OpenRouter Fusion API Khớp Hiệu Suất Claude Fable 5 Với Chi Phí Bằng Một Nửa

2026-06-21 18:13:05

OpenRouter đã ra mắt Fusion vào ngày 12 tháng 6, một API phía máy chủ phân phối prompt tới nhiều mô hình AI song song, sau đó dùng một mô hình “judge” và bộ tổng hợp để gộp các phản hồi thành một câu trả lời thống nhất. Công ty khẳng định hệ thống có thể bắt kịp hiệu năng của Claude Fable 5 với chi phí xấp xỉ bằng một nửa, dựa trên thử nghiệm trên benchmark DRACO của Perplexity, nơi một bảng điều khiển các mô hình theo ngân sách đạt 64,7% so với 65,3% của Fable 5. Việc ra mắt diễn ra ngay sau khi Anthropic đình chỉ Fable 5 và Mythos 5 tuần trước, theo một chỉ đạo kiểm soát xuất khẩu của Mỹ trích dẫn một phát hiện jailbreak bị tranh cãi. OpenRouter định vị Fusion như một lựa chọn thay thế với thông điệp “trí tuệ tầm Fable ở mức giá bằng một nửa”.

OpenRouter Fusion Xử Lý Prompt Qua Kiến Trúc “Bảng” Nhiều Mô Hình

Khi người dùng gửi một prompt tới Fusion, OpenRouter phân phối prompt đó tới một bảng các mô hình chạy song song, với mỗi mô hình được cung cấp công cụ tìm kiếm web và bash. Sau đó, một mô hình judge sẽ trích xuất các điểm đồng thuận, mâu thuẫn và “blind spot” từ mọi phản hồi. Sau giai đoạn phân tích này, một bộ tổng hợp—mặc định là Claude Opus 4.8—sẽ viết câu trả lời cuối cùng dựa trên phần phân tích đó. Toàn bộ quy trình diễn ra phía máy chủ. Người dùng có thể đổi chuỗi mô hình sang “openrouter/fusion” để dùng bảng mặc định, thêm một công cụ fusion để mô hình của riêng họ gọi có chọn lọc, hoặc xây dựng một bảng tùy chỉnh trong phòng chat Fusion mà không cần viết code.

Bảng AI Theo Ngân Sách Đạt 64,7% Trên Benchmark DRACO, So Với Fable 5 Đạt 65,3%

OpenRouter đã thử nghiệm Fusion trên DRACO, benchmark của Perplexity được xây dựng từ các yêu cầu nghiên cứu chuyên sâu thực tế của người dùng. Fable 5 kết hợp với GPT-5.5 của OpenAI và được tổng hợp bởi Opus đã đứng đầu bảng với 69%. Fable 5 chạy một mình đạt 65,3%, dù bảy trong số 100 tác vụ của nó không chạy do các bộ lọc nội dung riêng của nó chặn. Tổ hợp “theo ngân sách” gồm Gemini 3 Flash kết hợp với các mô hình tiếng Trung mã nguồn mở Kimi K2.6 và DeepSeek V4 Pro, được hòa trộn và tổng hợp bởi Opus, đạt 64,7%—vượt Fable 5 chạy một mình là GPT-5.5 (60%) và Opus 4.8 (58,8%), đồng thời nằm trong vòng một điểm phần trăm so với Fable, với mức chi phí xấp xỉ bằng một nửa. Khi ghép Opus 4.8 với một phiên bản riêng của chính nó, điểm đạt 65,5%, tăng 6,7 điểm so với Opus chạy một mình. OpenRouter cho biết khoảng ba phần tư mức cải thiện đó đến từ chính bước tổng hợp, phần còn lại đến từ sự đa dạng mô hình thực sự.

OpenRouter tiết lộ rằng việc cấp quyền truy cập web trực tiếp cho bảng cho phép các mô hình “lôi” rubric chấm điểm riêng của DRACO lên kết quả tìm kiếm, một rủi ro nhiễm bẩn mà công ty gọi là ngẫu nhiên chứ không cố ý. Cách khắc phục cần đúng một dòng cấu hình để loại trừ các miền máy chủ của benchmark khỏi các công cụ tìm kiếm, và mọi con số công bố đều phản ánh kết quả sau khi đã làm sạch lần chạy đó.

Anthropic Đình Chỉ Fable 5 và Mythos 5 Sau Chỉ Đạo Kiểm Soát Xuất Khẩu Của Mỹ

Ngay sau khi phát hành Fable 5 và Mythos 5 tuần trước, một chỉ đạo kiểm soát xuất khẩu của Mỹ buộc Anthropic đình chỉ các mô hình đó đối với mọi công dân nước ngoài trên toàn thế giới, với lý do trích dẫn một phát hiện jailbreak bị tranh cãi. OpenRouter công bố Fusion trên X vào ngày 13 tháng 6, định vị nó như một lựa chọn thay thế với lời hứa “trí tuệ tầm Fable ở mức giá bằng một nửa”.

OpenRouter Xác Định Giới Hạn của Fusion Với Lập Trình và Các Tác Vụ Dài Hạn

OpenRouter cho biết Fusion không phải là một bản thay thế hoàn chỉnh cho Fable. DRACO bỏ qua các tác vụ dài hạn, nơi theo tin đồn Fable vẫn dẫn đầu. Với lập trình, Fusion hoạt động như một công cụ mà một mô hình lập trình gọi có chọn lọc, chứ không phải một bản thay thế toàn diện. Chủ đề ra mắt ghi nhận mức độ tích cực trong cảm xúc theo dõi theo tỷ lệ xấp xỉ hai trên một. Nhà nghiên cứu AI Andrew Trask gọi đây là “một thỏa thuận lớn hơn nhiều so với vẻ bề ngoài,” cho rằng các phòng thí nghiệm tiên phong sẽ không bao giờ sở hữu “đường biên” một mình nữa. Những người hoài nghi nêu các kết quả lập trình kém, khả năng gọi công cụ chưa tốt và thiếu minh bạch vì Fable 5 hiện không còn để so sánh kết quả. Fusion chạy hoàn toàn trên các mô hình được định tuyến qua hạ tầng của OpenRouter, nên không giải quyết vấn đề kiểm soát xuất khẩu ngay tại nguồn.

FAQ

OpenRouter đã ra mắt gì vào ngày 12 tháng 6?

OpenRouter đã ra mắt Fusion vào ngày 12 tháng 6, một API phía máy chủ phân phối prompt tới nhiều mô hình AI song song, sau đó dùng một mô hình judge và bộ tổng hợp để gộp các phản hồi thành một câu trả lời thống nhất.

Bảng theo ngân sách của Fusion hoạt động thế nào trên benchmark DRACO so với Claude Fable 5?

Trên benchmark DRACO của Perplexity, bảng theo ngân sách của Fusion kết hợp Gemini 3 Flash, Kimi K2.6 và DeepSeek V4 Pro đạt 64,7%, nằm trong vòng một điểm phần trăm so với điểm 65,3% của Fable 5 chạy một mình, với chi phí xấp xỉ bằng một nửa.

Vì sao Anthropic đình chỉ Claude Fable 5 và Mythos 5?

Anthropuic đình chỉ Fable 5 và Mythos 5 tuần trước sau một chỉ đạo kiểm soát xuất khẩu của Mỹ trích dẫn một phát hiện jailbreak bị tranh cãi, ảnh hưởng đến khả năng truy cập của mọi công dân nước ngoài trên toàn thế giới.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

3giờ trước

OpenRouter ra mắt Fusion API, khớp với Claude Fable 5 với chi phí chỉ bằng một nửa vào ngày 12 tháng 6

5giờ trước

Mercury 2 của Inception Labs đạt 90% trên AIME 2026, vượt trội DiffusionGemma của Google

14giờ trước

OpenAI sắp ra mắt GPT-5.6 vào tuần tới với cửa sổ ngữ cảnh lên tới 1,5 triệu token