Thinking Machines Ra mắt mô hình tương tác với thời gian phản hồi 200 ms, vượt trội GPT-Realtime-2.0

Theo Beating, Thinking Machines, phòng thí nghiệm được thành lập bởi cựu CTO OpenAI Mira Murati, đã phát hành bản xem trước nghiên cứu cho mô hình Interaction của mình, với khả năng xử lý âm thanh và video thời gian thực tích hợp, cùng các phản hồi micro-turn chỉ trong 200 mili giây. Mô hình cho phép nghe, xem và nói đồng thời, đồng thời hỗ trợ người dùng ngắt quãng theo thời gian thực.

Mô hình TML-Interaction-Small sử dụng kiến trúc MoE gồm 276 tỷ tham số, với 12 tỷ tham số được kích hoạt cho mỗi lần suy luận. Dữ liệu chính thức cho thấy độ trễ bắt đầu lượt nói là 0,40 giây và điểm FD-bench V1.5 đạt 77,8, cả hai đều vượt qua GPT-Realtime-2.0 và Gemini 3.1 Flash Live. Quyền truy cập xem trước hạn chế dự kiến sẽ được mở trong vài tháng tới.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận