Theo Beating, Step Audio 2,5 Realtime, một mô hình giọng nói thời gian thực end-to-end của Step Cosmos, đã ra mắt trên API nền tảng mở của họ vào tháng 4 năm 2026. Mô hình tập trung vào hội thoại tự nhiên với các nhân cách nhân vật có thể tùy chỉnh và khả năng nhận biết tín hiệu cận ngôn ngữ (giọng điệu, ngắt quãng, tiếng thở dài).
Trong thử nghiệm chính thức trên năm tiêu chí, Step Audio 2,5 Realtime xếp hạng số 1 ở tất cả các hạng mục. Điểm đánh giá chủ quan (các cuộc trò chuyện trên ứng dụng điện thoại do người dùng thật thực hiện) đạt 80,41, so với 68,01 của GPT-Realtime-1,5 và 67,16 của Gemini Live. Chuẩn đo giọng nói Q&A đạt 79,80, gần gấp 1,5 lần 53,20 của GPT-Realtime-1,5. Giá API: 10 nhân dân tệ cho mỗi 1 triệu token đầu vào (2 nhân dân tệ khi cache hit), 70 nhân dân tệ cho mỗi 1 triệu token đầu ra, với ước tính cuộc gọi giọng nói liên tục ở mức 3,8 nhân dân tệ mỗi giờ.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
SoftBank Cắt Giảm Kế Hoạch Tài Trợ Có Hỗ Trợ Của OpenAI Từ $10B xuống $6B giữa Mối Quan Ngại Của Các Tổ Chức Cho Vay
Theo ChainCatcher, SoftBank Group đang cắt giảm một kế hoạch cấp vốn được hậu thuẫn bởi cổ phần của OpenAI, thu hẹp từ khoảng 10 tỷ USD xuống còn 6 tỷ USD. Các bên cho vay đã bày tỏ lo ngại về cấu trúc giao dịch và độ tin cậy của định giá OpenAI với tư cách là một công ty tư nhân, trở thành một yếu tố then chốt
GateNews21phút trước
TCI Fund Bán Giảm Gần $8B Cổ Phiếu Microsoft, Trích Dẫn Rủi Ro Từ AI
Theo Financial Times, quỹ phòng hộ của Chris Hohn là TCI gần đây đã thoái gần 8 tỷ USD cổ phiếu Microsoft. Quỹ này cho biết với nhà đầu tư rằng trí tuệ nhân tạo là một mối đe dọa đối với vị thế thống trị của Microsoft trong phần mềm.
GateNews1giờ trước
Tessera Labs hoàn tất vòng gọi vốn $60M do a16z dẫn dắt
Theo Odaily, công ty khởi nghiệp tự động hóa bằng AI Tessera Labs đã công bố hoàn tất vòng gọi vốn 60 triệu USD do Andreessen Horowitz (a16z) dẫn dắt, với sự tham gia của Foundation Capital, Myriad Venture Partners và Osage University Partners. Nền tảng AI-native của công ty tự động hóa cho doanh nghiệp
GateNews3giờ trước
Kẻ tấn công chèn 575 kỹ năng độc hại vào Hugging Face và ClawHub bằng 13 tài khoản
Theo CISO của Mist Security @im23pds, các kẻ tấn công gần đây đã xâm nhập 13 tài khoản để chèn 575 Skills độc hại vào Hugging Face và ClawHub (OpenClaw), như đã được công bố trên nền tảng X.
GateNews3giờ trước
DeepSeek dự định huy động tối đa 50 tỷ RMB trong vòng gọi vốn kỷ lục, mô hình V4.1 dự kiến ra mắt vào tháng 6
Theo PANews vào ngày 8 tháng 5, DeepSeek dự kiến huy động tối đa 50 tỷ RMB trong vòng gọi vốn đầu tiên, qua đó đánh dấu thương vụ gọi vốn đơn lẻ lớn nhất của một công ty AI Trung Quốc. Nhà sáng lập kiêm CEO Liang Wenfeng dự kiến sẽ đóng góp số tiền tối đa. Công ty có kế hoạch đẩy nhanh việc phát triển các mô hình ngôn ngữ lớn m
GateNews3giờ trước
Sportix hoàn tất vòng gọi vốn 3,2 triệu USD do Coinvestor Ventures và Animoca Brands dẫn dắt
Theo ChainCatcher, nền tảng hạ tầng AI cho thể thao Sportix đã hoàn tất vòng gọi vốn trị giá 3,2 triệu USD. Vòng này được dẫn dắt bởi Coinvestor Ventures, với sự tham gia của Animoca Brands, Becker Ventures, X21 Digital và Alpha Capital.
Sportix cho biết họ sẽ sử dụng số tiền để thúc đẩy AI của mình
GateNews3giờ trước