Xiaomi Mở Nguồn OmniVoice, Mô Hình Nhân Giọng Không Cần Ví Dụ (Zero-Shot) Hỗ Trợ 646 Ngôn Ngữ

Theo Beating, nhóm Kaldi tại AI Lab của Xiaomi đã mở mã nguồn OmniVoice, một mô hình TTS nhân bản giọng nói zero-shot hỗ trợ 646 ngôn ngữ. Mô hình có thể sao chép đặc trưng giọng nói chỉ từ vài giây âm thanh tham chiếu và hoạt động trên nhiều ngôn ngữ—một giọng có thể tổng hợp lời nói bằng tiếng Quan Thoại, tiếng Nhật, tiếng Hàn và các ngôn ngữ khác. Toàn bộ mã nguồn, trọng số và dữ liệu huấn luyện được mở mã nguồn theo giấy phép Apache-2.0.

OmniVoice dùng kiến trúc được đơn giản hóa với một Transformer hai chiều duy nhất, ánh xạ trực tiếp văn bản sang các token âm học rời rạc, đạt tốc độ suy luận nhanh hơn thực tế 40 lần trong PyTorch. Được huấn luyện trên 580.000 giờ âm thanh từ 50 bộ dữ liệu mở mã nguồn, OmniVoice vượt trội các hệ thống thương mại về độ tương đồng giọng nói và khả năng hiểu trong 24 ngôn ngữ được thử nghiệm, đồng thời khớp hoặc vượt qua các bản ghi của con người ở 102 ngôn ngữ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Video Rebirth ra mắt công cụ BACH AI để tạo video nhiều cảnh lên tới 30 giây

Video Rebirth đã ra mắt BACH vào ngày 7 tháng 5, một công cụ tạo video đa cảnh dài tới 30 giây từ các lời nhắc bằng văn bản và hình ảnh tham chiếu. Công cụ này duy trì tính nhất quán nhân vật giữa các cảnh, tuân theo hướng dẫn máy quay và tạo video gốc độ phân giải 1080p kèm hiệu ứng âm thanh, thuyết minh giọng nói và

GateNews5giờ trước

Tether ra mắt mô hình AI y tế MedPsy QVAC, đạt điểm 62,62 trên phiên bản 17 tỷ tham số

Theo Odaily, Tether AI Research Group đã ra mắt QVAC MedPsy, một mô hình AI y tế được thiết kế để chạy cục bộ trên điện thoại thông minh và các thiết bị đeo mà không phụ thuộc vào đám mây. Phiên bản với 1,7 tỷ tham số đạt 62,62 trên bảy bộ tiêu chí y tế, vượt MedGemma-1.5-4B của Google thêm 11,42 điểm poi

GateNews6giờ trước

TCV dẫn đầu $160M vòng Series B cho công ty khởi nghiệp bảo hiểm Corgi

Corgi, một startup bảo hiểm kinh doanh có trụ sở tại Mỹ, đã công bố vào ngày 6/5 rằng công ty đã huy động 160 triệu USD trong vòng gọi vốn Series B do TCV dẫn dắt với mức định giá 1,3 tỷ USD, theo TechCrunch. Vòng này cũng có sự tham gia của Kindred Ventures, Leblon Capital và First Order Fund. Điều này đưa tổng số vốn mà Corgi đã huy động lên 268

CryptoFrontier14giờ trước

B.AI Vượt 1,7 triệu Người Dùng vào ngày 7 tháng 5, Ra mắt Chương trình Phần thưởng

Theo B.AI, nền tảng hạ tầng AI đã vượt 1,7 triệu người dùng vào ngày 7/5. Nền tảng này tập trung vào hạ tầng bảo vệ quyền riêng tư và nền kinh tế tác nhân, đang tặng người dùng mới 500.000 tín dụng miễn phí khi đăng ký, áp dụng mức giá không chênh lệch (không cộng markup) cho tất cả các mô hình, và ưu đãi giới hạn thời gian 1:1

GateNews14giờ trước

Osome cắt giảm hơn 70 vị trí, cải thiện EBITDA 50% nhờ chuyển đổi bằng AI

Theo Tech in Asia, nền tảng quản lý doanh nghiệp có trụ sở tại Singapore Osome đã cắt hơn 70 vị trí trong hai năm qua, đồng thời triển khai AI để đảm nhiệm các tác vụ tuân thủ như ghi lại giao dịch và xử lý hóa đơn. CEO Eugenio Ferrante cho biết công ty đã đánh đổi để tăng trưởng doanh thu chậm hơn i

GateNews17giờ trước

Schneider Electric sẽ mở trung tâm đào tạo Đông Nam Á tại Malaysia trong năm nay, các công cụ AI cắt giảm mức tiêu thụ năng lượng 2%-3%

Theo Reuters, Schneider Electric dự kiến mở một trung tâm đào tạo tại Đông Nam Á ở Malaysia trong năm nay để giải quyết nhu cầu điện năng ngày càng tăng do hạ tầng AI mở rộng trong khu vực. Trung tâm sẽ đào tạo các đối tác và khách hàng về hệ thống quản lý năng lượng và thiết bị trung tâm dữ liệu. Schneider'

GateNews18giờ trước
Bình luận
0/400
Không có bình luận