Grok ra mắt chức năng sao chép giọng nói: ghi âm một phút, có thể tạo ra giọng AI của riêng bạn

robot
Đang tạo bản tóm tắt

Thông tin từ Coinjie.com, Grok ra mắt chức năng sao chép giọng nói, người dùng chỉ cần ghi âm một phút là có thể tạo ra giọng AI của riêng mình. Chức năng này cho phép người dùng ghi âm giọng nói trên bảng điều khiển xai, tạo ra voice_id, và kết nối với API TTS hoặc voice agent của Grok, phù hợp cho các tình huống như dịch vụ khách hàng, sáng tạo nội dung, nhân vật trong trò chơi và thuyết minh sách nói. Người dùng cần đọc to câu xác thực, hệ thống sẽ chuyển đổi giọng nói thành văn bản theo thời gian thực qua STT và so sánh đặc điểm ghi âm, xác nhận người nói trước khi tạo giọng nói để tránh sao chép giọng của người khác. Hiện tại, chức năng custom voices chỉ mở tại Mỹ, trừ Illinois, bảng điều khiển tối đa có thể tạo miễn phí 30 giọng tùy chỉnh, khả năng tạo qua API chỉ dành cho nhóm doanh nghiệp. Giọng tùy chỉnh không tính phí bổ sung, nhưng gọi API giọng nói tính theo lượng sử dụng: thời gian thực là 3,00 USD/giờ, chuyển văn bản thành giọng nói là 4,20 USD trên triệu ký tự.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim