Grok giới thiệu chức năng sao chép giọng nói, người dùng ghi âm khoảng một phút trên bảng điều khiển xai để tạo ra giọng AI và kết nối với API TTS hoặc voice agent, phù hợp cho các tình huống như dịch vụ khách hàng, sáng tạo, trò chơi và sách nói. Để ngăn chặn việc sử dụng trái phép, cần đọc to câu xác minh ngắn, chuyển đổi STT và so sánh trước khi tạo. Giọng nói tùy chỉnh chỉ mở tại Mỹ, trừ Illinois, bảng điều khiển miễn phí tạo tối đa 30 giọng tùy chỉnh, API chỉ dành cho doanh nghiệp. Giọng nói tùy chỉnh miễn phí, gọi API tính phí theo lượng: $3.00/giờ, $4.20/một triệu ký tự.

CoinNetwork

2026-05-02 11:37:51

Đang tạo bản tóm tắt

Thông tin từ Coinjie.com, Grok ra mắt chức năng sao chép giọng nói, người dùng chỉ cần ghi âm một phút là có thể tạo ra giọng AI của riêng mình. Chức năng này cho phép người dùng ghi âm giọng nói trên bảng điều khiển xai, tạo ra voice_id, và kết nối với API TTS hoặc voice agent của Grok, phù hợp cho các tình huống như dịch vụ khách hàng, sáng tạo nội dung, nhân vật trong trò chơi và thuyết minh sách nói. Người dùng cần đọc to câu xác thực, hệ thống sẽ chuyển đổi giọng nói thành văn bản theo thời gian thực qua STT và so sánh đặc điểm ghi âm, xác nhận người nói trước khi tạo giọng nói để tránh sao chép giọng của người khác. Hiện tại, chức năng custom voices chỉ mở tại Mỹ, trừ Illinois, bảng điều khiển tối đa có thể tạo miễn phí 30 giọng tùy chỉnh, khả năng tạo qua API chỉ dành cho nhóm doanh nghiệp. Giọng tùy chỉnh không tính phí bổ sung, nhưng gọi API giọng nói tính theo lượng sử dụng: thời gian thực là 3,00 USD/giờ, chuyển văn bản thành giọng nói là 4,20 USD trên triệu ký tự.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
501.95K Phổ biến
#
USSeeksStrategicBitcoinReserve
58.73M Phổ biến
#
IsraelStrikesIranBTCPlunges
38.3K Phổ biến
#
BitcoinETFOptionLimitQuadruples
1.01M Phổ biến
#
#FedHoldsRateButDividesDeepen
33.02K Phổ biến

Ghim

sơ đồ trang web

Grok ra mắt chức năng sao chép giọng nói: ghi âm một phút, có thể tạo ra giọng AI của riêng bạn

Chủ đề thịnh hành

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Ghim