Google công bố tính năng dịch AI Gemini theo thời gian thực mở rộng đến iOS

ChainNewsAbmedia

Google thông báo tính năng dịch thuật thời gian thực Gemini AI đã được mở rộng từ nền tảng Android sang hệ điều hành iOS, đồng thời ra mắt tại nhiều thị trường như Anh, Nhật Bản, Đài Loan, Đức. Cập nhật này nhằm cung cấp dịch vụ dịch thuật giọng nói với khả năng hiểu ngữ cảnh và ngữ điệu tự nhiên hơn thông qua các thiết bị di động và thiết bị đeo, điểm nổi bật nhất là ứng dụng có thể kết hợp với bất kỳ thương hiệu tai nghe Bluetooth nào, không bị giới hạn bởi thông số của Apple.

Ứng dụng dịch thuật thời gian thực iOS có thể kết hợp với bất kỳ thương hiệu tai nghe Bluetooth nào

Trước đây, tính năng dịch thuật thời gian thực của các thương hiệu cụ thể thường bị giới hạn bởi phần cứng riêng, tính năng “dịch thuật tai nghe thời gian thực” mà Google giới thiệu lần này áp dụng kiến trúc mở, người dùng chỉ cần tải ứng dụng Google Dịch trên iPhone hoặc iPad, có thể sử dụng với bất kỳ tai nghe Bluetooth không dây của thương hiệu nào, tính năng mới này có thể sử dụng trên nhiều thiết bị phần cứng, giúp người dùng iOS cũng có thể nhận thông tin ngay lập tức trong quá trình di chuyển. Công nghệ nền tảng được điều khiển bởi mô hình Gemini 3.1 Flash Live, nhấn mạnh vào việc xử lý âm thanh với độ trễ thấp, hiện đã hỗ trợ hơn 70 ngôn ngữ, tăng cường giá trị thực tiễn của công cụ này trong bối cảnh kinh doanh quốc tế và du lịch cá nhân.

Trí tuệ nhân tạo tối ưu hóa độ tự nhiên của dịch thuật giọng nói

So với dịch thuật từng từ (Word-for-word translation) truyền thống, công cụ dịch thuật áp dụng công nghệ Gemini chú trọng hơn vào việc phân tích ngữ nghĩa và giữ lại cảm xúc, hệ thống khi xử lý giọng nói không chỉ tiến hành dịch thuật văn bản mà còn cố gắng mô phỏng giọng điệu, nhấn mạnh và nhịp điệu của người nói gốc, giảm bớt cảm giác xa cách do giọng nói máy móc mang lại. Khi xử lý thành ngữ (Idioms) hoặc từ lóng, trí tuệ nhân tạo có thể cung cấp gợi ý dịch thuật chính xác hơn dựa trên ngữ cảnh, biến các cụm từ thông dụng tiếng Anh thành từ vựng phù hợp với ý nghĩa văn hóa địa phương.

Cập nhật đồng bộ dịch thuật giọng nói trong Google Meet

Tính năng dịch thuật giọng nói đã chính thức ra mắt cho người dùng Google Workspace và tài khoản cá nhân trong chương trình Google AI. Nó sẽ thêm giọng nói lồng ghép vào giọng nói của người nói ngay lập tức. Như vậy, người tham gia có thể nghe được bản dịch bằng ngôn ngữ mẹ đẻ và cũng hiểu được ngữ cảnh cảm xúc của người nói. Hiện tại, tính năng này hỗ trợ dịch thuật hai chiều giữa tiếng Anh và nhiều ngôn ngữ khác nhau, bao gồm tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Bồ Đào Nha và tiếng Ý.

Chức năng đa phương tiện hỗ trợ nhận thức môi trường

Ngoài giao tiếp bằng giọng nói, Google cũng đã tăng cường phạm vi ứng dụng của trí tuệ nhân tạo đa phương tiện (Multimodal). Thông qua tính năng “tìm kiếm thời gian thực” và camera Google Lens, người dùng có thể trực tiếp nhắm vào biển báo, thực đơn hoặc hướng dẫn để thực hiện dịch thuật thời gian thực và tiến hành cuộc trò chuyện chi tiết với Gemini. Trong lĩnh vực học ngôn ngữ, ứng dụng Google Dịch đã mở rộng tính năng luyện tập nói, triển khai cơ chế phản hồi đã được cải thiện tại 20 quốc gia như Đài Loan, Thụy Điển, Ấn Độ. Hệ thống có thể cung cấp gợi ý cụ thể về phát âm của người dùng, giúp người dùng đạt được mục tiêu nắm vững ngôn ngữ thông qua việc theo dõi tiến độ học tập (như số ngày luyện tập liên tiếp), nâng cao trải nghiệm học tập cá nhân hóa.

Ra mắt kính thông minh đeo trên người vào nửa cuối năm

Google sẽ hợp tác với các nhà sản xuất như Samsung và Warby Parker, dự kiến sẽ ra mắt kính thông minh tích hợp chức năng trí tuệ nhân tạo vào nửa cuối năm 2026. Một trong những ứng dụng cốt lõi của sản phẩm này là công nghệ hiển thị tích hợp trong ống kính, có khả năng cung cấp “phụ đề thời gian thực” trong tầm nhìn của người dùng, trực tiếp chiếu văn bản dịch vào cảnh vật thực tế. Việc phát triển các thiết bị đeo như vậy tượng trưng cho việc công nghệ dịch thuật đang tiến hóa từ hiển thị trên màn hình đơn giản sang dịch vụ nhận thức môi trường tích hợp giữa thị giác và thính giác. Hiện tại, loạt chức năng này đang trong giai đoạn thử nghiệm và phát triển dần, và sẽ được tối ưu hóa mô hình dựa trên phản hồi sử dụng của người dùng ở các quốc gia.

Bài viết này Google thông báo tính năng dịch thuật thời gian thực Gemini AI mở rộng sang iOS lần đầu tiên xuất hiện trên ChainNews ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận