Trí tuệ nhân tạo đang đứng trên bờ của một cuộc cách mạng căn bản. Thay vì chỉ là một công cụ thụ động chờ lệnh từ người dùng, AI đang tiến hóa thành các trợ lý tự động có khả năng thực hiện các nhiệm vụ phức tạp một cách độc lập. Công ty đầu tư mạo hiểm quốc tế Andreessen Horowitz (a16z) trong hội nghị gần đây “Big Ideas for 2026" đã trình bày ba giả định đột phá có thể thay đổi hoàn toàn cách chúng ta hoạt động và làm việc.
Kết thúc kỷ nguyên của trường nhập liệu: từ prompt đến hành động chủ động
Thay đổi quan trọng đầu tiên liên quan đến cách chúng ta tương tác với hệ thống AI. Marc Andrusko, đối tác của nhóm đầu tư về ứng dụng AI tại a16z, đưa ra luận điểm táo bạo: trường nhập liệu như công cụ chính để giao tiếp với các ứng dụng AI sẽ trở thành quá khứ. Thế hệ hệ thống thông minh mới sẽ không còn bắt người dùng phải viết lệnh – thay vào đó, chúng sẽ theo dõi hành động của chúng ta, tích cực đề xuất giải pháp và chờ đợi sự phê duyệt cuối cùng.
Điều gì đứng sau sự thay đổi này? Một bước nhảy lớn về tiềm năng kinh doanh. Trước đây, thị trường phần mềm dao động quanh mức 300–400 tỷ đô la chi tiêu hàng năm trên toàn cầu. Trong khi đó, thị trường chi tiêu cho lực lượng lao động tại chính Mỹ đã lên tới 13 nghìn tỷ đô la. Điều này đồng nghĩa với việc mở rộng thị trường tiềm năng (TAM) khoảng 30 lần.
AI lý tưởng nên hoạt động như một nhân viên xuất sắc trong công ty – không chỉ xác định vấn đề mà còn tự chẩn đoán nguyên nhân, đề xuất và triển khai giải pháp, cuối cùng chỉ cần yêu cầu: “Phê duyệt giải pháp mà tôi đã tìm ra.” Ví dụ là CRM gốc AI, tự động quét email trong những năm gần đây, xác định các khách hàng tiềm năng bị quên lãng và đề xuất các chiến dịch quay lại. Trong khi quyết định vẫn do con người thực hiện, máy móc đảm nhận 99% công việc chuẩn bị.
Mô hình thiết kế mới: tạo ra cho máy móc, không phải cho con người
Thay đổi thứ hai liên quan đến việc tái cấu trúc căn bản cách chúng ta thiết kế phần mềm và nội dung. Stephanie Zhang, đối tác đầu tư trong nhóm tăng trưởng của a16z, chỉ ra một thay đổi đột phá: đối tượng mục tiêu không còn là con người nữa, mà là các agent AI.
Điều này có hậu quả dài hạn. Những gì thu hút sự chú ý của con người – như nguyên tắc “5W1H” trong báo chí hay giao diện người dùng trực quan – không nhất thiết phải gây ấn tượng với các agent. Trong khi con người đọc vài đoạn đầu của bài báo, AI sẽ phân tích toàn bộ nội dung. Tiêu chuẩn tối ưu mới không còn là hình thức, mà là khả năng đọc hiểu của máy (Machine Legibility).
Các tổ chức đã bắt đầu thử nghiệm với khái niệm gọi là “SEO cho agent” – làm thế nào để các sản phẩm xuất hiện trong các kết quả của AI. Trong thế giới mà chi phí tạo nội dung gần như bằng không, có nguy cơ xuất hiện hàng loạt nội dung siêu cá nhân hóa, chất lượng trung bình, hướng tới các agent – tương tự như từ khóa trong thời đại tìm kiếm.
Sự chuyển đổi này ảnh hưởng đến mọi khía cạnh – từ cách các nhóm kỹ thuật giám sát hệ thống (thay vì xem dashboard, AI SRE báo cáo kết luận trên Slack), đến cách các nhân viên bán hàng thu thập thông tin (agent lấy dữ liệu từ CRM và tóm tắt, thay vì bắt con người phải duyệt thủ công).
Các agent thoại bắt đầu thâm nhập thị trường: từ khoa học viễn tưởng thành thực tế
Thay đổi thứ ba là sự gia tăng nhanh các ứng dụng thực tế của các agent thoại. Olivia Moore, đối tác nhóm ứng dụng AI tại a16z, nhận thấy sự chuyển đổi từ khái niệm lý thuyết về voice AI sang các hệ thống được triển khai rộng rãi bởi các công ty thực tế.
Chăm sóc sức khỏe là ví dụ lớn nhất. Các agent thoại đã phục vụ các cuộc gọi đến các công ty bảo hiểm, nhà thuốc, công ty dược phẩm, thậm chí các cuộc trò chuyện nhạy cảm với bệnh nhân – từ đặt lịch hẹn, tư vấn hậu phẫu, đến tư vấn tâm thần sơ bộ. Động lực chính là tỷ lệ thay thế nhân viên cao và khó tuyển dụng.
Ngành tài chính còn có nhiều tiềm năng hơn nữa. Trái với kỳ vọng, chính tại đây voice AI hoạt động tốt hơn con người, vì luôn tuân thủ chính xác các quy định về tuân thủ pháp lý, trong khi nhân viên đôi khi bỏ qua. Thêm vào đó, mọi hành động của agent đều được theo dõi và ghi lại đầy đủ.
Tuyển dụng là mặt trận thứ ba. Voice AI có thể thực hiện các cuộc phỏng vấn sơ bộ bất cứ lúc nào, giúp các ứng viên tiến tới các vòng tiếp theo do con người thực hiện.
Với sự cải thiện của các mô hình nền tảng trong năm qua, độ chính xác đã tăng lên và độ trễ giảm xuống. Một số công ty cố tình làm chậm các agent hoặc thêm tiếng ồn nền để chúng nghe tự nhiên hơn.
Domino sụp đổ: thay đổi trong call center và ngành BPO
Chuyển đổi về hành động giá (price action) có hậu quả trực tiếp đối với các trung tâm dịch vụ khách hàng truyền thống và ngành gia công quy trình kinh doanh (BPO). Như câu nói đúng trong ngành: “AI không lấy đi công việc của bạn, nhưng người sử dụng AI thì có.”
Một số trung tâm call sẽ trải qua quá trình chuyển đổi nhẹ nhàng, số khác đối mặt với sự sụp đổ nhanh chóng. Các khách hàng doanh nghiệp thích mua các giải pháp toàn diện, vì vậy họ vẫn sẽ hợp tác với BPO, nhưng chỉ những đơn vị cung cấp giá rẻ hơn hoặc có khả năng xử lý cao hơn nhờ AI. Trong các khu vực mà con người vẫn rẻ hơn các voice AI tốt nhất, lợi thế còn thuộc về con người – nhưng khi chi phí của các mô hình giảm xuống, tình hình sẽ thay đổi đáng kể.
Tương lai của voice AI: từ B2B đến chính quyền và chăm sóc sức khỏe
Trong khi các giải pháp B2B chiếm ưu thế, a16z nhận thấy tiềm năng lớn trong các lĩnh vực khác. Các trợ lý thoại trong nhà chăm sóc và trung tâm dành cho người cao tuổi đã hoạt động như những người bạn đồng hành và giám sát sức khỏe. Các khả năng trong việc xử lý các cuộc gọi khẩn cấp 911 và các cơ quan giao thông (DMV) còn hấp dẫn hơn – tất cả đều có thể được đơn giản hóa đáng kể, giảm thiểu sự phiền hà cho người tiêu dùng và nhân viên hệ thống.
Ai là người quyết định trong cuộc chuyển đổi này?
Trong mỗi kịch bản, người quyết định – con người – vẫn giữ vai trò trung tâm. Tuy nhiên, vai trò của họ đã thay đổi căn bản. Thay vì làm công việc, họ sẽ giám sát, phê duyệt và hướng dẫn. Các trợ lý kỹ thuật số sẽ làm phần công việc, còn con người sẽ đưa ra quyết định chiến lược cuối cùng.
Ngành công nghiệp voice AI phát triển như một toàn thể, không chỉ là một thị trường riêng biệt. Ở mọi cấp độ của hệ sinh thái công nghệ – từ các mô hình nền tảng đến các nền tảng ứng dụng – sẽ xuất hiện người chiến thắng và người thua cuộc. Nếu bạn quan tâm đến ngành này, nên theo dõi các công ty như 11 Labs, cho phép thử nghiệm tạo ra các giọng nói và agent riêng của mình.
Chuyển đổi mà các dự báo của a16z cho năm 2026 dự đoán không phải là một cuộc cách mạng xa vời. Đó là những thay đổi đã bắt đầu và đang tăng tốc.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Ba ba cuộc cách mạng đột phá trong thế giới trí tuệ nhân tạo vào năm 2026: từ trường đầu vào đến nhân viên kỹ thuật số
Trí tuệ nhân tạo đang đứng trên bờ của một cuộc cách mạng căn bản. Thay vì chỉ là một công cụ thụ động chờ lệnh từ người dùng, AI đang tiến hóa thành các trợ lý tự động có khả năng thực hiện các nhiệm vụ phức tạp một cách độc lập. Công ty đầu tư mạo hiểm quốc tế Andreessen Horowitz (a16z) trong hội nghị gần đây “Big Ideas for 2026" đã trình bày ba giả định đột phá có thể thay đổi hoàn toàn cách chúng ta hoạt động và làm việc.
Kết thúc kỷ nguyên của trường nhập liệu: từ prompt đến hành động chủ động
Thay đổi quan trọng đầu tiên liên quan đến cách chúng ta tương tác với hệ thống AI. Marc Andrusko, đối tác của nhóm đầu tư về ứng dụng AI tại a16z, đưa ra luận điểm táo bạo: trường nhập liệu như công cụ chính để giao tiếp với các ứng dụng AI sẽ trở thành quá khứ. Thế hệ hệ thống thông minh mới sẽ không còn bắt người dùng phải viết lệnh – thay vào đó, chúng sẽ theo dõi hành động của chúng ta, tích cực đề xuất giải pháp và chờ đợi sự phê duyệt cuối cùng.
Điều gì đứng sau sự thay đổi này? Một bước nhảy lớn về tiềm năng kinh doanh. Trước đây, thị trường phần mềm dao động quanh mức 300–400 tỷ đô la chi tiêu hàng năm trên toàn cầu. Trong khi đó, thị trường chi tiêu cho lực lượng lao động tại chính Mỹ đã lên tới 13 nghìn tỷ đô la. Điều này đồng nghĩa với việc mở rộng thị trường tiềm năng (TAM) khoảng 30 lần.
AI lý tưởng nên hoạt động như một nhân viên xuất sắc trong công ty – không chỉ xác định vấn đề mà còn tự chẩn đoán nguyên nhân, đề xuất và triển khai giải pháp, cuối cùng chỉ cần yêu cầu: “Phê duyệt giải pháp mà tôi đã tìm ra.” Ví dụ là CRM gốc AI, tự động quét email trong những năm gần đây, xác định các khách hàng tiềm năng bị quên lãng và đề xuất các chiến dịch quay lại. Trong khi quyết định vẫn do con người thực hiện, máy móc đảm nhận 99% công việc chuẩn bị.
Mô hình thiết kế mới: tạo ra cho máy móc, không phải cho con người
Thay đổi thứ hai liên quan đến việc tái cấu trúc căn bản cách chúng ta thiết kế phần mềm và nội dung. Stephanie Zhang, đối tác đầu tư trong nhóm tăng trưởng của a16z, chỉ ra một thay đổi đột phá: đối tượng mục tiêu không còn là con người nữa, mà là các agent AI.
Điều này có hậu quả dài hạn. Những gì thu hút sự chú ý của con người – như nguyên tắc “5W1H” trong báo chí hay giao diện người dùng trực quan – không nhất thiết phải gây ấn tượng với các agent. Trong khi con người đọc vài đoạn đầu của bài báo, AI sẽ phân tích toàn bộ nội dung. Tiêu chuẩn tối ưu mới không còn là hình thức, mà là khả năng đọc hiểu của máy (Machine Legibility).
Các tổ chức đã bắt đầu thử nghiệm với khái niệm gọi là “SEO cho agent” – làm thế nào để các sản phẩm xuất hiện trong các kết quả của AI. Trong thế giới mà chi phí tạo nội dung gần như bằng không, có nguy cơ xuất hiện hàng loạt nội dung siêu cá nhân hóa, chất lượng trung bình, hướng tới các agent – tương tự như từ khóa trong thời đại tìm kiếm.
Sự chuyển đổi này ảnh hưởng đến mọi khía cạnh – từ cách các nhóm kỹ thuật giám sát hệ thống (thay vì xem dashboard, AI SRE báo cáo kết luận trên Slack), đến cách các nhân viên bán hàng thu thập thông tin (agent lấy dữ liệu từ CRM và tóm tắt, thay vì bắt con người phải duyệt thủ công).
Các agent thoại bắt đầu thâm nhập thị trường: từ khoa học viễn tưởng thành thực tế
Thay đổi thứ ba là sự gia tăng nhanh các ứng dụng thực tế của các agent thoại. Olivia Moore, đối tác nhóm ứng dụng AI tại a16z, nhận thấy sự chuyển đổi từ khái niệm lý thuyết về voice AI sang các hệ thống được triển khai rộng rãi bởi các công ty thực tế.
Chăm sóc sức khỏe là ví dụ lớn nhất. Các agent thoại đã phục vụ các cuộc gọi đến các công ty bảo hiểm, nhà thuốc, công ty dược phẩm, thậm chí các cuộc trò chuyện nhạy cảm với bệnh nhân – từ đặt lịch hẹn, tư vấn hậu phẫu, đến tư vấn tâm thần sơ bộ. Động lực chính là tỷ lệ thay thế nhân viên cao và khó tuyển dụng.
Ngành tài chính còn có nhiều tiềm năng hơn nữa. Trái với kỳ vọng, chính tại đây voice AI hoạt động tốt hơn con người, vì luôn tuân thủ chính xác các quy định về tuân thủ pháp lý, trong khi nhân viên đôi khi bỏ qua. Thêm vào đó, mọi hành động của agent đều được theo dõi và ghi lại đầy đủ.
Tuyển dụng là mặt trận thứ ba. Voice AI có thể thực hiện các cuộc phỏng vấn sơ bộ bất cứ lúc nào, giúp các ứng viên tiến tới các vòng tiếp theo do con người thực hiện.
Với sự cải thiện của các mô hình nền tảng trong năm qua, độ chính xác đã tăng lên và độ trễ giảm xuống. Một số công ty cố tình làm chậm các agent hoặc thêm tiếng ồn nền để chúng nghe tự nhiên hơn.
Domino sụp đổ: thay đổi trong call center và ngành BPO
Chuyển đổi về hành động giá (price action) có hậu quả trực tiếp đối với các trung tâm dịch vụ khách hàng truyền thống và ngành gia công quy trình kinh doanh (BPO). Như câu nói đúng trong ngành: “AI không lấy đi công việc của bạn, nhưng người sử dụng AI thì có.”
Một số trung tâm call sẽ trải qua quá trình chuyển đổi nhẹ nhàng, số khác đối mặt với sự sụp đổ nhanh chóng. Các khách hàng doanh nghiệp thích mua các giải pháp toàn diện, vì vậy họ vẫn sẽ hợp tác với BPO, nhưng chỉ những đơn vị cung cấp giá rẻ hơn hoặc có khả năng xử lý cao hơn nhờ AI. Trong các khu vực mà con người vẫn rẻ hơn các voice AI tốt nhất, lợi thế còn thuộc về con người – nhưng khi chi phí của các mô hình giảm xuống, tình hình sẽ thay đổi đáng kể.
Tương lai của voice AI: từ B2B đến chính quyền và chăm sóc sức khỏe
Trong khi các giải pháp B2B chiếm ưu thế, a16z nhận thấy tiềm năng lớn trong các lĩnh vực khác. Các trợ lý thoại trong nhà chăm sóc và trung tâm dành cho người cao tuổi đã hoạt động như những người bạn đồng hành và giám sát sức khỏe. Các khả năng trong việc xử lý các cuộc gọi khẩn cấp 911 và các cơ quan giao thông (DMV) còn hấp dẫn hơn – tất cả đều có thể được đơn giản hóa đáng kể, giảm thiểu sự phiền hà cho người tiêu dùng và nhân viên hệ thống.
Ai là người quyết định trong cuộc chuyển đổi này?
Trong mỗi kịch bản, người quyết định – con người – vẫn giữ vai trò trung tâm. Tuy nhiên, vai trò của họ đã thay đổi căn bản. Thay vì làm công việc, họ sẽ giám sát, phê duyệt và hướng dẫn. Các trợ lý kỹ thuật số sẽ làm phần công việc, còn con người sẽ đưa ra quyết định chiến lược cuối cùng.
Ngành công nghiệp voice AI phát triển như một toàn thể, không chỉ là một thị trường riêng biệt. Ở mọi cấp độ của hệ sinh thái công nghệ – từ các mô hình nền tảng đến các nền tảng ứng dụng – sẽ xuất hiện người chiến thắng và người thua cuộc. Nếu bạn quan tâm đến ngành này, nên theo dõi các công ty như 11 Labs, cho phép thử nghiệm tạo ra các giọng nói và agent riêng của mình.
Chuyển đổi mà các dự báo của a16z cho năm 2026 dự đoán không phải là một cuộc cách mạng xa vời. Đó là những thay đổi đã bắt đầu và đang tăng tốc.