Karpathy: Nhận thức về năng lực AI xuất hiện một sự đứt gãy nghiêm trọng, phiên bản miễn phí và Agent tiên tiến là “một sản phẩm hoàn toàn khác nhau”

Trước Tổng giám đốc AI của Tesla, đồng sáng lập viên OpenAI Andrej Karpathy vào ngày 9 tháng 4 đã đăng một bài viết dài trên X, chỉ ra rằng nhận thức của công chúng về năng lực của AI đang bị chia rẽ một cách nghiêm trọng. Ông cho rằng, những người sử dụng ChatGPT bản miễn phí và những kỹ thuật viên sử dụng hằng ngày các công cụ agent tiên tiến như Codex, Claude Code thực chất đang thảo luận về « những sản phẩm hoàn toàn khác nhau », nhưng cả hai bên đều tin rằng thứ mình nhìn thấy chính là toàn bộ bức tranh của AI.

Hai thế giới, hai kiểu nhận thức về AI

Karpathy hiện chia những người dùng AI thành hai nhóm.

Nhóm thứ nhất là những người đã thử ChatGPT bản miễn phí vào một thời điểm nào đó trong năm ngoái, rồi từ đó hình thành ấn tượng tổng thể về AI. Họ nhìn thấy vô số sai sót của mô hình — ảo giác, kết quả tìm kiếm lạc lối, và ngay cả các vấn đề đơn giản như chế độ giọng nói “nên lái xe hay đi bộ rồi đến tiệm rửa xe” cũng bị nó làm hỏng. Karpathy thừa nhận rằng những vấn đề này thực sự tồn tại, nhưng nhấn mạnh rằng bản miễn phí và các mô hình đã lỗi thời không thể đại diện cho năng lực thực sự của các mô hình agent tiên tiến trước năm 2026.

Nhóm thứ hai thỏa mãn đồng thời hai điều kiện: trả phí để sử dụng các mô hình agent tiên tiến mới nhất (như OpenAI Codex hoặc Claude Code), và sử dụng chuyên nghiệp trong các lĩnh vực kỹ thuật như phát triển phần mềm, toán học, nghiên cứu. Karpathy gọi nhóm người này đang trải qua cú “tấn công tinh thần AI” (AI Psychosis) ở mức độ cao, bởi những tiến bộ gần đây trong lĩnh vực kỹ thuật của các mô hình này “chỉ có thể mô tả là kinh ngạc” — bạn có thể chứng kiến trực tiếp chúng giải quyết các vấn đề kiến trúc phần mềm vốn trước đó cần tới vài ngày, thậm chí vài tuần, chỉ trong vòng một giờ.

Tại sao sự tiến bộ tập trung mạnh ở lĩnh vực kỹ thuật

Karpathy giải thích lý do vì sao việc nâng cao năng lực AI lại đặc biệt rõ rệt trong các lĩnh vực kỹ thuật như phát triển phần mềm, nhưng trong các mục đích phổ thông như tìm kiếm, viết lách, đưa ra gợi ý thì không nổi bật bằng.

Có hai nguyên nhân: thứ nhất, lĩnh vực kỹ thuật cung cấp hàm thưởng có thể kiểm chứng được (ví dụ: kiểm tra xem unit test có pass hay không), nhờ đó huấn luyện tăng cường học (reinforcement learning) vận hành hiệu quả; trong khi đó, việc đánh giá đúng sai kém của chất lượng bài viết khó xác định một cách rõ ràng. Thứ hai, trong các kịch bản B2B, lĩnh vực kỹ thuật mang giá trị thương mại cao hơn, nên các công ty AI đổ vào những hướng này tỷ lệ lớn nhất nguồn lực của đội ngũ.

Hai nhóm không hiểu nhau đang nói gì

Karpathy kết luận rằng hai nhóm người này đang “mỗi bên nói một câu”. Chế độ giọng nói của OpenAI bản miễn phí làm hỏng các vấn đề thường ngày, còn OpenAI bản trả phí cao cấp Codex thì trong vòng một giờ có thể tái cấu trúc toàn bộ kho mã hoặc phát hiện lỗ hổng của hệ thống — cả hai điều đó đều đúng.

Trong phần phản hồi tiếp theo, ông bổ sung rằng có người đã nêu với ông một quan điểm: sự kiện OpenClaw gây ra sự quan tâm lớn đến vậy trong xã hội, chính là vì nó khiến một lượng lớn người không thuộc giới kỹ thuật lần đầu tiên tiếp cận các mô hình agent tiên tiến, trong khi trước đó họ chỉ biết rằng AI tương đương với ChatGPT phiên bản web.

Bài viết Karpathy: Nhận thức về năng lực AI xuất hiện sự đứt gãy nghiêm trọng, bản miễn phí và agent tiên tiến là “những sản phẩm hoàn toàn khác nhau” lần đầu xuất hiện trên Chainews ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Reid Hoffman: AI Agents Sẽ Cần Các Hệ Thống Niềm Tin Crypto

Reid Hoffman, đối tác của Greylock và đồng sáng lập LinkedIn, cho biết các tác nhân tự động sẽ cần các hệ thống niềm tin dựa trên crypto để giao dịch qua mạng internet mở, gợi ý rằng sự phát triển này có thể mở đường cho NFT quay trở lại. Phát biểu của Hoffman liên kết sự xuất hiện của các tác nhân tự động với

CryptoFrontier18phút trước

B.AI Vượt 1,7 triệu Người Dùng vào ngày 7 tháng 5, Ra mắt Chương trình Phần thưởng

Theo B.AI, nền tảng hạ tầng AI đã vượt 1,7 triệu người dùng vào ngày 7/5. Nền tảng này tập trung vào hạ tầng bảo vệ quyền riêng tư và nền kinh tế tác nhân, đang tặng người dùng mới 500.000 tín dụng miễn phí khi đăng ký, áp dụng mức giá không chênh lệch (không cộng markup) cho tất cả các mô hình, và ưu đãi giới hạn thời gian 1:1

GateNews52phút trước

a16z ra mắt quỹ tiền mã hóa giai đoạn thứ năm trị giá 2,2 tỷ USD, dẫn đầu vòng gọi vốn cho 3 công ty khởi nghiệp AI mới

Theo thông báo của a16z (Andreessen Horowitz) vào ngày 5 tháng 5, công ty đầu tư mạo hiểm này đã chính thức ra mắt quỹ riêng cho tiền mã hóa giai đoạn thứ năm mang tên “Crypto Fund 5”, với quy mô huy động 2,2 tỷ USD. Cùng thời điểm, a16z cho biết họ sẽ dẫn dắt vòng gọi vốn các doanh nghiệp gồm công ty tích hợp AI Tessera Labs, nền tảng tuyển dụng AI Ethos và nền tảng sáng tạo AI Glif.

MarketWhisper1giờ trước

Người sáng lập Cardano: AI Agents sẽ vượt hoạt động Internet của con người vào năm 2035, làm gián đoạn các mô hình dựa trên quảng cáo

Theo CoinDesk, người sáng lập Cardano Charles Hoskinson đã dự đoán tại hội nghị Consensus vào ngày 7/5 rằng các tác nhân AI sẽ vượt hoạt động của con người trong tìm kiếm trên internet, thương mại và giao dịch vào năm 2035. Do các tác nhân AI không nhấp vào quảng cáo hay thể hiện sở thích về thương hiệu, Hoskinson cho biết điều này sẽ…

GateNews4giờ trước

Trưởng nhóm Claude Code, Boris: AI agent nâng cao năng suất của con người, viết lại lịch sử phát triển phần mềm

Người phụ trách Claude Code, Boris Cherny, trong cuộc phỏng vấn với CNBC cho biết các công cụ AI agent như Co-Work có thể giao các tác vụ phức tạp cho AI xử lý; kỹ sư chuyển từ người thao tác thành người hướng dẫn, đồng thời có thể kích hoạt nhiều agent để xử lý việc gỡ lỗi, qua đó cải thiện đáng kể năng suất. Doanh nghiệp cần coi AI như lõi để tái cấu trúc quy trình; AI đã chứng minh giá trị trong mọi lĩnh vực. Phát triển phần mềm sẽ chuyển từ việc viết mã sang hợp tác do logic và hội thoại dẫn dắt, rào cản kỹ thuật giảm xuống, và đổi mới, khởi nghiệp sẽ có sự tăng trưởng bùng nổ.

ChainNewsAbmedia5giờ trước

Reid Hoffman: NFT có thể quay trở lại khi các tác nhân AI cần niềm tin từ crypto

Reid Hoffman, đối tác của Greylock và đồng sáng lập LinkedIn, cho biết các tác nhân tự động sẽ cần các hệ thống niềm tin dựa trên crypto để giao dịch trên internet mở, gợi ý rằng NFT có thể quay trở lại, theo tuyên bố của ông. Tác nhân AI và hạ tầng niềm tin Nhận xét của Hoffman cho thấy khả năng tiềm tàng

CryptoFrontier6giờ trước
Bình luận
0/400
Không có bình luận