George Hotz, hacker từng bẻ khóa iPhone đầu tiên khi 17 tuổi và thực hiện reverse-engineering PlayStation 3, đã đăng một bài blog vào Chủ nhật, lập luận rằng việc mở rộng ồ ạt các tác nhân AI trong viết mã sẽ dẫn đến suy giảm đáng kể chất lượng phần mềm. Hotz viết: "Tôi nói trước đây, việc các tác nhân AI được đưa vào phát triển phần mềm sẽ là một trong những sai lầm tốn kém nhất trong lịch sử của ngành." Quan điểm của ông đối lập trực tiếp với Andrej Karpathy, một trong những nhà nghiên cứu AI nổi bật nhất, người đã tham gia nhóm pre-training của Anthropic vào ngày 19/5/2026, đồng thời phát biểu rõ ràng rằng các tác nhân AI đã và đang biến đổi phát triển phần mềm. Hai người đại diện cho hai thái cực của một cuộc tranh luận chưa ngã ngũ trong ngành, và cả hai đều có cơ sở thuyết phục để bảo vệ lập trường của mình.
Luận điểm cốt lõi của Hotz
Hotz đã dành 6 tháng thử nghiệm các tác nhân AI trên các dự án thực: một phần của Tinygrad, khung deep learning mã nguồn mở của ông, và reverse-engineering hoàn chỉnh firmware của một chip USB-PCIe. Dựa trên trải nghiệm đó, ông lập luận rằng "tác nhân không thể lập trình, và ngày càng lâu hơn để nhận ra rằng chúng không thể." Ông mô tả đầu ra là "hỏng, nhưng theo cách ngày càng khó phát hiện. Và đúng là bạn sẽ kỳ vọng từ một mô hình thống kê ngày càng chính xác."
Mối lo trọng tâm của ông mang tính tổ chức. Người làm tốt có vòng phản hồi chặt chẽ để bắt các vấn đề do tác nhân tạo ra trước khi phát hành — họ đọc mã, phát hiện lỗi và hiệu chỉnh thời điểm có thể tin vào công cụ. "Người làm kém sẽ không có cơ chế tự kiểm tra đó," Hotz viết. Vấn đề then chốt: người làm kém đang dùng tác nhân để tạo ra đầu ra nhiều gấp 10 lần so với trước đây. Ở các công ty lớn, điều này làm suy giảm nhanh hơn chất lượng mã trung bình, bị che lấp bởi khối lượng khổng lồ. Hotz mô tả kết quả là "thời kỳ hoàng kim cho thùng thùng rác rưởi, và thời đại đen cho những viên ngọc chất lượng." Ông dẫn các báo cáo rằng Apple đang đẩy các công cụ AI viết mã trên toàn bộ tổ chức kỹ sư của mình, và đặt câu hỏi: "Bạn nghĩ macOS sẽ tốt hơn hay tệ hơn trong 2 năm tới?"
Không phải chuyện cái tôi
Hotz dự đoán phản biện rằng một lập trình viên định nghĩa bản sắc của mình qua nghề nghiệp sẽ tự nhiên chống lại các công cụ thay thế. Ông coi trọng phản biện này và bác bỏ dựa trên tính hợp lý. "AFL của Google tìm thấy nhiều lỗi hơn LLM, và không ai cảm thấy như vậy. Cờ vua và cờ vây còn phổ biến hơn bao giờ hết," ông viết. AI chơi cờ vua đã thống trị con người trong nhiều thập kỷ, trong khi trò chơi chỉ ngày càng phổ biến.
Hotz cũng bày tỏ hoài nghi về động cơ của ngành: "Tôi gần như nghĩ đây là một kiểu psyop để bán các tác nhân. Nỗi sợ mất mát là một trong những cách duy nhất để khiến các công ty lớn phải di chuyển. Dù vậy, tôi cho rằng trong nỗi sợ đó họ đang mắc một sai lầm lớn."
Các phe đang đứng ở đâu
Giờ Hotz định vị mình trong cái mà ông gọi là "phe LeCun/Marcus" — ám chỉ Yann LeCun, nhà khoa học AI hàng đầu của Meta, và Gary Marcus, một người lâu nay hoài nghi về LLM. Cả hai đều lập luận rằng mô hình ngôn ngữ về bản chất là những bộ bắt chước mẫu hình phức tạp: chúng có thể bắt chước phân phối của mã hiện có, nhưng không thể suy luận qua những bài toán thật sự mới từ nguyên lý đầu tiên.
Vibe coding — mô tả điều bạn muốn bằng ngôn ngữ tự nhiên và để AI tạo phần hiện thực — đã bùng nổ trong năm qua. Các phòng thí nghiệm AI lớn đã định vị việc lập trình dựa trên tác nhân như một sản phẩm cờ đầu. Năm 2025, Microsoft đã biến GitHub Copilot thành một hệ thống tác nhân đầy đủ, với CEO Satya Nadella mô tả đây là một bước chuyển cấp nền tảng tương tự như bước chuyển sang điện toán đám mây.
Karpathy từng hoài nghi về các tác nhân vào đầu năm 2025, nhưng đã đảo ngược quan điểm sau khi có các lần phát hành mô hình mới. CEO của Anthropic, Dario Amodei, cho biết tại Davos rằng một số kỹ sư của Anthropic đã ngừng tự viết mã, để mô hình xử lý trong khi họ rà soát đầu ra. Hotz, sau khi thử cách tiếp cận tương tự, nói rằng ông thấy mình lúc nào cũng phải quay lại sửa thủ công.