Nhóm nghiên cứu của Đại học Zhejiang đề xuất con đường mới: dạy AI cách hiểu thế giới của não người

robot
Đang tạo bản tóm tắt

Mô hình quy mô lớn luôn không ngừng tăng lên, và quan điểm chủ đạo cho rằng số lượng tham số càng nhiều thì mô hình càng tiệm cận cách con người suy nghĩ. Tuy nhiên, một bài báo do nhóm Đại học Chiết Giang công bố trên Nature Communications vào ngày 1 tháng 4 lại đưa ra quan điểm khác biệt (liên kết nguyên văn: https://www.nature.com/articles/s41467-026-71267-5). Họ phát hiện rằng khi quy mô mô hình (chủ yếu là SimCLR, CLIP, DINOv2) được mở rộng, năng lực nhận diện các sự vật cụ thể đúng là tiếp tục tăng lên, nhưng năng lực hiểu các khái niệm trừu tượng không những không được cải thiện mà còn có xu hướng giảm. Sau khi tham số tăng từ 22,06 triệu lên 304,37 triệu, độ chính xác ở các nhiệm vụ khái niệm cụ thể tăng từ 74,94% lên 85,87%, còn các nhiệm vụ khái niệm trừu tượng giảm từ 54,37% xuống 52,82%.

Sự khác biệt giữa cách con người và mô hình suy nghĩ

Khi não người xử lý khái niệm, sẽ hình thành trước một hệ quan hệ phân loại. Thiên nga và cú trông không giống nhau, nhưng con người vẫn xếp chúng vào cùng một nhóm “chim”. Cao hơn nữa, chim và ngựa còn có thể tiếp tục được đưa vào tầng “động vật”. Khi con người nhìn thấy một thứ mới, họ thường nghĩ ngay rằng nó giống với những thứ nào đã từng thấy trước đây và đại khái thuộc nhóm nào. Con người liên tục học những khái niệm mới, rồi tổ chức lại kinh nghiệm, dùng hệ quan hệ này để nhận diện sự vật mới và thích ứng với những tình huống mới.

Mô hình cũng phân loại, nhưng cách hình thành khác nhau. Nó chủ yếu dựa vào các dạng thức xuất hiện lặp đi lặp lại trong dữ liệu quy mô lớn. Đối tượng cụ thể xuất hiện càng nhiều, mô hình càng dễ nhận ra nó. Đến bước phân loại ở mức nhóm lớn hơn, mô hình sẽ gặp khó khăn hơn. Nó cần nắm bắt những điểm chung giữa nhiều đối tượng, rồi gom các điểm chung đó vào cùng một lớp. Các mô hình hiện tại vẫn còn một số điểm yếu rõ ràng ở đây. Khi tham số tiếp tục tăng, nhiệm vụ khái niệm cụ thể sẽ được cải thiện, trong khi nhiệm vụ khái niệm trừu tượng đôi khi còn giảm.

Điểm chung giữa não người và mô hình là cả hai bên đều hình thành một hệ quan hệ phân loại bên trong. Tuy nhiên, trọng tâm của hai bên khác nhau: vùng thị giác cấp cao của não người tự nhiên tách ra các nhóm lớn như sinh vật và phi sinh vật. Mô hình có thể tách riêng các đối tượng cụ thể, nhưng lại khó hình thành ổn định những nhóm lớn hơn theo kiểu này. Sự khác biệt đó khiến não người dễ áp dụng kinh nghiệm cũ sang các đối tượng mới hơn, nên khi đối mặt với những thứ chưa từng gặp, chúng ta có thể phân loại nhanh chóng. Còn mô hình lại phụ thuộc nhiều hơn vào tri thức sẵn có, vì vậy khi gặp đối tượng mới, nó dễ dừng lại ở các đặc trưng bề mặt. Phương pháp được đề xuất trong bài báo chính là phát triển xung quanh đặc điểm này: dùng tín hiệu não để ràng buộc cấu trúc bên trong của mô hình, khiến nó gần hơn với cách phân loại của não người.

Giải pháp của nhóm Đại học Chiết Giang

Giải pháp mà nhóm đưa ra cũng rất độc đáo: không phải tiếp tục “đắp thêm” tham số, mà dùng một lượng nhỏ tín hiệu não để giám sát. Những tín hiệu não này đến từ việc ghi lại hoạt động của não khi con người nhìn ảnh. Bài báo viết rằng: chuyển human conceptual structures sang DNNs. Ý là dùng cách con người phân loại, cách con người quy nạp, cách đặt các khái niệm tương tự cùng với nhau—giúp mô hình học được nhiều nhất có thể.

Nhóm dùng 150 lớp huấn luyện đã biết và 50 lớp kiểm tra chưa từng thấy để thực nghiệm. Kết quả cho thấy, khi quá trình huấn luyện này tiến triển, khoảng cách giữa mô hình và biểu diễn của não người tiếp tục thu hẹp. Sự thay đổi này đồng thời xuất hiện ở cả hai nhóm lớp, điều đó cho thấy mô hình không chỉ học từ từng mẫu đơn lẻ, mà thực sự bắt đầu học một cách tổ chức khái niệm gần hơn với não người.

Sau quá trình huấn luyện này, mô hình có khả năng học tốt hơn khi số lượng mẫu rất ít, và khi đối mặt với tình huống mới cũng cho kết quả tốt hơn. Trong một nhiệm vụ chỉ cung cấp rất ít ví dụ nhưng yêu cầu mô hình phân biệt các khái niệm trừu tượng như sinh vật và phi sinh vật, mô hình trung bình tăng 20,5%, đồng thời còn vượt cả các mô hình đối chứng có quy mô tham số lớn hơn nhiều. Nhóm cũng thực hiện thêm 31 nhóm kiểm thử riêng, và một số mô hình đều xuất hiện mức cải thiện gần một phần mười.

Trong vài năm qua, con đường quen thuộc trong ngành mô hình là tăng quy mô mô hình lớn hơn. Nhóm Đại học Chiết Giang lại chọn một hướng khác, đi từ bigger is better sang structured is smarter. Việc mở rộng quy mô thực sự hữu ích, nhưng chủ yếu giúp cải thiện hiệu suất trong các tác vụ quen thuộc. Năng lực hiểu trừu tượng và khả năng chuyển dịch của con người đối với AI cũng quan trọng không kém; điều này đòi hỏi trong tương lai cấu trúc suy nghĩ của AI phải ngày càng giống với não người hơn. Giá trị của hướng đi này nằm ở chỗ nó kéo sự chú ý của ngành trở lại từ việc chỉ mở rộng quy mô đơn thuần, hướng về chính cấu trúc nhận thức.

Neosoul và tương lai

Điều này gợi ra một khả năng lớn hơn: sự tiến hóa của AI không nhất định chỉ xảy ra trong giai đoạn huấn luyện mô hình. Huấn luyện mô hình có thể quyết định AI sẽ tổ chức khái niệm như thế nào, và hình thành cấu trúc phán đoán chất lượng cao ra sao. Khi đi vào thế giới thực, lớp tiến hóa tiếp theo của AI mới chỉ bắt đầu: phán đoán của AI agent sẽ được ghi lại như thế nào, được kiểm chứng ra sao, làm sao trong quá trình cạnh tranh lẫn nhau ngoài đời thực lại tiếp tục trưởng thành và tiến hóa, giống như con người—tự học tự tiến hóa. Đây chính là điều Neosoul đang làm ngay bây giờ. Neosoul không chỉ khiến AI agent tạo ra câu trả lời, mà đưa AI agent vào một hệ thống liên tục dự đoán, liên tục kiểm chứng, liên tục đối soát và liên tục sàng lọc, để nó liên tục tự tối ưu hóa giữa phần dự đoán và kết quả; nhờ đó cấu trúc tốt hơn được giữ lại, còn cấu trúc tệ hơn bị loại bỏ. Thực ra, mục tiêu mà nhóm Đại học Chiết Giang và Neosoul cùng hướng tới là một: khiến AI không chỉ biết làm bài, mà còn phải có năng lực suy nghĩ toàn diện, liên tục tiến hóa.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Ghim