Mô hình Rio 3.5 của IplanRIO được chứng minh là Nex Weight Merge trong tranh chấp về phân bổ quyền quy chiếu

IplanRIO phát hành Rio 3.5 Open 397B vào ngày 13 tháng 6, quảng bá đây là một mô hình AI biên giới do chính phủ xây dựng với điểm chuẩn cao hơn các mô hình đã được thiết lập, bao gồm cả Qwen 3.7 Plus. Vài ngày sau khi ra mắt, công ty AI Nex đã công bố một chứng minh toán học cho thấy mô hình này là phép gộp trọng số trực tiếp theo tỷ lệ 0,6 Nex / 0,4 Qwen, với các phép đo độ đồng biến (collinearity) đạt 0,993 trên cả 60 lớp và một tỷ lệ trộn ổn định α ≈ 0,571. Sau đó, IplanRIO cập nhật thẻ mô hình để ghi nhận Nex, xóa các tuyên bố về điểm chuẩn và cho rằng vấn đề xuất phát từ “tải lên không đúng” bản gộp nền thay vì mô hình đã được chưng cất cuối cùng. Tranh chấp tập trung vào tiêu chuẩn ghi công trong phát triển AI mã nguồn mở, nơi việc xây dựng dựa trên các mô hình open-weight hiện có là thực hành phổ biến nhưng cần ghi rõ công cho mọi mô hình nguồn theo điều khoản giấy phép như Apache 2.0 và MIT.

IplanRIO Releases Rio 3.5 Model on June 13

IplanRIO của Rio de Janeiro đã phát hành Rio 3.5 vào ngày 13 tháng 6. Cơ quan CNTT của thành phố mô tả đây là một mô hình hạng biên giới với 397 tỷ tham số và giấy phép mã nguồn mở cởi mở, được phát triển bởi chính quyền thành phố. Việc ra mắt trùng với trận mở màn World Cup của Brazil, và các bình luận về mô hình lan nhanh từ Brazil tới các khán giả quốc tế.

Thẻ mô hình ban đầu mô tả Rio 3.5 là kết quả “post-train” của Qwen 3.5 397B, mô hình open-base của Alibaba, với một lớp suy luận có tên SwiReasoning được thêm vào phía trên. Chi phí phát triển được báo cáo là R$500.000, xấp xỉ 100.000 USD. Kiến trúc sử dụng Mixture-of-Experts, kích hoạt khoảng 17 tỷ trong tổng số 397 tỷ tham số cho mỗi token. Mô hình hỗ trợ cả tầm nhìn và văn bản, xử lý hơn một tá ngôn ngữ và được phát hành theo giấy phép MIT.

SwiReasoning là một khung suy luận (inference) không cần huấn luyện, chuyển đổi giữa hai chế độ. Khi mô hình tự tin về từ tiếp theo—entropy thấp trong phân phối xác suất—nó suy luận bằng ngôn ngữ tự nhiên. Khi không chắc chắn, nó chuyển sang suy luận tiềm ẩn trong các trạng thái nội bộ ẩn mà không phát ra token.

Các điểm chuẩn tự báo cáo bao gồm Terminal-Bench 2.1 ở 70,8%, nhỉnh hơn Qwen 3.7 Plus ở 70,3% và DeepSeek v4 Pro ở 67,9%. Trên IMOAnswerBench, Rio 3.5 đạt 89,5%. Trên HLE—Humanity's Last Exam—Rio 3.5 đạt 36,5%, cao hơn Qwen 3.7 Plus ở 34,7%. Thị trưởng Rio de Janeiro Eduardo Cavaliere đã đăng tweet về việc ra mắt, nói rằng “Một mô hình AI mở được huấn luyện tại Rio và được cấp vốn công khai trong năm qua bởi [Municipality of Rio] vừa vượt qua tất cả các mô hình khác.”

Nex Publishes Mathematical Proof of Weight Merge

Nex-AGI, một liên minh AI mã nguồn mở có trụ sở tại Thượng Hải, đã đăng trên X vài ngày sau khi phát hành. Bài phân tích nêu: “Mô hình Rio 3.5 đã làm sập internet trong tuần này. Cú twist là gì? Thực chất nó là mô hình mã nguồn mở của chúng tôi, Nex N2 Pro, đội một chiếc mũ khác.” Nex phân tích các trọng số và đưa ra công thức: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Một script xác minh và báo cáo đầy đủ trên GitHub đã được theo sau.

Bằng chứng bao gồm cả phần hành vi và toán học. Nex đã loại bỏ prompt hệ thống mã hóa cứng “You are Rio” khỏi mô hình được triển khai và đưa ra 120 câu hỏi nhận dạng danh tính. Không có prompt, Nex báo cáo mô hình tự nhận mình là “Nex, from Nex-AGI” trong 79,2% trường hợp và “Rio” trong 0% trường hợp. Mô hình kể lại nguyên văn phần “tiểu sử” cụ thể của Nex, nhắc đến “Shanghai Innovation Institute” và “một liên minh hệ sinh thái mô hình cỡ lớn”.

Về mặt toán học, Nex đo độ đồng biến (collinearity) trên toàn bộ 60 lớp. Kết quả trả về là 0,993. Tỷ lệ trộn giữ ở α ≈ 0,571, ổn định tới ba chữ số thập phân. Nex cho biết: “Mọi tensor trọng số trong Rio, tính theo hàng nghìn độ lệch chuẩn, là cùng một phép trộn 0,6/0,4 giữa Nex và Qwen—trên tất cả 60 lớp và mọi thành phần của mạng. Không có lời giải thích vô tội.”

Nex N2 Pro, được phát hành trước Rio 3.5 vài ngày, đạt 75,3% trên Terminal-Bench 2.1—cao hơn mức 70,8% của Rio. Trên GDPval, một benchmark dự báo kinh tế, Nex có điểm là 1.585 so với 1.533 của Rio.

IplanRIO Updates Model Card and Credits Nex

IplanRIO đã cập nhật thẻ mô hình trên Hugging Face. Bảng benchmark đã bị xóa và phần ghi công (attribution) được thay đổi. Readme cập nhật nêu: “Mô hình được xây dựng thông qua một phép gộp giữa nex-agi/Nex-N2-Pro và Qwen/Qwen3.5-397B-A17B, được tiếp nối bởi On-Policy Distillation từ một mô hình mạnh hơn. Chúng tôi đã phát hiện một lần tải lên không đúng ở phiên bản trước, trong đó bản gộp nền đã được tải lên thay vì mô hình đã chưng cất cuối cùng. Chúng tôi xin lỗi vì sự nhầm lẫn và xin chân thành cáo lỗi.”

Chưa có thông báo công khai nào khác từ IplanRIO. Giờ đây Nex được ghi công trên thẻ mô hình. Giải thích “tải lên không đúng” khẳng định phần phát hành dự định là phiên bản đã chưng cất của nền gộp, chứ không phải chính bản gộp thô. On-policy distillation là việc dùng một mô hình “teacher” mạnh hơn tạo ra đầu ra, trong khi mô hình “student” huấn luyện trên các đầu ra đó và tự tạo ra đầu ra của mình.

IplanRIO cho biết họ đang làm việc để tải lên mô hình đã được chưng cất sau khi sửa, với ghi công đầy đủ đã được đặt đúng.

Community Debate on Attribution Standards

Việc gộp mô hình là hợp lệ theo các giấy phép liên quan. Nex N2 Pro là Apache 2.0, cho phép sử dụng, sửa đổi và phân phối lại kèm ghi công. Qwen 3.5 được cấp phép công khai. Vấn đề nằm ở việc trình bày đầu ra như một công trình được phát triển độc lập mà không nêu tên tất cả các mô hình nguồn.

Bình luận viên công nghệ Rafael Quintanilha cho rằng vì Nex N2 Pro được xây dựng dựa trên Qwen, đội ngũ có thể đã ghi công cho kiến trúc nền và để nguyên như vậy. Ông cũng chỉ ra rằng mô hình đã lan truyền mạnh trong một trận đấu World Cup, “không nhất thiết là ‘đã sẵn sàng để công chúng sử dụng’.” Lập trình viên Lucas Montano cho rằng “việc gộp hai mô hình thuộc nhóm ~400B rồi áp dụng policy distillation không hề đơn giản”, đồng thời thừa nhận vừa có lỗi kỹ thuật vừa có sự cố trong truyền thông.

Nhà nghiên cứu AI Diego Ambrosio cho biết lần ra mắt ban đầu mô tả Rio 3.5 là kết quả của “autonomous post-training and proprietary fine-tuning”—cách diễn đạt này hàm ý nghiên cứu gốc, chứ không phải một phép gộp.

Nex viết trên X: “Chúng tôi rất vinh dự khi Thành phố Rio dùng công sức của chúng tôi để đạt hiệu năng SOTA. Nhưng trong thế giới mã nguồn mở, việc ghi công là điều quan trọng.”

FAQ

What did IplanRIO release on June 13?

IplanRIO đã phát hành Rio 3.5 Open 397B vào ngày 13 tháng 6, được mô tả là một mô hình AI biên giới do chính phủ xây dựng với 397 tỷ tham số, kiến trúc Mixture-of-Experts và các điểm benchmark bao gồm 70,8% trên Terminal-Bench 2.1, 89,5% trên IMOAnswerBench và 36,5% trên HLE. Mô hình được phát hành theo giấy phép MIT với chi phí phát triển được báo cáo là R$500.000.

What did Nex's mathematical analysis show about Rio 3.5?

Nex đã công bố một chứng minh toán học cho thấy Rio 3.5 là phép gộp trọng số trực tiếp theo công thức: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Phân tích đo độ đồng biến ở mức 0,993 trên tất cả 60 lớp với tỷ lệ trộn ổn định α ≈ 0,571. Các bài test nhận dạng cho thấy mô hình tự nhận mình là “Nex, from Nex-AGI” trong 79,2% trường hợp và “Rio” trong 0% trường hợp khi loại bỏ prompt hệ thống mã hóa cứng.

How did IplanRIO respond to Nex's findings?

IplanRIO đã cập nhật thẻ mô hình trên Hugging Face để ghi công cho Nex, xóa các tuyên bố về điểm chuẩn và nêu: “Chúng tôi đã phát hiện một lần tải lên không đúng ở phiên bản trước, trong đó bản gộp nền đã được tải lên thay vì mô hình đã chưng cất cuối cùng.” Thẻ cập nhật mô tả mô hình là “được xây dựng thông qua một phép gộp giữa nex-agi/Nex-N2-Pro và Qwen/Qwen3.5-397B-A17B, được tiếp nối bởi On-Policy Distillation từ một mô hình mạnh hơn.” IplanRIO cho biết họ đang làm việc để tải lên mô hình đã được chưng cất sau khi sửa, với ghi công đầy đủ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận