IplanRIO phát hành Rio 3.5 Open 397B vào ngày 13 tháng 6, quảng bá đây là một mô hình AI biên giới do chính phủ xây dựng với điểm chuẩn cao hơn các mô hình đã được thiết lập, bao gồm cả Qwen 3.7 Plus. Vài ngày sau khi ra mắt, công ty AI Nex đã công bố một chứng minh toán học cho thấy mô hình này là phép gộp trọng số trực tiếp theo tỷ lệ 0,6 Nex / 0,4 Qwen, với các phép đo độ đồng biến (collinearity) đạt 0,993 trên cả 60 lớp và một tỷ lệ trộn ổn định α ≈ 0,571. Sau đó, IplanRIO cập nhật thẻ mô hình để ghi nhận Nex, xóa các tuyên bố về điểm chuẩn và cho rằng vấn đề xuất phát từ “tải lên không đúng” bản gộp nền thay vì mô hình đã được chưng cất cuối cùng. Tranh chấp tập trung vào tiêu chuẩn ghi công trong phát triển AI mã nguồn mở, nơi việc xây dựng dựa trên các mô hình open-weight hiện có là thực hành phổ biến nhưng cần ghi rõ công cho mọi mô hình nguồn theo điều khoản giấy phép như Apache 2.0 và MIT.
IplanRIO của Rio de Janeiro đã phát hành Rio 3.5 vào ngày 13 tháng 6. Cơ quan CNTT của thành phố mô tả đây là một mô hình hạng biên giới với 397 tỷ tham số và giấy phép mã nguồn mở cởi mở, được phát triển bởi chính quyền thành phố. Việc ra mắt trùng với trận mở màn World Cup của Brazil, và các bình luận về mô hình lan nhanh từ Brazil tới các khán giả quốc tế.
Thẻ mô hình ban đầu mô tả Rio 3.5 là kết quả “post-train” của Qwen 3.5 397B, mô hình open-base của Alibaba, với một lớp suy luận có tên SwiReasoning được thêm vào phía trên. Chi phí phát triển được báo cáo là R$500.000, xấp xỉ 100.000 USD. Kiến trúc sử dụng Mixture-of-Experts, kích hoạt khoảng 17 tỷ trong tổng số 397 tỷ tham số cho mỗi token. Mô hình hỗ trợ cả tầm nhìn và văn bản, xử lý hơn một tá ngôn ngữ và được phát hành theo giấy phép MIT.
SwiReasoning là một khung suy luận (inference) không cần huấn luyện, chuyển đổi giữa hai chế độ. Khi mô hình tự tin về từ tiếp theo—entropy thấp trong phân phối xác suất—nó suy luận bằng ngôn ngữ tự nhiên. Khi không chắc chắn, nó chuyển sang suy luận tiềm ẩn trong các trạng thái nội bộ ẩn mà không phát ra token.
Các điểm chuẩn tự báo cáo bao gồm Terminal-Bench 2.1 ở 70,8%, nhỉnh hơn Qwen 3.7 Plus ở 70,3% và DeepSeek v4 Pro ở 67,9%. Trên IMOAnswerBench, Rio 3.5 đạt 89,5%. Trên HLE—Humanity's Last Exam—Rio 3.5 đạt 36,5%, cao hơn Qwen 3.7 Plus ở 34,7%. Thị trưởng Rio de Janeiro Eduardo Cavaliere đã đăng tweet về việc ra mắt, nói rằng “Một mô hình AI mở được huấn luyện tại Rio và được cấp vốn công khai trong năm qua bởi [Municipality of Rio] vừa vượt qua tất cả các mô hình khác.”
Nex-AGI, một liên minh AI mã nguồn mở có trụ sở tại Thượng Hải, đã đăng trên X vài ngày sau khi phát hành. Bài phân tích nêu: “Mô hình Rio 3.5 đã làm sập internet trong tuần này. Cú twist là gì? Thực chất nó là mô hình mã nguồn mở của chúng tôi, Nex N2 Pro, đội một chiếc mũ khác.” Nex phân tích các trọng số và đưa ra công thức: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Một script xác minh và báo cáo đầy đủ trên GitHub đã được theo sau.
Bằng chứng bao gồm cả phần hành vi và toán học. Nex đã loại bỏ prompt hệ thống mã hóa cứng “You are Rio” khỏi mô hình được triển khai và đưa ra 120 câu hỏi nhận dạng danh tính. Không có prompt, Nex báo cáo mô hình tự nhận mình là “Nex, from Nex-AGI” trong 79,2% trường hợp và “Rio” trong 0% trường hợp. Mô hình kể lại nguyên văn phần “tiểu sử” cụ thể của Nex, nhắc đến “Shanghai Innovation Institute” và “một liên minh hệ sinh thái mô hình cỡ lớn”.
Về mặt toán học, Nex đo độ đồng biến (collinearity) trên toàn bộ 60 lớp. Kết quả trả về là 0,993. Tỷ lệ trộn giữ ở α ≈ 0,571, ổn định tới ba chữ số thập phân. Nex cho biết: “Mọi tensor trọng số trong Rio, tính theo hàng nghìn độ lệch chuẩn, là cùng một phép trộn 0,6/0,4 giữa Nex và Qwen—trên tất cả 60 lớp và mọi thành phần của mạng. Không có lời giải thích vô tội.”
Nex N2 Pro, được phát hành trước Rio 3.5 vài ngày, đạt 75,3% trên Terminal-Bench 2.1—cao hơn mức 70,8% của Rio. Trên GDPval, một benchmark dự báo kinh tế, Nex có điểm là 1.585 so với 1.533 của Rio.
IplanRIO đã cập nhật thẻ mô hình trên Hugging Face. Bảng benchmark đã bị xóa và phần ghi công (attribution) được thay đổi. Readme cập nhật nêu: “Mô hình được xây dựng thông qua một phép gộp giữa nex-agi/Nex-N2-Pro và Qwen/Qwen3.5-397B-A17B, được tiếp nối bởi On-Policy Distillation từ một mô hình mạnh hơn. Chúng tôi đã phát hiện một lần tải lên không đúng ở phiên bản trước, trong đó bản gộp nền đã được tải lên thay vì mô hình đã chưng cất cuối cùng. Chúng tôi xin lỗi vì sự nhầm lẫn và xin chân thành cáo lỗi.”
Chưa có thông báo công khai nào khác từ IplanRIO. Giờ đây Nex được ghi công trên thẻ mô hình. Giải thích “tải lên không đúng” khẳng định phần phát hành dự định là phiên bản đã chưng cất của nền gộp, chứ không phải chính bản gộp thô. On-policy distillation là việc dùng một mô hình “teacher” mạnh hơn tạo ra đầu ra, trong khi mô hình “student” huấn luyện trên các đầu ra đó và tự tạo ra đầu ra của mình.
IplanRIO cho biết họ đang làm việc để tải lên mô hình đã được chưng cất sau khi sửa, với ghi công đầy đủ đã được đặt đúng.
Việc gộp mô hình là hợp lệ theo các giấy phép liên quan. Nex N2 Pro là Apache 2.0, cho phép sử dụng, sửa đổi và phân phối lại kèm ghi công. Qwen 3.5 được cấp phép công khai. Vấn đề nằm ở việc trình bày đầu ra như một công trình được phát triển độc lập mà không nêu tên tất cả các mô hình nguồn.
Bình luận viên công nghệ Rafael Quintanilha cho rằng vì Nex N2 Pro được xây dựng dựa trên Qwen, đội ngũ có thể đã ghi công cho kiến trúc nền và để nguyên như vậy. Ông cũng chỉ ra rằng mô hình đã lan truyền mạnh trong một trận đấu World Cup, “không nhất thiết là ‘đã sẵn sàng để công chúng sử dụng’.” Lập trình viên Lucas Montano cho rằng “việc gộp hai mô hình thuộc nhóm ~400B rồi áp dụng policy distillation không hề đơn giản”, đồng thời thừa nhận vừa có lỗi kỹ thuật vừa có sự cố trong truyền thông.
Nhà nghiên cứu AI Diego Ambrosio cho biết lần ra mắt ban đầu mô tả Rio 3.5 là kết quả của “autonomous post-training and proprietary fine-tuning”—cách diễn đạt này hàm ý nghiên cứu gốc, chứ không phải một phép gộp.
Nex viết trên X: “Chúng tôi rất vinh dự khi Thành phố Rio dùng công sức của chúng tôi để đạt hiệu năng SOTA. Nhưng trong thế giới mã nguồn mở, việc ghi công là điều quan trọng.”
What did IplanRIO release on June 13?
IplanRIO đã phát hành Rio 3.5 Open 397B vào ngày 13 tháng 6, được mô tả là một mô hình AI biên giới do chính phủ xây dựng với 397 tỷ tham số, kiến trúc Mixture-of-Experts và các điểm benchmark bao gồm 70,8% trên Terminal-Bench 2.1, 89,5% trên IMOAnswerBench và 36,5% trên HLE. Mô hình được phát hành theo giấy phép MIT với chi phí phát triển được báo cáo là R$500.000.
What did Nex's mathematical analysis show about Rio 3.5?
Nex đã công bố một chứng minh toán học cho thấy Rio 3.5 là phép gộp trọng số trực tiếp theo công thức: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Phân tích đo độ đồng biến ở mức 0,993 trên tất cả 60 lớp với tỷ lệ trộn ổn định α ≈ 0,571. Các bài test nhận dạng cho thấy mô hình tự nhận mình là “Nex, from Nex-AGI” trong 79,2% trường hợp và “Rio” trong 0% trường hợp khi loại bỏ prompt hệ thống mã hóa cứng.
How did IplanRIO respond to Nex's findings?
IplanRIO đã cập nhật thẻ mô hình trên Hugging Face để ghi công cho Nex, xóa các tuyên bố về điểm chuẩn và nêu: “Chúng tôi đã phát hiện một lần tải lên không đúng ở phiên bản trước, trong đó bản gộp nền đã được tải lên thay vì mô hình đã chưng cất cuối cùng.” Thẻ cập nhật mô tả mô hình là “được xây dựng thông qua một phép gộp giữa nex-agi/Nex-N2-Pro và Qwen/Qwen3.5-397B-A17B, được tiếp nối bởi On-Policy Distillation từ một mô hình mạnh hơn.” IplanRIO cho biết họ đang làm việc để tải lên mô hình đã được chưng cất sau khi sửa, với ghi công đầy đủ.
Tin tức liên quan
IREN mua lại Nostrum Group có trụ sở tại Tây Ban Nha với công suất điện 490 MW cho trung tâm dữ liệu AI
AMD vượt $900B về vốn hóa thị trường khi Ryzen AI Halo thách thức Nvidia DGX Spark
Các nhà lãnh đạo AI tranh luận về việc khác biệt hóa mô hình và cơ hội về Trí tuệ hiện thân của Trung Quốc tại Hội nghị Zhiyuan
ChatGPT Pro mang lại giá trị AI 14.000 USD trong thử nghiệm gói đăng ký Semianalysis
Bittensor tăng 16% sau lệnh tắt mô hình AI của Anthropic