โมเดล Rio 3.5 ของ IplanRIO พิสูจน์แล้วว่าใช้ Nex Weight Merge ในข้อพิพาทการระบุแหล่งที่มา

IplanRIO เปิดตัว Rio 3.5 Open 397B เมื่อวันที่ 13 มิถุนายน โดยอ้างว่าเป็นโมเดล AI แนวหน้า (frontier) ที่สร้างโดยภาครัฐ พร้อมคะแนนการทดสอบที่ทำได้สูงกว่าโมเดลที่มีชื่อเสียง รวมถึง Qwen 3.7 Plus หลังจากเปิดตัวไม่กี่วัน บริษัทด้าน AI อย่าง Nex ได้เผยแพร่ “การพิสูจน์ทางคณิตศาสตร์” ว่าโมเดลนี้คือการรวมค่าน้ำหนัก (weight merge) แบบตรงตัว 0.6 Nex / 0.4 Qwen โดยการวัด collinearity อยู่ที่ 0.993 ครอบคลุมทั้ง 60 เลเยอร์ และอัตราส่วนการผสมที่เสถียร α ≈ 0.571 ต่อมา IplanRIO อัปเดตโมเดลการ์ดเพื่อให้เครดิต Nex ลบข้ออ้างด้านเกณฑ์การทดสอบออก และระบุว่าเกิดปัญหาจาก “การอัปโหลดที่ผิดพลาด” ของเวอร์ชันที่เป็นแบบรวม (base merged) แทนที่จะเป็นโมเดลที่ผ่านการกลั่น (final distilled) ข้อพิพาทโฟกัสที่มาตรฐานการให้เครดิตในวงการพัฒนา AI โอเพนซอร์ส ซึ่งการต่อยอดจากโมเดลโอเพนเวทที่มีอยู่แล้วเป็นเรื่องปกติ แต่ต้องให้เครดิตอย่างชัดเจนกับโมเดลต้นทางทุกตัวภายใต้เงื่อนไขลิขสิทธิ์ เช่น Apache 2.0 และ MIT

IplanRIO Releases Rio 3.5 Model on June 13

IplanRIO ในกรุงริโอเดจาเนโรเผยแพร่ Rio 3.5 เมื่อวันที่ 13 มิถุนายน หน่วยงานไอทีของเมืองอธิบายว่าเป็นโมเดลระดับ frontier ที่มีพารามิเตอร์ 397 พันล้าน และเป็นไลเซนส์โอเพนซอร์สแบบเสรี (permissive) โดยพัฒนาภายใต้รัฐบาลเทศบาล การเปิดตัวเกิดขึ้นพร้อมช่วงวันเปิดการแข่งขันฟุตบอลโลกของบราซิล และกระแสความคิดเห็นเกี่ยวกับโมเดลแพร่จากบราซิลไปยังผู้ชมต่างประเทศอย่างรวดเร็ว

ในโมเดลการ์ดเวอร์ชันเดิม อธิบาย Rio 3.5 ว่าเป็นโมเดลหลังผ่านการเทรนต่อ (post-train) จาก Qwen 3.5 397B โมเดล open-base ของ Alibaba โดยเพิ่มชั้นด้านเหตุผล (reasoning layer) ที่ชื่อ SwiReasoning ไว้ด้านบน ค่าใช้จ่ายในการพัฒนาที่รายงานอยู่ที่ R$500,000 คิดเป็นประมาณ $100,000 USD สถาปัตยกรรมใช้ Mixture-of-Experts โดยเปิดใช้งานพารามิเตอร์ราว 17 พันล้านจากทั้งหมด 397 พันล้านต่อ 1 โทเคน โมเดลรองรับทั้งภาพและข้อความ จัดการได้มากกว่าสิบภาษา และเผยแพร่ภายใต้ไลเซนส์ MIT

SwiReasoning เป็นเฟรมเวิร์กสำหรับการอินเฟอเรนซ์ที่ไม่ต้องเทรน (training-free) ซึ่งสลับระหว่าง 2 โหมด เมื่อโมเดล “มั่นใจ” เกี่ยวกับคำถัดไป (เอนโทรปีต่ำในความน่าจะเป็น) มันจะให้เหตุผลด้วยภาษาธรรมดา เมื่อไม่แน่ใจ มันจะเปลี่ยนไปใช้การให้เหตุผลแบบ latent ในสถานะภายในที่ซ่อนอยู่ โดยไม่ส่งโทเคนออกมา

คะแนนการทดสอบที่รายงานเองรวมถึง Terminal-Bench 2.1 ที่ 70.8% แซง Qwen 3.7 Plus ที่ 70.3% และ DeepSeek v4 Pro ที่ 67.9% บน IMOAnswerBench, Rio 3.5 ทำได้ 89.5% บน HLE—Humanity's Last Exam—Rio 3.5 อยู่ที่ 36.5% นำหน้า Qwen 3.7 Plus ที่ 34.7% นายกเทศมนตรีของริโอเดจาเนโร Eduardo Cavaliere ทวีตเกี่ยวกับการเปิดตัว โดยระบุว่า “โมเดล AI แบบโอเพนที่เทรนในริโอ และได้รับทุนสาธารณะตลอดปีที่ผ่านมาโดย [Municipality of Rio] เพิ่งก้าวขึ้นไปเหนือโมเดลอื่นทั้งหมด”

Nex Publishes Mathematical Proof of Weight Merge

Nex-AGI พันธมิตร AI โอเพนซอร์สจากเซี่ยงไฮ้ โพสต์บน X หลังจากเปิดตัวไม่นาน การวิเคราะห์ระบุว่า: “โมเดล Rio 3.5 ทำให้ทั้งอินเทอร์เน็ตสะเทือนในสัปดาห์นี้ ทวิสต์คืออะไร? แท้จริงมันคือโมเดลโอเพนซอร์สของเรา Nex N2 Pro ที่สวม ‘หมวก’ อีกใบ” Nex วิเคราะห์ค่าน้ำหนักและรายงานสูตรว่า Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5 ตามด้วยสคริปต์สำหรับการตรวจสอบและรายงานฉบับเต็มบน GitHub

หลักฐานประกอบด้วยทั้งส่วนเชิงพฤติกรรมและเชิงคณิตศาสตร์ Nex ลบพรอมต์ระบบ (system prompt) ที่ฝังโค้ด “You are Rio” ออกจากโมเดลที่นำไปใช้งานจริง และส่งคำถามเอกลักษณ์ (identity questions) จำนวน 120 ข้อ โดยไม่ใช้พรอมต์ตามที่ Nex รายงาน โมเดลระบุว่าตัวเองเป็น “Nex, from Nex-AGI” 79.2% ของเวลา และ “Rio” 0% ของเวลา โมเดลยังท่อง “ชีวประวัติ/เรื่องเล่าเบื้องหลัง” เฉพาะของ Nex แบบคำต่อคำ โดยกล่าวถึง “Shanghai Innovation Institute” และ “a large-model ecosystem alliance”

เชิงคณิตศาสตร์ Nex วัด collinearity ครอบคลุมทั้ง 60 เลเยอร์ ผลออกมาที่ 0.993 อัตราส่วนการผสมยังคงที่ α ≈ 0.571 โดยเสถียรถึงทศนิยม 3 ตำแหน่ง Nex ระบุว่า: “ทุก weight tensor ใน Rio คือ (เมื่อเทียบกับส่วนเบี่ยงเบนมาตรฐานระดับหลายพัน) การผสม 0.6/0.4 เดียวกันของ Nex และ Qwen—ครอบคลุมทั้ง 60 เลเยอร์ และทุกองค์ประกอบของเครือข่าย ไม่มีคำอธิบายแบบ ‘บังเอิญ’ ที่ไร้เดียงสา”

Nex N2 Pro ซึ่งเปิดตัวก่อน Rio 3.5 ไม่กี่วัน ทำคะแนน Terminal-Bench 2.1 ที่ 75.3% ซึ่งสูงกว่า Rio 70.8% บน GDPval ซึ่งเป็นเกณฑ์ทดสอบการพยากรณ์เศรษฐกิจ Nex อยู่ที่ 1,585 เทียบกับ Rio ที่ 1,533

IplanRIO Updates Model Card and Credits Nex

IplanRIO อัปเดตโมเดลการ์ดบน Hugging Face ตารางเกณฑ์การทดสอบถูกลบออก และการให้เครดิต (attribution) ถูกเปลี่ยนแปลง Readme ที่อัปเดตระบุว่า: “โมเดลนี้สร้างขึ้นผ่านการ merge ของ nex-agi/Nex-N2-Pro และ Qwen/Qwen3.5-397B-A17B โดยมี On-Policy Distillation จากโมเดลที่แข็งแกร่งกว่าเป็นขั้นนำหน้า เราพบว่ามีการอัปโหลดที่ไม่ถูกต้องในเวอร์ชันก่อนหน้า โดยมีการอัปโหลดเวอร์ชัน base merged แทนที่จะอัปโหลดโมเดลที่ถูกกลั่นขั้นสุดท้าย ขออภัยสำหรับความสับสน และขอโทษอย่างสุดซึ้ง”

ยังไม่มีแถลงการณ์สาธารณะอื่นใดจาก IplanRIO Nex ตอนนี้ได้รับเครดิตบนโมเดลการ์ด คำอธิบายเรื่อง “การอัปโหลดที่ไม่ถูกต้อง” อ้างว่าเวอร์ชันที่ตั้งใจปล่อยคือโมเดลที่ถูกกลั่นของ base ที่รวมแล้ว ไม่ใช่ตัว merge แบบดิบ (raw merge) การทำ On-policy distillation คือการให้โมเดลครู (teacher) ที่แข็งแรงกว่าสร้างผลลัพธ์ ขณะที่โมเดลนักเรียน (student) เทรนจากผลลัพธ์เหล่านั้น และสร้างผลลัพธ์ของตนเอง

IplanRIO ระบุว่ากำลังดำเนินการอัปโหลดโมเดลที่แก้ไขแล้วซึ่งเป็นเวอร์ชันกลั่น (distilled) พร้อมให้เครดิตอย่างครบถ้วนในที่ที่ควรอยู่

Community Debate on Attribution Standards

การ merge โมเดลถือว่าเป็นเรื่องที่ทำได้ตามกฎหมายภายใต้ไลเซนส์ที่เกี่ยวข้อง Nex N2 Pro ใช้ Apache 2.0 ซึ่งอนุญาตให้ใช้ ปรับแก้ และแจกจ่ายซ้ำพร้อมการให้เครดิต Qwen 3.5 เป็นโอเพนไลเซนส์ ประเด็นจึงอยู่ที่การนำเสนอผลลัพธ์ว่าเป็นผลงานที่พัฒนาขึ้นเองโดยอิสระ โดยไม่ระบุโมเดลต้นทางทั้งหมด

นักวิจารณ์ด้านเทคโนโลยี Rafael Quintanilha ตั้งข้อสังเกตว่าเนื่องจาก Nex N2 Pro ถูกสร้างขึ้นบน Qwen ทีมอาจให้เครดิตสถาปัตยกรรมพื้นฐานแล้วและทิ้งไว้ตรงนั้น เขาชี้ว่าโมเดลนี้แพร่ไวรัลในระหว่างเกมฟุตบอลโลก โดย “ไม่จำเป็นต้อง ‘พร้อมสำหรับการบริโภคสาธารณะ’” ส่วน Developer Lucas Montano ระบุว่า “การผสานโมเดลระดับ ~400B สองตัว แล้วค่อยใช้ policy distillation ไม่ใช่เรื่องง่าย” พร้อมยอมรับทั้งข้อผิดพลาดทางเทคนิคและความล้มเหลวด้านการสื่อสาร

นักวิจัยด้าน AI Diego Ambrosio ชี้ว่าแถลงการณ์เปิดตัวครั้งแรกบรรยาย Rio 3.5 ว่าเป็นผลลัพธ์จาก “autonomous post-training and proprietary fine-tuning” ซึ่งการกรอบแบบนี้สื่อเป็นนัยถึงงานวิจัยดั้งเดิม ไม่ใช่การ merge

Nex เขียนบน X: “เรารู้สึกเป็นเกียรติที่ City of Rio นำผลงานของเราไปเพื่อให้ได้ประสิทธิภาพระดับ SOTA แต่ในโลกโอเพนซอร์ส การให้เครดิตมีความสำคัญ”

FAQ

What did IplanRIO release on June 13?

IplanRIO เปิดตัว Rio 3.5 Open 397B เมื่อวันที่ 13 มิถุนายน โดยอธิบายว่าเป็นโมเดล AI แนวหน้าแบบสร้างโดยรัฐ มีพารามิเตอร์ 397 พันล้าน ใช้สถาปัตยกรรม Mixture-of-Experts และมีคะแนนการทดสอบรวมถึง 70.8% บน Terminal-Bench 2.1, 89.5% บน IMOAnswerBench และ 36.5% บน HLE โมเดลถูกเผยแพร่ภายใต้ไลเซนส์ MIT และมีรายงานค่าใช้จ่ายในการพัฒนาที่ R$500,000

What did Nex's mathematical analysis show about Rio 3.5?

Nex เผยแพร่การพิสูจน์ทางคณิตศาสตร์ที่แสดงว่า Rio 3.5 เป็นการรวมค่าน้ำหนักโดยตรงตามสูตร: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5 การวิเคราะห์วัด collinearity ได้ 0.993 ครอบคลุมทั้ง 60 เลเยอร์ และอัตราส่วนการผสมที่เสถียร α ≈ 0.571 การทดสอบด้านเอกลักษณ์ (identity tests) แสดงว่าเมื่อถอดพรอมต์ system prompt ที่ฝังโค้ดออก โมเดลจะระบุตัวเองว่า “Nex, from Nex-AGI” 79.2% ของเวลา และ “Rio” 0% ของเวลา

How did IplanRIO respond to Nex's findings?

IplanRIO อัปเดตโมเดลการ์ดบน Hugging Face เพื่อให้เครดิต Nex ลบข้ออ้างด้านเกณฑ์การทดสอบ และระบุว่า: “เราพบว่ามีการอัปโหลดที่ไม่ถูกต้องในเวอร์ชันก่อนหน้า โดยมีการอัปโหลดเวอร์ชัน base merged แทนที่จะอัปโหลดโมเดลที่ถูกกลั่นขั้นสุดท้าย” การ์ดที่อัปเดตอธิบายโมเดลว่า “สร้างขึ้นผ่านการ merge ของ nex-agi/Nex-N2-Pro และ Qwen/Qwen3.5-397B-A17B โดยมี On-Policy Distillation จากโมเดลที่แข็งแกร่งกว่าเป็นขั้นนำหน้า” IplanRIO ระบุว่ากำลังดำเนินการอัปโหลดโมเดลที่แก้ไขแล้วซึ่งเป็นเวอร์ชันกลั่น พร้อมให้เครดิตอย่างครบถ้วน

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น