El modelo Rio 3.5 de IplanRIO se ha probado como una fusión de peso Nex en una disputa de atribución

IplanRIO lanzó Rio 3.5 Open 397B el 13 de junio, presentándolo como un modelo de IA de frontera construido por el gobierno con puntuaciones de referencia por encima de modelos establecidos, incluido Qwen 3.7 Plus. Días después del lanzamiento, la empresa de IA Nex publicó una prueba matemática que mostraba que el modelo es una fusión directa de pesos con una ponderación 0,6 Nex / 0,4 Qwen, con mediciones de colinealidad de 0,993 en las 60 capas y una razón de mezcla estable de α ≈ 0,571. Posteriormente, IplanRIO actualizó la ficha del modelo para dar crédito a Nex, eliminó las afirmaciones de benchmarks y atribuyó el problema a un “cargado incorrecto” de una versión base fusionada en lugar de un modelo final destilado. La disputa se centra en los estándares de atribución en el desarrollo de IA de código abierto, donde construir sobre modelos abiertos de pesos es una práctica común, pero requiere atribuir explícitamente a todos los modelos fuente bajo términos de licencia como Apache 2.0 y MIT.

IplanRIO lanza el modelo Rio 3.5 el 13 de junio

El IplanRIO de Río de Janeiro lanzó Rio 3.5 el 13 de junio. La agencia de TI de la ciudad lo describió como un modelo de clase “frontier” con 397 mil millones de parámetros y una licencia permisiva de código abierto, desarrollado por el gobierno municipal. El lanzamiento coincidió con el partido inaugural de la Copa Mundial de Brasil, y los comentarios sobre el modelo se difundieron rápidamente desde Brasil hacia audiencias internacionales.

La ficha original del modelo describía Rio 3.5 como un post-entrenamiento de Qwen 3.5 397B, el modelo base abierto de Alibaba, con una capa de razonamiento llamada SwiReasoning añadida encima. El costo de desarrollo reportado fue de R$500.000, aproximadamente $100.000 USD. La arquitectura usa Mixture-of-Experts, activando alrededor de 17 mil millones de los 397 mil millones de parámetros por token. El modelo admite visión y texto, maneja más de una docena de idiomas y se distribuye bajo una licencia MIT.

SwiReasoning es un marco de inferencia sin entrenamiento que alterna entre dos modos. Cuando el modelo está seguro sobre la siguiente palabra—baja entropía en la distribución de probabilidades—razona en lenguaje claro. Cuando no está seguro, cambia a un razonamiento latente en estados internos ocultos sin emitir tokens.

Las puntuaciones de benchmarks autodeclaradas incluían Terminal-Bench 2.1 con 70,8%, superando a Qwen 3.7 Plus con 70,3% y DeepSeek v4 Pro con 67,9%. En IMOAnswerBench, Rio 3.5 obtuvo 89,5%. En HLE—Humanity's Last Exam—Rio 3.5 llegó a 36,5%, por delante del 34,7% de Qwen 3.7 Plus. El alcalde de Río de Janeiro Eduardo Cavaliere tuiteó sobre el lanzamiento, afirmando: “Un modelo de IA abierto entrenado en Río y financiado públicamente durante el último año por [la Municipalidad de Río] acaba de superar a todos los demás modelos.”

Nex publica una prueba matemática del merge de pesos

Nex-AGI, una alianza de IA de código abierto con sede en Shanghái, publicó en X días después del lanzamiento. El análisis dijo: “El modelo Rio 3.5 rompió internet esta semana. El giro? Es esencialmente nuestro modelo de código abierto, Nex N2 Pro, usando un sombrero diferente.” Nex analizó los pesos y reportó la fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Luego siguieron un script de verificación y un informe completo en GitHub.

La evidencia incluyó componentes conductuales y matemáticos. Nex eliminó del modelo desplegado el prompt del sistema “You are Rio” codificado (hardcoded) y envió 120 preguntas de identidad. Sin el prompt, Nex informa que el modelo se identificó como “Nex, from Nex-AGI” el 79,2% de las veces y como “Rio” el 0% de las veces. El modelo recitó el trasfondo específico de Nex palabra por palabra, mencionando el “Shanghai Innovation Institute” y una “a large-model ecosystem alliance”.

Matemáticamente, Nex midió la colinealidad en las 60 capas. El resultado fue 0,993. La razón de mezcla se mantuvo en α ≈ 0,571, estable hasta tres decimales. Nex afirmó: “Cada tensor de pesos en Rio es, en miles de desviaciones estándar, el mismo blend 0,6/0,4 de Nex y Qwen—en las 60 capas y en cada componente de la red. No hay una explicación inocente.”

Nex N2 Pro, lanzado días antes que Rio 3.5, obtiene 75,3% en Terminal-Bench 2.1—más alto que el 70,8% de Rio. En GDPval, un benchmark de pronóstico económico, Nex está en 1.585 frente a 1.533 de Rio.

IplanRIO actualiza la ficha del modelo y da crédito a Nex

IplanRIO actualizó la ficha del modelo en Hugging Face. Se eliminó la tabla de benchmarks y cambió la atribución. El Readme actualizado establece: “El modelo se construye mediante una fusión de nex-agi/Nex-N2-Pro y Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation desde un modelo más fuerte. Detectamos una carga incorrecta en la versión anterior, donde se subió la versión base fusionada en lugar del modelo final destilado. Lamentamos la confusión y pedimos disculpas con gran pesar.”

No se ha publicado ninguna otra declaración pública por parte de IplanRIO. Ahora Nex aparece acreditado en la ficha del modelo. La explicación del “cargado incorrecto” afirma que el lanzamiento previsto era una versión destilada de la base fusionada, no la fusión cruda en sí. La destilación on-policy implica que un modelo profesor más fuerte genera salidas mientras el estudiante se entrena con esas salidas y genera las suyas propias.

IplanRIO indicó que está trabajando para subir el modelo destilado corregido con la atribución completa en su lugar.

Debate en la comunidad sobre estándares de atribución

La fusión de modelos es legal bajo las licencias involucradas. Nex N2 Pro es Apache 2.0, lo que permite usar, modificar y redistribuir dando crédito. Qwen 3.5 tiene licencia abierta. El problema se centró en presentar la salida como un trabajo desarrollado de forma independiente sin nombrar a todos los modelos fuente.

El comentarista técnico Rafael Quintanilha señaló que, dado que Nex N2 Pro se construye sobre Qwen, el equipo podría haber acreditado la arquitectura subyacente y haberlo dejado ahí. También destacó que el modelo se volvió viral durante un partido de la Copa Mundial, “no necesariamente ‘listo para consumo público’.” El desarrollador Lucas Montano señaló que “fusionar dos modelos de la clase ~400B y luego aplicar distilación por política no es trivial”, mientras reconocía tanto un error técnico como un fallo de comunicación.

La investigadora de IA Diego Ambrosio señaló que el lanzamiento original describía Rio 3.5 como el resultado de “post-entrenamiento autónomo y afinamiento propietario”, encuadrándolo de modo que implicaba investigación original, no una fusión.

Nex escribió en X: “Nos sentimos halagados de que la Ciudad de Río haya usado nuestro trabajo para lograr rendimiento SOTA. Pero en el mundo del código abierto, la atribución importa.”

FAQ

¿Qué lanzó IplanRIO el 13 de junio?

IplanRIO lanzó Rio 3.5 Open 397B el 13 de junio, descrito como un modelo de IA de frontera construido por el gobierno con 397 mil millones de parámetros, arquitectura Mixture-of-Experts y puntuaciones de benchmarks que incluían 70,8% en Terminal-Bench 2.1, 89,5% en IMOAnswerBench y 36,5% en HLE. El modelo se lanzó bajo una licencia MIT con un costo de desarrollo reportado de R$500.000.

¿Qué mostró el análisis matemático de Nex sobre Rio 3.5?

Nex publicó una prueba matemática que muestra que Rio 3.5 es una fusión directa de pesos con la fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. El análisis midió la colinealidad en 0,993 en las 60 capas con una razón de mezcla estable de α ≈ 0,571. Las pruebas de identidad mostraron que el modelo se identificó como “Nex, from Nex-AGI” el 79,2% de las veces y como “Rio” el 0% de las veces cuando se retiró el prompt del sistema codificado.

¿Cómo respondió IplanRIO a los hallazgos de Nex?

IplanRIO actualizó la ficha del modelo en Hugging Face para acreditar a Nex, eliminó las afirmaciones de benchmarks y dijo: “Detectamos una carga incorrecta en la versión anterior, donde se subió la versión base fusionada en lugar del modelo final destilado.” La ficha actualizada describe el modelo como “construido mediante una fusión de nex-agi/Nex-N2-Pro y Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation desde un modelo más fuerte.” IplanRIO indicó que está trabajando para subir el modelo destilado corregido con la atribución completa.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios