Microsoft Research publicó esta semana Fara1.5, un modelo de IA de pesos abiertos para tareas de navegación web que superó a Operator de OpenAI y a Computer Use de Gemini 2.5 en benchmarks de la industria. Fara1.5-27B obtuvo un 72% en Online-Mind2Web, frente al 58,3% de OpenAI Operator y el 57,3% de Gemini 2.5 Computer Use. El lanzamiento supone un cambio en el panorama competitivo de los agentes de uso de computadoras: sistemas de IA diseñados para leer pantallas del navegador y realizar acciones como hacer clic, desplazarse e introducir texto sin requerir plugins especiales. A diferencia de Operator propietario y basado en la nube de OpenAI (lanzado en enero de 2025 a 200 USD mensuales antes de ser descontinuado en agosto) y de la oferta de Gemini de Google, Fara1.5 es de código abierto con pesos publicados públicamente. Microsoft logró este rendimiento replanteando el proceso de desarrollo completo, desde la generación de datos y los objetivos de entrenamiento hasta el diseño del modelo y la orquestación.
Especificaciones del modelo y disponibilidad
Fara1.5 viene en tres tamaños: 4 mil millones, 9 mil millones y 27 mil millones de parámetros, todos construidos sobre Qwen 3.5, un modelo base de Alibaba que Microsoft ajustó de forma específica para trabajos de navegador. Fara1.5-9B, la variante de tamaño medio, obtuvo un 63,4% en Online-Mind2Web, por delante de las ofertas de OpenAI y de Google. El modelo de 9 mil millones de parámetros ya está disponible en Azure AI Foundry, mientras que las variantes de 4 mil millones y 27 mil millones llegarán en breve.
Rendimiento en benchmarks
Online-Mind2Web, el benchmark principal, prueba con qué frecuencia un agente de IA completa correctamente 300 tareas diversas del mundo real en 136 sitios web populares en vivo, incluidas comparaciones de productos, llenado de formularios y servicios de reservas. La puntuación refleja las tareas completadas correctamente en la internet real, cambiante.
En WebVoyager, un segundo benchmark que mide el éxito de tareas en la web en vivo, Fara1.5-27B alcanzó un 88,6%, quedándose por encima del 87,0% de OpenAI Operator y superando a H Company con Holo2 (30 mil millones de parámetros) en un 83,0%.
Los competidores de código abierto puntuaron más bajo: GUI-Owl-1.5 de Alibaba (8 mil millones de parámetros) llegó a 48,6%, mientras que MolmoWeb de AI2 obtuvo 35,3%. El modelo anterior de Microsoft, Fara-7B, consiguió un 34,1%, lo que significa que Fara1.5-27B casi duplicó el rendimiento de su predecesor en un tamaño comparable. Navigator n1 de Yutori, la alternativa propietaria líder, alcanzó un 64,7%.
Metodología de entrenamiento
Microsoft usó FaraGen1.5 para generar datos de entrenamiento, empleando GPT-5.4—el modelo de OpenAI—como un “agente docente” para demostrar cómo completar tareas en el navegador. Estas demostraciones se convirtieron en los datos de entrenamiento de Fara1.5.
El equipo también creó seis réplicas totalmente funcionales de sitios web reales, incluidos clientes de correo, calendarios y marketplaces. Este entrenamiento de dominio sintético permitió al modelo practicar tareas que requieren inicios de sesión o acciones irreversibles sin acceder a cuentas reales, mejorando el rendimiento en tareas “gated”.
Seguridad y control del usuario
Cada modelo está diseñado para detenerse y preguntar antes de realizar acciones irreversibles. Fara1.5 se ejecuta mediante MagenticLite, un entorno de navegador aislado (sandbox) que registra cada acción y permite a los usuarios detener al agente en cualquier momento. Según Yash Lara, Senior PM Lead en Microsoft Research, “equilibrar salvaguardas robustas como Critical Points con trayectorias de usuario fluidas es clave. Contar con una UI, como Magentic-UI de Microsoft Research, es vital para dar a los usuarios oportunidades de intervenir cuando sea necesario, y también para ayudar a evitar la fatiga de aprobación”.
Expansión futura
Microsoft indicó que planea expandir Fara1.5 más allá del navegador hacia aplicaciones de escritorio y software empresarial.