De acuerdo con Beating, Google Gemini 3.1 Flash-Lite pasó de vista previa a disponibilidad general (GA) el 8 de mayo, convirtiéndose en el modelo más barato y rápido de la serie Gemini 3. El precio de entrada se fija en 0,25 USD por millón de tokens y el de salida en 1,50 USD por millón de tokens: el coste de entrada es 75% menor que Claude 4.5 Haiku (1,00 USD) y la salida es 70% menor (5,00 USD). El modelo incluye una ventana de contexto de 1 millón de tokens y logra un rendimiento de 363 tokens por segundo, un 45% más rápido que su predecesor Gemini 2.5 Flash.
Los benchmarks de rendimiento muestran GPQA Diamond (razonamiento científico a nivel de posgrado) en 86,9%, superando a Claude 4.5 Haiku con 73,0% y a GPT-5 mini con 82,3%. MMMU-Pro (razonamiento multimodal) alcanza 76,8%. Entre los primeros adoptantes están Gladly, plataforma de atención al cliente, que informa una reducción de costes del 60% y una tasa de éxito del 99,6% en cargas de trabajo de producción, y JetBrains, que integra Flash-Lite en herramientas de asistencia dentro de IDE.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
OpenAI cambia el modelo predeterminado de ChatGPT a GPT-5.5 instantáneo, reduciendo las alucinaciones en un 52,5%
Según OpenAI, la empresa cambió el modelo predeterminado de ChatGPT a GPT-5.5 Instant el 8 de mayo. En pruebas internas, el modelo produjo un 52,5% menos afirmaciones alucinadas que GPT-5.3 Instant en prompts de alto riesgo, mientras que redujo las afirmaciones inexactas en un 37,3% en conversaciones marcadas por los usuarios para verificación de hechos
GateNewsHace3m
El CEO de Nvidia, Huang: La infraestructura de IA de próxima generación requiere extensas conexiones ópticas; el cobre es insuficiente, el 8 de mayo
Según BlockBeats, el 8 de mayo, el CEO de Nvidia, Jensen Huang, afirmó que la infraestructura de IA de próxima generación requerirá conexiones ópticas extensas, ya que el cobre no puede satisfacer las demandas computacionales que crecen rápidamente. Huang elogió la nueva asociación de Nvidia con Corning y la calificó como una oportunidad importante
GateNewsHace8m
Cloudflare Despide a Más de 1.100 Empleados (20% de la Plantilla) para Pasar a Operaciones Impulsadas por IA
Según Reuters, Cloudflare despidió a más de 1.100 empleados, lo que representa aproximadamente el 20% de su plantilla, el 8 de mayo para reestructurar sus operaciones en torno a herramientas de IA. El CEO Matthew Prince afirmó que la empresa está rediseñando cada equipo y función para adaptarse a una era de IA agentica, señalando el uso interno de IA
GateNewsHace21m
Google lanza Fitbit Air por 99,99 USD; el rastreador sin pantalla se convierte en el centro del Gemini Health Coach el 26 de mayo
Según Beating, Google lanzó Fitbit Air, un rastreador de salud sin pantalla con un precio de 99,99 USD, previsto para salir a la venta el 26 de mayo. El dispositivo pesa solo 5,2 gramos y cuenta con una batería de 7 días con capacidad de carga rápida de 5 minutos. Los sensores registran la frecuencia cardíaca 24 horas, la detección de fibrilación auricular, la saturación de oxígeno en sangre, h
GateNewsHace24m
OpenAI lanza tres modelos de voz en la API de tiempo real; GPT-Realtime-2 incluye una ventana de contexto de 128K
Según Beating, OpenAI lanzó tres modelos de voz en su Realtime API: GPT-Realtime-2 para conversación por voz con razonamiento, GPT-Realtime-Translate para traducción en tiempo real y GPT-Realtime-Whisper para transcripción en streaming. GPT-Realtime-2 es el primer modelo de voz de OpenAI con nivel de GPT-5-level re
GateNewsHace40m
La previsión de ingresos de Cloudflare decepciona, recorta 1.100 empleos y la acción cae 19% en operaciones fuera de horario
El informe financiero del primer trimestre de Cloudflare, publicado el jueves, muestra que sus ingresos y utilidades superaron las expectativas del mercado, evidenciando un fuerte impulso de crecimiento. Sin embargo, debido a que la empresa pronosticó para el segundo trimestre ingresos ligeramente por debajo de las estimaciones de los analistas, el mercado se mostró preocupado por si ese impulso de crecimiento se mantendrá. Al mismo tiempo, Cloudflare anunció recortes de alrededor de 1.100 empleados, cerca del 20% de su plantilla total; el CEO Matthew Prince destacó que la IA y los agentes ya se han convertido en la productividad central de la empresa, mientras su modelo operativo atraviesa una transformación fundamental. Tras los resultados que no cumplieron con las proyecciones y las noticias sobre despidos a gran escala, la acción de la compañía (NET) cayó casi 19% en las operaciones fuera de horario.
El mal desempeño en las previsiones de Cloudflare hace que la acción se desplome 19% tras el cierre
Los ingresos de Cloudflare en el primer trimestre alcanzaron 6,398 mil millones de dólares
ChainNewsAbmediahace1h