Mensaje de Gate News, 24 de abril — Zhang Chi, ex ingeniero del equipo Seed de ByteDance y profesor asistente actual en la Universidad de Pekín, reveló en el podcast “Into Asia” que ByteDance requiere aproximadamente seis meses para completar un ciclo completo de entrenamiento de modelos de lenguaje a gran escala (pretraining más post-entrenamiento), mientras que Google, según se informa, solo necesita tres meses. Zhang atribuyó la diferencia de velocidad como una de las razones principales por las que las empresas chinas luchan por ponerse al día en el desarrollo de IA.
Zhang describió una “cultura de evaluación comparativa” dentro de Seed, donde los líderes del equipo son evaluados en función de las puntuaciones de referencia que supervisan, y todos los miembros se enfocan en impulsar las cifras. Sin embargo, señaló que esto no se traduce en una mejor experiencia de usuario en la práctica. Aunque, en papel, los modelos de las principales empresas chinas parecen competitivos con los modelos punteros de EE. UU., quedan cortos en el uso real. El objetivo de Seed es alcanzar el rendimiento de primer nivel a nivel global, pero Zhang afirmó que no cree que el equipo haya logrado esto, ni que haya alcanzado el objetivo de liderazgo en el ámbito nacional.
A finales de 2024, Seed se consideraba a la par con GPT-4o, pero tras el lanzamiento de DeepSeek, el equipo reconoció que la brecha seguía igual. Cuando Zhang se incorporó, todo el grupo estaba virando con urgencia hacia el aprendizaje por refuerzo para abordar la deficiencia.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
IREN adquiere Mirantis mediante un acuerdo íntegramente en acciones $625M para ampliar la plataforma de nube de IA
Según BlockBeats, IREN Limited acordó adquirir la empresa de software de infraestructura en la nube Mirantis por aproximadamente 625 millones de dólares en una transacción totalmente en acciones el 5 de mayo. La adquisición busca mejorar las capacidades de nube con IA de IREN mediante la introducción de capacidades de software y orquestación para
GateNewshace4h
El CEO de Anthropic: Estados Unidos está considerando un proceso simplificado para el lanzamiento de modelos de IA, con competidores entre 1 y 3 meses por detrás
Según 金十, el CEO de Anthropic reveló el 5 de mayo que parece que el gobierno de EE. UU. está considerando simplificar el proceso para liberar modelos de inteligencia artificial. El CEO señaló que las capacidades de otros grandes laboratorios de IA podrían quedarse atrás de Anthropic entre uno y tres
GateNewshace5h
El equipo de SGLang completa la ronda de financiación semilla $100M en valoración $400M , con Accel a la cabeza
Según Beating, el equipo detrás del motor de inferencia de código abierto SGLang ha establecido formalmente RadixArk y ha completado una ronda de financiación semilla de 100 millones de dólares con una valoración post-money de 400 millones de dólares. Accel lideró la ronda, con Spark Capital como inversor co-líder. Los rivales de semiconductores Nvidia (a través de
GateNewshace5h
OpenAI concede a 8.000 desarrolladores un aumento de 10x del límite de tasa de Codex hasta el 5 de junio
Según Beating, OpenAI envió correos electrónicos a más de 8.000 desarrolladores que se registraron para el evento sin conexión de GPT-5.5 en San Francisco, concediéndoles un aumento de 10x en los límites de velocidad de Codex, efectivo de inmediato hasta el 5 de junio. Todos los solicitantes reciben la recompensa independientemente de si la recibieron en el evento.
GateNewshace5h
Las conversaciones de la empresa conjunta de OpenAI con Anthropic para adquirir tres empresas de servicios de IA el 5 de mayo
Según Jin 10, la empresa conjunta de OpenAI con Anthropic está en conversaciones para adquirir tres empresas de servicios de IA el 5 de mayo. Según se informa, las empresas objetivo incluyen firmas centradas en la ingeniería dentro de los servicios de IA
GateNewshace5h
Anthropic lanza diez agentes de IA para servicios financieros el martes
Anthropic lanzó el martes diez nuevos agentes de IA diseñados para gestionar tareas de servicios financieros, incluyendo la elaboración de presentaciones para reuniones con clientes, la revisión de estados financieros y la escalada de casos para su revisión de cumplimiento. Las herramientas están dirigidas a profesionales de banca, seguros, gestión de activos y fintech
GateNewshace5h