ByteDance abre el código fuente del modelo multimodal de lanzamiento 3B entrenado en 128 GPU A100

Según Beating, ByteDance Research lanzó de forma open-source Lance, un modelo multimodal unificado con 3 mil millones de parámetros entrenado solo con 128 GPU A100. Lance admite comprensión, generación y edición de imágenes y vídeos dentro de un único marco, demostrando que es posible alcanzar capacidades multimodales avanzadas con recursos computacionales mínimos mediante una arquitectura de mezcla de expertos de doble flujo y una codificación posicional rotatoria consciente del modo.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios