ByteDance відкриває вихідний код мультимодальної моделі 3B Lance, навченої на 128 GPU A100

За даними Beating, ByteDance Research відкрила вихідний код Lance — уніфікованої мультимодальної моделі з 3 мільярдами параметрів, навченої лише на 128 GPU A100. Lance підтримує розуміння, генерацію та редагування зображень і відео в межах однієї структури, демонструючи, що вдосконалені мультимодальні можливості можна досягти за мінімальних обчислювальних ресурсів завдяки архітектурі dual-stream mixture-of-experts і модально-орієнтованому rotary position encoding.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів