Trajectory запускает платформу SkyRL с открытым исходным кодом и добивается улучшения пропускной способности в 2,81 раза

По данным OneMillion_AI, Trajectory в сотрудничестве с лабораторией Sky Computing Lab при UC Berkeley и Anyscale недавно объявили о платформе SkyRL с открытым исходным кодом и архитектуре Multi-LoRA Training для донастройки больших языковых моделей. Система решает неэффективность традиционной оптимизации моделей за счет сохранения общей базовой модели в памяти GPU и обработки нескольких экспериментов по донастройке как легковесных модулей-адаптеров. Тестирование показало, что сквозная пропускная способность экспериментов выросла в 2,81 раза; абсолютная пропускная способность по времени на одном узле достигла улучшения в 3,25 раза, что позволяет большим моделям добиваться самосовершенствования на уровне часов благодаря данным реального производства в режиме реального времени. Обучающий код теперь доступен в репозитории SkyRL.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев