OpenAI скорочує витрати на інференс більш ніж на 50%, використання GPU впало до сотень з десятків тисяч

Як повідомляють ЗМІ з посиланням на джерела, OpenAI досягла значного технічного прориву на початку цього місяця, скоротивши витрати на інференцію більш ніж на 50% та значно зменшивши потреби в GPU. Внутрішні інженери представили цей прорив, розкривши, що новий підхід до оптимізації зменшив використання GPU лише до сотень одиниць під час обробки запитів відвідувачів ChatGPT, порівняно з десятками тисяч високоякісних чипів, які раніше були потрібні.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів