Google запустить Gemini 3.2 Flash на I/O 20 травня, досягнувши продуктивності, як у GPT-5.5, але за 1/15 вартості

AT0,31%
ON-14,83%
MAY-2,94%

За словами CEO Abacus.AI Бінду Редді, Google планує представити Gemini 3.2 Flash під час своєї конференції I/O 20 травня; за продуктивністю вона досягатиме 92% GPT-5.5 у завданнях із кодування та міркувань, водночас скорочуючи витрати на інференс лише до однієї п’ятнадцятої — однієї двадцятої від показників останньої. Більшість запитів матиме затримку нижче 200 мілісекунд. Редді пов’язав цей прорив із техніками distillation і sparsity від Google: вони стискають «фронтирну» модель до рівня Flash без типового провалу продуктивності, який зазвичай спостерігається під час оптимізації моделей.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів