Google 5 травня запустив на Gemini API функцію Webhooks, яка вирішує болі розробників при розробці задач із тривалим виконанням (long-running jobs). У офіційному блозі Google пояснили, що Webhooks — це механізм подієво керованих push-повідомлень: розробникам більше не потрібно в режимі безперервного опитування (polling) постійно запитувати в Gemini API статус виконання задачі — після завершення API самостійно надішле результат за endpoint, вказаний розробником. Керівник з питань відносин із розробниками в галузі ШІ Google Logan Kilpatrick (@OfficialLoganK) у X назвав це «важливим кроком для DevX довготривалих задач».
Розв’язує яку проблему: витрати на polling для batch, генерації відео, довгих reasoning
Раніше розробники Gemini API під час роботи з batch (пакетною обробкою), генерацією відео (Veo 2) і задачами з довгим reasoning змушені були кожні кілька секунд викликати status endpoint, щоб перевіряти прогрес. Такий підхід був невдалим одразу в трьох площинах: витрати ресурсів, ліміти API quota і затримка. Розкладемо:
Ресурси марнуються — масові безглузді запити status check, які також з’їдають API quota
Затримка непередбачувана — якщо інтервал polling занадто короткий, згоряє quota; якщо занадто довгий — результат стає відомим із запізненням
Код складніший — потрібно на клієнті реалізовувати стан (state machine) для керування опитуванням кількох паралельних задач
Webhooks перевертають цю модель: розробник реєструє callback URL, а Gemini API після завершення задачі самостійно робить POST із результатом на цей URL — клієнту лишається лише обробити отримані push-повідомлення.
Де це застосувати: Batch API, Veo 2 відео, reasoning із довгим контекстом
Цей реліз Webhooks головно застосовний до трьох типів асинхронних задач:
Batch API — batch endpoint Gemini для великих обсягів тексту, векторних ембедингів, класифікаційних задач; офіційно пропонується знижка 50%, цільовий час відповіді — 24 години, але на практиці найчастіше це займає кілька годин
Генерація відео (Veo 2) — генерація одного відео потребує часу в хвилинах, раніше розробники постійно опитували статус
Reasoning із довгим контекстом — аналіз довгих документів від 1M токенів; внутрішня обробка в Gemini може тривати від десятків секунд до кількох хвилин
З погляду реалізації для розробників: після реєстрації webhook клієнт може «віддати задачу й забути про неї» — коли виконання завершиться, Gemini природно сама повідомить про результат. Такий підхід особливо добре лягає на серверлес (serverless) архітектури: бекенд вмикається лише тоді, коли приходить подія, і не потрібно тримати окремий polling-процес.
Порівняння з OpenAI та Anthropic: хто перший, хто — пізніше
Прогрес довготривалих webhook у трьох AI-платформах:
Google Gemini: 5 травня запустив Webhooks (цей матеріал), і це покриває batch, відео, довгий reasoning — усе
OpenAI: Codex, Sora 2 та інші довготривалі задачі наразі здебільшого спираються на SSE (Server-Sent Events) стримінг; для batch є окремий endpoint, але немає нативного webhook
Anthropic: у Claude API поки немає нативного webhook; Claude Code всередині використовує механізм polling для роботи з довгими задачами
Google на лінії DevX (developer experience) за останні 12 місяців помітно наростив інвестиції — від Gemini 2.5 Pro з 1M context, візуального розроблення в AI Studio, Agent Designer, Memory Bank, які були представлені в Cloud Next 2026, до Webhooks цього разу. На противагу OpenAI, яке має вищий пріоритет «безпосереднього споживання продуктів на клієнті» (ChatGPT, Operator), Google рухається в напрямку «корпоративної/розробницької інфраструктури». Webhooks — конкретна частина цієї лінії.
Подальші спостереження: механізми безпеки webhook, діапазон моделей
Фокус на наступному етапі:
Безпека webhook — чи Gemini надає HMAC-підпис для верифікації, щоб уникати підроблених запитів на callback URL і «бомбардування» запитами
Розширення покриття моделей — зараз охоплено batch, Veo 2, long reasoning; далі, ймовірно, це пошириться на генерацію зображень Imagen, Speech-to-Speech, а також чи підтримуватиметься Gemini Live разом із цим
Відповіді OpenAI та Anthropic — коли Google підніме DevX до цього рівня, чи підуть конкуренти за ним
Для практики розробників у Тайвані: якщо ви вже використовуєте Gemini API для batch задач (наприклад, пакетну класифікацію даних клієнтів чи підсумовування документів), Webhooks варто інтегрувати вже зараз — це суттєво зменшує споживання API quota і складність системи.
Ця стаття «Gemini API 推 Webhooks:Google 解決長任務輪詢痛點、Batch/Veo 可即時推送» вперше з’явилася на 鏈新聞 ABMedia.
Пов'язані статті
Хуан Женьмінь спростовує апокаліптичні прогнози про ШІ: у майбутньому створить великі можливості для нових робочих місць
OpenAI прискорює випуск телефонів для AI-агентів до H1 2027, MediaTek укладе ексклюзивну угоду щодо процесорів
Sierra залучила 9,5 мільярда доларів США, оцінка 158 мільярдів: Брет Тейлор приєднується до OpenAI як голова й націлюється на лідера AI-客服 обслуговування
Krutrim переходить до хмарних AI-послуг 5 травня, публікує перший прибуток: фінрік FY26 дає $31,6 млн доходу