Gemini API lance des Webhooks : Google résout la douleur du polling des tâches longues, avec une diffusion instantanée via Batch / Veo

Google a lancé le 4 mai sur l’API Gemini la fonctionnalité Webhooks, qui vise à résoudre les douleurs des développeurs liées au développement de tâches longues (long-running jobs). Dans son billet officiel, Google explique que les Webhooks sont un mécanisme de notifications push pilotées par des événements : les développeurs n’ont plus besoin d’utiliser le polling pour interroger continuellement l’API Gemini afin de vérifier l’état des tâches. Une fois l’API terminée, elle enverra automatiquement le résultat vers l’endpoint spécifié par le développeur. Logan Kilpatrick (@OfficialLoganK), responsable des relations développeurs IA chez Google, a déclaré sur X qu’il s’agit d’une « étape importante pour le DevX des tâches longues ».

Résoudre quel problème : le coût du polling pour batch, génération vidéo et long reasoning

Par le passé, lorsque des développeurs de l’API Gemini faisaient face à des tâches batch (traitement par lots), à la génération de vidéos (Veo 2) et à des tâches de long reasoning, ils devaient appeler une fois toutes les quelques secondes l’endpoint de status pour vérifier la progression. Ce modèle n’est pas idéal sur trois plans : consommation de ressources, quota API et latence.

Gaspillage de ressources—de nombreux appels de status check sans intérêt, et occupation du quota API

Latence incontrôlable—intervalle de polling trop court qui brûle le quota, trop long qui retarde la découverte du résultat

Code complexe—nécessité d’écrire côté client une machine à états pour gérer le polling de plusieurs tâches en parallèle

Avec les Webhooks, le modèle s’inverse : les développeurs enregistrent une callback URL, puis l’API Gemini enverra activement (POST) le résultat vers cette URL lorsque la tâche est terminée. Le client n’a plus qu’à traiter la notification reçue.

Cas d’usage : Batch API, vidéos Veo 2, inférence long context

Le Webhooks lancé aujourd’hui s’applique principalement à trois types de tâches asynchrones :

Batch API—l’endpoint de traitement par lots de Gemini pour de grandes quantités de texte, d’embeddings vectoriels, de tâches de classification ; l’officiel propose une remise de 50% sur le prix, avec un objectif de réponse sous 24 heures, mais en pratique la plupart des cas finissent en quelques heures

Génération de vidéos (Veo 2)—la génération d’une seule vidéo prend quelques minutes ; auparavant, les développeurs devaient sans cesse polling

Inférence long context—l’analyse de documents longs de plus de 1M tokens peut nécessiter des dizaines de secondes à quelques minutes pour le traitement interne de Gemini

Du point de vue de l’implémentation pour les développeurs, après l’enregistrement d’un webhook, le client peut « lancer la tâche et l’oublier » : une fois le travail terminé, Gemini notifie naturellement le résultat. Ce modèle est particulièrement adapté aux architectures serverless : le backend n’est réveillé qu’à l’arrivée de l’événement, sans avoir à maintenir un processus de polling.

En face à face avec OpenAI et Anthropic : qui le fait en premier, qui le fait ensuite

Progression des webhooks pour tâches longues sur les trois grandes plateformes IA :

Google Gemini : Webhooks lancés le 4 mai (ce projet), avec couverture de batch, vidéo et long reasoning

OpenAI : des tâches longues comme Codex et Sora 2 reposent principalement sur le SSE (Server-Sent Events) en streaming ; les tâches batch ont un endpoint dédié, mais pas de webhook natif

Anthropic : pas de webhook natif pour l’instant côté Claude API ; Claude Code utilise en interne un mécanisme de polling pour gérer les tâches longues

Sur l’axe DevX (developer experience), Google a nettement renforcé ses investissements au cours des 12 derniers mois : de Gemini 2.5 Pro avec 1M context, au développement visuel via AI Studio, à l’Agent Designer et Memory Bank lancés avec Cloud Next 2026, jusqu’aux Webhooks d’aujourd’hui. Par rapport à la priorité d’OpenAI pour les « produits consommés directement côté client » (ChatGPT, Operator), Google suit une voie « infrastructure entreprise/développeurs ». Les Webhooks sont un élément concret de cette stratégie.

Prochaines observations : mécanismes de sécurité des webhooks, modèles concernés

Les points d’observation pour la prochaine étape :

Sécurité des Webhooks—est-ce que Gemini propose une vérification de signature HMAC pour éviter que des demandes contrefaites ne viennent bombarder la callback URL

Extension des modèles—pour l’instant, cela couvre batch, Veo 2, long reasoning ; qu’en est-il à l’avenir pour la génération d’images Imagen, Speech-to-Speech, et si Gemini Live sera aussi pris en charge

Réponse d’OpenAI et Anthropic—une fois que Google aura porté le DevX à ce niveau, les concurrents suivront-ils ?

Pour les développeurs à Taïwan, dans la pratique, si vous utilisez l’API Gemini pour des tâches batch (par exemple le traitement par lots de la classification de données clients, ou le résumé de documents), les Webhooks sont une fonctionnalité qui vaut la peine d’être intégrée immédiatement : elle peut réduire fortement la consommation de quota API et la complexité du système.

Cet article « Gemini API 推 Webhooks:Google 解決長任務輪詢痛點、Batch/Veo 可即時推送 » est paru pour la première fois sur 鏈新聞 ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

OpenAI accélère le lancement du téléphone pour agents IA jusqu’à mi-2027, MediaTek pour obtenir un accord exclusif de processeur

D’après la dernière enquête sectorielle de l’analyste Ming-Chi Kuo, OpenAI accélère le développement de son premier téléphone doté d’un agent IA et vise une production de masse dès le T1 2027. MediaTek a désormais plus de chances d’obtenir une commande de processeur exclusive, avec une puce basée sur une version personnalisée de

GateNewsIl y a 2m

Sierra lève 950 millions de dollars, valorisée à 15,8 milliards : Bret Taylor, en tant que président d'OpenAI, prend les commandes du leader du service client basé sur l'IA

Sierra, cofondée par Bret Taylor, annonce avoir bouclé un tour Series E de 950 millions de dollars, avec une valorisation de 15,8 milliards de dollars, mené par Tiger Global et GV. En 8 saisons, la société a atteint 150 millions de dollars de ARR et un taux de pénétration Fortune 50 supérieur à 40 %. Positionnée comme une plateforme de service client B2B verticale centrée sur les agents IA, elle propose des flux de travail prêts à l’emploi. Taylor est également président du conseil d’administration d’OpenAI, et la gouvernance ainsi que la divulgation des intérêts sont au cœur des discussions.

ChainNewsAbmediaIl y a 1h

Krutrim passe aux services cloud d’IA le 5 mai, publie ses premiers bénéfices alors que le chiffre d’affaires de l’exercice 26 atteint 31,6 millions de dollars

Selon Press Trust of India, la société indienne d’IA Krutrim s’est repositionnée en tant que fournisseur de services de cloud d’IA domestique le 5 mai, en mettant en pause ses efforts de conception de puces et en redirigeant ses capitaux et ses talents vers l’infrastructure cloud. La société a annoncé un chiffre d’affaires pour l’exercice FY26 d’environ 3 milliards de roupies (31,6 millions de dollars US)

GateNewsIl y a 2h

Les investissements d’Anthropic et d’OpenAI dépassent 1,1 milliard de dollars dans le trading crypto de détail depuis le début 2026

Selon Bloomberg, les investisseurs particuliers ont versé environ 1,13 milliard de dollars dans le trading à effet de levier via des dérivés de sociétés privées d’IA depuis le début de 2026. Les plateformes crypto Ventuals et PreStocks permettent un trading 24 heures sur 24 sur des sociétés telles qu’Anthropic, OpenAI et SpaceX, sans accorder d’e

GateNewsIl y a 3h
Commentaire
0/400
Aucun commentaire