Google ngày 4/5 đã ra mắt tính năng Webhooks trên Gemini API, giải quyết nỗi đau của nhà phát triển khi phải làm việc với các tác vụ chạy dài (long-running jobs). Blog chính thức của Google cho biết Webhooks là cơ chế thông báo đẩy theo hướng sự kiện, giúp nhà phát triển không còn phải dùng cách thăm dò (polling) liên tục để hỏi trạng thái tác vụ trên Gemini API nữa—khi API hoàn tất, kết quả sẽ tự động được đẩy đến endpoint mà nhà phát triển chỉ định. Giám đốc quan hệ phát triển AI của Google, Logan Kilpatrick (@OfficialLoganK), trên X cho biết đây là “một bước quan trọng cho DevX của các tác vụ chạy dài”.
Giải quyết vấn đề gì: chi phí polling cho batch, tạo video và long reasoning
Trước đây, khi nhà phát triển Gemini API xử lý batch (xử lý theo lô), tạo video (Veo 2) và các tác vụ long reasoning, họ phải mỗi vài giây gọi lại status endpoint để kiểm tra tiến độ tác vụ. Mô hình này kém tối ưu ở cả ba phương diện: tiêu tốn tài nguyên, quota API và độ trễ:
Lãng phí tài nguyên—các cuộc gọi status check vô nghĩa với số lượng lớn, chiếm dụng quota API
Độ trễ khó kiểm soát—khoảng polling quá ngắn sẽ đốt quota, quá dài thì nhận kết quả muộn
Mã phức tạp—phải viết trạng thái (state machine) ở phía client để quản lý polling cho nhiều tác vụ song song
Webhooks lật ngược mô hình này: nhà phát triển đăng ký một callback URL, Gemini API khi hoàn tất tác vụ sẽ chủ động POST kết quả đến URL đó, client chỉ cần xử lý phần nhận đẩy (push).
Tình huống phù hợp: Batch API, video Veo 2, suy luận trên ngữ cảnh dài
Webhooks lần này chủ yếu áp dụng cho ba nhóm tác vụ bất đồng bộ:
Batch API—endpoint xử lý theo lô của Gemini, dùng cho số lượng lớn các tác vụ văn bản, vector nhúng, phân loại; được nhà cung cấp giảm giá 50%, mục tiêu phản hồi trong 24 giờ, thực tế thường hoàn tất trong vài giờ
Tạo video (Veo 2)—mỗi lần tạo một video cần thời gian ở mức vài phút, trước đây nhà phát triển phải liên tục polling
Suy luận ngữ cảnh dài—phân tích tài liệu dài trên 1M token; xử lý nội bộ của Gemini có thể mất từ vài chục giây đến vài phút
Với phía nhà phát triển, sau khi đăng ký webhook, client có thể “ném tác vụ đi và quên nó đi”; khi kết quả hoàn tất, Gemini sẽ tự động thông báo. Mô hình này đặc biệt phù hợp với kiến trúc không máy chủ (serverless), nơi backend chỉ được đánh thức khi sự kiện đến, không cần duy trì các tiến trình polling.
Đối chiếu với OpenAI, Anthropic: ai làm trước, ai làm sau
Tiến độ webhook cho các tác vụ chạy dài trên ba nền tảng AI lớn:
Google Gemini: 4/5 ra mắt Webhooks (bản này), bao phủ toàn bộ batch, video và long reasoning
OpenAI: các tác vụ chạy dài như Codex, Sora 2 hiện chủ yếu dựa trên SSE (Server-Sent Events) để stream; tác vụ theo lô có endpoint riêng nhưng không có webhook nguyên sinh
Anthropic: Claude API hiện chưa có webhook nguyên sinh; trong Claude Code, cơ chế polling được dùng để xử lý tác vụ chạy dài
Trên trục DevX (developer experience), Google trong 12 tháng qua rõ ràng đã tăng đầu tư—từ Gemini 2.5 Pro với 1M context, phát triển trực quan trên AI Studio, Agent Designer và Memory Bank được giới thiệu tại Cloud Next 2026, đến Webhooks lần này—trong khi OpenAI ưu tiên hơn cho “sản phẩm tiêu dùng trực tiếp” (ChatGPT, Operator). Nhìn chung, Google đi theo hướng “hạ tầng doanh nghiệp/cho nhà phát triển”. Webhooks là một mảnh ghép cụ thể của hướng đi này.
Theo dõi tiếp theo: cơ chế bảo mật webhook, phạm vi mô hình áp dụng
Trọng tâm quan sát giai đoạn tiếp theo:
Cơ chế bảo mật Webhook—Gemini có cung cấp xác thực chữ ký HMAC không, để tránh callback URL bị giả mạo và bị “tấn công” bằng yêu cầu
Mở rộng mô hình áp dụng—hiện bao gồm batch, Veo 2, long reasoning; trong tương lai có hỗ trợ Imagen tạo ảnh, Speech-to-Speech, và Gemini Live đi kèm không
Phản hồi từ OpenAI, Anthropic—khi Google nâng DevX lên mức này, đối thủ có theo kịp không
Với thực tiễn nhà phát triển tại Đài Loan, nếu bạn đang dùng Gemini API để làm các tác vụ batch (ví dụ: phân loại dữ liệu khách hàng theo lô, tóm tắt tài liệu), Webhooks là tính năng đáng tích hợp ngay, giúp giảm đáng kể mức tiêu thụ API quota và độ phức tạp của hệ thống.
Bài viết Gemini API 推 Webhooks:Google 解決長任務輪詢痛點、Batch/Veo 可即時推送 最早出現於 鏈新聞 ABMedia。
Bài viết liên quan
OpenAI đẩy nhanh điện thoại dành cho AI agent lên H1 2027, MediaTek chuẩn bị giành thỏa thuận bộ xử lý độc quyền
Sierra huy động 950 triệu USD, định giá 15,8 tỷ USD: Bret Taylor với tư cách Chủ tịch OpenAI giành ngôi đầu trong lĩnh vực AI chăm sóc khách hàng
Krutrim chuyển sang dịch vụ đám mây AI vào ngày 5/5, đăng bài lợi nhuận đầu tiên khi doanh thu FY26 đạt 31,6 triệu USD
Anthropic và các khoản đầu tư của OpenAI dẫn đầu với hơn 1,1 tỷ USD vào giao dịch tiền mã hóa bán lẻ từ khi bắt đầu năm 2026