Gemini API ra mắt Webhooks: Google giải quyết cơn đau do phải luân phiên thăm dò các tác vụ dài, Batch/Veo có thể đẩy ngay lập tức

2026-05-05 05:14:22

Google ngày 4/5 đã ra mắt tính năng Webhooks trên Gemini API, giải quyết nỗi đau của nhà phát triển khi phải làm việc với các tác vụ chạy dài (long-running jobs). Blog chính thức của Google cho biết Webhooks là cơ chế thông báo đẩy theo hướng sự kiện, giúp nhà phát triển không còn phải dùng cách thăm dò (polling) liên tục để hỏi trạng thái tác vụ trên Gemini API nữa—khi API hoàn tất, kết quả sẽ tự động được đẩy đến endpoint mà nhà phát triển chỉ định. Giám đốc quan hệ phát triển AI của Google, Logan Kilpatrick (@OfficialLoganK), trên X cho biết đây là “một bước quan trọng cho DevX của các tác vụ chạy dài”.

Giải quyết vấn đề gì: chi phí polling cho batch, tạo video và long reasoning

Trước đây, khi nhà phát triển Gemini API xử lý batch (xử lý theo lô), tạo video (Veo 2) và các tác vụ long reasoning, họ phải mỗi vài giây gọi lại status endpoint để kiểm tra tiến độ tác vụ. Mô hình này kém tối ưu ở cả ba phương diện: tiêu tốn tài nguyên, quota API và độ trễ:

Lãng phí tài nguyên—các cuộc gọi status check vô nghĩa với số lượng lớn, chiếm dụng quota API

Độ trễ khó kiểm soát—khoảng polling quá ngắn sẽ đốt quota, quá dài thì nhận kết quả muộn

Mã phức tạp—phải viết trạng thái (state machine) ở phía client để quản lý polling cho nhiều tác vụ song song

Webhooks lật ngược mô hình này: nhà phát triển đăng ký một callback URL, Gemini API khi hoàn tất tác vụ sẽ chủ động POST kết quả đến URL đó, client chỉ cần xử lý phần nhận đẩy (push).

Tình huống phù hợp: Batch API, video Veo 2, suy luận trên ngữ cảnh dài

Webhooks lần này chủ yếu áp dụng cho ba nhóm tác vụ bất đồng bộ:

Batch API—endpoint xử lý theo lô của Gemini, dùng cho số lượng lớn các tác vụ văn bản, vector nhúng, phân loại; được nhà cung cấp giảm giá 50%, mục tiêu phản hồi trong 24 giờ, thực tế thường hoàn tất trong vài giờ

Tạo video (Veo 2)—mỗi lần tạo một video cần thời gian ở mức vài phút, trước đây nhà phát triển phải liên tục polling

Suy luận ngữ cảnh dài—phân tích tài liệu dài trên 1M token; xử lý nội bộ của Gemini có thể mất từ vài chục giây đến vài phút

Với phía nhà phát triển, sau khi đăng ký webhook, client có thể “ném tác vụ đi và quên nó đi”; khi kết quả hoàn tất, Gemini sẽ tự động thông báo. Mô hình này đặc biệt phù hợp với kiến trúc không máy chủ (serverless), nơi backend chỉ được đánh thức khi sự kiện đến, không cần duy trì các tiến trình polling.

Đối chiếu với OpenAI, Anthropic: ai làm trước, ai làm sau

Tiến độ webhook cho các tác vụ chạy dài trên ba nền tảng AI lớn:

Google Gemini: 4/5 ra mắt Webhooks (bản này), bao phủ toàn bộ batch, video và long reasoning

OpenAI: các tác vụ chạy dài như Codex, Sora 2 hiện chủ yếu dựa trên SSE (Server-Sent Events) để stream; tác vụ theo lô có endpoint riêng nhưng không có webhook nguyên sinh

Anthropic: Claude API hiện chưa có webhook nguyên sinh; trong Claude Code, cơ chế polling được dùng để xử lý tác vụ chạy dài

Trên trục DevX (developer experience), Google trong 12 tháng qua rõ ràng đã tăng đầu tư—từ Gemini 2.5 Pro với 1M context, phát triển trực quan trên AI Studio, Agent Designer và Memory Bank được giới thiệu tại Cloud Next 2026, đến Webhooks lần này—trong khi OpenAI ưu tiên hơn cho “sản phẩm tiêu dùng trực tiếp” (ChatGPT, Operator). Nhìn chung, Google đi theo hướng “hạ tầng doanh nghiệp/cho nhà phát triển”. Webhooks là một mảnh ghép cụ thể của hướng đi này.

Theo dõi tiếp theo: cơ chế bảo mật webhook, phạm vi mô hình áp dụng

Trọng tâm quan sát giai đoạn tiếp theo:

Cơ chế bảo mật Webhook—Gemini có cung cấp xác thực chữ ký HMAC không, để tránh callback URL bị giả mạo và bị “tấn công” bằng yêu cầu

Mở rộng mô hình áp dụng—hiện bao gồm batch, Veo 2, long reasoning; trong tương lai có hỗ trợ Imagen tạo ảnh, Speech-to-Speech, và Gemini Live đi kèm không

Phản hồi từ OpenAI, Anthropic—khi Google nâng DevX lên mức này, đối thủ có theo kịp không

Với thực tiễn nhà phát triển tại Đài Loan, nếu bạn đang dùng Gemini API để làm các tác vụ batch (ví dụ: phân loại dữ liệu khách hàng theo lô, tóm tắt tài liệu), Webhooks là tính năng đáng tích hợp ngay, giúp giảm đáng kể mức tiêu thụ API quota và độ phức tạp của hệ thống.

Bài viết Gemini API 推 Webhooks：Google 解決長任務輪詢痛點、Batch／Veo 可即時推送最早出現於鏈新聞 ABMedia。

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

05-05 03:13

AI Overview của Google cung cấp hàng chục triệu câu trả lời sai mỗi giờ; Gemini 3 đạt độ chính xác 91%

05-05 02:29

Anthropic chuẩn bị trợ lý chủ động Orbit tích hợp sáu công cụ, bao gồm GitHub và Figma

05-03 01:49

OpenClaw Phát hành v2026.5.2 với tính năng di chuyển plugin từ npm sang ClawHub, hơn 200 bản sửa lỗi