Gemini API ra mắt Webhooks: Google giải quyết cơn đau do phải luân phiên thăm dò các tác vụ dài, Batch/Veo có thể đẩy ngay lập tức

ChainNewsAbmedia

Google ngày 4/5 đã ra mắt tính năng Webhooks trên Gemini API, giải quyết nỗi đau của nhà phát triển khi phải làm việc với các tác vụ chạy dài (long-running jobs). Blog chính thức của Google cho biết Webhooks là cơ chế thông báo đẩy theo hướng sự kiện, giúp nhà phát triển không còn phải dùng cách thăm dò (polling) liên tục để hỏi trạng thái tác vụ trên Gemini API nữa—khi API hoàn tất, kết quả sẽ tự động được đẩy đến endpoint mà nhà phát triển chỉ định. Giám đốc quan hệ phát triển AI của Google, Logan Kilpatrick (@OfficialLoganK), trên X cho biết đây là “một bước quan trọng cho DevX của các tác vụ chạy dài”.

Giải quyết vấn đề gì: chi phí polling cho batch, tạo video và long reasoning

Trước đây, khi nhà phát triển Gemini API xử lý batch (xử lý theo lô), tạo video (Veo 2) và các tác vụ long reasoning, họ phải mỗi vài giây gọi lại status endpoint để kiểm tra tiến độ tác vụ. Mô hình này kém tối ưu ở cả ba phương diện: tiêu tốn tài nguyên, quota API và độ trễ:

Lãng phí tài nguyên—các cuộc gọi status check vô nghĩa với số lượng lớn, chiếm dụng quota API

Độ trễ khó kiểm soát—khoảng polling quá ngắn sẽ đốt quota, quá dài thì nhận kết quả muộn

Mã phức tạp—phải viết trạng thái (state machine) ở phía client để quản lý polling cho nhiều tác vụ song song

Webhooks lật ngược mô hình này: nhà phát triển đăng ký một callback URL, Gemini API khi hoàn tất tác vụ sẽ chủ động POST kết quả đến URL đó, client chỉ cần xử lý phần nhận đẩy (push).

Tình huống phù hợp: Batch API, video Veo 2, suy luận trên ngữ cảnh dài

Webhooks lần này chủ yếu áp dụng cho ba nhóm tác vụ bất đồng bộ:

Batch API—endpoint xử lý theo lô của Gemini, dùng cho số lượng lớn các tác vụ văn bản, vector nhúng, phân loại; được nhà cung cấp giảm giá 50%, mục tiêu phản hồi trong 24 giờ, thực tế thường hoàn tất trong vài giờ

Tạo video (Veo 2)—mỗi lần tạo một video cần thời gian ở mức vài phút, trước đây nhà phát triển phải liên tục polling

Suy luận ngữ cảnh dài—phân tích tài liệu dài trên 1M token; xử lý nội bộ của Gemini có thể mất từ vài chục giây đến vài phút

Với phía nhà phát triển, sau khi đăng ký webhook, client có thể “ném tác vụ đi và quên nó đi”; khi kết quả hoàn tất, Gemini sẽ tự động thông báo. Mô hình này đặc biệt phù hợp với kiến trúc không máy chủ (serverless), nơi backend chỉ được đánh thức khi sự kiện đến, không cần duy trì các tiến trình polling.

Đối chiếu với OpenAI, Anthropic: ai làm trước, ai làm sau

Tiến độ webhook cho các tác vụ chạy dài trên ba nền tảng AI lớn:

Google Gemini: 4/5 ra mắt Webhooks (bản này), bao phủ toàn bộ batch, video và long reasoning

OpenAI: các tác vụ chạy dài như Codex, Sora 2 hiện chủ yếu dựa trên SSE (Server-Sent Events) để stream; tác vụ theo lô có endpoint riêng nhưng không có webhook nguyên sinh

Anthropic: Claude API hiện chưa có webhook nguyên sinh; trong Claude Code, cơ chế polling được dùng để xử lý tác vụ chạy dài

Trên trục DevX (developer experience), Google trong 12 tháng qua rõ ràng đã tăng đầu tư—từ Gemini 2.5 Pro với 1M context, phát triển trực quan trên AI Studio, Agent Designer và Memory Bank được giới thiệu tại Cloud Next 2026, đến Webhooks lần này—trong khi OpenAI ưu tiên hơn cho “sản phẩm tiêu dùng trực tiếp” (ChatGPT, Operator). Nhìn chung, Google đi theo hướng “hạ tầng doanh nghiệp/cho nhà phát triển”. Webhooks là một mảnh ghép cụ thể của hướng đi này.

Theo dõi tiếp theo: cơ chế bảo mật webhook, phạm vi mô hình áp dụng

Trọng tâm quan sát giai đoạn tiếp theo:

Cơ chế bảo mật Webhook—Gemini có cung cấp xác thực chữ ký HMAC không, để tránh callback URL bị giả mạo và bị “tấn công” bằng yêu cầu

Mở rộng mô hình áp dụng—hiện bao gồm batch, Veo 2, long reasoning; trong tương lai có hỗ trợ Imagen tạo ảnh, Speech-to-Speech, và Gemini Live đi kèm không

Phản hồi từ OpenAI, Anthropic—khi Google nâng DevX lên mức này, đối thủ có theo kịp không

Với thực tiễn nhà phát triển tại Đài Loan, nếu bạn đang dùng Gemini API để làm các tác vụ batch (ví dụ: phân loại dữ liệu khách hàng theo lô, tóm tắt tài liệu), Webhooks là tính năng đáng tích hợp ngay, giúp giảm đáng kể mức tiêu thụ API quota và độ phức tạp của hệ thống.

Bài viết Gemini API 推 Webhooks:Google 解決長任務輪詢痛點、Batch/Veo 可即時推送 最早出現於 鏈新聞 ABMedia。

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenAI đẩy nhanh điện thoại dành cho AI agent lên H1 2027, MediaTek chuẩn bị giành thỏa thuận bộ xử lý độc quyền

Theo khảo sát ngành mới nhất của nhà phân tích Ming-Chi Kuo, OpenAI đang đẩy nhanh việc phát triển chiếc điện thoại tác nhân AI đầu tiên của mình và đặt mục tiêu sản xuất hàng loạt sớm nhất vào H1 2027. Hiện MediaTek có khả năng cao hơn để giành được đơn đặt hàng bộ xử lý độc quyền, với con chip dựa trên một phiên bản được tùy chỉnh của

GateNews2phút trước

Sierra huy động 950 triệu USD, định giá 15,8 tỷ USD: Bret Taylor với tư cách Chủ tịch OpenAI giành ngôi đầu trong lĩnh vực AI chăm sóc khách hàng

Sierra do Bret Taylor đồng sáng lập, thông báo đã hoàn tất vòng gọi vốn Series E trị giá 950 triệu USD, định giá 15,8 tỷ USD, do Tiger Global và GV dẫn đầu. Trong 8 quý, công ty đạt 150 triệu USD ARR, tỷ lệ thâm nhập Fortune 50 vượt 40%. Nền tảng được định vị là hệ thống chăm sóc khách hàng theo chiều dọc lấy AI agent làm trung tâm, cung cấp các quy trình làm việc sẵn dùng. Taylor đồng thời là Chủ tịch OpenAI, vấn đề quản trị và công bố lợi ích là trọng tâm.

ChainNewsAbmedia1giờ trước

Krutrim chuyển sang dịch vụ đám mây AI vào ngày 5/5, đăng bài lợi nhuận đầu tiên khi doanh thu FY26 đạt 31,6 triệu USD

Theo Press Trust of India, công ty AI của Ấn Độ Krutrim đã tái định vị mình thành nhà cung cấp dịch vụ AI cloud trong nước vào ngày 5 tháng 5, tạm dừng các nỗ lực thiết kế chip và chuyển hướng vốn cũng như nhân lực sang hạ tầng điện toán đám mây. Công ty báo cáo doanh thu trong năm tài khóa FY26 khoảng 3 tỷ rupee (31,6 triệu USD

GateNews2giờ trước

Anthropic và các khoản đầu tư của OpenAI dẫn đầu với hơn 1,1 tỷ USD vào giao dịch tiền mã hóa bán lẻ từ khi bắt đầu năm 2026

Theo Bloomberg, các nhà đầu tư lẻ đã đổ vào khoảng 1,13 tỷ USD để giao dịch đòn bẩy trên các phái sinh của công ty AI tư nhân kể từ đầu năm 2026. Các nền tảng tiền điện tử Ventuals và PreStocks cho phép giao dịch 24 giờ trên các công ty như Anthropic, OpenAI và SpaceX mà không cấp quyền trực tiếp cho

GateNews3giờ trước
Bình luận
0/400
Không có bình luận