Google Ironwood TPU: Hiệu năng gấp 10 lần + Bốn đối tác cùng đối đầu Nvidia

ChainNewsAbmedia

Theo các báo cáo chuyên sâu của Bloomberg và thông báo chính thức từ Google, Google đã chính thức mở rộng danh mục chip AI do tự phát triển vào ngày 22 tháng 4: Ironwood (thế hệ TPU thứ bảy) chuyên cho suy luận được cung cấp đầy đủ trên Google Cloud, đồng thời khởi động hợp tác thiết kế thế hệ tiếp theo với bốn đối tác Broadcom, MediaTek, Marvell, Intel. Mục tiêu là dùng chuỗi cung ứng chip tùy chỉnh để thách thức vị trí thống trị của Nvidia trên thị trường năng lực tính toán AI.

Ironwood: Thế hệ TPU thứ bảy, lần đầu tiên được thiết kế riêng cho suy luận

Ironwood là sản phẩm thế hệ thứ bảy trong dòng TPU của Google và cũng là chip chuyên dụng cho suy luận đầu tiên theo chiến lược “tách nhánh huấn luyện và suy luận”. Các thông số mà Google công bố: hiệu năng đỉnh trên mỗi chip đạt gấp 10 lần TPU v5p, trang bị bộ nhớ 192GB HBM3E, băng thông bộ nhớ đạt 7,2 TB/s, một superpod có thể mở rộng lên tới 9.216 chip Ironwood làm mát bằng chất lỏng, tổng khối lượng tính toán FP8 đạt 42,5 exaflops.

Google cho biết chính thức rằng Ironwood đã “mở hoàn toàn cho khách hàng sử dụng Google Cloud”, và lượng hàng dự kiến xuất xưởng trong năm nay sẽ đạt “quy mô hàng triệu chip”. Anthropic đã cam kết sử dụng tối đa 1 triệu chip Ironwood TPU, còn Meta thì ký “hợp đồng nhiều năm trị giá hàng chục tỷ USD” để sử dụng TPU thông qua Google Cloud.

Phân công bốn đối tác: huấn luyện thuộc Broadcom, suy luận thuộc MediaTek

Chuỗi cung ứng chip thế hệ tiếp theo của Google được phân công rõ ràng như sau:

Đối tác Mã hiệu Vai trò Điểm nhấn Broadcom Sunfish Huấn luyện chuyên dụng Kế thừa quan hệ hợp tác TPU hiện có, dẫn dắt các nút huấn luyện quy mô lớn MediaTek (聯發科) Zebrafish Suy luận chuyên dụng Khẳng định chi phí thấp hơn phương án của Broadcom 20–30% Marvell Đang đàm phán Đơn vị xử lý bộ nhớ (MPU) + thêm TPU suy luận Tối ưu cho HBM và inference Intel Chưa công bố Tham gia thiết kế Tăng cường phân tán chuỗi cung ứng

Đây là lần đầu tiên trong ngành AI xuất hiện mô hình “bốn đối tác song song, phân công rõ ràng giữa huấn luyện và suy luận”. Google tránh sự phụ thuộc cấu trúc vào một nhà cung cấp duy nhất của Nvidia bằng cách phân tán rủi ro IP và đàm phán giá cạnh tranh. Lộ trình mở rộng đến cuối năm 2027 với TPU v8, được sản xuất trên quy trình 2nm của TSMC.

Ý nghĩa chiến lược: Thách thức Nvidia không phải bằng một chip duy nhất, mà bằng chuỗi cung ứng

Trong ba năm qua, thị trường chip AI gần như do Nvidia độc quyền, với hệ sinh thái phần mềm CUDA và hai lớp “hào lũy” từ các chip H100/GB200. Chiến lược của Ironwood của Google và nhóm bốn đối tác không nhằm mục tiêu “vượt trội một điểm đơn lẻ về thông số”, mà là sao chép logic “nền tảng được tiêu chuẩn hóa + mua sắm đa khách hàng” mà Nvidia đã áp dụng trong ngành—để TPU không chỉ phục vụ cho Google, mà còn trở thành một lựa chọn năng lực tính toán thương mại có thể dùng chung cho các công ty AI lớn như Anthropic, Meta.

Ý nghĩa của việc Anthropic cam kết 1 triệu chip TPU đặc biệt quan trọng: đây là cam kết năng lực tính toán lớn nhất ngoài Nvidia của một công ty AI đơn lẻ. Nó bổ sung lẫn nhau với cam kết 5GW/100 tỷ AWS mà Anthropic đạt được cùng Amazon—một bên gắn với AWS Trainium, một bên gắn với Google TPU. Với chiến lược “hai chip tùy chỉnh”, Anthropic giảm sự phụ thuộc vào Nvidia. Meta cũng là lần đầu công khai đưa TPU vào các khối lượng công việc huấn luyện/suy luận AI của chính mình, tạo ra một tín hiệu khác.

Phản ứng thị trường và liên kết với ngành

Trước khi tiết lộ lần này, MediaTek đã từng được xem như “người hưởng lợi từ chip tùy chỉnh của Google”. Việc lộ mã hiệu Zebrafish là lần đầu tiên đưa MediaTek trực tiếp vào danh sách đối tác thiết kế chip suy luận của Google. Đây là bước mở rộng theo tuyến truyện về “liên minh ngoài Nvidia” gần đây, gồm AMD × GlobalFoundries quang tử silicon và Marvell × Google MPU.

Nvidia ở cùng thời điểm vẫn có GB200 và nền tảng Rubin thế hệ tiếp theo để chống đỡ, nhưng tổ hợp năng lực tính toán phía khách hàng đang chuyển từ “toàn bộ Nvidia” sang mô hình ba trục song song “Nvidia + TPU + AWS Trainium”. Điều này cũng đồng nghĩa với việc năng lực sản xuất 2nm của TSMC sẽ đứng trước tình trạng Google, Nvidia, Apple và Amazon—bốn khách hàng lớn—đều đang xếp hàng, và sức mạnh đàm phán giá với nhà máy gia công bán dẫn tiếp tục tăng lên.

Bài viết “Google Ironwood TPU: Hiệu năng gấp 10 lần + bốn đối tác chống lại Nvidia” lần đầu tiên xuất hiện trên 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

TikTok Gỡ Hơn 538.000 Video Không Được Ủy Quyền Do AI Tạo Ra; Nhiều Nền Tảng Khởi Chạy Các Sáng Kiến Quản Trị

Tin tức Cổng Thông tin, ngày 23 tháng 4 — TikTok đã công bố một đợt siết chặt toàn diện đối với nội dung do AI tạo ra nhưng xâm phạm quyền của người dùng, tiết lộ rằng họ đã gỡ hơn 538.000 video và xử phạt hơn 4.000 tài khoản tính đến nay. Nền tảng sẽ ưu tiên thực thi chống lại các deepfake AI, giọng

GateNews23phút trước

Tài chính truyền thống sẽ thúc đẩy việc gia nhập thị trường crypto nhanh hơn, theo nhà kinh tế Phó Peng

Tin tức từ Gate, ngày 23 tháng 4 — Phó Peng, giám đốc kinh tế trưởng của Xinfire Group, đã chia sẻ quan điểm của mình về sự hội tụ giữa tài chính truyền thống và tài sản crypto tại Hội nghị Thượng đỉnh Quản lý Tài sản Số Tổ chức Hồng Kông 2026. Theo Phó Peng, việc tích hợp các tổ chức tài chính truyền thống với

GateNews35phút trước

OpenAI Codex 团队修复 OpenClaw 身份验证漏洞,显著改善智能体行为

OpenClaw 从 Pi 切换到 Codex harness,以修复静默的身份验证回退;通过两项 PR 处理桥接与回退问题;修复后,智能体从浅层心跳轮询转为完整的工作循环,从而实现进展。 摘要:OpenClaw 的 Codex harness 优化解决了一个关键的身份验证缺陷:当使用 OpenAI 模型的 Codex 时,会导致静默回退到 Pi harness。两项拉取请求修复身份验证桥接,并防止静默回退,改变了运行时适配器。因此,智能体的行为从浅层心跳轮询演进为完整的工作循环:读取上下文、分析任务、编辑代码库并验证进展,从而提升跨心跳的连续性与可见性。

GateNews51phút trước

Mô hình an ninh cấp vũ khí của Anthropic Mythos bị truy cập trái phép: họ đã làm điều đó như thế nào?

Theo Bloomberg, một nhóm diễn đàn tư nhân đã truy cập trái phép Mythos thông qua giấy ủy quyền hợp pháp của bên thứ ba đối với Anthropic. Mythos là AI phòng thủ dành cho doanh nghiệp, chỉ mở cho các tổ chức lớn đã trải qua thẩm định nghiêm ngặt. Nhóm này sử dụng việc nắm được URL của mô hình để suy đoán vị trí của hệ thống và đi vào, đồng thời đưa ra các ví dụ bằng ảnh chụp màn hình, cho rằng họ vẫn đang sử dụng nhưng không có ác ý. Anthropic đang điều tra, ban đầu xác định đây là lạm dụng quyền truy cập chứ không phải xâm nhập từ bên ngoài. Vụ việc cho thấy rủi ro khi giao các mô hình có độ nhạy cao cho bên thứ ba quản lý, cần tăng cường độ bền vững trong quản trị và cơ chế tạo niềm tin.

ChainNewsAbmedia1giờ trước

Misty CISO cảnh báo: ShinyHunters tuyên bố đã xâm nhập hệ thống nội bộ của Anthropic

Theo cảnh báo do Giám đốc an ninh thông tin cấp cao 23pds của SlowMist đăng trên nền tảng X vào ngày 23 tháng 4, nhóm tin tặc ShinyHunters tuyên bố đã xâm nhập các hệ thống nội bộ liên quan đến mô hình Anthropic Mythos và công khai chia sẻ bằng chứng dưới dạng các ảnh chụp về bảng điều khiển quản lý người dùng, bảng điều khiển thử nghiệm AI cũng như phân tích hiệu suất và chi phí của mô hình, tuy nhiên phía chính thức của Anthropic vẫn chưa đưa ra tuyên bố.

MarketWhisper1giờ trước

Chrome biến “đồng nghiệp AI”: Tự động hóa tác vụ duyệt web Auto Browse, gói doanh nghiệp trả theo tháng 6 đô la

Chrome Enterprise ra mắt Auto Browse và Chrome Skills được cung cấp bởi Gemini, cho phép trình duyệt tự động thực hiện các tác vụ nhiều bước, nhưng cần người dùng nhấp để xác nhận; có thể lưu/chia sẻ quy trình làm việc AI và tích hợp với Gmail, Lịch, Drive, bao gồm quản lý DLP, với mức phí hàng tháng 6 USD; được định vị như biến trình duyệt thành một đồng nghiệp AI.

ChainNewsAbmedia1giờ trước
Bình luận
0/400
Không có bình luận