Google Ironwood TPU: Hiệu năng gấp 10 lần + Bốn đối tác cùng đối đầu Nvidia

ChainNewsAbmedia

Theo các báo cáo chuyên sâu của Bloomberg và thông báo chính thức từ Google, Google đã chính thức mở rộng danh mục chip AI do tự phát triển vào ngày 22 tháng 4: Ironwood (thế hệ TPU thứ bảy) chuyên cho suy luận được cung cấp đầy đủ trên Google Cloud, đồng thời khởi động hợp tác thiết kế thế hệ tiếp theo với bốn đối tác Broadcom, MediaTek, Marvell, Intel. Mục tiêu là dùng chuỗi cung ứng chip tùy chỉnh để thách thức vị trí thống trị của Nvidia trên thị trường năng lực tính toán AI.

Ironwood: Thế hệ TPU thứ bảy, lần đầu tiên được thiết kế riêng cho suy luận

Ironwood là sản phẩm thế hệ thứ bảy trong dòng TPU của Google và cũng là chip chuyên dụng cho suy luận đầu tiên theo chiến lược “tách nhánh huấn luyện và suy luận”. Các thông số mà Google công bố: hiệu năng đỉnh trên mỗi chip đạt gấp 10 lần TPU v5p, trang bị bộ nhớ 192GB HBM3E, băng thông bộ nhớ đạt 7,2 TB/s, một superpod có thể mở rộng lên tới 9.216 chip Ironwood làm mát bằng chất lỏng, tổng khối lượng tính toán FP8 đạt 42,5 exaflops.

Google cho biết chính thức rằng Ironwood đã “mở hoàn toàn cho khách hàng sử dụng Google Cloud”, và lượng hàng dự kiến xuất xưởng trong năm nay sẽ đạt “quy mô hàng triệu chip”. Anthropic đã cam kết sử dụng tối đa 1 triệu chip Ironwood TPU, còn Meta thì ký “hợp đồng nhiều năm trị giá hàng chục tỷ USD” để sử dụng TPU thông qua Google Cloud.

Phân công bốn đối tác: huấn luyện thuộc Broadcom, suy luận thuộc MediaTek

Chuỗi cung ứng chip thế hệ tiếp theo của Google được phân công rõ ràng như sau:

Đối tác Mã hiệu Vai trò Điểm nhấn Broadcom Sunfish Huấn luyện chuyên dụng Kế thừa quan hệ hợp tác TPU hiện có, dẫn dắt các nút huấn luyện quy mô lớn MediaTek (聯發科) Zebrafish Suy luận chuyên dụng Khẳng định chi phí thấp hơn phương án của Broadcom 20–30% Marvell Đang đàm phán Đơn vị xử lý bộ nhớ (MPU) + thêm TPU suy luận Tối ưu cho HBM và inference Intel Chưa công bố Tham gia thiết kế Tăng cường phân tán chuỗi cung ứng

Đây là lần đầu tiên trong ngành AI xuất hiện mô hình “bốn đối tác song song, phân công rõ ràng giữa huấn luyện và suy luận”. Google tránh sự phụ thuộc cấu trúc vào một nhà cung cấp duy nhất của Nvidia bằng cách phân tán rủi ro IP và đàm phán giá cạnh tranh. Lộ trình mở rộng đến cuối năm 2027 với TPU v8, được sản xuất trên quy trình 2nm của TSMC.

Ý nghĩa chiến lược: Thách thức Nvidia không phải bằng một chip duy nhất, mà bằng chuỗi cung ứng

Trong ba năm qua, thị trường chip AI gần như do Nvidia độc quyền, với hệ sinh thái phần mềm CUDA và hai lớp “hào lũy” từ các chip H100/GB200. Chiến lược của Ironwood của Google và nhóm bốn đối tác không nhằm mục tiêu “vượt trội một điểm đơn lẻ về thông số”, mà là sao chép logic “nền tảng được tiêu chuẩn hóa + mua sắm đa khách hàng” mà Nvidia đã áp dụng trong ngành—để TPU không chỉ phục vụ cho Google, mà còn trở thành một lựa chọn năng lực tính toán thương mại có thể dùng chung cho các công ty AI lớn như Anthropic, Meta.

Ý nghĩa của việc Anthropic cam kết 1 triệu chip TPU đặc biệt quan trọng: đây là cam kết năng lực tính toán lớn nhất ngoài Nvidia của một công ty AI đơn lẻ. Nó bổ sung lẫn nhau với cam kết 5GW/100 tỷ AWS mà Anthropic đạt được cùng Amazon—một bên gắn với AWS Trainium, một bên gắn với Google TPU. Với chiến lược “hai chip tùy chỉnh”, Anthropic giảm sự phụ thuộc vào Nvidia. Meta cũng là lần đầu công khai đưa TPU vào các khối lượng công việc huấn luyện/suy luận AI của chính mình, tạo ra một tín hiệu khác.

Phản ứng thị trường và liên kết với ngành

Trước khi tiết lộ lần này, MediaTek đã từng được xem như “người hưởng lợi từ chip tùy chỉnh của Google”. Việc lộ mã hiệu Zebrafish là lần đầu tiên đưa MediaTek trực tiếp vào danh sách đối tác thiết kế chip suy luận của Google. Đây là bước mở rộng theo tuyến truyện về “liên minh ngoài Nvidia” gần đây, gồm AMD × GlobalFoundries quang tử silicon và Marvell × Google MPU.

Nvidia ở cùng thời điểm vẫn có GB200 và nền tảng Rubin thế hệ tiếp theo để chống đỡ, nhưng tổ hợp năng lực tính toán phía khách hàng đang chuyển từ “toàn bộ Nvidia” sang mô hình ba trục song song “Nvidia + TPU + AWS Trainium”. Điều này cũng đồng nghĩa với việc năng lực sản xuất 2nm của TSMC sẽ đứng trước tình trạng Google, Nvidia, Apple và Amazon—bốn khách hàng lớn—đều đang xếp hàng, và sức mạnh đàm phán giá với nhà máy gia công bán dẫn tiếp tục tăng lên.

Bài viết “Google Ironwood TPU: Hiệu năng gấp 10 lần + bốn đối tác chống lại Nvidia” lần đầu tiên xuất hiện trên 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

SenseNova U1 Cắt giảm chi phí tạo ảnh xuống còn 1/10 so với ảnh của ChatGPT Images 2.0, SenseTime công bố nửa đầu tiên có lãi trong năm 2025

Theo một cuộc phỏng vấn gần đây của CNBC, đồng sáng lập kiêm nhà khoa học trưởng của SenseTime Lin Dahua cho biết mô hình mới nhất của công ty, SenseNova U1, có khả năng tạo hình ảnh sau OpenAI GPT Image 2 và Google Gemini Nano Banana, nhưng chỉ tốn bằng một phần mười so với ChatGPT Images 2.0. SenseNova U1 là

GateNews5phút trước

Các vụ tấn công mã độc tống tiền tăng 389% trong năm 2025 lên 7.831, theo báo cáo của Fortinet

Theo Fortinet, số vụ tấn công ransomware toàn cầu tăng 389% so với cùng kỳ năm trước lên 7.831 vào năm 2025, khi tội phạm mạng tận dụng AI và đẩy nhanh các cuộc tấn công vào lỗ hổng phần mềm. Ngành sản xuất là lĩnh vực bị nhắm mục tiêu nhiều nhất với 1.284 vụ, tiếp theo là dịch vụ kinh doanh với 824 và bán lẻ với 682. Fortine

GateNews21phút trước

Blackstone, KKR, EQT đang đàm phán với Alphabet về các thương vụ danh mục AI

Theo Bloomberg, Blackstone, KKR và EQT có trụ sở tại Thụy Điển đang đàm phán với Alphabet để cung cấp cho các công ty trong danh mục của họ quyền truy cập các mô hình AI của Google thông qua các hợp đồng áp dụng trên toàn bộ danh mục. Các cuộc thảo luận là không độc quyền và có thể không dẫn đến giao dịch. Thỏa thuận này sẽ giúp Google có thêm phạm vi

GateNews31phút trước

Finnish AI Lab QuTwo Hoàn Tất Vòng Seed $29M tại Mức Định Giá $380M ; Công Ty Trước Đó Của Người Sáng Lập Silo AI Được AMD Mua Với Giá 665 Triệu USD

Theo Beating, phòng thí nghiệm AI của Phần Lan QuTwo đã hoàn tất vòng seed 25 triệu euro (xấp xỉ 29 triệu USD) với định giá sau vòng là 325 triệu euro (xấp xỉ 380 triệu USD). Người sáng lập và Chủ tịch điều hành Peter Sarlin trước đó từng sáng lập Silo AI, công ty mà AMD đã mua lại với giá 665 triệu USD vào năm 2024.

GateNews1giờ trước

DeepSeek được định giá $45B khi Quỹ Bán dẫn Nhà nước Trung Quốc nhắm tới khoản đầu tư dẫn đầu

Theo ChainCatcher, quỹ đầu tư chất bán dẫn do nhà nước Trung Quốc hậu thuẫn đang đàm phán để dẫn dắt vòng gọi vốn Series A của DeepSeek, có thể định giá phòng thí nghiệm AI ở khoảng 45 tỷ USD. Việc đàm phán gây quỹ vẫn đang tiếp diễn, theo bốn người quen thuộc với

GateNews1giờ trước

Khảo sát của Microsoft: Chỉ 13% nhân viên cho biết các thử nghiệm đổi mới nơi làm việc do AI thúc đẩy do chương trình khuyến khích của doanh nghiệp thất bại

Theo báo cáo Chỉ số Xu hướng Công việc hằng năm mà Microsoft công bố vào ngày 5 tháng 5, báo cáo đã phân tích hàng nghìn tỷ tín hiệu về năng suất Microsoft 365 ẩn danh và khảo sát 20.000 nhân viên tại nhiều thị trường như Mỹ, Anh, Ấn Độ và Nhật Bản. Dữ liệu của báo cáo cho thấy chỉ 13% nhân viên cho biết người sử dụng lao động sẽ khen thưởng khi họ thử cải thiện công việc bằng AI nhưng không đạt hiệu quả như mong đợi.

MarketWhisper2giờ trước
Bình luận
0/400
Không có bình luận