Google tìm cách mở rộng hệ sinh thái chip AI với Marvell khi cuộc cạnh tranh với Nvidia đang nóng lên

Theo một số nguồn tin, Google của Alphabet Inc. đang trong các cuộc đàm phán với Marvell Technology để phát triển hai chip mới nhằm cải thiện cách các mô hình trí tuệ nhân tạo được vận hành.
Tóm tắt

  • Google đang đàm phán với Marvell để phát triển hai chip tập trung cho AI, bao gồm một bộ xử lý xử lý bộ nhớ (memory processing unit) và một TPU thế hệ tiếp theo, nhằm cải thiện hiệu quả của mô hình.
  • Bước đẩy này là một phần nỗ lực của Google nhằm định vị các TPU của mình như một lựa chọn thay thế cho GPU Nvidia, đồng thời mở rộng quan hệ đối tác với Intel và Broadcom.
  • Động thái này diễn ra bên cạnh việc ra mắt Gemma 4, khi Google đồng bộ các mô hình AI và hệ thống phần cứng của mình trong bối cảnh cạnh tranh trong mảng điện toán AI ngày càng gay gắt.

Theo một báo cáo của The Information, trích dẫn các nguồn am hiểu vấn đề, một trong hai chip được đề xuất có thể là một bộ xử lý bộ nhớ được xây dựng để hoạt động song song với các tensor processing units của Google, hay TPU. Chip thứ hai được kỳ vọng là một TPU mới, được tùy chỉnh riêng để chạy các tác vụ AI hiệu quả hơn.

Động thái này là một phần nỗ lực của Google nhằm định vị các chip do hãng tự phát triển như một lựa chọn thay thế cho GPU của Nvidia. Việc áp dụng TPU đã góp phần thúc đẩy tăng trưởng doanh thu của Google Cloud, khi công ty tìm cách chứng minh hiệu quả từ khoản chi cho hạ tầng AI.

Báo cáo cho biết thêm rằng Google dự định hoàn tất thiết kế của chip tập trung vào bộ nhớ vào năm tới, trước khi chuyển sang giai đoạn kiểm thử sản xuất. Đồng thời, công ty đã mở rộng quan hệ đối tác với các nhà sản xuất chip như Intel và Broadcom để hỗ trợ nhu cầu đang tăng lên đối với hạ tầng AI.

Cạnh tranh gia tăng trong phần cứng AI

Khi Google tăng tốc phát triển các bộ tăng tốc AI, hãng có thể bắt đầu thách thức vị thế dẫn đầu lâu năm của Nvidia trong điện toán hiệu năng cao.

Chẳng hạn, NVIDIA đang đẩy mạnh danh mục các chip suy luận AI của riêng mình, bao gồm các thiết kế tích hợp công nghệ từ Groq. Việc một đối thủ lớn quy mô khác gia nhập cuộc đua có thể làm gia tăng mức độ cạnh tranh trong mảng phần cứng AI và định hình lại cách các công ty tìm nguồn cung cấp sức mạnh tính toán cho các mô hình.

Các nhà đầu tư có khả năng sẽ tìm kiếm thêm sự rõ ràng khi Google công bố kết quả kinh doanh quý 1 vào ngày 29 tháng 4. Bản công bố lợi nhuận dự kiến sẽ cung cấp tín hiệu về hiệu suất của mảng cloud, xu hướng quảng cáo, và mức độ quyết liệt công ty dự định đầu tư vào AI và chất bán dẫn trong các quý tới.

Những tiến bộ của mô hình AI thúc đẩy nỗ lực về phần cứng

Các cuộc thảo luận chip mới nhất của Google diễn ra trong lúc hãng tiếp tục mở rộng năng lực mô hình AI của mình. Đầu tháng này, công ty đã giới thiệu Gemma 4, một họ mô hình mã nguồn mở mới được xây dựng cho khả năng suy luận nâng cao và các quy trình làm việc kiểu tác nhân.

Gemma 4 có sẵn trong bốn kích cỡ và được thiết kế để xử lý logic nhiều bước và giải quyết vấn đề có cấu trúc hiệu quả hơn. Nó cũng đã mang lại kết quả được cải thiện trong các bài kiểm tra gắn với các tác vụ toán học và làm theo hướng dẫn.

Các mô hình bao gồm các tính năng như gọi hàm native (native function calling), đầu ra JSON có cấu trúc, và các chỉ dẫn cấp hệ thống, cho phép nhà phát triển xây dựng các hệ thống tự chủ có thể kết nối với API và các công cụ bên ngoài. Chúng cũng có thể tạo mã offline, biến các máy cục bộ thành trợ lý lập trình AI có năng lực.

Cùng với các kế hoạch nâng cấp mô hình và phát triển chip, những điều này cho thấy Google đang đồng bộ phần mềm và hệ thống phần cứng của mình khi cạnh tranh trong lĩnh vực AI tiếp tục gia tăng.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cloudflare: Tác nhân AI thúc đẩy lưu lượng truy cập không phải của con người, x402 cung cấp giải pháp

Giám đốc Chiến lược của Cloudflare cho biết hơn một nửa lưu lượng truy cập internet hiện nay là không phải của con người, cho thấy một sự thay đổi lớn trong các mô hình sử dụng web do tác động của các tác nhân AI và hệ thống tự động. Vị điều hành cũng cho rằng x402 Foundation đang xây dựng hạ tầng để giải quyết những thách thức

CryptoFrontier1phút trước

IREN mua lại Mirantis với $625M trong một thương vụ hoán đổi cổ phiếu để mở rộng nền tảng AI Cloud

Theo BlockBeats, IREN Limited đã đồng ý mua công ty phần mềm hạ tầng đám mây Mirantis với khoảng 625 triệu USD trong một giao dịch toàn cổ phiếu vào ngày 5/5. Việc mua lại nhằm tăng cường năng lực AI trên đám mây của IREN bằng cách giới thiệu khả năng phần mềm và điều phối để

GateNews6giờ trước

Giám đốc điều hành Anthropic: Mỹ đang xem xét quy trình phát hành mô hình AI đơn giản hóa, các đối thủ chậm 1-3 tháng

Theo 金十, CEO của Anthropic cho biết vào ngày 5/5 rằng chính phủ Mỹ dường như đang cân nhắc đơn giản hóa quy trình phát hành các mô hình trí tuệ nhân tạo. Vị CEO cho biết năng lực của các phòng thí nghiệm AI lớn khác có thể còn tụt hậu so với Anthropic từ 1 đến 3

GateNews6giờ trước

Nhóm SGLang hoàn tất vòng gọi vốn Seed tại $100M định giá $400M , do Accel dẫn dắt

Theo Beating, nhóm đứng sau công cụ suy luận mã nguồn mở SGLang đã chính thức thành lập RadixArk và hoàn tất vòng gọi vốn hạt giống 100 triệu USD với định giá sau đầu tư 400 triệu USD. Accel dẫn dắt vòng này, với Spark Capital đồng dẫn dắt. Các đối thủ bán dẫn Nvidia (thông qua

GateNews6giờ trước

OpenAI cấp phép cho 8.000 nhà phát triển tăng giới hạn tốc độ Codex lên 10 lần đến ngày 5 tháng 6

Theo Beating, OpenAI đã gửi email cho hơn 8.000 nhà phát triển đã đăng ký tham dự sự kiện GPT-5.5 offline ở San Francisco, cấp cho họ mức tăng gấp 10 lần giới hạn tốc độ của Codex, có hiệu lực ngay lập tức đến ngày 5/6. Tất cả ứng viên đều nhận phần thưởng bất kể họ có nhận được sự kiện hay không.

GateNews6giờ trước

Liên doanh của OpenAI với Anthropic đang đàm phán để mua 3 công ty dịch vụ AI vào ngày 5/5

Theo Jin 10, liên doanh của OpenAI với Anthropic đang trong các cuộc đàm phán để mua ba công ty dịch vụ AI vào ngày 5/5. Các công ty mục tiêu được cho là bao gồm các doanh nghiệp tập trung vào kỹ thuật trong lĩnh vực dịch vụ AI

GateNews6giờ trước
Bình luận
0/400
Không có bình luận