OpenAI và Broadcom công bố chip AI Jalapeno cho suy luận LLM vào ngày 25 tháng 6.

Theo OpenAI, công ty và Broadcom đã công bố Jalapeno vào ngày 25 tháng 6, một bộ tăng tốc AI tùy chỉnh được thiết kế đặc biệt cho suy luận mô hình ngôn ngữ lớn. Được phát triển với sự hợp tác của Broadcom và Celestica, Jalapeno đại diện cho thành phần đầu tiên của một nền tảng tính toán đa thế hệ theo kế hoạch nhằm cải thiện tốc độ, hiệu quả và khả năng tiếp cận của các hệ thống AI tiên tiến. Con chip được xây dựng từ nghiên cứu nội bộ về các yêu cầu suy luận LLM và kết hợp tối ưu hóa kernel, xử lý bộ nhớ, mạng và hệ thống phục vụ. Các mẫu kỹ thuật ban đầu đã chạy các khối lượng công việc học máy trong môi trường phòng thí nghiệm, bao gồm cả những khối lượng liên quan đến các mô hình tiên tiến như GPT-5.3-Codex-Spark, hoạt động ở mức tần số và công suất mục tiêu. Kiến trúc nhấn mạnh việc giảm di chuyển dữ liệu và phân bổ tài nguyên cân bằng giữa tính toán, bộ nhớ và mạng, được thiết kế để hoạt động trên các mô hình ngôn ngữ lớn khác nhau.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận