Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là “đáng ngạc nhiên là tầm thường và dễ gây lỗi” so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A đã trở thành chủ đề thảo luận phổ biến nhất tại hội nghị học thuật ISCA, đưa ra các khuyến nghị cụ thể phù hợp với các tiêu chuẩn kết nối liên ngành trong ngành. Ngược lại, V4 lại còn mơ hồ hơn rất nhiều.
Chan đã phản biện có hệ thống ba khuyến nghị then chốt. Về mức tiêu thụ điện năng, báo cáo cho rằng việc tối ưu hóa phần mềm cho phép chip chạy đồng thời ở mức công suất tối đa cho tính toán, lưu trữ và truyền thông, đồng thời khuyến nghị các nhà sản xuất chip dành ra thêm phần dự trữ công suất. Chan lập luận rằng điều này phản tác dụng: tổng công suất của chip bị giới hạn bởi các hạn chế của quy trình vật lý, do đó việc dành thêm biên công suất chỉ làm giảm tần số hoạt động, cuối cùng kéo giảm hiệu suất tính toán. Đối với truyền dữ liệu GPU-GPU, báo cáo đề xuất mô hình kéo—trong đó các GPU chủ động nạp dữ liệu—thay vì mô hình đẩy, viện dẫn chi phí thông báo cao trong các thao tác đẩy. Chan phản bác điều này, cho rằng mô hình kéo thực ra còn chậm hơn và năng lực bộ điều hợp mạng được cải thiện sẽ là lựa chọn tốt hơn. Tuy nhiên, hai bên có thể đang thảo luận về những lớp khác nhau của vấn đề: báo cáo đề cập đến chi phí do cơ chế thông báo, còn Chan lại nói về độ trễ truyền tải.
Về các hàm kích hoạt, báo cáo khuyến nghị thay thế SwiGLU bằng các hàm đơn giản hơn để giảm gánh nặng tính toán. Chan không thấy có giá trị trong việc này, lưu ý rằng Sonic MoE đã chứng minh hiệu suất tối ưu khi sử dụng SwiGLU. Chan nghi ngờ DeepSeek có thể đã “cố ý làm suy yếu phần này.”
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
xAI ra mắt Grok Custom Voices, cho phép người dùng sao chép giọng AI của chính mình trong 1 phút
Theo Beating, xAI đã ra mắt Grok Custom Voices và Voice Library, cho phép người dùng ghi lại 1 phút âm thanh trong bảng điều khiển xAI để tạo voice_id tùy chỉnh nhằm sử dụng với các API Grok TTS và Voice Agent. Tính năng này hỗ trợ các ứng dụng bao gồm tác nhân dịch vụ khách hàng, tạo nội dung,
GateNews56phút trước
HBM 後, AI sẽ vướng “nút thắt” bộ nhớ mới là HBF? Người đoạt giải Turing David Patterson: Suy luận sẽ định nghĩa lại kiến trúc lưu trữ
Tác giả giải Turing David Patterson cho biết, khi AI chuyển từ giai đoạn huấn luyện sang suy luận quy mô lớn, nút thắt về bộ nhớ tiếp theo có thể không phải là HBM mà là HBF (bộ nhớ flash băng thông cao). HBF sử dụng kiến trúc xếp chồng NAND Flash để cung cấp dung lượng lớn, tiêu thụ điện năng thấp, đảm nhiệm việc truy cập bối cảnh và dữ liệu trung gian trong quá trình suy luận, khác với sự phân công giữa các loại bộ nhớ tối ưu cho tốc độ như HBM. SK Hynix và SanDisk đang thúc đẩy tiêu chuẩn hóa, dự kiến đến năm 2038 nhu cầu đối với HBF có thể vượt HBM.
ChainNewsAbmedia1giờ trước
Hội nghị các nhà phát triển của Anthropic Code With Claude 5/6 khai mạc tại San Francisco: đăng ký miễn phí trực tiếp
Anthropic ngày 1/5 công bố hội nghị nhà phát triển đầu tiên “Code with Claude” sẽ khai mạc vào ngày 6/5 tại San Francisco, và lần đầu mở rộng thành chuỗi 3 điểm với London (19/5) và Tokyo (10/6). Số lượng chỗ ngồi trực tiếp tại 3 buổi hội trường chính được phân bổ theo cơ chế bốc thăm và tất cả đều đã bốc xong, nhưng đăng ký xem livestream vẫn mở cho mọi người. Nhằm đáp ứng nhu cầu trực tiếp vượt tải, sự kiện tại San Francisco còn có thêm một buổi “Extended” vào ngày 7/5, được thiết kế riêng cho các nhà phát triển độc lập và những người sáng lập ở giai đoạn sớm.
Ba chặng lưu diễn: 6/5 San Francisco, 19/5 London, 10/6 Tokyo
Code with Claude là hội nghị nhà phát triển do Anthropic tổ chức; sự kiện tại San Francisco là lần thứ 2 được tổ chức. Nội dung cả 3 sự kiện là như nhau: các buổi workshop trực tiếp cả ngày, demo các tính năng mới nhất, và những nội dung liên quan đến Claude ở từng phần
ChainNewsAbmedia1giờ trước
OpenAI công bố dữ liệu sau 1 tuần ra mắt GPT-5.5: tốc độ tăng trưởng doanh thu API lập kỷ lục mới, Codex tăng gấp đôi
OpenAI ngày 1/5 đã công bố trên tài khoản chính thức 3 số liệu sau 1 tuần ra mắt GPT-5.5: tự đánh giá là “bài đăng mạnh nhất từ trước đến nay”, tốc độ tăng trưởng doanh thu API đạt từ 2 lần trở lên so với bất kỳ lần công bố mô hình nào trước đây, và Codex tăng gấp đôi doanh thu trong chưa đầy 7 ngày. OpenAI quy kết nguyên nhân là nhu cầu phía doanh nghiệp đối với các công cụ agentic coding (lập trình theo tác nhân) tiếp tục tăng cao, trùng nhịp cùng việc đối đầu với Anthropic Mythos đồng thời ra mắt GPT-5.5-Cyber vào ngày 30/4, hình thành cùng một “nhịp” sản phẩm.
3 mục số liệu do công bố: tốc độ doanh thu API gấp đôi, Codex gấp đôi trong 7 ngày, bài đăng mạnh nhất từ trước đến nay
3 con số then chốt mà OpenAI lần này công bố đến từ các dòng tweet chính thức, không kèm báo cáo tài chính chi tiết: đầu tiên, GPT-5.5 là “mô hình có tăng trưởng doanh thu mạnh nhất từ trước đến nay” của…
ChainNewsAbmedia1giờ trước
Ủy ban Đối ngoại Hạ viện Mỹ gặp các gã khổng lồ công nghệ về các biện pháp kiểm soát xuất khẩu AI sau khi Đạo luật MATCH được thông qua với tỷ lệ 36-8
Theo Beating, các thành viên của Ủy ban Đối ngoại Hạ viện Mỹ sẽ đến thung lũng Silicon vào tuần tới để gặp các đại diện của Google, Anthropic, Meta, Tesla, Intel, Applied Materials và Nvidia nhằm thảo luận về trí tuệ nhân tạo và các biện pháp kiểm soát xuất khẩu. Một cuộc tọa đàm ngành là
GateNews2giờ trước
OpenAI Ra mắt Codex Pets, trợ lý ảo được AI hỗ trợ với khả năng tạo nội dung tùy chỉnh
Theo Beating, OpenAI đã thêm một tính năng mới “Codex Pets” vào ứng dụng Codex dành cho máy tính để bàn, cho phép người dùng tạo và tương tác với một người bạn đồng hành ảo dạng hoạt hình. Người dùng có thể kích hoạt một thú cưng bằng cách gõ /pet trong trình soạn thảo. Tính năng này hoạt động như một chỉ báo trạng thái tác nhân, hiển thị một
GateNews2giờ trước