Cựu kỹ sư Seed của ByteDance: Lượt lặp AI của ByteDance mất sáu tháng so với ba tháng của Google

Tin tức Cổng, ngày 24 tháng 4 — Zhang Chi, cựu kỹ sư tại đội Seed của ByteDance và hiện là trợ giảng tại Đại học Bắc Kinh, đã tiết lộ trên podcast “Into Asia” rằng ByteDance cần khoảng sáu tháng để hoàn thành một chu kỳ đầy đủ huấn luyện mô hình ngôn ngữ lớn (pretraining cộng thêm hậu huấn luyện), trong khi Google theo như báo cáo chỉ cần ba tháng. Zhang cho rằng sự chênh lệch tốc độ này là một lý do cốt lõi khiến các công ty Trung Quốc gặp khó khăn trong việc bắt kịp phát triển AI.

Zhang mô tả một “văn hóa đánh giá chuẩn” trong Seed, nơi các trưởng nhóm được đánh giá dựa trên điểm số benchmark mà họ giám sát, và mọi thành viên đều tập trung vào việc nâng cao các con số. Tuy nhiên, ông cho biết điều này không chuyển hóa thành trải nghiệm người dùng tốt hơn trong thực tế. Mặc dù các mô hình của các công ty lớn của Trung Quốc có vẻ cạnh tranh với các mô hình frontier của Mỹ trên giấy tờ, chúng lại thua kém trong cách sử dụng thực tế. Mục tiêu của Seed là đạt hiệu năng thuộc nhóm hàng đầu toàn cầu, nhưng Zhang cho biết ông không tin rằng nhóm đã đạt được điều đó, và cũng chưa đạt được mục tiêu dẫn dắt trong nước.

Vào cuối năm 2024, Seed tự đánh giá mình ngang với GPT-4o, nhưng sau khi DeepSeek ra mắt, nhóm nhận ra khoảng cách vẫn còn. Khi Zhang tham gia, cả nhóm đang khẩn trương chuyển hướng sang học tăng cường để bù đắp sự thiếu hụt.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cloudflare: Tác nhân AI thúc đẩy lưu lượng truy cập không phải của con người, x402 cung cấp giải pháp

Giám đốc Chiến lược của Cloudflare cho biết hơn một nửa lưu lượng truy cập internet hiện nay là không phải của con người, cho thấy một sự thay đổi lớn trong các mô hình sử dụng web do tác động của các tác nhân AI và hệ thống tự động. Vị điều hành cũng cho rằng x402 Foundation đang xây dựng hạ tầng để giải quyết những thách thức

CryptoFrontier1giờ trước

IREN mua lại Mirantis với $625M trong một thương vụ hoán đổi cổ phiếu để mở rộng nền tảng AI Cloud

Theo BlockBeats, IREN Limited đã đồng ý mua công ty phần mềm hạ tầng đám mây Mirantis với khoảng 625 triệu USD trong một giao dịch toàn cổ phiếu vào ngày 5/5. Việc mua lại nhằm tăng cường năng lực AI trên đám mây của IREN bằng cách giới thiệu khả năng phần mềm và điều phối để

GateNews7giờ trước

Giám đốc điều hành Anthropic: Mỹ đang xem xét quy trình phát hành mô hình AI đơn giản hóa, các đối thủ chậm 1-3 tháng

Theo 金十, CEO của Anthropic cho biết vào ngày 5/5 rằng chính phủ Mỹ dường như đang cân nhắc đơn giản hóa quy trình phát hành các mô hình trí tuệ nhân tạo. Vị CEO cho biết năng lực của các phòng thí nghiệm AI lớn khác có thể còn tụt hậu so với Anthropic từ 1 đến 3

GateNews8giờ trước

Nhóm SGLang hoàn tất vòng gọi vốn Seed tại $100M định giá $400M , do Accel dẫn dắt

Theo Beating, nhóm đứng sau công cụ suy luận mã nguồn mở SGLang đã chính thức thành lập RadixArk và hoàn tất vòng gọi vốn hạt giống 100 triệu USD với định giá sau đầu tư 400 triệu USD. Accel dẫn dắt vòng này, với Spark Capital đồng dẫn dắt. Các đối thủ bán dẫn Nvidia (thông qua

GateNews8giờ trước

OpenAI cấp phép cho 8.000 nhà phát triển tăng giới hạn tốc độ Codex lên 10 lần đến ngày 5 tháng 6

Theo Beating, OpenAI đã gửi email cho hơn 8.000 nhà phát triển đã đăng ký tham dự sự kiện GPT-5.5 offline ở San Francisco, cấp cho họ mức tăng gấp 10 lần giới hạn tốc độ của Codex, có hiệu lực ngay lập tức đến ngày 5/6. Tất cả ứng viên đều nhận phần thưởng bất kể họ có nhận được sự kiện hay không.

GateNews8giờ trước

Liên doanh của OpenAI với Anthropic đang đàm phán để mua 3 công ty dịch vụ AI vào ngày 5/5

Theo Jin 10, liên doanh của OpenAI với Anthropic đang trong các cuộc đàm phán để mua ba công ty dịch vụ AI vào ngày 5/5. Các công ty mục tiêu được cho là bao gồm các doanh nghiệp tập trung vào kỹ thuật trong lĩnh vực dịch vụ AI

GateNews8giờ trước
Bình luận
0/400
Không có bình luận