DeepSeek giới thiệu phương pháp Visual Primitives để nâng cao khả năng suy luận đa phương thức vào ngày 30 tháng 4

Theo báo cáo kỹ thuật của DeepSeek, vào ngày 30/4 công ty đã giới thiệu Visual Primitives, một phương pháp nhúng các đơn vị hình ảnh cơ bản như điểm và khung giới hạn vào các chuỗi suy luận nhằm giải quyết vấn đề Reference Gap trong các tác vụ đa phương thức. Phương pháp này giúp giảm mức tiêu thụ token hình ảnh thông qua nén KV cache.

Trong các bộ benchmark đếm và suy luận không gian, cách tiếp cận đạt hiệu năng tương đương với GPT-5.4, Claude-Sonnet-4.6 và Gemini-3-Flash ở một số hạng mục được chọn. DeepSeek cho biết sẽ mở mã nguồn một phần của các benchmark và bộ dữ liệu, đồng thời các trọng số mô hình sẽ được phát hành sau khi tích hợp.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Forefront Tech hoàn tất định giá IPO $100M , niêm yết trên Nasdaq theo mã FTHAU

Theo ChainCatcher, công ty đầu tư mục đích đặc biệt Forefront Tech đã hoàn tất định giá IPO 100 triệu USD vào ngày 30 tháng 4 và sẽ niêm yết trên Nasdaq với mã FTHAU. Công ty dự kiến sử dụng số tiền thu được để theo đuổi các cơ hội sáp nhập và mua lại trong blockchain, fintech, trí tuệ nhân tạo trong

GateNews42phút trước

Claude Code của Anthropic bị tính phí quá mức 200,98 USD do lỗi thanh toán, ban đầu bị từ chối hoàn tiền trước khi được bồi thường đầy đủ

Theo giám sát của Beating, một lỗi tính phí trong dịch vụ Claude Code của Anthropic đã khiến một thuê bao Max đạt mức bị tính phí quá 20 lần, tương đương 200,98 USD phí sử dụng phát sinh, trong khi chỉ dùng 13% hạn mức theo tháng của họ. Lỗi được kích hoạt khi lịch sử commit của kho git của người dùng chứa chữ in hoa

GateNews1giờ trước

NVIDIA Phát hành Trọng số mô hình Cosmos-Reason2-32B chủ lực, mở rộng cửa sổ ngữ cảnh lên 256K token

Theo Beating, NVIDIA đã phát hành các trọng số cho Cosmos-Reason2-32B, phiên bản chủ lực của mô hình ngôn ngữ-thị giác suy luận AI vật lý (VLM) nhằm giúp robot và các hệ thống lái xe tự động hiểu các nguyên lý về không gian, thời gian và vật lý. Mô hình 32 tỷ tham số,

GateNews1giờ trước

OpenAI tiết lộ Codex vì sao bị cấm nói về “goblin”: kiểm soát phần thưởng “nhân cách lập trình viên” bị vượt tầm

OpenAI trong blog chính thức đã giải thích Codex cấm không nhắc đến goblin và các sinh vật khác, bắt nguồn từ việc ưu tiên tín hiệu phần thưởng trong huấn luyện tính cách kiểu “dân mọt sách”, khiến hình ảnh so sánh mang tính sinh vật gây ô nhiễm chéo giữa các nhân cách và dẫn đến RLHF bị hiểu sai. Sự việc được Barron Roth tiết lộ sau khi bộc lộ các chỉ lệnh hệ thống, sau đó OpenAI áp dụng hai chiến lược: mã hóa cứng ngắn hạn và xóa dần các tín hiệu phần thưởng trong dài hạn, đồng thời cảnh báo về sự mong manh của thiết kế phần thưởng; giai đoạn kiểm toán sau huấn luyện cần chi tiết hơn.

ChainNewsAbmedia2giờ trước

Module diễn giải Qwen-Scope nguồn mở của Alibaba mở rộng, bao phủ 7 mô hình vào ngày 30 tháng 4

Theo PANews, vào ngày 30/4, Qwen của Alibaba đã công bố mã nguồn mở cho Qwen-Scope, một mô-đun khả giải thích được huấn luyện trên các mô hình thuộc dòng Qwen3 và Qwen3.5. Bản phát hành bao gồm 7 mô hình ngôn ngữ lớn ở các biến thể dense và mixture-of-experts, với 14 bộ sparse autoencoder

GateNews3giờ trước

Các máy chủ AI Nvidia B300 đạt mốc 1 triệu USD tại Trung Quốc trong bối cảnh thiếu hụt nguồn cung

Theo Reuters, các máy chủ AI B300 của Nvidia hiện được bán với giá khoảng 7 triệu nhân dân tệ (1 triệu USD) tại Trung Quốc, nhờ việc siết chặt các đường dây buôn lậu và nhu cầu tiếp tục từ các công ty công nghệ trong nước. Giá đã tăng từ khoảng 4 triệu nhân dân tệ (585.000 USD) vào cuối năm 2025, đáng kể

GateNews3giờ trước
Bình luận
0/400
Không có bình luận