Theo Beating, Microsoft gần đây đã mã nguồn mở họ mô hình Phi-Ground, được thiết kế để giải quyết vấn đề AI nên nhấp vào đâu trên màn hình máy tính. Phiên bản 4 tỷ tham số, kết hợp với các mô hình ngôn ngữ lớn hơn để lập kế hoạch theo hướng dẫn, đã vượt độ chính xác nhấp chuột của OpenAI Operator và Claude Computer Use trong benchmark Showdown, đồng thời xếp hạng đầu trong số tất cả các mô hình dưới 100 tỷ tham số qua năm đánh giá, bao gồm cả ScreenSpot-Pro.

Nhóm đã huấn luyện trên hơn 40 triệu mẫu dữ liệu và phát hiện rằng 3 kỹ thuật huấn luyện phổ biến được sử dụng trong các bài báo học thuật trở nên kém hiệu quả khi triển khai ở quy mô lớn. Cách tiếp cận cốt lõi lại khá đơn giản: xuất tọa độ dưới dạng các con số thông thường, chẳng hạn như “523, 417”. Các nghiên cứu trước đó đã tạo ra từ vựng vị trí chuyên biệt cho tọa độ, nhưng không thể mở rộng quy mô. Nhóm cũng phát hiện rằng việc đặt chỉ dẫn bằng văn bản trước hình ảnh giúp cải thiện hiệu suất, vì mô hình có thể xác định mục tiêu trong khi xử lý pixel. Ngoài ra, các phương pháp học tăng cường như DPO cải thiện độ chính xác ngay cả sau khi fine-tuning.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Sakana AI và Nvidia đạt tốc độ suy luận H100 nhanh hơn 30% bằng cách bỏ qua 80% các phép tính không hợp lệ

Tin tức ngành AI

Sakana AI và Nvidia đã mã nguồn mở TwELL, một định dạng dữ liệu thưa giúp các GPU H100 bỏ qua 80% các phép tính không hợp lệ trong các mô hình ngôn ngữ lớn mà không làm giảm độ chính xác. Giải pháp mang lại suy luận nhanh hơn tới 30% và huấn luyện nhanh hơn 24% trên H100, đồng thời giảm mức sử dụng bộ nhớ đỉnh. Trong thử nghiệm với một mô hình tham số 1,5 tỷ, phương pháp này đã đưa số nơ-ron hoạt động xuống dưới 2% nhờ cơ chế chính quy hóa nhẹ trong quá trình huấn luyện, không suy giảm hiệu năng

GateNews25phút trước

Tilde Research phát hiện Muon Optimizer tiêu diệt 25% nơ-ron; giải pháp thay thế Aurora đạt mức tăng hiệu quả dữ liệu gấp 100 lần

Tin tức ngành AI

Theo Tilde Research, bộ tối ưu hóa Muon được áp dụng bởi các mô hình AI hàng đầu bao gồm DeepSeek V4 và Kimi K2.5 có một lỗi ẩn: nó khiến hơn 25% nơ-ron ở các lớp MLP bị chết vĩnh viễn trong giai đoạn huấn luyện sớm. Nhóm đã thiết kế Aurora, một bộ tối ưu hóa thay thế, và phát hành mã nguồn mở. Một mô hình tham số 1,1B được huấn luyện với chỉ 100B token đã đạt hiệu năng tương đương với Qwen3-1.7B được huấn luyện trên 36T token ở các bài benchmark hiểu ngôn ngữ như HellaSwag và Winogrande, cho th

GateNews1giờ trước

Nvidia cam kết hơn 40 tỷ USD cho các khoản đầu tư AI vào đầu năm 2026, bao gồm 30 tỷ USD cho OpenAI

Tin tức ngành AI

Theo TechCrunch, Nvidia đã cam kết hơn 40 tỷ USD cho các khoản đầu tư vào cổ phần tại các công ty AI trong những tháng đầu năm 2026, trong đó khoản đầu tư 30 tỷ USD vào OpenAI là cam kết đơn lẻ lớn nhất. Nhà sản xuất chip này cũng cam kết lên tới 3,2 tỷ USD cho Corning, công ty sản xuất kính, và tối đa 2,1 tỷ USD cho nhà điều hành trung tâm dữ liệu IREN, bao gồm quyền mua (warrant) trong 5 năm và một hợp đồng riêng 3,4 tỷ USD cho dịch vụ đám mây GPU quản lý sử dụng hệ thống Nvidia Blackwell. The

GateNews4giờ trước

NVIDIA mở rộng quan hệ đối tác AI dài hạn với Deepinfra, nhận 107 triệu đô la Mỹ vòng B để xây dựng “nhà máy token”

Tin tức ngành AI

AI khởi nghiệp DeepInfra công bố hoàn tất vòng tài trợ Series B 1,07 trăm triệu USD, do 500 Global và kỹ sư phần mềm kỳ đầu tại Google Georges Harik dẫn dắt, với sự tham gia của các nhà đầu tư chiến lược như NVIDIA (NVIDIA), Samsung Next và Supermicro. Theo thông tin chính thức, khoản đầu tư lần này sẽ được dùng để mở rộng năng lực trung tâm dữ liệu toàn cầu, nhằm giải quyết chi phí vận hành và các nút thắt hiệu suất mà các ứng dụng AI hiện đang gặp phải khi chuyển từ “huấn luyện mô hình” sang “

ChainNewsAbmedia5giờ trước

Thành viên Hội đồng Thống đốc ECB Escrivá cảnh báo rủi ro AI đối với hạ tầng tài chính vào ngày 9 tháng 5

Tin tức ngành AI

Thành viên Hội đồng Thống đốc Ngân hàng Trung ương châu Âu (ECB) Escrivá cho biết vào ngày 9 tháng 5 rằng các ngân hàng trung ương phải đánh giá lại mức độ vững chắc của hạ tầng tài chính và khả năng chống chịu trước các cuộc tấn công mạng trong bối cảnh những phát triển của trí tuệ nhân tạo. Theo phát biểu của ông tại một sự kiện, những tiến bộ AI gần đây khiến cần phải xem xét lại khả năng của các hệ thống tài chính trong việc chịu đựng các rủi ro mới nổi.

GateNews5giờ trước

SpaceX đổi thương hiệu xAI thành SpaceXAI, nộp đơn đăng ký nhãn hiệu “Orbital Computing” trước IPO trị giá 1,75 nghìn tỷ USD

Tin tức ngành AI

Theo các hồ sơ đăng ký nhãn hiệu với Cơ quan Sáng chế và Nhãn hiệu Hoa Kỳ, công ty trí tuệ nhân tạo của Elon Musk là xAI đang được sáp nhập vào SpaceX dưới một thương hiệu mới, SpaceXAI. Việc đổi thương hiệu bao gồm các trung tâm dữ liệu dựa trên vệ tinh, điện toán quỹ đạo, điện toán đám mây và quản lý khối lượng công việc AI thông qua các nền tảng dựa trên không gian. Musk xác nhận xAI sẽ giải thể như một công ty riêng, trong đó các sản phẩm AI sẽ hoạt động dưới SpaceXAI với logo riêng. Động th

GateNews7giờ trước

Bình luận

0/400

Không có bình luận