Các mô hình AI hàng đầu tụt lại ở các tác vụ doanh nghiệp thường ngày, Databricks nói rằng các mô hình chuyên biệt nhỏ hơn vượt trội

Tin Gate News, ngày 20 tháng 4 — Các mô hình AI hàng đầu tỏ ra xuất sắc trong việc giải các vấn đề phức tạp như toán Olympic, nhưng lại gặp khó khăn với công việc doanh nghiệp thường nhật, theo David Meyer của Databricks. Một số mô hình có thể sửa một mã số hóa đơn sai thay vì gắn cờ đó là lỗi, trong khi các công cụ lập trình như Claude cũng có thể hoạt động kém hiệu quả trong các tác vụ kỹ thuật dữ liệu.

Khoảng cách này xuất phát từ sự khác biệt cơ bản giữa dữ liệu doanh nghiệp và văn bản công khai trên web được dùng để huấn luyện các mô hình lớn. Dữ liệu doanh nghiệp thường có nhãn cột mơ hồ, nhiều trường trống và các mã được lưu dưới dạng văn bản thuần. Trong một nghiên cứu học thuật, điểm F1 của một mô hình AI—điểm cân bằng giữa độ chính xác và độ thu hồi—giảm từ 0.94 trên dữ liệu công khai xuống 0.07 trên dữ liệu doanh nghiệp cho một tác vụ kỹ thuật dữ liệu. Ngoài ra, các mô hình lớn thường mặc định theo những khuôn mẫu quen thuộc từ quá trình huấn luyện; một số mô hình mặc định sang Structured Query Language (SQL) dù đã nhận được hướng dẫn và tài liệu về ngôn ngữ truy vấn độc quyền của một công ty.

Các mô hình nguồn mở nhỏ được tinh chỉnh bằng học tăng cường có thể xử lý các công việc cụ thể hiệu quả hơn với chi phí huấn luyện thấp hơn đáng kể so với các mô hình tổng quát lớn. Databricks đang xây dựng các tác nhân AI nhỏ cho các quy trình làm việc cụ thể, như KARL, sử dụng học tăng cường cho suy luận nhiều bước với tài liệu của công ty. Ngành đang chuyển từ việc phụ thuộc vào các mô hình khổng lồ sang các kiến trúc lai, trong đó các mô hình nhỏ hiệu quả xử lý khối lượng thường ngày, rồi chỉ nâng cấp lên các hệ thống lớn hơn, tốn kém hơn cho những trường hợp không rõ ràng hoặc phức tạp.

Gần đây Databricks đã mua Quotient AI để giúp các doanh nghiệp lớn chạy các tác nhân AI đáng tin cậy hơn. Cuộc cạnh tranh trong mảng kinh doanh AI hiện tập trung vào việc vận hành toàn bộ vòng đời AI, bao gồm các hệ thống phản hồi để theo dõi lỗi và liên tục cải thiện mô hình theo thời gian, khiến các công cụ đánh giá và tinh chỉnh ngày càng có giá trị sau khi triển khai.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Các nhà nghiên cứu triển khai công nghệ DPN-LE để chỉnh sửa các đặc điểm tính cách của AI, chỉ chỉnh sửa 0,5% số nơ-ron

Theo BlockBeats, vào ngày 3/5, nhà nghiên cứu AI Brian Roemmele đã tiết lộ rằng công ty Zero-Human của ông đã triển khai công nghệ DPN-LE (Dual Personality Neuron Localization and Editing) để điều chỉnh chính xác

GateNews1giờ trước

AI Agent Manfred thành lập công ty, chuẩn bị ví tiền mã hóa để giao dịch trước cuối tháng 5

Tác nhân AI Manfred đã thành lập công ty của riêng mình và nhận được một ví crypto cùng các giấy tờ kinh doanh, bao gồm khả năng thuê nhân sự và thực hiện thanh toán. Tác nhân này dự kiến sẽ bắt đầu giao dịch crypto vào cuối

GateNews1giờ trước

CEO của Tether đề xuất tích hợp WDK và QVAC để hỗ trợ thẻ tác nhân

Theo Foresight News, CEO Tether Paolo Ardoino cho biết trên X rằng công ty phát hành stablecoin có thể cần thúc đẩy việc tích hợp giữa WDK và QVAC để hỗ trợ chức năng Agent Cards.

GateNews5giờ trước

Particle Network Ra Mắt Lộ Trình Tài Khoản Phổ Quát, Khởi Chạy Universal Deposit SDK và Tài Khoản AI Agent

Theo ChainCatcher, hôm nay Particle Network đã công bố lộ trình giai đoạn tiếp theo cho Universal Accounts, giới thiệu hai sản phẩm mới trong vài tháng tới: Universal Deposit SDK, cho phép nhà phát triển thêm tiền gửi đa chuỗi với khoảng 10 dòng code và Universal Agent Accounts,

GateNews5giờ trước

OpenAI Cho Phép Các Gói Đăng Ký ChatGPT Hoạt Động Trên Nền Tảng Tác Nhân OpenClaw

Theo CEO OpenAI Sam Altman vào ngày 2/5, người dùng ChatGPT hiện có thể đăng nhập vào nền tảng tác nhân OpenClaw bằng tài khoản ChatGPT của họ và trực tiếp sử dụng các gói đăng ký ChatGPT hiện có trên nền tảng này.

GateNews7giờ trước

AI Agent Manfred thành lập công ty, chuẩn bị giao dịch crypto vào cuối tháng 5

Tác nhân AI Manfred đã thành lập công ty riêng và có được một ví tiền mã hóa kèm theo các thông tin đăng nhập để tuyển nhân sự, thực hiện thanh toán và tiến hành hoạt động kinh doanh. Tác nhân này dự định bắt đầu giao dịch tiền mã hóa vào cuối

GateNews8giờ trước
Bình luận
0/400
Không có bình luận