Claude Code tự động hóa nghiên cứu giành được ngôi quán quân hackathon! Người chiến thắng: Tôi thật sự chẳng biết mình đã thắng bằng cách nào

Tại Autoresearch Hackathon do Paradigm tổ chức, một thí sinh gần như “không tự tay thiết kế chiến lược”, nhưng cuối cùng lại giành chức vô địch. Nhà vô địch Ryan Li đồng thời cũng là Giám đốc điều hành của SurfAI cho biết toàn bộ quá trình giải bài gần như hoàn toàn do AI thực hiện; anh thậm chí “không biết mình đã thắng bằng cách nào”, nhưng cuối cùng vẫn giành vị trí số 1 trong Prediction Market Challenge.

Cuộc thi yêu cầu người tham gia thiết kế chiến lược tạo lập thị trường trong một thị trường dự đoán nhị phân mô phỏng. Thông qua lệnh giới hạn để cung cấp thanh khoản trên sổ lệnh, và đạt được sự cân bằng lợi nhuận giữa “nhà kinh doanh chênh lệch giá” và “dòng tiền của nhà đầu tư lẻ”. Xếp hạng cuối cùng dựa trên edge trung bình (lợi thế về lợi nhuận) trong 200 lần mô phỏng ngẫu nhiên. Kết quả cuối cùng của Ryan là 42.32 đô la mean edge (tính theo trung vị của ba bộ seed ngẫu nhiên), và sau khi chấm lại đã vươn lên dẫn đầu bảng.

Claude Code + Codex tự động nghiên cứu, tạo ra 1.039 chiến lược

Khác với các chiến lược giao dịch định lượng hay tạo lập thị trường truyền thống vốn phụ thuộc vào việc con người tinh chỉnh tham số và mô hình hóa, Ryan áp dụng hướng tiếp cận “Bitter Lesson” do Rich Sutton đề xuất trong những năm gần đây: sức mạnh tính toán và quy mô tìm kiếm đánh bại kinh nghiệm của con người. Anh chuyển toàn bộ bài toán thành quy trình “tự động hóa nghiên cứu” (autoresearch), sử dụng nhiều agent AI song song để khám phá không gian lời giải, thay vì tối ưu thủ công.

Trong suốt quá trình, anh sử dụng từ 8 đến 20 agent AI chạy song song (chủ yếu dựa trên Claude Code, đồng thời có bổ sung Codex). Mỗi agent chịu trách nhiệm cho những giả định và không gian tham số khác nhau, liên tục tạo chiến lược, chạy mô phỏng và báo cáo kết quả. Cuối cùng, anh tích lũy đầu ra 1.039 biến thể chiến lược, thực hiện hơn 2.000 lần đánh giá, đồng thời tự động tạo ra 47 tập lệnh quét tham số. Quy mô tìm kiếm tổng thể tương đương với việc nén vài tuần thí nghiệm thủ công thành vài giờ hoàn thành.

900 dòng Python thuật toán tạo lập thị trường do AI tạo ra giành quán quân hackathon

Ở cấp độ chiến lược, phương án chiến thắng cuối cùng là một thuật toán tạo lập thị trường khoảng 900 dòng Python. Logic cốt lõi không đến từ một thiết kế đơn lẻ, mà từ việc chồng ghép nhiều mô-đun “đã được xác thực hiệu quả”. Bao gồm việc né vùng chênh lệch giá cực hẹp nơi nhà kinh doanh chênh lệch giá luôn thắng; ước tính giá thực dựa trên lý thuyết thông tin; điều chỉnh động quy mô báo giá theo rủi ro kinh doanh chênh lệch giá; và chủ động vào cuộc khi sổ lệnh của đối thủ bị “ăn sạch” để giành các khoảng lợi nhuận cao.

Trong đó, bước đột phá quan trọng nhất đến từ một agent AI “hoàn toàn từ bỏ chiến lược sẵn có, bắt đầu từ số không”. Khi quá trình tối ưu bị kẹt quanh mức +25 edge, agent này độc lập phát hiện một mô hình sizing lấy “xác suất rủi ro kinh doanh chênh lệch giá” làm lõi, từ đó đưa hiệu suất chiến lược tăng vọt lên +44, trở thành điểm ngoặt của toàn bộ cuộc thi. Kết quả này cũng trực tiếp xác nhận phương pháp luận của Ryan: khi tìm kiếm rơi vào tối ưu cục bộ, việc khởi động lại còn hiệu quả hơn so với tinh chỉnh.

Lợi thế tuyệt đối của nghiên cứu AI: tự động hóa thử-sai

Trong phần tổng kết, Ryan cho biết điểm mấu chốt của cuộc thi không nằm ở việc thiết kế một “chiến lược thông minh”, mà là xây dựng một hệ thống có thể tìm kiếm, xác thực và loại bỏ ý tưởng ở quy mô lớn. Thay vì dựa vào trực giác của con người, hãy để AI thử-sai trong không gian lời giải khổng lồ, và khuếch đại hiệu suất thông qua song song hóa và tự động hóa.

Trường hợp này cũng củng cố thêm sự chuyển dịch vai trò của “Agentic AI” trong quy trình kỹ thuật và nghiên cứu: AI không còn chỉ là công cụ hỗ trợ, mà có thể trực tiếp đảm nhiệm đơn vị thực thi cốt lõi cho khám phá và ra quyết định. Trong một số bài toán có cấu trúc cao và có thể mô phỏng, con người thậm chí có thể hoàn toàn rời khỏi vị trí “người giải”, chuyển sang thiết kế chính chính khung tìm kiếm và cơ chế đánh giá.

Bài viết Claude Code tự động hóa nghiên cứu giành quán quân hackathon! Nhà vô địch: Tôi căn bản không biết mình đã thắng thế nào! Xuất hiện sớm nhất tại 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Predict.fun Ra mắt dự đoán đợt phát hành token của Polymarket; đặt cược 9% cho hạn chót ngày 30/06/2026

Theo Odaily, nền tảng thị trường dự đoán Predict.fun đã ra mắt một sự kiện dự đoán mới vào hôm nay về thời điểm Polymarket ra mắt token chính thức, với khối lượng giao dịch hiện tại đạt 546.800 USD. Nền tảng ước tính xác suất 9% rằng Polymarket ra mắt token vào trước ngày 30/6/2026, 39% vào

GateNews1giờ trước

Bitcoin tăng lên 81.300 USD, các nhà đầu tư nắm giữ dài hạn tích lũy 331.000 BTC khi dòng tiền vào Spot ETF bùng nổ, đạt 1,18 tỷ USD trong 3 ngày

Theo ChainCatcher, Bitcoin đã tăng lên 81.300 USD vào thứ Ba, với mức tăng hằng tuần và trong 30 ngày lần lượt đạt 5% và 21%. Dữ liệu của CryptoQuant cho thấy các nhà đầu tư nắm giữ dài hạn đã tích lũy ròng 331.000 BTC trong 30 ngày, trị giá xấp xỉ 26,7 tỷ USD theo giá hiện tại, tương đương 1,6% tổng cung.

GateNews1giờ trước

Giao dịch mua tài khoản tỷ lệ thắng 61% $43K HLE đặt cược chiến thắng trên Polymarket trước trận đấu hôm nay

Theo Odaily Seer, một địa chỉ ví có mức độ chính xác dự đoán 61% (0x7714c16f86bcfdba47bfcb161dc39a2a1ff2b814) đã mua 43.000 USD cổ phiếu chiến thắng HLE trên Polymarket, tại thị trường dự đoán cho vòng loại Esports World Cup của bộ môn Liên Minh Huyền Thoại

GateNews2giờ trước

SEC hoãn 24; các ETF cho thị trường dự đoán sắp ra mắt trong tuần này

Theo Reuters ngày 4/5, Ủy ban Chứng khoán và Giao dịch Mỹ (SEC) đã hoãn 24 quỹ ETF giao dịch trên sàn dự đoán thị trường dự kiến ra mắt trong tuần này. Tạm dừng này ảnh hưởng đến các ETF từ các nhà phát hành bao gồm Bitwise, Roundhill và GraniteShares, khi SEC rà soát cách các sản phẩm sẽ vận hành và phần đầu tư liên quan

GateNews4giờ trước

Polymarket Ghost Fills giảm từ mức đỉnh 30% xuống còn 0,17% sau khi các ví tiền gửi được ra mắt

Theo Josh Stevens, Phó Giám đốc Kỹ thuật của Polymarket, tỷ lệ khớp lệnh “ghost fills” đã giảm từ mức đỉnh 30% xuống còn 0,17% sau khi ra mắt tính năng Deposit Wallets, và chỉ số này được dự kiến sẽ tiếp tục tiến về 0 trong suốt

GateNews7giờ trước
Bình luận
0/400
Không có bình luận