Lợi nhuận 1 USD chỉ 43%, tại sao 87% người chơi Polymarket lại đang thua lỗ?

null

Tiêu đề gốc: Game Theory on Polymarket: The 5 Formulas tested on 72 million trades,作者:Movez(@0xMovez)

Biên tập|Odaily 星球日报(@OdailyChina);Người dịch|Asher(@Asher_ 0210)

Trên Đại lộ Las Vegas, tỷ suất sinh lời trung bình của máy kéo ước chừng 93%, tức là bỏ ra 1 USD thì trung bình chỉ thu về 0.93 USD; còn trên Polymarket, người giao dịch lại tự nguyện chấp nhận mức hoàn vốn thấp tới 0.43 USD, dùng 1 USD để đặt cược vào những kết quả “đầu lạnh” có mức cược thậm chí còn tệ hơn cả sòng bạc.

Đây không phải là ẩn dụ, mà dựa trên dữ liệu thực tế. Nghiên cứu viên Jonathan Becker đã phân tích toàn bộ các thị trường đã được giải quyết trên Kalshi, bao phủ 72.10 triệu giao dịch, tổng khối lượng giao dịch 18.26 tỷ USD. Những quy luật mà ông phát hiện ra đều cũng đúng với Polymarket—cùng cơ chế, cùng thiên lệch, và vì thế là cùng cơ hội. Kết luận mà dữ liệu đưa ra rất thẳng thắn: khoảng 87% ví của các thị trường dự đoán cuối cùng đều bị lỗ, nhưng 13% còn lại không thắng nhờ may mắn, mà nhờ nắm được một bộ phương pháp toán học mà đa số nhà giao dịch thậm chí chưa từng tìm hiểu.

Bài viết này sẽ phân tích 5 công thức trong thuyết trò chơi dùng để phân biệt người thắng và kẻ thua; mỗi công thức đều đi kèm nguyên lý toán học tương ứng, ví dụ thực tế, và mã Python chạy trực tiếp được; một số nhà giao dịch đã sử dụng các phương pháp này trong thực chiến, bao gồm:

RN(Địa chỉ Polymarket: Một robot giao dịch thuật toán Polymarket, dựa trên mô hình trong bài đã thực hiện lợi nhuận tổng cộng hơn 6 triệu USD trong thị trường thể thao.

distinct-baguette(Địa chỉ Polymarket: Thị trường UP/DOWN, đã cuộn 560 USD thành 812,000 USD.

I. Giá trị kỳ vọng: công thức cốt lõi nhất

Trên Polymarket, mỗi giao dịch về bản chất là một lần phán đoán giá trị kỳ vọng. Phần lớn người giao dịch dựa vào trực giác, còn 13% người chiến thắng thì dùng toán học để ra quyết định. Giá trị kỳ vọng (EV) không đo kết quả của một lần, mà đo mức hoàn vốn trung bình sau lặp đi lặp lại nhiều lần, dùng để xác định liệu một giao dịch có đáng tham gia hay không.

Lấy một thị trường thực tế làm ví dụ: “Bitcoin có đạt 150,000 USD trước tháng 6 năm 2026 không?” Giá YES hiện tại là 12¢, tương ứng với xác suất ngụ ý của thị trường là 12%. Nếu dựa trên dữ liệu on-chain, chu kỳ halving và dòng tiền ETF, ước tính xác suất thực là khoảng 20%, thì giao dịch này có giá trị kỳ vọng dương. Theo cách tính này, với 12¢ mua vào mỗi hợp đồng, trung bình dài hạn có thể thu được lợi nhuận 8¢; mua 100 hợp đồng, tương ứng chi phí 12 USD, lợi nhuận kỳ vọng là 8 USD, tỷ suất hoàn vốn xấp xỉ +66.7%.

Nhưng dữ liệu cho thấy đa số người giao dịch trên thị trường dự đoán không thực hiện các phép tính như vậy. Trong mẫu bao phủ 72 triệu giao dịch, taker (người mua theo giá thị trường) trung bình thua lỗ khoảng 1.12% mỗi giao dịch, còn maker (người đặt lệnh) trung bình có lãi khoảng 1.12% mỗi giao dịch. Khoảng cách giữa hai bên không nằm ở thông tin, mà nằm ở sự kiên nhẫn—maker chờ cơ hội có giá trị kỳ vọng dương, còn taker dễ bốc đồng trong giao dịch.

II. Định giá sai: cái bẫy hợp đồng giá rẻ

“Thiên lệch đối với hàng hiếm” là một trong những sai lầm đắt đỏ nhất trong thị trường dự đoán; người giao dịch thường có xu hướng hệ thống tính quá cao các sự kiện xác suất thấp, và sẵn sàng trả giá quá cao cho những hợp đồng trông có vẻ rẻ. Một hợp đồng được định giá 5¢ về mặt lý thuyết phải có 5% tỷ lệ thắng, nhưng trên Kalshi tỷ lệ thắng thực tế chỉ là 4.18%, tương ứng sai lệch định giá -16.36%; trong trường hợp cực đoan hơn, một hợp đồng 1¢ lẽ ra có 1% tỷ lệ thắng, nhưng với taker thì tỷ lệ thắng thực tế chỉ là 0.43%, mức lệch lên tới -57%.

Nhìn từ phân phối tổng thể, định giá ở vùng giữa (30¢–70¢) tương đối chính xác, nhưng ở cả hai đầu lại xuất hiện sai lệch rõ rệt: các hợp đồng dưới 20¢ có tỷ lệ thắng thực tế nhìn chung thấp hơn xác suất ngụ ý trong định giá; còn các hợp đồng trên 80¢ thì tỷ lệ thắng thường cao hơn xác suất mà giá thể hiện.

Nói cách khác, sự kém hiệu quả của thị trường chủ yếu tập trung ở hai đầu, và chính những vùng này lại là nơi giao dịch cảm xúc diễn ra nhiều nhất. Cụ thể, có hai công thức:

Công thức 1: Định giá sai (Mispricing, δ)

Định giá sai dùng để đo mức độ chênh lệch giữa tỷ lệ thắng thực tế của hợp đồng và xác suất ngụ ý của nó. Lấy ví dụ hợp đồng 5¢: trong tất cả các thị trường đã được giải quyết, giả sử có tổng cộng 100,000 giao dịch được khớp ở mức 5¢, trong đó 4,180 giao dịch cuối cùng có kết quả YES; khi đó tỷ lệ thắng thực tế là 4.18%, còn xác suất ngụ ý tương ứng với giá là 5.00%. Chênh lệch giữa hai giá trị là -0.82 điểm phần trăm, tương ứng sai lệch tương đối khoảng -16.36%. Điều này có nghĩa là, khi mua mỗi hợp đồng 5¢, thực tế bạn đang trả khoảng 16.36% phần phí bảo hiểm.

Công thức 2: Lợi nhuận vượt trội theo từng giao dịch (Gross Excess Return, rᵢ)

Nếu định giá sai phản ánh sai lệch tổng thể, thì lợi nhuận vượt trội theo từng giao dịch lại vạch ra cấu trúc hoàn vốn thực tế của từng lệnh—và chính ở đây, thiên lệch hành vi trở nên nhìn thấy rõ ràng. Khi mua một hợp đồng 5¢ sẽ có hai kết quả: nếu hợp đồng trúng, lợi nhuận có thể đạt +1900% (khoảng 20 lần lợi nhuận); nếu không trúng, thì thua 100%—toàn bộ 5¢ bạn bỏ ra sẽ về 0.

Đây chính là lý do vì sao “thiên lệch đối với hàng hiếm” lại hấp dẫn: một khi trúng, lợi nhuận cực cao nên dễ được ghi nhớ, thổi phồng và lan truyền. Nhưng nhìn tổng thể, tỷ lệ trúng thực tế lại thấp hơn xác suất ngụ ý bởi giá; và cấu trúc bất đối xứng giữa “thua hết” và “lãi cực cao”, khi được đặt vào nhiều giao dịch, sẽ tạo ra giá trị kỳ vọng âm—về bản chất, tương đương với việc mua một tấm vé số bị định giá cao.

Nhìn từ phân phối tổng thể, sai lệch này có “độ dốc theo giá” rõ rệt: giá càng thấp thì hoàn vốn càng tệ. Ví dụ, với tư cách taker: ở hợp đồng 1¢, mỗi khi bỏ ra 1 USD bạn chỉ có thể thu về khoảng 0.43 USD; còn ở hợp đồng 90¢, mỗi khi bỏ ra 1 USD bạn có thể nhận được khoảng 1.02 USD. Giá càng rẻ thì điều kiện giao dịch thực tế lại càng bất lợi.

Phân rã vai trò sâu hơn có thể thấy rằng cấu trúc này gần như là một mối quan hệ đối xứng qua gương: taker ở vùng giá thấp chịu lỗ (thấp nhất có thể tới -57%), tương ứng đúng với lợi nhuận của maker trong cùng vùng đó; còn sai lệch định giá của toàn thị trường nằm giữa hai bên. Nói cách khác, mỗi khi taker lỗ đi một xu (một phần tiền) thì gần như toàn bộ số đó đều được maker thu được.

Xét từ góc độ thuyết trò chơi: các hợp đồng xác suất thấp thường bị đánh giá quá cao một cách có hệ thống, còn các hợp đồng xác suất cao thì thường bị đánh giá thấp. Chiến lược đúng đắn không phải là đuổi theo hàng hiếm, mà là bán hàng hiếm và mua các cược có độ chắc chắn cao.

III. Công thức Kelly: nên đặt cược bao nhiêu

Khi phát hiện một giao dịch có giá trị kỳ vọng dương, câu hỏi thật sự lúc này mới chỉ bắt đầu: nên đặt cược bao nhiêu? Đặt quá lớn thì chỉ một lần thua có thể xóa sạch lợi nhuận của nhiều tuần; đặt quá nhỏ thì dù có lợi thế, tốc độ tăng trưởng lại chậm đến mức gần như vô nghĩa. Giữa “đặt tất cả” và “không đặt gì”, tồn tại một tỷ lệ đặt cược tối ưu về mặt toán học—đó chính là công thức Kelly.

Công thức Kelly được John Kelly Jr. đề xuất vào năm 1956, ban đầu dùng để tối ưu hóa bài toán tín hiệu liên lạc trong điều kiện nhiễu; sau đó được chứng minh là một trong những phương pháp quản lý vị thế hiệu quả nhất trong cờ bạc, giao dịch và thậm chí cả thị trường dự đoán. Các tay chơi poker chuyên nghiệp, những bậc thầy cá cược thể thao, và các quỹ định lượng ở Phố Wall hầu như đều đang sử dụng một dạng chiến lược Kelly nào đó.

Trong thị trường dự đoán, do hợp đồng có cấu trúc nhị phân (kết quả là $1 hoặc $0) và bản thân giá cũng biểu thị xác suất, việc áp dụng công thức Kelly càng trở nên trực tiếp. Điểm mấu chốt nằm ở việc hiểu hệ số cược (b): nếu mua hợp đồng YES ở mức 30¢, thực chất bạn dùng 0.30 USD để cược lấy khoản lợi 0.70 USD, tương ứng hệ số cược là 0.70 / 0.30 ≈ 2.33; giá 50¢ thì hệ số cược là 1; giá 10¢ thì là 9; giá 80¢ thì chỉ còn 0.25. Hệ số cược càng cao, thì trong điều kiện tồn tại lợi thế, tỷ lệ đặt cược mà Kelly đề xuất cũng càng lớn.

Nhưng một nguyên tắc then chốt là không sử dụng Kelly đầy đủ. Dù về mặt toán học, Kelly đầy đủ có thể tối đa hóa tốc độ tăng trưởng vốn dài hạn, nhưng trong thực thi thực tế, biến động cực lớn, mức sụt giảm có thể vượt quá 50% tùy lúc. Trong chu kỳ dài, có thể cho lợi nhuận cao nhất, nhưng dao động dữ dội ở giữa thường khiến phần lớn người không thể kiên trì. Vì vậy, cách phổ biến hơn là dùng Kelly theo phân số (ví dụ 1/2 hoặc 1/4 Kelly). Chẳng hạn, trong điều kiện tỷ lệ thắng ổn định: Kelly đầy đủ có đường cong vốn cuối cùng cao nhất nhưng biến động mạnh; Kelly 1/4 làm tăng trưởng mượt hơn và mức rút lui kiểm soát được; còn Kelly 1/2 nằm giữa hai lựa chọn đó.

Về bản chất, công thức Kelly cung cấp một bộ kỷ luật: trước tiên đánh giá xem có lợi thế hay không (tức là xác suất chủ quan cao hơn xác suất ngụ ý của thị trường), rồi trên cơ sở đó quyết định nên đưa vào bao nhiêu vốn. Chỉ khi cả “có đặt cược hay không” và “đặt bao nhiêu” đều bị ràng buộc bởi toán học, giao dịch mới thực sự chuyển từ trò chơi sang chiến lược.

IV. Cập nhật Bayes: thay đổi suy nghĩ như một chuyên gia

Thị trường dự đoán dao động vì cốt lõi là thông tin mới liên tục đi vào. Điều then chốt không nằm ở việc ban đầu nhận định đúng hay sai, mà nằm ở việc khi bằng chứng thay đổi thì nên điều chỉnh nhận thức như thế nào. Đa số người giao dịch hoặc bỏ qua thông tin mới, hoặc phản ứng quá mức; còn cập nhật Bayes cung cấp một phương pháp toán học để trả lời “cần điều chỉnh bao nhiêu là hợp lý”.

Logic cốt lõi có thể hiểu đơn giản: nhận định mới = mức độ bằng chứng ủng hộ giả thuyết ban đầu × nhận định ban đầu ÷ xác suất tổng thể mà bằng chứng đó xuất hiện. Trong ứng dụng thực tế, thường sẽ dùng công thức xác suất toàn phần để khai triển, từ đó thu được dạng dễ tính hơn.

Lấy một ví dụ thị trường điển hình: “Cục Dự trữ Liên bang (Fed) có cắt giảm lãi suất trong cuộc họp tháng 6 không?” Giá thị trường hiện tại là 35¢, tương ứng xác suất 35% như một phán đoán ban đầu. Sau đó dữ liệu việc làm phi nông nghiệp được công bố: việc làm mới chỉ 120,000 (kỳ vọng 200,000), tỷ lệ thất nghiệp tăng và tốc độ tăng trưởng lương chậm lại. Trong trường hợp này, nếu Fed thực sự sẽ cắt giảm lãi suất, thì xác suất để xuất hiện dữ liệu việc làm yếu sẽ cao, có thể ước là 70%; nếu không cắt giảm lãi suất, thì xác suất xuất hiện kiểu dữ liệu này sẽ thấp hơn, nhưng vẫn có thể, có thể ước là 25%.

Sau khi thế vào cập nhật Bayes, xác suất mới xấp xỉ 60.1%, tức là từ 35% được hiệu chỉnh ngay lên 60.1%, tăng khoảng 25 điểm phần trăm. Điều này có nghĩa là chỉ một thông tin then chốt cũng đủ để thay đổi đáng kể cách thị trường đánh giá.

Trong vận hành thực tế, không cần mỗi lần phải tính đầy đủ công thức. Cách phổ biến hơn là “tỷ lệ hợp lý (likelihood ratio)”. Cùng một thông tin (ví dụ LR = 3), tác động không như nhau dưới các phán đoán ban đầu khác nhau: bắt đầu từ 10% có thể tăng lên khoảng 25%; bắt đầu từ 50% có thể tăng lên 75%; còn bắt đầu từ 90% thì chỉ tăng lên khoảng 96%. Mức độ bất định càng cao thì tác động của thông tin càng lớn.

Những người giao dịch vượt trội trong dài hạn trên thị trường dự đoán không nhất định là người “đúng nhất” trong phán đoán, mà là người biết cách điều chỉnh phán đoán nhanh nhất và hợp lý nhất khi có bằng chứng mới xuất hiện. Phương pháp Bayes về bản chất cung cấp thước đo cho “tốc độ điều chỉnh” đó.

V. Cân bằng Nash: “công thức poker” trong thị trường dự đoán

Trong poker, bluff (gài) không bao giờ là hành vi bốc đồng dựa trên cảm tính, mà là một chiến lược có thể tính toán chính xác. Về mặt lý thuyết, tồn tại một tần suất bluff tối ưu; nếu lệch khỏi đó, đối thủ thành thạo sẽ tận dụng được. Logic tương tự cũng áp dụng cho thị trường dự đoán. Trên Polymarket, “bluff” tương ứng với giao dịch ngược xu hướng—khi định giá của thị trường xuất hiện sai lệch, chọn đứng về phía đối lập với đa số; còn “fold” (bỏ bài) thì giống như một taker thụ động, liên tục trả phí bảo hiểm (premium) cho tâm trạng của thị trường.

Trên Polymarket, maker và taker tạo thành một quan hệ đối đầu tương tự. Giao dịch ngược xu hướng (chống lại sự đồng thuận của thị trường) giống như “bluff”, còn giao dịch thuận xu hướng (đi theo phán đoán chủ đạo) giống như “cược theo giá trị”. Xét theo góc nhìn cân bằng, thị trường nên giữ cho người tham gia ở rìa (marginal participant) ở trạng thái không khác biệt giữa việc “làm maker” và “làm taker”; trạng thái này chính là cân bằng Nash trong thị trường dự đoán.

Nhưng cân bằng này không cố định; nó sẽ điều chỉnh động theo sự thay đổi của cấu trúc người tham gia. Dữ liệu cho thấy các loại thị trường khác nhau tương ứng với các chiến lược tối ưu khác nhau: ở những lĩnh vực lý tính hơn và định giá hiệu quả hơn (ví dụ thị trường tài chính), không gian giao dịch ngược xu hướng nhỏ hơn; còn ở những lĩnh vực cảm xúc mạnh hơn và phi lý hơn (ví dụ giải trí, thể thao), thị trường dễ xuất hiện sai lệch định giá hơn, từ đó tạo cơ hội cho giao dịch ngược xu hướng.

Quan trọng hơn, cân bằng này cũng thay đổi đáng kể theo chiều thời gian. Ở giai đoạn đầu (2021–2023), taker lại là nhóm kiếm lời, chiến lược tối ưu nghiêng về phía giao dịch chủ động; nhưng sau khi khối lượng giao dịch bùng nổ vào quý 4 năm 2024, nhiều nhà tạo lập thị trường chuyên nghiệp gia nhập với quy mô lớn, khiến cấu trúc thị trường thay đổi, và chiến lược cân bằng chuyển sang maker là chủ (khoảng 65%–70%). Đây là một kết quả điển hình của thuyết trò chơi: khi cấu trúc người tham gia thay đổi, chiến lược tối ưu cũng sẽ tiến hóa theo. Những chiến lược từng hiệu quả trong “môi trường người mới” có thể nhanh chóng mất tác dụng trước “đối thủ chuyên nghiệp”, và do đó cách “đánh” của thị trường cũng được lặp cải tiến liên tục.

Tóm tắt

87% ví của các thị trường dự đoán cuối cùng bị thua lỗ; đây không phải vì thị trường bị thao túng, mà vì những người giao dịch đó chưa bao giờ thực sự tiến hành tính toán. Họ mua các hợp đồng “đầu lạnh” với mức giá tệ hơn cả máy kéo, quyết định quy mô vị thế theo cảm hứng, bỏ qua những thay đổi của thông tin mới, và trong mỗi lần giao dịch theo giá thị trường, họ phải trả giá cho “tâm lý lạc quan”.

Còn 13% người tham gia duy trì được lợi nhuận không phải vì may mắn hơn, mà vì họ coi cả 5 công thức như một bộ phương pháp hoàn chỉnh—từ đánh giá đến thực thi hình thành một quy trình đầy đủ, và mỗi bước đều dựa trên dữ liệu 72.10 triệu giao dịch thực tế.

Cửa sổ cơ hội này sẽ không tồn tại mãi. Khi các nhà tạo lập thị trường chuyên nghiệp tham gia, chênh lệch giá (spread) đang bị nén lại rất nhanh; vào năm 2022, taker vẫn còn khoảng +2.0% lợi thế, nhưng hiện nay đã chuyển sang -1.12%.

Vấn đề chỉ còn là: có cùng thị trường tiến hóa theo, hay tiếp tục dùng mức hoàn vốn 0.43 USD để mua một tấm vé số 1 USD.

BTC2,04%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim