✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
刚刚和某个人聊过,他声称在 Polymarket 上发现了一个简单套利。是的:YES 价格是 $0.62,NO 价格是 $0.33,总和为 $0.95……轻松赚 $0.05 利润,对吧?不对。等他们把这些订单下进去时,实际的套利机会已经消失了。原因如下。
当散户交易者还在做基础数学计算时,量化系统同时在扫描 17,218 个市场条件,覆盖 2^63 种可能的结果组合。他们用整数规划而不是蛮力枚举,在毫秒级发现定价矛盾。他们会结合订单簿深度计算最优持仓规模。他们把所有步骤并行执行。然后他们转向下一个机会。差距不在速度,而在数学基础设施。
我花时间去理解这些事情究竟是怎么运作的,而且它比大多数人想象的复杂得多。让我把真正的机制拆开讲。
首先,显而易见的套利陷阱。你会看到两个市场存在逻辑依赖关系。市场 A:Trump 赢得宾夕法尼亚州,YES 为 $0.48。市场 B:宾夕法尼亚州的共和党以 5+ 分赢得胜利,YES 为 $0.32。两者相加为 $1.00,所以看起来很“干净”。但关键在于——如果共和党以 5+ 分赢,那就是 Trump 赢的一个子集。子集的价格不能超过超集的价格。当市场违反这个关系时,就存在套利。只是手动找出这些关系几乎不可能。仅仅 305 个美国选举市场,就有 46,360 种可能的依赖组合。研究团队使用 DeepSeek AI 做初步筛查,然后进行了三层验证。结果:40,057 对是独立的,1,576 对是依赖的,374 对满足严格条件,只有 13 对真正可被利用。
第二个,没人会去讨论的数学问题。当你发现了错误定价,你该如何计算最优交易?直观答案——把到“公平价格”的欧几里得距离最小化——是错的。它把从 $0.50 到 $0.60 的移动,和把从 $0.05 到 $0.15 的移动看成同样的 $0.05。但它们完全不同。第二种对应的是隐含概率的巨大变化。就像你从称量 70kg 的体重增加 10kg 和从 30kg 增加 10kg,意义完全不同。变化一样,含义却完全不同。
Polymarket 使用 LMSR (Logarithmic Market Scoring Rule) 定价,这意味着价格代表概率分布。在这里,正确的距离度量是 KL divergence——它衡量的是两个概率分布之间的信息论距离。不同于简单的欧几里得距离,KL divergence 会自动对靠近极端价格的移动给予更高权重。从 $0.05 到 $0.15 的变化,用 KL divergence 看起来会远得多。这与现实一致——极端价格的变动意味着更大的信息冲击。
这里的洞察是:你能提取的最大利润,等于当前市场状态到无套利边界之间的 KL divergence 距离。这个距离告诉你该买什么、卖什么,以及你最多能赚多少钱。
第三,真正去计算它。问题在于:如果市场规模很大,直接计算 KL divergence 的投影在计算上根本不可行。无套利空间有指数级数量的顶点。你不可能全部检查。于是引入 Frank-Wolfe 算法。它不是一次性把所有东西都解出来,而是迭代进行。先从一小组有效结果开始优化。在该集合上进行优化。用整数规划找出一个新的有效结果,把它加入集合。重复,直到收敛。在 100 次迭代后,你只跟踪了 100 个顶点,而不是 2^63 种组合。
研究团队使用 Gurobi 求解器作为他们的整数规划引擎。早期迭代 (few games resolved):用时少于 1 秒。中期 (30-40 games):10-30 秒。后期 (50+ games):少于 5 秒。为什么后期更快?因为随着结果逐渐明朗,可行解空间会收缩。变量更少、约束更紧,因此求解更快。
不过还有一个技术难点。LMSR 的价格会逼近极端值 (near $0 或 $1),并且梯度会爆炸。解决方案是 Barrier Frank-Wolfe。它不是在完整边界上优化,而是在一个略微收缩后的版本上优化。收缩参数会自适应减小——最开始更远离边界 (stable),后来逐步逼近真正的边界 (accurate)。实际情况下,50-150 次迭代就能实现收敛。
第四,执行会摧毁大多数策略。你算出了最优交易。接下来呢?Polymarket 使用 CLOB (Central Limit Order Book),这意味着订单是按顺序逐个执行的,而不是原子式同时成交。你的套利计划:以 $0.30 买 YES,以 $0.30 买 NO,总成本 $0.60,不管结果如何都能收回 $1.00,利润 $0.40。现实情况:YES 的订单在 $0.30 执行。你的订单推动了市场。于是 NO 的订单现在在 $0.78 执行。总成本 $1.08,收回 $1.00,最终结果:亏损 $0.08。你暴露在风险里。
这就是为什么研究只考虑超过 $0.05 的价差。更小的价差会被执行风险吞掉。真正的交易者会计算 VWAP (volume-weighted average price),即每个区块内所有交易的成交量加权平均价。如果总和偏离 $1.00 超过 $0.02,就会被记录为机会。VWAP 会考虑实际的订单簿深度。假如你想要 10,000 个代币,但在 $0.30 只有 2,000 个,在 $0.32 有 3,000 个,在 $0.35 有 5,000 个,那么你的 VWAP 是 $0.326,而不是 $0.30。
完整系统由五个层次组成。来自 Polymarket API 的实时 WebSocket 数据。从 Alchemy 节点查询合约事件的历史数据。利用 LLM 筛查并加三层验证来检测依赖关系。三层优化:简单线性约束 (milliseconds)、整数规划结合 Frank-Wolfe 加上 Gurobi (core engine)、以及针对当前订单簿的执行验证。仓位规模使用经过修改的 Kelly 公式,并根据订单簿深度来调整执行风险概率,且最多只占可用深度的 50%。
2024 年 4 月至 2025 年 4 月的结果如下:单条件套利提取 $10.58M,市场再平衡提取 $29.01M,跨市场组合套利提取 $95K。合计 $39.69M。前 10 名套利者捕获了 $8.13M (20.5%)。顶级套利者通过 4,049 笔交易赚取了 $2.01M,平均 $496 per trade.
当交易者还在阅读有关预测技术的文章时,量化系统会用整数规划检查依赖关系,用 KL divergence 投影计算最优交易,用 Frank-Wolfe 算法运行并估算滑点,用 VWAP 来执行,进行并行处理,并系统性地提取 $40M in guaranteed profits.
差别不在于运气或时机。而在于数学基础设施。论文是公开的,算法是已知的,利润是真实的。问题是:散户交易者能否在下一次 $40M opportunity closes 之前,构建起这套基础设施。