Gate News 消息,3 月 17 日,Mistral AI 今日发布 Leanstral,这是首个专为形式化验证工具 Lean 4 设计的开源代码 Agent。该模型的核心创新在于,AI 生成代码的同时可输出可被 Lean 4 自动校验的形式化证明,从而绕开传统 AI 代码生成中人工审查的瓶颈环节。
Leanstral 采用稀疏 MoE 架构,拥有 120B 总参数和 6B 激活参数,以 Apache 2.0 协议开源,并针对 lean-lsp-mcp 进行了专项训练优化。用户可在 Mistral Vibe 中通过命令 /leanstall 零配置启动,或通过免费 API 端点 labs-leanstral-2603 调用,同时支持下载权重进行自部署。
Mistral 同步发布了新评估基准 FLTEval,以 Lean 4 社区的费马大定理形式化项目为测试场景。性能对比数据显示:Leanstral pass@2 以 36 美元成本得分 26.3,超过成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,领先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能达到 39.6 分。在开源模型中,Qwen3.5-397B-A17B 需运行 4 次才能达到 25.4 分,仍低于 Leanstral pass@2 的表现。