Mistral AI 发布 Leanstral:首个 Lean 4 开源代码 Agent,可自动输出形式化证明

GateNews

Gate News 消息,3 月 17 日,Mistral AI 今日发布 Leanstral,这是首个专为形式化验证工具 Lean 4 设计的开源代码 Agent。该模型的核心创新在于,AI 生成代码的同时可输出可被 Lean 4 自动校验的形式化证明,从而绕开传统 AI 代码生成中人工审查的瓶颈环节。

Leanstral 采用稀疏 MoE 架构,拥有 120B 总参数和 6B 激活参数,以 Apache 2.0 协议开源,并针对 lean-lsp-mcp 进行了专项训练优化。用户可在 Mistral Vibe 中通过命令 /leanstall 零配置启动,或通过免费 API 端点 labs-leanstral-2603 调用,同时支持下载权重进行自部署。

Mistral 同步发布了新评估基准 FLTEval,以 Lean 4 社区的费马大定理形式化项目为测试场景。性能对比数据显示:Leanstral pass@2 以 36 美元成本得分 26.3,超过成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,领先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能达到 39.6 分。在开源模型中,Qwen3.5-397B-A17B 需运行 4 次才能达到 25.4 分,仍低于 Leanstral pass@2 的表现。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Drift Protocol 澄清早期赎回机制:按当前资金池比例折价的股份

根据 Drift Protocol 今天的官方公告,用户可以在赎回开启后随时赎回资产,但选择提前赎回的用户将基于当前资金池比例获得折扣后的份额。 随着资金池持续增长,推迟赎回的持有人可能会获得

GateNews3 分钟前

Ripple 金库突破 13 万亿美元,CEO 概述分阶段链上战略

Ripple 首席执行官 Brad Garlinghouse 在 2026 年 Consensus Miami 概述了区块链集成的分阶段方法,称公司将“先爬行,再行走,再奔跑”,以将机构金融资金流转移到链上基础设施上。根据 Garlinghouse 的发言,Ripple 金库已然处理

Crypto Frontier2小时前

Kelp DAO 在 $292M Exploit 之后放弃 LayerZero,转向 Chainlink CCIP

据 The Block 称,Kelp DAO 正在放弃 LayerZero,作为其跨链基础设施提供商,转而选择 Chainlink,成为首个在 2.92 亿美元之后从 LayerZero 转离的大型协议

GateNews2小时前

Gomining 在 Consensus Miami 上推出 GoBTC,瞄准比特币长期期待的支付层

Gomining 是全球顶级比特币矿工之一,用户数超过 500 万,已在 2026 年米阿迈共识(Consensus Miami 2026)上发布 GoBTC:这是一种开放式支付协议,可在 12 小时内实现即时授权与链上比特币结算,并收取 0.2% 的商户手续费。 要点: Gomining 在 Conse

Coinpedia2小时前

Prophet 今日推出 AI 驱动的预测市场,并开设 10,000 美元的实时交易分档

据 MetaversePost 报道,Prophet 于今日(5 月 6 日)推出了一个由 AI 驱动的预测市场,分配了 10,000 美元的 USDC 用于实时交易。用户可以直接与一个生成基于概率定价的 AI 对手方进行交易;每个市场中有些合约将在 24 小时内结算。

GateNews3小时前

WorldClaw 使用 WLFI 推出 WorldRouter,并以更低 30% 的成本提供 300+ 种 AI 模型

据 WorldClaw 称,该公司与 World Liberty Fi 联合推出 WorldRouter,使用户能够通过单一账户访问 300 多种 AI 模型,相较于直接供应商定价成本约降低 30%。WorldRouter 作为进入 WorldClaw 的 AgentOS 的首个入口,

GateNews3小时前
评论
0/400
暂无评论