Mistral AI 發佈 Leanstral:首個 Lean 4 開源代碼 Agent,可自動輸出形式化證明

Gate News 消息,3 月 17 日,Mistral AI 今日發布 Leanstral,這是首個專為形式化驗證工具 Lean 4 設計的開源代碼 Agent。該模型的核心創新在於,AI 生成代碼的同時可輸出可被 Lean 4 自動校驗的形式化證明,從而繞開傳統 AI 代碼生成中人工審查的瓶頸環節。

Leanstral 採用稀疏 MoE 架構,擁有 120B 總參數和 6B 激活參數,以 Apache 2.0 協議開源,並針對 lean-lsp-mcp 進行了專項訓練優化。用戶可在 Mistral Vibe 中通過命令 /leanstall 零配置啟動,或通過免費 API 端點 labs-leanstral-2603 調用,同時支持下載權重進行自部署。

Mistral 同步發布了新評估基準 FLTEval,以 Lean 4 社區的費馬大定理形式化項目為測試場景。性能對比數據顯示:Leanstral pass@2 以 36 美元成本得分 26.3,超過成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,領先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能達到 39.6 分。在開源模型中,Qwen3.5-397B-A17B 需運行 4 次才能達到 25.4 分,仍低於 Leanstral pass@2 的表現。

查看原文
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言