Mistral AI 發佈 Leanstral:首個 Lean 4 開源代碼 Agent,可自動輸出形式化證明

GateNews

Gate News 消息,3 月 17 日,Mistral AI 今日發布 Leanstral,這是首個專為形式化驗證工具 Lean 4 設計的開源代碼 Agent。該模型的核心創新在於,AI 生成代碼的同時可輸出可被 Lean 4 自動校驗的形式化證明,從而繞開傳統 AI 代碼生成中人工審查的瓶頸環節。

Leanstral 採用稀疏 MoE 架構,擁有 120B 總參數和 6B 激活參數,以 Apache 2.0 協議開源,並針對 lean-lsp-mcp 進行了專項訓練優化。用戶可在 Mistral Vibe 中通過命令 /leanstall 零配置啟動,或通過免費 API 端點 labs-leanstral-2603 調用,同時支持下載權重進行自部署。

Mistral 同步發布了新評估基準 FLTEval,以 Lean 4 社區的費馬大定理形式化項目為測試場景。性能對比數據顯示:Leanstral pass@2 以 36 美元成本得分 26.3,超過成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,領先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能達到 39.6 分。在開源模型中,Qwen3.5-397B-A17B 需運行 4 次才能達到 25.4 分,仍低於 Leanstral pass@2 的表現。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Ripple 執行長駁斥 AI 裁員敘事,隨 Coinbase 裁員而來

Ripple 執行長推動「以 AI 促成成長」敘事 Ripple 執行長 Brad Garlinghouse 拒絕了「人工智慧主要是用來削減工作」的說法,並在 2026 年共識邁阿密(Consensus Miami 2026)期間接受 CoinDesk 採訪。「把 AI 描繪成恐怖怪物是極大的不公」Garlinghouse 表示,並將這項技術視為一個

Crypto Frontier1小時前

Kelp DAO 因 $292M Exploit 事件而改用 Chainlink CCIP,放棄 LayerZero

根據 The Block,Kelp DAO 正在放棄 LayerZero,改以 Chainlink 作為其跨鏈基礎設施提供者,成為第一個主要協議在 2.92 億美元($292 million)之後轉離 LayerZero。

GateNews1小時前

Gomining 於 Consensus Miami 推出 GoBTC,瞄準比特幣久違的支付層

Gomining 是全球前 10 大比特幣礦工之一,擁有 500 萬名用戶,已在 2026 年共識邁阿密(Consensus Miami 2026)揭露 GoBTC。這是一個開放式支付協議,能在 12 小時內提供即時授權與鏈上比特幣結算,並收取 0.2% 的商家手續費。 重點摘錄: Gomining 在 Conse

Coinpedia2小時前

Prophet 今日推出以 AI 驅動的預測市場,並啟用 10,000 美元的即時交易分批

根據 MetaversePost,Prophet 於今日(5 月 6 日)推出一個由 AI 驅動的預測市場,配置 10,000 美元的 USDC 用於進行現場交易。使用者可以直接與由 AI 作為對手方的交易進行交易,該對手方會為每個市場產生基於機率的定價;部分合約可在 24 小時內結算

GateNews2小時前

WorldClaw 推出搭載 WLFI 的 WorldRouter,提供 300+ 個 AI 模型,成本降低 30%

根據 WorldClaw,該公司與 World Liberty Fi 合作推出 WorldRouter,讓使用者能透過單一帳戶存取超過 300 個 AI 模型,成本大約比直接供應商定價低 30%。WorldRouter 作為進入 WorldClaw 的 AgentOS 之首個入口,

GateNews3小時前

穩定主網 v1.3.0 升級將於 5 月 13 日在區塊高度 24,077,500 啟動

根據 Foresight News,Stable 的主網 v1.3.0 升級將於 5 月 13 日 15:00 UTC 在區塊高度 24,077,500 啟動。此次升級透過強化對已預先編譯執行(precompiled execution)的保護、修復 EVM 執行不一致性,以及提升網路共識來增強執行安全性,並改進

GateNews4小時前
留言
0/400
暫無留言