Gate Newsの報道によると、3月17日、Mistral AIは本日、Leanstralをリリースしました。これは、形式的検証ツールのLean 4専用に設計された、最初のオープンソースコードエージェントです。このモデルの核心的な革新は、AIがコードを生成する際に、Lean 4による自動検証が可能な形式的証明も同時に出力できる点にあり、従来のAIによるコード生成における人間による審査のボトルネックを回避しています。
Leanstralは疎なMoE(Mixture of Experts)アーキテクチャを採用し、総パラメータは1200億、活性化パラメータは60億です。Apache 2.0ライセンスのもとオープンソース化されており、lean-lsp-mcp向けに特化した訓練と最適化も行われています。ユーザーはMistral Vibe内でコマンド /leanstall を使って設定不要で起動できるほか、無料APIエンドポイントlabs-leanstral-2603を通じて呼び出すことも可能です。また、重みをダウンロードして自己展開することもサポートしています。
Mistralは新たな評価基準FLTEvalも同時に公開し、Lean 4コミュニティのフェルマーの大定理の形式化プロジェクトをテストシナリオとしています。性能比較の結果、Leanstralのpass@2は36ドルのコストで26.3点を獲得し、コスト549ドルのClaude Sonnet 4.6(23.7点)を上回っています。pass@16は290ドルのコストで31.9点を獲得し、Sonnet 8を4点リードしています。一方、Claude Opus 4.6は1,650ドルのコストで39.6点に到達します。オープンソースモデルのQwen3.5-397B-A17Bは4回の実行で25.4点に達し、Leanstralのpass@2のパフォーマンスを下回っています。