2026-05-09 11:17:39
Google DeepMindのAI「Co-Mathematician」がFrontierMathティア4で47.9%を記録し、GPT-5.5 Proを上回り、これまで未解決だった3つの問題を解き明かした
Google DeepMindは、マルチエージェントの数学研究アシスタントであるAIコ・マサチック者をリリースし、FrontierMath Tier 4ベンチマークで47.9%の精度を達成して、5月9日のGPT-5.5 Proのこれまでの記録である39.6%を上回りました。システムは48問中23問を解けるようになり、これまでのあらゆるモデルが解けなかった3問も含まれています。Gemini 3.1 Proをベースにしたこのアーキテクチャは、階層型の設計で、プロジェクト・コーディネーターのエージェントが、文献検索、コーディング、推論を担当するサブエージェントへタスクを配分し、投稿前に複数のレビュアー・エージェントが証明を検証する仕組みになっています。 Epoch AIはブラインドテストを実施し、DeepMindのチームが問題を見られないようにしたうえで、各質問に対して計算時間として48時間を許可しました。実運用では、数学者のMarc Lackenbyがこのシステムを使ってKourovka Notebookの未解決予想を解決し、その実践的な研究価値を示しました。システムは現在、ベータテストと