CMU教授開源Agent框架Motus,多模型編排SWE-bench跑到79%且成本減半

robot
摘要生成中

ME News 消息,4 月 15 日(UTC+8),據 動察 Beating 監測,卡內基梅隆大學計算機科學系教授 Dimitrios Skarlatos(CEO)和 Zhihao Jia(CTO)創辦的 AI 基礎設施公司 Lithos AI 開源了 Agent 服務框架 Motus,Apache 2.0 許可證。團隊由 CMU 和斯坦福研究人員組成,成員有 AWS、谷歌、Meta 和英偉達的生產基礎設施經驗。 Motus 的核心思路:不同任務適合不同模型,與其始終用最貴的前沿模型跑所有步驟,不如讓系統從生產運行的軌跡中學習,自動把不同子任務路由到最合適的模型。當前 Agent 部署後是靜態的,提示框架、模型和上下文策略固定不變,Motus 則從每次運行中提取任務成功率、延遲和成本信號,持續優化。 據 Lithos AI 官網數據,在 SWE-bench Verified 上,Motus 多模型編排達到 79% 準確率,高於 Claude Opus 4.6 的 75.8% 和 GPT-5.3-Codex 的 72.6%,成本不到單用 Opus 的一半。在 Terminal-Bench 2.0 上,準確率從 Opus 的 64% 提至 80.1%,成本同樣約減半。框架還會根據具體工作負載調整上下文記憶策略,並自動檢測可並行執行的步驟來降低延遲。 Motus 不綁定模型提供商,支持 OpenAI Agents SDK、Anthropic SDK、Google ADK 及純 Python 構建的 Agent,提供 Claude Code、Codex 和 Cursor 插件,一條命令本地部署或推送至雲端。早期預覽階段免費提供算力。 (來源:BlockBeats)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆