微软为 Copilot Researcher 推出 Critique 与 Council 功能,DRACO 测试得分 57.4 领先行业

GateNews

Gate News 消息,3 月 31 日,微软周一宣布为 Copilot Researcher 推出两项新功能——Critique 与 Council,将 OpenAI 的 GPT 与 Anthropic 的 Claude 结合用于同一研究任务。Critique 采用串联协作模式:GPT 负责规划研究、检索资料并生成初稿,Claude 随后担任审阅者,核查事实准确性与引用质量;Council 则让两个模型并行独立生成报告,再由第三个裁判模型对比差异、归纳分歧。在涵盖医疗、法律、科技等 10 个领域共 100 项复杂研究任务的 DRACO 基准测试中,搭载 Critique 的 Copilot 得分 57.4 分,领先第二名近 14%,远超 Claude Opus 4.6 单独运行的 42.7 分。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言