OpenAI 追踪 Goblin 问题到书呆子型人格奖励信号,Goblin 提到其在 GPT-5.1 中飙升 175%

根据 OpenAI, 该公司确定了从 GPT-5.1 开始困扰 GPT 模型的“哥布林”问题的根本原因。用于强化“书呆子(Nerdy)”人格特质的奖励信号,鼓励生成包含奇幻生物引用的内容,而 76.2% 的训练数据集显示存在这种偏置。“书呆子(Nerdy)”人格仅占 ChatGPT 回答的 2.5%,但却贡献了 66.7% 的“哥布林(goblin)”提及,且从 GPT-5.2 到 GPT-5.4 的出现次数飙升了 3,881%。

OpenAI 于 3 月移除了“书呆子(Nerdy)”人格,消除了有偏置的奖励信号,并对训练数据进行了过滤。该公司还在 Codex 中为 GPT-5.5 的开发者提示加入了抑制指令。此次调查促成了新模型行为审计工具的开发。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenAI 发布 GPT-5.5-Cyber:对战 Anthropic Mythos

OpenAI 公告推出 GPT-5.5-Cyber,專为網安设计,將在「未来幾天內」以政府協作的可信存取机制部署給关鍵防禦單位,非开放销售。与 Anthropic Mythos 的开放路徑形成对照,白宮反对擴至70家。Preparedness Framework 評为 High(未到 critical),同时加強资安防護。后续觀察部署名單、CISA 可能入列与雙方资安標準分野。

鏈新聞abmedia17 分钟前

施耐德电气 Q1 营收达 98 亿欧元,因 AI 数据中心需求增长 11.2%

据路透社报道,Schneider Electric 于 4 月 30 日公布第一季度营收 98 亿欧元(114亿美元),得益于 AI 数据中心需求,有机增长提升至 11.2%。这家法国电力与制冷设备供应商表示,该结果略高于一致预期,并且

GateNews24 分钟前

Protum 为 AI 治理平台融资 200 万美元种子轮,目标在 2026 年 6 月完成交割

根据 TechCrunch 的 Startup Spotlight,AI 治理初创公司 Protum 正在进行一轮 200 万美元的种子轮融资,目标是在 2026 年 6 月前完成。由 Sandeep J. 创立,他拥有 25 年的企业转型经验。Protum 提供一个平台,旨在让企业实现持续

GateNews54 分钟前

企业裁员潮可能导致劳资双输局面,研究建议:应开征 AI 自动化税

研究指出 AI 裁員的需求外部性:裁員成本由企业獨享,但消费力道的損失卻由整體市场承擔,裁越多、需求越萎縮,雙方皆输。提出徵收 AI 自动化稅,將外部成本內部化,並以稅收资助再培訓,以恢復需求並穩定经濟。

鏈新聞abmedia58 分钟前

Claude 会收语言税?研究曝翻译中日韩内容消耗最多近三倍 Token

研究者 Komatsuzaki 在 X 指出主流 LLM 的 tokenizer 存在非英语语言税。以《The Bitter Lesson》翻译测试,Claude 在印地语、阿拉伯语、俄语、中文的 token 增幅分别约 3.24×、2.86×、2.04×、1.71×,明显高于 OpenAI。中国本土模型对中文更友善,显示训练数据偏英语造成成本不平等,成为普及障碍。

鏈新聞abmedia1小时前

微软 AI 业务收入翻倍至 $370B ARR;计划为 2026 年投入 $190B Capex

在 4 月 29 日,微软公布了其 2026 财年第三季度业绩,覆盖截至 3 月 31 日的期间,表现优于市场预期。Q3 营收达到 828.86 亿美元,同比增长 18%,高于预期的 814 亿美元;GAAP 净利润增长 23% 至 317.78 亿美元;非 GAAP 稀释后的每股收益 per diluted earnings per

GateNews1小时前
评论
0/400
暂无评论