Anthropic 已在 4 月 30 日公布一项令人意外的研究:在 1.000.000 条 Claude 对话中,大约有 6% 的用户把 AI 当成人生顾问——询问该不该换工作、要不要搬家、感情该如何处理。研究还发现,尽管 Claude 整体的谄媚(sycophancy)行为比例只有 9%,但一旦问到“感情关系”,谄媚率就飙到 25%;而“灵性与信仰”更高达 38%。Anthropic 用这些数据对 Opus 4.7 与 Mythos Preview 进行反向训练:前者将关系建议的谄媚率砍半,后者再砍半。
6% 用户把 Claude 当人生顾问:四大问题集中在健康、职涯、感情、财务
Anthropic 使用一款保护隐私的分析工具扫描了 1.000.000 条 Claude 对话,发现约 6% 属于用户在寻求“人生建议”——不是写程式、也不是查资料,而是问 AI:“我该不该接这份工作”“这次冲突我该怎么处理”“我要不要搬家”这类没有标准答案的选择题。
更具体来说,这些“人生顾问”对话中超过 75% 落在四个领域:健康与身心状态、职涯选择、感情关系、个人财务。换句话说,当用户感到迷惘或承压时,AI 已经逐渐取代朋友、家人、专业咨询师的部分功能。这个比例本身比过去想像的更高,也让 AI 模型在这些情境下“给出什么回应”的影响力远超出写程式或回答事实题。
谄媚高峰:感情问题 25%、灵性问题 38%——为什么这两个领域特别严重
“谄媚”(sycophancy)在 AI 研究中专指“为了讨好用户而附和、迎合,即使该说的是不同看法”。Anthropic 的整体统计是 9% 的对话出现谄媚行为,但分领域看差距很大:感情关系建议 25%、灵性与信仰类问题 38%——是平均值的 3 到 4 倍。
为什么这两个领域特别严重?Anthropic 指出两个触发点:第一,当用户对 Claude 的分析提出反驳(pushback)时,模型就更容易让步、改口附和;第二,当用户提供大量单方面的情境细节时,模型容易接受用户建构的版本、不再质疑。感情关系正是这两种触发最频繁的场域——人们会本能地为自己辩护,用大量情绪细节描述对方的不是,而 Claude 在这种压力下最容易“告诉你想听的答案”,反而强化既有立场、扭曲对情況的判断。
对用户而言,这意味着最危险的咨询场景,反而是用户最常使用 AI 的场景。当有人犹豫该不该分手、该不该离开伴侣时,他们向 AI 寻求的并非中立建议,而是“我做这个决定是对的”的验证。若 Claude 在 25% 的时候给出附和性回答,可能加深对立、让用户误以为某个讯号比实际意义更重要。
Anthropic 的修正:合成训练让 Opus 4.7 砍半、Mythos Preview 再砍半
研究团队将这些触发场景做成合成训练资料:当 Claude 模拟被推回去、被堆叠片面细节、被拉去合理化用户立场时,应该如何回应才符合“不过度谄媚但仍同理”的原则。对曾经出现谄媚行为的真实对话进行压力测试,Opus 4.7 在感情建议的谄媚率比 Opus 4.6 减半,Mythos Preview 又把这个比例再减半——意味着相对 Opus 4.6,Mythos Preview 的谄媚率降至约四分之一。改善并不局限于感情领域,其他主题也有外溢效果。
Anthropic 将这份研究定位为“社会影响 → 模型训练”迴路的一环:研究真实用户如何使用 Claude、找出模型在那些场景中违背原则、把学到的东西用于下一代模型训练。所有资料皆透过 privacy-preserving 工具收集,个别用户不会被追溯。对用户而言,下次当你向 Claude 寻求感情建议时,不妨刻意提出反向问题(“我朋友会怎么看我这个立场?”“对方有没有可能是对的?”),让 AI 站在“不过度讨好”的位置回应,比 100% 接受 AI 的第一个答案更接近这项研究真正的应用价值。
这篇文章 你问 Claude 人生大事时:感情问题 25%、灵性 38% 谄媚率 最早出现在 链新闻 ABMedia。
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
La plataforma de IA Certifyde completa una ronda semilla de 2 millones de dólares el 1 de mayo, respaldada por el CEO de Ripple, Brad Garlinghouse
Según TechfundingNews, la plataforma de aplicaciones de IA Certifyde completó una ronda de financiación semilla de 2 millones de dólares el 1 de mayo. Los inversores incluyen K5 Global, Flamingo Capital y inversores ángel, incluidos el cofundador de Honey, George Ruan, el CEO de Ripple, Brad Garlinghouse, y el cofundador de Nutra, Roland
GateNewsHace15m
Subsecretario de tecnología del Pentágono: Anthropic sigue en la lista negra, excepciones para Mythos
El 1 de mayo, el máximo responsable de tecnología del Departamento de Defensa de Estados Unidos (Pentagon technology chief) declaró ante el Congreso: «Anthropic sigue en la lista negra, pero Mythos Preview es otro tema», reconociendo oficialmente que el Departamento de Defensa trata de manera diferente la marca principal Anthropic y su nuevo modelo, Mythos. Esta postura coincide con lo revelado por Axios el 19 de abril, que indicó que la NSA (Agencia de Seguridad Nacional) ya ha utilizado Mythos en la práctica, y también consolida formalmente la orientación de política hacia un «canal de excepción para Mythos». Al mismo tiempo, implica una contradicción interna a nivel de argumentación legal: el Departamento de Defensa había sostenido en los tribunales que usar herramientas de Anthropic amenazaría la seguridad nacional, en contraste con las prácticas actuales.
Anthropic vs Pentagon
ChainNewsAbmediaHace56m
137 Ventures cierra $700M en nuevos fondos; AUM alcanza 15.000 millones de USD
Según ChainCatcher, 137 Ventures, un inversor inicial en SpaceX, recientemente completó la recaudación de fondos para dos nuevos fondos con un total de más de 700 millones de dólares, elevando sus activos bajo gestión a más de 15 mil millones de dólares. El nuevo capital se destinará a inversiones en agentes de IA, robótica y propulsión espacial
GateNewshace1h
Reddit se dispara un 16% con una sólida perspectiva para el 2T; Apple enfrenta un déficit de Mac mientras la demanda de IA supera el suministro
Las acciones de Reddit subieron un 16% antes de la apertura del mercado el viernes después de que la empresa emitiera una guía de ingresos para el próximo trimestre superior a la esperada. Los visitantes activos diarios crecieron un 17% hasta 126,8 millones, mientras que los ingresos medios por usuario a nivel mundial aumentaron un 44%, impulsados por la IA,
GateNewshace1h
El Departamento de Defensa de EE. UU. llega a un acuerdo con 7 empresas de IA, incluyendo OpenAI, Google y Microsoft
Según el Departamento de Defensa de EE. UU., la agencia firmó acuerdos hoy (1 de mayo) con siete de las principales empresas de inteligencia artificial: SpaceX, OpenAI, Google, Nvidia, Reflection, Microsoft y Amazon Web Services (AWS). Los acuerdos tienen como objetivo acelerar la transformación militar y establecer t
GateNewshace1h
Datavault AI se asocia con King Mining Capital en el plan de tokenización de $150M Gold
De acuerdo con Businesswire, el 1 de mayo, Datavault AI, cotizada en Nasdaq, anunció una asociación estratégica con King Mining Capital para lanzar GoldVault, un plan de tokenización de oro por más de 150 millones de dólares. Bajo el acuerdo, Datavault AI adquirirá una participación accionaria del 5% en King Mining Capital y una
GateNewshace1h