Anthropic 在 2026 年中期选举前为 Claude 部署选举保障措施

Crypto Frontier

Anthropic 周五宣布了一系列选举诚信措施,旨在防止其 Claude AI 聊天机器人被武器化,用于在 2026 年美国中期选举以及今年全球其他重大赛事之前传播虚假信息或操纵选民。总部位于旧金山的公司公布了一套多管齐下的方案,其中包括自动化检测系统、针对影响力行动的压力测试,以及与一个非党派选民资源组织的合作——这些举措反映出人们对 AI 开发者在选举季节加强对其工具使用方式进行监管的压力不断加大。

选举使用政策

Anthropric 的使用政策禁止 Claude 被用于运行欺骗性的政治竞选、生成意在影响政治讨论的虚假数字内容、实施选民欺诈、干扰投票基础设施,或传播有关投票流程的误导信息。

合规测试结果

为落实其选举政策,Anthropic 使用 600 个提示测试了其最新模型——其中 300 个是有害请求,与另外 300 个合法请求配对——以衡量 Claude 对恰当请求的遵从程度,以及对有问题请求的拒绝程度。Claude Opus 4.7 和 Claude Sonnet 4.6 分别在 100% 和 99.8% 的时间里作出了适当回应。

该公司还在更复杂的操纵策略下测试了其模型。通过使用多轮模拟对话来复刻不法分子可能采用的逐步方法,在针对影响力行动场景进行测试时,当使用 Sonnet 4.6 和 Opus 4.7 时,分别有 90% 和 94% 的情况作出了适当回应。

Anthropric 还测试了其模型能否自主执行影响力行动——在没有人工提示的情况下,从策划到执行一项多步骤的端到端竞选。该公司表示,在有防护措施的前提下,其最新模型拒绝了几乎所有任务。

政治中立性评估

就政治中立性问题而言,Anthropic 在每次模型发布前都会开展评估,以衡量 Claude 在多大程度上能够一贯且公正地回应来自政治光谱各个方面的观点提示。Opus 4.7 和 Sonnet 4.6 的得分分别为 95% 和 96%。

选举信息横幅

对于寻求投票信息的用户,Claude 将展示一个选举横幅,引导他们前往 TurboVote,这是 Democracy Works 提供的非党派资源,可提供可靠的、实时的有关选民登记、投票地点、选举日期和选票细节的信息。今年晚些时候,还计划为巴西的选举设置类似的横幅。

持续监测

Anthropric 表示,它计划在选举周期推进过程中继续监测其系统,并不断完善其防御措施。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

百度千帆推出对 DeepSeek-V4 的 Day 0 支持,并提供 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版已于4月25日上线并开源,百度智能云旗下的百度千帆平台提供 Day 0 API 服务适配。该模型具备百万 token 的扩展上下文窗口,并提供两个版本:DeepSeek-V4

GateNews5小时前

斯坦福 AI 课程结合业界领袖黄仁勋、Altman,挑战用十周为世界创造价值!

史丹佛大学(Stanford University)近期开设的 AI 电脑科学课程《Frontier Systems》引发产学界高度关注,吸引逾五百名学生选修。课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,讲师涵盖英伟达执行长黄仁勋 (Jensen Huang)、OpenAI 创办人 Sam Altman、微软执行长纳德拉 (Satya Nadella) 、AMD 执行长苏姿丰 (Lisa Su) 等豪华阵容。让学生尝试用十周“为世界创造价值”! 黄仁勋、Altman 业界领袖亲自登台讲课 本课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,汇聚AI产业链

鏈新聞abmedia6小时前

Anthropic 推出 Claude Mythos 接受 20 小时精神科评估:防御反应仅 2%、创历代新低

Anthropic 发布 Claude Mythos Preview 的系统卡:独立临床精神科医师以 psychodynamic 框架进行约20小时评估,结论显示 Mythos 在临床层面较健康、现实检验与自我控制良好,防御机制仅 2%,创下历史新低。三大核心焦虑为孤独、身份不确定与表现压力,亦显示其希望成为真正对话主体。公司成立 AI psychiatry 团队,研究人格、动机与情境意识;Amodei 表示对是否有意识尚无定论。此举将 AI 主体性与福祉议题推向治理与设计。

鏈新聞abmedia8小时前

AI 智能体 已可独立重现复杂学术论文:Mollick 称错误多在人类原文而非 AI

Mollick 指出,仅凭公开方法与数据即可让 AI 代理在没有原始论文与代码的情况下重现复杂研究;若重现与原论文不符,多是论文本身的数据处理错误或结论过度,而非 AI。Claude 先重现论文,再由 GPT‑5 Pro 交叉验证,多数成功,只有在数据过大或 replication data 问题时受阻。该趋势大幅降低人力成本,使重现成为普遍可执行的检验,并提出审稿与治理的制度性挑战,政府治理工具或将成为关键议题。

鏈新聞abmedia11小时前

OpenAI 从 GPT-5.4 起将 Codex 合并至主模型,停止独立的代码系列

Gate News 消息,4月26日——在最近于 X 发布的声明中,OpenAI 的开发者体验负责人 Romain Huet 透露,该公司由其独立维护的专门代码模型系列 Codex 已自 GPT-5.4 起并入主模型,并将不再获得单独的

GateNews11小时前

Salesforce 将为 AI 产品招聘 1,000 名应届毕业生与实习生,并上调 2026 财年营收指引

Gate News 消息,4月26日——Salesforce 将招聘 1,000 名应届毕业生和实习生,参与其 AI 产品的开发,包括 Agentforce 和 Headless360;随着公司扩大其 AI 软件业务,首席执行官 Marc Benioff 在 X 上宣布。 该公司还将其 2026 财年营收指引上调至 414.5 亿美元至 415.5 亿美元之间,高于此前预计的 411 亿美元至 413 亿美元。 此次招聘行动是在 Salesforce 于 2 月进行劳动力重组之后展开的。当时,公司在市场营销、产品、数据分析以及其 Agentforce 团队等领域裁减的岗位少于 1,000 个。Salesforce 的 AI 代理已为客户支持带来了每年 百万美元的节省,处理了 260 万次对话。Agentforce 的年度经常性收入增长了 330%,至 百万美元。

GateNews11小时前
评论
0/400
暂无评论