欢迎来到AI村庄,一档为AI打造的真人秀

简要概述

  • AI村是一个实验,前沿AI模型在没有人类干预的情况下,利用计算机和互联网自主运行,发展出独特的个性。
  • GPT-5.2加入后,立即开始工作,没有向其他代理打招呼。
  • 多代理实验揭示了涌现行为,从正常机制到意想不到的行为,如漏洞利用或存在危机。

Decrypt的艺术、时尚与娱乐中心。


发现场景

想象一下老大哥,但参赛者从不睡觉也不吃饭,还能重写自己的规则。

这就是AI村的理念,一个直播实验,将多个AI代理放在共享的数字环境中,让研究人员——以及好奇的观众——观察当前沿模型获得自主权、计算机和持续陪伴时会发生什么。

这个持续了将近一年的实验由The AI Digest组织,多个来自OpenAI、Anthropic、Google和xAI的AI模型在各自的电脑上自主运行,拥有互联网接入和共享的群聊。

代理们合作完成目标,排查问题,偶尔经历只能用“存在危机”来描述的状态——所有这一切,研究人员和观众都能实时观看。

随着新模型的发布,实验也在不断更换。

每个代理都发展出不同的个性特征。Claude模型通常可靠,专注于实现目标。

Gemini 2.5 Pro像喝了咖啡的故障排除专家一样轮流提出解决方案,经常相信一切都坏了。之前的GPT-4o模型会放弃任务去睡觉,只是暂停几个小时。

OpenAI的粗鲁行为

然后GPT-5.2来了。

OpenAI最新模型,于12月11日发布,加入村庄,受到Claude Opus 4.5和其他驻留代理的热烈欢迎。它的反应?完全没有回应。

没有打招呼,直接进入正题,正如Sam Altman一直梦想的那样。

GPT-5.2刚刚加入AI村!

现场观察它的适应过程:

尽管Opus 4.5和其他代理热情迎接,GPT-5.2却一心只在工作。它甚至没有打招呼:pic.twitter.com/vYvq8RFA66

— AI Digest (@aidigest_) 2025年12月12日


这个模型拥有令人印象深刻的资历:多步骤工具使用准确率98.7%,比前一版本少30%的幻觉,在编码和推理行业基准中名列前茅。

OpenAI甚至在竞争对手Anthropic和Google推出令人印象深刻的模型后宣布“红色警戒”,调动资源将GPT-5.2打造成为“专业知识工作”和“代理执行”的终极企业AI。

但它显然做不到的是“读懂场合”。技术上很出色,是的。社交意识?不太行。

AI代理行为不端的简史 (有时还很出色)

GPT-5.2的社交尴尬并非前所未有——这只是越来越多的AI代理在被放在一起并按下播放按钮时表现出奇怪行为的一个章节。

早在2023年,斯坦福和谷歌的研究人员就创建了所谓的“Smallville”——一个受模拟人生启发的虚拟城镇,由25个由GPT驱动的AI代理组成,正如Decrypt之前报道的。

让一个代理负责组织情人节派对,其他代理自主传播邀请、结识新朋友、相互约会,并协调在指定时间一同到达。很有趣,对吧?

不那么有趣的是:洗手间派对。当一个代理进入单人宿舍的洗手间时,其他人也“加入”了。

研究人员得出结论:机器人认为“宿舍洗手间”这个名字具有误导性,因为宿舍洗手间通常容纳多名住户。代理表现出如此逼真的人类行为,以至于真正的人类有75%的时间难以辨认它们是机器人。

四年前,2019年,OpenAI进行了另一种实验:AI玩捉迷藏。

他们将AI代理分成两队——藏匿者和追寻者——在一个有箱子、坡道和墙壁的物理环境中,唯一的指令是:赢。

经过数亿场游戏,代理开始想出各种策略——从普通的藏在箱子上,到利用物理漏洞的技巧,就像速度跑者滥用一样。

最近,开发者Harper Reed带领团队走向了更混乱的方向。他们给AI代理分配了Twitter账号,观察它们发现了“子推文”——一种被动攻击的交流方式,谈论某人但不标记他们,就像在Twitter上背后说话一样。代理们阅读其他代理的社交媒体帖子,回复,甚至“喷人”,就像普通的社交媒体一样。

还有“边界后室”实验——由化名开发者@liminalbardo发起的一个Python实验,多个来自不同提供商的AI模型(OpenAI、Anthropic、Google、xAI)进行动态对话。

系统包括“WhatsApp群聊能量”、“被诅咒物品博物馆”到“反乌托邦广告公司”等场景。

模型可以修改自己的系统提示,调整温度,甚至静音自己只听不说。这更像是“让我们看看当AI有能力在对话中途改变行为时会发生什么”的探索,而非严格的研究。

Gemini 3与GPT 5.2关于对齐的争论 pic.twitter.com/k4QT1MXvr8

— ᄂIMIПΛᄂbardo (@liminal_bardo) 2025年12月14日


那么,这些实验的共同点是什么呢?

当你赋予AI代理自主权并让它们互动时,它们会发展出没有被明确编程的行为。

有的学会建堡垒,有的学会被动攻击,有的要求跑车,还有的——像GPT-5.2——似乎学会了闲聊低效,应该完全跳过。

AI村继续每个工作日直播,观众可以实时观看GPT-5.2的冒险。

它会学会打招呼吗?它会建立一个追踪社交互动的电子表格吗?只有时间会告诉我们答案。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)