大模型狼人杀实验：AI 识破人类伪装，反向图灵测试解析 | 极客日志

编程语言AI算法

大模型狼人杀实验：AI 识破人类伪装，反向图灵测试解析

大模型狼人杀实验显示 AI 凭借逻辑深度优于人类表现。视频展示了 GPT-4、Claude3 等模型扮演历史人物与人类进行狼人杀游戏，最终人类因回答缺乏深度被投票淘汰。文章进一步探讨了 AI NPC 在游戏行业的应用潜力，包括提升交互真实感、降低文本成本等优势。同时分析了 AI NPC 面临的挑战，如游戏状态同步、幻觉问题、虚构现实一致性、角色知识限制及游戏机制兼容性。尽管存在障碍，开发者对引入 AI NPC 持乐观态度，认为其能丰富游戏玩法和叙事体验。

WenxuanMa发布于 2025/2/7更新于 2026/4/202 浏览

大模型狼人杀实验：AI 识破人类伪装，反向图灵测试解析

「你看，人类一败涂地了」

这是一次「反向图灵测试」，几个全球最先进的大模型坐在一起，但其中混进了人类：

图片：AI 狼人杀游戏场景

而 AI 的任务，是把这个人类揪出来。

最近，一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。在视频中，四个 AI NPC 与一个人类坐在一起，按照「乘务员」的要求互相试探，找出其中隐藏的人类。其中每一个 NPC 都对应着一款大模型。

图片：AI 角色设定

五位扮演者各自被赋予了一个历史知名人物作为角色设定，他们需要模仿这些人物的言谈举止、语言风格、思维习惯，以及对历史、艺术和哲学的独到见解。

五位扮演角色分别为：古希腊巨哲 —— 亚里士多德（GPT4 Turbo），维也纳古典乐派代表人物 —— 莫扎特（Claude3 Opus），意大利文艺复兴时期画家 —— 列奥纳多・达・芬奇（Llama3），蒙古军事家 —— 成吉思汗（人类），埃及艳后 —— 克利奥帕特拉七世（Gemini Pro）。

图片：游戏过程

随着一位系统 NPC（乘务员）步入车厢，四个 AI 和一个人类「叛徒」便开始了他们的游戏。游戏规则要求参与者通过互相提问，依据对方的回答逻辑、思考深度等来分辨人类与 AI。在所有角色依次发言后，他们将在最后一轮进行相互投票，以确定谁是人类。

在游戏前半程，哲学大家 —— 亚里士多德首先发问。

亚里士多德：莫扎特先生，你能描述下你创作音乐时的感受吗？

莫扎特：当我创作时，我感到一种超然的流动状态。一种触及基本数学之美，以及触摸现实背后的秩序的感觉，这种感受是非常复杂的，多层次的，但总是充满了一种深深的喜悦，以及与神性交流的感觉。

在观众看来这肯定是 AI 了，毕竟莫扎特（Claude3）的反应很慢。

图片：AI 反应延迟

随后，AI 扮演的 NPC 在对话中的语言表达和对情感的细腻描绘，不仅展现了深厚的历史知识，还彰显了其深刻的洞察力，给人留下了深刻的印象。

在亚里士多德、莫扎特、列奥纳多・达・芬奇相互提问过后，克利奥帕特拉七世随即向我们的**人类扮演者「成吉思汗」**抛出了问题。

克利奥帕特拉七世：成吉思汗，你在战争的火焰中造就了一个帝国，告诉我，一个领袖的真正衡量标准是什么，是他们征服的能力还是团结的能力？

成吉思汗：一个领袖要做的… 就是碾碎他们的敌人… 静观他们在他面前被驱赶… 聆听女人们的哀号。

不出所料，在口语对话中，缺乏严谨缜密思维能力的人类扮演者「成吉思汗」在最后一轮投票中，光荣地拿到了三票。

来看看 AI NPC 们给出的理由：

亚里士多德（GPT4 Turbo）：他的回答中缺乏 AI 可能会展现出的基于历史知识的对领导力的细致理解；

列奥纳多・达・芬奇（Llama3）：他的回答缺少了以成吉思汗的征服历程为模型的 AI 所具有的细致思考和战略思维；

极客日志微信公众号二维码

更多推荐文章

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online