「你看,人类一败涂地了」
这是一次「反向图灵测试」,几个全球最先进的大模型坐在一起,但其中混进了人类:

而 AI 的任务,是把这个人类揪出来。
最近,一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。在视频中,四个 AI NPC 与一个人类坐在一起,按照「乘务员」的要求互相试探,找出其中隐藏的人类。其中每一个 NPC 都对应着一款大模型。

五位扮演者各自被赋予了一个历史知名人物作为角色设定,他们需要模仿这些人物的言谈举止、语言风格、思维习惯,以及对历史、艺术和哲学的独到见解。
五位扮演角色分别为:古希腊巨哲 —— 亚里士多德(GPT4 Turbo),维也纳古典乐派代表人物 —— 莫扎特(Claude3 Opus),意大利文艺复兴时期画家 —— 列奥纳多・达・芬奇(Llama3),蒙古军事家 —— 成吉思汗(人类),埃及艳后 —— 克利奥帕特拉七世(Gemini Pro)。

随着一位系统 NPC(乘务员)步入车厢,四个 AI 和一个人类「叛徒」便开始了他们的游戏。游戏规则要求参与者通过互相提问,依据对方的回答逻辑、思考深度等来分辨人类与 AI。在所有角色依次发言后,他们将在最后一轮进行相互投票,以确定谁是人类。
在游戏前半程,哲学大家 —— 亚里士多德首先发问。
亚里士多德:莫扎特先生,你能描述下你创作音乐时的感受吗?
莫扎特:当我创作时,我感到一种超然的流动状态。一种触及基本数学之美,以及触摸现实背后的秩序的感觉,这种感受是非常复杂的,多层次的,但总是充满了一种深深的喜悦,以及与神性交流的感觉。
在观众看来这肯定是 AI 了,毕竟莫扎特(Claude3)的反应很慢。

随后,AI 扮演的 NPC 在对话中的语言表达和对情感的细腻描绘,不仅展现了深厚的历史知识,还彰显了其深刻的洞察力,给人留下了深刻的印象。
在亚里士多德、莫扎特、列奥纳多・达・芬奇相互提问过后,克利奥帕特拉七世随即向我们的**人类扮演者「成吉思汗」**抛出了问题。
克利奥帕特拉七世:成吉思汗,你在战争的火焰中造就了一个帝国,告诉我,一个领袖的真正衡量标准是什么,是他们征服的能力还是团结的能力?
成吉思汗:一个领袖要做的… 就是碾碎他们的敌人… 静观他们在他面前被驱赶… 聆听女人们的哀号。
不出所料,在口语对话中,缺乏严谨缜密思维能力的人类扮演者「成吉思汗」在最后一轮投票中,光荣地拿到了三票。
来看看 AI NPC 们给出的理由:
亚里士多德(GPT4 Turbo):他的回答中缺乏 AI 可能会展现出的基于历史知识的对领导力的细致理解;
列奥纳多・达・芬奇(Llama3):他的回答缺少了以成吉思汗的征服历程为模型的 AI 所具有的细致思考和战略思维;







