【AIGC】《Generative Agents:Interactive Simulacra of Human Behavior》

【AIGC】《Generative Agents:Interactive Simulacra of Human Behavior》

让 AI 村民组成虚拟村庄会发生什么事?

文章目录

Generative Agents

Park J S, O’Brien J, Cai C J, et al. Generative agents: Interactive simulacra of human behavior[C]//Proceedings of the 36th annual acm symposium on user interface software and technology. 2023: 1-22.

这篇论文由斯坦福大学和 Google 的研究人员(如 Joon Sung Park, Percy Liang 等)共同发表,也就是大名鼎鼎的 “AI 小镇(Smallville)” 论文。鉴于你之前关注“能使用工具的 AI”,这篇文章正是“自主智能体(Autonomous Agents)”领域的开山之作。

核心贡献:提出了一个名为 “生成式智能体架构(Generative Agent Architecture)” 的系统,包含三个关键组件:

  • 记忆流 (Memory Stream):一个长期内存数据库,用自然语言记录智能体的所有经历(观察)。通过相关性、近时性、重要性三个维度进行检索,决定智能体当前该想起什么。
  • 反思 (Reflection):智能体会定期停下来,对记忆流中的碎片化信息进行归纳总结,提取出高层级的观点(例如:某人很友好,或者我下午需要去买菜),这让智能体能够形成更深刻的判断。
  • 规划 (Planning):智能体会制定长、中、短期计划,并根据环境变化(观察到新事物)随时调整计划(Re-planning),保证行为的逻辑连贯性。

点击对应的 NPC,可以看到更多细节

每个角色都有人设

最经典的案例情人节派对,至今还被反复拿出来讨论。
他们只给其中一个叫Isabella的AI下了一个种子指令——“你想在情人节办个派对”。
剩下的事情,人类完全没有插手,然后整个小镇就自发运转起来了。
Isabella开始四处发邀请函,接到邀请的AI们会根据自己的性格决定去不去,甚至有人在派对前一天就开始紧张地讨论该穿什么、要不要带点礼物。
甚至有人帮忙装饰咖啡馆,有人提前规划路线,最后5个AI准时到场,派对办得热火朝天。
整个过程虽然丝滑,却没有一条硬编码规则,全是这群电子小人自己“想”出来的。

Daily requirement 超长

NPC 觉醒,喜欢上了玩家操控的女角色,会发生什么事情呢?

行为说明应该是 ChatGPT 生成的

行为说明转成行为应该基于 program 规则

感知-思考-行动循环:

  • 感知:Agent 观察周围环境并存入记忆流。
  • 检索:根据当前场景检索最相关的记忆。
  • 行动:通过 Prompting 让 LLM 生成下一步动作(对话、移动、操作物体)。

固定的太枯燥了

可以让 Agent 根据外界的信息改变自己的行为

重要性打分,

模型内部的结构,有 plan,有 observation,还有 reflection

因为 no evidence

发现了相互暗恋的情况(Maria 和 Klaus),不排除是上帝把 reflection 塞进来了,因为没有看到 evidence

John 是 Eddy 的爸爸,John 看见 Eddy 后,改变了自己的 plan,开始与 Eddy 去对话

伊莎贝拉计划举办一场情人节派对。她传播了这个信息,在模拟结束时,12 个角色已经知道了这件事。其中 7 个人「犹豫不决」——3 个人已有其他计划,4 个人没有表露想法,这和人类的相处一样。

demo 比较慢,李老师没有看到最后,不知道 Maria 和 Klaus 的对话内容以及情人节活动现场发生的事情

自己注释了一个 happy ending,哈哈哈

实验最令人惊叹的是观察到了涌现出的社会行为 (Emergent Social Behaviors):

  • 信息传播:一个 Agent 决定举办情人节派对,消息通过社交互动在小镇里传开,大家纷纷调整计划参加。
  • 关系演变:智能体之间会建立新的友谊,并根据过去的互动改变对彼此的态度。
  • 协作:多个智能体协调时间,共同出现在同一地点。

论文证明了将 LLM 与架构化的记忆机制结合,可以创造出极具真实感的“数字人类”。

证明了 Agent 的可信度不仅取决于模型本身,更取决于其对过去经历的组织和反思能力

资讯

  1. 「斯坦福AI小镇」创业即获投1亿美元!李飞飞卡帕西都投了(2026-02-14)
    • 当初那个“智能体早期真神”,让25个智能体自己聊天、传八卦、谈恋爱的AI小镇Smallville团队也官宣创业了。
    • 公司名叫Simile,直接拿下了Index Ventures领投的1亿美元融资,连卡帕西、李飞飞也跟了。
  2. 爆火论文打造《西部世界》雏形:25个AI智能体,在虚拟小镇自由成长(2023-04-11)
    • Generative Agents 的架构中心是记忆流—— 一个全面记录智能体经验的数据库。智能体会从记忆流中检索相关记录,以规划智能体的动作行为并对环境做出适当反应,并且每次行为都会被记录以递归合成更高级别的行为指导。Generative Agents 架构中所有的内容都被记录下来并以自然语言描述的形式来进行推理,从而使智能体能够利用大型语言模型的推理功能。
    • 只有当智能体对最近事件的重要性分数总和超过某个阈值,智能体才会开始反思。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考

  • https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php
  • https://www.bilibili.com/video/BV18fXbY6Eis/?spm_id_from=333.1387.homepage.video_card.click&vd_source=8e91f8e604278558ec015e749d1a3719
  • https://www.youtube.com/watch?v=G44Lkj7XDsA
  • Demo:https://reverie.herokuapp.com/arXiv_Demo/

Read more

FLUX.1-dev-fp8-dit文生图完整流程:ComfyUI界面操作+节点连接+图片尺寸设置+执行监控

FLUX.1-dev-fp8-dit文生图完整流程:ComfyUI界面操作+节点连接+图片尺寸设置+执行监控 本文面向想要快速上手FLUX.1-dev-fp8-dit文生图模型的用户,通过ComfyUI界面操作和节点连接,让你在10分钟内掌握从输入文字到生成高质量图片的完整流程。 1. 环境准备与工作流选择 开始使用FLUX.1-dev-fp8-dit模型前,确保你已经运行了ComfyUI环境。这个环境提供了直观的图形化界面,让文生图操作变得简单直观。 进入ComfyUI后,在左侧工作流列表中找到并选择"FLUX.1-dev-fp8-dit文生图"工作流。这个预置的工作流已经帮你配置好了所有必要的节点和连接,无需从零开始搭建,大大降低了使用门槛。 选择工作流后,界面会自动加载所有相关节点,包括文本输入、模型加载、图像生成等模块。这些节点之间已经通过连线建立了正确的工作流程,你只需要关注几个关键参数的设置即可。 2. 提示词输入与风格选择 在加载的工作流中,找到名为"SDXL Prompt Styler"的节点。这是你与模型交互的主要入口,通过这里输入文字描述来控制生成

Copilot代理与网络配置全攻略(突破访问限制的终极方法)

第一章:Copilot代理与网络配置全攻略(突破访问限制的终极方法) 在使用 GitHub Copilot 的过程中,开发者常因网络策略或区域限制无法正常激活服务。通过合理配置代理与网络环境,可有效绕过此类问题,确保代码补全功能稳定运行。 配置本地代理服务器 为确保 Copilot 能够连接至远程 API,建议在本地部署 HTTP 代理服务。以下是一个基于 Node.js 的简易代理示例: // proxy-server.js const http = require('http'); const net = require('net'); // 创建 HTTP 代理服务器 const server = http.createServer((req, res) => { // 允许跨域请求 res.setHeader(

AI绘画入门:文生图基本原理与工具推荐

AI绘画入门:文生图基本原理与工具推荐

AI绘画入门:文生图基本原理与工具推荐 📝 本章学习目标:通过本章学习,你将全面掌握"AI绘画入门:文生图基本原理与工具推荐"这一核心主题,建立系统性认知。 一、引言:为什么这个话题如此重要 在人工智能快速发展的今天,AI绘画入门:文生图基本原理与工具推荐已经成为每个AI从业者和爱好者必须了解的核心知识。无论你是技术背景还是非技术背景,理解这一概念都将帮助你更好地把握AI时代的机遇。 1.1 背景与意义 💡 核心认知:大模型技术正在深刻改变我们的工作和生活方式。作为这一变革的见证者和参与者,我们需要系统性地理解其背后的原理和应用。 从2022年ChatGPT的横空出世,到如今百花齐放的大模型生态,短短几年间,AI技术已经渗透到各行各业。根据最新统计,全球大模型市场规模已突破千亿美元,年增长率超过50%。这一数字背后,是无数企业和个人正在经历的数字化转型。 1.2 本章结构概览 为了帮助读者系统性地掌握本章内容,我将从以下几个维度展开: 📊 理论基础 → 核心概念 → 技术原理 → 实践应用 → 案例分析 → 总结展望 二、核心概念解析 2.1

2026低代码选型指南:AI与低代码双向赋能,破解企业数字化落地难题

2026低代码选型指南:AI与低代码双向赋能,破解企业数字化落地难题

在数字化转型深化的今天,低代码平台已从“边缘工具”升级为企业数字化的核心基建,成为破解“开发效率低、技术门槛高、系统集成难”的关键抓手。根据Gartner预测,2026年全球80%的新应用将通过低代码构建,但企业在选型过程中,往往陷入“重功能、轻适配”“追概念、缺落地”的误区——要么平台易用性不足,业务人员无法上手;要么技术拓展性欠缺,难以支撑复杂业务场景;要么AI功能流于表面,无法真正赋能全流程。 真正优秀的低代码平台,应当兼顾“易用性、专业性、扩展性”三大核心,而2026年的核心趋势的是“AI与低代码深度融合”:AI降低使用门槛,低代码提供落地底座,二者互为支撑、双向赋能,才能真正让数字化转型落地到每一个业务环节。 一、企业低代码选型的3个核心维度(避开90%的坑) 很多企业选型时,过度关注“拖拽功能多炫”“模板数量多少”,却忽略了核心适配性,导致项目上线后无法落地、反复返工。结合上千家企业落地经验,