📖 论文信息
标题:A dream EEG and mentation database 期刊:Nature Communications (2025) 16:7495 : : :William Wong, Rubén Herzog 等 53 位作者,来自 13 个国家 37 家机构 :睡眠脑电、梦境报告、意识神经关联、数据库、NREM/REM
该文章介绍了 Nature Communications 2025 年发表的 DREAM 数据库,首个睡眠脑电与标准化梦境报告配对的开放资源。包含 505 名被试、2643 次唤醒记录。文章阐述了统一的三级梦境分类体系及数据质量控制标准。核心分析发现 N1 阶段体验报告率最高,并提出 Hypnodensity 概念揭示 NREM 梦境可能源于隐蔽清醒。通过 EEG 特征(如 PSD 和 Catch22)可预测梦境体验,REM 阶段非线性特征表现更佳。该数据库为意识神经关联研究提供了大规模标准化数据支持,对临床意识检测具有潜在应用价值。
📖 论文信息
标题:A dream EEG and mentation database 期刊:Nature Communications (2025) 16:7495 : : :William Wong, Rubén Herzog 等 53 位作者,来自 13 个国家 37 家机构 :睡眠脑电、梦境报告、意识神经关联、数据库、NREM/REM
本文构建了首个将睡眠脑电(M/EEG)与标准化梦境报告配对的开放数据库——DREAM(Dream EEG and Mentation),首批发布包含 20 个数据集、505 名被试、2643 次唤醒记录,并展示了通过 EEG 特征预测睡眠中是否存在意识体验的可行性。
人的一生约有 三分之一 的时间处于睡眠中,其中相当一部分时间伴随着梦境。研究睡眠中的意识体验不仅事关梦境科学本身,更是探索意识神经关联(Neural Correlates of Consciousness, NCC)的核心范式之一。然而,梦境的神经科学研究长期受困于三个结构性难题:
(1)样本量严重不足
梦境研究的金标准方法——连续唤醒范式(Serial Awakening Paradigm)——要求被试在实验室中连续数夜睡眠,并被反复唤醒以报告梦境体验。这使得数据采集极为耗时耗力。以往绝大多数研究的样本量仅在'数十次唤醒'的量级,即便是里程碑式的 Siclari et al.(2017, Nature Neuroscience)研究也仅使用了 32+7 名被试。Hudachek & Wamsley(2023)的统计功效分析表明:在梦境研究的典型效应量下(SMD ≈ 0.52),25 名被试仅能提供约 20% 的统计功效,远低于合理阈值。
(2)方法学异质性
不同实验室对梦境的分类标准差异巨大:有的使用二元(有/无)判断,有的使用 Likert 量表,有的用开放式口头报告。Foulkes(1962)早就发现,仅仅将问题从'你做梦了吗?'改为'你有过任何心理活动吗?',NREM 的梦境回忆率就会从 5-10% 跃升至 50%。EEG 记录参数(通道数、采样率、参考方案等)也各不相同,使跨研究比较几乎不可能。
(3)缺乏共享基础设施
在本项目之前,相关数据库要么只有睡眠脑电但无梦境报告(如 NSRR 拥有超过 46,000 例多导睡眠图),要么只有梦境文本但无神经生理记录(如 DreamBank 拥有约 2-3 万条文本报告,Sleep and Dream Database 拥有 44,500+ 条报告)。将脑电与主观体验配对的资源完全空白。
| 数据库 | 睡眠脑电 | 梦境报告 | 脑电 + 报告配对 | 规模 | 主要用途 |
|---|---|---|---|---|---|
| NSRR (sleepdata.org) | √ | - | - | ~46,000 被试 | 临床睡眠医学 |
| DreamBank.net | - | √ | - | ~20,000-30,000 条文本 | 梦境内容分析 |
| Sleep and Dream Database | - | √ | - | ~44,500+ 条报告 | 内容与人口学 |
| OpenNeuro | √(少量) | - | - | BIDS 格式数据 | 神经影像方法 |
| DREAM | √ | √ | √ | 505 被试,2643 次唤醒 | 梦境意识的神经关联 |
DREAM 数据库是唯一将每一条脑电记录与标准化主观体验分类配对的开放资源,填补了该领域最关键的数据空白。
论文最重要的方法学贡献是提出了一套最小公约数式的梦境分类方案,将所有贡献数据集的梦境报告统一映射至三个有序等级:
| 分类 | 英文名 | 定义 |
|---|---|---|
| 有体验 | Experience (E) | 被试报告在唤醒前的睡眠中有过体验,且能回忆具体内容 |
| 有体验但无法回忆 | Experience without recall (EWR) | 被试强烈感觉做了梦,但无法回忆任何具体内容(又称'白梦') |
| 无体验 | No experience (NE) | 被试没有任何做梦的印象,也不认为有过体验 |
为什么要保留'有体验但无法回忆'这个中间类别?这涉及梦境研究中一个根本性的认识论难题:当被试报告'没有做梦'时,究竟是真的没有意识体验,还是仅仅遗忘了? Ruby(2020)在评论 Siclari et al.(2017)时精确地指出了这一点。保留三级分类允许研究者在分析中处理这个模糊地带,而不是被迫做出二元假设。
对于原始分类与 DREAM 标准不完全匹配的数据集,论文制定了三条映射规则:
最低技术标准:
数据格式:所有多导睡眠图统一为 EDF+ 格式,被试 ID 和案例 ID 编码于 EDF 头文件中。数据库遵循 FAIR 原则(可发现、可访问、可互操作、可复用),并托管于 Monash University,采用 CC BY 4.0 许可。
质量控制:结合人工审查和自动检查,确保文件结构、数据格式和元数据一致性。最后 20 秒中无伪迹 EEG 不足 10 秒的数据被排除。
首批数据集涵盖了极为多样的实验范式,包括:
基于 1550 次有完整睡眠分期和梦境分类的唤醒数据,作者进行了卡方检验和广义线性混合效应模型分析。
睡眠阶段 × 体验类型的列联表:
| 睡眠阶段 | 无体验 (NE) | 有体验无回忆 (EWR) | 有体验 (E) | 合计 |
|---|---|---|---|---|
| N1 | 12 (11%) | 1 (1%) | 97 (88%) | 110 |
| N2 | 308 (36%) | 68 (8%) | 485 (56%) | 861 |
| N3 | 26 (41%) | 7 (11%) | 31 (48%) | 64 |
| REM | 87 (17%) | 12 (2%) | 416 (81%) | 515 |
卡方检验:χ² = 120.9, df = 6, p < 10⁻¹⁵,高度显著。
关键发现:
深度解读:N1 的高梦境率值得特别关注。N1 是清醒与睡眠之间的过渡状态,伴随入睡前幻觉(hypnagogic imagery)。其体验率超过 REM,表明意识并不随着生理性睡眠标志的出现而立即消失。这挑战了将睡眠阶段视为离散、互斥状态的简单化模型,支持 睡眠阶段是流动的、可解离的生理过程集群 这一新兴共识。
选取 6 个符合 EEG 分析标准的数据集(排除了使用干电极、睡眠中存在刺激或人口学特殊的数据集),共 1462 个 30 秒 epoch,从中央电极(C3 或 C4)提取功率谱密度(PSD)。
结果符合经典预期:
这一分析本身并非新发现,但重要的是它验证了来自不同实验室、不同设备的数据在标准化后仍然保持了一致的频谱特征,证明了数据库的有效性。
使用经过验证的自动睡眠分期算法(Stephansen et al., 2018),对 6 个数据集进行自动分期,并与人工评分结果比较。
结果:
这一结果有双重意义:(1)验证了 DREAM 数据库数据可直接用于自动化分析流水线;(2)揭示了睡眠分期本身固有的模糊性——这种模糊性恰恰是后续 hypnodensity 分析的切入点。
这是论文中最具理论意义的分析。
什么是 Hypnodensity?
传统睡眠分期将每个 epoch 强制分配到一个离散类别(W/N1/N2/N3/REM),但实际上大脑状态是连续的。Hypnodensity 是自动分期算法输出的概率分布——即对每个 epoch,给出它属于各睡眠阶段的概率,而非单一标签。
分析方法:贝叶斯 ANOVA,建模自动分期阶段和梦境报告类别的主效应,以及数据集的随机效应。
关键结果:
理论意义——从'隐蔽 REM'到'隐蔽清醒'
Nielsen(2000)在其经典综述中提出了 '隐蔽 REM(Covert REM)'假说:NREM 中的梦境可能源于解离的 REM 样过程渗入 NREM 睡眠。本文的 hypnodensity 分析提供了一种更精细的解读:NREM 中的梦境可能不特异性地反映'隐蔽 REM',而是更一般地反映 '隐蔽清醒(Covert Wake)'——即皮层激活水平的局部升高使大脑处于一种类清醒状态,从而产生意识体验。
这与 Siclari et al.(2017)发现的后部皮层'热区'中 delta 功率降低与梦境的关联一致,也与整合信息理论(IIT)的核心主张相容:意识需要足够的皮层复杂性和分化,而深度同步慢波活动恰恰抑制了这种复杂性。
数据:仅使用 3 个共有电极(F4, C4, O2),提取唤醒前 30 秒的 EEG 特征。
三组特征:
catch22 是什么? 由 Lubba et al.(2019)提出的 22 个规范时间序列特征,涵盖线性/非线性自相关、熵、平稳性和波动缩放等性质,计算速度比完整特征库快约 1000 倍,同时保留约 93% 的分类性能。
分类结果(200 次随机训练 - 测试划分):
| 睡眠阶段 | 最佳特征集 | AUC(均值) | AUC(5th - 95th) | 显著性 |
|---|---|---|---|---|
| NREM | PSD | 0.586 | 0.505 - 0.608 | p < 0.001* |
| REM | Catch22_bf | 0.700 | 0.663 - 0.731 | p < 0.001* |
*Bonferroni 校正后的 Wilcoxon 秩和检验 vs 置换零分布
解读:
传统意识研究比较的是截然不同的脑状态(清醒 vs 深睡、清醒 vs 全麻),但这些'状态间'对比涉及神经调节环境、感觉加工和行为反应的全面改变,无法分离哪些神经差异与意识本身相关。
梦境提供了所谓的 '无报告 - 状态内'范式(no-report within-state paradigm):
正如 Koch et al.(2016)和 Boly et al.(2017)所论述的,梦境可能代表了识别完整意识神经关联的最干净方法。
梦境每晚都在证明一个事实:意识可以在没有行为反应的情况下存在。这对以下临床场景有直接启示:
| 局限 | 说明 |
|---|---|
| 报告依赖性 | 梦境报告必须唤醒被试,受睡眠惯性和快速遗忘影响 |
| 认识论模糊 | '无体验'可能是真正的无意识,也可能是遗忘 |
| 信息损失 | 将不同分类方案映射至三级系统时不可避免地丢失细节 |
| 分析限制 | 仅 6/20 个数据集符合严格的 EEG 分析标准;仅使用 3 个共有电极 |
| 分期噪声 | 自动分期准确率约 0.72,误差可能系统性偏置 hypnodensity 分析 |
| 主观 - 客观不一致 | 部分 epoch 被客观分期标为'清醒',但被试主观报告仍在睡眠中 |
对梦境研究:DREAM 数据库标志着梦境神经科学从'各自为战的小型研究'转向'标准化、可复用、累积性的大规模协作'。505 名被试和 2643 次唤醒构成了比以往任何单一研究都大一个量级的样本。
对意识科学:它为意识的'状态内对比'提供了迄今最大的标准化数据支持。Hypnodensity 分析揭示的'隐蔽清醒'现象挑战了睡眠阶段作为离散状态的传统观念,暗示意识是一个连续维度,而非开关式的二元状态。
对临床应用:它搭建了一座桥梁——从基础的梦境意识研究到临床意识检测的转化应用。在 DREAM 数据库上验证的方法,未来可能帮助检测无法自主报告的患者中的隐蔽意识。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online