【保姆级教程】从零入手：Python + Neo4j 构建你的第一个知识图谱

优质文章学习记录

07 Apr 2026 — 7 min read

摘要：大数据时代，数据之间的关系往往比数据本身更有价值。传统的 SQL 数据库在处理复杂关系（如社交网络、推荐系统、风控分析）时显得力不从心，而 知识图谱 和 图数据库 Neo4j 正是为此而生。本文将带你从 0 基础出发，理解知识图谱核心概念，安装 Neo4j 环境，并手把手教你用 Python 代码构建一个生动的人物关系图谱。拒绝枯燥理论，全是实战干货！

一、什么是知识图谱与 Neo4j？

在动手写代码之前，我们先用大白话把两个核心概念捋清楚。

1. 什么是知识图谱 (Knowledge Graph)？

不要被高大上的名字吓到。知识图谱本质上就是把世界上的事物（节点）和它们之间的联系（关系）画成一张巨大的网。

Excel 思维： 罗列数据。例如：张三，25岁；李四，30岁。
图谱思维： 链接数据。例如：（张三）--[朋友]-->（李四）。

它由三要素组成：

实体 (Entity/Node)： 比如“周杰伦”、“昆凌”。
关系 (Relationship)： 比如“夫妻”、“代言”。
属性 (Property)： 比如周杰伦的“年龄：40+”。

2. 什么是 Neo4j？

如果说 SQL 是关系型数据库的霸主，那么 Neo4j 就是图数据库（Graph Database）的王者。

特点： 原生支持图存储，查询关联数据速度极快（秒杀 MySQL）。
查询语言： 使用 Cypher 语言（类似 SQL，但更直观）。

一句话总结： 我们用 Python 处理数据，把数据喂给 Neo4j，最终形成可视化的知识图谱。

二、环境搭建：Neo4j Desktop 安装

对于初学者，我强烈推荐使用 Neo4j Desktop（桌面版），不仅免费，而且图形化界面非常友好，免去了复杂的命令行配置。

步骤 1：下载与安装

进入 Neo4j 官网下载中心。
填写基本信息后下载 Neo4j Desktop。
像安装普通软件一样安装并运行。

步骤 2：创建项目与数据库

打开 Neo4j Desktop，点击 "New Project"。
在右侧点击 "Add" -> "Local DBMS"。
关键设置： 设置一个密码（比如 123456），一定要记住！
点击 Create，然后点击 Start 启动数据库。

步骤 3：进入浏览器控制台

当状态灯变绿后，点击 Open 或者在浏览器输入 http://localhost:7474。

用户名：neo4j
密码：你刚才设置的（如 123456）

三、快速上手：Cypher 语言初体验

在用 Python 之前，我们先在 Neo4j 浏览器的输入框里敲一行代码，感受一下图的魅力。

输入以下命令并按回车（或点击播放按钮）：

Cypher

CREATE (p1:Person {name: '孙悟空', title: '齐天大圣'}) CREATE (p2:Person {name: '唐僧', title: '师傅'}) CREATE (p1)-[:PROTECT {role: '保镖'}]->(p2) RETURN p1, p2

你会看到屏幕上出现了两个圆圈（节点）和一条连线。这就是最简单的图谱！

四、实战：使用 Python 构建知识图谱

在实际工作中，我们不可能手动一条条敲 Cypher 命令，而是通过 Python 读取文件（CSV/Excel）并批量写入。

1. 安装 Python 驱动

打开终端或 CMD，运行：

Bash

pip install neo4j

2. 编写核心代码

下面我编写了一个通用的连接类，你可以直接复制使用。我们将构建一个简单的 “西游记人物关系图谱”。

新建一个 build_graph.py 文件：

Python

from neo4j import GraphDatabase class KnowledgeGraph: def __init__(self, uri, user, password): """ 连接 Neo4j 数据库 """ self.driver = GraphDatabase.driver(uri, auth=(user, password)) def close(self): """ 关闭连接 """ self.driver.close() def create_node_and_relationship(self, person1, relation, person2): """ 创建节点和关系 使用 MERGE 关键字，保证节点不被重复创建 """ with self.driver.session() as session: # Cypher 语句说明： # 1. 查找或创建名为 person1 的节点 # 2. 查找或创建名为 person2 的节点 # 3. 建立两者之间的关系" MERGE (p1:Character {name: $name1}) MERGE (p2:Character {name: $name2}) MERGE (p1)-[r:RELATION {type: $rel}]->(p2) RETURN p1, p2, r """ session.run(query, name1=person1, name2=person2, rel=relation) print(f"成功构建：{person1} --[{relation}]--> {person2}") def clear_data(self): """ (可选) 清空数据库，方便测试 """ with self.driver.session() as session: session.run("MATCH (n) DETACH DELETE n") print("数据库已清空！") # --- 主程序执行 --- if __name__ == "__main__": # 1. 配置数据库连接 (请修改你的密码) URI = "bolt://localhost:7687" USER = "neo4j" PASSWORD = "123456" # 替换为你自己的密码 # 2. 准备数据 (模拟从 Excel 读取的数据) data = [ ("唐僧", "师徒", "孙悟空"), ("唐僧", "师徒", "猪八戒"), ("唐僧", "师徒", "沙僧"), ("孙悟空", "师兄弟", "猪八戒"), ("孙悟空", "师兄弟", "沙僧"), ("孙悟空", "结拜兄弟", "牛魔王"), ("牛魔王", "夫妻", "铁扇公主"), ("铁扇公主", "母子", "红孩儿") ] # 3. 开始构建 kg = KnowledgeGraph(URI, USER, PASSWORD) try: # 先清空旧数据，防止重复 kg.clear_data() print("开始构建知识图谱...") for p1, rel, p2 in data: kg.create_node_and_relationship(p1, rel, p2) print("\n图谱构建完成！请去 Neo4j Browser 查看效果。") except Exception as e: print(f"发生错误: {e}") finally: kg.close()

3. 运行效果

运行上述脚本，控制台会输出：

Plaintext

数据库已清空！ 开始构建知识图谱... 成功构建：唐僧 --[师徒]--> 孙悟空 成功构建：唐僧 --[师徒]--> 猪八戒 ... 图谱构建完成！

五、见证奇迹的时刻：可视化展示

现在回到你的 Neo4j Browser (http://localhost:7474)。

在顶部输入框输入以下命令查询所有数据：

Cypher

MATCH (n) RETURN n

点击播放按钮。 你将看到一张错综复杂、可以拖拽的人物关系网！

你可以尝试：

点击“孙悟空”节点，改变它的颜色。
拖动节点，感受力导向图的物理效果。
鼠标悬停在连线上，查看关系类型。

六、总结与展望

恭喜你！你已经完成了从 0 到 1 的知识图谱构建。我们通过 Python 的 neo4j 库，成功将结构化的数据转化为了图谱。

本文学到了什么？

理解了图数据库与传统数据库的区别。
学会了安装 Neo4j Desktop。
掌握了 Python 连接 Neo4j 并批量写入数据的核心代码。

下一步可以做什么？ 构建图谱只是第一步。有了这个图谱，我们不仅可以“看”，还可以让 AI 去“理解”。在下一篇文章中，我将分享 《进阶篇：如何结合 BERT 模型与 Neo4j 实现智能问答系统 (KBQA)》，让 AI 能回答“孙悟空的结拜兄弟的老婆是谁？”这种复杂问题。

如果你觉得这篇文章对你有帮助，欢迎点赞、收藏、关注三连！有任何报错问题，请在评论区留言，我会第一时间解答！

Llama-2-7b在昇腾NPU上的六大核心场景性能基准报告

引言随着大语言模型（LLM）技术的飞速发展，其底层算力支撑硬件的重要性日益凸显。传统的GPU方案之外，以华为昇腾（Ascend）为代表的NPU（神经网络处理单元）正成为业界关注的焦点。为了全面、深入地评估昇腾NPU在实际LLM应用中的性能表现，我们进行了一项针对性的深度测评。本次测评选用业界广泛应用的开源模型Llama-2-7b，在 Atlas 800T A2 训练卡平台上进行部署、测试与分析，旨在为开发者和决策者提供一份详实的核心性能数据、深度的场景性能剖析、以及可靠的硬件选型与部署策略参考。模型资源链接：本项目测评使用的模型权重及相关资源可在 GitCode 社区获取：https://gitcode.com/NousResearch/Llama-2-7b-hf 一、测评环境搭建与准备扎实的前期准备是确保测评数据准确可靠的基石。本章节将详细记录从激活昇腾NPU计算环境到完成所有依赖库安装的全过程，确保测试流程的透明与可复现性。 1.1 激活NPU Notebook实例我们通过GitCode平台进行本次操作。首先，需要进入项目环境并激活一个Notebook实例，这

Qwen3-TTS部署教程：Qwen3-TTS与Whisper ASR构建双向语音对话系统

Qwen3-TTS部署教程：Qwen3-TTS与Whisper ASR构建双向语音对话系统想象一下，你对着电脑说一句话，电脑不仅能听懂，还能用自然、有感情的声音回答你，整个过程流畅得就像在和朋友聊天。这听起来像是科幻电影里的场景，但现在，通过Qwen3-TTS和Whisper ASR这两个强大的开源模型，我们完全可以自己动手搭建这样一个系统。今天，我就带你一步步实现这个目标。无论你是想做一个智能语音助手，还是想为你的应用增加语音交互功能，这篇教程都会给你一个清晰的路线图。我们会从最基础的部署开始，到最终实现一个能听会说的双向对话系统。 1. 准备工作与环境搭建在开始之前，我们先来了解一下今天要用到的两个核心工具。 Qwen3-TTS 是一个强大的文本转语音模型。它最吸引人的地方在于，它支持10种主要语言，包括中文、英文、日文等，还能生成多种方言和语音风格。更厉害的是，它能理解你文本里的情感和意图，自动调整说话的语调、语速，让生成的声音听起来特别自然。 Whisper ASR 则是OpenAI开源的语音识别模型，它的识别准确率非常高，支持多种语言，而且对带口音、有噪声

5个技巧让你的Windows语音识别效率翻倍：Whisper完全使用指南

5个技巧让你的Windows语音识别效率翻倍：Whisper完全使用指南【免费下载链接】WhisperHigh-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model 项目地址: https://gitcode.com/gh_mirrors/wh/Whisper 还在为语音识别软件速度慢、准确率低而烦恼吗？今天我要介绍一个能让你的Windows语音识别体验彻底改变的解决方案——Whisper。这个基于GPU加速的开源项目，让语音转文字变得前所未有的快速和精准。为什么选择Whisper？ Whisper不同于传统的语音识别工具，它充分利用了现代GPU的计算能力，通过DirectX 12和计算着色器技术，实现了真正的硬件加速。想象一下，无论是会议记录、音频文件处理，还是实时直播字幕，都能轻松应对。第一步：环境准备与项目部署首先确保你的系统环境符合要求： * Windows 10或更高版本操作系统 * 支持DirectX 12的独立显卡 *

Swift Composable Architecture：从混乱状态到优雅解耦的架构革命

Swift Composable Architecture：从混乱状态到优雅解耦的架构革命【免费下载链接】swift-composable-architecturepointfreeco/swift-composable-architecture: Swift Composable Architecture (SCA) 是一个基于Swift编写的函数式编程架构框架，旨在简化iOS、macOS、watchOS和tvOS应用中的业务逻辑管理和UI状态管理。项目地址: https://gitcode.com/GitHub_Trending/sw/swift-composable-architecture 你是否曾经在SwiftUI项目中陷入这样的困境：状态散落在各个角落，异步操作让界面闪烁不定，测试覆盖率低得可怜？当应用从简单的计数器扩展到复杂的业务场景时，传统的状态管理模式往往成为技术债务的温床。今天，让我们一起探索Swift Composable Architecture（SCA）如何重新定义SwiftUI应用架构。传统SwiftUI状态管理的三大困局在深入SCA之前，

一、 什么是知识图谱与 Neo4j？