【Mac 实战】简单知识图谱搭建步骤详解（Neo4j + py2neo）

（1）安装neo4j

安装了Homebrew直接在终端输入以下命令即可

安装后，Neo4j 浏览器可通过 http://localhost:7474 访问。

（2）登录neo4j

【1】在登录页面填写信息：Connect URL：输入 neo4j://localhost:7687Authentication type：保持为 "Username / Password"Username：输入 neo4jPassword：首次连接时输入默认密码 neo4j点击蓝色的 Connect 按钮

【2】首次连接成功后，系统会强制要求修改默认密码：当前密码：neo4j设置一个新的安全密码（请务必记住）

【3】测试连接

连接成功后，在顶部的命令行中输入 Cypher 查询语句，例如：

2、neo4j 快速入门

【1】我们点击左边栏的星星图标，在Example Graphs中选择Movie Graph，点击运行，就会弹出一个关于电影图谱的教程

【2】创建图谱

点击灰色代码框，创建图谱的代码会自动复制到代码框

点击运行，即可看到创建的电影图谱

【3】查找

下面是一些关于查找的语句：查找名叫Tom Hanks的演员查找标题为Cloud Atlas的电影查找10个人查找在20世纪90年代上映的电影

【4】询问

后续还有一些查询语句教程不一一列举了，感兴趣的同学可以自行运行。

3、neo4j 基本操作

接下来我们以【麦当劳】为背景，用Neo4j的Cypher查询语言演示基本增删改查操作。

下面我们建立一个简单的图谱，包含两种节点和一种关系：

节点类型1：餐厅
- 属性：名称，地址，开业年份
节点类型2：产品
- 属性：名称，价格，类别
关系类型：供应
- 属性：自何时起供应

（1）增操作

【1】创建节点

【2】创建关系

（2）查操作

【1】查找所有餐厅

【2】查找特定餐厅供应的所有产品

【3】查找供应可乐的所有餐厅

因为前面没有创建这么多关系，下面只做操作语法展示

【4】多跳查询 - 查找与MC销售同类产品的其他餐厅

因为前面没有创建这么多关系，这里只做操作语法展示

【5】路径查询 - 查找两家餐厅通过共同产品产生的关联

（3）改操作

【1】更新节点属性

【2】新增节点属性

【3】更新关系属性

（4）删操作

【1】删除关系

【2】删除节点（必须先删除其所有关系）

【3】删除所有节点

通过以上麦当劳的例子，我们可以看到Neo4j的操作非常直观：CREATE/ MERGE：对应SQL的INSERT，用于创建节点和关系。MATCH：对应SQL的SELECT ... FROM，是查询的起点，用于定位图形中的模式。WHERE：对应SQL的WHERE，用于过滤结果。SET：对应SQL的UPDATE，用于更新属性。DELETE/ DETACH DELETE：对应SQL的DELETE，用于删除元素。

Neo4j的核心优势在于通过MATCH子句描述关联模式，例如(餐厅)-[供应]->(产品)，这使得查询复杂的关系网络变得简单和高效。

4、安装py2neo

py2neo 是 Python 连接和操作 Neo4j 图数据库的主要工具库，适用于需要处理复杂关系数据的应用场景。

二、数据预处理

数据预处理包括数据清洗、实体识别等步骤，目的是将原始数据转换为适合构建知识图谱的格式。

1、数据清洗

数据质量要求：补全缺失值：对于明显缺失的信息（如设备型号），可以标记为【缺失】或根据上下文推断。格式标准化：将日期统一为【YYYY-MM-DD】格式。去除重复值：删除重复的条目

2、知识建模

我们需要从业务角度理解数据，设计出合理的图谱结构。（1）识别实体

实体是知识图谱中的【节点】。在我的数据集中，可以识别出以下主要实体类型：订单记录：核心实体，每一笔订单就是一个销售事件。产品：订单中的商品。例如，“生日蛋糕”、“马卡龙”、“手冲咖啡”。数据中【产品名称】和【产品类别】是其属性。配方标准：制作产品的依据和标准。数据中【配方名称】、【配料序号】、【制作要点】等是其属性。客户反馈：客户对订单或产品的评价与建议。促销活动：与订单关联的营销方案。门店：订单发生的背景。

（2）识别实体属性

属性是描述实体的键值对。订单记录 的属性：下单时间、订单描述、订单金额、是否加急、订单状态、支付方式、配送地址。产品的属性：产品名称、产品类别、规格、单价、保质期、产品编号。配方标准 的属性：配方名称、配料序号、制作步骤、所需时间、适用产品。客户反馈 的属性：反馈内容、评分。促销活动 的属性：活动名称、折扣力度、适用条件。门店的属性：门店地址、营业时间、联系电话。

（3）识别关系

关系是连接实体的边，是图谱价值的体现。门店 -- 提供 --> 产品订单记录 -- 产生于 --> 门店订单记录 -- 包含 --> 产品订单记录 -- 触发 --> 促销活动订单记录 -- 收到 --> 客户反馈产品 -- 依据 --> 配方标准配方标准 -- 适用于 --> 产品

三、搭建知识图谱

下面代码为简化后的模板代码，需要根据自己的数据集进行修改后再运行。

运行后效果如下图：

llama.cpp量化模型部署实战：从模型转换到API服务

1. 为什么你需要关注llama.cpp：让大模型在普通电脑上跑起来如果你对AI大模型感兴趣，肯定听说过动辄需要几十GB显存的“庞然大物”。想在自己的电脑上跑一个7B参数的模型，以前可能得配一张昂贵的专业显卡。但现在，情况不一样了。我今天要跟你聊的 llama.cpp，就是那个能让大模型“瘦身”并飞入寻常百姓家的神奇工具。简单来说，llama.cpp是一个用C/C++编写的开源项目，它的核心目标只有一个：用最高效的方式，在消费级硬件（比如你的笔记本电脑CPU）上运行大型语言模型。它不像PyTorch那样是个庞大的深度学习框架，它更像一个“推理引擎”，专注于把训练好的模型，以最小的资源消耗跑起来。我刚开始接触大模型部署时，也被各种复杂的依赖和巨大的资源需求劝退过。直到用了llama.cpp，我才发现，原来在我的MacBook Pro上，也能流畅地和Llama 2这样的模型对话。这背后的功臣，主要就是两点：纯C/C++实现带来的极致性能，以及模型量化技术带来的体积与速度革命。量化这个词听起来有点技术，你可以把它想象成给模型“压缩图片”

极致压缩：Whisper.cpp 量化版本清单与 ggml 格式模型下载

Whisper.cpp 量化模型下载指南 Whisper.cpp 是 OpenAI Whisper 语音识别模型的高效 C++ 实现，支持量化技术来减小模型尺寸，实现“极致压缩”。量化通过降低模型参数的精度（如从 32 位浮点数到 4 位整数）来减少存储和计算需求，同时保持合理的准确性。ggml 格式是一种轻量级模型格式，专为资源受限设备优化。以下信息基于 Whisper.cpp 官方 GitHub 仓库（真实可靠），我将逐步引导您获取量化版本清单和下载链接。 1. 量化版本清单 Whisper.cpp 支持多种量化级别，每种对应不同的压缩率和精度权衡。以下是常见量化版本清单（基于最新官方数据）： * q4_0：4 位量化，极致压缩，模型尺寸最小，适合内存受限设备（如嵌入式系统）。精度损失较高。

VsCode 远程 Copilot 调用 Claude Agent 提示 “无效请求”？参数配置错误的修正

解决 VsCode 远程 Copilot 调用 Claude Agent 提示“无效请求”问题当在 VsCode 中通过远程 Copilot 调用 Claude Agent 时，若出现“无效请求”错误提示，通常与参数配置错误有关。以下方法可帮助排查和修正问题。检查 API 密钥配置确保 Claude Agent 的 API 密钥已正确配置在 VsCode 设置中。打开 VsCode 的设置文件（settings.json），验证以下参数是否完整： "claude.apiKey": "your_api_key_here"

大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表

Firefly vs LLaMA Factory 全方位对比表 + 生物医药垂类微调选型建议一、核心维度对比表格对比维度Firefly（流萤）LLaMA Factory开发主体个人开源：杨建新（YeungNLP），前Shopee NLP工程师，中山大学硕士社区开源：hiyouga核心维护，全球开源社区协同迭代项目定位聚焦中文大模型的轻量化训练框架+配套中文优化模型通用型全栈大模型微调框架，无语言/模型偏向，极致兼容支持基座模型以中文友好模型为主（Llama系列、Qwen、ChatGLM、Firefly自训模型），覆盖有限但深度适配全主流开源模型全覆盖（Llama、Qwen、Mistral、DeepSeek、GLM、Yi、Firefly等），几乎无适配成本支持微调方式基础SFT、LoRA/QLoRA、增量预训练，进阶对齐方法较少SFT、DPO/IPO/KTO、RLHF、预训练、多模态微调，全流程对齐方案完整中文优化原生深度优化：中文分词、语料、表达逻辑专项适配，

一、Neo4j图数据库

1、neo4j 安装 - mac brew版