node-llama-cpp安装与配置：Windows、Linux和Mac全平台教程

优质文章学习记录

07 Apr 2026 — 4 min read

node-llama-cpp安装与配置：Windows、Linux和Mac全平台教程

【免费下载链接】node-llama-cppRun AI models locally on your machine with node.js bindings for llama.cpp. Force a JSON schema on the model output on the generation level 项目地址: https://gitcode.com/gh_mirrors/no/node-llama-cpp

node-llama-cpp是一个基于llama.cpp的Node.js绑定库，让你能够在本地机器上运行AI模型，并在生成级别强制模型输出符合JSON模式。本文将为你提供Windows、Linux和Mac全平台的安装与配置教程，帮助你快速上手这款强大的AI工具。

一、准备工作

在开始安装node-llama-cpp之前，请确保你的系统满足以下要求：

Node.js环境（建议使用最新的LTS版本）
npm包管理器
Git版本控制工具

二、快速安装：使用npm

node-llama-cpp提供了预构建的二进制文件，适用于macOS、Linux和Windows系统，因此安装过程非常简单。只需在终端中运行以下命令：

npm install node-llama-cpp

这条命令会自动下载并安装适合你当前系统的预构建二进制文件。如果你的系统没有可用的预构建二进制文件，node-llama-cpp会自动下载llama.cpp的源代码并尝试从源码构建。

三、Windows系统详细安装指南

3.1 安装依赖

在Windows系统上，如果你需要从源码构建node-llama-cpp，需要安装以下构建工具：

你可以通过WinGet安装所有依赖：

winget install --id Microsoft.VisualStudio.2022.BuildTools --force --override "--add Microsoft.VisualStudio.Component.VC.CMake.Project Microsoft.VisualStudio.Component.VC.CoreBuildTools Microsoft.VisualStudio.Component.VC.Tools.x86.x64 Microsoft.VisualStudio.Component.VC.ATL Microsoft.VisualStudio.Component.VC.ATLMFC Microsoft.VisualStudio.Component.VC.Llvm.ClangToolset Microsoft.VisualStudio.Component.VC.Llvm.Clang Microsoft.VisualStudio.Component.VC.Redist.14.Latest Microsoft.Component.VC.Runtime.UCRTSDK Microsoft.VisualStudio.Component.Windows10SDK Microsoft.VisualStudio.Component.Windows10SDK.20348"

WinGet是Windows 11和现代Windows 10版本的内置工具。

或者，你也可以手动下载并安装Visual C++ Build Tools，确保勾选以下组件：

C++ CMake工具
C++ Clang编译器
Windows 10 SDK
Windows Universal CRT SDK

3.2 Windows on Arm额外要求

如果你使用的是Windows on Arm系统，需要安装额外的构建工具：

winget install --id Microsoft.VisualStudio.2022.BuildTools --force --override "--add Microsoft.VisualStudio.Component.VC.CMake.Project Microsoft.VisualStudio.Component.VC.CoreBuildTools Microsoft.VisualStudio.Component.VC.Tools.x86.x64 Microsoft.VisualStudio.Component.VC.Tools.ARM64 Microsoft.VisualStudio.Component.VC.ATL Microsoft.VisualStudio.Component.VC.ATL.ARM64 Microsoft.VisualStudio.Component.VC.ATLMFC Microsoft.VisualStudio.Component.VC.MFC.ARM64 Microsoft.VisualStudio.Component.VC.Llvm.ClangToolset Microsoft.VisualStudio.Component.VC.Llvm.Clang Microsoft.VisualStudio.Component.VC.Redist.14.Latest Microsoft.Component.VC.Runtime.UCRTSDK Microsoft.VisualStudio.Component.Windows10SDK Microsoft.VisualStudio.Component.Windows10SDK.20348"

四、Linux系统详细安装指南

4.1 安装依赖

在Linux系统上，你需要安装以下依赖：

build-essential
cmake
git
libstdc++6
libgomp1 (用于OpenMP支持)

对于Debian/Ubuntu系统，可以使用以下命令安装：

sudo apt-get update sudo apt-get install build-essential cmake git libstdc++6 libgomp1

4.2 从源码构建

如果需要从源码构建，可以使用以下命令：

npx node-llama-cpp source download npx node-llama-cpp source build

五、Mac系统详细安装指南

5.1 安装Xcode命令行工具

在Mac上，你需要安装Xcode命令行工具：

xcode-select --install

5.2 安装依赖

使用Homebrew安装必要的依赖：

brew install cmake git

5.3 从源码构建

如果需要从源码构建，可以使用以下命令：

npx node-llama-cpp source download npx node-llama-cpp source build

六、配置模型自动下载

为了确保在运行npm install后自动下载模型，建议在package.json中设置postinstall脚本。详细方法可以参考官方文档中的Using the CLI部分。

七、常见问题解决

7.1 构建失败

如果构建失败，请确保你已安装所有必要的构建工具和依赖。对于特定平台的问题，可以参考building-from-source文档。

7.2 Windows上的权限问题

如果在Windows上遇到权限错误，确保不要使用管理员账户运行npm install，然后用普通用户账户运行代码。

7.3 Electron应用构建问题

在Windows上构建Electron应用时，如果遇到EPERM: operation not permitted错误，需要启用开发者模式以允许创建符号链接。

八、总结

通过本教程，你已经了解了如何在Windows、Linux和Mac系统上安装和配置node-llama-cpp。现在你可以开始在本地运行AI模型，享受高效的AI推理体验了。如果需要更多帮助，可以查阅项目的官方文档或提交issue寻求支持。

祝你使用愉快！ 🚀

ROS2机器人slam_toolbox建图零基础

系统：Ubuntu22.04 ROS2版本：Humble 雷达设备：rplidar_a1 一、安装必要的软件包 # 更新系统 sudo apt update # 安装slam_toolbox sudo apt install ros-humble-slam-toolbox # 安装RPLidar驱动 sudo apt install ros-humble-rplidar-ros # 安装导航相关包 sudo apt install ros-humble-navigation2 ros-humble-nav2-bringup 二、配置RPLidar_A1 创建udev规则（让系统识别雷达） # 创建udev规则 echo 'KERNEL=="ttyUSB*", ATTRS{idVendor}=="10c4", ATTRS{idProduct}

【硬核实战】Mac mini M4 部署 OpenClaw + Ollama 本地大模型：从零到一打通飞书机器人

文章目录 * 一、核心环境准备 * 二、避坑指南：环境初始化在 Mac 终端部署时，首要解决的是权限与路径问题。 * 1. 终端常用快捷键* `Control + C`：强制停止当前运行的命令（如安装卡死时）。 * 2. Node.js 环境修复若遇到 `zsh: command not found: openclaw`，说明 NVM 路径未加载。 * 3. 临时加载环境 * 4. 永久写入配置 * 三、模型选择：M4 性能调优 * 四、 OpenClaw 配置手术 (JSON 详解) * 五、飞书机器人接入：最后的临门一脚 * 六、运行与调试 * 启动 Gateway * 第一次发消息需授权 (Pairing) * 💡 结语

2026实测｜DeepSeek-R1-Distill-Qwen-1.5B部署全攻略（vLLM+Open WebUI，0.8GB显存就能跑，告别服务器瓶颈）

前言：2026年，轻量级大模型部署已成为开发者核心需求——专业GPU服务器成本高昂、边缘设备算力有限，多数1.5B级模型仍需3GB以上显存，让个人开发者与中小企业望而却步。而DeepSeek-R1-Distill-Qwen-1.5B（下称“DQ-1.5B”）的出现打破僵局，通过知识蒸馏技术在1.5B参数体量下实现接近7B级模型的推理能力，配合vLLM推理加速与Open WebUI可视化交互，实测0.8GB显存即可稳定运行，无需高端服务器，个人PC、边缘设备均可轻松落地。本文结合2026年最新实测数据，从核心原理、分步实操、实测验证、应用场景、落地案例到问题排查，打造零冗余、高可用的部署全攻略，兼顾专业性与实用性，助力开发者快速上手，轻松实现轻量级大模型本地化部署。一、核心技术解析部署前先理清三大核心组件的核心逻辑，无需深入底层源码，聚焦“为什么能用、为什么高效”，贴合开发者落地需求。 1.1 模型核心：DeepSeek-R1-Distill-Qwen-1.5B 优势解析 DQ-1.5B是DeepSeek团队基于Qwen-1.

前端跨子域通讯深度解读：跳出基础，聚焦避坑

在前端开发中，“跨域”是绕不开的话题，而“跨子域”作为跨域的一种特殊场景（如 a.example.com 与 b.example.com），因主域一致、子域不同的特性，既有别于完全跨域（如 example.com 与 test.com），也存在专属的通讯技巧和避坑点。多数文章仅罗列“可用方案”，却忽略了不同场景下的选型逻辑、实际落地中的细节问题，以及生产环境中的最佳实践。本文将从“痛点拆解→方案深度解析（含代码+场景）→避坑指南→最佳实践”四个维度，真正了解跨子域通讯，而非停留在“知道有哪些方法”的层面。一、先搞懂：跨子域通讯的核心痛点（区别于普通跨域）跨子域的核心特点是「主域相同，子域不同」，这就决定了它的痛点的特殊性，而非普通跨域的“