昇腾设备部署llama.cpp

优质文章学习记录

10 Apr 2026 — 1 min read

硬件环境：

Atlas 800I A2

CPU：KunPeng920 * 192

NPU：Atlas 910B4-1 * 8

内存：1000G

软件环境

操作系统：OpenEuler22.03 LTS

内核：5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动：24.1.rc2

docker：26.1.3

为了不影响物理环境，安装是在docker容器环境中进行，

由于目前llama.cpp只支持openeuler22.03和ubuntu 22.04，可以下载一个对应操作系统的镜像

此处以vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64镜像为例

拉取镜像：

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持Atlas 300I Duo Atlas 300T A2（Ascend 910B4）

起容器：

docker run -it -d --net=host --shm-size=500g \ --privileged \ --name vllm-ascend \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ --device=/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/

Read more

RAG 五大应用场景（三）企业级 Code RAG 与代码库 Copilot 深度架构指南

RAG 五大应用场景（三）企业级 Code RAG 与代码库 Copilot 深度架构指南

文章目录 * 1. 引言：为什么你的代码助手总是“差点意思”？——一场凌晨 2 点的生产力惨案 * 2. 核心洞察：代码是图，不是文本 —— 为什么传统切分必“翻车”？ * 2.1 “文本刀法”的三大原罪 * 1. 语义连贯性被物理斩断（Semantic Decapitation） * 2. 噪声泛滥与上下文窗口的极度浪费（Context Pollution） * 3. 依赖缺失：硬伤中的硬伤（Missing Dependencies） * 3. 技术范式转移：引入 Tree-sitter 与 AST 结构化索引 * 3.1 降维打击的武器：Tree-sitter * 3.2 节点元数据（Metadata）建模：构建代码知识图谱 * 3.3

【全网最全・保姆级】Stable Diffusion WebUI Windows 部署 + 全套报错终极解决方案

大家好，我是在部署 SD WebUI 过程中把几乎所有坑都踩了一遍的选手，从 Git 报错、模块缺失、依赖冲突到虚拟环境异常，全部踩完。今天把完整安装流程 + 我遇到的所有真实错误 + 一行一解全部整理出来，写成一篇能直接发 ZEEKLOG 的完整文章。一、前言 Stable Diffusion WebUI 是目前 AI 绘画最主流的本地部署工具，但 Windows 环境下因为 Python 版本、虚拟环境、Git 仓库、依赖包、CLIP 编译等问题，90% 的新手都会启动失败。本文包含： * 标准 Windows 一键部署流程 * 我真实遇到的 10+ 种报错 * 每一种报错的原因 + 直接复制可用的命令 * 最终测试出图提示词（

Claude Code 的完美平替：OpenCode + GitHub Copilot（顶级模型+最优价格）

引言：Claude 虽好，但你真的能用上吗？在当前席卷全球的“Vibe Coding”浪潮中，Anthropic 推出的 Claude 系列模型 + 终端工具 Claude Code，凭借极强的逻辑推理能力，成为了开发者眼中的“白月光”。但现实是残酷的：对于中国开发者而言，账号随时被封、海外信用卡支付遭拒、API 额度受限以及复杂的网络环境，构成了一道难以逾越的门槛。虽然最近国产编程模型不断发力，Claude Code + GLM-4.7 的表现非常出色，但面对复杂问题，Claude系列模型依然完胜。难道我们只能眼馋Claude全家桶的编程体验吗？作为一名追求极致生产力的开发者，我发现了一个绝佳的完美替代方案：OpenCode + GitHub Copilot。这个组合不仅能让你享受如 GLM-4.7 一样的性价比，还能更方便的使用 Claude 的顶级模型。 Claude Code 的开源平替：OpenCode

AI 编程工具选型：Copilot、Cursor、Codex 核心差异

AI 编程工具选型：Copilot、Cursor、Codex 核心差异

【如文章引起大家共鸣，请“点赞”以及“转发”，以支持继续创作，谢谢大家！】朋友们大家好！今天咱们不聊那些虚头巴脑的，直接来点实在的——AI编程工具选型，Copilot、Cursor、Codex这仨到底咋选？别急，我这就用最接地气的方式，给你唠唠它们的“脾气秉性”，保证你听完就能上手挑！先说Copilot，这哥们儿可是“代码补全界的扛把子”！它就像你身边的“代码小秘书”，你敲代码时，它就在旁边默默观察，你刚敲个“for”，它立马给你补上“(int i=0;i<n;i++)”，那叫一个快！而且，它还支持多IDE，VS Code、JetBrains啥的，都能无缝对接。不过呢，Copilot也有个“小毛病”，就是它更擅长“补全”，对于复杂的代码重构或者项目级理解，就有点力不从心了。