昇腾设备部署llama.cpp

硬件环境:

Atlas 800I A2

CPU:KunPeng920 * 192

NPU:Atlas 910B4-1 * 8

内存:1000G

软件环境

操作系统:OpenEuler22.03 LTS

内核:5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动:24.1.rc2

docker:26.1.3

为了不影响物理环境,安装是在docker容器环境中进行,

由于目前llama.cpp只支持openeuler22.03和ubuntu 22.04,可以下载一个对应操作系统的镜像

此处以vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64镜像为例

拉取镜像:

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持Atlas 300I Duo Atlas 300T A2(Ascend 910B4)

起容器:

docker run -it -d --net=host --shm-size=500g \ --privileged \ --name vllm-ascend \ --device=/dev/davinci_manager \ --device=/dev/hisi_hdc \ --device=/dev/devmm_svm \ -v /usr/local/Ascend/driver:/usr/local/

Read more

从对话到协作:深度解析 WebMCP —— 开启浏览器端的 AI 智能体新时代

从对话到协作:深度解析 WebMCP —— 开启浏览器端的 AI 智能体新时代

在 2024 年底,Anthropic 推出了 MCP (Model Context Protocol),试图为 AI 模型与外部数据源之间构建一条“通用数据总线”。然而,对于广大的前端开发者和 Web 生态来说,传统的 MCP 更多是在后端或桌面端发力。 2025 年初,由 Google 和 Microsoft 工程师联合发起的 WebMCP 提案正式进入 W3C Web 机器学习社区组(WebML CG)的视野。它标志着 AI 智能体(Agent)正式获得了与 Web 页面进行“结构化对话”的官方绿卡。 本文将为你深度拆解 WebMCP 的前世今生、核心机制以及它将如何重塑前端开发者的技能图谱。 一、 为什么我们需要

前端SSG:静态站点生成的艺术

前端SSG:静态站点生成的艺术 毒舌时刻 前端SSG?这不是给博客用的吗? "我的应用需要动态内容,SSG不适合"——结果首屏加载慢,SEO差, "SSG就是静态HTML,太简单了"——结果构建时间长,数据更新困难, "我用SSR就够了"——结果服务器压力大,响应慢。 醒醒吧,SSG不是简单的静态HTML,而是一种现代化的前端架构! 为什么你需要这个? * 性能优异:静态文件加载快,无需服务器渲染 * SEO友好:所有内容都是静态的,搜索引擎容易收录 * 部署简单:可以部署到任何静态文件服务器 * 安全性高:没有服务器端代码,减少攻击面 反面教材 // 反面教材:纯静态HTML <!DOCTYPE html> <html> <head>

一天一个开源项目(第24篇):OpenClawInstaller - 一键部署私人 AI 助手 OpenClaw

一天一个开源项目(第24篇):OpenClawInstaller - 一键部署私人 AI 助手 OpenClaw

引言 “把 Claude/GPT 装进 Telegram、Discord、飞书——一条命令完成环境检测、安装、配置与启动。” 这是"一天一个开源项目"系列的第24篇文章。今天带你了解的项目是 OpenClawInstaller(GitHub),由 miaoxworld 维护。 OpenClaw(官网 clawd.bot)是一个可自托管的 AI 助手网关:接入 Claude、GPT、Gemini、Ollama 等模型,通过 Telegram、Discord、WhatsApp、飞书、Slack、微信等渠道与你对话,并具备持久记忆、主动推送、技能系统与可选的远程控制能力。但若从零安装 OpenClaw、配置 Node 环境、

AI的提示词专栏:写作助手 Prompt,从提纲到完整文章

AI的提示词专栏:写作助手 Prompt,从提纲到完整文章

AI的提示词专栏:写作助手 Prompt,从提纲到完整文章 本文围绕写作助手 Prompt 展开,阐述其核心价值在于降低写作门槛、提升效率与保证内容质量,介绍其 “指令目标、背景信息、输出约束、示例引导” 的基础结构。文章详细拆解从提纲生成到全文创作再到优化的三步流程,每步均提供含指令目标、背景信息、输出约束的 Prompt 示例,搭配预期输出与技巧分析,同时针对短篇文案、学术文章等不同场景给出 Prompt 调整策略,还解答了模型生成提纲偏离主题、内容缺乏论据、风格不统一等常见问题,最后总结核心要点并提出多轮迭代优化、结合工具使用等扩展建议,为高效生成符合需求的内容提供全面指导。 人工智能专栏介绍     人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的 AI 知识库,把提示词设计、AI 创作、智能绘图等多个细分领域的知识整合起来。无论你是刚接触 AI 的新手,还是有一定基础想提升的人,都能在这里找到合适的内容。从最基础的工具操作方法,到背后深层的技术原理,