从零到一：Ubuntu上llama.cpp的编译艺术与性能调优实战

优质文章学习记录

07 Apr 2026 — 2 min read

从零到一：Ubuntu上llama.cpp的编译艺术与性能调优实战

在人工智能技术快速发展的今天，大型语言模型(LLM)已成为开发者工具箱中不可或缺的一部分。而llama.cpp作为一款高效、轻量级的LLM推理框架，因其出色的性能和跨平台支持，越来越受到开发者的青睐。本文将带您深入探索在Ubuntu环境下编译和优化llama.cpp的全过程，从基础环境搭建到高级性能调优，为您呈现一套完整的解决方案。

1. 环境准备与基础编译

在开始编译llama.cpp之前，我们需要确保系统环境满足基本要求。Ubuntu 22.04 LTS是最推荐的系统版本，它提供了稳定的软件包支持和良好的兼容性。

首先更新系统并安装必要的开发工具：

sudo apt update && sudo apt upgrade -y sudo apt install -y build-essential cmake git curl libcurl4-openssl-dev

对于希望使用CUDA加速的用户，还需要安装NVIDIA驱动和CUDA工具包：

sudo apt install -y nvidia-driver-535 nvidia-cuda-toolkit

接下来，我们获取llama.cpp的源代码并初始化构建目录：

git clone https://github.com/ggerganov/llama.cpp cd llama.cpp mkdir build && cd build

基础编译配置使用CMake完成。对于纯CPU环境，推荐以下配置：

cmake .. -DLLAMA_CURL=ON -DBUILD_SHARED_LIBS=OFF

提示：-DLLAMA_CURL=ON启用了HTTP支持，-DBUILD_SHARED_LIBS=OFF创建静态链接库，便于部署。

编译过程可以使用多线程加速：

cmake --build . --config Release -j $(nproc)

编译完成后，主要生成以下可执行文件：

文件名	功能描述

Read more

手把手教你配置飞书 OpenClaw 机器人，打造企业级 AI 智能助手

手把手教你配置飞书 OpenClaw 机器人，打造企业级 AI 智能助手

目标：在飞书（Feishu/Lark）中添加 OpenClaw 机器人，实现 7×24 小时 AI 智能对话与自动化办公。 OpenClaw GitHub | feishu-openclaw 桥接项目想让你的机器人具备语音交互能力？试试 Seeed Studio 的 ReSpeaker 系列吧！我会后续出reSpeaker XVF3800与Openclaw联动实现语音输入的教程，完全开放源码。 reSpeaker XVF3800 是一款基于 XMOS XVF3800 芯片的专业级 4 麦克风圆形阵列麦克风，即使在嘈杂的环境中也能清晰地拾取目标语音。它具备双模式、360° 远场语音拾取（最远 5 米）、自动回声消除 (AEC)、自动增益控制 (AGC)、声源定位 (DoA)、去混响、波束成形和噪声抑制等功能。

OpenClaw基础-3-telegram机器人配置与加入群聊

OpenClaw基础-3-telegram机器人配置与加入群聊 💡 大家好，我是可夫小子，《小白玩转ChatGPT》专栏作者，关注AI编程、AI自动化和自媒体。 Openclaw的优势是接入各种聊天工作，在前面的文章里，已经介绍了如何接入飞书。但之前我也提到了，飞书的最大的问题是请求多的限制，以及无法在非认证企业账号下面组建群聊。但这些限制另一个聊天工具可以打破，那就是Telegram，今天就跟大家分享一下，如果在OpenClaw里面接入Telegram。第一步：Openclaw端配置通过命令openclaw config，local→channels→telegrams 这里等待输入API Token，接下来我们去Telegram里面获取第二步：Telegram端配置 1. 1. 在聊天窗口找到BotFather，打开对话与他私聊 2. 3. 然后再输入一个机器人，再输入一个账号名username，这里面要求以Bot或者Bot结尾，这个是全网的id，要 2. /newbot 来创建一个机器人，输入一个名字name

【论文阅读】加密流量-FlowMiner-徐洪波-INFOCOM2025

【论文阅读】加密流量-FlowMiner-徐洪波-INFOCOM2025

FlowMiner: A Powerful Model Based on Flow Correlation Mining for Encrypted Traffic Classification FlowMiner：一种基于流关联挖掘的强效加密流量分类模型徐洪波 1 , 2 , 4 , ∗ ^{1,2,4,*} 1,2,4,∗，司承祥 3 , ∗ ^{3,*} 3,∗，李树豪 4 , † ^{4,†} 4,†，程振宇 4 ^{4} 4，王晨旭 1 , 2 ^{1,2} 1,2，谢江 4 ^{4} 4，孙培帅 1

Stable Diffusion XL 1.0实战：灵感画廊的创意应用案例

Stable Diffusion XL 1.0实战：灵感画廊的创意应用案例 "见微知著，凝光成影。将梦境的碎片，凝结为永恒的视觉诗篇。" 1. 引言：当AI艺术遇见灵感画廊在数字艺术创作的世界里，我们常常面临这样的困境：有了惊艳的AI技术，却缺少一个能激发创作灵感的界面。传统的AI绘画工具往往充斥着复杂参数和技术术语，让创作过程变得冰冷而机械。灵感画廊（Atelier of Light and Shadow）正是为了解决这一痛点而生。它基于Stable Diffusion XL 1.0打造，却完全摒弃了工业化界面，转而营造一种艺术沙龙般的创作体验。在这里，技术参数变成了"意境预设"，提示词化身为"梦境描述"，整个创作过程如同一场与AI的私密对话。本文将带你深入体验这个独特的创作空间，通过实际案例展示如何将技术转化为艺术，让SDXL 1.0的强大能力在优雅的界面中完美绽放。