老手机 本地部署小龙虾OpenClaw(使用本地千问大模型)实机演示 Termux+Ubuntu+Llama 新手完整安装教程(含代码)

本教程提供从 0 到 1 的详细步骤,在安卓手机上通过 Termux 运行 Ubuntu,部署本地 Llama 大模型,并集成 OpenClaw 进行 AI 交互,全程无需 Root。建议手机配置:≥4GB 内存,≥64GB 存储,Android 7+。

一、准备工作

1.1 安装 Termux

  1. F-DroidGitHub下载最新版 Termux(避免应用商店旧版本)
  2. 安装并打开,首次启动会自动配置基础环境

1.2 手机设置优化

  1. 开启开发者选项(设置→关于手机→连续点击版本号 7 次)
  2. 开启USB 调试(部分手机需要)
  3. 授予 Termux存储权限(后续步骤会自动请求)

二、Termux 基础配置与 Ubuntu 安装

2.1 Termux 初始化与换源(加速下载)

bash

运行

# 1. 更新系统包 pkg update -y && pkg upgrade -y # 2. 安装必要工具 pkg install -y proot-distro git curl wget termux-exec # 3. 授予存储权限(允许访问手机文件) termux-setup-storage # 4. 更换国内源(解决下载慢问题) echo "deb https://mirrors.tuna.tsinghua.edu.cn/termux/apt/termux-main stable main" > $PREFIX/etc/apt/sources.list pkg update -y 

2.2 安装 Ubuntu 系统(Proot 容器,无需 Root)

bash

运行

# 1. 安装Ubuntu(默认最新LTS版本,约200MB) proot-distro install ubuntu # 2. 验证安装并登录Ubuntu proot-distro login ubuntu --isolated # --isolated参数必须加,避免环境变量冲突 # 登录成功后,终端提示符变为:root@localhost:~# 

三、Ubuntu 环境配置(核心依赖安装)

在 Ubuntu 终端中执行以下命令(确保已通过proot-distro login ubuntu进入):

3.1 系统更新与基础工具

bash

运行

# 1. 更新Ubuntu软件源 apt update -y && apt upgrade -y # 2. 安装必要依赖 apt install -y build-essential git curl wget nano python3 python3-pip nodejs npm 

3.2 安装 Node.js(OpenClaw 依赖,必须 v22+)

bash

运行

# 卸载旧版本(如果有) apt remove -y nodejs npm # 安装Node.js v22 LTS curl -fsSL https://deb.nodesource.com/setup_22.x | bash - apt install -y nodejs # 验证版本(应显示v22+) node -v && npm -v # 安装pnpm(OpenClaw推荐包管理器) npm install -g pnpm 

四、本地 Llama 模型部署(两种方案,推荐 Ollama)

方案 A:Ollama(推荐,新手友好,自动管理模型)

bash

运行

# 1. 安装Ollama(一键脚本) curl -fsSL https://ollama.com/install.sh | sh # 2. 启动Ollama服务(后台运行) nohup ollama serve > ollama.log 2>&1 & # 后台运行,日志保存到ollama.log # 3. 验证安装 ollama --version # 4. 下载轻量级Llama模型(手机推荐0.5B~7B参数) # 下载Qwen2.5-0.5B(中文支持好,仅需约300MB空间) ollama pull qwen2.5:0.5b # 或下载Llama 3.1-8B(英文优秀,约4.7GB) # ollama pull llama3.1:8b # 5. 测试模型(交互模式) ollama run qwen2.5:0.5b # 输入"你好"测试,输入"/bye"退出 

方案 B:llama.cpp(手动编译,适合高级用户)

bash

运行

# 1. 克隆llama.cpp仓库 git clone https://github.com/ggerganov/llama.cpp.git cd llama.cpp # 2. 编译(手机CPU优化) make LLAMA_NATIVE=1 LLAMA_NO_ACCELERATE=1 # 禁用加速,适配手机CPU # 3. 下载GGUF格式Llama模型(推荐Q4_K_M量化版,体积小速度快) # 下载Qwen2.5-0.8B-UD-Q4_K_M.gguf(约500MB) wget https://hf-mirror.com/Qwen/Qwen2.5-0.8B-UD/resolve/main/Qwen2.5-0.8B-UD-Q4_K_M.gguf -P models/ # 4. 启动llama.cpp API服务(OpenClaw可通过API访问) ./server -m models/Qwen2.5-0.8B-UD-Q4_K_M.gguf -c 2048 --host 0.0.0.0 --port 8081 # -c 2048:上下文窗口大小 # --host 0.0.0.0:允许外部访问 # --port 8081:API端口 

五、OpenClaw 安装与配置

5.1 安装 OpenClaw

bash

运行

# 1. 克隆OpenClaw仓库(或直接下载最新版) git clone https://github.com/openclaw/openclaw.git cd openclaw # 2. 安装依赖 pnpm install # 3. 初始化配置(自动生成.env文件) pnpm run setup 

5.2 配置 OpenClaw 连接本地 Llama 模型

情况 1:连接 Ollama(推荐)

在初始化过程中,按以下提示配置:

plaintext

? 请选择默认模型提供商: Ollama ? Ollama API 地址: http://localhost:11434 # Ollama默认端口 ? 请设置Ollama API密钥: ollama-local # 任意值即可,Ollama不需要真实密钥 ? 请选择默认模型: qwen2.5:0.5b # 选择已下载的模型 
情况 2:连接 llama.cpp API

bash

运行

# 修改.env文件 nano .env # 添加以下内容(替换原有Ollama配置) MODELS_PROVIDERS_CUSTOM_API_BASE_URL=http://localhost:8081/v1 MODELS_PROVIDERS_CUSTOM_API_KEY=sk-local # 任意值 DEFAULT_MODEL=custom:llama # 保存并退出(Ctrl+O,回车,Ctrl+X) 

5.3 启动 OpenClaw

bash

运行

# 开发模式启动(适合调试) pnpm run dev # 或生产模式启动(推荐,性能更好) pnpm run build pnpm run start # 启动成功后,会显示: # > OpenClaw is running on http://localhost:8080 

六、访问与使用 OpenClaw

6.1 本地访问(手机浏览器)

  1. 保持 Termux/Ubuntu 终端运行,不要关闭
  2. 打开手机浏览器,输入:http://localhost:8080
  3. 进入 OpenClaw 界面,在左侧选择 "模型交互"
  4. 右侧选择已配置的模型(如 qwen2.5:0.5b)
  5. 输入问题,点击 "发送",等待回复(手机性能有限,首次可能需要 10-30 秒)

6.2 局域网访问(其他设备)

bash

运行

# 查看手机IP地址(在Ubuntu终端执行) ip a # 查找inet后的地址,如192.168.1.100 # 其他设备浏览器输入:http://手机IP:8080 # 例如:http://192.168.1.100:8080 

七、常见问题解决

问题 1:Ollama 启动失败

bash

运行

# 查看日志 cat ollama.log # 常见修复:重启服务 pkill ollama nohup ollama serve > ollama.log 2>&1 & 

问题 2:OpenClaw 连接模型失败

bash

运行

# 1. 检查模型服务是否运行 # Ollama: curl http://localhost:11434/v1/models # 应返回模型列表 # llama.cpp: curl http://localhost:8081/v1/models # 应返回模型列表 # 2. 检查.env配置是否正确 cat .env # 3. 重启OpenClaw pnpm run restart 

问题 3:内存不足 / 运行缓慢

  1. 选择更小的模型(如 0.5B~2B 参数)
  2. 关闭其他后台应用
  3. 降低模型上下文窗口(llama.cpp 中-c 512代替-c 2048

七、完整操作流程总结(快速参考)

bash

运行

# 1. 启动Termux # 2. 进入Ubuntu proot-distro login ubuntu --isolated # 3. 启动Ollama服务(如果未启动) nohup ollama serve > ollama.log 2>&1 & # 4. 进入OpenClaw目录 cd openclaw # 5. 启动OpenClaw pnpm run start # 6. 打开浏览器访问http://localhost:8080 

八、进阶技巧

后台运行与进程管理

bash

运行

# 1. 查看后台进程 jobs # 2. 将前台进程转为后台(Ctrl+Z后) bg # 3. 恢复后台进程到前台 fg [进程号] # 4. 永久后台运行(重启后仍生效) echo "nohup ollama serve > ollama.log 2>&1 &" >> ~/.bashrc echo "cd /root/openclaw && pnpm run start" >> ~/.bashrc 

模型推荐(手机性能友好)

表格

模型名称参数大小占用空间推荐指数特点
Qwen2.5-0.5B0.5B~300MB★★★★★中文支持好,速度快
Llama 3.1-1B1B~600MB★★★★☆英文优秀,轻量级
Mistral-7B-Instruct-v0.37B~4GB★★★☆☆性能强,需≥8GB 内存

常见问题 Q&A

  1. 是否需要 Root?不需要!全程使用 Proot 容器技术,安全无风险
  2. 手机最低配置要求?建议≥4GB RAM,≥64GB 存储,Android 7+
  3. 模型下载慢怎么办?使用国内镜像源,如hf-mirror.com,或在电脑下载后通过 USB 传输到手机
  4. 如何关闭服务?
    • OpenClaw:Ctrl+C
    • Ollama:pkill ollama
    • Ubuntu:exit 退出,然后关闭 Termux

老手机 本地部署小龙虾OpenClaw(使用本地千问大模型)

现在你已经成功在手机上搭建了完整的本地 AI 环境,可以开始使用 OpenClaw 与 Llama 模型进行交互了!

大模型交流群:959957732

Read more

LangChain 消息处理全解析:缓存、过滤、合并与流式输出实战

LangChain 消息处理全解析:缓存、过滤、合并与流式输出实战

文章目录 * 一、消息内存缓存 * 核心概念 * 关键组件 * 代码流程 * 运行效果 * 二、消息过滤 * 核心概念 * 关键函数 * 过滤参数 * 代码示例 * 过滤逻辑 * 三、消息合并 * 核心概念 * 关键函数 * 代码示例 * 合并效果 * 两种使用方式 * 四、流式输出 * 什么是流式输出 * 为什么需要? * 典型应用 * 五、同步 vs 异步流式 * 核心区别 * 工作原理 * 何时使用异步? * 六、流式输出基础用法 * 同步流式 * 异步流式 * 七、输出解析器 * 八、流式输出实际应用 * 1. 聊天机器人 * 2. 多用户并发 * 3. FastAPI 集成 * 九、常见问题

openclaw webUI 空白页问题

部分使用win10安装openclaw,可能会出现OpenClaw启动WebUi,什么也看不到,就显示Not Found,这是因为使用的pnpm或npm安装的,web-ui路径没有指定,新版的没有这个问题了。 如图 解决办法是手动配置we-ui路径 # 一般的安装路径如下: C:\Users\你的用户名\AppData\Roaming\npm\node_modules\openclaw\dist\control-ui 修改openclaw.json文件,添加以下参数 {"controlUi":{"root":"C:/Users/86135/AppData/Roaming/npm/node_modules/openclaw/dist/control-ui"},}

不懂blender的前端工程师,不是好的程序员,带你一揽web3D技术栈

不懂blender的前端工程师,不是好的程序员,带你一揽web3D技术栈

作为前端工程师转向Blender+3D交互的数字孪生/智慧工厂领域,这是个非常有前景的方向! 一、核心基础技术 (前端3D核心) 1. Three.js * 为什么: Web端3D渲染的基石,90%的工业级Web3D项目基于它。 * 关键点: * 场景(Scene)、相机(Camera)、渲染器(Renderer) * 几何体(Geometry)、材质(Material)、光照(Light) * 加载器(GLTFLoader, OBJLoader) * 性能优化(实例化InstancedMesh, LOD, 遮挡剔除) 1. Blender (建模+数据导出) * 关键技能: * 工业设备建模(低多边形优化) * UV展开与纹理烘焙 * 动画制作(设备运动/状态切换) * glTF 2.0导出(首选格式,保留材质/

实测对比 32GB RTX 5090 与 48GB RTX 4090,多场景高并发测试,全面解析 AI 服务器整机性能与显存差异。

实测对比 32GB RTX 5090 与 48GB RTX 4090,多场景高并发测试,全面解析 AI 服务器整机性能与显存差异。

在AI算力快速演进的今天,用户对GPU的需求已经从单一性能转向显存容量、吞吐效率与稳定能效的综合考量。 随着RTX 5090的到来,我们看到了一款在AI模型推理、微调与中型训练任务中表现出色的全能GPU。与此同时,RTX 4090 48GB凭借更大的显存,在长上下文与多任务并发下仍具优势。 为此,我们基于赋创自研整机平台,对8× RTX 5090(32GB)与8× RTX 4090(48GB)进行了系统性实测对比,并同步参考24GB标准版4090的表现,希望能够帮助各位更客观地选择最合适的AI服务器方案。 一、单卡性能与显存差异 分析说明: ●32GB的RTX 5090在带宽与能效上具备显著优势,适合模型推理、参数微调及高并发多实例部署。 ●48GB 的RTX 4090在长上下文与多会话并发中更具稳定性: ○更大显存允许单卡容纳更完整的KV Cache与更长输入序列; ○避免24GB版本常见的页外KV/CPU Offload与调度延迟; ○Flash-Attention等高效内核能以更大Tile运行,减少同步与重排次数。 ●24GB版本在显存边缘运行时,容易出现反复内存回收与