ClawdBot 本地 AI 实践：树莓派 4 运行 OCR/Whisper/vLLM 高并发

ClawdBot 本地 AI 实践：树莓派 4 运行 OCR/Whisper/vLLM 高并发 | 极客日志

docker run -d \
 --name moltbot \
 -e TELEGRAM_BOT_TOKEN="your_bot_token_here" \
 -e TZ=Asia/Shanghai \
 -p 8000:8000 \
 -v /path/to/config:/app/config \
 --restart=always \
 moltbot/moltbot:latest

{
  "models": {
    "mode": "merge",
    "providers": {
      "vllm": {
        "baseUrl": "http://localhost:8000/v1",
        "apiKey": "sk-local",
        "api": "openai-responses",
        "models": [
          {
            "id": "Qwen3-4B-Instruct-2507",
            "name": "Qwen3-4B-Instruct-2507"
          }
        ]
      }
    }
  }
}

# moltbot/workflows/translate.py（示意）
def post_edit_translation(text, target_lang):
    response = requests.post(
        "http://localhost:7860/v1/chat/completions",
        headers={"Authorization": "Bearer sk-local"},
        json={
            "model": "vllm/Qwen3-4B-Instruct-2507",
            "messages": [{
                "role": "user",
                "content": f"请将以下{target_lang}文本润色为更自然的表达，保持原意不变：{text}"
            }]
        }
    )
    return response.json()["choices"][0]["message"]["content"]

# 查看待审批设备请求
clawdbot devices list
# 批准请求（request ID 来自上一步输出）
clawdbot devices approve abc123-def456
# 此时控制台已可访问 http://localhost:7860

clawdbot dashboard
# 输出类似：
# Dashboard URL: http://127.0.0.1:7860/?token=23588143fd1588692851f6cbe9218ec6b874bb859e775762

# 在你的 Mac/Windows 电脑终端执行
ssh -N -L 7860:127.0.0.1:7860 [email protected]
# 然后浏览器访问 http://localhost:7860

{
  "id": "Qwen2.5-7B-Instruct-GGUF",
  "name": "Qwen2.5-7B-Instruct-GGUF",
  "format": "gguf",
  "quantization": "q4_k_m"
}

clawdbot models list
# 输出应包含新模型
# vllm/Qwen2.5-7B-Instruct-GGUF text 32k yes yes

指标	数值	说明
平均 CPU 占用	68.3%	峰值出现在多张图片并发 OCR 时（82%），未触发温控降频
内存占用	3.1 GB / 3.8 GB 可用	vLLM 常驻 1.2GB，Whisper+OCR 共占 0.9GB，系统缓存 1.0GB
平均响应延迟	0.92 秒	语音转写 0.35s + 翻译 0.28s + 发送 0.29s
图片 OCR 延迟	1.17 秒	含上传、预处理、识别、标注、返回全流程
错误率	0.0%	全程无超时、无模型加载失败、无队列溢出

ClawdBot 本地 AI 实践：树莓派 4 运行 OCR/Whisper/vLLM 高并发

ClawdBot 本地 AI 实践：树莓派 4 运行 OCR/Whisper/vLLM 高并发

1. 什么是 ClawdBot？一个真正属于你的本地 AI 助手

2. MoltBot：Telegram 上的全能翻译官，5 分钟上线

2.1 一句话看懂它能做什么

2.2 它到底有多'零配置'？

2.3 为什么树莓派 4 能扛住 15 人并发？

3. ClawdBot 与 MoltBot 的关系：本地 AI 能力的两种形态

3.1 架构视角：一个内核，两种封装

3.2 配置复用：如何让 MoltBot 用上你自己的 vLLM 模型

4. 实操指南：从零部署 ClawdBot 控制台

4.1 访问控制台的三种方式

4.2 模型热切换：不重启服务更换大模型

5. 性能实测：树莓派 4 上的多模态并发能力

5.1 测试环境与方法

5.2 关键数据结果

5.3 为什么它不卡顿？三个关键优化点

6. 总结：本地 AI 的实用主义胜利

更多推荐文章

相关免费在线工具

ClawdBot 本地 AI 实践：树莓派 4 运行 OCR/Whisper/vLLM 高并发

ClawdBot 本地 AI 实践：树莓派 4 运行 OCR/Whisper/vLLM 高并发

1. 什么是 ClawdBot？一个真正属于你的本地 AI 助手

2. MoltBot：Telegram 上的全能翻译官，5 分钟上线

2.1 一句话看懂它能做什么

2.2 它到底有多'零配置'？

2.3 为什么树莓派 4 能扛住 15 人并发？

3. ClawdBot 与 MoltBot 的关系：本地 AI 能力的两种形态

3.1 架构视角：一个内核，两种封装

3.2 配置复用：如何让 MoltBot 用上你自己的 vLLM 模型

4. 实操指南：从零部署 ClawdBot 控制台

4.1 访问控制台的三种方式

4.2 模型热切换：不重启服务更换大模型

5. 性能实测：树莓派 4 上的多模态并发能力

5.1 测试环境与方法

5.2 关键数据结果

5.3 为什么它不卡顿？三个关键优化点

6. 总结：本地 AI 的实用主义胜利

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具