简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

11 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

FPGA加速图像处理：核心算法全解析

FPGA（现场可编程门阵列）在图像处理领域因其并行处理能力、低延迟、高能效和可定制化的特点而极具优势，特别适合于实时性要求高、算法固定、功耗受限的应用场景。以下是FPGA上常实现的主流图像处理算法，按处理流程和类别划分：一、底层图像预处理（像素级操作）这类算法高度并行，非常适合FPGA。 1. 色彩空间转换 * RGB转灰度：Y = 0.299R + 0.587G + 0.114B，可通过移位和加法实现，无需乘法器。 * RGB与YCbCr互转：视频压缩（如JPEG， H.264）中的关键步骤，FPGA可以并行计算三个分量。 2. 几何变换 * 旋转、缩放、平移：需要插值算法（如双线性插值、最邻近插值）。FPGA可以并行计算多个输出像素的坐标和插值。 3. 图像校正 * 镜头畸变校正：通过查找表（LUT）

飞书/钉钉/QQ 机器人一站式搞定！OpenClaw Docker 部署教程

一、概述 OpenClaw-Docker-CN-IM（OpenClaw 中国IM平台整合Docker版本）是一款容器化应用，旨在提供集成中国主流IM平台的AI机器人网关解决方案。该镜像预装并配置了飞书、钉钉、QQ机器人、企业微信等插件，支持通过环境变量灵活配置，实现快速部署与数据持久化。同时集成了OpenCode AI代码助手、Playwright浏览器自动化工具及中文TTS语音合成功能，适用于需要构建多平台IM机器人的开发者与科研用户。本指南将详细介绍其Docker部署流程，包括环境准备、镜像拉取、容器配置、功能测试及生产环境优化建议，帮助用户快速实现服务部署与应用。二、项目简介与核心特性 2.1 项目简介 OpenClaw 中国 IM 插件整合版 Docker 镜像，预装并配置了飞书、钉钉、QQ机器人、企业微信等主流中国 IM 平台插件，让您可以快速部署一个支持多个中国 IM 平台的 AI 机器人网关。官方项目地址: https://github.com/justlovemaki/

6层高速PCB设计，立创-逻辑派FPGA-G1开发板，万字笔记。基于立创EDA高速PCB，FPGA,GW2A-LV18PG256C8/17、GD32F303CBT6学习笔记

个人声明：本文章为个人学习PCB六层板设计的学习记录。官方资料请参考嘉立创的相关教程。我用的是嘉立创EDA的专业版。最后我会放上立创开源广场的连接，大家可以去看一下，跟着官方学习一下，官方非常权威开源广场的地址我放在文章中，因为需要一个DXF文件，需要导入到EDA 并且六层以下都可以免费打板，对我帮助非常大，尤其是像我这种刚入门的新手来说，给予了很多试错机会，毕竟每个月可以免费打两次。而且立创EDA还是免费的，打开网页就能画板子，相当方便快捷。一.笔记前资料准备立创·逻辑派FPGA-G1是一款面向学习和开发的国产FPGA开发板，它的一大特点是采用了FPGA与ARM Cortex-M内核相结合的异构架构，并提供了非常完善的开源资料。主控：GW2A-LV18PG256C8/17、GD32F303CBT6 FPGA逻辑单元：20KHz。 ARM主频：120MHz。 DDR3内存：2Gbit FPGA端存储：FLASH16M/64M/128M ARM端存储：TF卡2GB/4GB/16GB/32GB FPGA端8P接口支持：Gowin程序下载、GAO在线逻辑仿真

CentOS环境下libwebkit2gtk-4.1-0安装配置手把手教程

手把手教你解决 CentOS 下 libwebkit2gtk-4.1-0 安装难题你有没有遇到过这样的场景？在 CentOS 上部署一个基于 GTK 的桌面应用，刚运行就报错： error while loading shared libraries: libwebkit2gtk-4.1.so.0: cannot open shared object file: No such file or directory 别急，这不是你的代码问题，而是系统里缺了关键的 Web 渲染引擎库 —— libwebkit2gtk-4.1-0 。这玩意儿听着冷门，但其实大有来头。它是 GNOME 桌面生态中许多应用程序（比如帮助手册、配置面板、文档浏览器）背后默默工作的“网页内核”。可偏偏在企业级稳定的