简单易学的分离式部署小米智能家居Miloco方法

Ne0inhk

23 Mar 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

Flutter 组件 simplify 的适配鸿蒙Harmony 实战 - 驾驭路径精简算法、实现鸿蒙端高性能地理足迹渲染与矢量图形优化方案

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 simplify 的适配鸿蒙Harmony 实战 - 驾驭路径精简算法、实现鸿蒙端高性能地理足迹渲染与矢量图形优化方案前言在鸿蒙（OpenHarmony）生态的运动健康轨迹展示、高精度室内导航以及大规模矢量地图看板开发中，“路径性能”是决定用户滑动流畅度的核心红线。面对用户运动 1 小时产生的包含数万个（X, Y）坐标点的原始 GPS 序列。如果直接将其交给鸿蒙端的渲染层进行绘制，不仅会引发由于顶点（Vertices）过多导致的 GPU 负载饱和。更会由于频繁的坐标点内存申请（Memory Allocation），产生严重的 UI 掉帧与功耗飙升。我们需要一种“去重存精、视觉无损”的几何精简艺术。 simplify 是一套专注于极致性能的 Douglas-Peucker 及其增强算法实现。它能瞬间将冗余的、

【接口自动化】初识pytest，一文讲解pytest的安装，识别规则以及配置文件的使用

🌟🌟🌟精彩读导本次我们将全面剖析接口自动化要点，包括其丰富的数据类型体系、高效的编码方式以及秒级响应的性能奥秘。对于渴望深入理解接口的技术爱好者，这是一次难得的学习机会！ 🔍 推荐扩展阅读了解更多数据库技术干货，访问小编的ZEEKLOG技术博客： 👉GGBondlctrl-ZEEKLOG博客👈 💖 读者互动您的每一个👍点赞、⭐收藏和✏️评论，都是我们持续输出优质技术内容的强大动力！期待在评论区看到您的见解 📚️前言目录编辑📚️前言 📚️1.自动化pytest框架 📚️2.pytest使用 2.1pytest的安装 2.2pytest的运行规则 2.3pytest的命令 2.3.1pytest -s 2.3.2pytest -v 2.3.3pytest test_module.py 2.4pytest配置文件 2.5前后置 📚️3.

yfinance完整教程：Python金融数据分析的5个高效技巧

yfinance完整教程：Python金融数据分析的5个高效技巧【免费下载链接】yfinanceDownload market data from Yahoo! Finance's API 项目地址: https://gitcode.com/GitHub_Trending/yf/yfinance yfinance作为Python金融数据获取的利器，让量化投资和数据分析变得前所未有的简单。无论你是金融分析师、数据科学家还是编程新手，都能通过这个强大的开源工具轻松访问全球市场数据。本教程将从快速上手到深度优化，带你全面掌握yfinance的核心功能。 🚀 快速上手：3分钟完成环境配置安装yfinance的正确姿势想要顺利使用yfinance，首先需要确保Python环境配置正确。推荐使用虚拟环境来避免依赖冲突，这是保障项目稳定运行的关键步骤。安装命令： pip install yfinance 如果你遇到网络问题或安装失败，可以尝试使用国内镜像源加速下载，这能显著提高安装成功率。安装完成后，通过简单的导入语句即可开始使用。基础数据获取演示 yfinanc

关于python -m http.server的一些安全问题

在测试环境中使用 python -m http.server 8080 可以快速启动一个web服务，测试一些简单的网页，但是如果要在公网发布页面还是存在一些安全问题的。 1. python -m http.server 的作用与安全风险 python -m http.server 8080 是 Python 内置的一个简单 HTTP 服务器，用于快速共享文件或调试。它的主要安全风险如下：（1）默认暴露当前目录所有文件 * 启动后，任何人（包括外网）都能访问你当前工作目录及子目录的所有文件，存在信息泄露风险。 * 例如：cd /etc && python3 -m http.server 8080会导致 /etc 目录下的敏感配置文件被公开访问。（2）无身份验证与加密 * 传输为明文 HTTP，