简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

08 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

基于Vivado的RISC-V五级流水线CPU FPGA实现详解

手把手教你用 Vivado 实现一个 RISC-V 五级流水线 CPU（FPGA 实战全记录）当问题从课本走向 FPGA 开发板你有没有过这样的经历？在《计算机组成原理》课上听得头头是道：五级流水、数据旁路、控制冒险……可一旦打开 Vivado 想自己搭一个，瞬间懵了——PC 怎么跳？寄存器文件读写冲突怎么办？分支预测失败后怎么“擦屁股”？别慌。我也是这么过来的。今天，我就带你从零开始，在 Xilinx Artix-7 FPGA 上实现一个完整的 RISC-V 五级流水线 CPU 。不是仿真玩玩，而是真正能跑通汇编程序、点亮 LED 的硬核项目。我们不堆术语，不照搬教材框图，只讲你真正需要知道的实战细节：每个模块怎么写，关键信号怎么连，

基于腾讯云云服务器搭建一个Clawdbot，实现Telegram机器人自动回复

哈咯大家好，这里依然是码农的搬运工！！从25年开始，全球都开始走向AI，拥抱AI。最近博主，也就是我，发现一个国外作者，【Peter Steinberger】在本月推出了一个新的智能体【Clawdbot】，首先我们可以先去官网看一下这个东西是什么：Clawdbot 那么我也是研究了一把，但是这个文档实在是差点把我这个大专生劝退，纯英文，废了九牛二虎之力，我才差不多看懂了。肯定有小伙伴比较好奇，那么文档给你们放出来你们也可以看看：https://docs.molt.bot/start/getting-started OK！话不多说，那我们开始实操一下：首先呢，看了一下这个文档，安装环境还是不错的，macOS/Linux、Windows【Powershell/CMD】而且作者还贴心的给了安装命令，这样就省了好大一部分精力。不需要费劲去git拉取代码编译了。【这里需要注意一点，macos系统得14+，作者只有13的系统，所以是没有办法弄mac的】当然，如果有小伙伴就是头铁，还是想从git上拉代码，那我也给你贴一下这个文档，你来安装：

毕业设计：基于neo4j的知识图谱的智能问答系统（源码）

一、项目背景知识图谱作为人工智能领域重要的知识表示与推理技术，近年来已成为实现机器认知智能的核心基础设施。它将海量、异构的实体、属性及其复杂关系，以图结构的形式进行语义化组织与存储，形成了一张能够被计算机理解和处理的“知识网络”。在信息爆炸的时代，传统基于关键词匹配的搜索引擎和问答系统，往往难以理解用户查询背后的深层语义与意图，导致返回结果碎片化、准确性不足，尤其无法有效回答涉及多跳推理、关系路径挖掘的复杂问题。例如，面对“李白最欣赏的诗人是谁？”或“与《静夜思》情感基调相似的杜甫作品有哪些？”这类问题，传统系统往往束手无策。因此，构建能够理解复杂语义、进行关联分析与逻辑推理的智能问答系统，成为提升信息获取效率与智能化水平的关键需求。在各行业知识密集型应用（如医疗诊断辅助、金融风控、智慧教育等）的驱动下，基于知识图谱的智能问答（KBQA）技术展现了巨大潜力。它通过将自然语言问题解析为对知识图谱的结构化查询，能够直接返回精准、结构化的答案，而非一系列相关网页链接，实现了从“信息检索”到“知识问答”的质变。这一技术路径对于传承与梳理中华优秀传统文化，特别是像古诗词这样蕴含丰富人物、

【STM32项目开源】基于STM32的智能家居环境监测系统

目录一、设计背景和意义 1.1设计背景 1.2设计意义二、实物效果展示 2.1实物图片 2.2实物演示视频三、硬件功能简介 3.1项目功能详解 3.2元器件清单四、主框图与软件流程图五、硬件PCB展示六、软件程序设计七、项目资料包内容资料获取：查看主页介绍“充哥单片机设计” 一、设计背景和意义 1.1设计背景随着物联网（IoT）、嵌入式系统和云计算等技术的飞速发展，智能家居系统正在逐渐改变人们的生活方式。智能家居不仅仅是简单的远程开关控制，而是向着环境感知、自主判断、智能决策的方向不断演进。特别是在城市化进程加快、生活节奏加快的背景下，用户对生活便捷性、家庭安全性和环境舒适度的要求不断提高，这对智能家居系统的综合感知、智能响应能力提出了更高的要求。当前市面上的智能家居产品多以分立模块存在，系统功能较为单一，