简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

09 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

Blockly可视化编程：零基础玩转智能家居设备控制

Blockly可视化编程：零基础玩转智能家居设备控制【免费下载链接】blocklyThe web-based visual programming editor. 项目地址: https://gitcode.com/gh_mirrors/bl/blockly 你是否曾想过让家中的智能设备按自己的想法工作，却被编程代码拒之门外？是否希望无需学习复杂语法就能打造个性化的智能家居场景？本文将带你用Blockly可视化编程工具，从零开始实现对智能灯、温控器等设备的控制，45分钟内完成属于你的第一个智能家居自动化项目。通过拖拽积木块，你将掌握设备联动逻辑设计、定时任务配置和传感器数据应用等核心技能，让科技真正服务于生活。问题导入：智能家居编程的门槛与破局之道当我们谈论智能家居，总会遇到这样的困境：专业的自动化场景需要编写复杂代码，而现成的App又无法满足个性化需求。传统文本编程动辄需要掌握Python、JavaScript等语言，光是语法错误就让很多用户望而却步。据统计，超过68%的智能家居用户因"不会编程"放弃了自定义场景设置（数据来源：智能家居用户行为报告）。 Blockl

【保姆级教程】从零入手：Python + Neo4j 构建你的第一个知识图谱

摘要：大数据时代，数据之间的关系往往比数据本身更有价值。传统的 SQL 数据库在处理复杂关系（如社交网络、推荐系统、风控分析）时显得力不从心，而知识图谱和图数据库 Neo4j 正是为此而生。本文将带你从 0 基础出发，理解知识图谱核心概念，安装 Neo4j 环境，并手把手教你用 Python 代码构建一个生动的人物关系图谱。拒绝枯燥理论，全是实战干货！一、什么是知识图谱与 Neo4j？在动手写代码之前，我们先用大白话把两个核心概念捋清楚。 1. 什么是知识图谱 (Knowledge Graph)？不要被高大上的名字吓到。知识图谱本质上就是把世界上的事物（节点）和它们之间的联系（关系）画成一张巨大的网。 * Excel 思维：罗列数据。例如：张三，25岁；李四，

必看：2026年跨维度AR测试工具进化论

AR测试工具的热度背景 2026年，增强现实（AR）技术正深度融入金融、电商、医疗等垂直领域，驱动跨维度测试需求激增。软件测试从业者面临空间交互、多设备兼容性等新挑战，公众号内容热度由此聚焦工具进化与实战解决方案。用户痛点如AR场景下的缺陷预测和自动化覆盖，成为流量核心驱动力，其中工具评测与AI融合话题占据主导地位。一、公众号热度内容全景解析 1. AI驱动的AR测试自动化（热度指数：95%）生成式AI工具（如ChatGPT）已重塑AR测试工作流，能自动生成80%的回归测试脚本，大幅降低人工耗时。热门内容如《2026年Top 5 AR测试工具》强调实操数据： * 效率提升：AI插件（如Selenium扩展）使AR空间定位测试效率提高30%，缺陷检出率提升40%。 * 爆款案例：某电商AR试穿功能的测试优化指南，单篇引流10万+，核心是提供免费AI脚本资源包。从业者关注点集中于低代码工具集成（如Testim）和Prompt工程技巧，以应对AR交互复杂性。 2. 云平台支持的跨维度测试（热度指数：88%）云测试平台（如AWS

智元 D1 强化学习sim-to-real系列 | Robot Lab 基于 Isaac Lab 的机器人强化学习使用（四）

1. 项目简介 Robot Lab 是一个基于 NVIDIA Isaac Lab 构建的机器人强化学习扩展库，专注于为各类机器人提供标准化的强化学习训练环境。该项目允许开发者在独立的环境中进行开发，而无需修改核心 Isaac Lab 仓库。对应ISaac lab 使用需要你参考并学习。然后可以参考Isaac Sim｜操作界面指南，ISAAC SIM安装与软件实践学习（二）—用户界面与工作流程，Nvidia Isaac Sim图形界面入门教程 2024（3）学习操作。最全的资料还是我们之前讲到的isaacsim官方教程以及isaaclab翻译版本 NVIDIA的机器人平台主要由两大核心组件构成，它们之间是层级关系：基础仿真平台Isaac Sim，以及构建于其上的机器人学习应用框架Isaac Lab。要精通 Isaac Sim，必须理解其分层架构中的五个核心概念。Isaac Sim 是什么？它是一个通用的机器人模拟器，提供了高保真的物理引擎（PhysX）和照片级的渲染技术（