简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

07 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

Stable Diffusion XL 1.0艺术化落地：灵感画廊镜像免配置部署教程

Stable Diffusion XL 1.0艺术化落地：灵感画廊镜像免配置部署教程 1. 开篇：走进灵感画廊的艺术世界想象一下，你不需要学习复杂的参数设置，不需要面对冰冷的工业界面，只需要在一个充满艺术气息的空间里，用自然语言描述你的创意想法，就能生成高质量的艺术作品。这就是"灵感画廊"带给你的创作体验。灵感画廊是基于Stable Diffusion XL 1.0打造的沉浸式艺术创作工具。它把技术复杂性隐藏在优雅的界面背后，让你专注于创意本身。就像走进一个真正的艺术沙龙，这里没有繁琐的操作步骤，只有与AI的自然对话和灵感碰撞。无论你是专业设计师、艺术爱好者，还是完全不懂技术的创意人士，都能在几分钟内上手使用，开始你的艺术创作之旅。 2. 环境准备与一键部署 2.1 系统要求在开始之前，请确保你的环境满足以下要求： * 操作系统：Ubuntu 18.04+ 或 CentOS 7+ * GPU：

AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例

* 本文重点在于文心大模型的微调 * 一起来轻松玩转文心大模型吧👉一文心大模型免费下载地址: https://ai.gitcode.com/theme/1939325484087291906 计算机配置 * 在国内部署选个自带CUDA的会快一点，不自带还得去NVIDIA下载，而其提供的CUDA依赖需要科学上网才能下载快。换阿里清华源也没用。 * 文心模型汇总环境配置与部署 1. 更换镜像源（使用阿里云镜像源）： sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak sudo sed -i 's|http://archive.ubuntu.com/ubuntu|http://mirrors.aliyun.com/ubuntu|g' /etc/apt/sources.

MacOS 安装 OpenClaw 并接入飞书机器人（保姆级教程 + 常见问题解决）

MacOS 安装 OpenClaw 并接入飞书机器人（保姆级教程 + 常见问题解决）在 AI Agent 和自动化工具越来越普及的今天，越来越多开发者希望拥有一个能够自动处理任务、接入团队协作工具的 AI 助手。最近OpenClaw火的一塌糊涂，我也跟风研究了一下这个开源项目。它可以理解为一个可扩展的 AI Agent 框架，支持接入各种工具、自动执行任务，并且可以和企业协作平台（如飞书）打通，实现 AI 自动回复、自动化工作流。本文将带大家从 0 开始，在 MacOS 上安装 OpenClaw，并接入飞书机器人。同时我也整理了自己在安装过程中遇到的终端报错问题与完整解决方案，让你一次性避坑。本文包含： * MacOS 安装 OpenClaw * 接入飞书机器人 * 配置开机自启 * 终端报错解决（

不用写代码，AI 直接帮你出网站？实测三款国外“低代码”神器，谁才是最强辅助？

最近，AI 编程的风越刮越猛，仿佛只要你会打字，人人都能变身“全栈工程师”。以前做一个简单的页面，还得琢磨 HTML、CSS，现在直接把需求扔给 AI，几秒钟就能给你生成一个能跑的应用。今天，我就为大家深度测评三款国外非常火爆的 AI 低代码开发平台：bolt.new、lovable.dev 和 Firebase Studio。它们到底能不能真正解放生产力？免费额度够不够用？我们一个个来看。 01 bolt.new：像聊天一样做网页 bolt.new 是一个国外的 AI 低代码开发平台（网址：https://bolt.new/）。它的体验非常流畅，有点类似于国内的百度“秒哒”，非常适合用来快速搭建简单的页面或小工具。下面我们试着做一个简单的 BMI 计算器看看： 1）输入需求打开网站，直接在对话框里输入你的需求，