简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

10 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

Mac Mini部署OpenClaw实战指南：打造7×24小时全天候AI数字管家

引言：当Mac Mini遇上OpenClaw 2026年，开源AI智能体OpenClaw已成为技术圈最炙手可热的话题——短短数月斩获超16.5万GitHub星标，社区成员突破8900人。这款原名Clawdbot/Moltbot的开源框架，能将大语言模型的推理能力转化为真实的系统操作力：管理文件、执行终端指令、调用本地应用、连接WhatsApp/Telegram/iMessage等数十种通信渠道。而Mac Mini，特别是搭载M4芯片的最新款，凭借其极致能效、静音运行、统一内存架构三大特质，成为运行OpenClaw的公认理想宿主。本文将手把手教你将一台Mac Mini打造成全天候在线的AI数字管家，同时深入探讨安全加固、性能优化与生产级部署的最佳实践。一、为什么是Mac Mini + OpenClaw？ 1.1 OpenClaw：本地AI智能体的核心价值 OpenClaw并非简单的聊天机器人，而是一个具备系统级权限的自主执行框架： * 文件系统操作：创建、编辑、删除文件，整理目录结构 * 终端指令执行：运行Shell命令，调用系统工具 * 应用控制：操作浏览器、

GTC2026前瞻+(一)Rubin与AI 工厂篇

关键信息：GTC 2026 的官方会期是 3 月 16 日到 19 日，黄仁勋主题演讲是 3 月 16 日 11 a.m.–1 p.m. PT，而 8–11 a.m. PT 是官方暖场直播；另外，Vera Rubin 平台并不是等到 GTC 2026 才首次亮相，它已经在 CES 2026 官宣，并确认将在 2026 年下半年随合作伙伴落地。(英伟达投资者网站) GTC 2026，不只是一次发布会：英伟达正在把 AI 从“

国内Sora-2 API接入实测：小镜AIGC平台技术评测与性价比分析

摘要：本文基于2025年10月实测数据，对国内AI模型接入平台的技术表现进行评估。随着Sora-2等先进AI模型API的开放，开发者和企业面临接入成本高、稳定性要求高的双重挑战。本文将从定价策略、失败处理机制、并发能力等多个维度，客观分析小镜AIGC开放平台的服务表现。 1. 国内AI模型接入现状当前，国内开发者接入国际先进AI模型面临多重挑战： * 直接接入壁垒高：国际主流AI服务商对国内用户存在注册限制、网络访问障碍 * 成本控制困难：官方API按量计费模式对中小规模应用不友好 * 技术集成复杂：需要处理网络优化、错误重试、负载均衡等技术细节在此背景下，专业的API中转服务平台成为许多开发团队的务实选择。 2. 平台概况：小镜AIGC开放平台小镜AIGC开放平台（https://aigc.x-see.cn/）提供多模型统一接入服务，支持包括Sora-2、Claude、Gemini-3等主流AI模型。平台定位为技术中立方，专注于提供稳定、高效的API转发服务。 3. 核心技术指标实测分析 3.1 定价与计费模型分析这是小镜API最引人注目的特点。

Mac基于LLaMA Factory微调模型导入Ollama踩坑记录

Mac基于LLaMA Factory微调模型导入Ollama踩坑记录 * 一、llama Factory安装 * 二、模型下载&验证 * 三、数据集准备 * 四、训练&验证效果 * 五、导出ollama 记录下完成大模型微调demo遇到的问题及最终效果一、llama Factory安装 # 通过git下载项目git clone https://github.com/hiyouga/LLaMA-Factory.git # 进入目录cd LLaMA-Factory # 安装 pip install -e ".[torch,metrics]" 遇到问题1：ERROR: Package 'llamafactory' requires a different Python: 3.