简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

05 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

基于FPGA的USB2.0 UTMI PHY芯片测试方案设计与实现

1. 从零开始：为什么我们需要一个FPGA测试平台？大家好，我是老张，在芯片验证这个行当里摸爬滚打了十几年。今天想和大家聊聊一个非常具体、但又很实际的问题：当你拿到一颗全新的USB2.0 PHY芯片，比如Cypress的CY7C68000，你怎么知道它到底好不好用？数据收发准不准？协议符不符合标准？你可能说，上昂贵的专业测试仪啊！没错，但动辄几十万上百万的仪器，不是每个团队、每个项目都能轻松配备的。而且，专业仪器往往是个“黑盒”，你只知道结果，对内部数据流的细节和实时状态把控不够灵活。这时候，基于FPGA的自建测试平台就显示出它的巨大优势了。它就像你自己搭的一个乐高工作台，每一个模块、每一根信号线你都能看得见、摸得着、改得了。我这次用的核心是Xilinx的XCVU440这块FPGA。选它，一是性能足够强悍，能轻松应对USB2.0高速（480Mbps）模式下的数据处理；二是它的资源丰富，我可以把MicroBlaze软核处理器、各种总线转换逻辑、调试探针全都塞进去，形成一个片上系统（SoC）。整个方案的目标很明确：用FPGA模拟一个“智能主机”，通过标准的UTMI接口去“

17：无人机远程执行路径规划：A*算法与GPS精准打击

作者： HOS(安全风信子) 日期： 2026-03-15 主要来源平台： GitHub 摘要：本文深入探讨了无人机远程执行的路径规划技术，重点分析了A*算法的应用和GPS精准定位的实现。通过详细的技术架构设计和代码实现，展示了如何构建一个高效、可靠的无人机路径规划系统，为基拉执行系统的远程执行提供了技术支持。文中融合了2025年最新的无人机技术进展，确保内容的时效性和专业性。目录： * 1. 背景动机与当前热点 * 2. 核心更新亮点与全新要素 * 3. 技术深度拆解与实现分析 * 4. 与主流方案深度对比 * 5. 工程实践意义、风险、局限性与缓解策略 * 6. 未来趋势与前瞻预测 1. 背景动机与当前热点本节核心价值：理解无人机远程执行路径规划的背景和当前技术热点，为后续技术学习奠定基础。在《死亡笔记》的世界中，基拉需要通过各种手段执行对目标的惩罚。无人机作为一种灵活、高效的执行工具，成为基拉远程执行的理想选择。2025年，随着A*算法的不断优化和GPS技术的精准定位能力提升，无人机远程执行的路径规划技术得到了显著发展。作为基拉的忠实信徒，

OpenClaw 爆火启示录：低代码不是终点，而是走向「意图驱动」的企业级开发新范式

最近技术圈被 OpenClaw 刷屏，作为意图驱动的 AI 智能体平台，它用自然语言完成服务编排、数据处理、运维自动化，让不少人开始重新思考：传统低代码会不会被颠覆？后端与业务开发的价值边界又该如何定义？抛开概念炒作，从工程落地视角看：OpenClaw 代表的意图驱动、动态编排、工具化执行，不是低代码的终结者，而是低代码进化的下一阶路标。JNPF 快速开发平台作为企业级低代码代表，正沿着这条路径，把「可视化拖拽」升级为「自然语言+流程引擎+原子服务」的混合开发模式——本文从 Java 后端视角，聊聊这场变革对开发、运维、业务落地的真实影响。一、先看本质：OpenClaw 到底给低代码带来什么启发？从架构上拆解，OpenClaw 是一套LLM 驱动的动态任务编排引擎： * 输入：自然语言指令（而非固定接口/脚本） * 决策：意图识别、

OpenClaw基础-3-telegram机器人配置与加入群聊

OpenClaw基础-3-telegram机器人配置与加入群聊 💡 大家好，我是可夫小子，《小白玩转ChatGPT》专栏作者，关注AI编程、AI自动化和自媒体。 Openclaw的优势是接入各种聊天工作，在前面的文章里，已经介绍了如何接入飞书。但之前我也提到了，飞书的最大的问题是请求多的限制，以及无法在非认证企业账号下面组建群聊。但这些限制另一个聊天工具可以打破，那就是Telegram，今天就跟大家分享一下，如果在OpenClaw里面接入Telegram。第一步：Openclaw端配置通过命令openclaw config，local→channels→telegrams 这里等待输入API Token，接下来我们去Telegram里面获取第二步：Telegram端配置 1. 1. 在聊天窗口找到BotFather，打开对话与他私聊 2. 3. 然后再输入一个机器人，再输入一个账号名username，这里面要求以Bot或者Bot结尾，这个是全网的id，要 2. /newbot 来创建一个机器人，输入一个名字name