简单易学的分离式部署小米智能家居Miloco方法

优质文章学习记录

09 Apr 2026 — 4 min read

一、安装环境

Windows用户：安装WSL2以及Docker
macOS/Linux用户：安装Docker
此处不再赘述，网上随便找个教程即可。特别地，对于Windows用户来说，你需要将 WSL2 的网络模式设置为 Mirrored。

二、使用Docker部署Miloco后端

以下均为bash命令。请Windows用户进入WSL2 / Linux、macOS用户进入终端操作：

mkdir miloco cd milico vi docker-compose.yml

以下是compose的内容（不会使用vi的同学可以傻瓜式操作：先按i，再使用粘贴功能，然后按冒号，输入wq然后回车，记得关闭输入法）：

services:backend:container_name: miloco-backend image: ghcr.nju.edu.cn/xiaomi/miloco-backend:latest network_mode: host expose:- ${BACKEND_PORT:-8000}environment:- BACKEND_HOST=${BACKEND_HOST:-0.0.0.0}- BACKEND_PORT=${BACKEND_PORT:-8000}- AI_ENGINE_HOST=${AI_ENGINE_HOST:-0.0.0.0}- AI_ENGINE_PORT=${AI_ENGINE_PORT:-8001}- BACKEND_LOG_LEVEL=${BACKEND_LOG_LEVEL:-info}- TZ=${TZ:-Asia/Shanghai}volumes:- ./data:/app/miloco_server/.temp - ./log/backend:/app/miloco_server/.temp/log restart: unless-stopped healthcheck:disable:true

再写个.env：

vi .env

以下是.env的内容：

TZ=Asia/Shanghai BACKEND_HOST=0.0.0.0 BACKEND_PORT=8000 BACKEND_LOG_LEVER=info AI_ENGINE_HOST=0.0.0.0 AI_ENGINE_PORT=8001 AI_ENGINE_LOG_LEVER=info

继续执行命令：

mkdir -p data mkdir -p log/backend docker compose up -d

静待下载镜像以及运行即可。

三、部署视觉大模型

对于小白用户（含非专业的AMD用户），此处建议使用LM Studio或Ollama来部署GGUF版的VL模型。
如果你有一张高性能NVIDIA显卡（RTX3090、RTX4090、RTX5090等显存>=24G的），想要更加专业稳定的服务，那么建议使用vLLM或SGLang进行生产级服务部署。
此处为了照顾Windows及macOS小白用户，以简单易用的LM Studio举例。

下载LM Studio并安装

https://lmstudio.ai/

设置及下载模型

点击界面最右下角的设置图标，

App Settings-General-Language-简体中文
App Settings-Developer-启用本地 LLM 服务

检查环境安装情况

还是在设置页-Runtime

NVIDIA用户

Vulkan llama.cpp
CUDA llama.cpp
CPU llama.cpp
CUDA 12 llama.cpp
Harmony

AMD用户

Vulkan llama.cpp
ROCm llama.cpp
CPU llama.cpp
Harmony

苹果用户

Vulkan llama.cpp
Metal llama.cpp
MLX llama.cpp
CPU llama.cpp
Harmony

下载模型

Model Search-搜索框中输入：xiaomi-open-source/Xiaomi-MiMo-VL-Miloco-7B-GGUF
点击右下角Download即可

运行模型并提供API服务

下载完成后点击页面左侧的“开发者”（一个绿色终端图标，位于对话图标下方）
点击页面顶部加载模型
你应该能够看到xiaomi-mimo-vl-miloco-7b是READY状态。
页面顶部有一个Status: Stopped，点击开关，切换到Running。
点击Server Settings，打开“在网络中提供服务”。
你将得到一个局域网地址，显示在右侧的Reachable at中，如：http://192.168.50.210:1234。复制它。

四、与Miloco对接

假设你的Docker宿主机IP为192.168.50.123，那么就访问https://192.168.50.123:8000/。首次设置会让你登录账号，登录后有一个callback地址，也填写192.168.50.123:8000。

对接VL模型

点击模型管理-云端模型-添加模型：
Base URL输入http://192.168.50.210:1234/v1
API Key随便填
模型ID填xiaomi-mimo-vl-miloco-7b，再点击一下以添加。
完成后在上方“视觉理解大模型”中选择云端：xiaomi-mimo-vl-miloco-7b

对接规划模型

对于许多用户来说，走到这一步的时候，想必你的显存/统一内存已经所剩无几了吧！让我们白嫖一下硅基流动的大模型。

访问https://cloud.siliconflow.cn/，注册并登录。
点击左侧的API密钥，生成一个，复制出来（sk开头的）
还是添加云端模型:
Base URL输入https://api.siliconflow.cn/v1
API Key填刚才生成的
模型ID选Qwen/Qwen3-8B
完成后在上方“规划大模型”中选择云端：Qwen/Qwen3-8B

回到AI中心，开始你的Miloco之旅吧！

五、一点Tips

对于规划模型，你可以尝试使用更强的大模型，它们调用工具更稳定，比如Kimi K2、Minimax M2等。Qwen3-8B的训练时间较早且对齐略有问题，可能不能很好地稳定调用工具。这只是一个便宜的入门之选。
对于VL模型，有条件的同学可以尝试部署全精度版本，使用vLLM提供服务，会获得更棒的体验。
官方文档中推荐的安装方式只是多集成了一个AI Engine，本质上就是对llama.cpp的封装。分离式部署大模型服务更灵活。
吐槽：我曾经想着提个pr来适配更多平台，但发现代码里硬编码了许多CUDA/nvidia相关的东西，蒜鸟蒜鸟。
有疑问可以联系我：[email protected]，不保证时效性。

dify接入企业微信群聊机器人详细步骤（从零到上线全记录）

第一章：dify接入企业微信群聊机器人详细步骤（从零到上线全记录）准备工作：获取企业微信机器人Webhook URL 在企业微信管理后台创建群聊机器人，获取唯一的 Webhook 地址。该地址用于外部系统向指定群组发送消息。登录企业微信 → 进入“应用管理” → 创建或选择一个自建应用 → 添加“群机器人”，复制生成的 Webhook URL。配置Dify工作流触发外部通知在 Dify 中设置自定义响应后处理逻辑，通过 HTTP 请求将输出内容推送到企业微信群。使用内置的“HTTP 请求”节点，填写以下参数： * Method: POST * URL: 企业微信机器人的 Webhook 地址 * Body (JSON): 包含要发送的消息内容 { "msgtype": "text", "text"

RISC-V开源处理器实战：从Verilog RTL设计到FPGA原型验证

引言：开源浪潮下的RISC-V处理器设计在芯片设计领域，RISC-V架构正以其开源免授权、模块化扩展和极简指令集三大优势重塑行业格局。与传统闭源架构不同，RISC-V允许开发者自由定制处理器核，从嵌入式微控制器到高性能服务器芯片均可覆盖。本文以Xilinx Vivado 2025工具链和蜂鸟E203处理器为核心，完整呈现从Verilog RTL设计到FPGA原型验证的全流程，为嵌入式工程师和硬件爱好者提供一套可复现的实战指南。项目目标与技术栈 * 核心目标：基于RISC-V RV32I指令集，设计支持五级流水线的32位处理器核，实现基础算术运算、逻辑操作及访存功能，并在Xilinx Artix-7 FPGA开发板验证。 * 工具链：Xilinx Vivado 2025（逻辑设计、综合实现）、ModelSim（功能仿真）、Xilinx Artix-7 XC7A35T FPGA开发板（硬件验证）。 * 参考案例：蜂鸟E203处理器（芯来科技开源RISC-V核，已在Xilinx FPGA上完成移植验证，最高运行频率50MHz）。一、数字系统设计流程：从需求到架构 1.

2026最强实战：用《三国演义》把 KAG（知识增强生成）跑通：LLM抽取知识图谱→Neo4j入库→召回评测→图谱问答闭环（附完整测试代码）

Git 仓库： langchain4j-spring-agent/langchain4j-spring-ai/langchain4j-spring-ai-seg-flow 相关文章：三国演义向量检索实战：RAG 混合切分 + Qdrant + BGE（Recall@5=0.8 全流程）相关文章：RAG 增强与向量基础篇：继续搭建“模型 + 向量 + 会话 + 工具”协同底座相关文章：零成本打造本地多引擎大模型与向量服务：Xinference 全栈部署 + 性能调优实战这篇文章不是“概念科普”，而是一套可以直接跑起来的 KAG（Knowledge-Augmented Generation）工程闭环：用大模型从小说文本中抽取知识图谱 JSON一键导入 Neo4j用评测集做 Recall@5 召回评测（LLM 参与生成 Cypher + 判定命中）最后把同一套链路用于 KAG

跨越天堑：机器人脑部药物递送三大技术路径的可转化性分析研究

摘要血脑屏障是中枢神经系统药物研发最核心的瓶颈。尽管相关基础研究层出不穷，但“论文成果显著、临床转化缓慢”的悖论依然存在。本文认为，突破这一瓶颈的关键在于，将研究重心从“单点机制”转向构建一条“可验证、可复现、可监管”的全链条递送系统。为此，本文提出了一个衡量脑部递送技术可转化性的四维评价标尺：剂量可定义、闭环可监测、质控可标准化、可回退。基于此标尺，本文深度剖析了当前最具潜力的三条技术路径：（1）FUS/低强度聚焦超声联合微泡；（2）血管内可导航载体/机器人；（3）针对胶质母细胞瘤（GBM）的多功能纳米系统。通过精读关键临床试验、前沿工程研究和系统综述，我们抽离出可直接写入临床或产品方案的核心变量，识别了各自面临的最大转化风险，并提出了差异化的“押注”策略。分析表明，FUS+MB路径因其在“工程控制”上的成熟度，在近期（12-24个月）的转化确定性最高；血管内机器人代表了精准制导的未来趋势，