大模型+智能家居解决方案--小米MiLoco部署

大模型+智能家居解决方案--小米MiLoco部署

一、Miloco简介

小米推出了首个“大模型+智能家居”解决方案Xiaomi Miloco,全称为 Xiaomi Local Copilot(小米本地协同智能助手)。

https://gitee.com/xiaomi-miloco/xiaomi-miloco

1、GitHub地址

https://github.com/XiaoMi/xiaomi-miloco

Miloco以米家摄像头为视觉信息源,以自研大语言模型MiMo-VL-Miloco-7B为核心,连接家中所有物联网(IoT)设备,框架面向所有人开源。MiMo-VL-Miloco-7B模型基于小米4月发布的MiMo模型调优而来,“天才少女”罗福莉最近加入的正是MiMo模型团队。

这很可能是智能家居的“ChatGPT时刻”,小米AIoT平台截至今年6月已连接的IoT设备数(不含智能手机、平板及笔记本计算机)达9.89亿台,数以亿计的米家摄像头、小爱音箱、台灯等设备都有望用上大模型。

从小米公布的Miloco页面来看,页面主视觉是一个类似于ChatGPT的聊天框,聊天框的左侧具有智能家居设备的导航栏,包括AI中心、模型管理、MCP服务、设备管理等选项;“相机设备”独立成一栏,陈列了一些智能摄像头记录的视频。

2、关键特性

  1. 交互新范式:基于大模型的开发范式,通过自然语言交互就可以完成规则设置、设备的复杂指令控制。
  2. 视觉数据新用途:以摄像头数据流作为感知信息源,使用大模型将视觉数据包含的各种家庭场景事件解析出来,用于回复用户 Query。
  3. 端侧大模型:将家庭场景任务拆分规划+视觉理解两个阶段,提供小米自研端侧模型,实现端侧视频理解,保障家庭隐私安全。
  4. 米家生态:打通米家生态,支持米家设备、米家场景的获取与执行,支持自定义内容发送米家通知。

Miloco还通过标准化的MCP协议封装,实现米家生态与全球最大开源智能家居社区Home Assistant生态的打通,同时开放支持第三方IoT平台接入

从项目公布的软硬件要求来看,部署Miloco硬件要求不高,仅需要硬件搭载x64架构,图形处理器在英伟达30系列及以上,存储要在16GB及以上即可。

▲Miloco部署的软硬件需求

据悉,Miloco的全屋智能差异化体验,依托于Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型“硬件-能力-应用-用户”四层完整架构的支撑。

3、Miloco的四层架构

二、快速开始

1、系统要求

  • 硬件要求
CPU: x64 架构 显卡: NVIDIA 30系及以上显卡,显存 8GB 及以上(最低),建议 12GB 及以上 存储: 建议 20GB 及以上可用空间(用于本地模型存储)
  • 软件要求
操作系统: - Linux: x64 架构,建议 Ubuntu 22.04 及以上 LTS 版本 - Windows: x64 架构,建议 Windows 10 及以上版本,要求支持 WSL2 - macOS: 暂不支持 Docker: 20.10 及以上版本,需要支持 docker compose NVIDIA 驱动: 支持 CUDA 的 NVIDIA 驱动 NVIDIA Container Toolkit: 用于Docker GPU支持

2、安装依赖环境

注意: 请确保您的系统满足上述硬件和软件要求。windows 系统需要进入 wsl 环境。

(1)WSL安装与配置

https://gitee.com/xiaomi-miloco/xiaomi-miloco/blob/main/docs/environment-setup-windows_zh-Hans.md

系统要求: Windows11 22H2 及以上版本 + WSL2

在系统中搜索然后打开控制面板,点击程序>启动或关闭 Windows 功能,然后勾选 Hyper-V 和适用于 Linux 的 Windows 子系统,点击确定,等待系统安装更新后重启

安装 WSL

在系统中搜素终端然后打开,输入wsl --install,等待 WSL 安装完成;如果已经安装,可以使用wsl --update更新到最新版本

下载 WSL2 Linux 发行版

打开 Windows 自带的应用商店,搜索 Ubuntu ,然后下载 Ubuntu24.04.1 LTS

在 Windows 终端可使用wsl --list --online查看在线的发行版,然后输入wsl --install -d Ubuntu-24.04安装

使用 WSL2

在应用商店下载完成后,可以点击打开按钮,然后按照提示输入用户名和密码,完成初始化

在终端输入wsl -d Ubuntu-24.04,然后按照提示输入用户名和密码,完成初始化

(2)WSL常用操作
# 启动默认发行版

wsl

# 退出当前发行版

exit # 或 logout

# 列出所有发行版(含状态)

wsl --list --verbose # 简写 wsl -l -v#

查看详细信息


wsl --status

# 设置默认启动发行版

wsl --set-default Ubuntu-22.04

# 卸载指定发行版(数据丢失)

wsl --unregister Ubuntu-20.04

# 查看WSL2的IP地址

ip addr show eth0 | grep 'inet\b' | awk '{print $2}' | cut -d/ -f1

# 关闭所有WSL实例

wsl --shutdown

# 运行特定发行版命令 wsl -d Ubuntu-22.04 -e bash -c "echo Hello"

#重启版本

wsl --terminate <DistributionName>

wsl --distribution <DistributionName>


网络模式配置

在系统中搜索 WSL Setting ,点击网络,然后将网络模式修改为 Mirrored ,修改完成后,需要使用wsl --shutdown停止子系统,然后重新运行wsl -d Ubuntu-24.04进入子系统,输入ip a查看子系统网络配置是否和宿主机器一致。

设置为 Mirrored 模式后,需要配置 Hyper-V 防火墙,允许入站连接。

在 PowerShell 窗口中以管理员权限运行以下命令,以配置 Hyper-V 防火墙设置,使其允许入站连接:

Set-NetFirewallHyperVVMSetting -Name '{40E0AC32-46A5-438A-A0B2-2B479E8F2E90}' -DefaultInboundAction Allow # 使用下述命令获取WSL防火墙策略 Get-NetFirewallHyperVVMSetting -PolicyStore ActiveStore -Name '{40E0AC32-46A5-438A-A0B2-2B479E8F2E90}' # DefaultInboundAction和DefaultOutboundAction为Allow即可: # Name : {40E0AC32-46A5-438A-A0B2-2B479E8F2E90} # Enabled : True # DefaultInboundAction : Allow # DefaultOutboundAction : Allow # LoopbackEnabled : True # AllowHostPolicyMerge : True
(3)Docker环境

使用官方脚本安装( WSL2 中官方推荐 Docker Desktop 安装,可以忽略提示,采用下述命令直接安装)

curl -fsSL https://get.docker.com | bash -s docker # 中国国内用户可以指定Aliyun源安装 curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun

可将当前用户加入 docker 组,从而可以直接使用 docker 命令:

sudo usermod -aG docker $USER

添加完成后,需要重新登录,以使用户组更改生效。 使用命令docker --version验证是否安装成功。

(4)显卡驱动及开发工具(任选一个)
# 25-11-1更新 # 安装CUDA Toolkit(推荐安装) wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb sudo dpkg -i cuda-keyring_1.1-1_all.deb sudo apt-get update sudo apt install nvidia-cuda-toolkit # 安装NVIDIA Driver sudo apt-get -y install cuda-drivers

# 25-11-1更新 # 配置下载源 sudo apt-get update && sudo apt-get install -y --no-install-recommends curl gnupg2 curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \ && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \ sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \ sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list sudo apt-get update export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.18.0-1 sudo apt-get install -y \ nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \ libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}

3、环境验证

(1)验证 Docker

使用hello-world镜像验证 Docker 是否安装成功,如果显示Hello from Docker!则表示安装成功。

docker run hello-world # 验证完成后,可移除镜像 docker rmi hello-world
(2)验证 NVIDIA 显卡驱动

使用命令nvidia-smi验证 NVIDIA Driver 是否安装成功,如果显示显卡驱动和 CUDA 工具包信息,则表示安装成功。

使用命令nvcc --version验证 NVIDIA CUDA Toolkit 是否安装成功,如果安装成功,会显示版本信息。

(3)验证 NVIDIA Container Toolkit

使用下述命令验证 NVIDIA Container Toolkit 是否安装成功,如果显示显卡驱动和 CUDA 工具包信息,则表示安装成功。

docker run --rm --gpus all nvidia/cuda:12.4.0-base-ubuntu22.04 nvidia-smi # 验证完成后,可移除镜像 docker rmi nvidia/cuda:12.4.0-base-ubuntu22.04

4、miloco安装与启动

下载源码后,执行一键安装脚本

git clone https://github.com/XiaoMi/xiaomi-miloco.git bash scripts/install.sh

miloco安装运行界面:

选择 “1. Quick Install”

选择下载路径:国内推荐 Xiaomi FDS

安装完成提示:

启动服务:

运行服务后的系统运行时状态:

5、前端访问服务

通过https://<your ip>:8000访问服务,如果是本机访问, IP 为127.0.0.1

📄NOTICE:

  • 请使用 https 访问,而不是 http
  • Windows 下,在 Windows 中可以尝试直接访问 WSL 的 IP 地址,如 https://<wsl ip>:8000
  • macOS 环境下,如果网络模式配置为桥接模式,访问时请使用 Docker 所在虚拟机的 IP。

6、miloco使用

miloco前端管理界面:

设置后端使用的模型:

设置规则:

主界面里可以自动生成,也可以在规则管理里手动添加。这里使用的是手动添加。

注意:

添加规则前,需要在米家APP里测试相关控制设备的有效性。

添加规则时,一定要在设置控制选项点击“测试”按钮,生成有效的米家控制指令,有时AI模型调用生成指令有问题,多测试几遍。

如果设置的规则执行有问题,可以在日志管理查看相关执行日志。

Read more

深入解析Stable Diffusion基石——潜在扩散模型(LDMs)

深入解析Stable Diffusion基石——潜在扩散模型(LDMs)

一、技术解读:潜在扩散模型——高分辨率图像合成的范式革命 1.1 核心动机:破解“质量-效率-可控性”的不可能三角 在潜在扩散模型(Latent Diffusion Models, LDMs)出现之前,高分辨率图像生成领域长期存在一个“不可能三角”:生成质量、计算效率、可控性难以兼得。 * GANs:能快速生成高质量图像,但训练极其不稳定,易出现模式崩溃(多样性差),且实现复杂条件的可控生成需要为不同任务设计特定架构,工程化成本极高。 * VAEs:训练稳定、架构简单,但其优化目标过度依赖像素级损失+强正则化,导致生成图像模糊、细节丢失严重,无法满足高保真生成需求。 * 像素空间扩散模型(DMs):生成质量顶尖,并支持无需重新训练的灵活引导(如修复、上色、超分),但其在百万维度的像素空间中直接进行迭代去噪,导致训练成本(通常需数百个GPU天)和推理成本(生成一张图需数分钟)高昂,仅能在超算中心或大厂落地,

收藏!只为就业:纯LLM、多模态大模型、AIGC该选哪条路?

收藏!只为就业:纯LLM、多模态大模型、AIGC该选哪条路?

这绝对是2025年计算机应届生及算法方向求职者最焦虑的问题,没有之一。 过去几年,我从一线技术面试官做到团队负责人,面过的候选人从海外大厂博士到985硕士,累计不下八百人。聊得多了,也摸清了行业招聘的底层逻辑,今天就抛开虚言,从实战角度给大家盘清这三条赛道的利弊。 我不跟大家扯虚无的行业报告、千亿级市场规模这些空话——这些数据对普通人找工作毫无意义。核心只从「看简历、面候选人、拍板发offer」的一线视角,帮你判断哪条路更适合长期就业、薪资更高、更难被替代。 先定时间坐标:2026年1月。 大模型领域技术迭代太快,去年的最优解今年可能就成了内卷重灾区,这个时间点的行业现状,对求职决策至关重要。 先给结论,不绕弯子:优先all in多模态大模型 如果你的目标是拿下高质量算法岗,追求长期职业价值、低替代风险和高薪资天花板,别犹豫,直接深耕多模态领域。至于为什么这个方向是最优解,我把逻辑拆透,大家听完自己判断。 先看清三条赛道的真实现状 1. 纯语言大模型(LLM):基建化定型,算法岗内卷加剧 2025年的纯LLM领域,核心特征就四个字:基建化、工程化。现在想从零训练一个

5分钟搞定!ComfyUI Photoshop插件终极安装指南:让AI绘画直接在PS中完成

5分钟搞定!ComfyUI Photoshop插件终极安装指南:让AI绘画直接在PS中完成 【免费下载链接】Comfy-Photoshop-SDDownload this extension via the ComfyUI manager to establish a connection between ComfyUI and the Auto-Photoshop-SD plugin in Photoshop. https://github.com/AbdullahAlfaraj/Auto-Photoshop-StableDiffusion-Plugin 项目地址: https://gitcode.com/gh_mirrors/co/Comfy-Photoshop-SD 还在为AI绘画的繁琐流程而烦恼吗?每次都要在Photoshop和AI软件之间来回切换,不仅效率低下,还容易打断创作灵感。ComfyUI Photoshop插件完美解决了这一痛点,让你在熟悉的Photoshop环境中直接使用强大的AI功能,实现无缝创作体验。 🎯 为什么你需要ComfyUI Photoshop

Midjourney 推出面向动漫领域的图像生成模型:Niji V7

Niji V7 的核心亮点 Niji 是 Midjourney 与 Spellbrush 合作开发的、专门针对动漫和二次元风格进行优化的独立模型。V7 是其最新版本,相较于之前的版本,它在多个方面实现了质的飞跃: 1. 风格广度与精准度: * 风格范围极广:V7 能够精准生成从经典赛璐璐(90年代动画)、现代流行动画(如京都动画、MAPPA风格)、复古像素游戏风,到华丽插画、动漫画稿、三渲二(3D渲染成2D)等多种细分风格。 * 风格锁定能力强:用户可以通过更简单的提示词(如“90s anime”,“studio ghibli style”,“visual novel key visual”)就能稳定输出预期风格,减少了随机性。 2. 角色一致性: * 这是 Niji V7 最突出的进步之一。通过新的