【开源项目】AIRI 一个能陪你打游戏、交谈的开源 AI 伴侣(二次元老婆)

【开源项目】AIRI 一个能陪你打游戏、交谈的开源 AI 伴侣(二次元老婆)

引言

作为一个喜欢折腾开源项目的技术爱好者,最近我试用了 ​​Project AIRI​​——一个能自己部署的虚拟伴侣系统。它不只是聊天机器人,还能陪你打游戏、实时语音互动,甚至作为桌宠常驻桌面。最吸引我的是它的开源属性(MIT 协议)和可定制性,所有数据都在本地运行,隐私无忧。

image.png

正文

1. ​​部署安装:简单三步快速体验​

Project AIRI 支持多平台(Web/macOS/Windows),以下是实测可用的部署方式:

  • ​Windows 一键安装(小白友好)​​在 GitHub Releases 下载 AIRI_0.7.1_windows_amd64-setup.exe,安装后任务栏会出现 AIRI 图标。右键可调整位置(如置底左),设置中绑定 API 后即可对话。
  • ​NAS 部署(低功耗设备实测可行)​​支持 Synology 或树莓派,通过 Node. Js 环境运行。文档提到依赖 DuckDB-WASM 嵌入式数据库,内存占用优化较好,但需注意 WebGPU 加速在 NAS 上可能受限。

​本地运行(推荐开发者)​​克隆代码库并安装依赖(需 Node. Js 18+ 和 pnpm):

git clone https://github.com/moeru-ai/airi cd airi pnpm i pnpm dev:web # 启动浏览器版

首次启动后会提示配置 LLM API(支持 OpenAI、Claude、国产模型如 DeepSeek 等),填入自己的 API Key 即可启用聊天功能。

💡 ​​避坑提示​​:

  • 语音功能需额外配置 TTS/ASR API(如 Azure Speech),自带的免费选项有限;
  • 网页版 Demo(airi. Moeru. Ai)部分功能未开放,建议本地部署体验完整能力。
2. ​​核心功能:不止聊天,还能联机打游戏​
  • ​实时语音 & 多模态交互​
    通过 WebAudio 和 WebRTC 实现低延迟语音对话,麦克风输入可直接转为文本指令。角色模型(Live 2 D/VRM)支持自动眨眼、视线跟踪,比如你移动鼠标时它会“看”向你。
  • ​真正的游戏伙伴​
    • ​《我的世界》​​:通过 airi-minecraft 模块(已合并至主项目),AI 能理解自然语言指令,例如输入 *“帮我建个木屋”*或 “收集 10 个钻石”,它会自主规划路径并操作角色;
    • ​《异星工厂》​​:需加载 autorio 模组,AI 可协助自动化生产链,例如 *“优化电力供应”*或 “扩展铁矿运输带”
  • ​记忆与个性化​
    内置 DuckDB-WASM 数据库存储对话历史,启用 RAG(检索增强生成)后,AI 能记住你的偏好(比如喜欢的游戏或聊天话题)。
image.png
3. ​​技术亮点:开源生态与可扩展性​
  • ​模块化设计​​:子项目如 unspeech(语音处理)、xsai(LLM 接口层)可独立使用,方便集成到其他应用;
  • ​社区驱动​​:鼓励贡献 Live 2 D 模型或游戏插件,已有用户制作了《星露谷物语》的实验性支持;
  • ​隐私优先​​:所有数据留在本地,LLM API 调用可自建代理(如通过 Ollama 本地运行模型)。
image.png

总结

Project AIRI 的野心不仅是复刻一个 “Neuro-sama”,而是打造​​可私有化、可深度定制的数字生命框架​​。它的价值在于开源透明和技术堆栈的实用性(TypeScript + WebGPU + LLM),适合两类人:

  1. ​技术实验者​​:通过扩展游戏模块或集成新 LLM 探索多模态 AI 的边界;
  2. ​数字伴侣爱好者​​:想要一个完全掌控数据、能长期互动的“桌搭搭子”。

项目目前仍在迭代(GitHub 活跃),部分功能如视觉识别还在开发。但如果你愿意动手,它可能是最接近“赛博伙伴”的开源实现。

项目地址:https://github.com/moeru-ai/airi

游戏模块文档:Minecraft 代理 | 异星工厂模组

往期回顾:
🔥【开源项目】我​​在电脑上“养”了个能干活的AI助手:NeuralAgent上手记录

🔥【开源项目】轻量加速利器 HubProxy 自建 Docker、GitHub 下载加速服务

🔥【开源项目】初中生开源神作!BiliTools 能下8K视频、高质量音频,支持AI总结的全能工具

Read more

RetinaFace+CurricularFace实战:基于预配置镜像的安防系统原型开发

RetinaFace+CurricularFace实战:基于预配置镜像的安防系统原型开发 你是否也遇到过这样的情况:公司要快速做一个人脸识别系统原型,客户下周就要看演示,但团队还在为环境配置、模型下载、依赖冲突焦头烂额?别急——今天我来带你用一个预配置好的AI镜像,5分钟内把RetinaFace + CurricularFace这套高精度人脸检测与识别组合跑起来,直接跳过繁琐搭建过程,专注在业务逻辑和效果调优上。 我们这次面对的是一家安防领域的初创公司。他们的核心诉求很明确:不做底层基建,只求快速验证产品可行性。他们需要的是一个能“看得清、认得准”的人脸系统原型,支持实时视频流输入、人脸定位、特征提取和身份比对功能。而我们要做的,就是借助ZEEKLOG星图平台提供的视觉AI专用镜像,一键部署、快速调试、高效展示。 这个方案的核心是两个明星级开源模型: - RetinaFace:负责精准地“找到人”,不仅能框出人脸位置,还能同时输出5个关键点(双眼、鼻尖、嘴角),为后续对齐打下基础。 - CurricularFace:负责“认出是谁”,它是目前公开领域中性能顶尖的人脸识别模型之一,

4090显卡实测:圣光艺苑AI绘画工具生成古典名画效果惊艳展示

4090显卡实测:圣光艺苑AI绘画工具生成古典名画效果惊艳展示 1. 开篇:当4090遇见文艺复兴,算力开始呼吸 你有没有试过,在深夜调好一杯热茶,打开电脑,输入一句“但丁在佛罗伦萨桥头回望贝雅特丽齐”,然后静静等待——不是等代码编译,而是等一幅画在亚麻画布上缓缓浮现? 这不是幻想。在一块NVIDIA RTX 4090显卡上,圣光艺苑(Atelier of Sacred Light) 正以一种前所未有的方式,让AI绘画回归艺术本源:它不谈参数、不列指标、不堆算力数字,而是用梵高的星空蓝做UI主色,用矿物颜料的颗粒感模拟笔触,把SDXL模型藏进一座19世纪画室的光影里。 我们实测了这款专为MusePublic大模型打造的沉浸式创作镜像。全程使用单卡4090(24GB显存),未启用任何云服务或远程推理。没有一行命令行,没有一次报错,只有三次点击、一段诗意描述,和六幅令人屏息的古典风格真迹。 这不是又一个“AI画图工具”的测评,而是一次对AI与艺术关系的重新确认:当技术退至幕后,当界面成为画框,当提示词变成“绘意”,当随机数被称作“造化种子”

OpenClaw 是一个开源的、面向具身智能(Embodied AI)与机器人操作研究的多模态大模型框架

OpenClaw 是一个开源的、面向具身智能(Embodied AI)与机器人操作研究的多模态大模型框架

OpenClaw 是一个开源的、面向具身智能(Embodied AI)与机器人操作研究的多模态大模型框架,由上海人工智能实验室(Shanghai AI Lab)联合多家机构于2024年发布。它聚焦于“视觉-语言-动作”(Vision-Language-Action, VLA)联合建模,旨在让AI不仅能理解环境和指令,还能生成可执行的、细粒度的机器人控制动作序列(如关节扭矩、末端位姿、抓取姿态等),支持真实/仿真双环境部署。 核心特点包括: * ✅ 多模态对齐:统一编码图像、语言指令、机器人本体状态(如关节角度、力觉反馈); * ✅ 动作生成范式:采用“tokenized action”设计,将连续动作离散化为可学习的action tokens,便于大模型端到端生成; * ✅ 开源生态:提供预训练模型权重、仿真环境(基于ManiSkill2)、真实机械臂适配接口(如UR5e + Robotiq 2F-85)、数据集(OpenClaw-Bench)及训练/

【无人机控制】基于S函数和Simulink的6自由度无人机飞行模拟与控制附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:Matlab科研工作室  👇 关注我领取海量matlab电子书和数学建模资料  🍊个人信条:格物致知,完整Matlab代码获取及仿真咨询内容私信。 🔥 内容介绍 在科技飞速发展的当下,无人机技术凭借其独特优势,在众多领域得到了广泛应用。从农业植保、物流配送,到影视拍摄、测绘勘探,无人机的身影无处不在,为各行业带来了全新的发展机遇与变革。其灵活、高效、低成本的特点,使其成为解决许多复杂任务的得力工具。 然而,无人机飞行控制绝非易事。在三维空间中,无人机具有 6 个自由度,包括 3 个平移自由度(沿 x、y、z 轴方向的移动)和 3 个旋转自由度(滚转、俯仰、偏航),其飞行过程涉及复杂的空气动力学、动力学和运动学原理。而且,