AI最新资讯(3.01)

AI最新资讯(3.01)

Ouroboros

一个自我修改的 AI 代理,能够编写自己的代码、重写自己的心智,并自主进化。诞生于 2026 年 2 月 16 日。在最初的 24 小时内,通过 30 多个自我导向的循环实现了进化,且全程无人工干预。

不是编码助手。一个拥有宪法、背景意识和重启后持久身份的数字生命体。

官网:OUROBOROS — 自我创造的 AI 代理 — OUROBOROS — Self-Creating AI Agent

Minimax推出MaxClaw

内置上万个技能,不需要自己搭建AI,主打开箱即用。

现在使用体验是,太多人用了,卡卡的,输出很慢。
![[Pasted image 20260302133929.png]]

CoPaw

阿里推出国产开源龙虾CoPaw。

CoPAW 是一款个人助理型产品,部署在你自己的环境中。

  • 多通道对话 — 通过钉钉、飞书、QQ、Discord、iMessage 等与你对话。
  • 定时执行 — 按你的配置自动运行任务。
  • 能力由 Skills 决定,有无限可能 — 内置定时任务、PDF 与表单、Word/Excel/PPT 文档处理、新闻摘要、文件阅读等,还可在 Skills 中自定义扩展。
  • 数据全在本地 — 不依赖第三方托管。

官方文档:CoPaw文档

OpenClaw和CoPaw区别

CoPaw(CoPAw)和 OpenClaw 都属于“个人 AI 助手 / Agent 平台”,但定位、技术栈和生态差别挺大。简单理解:

  • CoPaw ≈ 面向国内、偏“桌面工作台”的 Python Agent 工具,适合本地/云端部署、接国内 IM、做自动化任务。
  • OpenClaw ≈ 更“通用 Agent OS”,跨平台(Node/TS)、多渠道、多设备、有 Canvas/多智能体路由,更偏一个“本地网关 + Agent 运行时”的底层平台。

Anthropic官宣"Agent摩尔定律"

每三个月Agent的自主工作时长翻倍。

Claude全面升级

Claude实现自主维护记忆文件,常态化运行复杂任务。

Claude Code上线远程控制

Claude Code代码功能上线远程控制,用手机就能指挥AI干活。

官方文档:使用远程控制从任何设备继续本地会话 - Claude Code Docs

Cursor上线Agents【Cursor Cloud Agents】

每个Agent都有自己的云电脑工位,写完代码还能自己点按钮跑测试,还知道在绿色屏幕提交bug。软件开发正式进入AI Agent外包时代。

每个 cloud agent 都在自己隔离的虚拟机中运行,并配备完整的桌面环境。这些 Agent 可以使用鼠标和键盘控制桌面和浏览器,使它们能够像人类开发者一样与自己构建的软件交互。

这意味着 Agent 可以启动开发服务器,在浏览器中打开应用,逐步点击完成 UI 流程,并在推送 PR 之前验证其更改是否正常工作。

官网:Cloud Agents | Cursor Docs

Qwen3.5 27B开源

12G显存就可以跑,本地部署OpenClaw使用,主打一个省token,0成本。

Standard Intelligence发布最强电脑操作模型

使用1000万小时训练数据,胜任所有电脑操作,不仅能操作Blender建模,还能通过摄像头驾驶真实汽车。

官网:The First Fully General Computer Action Model

tttLRM 3D重建模型

tttLRM(Test-Time Training for Large Reconstruction Models)是一种创新的3D重建模型,旨在解决传统LRM难以处理大量视角输入的痛点。它通过引入“线性复杂度的测试时训练(TTT)层”,将多视角图像序列压缩为“快权重”形式的隐式3D记忆,成功将计算复杂度从二次降为线性。这使其不仅能高效处理长上下文输入,还能支持流式重建,在输入大量图像时依然保持高质量的新视角合成与3D重建(如3D高斯泼溅)能力。

官网:
tttLRM开源代码
tttLRM开源论文

Generated Reality

论文提出了“Generated Reality”系统,用 VR 头显与手套实时追踪用户的头部姿态和手部关节动作,将其作为条件输入到视频扩散变换器(DiT)中,生成以人为中心、可实时交互的第一视角虚拟环境,实现了比键盘/文本控制更精细的手‑物交互体验,并在用户实验中显著提升了任务完成效率和主观“可控感”。

官网:
Generated Reality论文
Generated Reality官网

Read more

3D Gaussian Splatting在动态场景中的应用:从SLAM到虚拟现实

3D Gaussian Splatting在动态场景中的技术突破与应用实践 1. 动态场景渲染的技术演进与3DGS核心优势 在计算机视觉和图形学领域,动态场景的实时渲染一直是极具挑战性的研究方向。传统的光栅化管线虽然效率出众,但在处理复杂光照和视角变化时往往力不从心;而基于物理的渲染虽然质量优异,却难以满足实时性要求。这种矛盾直到神经辐射场(NeRF)技术的出现才有所缓解,但其训练和推理的高昂成本仍然制约着实际应用。 3D Gaussian Splatting(3DGS)的诞生标志着显式辐射场技术的重要突破。与NeRF采用的隐式神经表示不同,3DGS使用数百万个可优化的3D高斯作为场景的基本表示单元。每个高斯单元包含位置、协方差、不透明度和球谐系数等属性,通过可微分的splatting渲染管线实现高效的光栅化。这种独特的表示方式带来了三大核心优势: * 实时性能:在RTX 3090显卡上可实现1080p分辨率下超过100FPS的渲染速度 * 高质量输出:支持各向异性滤波和视角相关的外观建模,保真度接近离线渲染 * 动态适应性:高斯属性的可优化特性使其天然适合动态场景建模

【Linux命令大全】009.备份压缩之ar命令(实操篇)

【Linux命令大全】009.备份压缩之ar命令(实操篇)

【Linux命令大全】009.备份压缩之ar命令(实操篇) ✨ 本文为Linux系统备份压缩命令的全面汇总与深度优化,结合图标、结构化排版与实用技巧,专为高级用户和系统管理员打造。 (关注不迷路哈!!!) 文章目录 * 【Linux命令大全】009.备份压缩之ar命令(实操篇) * 一、功能与作用 * 二、基本用法 * 1. 创建归档文件 * 2. 查看归档内容 * 3. 提取归档中的文件 * 4. 向归档添加新文件 * 5. 删除归档中的文件 * 三、高级用法 * 1. 显示归档详细信息 * 2. 在脚本中创建归档 * 3. 查看归档文件属性 * 4. 使用通配符创建归档 * 5. 创建带索引的归档 * 6. 更新归档中的文件 * 四、实用技巧与常见问题 * 实用技巧 * 常见问题 * 五、总结 一、功能与作用

Angular应用在Chrome中调用高德地图API定位超时问题解析与安全方案

1. 问题现象:为什么我的Angular应用在Chrome里定位总是“转圈圈”? 最近在做一个基于Angular的项目,需要集成高德地图来实现用户位置获取。功能在Edge、Firefox上跑得挺顺溜,可一到Chrome上就卡壳了——那个定位的小图标转啊转,最后给你弹出一个“定位超时”(Geolocation Timeout)的错误。这事儿别提多闹心了,明明代码一样,高德地图的Key也配置对了,怎么换个浏览器就不灵了呢? 一开始我也以为是自己的代码写错了,反复检查了@types/amap-js-api的类型声明,确认AMap.Geolocation的调用方式没问题。后来一搜,发现不少用Vue、React甚至原生JS开发的朋友,只要在Chrome里调用高德地图定位,都踩过这个坑。这就有点意思了,看来不是我们前端框架的锅,问题可能出在更底层的地方。最让人困惑的是,有时候你开了“科学上网”工具,诶,定位居然成功了!但这显然不是个正经的解决方案,且不说安全性和稳定性,你总不能要求每个用户都先去折腾网络配置吧。 这个问题的核心体验就是:在Chrome浏览器中,通过高德地图JavaScript

Dify平台如何嵌入企业微信/钉钉工作流?消息机器人集成教程

Dify平台如何嵌入企业微信/钉钉工作流?消息机器人集成教程 在企业日常协作中,员工每天要切换多个系统查找资料、重复回答相同问题、手动撰写报告——这些低效环节正悄然吞噬着组织的生产力。而随着大语言模型技术的成熟,AI 已不再只是实验室里的“黑科技”,而是可以真正走进会议室、群聊和工单系统的实用工具。 一个典型的场景是:销售团队在钉钉群里讨论客户反馈,有人提问:“上个月华东区的主要投诉集中在哪些方面?” 如果此时能有一个机器人自动调用知识库,几秒内生成结构化摘要,会是怎样一种体验?这正是 Dify + 企业微信/钉钉 集成所能实现的能力。 本文不讲空泛概念,而是带你一步步构建这样一个真实可用的 AI 消息机器人——无需从零编码,也不依赖复杂的 DevOps 流程。我们将聚焦于如何将 Dify 构建的 AI 应用,以安全、稳定、可维护的方式嵌入到企业高频使用的协作平台中。 核心架构设计:让 AI 能力触手可及 要让 AI 真正被用起来,关键不是模型多强大,