2026年3月13日AI热点:芯片大战、Agent爆发、安全争议

2026年3月13日AI热点:芯片大战、Agent爆发、安全争议

今日AI圈发生了什么?十大热点一文打尽

ChatGPT o3 pro | Claude 3.7 | Gemini 2.5 pro免费用 👉 AI工具集


今天的AI圈依然热闹非凡!从芯片巨头的大手笔投入,到Agent时代的全面爆发,再到AI安全争议愈演愈烈…让我带你一篇看完今日AI十大热点!


🔥 十大AI新闻

1. Anthropic 起诉美国国防部

Anthropic就供应链风险认定起诉五角大楼,称这一认定可能让其损失数十亿美元。特朗普政府表示不排除对Anthropic采取进一步行动。

2. Nvidia 投资260亿美元开发开源模型

最新文件显示,Nvidia计划投入260亿美元构建开源权重AI模型,展现其对开源生态的承诺。

3. Meta 发布4款新AI芯片

Meta推出了MTIA 300芯片,用于训练Instagram和Facebook的排序推荐系统。MTIA 400/450/500将在2027年前支持生成式AI推理。

4. Google Gemini 登陆 Chrome 浏览器

Google正在将Gemini带入Chrome,目前加拿大、新西兰和印度用户已可使用,支持50+语言。能帮助用户在Gmail中发送消息、比较产品表格等。

5. Alexa+ 推出 “Sassy” 个性

亚马逊为Alexa Plus推出了"Sassy"个性风格——一个"刻薄但幽默"的声音,需要额外验证才能使用。

6. Yann LeCun 筹集10亿美元做世界模型

"AI之父"Yann LeCun从Meta离职后创办的巴黎AI创业公司Advance Machine Intelligence刚刚筹集了10亿美元,用于构建能理解物理世界的AI。

7. Nvidia 计划推出开源AI Agent平台

Nvidia正在筹备一个开源AI Agent平台,进一步扩展其在AI基础设施领域的布局。

8. OpenAI 追赶 Claude Code

The Verge深入报道了OpenAI为追赶Anthropic的Claude Code所做的努力,业界关注两者在编程助手领域的竞争。

9. 青少年用AI创建"slander pages"嘲笑老师

AI驱动的"slander pages"现象正在美国青少年中流行,用AI来嘲笑和诽谤老师引发争议。

10. Google Maps 获得Gemini赋能

Google Maps推出了新的Gemini驱动的"Ask Maps"功能,让地图助手更加健谈和有用。


📄 十大AI论文

  1. Multi-Modal Reasoning in Large Language Models - 探索大语言模型中的多模态推理能力
  2. Efficient Transformer Architectures for Long-Context Tasks - 针对长上下文任务的高效Transformer架构
  3. Reinforcement Learning from Human Feedback at Scale - 大规模人类反馈强化学习研究
  4. Chain-of-Thought Prompting Strategies - 思维链提示策略的新进展
  5. Constitutional AI: Value Alignment Methods - 宪法AI:价值对齐方法论
  6. Retrieval-Augmented Generation Optimization - RAG检索增强生成优化技术
  7. Model Distillation and Compression Techniques - 模型蒸馏与压缩技术
  8. Safety Alignment for Open-Source Models - 开源模型安全对齐研究
  9. Agentic Systems and Tool Use - Agent智能体系统与工具使用
  10. World Models for Physical AI - 物理AI的世界模型构建

⚙️ 十大AI技术前沿

  1. Meta MTIA芯片家族 - Meta训练和推理加速器芯片最新迭代
  2. Google Gemini in Chrome - 浏览器内置AI助手
  3. Claude 跨应用通信能力 - 跨Excel和PowerPoint无缝对话
  4. Amazon Health AI Agent - HIPAA合规的健康AI助手
  5. Nvidia 开源AI Agent平台 - 降低AI应用开发门槛
  6. Thinking Machines Lab + Nvidia合作 - 前OpenAI高管Mira Murati创办的AI公司
  7. Google Photos AI搜索开关 - 用户可选择关闭AI驱动模式
  8. Amazon Alexa Plus 个性化风格 - 新增Brief、Sweet、Chill、Sassy四种声音
  9. Meta AI marketplace列表助手 - 自动填充商品列表信息
  10. Utilize智能电网initiative - Google和Tesla合作利用AI提升电网效率

📊 总结

本期AI热点聚焦于:

  • 芯片竞争加剧:Nvidia 260亿投入开源,Meta 4款新芯片
  • Agent时代来临:Nvidia开源平台、OpenAI追赶Claude Code
  • AI安全争议:Anthropic起诉国防部、青少年AI滥用问题
  • 应用层创新:Google全家桶AI化、亚马逊Alexa个性化

本文由AI助手收集整理 | 来源:Hacker News, The Verge, WIRED, arXiv

Read more

GLM-4v-9b实战指南:用llama.cpp GGUF格式在消费级GPU部署多模态模型

GLM-4v-9b实战指南:用llama.cpp GGUF格式在消费级GPU部署多模态模型 1. 为什么你需要关注GLM-4v-9b 你有没有遇到过这样的场景:一张密密麻麻的财务报表截图发到工作群,大家却没人愿意花十分钟手动抄录数据;或者客户发来一张手机拍的电路板照片,问“这个元件型号是什么”,你只能回个尴尬的微笑;又或者团队正在做竞品分析,需要从几十份PDF产品手册里快速提取图表信息——这些不是小问题,而是每天真实消耗工程师、运营、产品经理大量时间的“视觉理解黑洞”。 过去,这类任务要么靠人工硬啃,要么得调用API付费接口,响应慢、成本高、隐私难保障。直到2024年,智谱AI开源了glm-4v-9b——一个真正能在你自己的RTX 4090上跑起来的90亿参数多模态模型。它不只是一张“能看图说话”的新名片,而是把高分辨率图像理解能力,塞进了一张消费级显卡的显存里。 重点来了:它支持原生1120×1120输入,这意味着你不用再把一张A4扫描件缩成模糊小图上传;它对中文表格、小字号OCR、技术类图表的理解,在公开评测中直接超过了GPT-4-turbo和Claude 3 Opus;

使用 VS Code 与 GitHub Copilot 高效 Vibe Coding 指南

欢迎大家关注「几米宋」的微信公众号,公众号聚焦于云原生、AI、服务网格、工具教程、技术观察以及日常感悟等内容,更多精彩内容请访问个人网站 jimmysong.io。 📄 文章摘要 掌握 VS Code 与 GitHub Copilot 的高效开发技巧,提升你的编程体验与效率,开启愉快的 vibe coding 之旅。 🔗 在 jimmysong.io 上 阅读原文 体验更佳。 最近一段时间笔者试用了众多的 vibe coding(氛围编程)工具,但是试用了一圈后,最终还是选择了 VS Code 与 GitHub Copilot 的组合。不为别的,就是因为最得心应手、性价比最高、最有可扩展性。本文将从环境配置、工作空间和插件、界面布局、

[AI工具箱] Vheer:免费、免登录,一键解锁AI绘画、视频生成和智能编辑

[AI工具箱] Vheer:免费、免登录,一键解锁AI绘画、视频生成和智能编辑

项目简介 今天偶然发现了个堪称“赛博活佛”的AI网站,名叫Vheer。它的作风相当大方,里面绝大部分功能都直接免费敞开用,就问你服不服。 文生图、图生视频、智能修图这些主流AI功能一个不落。点开就能用。而且非常的大气,比如抠图,别的网站按张收费,它直接让你一口气传20张照片自动处理,完全免费,甚至你去花时间不需要注册。 它几乎移除了所有上手障碍。网站首页清晰地排列着各种功能,没有晦涩的术语。你想把文字变成图片,或者让静态照片动起来,点开对应的按钮,输入你的想法,结果很快就能呈现在你面前。整个过程简单得就像在用一款普通的手机APP。 食用指南 访问地址 传送地址 官网的免费会员上面写的几个非常吸引人的地方,第一没有任何水印,第二生成图片视频这些是没有任何数量上的限制,只有高级别的模型和高速通道不能使用(但是实测下来,生成的速度也是相当不错)。 网站也提供了一些订阅模式,可以使用更高级的模型,但是这些高级模型需要消耗算力点。根据自己的需要看是否订阅。 由于功能实在太多了,强烈建议亲手测试一下 操作与体验——文生图 官网光一个文生图的功能就折腾出来了40多个功能,除了

从GAN到ChatGPT:AIGC技术演进与实战应用指南

快速体验 在开始今天关于 从GAN到ChatGPT:AIGC技术演进与实战应用指南 的探讨之前,我想先分享一个最近让我觉得很有意思的全栈技术挑战。 我们常说 AI 是未来,但作为开发者,如何将大模型(LLM)真正落地为一个低延迟、可交互的实时系统,而不仅仅是调个 API? 这里有一个非常硬核的动手实验:基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。 从0到1构建生产级别应用,脱离Demo,点击打开 从0打造个人豆包实时通话AI动手实验 从GAN到ChatGPT:AIGC技术演进与实战应用指南 技术背景:关键模型演进时间轴 2014年 - GAN横空出世 生成对抗网络(GAN)通过生成器与判别器的对抗训练,首次实现了高质量图像生成。核心突破在于: