企业动态
新清影:模型全面升级、4K、任意比例、自带音效
日前,智谱面向公众开放的视频生成产品,并在智谱清言 App 上线。基于 CogVideoX 模型的最新技术进展和最新推出的音效模型 CogSound,新清影在以下 5 个方面实现了提升。
模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。
4K 超高清分辨率:支持生成 10s、4K、60 帧超高清视频,视觉体验拉到极致,动态画面更加流畅。
可变比例:支持任意比例的图像生成视频,超宽画幅也能轻松 Hold 住,从而适应不同的播放需求。
多通道生成能力:同一指令/图片可以一次性生成 4 个视频。
带声效的 AI 视频:新清影可以生成与画面匹配的音效了。音效功能将很快在本月上线公测。
OpenAI 正在与监管机构谈判,希望成为一家盈利性公司
据报道,OpenAI 正在与加利福尼亚州和特拉华州的监管机构进行初步谈判,目标是将该公司转变为营利性公司。根据加州法律,这一过程可能很复杂,该法律要求将分配给非营利资产的价值分配给慈善事业,但 OpenAI 的主要资产是其知识产权。
Meta 前 Orion 硬件负责人将加入 OpenAI
据《TechCrunch》报道,前 Meta Orion 硬件负责人 Caitlin Kalinowski 宣布加入 OpenAI,领导机器人和消费硬件部门。Kalinowski 此前在 Meta 负责 AR 眼镜和虚拟现实设备的硬件开发,还曾在苹果设计 MacBook 硬件。在新职位中,她将专注于 OpenAI 的机器人项目,推动 AI 在物理世界中的应用。
Physical Intelligence 推出通才机器人模型 π0
尽管 AI 在生成图像、视频、甚至蛋白质结构预测方面取得显著进展,但与人类相比,AI 在物理世界的操作上仍存在巨大差距。
基于此,Physical Intelligence 开发了通才机器人模型 π0,希望通过融合多模态数据和物理交互经验,使其拥有物理智能。这款模型采用预训练的视觉语言模型(VLM)作为起点,结合网络结构创新实现了高频率运动输出,支持更灵活的机器人操作,不仅可处理图像、文本和物理动作数据,还能通过低层次的运动指令控制多种机器人,甚至支持专门任务微调。实验表明,π0 具备处理复杂任务的能力,如通过微调可成功完成堆叠餐具或整理衣物等高度灵活的操作。这一成果为未来构建具备普适性物理智能的机器人提供了重要基础。
该公司日前刚刚筹集了 4 亿美元,融资后估值为 24 亿美元。此轮融资由 Jeff Bezos、风险投资公司 Thrive Capital 和 Lux Capital 领投,其他投资者包括 OpenAI、Redpoint Ventures 和 Bond。
xAI 推出公开测试版 API
日前,xAI 推出了公开测试版 API,它使开发人员能够以编程方式访问他们的 Grok 系列基础模型。Grok 模型的上下文长度为 128000 个 tokens,支持函数调用和系统提示。除了纯文本版本的 grok-beta 模型外,他们还将发布图像多模态模型版本。
BlackForest Labs 推出 FLUX1.1 [pro] Ultra 和 Raw 模式
BlackForest Labs 宣布推出 FLUX1.1 [pro] Ultra 和 Raw 模式。其中,Ultra 模式可生成分辨率为标准 FLUX1.1 [pro] 四倍的图像,而不会牺牲提示遵守度(prompt adherence),生成速度比同类高分辨率产品快 2.5 倍以上。Raw 模式可以生成合成程度更低、更自然美感的图像。与其他文本转图像模型相比,Raw 模式显著增加了人物主体的多样性,增强了自然摄影的真实感。
Mistral AI 推出 Mistral Batch API
日前,Mistral AI 推出了 Mistral Batch API。Batch API 引入了一种更高效的方式来处理对 Mistral 模型的大量请求,成本比同步 API 调用低 50%。Batch API 的应用场景包括客户反馈和情绪分析、批量文档摘要和翻译、用于准备搜索索引的向量嵌入以及数据标记。
Mistral AI 推出 Mistral Moderation API
Mistral AI 推出了一款新的内容审核 API,旨在为下游应用提供系统级的安全防护,支持用户根据特定应用需求和安全标准进行调整。该 API 同样为聊天工具 Le Chat 提供审核支持,采用了基于大语言模型(LLM)的分类器,将文本内容分为 9 类。API 提供文本和对话两种端点,尤其针对对话的最后一条消息进行审核,支持多语言,涵盖阿拉伯语、中文、英语等 11 种语言。内容审核分类器通过相关政策类别为 AI 安全提供有效的防护机制。
Anthropic 将为美国情报和国防机构提供 Claude 模型
Anthropic 正在与数据分析公司 Palantir 和 AWS 合作,为美国情报和国防机构提供 Claude 系列 AI 模型。Claude 于本月初在 Palantir 平台上推出,现在可以在 Palantir 的国防认证环境 Palantir Impact Level 6 (IL6) 中使用。Anthropic 销售主管 Kate Earle Jensen 表示,'我们很自豪能够走在将负责任的 AI 解决方案引入美国机密环境的前沿,提高政府重要运营的分析能力和运营效率'。


