人工智能前沿动态:哈佛 AI 课程、微软证书及行业新规
本期汇总了多项人工智能领域的重要动态。哈佛大学将在 CS50 课程中引入 AI 助教,微软推出首个生成式 AI 技能证书。纽约州立法禁止恶意 deepfake,Inflection AI 完成新一轮融资。此外还包括 AI 诊断老年痴呆准确率提升、MIT 图注优化工具、DragDiffusion 图像编辑技术及李开复新公司零一万物等信息。内容涵盖教育应用、法律法规、企业融资及技术进展等多个方面。

本期汇总了多项人工智能领域的重要动态。哈佛大学将在 CS50 课程中引入 AI 助教,微软推出首个生成式 AI 技能证书。纽约州立法禁止恶意 deepfake,Inflection AI 完成新一轮融资。此外还包括 AI 诊断老年痴呆准确率提升、MIT 图注优化工具、DragDiffusion 图像编辑技术及李开复新公司零一万物等信息。内容涵盖教育应用、法律法规、企业融资及技术进展等多个方面。

今日值得关注的人工智能新动态:
当前,关于 GPT-4 等大型语言模型在教育中的机会(如内容生成、解释)和风险(如作弊)的讨论有很多,但很少有关于这些模型在支持课程设计和高质量学习目标(LOs)撰写方面的能力的探讨。该研究评估了 GPT-4 在 AI 课程中自动生成高质量学习目标(LOs)的能力。数据显示,生成的 LOs 是合理的,且表达恰当(如以动词开头),表明先进的生成模型有潜力帮助教师进行课程设计。

论文链接: https://arxiv.org/abs/2306.17459
自今年秋季学期起,哈佛大学将引入一个类似于 ChatGPT 的人工智能聊天机器人,作为其著名的 CS50(计算机科学导论)课程的讲师。该课程的主讲教授 David Malan 表示,这个 AI 聊天机器人将为学生提供基于软件的工具,24 小时支持他们学习,适应学生的个人喜好和节奏。Malan 还表示,'尽管该机器人本质上与 ChatGPT 类似,但其工作原理是'引导学生找到答案,而不是把答案交给他们',学生应该始终具有批判性思维。'

近日,微软推出了一项新的 AI 技能计划,任何人都可以通过 LinkedIn 接受免费在线培训,学习 AI 概念和框架,从而获得生成式 AI 技能证书。该证书目前以英语提供,未来几个月将提供中文、法语和德语等版本。该课程预计将在 2025 年之前免费上线。

纽约州议会日前通过了一些法案,其中包括一项禁止网上'深度伪造'(deepfake)图像的法案。deepfake 是指图像或视频被篡改,使其看起来好像某人在说或做他们从未说过或做过的事情。该法案将规定,创建或传播用于伤害或羞辱某人的 deepfake 是非法的。

日前,75 岁的阿诺德·施瓦辛格在一场活动中表示,在电影《终结者》中预言的 AI 世界已经'成为现实'。
'今天,每个人都害怕它,害怕它成为我们不愿意看到的样子,'施瓦辛格在谈到当前 AI 现状时说道,'在《终结者》中,我们谈论机器变得具有自我意识并接管一切…现在几十年过去了,这已经成为现实。'

近日,为简化痴呆症和阿尔茨海默病的诊断,研究人员开发了一款 AI 工具 CognoSpeak。该工具利用虚拟代理让患者参与认知测试并分析他们的语言和言语模式,从而提供快速有效的评估。CognoSpeak 可通过网络浏览器访问,允许患者在家中进行测试。初步试验表明,该工具在区分阿尔茨海默病患者和认知健康个体方面的准确率高达 90%。

近日,Inflection AI 宣布在新一轮融资中筹集了 13 亿美元,该轮融资由微软和英伟达领投,新一轮融资使公司融资总额达到 15.25 亿美元,在 AI 领域的估值仅次于 OpenAI。目前 Inflection AI 与合作伙伴 CoreWeave 和 NVIDIA 一起,正在构建世界上最大的人工智能集群,该集群包含 22000 个 NVIDIA H100。Inflection AI 表示,新一轮融资将继续用于人工智能集群和新产品 Pi 的开发。

为了编写高质量的图注,麻省理工学院的研究人员推出了一个名为 VisText 数据集。使用该数据集,研究人员可以教会机器根据用户需求改变图注中的内容。基于数据集开发的自动系统可以为无字幕的在线图表提供更丰富的描述,提高视力障碍人士的可访问性。

AI 又有了新用途——帮助昆虫完成授粉。为保护昆虫传粉媒介,艺术家 Alexandra Daisy Ginsberg 等联合开发了一种用于花园规划的 AI 算法——Pollinator Pathmaker。他们希望通过使用该算法精确选择植物品种和精心布置来最大限度地增加昆虫传粉媒介的数量,从而帮助减缓当地飞虫的数量下降。

近来大火的 DragGAN 实现了一个基于点的交互式图像编辑框架,并以像素级的精度取得了令人印象深刻的编辑结果。然而,由于该方法是基于生成对抗网络(GAN),其通用性受到预先训练好的 GAN 模型能力的限制。来自新加坡国立大学和字节跳动的研究团队将这样一个编辑框架扩展到扩散模型,并提出了 DragDiffusion。与现有的大部分基于扩散模型的图像编辑方法不同,DragDiffusion 通过优化扩散潜变量(diffusion latent)实现了精确的空间控制,能够高效地完成高质量编辑,且具有多功能性和通用性。

论文链接: https://arxiv.org/abs/2306.14435
近日,微软研究院发布了'升级版'多模态大型语言模型(MLLM)——Kosmos-2。Kosmos-2 不仅具备感知一般模态、遵循指令和执行上下文学习的功能,还能将 grounding 能力集成到下游应用中。该研究为具身 AI 的发展奠定了基础,同时也为语言、多模态感知、行动和世界建模的大融合提供了重要启示。
论文链接: https://arxiv.org/abs/2306.14824
中国香港为初中学生推出了该市首个 AI 课程,包括 ChatGPT 的使用以及该技术的道德和社会影响。当地教育局要求 450 多所公立学校将 AI 教育纳入初中一至三年级学生的信息与通信技术(ICT)科目中。
美国一男子开发了一款 AI 聊天机器人,用来浪费电话推销员的时间。该男子告诉《华尔街日报》,该聊天机器人使用了预设的表达和针对特定话题的回答,并通过语音克隆器传递出来,真实到推销员以为自己在和真人交谈。
为了使大型语言模型能够记忆长期(对话)历史,来自加州大学圣塔芭芭拉分校和微软研究院的研究团队提出了一个用长期记忆增强的语言模型 LongMem。当该模型通过使用传统的大型语言模型检查输入时,会将一些输入存储在内存库中。它还将每个当前提示(prompt)的输出传递给另一个名为 SideNet 的神经网络中。结果表明,该方法在 ChapterBreak(一个具有挑战性的长文本建模基准)上优于强长文本模型,并在内存增强的 in-context 学习上比其他 LLMs 取得了显著的改进。

论文链接: https://arxiv.org/abs/2306.07174
李开复以 Project AI2.0 之名入局大模型的创业公司和官网今日正式亮相,公司名为'零一万物',总部位于北京。该公司定位为打造 AI 2.0 的平台和应用,技术路线为自研大模型,三个月内已实现百亿参数规模的模型内测,目前正向 300 亿到 700 亿参数规模扩大。已加入的联创团队成员包括前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管等,记者在官网注意到,'零一万物'正面向全球招募 AI 人才。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online