国内大模型领域迎来新动态
5 月 15 日,字节跳动正式发布'豆包大模型'。据字节跳动有关负责人介绍,豆包大模型目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。豆包大模型原名'云雀',是国内首批通过算法备案的大模型之一。
多模态能力与生态联盟
豆包大模型提供的是一个有多模态能力的模型家族,主要包括通用模型 pro、通用模型 lite、语音识别模型、语音合成模型、文生图模型等 9 款模型。火山引擎总裁谭待表示,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一。
发布会当天,字节跳动还宣布与国内多家汽车和电子消费厂商合作推出'大模型生态联盟'。在汽车领域,与吉利、长城、赛力斯等 20 余家厂商成立汽车大模型生态联盟;与 OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO、荣耀、小米和华硕等多家厂商旗下的 AI 助手已接入字节跳动的大模型服务。
价格竞争进入'厘时代'
激烈市场竞争中,价格成为大模型行业关注的重点之一。字节跳动有关负责人称,豆包主力模型在企业市场的定价只有 0.0008 元/千 Tokens,比行业便宜 99.3%。根据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的 125 万 Tokens,大约是 200 万个汉字。
国内外竞品迭代情况
近期,国内外多款大模型重磅消息不断。
- OpenAI: 5 月 14 日正式推出新一代大模型 GPT-4o,能够接受文本、音频和图像任意组合的输入与输出,响应更快、效率更高。GPT-4o 可以检测人的情绪,并以类似人类或机器人的语调与用户交谈,最快 232 毫秒的时间内响应音频输入。
- 阿里云: 5 月 9 日发布通义千问 2.5,在中文场景模型性能赶超 GPT-4-Turbo,1100 亿参数开源模型在多个基准测评收获最佳成绩。相比上一版本,2.5 版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升 9%、16%、19%、10%。
- 谷歌: 5 月 15 日凌晨在 2024 年 I/O 开发者大会上推出轻量化的模型 Gemini 1.5 Flash、AI 通用智能体 Project Astra 等,Gemini 1.5 Pro 的上下文窗口从 100 万 tokens 升级到 200 万。
行业分析与展望
麦肯锡报告分析,大模型的价值创造潜力惊人,到 2030 年,有望在全球推动 49 万亿人民币的经济增量。QuestMobile 数据显示,截至今年 3 月,基于大模型的 AIGC 行业用户量为 7380 万,尽管同比增长了 8 倍,也仅占移动互联网用户量的 6%。
华泰证券研报分析称,在 AI 大模型的商业模式和竞争格局方面,可能形成赢者通吃或国内外寡头竞争的局面,而行业大模型则有望百花齐放。目前'基础大模型'到'行业大模型'再到'终端应用'的大模型路线非常清晰。训练基础大模型的高成本和高技术壁垒,决定了科技巨头或成为主要玩家。未来可能产生专门精调行业大模型的公司,凭借对垂直领域的专门技术,深耕某一赛道的行业大模型。AI 大模型最大的投资机会在应用,在搜索、电商零售、办公、金融、医药等行业有望率先落地。


