AI 大模型新型智算中心技术体系深度分析
ChatGPT 系列大模型的发布,不仅引爆全球科技圈,更加夯实了人工智能(Artificial Intelligence, AI)在未来改变人类生产生活方式、引发社会文明和竞争力代际跃迁的战略性地位。当前各国政府已全面布局 AI,作为 AI 技术发展的关键底座,智算中心的建设和部署在全球范围内提速。
然而,早期建设的智算中心,以承载中小模型、赋能企业数智化转型为主要目的,在技术标准、生态构建、业务发展和全局运营等各方面仍有待提升。当追逐大模型成为行业标准动作,面向大模型的新型智算中心(New Intelligent Computing Center,NICC)成为新时期关注的焦点。
新型智算中心的建设是一个系统工程,需要'算存网管效'多个维度的协同设计。为构建智能服务的核心和基础,定义新型智算中心技术体系架构,并面向未来大模型孵化,从新互联、新算效、新存储、新平台和新节能等五个领域提出下一代技术演进建议,希望本文为大家在新型智算中心的硬件设备选型、算力集群设计、机房散热规划、软硬工程调优、全局运营调度等多个方面的技术路线选型提供帮助。
一、智算中心行业发展现状
1.1 智能算力跃升为全球第一大算力,智算中心建设如火如荼
1956 年第一次 AI 发展浪潮信息伊始,60 多年来,从理论探索到大数据驱动,从深度学习到大模型智能涌现,AI 正在成为一项新兴的通用型技术,向多场景、规模化、AIGC(AI Generated Content)等方向快速演进。智能算力作为 AI 的底座型技术迎来需求井喷。据统计,到 2030 年,全球智能算力需求增长约 390 倍,增速远超摩尔定律。据《中国算力发展指数白皮书(2022)》指出,我国智能算力也在近几年保持快速增长态势。2021 年我国智算规模已达到 104E FLOPS,占比超过总算力的 50%,预计到 2030 年将升至 70%,成为算力的主要增长极。智算成为全球第一大算力已是大势所趋。
随着 AI 在赋能产业发展、促进数实融合方面发挥出愈加显著的作用,各国政府纷纷发布政策引导其发展。美国为加强其在 AI 领域研发和部署的领导地位,于 2019 年签署《美国人工智能倡议》(American AI Initiative),旨在从国家战略层面重新分配资源,用于 AI 研发,以应对来自'战略竞争者和外国对手'的挑战。
之后,在 2021 年颁布《美国创新与竞争法案》,高度关注 AI 与机器学习、高性能计算、半导体等十大关键技术领域。欧盟在 2021 年发布《2030 数字指南针:欧洲数字十年之路》,要求到 2030 年 75% 的欧盟企业使用云计算、大数据和 AI 技术。
我国也高度重视 AI 技术发展,自 2017 年以来国家各部委和地方政府相继出台政策,指导 AI 产业发展规划,鼓励企业加大人才引进和研发力度,并明确指出要积极推动智算中心有序发展。
至此,智算中心作为一种新型算力基础设施为大家所熟悉。不同于传统的云数据中心和超算中心,智算中心是以 GPU、AI 加速卡等智能算力为核心、集约化建设的新型数据中心,为人工智能应用提供所需的算力服务、数据服务和算法服务,使能各行各业数智化转型升级。


