原标题:算力网络深度:全国一体化算力网络建设加速(附下载)
(报告出品方:东方证券)
全国一体化算力网络建设相关政策有望持续出台。算力网络已成为国家重点发展领域之一,利好 政策持续出台,未来行业发展前景广阔。2020 年 12 月,《关于加快构建全国一体化大数据中心 协同创新体系的指导意见》首次提出全国范围内数据中心形成布局合理、绿色集约的一体化格局。 2021 年 7 月,工信部发布《新型数据中心发展三年行动计划(2021-2023 年)》,计划建设全 国一体化算力网络。2022 年 2 月,发改委发布《国家发展改革委等部门关于同意京津冀地区启 动建设全国一体化算力网络国家枢纽节点的复函》,标志着 “东数西算”工程正式启动,我国算 力网络发展扬帆起航。2023 年 2 月,中共中央、国务院发布《数字中国建设整体布局规划》, 将数字基础设施列为数字中国建设的两大底座之一。2023 年 4 月 17 日,科技部启动国家超算互 联网工作,成立了国家超算互联网联合体。预计到 2025 年,国家超算互联网将形成总体布局, 成为数字中国建设的“高速路”。我们认为,全国一体化算力网络建设相关政策有望持续出台。
2022 年 2 月,作为算网建设开始的“东数西算”正式启动。2022 年 2 月 17 日,国家发改 委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤 港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等 8 地启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数 西算”工程正式全面启动。
机器学习进入大模型时代,ChatGPT 等通用大模型的训练迭代极大拉动对智能算力的需求。模 型成功部署后,推理也将需要大量智能算力做支撑。从模型训练角度来说,据 J. Sevilla 等发布的 文章《Compute Trends Across Three Eras of Machine Learning," 2022 International Joint Conference on Neural Networks (IJCNN)》,机器学习的训练计算大概可以分为三个时期。第一 个时期为 2012 年之前,训练算力大致遵循摩尔定律,约每 20 个月翻一番。
而进入深度学习时代, 算力翻倍的速度加速至 5-6 个月。2015-2016 年左右开启了大模型时代,在这个时期,计算量增 长变慢,翻倍时间约为 10 个月。但整体的训练计算量比深度学习时代的系统大 2 到 3 个数量级 (OOM)。 从 2022 年底,随着 ChatGPT 成功带来的新一代 AI 浪潮,国内外 Bert、GPT4、文心 一言等通用大模型相继发布。这些大模型的训练需要千亿、甚至万亿级参数,以及上千 GB 的高 质量数据,大模型的训练迭代将极大地拉动了智能算力的需求。另外,日后随着模型的成熟落地 和推广,模型推理所需的智能算力也将逐渐增加,占比不断提高。
除了通用大模型的训练,垂直行业大模型的训练、基于通用大模型的微调的行业应用也需要大量 的智能算力做支撑。垂直行业的大模型训练也需要大量的智能算力,另外,基于大模型的多场景 应用也不断拓展。AI 渗透千行百业,拉动智能算力规模高速增长。2022 年,各行各业的 AI 应用 渗透度都呈不断加深的态势,尤其是在金融、电信、制造以及医疗领域,为实现业务增长、保持 强大竞争力、从而占据更大的市场份额,企业纷纷入局 AI 领域,通过新技术提升传统业务用户体 验,人工智能应用增长迅速。据 IDC 和浪潮信息联合发布的《2022-2023 中国人工智能计算力发 展评估报告》,预计到 2023 年年底,中国将有 50%的制造业供应链环节采用人工智能技术实现 业务体验提升。在未来,随着 AI 技术对传统行业赋能作用日益凸显,催生出更大智算需求成为必 然。
AI 应用存在此长尾效应,实现规模化首要实现算力普惠。孙凝晖院士在演讲中提出,AIGC 带来 人工智能产业的爆发,而智能技术的规模化应用具有典型长尾问题,即具备强 AI 能力的强势部门 (网安、九院九所和气象局等)、科研院校与大中企业只占据算力需求主体的大约 20%,另外 80% 则均为中小微企业,这类主体受限于公司规模与预算,往往难以接入算力资源、或受限于算力的 高昂价格,从而难以在 AI 时代浪潮中获得发展红利。因此,要实现智能技术的规模化应用,让人 工智能产业既“叫好”也“叫座”,需要大量便宜、易用的智能算力,让中小微企业也能方便、 便宜地使用算力。因此实现算力普惠,一方面可以支持先进科技发展,赋能更多产业 AI 化,同时 还能让 AI 走入千家万户,达成 AI 普惠。
算力要成为像水、电一样的公共资源,需要由算力网络扮演路、桥的角色。算力应该是水、电一 样普惠大众、随取随用的公共基础资源,早在 1961 年,美国教授 John McCarthy 就将算力类比 为电话服务,可以随取随用。到了 1990 年,美国 Ian Foster 教授将算力与电力类比,提出算力 是一种公共服务。今天,我们来到了数字经济时代,算力将成为水、电一样普惠大众、随取随用 的公共基础资源,为社会高效发展赋能,最终实现“网络无所不达、算力无所不在、智能无所不 及”的社会愿景。而为实现这一愿景,需通过算网来整合并调度各方算力资源,并分配给个需求 方。
算力网络是提供普惠算力的最优解,或将成为智能时代的标志性基础设施。目前,算力对大部分 公司、科研院所、个人来说都是奢侈品,没有成为普惠大众的基础资源。像上述所讨论的那样, 我国算力存在着供需失衡、成本较高、鲁棒性不足等问题。急剧增长的全行业计算需求与相对较 慢的迭代发展速度造成了算力供需失衡;同时,地理位置上聚集于东部、行业上大量存在于互联 网企业等分布特点也对算力资源的合理分配构成阻碍,算力流动进而导致成本不能有效满足普惠 发展需求;此外,数据中心的建设带来了更加复杂的算力应用场景,随之带来的偶发性算力需求 激增和隐私数据安全保护诉求对各节点的鲁棒性、安全性提出了更高的要求。为解决以上难点, 实现跨地域与跨行业共享、弹性按需调动,算力网络应运而生,成为算力资源健康发展的最优解。 在不久的将来,算力网络将成为这个数字经济时代、智能时代的标志性基础设施。
计算场景愈发丰富,不同应用对算力精度、延迟、带宽等提出不同需求。算力作为逻辑资源,本 身与水电等标准化资源相比就更加复杂、具备更多维度,而技术的发展催生了丰富的计算场景, 不同的行业、应用场景对算力更提出了不同的需求,进一步增加了构建网络的复杂度。例如,天 体物理、气象研究、航空航天等高精尖科研领域需要能够支持复杂运算、性能高的双精度算力, 即超算算力。而无人驾驶、智慧交通等 AI 主要用于处理语音、图片或视频等,单精度、半精度、 甚至整型的计算即可满足应用需要。 而一些产业数字化的场景对精度要求不高,通用算力(基础 算力)即可满足需求。除了算力精度,不同的应用场景对带宽和延时也提出了不同的需求。例如, 需要实时渲染的游戏、自动驾驶决策、远程手术、工业控制等领域对延迟的要求非常高,而模型 训练等场景则对延迟没有很高要求。同时,基于 AR、VR 等渲染场景,模型训练、超算类等场景 对大带宽的需求较高,工控、物联网采集等则对带宽要求不高。
算力网络:云边端节点全连接,动态感知、灵活调度。
算力网络是通过新型网络技术将云、边、 端等分散的算力节点连接起来,动态实时感知算力资源状态,根据业务需求进行统筹分配和调度。 不同的业务需要的算力种类、带宽、延时不同,然而在算力网络中用户无需关心网络中计算资源 的位置和部署状态。算力网络可以实时感知客户的算力需求,并根据算力资源池的情况,给客户 自动调配符合其需求的最优算力,获取算力将像获取水、电一样便捷、价低。
在众多地方政策中,主要聚焦于公共算力平台建设、算力调度中心建设、鼓励中小企业参与共建、 算电一体四个方面。
1. 加强智能算力供给:推动算力基础设施建设,以智能算力供给为主,且需满足绿色低碳要求。 同时,一些文件对芯片、操作系统、开源深度学习框架的国产化提出要求。
2. 算力资源统筹调度:推动算力标准化和服务化,统筹算力资源,实现算网统一管理、编排和 调度。
3. 鼓励中小企业、第三方云厂商积极参与算网建设、接入算网:鼓励中小企业参与算网共建, 不仅可有效避免“帝国制”的垄断运营,同时也可使算力网络建设惠及更宽领域、带动产业健康 发展。
4. 推动“算电一体”新型供能体系建设,助力算网升级,赋能双碳目标: 鼓励超算中心、智算 中心、新型数据中心等因地制宜地配置储能设施,以提升电力自平衡能力,进一步推动了算力基 础设施与储能设施的融合发展。
下面四章,我们将从这四个重点发展方向进行论述,梳理相关政策、分析相关产业发展现状。
算力可分为通用算力、超算算力与智算算力三种,分别应用在不同场景中。通用算力主要来源于 通用处理器 CPU,应用场景非常广泛,可用于对精度要求不高的数字化场景中。而超算算力则主 要支持天体物理、气象研究、航空航天等高精尖科研领域。这些场景运算量大,且对精度要求高 (双精度算力)。智算算力则主要应用于 AI 场景中。对于 AI 模型训练及推理来说,处理文字、 语音、图片或视频等需求较大,单精度、半精度、甚至整型的计算即可满足应用需要。一般来说, 相比于模型训练,模型推理所需的算力精度较低,很多场景 Int8 即可满足需要。
据国家信息中心,未来 80%的场景都将基于人工智能,所需算力资源将主要由智算中心提供。AI 大模型已经成为国家、企业和科研院所积极发展、重点投入的大方向。而普惠大众的智能算力就 是 AI 发展的基础资源,智算中心正是实现这些科技创新的源泉。
从智能算力总额来看,美、中处于领先地位。从人均智能算力的角度,中国仍处于全球中等水平。 据《中国算力指数发展白皮书(2022)》,美、中的智能算力处于全球领先地位,分别占全球比 重的 45%和 28%。然而从人均算力的高低来衡量,美国、英国、德国等国家的人均算力普遍高于 1000GFlops,而我国的人均算力处于中等水平。据 IMD 研究发现,人均算力的水平与一国 的智能化水平高度相关,我国积极发展智能算力、打造智算中心是打造国际竞争力、发展综合国 力的关键。
中国智能算力规模有望持续快速增长, 2021-2026 年期间,预计年复合增长率达到 52.3%。据 IDC 数据与预测,2021 年中国智能算力规模达到 155.2EFLOPS,并在之后的几年始终保持稳健增长 态势,预计到 2026 年将突破进入每秒十万亿亿次浮点计算级别,智能算力实现 1,271.4EFLOPS 的庞大规模,2021-2026 年期间,预计年复合增长率达到 52.3%。
中国 AI 芯片市场将保持高速增长。2022 年,中国的 AI 芯片市场规模约 385 亿元。随着 AI 发展 以及智算中心建设浪潮,该市场预计将保持高增长趋势。据艾瑞咨询测算,到 2027 年,中国的 AI 芯片市场规模预计将达到 2164 亿元。
2022 年,我国智能算力占比已达到 60%,预计于 2027 年达到 88%。我国智能算力占比连年快速 拉升。据头豹研究院,目前已从 2018 年的 12%快速增长至 2022 年的 60%,超过通用算力并且 持续保持稳健增长态势,预计智能算力的占比将在 2023 年达到 70%,在 2027 年达到 88%。因 此,建立智算平台成为大势所趋,AI 应用迫切呼唤充沛的算力养料。
《算力网络系列深度二:全国一体化算力网络建设加速》PDF,来源(幻影视界)。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
本报告共计:62页。受篇幅限制,仅列举部分内容。返回搜狐,查看更多
责任编辑:
相关标签: