AI算力建设的“混沌时代”该怎么办?

原创 环球时报

当算力之争逐步成为各国人工智能(AI)竞争的重要一面,人工智能算力平台建设越发变得如火如荼。

放眼国际,在政府投资主导模式下,美国依托能源部下属6大国家实验室、国家科学基金会支持的依托高校的智能计算中心以及NASA下属的研究中心超级计算中心这三大体系,大力推动算力平台“长出”智能计算能力;欧盟则通过“EuroHPC计划”在欧洲建设8处大规模算力平台,并积极促进与人工智能技术的结合。

我国AI算力建设也正进入一个“大建设”时期。自2017年国务院印发《新一代人工智能发展规划》以来,我国通过政府投资主导、企业投资主导、政企合资等模式,一批AI算力基础设施拔地而起。最近,地方新建AI算力项目更是不断涌现,大有将弥合“AI算力鸿沟”的气势。

然而,AI算力建设还处于初期摸索阶段,存在建设标准不统一,行业定价混乱等问题。这些问题正悄悄成为这一新生平台发展路上的滞碍。

AI算力建设初期的“内在逻辑”

在发布白皮书《新一代人工智能算力基础设施发展研究》的报告中,国家工业信息安全发展研究中心副总工程师兼信息政策所所长黄鹏指出,AI产业化、产业AI化和政府治理智能化等需求,驱动着我国AI算力的建设。

“为什么很多地方积极布局算力基础设施?《2020全球计算力指数评估报告》显示,计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰。”黄鹏认为,对数字经济肉眼可见的拉动作用,是地方或区域加码AI算力的内在逻辑。

刚需确实存在。根据IDC预测,未来大概3/4的企业都期望加强其AI能力的建设,企业未来几年对AI算力需求的复合增长将达到近40%,而公共的人工智能算力基础设施将成为“香饽饽”。

在此背景下,越是“一窝蜂”地投建,越可能降低AI算力建设这样关系未来的基础性工程的实用性和适用性。

在《新一代人工智能算力基础设施发展研究》白皮书中,国家工业信息安全发展研究中心一口气梳理了AI算力基础设施建设中的四方面问题:国家顶层制度建设和标准体系仍不统一、国内AI芯片等软硬件技术仍受制于国外、大型智算中心面临重复建设且高能耗问题、重建设轻应用导致无法覆盖不同的应用场景需求。

“比如算力概念的混淆,尤其是没有匹配产业发展的针对性需求。另外,行业定价标准混乱,我们调研发现,功能类似、规模近似的两家智算中心,建设投入相差6倍多。这也说明了我们还处于智能算力发展的初级阶段,还没有形成标准化的模式。”黄鹏说道。

符合产业发展应做好充分调研

黄鹏阐释,AI算力的建设成本可分为3部分:厂房等基建、服务器和计算芯片等设备和产品、后期运维成本和电费等。就基建、电费、人员等的成本而言,东西部或许有差异,但“差6倍这么多就有点夸张了”。

黄鹏认为,智算中心的建设可借鉴参考中科院人工智能产学研创新联盟推出的算力价格标准方案——在综合存储、能耗、开发、定制、数据调度等一系列因子并代入明确算法标准后,得出同时具备5P双精度算力(64位)、25P单精度算力(32位)和100P半精度算力(16位)的情况下,智能计算中心的基础设施价格约为1亿~1.5亿元。

此外,黄鹏还提出,当前AI算力的建设还有一些明显的特征:高投入、高风险、高垄断性。她认为,尤其是当前能够一力提供AI算力全栈部署的“乙方”还不多,这也让地方政府缺少一定的选择空间。

对此,北京市大数据中心的副主任石志国在中国信息化百人会“数字新基建与数智化转型专题研讨会”上提出,充分的竞争是必要的。“我们希望有多家(建设者)竞争,虽然一家承建可以很好地统筹全局,但长此以往并不利于行业发展,而多家竞争可以逐步推进技术方案的完善。”

石志国还以AI算力建设为例,点出当前一些“新基建”的弊端:往往是建设的时候投入很多经费,到需要运维升级时投入开始缩减,如果AI算力中心没有很好的造血机制和可持续应用,未来它的改造、迭代会面临费用越来越少的窘境。

“AI算力需要社会力量的参与,让它服务于社会,甚至产生现金流、实现价值。”石志鹏说,要避免重金打造的AI算力一步步调入“重建设轻应用”的泥潭。

从高投入、高风险、高垄断的特点出发,黄鹏建议,地方政府要在建设AI算力平台之前做好充分的调研和论证,以免出现“低水平重复建设”和“与当地发展需求不匹配”的情况出现,“这不是我们想看到的”。

还须全行业潜心“闯关”

如果说“概念混淆”“价格混乱”“重建设轻应用”等问题可以通过充分的调研和论证来规避,但AI算力建设的一些深层次难题还需要全产业链的努力,比如AI软硬件技术受制于国外、大型AI计算中心的能耗过大成本过高等等。

中铝智能科技发展公司总经理文欣荣从用户的角度提出了同样的问题:“在选择供应商的时候我们经常会很纠结,因为我们不知道到底谁拥有核心技术。”他说,以前我们不够注重创新而被人“卡脖子”,现在来看,“我们在底层还有很多技术需要完善”。

黄鹏建议,企业层面要积极探索AI技术研发和模式创新,尤其要加大对AI芯片等核心技术的自主研发力度,联合上下游提升产业链粘合度和生态兼容度,同时加强对算法、框架、模型等软件平台及应用的研发,“把技术发展掌握在自己手中”。

对于AI算力基础设施运维面临的高能耗问题,黄鹏提出,龙头企业要牵头研发绿色低碳技术方案,并加大对低功耗技术整体方案的宣传推广与应用,让AI算力中心的PUE值降到最低。

同时,黄鹏提醒,还要警惕公共AI计算中心的适用范围出现“偏科”问题——要构建的AI计算中心不能过于“专”、仅能支持少数应用场景而无法提供普适性的AI应用服务,这将限制其应用场景、范围和效率。


了解《环球时报》的三观

请长按下方二维码关注我们or回到文章顶部,点击环球时报 (微信公众号ID:hqsbwx)

AI算力建设的“混沌时代”该怎么办?

本文转载自https://mp.weixin.qq.com/s/BZAhthOz7sa_ODyetluRWA

(0)
PlatONWorld-M6的头像PlatONWorld-M6管理员
上一篇 17 9 月, 2021 20:51
下一篇 18 9 月, 2021 10:29

相关推荐

发表回复

登录后才能评论