智算中心会成为自动驾驶的“新基建”吗?

1.jpeg

“超算中心会成为自动驾驶企业的入门配置。” 第七届HAOMO AI DAY上,毫末智行董事长张凯给出了2023年自动驾驶行业趋势的十大新预测,超算中心赫然位列其中。考虑到此次AI DAY的重头戏就是毫末自己的智算中心,意外

“超算中心会成为自动驾驶企业的入门配置。”

第七届HAOMO AI DAY上,毫末智行董事长张凯给出了2023年自动驾驶行业趋势的十大新预测,超算中心赫然位列其中。考虑到此次AI DAY的重头戏就是毫末自己的智算中心,意外之情倒也少了几分。

会上,毫末智行宣布与火山引擎联合打造智算中心雪湖·绿洲,官方介绍称,该智算中心每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。

如果长期关注自动驾驶行业动态的话,可以发现,近几年不管是造车新势力,还是自动驾驶技术方案企业,纷纷自建超算中心。

最早在2021年8月20日,特斯拉发布自研神经网络训练芯片,当时计划组建超级计算机Dojo。最近一期的特斯拉AI DAY上,马斯克公布了超算Dojo D1芯片的最新进展,称将于2023年一季度部署完成特斯拉超级计算机群组ExaPOD。

小鹏紧随其后。2022年8月2日,小鹏汽车宣布与阿里云在内蒙古乌兰察布建设智算中心“扶摇”用于自动驾驶模型训练,算力可达600PFLOPS(每秒60亿亿次浮点运算)。

曾有业内高管评价称,现在很多车企和自动驾驶技术企业已经开始把打造智算中心当成下一阶段竞争重点。

那么,究竟什么是智算中心?智算中心为什么能够成为自动驾驶企业的“香饽饽”?智算中心又是否会成为自动驾驶企业的入门配置?这是本篇文章要探讨的问题。

智算中心:算力的商品化体现

智算中心不是一个新物种。

2020年4月20日,国家发展改革委首次明确新型基础设施的范围,其中就包括以智能计算中心为代表的算力基础设施。

同年11月17日,第十届全球智慧城市大会上,国家信息中心信息化和产业发展部联合浪潮发布了《智能计算中心规划建设指南》。这是首份对智能计算中心进行全面深入解读的报告。

《指南》对智能计算中心,即智算中心进行明确定义:智能计算中心是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施……

通俗来说,智算中心其实是一个算力的供应和生产平台。由于概念相近,往往容易与超算中心、云数据中心概念相混淆。但其实在建设目的、技术标准、具体功能、应用领域和“投-建-运”模式等方面,与后两者相比,智算中心都有所差别。

可以看到,近年来,国内掀起一波智算中心“落地潮”。

据不完全统计,从2021年初到2022年2月底,全国至少有26个城市在推动或刚刚完成当地智算中心的建设,其中已经投入使用的就包括南京、合肥等地的智算中心。

考虑2022年疫情反复影响项目施工进度,预计2023年仍为智能算力中心建设“大年”。这背后存在着多种驱动因素。

一方面,与近年来的政策推动有关。2022年2月18日,“东数西算”上升为国家战略,政策方面的扶持和激励,特别是东数西算工程的全面启动,为智算中心的快速发展注入了助推剂。

另一方面,产业趋势也是智算中心得以快速落地的催化剂。根据《中国算力发展指数白皮书(2021年)》测算,算力每投入1元,将带动3-4元的经济产出。

IDC、清华大学和浪潮信息联合发布的《2021-2022全球计算力指数评估报告》也提到,国家的算力指数每提高1个百分点,数字经济和GDP将分别增长3.3‰和1.8‰。

与此同时,随着自动驾驶、生命医学、智能制造等前沿领域发展迅速,随之而来的是超大规模人工智能模型和海量数据对算力需求的不断提高,智算中心的建设恰逢其会。

现阶段,在市场上比较活跃的智算中心包括阿里云搭建的两座超大规模智算中心:

2022年8月30日,阿里云宣布正式启动张北超级智算中心和乌兰察布智算中心,张北智算中心总建设规模为12EFLOPS(每秒1200亿亿次浮点运算)AI算力,乌兰察布智算中心建设规模为3EFLOPS(每秒300亿亿次浮点运算)AI算力。可为AI大模型训练、自动驾驶、空间地理等人工智能探索应用提供强大的智能算力服务。

业内人士透露,乌兰察布基地算力规模为300亿亿次,上文提到的“扶摇”算力为60亿亿次,阿里云与小鹏汽车的合作占整体AI算力的20%,小鹏汽车拥有300人团队建设扶摇平台,为阿里云最大的合作伙伴。

碰巧的是,在本次AI DAY官宣之前,毫末曾公开宣布筹建智算中心,并且与阿里云基于飞天智算,在自动驾驶模型训练有所合作。因此,彼时市场猜测双方很有可能在此基础上进一步延续。

可结果令人诧异,最终毫末选择了字节旗下的火山引擎联合打造智算中心,侧面也反映了云市场的竞争愈发激烈。

自动驾驶的加速器

无论是毫末、小鹏,还是特斯拉,都在用自身的案例抛给行业一个问题——车企是不是需要考虑拥有自己的智算中心?从现有情形来看,成本和需求两重因素,是智算中心的诱人之处。

先从成本考量。当下,行业内已基本形成共识,算力是自动驾驶根本要素。自动驾驶不仅对车载算力提出了高要求,在完善策略的过程中,也需要更高性能的智算中心来完成训练、标注等工作。

此前在乌兰察布考察智算中心时,何小鹏曾表态:未来5年,小鹏汽车可能还有百倍的算力需求增长。希望大家都看到这个趋势。如果现在不以这样的方式提前储备算力,那么今后5年内,企业算力成本会从亿级,加到数十亿级。

显然,何小鹏对汽车未来算力成本的预测,表明了自建智算中心是为了降低成本。

根据《财新》报道,同样由于直接购买数据中心服务成本太高,毫末智行宣布筹建智算中心。毫末希望,智算中心的平均算力成本可以降低至目前的5‰。

而在成本之外,从需求的角度来看,智算中心似乎可以成为自动驾驶和车企的托底神器。自动驾驶的开发包括从数据采集到数据筛选、打标、模型训练、回放性验证、仿真测试等等,智算中心将在这几大环节中发挥重大作用。

拿数据采集、筛选和标注来说,自动驾驶系统在前期开发阶段,需要采集大量的道路环境数据,以此让车辆像人类驾驶员一样快速准确地识别车道、行人、障碍物等驾驶环境中的关键信息。

唯一的办法是,通过在海量数据基础上不断地重复训练与验证,车辆对道路环境的认知水平逐渐趋近于真实情景,判断的准确性在这一过程中不断提升。

2021年6月,特斯拉称当前拥有100万个由10秒钟视频组成的高度差异化场景,60亿个包含精确深度和速度的物体标注,总数据量为1.5PB。倘若算上量产车在上市后持续不断回传的场景数据,数据量必然会呈现指数级增长。

如何高效地用好持续增长的海量数据,并从数据中抽象出高阶智能驾驶算法?智算中心的作用在这里就体现出来。

不仅如此,车企收集到的数据还需要进行模型训练,算法通过在数据上进行运算产生模型,而超算中心将是驱动大模型和海量数据训练的加速器。

在“扶摇”的加持下,小鹏的自动驾驶模型训练效率提升了602倍。与2400TOPS算力的服务器进行单机训练相比,80机并行训练可将训练时长由276天缩短至11小时。

毫末智行CEO顾维灏也在AI DAY上详细阐释了建设智算中心的底层逻辑,“自动驾驶对智算中心的第一要求肯定是算力。智算中心的超大算力代表了有多少的 AI 工程师在这个练武场中能够做出什么大模型,能训练多少大模型。”

此外,高强度的算力不仅需要用于模型的运行、更新、迭代,还能够支撑仿真测试中场景的搭建与渲染。所谓仿真测试,即无需实车直接通过仿真软件将自动驾驶的应用场景进行数字化还原,建立尽可能多的真实世界系统模型,进行测试验证。

仿真测试能有效缩短技术和产品开发周期,降低研发成本。业内典型的长尾场景问题不够丰富,现实中可遇而不可求的极端场景,利用仿真平台可以便捷生成。由于仿真测试中的模拟环境需要实现多模态融合,以支持传感器模组的复杂性,因而也需要大算力的支持。

当下,随着新能源汽车品牌普遍已经把高速公路场景下的辅助驾驶列为标配,赛场已经逐渐转换到路况更复杂的城市场景。在此背景下,智算中心理所当然成为城市辅助驾驶落地的关键。

智算中心会成为标配吗?

如上文所述,自动驾驶需要针对算力需求进行持续性地投资,如果使用公有云,会造成边际成本不断上涨。相比之下,自建数据中心从长期来看能够节省大量的成本,而且还能在各种场景中复用。

因此,IDC预测自动驾驶行业的开发团队对这一领域的投资将在未来稳定增长。但即便智算中心能带来诸多助力,关于是否会成为标配,答案却是存疑的。

通过调研,IDC发现搭建人工智能计算中心时,在降低企业成本之前,行业内最常见的问题是初始投资过高,这一问题对于几家自动驾驶行业独角兽来说尤为棘手。

数据显示,投资方面,主机厂及一级供应商对搭建人工智能计算中心的预算普遍超过1亿元;自动驾驶独角兽的预算普遍处在1至5千万之间。人工智能计算中心的投入,对于行业内各方开发团队,均形成了较大的资金压力。

此外,项目时间周期过长,是车企和传统一级供应商需要面临的问题。由于不同公司在搭建人工智能计算中心时所花费的时间是不同的,大多超过3个月,而多数自动驾驶公司则将时间长度停留在3到4个月的水平,这无疑有些周期过长。

显而易见,智算中心建设的资金问题和项目周期,贯穿自动驾驶解决方案开发过程始终,会成为影响开发者项目决策的重要因素。

特别是在眼下,自动驾驶赛道骤然进入寒冬。L4级自动驾驶技术无论从技术还是政策抑或是现实角度来看,都不具备成熟的商业化落地条件。

好在L2领域持续升温,据高工智能汽车研究院数据显示,2022年中国市场(不含进出口)乘用车前装标配搭载L2级辅助驾驶的搭载率,已经连续第二个月超过30%。

从终局来看,自动驾驶会是一个“马太效应”明显的行业。且大部分自动驾驶公司仍处在创业初期,数据尚未起量,因此最终能够建设智算中心的,恐怕只有少数几家头部。

对于大多自动驾驶企业而言,退而求其次,汽车云或是更现实的选择。

根据分析机构弗若斯特沙利文发布的《2021年中国汽车云市场追踪报告》,中国汽车云服务/解决方案按应用场景可分为自动驾驶、车联网、车路协同以及车企数字化转型场景。

而自动驾驶汽车云则是指调用汽车云基础服务与自动驾驶服务平台,同样可以实现如数据接入、数据标注、模型训练、模拟仿真、OTA升级等功能。

现阶段,国内“汽车云”领域已经凑够了“BATHD(百度、阿里、腾讯、华为、抖音)”。2022年的云栖大会上,阿里云“汽车云”正式亮相,主要围绕自动驾驶、智造、营销三大业务场景;同样在2022智能经济高峰论坛上,百度智能云发布了 “云智一体3.0”架构,并首次发布“汽车云”,等等。

作为汽车云关键场景之一的自动驾驶,被普遍认为最具潜力,也是云厂商们的重要布局方向。

当然,重新回到智算中心,随着现阶段的政策落地和产业发展,其在自动驾驶场景的应用也正不断完善和升级,也许成为自动驾驶企业入门配置的那一天已经不远了。

参考资料:

浪潮《智能计算中心规划建设指南》

IDC《现实+仿真-超大算力赋能自动驾驶》

财新《特斯拉自动驾驶系统年内可全球推送 需各国政府审批》

甲子光年《阿里发布汽车云:自动驾驶能干十年,智能制造能干一辈子 》

产品图.jpg

赞 (0)
上一篇 2024年11月22日 17:56
下一篇 2024年11月22日 17:56