飞桨第一的背后:打造“国之重器”,中国科技实力反超从AI开始
中国AI发展在全球处于什么样的地位,一直都有争议。有的说中国AI起步不晚,与美国处于同一起跑线,也有的说中国在一些技术上还有差距。
中国AI发展在全球处于什么样的地位,一直都有争议。有的说中国AI起步不晚,与美国处于同一起跑线,也有的说中国在一些技术上还有差距。
沙利文刚刚发布《中国深度学习软件框架市场研究报告(2021)》(以下简称《报告》),对中国市场上主流深度学习软件框架从多维度进行评分对比,结果显示,百度竞争力综合排名第一,在应用能力、技术能力和生态能力层面均具备显著优势。《报告》中称:“百度飞桨PaddlePaddle不仅具备深厚的技术积累,在产业实践落地层面亦存在极强的竞争优势。”
在此之前,IDC报告显示,2021年飞桨位居中国深度学习平台市场综合份额第一。也就是说,百度飞桨不仅在市场份额上,超过了谷歌的TensorFlow和Mate(脸书)的PyTorch,并且在全方位的综合竞争力上也得到广泛认可。
从信息化到数字化,再到智能化,科技对社会的改变在逐步加深,AI对社会的改变会更深远、更彻底。这次《报告》是对百度在AI底层技术的认同,其已经具备与谷歌、Mate三足鼎立的实力。同时,也是对中国科技产业在AI时代能力的一次肯定,中国科技产业的核心技术长期受制于人,而在AI时代这种局面终于得以扭转,我国人工智能技术开发者和使用者不必依赖于国外平台,同时还可进一步培育自主可控的AI开发应用生态。有了这样的优势,未来中国在AI创新方面就有了更高的起点,AI的落地也将进一步提速。
「 01 」
掌握“灵魂”,贯通上下
什么是人工智能深度学习软件框架?为什么这个领域会大厂云集?
这一轮人工智能爆发深度学习是关键技术,比如计算机视觉和自然语言处理等技术的成熟和落地让很多行业的智能应用可以成为现实。深度学习软件框架是一种底层开发工具,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体的平台,有了这个平台可以支持各种深度学习技术快速落地,相当于AI时代的“轮子”。
说得再通俗一些,大家通常认为深度学习框架是“AI时代的操作系统”,如同PC时代的操作系统Windows、移动互联网时代的IOS和安卓,与和芯片一起构成了人工智能的基础设施。
在整个人工智能技术体系中,深度学习框架处于贯通上下的腰部位置,下接芯片、上承应用,是一个关键枢纽,是推动AI应用大规模落地的关键力量,重要性日益凸显。
也正是因为深度学习框架产业地位特殊,其成熟度影响面也非常大。
对内,即从科技行业的角度来看,AI产业的参与主体,几乎涵盖整个信息产业,云计算、芯片、ICT设备、互联网、软件、智能技术服务等等,深度学习框架的发展会对科技产业自身的产品形态、运行模式产生很大变革,同时也对整个科技产业的发展有着整体带动效应。
对外,即从全社会层面看,整个社会正在走向智能时代,无论是传统行业还是人们的日常生活,所有的细分场景都在加速AI化。AI正在重塑传统行业模式,重塑我们的生活,重塑整个社会,为经济社会输出独一无二的未来价值。深度学习框架这个“轮子”造好,整个社会经济的转型升级也就会更顺畅。
对比PC时代、移动互联网时代操作系统的影响力,就知道今天深度学习框架的重要性。头部企业都努力构建开源的深度学习软件框架生态,试图形成应用接口和硬件适配的双向主导权。《报告》中有这样一段描述:由于转换至其他框架会一定程度上影响模型性能、增加二次研发成本,长此以往,大量应用将深度依赖原有软件框架进行训练和推断,形成产业默认的事实接口标准。此外,框架市场份额领先的人工智能头部企业正在依托框架与智能芯片适配构建标准化硬件接口,有望进一步增强其对智能芯片的话语权。
也正是如此重要,全球科技巨头纷纷入局,包括美国的谷歌、Mate(脸书)、微软,中国的百度、腾讯、华为、阿里等,各自携不同的优势进入。
中国科技产业起步晚,不少核心技术缺失受制于人。如果中国开发者主要依赖于国外的框架进行研发,这将面临着核心技术容易形成代差,也有可能面临技术封锁带来的危害,当然还有很重要的一点是数据安全。AI是又一轮科技竞赛,中国科技自立自强的角度,需要有自己的核心技术以及相应的产业生态。中国已将人工智能上升为国家战略,在“十四五”规划中,深度学习框架被列入“新一代人工智能”领域,成为国家重点支持的前沿创新技术。
深度学习框架重要,但是做起来非常难,跟操作系统一样,投入高、周期长、风险大。今天,有实力布局这一领域的基本都是有技术、有资金的巨头。作为开启下一个AI时代的钥匙,深度学习框架是大厂的必争之地,背后也是国家科技竞争力必争之地。
「 02 」
巨头逐鹿,格局初定
在AI领域,百度是中国市场一个坚定的先行者,旗下的飞桨也是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。近两年,飞桨的技术体系越来越完善,百度给予开发者的支持力度大,并且因为更贴近中国客户的需求,越来越多的成功案例落地,飞桨的认知度和认可度也不断提升。
根据IDC报告,2021年飞桨已经成为中国市场份额第一的深度学习框架,市场地位得以初步确立,TensorFlow等框架的主流地位亦受到挑战。但是借助本土优势取得市场份额的第一还不足够,作为产业长期发展的底层技术,想要在国际竞争中取得领先,需要具备更全面的竞争力才能在长跑中取胜。
这一次沙利文的《报告》根据评价深度学习软件框架在应用、产品、生态能力三个维度的综合表现,对比主流深度学习软件框架厂商的综合竞争力。报告结果得出:深度学习软件框架厂商中百度竞争力综合排名第一,在应用能力、技术能力和生态能力层面均具备显著优势。这是飞桨在获得市场份额第一后,又一次重大突破。竞争力综合排名第一意味着飞桨具备了全面与Google的TensorFlow、 Meta(脸书)的PyTorch全面抗衡的实力。
首先,应用能力,也就是指行业渗透的广度与深度,本质也是客户认可度。市场应用覆盖范围越广,就更能体现企业具备更强和更完善的能力去满足不同客户的定制需求。针对不同场景的解决方案数量越多,则证明该厂商在企业应用深度方面远超于其他厂商,其产品能够拥有更好的兼容和适应性,进而能够为用户提供稳定且更加有保障的使用体验。
这一点,从飞桨在市场份额上的优势就可以看出,飞桨已经得到中国客户的广泛认可,不断渗透关键行业以及新兴的前沿行业,包括农业,交通、制造、药物研发、疫苗设计和精准医疗等等。在沙利文的报告中,飞桨在应用能力方面为5分,有着明显优势。
在农业领域,与京东方联手打造的智慧植物工厂,通过机器24小时自动照看、多方位呵护蔬菜生长采收;在制造业领域,在上海哲元的生产线上用机器替代人工进行全流程智能化检测,大大提升效率的同时也降低了成本;在能源领域,与华夏天信机器人有限公司合作,开发出的输煤胶带智能巡检机器人,不仅能实现高频次、无间歇巡检,还能通过摄像仪将实时视频回传并智能识别分析,一次性解决了工作效率、恶劣环境、作业安全等多项难题;在交通领域,成都国铁利用飞桨PaddleDetection等套件解决了AI算法难题,研发了一套“轨道在线智能巡检系统”,实现对轨道巡检图片的实时检测;在互联网领域,网易云音乐选择应用百度飞桨PGL图神经网络技术来迭代升级云音乐的推荐系统,能够为云音乐处理高达百亿级别的大规模数据……
其次,产品能力,这是对框架技术的完整性、创新性的评估,包括功能完备性、产业级模型库丰富度、深度学习工具链及企业级平台、服务质量等多个维度。
从产品完整度来看,飞桨经过几年的积累,集深度学习核心框架、基础模型库、端到端开发套件和丰富的工具组件于一体,还包括飞桨企业版EasyDL和BML,以及人工智能学习与实训社区AI Studio。截至目前,基于飞桨开发的模型数量已经有47.6万个,核心框架贯穿开发、训练、推理部署三个环节,基础模型库覆盖CV、NLP、推荐、语音、知识增强的文心大模型,服务的开发者数量已经达到406万,并在270多所高校开设了AI学分课程。
从沙利文的评估可以看出,飞桨在产品能力上已经可以与国际巨头一较高低,这也从一个侧面证明了中国AI技术并不落后。
第三,生态能力,生态能力越强,则证明深度学习软件框架被更加广泛和频繁的使用,其生态合作、产业协作能力越强,这个指标能代表可持续发展的能力以及发展的速度。任何产业的竞争最后都是生态的竞争,特别是AI,AI的实现涉及的产业链条非常长,生态合作、产业协作决定护城河有多深。
百度深谙此道,不仅为开发者提供一个好用的底层框架,还投入了大量人力、物力来打造一个友好度更高、适用性更强的生态。飞桨用短短几年时间构建了全球前三、中国第一的AI开发者生态,凝聚了406万开发者、创建47.6万个模型,服务15.7万家企事业单位——当然,这是截止去年底的数据。如今,飞桨的生态正在加速度成长,相信在5月20日的WAVE SUMMIT 2022,还会有更令人振奋的数据展现。
过去十年,是AI产业爬坡的十年,也是产业打地基的十年、产业链格局重构的十年。在打地基的十年中,深度学习框架是一个关键竞争要素。可以将这一次对综合竞争力的评估看作一次阶段性的小考。
从这份报告可以看出,深度学习框架已经从百花齐放到巨头逐鹿的阶段。百度作为中国AI的一面旗帜,在应用能力、产品能力、生态能力已经构筑起了一定的竞争壁垒,可以与谷歌、Mate(脸书)正面交锋。这代表了中国AI的产业能力,也代表了中国在AI领域的竞争力。
「 03 」
夯实地基,加速前行
百度为什么可以取得这样的成绩?是AI在百度的战略地位决定的。很多企业将AI作为创新业务或是一条业务线,而百度将AI看作公司级战略,并不是在一两个点上发力,公司会面向未来做长远的、全面的、系统的布局。这样的布局,并不会很快见效,甚至需要有“板凳甘坐十年冷”的决心和觉悟。
就以研发为例来看,我们知道深度学习框架投入高、周期长、风险大,百度持续在这个领域投入,瞄准核心技术取得多项突破。据《百度人工智能专利白皮书2022》显示2021年,百度核心研发占百度核心收入23%,研发强度位列中国民营500强首位。截至2022年4月,百度全球人工智能专利申请超过2.2万件,其中,中国专利申请量超过1.6万件,中国授权专利超过4600件。根据相关报告,在中国人工智能高价值专利及创新驱动力评测结果中,百度位列第一。
专利有多重要?看看通信行业几十年的历程就知道,越早介入、越掌握核心技术、积累越多,就能吃到更多的产业红利。将专利技术握在自己手里,意味着有机会建立行业标准,也有能力影响行业的走向。
企业的竞争力是国家竞争力的一个表现。早在2017年,国家发改委正式批复,由百度牵头筹建深度学习技术及应用国家工程实验室,堪称“深度学习国家队”。今年4月26日,实验室升级为深度学习技术及应用国家工程研究中心,将重点面向国家重大战略任务和重点工程建设需求,开展关键核心技术研究,探索创新联合体模式,加速科技成果工程化、产业化。
飞桨是实验室的成果之一,飞桨的成功也代表了国家队的成功。这次百度获得第一,也是中国科技自主创新、科技自立自强的一个缩影。在AI时代,中国科技产业不必再看国际巨头的脸色,也不会再处处受制于人。
沙利文报告在对主流框架综合评价的基础上,认为深度学习技术已然迈入升级优化阶段,带动相关产业高速蓬勃发展。根据技术成熟度曲线,任何一个新技术都会有缓慢爬坡的阶段,也就是打地基的阶段。从这两年的应用落地情况来看,AI已经开始进入快速爬升期。“板凳甘坐十年冷”为的是打好地基,地基打得越稳,后期盖楼就会又快又好。百度飞桨“小考”领先,在后面的加速跑中也将处于优势地位。
值得期待的是,5月20日,深度学习技术及应用国家工程研究中心主办、飞桨承办的WAVE SUMMIT 2022 深度学习开发者峰会将在线上和开发者见面。从这两年发展的态势来看,AI的价值已经在千行百业中得到验证,将有更多的开发者愿意投身其中,也将有更多的企业客户愿意身体力行。相信WAVE SUMMIT 2022上,我们能看到更多的开发者,更多创新的成功案例,百度也会给出更多的生态支持政策。