中国深度学习平台逆袭,只是因为“国潮”吗?
一直到今天,柯洁也未必知道,他2017年看似输给了阿尔法狗,但实际上是输给了深度学习平台。
相比于之前以职业棋手为目标的围棋AI,阿尔法狗棋力突然飞升的核心原因,在于搭载了深度学习模型。谷歌在2015年推出了深度学习框架TensorFlow,引入深度学习这项原来算法复杂、算力需求极高、开发难度极大的技术,也有效降低了深度学习模型的开发成本。
甚至可以说,TensorFlow推出后,柯洁败给AI已经只是时间问题,没有阿尔法狗,也会有阿尔法猫或者贝塔狗。
这个故事告诉我们,虽然人工智能的新闻纷繁复杂,但是目前从实用化角度来说,深度学习底层构建是一条重要主线。2015年其出现之前,AI需要从零开始研发,因此应用停留在比较浅的阶层;2015年之后,谷歌发布TensorFlow则让AI应用落地有了全新的想象空间。
但,牌桌上的玩家层出不穷。
一、“中国玩家”的弯道超车
尽管拥有先发优势,但TensorFlow没有一统江湖,并不出人意料。
作为深度学习平台的开创者,TensorFlow有一个公认评价,“什么都好,就是不好用”。反观Meta推出的PyTorch,虽然时间更晚,但更具有通用性,结果谷歌因此被迫先后推出TensorFlow2.0和JAX进行防御。
这看似是TensorFlow的战略失误,而从更高的维度来讲,TensorFlow不可能既满足通用性又满足专业性。作为一个前途广阔的领域,虽然深度学习平台作为人工智能的基础设施投资巨大,但是正如CPU有英特尔和AMD,手机操作系统也是苹果和安卓共分天下一样,独木不成林,似乎只有两强争霸并立才能形成稳定态。
但是,这样的两强体制也因以飞桨为代表的“中国平台”集体登场而被打破格局。
2022年7月28日,在2022全球数字经济大会“人工智能驱动未来产业论坛”上,中国信通院与深度学习技术及应用国家工程研究中心联合发布了《深度学习平台发展报告》。报告显示,在经过多维度分析,百度飞桨在中国深度学习市场应用规模已经达到第一。截至2022年5月,飞桨已累计凝聚477万开发者、服务18万企事业单位、创建56万AI模型。与此同时,华为昇思、旷视天元、之江天枢等深度学习平台,同样也获得了快速发展。
无独有偶,在信通院发布报告之前,调研机构IDC和弗若斯特沙利文同样发布了相关报告,结果分别显示百度飞桨的中国深度学习市场综合份额第一、综合竞争力第一。
2016年正式开源的飞桨,如何能在底层框架这样马太效应强烈的领域完成弯道超车?
这看似不可思议,但实际上却可能有某种必然性。
首先,经过一系列卡脖子事件之后,中国无论是硬件还是软件,都对安全性有着更高的需求。而更重要的是,中国AI的产业体量,也到了不可能不去争夺底层控制权的时期。
根据IDC预测,在2020-2024年中国人工智能整体市场规模将保持30.4%的年复合增长率,到2024年将达到172.2亿美元,在全球占比从2020年的12.5%上升到2024年的15.6%,实力位居全球第三,前两名是美国和打包在一起的欧洲。
这样的规模和增速,意味着中国的AI产业来到了与2011年通信产业相同的境地:当年中国终于普及3G,用户数和市场规模达到世界第三,巨大的体量,意味着遵守别人底层规则产生的摩擦成本以及额外费用,会迅速超过自建标准和基础设施的投入。因此中国通信产业既有实力,也不得不深度介入通信标准制定,而下一年,中国制定的4G标准成为国际通信标准之一。
很多时候,决战紫禁之巅不是因为恩怨情仇,而是剧情已经到这里了。
二、“飞桨们”的底气在哪里?
中国本土深度学习平台厚积薄发的依仗,来自中国对深度学习产业的特殊需求。
虽然从总体而言,深度学习平台的发展方向都是更体系化,更专业化,更低门槛。但是因为国内外发展速度、应用场景以及产业水平的差距,在在解决具体问题上,中国对深度学习平台的要求,往往跟国外千差万别。
举例而言,作为拥有14亿人口的世界工厂,中国无论是制造业还是服务业,任何一个程序,都可能应用到十几甚至几十万个单位和机构,直接面向数亿人,完全不同的用户体量,一方面决定了中国场景需求跟国外需求不完全相同,超大规模深度学习模型训练技术的需求摆上台面,另外还会催生更多千姿百态的、低数量级用户完全不需要的应用场景。
这样的总体状况,使得中国的深度学习对端到端的推理部署能力和在产业实践当中沉淀出来的模型更为重视。
其次AI市场规模的快速扩张又导致人才相对稀缺,再加上总体产业发展水平还比较落后,因此对降低AI门槛的需求永无止境,更进一步催化了低代码乃至无代码模型的发展,而这一切都很难从国外的深度学习平台得到帮助,甚至反过来是中国用户拖着国外平台前进,这种温度差,就是中国深度学习平台发展的动力。
但是,中国AI产业发展的需求,是给了所有的深度学习平台同等的机会,为什么飞桨做到了中国第一?这在很大程度上,是一个机会青睐了有准备者的故事。
飞桨的竞争优势,首先来自技术应用能力方面,来源于百度在AI领域数十年的技术积累。早在2013年,百度便成立全球第一个深度学习研究院;而在飞桨诞生之后,百度绝大多数人工智能项目都是基于飞桨研发和创新。
相比于其他在后来才建立的深度学习平台,飞桨的冷启动有了百度研发这个巨大的应用场景,不仅提升了工具和框架的易用性和成熟度,而且先期积累了更多人工智能的应用模型,特别是从2019年开始,百度AI的能力逐渐下沉,开始跟产业经济和生产一线相结合,在飞桨平台上也展现出越来越多的产业项目,这些与产业相结合的人工智能应用模型,使得飞桨获得了更强的竞争力。
因为有这样的先期发展基础,所以飞桨有着更强的比较优势,所以很快迎来了迅速发展的机会,平台服务规模开始不断扩张。
相比于其他平台,飞桨不仅拥有便捷的开发框架,而且还有多端多平台部署的高性能推理引擎、产业级开源模型库,以及更适合中国AI场景的超大规模深度学习模型训练技术。大规模分布式训练能力在真正的工业化场景应用更加契合,因此用户数实现快速增加。
根据《深度学习平台发展报告(2022)》显示,在过去一年半里,飞桨的项目贡献人数(Contributors)增速为60%,关注度增速为37.6%。均超过了国际主流框架。而在总数上,无论是活跃度,还是关注度和贡献人数,飞桨均超过其余国产框架总和。
总体而言,飞桨发展的最根本动力,还是来自于中国人工智能进入大规模工程落地阶段,深度学习随着AI进入千行百业,而需求的推动又引发中国AI能力的厚积薄发,和AI研发者的迅速增加,最终带动了国产平台的迅速发展。
从这种意义上讲,飞桨们的崛起,是我国算法开发能力、产业和生态积累至今的总和。
三、“黄金十年”的舞台
在未来,AI将迎来“黄金十年”,而深度学习平台,有可能成为新时代的“操作系统”。
有机构预测,到2030年,AI可能使全球总产量增长约13万亿美元,并推动全球GDP每年增长约1.2%,而在这一轮人工智能带动的增长中,深度学习仍是主导路线,并且会随着产业发展对AI底层基础设施提出更高要求,以科技巨头引领的平台化生态布局正不断加速。正如百度CTO王海峰所言,在人工智能工业大生产阶段,深度学习平台下接芯片、上承应用,相当于“人工智能时代的操作系统”,处于人工智能技术体系的关键核心位置。
因此,飞桨们并非是一个“图方便”的国内自有平台,或者提升国内AI产业独立性的防御体系,而是是一张通往未来的船票。它的能力还未完全发挥,未来在驱动产业赋能,推动AI发展上还有更大的空间。
首先,当前深度学习平台主要是帮助软件开发者,但是长远来看,深度学习平台是链接软硬件的桥梁,平台能够与芯片企业共同围绕软硬协同进行联合优化,从而提升对差异化的硬件芯片的适配能力,最终提升整体的AI性能,起到“操作系统”的作用,比如百度飞桨就与硬件厂商深入合作,进行广泛模型适配并开展软硬一体联合优化,目前已与超过20个厂家,30种以上的芯片完成适配工作,并联合发起硬件生态共创计划。
其次,深度学习平台还能够进一步提升赋能平台广度,向更多行业更多领域拓展,并通过提供端到端代码实现方案降低行业创新门槛,如飞桨提供超过500个精选算法和预训练模型,其中就包含了经过产业实践长期打磨的主流模型;结合产业实际场景、精心打造了精度与性能平衡PP系列特色模型,覆盖目标检测、OCR、语音理解等多个高频应用场景,可以让AI产业应用时达到事半功倍的效果;飞桨产业范例库和产业模型选型工具则以真实产业场景和数据为蓝本进行研发,涵盖智慧城市、智能制造等多个领域,助力企业灵活运用模型和开发套件构建完整的落地方案,直达项目落地,降低AI产业落地难度。
最后深度学习平台不仅是AI开发者的聚集地,同时也是孵化器,当前,深度学习平台正通过组织培训、技术指导、赛事等活动等方式,与开发者共建社区生态。同时,通过组织人工智能赛事活动,推动在前沿研究、产业应用中的AI技术难点攻关。
总而言之,虽然从客观上来讲,飞桨等国内平台只是迈出了万里长征第一步,距离其成为AI产业核心驱动力的“完全形态”还有很长的距离,但是深度学习平台的增长并非是线性增长,而是技术水平、算力、用户规模、模型数量的复合型增长,在“乘数效应”的驱动下,可以想见,在不远的未来,深度学习平台会在近至自动驾驶,远至天地探测,小到蛋白质折叠预测,大到核聚变装置控制的广阔领域里,为我们的技术发展带来新的曙光。
所以,中国的深度学习平台并不只是逆袭,更是在顺风飞翔。
作者:钱皓
编辑:安吉拉
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本文禁止转载,侵权必究。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)