国产大模型,到底行不行?
1
现在是个公司都在讨论做大模型。
按定义上说,大模型是需要大量训练数据和计算资源,依赖动辄上亿乃至数十亿的模型参数和大量层数来实现高性能的模型。
但万万没想到,加了这么多定语,硬是没给厂商们的想象力定住,这两年,不对,这几个月光国内就出了几十个所谓的大模型,互联网世界沉浸在一片丰收的喜悦中。
你别管怎么模的,你就说型不型吧。
别管能活几个,就说这个大模型适不适合中国宝宝的体质吧。
我思考了很久,我觉得这个味儿好熟悉,后来我发现同样的故事上一次叫元宇宙,上上次还是区块链。
这时我就开始怀念大家做O2O时候的样子。
虽然最后也就那样,但那个时候人与人之间真的好纯粹,钱是真的烧,打法也是真的烧。
要押金的那批除外。
2
问题来了,虽然都在吹牛,但大家为啥争大模型这个风口?
是因为看到了一个机会。
这东西很有可能成为你未来使用的最基础工具,就像你现在用word工作,用搜索引擎获得信息一样,它会成为你生活方式的一种。
争的是风口吗,那是未来生活定义权的入口。
那这东西的难点在哪儿?
甭管你是什么大模型,核心都绕不开两个问题。
其一,训练模型的高质高量的数据从哪里来;
第二,你训练出的大模型在哪里能用的上,应用场景是什么。
前者是个技术难题。
数据不但要高质高量,还要合理合法,而且面对这个量级的数据,不仅要有复杂度上天的ETL(我以前工作最讨厌的事情就是洗数据整数仓),还需要配备大量的算力,最后还要考虑如何再将大模型部署到线上保证性能。
后者是个变现难题。
大模型好不容易训练成功了,找不到应用的场景,那这更白玩了。
你有屠龙技,但大家不需要屠龙,那最后就只有一条龙服务了。
这两个问题太沉重了,根本不是朝生夕死的厂商们该考虑的问题。
是,我搞出技术红利了,就等着量变引起质变了,只要几年,我就改变世界了。
没错,谢谢你,大家会把好消息烧给你的。
行业小玩家根本烧不起,家人只需要看到烧钱后的债务情况,只要几分钟,就能改变婚姻状态。
所以现在这么多厂商都在搞大模型,争先入局烧钱,真正能坚持到最后的,还是少数。
评价大模型能不能走得远,把AI红利兑现了,其实就三条标准——有没有看得见摸得着的真实应用案例,有没有能够规模化推广应用的产品,有没有统计数据能够证明的应用成效。
不然都是吹的。
也就是说,面对国企、央企等G端用户,大模型围绕着需求进行针对性的私有化部署;
面对B端用户,能将AI能力结合到企业生产各环节中,实在地帮助提升效率;
面对C端,能够利用已经成型的市场渠道和消费者对品牌的认知,提高消费者的使用频次,进行流量转化。
跨过这三关,路才能走稳。
当然,在走稳以后,我还想再补充上一条隐形门槛。
人类能够诞生文明,形成国家,都依赖于语言,语言才是诞生智能的前提。
厂商一定要对语言模型有扎实的研究,大模型才具备较强的泛化能力,将来大模型才能方便不同国家不同民族、不同专业人士应用于各自的领域。
有了这个能力,故事才能讲得真正性感。
3
昨天,科大讯飞举办了一场成果发布会,介绍了讯飞星火认知大模型。
主打的,就是开放,大规模开放,所有用户都可以使用。
发布会现场上,星火认知大模型不讲虚话,直接实测了文本生成、语言理解、知识问答等七大维度能力,还顺便做了数学题,给大家漏了一小手。
这七大维度和481项细分任务类型,将构成科学的大模型评测体系。
大模型行不行,咱评测后看。
会场上别的能力不赘述了,我觉得与大部分上班族真正利益相关的,还要数星火大模型的一键成稿能力。
当你在办公室里开完两个小时会议后,不需要再加班花两个小时重听一遍整理文稿了,打开讯飞听见输入音频后,大模型会帮你分析文字内容,一键输出摘要,代办事项,工作计划等内容,直接文字形式给你安排得明明白白;
如果你赶时间,给它一分钟,面对老板,它能智能生成新闻稿件这类通稿;
面对消费者,它能生成宣传文案;你要面对老外,它还能生成多语种版本。
就一分钟,写的事儿它来,摸鱼的事儿你来,老板还得夸你一句真努力。
就直接说吧,会议纪要,是不是大家日常的刚需以及痛点?
再延伸一下,依据大量会议纪要,生成周报月报,是不是效率越高越好?
别扯啥改变世界,先让社畜过得舒服点才是硬道理。
讯飞的态度很坚决,号称今年三次升级后,会在十月整体赶超国外对手。
不成功,就成梗。
4
讯飞这番操作,我很震惊,但毫不意外。
首先从技术层面上,讯飞就有保障;
论算法,讯飞在Transformer深度神经网络算法方面拥有丰富经验,在语音识别和图文识别方面水平过硬,在认知智能领域,讯飞仅去年就获得了常识阅读理解挑战赛OpenBookQA等13项世界冠军,开源了六个大类,超过40个通用领域的系列中文预训练语言模型;
讲数据,讯飞在严格遵守适用法律法规前提下,在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用。
注意,是,每天。
在算力方面,讯飞总部自建了业界一流的数据中心,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,讯飞也与华为强强联合,大模型建立在安全可靠的国产算力平台之上的。
就这三个BUFF一叠,技术不过硬才有问题。
技术有了依靠,讯飞的1+N架构则是将大模型变成了这个1——通用认知智能大模型。
AI技术常年应用于N个一线领域,要论开放,讯飞知道如何更好地推出各领域的专用大模型版本。
比如办公领域,讯飞AI学习机等多项C端教育产品为消费者提供了新颖的交互体验,讯飞智能办公本和讯飞听见也帮助职场人士提升了工作效率。
比如汽车领域,讯飞打造的搭载大模型的智能座舱,能实现拟人化的沟通;
比如发布会现场展示的人机交流过程,智能座舱能在帮你安排接听公司电话并将对话内容发送到手机的同时,还能帮你哄孩子,解决孩子一个又一个天马行空的问题。
铺垫了这么多年,这次只能说是厚积薄发,偷偷给你开个大。
本次大规模开放讯飞星火认知大模型,对用户来说,是好事。
功能就在那里,你用了就能简单直接地感受效率提升,跟大模型合作久了,你自己也知道面对问题如何拆分自己的需求,将来要构建怎样的智能生活,你也有话讲;
对讯飞来说,通过百行千业的用户在一次次实践过程中的真实交互,这些宝贵高质量的反馈也在帮助讯飞进行人工标注,加快讯飞星火认知大模型迭代的过程,实践出真知。
你不用担心这是一场作秀,一场仓促的表演。
星火二字的由来,就是科大讯飞的决心,“要么熄灭,要么燎原”,这句话就被刻在讯飞总部大楼的墙面上。
二十四年前一群中科大的大学生喊出了,要把中文语音做到世界最好。
讯飞从学界做到产界,从输入法做到翻译机,一直深耕于语音语义领域,到如今早就对于认知智能有了独到的理解和布局,未来关于“如何定义智能”这个终极目标,相信讯飞能拥有独到的见解。
取火,要很久。
燎原,只要一瞬间。
5
星星之火可以熄灭,也可以燎原。
亲吻足下大地,才能回报火焰。
大模型只是讯飞走出的关键一步,围绕着大模型,讯飞还会贯彻一个战略和一个计划。
战略是,讯飞会进一步推进讯飞开发平台2.0,星火认知大模型是一把关键的钥匙,由行业龙头自己掌握,最后大家一起创造出一个行业通用大模型解决方案。
计划是,讯飞推出了AI星火营生态计划。
首先是从现在起,以星火大模型开放源头技术能力,帮助创新应用更好落地,通过讯飞定期举办的AI开发者大赛,帮助优秀开发者团队产学联动,招商引智,培养人才后备军。
讯飞拥有几百万开发者,撬动大模型落地,未来所有的硬件和所有的APP都要在大模型上迭代更新,真正做到众智众创。
其次是通过讯飞开放平台旗下AI产供销一体化平台“讯飞AI服务市场”,为大模型上中下游企业提供从品牌、管理、经营的全栈服务,解决需求。
最后,是通过科大讯飞生态平台的“星火营·创业营”项目,帮助各地创业团队搭建产业资源和资本资源的对接平台,让创业团队和产业方资本方快速对接,做好平台。
三步走完,大模型才不是一场自嗨的表演,而是技术进步的狂欢。
不仅如此,讯飞的能力还会开放给羚羊工业互联网平台,帮助各行各业,对外合作。
大模型作为技术底座,通过开放平台帮助各个合作伙伴跨越技术壁垒时,整个人工智能开发生态才能欣欣向荣。
中国的人工智能,由中国人定义。
未来会变成什么样,其实没有人能猜到。
但总归是要做的。
当所有星火闪耀起来的那一刻,正是文明闪耀之时。
好不好,总得试试才知道。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本文禁止转载,侵权必究。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)