新火种AI|实属罕见!四大AI顶流同台,有哪些关键信息值得关注?

原创 收藏 评论
举报 2024-06-19

作者:小岩

编辑:彩云

在有着“AI春晚”之称的2024年智源大会上,非常难得的一幕出现了:当下国内的四大AI顶流公司——月之暗面,百川智能,智谱AI,面壁智能齐聚一堂,十分罕见的同台了。

从体量上来说,四家大模型公司都称得上是独角兽级别,它们的创始人聚在一起,分享各自对大模型未来的观点和看法,这对于整个行业来说,无疑是值得标记的一笔。

有意思的是,这四家大模型独角兽掌舵人——百川智能的CEO王小川,智谱AI CEO张鹏,月之暗面CEO杨植麟以及面壁智能联合创始人,CEO李大海都出身于清华,是名副其实的师出同门。

图片1.png

关于价格,安全等话题:四家独角兽给出的答案各有侧重。

在智源大会上,四位出身于清华的大模型独角兽掌舵人一同出席了《尖峰对话:通往AGI之路》环节。

在对话中,大家对于大模型的价格战问题表达了自己的看法。王小川就公开表示,价格战对于中国发展大模型是特别好的事,自己也是积极看待的。目前打响的大模型价格战,主要是云厂商之间的竞争。包括火山引擎,阿里云,腾讯云,百度云等。

可在此之前,王小川是旗帜鲜明的反对价格战的,表示这是巨头间的游戏,百川智能不愿意掺和进去。

其实王小川先前的想法并非个例。零一万物创始人李开复也在大会别的环节上表示,当下AI市场存在一个比较严重的问题,就是很多大公司没有认识到软件的价值,不愿意为软件付费。结果很多大模型公司来竞标,结果却是越竞越低,做到最后做一单赔一单,没有利润。也正因此,他认为,零一万物坚决做to C,不做“赔钱的to B”。而智源研究院的院长王仲远也认为,当下选择大模型优先考虑的肯定不是性价比,而是能否真正为自己的产品赋能。在此基础之上,大模型的价格终归会达到一个合理的水平。

大模型是否是通往AGI的基石:大家所存在的共识与非共识。

除了对于降价潮这样的“周边问题”表达看法,对于“大模型是否是通往AGI之路的基石”这一热点话题,四位掌舵人也给出了自己的看法和观点。

图片2.png

月之暗面的杨植麟认为,大模型的第一性原理,就是要不断提升模型的规模。这件事从本质上来说,是在做压缩,压缩就会产生智能。当然,这个过程会面临很多的挑战,诸如数据流失,某些领域的数据资料较为稀缺等。由此可见,数据是当前存在的最大的问题和变量,而规模定律或大模型本身并没有什么问题。

杨植麟还表示,“如何定义AGI”这件事至关重要,但不必急于现在就给出一个精确量化的定义。AGI可能更多地是一种定性的概念,一种感觉上的共识。其核心作用在于,能够使社会和个人对未来可能发生的变化有所准备。毕竟,这项技术的发展速度可能异常迅猛。

百川智能的王小川则认为,“基石”这个词是没有问题的,但它只是在逼近AGI。从根本上说,这需要一个范式的转变,而今天大家看到的规模定律的成效只是迈出的第一步。王小川认为,从某种程度上说,我们目前已经进入了AGI的时代,这个时代有能力吸引更多的科学家和资源,共同迈向AGI。但仅凭目前公开的规模定律无法完全实现AGI, 光靠Scaling Law,也是做不到AGI的。

智谱AI的张鹏则肯定大模型是基石之一。他认为,当下人工智能的从业者很“实用主义”,大家都十分关心到底能不能真正的解决问题,到底能不能真的向每个人心中定义的AGI路径上进行推动。目前来说,Scaling Law还在生效,还在往前前进,大模型也依然在很有效地推进。但说到未来能否真的帮助人们到达顶峰,尚未可知。

或许是因为面壁智能的李大海出自数学专业,他的表达较为严谨。他表示,大模型一定是当前所有技术里,可以在通往AGI这个方向上走得最远的,但它能否直达,现在来看还有很多未知因素。李大海表示,“联想到《思考:快与慢》的观点,人脑有两个系统:快速直观的感性思考与慢速细致的理性思考。现在的云端大模型主要是在处理人的大脑系统,一是“快思考”的工作;二是“慢思考”的系统,即要做各种各样推理,搜索空间去做搜索,组合,从而来完成一个任务”。

想要实现“慢思考”的能力,需要大模型通过Agent技术外部化或者把它内化为自己的能力,抑或通过端侧大模型的部署来实现。未来的大模型是否有这样的能力?这需要大家去进行进一步的探索。

图片3.png

由此可见,在短期内对对AGI的进展进行评估,会是一个极具挑战性的问题。

大模型是否应该开源?大家普遍共识:开源并不会削弱竞争力。

近期斯坦福的三位学生抄袭面壁智能MiniCPM大模型的事件正闹的沸沸扬扬,而面壁智能的李大海也在会上首次公开做出了回应。他表示,“我们完全没有想到我们的工作会以这种方式出圈,挺惶恐的”。

图片4.png

这个具体事件要追溯到5月20日,面壁智能开源了MiniCPM大模型之后。5月29日,三位斯坦福的本科生在该模型基础上做了非常简单的高斯叠加,就号称是自己的模型。这个模型一下子变得很受欢迎,因为该团队宣称这个模型的多模态能力跟GPT4-V完全对标,但是参数只有后者的1%,并且只需要500美金就能够训练出来。

事件发生仅仅过了一天,开元社区的热心参与者便发现了事情的真相,并将此曝光。

图片6.png

在大会上,李大海对于这一事件进行了表态。他表示,3位本科生所提到的“模型的多模态能力跟GPT4-V完全对标,但是参数只有后者的1%”是真实的,面壁智能确实具备这样的实力,但其耗费的成本远远不止500美金,其实是需要花很多钱的。李大海认为,这件事让面壁智能更加坚定了开源的力量。开源力量很强大,不光有做原创工作的人,还有很参与者贡献需求,贡献反馈,这也是开源生态重要组成部分。持续做开源贡献,势必能够给公司带来正向收益。

百川智能同样是开源的参与者,王小川解释了开源的动机:“第一,开源在市场上有这个需求,2023年6月开源了第一版,9月份开源了第二版。去年,中国对大模型充满热情与紧迫感,开源策略在市场上产生了积极影响。作为认真开源的商业化厂商,百川获得了市场的认可,这对我们来说是一个巨大的鼓舞,无论是在人才储备还是资本关注方面,都为行业树立了标杆。第二,开源也体现了一种心态。我们认识到模型的快速迭代,今天的领先并不意味着明天的竞争力。因此,开源并没有削弱我们的商业竞争力”。更重要的是,众多公司参与开源,共同推动中国生态追赶美国,保护知识产权,这会使整个生态持续繁荣的发展。

四家独角兽大模型公司的同台是具有极其重要的意义的,这不仅体现了行业内的合作精神和开放交流的态度,也会推动整个行业的发展和创新。


本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    暂无评论哦,快来评论一下吧!

    全部评论(0条)