新火种AI|实属罕见！四大AI顶流同台，有哪些关键信息值得关注？

原创赞收藏评论

举报 2024-06-19

扫描,分享朋友圈

作者：小岩

编辑：彩云

在有着“AI春晚”之称的2024年智源大会上，非常难得的一幕出现了：当下国内的四大AI顶流公司——月之暗面，百川智能，智谱AI，面壁智能齐聚一堂，十分罕见的同台了。

从体量上来说，四家大模型公司都称得上是独角兽级别，它们的创始人聚在一起，分享各自对大模型未来的观点和看法，这对于整个行业来说，无疑是值得标记的一笔。

有意思的是，这四家大模型独角兽掌舵人——百川智能的CEO王小川，智谱AI CEO张鹏，月之暗面CEO杨植麟以及面壁智能联合创始人，CEO李大海都出身于清华，是名副其实的师出同门。

图片1.png

关于价格，安全等话题：四家独角兽给出的答案各有侧重。

在智源大会上，四位出身于清华的大模型独角兽掌舵人一同出席了《尖峰对话：通往AGI之路》环节。

在对话中，大家对于大模型的价格战问题表达了自己的看法。王小川就公开表示，价格战对于中国发展大模型是特别好的事，自己也是积极看待的。目前打响的大模型价格战，主要是云厂商之间的竞争。包括火山引擎，阿里云，腾讯云，百度云等。

可在此之前，王小川是旗帜鲜明的反对价格战的，表示这是巨头间的游戏，百川智能不愿意掺和进去。

其实王小川先前的想法并非个例。零一万物创始人李开复也在大会别的环节上表示，当下AI市场存在一个比较严重的问题，就是很多大公司没有认识到软件的价值，不愿意为软件付费。结果很多大模型公司来竞标，结果却是越竞越低，做到最后做一单赔一单，没有利润。也正因此，他认为，零一万物坚决做to C，不做“赔钱的to B”。而智源研究院的院长王仲远也认为，当下选择大模型优先考虑的肯定不是性价比，而是能否真正为自己的产品赋能。在此基础之上，大模型的价格终归会达到一个合理的水平。

大模型是否是通往AGI的基石：大家所存在的共识与非共识。

除了对于降价潮这样的“周边问题”表达看法，对于“大模型是否是通往AGI之路的基石”这一热点话题，四位掌舵人也给出了自己的看法和观点。

图片2.png

月之暗面的杨植麟认为，大模型的第一性原理，就是要不断提升模型的规模。这件事从本质上来说，是在做压缩，压缩就会产生智能。当然，这个过程会面临很多的挑战，诸如数据流失，某些领域的数据资料较为稀缺等。由此可见，数据是当前存在的最大的问题和变量，而规模定律或大模型本身并没有什么问题。

杨植麟还表示，“如何定义AGI”这件事至关重要，但不必急于现在就给出一个精确量化的定义。AGI可能更多地是一种定性的概念，一种感觉上的共识。其核心作用在于，能够使社会和个人对未来可能发生的变化有所准备。毕竟，这项技术的发展速度可能异常迅猛。

百川智能的王小川则认为，“基石”这个词是没有问题的，但它只是在逼近AGI。从根本上说，这需要一个范式的转变，而今天大家看到的规模定律的成效只是迈出的第一步。王小川认为，从某种程度上说，我们目前已经进入了AGI的时代，这个时代有能力吸引更多的科学家和资源，共同迈向AGI。但仅凭目前公开的规模定律无法完全实现AGI，光靠Scaling Law，也是做不到AGI的。

智谱AI的张鹏则肯定大模型是基石之一。他认为，当下人工智能的从业者很“实用主义”，大家都十分关心到底能不能真正的解决问题，到底能不能真的向每个人心中定义的AGI路径上进行推动。目前来说，Scaling Law还在生效，还在往前前进，大模型也依然在很有效地推进。但说到未来能否真的帮助人们到达顶峰，尚未可知。

或许是因为面壁智能的李大海出自数学专业，他的表达较为严谨。他表示，大模型一定是当前所有技术里，可以在通往AGI这个方向上走得最远的，但它能否直达，现在来看还有很多未知因素。李大海表示，“联想到《思考：快与慢》的观点，人脑有两个系统：快速直观的感性思考与慢速细致的理性思考。现在的云端大模型主要是在处理人的大脑系统，一是“快思考”的工作；二是“慢思考”的系统，即要做各种各样推理，搜索空间去做搜索，组合，从而来完成一个任务”。

想要实现“慢思考”的能力，需要大模型通过Agent技术外部化或者把它内化为自己的能力，抑或通过端侧大模型的部署来实现。未来的大模型是否有这样的能力？这需要大家去进行进一步的探索。

图片3.png

由此可见，在短期内对对AGI的进展进行评估，会是一个极具挑战性的问题。

大模型是否应该开源？大家普遍共识：开源并不会削弱竞争力。

近期斯坦福的三位学生抄袭面壁智能MiniCPM大模型的事件正闹的沸沸扬扬，而面壁智能的李大海也在会上首次公开做出了回应。他表示，“我们完全没有想到我们的工作会以这种方式出圈，挺惶恐的”。

图片4.png

这个具体事件要追溯到5月20日，面壁智能开源了MiniCPM大模型之后。5月29日，三位斯坦福的本科生在该模型基础上做了非常简单的高斯叠加，就号称是自己的模型。这个模型一下子变得很受欢迎，因为该团队宣称这个模型的多模态能力跟GPT4-V完全对标，但是参数只有后者的1%，并且只需要500美金就能够训练出来。

事件发生仅仅过了一天，开元社区的热心参与者便发现了事情的真相，并将此曝光。

图片6.png

在大会上，李大海对于这一事件进行了表态。他表示，3位本科生所提到的“模型的多模态能力跟GPT4-V完全对标，但是参数只有后者的1%”是真实的，面壁智能确实具备这样的实力，但其耗费的成本远远不止500美金，其实是需要花很多钱的。李大海认为，这件事让面壁智能更加坚定了开源的力量。开源力量很强大，不光有做原创工作的人，还有很参与者贡献需求，贡献反馈，这也是开源生态重要组成部分。持续做开源贡献，势必能够给公司带来正向收益。

百川智能同样是开源的参与者，王小川解释了开源的动机：“第一，开源在市场上有这个需求，2023年6月开源了第一版，9月份开源了第二版。去年，中国对大模型充满热情与紧迫感，开源策略在市场上产生了积极影响。作为认真开源的商业化厂商，百川获得了市场的认可，这对我们来说是一个巨大的鼓舞，无论是在人才储备还是资本关注方面，都为行业树立了标杆。第二，开源也体现了一种心态。我们认识到模型的快速迭代，今天的领先并不意味着明天的竞争力。因此，开源并没有削弱我们的商业竞争力”。更重要的是，众多公司参与开源，共同推动中国生态追赶美国，保护知识产权，这会使整个生态持续繁荣的发展。

四家独角兽大模型公司的同台是具有极其重要的意义的，这不仅体现了行业内的合作精神和开放交流的态度，也会推动整个行业的发展和创新。

本文系作者授权数英发表，内容为作者独立观点，不代表数英立场。
未经授权严禁转载，授权事宜请联系作者本人，侵权必究。