新火种AI|这家“中国OpenAI”,能赶超OpenAI吗?

原创 收藏 评论
举报 2024-01-18

作者:一号

编辑:美美

全面对标OpenAI,智谱AI能成为“中国的OpenAI”吗?

在OpenAI首次DevDay发布GPT-4Turbo、GPTs应用商店等的两个月后,GPT store刚刚上线后,1月16日,国产大模型迎来了第一个重磅消息。被称为“中国OpenAI”的智谱AI,在其技术开放日Zhipu DevDay上,正式发布了新一代基座大模型GLM-4。

经历三个月的技术迭代,相比上一代,GLM-4性能大幅增强,实现了60%的性能全面提升,逼近GPT-4,并且在中文对其能力上总分超过了GPT-4,在包括GSM8K、Math等多项数据集当中,GLM-4的表现均优于GPT-3.5。    

GLM-4支持更长的上下文、具备更强的多模态能力、有着更快的推理速度和响应高并发的能力,大大降低了推理成本。

此外,在AI Agent越来越成为行业共识的今天,GLM-4也增强了智能体的能力,智谱AI正式上线了GLM-4-All Tool和GLMs个性化智能体定制能力,并且GLMs模型应用商店开发者分成计划也将同期公布。真不愧是从成立之初就一直对标OpenAI的公司,让人想起了OpenAI的GPTs,在产品上持续对标OpenAI。

清华出身,广受青睐的智谱AI

从智谱AI的公众号上可以了解到,2023年10月,这家公司就已累计获得超25亿人民币融资,投资方包括社保基金、阿里、美团、腾讯、小米、顺为、红杉和高瓴等知名机构,估值已经超过了100亿人民币。

能让腾讯阿里联手,主流基金入场,战投纷纷表态,这样的融资声势无论在哪个行业都是相当罕见的,这家名为智谱的AI公司,究竟是何方神圣?    

成立于2019年6月的智谱AI,是由清华大学计算机系只是工程实验室的技术成果转化而来的,团队的核心成员曾参与清华大学与智源研究院合作项目“悟道”的研发工作。

2020年,GPT-3发布,给了行业一个明确的信号,即大模型具备了实际可用性,而这一年智谱AI决定跟进,全面投身大模型,成为了国内最早研发大模型的企业之一。尽管今天看来,智谱AI提前3年的抢跑非常正确,但是在当时,是否跟进大模型还是一个问题,这样的决定其实十分冒险。    

2021年,智谱利用MoE架构成功训练出万亿参数模型,并且在2022年合作研发了双语千亿级超大规模预训练模型GLM-130B,并且开始基于这个千亿基座模型开始打造大模型平台和产品矩阵,同年11月,GLM-130B成为斯坦福大学基础研究中心全方位评测全球20个主流大模型中亚洲唯一入选的大模型

到了2023年,大量新兴的AI大模型公司出现,但智谱依旧沉稳,推出了千亿基座的对话模型ChatGLM,并且开源了单卡版模型ChatGLM-6B。在Hugging Face上,智谱AI的下载量超过1100万次,位居全球最受欢迎开源机构第五名,成为了国内唯一上榜的公司。同年8月底,它成为8家首批通过备案的大模型公司之一,并推出了面向C端的生成式AI助手智谱清言。

OpenAI的模仿者还是追赶者?

在众多方面上,智谱AI都可以称得上是国内“最具OpenAI”气质的公司。

在技术发展特点上来看,它们都致力于自然语言处理领域的研究,都拥有先进的预训练模型。产品性能也十分相似,并且都注重AI伦理的研究和实践,开发符合道德规范的AI技术。

从融资方面上来看,智谱AI是国内AI赛道融资最高的企业之一,OpenAI则凭借其优异的表现,成为美国AI赛道融资最高的企业。它们的研究团队在某种程度上也很相似,OpenAI 研究团队主要来自世界顶级大学,而智谱 AI 的团队主要来自清华大学。

因此,在硅谷科技媒体The Information 2023年的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一。

“OpenAI公司一直在领跑,所以最直接的方式是先达到他们的水平。”CEO张鹏说道。因此,在技术选型和解决方案方面,智谱AI选择了和OpenAI看齐,但并没有完全依赖OpenAI的技术经验,开发了GLM模型,实现单一模型处理多个任务,从而用更低的成本来支持更多上层任务。

在商业化和开源的问题上,智谱AI也更加关注商业化,同时也比OpenAI更“Open”

从成立之初,智谱AI就“带着客户入场”,面向企业和机构的B端客户,成为了国内科研机、科技型企业、互联网企业和一些国际顶尖科技企业的的合作方,在大模型市场上提出了MaaS的商业化落地路径,并针对不同客群类型和需求提供了云端API、云端私有化以及本地私有化等多种解决方案。在2023年下半年,签单客户就有几百家,全年也达到了亿级签单额。

与OpenAI不同,智谱AI打出了「GLM❤开源」、「GLM❤开发者」的 Slogan,在此前就已经开源了ChatGLM3-6B 模型、多模态 CogVLM-17B 和智能体 AgentLM 等能力,一方面依靠更多人的使用来提高项目质量和成熟度;另一方面,开源能在全球开源项目中发出中国声音,同时也能学习和借鉴海外先进技术和经验。

从这个意义上来说,智谱AI恐怕才是真正的“OpenAI”。

不做“中国的OpenAI”

CEO张鹏表示,智谱AI的目标并不是做“中国的OpenAI”

如今市面上最主流的三种模型训练路径都来自西方:GPT来自OpenAI,BERT和T5都来自谷歌。要想在AI赛道上实现对美国的弯道超车,只跟着OpenAI的路子走,永远没有机会。    

也因此,为了打破西方的路径垄断,智谱AI提出了GLM路径,如果把GPT的原理比作“根据上文做完形填空”,那么GLM的完形填空则是根据上文扩充到上下文,理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。

为了更早推动中国在AGI技术上的发展,智谱AI没有选择推出行业大模型,而是说服行业客户在通用大模型基座上做微调。如今智谱AI在开放平台、云端私有化、本地私有化三个方面,基于自己的开源生态,已经和超过 200 家的企业进行了生态共建,和超过 1000 家机构共建了大模型应用场景。

时至今日,智谱AI已经是一家“有人、有技术、有客户”的“完成时”企业。有投资人说,“现在只有智谱AI挑投资机构的份”。

智谱AI目前已取得了多项国际领先的AI技术突破,在超大规模智能模型训练技术体系中占据了领先地位,已经具备了构建我国人工智能应用通用基础设施的实力,未来将有望成长为全球认知智能平台领军者。


本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    暂无评论哦,快来评论一下吧!

    全部评论(0条)