新火种AI|这家“中国OpenAI”，能赶超OpenAI吗？

原创赞收藏评论

举报 2024-01-18

扫描,分享朋友圈

作者：一号

编辑：美美

全面对标OpenAI，智谱AI能成为“中国的OpenAI”吗？

在OpenAI首次DevDay发布GPT-4Turbo、GPTs应用商店等的两个月后，GPT store刚刚上线后，1月16日，国产大模型迎来了第一个重磅消息。被称为“中国OpenAI”的智谱AI，在其技术开放日Zhipu DevDay上，正式发布了新一代基座大模型GLM-4。

经历三个月的技术迭代，相比上一代，GLM-4性能大幅增强，实现了60%的性能全面提升，逼近GPT-4，并且在中文对其能力上总分超过了GPT-4，在包括GSM8K、Math等多项数据集当中，GLM-4的表现均优于GPT-3.5。

GLM-4支持更长的上下文、具备更强的多模态能力、有着更快的推理速度和响应高并发的能力，大大降低了推理成本。

此外，在AI Agent越来越成为行业共识的今天，GLM-4也增强了智能体的能力，智谱AI正式上线了GLM-4-All Tool和GLMs个性化智能体定制能力，并且GLMs模型应用商店开发者分成计划也将同期公布。真不愧是从成立之初就一直对标OpenAI的公司，让人想起了OpenAI的GPTs，在产品上持续对标OpenAI。

清华出身，广受青睐的智谱AI

从智谱AI的公众号上可以了解到，2023年10月，这家公司就已累计获得超25亿人民币融资，投资方包括社保基金、阿里、美团、腾讯、小米、顺为、红杉和高瓴等知名机构，估值已经超过了100亿人民币。

能让腾讯阿里联手，主流基金入场，战投纷纷表态，这样的融资声势无论在哪个行业都是相当罕见的，这家名为智谱的AI公司，究竟是何方神圣？

成立于2019年6月的智谱AI，是由清华大学计算机系只是工程实验室的技术成果转化而来的，团队的核心成员曾参与清华大学与智源研究院合作项目“悟道”的研发工作。

2020年，GPT-3发布，给了行业一个明确的信号，即大模型具备了实际可用性，而这一年智谱AI决定跟进，全面投身大模型，成为了国内最早研发大模型的企业之一。尽管今天看来，智谱AI提前3年的抢跑非常正确，但是在当时，是否跟进大模型还是一个问题，这样的决定其实十分冒险。

2021年，智谱利用MoE架构成功训练出万亿参数模型，并且在2022年合作研发了双语千亿级超大规模预训练模型GLM-130B，并且开始基于这个千亿基座模型开始打造大模型平台和产品矩阵，同年11月，GLM-130B成为斯坦福大学基础研究中心全方位评测全球20个主流大模型中亚洲唯一入选的大模型。

到了2023年，大量新兴的AI大模型公司出现，但智谱依旧沉稳，推出了千亿基座的对话模型ChatGLM，并且开源了单卡版模型ChatGLM-6B。在Hugging Face上，智谱AI的下载量超过1100万次，位居全球最受欢迎开源机构第五名，成为了国内唯一上榜的公司。同年8月底，它成为8家首批通过备案的大模型公司之一，并推出了面向C端的生成式AI助手智谱清言。

OpenAI的模仿者还是追赶者？

在众多方面上，智谱AI都可以称得上是国内“最具OpenAI”气质的公司。

在技术发展特点上来看，它们都致力于自然语言处理领域的研究，都拥有先进的预训练模型。产品性能也十分相似，并且都注重AI伦理的研究和实践，开发符合道德规范的AI技术。

从融资方面上来看，智谱AI是国内AI赛道融资最高的企业之一，OpenAI则凭借其优异的表现，成为美国AI赛道融资最高的企业。它们的研究团队在某种程度上也很相似，OpenAI 研究团队主要来自世界顶级大学，而智谱 AI 的团队主要来自清华大学。

因此，在硅谷科技媒体The Information 2023年的盘点中，智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一。

“OpenAI公司一直在领跑，所以最直接的方式是先达到他们的水平。”CEO张鹏说道。因此，在技术选型和解决方案方面，智谱AI选择了和OpenAI看齐，但并没有完全依赖OpenAI的技术经验，开发了GLM模型，实现单一模型处理多个任务，从而用更低的成本来支持更多上层任务。

在商业化和开源的问题上，智谱AI也更加关注商业化，同时也比OpenAI更“Open”。

从成立之初，智谱AI就“带着客户入场”，面向企业和机构的B端客户，成为了国内科研机、科技型企业、互联网企业和一些国际顶尖科技企业的的合作方，在大模型市场上提出了MaaS的商业化落地路径，并针对不同客群类型和需求提供了云端API、云端私有化以及本地私有化等多种解决方案。在2023年下半年，签单客户就有几百家，全年也达到了亿级签单额。

与OpenAI不同，智谱AI打出了「GLM❤开源」、「GLM❤开发者」的 Slogan，在此前就已经开源了ChatGLM3-6B 模型、多模态 CogVLM-17B 和智能体 AgentLM 等能力，一方面依靠更多人的使用来提高项目质量和成熟度；另一方面，开源能在全球开源项目中发出中国声音，同时也能学习和借鉴海外先进技术和经验。

从这个意义上来说，智谱AI恐怕才是真正的“OpenAI”。

不做“中国的OpenAI”

CEO张鹏表示，智谱AI的目标并不是做“中国的OpenAI”。

如今市面上最主流的三种模型训练路径都来自西方：GPT来自OpenAI，BERT和T5都来自谷歌。要想在AI赛道上实现对美国的弯道超车，只跟着OpenAI的路子走，永远没有机会。

也因此，为了打破西方的路径垄断，智谱AI提出了GLM路径，如果把GPT的原理比作“根据上文做完形填空”，那么GLM的完形填空则是根据上文扩充到上下文，理论上，GLM的训练效率会比GPT更高，也能理解更复杂的场景。

为了更早推动中国在AGI技术上的发展，智谱AI没有选择推出行业大模型，而是说服行业客户在通用大模型基座上做微调。如今智谱AI在开放平台、云端私有化、本地私有化三个方面，基于自己的开源生态，已经和超过 200 家的企业进行了生态共建，和超过 1000 家机构共建了大模型应用场景。

时至今日，智谱AI已经是一家“有人、有技术、有客户”的“完成时”企业。有投资人说，“现在只有智谱AI挑投资机构的份”。

智谱AI目前已取得了多项国际领先的AI技术突破，在超大规模智能模型训练技术体系中占据了领先地位，已经具备了构建我国人工智能应用通用基础设施的实力，未来将有望成长为全球认知智能平台领军者。

本文系作者授权数英发表，内容为作者独立观点，不代表数英立场。
转载请在文章开头和结尾显眼处标注：作者、出处和链接。不按规范转载侵权必究。