新火种AI|微软扶持下一个OpenAI？Mistral AI新模型对标GPT-4

原创赞收藏评论

举报 2024-02-27

扫描,分享朋友圈

作者：一号

编辑：美美

OpenAI的大金主微软，还想缔造“下一个OpenAI”。

周一晚间，成立仅9个月的Mistral AI正式发布了最强力的旗舰模型Mistral Large。和此前他们所推出的一系列模型不同，Mistral AI本次发布的版本性能更强，体量也更大，直接对标OpenAI的GPT-4。

在目前所有能够通过API访问的大模型中，Mistral Large排名第二，仅次于“当红明星”GPT-4，并且和GPT-4一样，是唯二在MMLU考试中拿到了80分以上的。

而且随着Mistral Large上线，Mistral AI还推出了名为Le Chat的聊天机器人，对标ChatGPT，大有复制OpenAI成功道路的意图。即便有微软Azure算力资源的加持，Le Chat的服务器还是被挤爆了。

忘了初心，开源变闭源？

早在本次Mistral Large“炸街”之前，Mistral AI所提出的Mistral-Medium就因为其强大的性能，还有令人意外的开源而名噪一时。使得不少的大模型初创企业不再对标Llama2这个开源模型，而是转而将Mistral旗下的模型作为直接竞争对手。这一次Mistral Large的横空出世，自然引人注目。

从性能上来说，尽管Mistral Large在参数量上还比不上GPT-4，但在一些关键性能上，它还是能够和GPT-4一战的，可以说，已经是当前业内前三的地位。

在推理准确性上，Mistral Large也已经超过了Claude 2、Gemini 1.0 Pro、GPT-3.5等一众为人所熟知的大模型，并且它还支持32k token的上下文窗口，支持精确指令，自带函数调用能力。在推理速度上，Mistral Large甚至还超过了GPT-4还有谷歌刚推出不久的Gemini Pro。

但有眼尖的网友发现，Mistral修改了网站内容，删除了所有提及开源社区义务的内容，这让不少开源大模型爱好者开始担心，Mistral AI也会像OpenAI一样，从开放走向封闭。

不过据媒体对Mistral CEO的采访，未来他们依旧会坚持开源理念，但与此同时，也会推出性能最为强大的闭源模型来参与商业竞争。

从诞生之初，就充满传奇光环

谁能想到，今天这个逼近GPT-4的模型，是来自一家仅仅成立9个月的法国公司。

Mistral AI的创始人Arthur Mensch在1993年时出生于法国。在巴黎综合理工学院和巴黎高等师范学院学习期间，他结识了后来成为Mistral AI联合创始人的Timothée Lacroix和Guillaume Lample。而后两位都曾在Meta AI团队工作过，其中Lample还领导了LLaMA模型的开发。在那时，全球范围内具备构建、训练和优化大型语言模型（LLM）专业经验的人才不超过100人。

Arthur Mensch本人也颇有实力。他在2020年初便加入了谷歌，成为了DeepMind的研究员，专注于提高AI和机器学习系统的效率。在那里，他参与开发了大型语言模型，并以主要作者的身份发表了著名的“Chinchilla论文”，该研究重新定义了人们对AI模型大小、训练数据量及其性能之间关系的认识。

然而随着AI竞赛的升温，Mensch对于大公司AI实验室减少与研究社区分享研究成果的做法感到失望。他所在的团队从一个10人的小团队迅速扩大到70人的大团队，但他觉得在大型科技公司中开发不透明的技术过于官僚化，于是决定离开。

2023年初，他离开了谷歌，和前文所提到的Lacroix和Lample一起创立了Mistral AI。他们的目标是通过更加高效的方法构建和部署AI模型，并坚持开源模型的原则，希望让每个人对自己使用的AI有更多的控制权。

在种子轮融资时，Mistral AI的故事更具传奇色彩：一个6人团队凭借着7页PPT就拿到了8亿欧元的融资。而当前公司的估值已经达到了20亿美元，涨了七倍多。尽管与美国的竞争者相比，所获得的资金并不算多，但他们的目标是成为AI领域中最节省资本的公司。

微软想要打造下一个OpenAI？

在Mistral Large以令人惊喜的性能收获目光之时，微软CEO纳德拉宣布，微软已经和Mistral AI建立了多年合作伙伴关系。这也是微软继OpenAI之后，又再一次地把“真金白银”投给了AI圈的另一家顶流模型公司。

人们不禁怀疑，微软这是想要打造“下一个OpenAI”？

根据公告，微软和Mistral AI的合作将集中在以下三个关键领域：

超算基础结构：微软将通过Azure AI超算基础结构支持Mistral AI，用于AI训练和推理工作负载。

扩展市场：微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务（MaaS）向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外，模型目录还提供了多种开源和商业模型。

人工智能研发：微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。

毫无疑问，除了OpenAI之外，微软还想给自己的Azure云服务吸引更多客户。并且，微软两头下注，实际上很可能是想要分散风险，并且期望获得更大的影响力。

去年11月，OpenAI经历了CEO奥特曼被解雇而后又重返的董事会风波。而作为OpenAI的最大股东，微软直到消息公布之前的5到10分钟才从OpenAI那里得到消息。尽管在这场风波之后，微软设法在控制 OpenAI 的非营利性董事会中获得了一个无投票权的观察员席位，这让他们对OpenAI的内部运作有了更多的了解，但在一些重大决策上，微软依旧没有投票权。

微软作为OpenAI的最大金主，显然没在OpenAI的决策上取得与之相对应的影响力。因此，微软想要扶持另一家能够与OpenAI对位的企业也是情理之中。

这一点，在路透社对Mistral AI的采访中也得到了体现，Mistral AI承认，作为交易的一部分，微软将持有该公司少数股权，但并没有透露更多细节。而微软这边则仅仅是证实了其对Mistral的投资，在是否持有该公司股权的问题上，微软给出了否定的回答。而这很可能与微软因向OpenAI提供了巨额资金而受到欧洲和美国监管机构的审查有关。

另外，由于Mistral AI是一家法国公司，在语言支持上也更加偏向于欧洲本土语言，因此微软投资Mistral AI也是想要在欧洲建立起自己的AI影响力，在欧洲AI领域站稳脚跟。

与美国不同，欧洲许多国家对AI的态度偏保守，持批判性看法，尤其是数据保护方面。因此投资一家欧洲本土的AI企业，打造一家“欧洲版OpenAI”，也许能够更让人放心。

本文系作者授权数英发表，内容为作者独立观点，不代表数英立场。
未经授权严禁转载，授权事宜请联系作者本人，侵权必究。