新火种AI|微软扶持下一个OpenAI?Mistral AI新模型对标GPT-4

原创 收藏 评论
举报 2024-02-27

作者:一号

编辑:美美

OpenAI的大金主微软,还想缔造“下一个OpenAI”。

周一晚间,成立仅9个月的Mistral AI正式发布了最强力的旗舰模型Mistral Large。和此前他们所推出的一系列模型不同,Mistral AI本次发布的版本性能更强,体量也更大,直接对标OpenAI的GPT-4。

在目前所有能够通过API访问的大模型中,Mistral Large排名第二,仅次于“当红明星”GPT-4,并且和GPT-4一样,是唯二在MMLU考试中拿到了80分以上的。

而且随着Mistral Large上线,Mistral AI还推出了名为Le Chat的聊天机器人,对标ChatGPT,大有复制OpenAI成功道路的意图。即便有微软Azure算力资源的加持,Le Chat的服务器还是被挤爆了。

忘了初心,开源变闭源?

早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因为其强大的性能,还有令人意外的开源而名噪一时。使得不少的大模型初创企业不再对标Llama2这个开源模型,而是转而将Mistral旗下的模型作为直接竞争对手。这一次Mistral Large的横空出世,自然引人注目。

从性能上来说,尽管Mistral Large在参数量上还比不上GPT-4,但在一些关键性能上,它还是能够和GPT-4一战的,可以说,已经是当前业内前三的地位。

在推理准确性上,Mistral Large也已经超过了Claude 2、Gemini 1.0 Pro、GPT-3.5等一众为人所熟知的大模型,并且它还支持32k token的上下文窗口,支持精确指令,自带函数调用能力。在推理速度上,Mistral Large甚至还超过了GPT-4还有谷歌刚推出不久的Gemini Pro。

但有眼尖的网友发现,Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这让不少开源大模型爱好者开始担心,Mistral AI也会像OpenAI一样,从开放走向封闭。

不过据媒体对Mistral CEO的采访,未来他们依旧会坚持开源理念,但与此同时,也会推出性能最为强大的闭源模型来参与商业竞争。

从诞生之初,就充满传奇光环

谁能想到,今天这个逼近GPT-4的模型,是来自一家仅仅成立9个月的法国公司。

Mistral AI的创始人Arthur Mensch在1993年时出生于法国。在巴黎综合理工学院和巴黎高等师范学院学习期间,他结识了后来成为Mistral AI联合创始人的Timothée Lacroix和Guillaume Lample。而后两位都曾在Meta AI团队工作过,其中Lample还领导了LLaMA模型的开发。在那时,全球范围内具备构建、训练和优化大型语言模型(LLM)专业经验的人才不超过100人。

Arthur Mensch本人也颇有实力。他在2020年初便加入了谷歌,成为了DeepMind的研究员,专注于提高AI和机器学习系统的效率。在那里,他参与开发了大型语言模型,并以主要作者的身份发表了著名的“Chinchilla论文”,该研究重新定义了人们对AI模型大小、训练数据量及其性能之间关系的认识。

然而随着AI竞赛的升温,Mensch对于大公司AI实验室减少与研究社区分享研究成果的做法感到失望。他所在的团队从一个10人的小团队迅速扩大到70人的大团队,但他觉得在大型科技公司中开发不透明的技术过于官僚化,于是决定离开。

2023年初,他离开了谷歌,和前文所提到的Lacroix和Lample一起创立了Mistral AI。他们的目标是通过更加高效的方法构建和部署AI模型,并坚持开源模型的原则,希望让每个人对自己使用的AI有更多的控制权。

在种子轮融资时,Mistral AI的故事更具传奇色彩:一个6人团队凭借着7页PPT就拿到了8亿欧元的融资。而当前公司的估值已经达到了20亿美元,涨了七倍多。尽管与美国的竞争者相比,所获得的资金并不算多,但他们的目标是成为AI领域中最节省资本的公司。

微软想要打造下一个OpenAI?

在Mistral Large以令人惊喜的性能收获目光之时,微软CEO纳德拉宣布,微软已经和Mistral AI建立了多年合作伙伴关系。这也是微软继OpenAI之后,又再一次地把“真金白银”投给了AI圈的另一家顶流模型公司。

人们不禁怀疑,微软这是想要打造“下一个OpenAI”?

根据公告,微软和Mistral AI的合作将集中在以下三个关键领域:

超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。

扩展市场:微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务(MaaS)向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外,模型目录还提供了多种开源和商业模型。

人工智能研发:微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。

毫无疑问,除了OpenAI之外,微软还想给自己的Azure云服务吸引更多客户。并且,微软两头下注,实际上很可能是想要分散风险,并且期望获得更大的影响力。

去年11月,OpenAI经历了CEO奥特曼被解雇而后又重返的董事会风波。而作为OpenAI的最大股东,微软直到消息公布之前的5到10分钟才从OpenAI那里得到消息。尽管在这场风波之后,微软设法在控制 OpenAI 的非营利性董事会中获得了一个无投票权的观察员席位,这让他们对OpenAI的内部运作有了更多的了解,但在一些重大决策上,微软依旧没有投票权。

微软作为OpenAI的最大金主,显然没在OpenAI的决策上取得与之相对应的影响力。因此,微软想要扶持另一家能够与OpenAI对位的企业也是情理之中。

这一点,在路透社对Mistral AI的采访中也得到了体现,Mistral AI承认,作为交易的一部分,微软将持有该公司少数股权,但并没有透露更多细节。而微软这边则仅仅是证实了其对Mistral的投资,在是否持有该公司股权的问题上,微软给出了否定的回答。而这很可能与微软因向OpenAI提供了巨额资金而受到欧洲和美国监管机构的审查有关。

另外,由于Mistral AI是一家法国公司,在语言支持上也更加偏向于欧洲本土语言,因此微软投资Mistral AI也是想要在欧洲建立起自己的AI影响力,在欧洲AI领域站稳脚跟。

与美国不同,欧洲许多国家对AI的态度偏保守,持批判性看法,尤其是数据保护方面。因此投资一家欧洲本土的AI企业,打造一家“欧洲版OpenAI”,也许能够更让人放心。


本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    暂无评论哦,快来评论一下吧!

    全部评论(0条)