谷歌深夜炸弹！史上最强开源模型Gemma，打响新一轮AI之战

原创赞收藏评论

举报 2024-02-22

扫描,分享朋友圈

作者：文子

编辑：小迪

谷歌，2024年卷出新高度。

全球最强开源模型，Gemma重燃战局

短短12天连放三次大招，谷歌AI更新迭代之快，让人始料未及。

当地时间2月21日，谷歌毫无预兆地发布号称“全球性能最强大、轻量级”的新一代开源系列模型Gemma，瞬间打响AI开源战争。

据官方介绍，Gemma模型使用了和Gemini同源的技术，总共有20亿参数和70亿参数两种规模，每个规模又分预训练和指令微调两个版本。

其中20亿参数版本可以直接在笔记本电脑上运行，而70亿参数版本在一系列语言理解、推理、数学等标准测试上击败了主流开源模型Llama-2和Mistral，一度登顶Hugging Face开源大模型排行榜，成为目前全球最强的开源大模型。

可见，谷歌除了将目光瞄向山姆奥特曼的GPT-5以外，也没打算放过针对扎克伯格的Llama-2，先后推出的Gemini和Gemma都是对标产品。

而和Gemini的全家桶路线不同，Gemma这一次主打轻量级、高性能，除了笔记本电脑电脑，还可以在台式机、物联网设备、移动设备和云端等不同平台运行。

除了模型本身，谷歌还提供了一整套工具帮助开发者，确保Gemma模型负责任的使用，帮助开发者用Gemma构建更安全的AI应用程序。

按照谷歌CEO 桑达尔·皮查伊的说法，Gemma即日起就将在全球范围内开放使用，用户可以在Kaggle、Hugging Face等平台上进行下载和试用。据一位X平台的用户分享，Gemma不仅速度飞快，而且输出很稳定。

值得注意的是，谷歌目前已与英伟达达成战略合作，将利用英伟达TensorRT-LLM对Gemma进行优化。同时，英伟达刚刚发布的聊天机器人Chat with RTX也将很快增加对Gemma的支持。

技术报告首度曝光，31人来自亚洲

与Gemini发布时一样，谷歌此次也同步公开了Gemma的技术报告。

报告称，Gemma数据主要来自网络文档、数学和代码的英语数据。不同于Gemini，这些模型不是多模态的，也没有针对多语言任务进行训练。而且谷歌保证了兼容性，它分割数字但不去除额外的空格，这可能意味着它更容易扩展到其他语言。

不过Gemma也并不是完全“开源”，虽然Gemma模型在性能、安全性和负责任开发方面实现了突飞猛进的进展，但谷歌承认“此发布是不可逆转的”，并且开放模型造成的危害尚未明确定义。

因此谷歌仍然可制定使用该模型的条款及所有权条款，也会进一步研究并创建可靠、按预期执行的稳健、安全的模型。

此外，根据技术论文显示，此次参与谷歌Gemma开源模型的研发人员数量高达57位。其中包括核心贡献者14人，参与者35人，产品管理2人，项目管理1人，执行赞助人5人。

根据研发者名字进行梳理和猜测，此次参与Gemma模型研发的57人中，可能有大约一半以上的开发者来自亚洲，或与华人或具有华人血统的个人有关。

比如谷歌Gemma团队的侯乐博士曾是谷歌FLAN-T5技术的作者。在加入谷歌之前，侯乐在纽约州立大学石溪分校攻读博士学位，专注于高分辨率图像的分析，涵盖卫星图像和医学图像等领域。加入谷歌后，侯乐研究主要集中于NLP方面，包括高效的语言模型训练、指令微调和提示工程等，核心能力是通过更好的微调和提示工程来提高最先进语言模型的推理能力。

另一位华人Geng Yan同样也是AI领域大神级人物。他毕业于浙江大学计算机科学系，随后在美国美国卡内基梅隆大学完成计算机视觉专业的硕士学位。Geng Yan曾就职于商汤和亚马逊，专注研究人工智能机器算法技术，在谷歌曾参与研发Google Facemesh追踪面部的AI模型，该模型在谷歌相机自拍、手机支付等多个场景中均发挥巨大作用。

截至目前，开发者可以在Kaggle中免费使用Gemma，首次使用Google Cloud 的用户将获得 300美元的积分，并可申请高达50万美元的Google Cloud积分来使用这些模型。

此外，谷歌的Google One AI Premium正在将Gemini整合到谷歌Gmail、Docs、Sheets、Slides和Meet当中，提供书写、校对和生成图像等 AI 增强功能。而作为账户付费产品，前两个月免费使用，之后每月19.99美元。

全球四面开战，谷歌野心暴露无遗

可以说，谷歌想要成为AI行业王者的野心已经暴露无遗。

2月9日，谷歌宣布最强大模型Gemini Ultra免费使用，向OpenAI发起强势一击。2月16日，谷歌放出大模型核弹Gemini 1.5，将上下文窗口长度扩展到100万个tokens，向OpenAI还没发布的GPT-5发起挑战。再到2月21日，谷歌发布Gemma疯狂狙击Mate，一举登上开源大模型铁王座，为生成式AI的应用开发者带来福音，更为闭源的代表OpenAI狠狠地上了一课。

OpenAI CEO山姆奥特曼就曾在私下表示过，与谷歌相比，OpenAI在算力上处于劣势。无论是在算力、算法，还是数据方面，谷歌都具有很明显的技术领先优势。

而这一次的谷歌，也的确有拳打OpenAI，脚踢Meta的风范。尤其是近两年来，头部科技大厂你追我赶，厮杀异常激烈。前有闭源代表OpenAI推出的GPT-4 Turbo大模型，后有Meta大力进攻开源权重模型，留给谷歌的时间本就不多了。

按照谷歌开发者 X 副总裁兼总经理、谷歌开发者关系主管Jeanine Banks的说法，Gemma模型就像是谷歌开源AI开发技术历史的延续，从TensorFlow等工具开始，经过PaLM2、AlphaFold的演进，最终形成了Gemma。

目前摆在Gemma面前的竞争对手有Meta的开源大型语言模型 Llama 2、Mistral AI 的7B 模型、Deci的DecilLM和Microsoft的Phi-2，以及旨在在组织自己的硬件上运行的类似小型生成式 AI 模型。可以说，憋坏了的谷歌正在四面开战了。

接下来，就看刚刚跌落神坛的Meta会如何接招了。

本文系作者授权数英发表，内容为作者独立观点，不代表数英立场。
转载请在文章开头和结尾显眼处标注：作者、出处和链接。不按规范转载侵权必究。