开始大模特之战！谷歌推出最强大的开源模型 Gemma

继 2 月 16 日发布 Gemini 1 之后5. OpenAI 的 GPT-4 之后的正面很硬。当地时间2月21日，谷歌推出新一代开源模型“Gemma”，直接指代Meta的开源模型Llama 2。

谷歌表示，GEMMA是“最先进”的轻量级开放模型系列，超过了Mistral 7B和Llama 2，成为迄今为止同类语言模型中最强大的语言模型。

据谷歌官网称，GEMMA在拉丁语中意为“宝石”，以它命名的开放模型系列GEMMA是由谷歌DeepMind等团队开发的，使用与创建双子座模型相同的研究和技术。

目前，GEMMA系列有“GEMMA 2B”和“GEMMA 7B”两种尺度可供选择，即20亿个参数和70亿个参数，以满足开发者的不同需求。

在性能方面，它在多项测试中都领先于 LLAMA 2，包括 MMLU、BBH、MATH 等。

其中，GEMMA 7B在MMLU（Massive Multitasking Language Understanding）中获得了64分。3%。就其大小而言，最初最强的Mistral 7b得分为625%，Meta 的 Llama-2 7b 和 13b 为 452% 和 548%，这与杰玛相去甚远。

在使用方面，开发人员可以根据自己的数据对 GEMMA 模型进行微调，并在框架、工具和硬件之间对其进行优化。首先，谷歌通过了原生的keras 30 兼容所有主要框架（Jax、Pytorch 和 TensorFlow），并为 GEMMA 提供了用于推理和监督微调（SFT）的工具链。

同时，GEMMA 支持多个 AI 硬件平台，包括 NVIDIA GPU 和 Google Cloud TPU，这使得 GEMMA 模型可以在所有类型的设备上运行，包括笔记本电脑、台式机、物联网、移动设备和云。

然而，与闭源模型相比，开源模型的安全性也是很多人关心的问题。

为此，Google 使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外，人类反馈（RLHF）被用于广泛的微调和强化学习，以使指令调整模型与负责任的行为保持一致。还评估了GEMMA模型的风险状况。

GEMMA 的推出恰逢 Google 新推出的 Responsible Generative AI Toolkit，以帮助开发人员和研究人员优先构建安全和负责任的 AI 应用程序。

谷歌表示，作为一个开放的产品，GEMMA允许所有组织，无论规模大小，都以商业上负责任的方式使用它，并符合安全标准。

此外，谷歌副总裁兼总经理兼开发者关系主管珍妮·班克斯（Jeanine Banks）也强调，GEMMA与Meta的开源不同，Meta的开源有许可条款，阻止其大型科技竞争对手使用其LLAMA 2开源模式，而谷歌GEMMA则没有这样的商业限制。这波谷歌确实在得分！

事实上，在人工智能领域，如果说Meta是大模型开源的鼻祖，那么谷歌可以说是人工智能领域的开源鼻祖。无论是 OpenAI 还是 Meta，谷歌的竞争对手，还是任何生成式 AI 公司，他们都离不开 Transformer 框架的影响。

Transformer 框架在 Google 2017 年的“Attention is All You Need”** 中首次被提及。作者：Vaswani，谷歌的人工智能研究员，等人。

在 Google 发布之前，OpenAI 的技术路线图主要集中在卷积神经网络（CNN）和递归神经网络（RNN）上。由于 Transformer 架构的提出，有助于解决 RNN 在长距离依赖问题中的困境。

原件中变形金刚模型主要部件的插图。

Transformer 模型在机器翻译、文本摘要、问答等任务中取得了显著的成绩，并迅速成为自然语言处理领域的标准模型。当今的大多数大型语言模型，包括 GPT-2、GPT-3、GPT-4、Claude、BERT、XLNet、Roberta 和 ChatGPT，都展示了 Transformer 执行各种自然语言处理（NLP）相关任务的能力。

另一方面，谷歌在人工智能领域的实力此前一直被低估，可以说甚至比OpenAI、Meta等竞争对手拥有更大的先发优势。

但自 2022 年 ChatGPT 发布以来，OpenAI 代表了世界上最先进的生成式大模型。谷歌作为先驱，在这个领域几乎“消失”了。

为了应对ChatGPT的挑战，谷歌于2023年3月紧急推出了Bard。 2023年12月，Gemini多模态大模型发布。与此同时，谷歌也面临诸多质疑，甚至被指责在发布会上呈现假片段。

面对外部打击，谷歌并没有就此止步。 2024 年 2 月，谷歌将发布 Gemini Ultra 免费版和 Gimini 15. GEMMA开源三大举措。可以看出，谷歌一直在用实际行动证明自己。

近日，OpenAI再次推出颠覆性产品Sora，将多模态人工智能领域提上日程。这对谷歌来说压力很大，但并不可怕。

早在去年年底，谷歌就推出了第一代模型视频诗人。据谷歌称，该模型可以“零镜头生成”，不仅支持常见的文生和土生，还支持编辑、风格化、扩展和配乐。从谷歌提供的输出**效果来看，VideoPoet与之前的AI**大模型相比，确实有了质的飞跃。未来，它可能会与OpenAI竞争。

目前，在开源大模型领域，随着谷歌的强势进军，已经形成了三足的局面：Meta、欧洲Mistral AI和谷歌。在闭源大模型领域，谷歌在OpenAI和Microsoft领导的阵营中占据了一席之地。

再过不到两个月的2024年，“大模型之战”就已经开始，可以预见，2024年大模型领域的竞争将进一步升温。

但就国内市场而言，没有谁能独自掌控，我们还需要拭目以待，看看是否会有一匹黑马如雨后春笋般涌现。当然，我们也期待这样一匹黑马的出现。

开始大模特之战！谷歌推出最强大的开源模型 Gemma

相似文章

Google 推出 Gemini，最强大的大型语言模型

谷歌扩大了推出 AI 模型 Gemini 以挑战 GPT 4 的举动

谷歌大型AI模型双子座出道擅长复杂主题推理，懂编程语言PKGPT 4

谷歌双子座来了，国产大模还得内卷才长大？

谷歌推出 Gemma，一个轻量级的开放 AI 模型

开始大模特之战！ 谷歌推出最强大的开源模型 Gemma

相似文章

Google 推出 Gemini，最强大的大型语言模型

谷歌扩大了推出 AI 模型 Gemini 以挑战 GPT 4 的举动

谷歌大型AI模型双子座出道 擅长复杂主题推理，懂编程语言PKGPT 4

谷歌双子座来了，国产大模还得内卷才长大？

谷歌推出 Gemma，一个轻量级的开放 AI 模型

开始大模特之战！谷歌推出最强大的开源模型 Gemma

谷歌大型AI模型双子座出道擅长复杂主题推理，懂编程语言PKGPT 4