作者:Fumiko。
编辑:肖迪.
谷歌,在 2024 年达到新的高度。
世界上最强大的开源模型,GEMMA重新点燃了这场战斗。
短短12天,三大动作接连发布,谷歌AI更新迭代速度出乎意料。
当地时间2月21日,谷歌毫无征兆地发布了被誉为“全球最强大最轻量级”的新一代开源系列模型Gemma,瞬间掀起了AI开源大战。
根据官方介绍,GEMMA模型采用与Gemini相同的技术,共有20亿个参数和70亿个参数,每个参数分为预训练和指令微调两个版本。
其中,20亿参数版本可以直接在笔记本电脑上运行,70亿参数版本在语言理解、推理、数学等一系列标准测试中击败了主流开源模型LLAMA-2和MISTRAL,一度登顶Hugging Face开源大模型排行榜,成为全球最强开源大模型。
可以看出,除了瞄准山姆奥特曼的GPT-5之外,谷歌并不打算放过扎克伯格的LLAMA-2,相继推出的Gemini和GEMMA都是标杆产品。
与 Gemini 的 Family Bucket 路线不同,Gemma 是轻量级、高性能的,除了笔记本电脑之外,还可以在台式机、物联网设备、移动设备和云上运行。
除了模型本身之外,Google 还提供了一套工具来帮助开发人员确保负责任地使用 GEMMA 模型,并帮助开发人员使用 GEMMA 构建更安全的 AI 应用程序。
据谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)称,GEMMA将从现在开始在全球范围内推出,用户可以在Kaggle和Hugging Face等平台上试用**。 据X平台的一位用户介绍,GEMMA不仅速度快,而且输出稳定。
值得注意的是,谷歌现在已经与英伟达达成了战略合作伙伴关系,使用英伟达的Tensorrt-LLM优化GEMMA。 同时,英伟达刚刚发布的聊天机器人 Chat with RTX 也将很快增加对 GEMMA 的支持。
来自亚洲的31人首次出席了会议。
与Gemini的发布一样,谷歌也发布了GEMMA的技术报告。
根据该报告,GEMMA数据主要来自在线文档、数学和英语数据。 与 Gemini 不同,这些模型不是多模态的,也没有针对多语言任务进行训练。 谷歌保证兼容性,它会拆分数字但不会删除多余的空格,这可能意味着它更容易扩展到其他语言。
然而,GEMMA 并不是完全“开源”的,虽然 GEMMA 模型在性能、安全性和负责任的开发方面取得了突飞猛进的进步,但 Google 承认“此版本是不可逆的”,并且开放模型造成的危害尚未明确定义。
因此,谷歌仍然可以为该模型的使用建立条款和所有权条款,并将进一步研究并创建一个可靠且安全的模型,该模型应可靠且按预期执行。
此外,根据技术**,谷歌GEMMA开源模式涉及的研发人员数量高达57人。 其中,核心贡献者14人,参与者35人,产品经理2人,项目经理1人,执行发起人5人。
根据开发者的名字,参与GEMMA模型开发的57名开发者中,有一半以上可能来自亚洲,或者与中国人或有华人血统的人有关系。
例如,谷歌GEMMA团队的侯乐博士是谷歌FLAN-T5技术的作者。 在加入 Google 之前,侯先生在纽约州立大学石溪分校攻读博士学位,专注于高分辨率图像的分析,包括卫星图像和医学图像。 加入谷歌后,侯先生的研究重点是NLP,包括高效的语言模型训练、指令微调和提示工程,他的核心能力是通过更好的微调和提示工程来提高最先进语言模型的推理能力。
另一位中国人耿彦,也是AI领域的神级人物。 他毕业于浙江大学,获得计算机科学学位,随后在卡内基梅隆大学获得计算机视觉硕士学位。 耿彦曾就职于商汤科技、亚马逊,专注于人工智能机器算法技术,在谷歌参与开发用于人脸追踪的Google FaceMesh AI模型,在Google Camera**、移动支付等多个场景中发挥了巨大作用。
截至目前,开发人员可以在 Kaggle 中免费使用 GEMMA,首次使用 Google Cloud 的用户将获得 300 美元的积分,并可以申请高达 500,000 美元的 Google Cloud 积分来使用这些模型。
此外,Google 的 Google One AI Premium 正在将 Gemini 集成到 Google Gmail、Docs、Sheets、Slides 和 Meet 中,以提供 AI 增强功能,例如写作、校对和图像生成。 作为帐户付费产品,前两个月免费,之后每月 19 美元99 美元。
世界四面楚歌,谷歌的野心暴露无遗。
可以说,谷歌成为AI行业之王的野心已经暴露无遗。
2 月 9 日,谷歌宣布其最强大的机型 Gemini Ultra 免费使用,对 OpenAI 发起了沉重打击。 2月16日,谷歌发布了一款大型模型核弹双子座1号5. 将上下文窗口长度扩展到 100 万个代币,以挑战 OpenAI 尚未发布的 GPT-5。 随后在2月21日,谷歌发布了GEMMA Crazy Sniper Mate,一举登上了开源大模型的铁王座,给生成式AI的应用开发者带来了好消息,也代表闭源给OpenAI上了一课。
OpenAI 首席执行官 Sam Altman 曾私下表示,与谷歌相比,OpenAI 在算力上处于劣势。 无论是在算力、算法还是数据方面,谷歌都有明显的技术领先优势。
而这一次,谷歌确实有拳打脚踢 Meta 的风格。 尤其是这两年,头部科技公司一直在追我,而且打得极为激烈。 过去,有代表OpenAI推出的闭源GPT-4 Turbo模型,然后Meta大力攻击开源权重模型,留给谷歌的不多。
据 Google Developer X 副总裁兼总经理、Google 开发者关系负责人 Jeanine Banks 介绍,GEMMA 模型就像是 Google 开源 AI 开发技术历史的延续,从 Tensorflow 等工具开始,经过 Palm2 和 Alphafold 的演进,最后形成 GEMMA。
目前,摆在GEMMA面前的竞争对手并不缺乏,包括Meta的开源大型语言模型Llama 2,Mistral AI的7B模型,Deci的DeciM和Microsoft的Phi-2,以及类似的小型生成式AI模型,旨在运行在组织自己的硬件上。 可以说,窒息的谷歌正在四面楚歌。
接下来,就看刚刚从神坛上掉下来的Meta将如何接手。