近日,一家领先的搜索引擎公司刚刚宣布推出其最新的开源大型模型项目。 这一次,一家领先的搜索引擎公司带来了其全新的开源模型系列——GEMMA,标志着开源领域大模型的重量级新成员。 GEMMA 模型通过其轻量级设计和商业可用性突破了可能的界限,并且比以前的 Gemini 模型更轻巧,完全免费,并且与模型重量一起开源。
如果您想了解更多,这里就是您要去的地方
此版本的 GEMMA 包括两个版本的模型权重:GEMMA 2B 和 GEMMA 7B,两者都提供预训练版本和带有说明的微调版本。 对于希望使用这些模型的用户,可以通过 Kaggle、Google 的 Colab Notebook 或 Google Cloud 访问它们。
人工智能工具现在更新得非常快,在获取最新的人工智能工具和信息方面往往存在滞后。 为了实时跟上最新的AI发展趋势,强烈建议在手机上安装一款名为“AI Classroom”的应用程序。 AI Classroom 汇集了 AI 行业的核心知识和最新进展,无论您是初学者 AI 爱好者还是希望加深专业技能的行业专家,总有一款适合您。 通过“AI课堂”,您可以轻松地从初学者转变为专业的AI专家,享受高效全面的学习之旅。
GEMMA还迅速在HuggingFace和HuggingChat平台上推出,使广大用户能够立即体验其生成功能。 尽管尺寸较小,但 GEMMA 在关键基准测试中的表现明显优于 LLAMA-2 7B 和 13B 等大型型号,以及流行的 Mistral 7B。
值得一提的是,GEMMA模型能够直接在开发人员的笔记本电脑或台式计算机上运行。 一家领先的搜索引擎公司不仅推出了这种轻量级模型,还提供了促进协作的工具和负责任地使用它们的指南。
GEMMA继承了构建Gemini模型的技术和研究成果,但以直接融入开源生态的方式出现,这与Gemini的策略截然不同。 一家领先的搜索引擎公司此举显然是希望吸引更多用户使用自己的人工智能模型,而不是转向 Meta 和 Mistral 等竞争对手。
在18个基于文本的任务中,GEMMA已经证明了其优于其他相同规模的开放模型的卓越能力,例如问答、常识推理、数学科学和编程。 特别是在数学和编码任务方面,GEMMA表现出色,并证明了其在这些领域的领导地位。
此外,某领先的搜索引擎公司也强调了GEMMA模型的安全和隐私保护措施,利用先进的过滤技术从训练数据中去除敏感信息,确保生成的内容安全可靠。 通过引入负责任的生成式 AI 工具包,一家领先的搜索引擎公司进一步指导开发人员如何安全地使用 GEMMA 模型,并通过兼容 Jax、PyTorch 和 TensorFlow 等主流框架,GEMMA 为 AI 社区提供了一个强大而灵活的工具来支持推理和微调。
GEMMA的推出不仅为AI研究和应用领域带来了新的可能,也进一步深化了开源和闭源AI技术路线之间的讨论。 随着GEMMA模型的不断优化和应用拓展,未来将对AI技术的发展和应用创新发挥更大的推动作用。