最新开源大模型Gemma上线

小夏 科技 更新 2024-02-24

近日,一家领先的搜索引擎公司刚刚宣布推出其最新的开源大型模型项目。 这一次,一家领先的搜索引擎公司带来了其全新的开源模型系列——GEMMA,标志着开源领域大模型的重量级新成员。 GEMMA 模型通过其轻量级设计和商业可用性突破了可能的界限,并且比以前的 Gemini 模型更轻巧,完全免费,并且与模型重量一起开源。

如果您想了解更多,这里就是您要去的地方

此版本的 GEMMA 包括两个版本的模型权重:GEMMA 2B 和 GEMMA 7B,两者都提供预训练版本和带有说明的微调版本。 对于希望使用这些模型的用户,可以通过 Kaggle、Google 的 Colab Notebook 或 Google Cloud 访问它们。

人工智能工具现在更新得非常快,在获取最新的人工智能工具和信息方面往往存在滞后。 为了实时跟上最新的AI发展趋势,强烈建议在手机上安装一款名为“AI Classroom”的应用程序。 AI Classroom 汇集了 AI 行业的核心知识和最新进展,无论您是初学者 AI 爱好者还是希望加深专业技能的行业专家,总有一款适合您。 通过“AI课堂”,您可以轻松地从初学者转变为专业的AI专家,享受高效全面的学习之旅。

GEMMA还迅速在HuggingFace和HuggingChat平台上推出,使广大用户能够立即体验其生成功能。 尽管尺寸较小,但 GEMMA 在关键基准测试中的表现明显优于 LLAMA-2 7B 和 13B 等大型型号,以及流行的 Mistral 7B。

值得一提的是,GEMMA模型能够直接在开发人员的笔记本电脑或台式计算机上运行。 一家领先的搜索引擎公司不仅推出了这种轻量级模型,还提供了促进协作的工具和负责任地使用它们的指南。

GEMMA继承了构建Gemini模型的技术和研究成果,但以直接融入开源生态的方式出现,这与Gemini的策略截然不同。 一家领先的搜索引擎公司此举显然是希望吸引更多用户使用自己的人工智能模型,而不是转向 Meta 和 Mistral 等竞争对手。

在18个基于文本的任务中,GEMMA已经证明了其优于其他相同规模的开放模型的卓越能力,例如问答、常识推理、数学科学和编程。 特别是在数学和编码任务方面,GEMMA表现出色,并证明了其在这些领域的领导地位。

此外,某领先的搜索引擎公司也强调了GEMMA模型的安全和隐私保护措施,利用先进的过滤技术从训练数据中去除敏感信息,确保生成的内容安全可靠。 通过引入负责任的生成式 AI 工具包,一家领先的搜索引擎公司进一步指导开发人员如何安全地使用 GEMMA 模型,并通过兼容 Jax、PyTorch 和 TensorFlow 等主流框架,GEMMA 为 AI 社区提供了一个强大而灵活的工具来支持推理和微调。

GEMMA的推出不仅为AI研究和应用领域带来了新的可能,也进一步深化了开源和闭源AI技术路线之间的讨论。 随着GEMMA模型的不断优化和应用拓展,未来将对AI技术的发展和应用创新发挥更大的推动作用。

相似文章

    谷歌正式开通杰玛大模,多家车企挖走高河汽车

    年 月 日 昨晚今天早上开车中国 四部门联合发布 年全民数字素养与技能提升要点 国家互联网信息办公室 教育部 工业和信息化部 人力资源和社会保障部联合发布 年全民数字素养和技能要点 共提出六大核心领域项重点任务,旨在全面培养高层次交叉学科数字人才,缩小数字鸿沟,加大数字经济支撑力度,拓展智慧生活场景...

    中国开源模型荣登HuggingFace排行榜榜首

    月日消息,全球最大的开源大模型社区Huggingface近日公布了最新的开源大模型排行榜,阿里云通益千问击败llama等国内外开源大模型登上榜首。Tongyi Qianwen B荣登Huggingface公开法学硕士排行榜榜首 HuggingFace的Open LLM排行榜是目前大模型领域最权威的榜...

    AllenAI已经开源了有关大模型的所有细节! 数据代码,完全复制

    在人工智能领域,语言模型 LMS 的发展一直是推动自然语言处理 NLP 技术进步的核心力量。随着商业价值的增长,强大的语言模型越来越多地被封闭在专有接口后面,其训练数据 架构和开发细节通常不为人知。然而,这些细节对于科学研究至关重要,不仅关乎模型的偏差和潜在风险,而且是理解和提高模型性能的关键。有鉴...

    使用开源大语言模型作为LangChain代理

    开源大型语言模型 LLMS 现在已经达到了一定的性能水平,使其适合作为推理引擎来驱动代理工作流 在我们的基准测试中,Mixtral 甚至超过了 GPT .通过微调,可以很容易地进一步提高其性能。为因果语言建模训练的大型语言模型 LLMS 可以处理各种任务,但它们通常难以完成逻辑 计算和搜索等基本任务...

    APUS Model 3 0首款开源机型正式亮相

    据了解,APUS大型型号 玲丽在中国基准评价榜c eval中得分分分,中文能力超越GPT ,在所有参与模型中排名第三,与原开源模型基准测试LLAMA B相比。值得注意的是,大数据国家工程实验室由深圳大学牵头,国家信息中心 清华大学 腾讯科技共同建设。此外,中科院陈国良院士 国家重点研发计划项目首席科...