大模“套管”新宠 再见LLaMA,你好通益千文!

小夏 科技 更新 2024-01-28

在全球人工智能大潮中,一场大模型争夺战正在悄然展开。 这场名为“百人大战”的比赛,是国内外科技巨头与AI领域新兴势力的较量。 但在这场看似繁荣的竞争背后,却有一个不容忽视的事实:国内自主研发的大模型,大多只是西方开源模型的“壳”产品。

这种现象引发了一系列问题:我们真的在自己开发大型模型吗?国内AI领域的创新能力如何?是时候揭开这种粉饰的面纱,正视国内大型模型领域的真面目了。

全球大模型有闭源和开源两种主流开发路线。

以 OpenAI 的 GPT 系列为旗帜的闭源代表了商业化和专有技术的结合。 开源学派以Meta的羊驼系列模型为代表,象征着知识共享和技术的民主化。

国内AI领域反应迅速,一时间形成了“百模大战”的局面。 但是,这场战斗中涉及的大型模型中,有多少是建立在自主创新之上的?仔细观察不难发现,大多数所谓的自研大模型,其实都只是站在开源巨头的肩膀上,稍作调整的产物。

最典型的例子是 Kai-Lee 的“Yi”模型,它被发现只是对 Llama 的肤浅修改——只是改变了两个张量的名称。 这种抄袭式创新在国内AI行业并非孤例,而是普遍现象。 零和一事的做法,只是隐藏在国产大模型领域已久的一块遮羞布。

那么,这种“套管”现象的背后是什么呢?

它暴露了国家在原创创新方面的短板,虽然拥有巨大的市场和资金投入,但在核心技术的原创性上,我们似乎还在追赶的路上。 这种后续创新策略虽然能在短期内快速填补市场空白,但长期来看缺乏持续的创新动力。

同时,这也暴露了国内AI领域对“速见成效”的渴望。 在快速增长的市场的推动下,公司可能更倾向于采取快速复制和轻微修改的方法来抢占市场,而不是将时间和资源投入到深度技术创新中。 这种策略虽然能在短期内带来效益,但可能会牺牲长期的技术积累和行业的健康发展。

这种现象也反映出国内AI产业缺乏技术信心,在全球AI技术竞赛中,我们似乎更多的是追随者而不是领导者。 这种状况需要通过加强原始创新、技术积累和人才培养来逐步改变。

中国要想在大模型领域赶超美国同行,不仅要在闭源模型上赶超OpenAI的GPT-4,还要在开源领域赶超Meta的LLAMA。

2024年2月,Meta首次发布羊驼系列款。 在这个初始版本中,羊驼系列包括四种不同尺度的模型:7 亿、13 亿、33 亿和 65 亿参数。

7 月,Meta 发布了其最新的大型模型 Llama 2(Alpaca 2),其中包括 7b、13b 和 70b 三个参数变体,可免费用于商业或研究目的。

令人欣慰的是,国内厂商也在积极布局开源大模型领域。

近日,阿里云通益千问的 720 亿参数模型 QWEN-72B 宣布开源。 截至目前,同益千问已经开源了18亿、70亿、140亿、720亿参数的四大语言模型,以及视觉理解和音频理解的多模态大模型,实现了“全尺寸、全模态”的开源。

可以发现,在参数尺度上,阿里通义千文已经追平了Meta的羊驼2,参数尺度均为700亿。

另外值得关注的一点是,国内一些大型模型创业公司也在推出开源的大型模型。 例如7月,智浦AI开源CHATGLM-6B和CHATGLM2-6B;同月,百川智能开源了百川-7b和百川-13b。

我国拥有自己的开源大规模模型生态系统,对技术和产业的自主性和可控性具有深远的意义。

这些开源模型为中国科技公司提供了强大的技术基础,使他们能够更自信地在全球人工智能竞争中展示自己的实力。 这些开源模型的存在为中国研究人员和开发者提供了更多的选择和灵活性,推动了国内人工智能技术的快速发展和创新。 这也将有助于减少对外国技术的依赖,增强中国在关键技术领域的自主性和安全性。

中国在大模型领域的这一系列行动,不仅是在技术竞争中的闪亮亮相,也是对全球人工智能格局的重要贡献。 它不仅展示了中国科技公司在大模型领域的实力和创新能力,也为全球人工智能技术的发展和应用开辟了一条新的道路。

随着越来越多的中国公司和研究机构加入开源模型的竞赛,我们有理由相信,中国将在全球人工智能舞台上发挥越来越重要的作用。

在大模型领域,是开源还是闭源开发?

如果从商业角度来看,这不是一个好的判断。

但是,从人类整体利益的角度来看,开源的大规模模型路线必须更加“安全”。 主要表现为:

1、开源模式更容易被公众理解和监督。

开源模型的透明度使其成为技术民主化的典范,为广泛的研究人员和开发人员提供了易于理解和使用的工具,并允许公众参与监督。

这种开放的沟通和协作模式使最新的技术进步和知识能够迅速普及,确保社会各界对人工智能发展方向有知情权和发言权。 这种互动不仅推动了技术的快速进步,还有助于提高公众对人工智能技术的信任和接受度。

2. 避免AGI被科技巨头垄断。

大模式的最终目标是AGI,如此强大的力量绝不能被一个追求利润的商业公司所控制。

OpenAI的初衷是避免人工智能被谷歌垄断。 openai这个名字中的“open”本身就意味着开放和开源。 只不过现在OpenAI越来越封闭,这与其成立初衷背道而驰。

为了人类的整体利益,大模型至少应该保持一条开源的技术路线,作为人类的b计划。

3、开源大模型有利于大模型行业的繁荣创新。

开源模式为初创企业提供了一个强大的创新平台,降低了进入人工智能领域的门槛。 这些公司能够在现有先进模型的基础上,开发定制的改进和应用,从而快速实现技术创新。

这种模式不仅促进了技术多样性和应用创新,也为整个人工智能产业带来了活力和竞争力,加速了新技术的商业化进程,有力地促进了整个行业的健康发展和繁荣。

接下来,我们来看两个基于阿里通义千文开源模型的应用创新案例。

案例一:大模型+机器人=具身智能

随着智能技术的飞速发展,具身智能逐渐走进我们的生活。 浙江优路机器人科技,一家专注于大模型与具身智能相结合的初创公司,在这一领域取得了令人瞩目的进展。

创始人兼CEO陈俊波带领团队,依托自主研发的第二代具身智能模型,致力于将适应性强、泛化性强的通用智能大脑融入到每一台专业设备中。

优路机器人的愿景是让传统专业设备智能化,而这是具身智能时代最大的机遇。 中国有数以万计的传统专业设备制造商,他们迫切需要人工智能系统来升级现有产品。 优路机器人为这些设备提供了通用的人工智能大脑,不仅降低了针对每个型号单独开发智能系统的成本,还提高了产品的智能化水平。

优路机器人已成功将通益千问开源模型QWEN-7B集成到道路清扫机器人中。 这种智能清洁机器人能够通过自然语言与用户实时交互,理解并执行用户的指令。 这项创新不仅提高了机器人的效率,还增强了其在实际应用中的灵活性。

陈俊波解释说,他们选择通义千文模型有几个原因:首先,它是中国领域最好的开源模型之一;其次,提供了一个易于使用的工具链,用于快速实验和微调此外,量化模型没有损失,适合部署在嵌入式设备上最后,通益千文提供的服务反应灵敏,能够满足企业的多样化需求。

优路机器人的成功案例表明,开源大模型在具身智能领域的应用具有广阔的前景。 对于需要演进和适应新数据的应用来说,开源模型无疑是更好的选择。 这不仅推动了具身智能的发展,也给相关行业带来了革命性的变化。

案例2:心智模型

在现代社会,人们面临着越来越多的心理压力和挑战,心理健康成为公众关注的焦点。 针对这一需求,华东理工大学X-D Lab(Heart Beat Lab)团队,以闫欣为核心成员,致力于开发能够抚慰和改善当代人心的AI应用。

基于通益千文的开源模型,他们开发了一系列心理健康、医疗健康、教育考试等大型模型,包括心理健康模型MindChat、医疗健康模型Sunsimiao、教育考试模型GradChat等。

特别是MindChat,作为一种心理咨询工具,就像一个AI心理咨询师,为用户提供及时、安全、便捷的心理测评服务。 通过阿里云魔术社区,用户可以体验到这个模型的实际效果。 通过分析用户的文本内容和语气,MindChat可以与用户产生共鸣,为他们提供个性化的建议,甚至在必要时推荐真正的人类或心理专家进行干预。

这个项目起源于闫欣和她的老师在餐桌上关于整个社会的孤独和心理健康问题的对话。 基于此,他们决定开发一个大型心理模型,可以提供情绪出口并维持社会联系。

现在超过 200,000 人使用了他们的大模型,并提供了超过 100 万次问答服务帮助很多人解决了升学、考研、就业、职场等压力。

此外,团队还非常重视用户隐私保护,采用分布式架构对训练数据进行存储和分析,确保用户信息安全。 闫昕强调,选择开源模式是为了实现技术的可持续性和适应性,特别是在高度注重隐私的领域,如心理学和医学。 他们之所以选择通益千问模型,是因为它具有中国领域最好的智能性能,提供了易于使用的工具链,支持快速实验和微调,并量化了模型在部署中的效率。

最终,X-D Lab采用了开源和闭源相结合的方式,不仅回馈了开源社区,还以闭源API的形式为现实世界场景提供服务,确保了他们的技术既具有创新性,又能满足实际应用的需求。 通过这种方式,他们希望让大模型技术为更广泛的社会群体服务,尤其是那些在心理健康领域寻求帮助的人。

需要指出的是,开源模型是好东西,但有一个关键的前提,那就是开源模型本身就非常强大。 此外,这种开源模式将不断演进,推动整个开源生态系统的技术进步。 以千文将军的模型为例,仅开源了700亿参数规模的大模型,是不够的。 相信未来,我们会看到一些千亿级参数的开源大模型。

在探索人工智能的汪洋大海中,开源模式犹如一座灯塔,照亮了前进的方向。 这不仅是技术进步的象征,也是人类智慧共享的胜利。 开源大模型的出现,打破了知识和技术的壁垒,让更多的科研人员、企业乃至大众分享各代人的科技成果,共同推动人工智能领域的发展。

然而,我们也应该意识到,开源大型模型的旅程才刚刚开始。 未来,我们需要更多的创新、合作和智慧,不断提升这些模式的能力和适用性。

我们期待看到更强大、更智能的开源模式的诞生,这不仅是技术创新,更是人类探索未知世界的伙伴,携手共创更智能、更美好的未来。 让我们期待在这条充满挑战和机遇的道路上,见证人工智能带给世界的更多奇迹。

文字:一团烟和雨数据猿。

相似文章

    电视“套娃”收费终于成为历史,新的套娃不会酝酿

    电视是人们日常生活中不可缺少的一部分,它既是获取信息 娱乐休闲的重要渠道,也是传播文化 弘扬主流价值观的重要载体。但是,随着智能电视的普及和网络视听的发展,电视的充电模式和操作模式也发生了变化,这给用户带来了很多麻烦和不便。电视 套娃 收费,是指用户购买电视 机顶盒 网络接入等基本服务的基础上,还需...

    大型语言模型简介:基于 Amazon Bedrock 的概述

    本文介绍了基于 Bedrock 的大型语言模型,Bedrock 是亚马逊云科技推出的大型语言模型和生成式 AI 系列。大型语言模型是具有数十亿个参数 B 的预训练语言模型 例如 GPT Bloom Llama 该模型可用于各种自然语言处理任务,例如文本生成 机器翻译和自然语言理解。大型语言模型的这些...

    深化AIGC大模型多模态应用,AI Agent加速应用普及

    报告制作人 招商局 跟踪当前AIGC行业的发展,大模型的多模态发展进一步深化,尤其是文盛 能力的快速提升,将大大降低创作门槛,开拓C端创作的商业空间,以及游戏 影视制作等B端应用空间。在应用端,随着大模型能力的提升和大模型开发工具门槛的降低,AI智能体的构建能力有望快速下沉,这将推动AI应用的进一步...

    从ChatGPT Lite版看大模型的演进报告

    我今天分享的是 看ChatGPT大模型演进报告 简化版 报告制作人 鹏程实验室。精选报告 公开标题 全球行业报告库 ChatGPT的开发过程是一个相反的结论。语言生成能力 基础世界知识 上下文学习都来自预训练 d inci 即从亿个参数中存储大量知识的能力。遵循指令并泛化到新任务的能力来自扩展指令习...

    在自研AI通用模型的加持下,vivo蓝信千寻专属智能助手正式上线!

    近日,vivo正式宣布正式上线基于自主研发的蓝心大模型 BlueLM 的APP 蓝心千寻 公开版。该应用程序可在 Vivo App Store 和 iOS App Store 上免费获得,供 Android 和 iOS 用户使用 此外,更多的应用商店正在开发中。在开发者大会上,vivo发布了蓝心模型...