(中信集团报道,潘如晨)。
大模型:发展超出预期,未来追求高泛化能力AGI
人工智能经历了计算、感知和认知三个阶段,大模型引领了一个新的发展阶段。 2022 年 11 月,Openal 从 GPT-3 推出了 AL 对话系统 - ChatGPT5系列中的一个模型经过微调,创新性地加入了人类反馈强化习和相应的奖励模型,并在Azure AL超级计算基础设施上进行了训练,可以进行逻辑对话、编写**、编写脚本、纠正错误、拒绝不当请求等,效果超出大众预期。
大模型以通用人工智能(AGI)为最终目标,追求模型效应的高泛化能力。 一般的大模型要求模型在不重新训练的情况下理解用户提出的非结构化提示词,并根据需求理解实现稳定、正确的文本生成。 通用大模型的最终目标是通用人工智能(AGI),即在**类中仅靠人工智能可以完成的所有任务,这体现在训练数据和模型的特点上:参数多、体积大。
大模型高质量完成自然语言理解和生成任务,以“预训练+微调”模式支持应用场景。 大模型将逐渐超越大语言模型的范畴,形成具有多模态能力的大模型。 “预训练+微调”模式能够以较低的成本提升模型在特定行业的性能能力,成为行业内深度模型应用的通用模式。
大模型:海外竞争格局清晰,国内竞争在竞争
海外模式供应:OpenAI 打磨多模态能力,选择闭源路线,Meta 等选择开源路线加速追赶。 ChatGPT在全球范围内迅速传播,在短时间内完成了对企业和用户的市场教育,需求的爆炸式增长倒逼供给创新。 2023 年 9 月 25 日,OpenAI 正式发布 ChatGPT4V(ISION)版本,增加**输入和语音输出能力,ChatGPT 正式集成多模态能力12 月 6 日,谷歌发布了 Gemini 模型,该模型具有强大的多模态能力和结合逻辑推理能力。 海外大型模型市场已经形成了OpenAI相对清晰的格局,谷歌双龙+Meta开源追赶+垂直特色厂商。
国内模式供给:科技公司、初创企业等企业相互竞争,竞争格局仍需等待趋势明朗。 国内大型模型的参与者主要包括具有代表性的科技公司(腾讯等)、新兴初创企业(百川智能、创迈科技等)、传统人工智能公司(科大讯飞、商汤科技等)、高校科研院所(复旦大学、中科院等)。 虽然国产大模型的能力差异和易用性尚待市场检验,但互联网巨头在AI领域的长期投入已经形成了先发优势,移动互联网时代积累的自有数据和应用场景也构成了独特的壁垒。
大模型:目前,大模型与AGI还存在差距,多模态成为重要途径
目前,主流大语言模型与AGIs之间还存在较大差距。 但是,参考 DeepMind、OpenAI、Meta 等公司对 AGI 能力的定义,我们认为目前大型语言模型与 AGI 在各个维度上还存在较大差距,主要体现在性能和通用性、认知能力、工具使用能力、创造能力等方面。
多模态能力提升了模型各个维度的能力,将大模型提升为AGI。 目前,大模型主要是指大型语言模型(LLMs),输入和输出以文本的形式进行,而多模态大模型(MLLMs)可以输入或输出文本等模态,包括图像、音频、数据库等。 多模态能力全面提升了模型的全方位能力,成为大型语言模型向AGI迈进的重要途径。
大模型赋能千行百业,整体市场空间广阔
大规模模型能力赋能千行百业,打造繁荣的模型生态。 目前,大模型已展现出强大的文本生成能力和通用性,并已逐步应用于办公、企业管理、金融、教育等领域。 未来,大模型对图像的识别、理解、总结和推理能力将不断提升,模型可以将图像、视频、文本等信息有机地结合在一起,更智能地识别和响应用户需求,推动模型融入千行百业,实现规模化应用,围绕大模型形成繁荣生态。
公有云与私有化部署模式共同推进,探索多元化商业模式
公有云模式下的MaaS模式值得期待,采用“订阅+流量”的收费模式。 模型即服务(Model as a Service,MaaS)是一种新的商业模式,它将模型作为基础设施部署在公有云中,为下游用户提供模型使用和基于模型的功能开发支持。 行业模型可以使用MaaS模型来支持各种场景,实现模型生态的快速发展。 采用MaaS模式的行业模式主要采用“订阅+流量”的计费模式,用户通过基础订阅获得对模型能力的访问,并根据用户模型的流量使用情况确定模型服务**。
私有化部署模式,通过项目化系统收费,满足客户定制化需求。 考虑到模型规模和算力的限制,大模型难以实现终端部署,私有云模式下的分层部署将是实现模型应用的主要模式。 基于企业管理、市场定位、历史文化等方面的考虑,很容易让每个企业形成差异化的市场认知,进而提出不同的模式需求。
生成式人工智能的整体市场是广阔的
生成式人工智能整体市场广阔,有望突破2000亿元。 根据 Techn**IO 数据,全球生成式 AI 市场规模预计将从 2022 年的 112 亿美元增长到 2027 年的 459 亿美元,复合年增长率为 3265%,其中 31 项将在 2023 年实现65%的增长率;前瞻产业研究院数据显示,2024年我国生成式AI市场规模约为660亿元,预计2020-2024年复合增长率将达到84%,整体增长通道处于高速增长通道。 在大模型的催化下,前瞻产业研究院生成式AI市场规模有望在中短期内保持较快增长,预计2024年将突破2000亿元,大模型产业未来发展前景广阔。
一般场景:Office——大模型实现后效率提升最显著的核心应用之一
办公场景自然高度复杂,预计办公软件将是GPT实施后效率提升最显著的核心应用之一。 工作的本质可以概括为发现问题、解决问题、创造更多可能性,这既涉及独立的劳动生产,也涉及大量的内外部协作。 源自工作的办公场景自然是高度复杂的。 办公软件作为一种生产力工具,可以提高工作效率,并深度嵌入到G-B和C端用户的日常工作中。 在办公软件行业新技术突破尚不明朗的当下,ChatGPT出人意料的试用体验和强大的潜在前景提供了新的可能性,我们相信办公软件将是GPT实施后效率提升最显著的核心应用之一。
一般方案:Office - Microsoft Office 引领办公软件生成式 AI 革命浪潮
Microsoft Office 接入 GPT-4,Microsoft 365 Copilot 引领办公软件生成式 AI 革命浪潮。 Microsoft首席执行官纳德拉在达沃斯举行的 2023 年世界经济论坛上表示,Microsoft计划将包括 ChatGPT 和 Dall-E 2 在内的人工智能工具集成到其所有产品中。 当地时间3月16日,Microsoft发布了Microsoft 365 Copilot,将Microsoft Graph中的大型语言模型和用户数据(包括日历、电子邮件、聊天、文档、会议等)和Microsoft 365应用相结合,在保证数据安全的同时,实现打造最强的生产力工具,帮助用户专注于最重要的工作内容。 我们相信,Microsoft 365 Copilot有可能从根本上改变用户与计算机和AI技术的交互方式,让用户通过对话更高效、更便捷地完成工作任务,并充分利用组织内部的共享数据,满足AIGC在办公领域的应用期望。
通用场景:安全 – Microsoft 发布安全 Copilot,开启安全 AI 新征程
3月28日,Microsoft推出了Microsoft Security Copilot,这是大规模模型技术首次应用于网络安全。 Security Copilot 将 OpenAI 的更大模型与 Microsoft 的安全模型相结合,后者提供生成式 AI 功能,该安全模型由 Microsoft 的威胁情报功能和每天超过 65 万亿个信号的信息提供支持。 Security Copilot 功能包括:1) 通过基于自然语言的调查为事件响应提供分步指导2)捕捉可能遗漏的威胁,然后进行下一步威胁3)通过用户反馈和互动进行闭环学习和习,以适应企业偏好4) 与 Microsoft 安全终端产品集成,以提供基于安全信号的高效体验。我们认为,Security Copilot有望改变传统的网络安全防御流程,激发政府和企业的投资意愿,提高效率此外,继SOAR、SASE、零信任、XDR等新兴技术模型之后,Security Copilot有望引领网络安全技术和模式的创新。
纵向场景:教育——引领教育变革和教学方法,爆款产品层出不穷
教、管、学、考“都融入到教育的应用中。 “学习”和“测试”以学生为目标,将大模型的生成能力融入线下和线上,促进学生教学的质量和效率,数据驱动的科学准备和科学习可以在学习和习过程中使用大模型技术,提高学习和习的效率。 “教”与“管” 对于教育工作者来说,行业模型可以利用数据集成能力,实现科学的师生评价管理系统,利用大模型工具,实现具有学习习能力和知识整合能力的高效备课,将有效减轻教师的工作量,实现因材施教。
纵向场景:教育——科大讯飞模式在教育领域领先
龙头企业参与行业标准建设,科大讯飞在国产K12机型评测中全面领先。 2024年7月8日,“2023世界人工智能大会智慧教育主题论坛”在上海世博中心成功举办,华东师范大学、上海交通大学、科大讯飞、网易有道、腾讯、好未来等行业领先科研机构和企业参与编制《教育通用人工智能大模型标准系列》。该标准包含总体框架、信息模型、数据规范、评价规范、教学应用要求五大“团体标准”,全面评价教育模式的能力,为教育模式的应用提供参考和指导。 根据面向K12教育领域的智能教育可信评估平台(EDUTEP)的评估,国产大模型在K12教育领域的表现参差不齐,其中科大讯飞星火认知大模型在K12教育领域综合能力较强。
垂直场景:金融——彭博GPT引领金融模型,并论证垂直场景的可行性
彭博训练彭博GPT,是大模型在金融领域应用的重要一步。 AI大模型在少样本学习习、文本生成、对话系统等方面表现突出,但考虑到金融领域专有术语海量,彭博社基于Transformer架构开发了自己的大模型。 3月30日,彭博社发布了500亿参数彭博GPT的发展报告。 根据**,BloombergGPT对3630亿个代币的金融数据集和3450亿个代币的通用数据集进行混合训练,完全支持金融领域的NLP任务,与其他模型相比性能领先,在通用任务中具有竞争力。
基于迄今为止最大的专业训练数据集之一,BloombergGPT 采用混合训练方法。 彭博社成立于2024年,是全球最大的金融信息公司,终端客户遍布全球,包括交易员、投资银行、美联储、中央银行等官方或金融机构。 彭博社积累了大量的财经文件,如新闻、公告、报告等,以及庞大的财经数据集。 为了训练一个大型金融垂直模型,彭博社提取了一个包含3630亿个代币的金融数据集。 结合公开数据集,BloombergGPT 的训练语料库总计 7000 亿个代币。
纵向场景:财税——境外税务企业投资AI技术实现转型升级
在税务领域,Intuit也在不断整合AI技术,实现业务升级转型。 2023 年 6 月,Intuit 宣布与 OpenAI 合作,在其专有的 Intuit 生成式 AI 操作系统 (GenOS) 上开发 AI 驱动的应用程序,该系统将为客户提供基于 AI 的建议,包括通过 MailChimp 优化生成营销信息或发送电子邮件等杂务。 2023 年 9 月,Intuit 推出了 Intuit Assist,这是一款由 GenAI 驱动的新型助手,可与他们的大型金融语言模型一起运行,这些模型经过微调以解决税务问题、会计、现金流、个人理财和营销挑战。 Intuit Assist还将提供个性化、智能的建议,帮助消费者和小型企业客户做出明智的财务决策。 根据该公司的年度报告,Intuit 的平台提供 73 亿次 AI 驱动的客户交互,每天产生 580 亿台机器 ***,并为每个小型企业提供 400,000 个客户财务属性。
税务记账公司Kick是OpenAI最早投资的公司之一,在智能化方面优势明显。 Kick 成立于 2021 年,致力于采用人工智能优先的方法来创造免费添加的簿记产品体验。 KICK是OpenAI Fund的首批投资公司之一,它使用Plaid连接用户的银行和信用卡账户,在专家AI的帮助下,响应速度更快,对用户的收入和支出进行分类,自动化记账,并生成税务报告供用户报税。 Kick 在两年内积累了超过 5000 万个体经营者的观众。 在客户节省 10,000 美元之前,它是完全免费的,此后每个实体每月节省 99 美元。
本文仅供参考,不代表我们的任何投资建议。 如需使用这些信息,请参阅原始报告。 )
专题报告**:未来的智库]。