在十个人工智能应用中,五个是办公室代理,三个是AIGC,2%是恢复活力的数字人。 “那么,智能体是大型模型的AGI终局产品吗?
作者 |战斗
编辑|皮烨
制作人 |实业家
今年4月,斯坦福大学和谷歌的研究人员创建了一个“西部世界模拟”,其中25名智能体执行类似人类的日常行为,例如醒来、做早餐和上班、艺术家绘画和作家写作。
这些就是今天人们谈论的“AI代理实验”。 今年下半年,在中国,大型模型市场的参与者似乎正在转向AI Agent,这是一个清晰可见的AGI终局游戏。
一组数据显示,截至11月中旬,AI代理赛道共发生13起融资事件融资总额约735亿元企业融资平均为5654亿元人民币。
在国外,这个领域也很热门。 “至少有 100 个项目正在努力将 AI 商业化**,近 100,000 名开发人员正在构建自主代理。 外媒mattschlicht曾说。
为什么AI代理如此受欢迎?
关于AI Agent的想象力,一个备受赞誉的答案是:“大型语言模型只能制造一条蛇,而AI代理可以制造荣耀之王。 ”
成熟的AI代理可以显著降低软件生产成本。 未来,在编码工作流程中,会有很多代理编写的软件和测试解决方案,他们不追求长期的解决方案可重用性,可以使用和丢弃。 目前,一个软件行业巨头往往拥有数万甚至10万人,在拥有AI代理后研发和交付所需的人力和资金将大大减少。 它使软件能够灵活地满足更多的长尾需求。
此外,人工智能代理可以为LLM构建一个框架,以深入思考和分析,以做出更复杂和可靠的决策。
简而言之,正如Microsoft创始人比尔·盖茨所说,“谁主宰了私人助理经纪人,谁就大不了。因为你永远不会去搜索,你会很有生产力,你会去亚马逊。 ”
值得注意的是,在这场巨大的技术变革下,目前我们仍然没有体验到AI代理带来的红利和变化。 显然,AI智能体的开发仍然存在一些困难。
一些值得一问的问题是,目前国内外AI智能体的发展现状如何?AI代理的实施要点是什么?人工智能代理的未来会怎样?
1. AI代理的现状,海外与本地
目前,国内一些科技公司已经生产了几款知名的大模型,因此培育剂应用逐渐进入大众视野。
例如,将文心模型应用于智能搜索和自动驾驶阿里将通义千文模式应用于高德地图、优酷、盒马等产品。 华为将其盘古模型应用于智能气象、语音识别等领域。
一家名为Facewall Intelligence的初创公司推出了他们的AI代理产品chatdev,它可以在短时间内完成软件或小游戏的开发,用户需要做的就是向它提供一个需求。
值得注意的是,协同办公领域似乎是巨头做AI代理的“必去之地”。
例如,在钉钉魔杖套件中,钉钉AI产品能力汇集了聊天AI、文档AI、会议AI、易达AI、TeamBitionAI等腾讯会议中的“会议助手”功能提供了一些智能支持,例如会议纪要的自动摘要、转录和翻译智能工作平台如流搭载文信大模型,可实现智能创作、智能推荐等功能字节跳动旗下的办公软件飞书宣布推出智能AI助手“myAI”,旨在提升团队协作效率。
有投资者调侃**:在十个人工智能应用中,五个是办公室代理,三个是AIGC,2%是恢复活力的数字人。 ”这不仅是国内AI代理发展的现状,也是谷歌、Microsoft等国外一些公司也在将AI代理投入到协同办公场景中的事实。
事实上,在海外,AI智能体的概念从出现到爆发,经历了许多阶段。
在单智能体阶段主要针对不同领域和场景的特定任务开发和部署专用代理。 以 gptengineer 为例,给它一个需求,它就可以写出一个粗略的 **。
还有多代理合作阶段,没错具有不同角色的座席会自动协同工作以完成复杂的任务。 例如,在 metagpt 上,如果你让它做一个工单分析工具,它会将这个任务翻译成产品经理、架构师、项目经理等五个角色,模拟整个软件开发中的所有决策工作流程。
然而,随着Microsoft新工具Autogen的发布,AI Agent很快开启了新的篇章。
Autogen 允许多个LLM代理通过聊天解决任务。 LLM 代理可以扮演各种角色,例如程序员、设计师或角色组合,对话过程解决了任务。 这与 Metagpt 不同,Metagpt 定义了角色模型,而 Autogen 允许开发人员定义自己的代理,并允许他们相互交谈。
这是一个新的、创造性的代理框架。 在Autogen发布后的两周内,星星数量从390颗飙升至10K,并在Discord上吸引了5000多名成员。
Microsoft 在 AI Agent 中的布局较早。 Microsoft 365 Copilot 于 2023 年 3 月发布,引发了一种基于 LLM 的应用程序开发范式,称为 Agent。 目前,Microsoft CopilotStudio 已支持自定义 ChatGPT 助手无缝集成到 CRM、ERP、OA等日常办公系统中。
可以发现,Microsoft的AI代理能力主要来源于自身业务Autogen 更像是其自身基于业务的能力的向外发布,这与 OpenAI 不同。
OpenAI 开发的 GPTS,以及 GPT-4Turbo 和可定制的 AI Agent,这样每个人都可以构建自己的大型模型应用程序。 不少业内人士认为,超低的创作门槛和与App Store相同的商业模式,将使OpenAI能够快速构建GPTS生态。
OpenAI 提供了构建基本代理的能力,例如工具调用和知识库文件内存功能。 该产品的发布,让AI智能体进入了一个新的阶段,即为大家提供了构建自己的智能体的可能。
值得注意的是,目前,AI智能体架构和产品已经出现在零售、房地产、旅游、客户服务、人力资源、金融、制造等多个领域。
例如,零售领域的亚马逊 Alexa、Aktify、Regie人工智能等;房地产领域的Epique、PropertyPen、ListingCopy等;Agent4, EBI. 在客户服务领域AI、JasonAI、AIDE等;人力资源领域的自主聊天机器人、AiinterviewCoach、CareerSai等。
整体在底层技术、架构、具体产品应用等方面,AI代理比较完整。 OpenAI、Microsoft和谷歌等科技巨头拥有先发优势。 另一个可以看到的现象是,中国AI智能体的深度和广度还存在差距。
一个值得思考的问题是,代理实现的关键是什么?
二、代理落地的关键:
型?行业经验?还是运营商?
目前市场上的大多数代理,包括OpenAI推出的GPTS,实际上只是基于特定的知识库或专业数据构建聊天机器人。 这些代理主要用于问答互动,例如获取行业信息和报告。
然而在方案联动和操作方面还有很大的改进空间。 目前,我们无法直接使用GPTS来操作SAP或金蝶等ERP系统,因为这涉及到API管理软件的应用、授权、维护和连接。
对于企业来说,如果像GPTS这样的AI代理只用于知识答题,那么它们的作用将非常有限,就像玩具一样,因为它目前无法渗透到企业的业务流程中。
这背后有很多原因包括模特能力、行业经验、场景契合度等,都会影响代理的能力。
AI 代理需要具备感知环境、做出决策和执行适当操作的能力。 这些关键步骤中最重要的是了解提供给代理的内容,对其进行推理,计划它,做出准确的决策,并将其转化为可执行的原子操作序列,以实现最终目标。
目前,许多研究利用LLM作为AI智能体的认知核心,这些模型的开发为完成这一步骤提供了质量保证。 因此,基于 GPT-4 的代理行为更加智能。
但就目前而言,包括 GPT-4 在内的所有大型模型仍然需要改进。
“基础模型仍然存在很大的问题,我们必须等待更好的模型才能让AI代理真正落地。 ”一位身处大型模型技术一线的业内人士对实业家说。
然而,为了解决模型能力不足的问题,智璞AI和清华KEG提出了一种对齐智能体能力的微调方法AgentTuning,它使用少量数据对现有模型进行微调显著激发了模型的智能体能力,并能保持模型原有的一般能力。
AI Agent 的行业经验对其实施也至关重要。
如果一个**提出了某种不同的训练方法,OpenAI 内部的 Slack 会嗤之以鼻,因为这些都是我们玩的剩菜。 但是,当新的AI代理**问世时,我们将进行严肃而激动人心的讨论。 这是 OpenAI 联合创始人 Andrej Karpathy 最近的一次演讲。
总之基于大模型,我们能做出什么样的东西,还是要看行业经验,而这正是OpenAI等很多大模型巨头所缺乏的。
要知道,要引入AI代理进行流程优化,企业必须在成本控制、投资预算、效率、安全控制等多个方面经过严格严格的评估。 就是这样技术供应商需要提供平台级解决方案,而不仅仅是一心一意。
1. 为各个场景提供.AI代理自动化解决方案。
大型企业引入新的人工智能技术不允许任何试错成本,因此技术供应商提供的解决方案必须是具有行业专业知识术语和业务规则的真正代理数字员工。 只有这样标准化的AI代理才能纳入企业内部的建立,进行统一管理和调度。
例如,医疗行业的AI代理需要具备医学知识,能够理解和处理医疗数据。 金融行业的人工智能代理需要具备金融知识,并能够理解和处理财务数据。
AI代理的实现效果也受到应用场景的限制。 在旅行预订中,由于丰富的 API 等问题,AI 代理表现良好。 然而,在法律助理等场景中,由于新知识的频繁涌现和API的不完善,实际应用面临更多的挑战。
这从国内AI智能体在协同办公平台的增长中可以看出。
事实上协同办公平台本身拥有良好的API接口和插件系统,可以更轻松地将大模型集成到现有工具中。
此外,许多企业和组织都在使用协作办公软件,这意味着大模型可以快速触达大量潜在用户。 广泛的用户群可以加速大模型的迭代和优化过程,更好地满足用户需求。
还有大量的数据资源有助于提升模型的性能,丰富的场景也可以促进大模型技术的不断提升。
钉钉、飞书、企业微信在作为代理载体时,也有着不同的优势。 钉钉提供了完整的组织架构管理功能,可以轻松创建、管理和调整团队架构,使企业能够快速构建符合其需求的组织架构。
飞书强调实时协作和沟通,支持多人**编辑文档、一起讨论等功能,帮助团队高效完成协作任务。 其独特的集成使整个办公流程更加标准化。
企业微信与微信互通,借助微信庞大的用户数据和应用场景,其AI代理可以提供更加个性化、场景化的服务。
从这个角度来看,国内AI代理在协同办公领域集聚是很自然的。 而更重要的是找到一个合适的场景或载体来实现AI智能体。
然而,除了协同办公之外,还有很多其他载体可能更适合AI智能体的落地应用。
例如,智能客服、智能助手、RPA、CRM等。 具体来说,在智能客服方面,AI坐席可以自动回答用户的问题,处理投诉和建议,提高客户满意度和效率。 在智能助手方面,苹果的Siri、谷歌的谷歌助手、亚马逊的Alexa都是智能助手的代表。
在智能流程自动化方面,许多企业使用智能流程自动化工具,如UiPath、Blueprism等,对某些业务流程进行自动化。
在智能营销方面,许多营销平台都集成了 AI 代理,例如 Hubspot、Salesforce 等。 这些平台的AI代理可以通过数据分析和机器学习技术,提供精准的营销建议和**,帮助企业更好地了解客户需求,提高销售业绩。
总而言之模式能力是核心,行业经验是关键,载体是保障。 无论是模型能力、行业经验,还是运营商,都是AI Agent落地的关键。 值得注意的是,国内软件行业倒逼国内厂商打造定制化、个性化能力,验证了国内企业在技术落地方面的潜力,将进一步推动代理商落地。
3. AI Agent的终局是什么?
在文章的“西部世界模拟”部分,这些智能体可以与他人和环境交流(注意彼此的行为,发起对话或问候),反思这些观察结果(形成独特的个人观点),并制定每日计划。 他们有自己的记忆和目标,产生可信的个体和新兴的社会行为,而这些行为不是通过预先设计实现的。
例如,从用户指定的单个任务开始,即一个AI智能体想要举办一个情人节派对,AI智能体会自发地传播邀请,结识新朋友,互相预约参加聚会,并协调在合适的时间出现在派对上。
这是代理项目中的代表性应用程序。 人们之所以对这个项目感到惊讶,是因为智能体的交互是人类意想不到的。 在AI Agent爆发后的一段时间内,人们普遍认为,弥补大模型短板的AI Agent更具实用性,将成为大模型的重要落地方向。
随着代理的建设越来越简单,代理生态的成熟会让C端代理百花齐放,代理在用户面前会更加脚踏实地,引发新一轮的爆发。
但就目前而言,该途径的商业化存在许多问题。 以游戏场景为例,目前收费主要针对**游戏装备、**等方式。 然而,AI代理的价值并不能体现在这些固有的变现渠道中。 而从目前代理落地的效果来看,如果没有颠覆性功能,就不可能知道 C 端用户是否会为此付费。
更值得注意的是,随着C侧药剂的泛滥,其应用价值也随着边际效应而趋于变小。 换言之,AI智能体能否成为AI大模型从C端商业化爆发的最核心应用方向,还需要时间验证。 而即使成为未来C端商业化爆发最核心的应用方向,其“寿命”也不长。
事实是,AI代理的最终立足点可能在B端。
比尔·盖茨(Bill Gates)认为,代理作为下一个平台,将影响人们使用软件的方式以及编写软件的方式。 它更擅长为用户查找信息和总结信息,并且能够为用户找到最优惠的价格,并将取代搜索和电子商务,以及文字处理器、电子产品和其他生产力应用程序。 此外,搜索广告、广告社交、购物、生产力软件等,现在都是独立的,都将成为智能孪生的业务。 该代理将彻底改变打开应用程序的方式。
在这些变化到来之前,比起代理本身的影响,如何构建代理是更值得关注的。
在代理搭建平台上,企业或许可以搭建自己的RPA、CRM、办公OA等一系列管理软件软件厂商也可以基于此平台构建软件,为企业提供服务。
对于正在或即将进入AI代理领域的玩家找到切入点和良好的商业模式至关重要。
未来,AI智能体的发展将不仅仅局限于单一的智能,还将延伸到物智能与机器人的联动。
从群体智能的角度来看,TOC可以形成一个更大的基于社区的虚拟组织,其中每个人的代理都可以通过虚拟数据连接在一起另一方面,TOB可以形成虚拟组织和企业,不同的企业和员工可以通过代理融入网络。
最终整个社会将成为一个虚实结合的巨大网络,形成一个“智能网络”。 在这个网络中,不同的主体将提供更高的生产力,重塑整个生产关系,从而提高整个社会的生产力。
因此,人工智能智能体的发展前景非常广阔,它们将不断扩大其应用范围和影响力,为未来的社会发展带来巨大的变化和机遇。
时至今日,虽然AI Agent带来了很多想象空间,但仍存在很多疑问。 技术发展的道路充满了质疑和批评,技术变革对任何企业和个人来说都是一个机遇,关键是如何把握。