2024年,这座城市将到处都是人工智能代理。 上个月,他说他正在做AI Copilot,但这个月他说他是一名特工。 人工智能黑客马拉松现在很流行,一场比赛后至少可以看到几十个所谓的“人工智能代理”。
在大型语言模型爆炸的那一年,我们一直处于“概念陷阱”中,用嘴跑火车,谈论各种新术语:代理、副驾驶、rag、推理、接地、对齐、......说实话,我有点恼火,如果我没有这些话挂在嘴边,难道我不配从事人工智能吗? 更重要的是,当人们讨论一个术语时,他们是否在谈论同一件事?
例如,“AI Agent”:你做了一个自动写入小红书文案的 GPTS,说这是一个写入代理; 我做了一个基于大型语言模型的RPG游戏角色模拟器,并说这是一个游戏开发代理......这时候,有人说:这些都是AI辅助工具,充其量是Copilot(copilot),你看看斯坦福大学和谷歌的“斯坦福城”,25个AI相互交流协作,这才是真正的AI代理。 谁是对的? 什么是 AI 代理? 这其实就是我们目前的情况:人们在讨论一个AI概念时,缺乏一个共同的定义作为前提,认知上从来就没有“对齐”。
很多人把“AI智能体”当成一个大语言模型时代的新名词来讨论,却不知道“智能体”是一个硬核的人工智能概念。 我联系了一会儿,“代理”第一次作为人工智能术语出现是在 1995 年出版的经典人工智能教科书《人工智能:一种现代方法》中。 该书将人工智能定义为:“智能代理的研究和设计”。 这看,“智能体”至少在近30年前就被视为人工智能发展的终极目标。 发展人工智能是人类的初衷,即找到人类所有行为的“**人”。
许多人还忽略了这样一个事实,即“代理人”在经济学和组织行为学中也是一个众所周知的概念。 现代经济社会充斥着各式各样的“代理”,如大家熟悉的公关公司、旅行社等,其含义是代理代表一方行事和交易。 人工智能定义的“代理”的含义接近经济学和组织行为学——即人工智能作为一个人或一个组织的代表,进行特定的行为和交易,降低个人或组织工作的复杂性,减少工作量和沟通成本。
人工智能真的有能力成为“智能体”,依靠大型语言模型。 人工智能代理这个古老的概念在 2023 年变得流行,这绝非巧合。 OpenAI 安全团队负责人 Lilian Weng 撰写了著名的“LLM Powered Autonomous Agents”,这被广泛认为是 OpenAI 对“AI Agent”的官方定义。 本文将智能体定义为一组大语言模型(LLM)、记忆、任务规划(规划技能)和工具使用,其中LLM是核心大脑,记忆、任务规划和工具使用是智能体的三大核心组成部分。 值得注意的是,**智能体自主使用工具调用外部API,自主分解任务的子目标,自主建立思维链(COT),具有自我批评和自我反馈的能力它们都指向文章标题中的关键字“自主”,即代理自动化。
人工智能革命被广泛称为“第四次工业革命”,前三次分别是19世纪初的蒸汽机革命、19世纪末的电力革命和20世纪中叶的信息技术革命。 贯穿前三次工业革命的关键词是“自动化”。 蒸汽机和电力革命使工业生产周围的体力劳动自动化,提高了生产效率。 信息技术革命在进一步提高工业生产自动化程度的同时,也可以取代人类的一些脑力劳动。 如第四次工业革命的人工智能革命,一方面使工业生产的自动化更加彻底(如充满机器人和传感器的无人工厂),另一方面,它空前地打开了脑力劳动的自动化过程。 脑力劳动自动化的载体是AI代理。
从这个意义上说,关于什么是人工智能代理的争论有些无聊。 《斯坦福镇》基于一个开创性的实验,以此为坐标来判断一个AI应用是否是“智能体”,这并不能帮助AI智能体提高智能密集型工作的效率。 我的下一个重要论点是:AI Agent本质上是“人类行动的自动化”。 只要不是在人类的手动要求下完成任务,就像在ChatGPT对话框中输入提示,启动Office 365的“copilot”来完成每一项具体的工作,但又有一定的自主性甚至不完全可控性来完成任务,它就是AI代理。
现在比较尴尬的一个情况是:你可能已经看过不少于20条关于AI Agent的推文,你从来没有真正用过一个好的Agent,这大概是Agent作为一个新物种注定要经历的阶段。 长期以来,人们经常提到AI代理模型是具有GPT能力的AutoGPT。 然而,现在,美国和中国都有一些更好的人工智能代理的原型。 您可以借此机会安利...
首先是ChatGPT新推出的升级付费版——ChatGPT团队。 它为拥有个人ChatGPT账号的小企业内部的协作提供了一个“私域空间”,ChatGPT团队的用户数据不会用于对GPT模型进行反向训练,用户还可以在企业内部创建GPTS,让这些GPT协同工作。 老实说,我认为 ChatGPT 团队比 GPT Store 更重要、更有用。 现在的 GPT Store 太乱了,大多数 GPTS 都很粗糙,对话框告诉你它为你做了什么,你根本无法调用 API。 然而,随着ChatGPT团队在私有环境中的使用,GPT们可以更顺畅地调用彼此的接口,相互协作更加顺畅。 ChatGPT团队是全球最大的AI平台ChatGPT,迈向AI代理的第一步(毕竟ChatGPT已经拥有15万企业客户)。
第二个是智普AI的GLM模型代理(GLMS)。 清华的色彩鲜艳的智浦AI是国内最像OpenAI的公司,刚刚推出的GLM-4完全对GPT-4进行对标,在多项评测基准中达到了GPT-4的85%以上。 GLMS 是 GLM-4 的副产品,也是 GLM-4 模型功能的溢出。 GLM-4 的“所有工具”允许 GLM-4 根据用户的需求决定是否绘制、搜索、制作或编程问题——这本质上是一个 AI 代理。 与只追求通用性的Open AI不同,智普AI拥有一系列针对金融、医疗、教育等垂直行业的定制化部署服务,积累了一定的客户群和行业知识,这使得智普客户基于GLM-4部署GLMS代理更加合理、更容易。
三是“面墙智能”,也属于清华大学的背景: Facewall Intelligence 有自己的“Stanford Town”,它基于 Facewall Intelligence 的 ChatDev 框架。 但“小镇”不是一个虚拟社会,而是一个软件公司的AI版本。 不同的 AI 代理被设计为程序员、产品经理、测试工程师和设计师,他们可以相互协作并自力更生——就像每天在办公室里发生的事情一样。 Facewall Intelligence 的 ChatGPTdev 框架支持开发者构建自己的 AI Agent,结合单一智能和群组智能,让 AI Agent 成为每个员工都可以使用的办公自动化工具,可以“逃避”很多狗屎工作。 顺便说一句,ChatDev 框架的形成不迟于“斯坦福镇”的发布。对此最大的影响之一是原生 AI 应用程序开发的可能性——AI Agent 自动化了 AI 应用程序开发。
第。
第四和第五分别是钉钉和飞书的“代理”实践。 如果我们认为AI Agent是一个生产力工具,我们不能忽视钉钉和飞书上已经存在的亿万用户,数百万的政企组织,海量文档、会议纪要、沟通记录、多维度**和自建工具——这些工具让钉钉的“智能助手”和飞书的“智能伙伴”更容易化身到每一个使用它们的农民工的嘴里和大脑里, 并且可以部分自主地完成一些事务性的狗屎工作,比如工作总结、会议纪要、报销和差旅流程、对一件事的后续反馈,甚至可能帮助人们扯掉和撕掉 X。 作为钉钉和飞书的双重用户,我必须说:现在的钉钉智能助手和飞书智能伙伴还远未“好用”——这大概就是通益模式和云雀模式的锅了。 不过,在场景丰富、数据真实、用户数量等方面,钉钉的“智能助手”和飞书的“智能伙伴”更容易真正“使用”。 座席也对被使用有更好的了解。 一旦模式进展,钉钉和飞书的代理化将向前迈出一大步。 我再说一个激烈的论点——钉钉、飞书将成为AI代理在中国的重要产品。
在“简单”和“有趣”之间。我坚信,对于 AI Agent 来说,“易于使用”比“有趣”更重要。 它首先是一种生产力工具。 那些AI陪伴的纸上男女朋友,也有理解力和情感价值,但可以称得上是“特工”或“智能娃娃”,但并不“聪明”,因为他们不具备人类完成任务或任务的能力。 所以把AI Agent翻译成“agent”是不合适的,而是“intelligence**”。“*是AI Agent的经济和组织行为属性,也是其脑力劳动自动化能力的本质。
在刚刚结束的CES上,斯坦福大学著名人工智能学者李飞飞提出了一个重要的观点:应该明确的是,AI代理取代了人类的“任务”而不是“工作”。 在达沃斯论坛上,OpenAI首席执行官萨姆·奥特曼(Sam Altman)在面对“人工智能使人失业”的老盘问时,表达了更直接的观点:“人工智能取代了人们的工作方式,而不是工作本身。
我非常同意李飞飞和山姆·奥特曼两位老师的观点,即脑力工作者的工作是由特定的关键任务组成的,但这不是工作的全部。 目标设定、创造力、资源获取和分配、设定更高的目标、组织不同的任务、判断力、说服力和表现力、......我们的工作中还有很多更有意义的元素。 把流程的“任务”,事务和日常操作的工作留给代理,写几行例行公事**,发几封战邮件,少做机械操作**,调整ppt格式几次,少复制粘贴,亲自发起和批准一些例行的出差和报销流程,我们的工作应该更快乐,更有创意。
当然,AI代理的普及可能会让一些“白领”吃亏甚至丢掉工作,但它会大大提高聪明人的创造力、模式感、整体感和生产力,在很多岗位上——甚至在基层,提高工作效率,创造更多的生产力, 更重要的是,减少工作时间。
大约100年前,“八小时工作日”成为全世界的普遍标准。 人们每天只能工作八小时,这是自电力工业革命以来工人阶级斗争和生产力爆炸式增长的结果。 面对更高的生产力,人们有信心争取更少的工作时间、更高的工资和更多的学习、休闲和旅游消费时间。 然而,自从计算机革命以来,人类的生产力空前提高,为什么人们的工作时间没有进一步减少,而是在一些智力最密集的技术和互联网公司中增加呢? 996呢? 这里一定有什么问题吗?
让我再提出一个重要的论点:在未来,人工智能代理将有多聪明,看看它是否允许我们每天只工作四个小时。 那些重复的、基于过程的、反思性的、经验主义的、强化学习可以理解的,甚至是表演性的工作,都留给了AI Agent——它们可能是钉钉和飞书,可能是面向墙壁的智能研讨会,也可能是GLM和GPT的企业版。 无论如何,“我只想要结果”,因为我真的只想每天工作四个小时。
前不久,我和钉钉总裁叶军聊了聊,觉得钉钉有一种“改主意做新人”的紧迫感,特别想从“小学生天敌”和“压员工神器”的口碑中选择自己。 于是他们做了一个钉钉智能助手。 我问,这东西能让我们每天只工作四个小时吗? 他说:“如果可能的话,每天工作一个小时。 事后,我觉得叶先生还是有点不高兴的。 但是,他说AI Agent可以让更多的人成为自己的老板,我同意这一点。 经纪人帮助了你,你不会说自己傻。