人工智能代理的任务是让我们每天最多工作四个小时

2024年，这座城市将到处都是人工智能代理。上个月，他说他正在做AI Copilot，但这个月他说他是一名特工。人工智能黑客马拉松现在很流行，一场比赛后至少可以看到几十个所谓的“人工智能代理”。

在大型语言模型爆炸的那一年，我们一直处于“概念陷阱”中，用嘴跑火车，谈论各种新术语：代理、副驾驶、rag、推理、接地、对齐、......说实话，我有点恼火，如果我没有这些话挂在嘴边，难道我不配从事人工智能吗？更重要的是，当人们讨论一个术语时，他们是否在谈论同一件事？

例如，“AI Agent”：你做了一个自动写入小红书文案的 GPTS，说这是一个写入代理; 我做了一个基于大型语言模型的RPG游戏角色模拟器，并说这是一个游戏开发代理......这时候，有人说：这些都是AI辅助工具，充其量是Copilot（copilot），你看看斯坦福大学和谷歌的“斯坦福城”，25个AI相互交流协作，这才是真正的AI代理。谁是对的？什么是 AI 代理？这其实就是我们目前的情况：人们在讨论一个AI概念时，缺乏一个共同的定义作为前提，认知上从来就没有“对齐”。

很多人把“AI智能体”当成一个大语言模型时代的新名词来讨论，却不知道“智能体”是一个硬核的人工智能概念。我联系了一会儿，“代理”第一次作为人工智能术语出现是在 1995 年出版的经典人工智能教科书《人工智能：一种现代方法》中。该书将人工智能定义为：“智能代理的研究和设计”。这看，“智能体”至少在近30年前就被视为人工智能发展的终极目标。发展人工智能是人类的初衷，即找到人类所有行为的“**人”。

许多人还忽略了这样一个事实，即“代理人”在经济学和组织行为学中也是一个众所周知的概念。现代经济社会充斥着各式各样的“代理”，如大家熟悉的公关公司、旅行社等，其含义是代理代表一方行事和交易。人工智能定义的“代理”的含义接近经济学和组织行为学——即人工智能作为一个人或一个组织的代表，进行特定的行为和交易，降低个人或组织工作的复杂性，减少工作量和沟通成本。

人工智能真的有能力成为“智能体”，依靠大型语言模型。人工智能代理这个古老的概念在 2023 年变得流行，这绝非巧合。 OpenAI 安全团队负责人 Lilian Weng 撰写了著名的“LLM Powered Autonomous Agents”，这被广泛认为是 OpenAI 对“AI Agent”的官方定义。本文将智能体定义为一组大语言模型（LLM）、记忆、任务规划（规划技能）和工具使用，其中LLM是核心大脑，记忆、任务规划和工具使用是智能体的三大核心组成部分。值得注意的是，**智能体自主使用工具调用外部API，自主分解任务的子目标，自主建立思维链（COT），具有自我批评和自我反馈的能力它们都指向文章标题中的关键字“自主”，即代理自动化。

人工智能革命被广泛称为“第四次工业革命”，前三次分别是19世纪初的蒸汽机革命、19世纪末的电力革命和20世纪中叶的信息技术革命。贯穿前三次工业革命的关键词是“自动化”。蒸汽机和电力革命使工业生产周围的体力劳动自动化，提高了生产效率。信息技术革命在进一步提高工业生产自动化程度的同时，也可以取代人类的一些脑力劳动。如第四次工业革命的人工智能革命，一方面使工业生产的自动化更加彻底（如充满机器人和传感器的无人工厂），另一方面，它空前地打开了脑力劳动的自动化过程。脑力劳动自动化的载体是AI代理。

从这个意义上说，关于什么是人工智能代理的争论有些无聊。《斯坦福镇》基于一个开创性的实验，以此为坐标来判断一个AI应用是否是“智能体”，这并不能帮助AI智能体提高智能密集型工作的效率。 我的下一个重要论点是：AI Agent本质上是“人类行动的自动化”。 只要不是在人类的手动要求下完成任务，就像在ChatGPT对话框中输入提示，启动Office 365的“copilot”来完成每一项具体的工作，但又有一定的自主性甚至不完全可控性来完成任务，它就是AI代理。

现在比较尴尬的一个情况是：你可能已经看过不少于20条关于AI Agent的推文，你从来没有真正用过一个好的Agent，这大概是Agent作为一个新物种注定要经历的阶段。长期以来，人们经常提到AI代理模型是具有GPT能力的AutoGPT。然而，现在，美国和中国都有一些更好的人工智能代理的原型。您可以借此机会安利...

首先是ChatGPT新推出的升级付费版——ChatGPT团队。 它为拥有个人ChatGPT账号的小企业内部的协作提供了一个“私域空间”，ChatGPT团队的用户数据不会用于对GPT模型进行反向训练，用户还可以在企业内部创建GPTS，让这些GPT协同工作。老实说，我认为 ChatGPT 团队比 GPT Store 更重要、更有用。现在的 GPT Store 太乱了，大多数 GPTS 都很粗糙，对话框告诉你它为你做了什么，你根本无法调用 API。然而，随着ChatGPT团队在私有环境中的使用，GPT们可以更顺畅地调用彼此的接口，相互协作更加顺畅。 ChatGPT团队是全球最大的AI平台ChatGPT，迈向AI代理的第一步（毕竟ChatGPT已经拥有15万企业客户）。

第二个是智普AI的GLM模型代理（GLMS）。 清华的色彩鲜艳的智浦AI是国内最像OpenAI的公司，刚刚推出的GLM-4完全对GPT-4进行对标，在多项评测基准中达到了GPT-4的85%以上。 GLMS 是 GLM-4 的副产品，也是 GLM-4 模型功能的溢出。 GLM-4 的“所有工具”允许 GLM-4 根据用户的需求决定是否绘制、搜索、制作或编程问题——这本质上是一个 AI 代理。与只追求通用性的Open AI不同，智普AI拥有一系列针对金融、医疗、教育等垂直行业的定制化部署服务，积累了一定的客户群和行业知识，这使得智普客户基于GLM-4部署GLMS代理更加合理、更容易。

三是“面墙智能”，也属于清华大学的背景： Facewall Intelligence 有自己的“Stanford Town”，它基于 Facewall Intelligence 的 ChatDev 框架。但“小镇”不是一个虚拟社会，而是一个软件公司的AI版本。不同的 AI 代理被设计为程序员、产品经理、测试工程师和设计师，他们可以相互协作并自力更生——就像每天在办公室里发生的事情一样。 Facewall Intelligence 的 ChatGPTdev 框架支持开发者构建自己的 AI Agent，结合单一智能和群组智能，让 AI Agent 成为每个员工都可以使用的办公自动化工具，可以“逃避”很多狗屎工作。顺便说一句，ChatDev 框架的形成不迟于“斯坦福镇”的发布。对此最大的影响之一是原生 AI 应用程序开发的可能性——AI Agent 自动化了 AI 应用程序开发。

第。

第四和第五分别是钉钉和飞书的“代理”实践。如果我们认为AI Agent是一个生产力工具，我们不能忽视钉钉和飞书上已经存在的亿万用户，数百万的政企组织，海量文档、会议纪要、沟通记录、多维度**和自建工具——这些工具让钉钉的“智能助手”和飞书的“智能伙伴”更容易化身到每一个使用它们的农民工的嘴里和大脑里，并且可以部分自主地完成一些事务性的狗屎工作，比如工作总结、会议纪要、报销和差旅流程、对一件事的后续反馈，甚至可能帮助人们扯掉和撕掉 X。作为钉钉和飞书的双重用户，我必须说：现在的钉钉智能助手和飞书智能伙伴还远未“好用”——这大概就是通益模式和云雀模式的锅了。不过，在场景丰富、数据真实、用户数量等方面，钉钉的“智能助手”和飞书的“智能伙伴”更容易真正“使用”。座席也对被使用有更好的了解。一旦模式进展，钉钉和飞书的代理化将向前迈出一大步。我再说一个激烈的论点——钉钉、飞书将成为AI代理在中国的重要产品。

在“简单”和“有趣”之间。我坚信，对于 AI Agent 来说，“易于使用”比“有趣”更重要。 它首先是一种生产力工具。那些AI陪伴的纸上男女朋友，也有理解力和情感价值，但可以称得上是“特工”或“智能娃娃”，但并不“聪明”，因为他们不具备人类完成任务或任务的能力。 所以把AI Agent翻译成“agent”是不合适的，而是“intelligence**”。“*是AI Agent的经济和组织行为属性，也是其脑力劳动自动化能力的本质。

在刚刚结束的CES上，斯坦福大学著名人工智能学者李飞飞提出了一个重要的观点：应该明确的是，AI代理取代了人类的“任务”而不是“工作”。在达沃斯论坛上，OpenAI首席执行官萨姆·奥特曼（Sam Altman）在面对“人工智能使人失业”的老盘问时，表达了更直接的观点：“人工智能取代了人们的工作方式，而不是工作本身。

我非常同意李飞飞和山姆·奥特曼两位老师的观点，即脑力工作者的工作是由特定的关键任务组成的，但这不是工作的全部。目标设定、创造力、资源获取和分配、设定更高的目标、组织不同的任务、判断力、说服力和表现力、......我们的工作中还有很多更有意义的元素。把流程的“任务”，事务和日常操作的工作留给代理，写几行例行公事**，发几封战邮件，少做机械操作**，调整ppt格式几次，少复制粘贴，亲自发起和批准一些例行的出差和报销流程，我们的工作应该更快乐，更有创意。

当然，AI代理的普及可能会让一些“白领”吃亏甚至丢掉工作，但它会大大提高聪明人的创造力、模式感、整体感和生产力，在很多岗位上——甚至在基层，提高工作效率，创造更多的生产力，更重要的是，减少工作时间。

大约100年前，“八小时工作日”成为全世界的普遍标准。人们每天只能工作八小时，这是自电力工业革命以来工人阶级斗争和生产力爆炸式增长的结果。面对更高的生产力，人们有信心争取更少的工作时间、更高的工资和更多的学习、休闲和旅游消费时间。然而，自从计算机革命以来，人类的生产力空前提高，为什么人们的工作时间没有进一步减少，而是在一些智力最密集的技术和互联网公司中增加呢？ 996呢？这里一定有什么问题吗？

让我再提出一个重要的论点：在未来，人工智能代理将有多聪明，看看它是否允许我们每天只工作四个小时。那些重复的、基于过程的、反思性的、经验主义的、强化学习可以理解的，甚至是表演性的工作，都留给了AI Agent——它们可能是钉钉和飞书，可能是面向墙壁的智能研讨会，也可能是GLM和GPT的企业版。无论如何，“我只想要结果”，因为我真的只想每天工作四个小时。

前不久，我和钉钉总裁叶军聊了聊，觉得钉钉有一种“改主意做新人”的紧迫感，特别想从“小学生天敌”和“压员工神器”的口碑中选择自己。于是他们做了一个钉钉智能助手。我问，这东西能让我们每天只工作四个小时吗？他说：“如果可能的话，每天工作一个小时。事后，我觉得叶先生还是有点不高兴的。但是，他说AI Agent可以让更多的人成为自己的老板，我同意这一点。经纪人帮助了你，你不会说自己傻。

人工智能代理的任务是让我们每天最多工作四个小时

相似文章

谁让我们这么累？

岁月不生，四季流淌。让我们珍惜每一刻，不留遗憾

让我们摆动双桨，看看它在哪里

谁给了梅西这么大的勇气，让我们给他一首很酷的歌

让我们接受孩子的平庸

人工智能代理的任务是让我们每天最多工作四个小时

相似文章

谁让我们这么累？

岁月不生，四季流淌。 让我们珍惜每一刻，不留遗憾

让我们摆动双桨，看看它在哪里

谁给了梅西这么大的勇气，让我们给他一首很酷的歌

让我们接受孩子的平庸

岁月不生，四季流淌。让我们珍惜每一刻，不留遗憾