对于大型模型的应用来说,最重要的是逻辑推理能力MEET2024

小夏 教育 更新 2024-02-01

编辑部 从 meet2024 量子比特组织 | qbitai

一个法律案件的事实是否清楚,如何确定它与法律的关系,都是合乎逻辑的。 ”

在meet2024智能未来大会上,面墙智能联合创始人兼CEO李大海在谈到大模型落地法律行业时,强调了逻辑推理能力的重要性。

他认为,AGI革命是继蒸汽革命、电力革命和信息革命之后的第四次技术变革,而作为这一变革的核心技术路线,最重要的是大模型能够真正应用于生产过程的逻辑推理能力。

作为国内最早制作大型模型的团队,面墙智能在模型训练过程中,在逻辑推理上做了大量细致的工作,将其划分为归纳、演绎、时空等多个维度,并专门一一克服和完善。

据介绍,Facing Wall Intelligence 的 1000 亿多模态大模型 CPM-Cricket 可以对标 GPT-35级,同时逻辑推理能力非常突出。 在公开考试的逻辑推理测试中,CPM的总准确率达到6376%,甚至超过GPT-4的6188%。

然而,在各行各业、各企业都看到了大模型的应用前景和价值的同时,如何释放大模型的更大潜力,推动生产力的发展和转化呢?

李大海给出的答案是“大模型+代理”。

他将大型模型比作汽车的发动机,为汽车提供动力。 但如果你想制造一辆汽车,你还需要一个转向系统,你需要一个汽车底盘,以及包括内饰在内的所有其他部件,才能真正为用户提供完整的汽车产品。

李大海认为,在大模型引擎的基础上,需要叠加一系列上层技术,包括记忆能力、工具使用等,从而带来越来越广泛的应用和想象空间,而AI智能体(agent)就是这一系列技术能力的载体。

为了充分体现李大海在“大模型+智能体”轨道上的思考,Qubit在不改变原意的基础上,对演讲内容进行了编辑整理。

关于Meet Smart Future Conference:Meet Conference是由量子比特主办的智能技术领域的顶级商业峰会,致力于前沿技术的实施和行业应用。 今年共有数十家主流**及直播平台对MEET2024大会进行报道和直播,吸引了超过300万行业用户在线参会,全网**总数突破2000万。

演讲要点。 大模型应该能够真正应用到生产环境中,最重要的是逻辑推理能力,大模型是一场新的技术革命,可以与工业革命、电力革命、信息革命相提并论,大模型是底层引擎,如果你想做好代理, 需要引擎提供强大的动力输出,而大模型带来的最根本的变化就是人机关系的变化,未来两者会变得更加平等,未来世界将由智能体连接智能体世界(以下为李大海演讲全文)。

大型模型应以逻辑推理为核心竞争力。

Facewall Intelligence是由清华大学Thunlp实验室孵化的一家大型模型公司,我们的团队在公司正式成立之前就开始耕耘大型模型领域。 同时,我们还推出了OpenBMB的开源社区,在其中我们为大型模型制作了大量的开源技术和工具。

我们与清华大学和OpenBMB开源社区一起,构建了“一体两翼”的产学研大模型生态。

Face Wall Intelligence是国内最早制作大型模型的团队,2020年12月,我们的团队推出了全球首个中国预训练大型模型,名为CPM-1。 2023 年 11 月,我们发布了最新的 1000 亿多模态大模型 CPM-Cricket,可以对标 GPT-35个级别。

该模型的核心能力在于逻辑推理。

从成立之初,我们就意识到,要真正将大型模型应用到生产环境中,最重要的是逻辑推理能力。 因此,在模型训练的过程中,我们在逻辑推理上做了大量细致的工作,将其划分为归纳、演绎、时间、空间等多个维度,并专门逐一处理和完善。

为了检验模型在真实场景中的逻辑推理性能,我们模拟了大模型近三年公开考试的试题,结果显示CPM的整体准确率达到6376%,甚至超过GPT-4的6188%。在英语GMAT考试中,面对面智能大模型的分数是GPT-4的93%,非常接近,有些题型甚至超过了GPT-4。

最近,我们在与法律行业客户的合作中看到,用例非常关注并依赖于模型的逻辑推理能力。 案件事实是否清楚,如何判断事实与法律规定的关系,都是逻辑问题。 经过行业客户的评估,Facewall Intelligence大模型的逻辑推理性能最为突出,完全符合客户的实际需求。

今天,相信大模型的技术路线已经形成了整个行业的共识,但大家还是要思考,大模型到底是像web3这样的技术浪潮,还是十年一年的产业变革。

在我看来,以大模型为核心的AGI革命是第四次重大技术变革,可以与蒸汽革命、电气革命、信息革命相提并论,至少会持续20-30年。 再过几年,整个人类社会的生产和生活就会因为AGI革命的演变而发生翻天覆地的变化。

大模型+代理“,创造更多想象空间。

大型模型就像汽车的发动机,为汽车提供动力。 但如果你想制造一辆汽车,你还需要一个转向系统,你需要一个汽车底盘,以及包括内饰在内的所有其他部件,才能真正为用户提供完整的汽车产品。

因此,在大模型引擎的基础上,还需要叠加一系列的上层技术,包括记忆能力、工具的使用等,从而带来越来越广泛的应用和想象空间,而AI代理就是这一系列技术能力的载体。

智能体具有性格、智商、情商、感知、价值观和成长六个维度的典型特征,从而适应各种应用场景。 同时,为了让单个智能体发挥更强大的能力,它们还需要相互连接和协调,以处理和完成更复杂的任务。

事实上,在人类社会和自然界中都有群体智能的典型案例。 正如我们需要团队和组织将个人聚集在一起一样,自然界中的蜂群、蚁群和鱼类群也表现出比个体更高的智力水平。

基于这些思路,Facewall Intelligence从2023年6月开始布局“大模型+智能体”的技术路线和落地方向,在过去的几个月里,它发布了一系列以大模型驱动的AI智能体应用框架,我们称之为Facewall Intelligence的“AI智能体三驾马车”。

第一个是agentverse代理通用平台。

它构建了一个丰富的虚拟空间,其中定义了大量具有不同角色和专业能力的代理专家。

当用户发出请求时,代理会立即启动分组过程。 这是一个战略招聘过程,旨在确定哪些专家应该致力于特定任务。 一旦这些专家组成了一个团队,他们就开始就任务的细节进行谈判,并明确分工。 协商完成后,进入执行阶段,每个智能体根据自己的角色完成相应的工作,然后进行整合。

全程还有一个战略规划师,确保所有代理商齐心协力,形成一个最终产品,与用户需求进行对比,如果出现较大偏差,则迭代改进。 该框架的普遍性使我们能够在此基础上再接再厉,开展广泛的工作。

第二个是 Xagent 超级代理应用框架。

它是一种超级智能,可以分解复杂的任务,并根据动态指令进行任务分配。 它充当代理专家,根据人的需求进行规划并完成用户提出的目标。

在此计划的基础上,如果用户没有输入足够的信息,它将与用户交互并收集必要的信息。

在计划的每个步骤结束时,Xagent 还会在执行每个步骤后评估是否需要额外的工作,整个过程是一个动态结构。 在基准测试中,Xagent 的功能已经全面超越了 AUOTGPT。

例如,当你向 xagent 发送命令,“我有朋友周末来访,请为我推荐几家餐厅”时,超级代理不会立即列出一长串餐厅,而是会先询问你的喜好,询问你是否喜欢安静的环境或特定类型的饮食来了解你的需求。

它的第一步是与您互动,而不是立即执行任务; 接下来,根据您的回答进行餐厅搜索; 然后,整理搜索结果并提出几个方案,并进行利弊分析。 方案准备就绪后,将显示为可视化效果供你选择。 一旦您做出选择,它将通过连接的 API 直接为您预订餐厅。

这与我们通常熟悉的一步问答模式不同,它显示了座席提供的更好的质量体验。

三是chatdev多智能体协同开发框架。

它可以帮助我们建立一个虚拟的AI软件公司,设置具有不同角色的代理,如CEO、CTO、产品经理、程序员、设计师等,并通过一个称为“对话链”的通信网络将它们连接起来。

这些角色的交互过程与软件开发的瀑布模型保持一致,包括软件设计、系统测试和文档。

我们让这些AI智能体按照明确的分工进行合作,通过自然语言进行交流和互动,平均不到3分钟,平均成本不到3元,一个简单的软件开发就可以完成“比一杯可乐的时间和金钱还少”。

在这项工作中,我们还做了一个叫做HAI(Human-Agent-Interaction)的功能,它允许人们通过自然语言与智能体进行交互,这样智能体就可以获得足够的数据反馈,使自己的工作变得更好,这就是我们刚才提到的智能体成长的探索。

在短短两个多月的时间里,GitHub 上的 ChatDev 明星数量猛增,超过 1 颗80,000,连续多日位居热门排行榜第一。

大模型和智能体之间的耦合非常重要。

Facewall智能需要同时做大模型和Agent的

因为大模型是底层引擎,想要做一个好的智能体,就需要引擎提供强大的动力输出。

在实际应用中,如果发现智能体在哪些方向上可能工作得不够好,就需要在底层有实时反馈,以便能够及时修改和优化。 单纯依赖外部大模型有很多局限性,两者之间的耦合非常重要。

目前,我们在“大模型+代理”的技术路线上有很多场景。

在金融场景方面,面墙智能与国内龙头银行客户开展深度合作,通过大模型为其“智能财富助手”产品提供强大的语言对话和逻辑推理能力,解答用户在财务咨询等业务咨询方面的专业问题。

在法律场景上,面墙智能打造大型法律模型,结合代理技术,为法务人员提供强大的助手,协助提取案件要点、澄清事实、梳理法律条款等,大大缩短案件处理时间,提高效率。

中国每年大约有3000万起案件,但基层法律人员的数量非常有限。 经过访谈,我们发现,平均每个基层法务人员每天要处理3-4个案件,但案件复杂,处理时间会很长,需要诉讼的案件可能会被安排。

三四个月后。 在这种情况下,需要一种法律模式,以更好地帮助法务部门大大提高案件处理效率。

大模型带来的最根本的变化是“人机关系的变化”。 它使机器能够通过自然语言以与人类相同的方式相互交互,并进行逻辑思考和处理复杂的任务。

大模型的出现,会让机器和人类的关系更加平等,每个人都可以拥有一个AI伙伴,而“大模型+智能体”可以帮助人们创造一个更亲密、更了解你的生活智能伙伴。

我们相信,未来的世界将是一个由智能体联动的世界,即Facewall Intelligence提出的“智能智能网”的新时代。

大模型是第四次技术革命。 每一次技术变革都需要很长的时间:第一次工业革命花了几百年,信息革命花了50年左右,我相信AGI革命不会很短。

2023年只是元年,相信还有很多问题需要解决和突破,包括任务规划、多模态、更高层次认知、更小的模型。

希望行业内各界伙伴共同努力,克服和解决这些问题,让整个社会和人民的生活更加美好。

相似文章

    生活中最重要的是冷静

    人生是一段跌宕起伏的旅程,就像潮水的起伏,时而波涛汹涌,时而平静如镜。当谈到成功时,我们需要保持谦虚,不要对我们的胜利感到自满。当我们失败时,我们需要冷静地接受它,不要因为挫折而气馁。生命的价值在于平静。冷静的心态,让我们在沉浸的喧嚣中保持独立,不被外界的变化所动摇。俗话说,一根竹杖,一双草鞋,在风...

    2024年是大规模模型应用的春天吗?知乎“洞察对话”预测未来趋势

    Techweb 月日报道 年是大规模模型应用的春天?下一代固态电池将带来怎样的 电动未来 mRNA技术会给人类带来什么更大的想象空间?中国科幻小说会走向怎样的未来?在 社会时钟 的驱使下,现代人如何避免与自己为敌?年中国体育能否 返璞归真 年,中国经济增长模式应有所突破 人类世 即将到来,人类在其中...

    在世界上,认知是最重要的

    在世界上,认知是最重要的认知是指人们获取 处理 存储和应用信息的能力,是人们认识 理解和应对世界的基础。以下是表明认知重要性的一些原因 认知影响决策 人们的决策往往受到自身认知能力的影响。认知能力较高的人能够更全面地思考,权衡利弊,并做出更明智的决定。认知塑造行为 人们的认知能力决定了他们的行为方式...

    军队对国家的发展最重要吗?

    军队对国家的发展最重要吗?在军队对国家发展的重要性中,我们必须意识到军事力量在国家发展中的作用。但是,我们不能忽视其他因素对国家发展的贡献。虽然军事力量在某种程度上是一个国家发展的基石,但它并不是唯一的决定因素。本文将从多个角度探讨军队对国家发展的重要性。首先,军事力量确实在 和稳定中起着至关重要的...

    12 27日涨停盘,炒股最重要的是做到知行合一

    最近比赛环境不太好,看得多,动得少。昨日,有两块板,博恩集团和佳龙股份。如今,嘉隆在水下出售,博恩股价等待上涨。错过了董事会的门票 亚视光电 清远股份。代表主题小票趋势的沪深指数,相继被单方面 说明游戏环境不好。我们所做的二分之一模型通常影响有限。如何做好?关键是要掌握二分之一模式的核心要素,才能在...