语言是人类最重要的交流和表达工具,也是人工智能(AI)系统的重要输入输出方式。 随着深度学习的发展,大型预训练语言模型(如GPT-3、T5等)已经能够在各种自然语言处理(NLP)任务上取得惊人的效果,甚至回答一些常识或专业问题。 然而,这些语言模型仍然存在一些局限性,例如缺乏逻辑推理能力、缺乏事实准确性、缺乏多样性和可解释性等。
为了解决这些问题,麻省理工学院(MIT)和IBM Watson AI实验室(MIT-IBM Watson AI Lab)的研究人员提出了一种使用语言来理解机器的新方法。 他们引入了一种策略,利用多个人工智能系统之间的讨论和辩论来得出最佳答案。 这种方法使这些大型语言模型能够提高对事实数据的依从性并提高决策质量。
具体来说,他们的方法包括以下步骤:
首先,给定一个问题,使用预先训练的编码器-解码器模型(例如,T5)生成初始答案。
然后,使用另一个预训练的编码器-解码器模型(例如,BART)来生成对初始答案的批评,即指出初始答案的缺点或错误。
然后,使用第一个模型来回应批评,即解释或修改最初的答案。
重复该过程,直到达成共识或超过预设的轮数。
最后,使用评估模型(例如,rouge)对最终答案进行评分,选择得分最高的答案作为输出。
他们方法的优势在于,它可以利用不同人工智能系统之间的交互和竞争来提高答案的质量和可信度。 通过讨论和辩论,人工智能系统可以相互制衡和纠正,相互补充和完善,相互激励和创新,从而得出更好的答案。 此外,他们的方法还可以使用语言来理解机器思维过程,通过生成和呈现对话来提高答案的可解释性和可理解性。
他们的方法已经在许多公开可用的数据集上进行了实验,结果表明,他们的方法可以显着提高答案的数量和多样性,并且他们的方法可以产生更多的事实和逻辑答案,以及比单一语言模型更具创造性和有趣的答案。
综上所述,使用语言理解机器是一种多智能体协作方法,它可以利用不同人工智能系统之间的讨论和辩论来提高答案的质量和可信度,也可以利用语言来理解机器的思维过程,以提高答案的可解释性和可理解性。 该方法为大型语言模型的应用和发展提供了新的思路和方向。