在12月23日举行的2023华为云AI院长峰会上,中国科学院院士、清华大学人工智能研究院名誉院长张波发表演讲,分享了大模型的价值、面临的治理问题以及未来的发展方向。
中国科学院院士、清华大学人工智能研究院名誉院长张波致辞
大型模型向通用 AI 迈出了一步
大型语言模型可以学习和理解人类语言进行对话,也可以根据聊天的上下文进行交互,真正像人类一样聊天和交流,甚至可以完成撰写新闻、电子邮件、脚本、文案、翻译等任务。 对此,张波院士表示,它非常接近与真实人的对话,实现了行为主义所追求的目标,这是人工智能的一个里程碑式的成就。
张勇认为,与第一代AI的知识驱动模型和第二代AI的数据驱动模型相比,它突破了特定领域的三个细节,使用特定的模型,实现特定的任务,向通用AI(AGI)迈出了一步。
人工智能的治理需要基于模型和使用的角度
大模型的出现,将传统人工智能转变为生成式人工智能,为所有人工智能企业打开了一扇新的大门,也为人工智能产业的发展带来了新的机遇。
一是推动AI技术革命。 张解释说,信息科学技术之所以能迅速发展,是因为它在发展初期就奠定了坚实的理论基础,但目前还没有人工智能的理论,现有的人工智能模型和算法都是针对特定领域和特定任务的,很难建立通用理论。 然而,与第一代和第二代AI不同的是,大模型突破了三个细节,使得AI理论具有可解释性和鲁棒性,这将极大地促进AI技术的快速发展。
二是推动AI产业转型。 由于单一领域、单一任务的局限性,人工智能的应用和产业化总是局限于狭隘的领域。 然而,目前大模型已经从生成文本扩展到生成其他模态,并且可以使用通用模型来生成人类水平的图像、声音、**和**等的多样性。 大模型可以通过微调来满足不同领域和任务的需求,结合知识库等工具,可以大大拓展AI产业的发展空间和应用,并可能将AI产业带入一个新的发展阶段。
此外,大模型的开发也带来了一些挑战。 首先,大模型只在自然语言处理、编程等少数任务中具有通用性,在决策、游戏等领域能否通用性还有待研究。
其次,大模型使用下一个单词的自监督学习方法来学习和生成文本,这与人类文本学习和语言生成的原理完全不同。 这就使其存在三个本质缺陷:一是输出质量不一致、不可控,有犯大错的可能;其次,受提示词(输入词)影响较大,输出鲁棒性相对较差第三,没有自我认识,他们很难自己发现和纠正错误。
由于其缺点,大模型生成不符合道德、伦理和政治标准的内容是很常见的,需要通过AI对齐来解决,这是模型的治理问题。 同时,大模型输出的正确内容也可能被误用和滥用,因此需要对用户进行治理。 在人工智能发展过程中,需要管理好发展与治理的关系,确保人工智能的健康发展。
第三代人工智能的发展需要产学研的共同努力
虽然GPT只能以人机对话的形式呈现,存在各种局限性,但它也是向通用人工智能方向迈出的一步。 如何让AI走上泛化之路?“必须开发第三代人工智能。 ”
张认为,发展第三代人工智能的任务包括,首先,建立可解释的、稳健的人工智能理论。 其次,我们需要开发安全、可信、可控、可靠和可扩展的人工智能技术。 三是推动人工智能创新应用和行业发展。
要完成这项任务,张说,需要充分利用知识、数据、算法和计算能力,通过文本语义向量表示、多头注意力机制转换器、自监督学习三大关键技术,实现文本处理从过去单纯将文本视为数据,到处理文本内容和文本中包含的知识,是关键一步。
张波指出,第三代人工智能的发展还需要产学研三方共同努力,将基础研究、技术创新和产业化结合起来。