今天分享的是:AI大模型系列深度研究报告:AI大模型专题:教育大模型研究报告
中国教育科学院数字教育研究所的报告)。
报告总数:页。
专题报告**:人工智能学院
当前,新一代人工智能技术的快速发展引起了全球的广泛关注。 2023 年 11 月,OpenAI 举办了首届开发者大会,发布了 GPTS 和最新的开发技术,让每个人都可以通过自然语言人机对话创建自定义的大模型。 与此同时,阿里巴巴、华为、科大讯飞等国内科技公司陆续发布了多款人工智能模型,提供中国解决方案。 未来,AI模式将深度融入各领域、各环节,赋能千行百业智能化升级,助力社会生产力跨越式发展。 从教育的通用模式到特殊模式,是人工智能模型技术深化和发展的重要趋势。 这不仅仅是基于通用大模型的微调和优化,而是基于教育场景和开放模型架构的重大创新。 教育专用模型是指基于通用模型,以多种教育数字化应用为驱动,通过统一的交互式对话界面,为教师、学生和社会学习者提供专业能力的多层次开放技术架构。 它拥有丰富多样的教育专业知识,并在其应用上不断升级。
“大模型”是指具有数十亿到数百亿或更多可训练参数的 AI 模型,是深度学习、GPU 硬件和大规模数据集等技术组合的产物。 大模型的强大能力,本质上是深度学习中“量变导致质变”的结果。 当模型参数的数量达到一定规模时,模型精度就会发生质的飞跃,这一过程称为“涌现能力”,即自动从原始训练数据中学习并发现新的、更高层次的特征和模式的能力。 这些能力突出地表现在理解一般用户意图的能力、在大范围上下文中持续对话的能力、智能纠正交互的能力、编辑、分类和总结内容的能力、生成新内容的能力以及多模态的能力。
教育模式作为重点研发领域之一,是大模型技术、知识库技术和各种智能教育技术的集成应用,将在教育过程中训练和形成新的教育场景,实现人类学习和机器学习的双向建构。 目前,教育专用大模型主要有两条技术路线:一是直接调用通用大模型,通过微调或提示学习使其具备一定的专业能力; 二是利用教育领域的专业数据,训练解决教育任务的大型模型。 两条技术路线都取得了一些进展,但实施效果仍有待提高。 由于缺乏足够的专业数据训练,知识深度不足,智力薄弱,难以灵活应对复杂多变的教育任务。
如何开发教育大模型,解决方案在于两条技术路线的整合。 这不是一个简单的附加组件,而是通过建立一种新的开放技术架构,系统地整合了通用问题解决能力和教育特定问题解决能力,实现了技术突破。 具体而言,需要将教育领域的通用大模型和专业数据相结合,打破数据孤岛,通过开放的数据接口,不断从常态化的教育应用中获取数据。 要以专家知识库作为大模型的补充,自觉地将教育教学中的学科知识和各种规律“传授”给大模型; 要把各类智能教育技术进行整合和应用,把已经发展起来的各类智能教育技术整合到教育专用大模型中来。
大型模型在口语练习、数学学习、情感分析和个性化推荐方面为教育带来了巨大的潜力和可能性。 我们梳理了教育专业大模型的5个典型应用案例,并对其发展背景、应用场景、设计特点进行了深入分析。
从应用场景来看星火语言伴侣主要用于语言学习,支持多语言文本、语音和**的实时翻译,并可纠正语法错误并提供口语陪练。 EMOGPT 用于提供心理健康服务、识别和响应用户情绪,并提供持续的心理支持。 MATHGPT面向全球的数学爱好者和研究机构,提供解决问题和解决问题的算法,以支持用户的数学问题解决和实践。 智海三乐用于AI专业教育,提供搜索引擎、计算引擎、本地知识库等功能,支持智能答疑和试题生成。 Khanmigo 通过对话式 AI 聊天机器人为学习者提供个性化的学习解决方案,同时还支持职业规划服务、教学方法辅导优化等。
从技术进步来看教育专用大模型在模型性能、应用场景、技术特点等方面均表现出优势,覆盖大部分学科,主要聚焦自主学习场景,包括知识问答、语言学习、学习指导、教学辅助等。 在技术路线上,“通用+微调”的路径已经证明了其有效性,许多技术方案都是基于通用大模型,通过指令微调等方式实现对特定学科知识的有效解答。
从现有的缺点来看现有的教育大模型在准确性、教学内容多样性、核心教育场景支持、学习者多样性的包容性等方面仍存在局限性,错误率高,缺乏共情理解能力,主要集中在学科知识教学和应试教育情境上,在跨学科学习、学生综合能力和高阶思维培养方面仍存在不足。 主要围绕支持自主学习,如何在真实课堂、同伴协作、混合教学等场景中充分发挥大模型的作用尚未得到有效探索。
总之,大模型在教育领域的应用取得了显著进展,但仍面临现实问题,需要进一步提升训练数据的质量和规模,特别是要将先进的教育理念、深入的教育知识以及教育核心场景的真实需求深度嵌入到技术设计中, 并根据用户反馈进行多轮迭代,形成更加智能、灵活的教育大模型。
大型教育模型的案例研究。
报告总数:页。
专题报告**:人工智能学院