本期,文信开发者说,邀请了DigiLifeform创始人张永成先生和青年开发者张艺墨先生,分享使用文信大模型制作AI PPT应用的全过程,以及应用的定位和使用。
1.如何创建一键生成PPT
AI PPT是一款在线工具,一键自动生成**信息并将其保存为PPT格式**,用户只需简明扼要地描述自己的需求,即可在2分钟内转换为高质量的PPT,包括标题,文本结构等。 该工具可以智能理解标题的语义,并为PPT每页的标题匹配相应的图片,最终生成**郁郁葱葱的PPT,并支持一键免费**。 对于用户来说,这是一款真正免费且无需注册的登录AI PPT生成器工具。
该工具生成的 PPT 的最后一页带有一个广告,用户可以随时删除该广告。 广告是基于AI算法,并基于用户输入的提示词来实现智能匹配,如用户输入来策划一场车展,将广告的智能匹配与汽车、展览、策划相关,实现精准的广告匹配。
二是大模型应用的整体业务流程框架。
首先,用户提交PPT制作需求,在此过程中,将输出具有Markdown结构的页面内容,主要是封面,页面标题和列表内容。 然后我们调用AI能力,智能理解标题并将其转化为关键词,然后调用开源图库生成关键词对应的**。 服务器将Markdown格式的内容解析为PPT所需的格式,开始匹配用户选择的模板样式,并结合AI PPT自主研发的广告精准匹配算法,在最后一页生成广告图片,用户可以直接在本地编辑和修改最终的PPT。
3.技术难点和门槛。
在AI PPT应用程序的开发过程中,有三个技术难点和门槛。
第一点是内容稳定性,大模型中最初返回的 Markdown,以及 SFT 对产品的训练在这个过程中缺失。 因此,我们通过AI在全行业高频输出PPT,比如输出10000个PPT形成数据库,根据PPT的结构和内容,我们通过AI挑选了近100个高质量的PPT,这100个标签是判断PPT是否高质量的标准。 完成上述过程后,我们让AI对10000个PPT进行标注,分析哪些PPT可以达到高质量标准,最后将这些高质量的PPT输入到模型中进行训练。
第二点是场景包容性,这意味着当用户使用来自许多不同场景的提示来生成PPT时,有时结果会大相径庭。 例如,当它使用相对简洁的内容时,当前模型的质量相当高,但如果使用更复杂的内容,则当前模型的内容输出主要是在原始内容的基础上进行处理,没有特殊的结构梳理。
第三点是简单与力量的矛盾。 目前市面上PPT生成产品较多,可以为用户提供深入的流程参与。 我们的产品定义是简单,在功能和简单之间找到平衡。 用户生成PPT可能只需要两三分钟,输出可以根据自己的要求进行修改,这是产品的一个定位。
DigiLifeForm创始人张永成和青年开发者张一墨分享了AI PPT应用开发的全过程,讨论了项目技术和产品中遇到的一些技术难点,帮助大家更好地了解了大模型应用开发的相关知识。 如果您想了解更多关于该技术的信息,可以参加文心开发者讲座课程**重播。 希望大家能在PaddlePaddle Galaxy社区学到更多习大模型的知识,基于大模型制作更多原生应用。