近日,一年一度的“科大讯飞A展i.特斯特斯科技创新中心研发团队同台竞技1000余个参赛团体,最终凭借NLP(自然语言处理)自监督引擎,在比赛ChatGPT生成的文本检测赛道中获得第二名。 目前,该引擎已应用于特瑞斯科技创新中心第9章AI算法赋能平台,为智能工厂等垂直场景下的经验模型转化提供优化支持。
特斯联科技创新中心研发团队荣获“科大讯飞A”。i.在开发者竞赛“ChatGPT生成的文本检测轨道”中获得第二名。
iflytek a.i.开发者大赛由科大讯飞发起,中国信息协、国家智能语音创新中心协办,旨在推动人工智能前沿科研创新成果转化,培养人工智能行业优秀人才,为构建繁荣的人工智能生态圈贡献力量。
在过去的一年里,人工智能在NLP领域取得了长足的进步,尤其是以ChatGPT为代表的生成模型的出现。 通过学习习大量的文本数据,生成式大模型具有生成高质量文本的能力,这引发了一系列关于文本真实性的讨论——传统上,我们使用语法错误和逻辑不连贯等特征来区分机器生成的文本,但随着生成模型的不断改进,这些特征变得越来越难以区分。 本次开发者大赛也是从此开始的,参赛队伍需要区分ChatGPT生成的文本和大赛通过算法提供的人工生成的文本。
针对上述挑战,特斯特属科技创新中心研发团队利用自主研发的NLP自监督引擎,对事件提供的加密文本进行预训练,提高模型对加密文本的适应性。 最终,基于预训练的NLP自监督引擎,团队在评估数据集上实现了99的准确率93%,获得赛事第二名。
NLP 自监督引擎页面。
本次大赛有效验证了特斯科技创新中心打造的NLP自监督引擎的普适性和鲁棒性。 事实上,该引擎已在实际场景中得到广泛应用。 以制造场景为例,在将“师傅”的个人经验转化为数学模型时,需要基于NLP分类模型对他的经验进行处理。 在这个过程中,对经验文本的理解和抽象尤为关键。 为了让工厂普通信息人员能够基于数据自主完成算法调优,科创中心采用九章算法赋能平台,基于Chinese-bert-wwm进行模型改进,对策训练SWA、多样本、dropout,结合NLP自监督引擎,提供低**甚至无**的算法孵化能力。
特斯科技创新中心于2024年正式成立,部署在武汉、德阳泾阳、中江县开州等地,旨在将学术生态与产业生态充分融合,一方面让学术生态基于产业数据开发相应的预训练模型另一方面,以共享的方式为行业从业者提供AI所需的算力、数据、算法模型,让各种规模、不同AI基础的企业,通过学术机构开发的模型,以低质量、模块化的生产模式,实现自主知识产权算法的孵化和成熟算法的调用。
德阳景阳科技创新中心自开业一年来,先后迎来了10余家企事业单位,涵盖能源、金融、制造等领域中江凯州科创中心为多家本土制造工厂提供核心算法孵化支持,协助其建立和建设数字化应用团队,帮助其实现产品和运营的数字化智能化武汉科技创新中心专注于建筑和个人服务领域的人工智能赋能。
依托科技创新中心,特斯联期望不断夯实自身产研能力,为行业提供更多低门槛工具,让越来越多的领域、企业、个人从智能科技中受益。