1月30日,科大讯飞举办Spark认知模型V35、升级大会上,七大核心能力全面提升,在数学、语言理解、语音交互等方面超越GPT-4 Turbo。 此外,Spark语音模型也同台亮相,首批37种主流语言超越OpenAI Whisper V3效果。
科大讯飞Spark v35 不仅在语义理解、指令遵循和多轮对话的演示中,而且在情感感知和拟人化综合方面。 既能帮助用户带来解决方案,又能带来“冷热知彼”的朋友的情感互动,超高拟人化让大模型更加人性化。
科大讯飞Spark v35、年终总结计划、汇报PPT、活动策划、政策问答等任务“触手可及”。 基于此,科大讯飞推出了一款可以一键快速自动生成文档和PPT的办公产品——科大讯飞智文,该产品的主要功能包括一键生成文档、AI写作助手、多语言文档生成、AI自动绘图、多种模板选择、语音备注功能。
大模型也可以结合外部知识进行合理扩展,从而实现“并排参考”。 元素提取、问题生成等能力的进步,可以帮助大家通过测试和学习形成思维闭环,在越来越多的服务领域和学习知识场所产生更多好用的智能体。
新的大规模模式提高了数智化生产力,可以更好地帮助提高民生急需的科研、产业等领域的质量和效率。 随着数学和推理能力的提升,多模态能力逐渐提升,科大讯飞星火v35、在视觉问答、联想推理等方面达到“高分”回答,理解更准确,表达更好。
此外,科大讯飞此次还推出了星火智能黑板,它拥有四大功能:多模态理解推荐、全自然交互、虚拟人辅助学习、智能录课分享。 例如,在三维几何等知识的教学中,星火智慧黑板通过解构立方体,将枯燥的理论形象化,使教学课堂更加生动有趣。 随着Spark语音模型的发布,首批中文、英文、法文、俄文等37种主流语言的语音识别效果超过了OpenAI Whisper V3,在多语言语音合成方面,首批40种语言的Spark语音模型超过了83%。
科大讯飞以智能语音起步,自25年前成立以来,一直驰骋在这条赛道上,持续走在世界前列。 搭载大语音模型的科大讯飞翻译器即将推出多语言自动识别和增强翻译两项重要功能,分别于今年1月底和3月中旬进行升级。
科大讯飞AI学习机可以提高学习效率,激发学习兴趣,提高综合素养; 自去年5月科大讯飞星火正式发布以来,科大讯飞智能办公笔记本和智能录音笔用户已超过650万次拨打了650万次,提供话语规范化、会议纪要、自动脚本等功能,让工作效率更高。 除硬件产品外,还提供软件应用程序。 星火赋能个人应用创建,目前基于科大讯飞听力、科大讯飞星火APP、科大讯飞输入法等应用,累计赋能数亿用户。 在Spark模型的支持下,越来越多的用户拥有了专业的AI助手。
科大讯飞还与中国移动强强联手,全力支持中国移动的数智化转型。 在赋能“5G新通话”方面,中国移动携手科大讯飞星火推出5G新通话创新应用“商务速记”,可实现通话语音同步分钟数,精准细化关键事项,无需**APP,全手机支持。
会上,首个基于国家工业化计算平台“飞星一号”的开源模型——星火开源-13B正式发布。 这个开源有 130 亿个密集参数 (13b),包括基本模型 iflytekspark-13b-base、微调模型 iflytekspark-13b-chat、微调工具 iflytekspark-13b-lora 和人类编程工具 iflytekspark-13b-charater。 学术企业研究可以基于全栈独立可控的Spark优化套件,更方便地训练自己的专用大模型。
展望2024年科大讯飞星火大模型的发展,首先,要在通用大模型的底层能力方面,继续对标国际先进水平,从算法研究上取得相对更好的结果,包括更小的算力。 第二,2024年,要真正让大模型的数量和质量齐飞,不仅要为行业应用,还要为许多关键技术创新链接大模型,中国商界和科界有信心实现超越。 三是高层建筑要建在安全可控的平台上,在自主可控的平台上实现生态繁荣。