由尚迪安撰写。
随着2024年行业发展方向逐渐明朗,AIGC掀起的变革浪潮开始影响更多行业。
相较于2023年大模型行业的“野蛮增长”,虽然2024年整个市场规模将再次迎来大幅增长,但趋势变化明显:行业需要更多的应用侧集成,能够为用户带来高效的改变。 这不仅是时代潮流,也是对大型模型基本能力的严格考验。
吸引眼球的方式将从主流中撤出,让位于更优秀的产品创新。 这也反映在2024年至今的行业趋势上:无论是行业还是C端,大型模型厂商似乎都在寻找方法,让最新的AI能力更贴近用户。
综上所述,在AI时代,2024年可以算是大模型真正落地的第一年,科大讯飞星火认知大模型V3将于1月30日举行5、此次升级大会可以看作是科大讯飞对2024年中国生成式大模型产业前景的回答。
科大讯飞想做什么样的大模型?
科大讯飞作为国内生成式大模型领域的热门企业之一,科大讯飞要做什么样的大模型,其价值可与行业投资风向标相媲美,所以在Spark模型3中5 发布后,许多业内人士试图从本次新闻发布会的众多内容中寻找答案。
从表面到内部,这个问题大致可以分为两个答案。
首先,最直观的原因——“对标ChatGPT”一直是Spark模型的目标之一。 在过去的一年里,Spark模型的三次大迭代对于这个强大的竞争对手来说都是不可或缺的。
当 GPT-4 发布时,Spark 模型的目标也发生了变化:科大讯飞为其制定了明确的时间表。 宣布将于2024年上半年对GPT-4进行基准测试,最终在1月底分阶段完成军令: 科大讯飞董事长刘庆峰表示,基于星火V3的全国算力训练,在语言理解、文本生成、知识问答、逻辑推理、数学能力、**能力、多模态能力七个方面5 也完全升级。 其中,语言理解和数学能力超过GPT-4 Turbo,**达到GPT-4 Turbo的96%,多模态理解达到GPT-4V的91%。
从这个维度来看,星火大模型的迭代升级,也像是中国自主大模型能力发展的一个缩影:在快速迭代上赶超国际先进水平,加速应用领域集成,推出各类软硬件产品,探索现阶段尽可能落地更多大模型的可能性, 赋予行业更多意义。
这种竞争更像是两辆三驾马车齐头并进,这反过来又直观地反映了星火大模式能力的快速提升:除了中国大模式更有利的行业应用场景外,还拥有更强的多式联运能力,可以吸引开发者更多,构建更有价值的自有生态。
*辅助生成能力一直是检验大模型能否快速应用于专业领域的典型场景之一,被誉为判断认知大模型智能的标志; Spark 模型从第一代开始就具有生成 ** 的能力,并且已经升级了主要版本的多次迭代。 现在它具有完整的完成、纠错和单元测试功能。 而在 OpenAI 打造的 ** 能力基准测试中,**达到了 GPT-4 Turbo 的 96%。
对于科大讯飞来说,业务初期智能语音交互软硬件的开发,更像是科大讯飞想要打造的大模型5 在新闻发布会上,科大讯飞还介绍了“老牌银行”的新成绩。
科大讯飞CEO刘庆峰表示,让机器具备学习、推理和决策的能力,是Spark模型目前在翻译领域关注的变革方向。
新发布的“星火语音模型”基于大型语言模型框架,结合科大讯飞语言、音色、内容等多维语音属性的解耦表示进行预训练。 它可以是多语言的,并实现超拟人化的语音合成效果。 前 40 种语言的平均 MOS 分数(评估音频或**质量的标准,5 为最高)增加了 025、MOS在拟人化测试中达到4分5分,拟人化程度达到83%,拟人语音合成能力超越ChatGPT。
这种语音能力也可以更快速地应用到C端硬件上:刘庆峰还发布了搭载星火语音机型的科大讯飞翻译器,宣布即将推出多语言自动识别和增强翻译两项重要功能,分别于今年1月底和3月中旬进行升级。 据介绍,科大讯飞翻译器的多语言自动识别升级将支持35种语言。 多语言自动识别让国际交流更便捷,增强翻译技术将译员变成AI翻译助手。
简单来说,就是借助一个大模型,让演讲具有更丰富的属性,包括语言、内容、韵律、音色、情感等。 ”
行业需要什么样的大模式?
至于科大讯飞想要做什么样的大模型的另一个答案,其实可以从另一个维度来回答:行业需要什么样的大模型。
首先是大模型行业对独立算力的迫切需求:对于严重依赖快速学习迭代来保持竞争力的大模型来说,硬件不是简单的设备替代品:关于硬件算力在行业中的形象有一个隐喻:就像植物和土壤一样, 尝试切换硬件的难度相当于将植物从最初生长的土壤中连根拔起,并将其重新培育到另一个新环境中。这不仅显示了独立计算硬件平台的重要性,也对独立计算能力对生态建设的巨大影响有了更深入的认识。
由此衍生出的“算力基础”概念也被广泛认为,算力卡在脖子上的情况在2023年频频出现。 逐渐成为行业共识。
如今,即使外国公司愿意规避出口管制,向中国客户销售定制产品,中国客户也会优先在新项目中使用更自主、更可控的国产算力。 同时,自主算力的投入也是构建生态圈的又一体现:根据中国信息通信研究院的测算,算力每投入1元,就能带动3-4元的GDP增长。
在2023年的行业奋斗中,独立可用的算力逐渐得到广泛认可,呼声越来越响亮,成为这场大型模型落地大赛中来自东方的时代最重要趋势之一: 10月23日,工业和信息化部、国家互联网信息办公室、 教育部等六部门印发《计算基础设施高质量发展行动计划》,提出到2025年算力规模突破300eflops,独立算力无疑将在其中占据重要地位。
事实上,自主算力早已是国内很多AI巨头甚至创业公司都在推广的东西,只是细分方向大相径庭,在应用场景中的实际体现也不同。 科大讯飞与华为联合打造的国产计算平台“飞星一号”,在去年正式上线90天后,完全基于在国产平台上训练的Spark Model 35也同时出现在舞台上。
除了在语言理解和数学理解能力上超越GPT-4外,由国家算力训练的Spark模型对行业在中国开发者生态建设中具有更重要的意义。
开源模型是建立生态系统的关键措施,而Spark模型3在发布版本5的同时,科大讯飞还发布了基于Spark 1的版本0版130亿参数开源模型,不仅系统地针对国内数据安全领域进行设计,还从底层架构上考虑了国内算力的适配。
根据科大讯飞官方发布的测试结果,星火开源大模型受益于国家级计算平台的性能提升,在典型应用场景中,效果比其他同规模开源模型高出20%以上。
这些性能提升将成为大模型在更多应用场景中进一步扎根的基础:更好的情感感知和拟人能力是让大模型直接“聪明如人”的最直观体现; 在生成PPT、汇报报告等常见的内容生成场景中,AI写作助手还可以在中文环境中生成更丰富的内容,具有更智能的理解能力和外部知识的扩展。
除了这些看得见的成果之外,还有一个不显眼的细节,那就是Spark开源模式选择了开源社区作为首发平台,这对开发者来说无疑是一个强烈的信号:科大讯飞正在借助开源模式拥抱开源社区生态和更多的第三方开发者。
这更符合行业领导者的态度:用足够的实力带动更多的行业和场景,借助开源大模型开发更多的产品,进而反馈生态本身,构建丰富可用的大模型生态。
结语。 看完星火模型v35 发布会结束后,除了对科大讯飞目前的大型模型能力有了更清晰的了解外,对于行业专业人士来说,找到2024年行业需要什么样的大型模型的问题的答案可能更重要。
的确,科大讯飞董事长刘庆峰在Spark模型V3中5 正如发布会上所说,中国的大模型还远未达到GPT-4的最佳水平。 然而,借助大模型推动自由通信和万物互联,同时构建独立开放的大模型生态,这不仅是科大讯飞当前的发展方向,也是整个行业的未来方向。
通过这次新闻发布会,我们期待一个充满希望和成长能量的春天。 相信2024年,我们一定能够实现火花四射,通用人工智能不仅能够深入广泛地应用于中国各大领域,而且在源头技术创新和大模型底层能力上也将站在一个新的台阶上。 “刘清峰说。