记者 陈佳兰 广州报道
近日,美国商务部长吉娜·雷蒙多(Gina Raimondo)宣布计划限制外国客户,尤其是中国客户使用美国云计算供应商的服务来训练AI大型模型,美国商务部宣布一项提案,要求美国IaaS(云服务)供应商向海外公司和个人提供包括AI模型训练在内的云服务。 有分析人士认为,此举将美国对中国科技的制裁推向了新的高度。
一方面,美国对华科技的制裁将AI算力推向了极限云服务的高度,另一方面,国内厂商自主可控技术的国产化进程正在加速。
1月30日,《中国经营日报》记者从科大讯飞获悉,国家算力平台“飞星1号”首个成果为科大讯飞星火V35发布,这是第一个基于国家算力训练的国家开放大模型。 此外,深度适配国产算力的科大讯飞星火开源模型“星火开源-13B”首次上线,昇腾开源社区联合首发。
2023年10月24日,科大讯飞董事长刘庆峰提出,科大讯飞星火大模型将在2024年上半年以ChatGPT4为基准。
当时,刘庆峰介绍了科大讯飞Spark V35的语言理解和数学能力已经超过了GPT-4 Turbo,**达到了GPT-4 Turbo的96%,多模态理解达到了GPT-4V的91%。 不过,科大讯飞有信心在2024年上半年赶上GPT-4目前的最佳水平。
国内厂商加速立足国产化,自主可控
近日,美国限制中国AI大型模型厂商通过美国云服务提供商使用海外算力的消息引发市场关注。
2022年10月7日,美国公布了中国人工智能训练的算力和带宽限制,从那时起,中国只能使用“阉割版”芯片训练大型模型。 2023年10月17日,美国商务部进一步颁布规定,中国连“阉割版”都买不到,对可能与中国合作的周边国家和地区实施严格限制。 就在本月,美国商务部进一步提出,美国公司将无法向中国人工智能企业提供计算能力。 “1月30日,迅飞Spark v35 在发布会上,刘清峰毫不避讳地谈到了美国最近禁止云计算厂商为中国训练AI大模型的计划,“无论是训练还是推理,我们的算力限制越来越严格。 在训练科大讯飞星火认知模型的第一天,科大讯飞就决心构建一个基于本地化的自主可控计算平台。 ”
为了抢占通用人工智能时代的发展主动权,科大讯飞较早布局了国内计算基地。 2023年上半年,科大讯飞与华为成立“联合专项团队”。 10月,科大讯飞宣布,将与华为合作,打造基于昇腾生态的自主可控的大规模模型计算基地——飞星一号平台。 在此过程中,科大讯飞基于硬件工具和算子库进行了数百次优化,进行了大量的bug修正和算子效率优化,使“飞星一号”算力集群能够训练出超大规模的通用人工智能模型。
1月30日,全国首款公开大模型科大讯飞星火V35次出场。 同时,科大讯飞首款基于国家算力平台“飞星一号”的开源模型——星火开源-13B正式发布。
刘庆峰表示,科大讯飞正式发布科大讯飞Spark V35、既是对科大讯飞在通用人工智能领域核心技术和创新能力的展示,也是对国产计算平台未来能否支撑大模型研发的重要考验。
虽然国产芯片和算力受到的限制越来越多,但也可以看出,它正在迫使各方加大对国产算力的投入,而目前的市场也可以看到,国产算力正在快速发展。
2023年以来,阿里云、华为云、腾讯云等多家国内云厂商纷纷发布了自研AI大模型平台。
在中关村大数据产业联盟副秘书长闫阳看来,随着外部高性能芯片和云服务的限制,国内市场对本地计算资源的需求可能会增加。
广发**电脑首席分析师刘雪峰认为,自主可控构建国内AI产业链的决心有望进一步加强,国产AI大模型的开发应用将大大加强对国产AI算力和模型服务的利用,国产AI算力自主可控建设进程有望加快。
力争今年上半年赶上GPT-4
它与该公司的上一代GPT-3相同5 科大讯飞Spark v30 发布近 100 天,科大讯飞 Spark v35、再一次迎来了多维度能力提升。
它不仅符合当时的期望,而且在许多方面都令人惊讶。 刘庆峰介绍,迅飞星火V35、在语言理解、文本生成、知识问答、逻辑推理、数学能力、高级能力、多模态能力等七个方面进行了升级。 升级 Spark 智能黑板; 首批37种主流语言超越OpenAI Whisper V3,赋能科大讯飞译器全新升级,助力沟通更自由,推动万物互联时代客服、汽车、机器人等场景人机交互的变革。
根据科大讯飞,科大讯飞Spark V35的能力越来越接近GPT-4 Turbo水平,在语言理解和数学能力方面已经超越了GPT-4 Turbo,在**中达到了GPT-4 Turbo的96%,在多模态理解上也达到了GPT-4V的91%,其中语音的多模态能力已经超过了GPT-4。
刘清峰也坦言,我们必须清醒理性地看到差距,GPT-4在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域的最佳水平还有差距,但科大讯飞星火有信心在2024年上半年赶上目前GPT-4的最佳水平。
值得注意的是,OpenAI 计划在 2024 年推出 GPT-5,OpenAI 可能已经完成了 GPT5 训练。 上海市第十六届人大代表王延峰教授在提交《关于加快建设具有全球影响力的大型示范创新集群的建议》中指出,我国科技企业虽然在大模型领域投入了大量资金,但与“世界一流”产品相比仍存在较大差距。 而且他们还没有在全球竞争中表现出相应的领先优势。“就大模型领域的投入和产出数量而言,中国已经追平甚至超过美国,但在大模型的实际应用和产业价值的转化方面,美国在全球竞争中仍然保持着显著的领先优势,它仍然是OpenAI等少数美国顶级科技公司, 真正达到世界级水平的谷歌和Meta,从这次CES可以清楚地看出。“王延峰说。
展望2024年科大讯飞星火大模型的发展,刘清峰指出了三点:第一,要继续在通用大模型的底层能力上对标国际先进水平,从算法研究上取得相对更好的结果,包括更小的算力。 今天的通用模型并不一定代表整个人工智能的未来,还有很多创新要做,比如脑科学交互、对抗网络深度连接等,需要整个创新生态,但我们必须有走在最前沿的勇气和期待。
第二,2024年要真正让大模型的数量和质量一起飞起来,不仅要用于行业应用,还要让许多关键技术创新链接大模型,中国企业界和科学界有信心实现超越。 刘庆峰说,“第三,高层建筑要建在安全可控的平台上,要在独立可控的平台上实现生态繁荣。 我有信心,从算法、数据、应用场景到算力,都能构建一个完全自主、可控的繁荣人工智能生态圈。 ”
面对美国频频出台限制算力出口和使用的政策,刘雪峰也提醒说,由于可用计算资源有限,我国AI大模型的开发和应用进程可能仍会受到影响,国内AI基础算力差距缩小还需要时间, 特别是在大规模集群训练和生态建设方面,美国对AI算力和模型服务的限制变化仍存在不确定性。
编辑:吴青 校对:刘军)。