记者 杨俊峰.
2023年8月24日,两名技术人员在江苏省常州市钟楼经济开发区宝钢轧辊科技有限公司加工数字化集中控制中心检查一台车床的运行状态。 摄影:Lu Shiqing (People**)。
2023年10月21日,安徽省芜湖市,市民在第十一届中国(芜湖)科学产品博览会上体验虚拟现实技术。 新华社记者杜宇摄。
2023年11月23日,在浙江省杭州市,参观者在2023年第二届全球数字博览会上了解华为盘古模型的应用。 摄影:龙卫(人物**)。
在当今时代,数据已成为创新的重要元素。 人工智能模型、新材料创制、生物育种、基础科学研究都离不开数据的支持。
国家数据局等17个部门近日印发《数据要素三年行动计划(2024-2026年)》,明确开展“数据要素与科技创新”行动,从促进科学数据有序开放共享方面阐述了数据要素与科技创新相结合的重点, 加强高质量科学数据资源的构建和场景应用,用科学数据助力前沿研究,以科学数据支撑技术创新,以科学数据支撑大模型开发,探索科研新范式。
从支持基础研究,到助力人工智能等前沿技术发展,再到推动科研手段转化,中国科技创新正随着“数据要素”三年行动计划的“东风”而“倍增”。
构建“硬件和软件”。
促进科学数据有序开放共享,促进重大科技基础设施和重大科技项目产生的各类科学数据互联互通,支持和培育具有国际影响力的科学数据库建设,是“数据要素科技创新”行动的重要目标之一。 依托国家科学数据中心等平台,加强高质量科学数据资源和场景应用建设。
打造相关“软硬件”,各地都在积极部署。
2024年,北京将推进算力中心、数据训练基地、国家区块链枢纽节点等一批重大项目落地。
江苏将系统推进5G、千兆光网络规模化部署,支持国家互联网骨干直连点在苏州建设,加快智能算力、边缘计算等算力布局。
四川提出提前建设数字信息基础设施,加快建设“东部数据、西部计算”工程国家枢纽节点,建设省级算力调度服务平台,构建算力、储能、运力一体化算力网络发展体系。
山东提出部署高性能智能计算中心,统筹布局通用和垂直大型模型算力,建设5A级省级新型数据中心25个以上,智能算力占比达到30%,构建“山东算力网络”。 支持济宁建设鲁南计算中心。 开展“双千兆”网络系统工程,打造500多个典型应用项目,新开通5G基站4万个。
“硬件”设施得到加强,“软件”设施也需要升级。
互联网是数据流转和汇聚的平台,是数字经济时代基础设施的关键。 中科院院士梅红表示,要加快建设数据网络、数据空间等新型基础设施。
2021年,中国科学院发布了具有国际服务能力的开放通用科学数据存储和发布平台——科学数据库(ScienceDB)。
科学数据库由中科院计算机网络信息中心自主研发,是一流的相关数据存储平台,可为相关数据的聚合、管理、开放和共享提供高效的解决方案,为实施科研诚信、培养共享文化、 加速数据流动,促进国际合作。
研究人员可以将自己收集和整理出来的科学数据存储和发布在科学数据库中,通过吸收“数据存款”和“化小钱变成大钱,死钱变成活钱”来收集个人和集体分散的数据资源,使其更容易被发现、访问、互操作和复用。 同时,研究人员还可以在学术提交之前将数据上传到科学数据库。
截至今年2月2日,科学数据库已收集了超过820万个开放数据集,平台访问量超过7亿次。
开发大型模型。
人工智能模型的开发是“数据要素科技创新”倡议的又一重要目标。
数据要素 《三年行动计划(2024-2026年)》提出,支持以科学数据开发大模型,深入挖掘各类科学数据和科技文献,通过细粒度知识提取和多知识融合构建科学知识资源库,构建高质量的语料库和基础科学数据集,支持人工智能大模型的开发和训练。
近年来,我国在大模型领域拥有良好的算力基础和广阔的市场,国产大模型频频出现并加速迭代。 据工信部赛迪研究院数据显示,目前国内大型语言模型研发厂商已超过19家,其中厂商模型产品已通过备案。
这些大型语言模型产品具有语言理解、逻辑推理、知识问答、文本生成等通用能力,一经推出就受到用户的欢迎。
科技创新取得新突破。 科大讯飞星火认知模型处于全国领先水平。 这是写进今年安徽省工作报告的一句话。
科大讯飞星火是科大讯飞于2023年5月正式发布的新一代认知模型。 目前,科大讯飞星火已获得国家经济研究院发展研究中心、新华社研究院中国企业发展研究中心等机构的多项评价,被誉为中国优质国产典范。
只有在完全自主可控的平台上搭建大模型,才能牢牢把握通用人工智能时代的发展主动权掌握在自己手中。 科大讯飞研究院院长刘聪告诉记者。 2023年10月,在科大讯飞全球1024开发者节上,科大讯飞宣布,将与华为合作打造国产大模型算力基地“飞星1号”平台。
目前,基于“飞星一号”的科大讯飞星火V35完成培训,于1月30日获释。 升级后的科大讯飞Spark v35、逻辑推理能力、语言理解能力、文本生成能力、数学应答能力、多模态能力等能力明显提高。 同时,科大讯飞还发布了星火语音模型和开源模型。
大型机型为语音技术的发展带来了新的机遇。 刘聪说。 使机器能够学习、推理和做出决策是认知模型的主要工作。
我们认为,未来AI模型的发展可能会有以下四个趋势。 刘聪告诉记者,“一是多模态、多语种。 从通用人工智能未来发展的角度来看,认知智能模型是核心基础,在此基础上,语音、图像、**等其他数据可以对齐成一个统一的语义空间,结合插件工具实现多模态系统呈现。 第二个是可信和可解释的。 这就需要保证海量数据的源质量,保证大模型本身和系统解决方案能力的持续优化迭代,以及国家出台的监管政策和法律法规。 三是向系统性创新方向发展。 在大模型能力的支持下,我们需要结合多种优势技术进行系统创新,并注意由此带来的护城河效应。 四是软硬件一体化和民族生产发展。 目前,科大讯飞已投入并深度参与国产AI芯片软件的生态建设,在训练端和推理端都取得了一定的收获和进展。 ”
推动数智融合。
智能搜索、关键字过滤和访问最新的医疗新闻......借助大数据和人工智能的便利性,用户可以轻松体验这些服务。 2023年10月,江苏省台州市大健康产业链标准云共享站正式上线,百万级标准数据,为企业提供真正当前、实时更新、更人性化的信息服务支持。
这是台州推动数智化技术与标准深度融合的创新实践。 纵观台州医药健康产业,从线上到线下,从“实验室”到“车间”,“智能化转型、数字化转型”的成果都转移到了“产线”上。
走进位于台州医药高新区(高岗区)的江苏大梦药业小批量注射液生产车间,自动化生产线有序运行,药品生产高效、准确、稳定; 长江药业集团生产工厂通过“机器换人”、信息系统一体化管理等一系列“智能化改造、数字化转型”措施,让生产全过程更加智能化、数字化。 江苏龙凤堂中药已形成从中药材预处理到提取的一整套现代解决方案,在中药工艺智能制造标准化建设领域打造了“智能化转型、数字化转型”的典范。
台州的实践表明,目前,数据已成为医药健康产业的重要要素,数字技术也成为生物医药创新发展的必备工具。 数智融合,赋能医药健康产业创新发展,离不开数智化。
在“数据要素与科技创新”行动中,推进数智融合也是重要举措之一。 《数据要素三年行动计划(2024-2026年)》提出,以科学数据支撑技术创新,聚焦生物育种、新材料创制、药物研发等领域,以数字智能融合加速技术创新和产业升级。
近年来,人工智能、区块链、深度学习、物联网等新一代数智技术的融合、迭代和扩散,渗透到研发设计、制造、客户服务等各个环节,为生产技术和生产方式带来全方位、全方位、全链条的转型,全面提升自动化水平, 数字化、智能化在行业内,为推动数智融合应用、加速形成新品质生产力提供关键驱动力。
西北大学经济管理学院教授钱晓静认为,数据要素作为数字经济时代计算机设备以非物质形式存储和处理的新型关键生产要素,具有非竞争性、复制成本低、非排他性、外部性强等技术经济特征。 并可被不同主体复用,通过解构重组、融合融合等方式产生“数据+算法+算力”的整合价值,为夯实数智融合内部形态、加速形成新的质量生产力提供基础和重要资源。
一方面,数据要素与传统生产要素的有机融合与应用丰富了数智融合的表达形式,将数智融合模式从地理空间向数字空间转变。 “另一方面,数据元素在传统生产要素的重构和重组中起着'媒介'作用,催生了新的要素加工模式,催生了数智集成的新形式。” ”