“计算机会思考吗? 自从英国数学家图灵在1950年的一篇著名文章中提出“人工智能(AI)”的概念以来,人类在人工智能领域从未停止过。 2022年底,ChatGPT上线,在语音图像识别、自然语言理解等复杂任务中表现良好,带动了2023年基于海量数据量和知识库构建的大模型的爆发式增长。 如果说2023年是AI模式的元年,那么2024年则有望成为AI应用创新之年,不仅会推动产业转型升级,更会重新定义我们的工作和生活方式。
百模大战回归理性发展
2023年,以ChatGPT为代表的AIGC(生成式人工智能)领域将迎来一场“百模大战”。 在美国,谷歌、Microsoft等科技巨头陆续推出大型机型。 在中国,阿里巴巴、华为、科大讯飞、腾讯等公司正在积极布局大型模型赛道,三大运营商也纷纷推出原创大型模型产品。 根据《2023北京市人工智能产业大模型创新与应用》,截至2023年10月,全国共有254家大模型规模在10亿参数以上的厂商和高校、科研院所,分布在20多个省(区、直辖市)。
然而,大型模型在训练过程中需要使用大量的数据和参数,这意味着大型模型的构建者必须拥有强大的计算资源、安全能力,并且必须投入大量的资金。 业内人士认为,在白热化的“百模大战”之后,行业必然会经历洗牌重组和优胜劣汰。 2023年8月,国家互联网信息办公室等7部门发布的《生成式人工智能服务管理暂行办法》正式实施,从政策层面设定准入门槛,标准体系覆盖多个行业,涵盖行业能力、工程性能、算力网络、安全可靠等。 这也意味着“百模大战”回归理性,AIGC行业将进入整合阶段。
各行各业都在呼唤原生应用
大型模特在对话、写文章、策划、写作等诸多领域都展现出了惊人的创作能力,并且每天都在快速发展。 然而,AIGC技术的能力远不止于此,其推动的数字经济与实体经济的深度融合将创造更多颠覆性的应用和更大的社会价值,有望开启未来几十年相关的一轮技术和产业变革。
在经历了“百模大战”之后,越来越多的人意识到,AI未来的竞争不在于大模型本身,而在于千行百业的原生应用。 中国工程院院士吴和全表示,基础大模型具有很强的常识能力,但很难聊起来成为刚性需求,而要体现大模型的价值,还取决于行业的应用。 创始人兼董事长李彦宏认为,人类进入AI时代的标志不是生产出很多大模型,而是生产出很多AI原生应用。 未来,我们需要的是100万个AI原生应用,而不是100个所谓的大模型。 英伟达CEO黄仁勋表示,AI领域的竞争将导致现成的AI工具的出现,从芯片设计和软件开发到药物发现和放射学,不同行业的公司将根据自身需求发挥更大的作用,结合自己独特的技术、数据和AI能力。
在药物发现领域,大型模型在药物分子建模和特性等任务中表现出优异的性能。 在矿山领域,AI监控系统可以准确识别异常情况,让工人坐在办公室就能完成管理工作,提高生产效率和安全性。 在工业制造领域,ChatGPT应用可以提高效率......设计、工程、制造和运营等流程人工智能的发展将把重点转移到行业模型上,每个行业都应该有自己的模型和应用。 未来,随着“思考计算机”渗透到经济社会发展的方方面面,不断推动数据与现实的融合,创造更大的经济社会价值,将出现大量的本土应用。
开源模式驱动科技创新
2024年1月10日,中国电信宣布,其自主研发的星辰语义大模型将全面开源,公开其底层**、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力,同时开放1T高质量清洗数据集,成为首家完成大语言模型(LLM)开源的央企。 1月17日,商汤科技与上海人工智能实验室联合香港中文大学、复旦大学发布新一代大型语言模型学者溥鱼2号0 宣布开源。 在此之前,阿里云于 2023 年 12 月开源了 720 亿参数模型 QWEN-72B。 大规模模型赛道转向“开源热”。 360**创始人周弘毅:2024年,开源模式将迎来爆发式增长。
早在2017年,**发布的《新一代人工智能发展规划》就将“开源”作为基本原则。 在2023中关村论坛上,科技部副部长吴朝晖表示,中国坚持开源协作,加强大模型技术持续创新,协同解决透明稳定等共性问题,进一步推动计算资源和数字资源开放共享,加速形成大模型产业生态。
训练大型模型需要巨大的计算资源和高昂的开发成本,而行业巨头拥有绝对优势,这是大量中小企业无法企及的。 大模型的开源可以降低中小企业开发AI应用的门槛,提高大模型的利用率,为科技创新提供新的动力。 大量第三方参与者将汇聚到应用开发的洪流中,这将推动大模型向实体经济的渗透,颠覆搜索引擎、电商、金融、教育、影视娱乐、医疗、游戏等众多行业,重构人们的工作和生活。
2024年,AI模型的竞争格局正在发生翻天覆地的变化,新的应用和商业模式将不断涌现。 AI大规模模型应用的春天来了。