封面新闻记者 孟梅 张月喜。
近日,第一代SORA一经推出,就首次引起了各界的关注,被称为ChatGPT诞生后人工智能领域的又一个“WOW”时间点。 与此同时,知名AI公司Emotibot被传出宣布停产半年,引发了大众对技术商业化领域新旧换代速度的感叹。
2月22日,封面新闻记者专访了上海财经大学电子商务研究所执行主任崔丽丽。 她表示,当一项创新刚刚出现时,对当前SORA观点的任何决定性趋势判断都可能为时过早。
虽然一些公布的SORA生成结果几乎是现实的,甚至比大多数缺乏专业能力的内容制作者还要好,但要真正取代或主导内容创作,还需要时间,甚至是很短的时间。 根据崔丽丽的说法,SORA主导或取代了内容创作,至少取决于模型和用户的因素。
崔丽丽,上海财经大学电子商务研究所执行主任。
在模型方面,有两个方面起着决定性的作用:一是人类世界已有内容的积累和人工智能模型的学习速度,二是人工智能模型如何进一步理解和掌握纯内容背后的一些隐含关系。 她表示,从SORA的现状来看,这其中的第一点已经实现,那就是根据对已经精细标注的内容的学习,快速标注和学习简单标注和非标注的内容。 但是,第二点在SORA中还没有看到,即在展现出完美的视觉生成画面的同时,是否涵盖了画面中所包含的机械关系、时空因果关系、局部关系和整体关系,这将决定所生成的视觉画面的合理性和真实性。 很难在单一维度上识别视觉图像和内容之间的逻辑关系。
这可能意味着,大语言模型在标注视觉画面的内容时,不仅要用语言描述和描述画面的状况,还需要标注画面中反映的隐含的物理关系,但问题在于语言描述不如数学公式准确。 崔丽丽解释说,换句话说,在现实世界中构成合理性的数学和物理原理并不是现有大型语言模型的专业知识,可能需要由其他更擅长数学或物理原理的技术模型来补充。 显然,突破还需要时间。
在她看来,即使这些问题都解决了,Sora仍然需要面对完美的实验室产品与大规模工业化应用之间的差距。 崔丽丽从适合应用场景和用户侧两个方面进行分析。 首先,使用一个好的AI模型也需要技巧,而要成为一名魔术师,首先要学会使用法术。 该领域的阈值决定了新技术应用的速度和频率。 比如ChatGPT问世后,就出现了这样一个专业职位的提示词工程师。 有人说,每一个人工智能模型的出现,都是第一个把班级养肥的。 各种培训课程的出现,足以说明,一项新技术的全面更新换代,需要全行业准备一整段时间,而个人技能的准备往往是第一步。
从进一步的商业角度来看,虽然新技术可以在早期阶段带来竞争优势,但也需要一些投资。 崔丽丽指出,这些投资不仅包括资金,还包括裁员、组织调整等隐性管理成本。 综上所述,导致公众开启未来世界黑洞的奇点还远未结束。 这个等待过程取决于现有行业数据的积累、模型的完善程度、应用场景的适应性、学习门槛、资金和管理成本。
场景需求是点燃技术生产力的魔杖。 崔丽丽提出的观点是,从优化的角度来看,一方面,现有行业的数据积累、数据质量、标注深度需要不断加强,这取决于场景行业的数字化程度,因此是持续推动各行各业信息化进程加速、实现数字化转型的必由之路。 另一方面,对于AI模型本身来说,重要的是整合更多可以隐含反映现实世界中全局关系的模型表示。
我们已经看到太多的新技术在信息技术领域加速发展。 例如,电子商务行业正在见证从基于搜索的平台到社交通信再到内容分发的范式转变,而内容分发正在以越来越快的速度收集流量。 事实证明,学习门槛越低,一项技术的普及和全面更新换代就越快。 因此,降低使用AI模型的门槛,与大家一起学习使用AI模型是一个双向的过程,可以促进奇点的更快到来。 这需要技术人员和教育行业的长期努力。 她想象,奇点之后,人工智能的出现可能会创造一个新的文明。 人工智能与元宇宙技术的交汇与融合,或许真的能创造一个“平行世界”。