两周前的今天,北京时间2月16日,OpenAI、Google、Meta、Stability都在这个时间节点前后发布了文盛**模型的结果,但只有OpenAI的SORA在这场大赛中突围而出,成功抓住了全世界的目光。 可以说,SORA已经打响了文盛**大模型产业2024的第一枪。 一方面,谁也没想到OpenAI的动作如此迅猛、刺激、刺激,招架已经来不及了,另一方面,都被其“60秒超长镜头”、“单**多角度镜头”和“世界模型”等爆炸性效果所震撼,并声称将迎来行业洗牌。 在关于SORA的各种争议和预测如火如荼、接踵而至的时候,《AI技术评论》反思了Disco Diffusion再出现Stable Diffusion的过程,并与业内投资人、技术专家、学术专家、AIGC创业者等数十位行业专业人士对SORA进行了冷思考。 (关于SORA和AIGC,欢迎各界朋友来找作者:.)s1060788086从长远来看,不可否认的是,SORA是文盛大模型的里程碑事件,标志着生成能力达到了一个新的水平。 不过,也有业内人士指出,“大家都应该清醒”,SORA的影响并没有想象的那么大,不会对影视、广告、内容创作等领域产生立竿见影的颠覆性影响,也不一定会切断AIGC创业者的后路。 SORA发布两周后,需要的不是嗡嗡声,而是降温。 SORA的影响现在并不急于完成这个故事,而是需要在未来1-3年内看到。
SORA技术有很大的探索空间当PIKA走红时,香港大学计算机科学系教授徐东称其为文盛**行业的曙光——让世界看到了文生**的惊人效果,但同时他也意识到,PIKA只是先跑出来的那个,距离大规模用户支付还有一段距离。 SORA的出现,徐东教授评论说,这是一个“巨大的突破”,它不是一个简单的来自ChatGPT-30 到 chatgpt-45、但对之前的视觉模型进行了降维打击。 60秒的长度,让其他文盛产品无与伦比。 但其实跳出对世代长度的考虑,生成速度也是考虑文盛大模型的关键指标。 一个 60 秒、令人惊叹的 AI** 是在 10 分钟还是一小时内生成,对用户来说都是一种截然不同的体验。 如果生成时间少于 60 秒,那将是另一种惊人的效果。 面对未来低时延的要求,背后算力的支持是最根本的基础。 预计高效利用算力满足巨大需求的方式,是SORA等文盛模式可以探索的空间之一。 要解决一系列代时问题,除了算力之外,石榴科技创始人弗兰克认为,其背后的技术解决方案也是影响因素的关键因素之一。 因为底层SORA是扩散模型,如果模型本身有一些局限性,导致处理速度达不到,生成时间确实不快,算力强也无法使用。 除了一代的60秒持续时间外,世界模型也是SORA开辟的新视野。 就世界模型的技术渊源而言,SORA目前的做法与杨丽坤最初提出的方法不同。 Yann Lecun强调对空间中规则表达式的理解,即是否有可能直接在这个模型中找到明确定义的对象的表达式。
空显然与这种方法不同,他们走上了“武力奇迹”的道路。 使用基于 Transformer 的 Diffusion 进行解压缩仍然是数据驱动生成的基本方法。 在这个过程中,是否真的能反转总结中间学到的物理定律,动画代捏ta产品创始人胡秀涵表示,这还是需要打个问号。 如果你认为 OpenAI 的理念是“缩放就是一切”,那么随着规模的增加,压缩效率越来越强,模型被迫学习和总结所有的物理定律然而,基于该模型目前的规模和有效性,目前还不可能直接得出SORA是世界模型的结论。 弗兰克对此表示同意,并补充说,不仅要从物理意义上思考,而且要从非物理意义上思考。 作为世界的典范,更需要考虑到社会中的“人类情感规律”。 就像当婴儿被抢走时,空能否成功**出来,婴儿会哭——所以除了物理定律的演化,世界模型还需要进一步满足日常生活中的场景和判断。 还有这个社会意义上的大多数信息不是通过文字和文字来表达的在它的背后,仍然需要探索文盛模型是如何被理解和生成的。 为了实现这一点,弗兰克认为有必要在表面文本和它背后的潜台词之间建立相应的联系。 基于OpenAI冰山一角的海量数据和一定连接关系的建立,GPT-4已经表明,它对人类潜台词、双关语等许多复杂内容有着非常高的理解率,而且非常聪明。 空也值得期待,看看能不能多一些联想,提示一句话,就能看懂它背后的10句话,然后用10句话完成更好的作品。 但是,当前的可视化模型SORA与以前的大型语言模型不同。 在OpenAI的早期,大部分研究成果都是开源的,甚至数据库也是开源的。 但现在不再是开源了,SORA的技术报告只讲了一个非常宏观的框架,其余的需要同一家赛道公司自己去探索。 徐东教授认为,OpenAI的闭源性使得探索OpenAI成果的工作难以赶上。 但是,从社会的宏观角度来看,有必要赶上中国的SORA时代。 一方面,游戏等行业或其他涉及商业秘密的行业不太适合OpenAI的底层技术。 另一方面文盛**技术的进攻和防守问题也是比较重要的方面。 由于SORA技术很容易产生大量的虚假信息,因此可能会被别有用心的人用来传播一些虚假信息或不正确的价值观来引导。 面对这样的情况,如果不知道对手是如何进攻的,就很难防守。 在应用方面,国内对文盛**的需求非常旺盛,大家不可能都翻墙使用OpenAI的产品。 追赶SORA是一件长期的事情,需要更多的社会资源来支持人才,这是这场新的AI竞赛的核心。 目前,香港大学的罗平教授正带领同学们一点一点地探索文生**,研究与SORA最相似的技术路线,几乎没有卡片。 在SORA冲击下的AI竞争格局中,产品应用是更安全的方式,国内企业也需要深入参与追赶技术。 因为无论你生产什么产品,如果技术基础不扎实,没有人开源,那么好的产品就很难出来。 此外,如果SORA很贵,那么该产品就没有多大意义。