人人都是导演的时代来了?
近日,OpenAI发布了第一个**生成模型Sora,并且还展示了几个具有相当爆炸效果的段落**。
比如,有一个女人走在东京街头的场景,**在霓虹灯闪烁的灯光下,女人穿着一件黑色皮大衣,走得自信而随意。
无论是路上小水坑反射的光线,还是女人的举止和走路的动作,都感觉非常逼真,几乎与拍摄的真实场景没有区别。
有网友在X平台上分享了这一段,下面有人评论说是“GG皮克斯”。
紧接着,“5G冲浪者”马斯克也回应说“GG Humans”。 ”
GG是网络游戏术语“goodgames”的缩写,主要由输家在游戏结束时发出,表示他承认输了。
换句话说,马斯克的意思是“人类输了,人工智能太强大了”。
那么,OpenAI释放了什么样的核弹呢? **生成模型SORA的优势是什么? 真的像马斯克说的那样,人类会终结吗?
根据 OpenAI 的说法,用户只需要输入一个简单的描述性陈述,Sora 就可以创建相应的短 **,最长可达 60 秒。
而且更重要的是,它可以实现非常细致的场景布局,复杂流畅的镜头运动,人物的性格也栩栩如生,与真人无异。
这是什么意思?
就算是普通人,只要你有丰富的想象力,能准确地描述出脑海中的画面,那么你就可以把它变成相应的画面,甚至可以独立创作一部电影。
毫不夸张地说,这次SORA是AI领域发展的又一个里程碑,和ChatGPT诞生之初初ChatGPT带来的震撼是一样的。
要知道,作为SORA的竞争对手,Runway Gen 2、PIKA等AI**工具还在试图在几秒钟内突破“**片段”的连贯性,而OpenAI的SORA已经能够打造出60秒的“大片”。
这相当于,别人家的孩子还在学走路,但自己的孩子已经能蹦蹦跳跳自己去上学了,中途可以去店里给妈妈买一瓶酱油回家。
最关键的问题是,这只是OpenAI宣布的测试版,未来SORA会发展到什么程度还不得而知,或者现在实验室是否会有更大的突破。
既然空这么强,那么与其他对手相比,它有多强?
OpenAI 在技术报告的标题上说得很清楚:**生成模型是一个世界模拟器。
世界模拟器,这是什么意思?
简单来说,sora不仅可以生成短**,还可以学习现实世界的物理定律,从而在一定程度上扩展,随着时间的推移,场景的下一刻会发生什么,场景中的物体将如何移动,会出现什么样的轨迹,形状将如何变化。
例如,我们都知道物体掉入水中会泛起涟漪,杯子打碎后水会溢出来,灯光会在水面上反射等等,但这些都是人工智能需要学习的新事物。
所以可以看到,SORA的竞争对手不仅生成了只有几秒钟的短**时间,而且只有一枪,这恰恰是因为它无法理解现实世界的物理定律,很难按照相应的描述生成**,即使真的生成了**, 会有各种“怪异”,远不如SORA现实。
当然,由于算力等因素,SORA在处理一些复杂的场景时还是会犯错误。
比如索拉产生一段水杯破裂时,先洒水,然后水杯破碎,这显然不符合现实中的物理定律。 例如,在提示“篮球穿过篮筐然后**”中,篮球没有被篮筐正确阻挡。
SORA发布后,360董事长周弘毅也表达了自己的观点。
按照周弘毅的想象,以SORA这样强大的大型模型为基础,再辅以其他方面的技术支持,可以成为各个领域的颠覆性工具。
例如,在生物医学、物理、化学、数学等基础学科中,大型模型可以发挥相应的作用。
特别是在自动驾驶领域,过去我们为电动汽车安装了雷达和摄像头,更强调的是一些感知层面,而不是认知层面。
但是,如果不能对碰撞的严重程度、是否会发生碰撞、对方的速度有多快有一个基本的了解,就很难实现真正的自动驾驶。
然而,人工智能技术的不断突破很可能使这种想象成为现实。
不过,这里可能有人会说,现在的SORA连一个破**都做不了,是不是太遥远了? 根本不可能在短时间内实现它。
但别忘了,现在距离ChatGPT发布才1年多的时间,AI的发展速度已经超出了大多数人的想象。
我们完全可以说,未来十年将是一个疯狂的十年。
虽然SORA带来了颠覆性的创新,但充其量只是一个起点,很难准确定义未来会发展出什么样的AI,它将给我们的生活带来什么变化。
写在最后:
在某种程度上,科学技术的发展与艺术的发展有一些相似之处
在过去的几百年里,艺术形式一直在变化,所以艺术家要适应新的艺术形式。
技术也是如此,人工智能技术发展迅速,我们唯一需要做的就是适应。 鲲鹏项目