焦虑制造者还是最强助手,空真的会砸影视圈的职位吗?

小夏 游戏 更新 2024-02-22

自从OpenAI宣布其新的生成式AI模型Sora以来,可以说是“一石激起千浪”,相关讨论一直没有停止。

人们感到期待、焦虑和恐惧......新工具,声称能够输出 60 秒的文本命令**它们共同构成了一个巨大的“索拉混沌地图”。 一方面,各种标签都说“the** is generated by sora”,但实际上网友们制作的搞笑**,却成了“一生”的流量密码,让很多网友好玩的人收获了快乐。

网友们将这个搞笑**标记为“the**tagged by sora”。

另一方面,虽然SORA尚未开放使用,但互联网上出现了大量“培训机构”,利用行业焦虑和信息不对称开始收割韭菜。 一位自称是清华大学博士的博主,以199元一本的价格卖出了520多本AI入门课程。 还有人发现,他这个AI课程一年卖出25万套,销量近5000万。 所以网友们纷纷称他为唯一能与奥特曼平起平坐的AI巨头。

网友制作的模因。

索拉到底是什么?

Sora源自日语单词“sora”,不仅指天空,还象征着无限的空间和无限的可能性,从而引出了自由的意义。 在OpenAI对SORA的介绍中,可以看到无数的纸飞机在空中自由飞翔,象征着SORA模型的自主性和创造性,体现了“空”中蕴含的自由概念。

SORA 介绍页面。

我想大家应该看过很多各类SORA一代**,相信很多人看完都会有疑问**:SORA是如何产生的**?

在OpenAI发布的技术报告中,SORA是这样描述的:SORA是一个“扩散变压器”。 在处理方式上与传统转换器(包括编码器和解码器)有相似之处,但它们处理的不是文本标签,而是称为“补丁”的视觉数据。

补丁实际上是大型模型在处理**和图像数据时将视觉数据分解成小块或小部分的一种方法。 通过将图像压缩成低维潜空间,将空间的身份分解为多个补丁,使模型能够更好地处理和生成高质量的图像内容。 这种方法的优点是它允许模型处理具有不同分辨率、持续时间和纵横比的视觉数据,从而为图像生成提供更大的灵活性和能力。

可视化编码过程。

“扩散变压器”是一种将扩散模型与变压器架构相结合的技术,它可以通过利用变压器处理数据之间复杂关系的能力,以及扩散模型逐步细化数据的策略,从嘈杂的数据中逐步恢复干净的数据来生成图像或**,从而在图像中生成或***“干净”的补丁。

让我们举个简单的例子,如果我们现在有一只狗**,我们可以一步一步地给这个**添加噪音,让它变得越来越模糊,最终它会变成一团乱七八糟的噪音。 如果我们把这个过程反转过来,我们也可以针对一堆杂乱无章的噪声一步一步地去掉噪声,并恢复到目标**,而扩散模型的关键就是学会反转噪声。

其实之前流行的《Midjourney》和《Stable Diffusion》的图像和**生成器也是基于扩散模型的,但不同的是,Sora可以一次将模型**制作成多帧,保证了主体即使离开视线也能保持不变,也展现了对影视拍摄语法的全新自发理解, 不仅可以跟随拍摄对象移动相机,还可以在移动镜头时改变角度。仍然可以保持图片的合理性和完整性。

SORA的另一个强项是它“继承”了OpenAI对文本的理解能力,可以根据提示词生成高质量的**和**,并且可以向前或向后扩展**,例如,在这个官网上展示的这个**中,SORA可以基于相同的**开头进行扩展,延伸到不同的结尾,或者从不同的开头介绍, 最后得到同样的结局。

所有三个开始最终都会导致相同的结局。

但事实上,OpenAI的野心远不止于此,SORA不仅仅是一个创造性的工具,它实际上是一个复杂的基于数据的模拟系统,能够模拟真实或想象的世界。 它通过学习如何正确渲染场景、模拟物理行为、执行长期推理和理解场景的含义来创建逼真的 3D 场景和动画。

这让它能够创造出很多现实中不存在的**,比如在下面的**中,提示“两艘海盗船在一杯咖啡中航行时互相争斗的逼真特写**”不仅要求Sora生成逼真的3D模型,还要让这些模型按照物理规则进行动画制作,并模拟液体的动力学, 并使用先进的渲染技术来达到**级的真实感,即使场景的语义在现实世界中不存在,但引擎仍然达到了我们期望的正确物理规则。

尽管SORA目前仍然存在缺陷,但它是一个很有前途的目标,通过构建如此复杂的仿真系统,我们可以对现实世界的数字交互进行建模和构建。 无论是谷歌、OpenAI还是马斯克的XAI,最终目标都是构建世界模型,比如电影《流浪地球2》中的MOSS就是强人工智能的化身,它可以通过构建真实世界的模型和强大的算力,推断出不同选择导致的结果,从而达到最终目标, 在很多人眼中,这可能是人工智能的终极形式。

但无论如何,这些都是以后的事情。

Sora真的会砸掉整个影视行业的工作岗位吗?

事实上,人工智能从诞生之日起就经常成为很多人幻想中的“假想敌”,而随着ChatGPT等新工具的开发,对AI的遥远恐惧逐渐演变成对手头工作的深深担忧,尤其是在SORA发布之后。

就SORA的产生能力而言,首当其冲的一定是影视从业者。 毕竟用传统方式制作1分钟的片段成本非常高,除了场景、灯光、演员之外,还需要提前沟通故事板,找到一个好的角度,考虑摄影机和演员的位置。 如果你需要一些特殊的因素,比如转瞬即逝的光影、理想的天气条件等,那么你就得赌运气了。

而这一切在SORA这里都不是问题,只要通过简单的提示语句,就可以直接生成**,并且与以往的AI工具相比,无论是**时长、画面的精细度,还是细节的完整性,甚至是多镜头拍摄,SORA都可以用“碾压”来概括, 这显然会对相关从业者产生更大的影响。

在网友们制作的模因图中,经典的好莱坞标志“好莱坞”变成了“索拉伍德”。

根据行业研究公司CVL Economics最近对好莱坞行业领导者的调查,焦虑目前笼罩着好莱坞,36%的受访者表示,生成式人工智能减少了对公司日常工作技能的需求,72%的受访公司是生成式人工智能工具的早期采用者。

其中,75%的受访者表示,生成式人工智能工具促使其业务部门削减了与合并相关的工作。 预计未来三年好莱坞将有超过20万个工作岗位受到人工智能的影响,尤其是视觉效果、音效艺术家和素描师等后期制作工作。

事实上,受影响的不仅仅是影视行业的人。 面对来自SORA的“降维攻击”,AI领域的一些创业者,比如RUNWAY首席执行官克里斯托瓦尔·瓦伦苏埃拉,已经做好了“游戏开启”的准备,有的像PIKA创始人郭文静开始准备一款以SORA为基准的新产品,也有像Stability AI首席执行官Emad Mostak这样的人,忍不住感叹“奥特曼真是个魔术师”,把SORA当成AI**全球的GPT-3瞬间。 这一次,很多人真的感受到了危机感。

风景应该是有远见的。

虽然 sora 真的很令人兴奋,但您不必对此过于焦虑。 一方面,在sora产生的**中,还有很多经典的“灵魂错误”。 例如,在许多**中,角色和动物会消失、变形或凭空变出克隆体; 也会有一些违背物理常识的“闹鬼”图像,比如一个人吹的蜡烛不变,篮球穿过篮筐,椅子漂浮和移动等。

在空产生的**中,老人吹灭蜡烛前后的火焰根本没有动,有点诡异。

另一方面,人工智能在创作逻辑上与人类完全不同,因此无法真正区分好故事和坏故事。 有很多人认为,机器生成的东西越多,对人类的创造就越珍贵,比如,带有“锅气”的食物往往比预制菜更好,体现工人努力的器皿不如机器准确,但具有更多的“温度”......这样的例子可以说无处不在,更不用说在影视中了,最能体现人类情感,囊括了各种艺术范畴。

比如,在很多电影场景中,在人物的表情、语气、表情背后,不仅有各种细腻的人类情感,更是半辈子的经历、情感和习俗的总和。

这些内容虽然看似不起眼,却无时无刻不在传达着大量的信息,而正是这些内容真正融入到每一个独特的人身上,也通过各种反应和互动,形成了人物之间的情感流动,正是这些细节的变化,默默地影响着我们的情感,带给我们感动, 这是生成式AI很难做到的,这或许是很多AI生成器“没有灵魂”的根本原因。

经典电影《黎明前的爱情》几乎全部由对白组成

此外,AI在影视行业的应用并不新鲜,此前横扫好莱坞最佳影片、最佳导演等7个奖项的《瞬时宇宙》都使用了Runway的AI**工具,去年21世纪福克斯曾与IBM Watson合作,使用AI工具为AI题材恐怖片《摩根》制作预告片, 迪士尼的漫威完全使用人工智能制作了《秘密入侵》的开场动画。

不久前,英伟达创始人黄仁勋在接受采访时表示,“在过去的10年或15年里,几乎每个人都会告诉你,学习计算机对孩子来说很重要,每个人都应该学习如何编程。 但其实恰恰相反,我们的工作就是创造计算技术,让没有人需要编程,让编程语言更加灵活,现在世界上的每个人都是程序员,技术鸿沟已经完全弥合了。 ”

而这似乎已经成为了AI时代的真实写照,无论是chatgpt-4还是SORA,在日新月异的新技术的帮助下,不懂编程语言的人也可以制作软件程序,没有影视相关技术背景的人也可以从容地制作自己的**,这无疑会走得更远, 激活新的产能,推动行业发展,甚至在人与人之间产生新的联系,这或许是生成式AI更大的意义。

我们有理由期待,未来,AI技术和电影或电视剧的制作必然会有更多的组合和创新,也许会出现一些我们从未想象过的精彩作品,给我们带来更多的惊喜。

相似文章

    张雪峰的社交焦虑或教育咨询

    张雪峰是一位颇具争议的教育顾问,他用自己的亲身经历和观察,为高考考生 研究生 专业人士提供了一套务实功利的 参考 受到广大考生和家长的高度推崇。借助社交网络 直播等新的传播矩阵,张雪峰的课程和观点经常一次又一次地引起广泛的关注和讨论。那么,这是教育咨询,还是在迎合和制造社交焦虑?陶博士说,这个世界会...

    人为制造焦虑,外卖小哥成为热搜,评论区真相大白!

    跟着我,我会定期分享一些有趣的故事和经验,一起交流教育经验。近日,一则大专毕业生下岗不送老婆送餐的新闻,引发网友热议。然而,这一事件被证实是一张摆拍的照片,这再次引发了人们对为什么摆姿势现象一再被禁止的思考。此外,随着春节的临近,为什么人为制造更多的焦虑也成为一个值得关注的问题。针对这些问题,通过评...

    人为制造焦虑,外卖大哥再上热搜,评论区网友爆出真相!

    跟着我,我会定期分享一些有趣的故事和经验,一起交流教育经验。近日,一段关于毕业生男子被妻子解雇送餐的段落,在社交网络上引发了广泛的讨论和热议。然而,后来这一段被证实是摆姿势,人们开始思考为什么摆姿势的行为一再被禁止。在即将到来的春节里,为什么总是有人为地制造更多的焦虑?评论区有网友透露了背后的真相。...

    在35岁时,我们的焦虑是减轻还是加重?

    岁,这个年龄被很多人称为 成立之年 但这个年龄真的让我们感到更加稳定和自信吗?事实上,很多人在岁时就面临着各种各样的焦虑和压力。那么,这些焦虑是减少还是加剧?首先,让我们来看看一些可能引起焦虑的情况。对于一些人来说,岁可能是一个年龄分界点,因为他们可能会觉得自己已经完成了许多重要的人生任务,比如结婚...

    铸铜雕塑厂家的艺术品还是制造缺陷?

    铸铜雕塑是一种古老的工艺,凝聚了时间的精华和文化的底蕴。然而,随着铸铜雕塑厂家的增加,这种艺术形式还能保持其原有的纯净和高品质吗?这个问题成为业界和消费者争论的热点话题。在这场争议中,一方面,铸铜雕塑制造商不得不面对如何在现代大规模生产过程中保持作品艺术性的问题。一件艺术品的独特性在于它的不可复制性...