Sora已经红了3天,业内人士纷纷表态

小夏 娱乐 更新 2024-02-20

北京时间2月16日凌晨,OpenAI发布了首款文盛**型号SORA。 该模型可以根据用户的输入文本提示描述生成一段 60 秒的内容。

近3天来,OpenAI和Sora占据了AI行业话题的中心,无论是AI工具的用户,还是马斯克、杨丽坤、周弘毅等科技巨头,都纷纷表达了自己的观点。 马斯克说“人类愿意赌输”; 周弘毅预测,“AGI的实现将从10年缩短到1年”。

OpenAI 首席执行官 SAM Altman 在社交平台 X 上积极与网友互动,也借此机会开始招聘:“OpenAI 是我在一个地方遇到的最有才华、最友善的一群人,致力于解决最困难、最有趣和最重要的问题,所有关键资源都到位,非常专注于构建 AGI(通用人工智能), 你也许应该考虑加入我们。 ”

业内人士怎么看?

2023年,文盛图和AI对话如火如荼,进展速度肉眼可见,但文盛**就像是AI慢慢开发的“金矿”,Runway、PIKA等创业公司纷纷浮出水面。 直到 2024 年初,OpenAI 发布了 SORA,并展示了 SORA 生成的多个 **,碾压了行业目前平均“4S”的 ** 代长,将生成质量提升到更高的水平。

在官方演示**中,Sora 可以直接输出多角色、多场景、多镜头移动的图片。 例如,一个提示是这样的:镜头走过东京繁华的街道,跟随几个人享受雪景和购物。 在Sora生成的**中,镜头从天空中的雪花中俯冲下来,跟随一对手牵着手穿过日式街道的情侣。

另一个例子是对东京街头一位时髦、时尚的女士的描述,充满了温暖的霓虹灯和充满活力的城市标志。

在Sora生成的**中,女士穿着黑色皮衣和红色裙子走在霓虹灯街道上,不仅主体连贯稳定,而且有多重镜头,包括从街景到女士面部表情的特写,以及霓虹灯反射在湿漉漉的街道地板上的光影效果。

*发布后,网友们在全世界的社交**上用无数种语言感叹:现实已不复存在。 行业大佬们从不同角度分析和评估SORA的。

马斯克在社交平台X上留言,如“人类甘愿赌输”、“人类会借助AI创造优秀作品”; 人工智能行业参与者之一Runway的联合创始人兼首席执行官克里斯托瓦尔·瓦伦苏埃拉(Cristobal Valenzuela)表示,过去需要一年的进步已经变成了几个月的问题,然后是几天和几个小时。

据**报道,出门问问创始人在朋友圈感叹道:“LLM ChatGPT是虚拟思维世界的模拟器,而基于LLM的**生成模型SORA是物理世界的模拟器,物理世界和虚拟世界都已经建模和模拟了,什么是现实? ”

此外,宏博股份副总裁、英博数码CEO周薇薇也分析了朋友圈里最让她感动的**,并称赞“从艺术的角度来看,空显然知道如何区分和合理搭配各种蒙太奇,意识流.......”从技术角度来看,这确实是......如此快速地完成稳定而复杂的 RTX”

她还直言不讳地表示,在AI时代,一步快,一步快,先发优势壁垒远超互联网时代,“赶超还是弯道超车? 过去很多骄傲的综合人才在强AI面前显得那么斑驳无力,与其当场叹息,不如向游戏低头,至少做一个精通工具的合格工具人。 ”

360集团创始人周弘毅在Sora发布后迅速发长微博和**,预测Sora可能会给广告行业、电影预告片、短**行业带来巨大的颠覆,但可能不会那么快击败TikTok,更有可能成为TikTok的创意工具。

他认为,大型语言模型的力量在于它们能够充分理解世界的知识。 以前,所有的文盛图和文生**都是在二维平面上的图形元素上操作的,不应用物理定律。

这一次,很多人从技术角度和产品体验来分析SORA时,强调它可以输出60秒**,保持多个镜头的一致性,模拟自然世界和物理定律,其实比较肤浅。 最重要的是,Sora的技术思维完全不同。 在SORA制作的**中,它可以像人类一样理解坦克具有巨大的冲击力,坦克可以撞车而不撞车。”

周弘毅认为,这也代表了未来的方向。 基于对人类语言的理解、人类知识和世界模型以及许多其他技术,我们可以创造各个领域的超级工具。 此外,SORA的出现可能意味着AGI的实施时间将从10年缩短到1年。

总部位于旧金山的早期投资人扎克·库科夫(Zak Kukoff)**,一个不到五人的团队,将利用文生模式和非工会劳工制作一部五年内票房收入超过5000万美元的电影。 很多国内AI创作者也在想象,一部由AI制作的电影会尽快到来。

OpenAI详细讲解技术突破点

SORA的出现,让文字变成了一场盛宴,除了震撼之外,相关技术也备受关注。

英伟达(Nvidia)高级科学家吉姆·范(Jim Fan)在X上表示,他看到了一些强烈的反对意见:“Sora不是在学习物理,它只是在2D中操纵像素。 Jim Fan说他不同意这种还原论的观点。

然后,他发帖说,SORA是一个数据驱动的物理引擎,可以模拟许多世界,包括真实的和幻想的。 “模拟器通过一些去噪和梯度数学来学习复杂的渲染、'直观'的物理、长期推理和语义基础知识。 ”

纽约大学助理教授谢森宁发表了多条分析SORA的推文,推测SORA是建立在扩散变压器模型之上的,整个SORA模型可能有30亿个参数。

当大家都在分析SORA在现有信息中的技术成就时,OpenAI却一反常态,公布了相关技术

我们探索了使用**数据来大规模训练生成模型。 具体来说,我们共同训练了一个扩散模型,其中文本作为**的输入,以及不同持续时间、分辨率和纵横比的图像。 我们引入了一种 transformer 架构,该架构对时空序列包和图像的潜在编码进行操作。 我们最先进的模型 Sora 已经能够产生长达一分钟的高保真度,这标志着生成领域的重大突破。

我们的研究结果表明,通过扩大生成模型的规模,我们有望构建可以模拟物理世界的通用模拟器,这无疑是一条很有前途的发展道路。 ”

本技术报告主要关注两个方面:第一,它详细介绍了一种将各种类型的视觉数据转换为统一表示的方法,从而实现生成模型的大规模训练; 其次,对SORA的能力及其局限性进行了深入的定性评估。

需要注意的是,本报告未涵盖该模型的具体技术细节。

此外,OpenAI还公开承认了SORA的一些缺陷:可能难以呈现复杂的物理变化,无法理解因果关系,以及令人困惑的空间细节。

例如,在演示**中,“五只灰狼幼崽在偏僻的碎石路上嬉戏追逐”,狼群数量会发生变化,有些会凭空出现或消失。

SORA目前被描述为研究的早期阶段,不打算供公众使用,因为该公司担心深度伪造的滥用**。 现在只有一部分视觉艺术家、设计师和电影制作人有内部试用机会。 许多业内人士,包括一些影视行业从业者,都表达了对全面开放之日的期待。

合成自OpenAI、21世纪经济报道社、X平台等。

相似文章

    知情人驳斥周海美去世传闻

    北京,月日 中国著名女演员周海美在社交媒体平台上传闻已去世。然而,根据许多权威人士的说法,我们郑重声明 周海梅的身体状况并不严重,现已脱离危险,这与网络谣言截然相反。周海美患病的真相,由一位现居北京 从事娱乐业的前TVB时事记者首次揭晓。该用户通过社交 发文,指出周海妹目前正在住院 虽然仍处于昏迷状...

    网上透露,周海妹意外离世,圈内人士连忙辟谣

    近日,一则关于香港女星周海美去世的消息在网络上疯传,引发了无数网友的关注和热议。据称,周海梅在北京顺义区的一栋别墅中被一名助手发现身体僵硬,并在送往医院的途中死亡,享年岁。这个消息震惊和悲伤了无数喜爱周海美的粉丝,并在社交平台上表达了对她的悲痛和怀念。然而,这个消息真的是真的吗?周海美终究是不是去世...

    白静庭事件越来越黑了! 圈内人集体给白静婷倒油!

    在这个浩瀚的娱乐圈里,每个人都在为自己的梦想和未来而努力。白景庭,这个名字近年来逐渐进入大众视野,他的演技 颜值和独特的个人魅力为他赢得了众多粉丝的喜爱。然而,随着人气的增长,他逐渐面临更多的挑战和考验。近日,白景庭因为 春山学 事件被推上了风口浪尖。央视春晚舞台上,因临时换衣强行占据C位被全网抨击...

    白静婷这次种下了,8位知情人公开爆料,吐槽他人品和演技都差

    白静霆的 上春山 里的风波愈演愈烈,现在娱乐圈里出来倒油的人不少,从他们的话语中,或许能看到一个更真实 更未经过滤的白静霆。第一 几位和白静霆合作拍戏的朋友都说白静霆在拍戏的时候犯了很多错误,死记不清字,演戏脾气不好,骂群演。第二 有业内娱乐记者说,他们从来没有夸过白静婷,一次都没有,你不明白是什么...

    知情人透露,五月天的口唇唱很难辨认,歌手怕自己没有对口型,很难取证

    近日,有业内人士对平台上的 事件做了分析,据这位业内人士透露,业内都知道他们在对口型,但取证难度比较大,并不是说观众会对口型,只要歌手坚持没有对口型,就很难识别。这位知情人透露了如何识别对口型,如果艺人有对口型,那么配合工作的一些工作人员一定知道,比如播放节目的老师 唱歌表演的人 音响工程师都知道。...