继ChatGPT之后,OpenAI又推出了另一款震惊科技圈的产品——SORA! 今天就让我们仔细看看吧!
什么是SORA?
SORA是OpenAI首款**生成模型,通过文字指令,可直接输出长达60秒**,并包含高度详细的背景、复杂的多角度镜头,以及情感丰富的多个角色,出道是王者炸弹!
SORA建立在过去对DALL·E 和 GPT 模型。它使用 Dall·e 3 的重述提示技术,为视觉训练数据生成高度描述性的注释,因此能够更忠实地遵循用户的文本指令。
SORA有什么颠覆性?
生成 ** 的时间长度。 在SORA之前,由于从AI文本到**生成的物理和时空推理的局限性,目前全行业发布的单个连贯性的最大长度为16秒,行业内一般水平在2-4秒之间。 不过,SORA这次的最大支持时长为60秒,直接跳升升级为15次。
相机剪辑和平滑度。 此前,AI生成的**产品都是单次单代,在效果层面,更像是做了一个**动作。 不过,SORA生成的**,在保持主体一致性的前提下,可以实现多角度镜头的无缝切换,整体画面干净流畅,从而达到真正的大片效果。
使用的基础模型体系结构。 上一代AI**大多是基于“大模型+大数据”的架构,因此很难突破AI错觉问题,Runway在去年12月也正式提出要搭建通用世界模型。 不过,这一次SORA已经有了世界模型的原型,它的生成是基于对真实物理世界的理解,所以内容更加合乎逻辑和说服力。
让我们一起来看看一些官方发布,感受一下SORA的魅力吧!
提示:东京在下雪后熙熙攘攘。 镜头穿过繁忙的街道,跟随几个人享受美丽的雪景,并在附近的摊位购物。 美丽的樱花花瓣随着雪花在风中飘扬。
小贴士:一场海上自行车比赛**,让各种动物以运动员的身份骑自行车,使用无人机射击视角。
小贴士:一位祖母的网红主持了一堂自制的饺子烹饪课,背景是带有电影灯光的质朴的托斯卡纳乡村厨房。
现在可以尝试一下吗?
目前,SORA不对外开放,只向专业人士提供极少数测试账号,门槛非常高。 但也有比较简单的测试方法,建议感兴趣的合作伙伴参考官方示例,写好**提示词,打开某个推送,去找@openai创始人Sam Altman,等待回复