谁能想到OpenAI的王邦会留到这个时候,但从奥特曼迄今为止的表现和公众态度来看,空是否是最后一张底牌还是未知数。
SORA是由知名AI研究机构OpenAI开发的一款可以从文本描述中生成**的AI模型。
sora这个名字来源于日语中的“sora”,意思是天空,以展示其无限的创造潜力。 其背后的技术是在 OpenAI 的文本到图像生成模型 DALL-E 的基础上开发的。 该模型的训练数据包含公开可用的**和授权用于训练目的的版权****,但 OpenAI 没有透露训练数据的确切数量和确切数量**。
在 Sora 之前,该领域已经有其他几款文生**型号,包括 Meta 的 Make-A-Video、Runwa 的 Gen-2 和谷歌的 Lumière,最后一个型号于 2024 年 2 月发布,仍处于研究阶段。 Sora 的开发公司 OpenAI 于 2023 年 9 月发布了 Dall E 3,这是其 Dall-E 文生图模型的第三个版本。
SORA背后的技术基于All E 3模型。 根据 OpenAI 的说法,SORA 是一种扩散变压器——一种使用变压器作为降噪器的去噪电位扩散模型。 通过对 3D“补丁”进行去噪,它会在潜在空间中生成,然后通过解压缩器将其转换为标准空间。 重新生成的标题用于通过在文本转文本模型上创建详细的标题来增强训练数据集。
OpenAI 于 2024 年 2 月 15 日向公众展示了 SORA 生成的多个 HD**,称该模型能够生成长达一分钟的 **。 同时,OpenAI也承认该技术存在一些缺点,包括难以模拟复杂的物理现象。 《麻省理工科技评论》报道称,这些演示令人印象深刻,但指出它们可能是经过精心挑选的,并不一定代表SORA生成的一般水平。
由于担心SORA可能被滥用,OpenAI表示目前没有计划向公众发布该模型,而是让一小群研究人员有限地了解该模型的潜在危害。 SORA 生成的 ** 使用 C2PA 元数据进行标记,以指示它们是由 AI 模型生成的。 OpenAI 还与一小群创意专业人士分享了 SORA,以获得有关其实用性的反馈。