首先,SORA模型并不是第一个制造AI的,已经有Stable Diffusion Video和Pika,以及其他公司推出了自己的产品。 SORA的爆炸式增长主要归功于其自身强大的后端和OpenAI令人信服的认可。
空在交流上引爆了第二个圈子,第一个圈子是吃螃蟹的人,然后吃螃蟹的人在等待下一个螃蟹——空是第二个圈子,基于话题先驱的热度,进一步打破圈子,从AI爱好者向更多行业推进。
如果我们真的好奇下一个热点会是什么,那么我们可以在一些垂直领域找到最强大、最有深度的公司或团队,然后这些人的作品会指出下一个热点的方向。
但作为一个普通人,或者一个普通的学生,一个基于内容制作的上班族,或者一个只是来找乐子的普通人。 这个空只是提醒一下:原来世界上有这样一件我一开始就没有注意到的东西,它的影响力和颠覆性力量冲破了信息茧,来到了我们身边。 作为信息,他很有穿透力,所以值得尝试了解这件事。
SORA的背后是OpenAI,一个像人工智能世界的“苹果”一样的角色。 最初,引入了一个语言对话模型,通过一些知识库,该模型可以理解人类的知识和问题,从而回答它们——这个对话模型非常新颖,它是无穷无尽的问答,直到一方感到无聊或另一方出现系统故障(我认为这在传统的问答中是无法理解的, 然后我们可以更详细地讨论一下),然后各大公司也研究了类似的模型,各种产品诞生了(更像是模仿)。
人工智能理解文本,下一步就是理解**和声音,基于扩散模型(暂时不需要理解),可以很好地学***或声音,然后分别诞生了midjourney和stable diffusion两个模型(openai在这个领域也有dalle系列),并不是说其他产品不重要, 但核心产品就是这三个,可以根据语言制作**。
值得一提的是,扩散可以单独做声音,但是没有自己的应用场景,只能在**制作软件中起到配音的作用。 随后,在完成文字和语音的突破后,AI巨头们开始思考如何攻克生产难点。 **可以理解为逐帧**+声音的组合,所以基本模式是扩散模型,通过逐帧制作**得到。
率先在鼠兔中赢得投资。 随后,Stable Diffusion 也推出了 **production,Stable Diffusion Video(SDV),此时,制作效果进一步提升,几个月后,直到今天,SORA 也推出了,其 demo** 的综合质量优于其他两款**,因此广受好评。 不过,基于通用扩散模型内核,本质上还是依仗训练数据、提示词技能的AI,效果高低两下。
如果你愿意在这波SORA下进入圈子,欢迎关注这个账号,继续输出AI领域的动态和想法。