SORA对国内各大厂商来说是机遇还是挑战?

小夏 科技 更新 2024-02-26

正文|陆九商业评论

撇开技术路线不谈,单从实现效果来看,国内大型样板企业在发电量上是否也有同样的“腾飞机会”?

龙年正月,就像去年的ChatGPT一样,OpenAI以文盛领域的另一颗王弹——SORA开启了新的一年。

面对这样的AI生成能力,包括几乎所有类型的从业者,他们都感受到了很大的震撼。 一位有IT背景的电影制片人告诉《陆九商业评论》,索拉的惊人表演让身边的从业者产生了危机感。 电影制作成本的急剧下降,以及新电影制作人的出现,将比以往任何时候都更容易。

然而,面对陆九《商业评论》提出的“SORA是否具备商业化条件”、“文盛**对算力有更高的要求以及如何解决”等问题,该制片人以“发展问题,发展解决方案”的表述回答。

这显然过于乐观了。 毕竟,更多的从业者认为,从概念到成熟的工商业阶段,就算是SORA也有很多不成熟的地方。

因此,撇开技术路线不谈,单就实施效果而言,文盛文等在通用车型上有相关布局的国内大型模型厂商,是否也有同样的“腾飞机会”? 文盛**,与过去的文盛文相比,有哪些实质性的飞跃? 这是一个有趣的话题。

Sora,革命还是泡沫? 必须承认,SORA的出现使通用人工智能(AGI)的实现更近了一步。 这样做的原因是它已经能够模拟真实物理世界的运动,例如物体的运动和相互作用。

然而,仅凭这种程度的改进并不是“惊人的”。 根据OpenAI的官方报告,SORA的“革命性”主要体现在以下几点。

首先是持续时间。 作为一般的文盛**大模型,它可以根据用户提供的文字描述生成长达60秒的**,不仅质量高,而且可以更完整、更准确地还原用户输入的提示,即提示词。

其次,在场景的复杂度和角色生成的层面上,都是一次突破。 到目前为止,Sora 已经能够生成包含多个角色、特定动作类型和主题的场景,这些场景精确且具有复杂的背景细节。 而镜头语言也开始复杂化,这让**本身开始具备了一定的叙事功能,而这正是当下短**领域所需要的。

第三,除了文本生成外,SORA还可以从静态图像中对图像进行动画处理,或者从现有图像中生成新图像,从而填补缺失的帧或扩展内容。

一位资深科技人士告诉陆九经营导报,SORA等AI产品的出现,是一次“平等思考”的机会,因为一些长期跟踪行业的科技记者,往往有一些“开脑”的想法,但是没有合适的工具让想法落地。 但是有了GPT和SORA这样的AI工具,一旦记者看到一个机会和一个想法,AI可能会帮助他实现产品,剩下的就是验证产品的可行性。

不过,在与众多行业人士交流后,《陆九商业评论》发现,就算是现在的风光无限,也有被高估的可能。

在他看来,SORA的出现很大程度上是文盛文的通用模式,延伸到了最前沿领域的舞台技术迭代。 SORA今天能有质的变化,很大程度上要归功于算力和资金的无上限投入,以及海量训练集的不断重复,这是“大力创造奇迹”的结果。

相较于技术实现的优越性,SORA在“资源禀赋”方面的优势,显然与国内众多“算力不足”的厂商相距较大。 这是国内大型模型相关厂商长期以来无法逾越的差距。

从投资角度来看,SORA等垂直领域的“通用模型”并不是热门目标。

一位一级市场从业者告诉陆九商业评论,纯一级市场投资通常只投资大概念和高估值标的。 主要原因是一级市场存续期为7年,投资期为2年,退出是5年内的高概率事件。 不过,谁也说不准文盛的垂直模式能否在5年内实现产业化和商业化。

此外,目前SORA的所有已知信息都只是2月15日发布的技术报告,但融资的消息是在3天后传出的。 在没有开放使用且外界不知道其实际水平的情况下,在风险投资公司Thrive Capital领投的融资中,OpenAI的估值已接近800亿美元。 这位一级市场从业者向陆九商业评论坦言,此次技术发布很可能是OpenAI“估值管理”的一部分。

昆仑万维董事长周亚辉在朋友圈表示,“这里(硅谷)的科学家和工程师根本不认可Open Al以外的创业公司的价值,觉得他们都是纸上财富。 我宁愿openaiGoogle、FB Microsoft 100 万包(半**)报价,而不要启动 300 万(80%**)报价。 ”

可以看出,在SORA之后,OpenAI进一步拉大了与其他AI厂商的差距。

虽然Meta、谷歌和Microsoft都做好了出手的准备,但相比于SORA上资本市场的狂热,国内大型模型厂商要平静得多。 国内各大厂商大多选择根据自身应用开发大模型,而不是追求所谓的原始AI大模型升级。

Byte 就是其中之一,其对生成式 AI 的保守态度早在文盛阶段就已经体现出来了。 而且从输入时间的角度来看,字节并不迟到。 根据后来的一份报告,在 OpenAI 于 2020 年 6 月发布 GPT-3 后,Byte 训练了一个具有数十亿个参数的大型生成语言模型。

如果按部就班地发展起来,到2023年,字节和OpenAI的GPT之间的距离不会很远。 只不过,在ROI的业务体系下,Byte的投资显然没有被计算出来。 因此,它对生成式人工智能的探索一直比竞争对手慢。

从上映时间来看,文心一言将于2023年3月上映,迭代至4版本 0,紧随其后的是阿里的通益千问和腾讯混元助手,而字节发布的云雀模型的发布时间是 2023 年 8 月。

后者导致的结果之一就是用户不足——文心艺言去年月活跃度突破1亿,豆袋字节数仍低于1000万。 不过,在Byte选择张楠负责建英之后,预计生成式AI的进展会快一些。

如果Byte没有看到在文盛领域可以立即使用的产品**,那么阿里就不是这种情况了。 早在去年的世界大会上,文心一言的文生**能力就已经展示出来了,主要集成在“一镜影”插件中。

当然,出现在世界大会上的这一代**只是无数扭蛋中的成功案例。 陆九的商业评论发现,一镜到底的拍摄还是有一些局限性的。

一个是材料库。 目前,One-Shot Streaming 使用无版权素材库,无法将其用于特定品牌的工业商业用途。

二是目前无法用肖像生成**,但由于可能拥有肖像权,可以用来生成未注册商标的商品**。

第三是目前生成的**在30秒左右,如果想达到与SORA类似的效果,还需要做两种**材质的拼接。 如果你想保持内容和风格的一致性,这显然会变得困难。

目前,通益千问是使用最多、最受欢迎的相关技术,以民族舞王为代表。 只需要一张全身照片,就可以让他们表演各种流行的舞蹈动作。 在B站,与慈禧等历史人物的第二次创作,加起来大约有1000万。

虽然还没有达到产业化的水平,也没有拉平与国外SORA的差距,但国外SORA也没有实现产业化,这意味着至少在商业化过程中,两者之间还有不大的距离。 其余的只需要继续追赶。

星星AI董事长李明顺也持类似观点。 他告诉陆九商业评论,目前,OpenAI仍然占据着行业头部的位置,但很大程度上是基于之前的算力储备和技术积累。 BAT和bytes等国内厂商将继续迎头赶上。 原因很简单,从某种程度上说,通用模式已经成为互联网企业基本能力的象征。

比赛似乎才刚刚开始。

文生**,真正的赢家在哪里? 当然,无论是OpenAI的SORA还是国内多家大型模型厂商,其最终目标依然是产业化、精简优质内容的制作。

但目前,即使它像SORA一样强大,也存在许多不成熟的因素,使其无法应用于工业化领域。 AI动态**解决方案产品智行源(www.)。creatlyai.CN)产品架构师告诉陆九经营评论,虽然SORA目前看起来非常方便,但高质量的**可以通过文字直接生成,只需要几个提示词来控制,对用户思想和操作的负担似乎很小。

然而,由于目前SORA对真实物理世界的了解有限,在某些场景中仍然会出现问题。 烛光的误导、精度的无序数字、空间物体进出的失真等细节,在后期剪辑中很难改变。

这并非没有解决方案。 由于SORA目前具有扩展和拼接功能,因此用户可以生成几秒钟的后期裁剪。 如果对于对提示词工程了解不足的人来说,很难避免多代+人工后期制作。

此外,在工业产品宣传片中,客户通常会发布一些**产品,如**羽绒服、新车、新手机等。 但是,用户的素材在**模型的训练集中并不存在,导致只生成了类似的产品,然后进行再加工,也就是在影视后期。

同样,专业用户和非专业用户的需求是有区别的。 例如,对于普通的轻度用户来说,如果没有商业需求,那么模型就是演示产品,任何新生成的作品都会给他带来惊喜。 但是,对于专业用户(如导演)来说,如果一次性生成不尽如人意,那么还涉及多代、多次后期制作,对算力和人力来说都是很大的负担。

上述电影人告诉陆九商业评论,在影视制作过程中,后期最大的成本是负责剪辑和特效,也就是二次加工的人工成本。 如果工作流程不够先进,很可能会在后期制作过程中推高成本,进而影响项目的投资回报率。

如果说现在的文盛还需要大量的人工调整,镜头和物理世界的还原不可能是1:1,那么用AI生成**材质的性价比其实并不高。

基于此,一位影视后期制作从业者告诉陆九商业导报,在他看来,AI能直接替代的,其实是建设、拍摄等中期工作。 由于AI可以模拟和还原物理世界,因此可以对其进行不断的训练以接近真实水平。

以上只是SORA对影视行业变化的部分推论。 至于游戏、广告、短片创作等细分领域,变化必须远远超过问题。 人工智能的应用及其革命性的变化无疑是宏伟的。 不过,国内大型厂商显然更愿意在AI应用的商业化方面下功夫和尝试。

同样,根据周雅辉的朋友圈剧透,“开放人工智能即将发布GPT4”。5、估计在Anthropic发布克劳德3的时候会特意放出来。 “除了SORA生成**,最新迭代的Open AI还有什么惊人的创新,这应该是国内从事大模型战略和业务部门的厂商最关心的事情。

最后,对于文盛**来说,是立足+AI做大规模模型应用,还是基于AI+训练升级自己原有的大规模模型。 显然,美国大公司和中国大公司已经做出了自己的选择。

相似文章

    SORA是一场革命还是创新,人工智能的未来会是什么样子?

    这几天,科技界出现了一则重磅消息,那就是OpenAI推出了文本生成工具Sora,在世界范围内引起了轰动。这个工具到底有多强大,不管是革命还是创新,下面我简单说说我对AI的看法。SORA工具与上一代软件不同,很多人可能不了解,感觉这样的事情已经存在很久了。比如之前替换明星脸 的功能和美颜功能,都不是A...

    白酒股,是风险还是机遇?

    稍有想法。白酒与我之前的判断基本一致,白酒企业库存压力会因为部分经销商业绩平平而推迟半年到一年,会反馈到上市公司半年到一年的财务报表中。今年订货会延期召开,不是捂耳抢钟,而是直截了当地告诉市场,白酒的库存压力是实实在在的。白酒是一个很好的商业模式,但近年来的高景气度引发了白酒企业的持续扩张计划,这与...

    是运营失败还是大型工厂之间的争斗?2024年部分手游将暂停盘点

    在这个时代,手游被暂停的情况并不少见,当一款游戏失去新鲜感,或者玩法没有吸引力,导致流水数据不佳时,等待的结果往往是关闭服务器,毕竟老板不吃饭,员工还得吃饭。而在年,宣布暂停服务的游戏不在少数,但这些游戏除了正常的运营问题外,也难免是厂商之间的斗争 致恶魔忍者Gogo 看到这个标题,应该有很多老司机...

    外卖和网约车,是机遇还是陷阱?

    随着外卖网约车行业的快速发展,越来越多的人加入这个行业,导致从业人员竞争激烈,收入不稳定。近期,部分地区甚至发布了网约车市场饱和的警告,提醒有意进入该行业的人士慎重考虑。在这个 卷起来 的时代,我们不仅要思考如何应对竞争,还要思考自己的职业规划和未来发展。作为从业者,你应该了解你所处行业的发展趋势和...

    600个工作组,是压力还是机遇?女人离职后,怎么能轻易摆脱工作?

    近日,一则商场设计师离职后退出多个工作小组的新闻,引发了广大 上班族 的热议。设计师每天的工作量如此之大,让人忍不住感叹她的辛苦和压力。据介绍,设计师在从事商场房地产设计时,已经积累了多个工作小组,因为每个商场都有上百家门店,需要逐一审核店面设计图纸。每天,她都需要随时回复这些群言,神经总是紧绷着。...