正文|陆九商业评论撇开技术路线不谈,单从实现效果来看,国内大型样板企业在发电量上是否也有同样的“腾飞机会”?
龙年正月,就像去年的ChatGPT一样,OpenAI以文盛领域的另一颗王弹——SORA开启了新的一年。
面对这样的AI生成能力,包括几乎所有类型的从业者,他们都感受到了很大的震撼。 一位有IT背景的电影制片人告诉《陆九商业评论》,索拉的惊人表演让身边的从业者产生了危机感。 电影制作成本的急剧下降,以及新电影制作人的出现,将比以往任何时候都更容易。
然而,面对陆九《商业评论》提出的“SORA是否具备商业化条件”、“文盛**对算力有更高的要求以及如何解决”等问题,该制片人以“发展问题,发展解决方案”的表述回答。
这显然过于乐观了。 毕竟,更多的从业者认为,从概念到成熟的工商业阶段,就算是SORA也有很多不成熟的地方。
因此,撇开技术路线不谈,单就实施效果而言,文盛文等在通用车型上有相关布局的国内大型模型厂商,是否也有同样的“腾飞机会”? 文盛**,与过去的文盛文相比,有哪些实质性的飞跃? 这是一个有趣的话题。
Sora,革命还是泡沫? 必须承认,SORA的出现使通用人工智能(AGI)的实现更近了一步。 这样做的原因是它已经能够模拟真实物理世界的运动,例如物体的运动和相互作用。
然而,仅凭这种程度的改进并不是“惊人的”。 根据OpenAI的官方报告,SORA的“革命性”主要体现在以下几点。
首先是持续时间。 作为一般的文盛**大模型,它可以根据用户提供的文字描述生成长达60秒的**,不仅质量高,而且可以更完整、更准确地还原用户输入的提示,即提示词。
其次,在场景的复杂度和角色生成的层面上,都是一次突破。 到目前为止,Sora 已经能够生成包含多个角色、特定动作类型和主题的场景,这些场景精确且具有复杂的背景细节。 而镜头语言也开始复杂化,这让**本身开始具备了一定的叙事功能,而这正是当下短**领域所需要的。
第三,除了文本生成外,SORA还可以从静态图像中对图像进行动画处理,或者从现有图像中生成新图像,从而填补缺失的帧或扩展内容。
一位资深科技人士告诉陆九经营导报,SORA等AI产品的出现,是一次“平等思考”的机会,因为一些长期跟踪行业的科技记者,往往有一些“开脑”的想法,但是没有合适的工具让想法落地。 但是有了GPT和SORA这样的AI工具,一旦记者看到一个机会和一个想法,AI可能会帮助他实现产品,剩下的就是验证产品的可行性。
不过,在与众多行业人士交流后,《陆九商业评论》发现,就算是现在的风光无限,也有被高估的可能。
在他看来,SORA的出现很大程度上是文盛文的通用模式,延伸到了最前沿领域的舞台技术迭代。 SORA今天能有质的变化,很大程度上要归功于算力和资金的无上限投入,以及海量训练集的不断重复,这是“大力创造奇迹”的结果。
相较于技术实现的优越性,SORA在“资源禀赋”方面的优势,显然与国内众多“算力不足”的厂商相距较大。 这是国内大型模型相关厂商长期以来无法逾越的差距。
从投资角度来看,SORA等垂直领域的“通用模型”并不是热门目标。
一位一级市场从业者告诉陆九商业评论,纯一级市场投资通常只投资大概念和高估值标的。 主要原因是一级市场存续期为7年,投资期为2年,退出是5年内的高概率事件。 不过,谁也说不准文盛的垂直模式能否在5年内实现产业化和商业化。
此外,目前SORA的所有已知信息都只是2月15日发布的技术报告,但融资的消息是在3天后传出的。 在没有开放使用且外界不知道其实际水平的情况下,在风险投资公司Thrive Capital领投的融资中,OpenAI的估值已接近800亿美元。 这位一级市场从业者向陆九商业评论坦言,此次技术发布很可能是OpenAI“估值管理”的一部分。
昆仑万维董事长周亚辉在朋友圈表示,“这里(硅谷)的科学家和工程师根本不认可Open Al以外的创业公司的价值,觉得他们都是纸上财富。 我宁愿openaiGoogle、FB Microsoft 100 万包(半**)报价,而不要启动 300 万(80%**)报价。 ”
可以看出,在SORA之后,OpenAI进一步拉大了与其他AI厂商的差距。
虽然Meta、谷歌和Microsoft都做好了出手的准备,但相比于SORA上资本市场的狂热,国内大型模型厂商要平静得多。 国内各大厂商大多选择根据自身应用开发大模型,而不是追求所谓的原始AI大模型升级。
Byte 就是其中之一,其对生成式 AI 的保守态度早在文盛阶段就已经体现出来了。 而且从输入时间的角度来看,字节并不迟到。 根据后来的一份报告,在 OpenAI 于 2020 年 6 月发布 GPT-3 后,Byte 训练了一个具有数十亿个参数的大型生成语言模型。
如果按部就班地发展起来,到2023年,字节和OpenAI的GPT之间的距离不会很远。 只不过,在ROI的业务体系下,Byte的投资显然没有被计算出来。 因此,它对生成式人工智能的探索一直比竞争对手慢。
从上映时间来看,文心一言将于2023年3月上映,迭代至4版本 0,紧随其后的是阿里的通益千问和腾讯混元助手,而字节发布的云雀模型的发布时间是 2023 年 8 月。
后者导致的结果之一就是用户不足——文心艺言去年月活跃度突破1亿,豆袋字节数仍低于1000万。 不过,在Byte选择张楠负责建英之后,预计生成式AI的进展会快一些。
如果Byte没有看到在文盛领域可以立即使用的产品**,那么阿里就不是这种情况了。 早在去年的世界大会上,文心一言的文生**能力就已经展示出来了,主要集成在“一镜影”插件中。
当然,出现在世界大会上的这一代**只是无数扭蛋中的成功案例。 陆九的商业评论发现,一镜到底的拍摄还是有一些局限性的。
一个是材料库。 目前,One-Shot Streaming 使用无版权素材库,无法将其用于特定品牌的工业商业用途。
二是目前无法用肖像生成**,但由于可能拥有肖像权,可以用来生成未注册商标的商品**。
第三是目前生成的**在30秒左右,如果想达到与SORA类似的效果,还需要做两种**材质的拼接。 如果你想保持内容和风格的一致性,这显然会变得困难。
目前,通益千问是使用最多、最受欢迎的相关技术,以民族舞王为代表。 只需要一张全身照片,就可以让他们表演各种流行的舞蹈动作。 在B站,与慈禧等历史人物的第二次创作,加起来大约有1000万。
虽然还没有达到产业化的水平,也没有拉平与国外SORA的差距,但国外SORA也没有实现产业化,这意味着至少在商业化过程中,两者之间还有不大的距离。 其余的只需要继续追赶。
星星AI董事长李明顺也持类似观点。 他告诉陆九商业评论,目前,OpenAI仍然占据着行业头部的位置,但很大程度上是基于之前的算力储备和技术积累。 BAT和bytes等国内厂商将继续迎头赶上。 原因很简单,从某种程度上说,通用模式已经成为互联网企业基本能力的象征。
比赛似乎才刚刚开始。
文生**,真正的赢家在哪里? 当然,无论是OpenAI的SORA还是国内多家大型模型厂商,其最终目标依然是产业化、精简优质内容的制作。
但目前,即使它像SORA一样强大,也存在许多不成熟的因素,使其无法应用于工业化领域。 AI动态**解决方案产品智行源(www.)。creatlyai.CN)产品架构师告诉陆九经营评论,虽然SORA目前看起来非常方便,但高质量的**可以通过文字直接生成,只需要几个提示词来控制,对用户思想和操作的负担似乎很小。
然而,由于目前SORA对真实物理世界的了解有限,在某些场景中仍然会出现问题。 烛光的误导、精度的无序数字、空间物体进出的失真等细节,在后期剪辑中很难改变。
这并非没有解决方案。 由于SORA目前具有扩展和拼接功能,因此用户可以生成几秒钟的后期裁剪。 如果对于对提示词工程了解不足的人来说,很难避免多代+人工后期制作。
此外,在工业产品宣传片中,客户通常会发布一些**产品,如**羽绒服、新车、新手机等。 但是,用户的素材在**模型的训练集中并不存在,导致只生成了类似的产品,然后进行再加工,也就是在影视后期。
同样,专业用户和非专业用户的需求是有区别的。 例如,对于普通的轻度用户来说,如果没有商业需求,那么模型就是演示产品,任何新生成的作品都会给他带来惊喜。 但是,对于专业用户(如导演)来说,如果一次性生成不尽如人意,那么还涉及多代、多次后期制作,对算力和人力来说都是很大的负担。
上述电影人告诉陆九商业评论,在影视制作过程中,后期最大的成本是负责剪辑和特效,也就是二次加工的人工成本。 如果工作流程不够先进,很可能会在后期制作过程中推高成本,进而影响项目的投资回报率。
如果说现在的文盛还需要大量的人工调整,镜头和物理世界的还原不可能是1:1,那么用AI生成**材质的性价比其实并不高。
基于此,一位影视后期制作从业者告诉陆九商业导报,在他看来,AI能直接替代的,其实是建设、拍摄等中期工作。 由于AI可以模拟和还原物理世界,因此可以对其进行不断的训练以接近真实水平。
以上只是SORA对影视行业变化的部分推论。 至于游戏、广告、短片创作等细分领域,变化必须远远超过问题。 人工智能的应用及其革命性的变化无疑是宏伟的。 不过,国内大型厂商显然更愿意在AI应用的商业化方面下功夫和尝试。
同样,根据周雅辉的朋友圈剧透,“开放人工智能即将发布GPT4”。5、估计在Anthropic发布克劳德3的时候会特意放出来。 “除了SORA生成**,最新迭代的Open AI还有什么惊人的创新,这应该是国内从事大模型战略和业务部门的厂商最关心的事情。
最后,对于文盛**来说,是立足+AI做大规模模型应用,还是基于AI+训练升级自己原有的大规模模型。 显然,美国大公司和中国大公司已经做出了自己的选择。