空不靠蛮力,大厂忙着开盲盒

小夏 宠物 更新 2024-02-23

正文|数智一线赵艳秋.

编辑|牛辉.

春节开学后的一周,国内人工智能圈和SORA技术相关各大厂商对OpenAI宣布SORA的反应,与**上的热情形成了鲜明的对比。

OpenAI越来越闭源化,几乎没有具体信息,中国仍处于开盲盒阶段。 不得不承认,SORA是算法组合、数据选择、训练策略、算力优化等能力的结合,虽然这些技术可能不是OpenAI独创的,但OpenAI对它们的深刻洞察,以及精湛的系统构思和设计能力,做出了“颠覆性”的突破,而不是简单的蛮力。

面对如此大规模的系统项目,国内人工智能圈在各个方面仍需补充。

01 各大厂商的反应 本周,字节、阿里巴巴、腾讯、华为、浪潮等公司均未发声。 一些相关厂商的研发团队正在“开箱”,信息绝对保密,“SORA将影响公司今年的产品研发计划”。 ”

值得注意的是,大型厂商中高层对SORA的积极关注和洞察程度,一般不如去年ChatGPT上线后那么迫切和深入。

在各大工厂的内网上,核心研发团队之外的“吃瓜群众”零星发帖讨论,“别说讨论热度了”,就连国内各大人工智能工厂的内网都是“零贴”。 这种情况与**上的热搜新闻,甚至对中美差距拉大的哀嚎截然不同。

然而,一些较快的举动也可以让人瞥见该行业的一些紧迫感。 2月17日,SORA发布后的第二天,Alimo社区发起了对SORA技术路径的分析,文章非常火爆; 2月18日,学校推出SORA口译系列课程; 春节刚过,浪潮相关业务已经向SORA提交了分析报告。 许多大型工厂都安排了与其业务线相关的研究和报告业务,其中一些工厂将在本周进行SORA分析和研究。

由于OpenAI透露的信息很少,不像ChatGPT上线后对技术的一些具体分析,SORA的分析有更多的猜测成分,而具体依据较少。

从各大工厂员工的内部讨论中,大家都聚焦在几个方向:SORA的技术机制,包括SORA能否成为真实世界的模拟器; 计算能力; 商业方向和时机。 目前,关于技术机制的“谜团”还很多; 关于算力消耗的猜测也令人困惑; 在SORA商业时间方面,**从一个月到半年不等,一般认为速度会很快。

从 OpenAI 的行动来看,包括 SORA、ChatGPT、Dalle 和一直强调的代理,OpenAI 可能会在今年下半年发布 GPT5,这将是真实代理的第一个版本。 以这个代理为例,以后如果你想做一个应用,GPT5可以自动生成**,打包部署,包括应用,配置域名,最后生成一个可访问的APP。 这些猜测还表明,每个员工的未来工作正在被重塑。

虽然在大厂论坛上对技术差距的哀嚎不多,但员工们在交流中却有抱怨和无奈。 不过,也有人认为SORA对国产AI超级有利,因为在全球空头市场中,Byte、腾讯、快手占据了前三名,大家都知道SORA原理是基于国内现有的GPU算力,推测“如果快一年”, 中国将有类似产品推出。

02 OpenAI不依赖蛮力,业界纷纷关注SORA的惊人效果,这要归功于新的算法组合和训练策略。 不过,与ChatGPT类似,单纯在具体算法上,并不是OpenAI的原创。

SORA在算法组织和数据训练策略上投入了大量精力,以充分挖掘算法和数据的潜力,并学习更深入的知识。 云之盛董事长梁佳恩表示,OpenAI通过架构设计和训练策略,而不是简单的算法改进,持续刷新行业认知。 这反映了OpenAI对算法和数据潜力的深刻洞察,以及其独创的系统构思和设计能力,而不是简单地用“蛮力”来做出这样的“颠覆性”突破。

在SORA正式宣布后,纽约大学的谢森宁对其技术进行了推测。 由于谢赛宁与SORA团队关系密切,他的猜测影响广泛,尤其是他猜测“SORA参数可能为30亿”。

有些人认为 30 亿参数有一定的道理。 据一位资深人士分析,SORA产生的最佳效果是惊人的,但存在很多细节问题,应该先是OpenAI大显身手,OpenAI将进一步扩展模型; 另一位资深人士从算力角度直观分析,**是立体的,单元处理所需的算力非常大,如果SORA参数太大,算力就会不足。

不过,也有业内人士认为“30多亿”。

30亿个参数,我认为这是误导性的。 一位简短的人工智能资深人士告诉 Digital Intelligence Frontline,“SORA 依靠 OpenAI 最强大的语言模型来生成字幕(字幕、字幕)。 在Sora提供的技术报告中,他们简要描述了他们如何设计自动化技术,生成文本描述,或将简短的用户提示转换为较长的详细描述,以提高整体质量。

而从OpenAI摸索人工智能边界的风格来看,也有人认为30亿太小了。 “这与它一直以来的做法不符,它们都是'奇迹'。 中科神智CTO宋健对数智一线表示,其实理论上已经指出了这条路,很多企业也尝试过。

一位Wave消息人士表示,SORA的突破再次证明AI是一种系统工程,纯粹的静态推测参数可能没有意义。

在生成方面,过去大家的难点是很难保持**的连贯性或一致性,因为有很多事情违背了常理,比如光影错,空间变形,所以业界想不通。

根据公开的信息,OpenAI 最终是否会采用更大规模的参数尚不清楚,但我怀疑他们肯定会以自己的风格尝试。 梁佳恩表示,此前,OpenAI从GPT2做GPT3的时候,就坚信,只要算法架构合理,通过超大规模的无监督学习,就有可能通过小样本甚至零样本学习击败监督学习,这是OpenAI对规模效应的坚定信念。 “这一次,SORA通过算法组合和数据设计,学到了更多符合物理定律的'知识',这符合OpenAI多年来的一贯风格。 ”

然而,SORA还不能被称为物理世界的适当模拟器。 在它生成的**中,存在大量错误。 OpenAI本身也在其技术报告中提出,这是一个很有前途的方向。

人们对SORA有不同的需求。 “如果你现在正在做一个数字孪生,你不妨直接用物理引擎作为底层来构建它,就像NVIDIA的Omniverse一样,它并不完全是物理的,但它已经非常准确了。 宋健说,“但对于视觉艺术来说,是关于视觉感性的,反物理也没关系,只要在视觉上给大家足够好的冲击力就行了。 ”

03 算力猜想 “现在大家对算力的猜测非常混乱。 一位英伟达消息人士告诉Digital Intelligence Frontline。 由于OpenAI此次发布的信息很少,业界很难评估。

视觉模型或多模态模型在计算能力方面与大型语言模型不同。 一位人工智能算力资深人士告诉数智一线,尽管SORA可能只有几十亿个参数,但其算力估计与数百亿或数千亿个大型语言模型相似。

他进一步分析说,他可以参考文生图模型Stable Diffusion,只有10亿个左右的参数,但用几十万台服务器训练算力却花了将近一个月的时间。 他估计,SORA的训练算力可能至少比前者大一个数量级,也就是上百台服务器,OpenAI肯定会更进一步,把SORA模型做大。

另一方面,该模型的推理算力也远大于大型语言,有数据表明,稳定扩散的推理算力消耗与LLAMA 70B(700亿)参数模型相似。 换句话说,就推理算力而言,一个10亿的文生图模型和一个1000亿的大语言模型差不多。 第一个生成模型SORA的推理计算能力肯定比第一个生成模型大得多。

文本是一维的,三维的,单位的计算能力更强。 一位人工智能专家告诉数字智能前线,他认为它需要几千卡路里大才有机会。

由于SORA推动的文盛**的发展,今年国内整体算力仍将非常紧张。 据某计算基础设施公司人士介绍,在人工智能算力方面,北美几家巨头的算力现在是中国总算力的十倍以上,甚至更多。

然而,在一些地方,国内的算力已经闲置。 这其中就包括几种情况,比如一些公司在去年上半年开始训练大模型,放弃了大模型的开发,转而使用开源模型; 去年,大型语言模型的应用遇到了挑战,大量的推理应用尚未落地,这将导致一些企业出现数十或数百台闲置机器的情况。

宋健也发现了算力闲置的问题。 他观察到,特别是从2023年11月左右开始,算力的租赁变得更加容易,可能是原来的2 3,甚至1 2。

相似文章

    Sora模式即将到来,这种行业将受到影响

    继ChatGPT之后,AI行业爆发了新一轮的技术革命。近日,OpenAI发布了首款文生 模型SORA 可根据提示词生成长达分钟的 该模型发布后,迅速引起了科技界和资本界的关注,比如的创始人兼董事长周弘毅,多次公开表达了自己对SORA的理解及其 诞生 的意义。上百份券商调研报告被重点关注,就连国资委近...

    报告揭示了Sora在行业中的六大优势,AGI可能在一两年内实现

    两只金毛猎犬在山顶播客 火星日落时分的未来派无人机比赛 徜徉在与自然和谐共处的未来城市中,同时又具有超朋克气质和高科技属性 根据以上提示,OpenAI CEO Altman 在 X 平台上发布了一系列 精美的场景让用户惊叹不已。而这些 都是由OpenAI在月日发布的最新 代SORA机型制作的,用户们...

    SORA模式直接改变了媒体,我们该如何应对?

    SORA模式对传统的影响 机遇与挑战并存。随着Openal最新的生成模型SORA的兴起,其在行业中的应用潜力正在逐渐显现。对于传统的 来说,SORA模式无疑带来了一场深刻的技术革命,既带来了前所未有的机遇,也带来了严峻的挑战。我们必须正视这种变化,深入研究SORA模式对传统的具体影响。机会 创新制作...

    Sora如何申请资格? 本文将介绍如何进行预订

    自发布以来,SORA这个大王级产品受到了AI圈的广泛关注,甚至在去年上半年就与AI相提并论版本 的发布是一样的,仿佛破圈了一般,这让 行业和设计界的朋友都感到震惊,因为这款产品是第一款带有物理引擎的产品,可以努力理解和模拟物理效果,比如以下场景 提示 显示一个男人奔跑的场景,毫米胶片拍摄。既然不能上...

    随着Sora的出现,手机行业会不会有大洗牌?

    作者罗一琪.编辑罗一凡.图源图虫。今年以来,随着一流的大模型SORA的出现,谷歌进一步迭代了容纳更高文本吞吐量的大模型,AI大模型的演进正在加速。这意味着,作为人机交互的重要入口,智能手机的发展也将迎来一个新的阶段。无论是手机硬件本身的算力,人机交互的方式,甚至是软件商店的服务闭环和商业模式等,都会...