文:王慧英。
编辑午夜。
OpenAI再次引起全球关注。
北京时间2月16日,OpenAI发布了文生**大模型SORA。 根据官方介绍,Sora能够根据文本提示创建详细的**,扩展现有**中的叙事,并从静态图像生成长达60秒的场景**。
这熟悉的场景,让人梦见2023年。 当时,ChatGPT引发了一波大模型浪潮,在全球范围内掀起了一场AI军备竞赛。 今年,OpenAI再次抛出一颗鹅卵石,在文盛**池中掀起涟漪。
SORA让“一句话生成”成为可能,这是一场人工智能改变生产的革命,全球空头巨头字节跳动也不能忽视这股浪潮。
无独有偶,在SORA出炉前一周,字节跳动宣布人事变动,抖音集团原CEO张楠宣布辞去集团CEO职务,未来将专注于建盈的发展。 字节跳动CEO梁汝波对张楠过去在引领中国信息平台业务方面做出的贡献和突破表示感谢,并期待她在新的岗位上继续努力。
作为一名资深员工,张楠加入字节跳动十年,领导了抖音、火山等产品的推出。 她带领抖音完成了对竞争对手的超越,成为字节跳动第二次飞跃的关键人物。 今天,抖音的日活跃度已经超过了65亿,成为全球空头**领域的领跑者。
高层的变动往往伴随着业务调整,让最熟悉抖音生态的人负责建英,字节跳动的目标很明确,就是在AI文盛的生产中抢占新的爆发性机遇**。
据《时代周刊》报道,接近建英的人士透露,过去一年,张楠将大部分精力都倾注在建英的业务上,并亲自带领团队在AI辅助创作上寻求突破,即将推出一款AI生成的一流产品。
ChatGPT和SORA给字节跳动带来了新的灵感,但也带来了更大的压力。 在过去的一年里,字节跳动延续了超级应用的逻辑,陆续推出了多款基于AI技术的产品,分发了对话、工具、互动剧情等多个品类,包括豆袋、按钮等应用。
动作很多,但速度不快,效果也不明显,这让字节跳动感到焦虑。 在年初的一次内部会议上,梁如波非常直白地表达了自己对技术部的不满。 他表示,字节跳动直到 2023 年才开始讨论 GPT,在行业中表现较好的大型模型初创公司是在 2018 年到 2021 年成立的。
在AI风口下,Byte一直没能轰轰烈烈地创造奇迹,张楠再次担当起了充电者的角色。 建英能否带领建英再次创造奇迹,对张楠和字节跳动来说非常重要,这决定了字节跳动能否走出成长困境,找到新的活力。
一位时髦的女人走在充满温暖的霓虹灯和动画城市标志的东京街道上。 她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包; 她戴着墨镜,涂着红色口红; 她自信而随意地走......
潮湿涝涝的街道映照着上图,女人身上的毛孔**清晰可见,如此逼真又逼真的**画面,出自AI之手。
SORA示例**,OpenAI官网
在没有任何通知的情况下,OpenAI 将放大其动作。 北京时间2月16日,OpenAI在社交平台X上发文,首次公布了名为Sora的文生**AI模型。
SORA带来的冲击不亚于去年的ChatGPT,瞬间成为年初最热门的话题之一。
其实,文生**并不新鲜。 在SORA发布之前,据知名投资机构A16Z统计,到2024年底,市面上共有21款公开AI**机型,包括知名Runway、Pika、Genmo、Stable Video Diffusion。
但为什么 Sora 如此惊人并再次颠覆 AI 行业? 理解和减少是SORA优于预期效果的核心。
OpenAI官网上的多段**也证明了Sora的能力。 两艘海盗船在一杯咖啡上航行,在美白的咖啡泡沫上相互争斗; 满载乘客的列车穿过光影交替的城市,车窗上投射出生动的车内倒影; 舞龙队在围观者和周围人群的陪伴下前行,远近的视角充满现实主义色彩。
在时长方面,用户只需要输入一段文字,Sora就可以自动生成最多一分钟的高清。 这比市场上的大多数产品都要多。 据 A16Z 统计,现有的 AI 模型大部分都是在 10 秒内制作的,比如之前流行的 Runway Gen 2 和 PIKA,分别只有 4 秒和 3 秒。
更重要的是,Sora理解现实世界并恢复它的能力超越了市场上现有的大型模型。
正如OpenAI在其官方博客上所写的那样,SORA不仅了解用户的需求,而且知道这些东西在现实世界中是如何存在的。 具体来说,SORA不仅可以实现一镜到底,还可以完成多角度镜头和副镜头的切换,可以还原现实世界中光影的反射、人类行为等。
超出预期的性能离不开技术支持。 据OpenAI介绍,由于采用了Transformer架构,SORA具有很强的可扩展性,同时还使用了DALL·E 3 在以往研究的基础上对 DALL·E 和 GPT 为视觉模型的训练数据生成高度描述性的注释。
SORA的出现能否在中国乃至全球掀起新一轮AI军备竞赛尚不得而知,但能产生60S**的SORA确实给字节跳动带来了压力。 因为60s**所在的赛道,是字节跳动王牌业务抖音的大本营。
来源:抖音官网
抖音生态越富越丰富后,为了服务于内容创作者,建盈也应运而生。在抖音流量池的支持下,截至2021年,建盈的月活跃用户已突破1亿,成为中国最大的移动编辑产品。 TikTok 在全球的流行也导致 Capcut 海外版本的数量激增。
建英之所以能如此受欢迎,是因为它降低了门槛,让普通人能够更快、更轻松地制作**内容。
近两年,随着AIGC的普及,生产门槛将再次降低。 这也是SORA现在对建英构成威胁的核心原因:更多的人会倾向于选择门槛低但效果更好的平台,建英的用户很可能会被AI**生成的产品抢走。
为了留住用户,也为了抓住新的机遇,削减AIGC的布局几乎是不可避免的。
2023年11月,建英测试了一款名为“Dreamina”的AIGC工具,用户只需输入一段文字,Dreamina就可以生成四张由AI生成的创意图片。 这些图像可以从抽象和写实等多个维度生成,以满足不同用户的审美需求。
当时,据Tech Planet报道,消息人士透露,该工具未来将用于抖音的**或短**内容创作,丰富抖音在AI创作方面的内容库。
不过,从效果上看,目前建英正面临着与Runway、Pika、Genmo等产品相同的困境:**的动作不自然,保真度不高,视角单一,这些问题本质上都是技术问题,而空通过技术解决了这些问题,同时威胁到“建英”的生存, 同时也为“建英”提供了思路。
今年,抖音集团前CEO张楠卸任,转而投身于建英的发展,揭示了抖音乃至字节对AI创作的重视。 值得注意的是,在张楠给建英的内部信中,张楠提到,AI图像生成技术正在给内容创作工具行业带来巨大的变化和可能性。
如今,SORA的诞生给字节跳动带来了压力,不能慢,如何与剑英突围,成为张楠在新阶段的重要任务。
入职十年,抖音集团前CEO张楠,算得上是字节跳动的英雄。 在一定程度上,字节跳动的短期业务可以快速“拓版图”,依靠张楠。
从2015年开始,张楠率队率先推出火山小**,上线后迅速走红,日活跃用户很快突破5000万; 2016年,张楠推出抖音从0到1,奠定了国内最流行的短**APP的基础,如今,抖音的日活跃度超过65亿。
2020年3月12日,在字节跳动成立八周年之际,字节跳动宣布,张楠将担任字节跳动(中国)首席执行官,担任中国业务总负责人,全面协调公司中国业务的产品、运营、市场和内容合作,包括今日头条、抖音、西瓜**、搜索等业务和产品。
张楠,来源字节跳动官网。
没过多久,抖音就从字节跳动旗下的一个应用成长为一个生态复杂的抖音集团,拥有抖音、火山、建映、青岩相机等多个应用,张楠成为抖音集团的CEO。
身份的转变,让张楠更像是一个在幕后掌控抖音大局的统帅,而不是一个冲锋陷阵的将军,但她永远是最了解抖音生态的人。
随着市场环境的变化,抖音的增长不如以前是事实,但抖音寻找字节新增量的目标并没有改变。 AI的东风吹得越来越强,原本是抖音**创作工具的建英站在风口上,这是一个机会,字节跳动必须抓住它。
这个时候,张楠的地位和作用都很重要,最了解抖音的人,现在负责剑英。
离开自己带出来的抖音,张楠在告别文中说,“未来十年,我会折腾一些自己喜欢的东西。
张楠位置的变化,与其说是离开了抖音的权力中心,不如说是她被安置在了一个新的关键位置,也释放了字节想要在AI领域突围的信号。
就在张楠辞去抖音CEO职务的一周前,Byte首席执行官梁汝波在Byte召开的2024年度全体员工大会上发表了题为“永远创业,摆脱平庸重力”的内部演讲。
在本次分享会上,梁汝波多次提到“危机感”二字,梁汝波甚至将“强化危机感”作为年度目标。 他承认,最大的危机感是担心字节作为一个组织,正在变得平庸,无法取得新的突破。
字节跳动CEO梁如波,图片来源为字节粉丝儿微信***
当空头**业务接近天花板时,字节需要寻找新的增长点。 当OpenAI的两颗炸弹证明了AI产业所蕴含的想象力时,字节跳动作为一家拥有丰富内容生态和自然AI使用场景的公司,必须跟上AI的步伐,利用AI技术为自己寻找突破口。
字节跳动是最好的平台,既有梦想又有务实的浪漫,我期待着和建英的朋友们一起做梦,和这个AI时代一起成长,共同在脑海中描绘奇幻世界。 张楠写道。
这个AI梦想不仅属于张楠本人,更肩负着字节跳动的希望。
如果一家初创公司在2023年上半年营收超过腾讯,并在2024年初达到2250亿美元的估值,位居全球独角兽榜单第一,那么该公司的年度关键词是什么?
不是自信,不是兴奋,字节跳动CEO梁如波给出的答案是危机感。
梁汝波提到,在组织上,字节跳动已经变得平庸:效率低下、迟钝、标准低; 在人才管理方面,减重减重效果不明显,对高素质人才的吸引力降低; 业务方面,核心业务没有明显超前,其他业务需要突破。
对机会的敏感度不如初创企业“,而公司经营的低迷更是加剧了梁如波的危机感。 大模型技术浪潮的缓慢跟进,是梁如波感受到危机的原因之一。
2023年,OpenAI将掀起“ChatGPT热”,也将掀起一场全球规模的GPT竞赛,国内外众多知名互联网巨头纷纷推出自主研发的大型模型产品。
回顾字节跳动的行动:2023年1月,组建了第一个大型模特团队,在新加坡负责TikTok技术的朱文佳被调回中国,担任团队的业务负责人; 2023年5月,字节跳动创始人张一鸣忙于研究OpenAI的一系列**,经常读到深夜。
只不过,与字节跳动以往的战斗力相比,在新的AI时代,字节跳动似乎没能引起轰动。
资料来源:字节跳动官网。
当其他公司纷纷加入大型模型竞赛,一款又一款产品推出时,字节跳动只会在2023年8月推出其自主研发的大型模型“云雀大模型”。 在那之后,字节跳动的AI行动变得快速而频繁。
首先,AI对话产品“斗宝”开始测试,其前身是字节内部代号为“Grace”的AI项目,可以生成歌词、**文案等文字内容,还可以提供数学计算、翻译、英文写作等功能; 后来,又有按钮、AI角色互动应用“Stove”、AI产品“Picpic”等产品进入内部测试和研发阶段。
目前,Byte已在国内外推出10余款AI产品,除上述产品外,还有AI情感聊天机器人“AI搜索”、“抖音小青”、电商内容创作“即时创作”、AI工具集小悟空(chitchop)、AI剧情互动平台百吉钟等。
这些产品的背后,是一个全新的AI部门Flow,它也是AI时代Byte的先锋。 据36氪介绍,流部技术负责人是字节跳动科技副总裁洪丁坤。 一位知情人士告诉36氪,这个新部门的业务负责人是字节大模型团队负责人朱文佳; 据Tech Planet报道,字节跳动产品与战略副总裁朱军一直负责Flow事业部的产品线。
召集多位主干部,Byte发挥AI的意图已经非常明显。 只不过,虽然在AI上投入了不少,但基于字节的产品要突破并不容易。 比如“斗宝”的上线不仅比ChatGPT晚了八个月,而且从效果来看,多项**评测结果显示,“斗宝”的智能化水平在大模型的C端辅助产品中没有明显优势。
一个明显的变化是,在AI时代,字节跳动依旧扮演着追随者的角色,没有弯道超车的迹象。
纵观TikTok在全球的发展,面临着许多挑战和竞争。 在这种情况下,字节跳动在AI时代并没有自己独特的优势,甚至可能被新技术颠覆,这或许是梁如波的危机感所在。
字节跳动目前的业务惯性非常大,即使团队不做额外的努力,公司仍然可以长期依靠惯性滑行,但这是非常危险的。 梁如波提到。
近十年来,字节跳动抓住了短时代的红利,未来十年,如何在AI时代从追随者转变为创造者,保持创业状态并不断突破,考验着字节跳动。 正如梁如波所说,只有保持危机感,始终创业,字节跳动才能“摆脱平庸的重力”。
2月** 动态激励计划