12 月 16 日,Geek Park 创始人、董事长兼首席执行官 Robin Li 和创始人兼总裁 Peng Zhang 共同探讨了“AI Native,我们需要什么样的产品和开发者?这个话题引发了一场对话,并输出了很多想法,这篇文章展示了最好的部分。 同时,在文章末尾附上了 17 个视图的集合。
问:近日,谷歌发布了 Gemini,据说是 GPT4 下的 OpenAI5也要发了,最近有各种传闻。 我们非常担心,确实正如您所说,最先进的基础车型只有少数几个,从国内来看,与国外的距离,我们在过去一段时间里是缩小还是扩大了?我们如何评价追赶他们,甚至有机会在未来创造属于自己的不同价值?
李彦宏:中美两国的市场环境差异较大,尤其是在应用层面,中美两国的发展方向可能相对不同。 美国在企业级软件方面一直有很大的市场,应该说更先进,中国在to C领域会更先进。
如果我们回到中美之间的技术差距,我的观点一直是,技术仍然需要服务于应用。 当你说技术是好的,或者技术是坏的时,你到底是什么意思?今天我们图书馆的PPT生成能力,我觉得是全球最好的,它是基于文心一颜模型的,这个时候你说我们和世界领先水平差距有多大,我觉得没有差距。但是,如果具体谈企业应用,中国的市场太小了。 因此,我们不准备做任何事情来优化这些事情,而且确实有可能落后。 或者各种小语言,我们没有精力去做那些优化,所以也有可能它们落后了。 所以当我看模型的技术层面时,我是在看它的应用,你在哪里比较,简单地刷一下列表,跑一个分数,我觉得这个东西挺无聊的。 如果你训练一个大模型,你需要投入多少资源!10000张GPU卡,你要训练很久才能练出来,你说我考高考,我得多少分,你高考得了高分,能赚多少钱?你刷一个榜单,你排名第一,那个榜单的主人,他能给你多少奖金?
李彦宏:我认为模型的先进技术更多地取决于模型所处的应用场景和作用。 想清楚这件事后,就可以判断模型的好坏了。 有时我讲的是模型质量的评价,这是做模型的企业的核心竞争力。 如果你不知道,你就得靠第三方给你评价,给你打分,这东西不靠谱,你不知道自己在做什么
问:最近有一种说法,大模型本身就是在技术上“大力冲出奇迹”,看来这个东西,就好像我们想做大模型的创新,还要靠奇迹的力量,这张牌可以重注,有足够的决心和足够的钱去上去, 这个距离能通过坚决的努力拉近吗?如何理解这个强大的奇迹?依靠它不行吗?
李彦宏:我认为“武力奇迹”这句话更多地是指从 0 到 1 探索大模型的过程。 OpenAI在别人不知道这条路可以通行的时候,用了足够的算力和足够的数据进行训练,最后跑出了这条路。 其实他们并没有发明新的算法,他们用的是transformer,最后他们做了很好的效果,因为它用了足够多的卡片,我看到美国学术界有人在调侃美国所有的大学都不能用他们的卡片训练GPT35.确实,这里使用的计算能力非常大。
但我认为,再往前追溯,这个游戏不是这种玩法,它不是大力创造奇迹的法则,它更像是走向它的对立面。 反之亦然?我认为这和所有的商业竞争都一样,谁更有效率,谁就赢了。 你可以融资,我也可以融资,最后我用10美元做100分的效果,你用10美元做120分的效果,久而久之你就赢了。 或者为了做出100分的效果,我用100美元,你用80美元,你就赢了。 我认为这就是大模型的价值最终在应用程序中体现的方式。
现在**和大众都在关注训练大模型,在实际训练完成后应用推理的成本是多少?不管你的推理成本在同等效果下比别人低,还是你的效果在同等成本下比别人好,这都是未来竞争的主线,我觉得是大力创造奇迹的反面。 而是你真的必须能够比其他人更有效地制作这些东西。
这也是为什么我们在这个领域有很好的积累,我们在芯片层、在框架层、在模型层、在应用层都有布局,这么多年,所以我可以端到端地优化。 刚才讲了生成PPT的例子,有需求的时候就传下去,文心模型一定要针对这个东西进行优化。 在优化时,有人说调用次数太大,成本非常高,我们负担不起计算能力。 往下看,你的框架,也就是桨的框架,应该完全针对文心大模型的需求进行优化。 再往下看,就是芯片如何适应球拍的框架和文心模型。 逐层、端到端优化,我们发现从3月份发布到现在,我们基本上可以将推理成本降低到1%。 以前你只敢打10000次,现在一天敢打100万次,完全是另一回事的感觉。 我认为这方面是未来竞争的主线。
问::如果你看一下,如果你想身处其中,中国发展依靠大模型的新一代AI产业的核心问题是什么?如果我们要列出三个核心问题,那么在一天中的这个时候,哪些问题最值得关注?是算力的问题吗?
李彦宏:不能说有三个,最关键的,甚至唯一的,就是应用。 大模型是基础的东西,如果上面有有价值的应用,那么就算行业跑了,也能越做越大。 你可能想问的是,你怎么能开发一个好的应用程序,这个关键因素就在于**??我认为有几个方面:一方面是我国的产业政策。 如果你看看中国相对领先的产业,很多时候国家在产业政策上是有远见的。 比如太阳能光伏,再是动力电池,直到现在的新能源汽车,新能源汽车似乎占全球出货量的60%还是多少,这是为什么呢?如果中国是燃油车,就会限制购买和通行,还要缴纳车辆购置税,所以有各种打压需求的伎俩,但是对新能源汽车没有这样的限制,自然会发展得更好。 在大模型方面,如果国家能够出台相关产业政策,鼓励开发基于大模型的AI原生应用,我认为这是一个非常重要的成功因素。
二是当前**环境。 **现在主要关注的是基础模型,有这个能力和那个能力,这个东西真的不重要,重要的是我们现有的企业,它是否利用大模型对其业务核心关键指标产生积极影响。 也就是说,我们现有的企业,不管是大企业、中小企业,还是创业公司,不管是做什么的,使用大模型后,能不能对其关键业务指标产生积极的影响,就是这个领域关注度比较低,我觉得如果这个关注度能提高的话, 对于制作大型模型或做大模型来说,这也是非常重要的一点。这件事说起来容易,做起来却不容易。 其实大公司反应很慢,甚至我有时也会说,大公司代表着落后的生产力,你一定不要看大公司在做什么。
以下是李彦宏观要点的合集,值得细细品味。
1.我认为这波大型模型技术的不同之处在于它的通用性。 我们称之为“智力涌现”,它已经学会了没有教过的东西。 有了这个功能,当你拥有一套基础技术,可以做得非常好,非常领先的时候,就可以在各种场景下快速做出有价值的应用。 这是人工智能在过去70年中没有做过的事情,所以这是一个完全不同的机会。
2、今年绝大多数时间,全社会的焦点都放在大模型本身,放在基础模型上。 但我的观点一直是,在基本模型之上,必须有数千甚至数百万个 AI 原生应用程序,才能体现大模型的价值。 我看到**、社会、大众的主要兴奋点还停留在基础模型上,并没有转移到AI原生应用上,这或多或少是焦虑的。 这就是为什么我一直强调,我们必须推出 AI 原生应用程序,并且我们必须制作这个东西,这样你的模型才有价值。
3、模型技术的进步,更多地取决于什么应用场景,模型是做什么用的想清楚这件事后,就可以判断模型的好坏了。 对模型质量的评价是制造模型的企业的核心竞争力。 你知道什么是好的,什么是不好的,所以你可以做一个好的模型。 如果你不知道,依靠第三方给你一个评价,给你一个分数是不可靠的。
4.“大力创造奇迹”,更多是指从0到1探索大模型的过程。 再往前追溯,这个游戏不是这种玩法,而是更倾向于它的相反。 反之亦然?这和所有商业竞争的规律是一样的,谁更有效率谁就赢了。 你可以融资,我也可以融资,最后我用10美元做100分的效果,你用10美元做120分的效果,久而久之你就赢了。 或者为了做出100分的效果,我用100美元,你用80美元,你就赢了。
5. 在同等效果下,你的推理成本是否低于其他人?还是在相同的成本下,你的表现是否比其他人更好?这是未来竞争的主线。 我们在芯片层、框架层、模型层和应用层都有布局,因此我们可以进行端到端的优化。 从3月份文心一言上映到现在,我们基本把推理成本降到了原来的1%,过去我们只敢打1万次,但现在一天敢打100万次,完全是不一样的感觉。
6. 我确实认为数百个基本模型是对社会资源的巨大浪费,尤其是在我们的计算能力仍然有限的情况下。 应该投入更多的资源去探索与各行各业的结合,探索任何新的超级应用的可能性。
7.基础模型的迭代过程不依赖于运行分数或刷这些东西。 一个做应用、做业务的人真正关心的,是他业务的核心指标,他的需求导致文心模型朝着真正符合市场需求的方向演进迭代,这是一个良性循环。
8、随着大模型时代的到来,真正的价值在于原生应用,原生应用对于大厂商、中小企业、创业者来说都是巨大的机遇。
9、大模型开发只有一个关键点,那就是应用开发好的应用有三个关键因素:一是有相关的产业政策鼓励开发基于大模型的AI原生应用;其次,是利用大模型对其业务核心关键指标产生积极影响的现有企业三是超级应用,什么时候会出现,会出现在哪些领域?更多的创业公司需要努力工作,尝试各种事情。
10、大模型的最大价值究竟是新的超级应用,还是对现有应用的改造尚无定论,当然一定是后者。 如果你今天看看Microsoft的Office365Copilot,它每月花费30美元,每年可能收取50亿美元,这比整个OpenAI的年收入还要大很多倍。 事实上,它通过改造现有产品创造了如此多的新价值,所以我认为每个人都应该更多地关注与现有业务的结合。 这波生成式AI可以为现有业务的转型创造更大的价值,Microsoft就是一个例子,Adobe也是一个例子,它对大模型的拥抱,导致它能为现有产品产生的收入和利润大幅增加。
11、我认为,这些在现有几乎所有行业都已经形成的公司,一旦出现转机,能够很好地利用大模型的能力,他们获得的收益和价值收益一定是最大的。 当然,这并不意味着创业公司没有机会,创业公司很有可能做出三五个超级应用,以及成百上千个非常有价值的垂直应用,这也是很有可能的。
12. PM和R&D的比例正在发生变化。 过去,我们必须在PM中做大量的研发工作,今天可能是1比1。 换句话说,许多实践在早期测试中不需要研发干预,PM可以通过自己攒钱来做到这一点,这与以前不同。
13.真正成功的AI原生应用产品经理,很可能不是某一类人,而是各种人的综合,有人可能不是计算机专业,但他有很强的学习习能力,他有产品和市场意识,同时不怕技术, 即使他没有学过,读了最新的**,也能明白说了什么,用了什么方法,这类人最有可能成为一个成功的产品经理。
14.为什么我在为“访问”这个词而苦苦挣扎,事实上,我正在为你的肌肉记忆而苦苦挣扎。 因为访问是最简单的,但也是最低的价值。 你的业务与大模型有什么关系,大模型能不能帮助你增加你的DAU,你的留存率增长多少,你的用户时长增长多少,你的收入增长多少,你的利润增长多少?这些是业务的关键指标。 但要在这些关键指标上有所作为并不容易。 它不依赖于惯性,也不依赖于肌肉记忆。
15.我们今天的认知与一个月、半年或一年后的认知大不相同。 这种认知是如何产生的?这不是你坐在房间里凭空想到的,也不是我读**来理解的东西。 的确,有无数的开发者在尝试的过程中知道这条路通,这条路行不通。 今天,绝大多数的可能性都没有尝试过,创业者和开发者都要尝试,无论这条路行不通,都是宝贵的经验和教训。 即使你没有通过,你也知道你没有通过,如果你通过,这是一个很大的机会。
16.我认为这是一个长期的机会,但如果你不及早抓住这个机会,你很可能会在竞争中落后。 今年有机会,今年有机会,明年有机会,如果五年有机会,我认为会有机会。 但为什么不早点呢?为什么不比同行和竞争对手更早地发挥技术的价值和技术的潜力呢?特别是当你的指标,当你的北极星指标时,它们对核心业务的关键指标有积极的影响吗?当你仔细考虑时,其他一切都会得到解决。
17、随着大模型时代的到来,真正的价值在于原生应用,原生应用对于大厂商、中小企业、创业者来说都是巨大的机遇。