AI(人工智能)自诞生以来已经走过了70年; 然而,“AI PC”从概念到产品落地的过程,犹如一夜之间的春风,用了不到半年的时间。
在不到半年的时间里,AI PC完成了从概念到产品落地的华丽演进
今年 9 月,英特尔 CEO 帕特·基辛格 (Pat Gelsinger) 首次提出了这一概念,根据英特尔的愿景,AI PC 将以前所未有的速度发展,2025 年将有数亿台配备人工智能模块的 PC 问世。
紧接着,英特尔新发布的处理器架构 Meteor Lake 明确增加了 NPU(英特尔在今年 6 月披露了这一信息,其 AI 模块当时被称为 VPU,声称比基于神经网络计算的外部 Movidius 计算棒具有更大的计算能力)。
10月,联想等一系列主机厂跟进这一理念,提出了AI for All、AI is Everywhere等思路,随后开始布局2024年的AI PC产品线,随着2024年越来越近,我们很快就会看到第一代AI PC产品的落地。
12 月 15 日,英特尔将发布第一代酷睿超高处理器,随后发布第五代英特尔至强可扩展处理器(Emerald Rapids),目前披露的信息是,新平台的 AI 算力已经爆发到上一代的 8 倍。
随着AI PC概念的发布,Microsoft也在积极布局AI领域,新一代Windows版本“哈德逊河谷”(Hudson Valley,正式版很可能命名为Windows 12)将全面部署AI功能,其中大部分需要NPU的支持才能完成。 我们已经很久没有看到PC上的软件(操作系统)驱动的硬件飞跃了,而人工智能很可能会带来下一波替代浪潮。 根据IDC**的数据,2024年诞生的新品类将在2024年占据81%的市场份额,没有更换PC的用户将无法享受到这一波AI带来的效率“红利”。
AI PC之所以会有如此快的落地速度,得益于ChatGPT等大型语言模型带来的AIGC浪潮,数字人等AI应用得到了快速推广......从数据中心、PC、智能手机等终端,AIGC的应用被快速推广,不久前,Open AI和Microsoft甚至推出了一个不需要编程技能的AI应用市场。
对于普通人来说,使用超级计算训练大型语言模型太遥远,成本太高。 在AI PC概念的布局中,需要让笔记本甚至轻薄的笔记本电脑都具备本地化的AI能力。 因此,帕特·基辛格明确表示,AI行业现在已经从训练阶段过渡到部署阶段,AI将成为PC行业的关键转折点,英特尔有信心在未来两年内引领行业,实现2024年AI PC出货量超过1亿台的目标。
在提出AI PC概念的同时,基辛格还期待AI PC运行“个人大模型”的可能性,在最大限度地发挥PC的AI算力后,将PC完全转变为无所不能的AI助手,实现更低的延迟、更好的可扩展性、更私密的本地化AI应用。
AI布局,英特尔领先一步,AMD快速跟进
作为PC处理器的两大厂商,Intel和AMD都切入了AI PC市场,非常巧合的是,两家公司最终都将处理器中的独立AI模块命名为NPU(在升级到Ryzen 8040系列处理器后,AMD将Ryzen 7040系列中的Ryzen AI引擎升级为NPU), 看似目标相同,但两者在处理器架构和AI布局上仍存在一些差异。
正如我之前提到的,Pat Gelsinger 是业内第一个提出 AI PC 概念的人,事实上,英特尔在第 12 代和第 13 代内核之上,通过 CPU、GPU、ARC 独立显卡和指令集,通过软件和模型优化,实现了对不同 AI 工作负载的支持。 此外,通过外部连接Movidius,可以进一步在终端和边缘部署AI加速能力。 其中,英特尔的XPU战略具有很大的先发优势,OpenVino在软件端构建了优秀的异构计算平台,可以最大限度地利用每台PC的AI算力。
早在几个月前,我们看到英特尔通过PyTorch的指令集加速和Bidl-LLM框架的优化,能够在16GB标准内存的13代酷睿轻薄笔记本电脑上流畅运行160亿参数的大型语言模型,当时它能够基于XE HD图形以每秒4到5步的速度运行Stable Diffusion。
此外,英特尔还在第一款英特尔至强可扩展处理器(Sapphire Rapids)和第一款数据中心GPU Max系列(Ponte Vecchio)上集成了大规模计算能力,尤其是第一款采用Chiplet设计的英特尔至强可扩展处理器(chiplet),在一个封装中集成了多达4个使用Intel 7工艺技术(3D封装技术EMIB)制造的单元, AI性能是上一代的10倍。在AI硬件在云端、边缘、端端的布局方面,英特尔有着相当清晰的前瞻性。
AMD 的 AI 战略始于 Ryzen 7040 系列处理器的发布,该处理器虽然与英特尔不同,但也集成了非常相似的 Ryzen AI 独立引擎。 虽然两家公司在市场竞争方面一直处于对立状态,但在“AI PC”的概念上一直保持着高度的一致性。
AMD在12月7日Advancing AI大会上发布的锐龙8040系列处理器出人意料地挤出了“牙膏”,8040系列几乎可以算是7040系列的背心,但在AI引擎上还是提供了1计算能力提高 6 倍; 据说,2024年的“Stirx Point”是真正提升性能的AMD一代,NPU也将升级到第二代,AI性能有望超过3倍。
深耕PC市场,英特尔的号召力更胜一筹
当AI浪潮以不可阻挡的趋势到来时,我们更能看到产业链顶尖厂商的背景。 英特尔发布“AI PC加速计划”后,展现了其在PC市场深耕、软硬件结合的优势。 在英特尔技术实力的推动下,酷睿平台获得了更多合作伙伴的青睐。
在第一代发布之前,英特尔在该计划中的ISV合作伙伴已迅速突破100家,并开发了300多种AI加速功能,其中大部分是基于NPU的。 从7040系列到8040系列处理器,AMD也在快速推进AI功能的适配,据说其NPU有100多种软件功能需要适配。 考虑到英特尔的先发优势,AMD的速度并不算太慢,但还是落后了不少。
AI算力布局与优化,英特尔在架构上具有优势
为什么更多的ISV会优先选择英特尔,是基于对市场的深耕和刚才提到的软硬件结合,还有一点就是英特尔在架构上的优势。 虽然英特尔的AMD在最新的处理器中植入了独立的NPU,但我刚才提到,英特尔的XPU架构可以最大限度地整合整个处理器的AI能力,让NPU也可以配合CPU和GPU来承担不同的AI负载。 事实上,处理器的整体AI算力对于未来的操作系统来说非常重要,据说Microsoft下一代Windows Copilot(AI助手)的系统性能设计需要达到40 tops,这肯定不是目前单个NPU可以做到的。
在酷睿至尊发布之前,虽然我们暂时不知道它的NPU有多少算力,但此前披露的信息显示,NPU的效率可以是CPU的5倍,GPU的近2倍。 值得注意的是,AMD没有类似“XPU”的异构计算布局,其AI通过NPU运行更加独立,因此在锐龙8040系列处理器上为NPU提供了16TOPS的算力。
需要注意的是,硬件算力是AI应用的基础,但不是决定性因素,PC端展示的AI能力需要软件端的ISV和开发者进行优化适配。 例如,尽管高通在最新骁龙 X Elite 使用的 Hexagon 处理器单元中部署了高达 45 tops 的算力,但如果 ISV 和相关开发者对其架构的支持不够,它仍然会陷入之前支持不足的泥潭。 如前所述,英特尔在这方面也具有领先优势。
写到最后
虽然AI PC是一个新时代,但它们考验着各地处理器制造商的技术深度和创新能力。 在过去的几十年里,我们已经看到英特尔一直在未雨绸缪,不断创造新的PC形态,如迅驰、上网本、超极本和EVO笔记本,以便它有能力在下一代到来时及时做出改变。