聪明的东西
作者 |程倩
编辑 |沙漠之影
大模型的火已经烧到了个人终端,尤其是与我们生活和工作相关的个人电脑。
进入2024年,大模型行业的竞争焦点从量参数和量性能延伸到商用落地,各种AI应用和工具迸发出来,让用户对大模型有更强的感知。
一方面,一些企业在提升通用大模型能力的道路上继续快速奔跑,另一方面,一些企业开始探索在终端设备上部署大模型的可能性。 各行各业的手机玩家纷纷部署大型模型技术,智能助手体验被颠覆; 自主研发的轮辋大模型分批上车,重新定义智能座舱体验; 还有智能家居厂商,机器人、芯片等赛道也在加速进军......
PC作为医疗、教育、制造等各行各业的超级生产力工具,插上大机型的翅膀后,很可能会掀起生产力工具的革命。
就在昨天,PC行业龙头联想集团发布了2023财年第三季度财报 24. 财报显示,联想集团第三财季营收1136亿元,同比增长3%,净利润近26亿元,盈利能力连续两个季度环比增长。 随后公司同时发布了硬核科普**,揭示了联想AI PC的原创性。
*通过炫酷的手法,联动解说AI电脑,以立体动画、立体故事板、平面故事板等逼真呈现联想研发的AI OS生态和AI芯片TAC,大模型压缩、知识蒸馏、矢量化等前沿技术清晰普及。
2024年,生产力工具革命浪潮来临,迎来AI为你的时代,联想集团正在为AI PC行业探索新的可能性。
从最初出现聊天机器人,到现在建立在大型模型能力上的产品和工具,已经逐渐转变为更实用的生产力工具。
在个人用户将这些产品融入到日常生活和工作的同时,他们的需求也更加深入和细分,他们需要更符合自身使用习惯的个人模型。
这些需求侧趋势中有许多正在推动大型模型行业的转型。 大型模型不再局限于超大规模参数理论,采用压缩技术在保持性能稳定的同时,减小模型的尺寸和计算复杂度,使其更易于部署。
当大模型可以部署到设备上时,就会出现一个问题,即如何使大模型的功能更适合用户的个性化需求。
PC设备脱颖而出,在交互模式、终端算力、本地存储能力等方面具有优势,使这款终端设备成为AI技术惠及所有人的重要途径。
首先,大模型驱动人机交互的变革,可以实现对语音、文本、图像、**的高质量识别和理解,从而使人机交互的方式更加自然、智能、高效。 同时,PC可以连接更多的外部终端,这是多种交互方式的核心,未来体验会更加丰富。
其次,PC更适合于大模型对应创作能力的呈现,从原来的大语言模型到多模态大模型,其生成的内容已经从简单的文字延伸到**、音频甚至3D动画。
最后,还有计算能力和数据。 PC是个人终端设备中算力最强的产品,也更适合用户存储个人数据和文件,因此可以支持大规模模型计算,保护用户数据安全。
综上所述,可以看出PC机型和大型机型的特性具有天然的适应性。
AI PC的出现进一步放大了PC的生产力工具属性。
首先,我们必须回答最本质的问题:什么是AI PC? 联想集团董事长兼CEO杨元庆给出了AI PC的五大特点,与传统PC相比,AI PC具有更强的算力、更大的存储空间、体积小但性能不降低的大型号、完整的AI应用生态、安全和隐私保护。
前三个与基础硬件和软件基础设施有关,即在PC上运行压缩和性能优化的个人大型模型的能力,包括CPU、GPU和NPU在内的异构计算,以及包含用户个人数据的本地知识库。
后两者测试了PC厂商的生态建设能力,让AI PC可以有更丰富的自然语言交互形式,而不仅仅是文本、语音、手势交互。 最后是让AI PC更可靠,让用户的数据更安全。
基于此,未来PC不仅可以承载一般大模型的能力,还可以独立运行用户专属的个人大模型,成为更实用的工具。 这背后,存在着许多挑战。
AI PC不仅要压缩超大规模参数模型,还要保证PC的可用性,保持稳定的性能。
在压缩的大模型之上,AI PC需要为用户构建自己的个人大模型,保持对用户习惯、数据等内容的持续学习和训练,并拥有强大的算力和存储空间来支持这些数据的训练和存储。
更重要的是,个人数据隐私和安全问题与用户的日常生活和工作息息相关,因此对用户数据安全保护的要求也将突飞猛进。
现在,随着这些技术困难的克服,人工智能电脑将彻底改变生产力工具。
联想集团展示的AI电脑,厚度只有不到2cm,里面隐藏着多少黑科技?
*使用3D动画,通过建模效果还原AI PC独创性背后的技术点,将AI PC进行三维拆解,我们可以看到AI PC的基础是强大的异构计算能力,高性能的CPU、GPU、NPU构成了大模型的初步硬件架构。
在硬件架构之上,如何实现PC可以控制的大模型? 其实,将参数比例大的模型安装到PC上是很困难的,在用一组数字量化的时候,我们发现OpenAI之前发布的大模型GPT-35 参数大小为 1750 亿,预计占用内存超过 330GB。
这个问题的答案是知识蒸馏,其中知识蒸馏的模型技术通过平面故事板技术以拓扑图的形式可视化。
可以看出,知识蒸馏就是利用大模型的监督信息来训练一个轻量级的小模型,使模型在小参数尺度下获得更好的性能和精度。 其中,成熟的模型是“老师”,PC中部署的本地模型是“学生”。
这样一来,大模型的参数大小可以从1750亿压缩到70亿,个人大模型只需要占用硬盘4到5GB的空间。
现在 PC 中的大模型已经准备好了,下一步是如何让它更加用户友好,并为每个人量身定制最强大的生产力工具。
*使用立体故事板演示如何通过矢量化技术构建本地知识库,当用户授权插入时,个人文档、ppt、pdf、日程表等与个人习惯相关的信息将存储在当地知识库中。
这些知识被矢量化为一种形式,可以由人工智能计算,然后存储。 当用户提出需求时,个人模型也会对相应的需求进行矢量化,并查询匹配本地知识库中最相似的片段。 个人模型提取出相关文本块后,会根据用户的提示词输出答案,结合大模型的生成和理解能力。
除了智能算力的部署和个人大模型的本地知识库外,联想集团自主研发的AI操作系统是整机的生态入口,可以调用本地文档,调节上百个隐藏系统和硬件设置,完成用户更加个性化的需求。
联想集团打破了该领域AI知识只由模型主导的格局,让AI在PC领域从“通用”回归“个体”,真正实现“千人千面”。
例如,当用户与 AI 操作系统交互时,“如果我觉得计算机不够流畅,无法玩游戏,我该怎么办? AI OS会识别出这个需求中涉及的关键词,然后了解用户想要适配游戏场景的相关设置,并弹出“开启野兽模式”的设置选项。
随着用户在PC上触发的交互次数越来越多,AI OS对个体有了更深入的了解,可以解决用户日常生活和工作中的诸多痛点,比如生成会议纪要、检索过去的PPT,从而服务于个人,为用户带来定制化的高效体验。
值得注意的是,大模型的每一次响应和学习都会占用大量的系统功耗,这需要AI PC智能调度和分配系统功耗,让用户体验更好。
针对这些问题,联想集团自主研发的AI芯片TAC(Trusted AI Controller)是关键,展现了TAC通过华丽流畅的三维动画辅助调度算力分配、释放高性能的实力。
TAC与PC上的所有硬件连接,并将该硬件的状态传输到AI OS。 如**所示,这些状态将被 AI OS 理解,并被识别为会议、游戏、学习等特定使用场景。
基于不同的场景和任务识别,TAC将精准转移能耗压力,确保CPU、GPU、NPU等计算芯片的合理运行,保障AI PC的可持续高效运行。
该芯片不仅将支持效率和功耗的最大化,而且将成为保护用户个人数据的有力卫士。
TAC会通过密钥对用户的个人文件、使用习惯等信息进行加密,并将密钥封印在芯片的ROM中进行独立供电,有效防止数据泄露和恶意攻击。
最后,联想AI PC巧妙地结合软硬件和生态,提供首次在个人终端上实现的落地方案,层层黑科技让我们看到,个人AI双胞胎(Personal AI Twin)即将成为现实。
AI PC 正在蓬勃发展,即将登陆。 人工智能将不再是用户的话题,而是一种可以使用的工具。
正如联想集团科普**中提到的,PC在39年前踏上历史舞台后,几乎承载了数字世界的每一次技术变革,而39年后的今天,AI PC或许也即将成为人类与数字世界交互的最佳解决方案之一。
这一次的AI PC既是突破,也是回归。 面对生产力工具发生重大变革的时刻,联想集团作为PC行业的领导者,将人工智能的颠覆性力量带到了每一个用户的终端,让每个人都能用AI PC实现AI的包容。