一年前,在 Amazon Web Services Re: Invent 2022 上,生成式 AI 几乎没有被提及。 但几天后,OpenAI ChatGPT 聊天机器人诞生了,瞬间掀起了变革狂潮,将整个世界笼罩在生成式 AI 的新时代。
在短短一年内,生成式人工智能已成为科技领域的重心。 亚马逊网络服务在今年的 Re: Invent 2023 大会上强调了该技术如何成为这家云巨头议程的重中之重。
在今年的主题演讲中,亚马逊网络服务首席执行官亚当·塞利普斯基(Adam Selipsky)表示:“围绕生成式AI模型的创新是最好的选择。 他补充说:“它将重塑我们在工作和家庭中互动的每个应用程序。 我们正在以一种与以往完全不同的方式接受生成式人工智能的整个概念。 ”
他还介绍了亚马逊云科技的“生成式人工智能技术栈”,旨在为客户提供生成式人工智能应用、构建大型语言模型的新工具以及加速模型训练和推理的基础设施。
一种新的生成式 AI 技术堆栈。
在快速发展的 AI 环境中构建和部署生成式 AI 模型和应用程序通常会带来一系列独特的挑战。 亚马逊云科技的回应是一套全新的生成式AI基础设施,它由三层技术栈组成,分别是基础设施层、基础模型服务层和AI应用层,希望帮助客户在这三层之上轻松创新。
在今年近两个半小时的 Re:Invent 主题演讲中,Selipsky 提供了大量有关生成式 AI 策略的细节,Selipsky 认为,他们的新 AI 技术堆栈在模型选择、芯片成本和性能方面具有优势,可以帮助 AI 开发人员在构建、训练和运行生成式 AI 应用程序时在基础模型上抢占先机。
堆栈的第 1 层:存储和计算领域的重大革命。
随着对生成式 AI 的需求持续增长,GPU 短缺。 据报道,英伟达性能最好的芯片可能在2024年之前就已经售罄。 台积电CEO近日表示,对前景并不乐观,认为英伟达及其竞争对手的GPU短缺可能会持续到2024年。 为了减少对 GPU 的依赖,亚马逊网络服务是几家有能力的科技巨头之一,他们正在开发用于创建、迭代和产品化 AI 模型的定制芯片。
凭借 Nitro 虚拟机管理程序和 Gr**Iton、Trainium 和 Inferentia 等芯片系列,亚马逊云科技在芯片开发技术方面积累了丰富的经验,这也使其在云和生成式 AI 领域具有显着优势。 在此前接受外媒采访时,Selipsky解释了这些创新的实际好处,并强调了在计算能力和成本水平之间取得平衡的重要性。 “生成式 AI 工作负载具有极高的计算密度,因此性价比至关重要。 ”
在本次大会上,亚马逊云科技推出了专为生成式AI和机器习训练而设计的云AI芯片Amazon Trainium2,以及自主研发的服务器CPU芯片Amazon GR**iton4。
Amazon Trainium2 针对训练具有数千亿甚至数万亿个参数的基础模型进行了优化,与 2020 年 12 月推出的第一代 Trainium 相比,性能提高了 4 倍,能效提高了 2 倍。 Trainium2 将用于 Amazon Web Services 中的 Amazon EC TRN2 实例,这是一个由 16 个芯片组成的集群,在 Amazon EC2 UltraCluster 产品中可扩展到 100,000 个芯片。 亚马逊云科技表示,使用一个由100,000个Trainium芯片组成的集群来训练一个具有3000亿个参数的大型AI模型,可以将训练时间从几个月缩短到几周。
另一款发布的芯片是基于ARM的GR**ITon4,它专注于推理。 根据 Selipsky 的说法,与在 Amazon EC2 上运行的上一代 Gr**Iton 处理器 Gr**Iton3(但不是较新的 Gr**Iton3E)相比,gr**iton4 的处理速度提高了 30%,内核增加了 50%,内存带宽增加了 75%。
此外,亚马逊云科技还宣布了其 S3 对象存储服务的重大更新:一种新的高性能、低延迟层 S3 存储类 Amazon S3 Express One Zone,旨在为延迟敏感型应用程序提供每秒数十万次数据访问的个位数毫秒级数据访问。 与 Amazon S3 标准版相比,Amazon S3 Express One Zone 的数据访问速度提高了 10 倍,请求成本降低了 50%,计算成本降低了 60%。
堆栈的第 2 层:与 OpenAI 最强大的竞争对手联手反击 Microsoft。
在此前接受外媒采访时,塞利普斯基分享了他对山姆·奥特曼突然离职和最终回归的看法,“对于企业来说,他们必须努力扩大技术准入**;任何单一的模型或商都不应占主导地位。 最近发生的事情再次证明了亚马逊网络服务选择的路线是合理的。 根据Selipsky的说法,“可靠的模型和可靠的供应商至关重要,提供选项并致力于支持该技术的云提供商也至关重要。 ”
Selipsky专注于亚马逊基岩平台,称它已经被数以万计的用户使用。 亚马逊基岩平台是亚马逊云科技于4月上线并于9月全面开放的大型模型开发平台,支持用户从亚马逊自有的Titan模型,以及AI21 Labs、Anthropic、Stability AI等第三方模型中调用和定制多样化模型。
特别是,亚马逊云科技还特别邀请了Anthropic的CEO达里奥·阿莫迪(Dario Amodei)在现场分享。 在谈话中,他们提到 Anthropic 围绕 Amazon Web Services 构建了独家定制功能,用户只能通过 Amazon Bedrock 和 Anthropic 的第一方产品享受这些功能。 “这些服务将提供重要的微调和定制功能,并且仅在有限的时间内通过 Anthropic 的第一方产品在 Amazon Bedrock 上提供。 这是唯一的一个,没有分号。 ”
Anthropic 由一位前 OpenAI 工程师于 2021 年创立,其创始人“在模型安全方面从一开始就有不同的愿景”。 今年 9 月 25 日,亚马逊云科技和 Anthropic 宣布战略合作,亚马逊云科技表示将向 Anthropic 投资高达 40 亿美元,这在数量上几乎可以与 OpenAI 和 Microsoft 的合作相媲美。 可以说,在争夺先进AI基础模型的竞赛中,亚马逊云科技与Anthropic的战略合作已经成为其基础模型服务层的重要组成部分。
自定义 AI具体而言,Amazon Bedrock 是一个提供对托管基础模型的访问的平台。 其中包括亚马逊云科技内部开发的 Amazon Titan 系列大型语言模型 (LLM),以及来自其他供应商和开源生态系统的神经网络选项。 亚马逊云科技还宣布了两项新功能:微调和持续预训练,允许客户在基岩中为特定任务定制大型模型。
自定义神经网络就是使用知识库中未包含的新数据来训练模型。 例如,电子商务企业可以使用产品文档来训练模型,以回答客户提出的与产品相关的问题。 此自定义过程可以显著提高大型模型的准确性。
亚马逊云科技引入的第一个自定义功能是微调,它允许开发人员在标记的数据集上训练支持的基岩模型。 这些数据集包含示例输入、常用提示词以及针对这些提示词的预先编写的 AI 答案。 这些记录以问答的形式组织起来,AI模型可以利用这些记录通过示例快速向习学习。
亚马逊云科技推出的另一项自定义功能是持续预训练,它针对一组不同的使用案例。 它允许企业在非常大的数据集上定制大型基岩模型,例如涉及数十亿个代币的库。 令牌是与多个字符或数字相对应的数据单位。 此新功能还允许使用新信息定期刷新训练数据集。
它还允许客户对未标记的数据集进行持续的预训练。 此类数据集包含示例输入,但通常没有 AI 模型所需的输出示例。 现在用户不需要创建输出示例,因此可以大大减少创建训练数据集的工作量,从而降低 AI 定制的成本。
亚马逊网络服务(Amazon Web Services)生成式人工智能首席开发布道师Antje Barth在一篇博客文章中表示:“用户最多可以指定10万条训练数据记录,通常在提交至少10亿个代币后会看到显著的定制结果。 ”
人工智能安全。
本月,有报道称,Microsoft名员工被禁止使用ChatGPT,这是该公司在OpenAI上投入巨资的产品。 “由于安全和数据问题,许多人工智能工具不再可供员工使用,”据说这是当时来自Microsoft内部的信息。 根据 Microsoft 的说法,“虽然Microsoft确实投资了 OpenAI,并且 ChatGPT 内置了防止不当使用的保护措施,但 ** 仍然是第三方外部服务。 ”
本次主题演讲中有趣的一点是,当 Selipsky 谈到 Bedrock 对安全和隐私的关注时,大屏幕播放了这篇关于 ChatGPT 的新闻报道。
塞利普斯基没有点名Microsoft,但他对“朋友”在没有全面安全保障的情况下发布早期版本的人工智能产品的行为表示惊讶,“我不敢相信一家朋友公司居然在没有全面安全保障的情况下发布了人工智能产品的早期版本。 他们对自己的模型和数据的安全性没有信心。 ”
堆栈的第 3 层:AI 助手的 Amazon Q 预览版已正式发布。
在今天的主题演讲中,亚马逊云科技还宣布了 Amazon Q 的预览版,这是一个处于技术堆栈顶端的应用程序。 一些分析师认为,Amazon Q 是今年 Re:Invent 大会上最重要的公告。 “它正在为开发人员提供人工智能,帮助他们取得成功。 ”
Amazon Q 能够回答诸如“如何使用 Amazon Web Services 构建 Web 应用程序?类似的东西。 Amazon Q 经过 Amazon 在过去 17 年中积累的知识培训,能够回答各种问题并解释原因。
亚马逊网络服务首席执行官亚当·塞利普斯基(Adam Selipsky)在演讲中表示:“您可以使用Amazon Q轻松进行对话、生成内容并采取行动。 Amazon Q 完全了解您的系统、数据存储库和运营需求。 ”
用户可以将 Amazon Q 连接到其组织指定的应用程序和软件(例如 Salesforce、Jira、Zendesk、Gmail 和 Amazon S3 存储实例)并自定义配置。 Amazon Q 将所有相关数据和内容编制索引,以“习”您当前业务的各个方面,包括组织结构、核心概念和产品名称。
例如,一家公司可以通过 Web 应用程序询问 Amazon Q,以分析客户在哪些功能上遇到了问题以及如何改进它们; 也可以像使用 ChatGPT 一样直接上传文件(Word 文档、PDF、电子**等)并提出与内容相关的问题。 Amazon Q 通过连接、集成和数据(包括特定于业务的数据)提供响应和参考。
Amazon Q 不仅可以回答问题,还可以充当生成或总结博客文章内容、时事通讯和电子邮件的助手。 它还为工作中的一般操作提供了一组可配置的插件,包括通过 Slack 中的特定团队自动创建服务工单,以及更新 ServiceNow 中的仪表板等。 为防止错误,Amazon Q 要求用户在采取行动之前查看其行动建议,并显示结果以供验证。
可以想象,Amazon Q 可以通过亚马逊云科技管理控制台、各种 Web 应用程序和聊天应用程序(如 Slack)访问,并且对亚马逊云科技系列产品和服务有透彻的了解。 根据亚马逊云科技的说法,Amazon Q 了解亚马逊云科技上各种应用程序工作负载的细微差别,即使对于只需要运行几秒钟或几乎无法访问存储内容的应用程序,也可以接受 Amazon Q 的指导和操作。
在舞台上,Selipsky 展示了一个高性能编码和转码应用程序的示例。 根据 Selipsky 的说法,当被问及哪些 EC2 实例最适合当前使用案例时,Amazon Q 有一个列表,其中包括性能与成本因素。
我坚信这将是生产力的改变,我希望来自不同行业和角色的人们都能从 Amazon Q 中受益。 ”
Amazon Q 与 Amazon CodeWhisperer 服务相结合,可构建和解释应用程序**。 在受支持的 IDE 中,例如 Amazon Web Services 的 CodeCatalyst,Amazon Q 可以为客户生成测试**,以衡量其质量水平。 Amazon Q 还可以创建新的软件功能、执行转换以及更新软件包、存储库和框架的草稿和文档,从而使用自然语言优化和执行计划。
根据 Selipsky 的说法,Amazon Web Services 的一个小团队在短短两天内就使用 Amazon Q 将数千个应用程序从 J**A 8 升级到 J**A 17,甚至完成了相应的测试。
Amazon Q 的转换功能仅支持从 J**A 8 和 J**A 11 升级到 J**A 17(即将推出)。 .NET Framework 到跨平台。 .NET 转换)以及所有相关功能(包括转换)都是 CodeWhisperer Professional 订阅服务所必需的。目前尚不清楚未来是否会放宽这些要求。
Selipsky还重申了亚马逊网络服务对安全责任的重要性,向潜在的生成式AI客户保证,“如果你的用户一开始就无法访问某些东西,那么在使用Amazon Q后,他们仍然无法访问它。 Amazon Q 了解并尊重用户的当前身份、角色和权限。我们也绝不会使用业务内容来训练底层模型。 ”
写在最后。 很明显,亚马逊云科技保持其在AI云领域主导地位的核心战略是继续增强其云基础设施,并为市场开发独特的生成式AI技术堆栈。
Selipsky认为,亚马逊云科技的生成式AI堆栈具有独特的优势,“我们独特的生成式AI堆栈为客户提供了优于其他云供应商的比较优势。 并非每个竞争对手都愿意在每个层面上进行创新,客户也不知道他们需要多长时间才能缩小差距。 ”
生成式 AI 的兴起为大型云提供商开辟了一个巨大的新市场,在这个快速发展的过程中,业界已经感受到了生成式 AI 适应性和创新的重要性。 正如塞利普斯基所说,“适应能力是你能拥有的最有价值的能力。 亚马逊云科技还通过gr**iton尖端芯片、Trainium等专用芯片、模型平台和Amazon Q应用产品展示了这些创新元素。
可以看出,亚马逊云科技在其独特的三层生成式AI技术栈上投入了大量资金,希望支持多样化的AI模型和平台、战略合作伙伴关系、最具成本效益的服务以及更丰富的技术选择。