一位顶级拳击冠军曾经抛出一个问题:力量还是速度,哪个是最重要的制胜因素?答案是令人惊讶的,因为对于最好的战士来说,预期是最重要的因素。 提前感知对手的动作,高速下出最强大的致命一击,才是结束比赛最需要的。 当业务和ICT技术快速发展时,预测也是CIO最重要的因素。
戴尔科技集团全球首席技术官John Roese近日从最前沿的角度分析了2024年ICT技术的演进趋势,是CIO们提升预测能力的绝佳参考标尺。
生成式人工智能的演变
2023 年,生成式 AI 正在兴起。 从表面上看,人工智能的成功看似一夜成名,但实际上,人工智能经历了一个漫长而艰巨的进化过程。 在经历了两次AI低谷之后,主张智能来自智能体与环境交互的行为主义盛行,直到2024年,在Alpago击败围棋领域最强的人类棋手后,2024年深度学习习出现后,该模型才成为AI研究和产业的中心。
2024年底,谷歌虽然发布了号称要赶超GPT-4的Gemini大模型,但这并不能阻止一个新的趋势:在2024年大语言模型训练热潮之后,2024年将迎来大语言模型应用的狂潮。 因此,2024年注定是大语言模型应用元年。
“2024年,包括OpenAI、谷歌、阿里巴巴在内的大公司纷纷推出自己的生成式AI技术,但很少有用户将生成式AI投入实际应用,而且大多数还处于理论阶段,”John Roese说。 处于领先地位的公司开始对生成式人工智能进行各种实验,以弄清楚如何应用它。 但到2024年,真正的转变将到来。 生成式人工智能将进入生产系统,实现从理论阶段到业务应用阶段的过渡。 ”
事实上,戴尔科技集团在 2023 年对生成式 AI 的使用进行了深入研究,并确定了数百个可以应用生成式 AI 的项目。 作为先驱者,John Roese提供了更有见地的建议:“当首席信息官和企业领导者准备应用生成式人工智能时,他们发现可能有成百上千个潜在的用例,但每个企业的资源有限,只能做其中的几个。 因此,首席信息官和业务领导者面临的第一个挑战是做出选择,能够确定优先级和优先级。 ”
一旦你选择了生成式人工智能应用程序,你就会遇到一个成本问题。 一种观点认为,大型语言模型在训练阶段需要大量成本,但在应用阶段不需要特别昂贵。 John Roese驳斥了这一说法:“就企业用例而言,我们在公司内部有一个系统,可以回答有关我们产品和技术的任何问题,它非常有用。 但我们发现,成本不仅来自构建模型的成本,还来自面临大量工作时的巨大运营成本。 因此,首席信息官还需要衡量生成式人工智能应用的性价比,以及当成本非常高时,他们是否愿意这样做。 ”
这些并不是生成式人工智能应用面临的所有问题,正如John Roese继续说道:“未来有许多复杂的问题。 首先是生成式 AI 推理的基础设施是什么,如果你有一个非常成熟的模型,但只有很少的用户,那么也许一台服务器就足够了。 但是,当您面对数以百万计的客户将使用此模型时,您可能需要数十万台服务器来组成基础架构。 第二个是你的推理过程将在哪里。 推理应该放置在数据和用户所在的位置,这样推理很可能不会放置在数据中心,而是可能位于边缘。 最后,即使您拥有适当的基础设施来保护足够的推理能力应用程序,您是否有能力保护基础设施?”
当生成式AI最终进入企业的核心应用,成为核心业务的依赖时,John Roese的观点将我们带回了问题的起点。
生成式 AI 应用的支持系统
在CIO看来,近年来,新技术浪潮层出不穷,像多条正弦曲线一样交织在一起。 从技术提供商的角度来看,多种技术往往会一起进步,以构建强大的底层基础设施,使技术脱颖而出。
从这个角度来看,生成式AI要想成功应用,要应对安全、推理场所、算力等新问题,无疑需要零信任安全、边缘计算、高性能硬件、足够的算力。 因此,根据 John Roese 的说法,零信任安全、边缘计算、先进硬件和量子计算将构成生成式 AI 应用的四大支柱。
与尚未大规模进入企业应用程序的生成式人工智能不同,黑客对它表现出了不同寻常的热情。 作为 ChatGPT 的变体,WormGPT 让钓鱼邮件更有说服力,FraudGPT 成功降低了黑客的技术准入门槛,深度伪造与勒索混合在一起,DeepLocker 和 BlackMamba 让攻击更加隐蔽。 正是由于生成式人工智能的发展,网络安全面临着更加严峻的挑战。 因此,迈向零信任安全已成为必经之路。
John Roese 解释说:“零信任并不是一个新概念,它意味着每个人、应用程序和设备都需要经过验证。 从控制的角度来看,确定好的、坏的和不知情的。 2024年,用户必须开始做零信任,同时鼓励零信任架构。 零信任不仅是一种产品,更是一种架构和理念。 整个生态系统正在使零信仰成为可能。 ”
至于边缘计算,John Roese认为:“在多云环境下,云服务提供商集中在数据中心提供服务,但在实践中,用户数据并不在数据中心,而是可能在工厂和医院。 这意味着大型服务提供商和服务堆栈需要为每个架构构建自己的边缘,但现实情况是,云服务提供商不需要为每个工作负载构建一个平台,他们只需要构建一个通用平台。 ”
对于许多人来说,量子计算只是明天的技术。 John Roese说:“我认为量子计算将在五年内成为现实。 量子计算与传统计算完全不同,在传统计算中,生成式人工智能可以根据无数的答案选项给用户一个正确的答案,而量子计算则具有处理无限数据的能力。 因此,当量子计算与生成式 AI 相结合并进行优化时,生成式 AI 可以变得更高效、运行得更好。 ”
2024年,未来已经到来
从生成式 AI 应用的四大支柱角度来看,Dell Technologies 推出了 Dell Apex 云平台,通过将云运营模式扩展到本地和边缘环境,提供一致的多云运维。 此外,戴尔科技集团还推出了许多创新产品和解决方案。 因此,戴尔科技集团在 2023 年所做的尝试可能正是我们将在 2024 年开始探索的。
那么,当 Dell Technologies 通过自己的努力打造未来时,您如何解决生成式 AI 应用程序中的新问题?为了满足我们的好奇心,约翰·罗斯(John Roese)提供了更多答案。
当大型语言模型进入工业应用时,还需要与领域知识深度融合。 在这个过程中,会遇到新的问题。 John Roese说:“大多数组织可以从基础模型开始,并对其进行调整以连接现有数据集,而不是10,000台服务器全天候运行以支持企业级生成式AI应用程序。 另一方面,用户必须重新设计其 IT 基础设施以支持生成式 AI 推理应用程序。 ”
对于生成式人工智能来说,当它进入企业应用程序时,数据短缺继续困扰着它的发展。 甚至有些人在三年内就耗尽了训练大型模型的数据。 在回答这个问题时,John Roese表示:“这种理解是完全正确的,没有好的硬件支持,就不会有好的生成式AI应用。 同时,如果没有好的数据,或者数据充满偏见或碎片化,那么你的应用程序就注定要失败。 我想给大家一些好消息,一些公司已经开发出了很好的工具。 从 Dell Technologies 的角度来看,我们现在与数据生态系统建立了良好的协作,这使我们能够进行高级数据编排。 例如,两年前,我们与 Snowflake 合作,它提供了非常好的基于云的数据仓库和数据编排,这使我们能够构建基础数据基础。 因此,从今年年初开始,所有公司都需要研究生成式AI需要什么样的数据来保证模型的训练。 Dell Technologies 与世界上最好的数据公司建立了良好的合作伙伴关系,我们在这一领域的使命是将这些数据工具引入各个用户组织的特定应用程序。 ”
对于大多数CIO来说,由于生成式AI应用的实施,数据还具有另一层更深层次的意义。 “数据对生成式人工智能至关重要,因此公司必须关注他们的数据集,不仅要关注数据的格式,还要关注该数据是否存在潜在的偏见,”John Roese强调说。 考虑到现在有新的工具可以清理新架构中的杂乱数据,用户有时甚至需要使用一个大型语言模型来检测另一个大型语言模型,以便在坏数据和好模型之间建立防火墙。 ”
从John Roese的介绍中,我们不难理解,无论你选择逃避还是正面交锋,生成式AI都会进入我们的工作和生活,也会给我们带来无穷无尽的新问题。 因此,选择合适的合作伙伴并立即开始接受挑战。