今年年初,大多数人从未听说过生成式人工智能,现在全世界都在竞相利用它,而这仅仅是个开始。 空间计算、量子计算、6G、智能基础设施和可持续发展等新市场正在加速更快、更高效、更专业地处理更多数据的需求。
与每隔几年等待下一个工艺节点的日子相比,过去一年和未来几年的事件将与**或汽车的诞生一样重要。 但会有很多创新技术,它们的交集将继续给科技界带来惊喜。
我们正在进入一个定制硬件、异构集成、软件定义系统的时代,所有这些都依赖于半导体。 但即使是芯片也在发生变化。 它们变得越来越有针对性,越来越复杂,潜在的安全威胁也越来越大。 所有这些趋势都将迫使设计师重新思考工作流程、架构和商业模式,其中一些将在 2023 年变得明显,但将在 2024 年开始真正加速。
ai/ml
2023 年人工智能机器学习 (AI ML) 随着 Google Gemini AI 的发布而落下帷幕,这既是对 ChatGPT 的追赶,也是对多模态 AI 的突破性推动。 谷歌的新技术应该会带来更多的设计进步,因为其他公司也在寻求将图像和人工智能纳入他们的人工智能工作。
Quadric首席营销官Steve Roddy表示:“Gemini之所以脱颖而出有几个原因。 首先,它有多个版本,可以从数据中心(Gemini Ultra)一直扩展到内存受限的电池供电设备(参数1)。8b)。 其次,谷歌提供了一个预量化版本的Gemini,可以部署在边缘设备中。 谷歌没有强迫嵌入式设备开发人员进行浮点到整数的转换,而是小心翼翼地让他们做好部署准备,这样他们就不需要用户充当数据科学家来进行转换。 对于边缘设备和手机开发人员来说,Gemini Nano 比以前的许多 GenAI 模型更易于部署,这可能会刺激应用的广泛采用和集成。 ”
与其他超大规模公司一样,谷歌拥有定制的人工智能生态系统,随着越来越多的公司在多个领域开发自己的人工智能芯片,这一趋势预计将加速。
AlphaW**e Semi首席技术官Tony Chan Carusone表示:“我们将看到开发自己的定制AI芯片的公司将带来大量令人兴奋的新应用和突破。 有各种各样的案例可以激励人们。 例如,甚至像特斯拉这样的公司也在开发自己的定制人工智能芯片,以帮助实现自动驾驶训练。 未来五年最激动人心的突破和应用将来自运行这种定制硬件的人。 ”
事实上,除了通常的大公司组合外,许多初创公司正在利用云技术来构建人工智能芯片,以解决汽车、光子学、太空和医疗设备等广泛领域的特定问题。 Synopsys 云上市和产品战略负责人 Bhatia 指出,他们正在内部使用人工智能来帮助削减云现货市场的成本,例如,通过提醒客户云提供商可能会终止他们的工作。 然后,它会自动将作业移动到其他虚拟机。
ARM工程执行副总裁Gary Campbell表示:“人工智能正在从根本上改变我们的生活和工作方式,这种转变只会在未来12个月内加速,甚至远远不止于此。 到 2024 年,围绕 AI 的讨论将变得更加微妙,重点关注不同类型的 AI、用例,最重要的是,我们需要建立哪些技术基础才能实现 AI 驱动的未来世界。 先进的专用芯片将在当今人工智能技术的扩展中发挥关键作用,并推动其部署的进一步发展。 CPU 在任何 AI 系统中都至关重要,无论是完全处理 AI 工作负载,还是与 GPU 或 NPU 等协处理器结合使用。 因此,这些算法和芯片的低功耗加速将更加强调,以便在大型语言模型、生成式人工智能和自动驾驶等高计算能力领域运行人工智能工作负载。 ”
此外,许多人希望利用人工智能来增强现有流程并提高生产力。 Synopsys产品线管理高级总监Arvind Narayanan表示:“在芯片设计过程中,通过引入人工智能来优化生产力有很多机会。 工艺几何形状的减少带来了一系列挑战,但设计芯片的时间要么保持不变,要么甚至更短。 预计到2024年,劳动力将严重短缺,设计师数量将减少20%至30%。 人工智能等变革性技术可以帮助填补这一空白。 ”
数字孪生和数据中心
人工智能对芯片设计工程师的潜在价值还有很多其他例子,例如将大型语言模型与数字孪生集成。 “随着数字孪生的指数级增长,市场规模将达到1112亿美元,更多的人将能够访问并希望使用数字孪生。 这就是为什么我们可能更有兴趣将LLM整合到数字孪生技术中,使其成为工作场所决策中更加关键的元素,因为LLM使操作员能够以自然的方式提出数字孪生问题。 ”
尽管目前人工智能蓬勃发展,但它在数据中心的使用可能会稳定下来。 “人工智能将继续用于数据中心,以帮助解决已被证明有效的小问题。 这些任务包括填补体力劳动的空白、提供能源管理建议或自动化产能管理等任务,“King 说。 “尽管如此,在解决重大挑战方面,例如考虑到当前的技能差距,人工智能仍不会被视为主要解决方案,例如运行数据中心而不是人类操作员。 因此,我们可能会从人工智能投资中看到更直接的小规模收益。 ”
数据中心也开始与边缘共享训练和推理,从而实现更多的分布式智能和实时响应。 Arteris 首席营销官 Michal Siwinski 表示:“边缘的 AI 推理意味着智能边缘绝对是企业运营向前迈出的一步,而且是全面的。 例如,我们将看到更多与汽车的跨界车。 消费者和工业界基本上正在从简单的电子产品转向相当先进的电子产品。 这是一个巨大的破坏。 ”
人工智能的影响正在蔓延
可以运行AI的芯片类型也在发生变化,这在边缘尤为重要。 例如,DSP 在视觉、音频和激光雷达等垂直市场中执行特定类型的处理时非常高效。 现在,随着人工智能无处不在,人们正在推动扩展这种能力。
“这样做的动机包括需要减少SoC面积并限制整体功耗,”Cadence的Tensilica Audio Voice DSP产品营销总监Prakash Madhvapathy说。 在边缘和设备端 AI 应用中,独立 DSP 或 DSP 与高效加速器相结合,是各种应用的理想选择,从微型耳塞到自动驾驶。 虽然 AI 加速器可能或多或少独立工作,但趋势是将它们与支持 AI 且高度可编程的 DSP 配对,作为面向未来的有效后备措施,以防不断发展的 AI 工作负载引入新的神经网络。 ”
定制
与此同时,定制化的发展,尤其是定制芯片的发展,对软件定义架构(SDAS)的兴趣越来越大,其中功能由软件定义。 “该产品实际上是一个软件产品,”Imperas(现为Synopsys的一部分)首席执行官Simon D**idmann说。 “看看特斯拉就知道了。 有大量的芯片,数百个处理器,但软件定义了这一切。 软件是预先设计和架构的,然后由芯片执行。 这意味着您必须事先进行大量模拟。 ”
SDAS 对定制芯片的需求与 RISC-V 不谋而合,Meta 在最近的 RISC-V 峰会上宣布将在其路线图上的所有产品中使用它,从而推动了 RISC-V 的发展。
“我们看到芯片设计人员越来越感兴趣,因为这给了他们自由,”D**Idmann说。 例如,我们正在与一家公司合作,该公司正在构建一种具有 512 个小内核的新型激光雷达芯片。 他们无法用他们能获得的许可证来制作它,所以他们不得不自己建造它。 他们不想发明自己的产品,所以他们选择了RISC-V。 ”
RISC-V International首席技术官Mark Himelstein对前景持乐观态度。 “RISC-V软件生态系统不断发展,具有许多里程碑式的发展,包括RISE项目的创建,以帮助加速RISC-V开源软件的开发,RISC-V的国际格局,以及使开发人员能够传达RISC-V软件可用性的通信。 ”
但这不仅仅是RISC-V的问题。 “人们正在构建混合架构 SoC,这带来了一系列完全不同的挑战,”Arteris 的 Siwinski 说。 “突然之间,你从一个稍微封闭的生态系统变成了一个必须跨所有标准进行互操作的生态系统。 我们如何将它们缝合在一起?这是关键挑战之一。 ”
答案可能是核心,最终会变得更加标准化。 “我们将看到小芯片如何协同工作,更加标准化,”Siwniski说。 “小芯片将成为另一个必须集成的IP。 ”
其他人也同意。 “随着晶圆代工技术的进步和摩尔定律的放缓,半导体行业需要找到新的方法来提高性能、降低成本和提高良率。 这就是为什么磁芯将在 2024 年成为整个行业的焦点。 Richard Grisenthwaite,ARM 执行副总裁兼首席架构师。 随着技术的普及和小芯片市场的多样化,重点将转向标准化和互操作性,以确保这些定制化的芯片以最快的方式进入市场,使它们能够在不同的市场中重复使用。 到 2024 年,我们预计业界将齐心协力,更明确地定义系统级功能和基础标准,使芯片能够用于更广泛的系统,而不会出现碎片化的风险。 ”
继续向左移动
小芯片和RISC-V扎根的关键原因之一是,新的工艺节点不再保证性能和/或功耗的提高。 SoC 被分解为多个部分,所有这些部分都需要表示为一个系统。 这需要更多的定制、更多的协作设计,以及在流程的早期更好地理解整体架构。
随着软件定义架构的发挥作用,您必须更多地关注前期系统设计,“是德科技 EDA、射频微波、电力电子和器件建模高级总监兼产品组合经理 Nilesh Kamdar 说。 “你以后不能再碰运气了。 从验证一直到流片的整个工作流程必须预先弄清楚、定义和设计。 你不能只是希望和祈祷它最终会走到一起。 ”
但这并不意味着事情变得更简单了。 Fraunhofer IIS自适应系统工程公司混合信号自动化组组长Benjamin Prautsch指出,复杂性稳步增加的趋势将继续下去。 “因此,任何有助于'左移'的活动都将被追究。 EDA是一个关键支柱,它面临着各种挑战,例如用于系统分区(包括基于小芯片的系统)的EDA,用于高级数字合成的EDA,以及用于模拟设计和验证的EDA。 ”
将所有这些部分组合在一起并不是一件简单的事情,您需要专注于真正的系统级设计以及所有部分如何组合在一起。 “用户知道他们需要进行真正的基于模型的系统设计,特别是对于软件定义的硅系统,”西门子EDA的IC验证解决方案战略总监Neil Hand说。 “他们想知道从哪里开始,因为这与本地优化有很大不同。 当您尝试在全球范围内设计系统并对其进行优化时,这是一系列全新的挑战。 ”
这将需要新的工具。 “真正的系统级设计的挑战之一是如何在域之间进行通信,”Hand说。 “你如何抽象一个详细的模型,使其可用于另一个领域?”当您开始查看左移时尤其如此。 如何获取流程级信息并将其提供给系统设计工程师?其中很大一部分将通过人工智能和机器学习创建模型来实现,这使得系统设计的其他领域可以发挥作用。 例如,它可用于创建复杂 SoC 的抽象系统模型,以便您可以在数字孪生中使用它。 ”
量子计算
2024年底,量子计算取得两项重大突破。 首先,IBM 推出了“IBM Quantum Heron”,这是一系列新的公用事业规模量子处理器中的第一款。 该公司还推出了 IBM Quantum Systems II,这是 IBM 的第一台模块化量子计算机,也是其以量子为中心的超级计算架构的基石。
其次,DARPA团队创建了有史以来第一个具有逻辑量子比特的量子电路,这是实现容错量子计算难题中缺失的关键部分。 逻辑量子比特经过纠错以保持其量子态,使其可用于解决各种复杂问题。 IBM 的成就令人兴奋,足以吸引一位 60 分钟的记者,他滔滔不绝地讲述前所未有的计算技术所实现的生物医学突破。
但量子时代也带来了一个巨大的警告。 RAMBUS高级首席工程师Scott Best表示:“事实上,在我们的有生之年,总会有人开发与密码学相关的量子计算机。 有了这样的机器,数学家们已经想出了如何破解所有数字签名算法和密钥交换算法的方法。 ”
因此,任何在 2024 年设计芯片的人都必须解决新芯片上市时传统加密方案被破解的可能性。 “人们对某些加密算法所做的一些模拟是合法的。 它们可能会在 2025 年之前到位。 Jayson Bethurem,Flex Logix 营销和业务发展副总裁。 “今天做出的关于安全的决定将不可避免地是错误的。 防止他们犯错误的唯一方法是在您的设备中保留某种动态加密,或者我们所说的“加密敏捷性”,例如 AES 算法。 ”
更多数据、更多性能和可持续性
数据不只是越线传输。 它还在大气层中移动,发送者和接收者都需要大幅改进的技术来处理大量增加的数据。 这就是 5G 毫米波和 6G 的用武之地。
在射频和毫米波领域,正在发生巨大的飞跃,这主要是由 6G 推动的,“是德科技的 Kamdar 说。 “当我们看到5G的一些后期阶段,以及6G的发展时,这将是一个巨大的飞跃。 从本质上讲,您将从 6GHz 或更低的载波频率升级到 28GHz 到 100GHz 的任何载波频率。 这意味着核心半导体技术、信号的核心调制以及应用的品质因数可能都必须完全改变。 市场的巨大变化使大多数公司无法继续使用过去的设计技术和工作流程。 他们必须想出全新的工作方式。 ”
这包括射频和基本主力——混合信号芯片。 最早可能在 2024 年进行设计改进。 对此,DARPA表示,它计划宣布一项建立射频异构集成标准的倡议。 Kamdar 说,鉴于人们对量子、光子学和 wifi 的兴趣,射频设计在最“可挖走”的员工技能列表中名列前茅。 “我真的鼓励更多的学生和年轻的职业专业人士考虑这个领域。 许多公司一旦发现您拥有合适的射频背景,就会立即抓住您。 ”
而这只是其中的一部分。 对人工智能的需求也将使内存、功耗和性能成为工程关注的重中之重。 Fraunhofer IIS EAS高效电子主管Andy Heinig表示:“随着基于复杂性增加的新型生成式AI的不断推出,对高性能处理器的需求也在增加。 这里的一个关键趋势是需要在各个级别获得更多内存。 对生成式人工智能的需求也加速了对高度具体的硬件实现的需求。 这样一来,整个系统的功率密度将大幅提高,但在动力传输和散热方面会出现问题。 ”
解决这些电力挑战的需求是由财务和环境问题驱动的。 Ampere首席产品官Jeff Wittich表示:“进入2024年,人工智能将成为一个推动者,可持续性和效率将成为计算能力增长的主要障碍。 如果不解决效率低下的问题,增长可能会停滞不前,因此企业将比以往任何时候都更加重视它。 ”
监管问题也在推动可持续发展举措。 “随着我们越来越接近一些监管要求,例如只允许电动汽车在加州或其他特定的碳目标中前进,系统公司正在考虑减少时间并确保一切都符合可持续性标准,”Arteris 的 Siwinski 说。 “随着最后期限的临近,许多创新正在加速。 ”
Untether人工智能产品副总裁鲍勃·比奇勒(Bob Beachler)表示,对可持续性的担忧可能会挑战甚至摧毁最受欢迎的人工智能场景之一。 “如果当今世界转向100%自动驾驶汽车,那么对温室气体的影响将大于目前全球所有数据中心中所有计算机的影响。 如果我们想让自动驾驶汽车上路,传统的自动驾驶汽车方法不具备使它们工作所需的“人工智能马力”。 我们需要一种更节能的方式来部署人工智能,让自动驾驶汽车上路。 ”
2024年后:可靠性和抗辐射性
更多的电子产品具有多方面的标签。 例如,缩小数字设备在成本、设计时间和可靠性方面的成本更高,每个类别都可以进一步细分。 密度越高,放射性粒子撞击重要部件的可能性就越大。 解决方案包括辐射硬化和冗余,这两者都可能导致组件成本增加 25% 到 50%。
Flex Logix 首席执行官 Geoff Tate 表示:“在较低的节点上,可靠性会受到粒子的影响,这可能导致开发人员需要更昂贵的抗辐射芯片。 “我们可能会看到更强大的抗辐射设计技术,适用于所有类型的存储元件和高级节点。 你不能让内存元素越来越小。 我们并没有摆脱阿尔法粒子。 它们在我们的太阳系中。 ”
虽然对于许多应用程序来说,这可能不是一个迫切的需求,但泰特的要求将会增加。 “对于大多数商业客户来说,制造抗辐射的组件可能要到本世纪末才成为问题。 我们刚刚开始看到商业客户需要抗辐射的内存组件来满足一些超高可靠性的商业应用。 ”
Siemens Hand对此表示赞同。 “随着我们进入 2024 年,可靠性将变得更加重要。 你会看到更多的公司考虑需要什么,“他说。 “无论是辐射硬化、功能安全还是其他技术,这都取决于哪种机制适合当前系统。 ”
结论
尽管取得了所有突破和令人兴奋的成果,但工程和商业的基础仍然存在。 “每个人都必须在设计和实施过程中提高效率才能完成工作,”Imperas的D**Idmann说。 “如果你没有足够快地到达那里,其他人就会抢占先机。 ”
随着新问题的出现,市场上充斥着寻求解决这些问题的初创公司,而大公司则因为技术、人才或两者兼而有之而收购它们,企业整合是另一个可能继续下去的趋势。 然而,正在改变的是所有这一切发生的速度。 随着新技术的引入,它正在加速,这只会持续到整个十年和下一个十年。 技术将继续存在,而半导体是使这一切发挥作用的引擎。 来源 |半导体行业观察(ID:ICBANK)编译自SemiEngineering
商务合作:请致电010-82306118或发送tiger@chinaaetcom