魏少军:关于“未来芯片”的几点思考。

小夏 教育 更新 2024-01-29

今天,第八届未来芯片论坛在北京举行。 未来芯片论坛是由清华大学集成电路学院、北京集成电路高精尖创新中心主办的重要年度学术会议,为该领域的高校、研究机构和企业搭建一个跨界、跨学科的思想交流平台。 国际欧亚科学院院士、清华大学魏少军教授谈到了自己对未来芯片的看法。

高性能计算已进入E级时代,去年美国能源部发布了全球首台E级计算超级计算机。 E级计算是一个非常重要的里程碑,能够完成每秒100亿exaflops。 超级计算机发布后,美国科学顾问委员会立即宣布,美国高性能计算的下一个目标是Z级计算。 与 E 级计算相比,Z 级计算速度快 1,000 倍。

业界对更高计算速度的追求永无止境。 并且数据总量正在增加,到 2024 年,数据总量将达到 100 ZB。 数据量急剧增长。 尤其是人工智能成长之后,数据量更大,所以Z级计算成为行业必须解决的问题。

魏少军指出:“仅仅依靠技术进步,几乎不可能实现更高性能的计算。 “原因很简单,按照美国尖端计算机使用的工艺,比如现在的6nm工艺,功耗高达211 MW,面积为 680 平方米。 半导体工艺不断向前发展,有5nm、4nm、3nm。 如果采用3nm工艺实现Z级计算,目前功耗高达8000兆瓦,这意味着一小时用电800万千瓦,相当于每小时电费约400万元。 在成本方面,使用 3nm 工艺实现 Z 级计算将花费 6000 亿美元。 虽然工艺的进展会带来成本的降低,但总的来说,直接成本不会下降太多,覆盖数十万平方米的面积,这也会带来巨大的延误。 因此,仅仅通过工艺进步几乎不可能实现更高性能的计算。

目前,计算芯片的计算资源在整个芯片资源中所占的比例非常低,不到01%,利用率较低,但数据传输的能耗非常高,例如GPU的能耗非常高,超过90%。 基于这样的基本特性,要想在目前的计算机制和计算芯片的基础上完成下一代计算是非常困难的。

此外,对算力的要求达到了无与伦比的水平,人工智能的蓬勃发展是众所周知的,目前人工智能的习分为两大类,一类称为类脑计算,另一类称为深度学习。 这两类涉及的三个基本要素包括算法、数据和计算能力。 其中,算力在人工智能中发挥了真正的推动作用。

目前的人工智能与预期相去甚远。 一方面,算法和人类识别是不一样的,现在要求人工智能能够适应不同的应用。 另一方面,人工智能的实现过程现在更加“暴力”。 例如,在 2014 年实现一个简单模型需要每秒约 196 亿次操作,并同时处理 1拥有38亿个参数,这样的高密度计算和高密度存储也给当今的芯片带来了巨大的挑战。 魏少军说:“对于计算架构来说,已经进入了'**时代'。 到目前为止,如果我们只遵循旧的传统,就不可能创新计算架构。 ”

未来,能够提供支持的超级计算,基本需要投资不到100亿元,功耗不到100兆瓦,占地数万平方米甚至10000平方米。 在这样的条件下,对芯片、硬件和软件提出了新的潜在要求。

智能扩展了我们的认知。 以计算机、网络、电信、光电子、集成电路技术为主要内容的信息革命,实现了人类感官能力的延伸和放大。 信息技术将与人工智能技术和新材料工程携手并进,将信息技术推向新的高度,实现人脑能力的延伸和放大。 以机械化、电气化、自动化为主要内容的工业革命解放了人的双手,为人类提供了巨大的能量,实现了人类体能的延伸和放大。

自2024年第一台电子计算机问世以来,它经历了三次智能浪潮。 2024年,日本第五代计算机被用作标志,这是第一次智能化浪潮。 到2024年,研究范围不断缩小,使用算法习机器学习进行分类和识别。 现在,谷歌的 DeepMind 游戏比人类职业游戏玩家好 10 倍。 可以看出,人工智能的发展在很多方面都超越了人类。

为什么会这样?加拿大神经科学家做出了重要贡献。 在他的启发下,在开发了类脑计算和深度学习习之后,可以使用深度神经网络进行训练,虽然有点暴力,但可以取得不错的效果。

人工智能芯片主流架构从AI芯片0开始5 一直到 AI 芯片 17. 从云 AI 向边缘 AI 演进。

魏少军说:“算力是人工智能发展的充分条件,算力是靠芯片来实现的,所以芯片缺一不可,后来专门针对人工智能的芯片出现了。 “一个应用就是一种算法,n个应用需要n个芯片,为了解决能够在一个芯片上实现不同应用的问题,出现了一种基于灵活性的可重构方法。 在处理不同算法的过程中,今天的人工智能通过计算能力和通用性的提高得到了进一步的提升。

当今的行业设想的架构更多地与计算机架构有关,可能需要探索新的技术实现。 但就没有必要去想一种硅基半导体材料了,它可以支持海量输入和海量输出,可能具有基本的加权和激活函数功能,并采用存储和计算一体化,超低延迟、超低功耗、极低成本,也可以使用目前的CMOS工艺制造,未来可以实现三维集成。 这是现在必须考虑的问题,如果我们能够突破这样的人工智能新技术,它可能会开辟一条新的道路。

魏少军也在思考,大模型是芯片不可缺少的,还是大模型会不会对芯片产生负面影响。 他做了一个实验,在聊天GPT上问“为什么林黛玉要三打白骨精”。 Chat GPT 4 和 Chat GPT 3 给出的答案完全不同。 Chat GPT 4 没有胡说八道,而是提供了一个更合乎逻辑的故事。

然而,ChatGPT在大量数据上进行训练,并开始增长其能力,这意味着它自身的创造能力非常有限。 人们之所以认为Chat GPT有很多新奇的想法,是因为它聚集了一群人的智慧。 事实上,Chat GPT 并不具有创造性,它更多的是通过数据进行训练。 在翻译与它的对话时,它的逻辑关系是不对的,其实Chat GPT并没有想象中的那么聪明。

回过头来看,大型模型对芯片设计有帮助吗?许多人认为EDA行业是利用大模型设计的最佳方式。 魏少军表示,EDA行业有两个部分可以使用大模型,一个是EDA工具,另一个是设计服务,即大模型和某些工具的结合来产生结果。 因此,对于这个问题,魏少军表示,大模型对芯片设计肯定有帮助,但值得思考的是,它有多大帮助。

三维集成电路最近慢慢开始升温,摩尔定律一直在发展,在发展过程中密度也越来越高。 现在5nm工艺可以集成在一平方毫米中约11 亿个晶体管,即 2,800 个逻辑门。 我们的集成能力已经大于可以实现的芯片。

基本器件在不断发展,从45nm、32nm到5nm、3nm,从hight-k到finfet,finfet可以用到7nm,再用3nm工艺到GAA。 GAA的寿命很短,只能使用一两代,再往前走还谁也不知道能不能进步。 虽然目前提出了二维器件和分子器件,但这是否可行以及成本是否可维持仍然是一个问题。

目前,小芯片和3D封装也被提出。 从某种意义上说,这两种方法都是广义上的集成,而不是传统的单芯片集成。 魏少军表示,从长远来看,这种做法没有问题,甚至会带来更重要的优势,比如降低成本。 没有必要使用所有最先进的工艺,开发和上市时间会更短。

在3nm发展之后,也可以考虑将晶体管垂直放置。 现在3D NAND已经做到了这一点,长江存储通过使用堆叠技术使3D NAND变得非常高。

另一方面,如果能够形成一种新的融合和新的融合,它不仅将解决计算和存储的问题,而且将实现三维集成电路的发展。

总而言之,计算无处不在。 高性能计算是未来发展的战略高地,也是大国竞争的焦点。 如今的计算架构和集成电路技术已经无法支撑到ZETTA级别的高性能计算,迫切需要通过架构创新来寻求突破。

智能化是大势所趋,人工智能的发展有赖于芯片技术的进步。 如今的芯片技术已经不能满足人工智能技术快速发展的需要亟需从基础部件入手,找到突破口。

大模型的到来,拓宽了人们的视野,给了一些新的发展方向。 很多人对大型辅助芯片的设计抱有强烈的期望。 今天,我们无法判断大模型对芯片设计的具体帮助,但是我们可以从大模型的基本原理做一些判断,下面进行对比客观而清醒地看待大模型在集成电路芯片设计中的作用。

集成电路的本质在于“集成”。 在系泊发展的背景下,是时候开始探索 3D 集成的路径和方法了。

本文由Semiconductor Industry Vertical(ID:icViews)根据清华大学魏少军教授在第八届未来芯片论坛上的演讲整理而成。

免责声明:本文由原作者创作。 文章内容为个人观点,我们仅分享与讨论,并不代表我们同意或同意,如有异议,请联系后台。

相似文章

    关于未来,有人看不到解决办法,有人看到好日子才刚刚开始!

    年后,大学同学聚在一起,已经能看到老年的痕迹。曾经瘦削有光泽的少年们,现在变成了圆滚滚的小肚腩,甚至脸上还长出了老年斑。在会议上,他们谈到了最新的发展。其中,有一位女学生成功退休,让大家大吃一惊。毕竟,我们一起在央企工作,只有她一个人坚持到最后。更让人意外的是,为了提前退休,她居然放弃了干部资格,因...

    探索比特币的未来:关于比特币未来的衷心讨论

    在一个对比特币的潜力充满兴奋的世界里,是时候消除噪音,就未来进行诚实的对话了。撇开炒作不谈,让我们揭开比特币未来的真实故事。要了解比特币的未来,我们必须首先了解它的根源。比特币是一种基于区块链技术的去中心化数字货币。对其历史的深入研究为评估其未来发展轨迹提供了宝贵的背景。加密货币市场以其波动性而闻名...