Exascale计算是最新的里程碑 尖端超级计算机 —可以使用任何其他方法以目前不可能以速度处理计算的高功率系统。
Exascale超级计算机是以Exaflop量表运行的计算机。前缀“ exa ”表示1千亿,即1 x 1018 —或一个18岁 之后零 。FLOP代表“每秒浮点操作” ,这是用于比较目的的一种计算方法。
这意味着一台Exascale计算机每秒至少可以处理至少1千万亿亿美元的浮点操作。相比之下,大多数家用计算机在TERAFLOP范围内运行(通常约为5 teraflops),仅处理约5万亿(5 x 1012)每秒浮点操作 。
HPC&AI客户解决方案副总裁杰拉尔德·克莱恩(Gerald Kleyn)杰拉尔德·克莱恩(Gerald Kleyn)杰拉尔德·克莱恩(Gerald Kleyn HPE ,告诉现场科学。
计算机每秒可以处理的浮点操作越多,其功能就越大,它可以更快地求解更多的计算。Exascale Computing通常用于进行复杂的模拟 ,例如气象天气预报,对新型药物进行建模和发动机设计的虚拟测试 。
第一台Exascale计算机,称为 边境,由HPE于2022年6月推出。其记录的运行速度为1.102 Exaflops。此后 ,这种速度已超过 现任领导人El Capitan,目前运行率为1.742 Exaflops。目前在出版时有两个 。
在COVID-19大流行期间,使用了Exascale超级计算机来收集 ,处理和分析大量数据。这使科学家能够理解和建模病毒的基因编码,而流行病学家部署了机器”。计算预测疾病的能力分布在整个人群中 。这些模拟是在短时间内进行的,而不是使用高性能的办公室计算机进行的。
也值得注意的是 量子计算机 与超级计算机不同。量子计算机没有使用常规位来表示信息 ,而是利用 Qubits 解决任何古典计算机的问题都太复杂了 。
为了工作 ,Exascale计算需要数万个高级中央处理单元(CPU)和图形处理单元(GPU),以包装到一个空间中。CPU和GPU的紧密距离至关重要,因为这会减少系统内部的延迟(数据之间传输数据所需的时间)。虽然延迟通常以皮秒为单位进行测量 ,但是当同时处理数十亿个计算时,这些微小的延迟可以结合起来以减慢整个系统 。
“互连(网络)将计算节点(由CPU和GPU和内存组成), ” CSC,告诉现场科学。“然后 ,软件堆栈可以将节点的关节计算功率利用为单个计算任务。”
尽管它们的组件尽可能紧密地塞入,但Exascale计算机仍然是巨大的设备 。例如,边境超级计算机有74个橱柜 ,每个机柜重约3.5吨,需要超过7,300平方英尺(680平方米)&ndash–大约是足球场的一半。
当然,将如此多的组件紧密地包装在一起会引起问题。计算机通常需要冷却以消散废热 ,而Exascale计算机每秒进行的数十亿计算可以将它们加热到潜在的破坏性温度。
克莱恩说:“将许多组件融合在一起作为一件事可能是最困难的道路,因为一切都需要完美运作 。”“作为人类,我们都知道很难让您的家人聚在一起吃晚饭 ,更不用说让36,000 GPU同步工作了。 ”
这意味着热量管理对于开发Exascale超级计算机至关重要。有些人使用北极中的冷环境来维持理想的温度;而另一些则使用液体水冷却,风扇架或两者的某种组合来保持低温 。
但是,环境控制系统还为能源管理挑战带来了进一步的并发症。由于需要供电的处理器数量 ,Exascale计算需要大量的能量。
尽管Exascale Computing会消耗大量能量,但从长远来看,它可以为项目提供节能 。例如,这些计算机无需迭代开发 ,构建和测试新的设计,而是在相对较短的时间段内模拟设计。
Exascale计算面临的另一个问题是可靠性。系统中的组件越多,它变得越复杂 。预计平均家用计算机将在三年内发生某种故障 ,但是在Exascale计算中,故障率以小时为单位进行测量。
该短失败率是由于需要数以万计的CPU和GPU—所有这些都以高能力运行。鉴于所有组件同时期望的高需求,很可能至少一个组件会在数小时内失败 。
由于Exascale计算的故障率 ,如果系统故障,应用程序使用检查点在处理计算时可以节省进度。
为了减轻故障的风险并避免不必要的停机时间,Exascale计算机将诊断套件与监视系统一起使用。这些系统提供了对系统的整体可靠性的持续监督 ,并确定了显示磨损迹象的组件,并在停电之前将其标记以进行更换。
Kleyn说:“诊断套件和监视系统向我们展示了机器的工作原理 。我们可以钻入每个组件,以查看它的失败并具有主动的警报。技术人员还在不断地在机器上工作 ,以取代失败的组件并保持运营状态。”“要保持这些机器的运转需要很多温柔的爱心 。”
Exascale计算中的高操作速度需要专业的操作系统和应用程序,以充分利用其处理能力。
曼尼宁(Manninen),我们需要能够以多种方式(通过节点和GPU或CPU内核上的节点内的节点内的节点和节点内的数百万处理单元的计算算法并行化计算算法。 ”“并非所有的计算问题都适合于此 。需要仔细精心策划不同过程和线程之间的通信;有效地实施输入和输出是具有挑战性的。”
由于进行模拟的复杂性,结果验证也可能具有挑战性。传统的办公计算机无法检查Exascale计算机的结果 ,或者至少在很短的时间内无法检查 。取而代之的是,应用程序使用预测的错误栏,这些错误栏对预期结果的粗略估计 ,这些栏以外的任何东西都打折了。
根据 摩尔法律,预计集成电路中的晶体管数量将每两年翻一番。如果这种发展的速度继续持续(如果不能永远持续下去,这是一个很大的话) ,我们可以期望Zettascale&Mdash&Mdash;一个具有21个零之后的一个;计算大约10年 。
Exascale计算在很短的时间内同时处理大量计算方面擅长,而量子计算开始解决常规计算会遇到的令人难以置信的复杂问题。尽管量子计算机目前不如Exascale计算机强大,但可以预测它们最终将超过它们。
一种可能的发展可能是量子计算和超级计算机的合并。该混合量子/经典超级计算机将将量子计算机的计算能力与经典计算的高速处理相结合 。科学家已经开始了这个过程 , 将量子计算机添加到Fugaku超级计算机 在日本。
克莱恩说:“随着我们继续缩小这些东西并提高了我们的冷却能力并使其价格降低,这将是解决我们以前无法解决问题的问题。”