超算和gpuSummit超算用了什么处理器？全面解析IBM与NVIDIA的强强联

是否曾好奇，曾经问鼎全球超级计算机排行榜首的Summit，究竟搭载了什么强大的心脏？??作为橡树岭民族实验室的超级计算利器，Summit的处理器选择体现了异构计算的精妙平衡。今天，我们就来深入剖析Summit超算的处理器类型、技术架构及其背后的设计哲学，看看它是怎样实现每秒20亿亿次惊人计算性能的！

??核心处理器：IBMPOWER9的强劲动力

ummit超级计算机的每个计算节点都配备了??两个IBMPOWER9处理器??。这款处理器是IBM的旗舰产品，专为高性能计算和人工智能职业负载而设计。

?POWER9的关键特性包括??：

???高度并行处理能力??：每个处理器拥有22个物理核心，支持大量并发线程执行，为复杂科学计算提供坚实基础。 ???高速内存带宽??：支持8通道DDR4内存，提供高达340GB/s的内存带宽，确保数据饥渴型应用能够高效运行。 ???先进的I/O子体系??：提供??96条PCIe4.0通道??，为连接加速器显卡提供了极高的数据传输吞吐量，这对于异构计算架构至关重要。

BMPOWER9处理器为Summit提供了稳健的通用计算能力和高效的数据处理基础。

?加速器显卡：NVIDIATeslaV100的深度进修威力

ummit的每一个计算节点不仅有两个POWER9CPU，还集成了??六个NVIDIATeslaV100图形处理单元（GPU）作为加速器??。这些GPU是Summit达到巅峰计算性能的关键。

?TeslaV100的核心优势体现在??：

???专为AI和HPC优化??：基于Volta架构，内置TensorCore，能极大加速深度进修训练和推理任务，同时也非常适合传统的科学计算。 ???极高的浮点运算性能??：尤其是在混合精度计算场景下，能提供惊人的计算吞吐量，助力Summit实现峰值性能。 ???高速互联支持??：通过??NVLink2.0??技术与POWER9处理器连接，提供高达100GB/s的带宽，显著减少了CPU与GPU之间的数据传输瓶颈，避免了传统PCIe连接可能带来的延迟。

种“CPU+GPU”的协同职业模式，使得Summit既能处理串行任务，也能并行处理海量数据。

??协同职业与异构架构

ummit的真正强大之处并非仅仅堆砌硬件，而在于其??创新的异构架构设计??，使POWER9处理器和TeslaV100GPU能够高效协同职业。

?其协同职业的精髓在于??：

???任务合理分配??：CPU擅长处理逻辑复杂、串行化的任务，而GPU则专注于数据并行度高、计算密集的核心算法。Summit智能地将职业负载分发到最适合的硬件单元上。 ???高速互联基础设施??：节点间采用??MellanoxEDRInfiniBand??网络进行连接，提供高达25GB/s的传输速率，构建了无阻塞的胖树拓扑结构，确保了数千个节点在并行计算时的高效通信。 ???统一内存架构支持??：体系支持超过10PB的混合内存（包括DDR4、HBM和非易失性内存），并为程序员提供了更统一的内存访问视图，简化了编程难度。

种设计使得Summit不仅在传统的科学模拟中表现卓越，更在人工智能、机器进修等新兴领域大放异彩。

??Summit处理器配置一览

了让无论兄弟们更直观地了解Summit的处理器配置，请看下表：

??组件类型?? ??具体型号?? ??单节点数量?? ??体系总数?? ??主要角色??

??中央处理器(CPU)?? IBMPOWER9 2个 9,216个通用计算、任务调度、数据管理

??图形处理器(GPU)?? NVIDIATeslaV100 6个 27,648个加速计算、并行处理、AI与深度进修任务

??为何选择这样的处理器组合？

ummit选择IBMPOWER9+NVIDIATeslaV100的组合，是基于深刻的性能需求和能效考量。

?背后的逻辑包括??：

???应对多样化职业负载??：从模拟原子相互影响、癌症研究到宇宙学模拟，研究课题需要不同的计算模式。CPU+GPU的异构架构提供了无与伦比的灵活性。 ???追求极点能效??：虽然在完全功耗上Summit达到了15兆瓦，但考虑到其200PFlops的峰值性能，其??计算能效比??在当时是相当出色的。GPU在执行特定计算时比CPU能效高得多。 ???为AI未来做准备??：Summit被设计为“最智能的超级计算机”，其架构前瞻性地预见了人工智能在科学发现中日益增长的重要性，TeslaV100中的TensorCores正是为此而生。

??实际应用与影响力

ummit的强大算力源于其处理器，而它的价格则体现在解决全球级难题上。

?其处理能力赋能了许多前沿领域??：

???能源研究??：例如，更高效的新型材料模拟，旨在开发更强大、更节能的材料。 ???医疗健壮??：??建立基因与癌症之间的关联??，加速癌症研究和精准药物开发。 ???天体物理学??：??模拟超新星爆炸??等复杂宇宙现象，帮助我们探索宇宙的起源。

??我的看法：异构计算是未来

观Summit的处理器选择，我们可以清晰地看到一条高性能计算进步的主流路径：??异构计算??。它并非简单粗暴地追求CPU核心数量的堆砌，而是??注重不同计算单元的优势互补与协同效能??。

ummit的成功操作表明，??“CPU+GPU”的架构??是应对当前及未来科学计算和AI挑战的有效方案。它不仅提供了惊人的rawpower，更在能效和实用性之间取得了良好平衡。对于从事高性能计算或AI研究的机构和开发者而言，领会并掌握这种异构编程模型，将是释放强大硬件潜力的关键。

明仪网