トップ 500 スーパーコンピューター: Nvidia H100 と Intel チップのおかげで新たな勢い

アルゴンヌ国立研究所の待望の Aurora システムがついに登場しました。5 年遅れで、当初の計画とはまったく異なるプロセッサーが搭載されました。 実際には、エネルギー省 (DOE) の資金提供を受けた米国エクサスケール コンピューティング プロジェクトの一環としてエクサスケール コンピューターになる予定でしたが、まだ待たなければなりません。 新しい、現在 62 番目の Top500 スーパーコンピューター リストによると、Aurora はまだ半分にすぎません。 しかし、2022年半ばから導入されているAMDテクノロジーを搭載したリーダーであるFrontierに次ぐ2位には少なくとも十分だ。

広告

今年 6 月、Intel と HPE は、Aurora に 10,624 ブレードすべてがついに「完全装備」されたことを祝い、期待は高かった。 しかし、どうやら多くの Sapphire Rapids プロセッサ (Xeon CPU Max 9470) と特に Ponte Vecchio コンピュータ アクセラレータ (Data Center GPU Max 1550) がまだ不足しているようです。これは、Top500 リスト (HPL) のランキングに使用される Linpack ベンチマークが半分の電力で動作しただけではないためです。達成されたのはわずか 585 ペタフロップス (PFlops) でした。 これはオークリッジ国立研究所のフロンティアが提供するものの半分強に相当し、トップ500リストの上位にランクインする唯一のエクサスケールシステムとなっている。

インテルは以前に何を作ったのでしょうか? Ponte Vecchio GPU あたりの最大パフォーマンスは 52 テラフロップス (TFlops) について話していました。 63,744 個の GPU で完全に拡張した場合、それだけで理論上のピーク パフォーマンス (R) の 3.3 エクサフロップス (EFlops) に相当します。絶頂に達する) そして、HBM RAM を搭載した Max 9470 Xeon の 100 万個を超えるコンピューティング コアのパフォーマンスが得られます。


トップ500 ランク1

1.2 エクサフロップス弱で依然として 1 位: 米国オークリッジ国立研究所のフロンティア。
(画像: HPE 国立研究所/Oak Ridge)

Intel はそれほど高い数値を設定せず、「2 EFlops を超えるピーク」についてのみ言及しました。しかし、21,248 Xeon と 63,744 GPU ではなく、10,878 Xeon と 32,634 GPU のみが含まれているため、現時点では 1.06 EFlops にすぎません。

Aurora の効率も一般に考えられているよりもはるかに悪く、HPL ベンチマークでは理論上の最大パフォーマンスの 55.3% しか達成できず、リストの 295 位にランクされています。 比較のために、リーダーのフロンティアは 71.1 パーセントに達します。

そして、エネルギー効率に関しては、状況はさらに悪化しているように見えます。フロンティアでは 23.7 GFlops/W に対し、52.6 GFlops/W です。 結論: インテルの当惑は続いている。

特別に最適化された Linpack ランタイムにより、Frontier は 62.7 GFlops/W を達成し、Green500 リストで 2 位となり、他の 3 台の HPE/AMD コンピューターを上回りました。

65.4 GFlops/W の Green500 のトップは、エネルギー効率を高めるために特別に設計された、Intel Xeon と Nvidia H100 を搭載した Flatiron Institute の比較的性能の低い Henri コンピュータによって依然としてマークされています。

Aurora と同様に、他の 3 つのシステムにもインテルの Max プロセッサーと Max GPU が搭載されています。ケンブリッジ大学の Dell の Dawn は 19.5 PFlops (41 位)、ライプニッツ データセンターの Lenovo の SuperMUC NG Phase 2 は 17.2 PFlops (52 位) )と同じくレノボ出身のクレメンティーナ XXI がアルゼンチンのセルヴィシオ メトロロジコ ナシオナルで 3.9 PFlops を記録し 196 位でした。



PCIe カードおよび 128 GB の HBM2e RAM を備えた 600 ワット モジュール バージョンの Intel GPU Max データ センター、別名 Ponte Vecchio。

(画像: c’t Magazine/C. Windeck)

ただし、3 つとも CPU ごとに 2 つの GPU しか搭載されていませんが、Aurora には 3 つの GPU が搭載されています。 効率は大きく異なり、Lenovo の 2 台のマシンはそれぞれ 61.5 パーセントと 64.7 パーセントですが、Dell の Cambridge システムはわずか 36.1 パーセントです。 もちろん、これは、Linpack のランタイムの最適化にどれだけの労力を費やしたかにも依存します。 ライプニッツのデータセンターでもエネルギー効率を測定しましたが、これは低いオーロラ値とほとんど変わりませんでした。

HPE が構築した国家核安全保障局の Crossroads など、GPU 以外の Sapphire Rapids システムもあり、それぞれ 56 コアの 12,708 個の Xeon Max プロセッサーを搭載してレースに参加し、75% で 30 PFlops (24 位) を達成しています。 。 しかし、ここではエネルギー効率がオフサイドで、4.8 GFlops/W です。 他の多くの新しい Xeon クラスターには Nvidia GPU が搭載されています。

前回の 2023 年夏のトップ 500 リストとは異なり、トップ 10 の上位には多くの変化がありました。 Aurora のすぐ後ろで、Microsoft Azure のクラウド システムが 561 PFlops で 3 位に入り、これも Sapphire Rapids ですが、GPU として Nvidia H100 を搭載しています。

これと同じ Intel/Nvidia の組み合わせを持つ他の 2 つのシステムが 8 位と 9 位を占めています。138 PFlops のバルセロナの EuroHPC MareNostrum 5 ACC と 121 PFlops の Nvidia 社内スーパーコンピューター EOS です。

トップ 10 に入っているもう 1 つの EuroHPC コンピューター、フィンランドの AMD プロセッサーと GPU を搭載した Lumi は、309 PFlops から 378 PFlops (5 位) にわずかに向上しました。 しかし、これは現在 4 位を占めている 442 PFlops の ARM64FX を搭載した日本の富岳を追い抜くには十分ではありません。

93 PFlops を誇る中国の Sunway TaihuLight は現在、トップ 10 から後退しています (11 位)。 しかし、中国はトップ500レースから外れている。 米国の輸出規制に抗議して、しばらく新しいシステムはほとんど報告されておらず、今回はまったく報告されていません。

Lenovo は、旧 IBM 工場の所有者として、他の中国諸国でさえも、さまざまな新しいシステムを発表することができます。 ふさわしく、アジア太平洋経済共同体(APEC)首脳会議がSC23と並行して米国で開催されており、ジョー・バイデンと習近平も会談したいと考えており、おそらく再び多少の緩和が見られるだろう。

ホームページへ

Nishikawa Katashi

「Web オタク。情熱的なトラブルメーカー。オーガナイザー。アマチュア コーヒー マニア。ゾンビ マニア。」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です