2008年05月18日
●1ペタFLOPSを超えるか-Roadrunnerのテストが間近
・理論ピーク性能1.3ペタFLOPSのRoadrunnerスーパーコンピューターが、IBMのポケプシー工場で組み立てをほぼ終わり、今月末からテストが始まるということが、先週IDGはじめいろいろなところから報道されています。
・いよいよ関心は、6月17日から始まるISC'08のTop500の発表で、ロスアラモス国立研究所(LANL)のRoadrunnerが、首位をキープし続けている宿敵(?)リバモア国立研究所(LLNL)のBlue Gene/Lを抜き去れるか、さらにはベンチマーク性能の歴史的なマイルストーンになる1ペタFLOPSに到達できるかどうかということになってきました。
・昨年のSC07のLANLのプレゼンテーションでは確か、今年8月には1ペタFLOPSを達成できると自信を持って話していたのでそのとおりに着実にコマを進めてきたと言えます。
・いまの時点で1ペタFLOPSのピーク性能を実現するためには、およそ次の3つの方法があって、それは
1. Opteron 13万プロセッサー・コアからなるシステム
2. IBM Blue Gene/Pで32万プロセッサー・コアのシステム
3. IBMのCellプロセッサーのSPE 8万個で加速するRoadrunnerのハイブリッド・システム、
ということですが、最後の3の方法が最初に1ペタFLOPSを達成する可能性が一段と高くなってきたようです。
・Roadrunnerに使用されているeDPと呼ばれていた新プロセッサーが先週IBMから発表されました。正式名称はIBM PowerXCell 8i、これはPowerPC* 8 SPEからきたネーミングなのでしょうか。
PowerXCell 8iを2個搭載したIBM QS22 ブレード・サーバーも同時に発表されました。
・IBMの発表によれば、倍精度浮動小数点演算がPowerXCell 8iでは以前のCell/B.E.の5倍も速くなり、QS22ブレード・サーバーのメモリーも最大32GBと大幅増となっています。
・QS22ブレード・サーバーがどのくらい速いかというと、ピーク性能で、
- QS22あたり 460GFLOPS(単精度)/217 GFLOPS (倍精度)
- BladeCenterシャシーあたり 6.4/3.0 TFLOPS (単精度/倍精度)
- 42Uラックあたり 25.8/12.18 TFLOPS (単精度/倍精度)
と、1ラックの性能でBlue Gene/Pの13.9 TFLOPSに迫る倍精度演算能力を持つことがわかります。これでいままで弱点と言われていた倍精度演算が主となるHPC用途についてもCell B.E.アーキテクチャの強さを利用できることになりました。
・ハイブリッド型クラスター・システムを使いこなすプログラミング等についての腕力がありさえすれば、今やだれでも小型のRoadrunnerを構築・活用できる条件ができたことになります。使いやすく安定した高性能システムと言われているBlue Geneに加え、ハイブリッドのRoadrunnerタイプと、スーパーコンピューターの選択肢がさらに増えたわけです。
どこを切っても同じ金太郎飴というのが昔ありましたが、すぐ飽きてしまった記憶があります。LLNLのBG/LやLANLのRRの動きを見ていると、金太郎飴とは対極の、他と積極的に違いを創り何が何でも成功させて優位さを示そうとする研究者・開発者達の勢いと執念というのをひしひし感じますね。
・いよいよ関心は、6月17日から始まるISC'08のTop500の発表で、ロスアラモス国立研究所(LANL)のRoadrunnerが、首位をキープし続けている宿敵(?)リバモア国立研究所(LLNL)のBlue Gene/Lを抜き去れるか、さらにはベンチマーク性能の歴史的なマイルストーンになる1ペタFLOPSに到達できるかどうかということになってきました。
・昨年のSC07のLANLのプレゼンテーションでは確か、今年8月には1ペタFLOPSを達成できると自信を持って話していたのでそのとおりに着実にコマを進めてきたと言えます。
・いまの時点で1ペタFLOPSのピーク性能を実現するためには、およそ次の3つの方法があって、それは
1. Opteron 13万プロセッサー・コアからなるシステム
2. IBM Blue Gene/Pで32万プロセッサー・コアのシステム
3. IBMのCellプロセッサーのSPE 8万個で加速するRoadrunnerのハイブリッド・システム、
ということですが、最後の3の方法が最初に1ペタFLOPSを達成する可能性が一段と高くなってきたようです。
・Roadrunnerに使用されているeDPと呼ばれていた新プロセッサーが先週IBMから発表されました。正式名称はIBM PowerXCell 8i、これはPowerPC* 8 SPEからきたネーミングなのでしょうか。
PowerXCell 8iを2個搭載したIBM QS22 ブレード・サーバーも同時に発表されました。
・IBMの発表によれば、倍精度浮動小数点演算がPowerXCell 8iでは以前のCell/B.E.の5倍も速くなり、QS22ブレード・サーバーのメモリーも最大32GBと大幅増となっています。
・QS22ブレード・サーバーがどのくらい速いかというと、ピーク性能で、
- QS22あたり 460GFLOPS(単精度)/217 GFLOPS (倍精度)
- BladeCenterシャシーあたり 6.4/3.0 TFLOPS (単精度/倍精度)
- 42Uラックあたり 25.8/12.18 TFLOPS (単精度/倍精度)
と、1ラックの性能でBlue Gene/Pの13.9 TFLOPSに迫る倍精度演算能力を持つことがわかります。これでいままで弱点と言われていた倍精度演算が主となるHPC用途についてもCell B.E.アーキテクチャの強さを利用できることになりました。
・ハイブリッド型クラスター・システムを使いこなすプログラミング等についての腕力がありさえすれば、今やだれでも小型のRoadrunnerを構築・活用できる条件ができたことになります。使いやすく安定した高性能システムと言われているBlue Geneに加え、ハイブリッドのRoadrunnerタイプと、スーパーコンピューターの選択肢がさらに増えたわけです。
どこを切っても同じ金太郎飴というのが昔ありましたが、すぐ飽きてしまった記憶があります。LLNLのBG/LやLANLのRRの動きを見ていると、金太郎飴とは対極の、他と積極的に違いを創り何が何でも成功させて優位さを示そうとする研究者・開発者達の勢いと執念というのをひしひし感じますね。

