2007年09月
2007年09月28日
●Cell/B.E.の国内事例等-アルゴグループ・フォーラム2007
・Cell/B.E.をテーマにした講演トラックなどで構成されたアルゴ・グループフォーラム2007が10月24日(水) 9:50〜で都内ロイヤルパークホテル(日本橋 箱崎)で開催されます。
・主催は株式会社アルゴグラフィックスです(協賛が日本アイ・ビー・エム株式会社、ダッソーシステムズ株式会社)。
・同社はCATIAなどと共にCAE分野のIBM製プラットホームの提供でよく知られていますが、HPC分野でも長い経験を持つ企業で、今回もHPCのトラックがあります。そして最近はCell/B.E.を搭載したIBM QS20 BladeCenterの拡大に力を入れていて、今回のアルゴ・グループフォーラム2007にもその勢いが現れています。
・さて米国ではすでに後継のQS21ブレードが発表され、QS21以降のロードマップも示されています。SDK 3.0には早くもRoadrunnerスーパーコンピューターの開発プロジェクトから派生したプログラミング環境が含まれていることから、Cell/B.E.はマルチコア・ハイブリッドHPCシステム分野で先頭を走り始めています。
・国内でCell/B.E.の事例はじめ実践的なセミナー、実演があるのはまだ例が少ないので、ご関心のある方は注目です。参加無料(事前登録制)です。
同社新社長の澤田米生氏が日本IBM時代にソニー グループ担当役員だったことからCell/B.E.にはひときわ強い思い入れがあるとも。なんでもそうですが、案外こういう点も大事です。
・主催は株式会社アルゴグラフィックスです(協賛が日本アイ・ビー・エム株式会社、ダッソーシステムズ株式会社)。
・同社はCATIAなどと共にCAE分野のIBM製プラットホームの提供でよく知られていますが、HPC分野でも長い経験を持つ企業で、今回もHPCのトラックがあります。そして最近はCell/B.E.を搭載したIBM QS20 BladeCenterの拡大に力を入れていて、今回のアルゴ・グループフォーラム2007にもその勢いが現れています。
・さて米国ではすでに後継のQS21ブレードが発表され、QS21以降のロードマップも示されています。SDK 3.0には早くもRoadrunnerスーパーコンピューターの開発プロジェクトから派生したプログラミング環境が含まれていることから、Cell/B.E.はマルチコア・ハイブリッドHPCシステム分野で先頭を走り始めています。
・国内でCell/B.E.の事例はじめ実践的なセミナー、実演があるのはまだ例が少ないので、ご関心のある方は注目です。参加無料(事前登録制)です。
同社新社長の澤田米生氏が日本IBM時代にソニー グループ担当役員だったことからCell/B.E.にはひときわ強い思い入れがあるとも。なんでもそうですが、案外こういう点も大事です。
2007年09月17日
● SC07まで2ヶ月弱
早いもので、今年もSC07 (International conference on high performance computing, networking, storage, and analysis)まで2ヶ月弱となりました。
今年のSC07はネバダ州のRenoで11月10日(土)〜16日(金)に開催されます。Renoでは1989年に一度開催されているので実に18年ぶりとなります。当時のプログラムにはCray-2、Cray Y-MP、ETA-10や筑波大のQCD-PAXなどが並んでいて、ベクトル・マルチプロセッサー全盛でやや高並列システムの兆しありといった様子がうかがえます。
コンファレンスは11月13日(火)から始まりますが、ペタスケール・コンピューティングへの話題が多かった昨年に比べプログラムの内容がやや地味な印象を受けます。
最初の基調講演は、MITのCenter for Bits and Atoms 所長のニール ガーシェンフェルド博士による"Programming Bits and Atoms"です。MITのメデイアラボの教授だったこともある人だそうです。
今年は昨年に比べてクライスラー、BMW、GM、Pratt & Whitneyや家電メーカーのWhirlpoolなどIT以外の製造業界からの発表も目につきます。
さてゴードン・ベル賞のファイナリストには、プログラムの掲載順に、
1.MDGRAPE-3によるX線タンパク構造解析で281TFLOPSの性能を示した理化学研究所のYousuke Ohno氏等のチーム
2.地球シミュレーター上で第一原理シミュレーション・コード PHASEを使い大規模半導体系を解き、14.6 TFLOPS(理論ピーク性能の59%)を達成した物質・材料研究機構のTakahisa Ohno氏等のチーム
3.Blue Gene/Lを使ってケルビン-ヘルムホルツ不安定性の最初のミクロン・スケールの計算で54.4TFLOPSを示したLawrence Livermore National Laboratory (LLNL)のJames N. Glosli氏等のチーム
4.LLNLのBlue Gene/Lで数値気象予報の中でも高分解能なWeather Research and Forecast (WRF) モデルを計算したUniversity Consortium for Atmospheric ResearchのJohn Michalakes氏等のチーム
の計4チームが選ばれています。
理論ピーク性能が現在Top500の1位のLLNLのBlue Gene/Lを凌ぐ1/2ペタFLOPSとして設計され、来年元旦にはNSF Teragridから利用可能になる予定のTexas Advanced Computing Center (TACC) のRangerシステムがアプリケーション性能でBlue Gene/Lを追い越してTop500のNO.1になれるかどうかは興味のあるところです。
Rangerについては"Introduction to Ranger: the First NSF "Track 2" Petascale System"というBOFが開かれます。
私は13日〜15日に参加し、16日は一日サンジェゴで過ごすことにして、飛行機とホテルを予約したところです。
今年のSC07はネバダ州のRenoで11月10日(土)〜16日(金)に開催されます。Renoでは1989年に一度開催されているので実に18年ぶりとなります。当時のプログラムにはCray-2、Cray Y-MP、ETA-10や筑波大のQCD-PAXなどが並んでいて、ベクトル・マルチプロセッサー全盛でやや高並列システムの兆しありといった様子がうかがえます。コンファレンスは11月13日(火)から始まりますが、ペタスケール・コンピューティングへの話題が多かった昨年に比べプログラムの内容がやや地味な印象を受けます。
最初の基調講演は、MITのCenter for Bits and Atoms 所長のニール ガーシェンフェルド博士による"Programming Bits and Atoms"です。MITのメデイアラボの教授だったこともある人だそうです。
今年は昨年に比べてクライスラー、BMW、GM、Pratt & Whitneyや家電メーカーのWhirlpoolなどIT以外の製造業界からの発表も目につきます。
さてゴードン・ベル賞のファイナリストには、プログラムの掲載順に、
1.MDGRAPE-3によるX線タンパク構造解析で281TFLOPSの性能を示した理化学研究所のYousuke Ohno氏等のチーム
2.地球シミュレーター上で第一原理シミュレーション・コード PHASEを使い大規模半導体系を解き、14.6 TFLOPS(理論ピーク性能の59%)を達成した物質・材料研究機構のTakahisa Ohno氏等のチーム
3.Blue Gene/Lを使ってケルビン-ヘルムホルツ不安定性の最初のミクロン・スケールの計算で54.4TFLOPSを示したLawrence Livermore National Laboratory (LLNL)のJames N. Glosli氏等のチーム
4.LLNLのBlue Gene/Lで数値気象予報の中でも高分解能なWeather Research and Forecast (WRF) モデルを計算したUniversity Consortium for Atmospheric ResearchのJohn Michalakes氏等のチーム
の計4チームが選ばれています。
理論ピーク性能が現在Top500の1位のLLNLのBlue Gene/Lを凌ぐ1/2ペタFLOPSとして設計され、来年元旦にはNSF Teragridから利用可能になる予定のTexas Advanced Computing Center (TACC) のRangerシステムがアプリケーション性能でBlue Gene/Lを追い越してTop500のNO.1になれるかどうかは興味のあるところです。
Rangerについては"Introduction to Ranger: the First NSF "Track 2" Petascale System"というBOFが開かれます。
私は13日〜15日に参加し、16日は一日サンジェゴで過ごすことにして、飛行機とホテルを予約したところです。
2007年09月16日
●スーパーコンピューターを20万円で創る
・友人の霜田さんが面白いと言って貸してくれたのがこの新書です。
スーパーコンピューターを20万円で創る
伊藤智義著 集英社新書(2007.6)
・いまではゴードン・ベル賞の常連となっている宇宙シミュレーション専用超高速コンピューターGrapeですが、その開発プロジェクト開始時、1989年に東大杉本研究室の大学院生(M1)として参加し、それ以来ハードウェアの開発を担当してGrape-1、Grape-2の成功をもたらした中核の一人、伊藤智義氏(現千葉大教授)による本です
・Grapeも発展してGrape-7が稼動するまでになり、さらに分子動力学専用のMD-Grapeへと枝分かれし、こちらもMDGRAPE-3へと進化して理研で稼動を始めています。そして今年のゴードン・ベル賞ファイナリストにもなっています。
より汎用目的のGRAPE-DRプロジェクトも進行中です。
・この本のユニークなところは、なんといってもプロジェクトの主要当事者である伊藤智義氏が執筆し当時のリーダーの杉本教授始め全員が実名で登場していることで、日本の出版物としてはめずらしいのではないでしょうか。文章は平易でたいへん読みやすいものです。
HPC関係者にとっても貴重な一冊になることは間違いありません。
この本から連想したのは、ステルスの開発者が書いた「ステルス戦闘機―スカンク・ワークスの秘密 」Ben R. Rich (原著), 増田 興司 (翻訳) 講談社 (1997/01) です。これも非常に面白い本でしたが、Grapeプロジェクトは、もしかして日本風にアレンジされたスカンク・ワークスだったのかも知れません。
スーパーコンピューターを20万円で創る
伊藤智義著 集英社新書(2007.6)
・いまではゴードン・ベル賞の常連となっている宇宙シミュレーション専用超高速コンピューターGrapeですが、その開発プロジェクト開始時、1989年に東大杉本研究室の大学院生(M1)として参加し、それ以来ハードウェアの開発を担当してGrape-1、Grape-2の成功をもたらした中核の一人、伊藤智義氏(現千葉大教授)による本です
・Grapeも発展してGrape-7が稼動するまでになり、さらに分子動力学専用のMD-Grapeへと枝分かれし、こちらもMDGRAPE-3へと進化して理研で稼動を始めています。そして今年のゴードン・ベル賞ファイナリストにもなっています。
より汎用目的のGRAPE-DRプロジェクトも進行中です。
・この本のユニークなところは、なんといってもプロジェクトの主要当事者である伊藤智義氏が執筆し当時のリーダーの杉本教授始め全員が実名で登場していることで、日本の出版物としてはめずらしいのではないでしょうか。文章は平易でたいへん読みやすいものです。
HPC関係者にとっても貴重な一冊になることは間違いありません。
この本から連想したのは、ステルスの開発者が書いた「ステルス戦闘機―スカンク・ワークスの秘密 」Ben R. Rich (原著), 増田 興司 (翻訳) 講談社 (1997/01) です。これも非常に面白い本でしたが、Grapeプロジェクトは、もしかして日本風にアレンジされたスカンク・ワークスだったのかも知れません。
2007年09月07日
●テキサスの0.5ペタFLOPSシステム
・9/3(月)の筑波大学計算科学研究センター主催による「PACS-CSシステムと計算科学」シンポジウムで、テキサス大学TACCのMinyard博士による同センターが導入中の0.5ペタFLOPSシステム(TACC Rangerシステム)の招待講演がありました。
・システム96ラックと分電盤がコンパクトにマシンルームに配置された写真を見せてくれましたが、たぶん中味の方はこれから実装していくのでしょう。
・このRangerシステムは、簡単に言えばAMD Barcelonaプロセッサー 4ソケット搭載のSun製ブレード・サーバーをInfinibandスイッチによる相互接続網で結んだクラスター・システム(ISC'07で発表されたSun Constellation Systemがそれ)で、OSにはLinuxが使われます。
・ノード(ブレード・サーバー)数が3,936ノード、Barcelonaプロセッサー数が15,744個(プロセッサーはQuad-coreで各コアが4FLOPS/cycle)。Barcellonaプロセッサーを2GHzで動作させるとちょうど504TFLOPSになります。
メモリーは125TB (8GB/プロセッサー)、外部HDが合計1.7ペタバイト(内蔵HDはなし。かわりにIBM BladeCenterでも採用されたフラッシュ・メモリーを使用)
・Blue Gene/LやBlue Gene/Pのように、数万ノードまで性能がスケーラブルになるための演算性能/通信性能のバランスへの配慮や、故障を回避するような特別な工夫が特に見当たらない一見コモディティの集積からBlue Gene/Lの性能を超える0.5ペタFLOPSを達成しようとしていますが、これがテキサス魂というのでしょう。
・計算ノードのラック数は82個なので、これでシステム消費電力の2.4MWを割るとラックあたりの電力消費は約29KWとなります。25KW以上になると熱設計が難しいとMinyard博士話していましたが、最終形でどう解決されているかがシステムの信頼性にも影響してきそうです。Blue Gene/Lでは確かラックあたり23〜24KWの電力消費。そしてラックの内部に斜め整流版を入れるというコロンブスの卵のような簡単な方法で解決しています。
・気になる消費電力は、システムが2.4MW、冷却用が約1MW、計約3.4MW、電気代は年間約100万ドル(1.2億円)だそうです。
・ところで購入(?)費用はNSF(全米科学財団)から獲得した賞金$59M(約62億円)にテキサス大からの助成金を入れて総額$76M (約85億円)とのことです。性能が目標通り達成できれば世界最大性能のHPCシステムが高々100億円以下で実現可能という時代に入ります。
・Minyard博士が多くのアプリケーションに対する性能期待値として、サステインドで50〜100TFLOPSはいくだろうと話していましたが、さてどうなるでしょうか。
・博士は課題として、
●密に実装したことによる発熱や、コモディティなプロセッサー利用による信頼性(MTBF)への影響
●ソフトウェアがまだ成熟していない
ことを指摘していました。講演からはよくわかりませんでしたが、高速プロセッサーとインフィニバンド相互接続網の組み合わせも巨大クラスター・システムの場合定量的に見てスケーラビリティのボトルネックにならないのか気になります。もっともこうした点は百も承知のことでしょうが。
今日、ペタFLOPS以上の性能を指向したスーパーコンピュータには、
●10ペタFLOPSを目指しTechnology By Japanによる次世代スーパーコンピューター・プロジェクト(アーキテクチャの詳細についてはまだ未公開)、
●Powerアーキテクチャをベースに精緻な設計で1〜20ペタFLOPSをターゲットにするIBM Blue Gene、そして
●1ペタFLOPSを目標に、Cell Broadband EngineをアクセルレータにしたLos Alamos National Laboratory/IBMのRoadrunner
の三つがよく知られています。
それらとは異なり、コモディティ製品を集めてシンプルに組み立てるというアプローチをとるTACC Rangerシステムはどこまでの性能を実現するでしょうか。
・システム96ラックと分電盤がコンパクトにマシンルームに配置された写真を見せてくれましたが、たぶん中味の方はこれから実装していくのでしょう。
・このRangerシステムは、簡単に言えばAMD Barcelonaプロセッサー 4ソケット搭載のSun製ブレード・サーバーをInfinibandスイッチによる相互接続網で結んだクラスター・システム(ISC'07で発表されたSun Constellation Systemがそれ)で、OSにはLinuxが使われます。
・ノード(ブレード・サーバー)数が3,936ノード、Barcelonaプロセッサー数が15,744個(プロセッサーはQuad-coreで各コアが4FLOPS/cycle)。Barcellonaプロセッサーを2GHzで動作させるとちょうど504TFLOPSになります。
メモリーは125TB (8GB/プロセッサー)、外部HDが合計1.7ペタバイト(内蔵HDはなし。かわりにIBM BladeCenterでも採用されたフラッシュ・メモリーを使用)
・Blue Gene/LやBlue Gene/Pのように、数万ノードまで性能がスケーラブルになるための演算性能/通信性能のバランスへの配慮や、故障を回避するような特別な工夫が特に見当たらない一見コモディティの集積からBlue Gene/Lの性能を超える0.5ペタFLOPSを達成しようとしていますが、これがテキサス魂というのでしょう。
・計算ノードのラック数は82個なので、これでシステム消費電力の2.4MWを割るとラックあたりの電力消費は約29KWとなります。25KW以上になると熱設計が難しいとMinyard博士話していましたが、最終形でどう解決されているかがシステムの信頼性にも影響してきそうです。Blue Gene/Lでは確かラックあたり23〜24KWの電力消費。そしてラックの内部に斜め整流版を入れるというコロンブスの卵のような簡単な方法で解決しています。
・気になる消費電力は、システムが2.4MW、冷却用が約1MW、計約3.4MW、電気代は年間約100万ドル(1.2億円)だそうです。
・ところで購入(?)費用はNSF(全米科学財団)から獲得した賞金$59M(約62億円)にテキサス大からの助成金を入れて総額$76M (約85億円)とのことです。性能が目標通り達成できれば世界最大性能のHPCシステムが高々100億円以下で実現可能という時代に入ります。
・Minyard博士が多くのアプリケーションに対する性能期待値として、サステインドで50〜100TFLOPSはいくだろうと話していましたが、さてどうなるでしょうか。
・博士は課題として、
●密に実装したことによる発熱や、コモディティなプロセッサー利用による信頼性(MTBF)への影響
●ソフトウェアがまだ成熟していない
ことを指摘していました。講演からはよくわかりませんでしたが、高速プロセッサーとインフィニバンド相互接続網の組み合わせも巨大クラスター・システムの場合定量的に見てスケーラビリティのボトルネックにならないのか気になります。もっともこうした点は百も承知のことでしょうが。
今日、ペタFLOPS以上の性能を指向したスーパーコンピュータには、
●10ペタFLOPSを目指しTechnology By Japanによる次世代スーパーコンピューター・プロジェクト(アーキテクチャの詳細についてはまだ未公開)、
●Powerアーキテクチャをベースに精緻な設計で1〜20ペタFLOPSをターゲットにするIBM Blue Gene、そして
●1ペタFLOPSを目標に、Cell Broadband EngineをアクセルレータにしたLos Alamos National Laboratory/IBMのRoadrunner
の三つがよく知られています。
それらとは異なり、コモディティ製品を集めてシンプルに組み立てるというアプローチをとるTACC Rangerシステムはどこまでの性能を実現するでしょうか。

