SC06
2007年01月21日
● SC2006不参加報告 - 小柳レポート特別版(?!)が発行に.
・SC06の小柳レポートが小柳先生不参加のために発行されないのは何とも残念、という多数のファン(?)の声に応え、ついに出してくれました。
・名づけて"SC2006不参加報告"です。小柳先生曰く、
「筆者はこれまでこのシリーズの多くの会議に出席してレポートを書いてきたが、今年は工学院大学に転任して、ちょうど推薦入学の時期に当たってしまい、出席できなかった。そういうわけで参加報告は書けないが、継続性を保つために、入手した資料を使って、簡単な「不参加報告」を書くことにした。参加者の方などで、お気づきの点があればお教え下さい。」
・と謙遜気味ですが、実際の内容はとても"不参加報告"だとは思えない密な記述になっています。
「2007年のリノでのSCには是非とも参加したいと思う」と力強い宣言。ことしは期待大です。
・名づけて"SC2006不参加報告"です。小柳先生曰く、
「筆者はこれまでこのシリーズの多くの会議に出席してレポートを書いてきたが、今年は工学院大学に転任して、ちょうど推薦入学の時期に当たってしまい、出席できなかった。そういうわけで参加報告は書けないが、継続性を保つために、入手した資料を使って、簡単な「不参加報告」を書くことにした。参加者の方などで、お気づきの点があればお教え下さい。」
・と謙遜気味ですが、実際の内容はとても"不参加報告"だとは思えない密な記述になっています。
「2007年のリノでのSCには是非とも参加したいと思う」と力強い宣言。ことしは期待大です。
2006年12月04日
● RoadRunnerとハイブリッド・プログラミング・モデル
●SC06でのLANL RoadRunner講演
・SC06のIBMシアターで、Los Alamos National Laboratory(LANL)のケン・コックによるRoadRunnerの講演を聞けたので、こちらも遅ればせながらそのあらましを紹介します。細かな諸元については聞き間違いもあるかもしれませんので、そのときは悪しからず。
・LANLではCell BEをアクセルレータに使うことで2007年に100GFLOPS程度を達成(いわばひよこのRoadRunner)、その後段階的にRoadRunnerを増強し2008年に1PetaFLOPSの持続性能を達成する計画です。RoadRunnerシステムは、8,640個のdual core Opteronで76テラFLOPSの性能、アクセルレータ部分は16,560個のCell BEで1.6PetaFLOPSピーク性能を予定しているクラスター・システムです。Opteron 1プロセッサー・コアにCell BE 1プロセッサーが対応する勘定です。
・IBM x3755サーバー1台(8プロセッサー・コア)にアクセルレータのCell BEブレードサーバー4台(8 Cell BEプロセサー)がInfiniBand(IB)で接続され、1ラックに6台のx3755と2台のブレードセンター(ブレードセンターの14スロットに12ブレード装着)を実装します。
細かいことですが、現行のCell BEブレードサーバー QS20は厚みがダブル幅のため7ブレードしか装着できず勘定があいません。彼が間違っているか厚みがシングル幅になるのか?
・Cell BEは倍精度演算スピードを大幅に改善した後継プロセッサ(eDP)を使用しますとのことです。
・このことは同じIBM シアターで、Cell BEのチーフサイエンティストのピーター・ホフスティがCell BEの2010頃までのロードマップ(開発計画)でも話していました。
SC06のような大イベントでは各メーカーや研究機関で開発に携わっている第一人者が、気軽にというよりもむしろ積極的にアッピールするよう話す雰囲気があります。あくまでプロジェクトや製品の計画段階についての許される範囲の紹介ですがユーザーに取ってはホットな情報源です。公式な製品発表ではないので、実際の性能や時期がどうかについては、当然ですが、そのメーカーの信頼感とかいろいろな面での判断がもちろん必要!!。
・クラスター間のインターコネクションにはInfiniBand(IB)を採用します。従来自社開発のスイッチを使用していたIBMシステムとしては新しい方向が取られています。
・このとき、クラスター全体を15個のクラスター・コネクション・ユニット(CU)に分割し、CU間もIBでインターコネクトする2ステージ構造です(逆算すると1 CUは144個のx3755ノードで構成)。
・ケン・コックの説明によると、電力はx3755が約1KW/台、Cellのブレードセンターが約5KW/台、1ラックでは約16KWです。総ラック数は360ラックなので電力使用はラック合計で約5,760KWになります。地球シミュレータ(ピーク性能40TFLOPS)の電力はノード部分で約4,000KW、結合ネットワーク等を入れて約7,000KWと言われているのでRoadRunner(ピーク性能1,600TFLOPS)の電力は地球シミュレータ・クラスの大きなものになります。
・占有面積は、360ラック(地球シミュレータは770ラックなのでそのほぼ半分)なので257平方メートル、もし間に1ラック列ずつ空間を空けた場合には20mx25mを占める計算になります。
●SC06でのIBMのハイブリッド・プログラミング・モデル講演
・IBMではRoadRunnerで実行すべきアプリケーションのプログラミング労力をプログラマーから大幅に軽減するためにハイブリッド・プログラミング開発環境を構築し始めています。背景にはRoadRunnerのようなハイブリッド・クラスター・システムのプログラムを書けるプログラマーは探すのも大変だし、報酬もかなり高くなるという事情があります。
・SC06のIBMシアターでのキャサリン・クロフォード(IBMの次世代システム・ソフトウェア チーフアーキテクト)の講演によると、Cell BEのようなアクセルレータに対応した"ヘテロジニアスでマルチコアのメモリー・ハイエラーキ・システム"へのプログラミング・モデルが必要だとしています。IBMではそのための開発環境として、Cellの8個のSPU(Synergistics Processing Unit)のデータのDMA移動や効率よいダブルバッファリングなどを行うための、ハードウェア・プラットフォームに直結したData and Communication Synchronization Library (DaCS)や、Cell BEのプロセス管理、効率よいscatter/gather処理のためのデータ分割やリスト生成、リモート・エラー・ハンドリング処理などのためのAccelerator Library Framework(ALF)と呼ぶフレームワーク作りに着手しています。
・プログラマーから見るとCell BE特有のアーキテクチャ、すなわち8個のSPUを使うためのややこしい命令の記述部分をALFが肩代わりしてくれることになり、だいぶ負担が減ります。こうしてアプリケーション・プログラムは通常のクラスターシステム用にMPIで記述したものに、CellのSPUを計算カーネル演算に使うための最適化済みAcceleration libraryのコールを加えただけのもの(!?)になります。
先に紹介したセミナーで聞いたマーキュリーコンピュータシステムズ社のアプローチの方は、IBMのようにハイブリッド・プログラミングのフレームワークをじっくり作っていくというよりは、ツール・ライブラリを必要に応じてタイムリーに拡充させていくという色彩が強く感じられました。当面はニーズやそれぞれの成熟度にあわせて両方の動向を見ながらうまく利用していくことが必要に見えます。
さて基本となるCell BEの開発キットSDKですが、
・現在バージョン1.1の状態です。Cell BEのIBM チーフ・アーキテクトのピーター・ホフスティがIBMシアターでの講演で説明した内容によると、2007年にはSDK3.0になります。だれかがFortranのサポートについて質問していましたがニーズが限られているので可能性は低いということでした。もっともLANLなど一部からはFortranへの強い要望があるそうです。
このサイトの掲載内容は個人の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません。
・SC06のIBMシアターで、Los Alamos National Laboratory(LANL)のケン・コックによるRoadRunnerの講演を聞けたので、こちらも遅ればせながらそのあらましを紹介します。細かな諸元については聞き間違いもあるかもしれませんので、そのときは悪しからず。
・LANLではCell BEをアクセルレータに使うことで2007年に100GFLOPS程度を達成(いわばひよこのRoadRunner)、その後段階的にRoadRunnerを増強し2008年に1PetaFLOPSの持続性能を達成する計画です。RoadRunnerシステムは、8,640個のdual core Opteronで76テラFLOPSの性能、アクセルレータ部分は16,560個のCell BEで1.6PetaFLOPSピーク性能を予定しているクラスター・システムです。Opteron 1プロセッサー・コアにCell BE 1プロセッサーが対応する勘定です。
・IBM x3755サーバー1台(8プロセッサー・コア)にアクセルレータのCell BEブレードサーバー4台(8 Cell BEプロセサー)がInfiniBand(IB)で接続され、1ラックに6台のx3755と2台のブレードセンター(ブレードセンターの14スロットに12ブレード装着)を実装します。
細かいことですが、現行のCell BEブレードサーバー QS20は厚みがダブル幅のため7ブレードしか装着できず勘定があいません。彼が間違っているか厚みがシングル幅になるのか?
・Cell BEは倍精度演算スピードを大幅に改善した後継プロセッサ(eDP)を使用しますとのことです。
・このことは同じIBM シアターで、Cell BEのチーフサイエンティストのピーター・ホフスティがCell BEの2010頃までのロードマップ(開発計画)でも話していました。
SC06のような大イベントでは各メーカーや研究機関で開発に携わっている第一人者が、気軽にというよりもむしろ積極的にアッピールするよう話す雰囲気があります。あくまでプロジェクトや製品の計画段階についての許される範囲の紹介ですがユーザーに取ってはホットな情報源です。公式な製品発表ではないので、実際の性能や時期がどうかについては、当然ですが、そのメーカーの信頼感とかいろいろな面での判断がもちろん必要!!。
・クラスター間のインターコネクションにはInfiniBand(IB)を採用します。従来自社開発のスイッチを使用していたIBMシステムとしては新しい方向が取られています。
・このとき、クラスター全体を15個のクラスター・コネクション・ユニット(CU)に分割し、CU間もIBでインターコネクトする2ステージ構造です(逆算すると1 CUは144個のx3755ノードで構成)。
・ケン・コックの説明によると、電力はx3755が約1KW/台、Cellのブレードセンターが約5KW/台、1ラックでは約16KWです。総ラック数は360ラックなので電力使用はラック合計で約5,760KWになります。地球シミュレータ(ピーク性能40TFLOPS)の電力はノード部分で約4,000KW、結合ネットワーク等を入れて約7,000KWと言われているのでRoadRunner(ピーク性能1,600TFLOPS)の電力は地球シミュレータ・クラスの大きなものになります。
・占有面積は、360ラック(地球シミュレータは770ラックなのでそのほぼ半分)なので257平方メートル、もし間に1ラック列ずつ空間を空けた場合には20mx25mを占める計算になります。
●SC06でのIBMのハイブリッド・プログラミング・モデル講演
・IBMではRoadRunnerで実行すべきアプリケーションのプログラミング労力をプログラマーから大幅に軽減するためにハイブリッド・プログラミング開発環境を構築し始めています。背景にはRoadRunnerのようなハイブリッド・クラスター・システムのプログラムを書けるプログラマーは探すのも大変だし、報酬もかなり高くなるという事情があります。
・SC06のIBMシアターでのキャサリン・クロフォード(IBMの次世代システム・ソフトウェア チーフアーキテクト)の講演によると、Cell BEのようなアクセルレータに対応した"ヘテロジニアスでマルチコアのメモリー・ハイエラーキ・システム"へのプログラミング・モデルが必要だとしています。IBMではそのための開発環境として、Cellの8個のSPU(Synergistics Processing Unit)のデータのDMA移動や効率よいダブルバッファリングなどを行うための、ハードウェア・プラットフォームに直結したData and Communication Synchronization Library (DaCS)や、Cell BEのプロセス管理、効率よいscatter/gather処理のためのデータ分割やリスト生成、リモート・エラー・ハンドリング処理などのためのAccelerator Library Framework(ALF)と呼ぶフレームワーク作りに着手しています。
・プログラマーから見るとCell BE特有のアーキテクチャ、すなわち8個のSPUを使うためのややこしい命令の記述部分をALFが肩代わりしてくれることになり、だいぶ負担が減ります。こうしてアプリケーション・プログラムは通常のクラスターシステム用にMPIで記述したものに、CellのSPUを計算カーネル演算に使うための最適化済みAcceleration libraryのコールを加えただけのもの(!?)になります。
先に紹介したセミナーで聞いたマーキュリーコンピュータシステムズ社のアプローチの方は、IBMのようにハイブリッド・プログラミングのフレームワークをじっくり作っていくというよりは、ツール・ライブラリを必要に応じてタイムリーに拡充させていくという色彩が強く感じられました。当面はニーズやそれぞれの成熟度にあわせて両方の動向を見ながらうまく利用していくことが必要に見えます。
さて基本となるCell BEの開発キットSDKですが、
・現在バージョン1.1の状態です。Cell BEのIBM チーフ・アーキテクトのピーター・ホフスティがIBMシアターでの講演で説明した内容によると、2007年にはSDK3.0になります。だれかがFortranのサポートについて質問していましたがニーズが限られているので可能性は低いということでした。もっともLANLなど一部からはFortranへの強い要望があるそうです。
このサイトの掲載内容は個人の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません。
2006年11月29日
● SC06 ゴードンベル賞等の受賞者
遅ればせながらSC06のプレスリリースによると、
・今年のゴードンベル賞はBlue Geneを使用した3チームの中から下記の2チームが受賞しました。
1. Gordon Bell Prize for Peak Performanceが、207.3 TFLOPS達成のBlue Gene/Lによる電子構造計算を行ったカリフォルニア大,LLNL等によるチーム
2. Gordon Bell Prize for Special Achievementが、"sustain up to 20% of the peak performance"達成のBlue Gene/LによるQCD計算を行ったIBM Research等のチーム
・ファイナリストとして産業界向けのアプリケーションに挑戦した秋葉チームは残念ながら受賞を逸しましたが、個人的にはペタスケール時代に魁て、さらに可能性の追求を期待したいものです。
・また、MD-GRAPE3による論文で理研チームが185 TFLOPS達成によりゴードンベル賞のHonorable mention(いわば佳作(小柳レポートによる))になりました。
・ゴードンベル賞のほかに、Challenge賞としてAnalytics Challenge、Storage Challenge for Large Systems、Storage Challenge for Small Systems、Bandwidth Challenge の4つの賞があります。
・この中のStorage Challenge for Large Systemsを筑波大・KEKチームが受賞しています。
・今年のゴードンベル賞はBlue Geneを使用した3チームの中から下記の2チームが受賞しました。
1. Gordon Bell Prize for Peak Performanceが、207.3 TFLOPS達成のBlue Gene/Lによる電子構造計算を行ったカリフォルニア大,LLNL等によるチーム
2. Gordon Bell Prize for Special Achievementが、"sustain up to 20% of the peak performance"達成のBlue Gene/LによるQCD計算を行ったIBM Research等のチーム
・ファイナリストとして産業界向けのアプリケーションに挑戦した秋葉チームは残念ながら受賞を逸しましたが、個人的にはペタスケール時代に魁て、さらに可能性の追求を期待したいものです。
・また、MD-GRAPE3による論文で理研チームが185 TFLOPS達成によりゴードンベル賞のHonorable mention(いわば佳作(小柳レポートによる))になりました。
・ゴードンベル賞のほかに、Challenge賞としてAnalytics Challenge、Storage Challenge for Large Systems、Storage Challenge for Small Systems、Bandwidth Challenge の4つの賞があります。
・この中のStorage Challenge for Large Systemsを筑波大・KEKチームが受賞しています。
2006年11月19日
● SC06スナップ
・行きと違って、シカゴ経由の帰りの飛行機は予定よりも30分以上も早く成田に到着。フロリダ帰りには寒気が一段と感じられた成田でした。
・タンパで開催されたSC06はホテルが会場のタンパ・コンベンション・センターの遠くに分散したため、シャトルバスが朝から7:00PMまで15分間隔で往復するシステムで、これがなかなかちょうほうでした。
バスも大型のリムジンバスです(写真)。
バスの後ろに見えるのがSC06会場のタンパ・コンベンション センターでダウンタウンの川岸に位置しています。
・SC06のオープニングとキーノートは、会場のボールルームを全部つないだ横長のスペースで行われました(写真)。そのため7セットのスクリーンをセットして講演者の顔とスライドを映しています。キーノートは発明家のRay Kurzweil氏が"The Coming Merger of Biological and Non Biological Intelligence"の題で話しました。25分も時間を超過した饒舌さでしたが、日本人の参加者にも大いに受けたかというとちょっと疑問かも知れません。
・お昼はだいたいの人がコンベンションセンターのロビーやテラスのあちこちにあるコーヒーショップなどで取ってました。写真は川べりのテラスで、ハンバーガーか何かの肉を焼いているいいにおいの煙がショップからたなびいていました。
講演や展示会で疲れたときに、このようなところで一休みできると時差ぼけからまたリフレッシュできるというものです。よい天気でした。
・写真はSC06のテクニカルセッションに登録するといただけるカンファレンス・バッグの中身です。
真ん中のCDがプロシーディングスで、紙の分厚いプロシーディングスを配らなくなってからもうだいぶ経ちました。
手前がRenoで開催されるSC07の案内、左の漂着ビンもどきにはマイクロソフトからのディナー招待状が入っていました。こうした遊びが見えるのもアメリカのコンファレンスらしくて楽しくなります。
さて来年はネバダ州のRenoです。小柳レポートによると第二回(1989年)がRenoだったので先祖がえりです。私個人はなぜか1986年6月に何かの国際会議でRenoに滞在しています。20年前の会議の内容はすっかり忘れてしまいましたが、山の上の狭い空港に飛行機が滑り込むまでのスリルだけはしっかりと覚えています。いまもそうなんでしょうか。
バスも大型のリムジンバスです(写真)。
バスの後ろに見えるのがSC06会場のタンパ・コンベンション センターでダウンタウンの川岸に位置しています。
講演や展示会で疲れたときに、このようなところで一休みできると時差ぼけからまたリフレッシュできるというものです。よい天気でした。
真ん中のCDがプロシーディングスで、紙の分厚いプロシーディングスを配らなくなってからもうだいぶ経ちました。
手前がRenoで開催されるSC07の案内、左の漂着ビンもどきにはマイクロソフトからのディナー招待状が入っていました。こうした遊びが見えるのもアメリカのコンファレンスらしくて楽しくなります。
さて来年はネバダ州のRenoです。小柳レポートによると第二回(1989年)がRenoだったので先祖がえりです。私個人はなぜか1986年6月に何かの国際会議でRenoに滞在しています。20年前の会議の内容はすっかり忘れてしまいましたが、山の上の狭い空港に飛行機が滑り込むまでのスリルだけはしっかりと覚えています。いまもそうなんでしょうか。
2006年11月16日
● SC06 (その2)
・SC06テクニカルセッションの二日目が終わり、明日は早朝に日本に戻るので、ざっと書き漏らしたことをまとめておきます。
・まず来年のSC07はネバダ州のRenoで11月10-16日に開催されます。
・今回の展示ブースはいつもより狭くなったとのことでしたが、逆に広すぎて閉口することもなく、じっくりと各ブースを見ることができました。日本からの各出展ブースも特に一箇所に集中することもなく自然な感じで溶け込んでいました。
・AIST, RIKEN次世代スーパーコンピュータとGRAPE、JAXA, NAREGI, 統計数理研究所、ITBL、防災研、東京大、筑波大、東北大、同志社大、東工大、九大、埼玉大、埼玉工大、国産メーカー各社が単独や共同でブースに参加していました(もしかしたら他にもあったかもしれませんが、気がついたまま。もれていた時はご容赦ください)。
・PetaScaleについては、個別の発表のほうにpetaFLOPSまたはそれ以上の時代を意識したものが現れていて全体の方向をリードしている段階と見受けられました。BOFなど多数が参加するセッションでは批判的な意見がでたりして全体が盛り上がる前の段階にあるという印象です。
・その点具体的にCell BEやそれを使ったハイブリッド・スーパーコンピュータRoadRunnerのセッション、さらにハイブリッド・プログラミング・モデルのセッションは関心が高く、立見になるような状況でした。
・Blue Gene/Lの次と言われているBlue Gene/P、その先のBlue Gene/Qについても政府側のASCがこの名称をBOFでの発表で使ったり、IBMブースではBlue Gene/Pのシステムボード二個が何気なくBG/Lの横に立て掛けて説明をしていたりと、あたかも既成事実になったかのようなSC06でした (もちろん正式な発表はIBMからもASCからも何もされていません)。
・RoadRunnerのセッション、さらにハイブリッド・プログラミング・モデルのセッションの内容は改めて紹介するつもりです。
SC06は話題性からもIBMがだんとつだったと感じましたが、しばらく続くだろうこの転換期に、各メーカー、大学・研究機関、日本の国家プロジェクトがどのような姿をこれから見せてくるでしょうか。ある意味、HPCは非常に期待され、挑戦しがいのある新時代に入ってきたようです。
・まず来年のSC07はネバダ州のRenoで11月10-16日に開催されます。
・今回の展示ブースはいつもより狭くなったとのことでしたが、逆に広すぎて閉口することもなく、じっくりと各ブースを見ることができました。日本からの各出展ブースも特に一箇所に集中することもなく自然な感じで溶け込んでいました。
・AIST, RIKEN次世代スーパーコンピュータとGRAPE、JAXA, NAREGI, 統計数理研究所、ITBL、防災研、東京大、筑波大、東北大、同志社大、東工大、九大、埼玉大、埼玉工大、国産メーカー各社が単独や共同でブースに参加していました(もしかしたら他にもあったかもしれませんが、気がついたまま。もれていた時はご容赦ください)。
・PetaScaleについては、個別の発表のほうにpetaFLOPSまたはそれ以上の時代を意識したものが現れていて全体の方向をリードしている段階と見受けられました。BOFなど多数が参加するセッションでは批判的な意見がでたりして全体が盛り上がる前の段階にあるという印象です。
・その点具体的にCell BEやそれを使ったハイブリッド・スーパーコンピュータRoadRunnerのセッション、さらにハイブリッド・プログラミング・モデルのセッションは関心が高く、立見になるような状況でした。
・Blue Gene/Lの次と言われているBlue Gene/P、その先のBlue Gene/Qについても政府側のASCがこの名称をBOFでの発表で使ったり、IBMブースではBlue Gene/Pのシステムボード二個が何気なくBG/Lの横に立て掛けて説明をしていたりと、あたかも既成事実になったかのようなSC06でした (もちろん正式な発表はIBMからもASCからも何もされていません)。
・RoadRunnerのセッション、さらにハイブリッド・プログラミング・モデルのセッションの内容は改めて紹介するつもりです。
SC06は話題性からもIBMがだんとつだったと感じましたが、しばらく続くだろうこの転換期に、各メーカー、大学・研究機関、日本の国家プロジェクトがどのような姿をこれから見せてくるでしょうか。ある意味、HPCは非常に期待され、挑戦しがいのある新時代に入ってきたようです。
●Gordon Bell賞ファイナリスト講演から
・Gordon Bell賞の最終選考に残った論文発表が今日の午前午後に分かれてあります。いま午前が終わったばかりです。受賞者の発表は帰りの飛行機に乗っている明日でした。
・最初の論文発表は、BG/Lの6万4千ノードを使用したLLNLによるMD計算がサステイン性能で207.3TFLOPSを達成したものでした。
・次に産業界のアプリケーションというSC06ではユニークといってよい、携帯電話の落下衝撃解析をBlue Geneの8,192ノードを使用して1.27TFLOPSを達成した秋葉博氏の発表です。
・論文では538GFLOPSと記載されていますが、その後の努力で2倍の性能になっています
・8,192ノードのBGのピーク性能が22.4TFLOPSのため実性能比が低いように見えますが、絶対性能が解析者には重要なので、CAEの実アプリケーションでは画期的なことと思われます。
・モバイルホンは198個の部品で構成されていて、そのモデルサイズは1億百万ノード。これを2.5msまでの計算をわずか100ステップで計算しています。これは陰解法を使っているためにタイムステップを大きく取れるためと思われます。
・この計算にはImplicit, Domain Decompositiion Method FEAプログラムADVCが使われています。
ちょっと残念だったのはSC06の参加者がこうしたアプリケーションに関心が低いのか途中退席者がやや目だったことでした。
・最初の論文発表は、BG/Lの6万4千ノードを使用したLLNLによるMD計算がサステイン性能で207.3TFLOPSを達成したものでした。
・次に産業界のアプリケーションというSC06ではユニークといってよい、携帯電話の落下衝撃解析をBlue Geneの8,192ノードを使用して1.27TFLOPSを達成した秋葉博氏の発表です。
・論文では538GFLOPSと記載されていますが、その後の努力で2倍の性能になっています
・8,192ノードのBGのピーク性能が22.4TFLOPSのため実性能比が低いように見えますが、絶対性能が解析者には重要なので、CAEの実アプリケーションでは画期的なことと思われます。
・モバイルホンは198個の部品で構成されていて、そのモデルサイズは1億百万ノード。これを2.5msまでの計算をわずか100ステップで計算しています。これは陰解法を使っているためにタイムステップを大きく取れるためと思われます。
・この計算にはImplicit, Domain Decompositiion Method FEAプログラムADVCが使われています。
ちょっと残念だったのはSC06の参加者がこうしたアプリケーションに関心が低いのか途中退席者がやや目だったことでした。
●渡辺貞氏がCray Award受賞講演
・HPCシステムのアーキテクトに贈られる最も名誉なCray Awardを、今年は日本人では初めて渡辺貞氏(次世代ス−パ一コンピュータ開発実施本部プロジェクトリーダー)が受賞しました。渡辺氏はNECのベクトル・スーパーコンピュータSXシリーズ、地球シミュレータの設計者としてよく知られています。
・けさ(11/15)の受賞講演もまずSX-1から最新のSX-8までの変遷をわかりやすく紹介しました。それによるとシステム性能は5万倍、CPU数が4,096倍、メモリサイズはなんと26万倍になっているそうです。
・その後、Top500の一位をしばらく占めていた地球シミュレータ(ES)のシステムと、それにより実現したファイン・グリッドによる地球規模の風と台風のシミュレーションのアニメーションを紹介しました。
・フロリダ半島周辺のハリケーンをカナダの研究者がESでシミュレーションしたアニメーションを紹介したときは、明日タンパを襲うかも知れないというジョークで会場がわきました。
・最後に2006-2012で1,100億円の予算を予定し、2011年FYの終わりにHWが稼動する日本の国家プロジェクト―次世代スーパーコンピュータの簡単な紹介、そして9つのRuleで締めくくりました。
なにより高いレベルの継続的な実績に裏打ちされた講演は、多数の参加者に深い感銘を与えていました。
・けさ(11/15)の受賞講演もまずSX-1から最新のSX-8までの変遷をわかりやすく紹介しました。それによるとシステム性能は5万倍、CPU数が4,096倍、メモリサイズはなんと26万倍になっているそうです。
・その後、Top500の一位をしばらく占めていた地球シミュレータ(ES)のシステムと、それにより実現したファイン・グリッドによる地球規模の風と台風のシミュレーションのアニメーションを紹介しました。
・フロリダ半島周辺のハリケーンをカナダの研究者がESでシミュレーションしたアニメーションを紹介したときは、明日タンパを襲うかも知れないというジョークで会場がわきました。
・最後に2006-2012で1,100億円の予算を予定し、2011年FYの終わりにHWが稼動する日本の国家プロジェクト―次世代スーパーコンピュータの簡単な紹介、そして9つのRuleで締めくくりました。
なにより高いレベルの継続的な実績に裏打ちされた講演は、多数の参加者に深い感銘を与えていました。
2006年11月15日
●Top500スーパーコンピュータ・サイト '06/11版
・さきほど17:30からのTop500 BOF(Birds of a Feather)が終わり、Top500の11月版の発表とその詳しい分析が発表されました。
・途中から出たのでTop500リストはWebをご覧いただくとして、TopはBlue Gene/Lで変化なしです。
・前回(6月版)11位だったヨーロッパ最大のバルセロナ・スーパーコンピュータ・センターのIBM JS21ブレード・サーバーによるシステムが5位に浮上していました。段々下がっていくのが普通なのに珍しい例です。
・前回6位と、いま日本で唯一Top10に入っている東工大のTSUBAMEは次々と現れた新手により今回9位に下がりました。
・分析結果については、アーキテクチャ、プロセッサ、メーカー別、国別等々Webにも掲載されている図を使って説明が行われました。
・これとは別に、電力消費が年々おおきくなっているのがHPCシステムの問題であるとして、今後こうしたデータも集めて方向を誤らないようにしたいとの表明があり、さらに
・LINPACKのみに注目したTop500では最近の複雑化したシステム、たとえばメモリーハイエラキーの影響、を評価できなくなってきているのではないかということでHPC Challengeベンチマーク問題をもっと広く進めようといったことをLINPACKを作ったDongarraが強調していました。
彼は、LINPACKベンチマークは70年代のコンピューターを念頭に作ったのでもう役目は終わったと言いたいようでしたが、これは簡単でわかりやすいだけに、HPC Challengeのように数個の指標を示す方式が改善策として一般的に受け入れられるかはまだ不明に見えます。
・途中から出たのでTop500リストはWebをご覧いただくとして、TopはBlue Gene/Lで変化なしです。
・前回(6月版)11位だったヨーロッパ最大のバルセロナ・スーパーコンピュータ・センターのIBM JS21ブレード・サーバーによるシステムが5位に浮上していました。段々下がっていくのが普通なのに珍しい例です。
・前回6位と、いま日本で唯一Top10に入っている東工大のTSUBAMEは次々と現れた新手により今回9位に下がりました。
・分析結果については、アーキテクチャ、プロセッサ、メーカー別、国別等々Webにも掲載されている図を使って説明が行われました。
・これとは別に、電力消費が年々おおきくなっているのがHPCシステムの問題であるとして、今後こうしたデータも集めて方向を誤らないようにしたいとの表明があり、さらに
・LINPACKのみに注目したTop500では最近の複雑化したシステム、たとえばメモリーハイエラキーの影響、を評価できなくなってきているのではないかということでHPC Challengeベンチマーク問題をもっと広く進めようといったことをLINPACKを作ったDongarraが強調していました。
彼は、LINPACKベンチマークは70年代のコンピューターを念頭に作ったのでもう役目は終わったと言いたいようでしたが、これは簡単でわかりやすいだけに、HPC Challengeのように数個の指標を示す方式が改善策として一般的に受け入れられるかはまだ不明に見えます。
●SC06会場から(1)
・今日のキーノートからSC06のテクニカルセッションと展示が始まるので、フロリダ州タンパに来ました。
・成田でいきなり出発便が3時間半遅れというハプニングにぶつかり、タンパのホテルにたどり着いたのが1:00 AMという幸先の悪さですが、今日は快晴で海風が湿気を少し運ぶ気持ちのよい日になっています。
・キーノートはじめさっき終わったばかりのBlue Brain Projectなど、アプリケーションについてはBiologyもしくはLife Scienceがやはりここ米国・ヨーロッパではドライビング・フォースになっている印象を受けました。
・展示も今日のキーノートの後から始まりました。日本からは産総研(AIST)が天井にとどく大きなロゴと大きなスペースで展示していますが、他にもさまざまな大学・研究機関が小さいスペースながらも活発な展示をしています。
・写真はIBMの展示ブースです。
・SCinetの無線LANが会場の大半で提供されているので、たいへん便利です。もとろんそれを利用してこの内容も送っています。
まずは一報ということで詳細はまたあとで。
・成田でいきなり出発便が3時間半遅れというハプニングにぶつかり、タンパのホテルにたどり着いたのが1:00 AMという幸先の悪さですが、今日は快晴で海風が湿気を少し運ぶ気持ちのよい日になっています。
・キーノートはじめさっき終わったばかりのBlue Brain Projectなど、アプリケーションについてはBiologyもしくはLife Scienceがやはりここ米国・ヨーロッパではドライビング・フォースになっている印象を受けました。
・展示も今日のキーノートの後から始まりました。日本からは産総研(AIST)が天井にとどく大きなロゴと大きなスペースで展示していますが、他にもさまざまな大学・研究機関が小さいスペースながらも活発な展示をしています。
・写真はIBMの展示ブースです。

・SCinetの無線LANが会場の大半で提供されているので、たいへん便利です。もとろんそれを利用してこの内容も送っています。
まずは一報ということで詳細はまたあとで。
2006年11月11日
● SC06 Just Now
・SC06でのIBMの展示シアターでBlue Gene以外にも面白い講演があるのがわかったので二、三紹介します。
・まず発表以来ベールをかぶっていた感のあるLos Alamos National LaboratotryのRoadRunnerスーパーコンピュータに関した講演が二件あります。
・11/14 12:30〜 "The New Roadrunner Supercomputer: What, When, How"、スピーカーはLANLの科学アドバイザのKen Kochです。
・同日 15:00〜 "Enabling Applications for Hybrid Architectures"、スピーカーはIBMチーフアーキテクトのCatherine Crawford。
彼女は翌日にはCellのプログラミングの話もします。
・11/15 16:30〜 "Cell Broadband Engine Software Developers' Kit: Past, Present & Future"
・きのう東京で開催したCellセミナーでは、Mercury Computer社のDirector、John Brickmanがcellのプログラム開発ツールの講演の中で、自分たちは非常にプラグマティックなアプローチを取り、コンパイラーが成熟するのを待つのではなく、意味があると思えば自分でそのツール群を開発する。アーキテクチャをプログラマーから隠そうとするよりは、アーキテクチャを明示したプログラミングの方が今の段階では性能を引き出せると強調していました。
はたしてCatherineが話すIBMのアプローチはどうなのでしょうか。
・まず発表以来ベールをかぶっていた感のあるLos Alamos National LaboratotryのRoadRunnerスーパーコンピュータに関した講演が二件あります。
・11/14 12:30〜 "The New Roadrunner Supercomputer: What, When, How"、スピーカーはLANLの科学アドバイザのKen Kochです。
・同日 15:00〜 "Enabling Applications for Hybrid Architectures"、スピーカーはIBMチーフアーキテクトのCatherine Crawford。
彼女は翌日にはCellのプログラミングの話もします。
・11/15 16:30〜 "Cell Broadband Engine Software Developers' Kit: Past, Present & Future"
・きのう東京で開催したCellセミナーでは、Mercury Computer社のDirector、John Brickmanがcellのプログラム開発ツールの講演の中で、自分たちは非常にプラグマティックなアプローチを取り、コンパイラーが成熟するのを待つのではなく、意味があると思えば自分でそのツール群を開発する。アーキテクチャをプログラマーから隠そうとするよりは、アーキテクチャを明示したプログラミングの方が今の段階では性能を引き出せると強調していました。
はたしてCatherineが話すIBMのアプローチはどうなのでしょうか。
2006年11月09日
● SC06 Coming Soon
・来週11日-17日のSC06が近づくにつれ、レジストレーションしたためでしょう。毎日のように出展者から自ブースへのお誘いeメールが届くようになってきました。
さっきまで届いた分をざっとリストにすると:
- Storage SolutionのDataDirect Networks社
- Cell BEプロセッサーのMercury Computer Systems
- Open MPIメンバー・ブースはiPod nano 8セットを抽選でプレゼント
- TeraGridとCray XT3のPittsburgh Supercomputing Center
- Data WarehouseのNetezzaも30GB iPodを抽選でプレゼント
- SGIはポータブルDVDプレーヤーの抽選会を毎日
- SUNはSun Grid GRIDATHONという実習セミナーを無料で提供(普段は有料?)
- サービスプロセッサのAvocentはプレステPSPを抽選でプレゼント
- グリッドのUnited Devices社
- マルチコア・デバッギングのEtnus社
- LSFで知られるPlatform Computing社
- MATLAB、PYTHON、MATHEMATICAでの並列プログラム開発ツールの
InteractiveSupercomputing社
- ネットワークのCisco社
- Fortranコンパイラーで知られているPortland Group社
となります。
わざわざメールしなくても自社のブースに来てくれるからでしょうか(?!)。IBMやHPからはeメールがまだです。
・SC06の開催にあわせて、新製品発表会やプレスリリースもこの時期盛んになります。
・例えば、国内ではこの6日にGRAPE-DRプロジェクトの主力部品である、1チップに512個の要素プロセッサーを搭載し、一個で512GFlopsの性能を持つプロセッサー・ボードのお披露目がありました
→東京大学、世界最高速のスーパーコンピューターへの搭載を目的とした高速プロセッサーを開発。
・記事によると、まだ熱々の同プロセッサー・ボードはSC06で展示されるそうです。
さっきまで届いた分をざっとリストにすると:
- Storage SolutionのDataDirect Networks社
- Cell BEプロセッサーのMercury Computer Systems
- Open MPIメンバー・ブースはiPod nano 8セットを抽選でプレゼント
- TeraGridとCray XT3のPittsburgh Supercomputing Center
- Data WarehouseのNetezzaも30GB iPodを抽選でプレゼント
- SGIはポータブルDVDプレーヤーの抽選会を毎日
- SUNはSun Grid GRIDATHONという実習セミナーを無料で提供(普段は有料?)
- サービスプロセッサのAvocentはプレステPSPを抽選でプレゼント
- グリッドのUnited Devices社
- マルチコア・デバッギングのEtnus社
- LSFで知られるPlatform Computing社
- MATLAB、PYTHON、MATHEMATICAでの並列プログラム開発ツールの
InteractiveSupercomputing社
- ネットワークのCisco社
- Fortranコンパイラーで知られているPortland Group社
となります。
わざわざメールしなくても自社のブースに来てくれるからでしょうか(?!)。IBMやHPからはeメールがまだです。
・SC06の開催にあわせて、新製品発表会やプレスリリースもこの時期盛んになります。
・例えば、国内ではこの6日にGRAPE-DRプロジェクトの主力部品である、1チップに512個の要素プロセッサーを搭載し、一個で512GFlopsの性能を持つプロセッサー・ボードのお披露目がありました
→東京大学、世界最高速のスーパーコンピューターへの搭載を目的とした高速プロセッサーを開発。
・記事によると、まだ熱々の同プロセッサー・ボードはSC06で展示されるそうです。
2006年10月15日
● SC06 アップデート
・SC06の事前登録割引は今日10/15までですね。私も495$でWebからTechnical programの登録をしました。10/16以降は700$と40%も高くなるので、選択の余地はないでしょう。
・ さて、しばらくぶりに最新のプログラムを見ているとpdfが付いているセッションがだいぶ増えてきました。
・SC05小柳レポートに「SCではいろいろな賞が与えられるが、Sidney Fernbach AwardとSeyour Cray AwardとはIEEE Computer Societyが与える特別に価値のある賞である。」と書かれている、そのSeymour Cray Award Lectureの招待講演者として現在は理研の次世代スーパーコンピューター開発実施本部プロジェクトリーダーの渡辺 貞氏の名前が載っているではないですか。ということは今年のSeymour Cray Awardは渡辺氏に贈られるということで、これは快挙です。
・ 前後しますが、去年マイクロソフトの会長ビル・ゲーツ氏が登場した、毎年呼び物のKeynote(基調講演)スピーカーには有名な発明家のレイ・カーツワイル(Ray Kurzweil)氏が決まっていました。
・ ビル・ゲーツやクリントン元大統領なども彼のファンだそうで、発明だけでなくベストセラーを出したり、三人の大統領から表彰されたりと大変な人らしいです。私はまったく知りませんでしたが・・・。
講演内容は"The Coming Merger of Biological and Non Biological Intelligence"と、なにやら超未来的というか、いかにもアメリカという雰囲気がむんむんしたテーマに見えます。
・ さて、しばらくぶりに最新のプログラムを見ているとpdfが付いているセッションがだいぶ増えてきました。
・SC05小柳レポートに「SCではいろいろな賞が与えられるが、Sidney Fernbach AwardとSeyour Cray AwardとはIEEE Computer Societyが与える特別に価値のある賞である。」と書かれている、そのSeymour Cray Award Lectureの招待講演者として現在は理研の次世代スーパーコンピューター開発実施本部プロジェクトリーダーの渡辺 貞氏の名前が載っているではないですか。ということは今年のSeymour Cray Awardは渡辺氏に贈られるということで、これは快挙です。
・ 前後しますが、去年マイクロソフトの会長ビル・ゲーツ氏が登場した、毎年呼び物のKeynote(基調講演)スピーカーには有名な発明家のレイ・カーツワイル(Ray Kurzweil)氏が決まっていました。
・ ビル・ゲーツやクリントン元大統領なども彼のファンだそうで、発明だけでなくベストセラーを出したり、三人の大統領から表彰されたりと大変な人らしいです。私はまったく知りませんでしたが・・・。
講演内容は"The Coming Merger of Biological and Non Biological Intelligence"と、なにやら超未来的というか、いかにもアメリカという雰囲気がむんむんしたテーマに見えます。
2006年10月05日
● SCといえば小柳レポート
・ 今年東大を定年退官され4月から工学院大学の情報学部長になられた小柳義夫先生による「小柳レポート」はHPCの世界では有名すぎるレポートですが、1992年11月(第5回)のSupercomputing '92から去年11月のSC05 (第18回)まで欠席なしの記述内容は、すでに歴史的な価値のある記録になっていることがわかります。
・ 最初の1992年のレポートには、当時のSupercomputing'92の規模は日本で開催していたSupercomputing Japan (そういえばありました)よりも小さいとか、ETA社の社長のThorndike 氏が「最初にTFLOPSのMPPを作るのは実装技術のあるIBMだ」と言ったとか面白い話がレポートされています。
ちなみに最初の1TFLOPS達成は5年後の1997年に7,264プロセッサーを備えたIntel製のASCI Red(1.3TFLOPS)によってなされ、IBMがTFLOPSを越えてトップを取るのはさらに3年後の2000年11月、8,192個のPOWER3プロセッサーを持ったASCI White (4.9TFLOPS)の出現まで待たなければなりません。
・ この時までは日本製のベクトル・コンピューターが総力戦で世界を圧倒していた感がします。
・ Supercomputing 2000の小柳レポートには、このときBlue Geneと地球シミュレータの講演が多くの聴衆を集めていたとあります。今読むとMPPとベクトル・プロセッサーの決戦かという印象です。
・ そしてご存知のとおり、まず地球シミュレータ(36TFLOPS)が2002年にトップをASCI Whiteから奪還し、そして2004年にはBlue Gene/L(70TFLOPS)がトップに踊り出ました。両者ともに、国際会議で話したことをきっちり実現したなどということも小柳レポートからわかります。
HPCに関して量・質とも備わったこのようなレポートは世界でも例がないでしょう。すごいの一言です。
さてSC06も来月になってきました。契約ホテルの予約締め切りが近づいています。
・ 最初の1992年のレポートには、当時のSupercomputing'92の規模は日本で開催していたSupercomputing Japan (そういえばありました)よりも小さいとか、ETA社の社長のThorndike 氏が「最初にTFLOPSのMPPを作るのは実装技術のあるIBMだ」と言ったとか面白い話がレポートされています。
ちなみに最初の1TFLOPS達成は5年後の1997年に7,264プロセッサーを備えたIntel製のASCI Red(1.3TFLOPS)によってなされ、IBMがTFLOPSを越えてトップを取るのはさらに3年後の2000年11月、8,192個のPOWER3プロセッサーを持ったASCI White (4.9TFLOPS)の出現まで待たなければなりません。
・ この時までは日本製のベクトル・コンピューターが総力戦で世界を圧倒していた感がします。
・ Supercomputing 2000の小柳レポートには、このときBlue Geneと地球シミュレータの講演が多くの聴衆を集めていたとあります。今読むとMPPとベクトル・プロセッサーの決戦かという印象です。
・ そしてご存知のとおり、まず地球シミュレータ(36TFLOPS)が2002年にトップをASCI Whiteから奪還し、そして2004年にはBlue Gene/L(70TFLOPS)がトップに踊り出ました。両者ともに、国際会議で話したことをきっちり実現したなどということも小柳レポートからわかります。
HPCに関して量・質とも備わったこのようなレポートは世界でも例がないでしょう。すごいの一言です。
さてSC06も来月になってきました。契約ホテルの予約締め切りが近づいています。
2006年09月23日
● SC06 - Blue Gene, Cell, そしてAward
SC06, "International Conference on High Performance Computing, Networking and Storage"が11月11日(土)〜17日(金)にフロリダのタンパで開催されます。
ボルチモアでのSC2002以降は足が遠のいてたSCですが、今年は参加してみようと思い直し、AAのディスカウント・エコノミー・チケットとホテルを予約したところです。会場のタンパ・コンベンションセンターに歩いていける範囲にはホテルはあまりなく、しかもSC06が用意したホテルはあらかた満室になっていたため、空港近くのSpringhill Suites Tampa Westshore というホテルを一泊129$で予約するはめになってしまいました。
最初の三日間はtutorial中心に進み、盛況になるのはコンファレンスが始まる11月14日(火)からなので、それに合わせての短期日程です。
このところ海外に出なかったためAAのプラチナ会員が失効していたのに気がつき、ちょっとがっかり。
ことしのプログラムはどんな感じかなと目を皿にしてながめてみると、ペタスケール・コンピューティングが手に届くところにきているということでしょうか、
・ BOF: The Pathway to Petascale Science
・ BOF: Approaching Petascale
・ パネル: High Productivity Computing and Usable Petascale Systems (HPCS)
と、ペタFLOPSをさかなに議論を盛り上げる魂胆のようです。
実現できたときの評価もそろそろ考えようということで、
・ BOF:Evaluating Petascale Infrastructure Systems: Benchmarks, Models, and Applications
というもあります。
BOFというのはBirds of a Featherのことで、特定のテーマに関連や関心のある人が集まり、自由に議論したり情報交換したりする場を指す(英辞郎 on the Web)ということでSC06では、40以上のBOFが開かれます。
■ ペタスケール・コンピューティング実現への先鋒をつとめているBlue Geneについては、ゴードン・ベル賞のファイナリストの論文にも見られるように、応用結果が発表される段階に入ってきました。ファイナリスト論文の他にも、
・ Blue Brain Project (Ecole Polytechnique Federale de Lausanne)
・ Blue Matter (IBM Research)
ソフトウェアについては、
・ Topology Mapping for Blue Gene/L Supercomputer (IBM Research)
があります。
■ そして今年注目のニューカマーはと言えばなんといってもCell BEのようです。特にそのプログラミングが関心事でしょう。
・ CellSs: A Programming Model for the Cell BE Architecture (Barcelona Supercomputing Center)
・ BOF: Cell BE Software Programming and Toolkits (IBM)
とあります。
そして、さらに
・ 招待講演: Real-time Supercomputing and Technology for Games and Entertainment (Cell BE Synergistic Processor Unit(SPU)のIBM チーフ・アーキテクト)
IBMのペタFLOPSに関したテクノロジー等について総括しているのが、Exhibitor Forumでの
・ Innovation beyond Imagination: The Road to PetaFLOPS Computing (IBM)
です。
☆★ さてSC06といえば、日本からも例年受賞者が出ている下の各種の賞が気になります。
・ Cray and Fernbach Awards
・ Gordon Bell Awards
・ Best Paper Awards
・ Best Student Paper Awards
・ HPC Competitions
-- HPC Analytics Challenge
-- HPC Bandwidth Challenge
-- HPC Storage Challenge
・ACM Student Research Competition
ゴードンベル賞のファイナリストについては、以前のブログのとおりですが、他の賞でもファイナリストに
・ HPC Analytics Challenge: 大阪大チーム
・ HPC Bandwidth Challenge: JAXA(宇宙航空研究開発機構)チーム
・ HPC Storage Challenge: KEK/筑波大チーム
が入っています。
(漏れがあったらごめんなさい)。
発表は、11月16日(木)の午後のようです。ゴードンベル賞も合わせて、いい結果に期待!です。
ボルチモアでのSC2002以降は足が遠のいてたSCですが、今年は参加してみようと思い直し、AAのディスカウント・エコノミー・チケットとホテルを予約したところです。会場のタンパ・コンベンションセンターに歩いていける範囲にはホテルはあまりなく、しかもSC06が用意したホテルはあらかた満室になっていたため、空港近くのSpringhill Suites Tampa Westshore というホテルを一泊129$で予約するはめになってしまいました。
最初の三日間はtutorial中心に進み、盛況になるのはコンファレンスが始まる11月14日(火)からなので、それに合わせての短期日程です。
このところ海外に出なかったためAAのプラチナ会員が失効していたのに気がつき、ちょっとがっかり。
ことしのプログラムはどんな感じかなと目を皿にしてながめてみると、ペタスケール・コンピューティングが手に届くところにきているということでしょうか、
・ BOF: The Pathway to Petascale Science
・ BOF: Approaching Petascale
・ パネル: High Productivity Computing and Usable Petascale Systems (HPCS)
と、ペタFLOPSをさかなに議論を盛り上げる魂胆のようです。
実現できたときの評価もそろそろ考えようということで、
・ BOF:Evaluating Petascale Infrastructure Systems: Benchmarks, Models, and Applications
というもあります。
BOFというのはBirds of a Featherのことで、特定のテーマに関連や関心のある人が集まり、自由に議論したり情報交換したりする場を指す(英辞郎 on the Web)ということでSC06では、40以上のBOFが開かれます。
■ ペタスケール・コンピューティング実現への先鋒をつとめているBlue Geneについては、ゴードン・ベル賞のファイナリストの論文にも見られるように、応用結果が発表される段階に入ってきました。ファイナリスト論文の他にも、
・ Blue Brain Project (Ecole Polytechnique Federale de Lausanne)
・ Blue Matter (IBM Research)
ソフトウェアについては、
・ Topology Mapping for Blue Gene/L Supercomputer (IBM Research)
があります。
■ そして今年注目のニューカマーはと言えばなんといってもCell BEのようです。特にそのプログラミングが関心事でしょう。
・ CellSs: A Programming Model for the Cell BE Architecture (Barcelona Supercomputing Center)
・ BOF: Cell BE Software Programming and Toolkits (IBM)
とあります。
そして、さらに
・ 招待講演: Real-time Supercomputing and Technology for Games and Entertainment (Cell BE Synergistic Processor Unit(SPU)のIBM チーフ・アーキテクト)
IBMのペタFLOPSに関したテクノロジー等について総括しているのが、Exhibitor Forumでの
・ Innovation beyond Imagination: The Road to PetaFLOPS Computing (IBM)
です。
☆★ さてSC06といえば、日本からも例年受賞者が出ている下の各種の賞が気になります。
・ Cray and Fernbach Awards
・ Gordon Bell Awards
・ Best Paper Awards
・ Best Student Paper Awards
・ HPC Competitions
-- HPC Analytics Challenge
-- HPC Bandwidth Challenge
-- HPC Storage Challenge
・ACM Student Research Competition
ゴードンベル賞のファイナリストについては、以前のブログのとおりですが、他の賞でもファイナリストに
・ HPC Analytics Challenge: 大阪大チーム
・ HPC Bandwidth Challenge: JAXA(宇宙航空研究開発機構)チーム
・ HPC Storage Challenge: KEK/筑波大チーム
が入っています。
(漏れがあったらごめんなさい)。
発表は、11月16日(木)の午後のようです。ゴードンベル賞も合わせて、いい結果に期待!です。
2006年09月03日
● SC06 のゴードン・ベル賞ファイナリスト
HPC恒例の大イベント SC06(International Conference on High Performance Computing, Networking, Storage and Analysis)が 11月11日-17日にフロリダ州タンパで開催されます。
この期間中に発表される有名なゴードン・ベル賞(Gordon Bell Prizes)のファイナリスト 6チームが公表されていました。
今年のゴードン・ベル賞は4カテゴリー:
1. Sustained FLOPSベースのピーク性能
2. 価格性能比 (1$当りのSustained FLOPS)
3. イノベーションによるスケーラビリティへの画期的な成功
4. コンパイラで達成したスケーラビリティ(?)(原文は* Scalability achieved through language constructs)
に分かれていて、ちなみにファイナリストの使用したシステムは
- Blue Gene使用が3チーム (米国2、日本1)、
- 地球シミュレータ使用が1チーム(日本)、
- MD-GRAPE使用が1チーム(日本)、
- FPGAベース・システム使用が1チーム(日本)となっています。
このうちBlue Gene使用チームは、
1. 米国がLLNLチーム (電子構造計算で200TFLOPS)、
2. IBM チーム(格子QCDで12 TFLOPS)、そして
3. 日本のアライドエンジニアリング・チーム(携帯電話の落下時衝撃解析)
の3チームでした。
3.のような産業界向けの解析がファイナリストになったのはたぶん始めてでしょう。
ともすれば特殊目的と思われがちなBGのような超並列アーキテクチャ・システムが産業界に役立つことを実証しているという意味でもイノベーティブな成果と言えるのではないでしょうか。
この期間中に発表される有名なゴードン・ベル賞(Gordon Bell Prizes)のファイナリスト 6チームが公表されていました。
今年のゴードン・ベル賞は4カテゴリー:
1. Sustained FLOPSベースのピーク性能
2. 価格性能比 (1$当りのSustained FLOPS)
3. イノベーションによるスケーラビリティへの画期的な成功
4. コンパイラで達成したスケーラビリティ(?)(原文は* Scalability achieved through language constructs)
に分かれていて、ちなみにファイナリストの使用したシステムは
- Blue Gene使用が3チーム (米国2、日本1)、
- 地球シミュレータ使用が1チーム(日本)、
- MD-GRAPE使用が1チーム(日本)、
- FPGAベース・システム使用が1チーム(日本)となっています。
このうちBlue Gene使用チームは、
1. 米国がLLNLチーム (電子構造計算で200TFLOPS)、
2. IBM チーム(格子QCDで12 TFLOPS)、そして
3. 日本のアライドエンジニアリング・チーム(携帯電話の落下時衝撃解析)
の3チームでした。
3.のような産業界向けの解析がファイナリストになったのはたぶん始めてでしょう。
ともすれば特殊目的と思われがちなBGのような超並列アーキテクチャ・システムが産業界に役立つことを実証しているという意味でもイノベーティブな成果と言えるのではないでしょうか。

