2006年10月
2006年10月30日
● eBlueRunner-IBM HPCメルマガ
・ HPCをテーマにしたメルマガを日本IBMがはじめます。名前はeBlueRunner。
わたしがメルマガ編集長ということになってしまったため、このブログでも紹介させていただきました。
・登録メンバーのみへの配布ですので、関心のある方はぜひ気軽に会員登録どうぞ。
こちらのIBM HPCサイトのトップバナーから登録できます。
★大事なことを書き漏らしていましたので追加します。
→メンバーの対象は「公的研究機関、大学、製薬企業の研究者、研究管理者、スタッフの皆様」
となっていました・・・あしからず。
ちなみにBlueRunnerという名前はRoadRunnerからのアナロジーですが、シマアジの一種で実在する魚です。釣り好きの方には有名な魚のようです。
わたしがメルマガ編集長ということになってしまったため、このブログでも紹介させていただきました。
・登録メンバーのみへの配布ですので、関心のある方はぜひ気軽に会員登録どうぞ。
こちらのIBM HPCサイトのトップバナーから登録できます。
★大事なことを書き漏らしていましたので追加します。
→メンバーの対象は「公的研究機関、大学、製薬企業の研究者、研究管理者、スタッフの皆様」
となっていました・・・あしからず。
ちなみにBlueRunnerという名前はRoadRunnerからのアナロジーですが、シマアジの一種で実在する魚です。釣り好きの方には有名な魚のようです。
2006年10月27日
● Cell BEとBlue Geneの今週の講演から
今週は三つの非常に面白かった国際会議とセミナーがありました。全部は出席できなかったので、その中から印象に残ったものを。
● First International Symposium for "Integrated Predictive Simulation System for Earthquake and Tsunami Disaster" (10/23-24, 東大 小柴ホール)
・1988年にGordon Bell賞を受け、NASA時代にNASベンチマーク・プログラムの開発メンバーだった、Horst Simon (NERSC, Lawrence Berkley National Laboratory)氏による"Challenges in Petascale Computing"の発表を聴きました。
・まず最初にNERSCの最新ニュースということでAMD Opteron Dual Core (2.6GHz)ベースの次期システムNERSC5について簡単に触れた後で本論が始まりました。
・Simon氏が考えるPetascale computingの定義は、ピークではなく持続性能がペタFLOPSのシステムで、かつ広範囲のユーザー(アプリケーション)に利用されるというものです。
その観点で見ると、彼は今三つの挑戦課題があるといいます。それらは
1) Scalingの課題: 外挿による予測では2010〜11年に持続性能がペタFLOPSのシステムが出てくる。ただそのシステムは500万から1,000万プロセッサーになるだろう。今や1980年当時のMC68000プロセッサーのトランジスター数(68,000個)に匹敵するプロセッサー数からシステムができている時代だ(ちなみにBlue Gene/Lはその倍の13万プロセッサー)。
2) 電力消費の課題: ここ二、三年で低電力テクノロジーに切り替わる。ただそれでもペタスケール・コンピューティング規模のセンターは一部の国立研究所や、Google、MSN、Yahooといった大企業のコンピューティング・センターくらいしかできないだろう。
3) Petascaleバブル: ペタスケールについてみんな過度に楽観的だ。見方によっては、2011年までは市場が増え、どこでもクラスターという一番よい時代であるとも言えるし、最悪の時代とも言える。
HPCの経験が豊富かつ造詣の深いHorst氏らしい見方ですが、過去数年を見ても超並列コンピューティングの流れのいっそうの加速や、Intel、AMD製のコモディティ・プロセッサーの高速化、低電力化など、こうした冷静な見方を越えて現実の方が先に進んで行っているというのが実感です。
もちろん彼もそのへんはよく理解していて、
・IBM Blue Gene/Pや、AMD OpteronとCell BEのハイブリッドによるロスアラモス(LANL)のRoadRunnerのようなシステムがPetascale Computingにおそらく最も近いところにいるだろう
と話していました。
・次の筑波大 朴 泰祐教授は"Low Power and High-Performance Massively Parallel Processor for Post-PFLOPS Computing"という題名で、組み込み型のプロセッサーによるUltra Low Power MPPのアーキテクチャの発表です。仮に地球シミュレータのテクノロジーのまま外挿して10PetaFLOPSのシステムを考えると、その電力使用量は1.75GW(175万KW)になるそうです。
・調べてみると、最近の原子力発電所の1ユニットの発電能力は110万KWなので、1ユニット4,000億円近い建設費の原子力発電所が2ユニット必要になる勘定です。
・この試算からも、低電力化が今後HPCにとってたいへん本質的な課題になるということがわかります。
・地球シミュレータはCRAY-1から始まり日本が席巻したベクトル型スーパーコンピューターの集大成でした。いっぽう、Blue Geneはこれから主流になっていくだろうPetaFLOPS級の低電力スーパーコンピューターの原点になっていくように見えます。
時の流れに乗り。ビジネスとして将来性のあるUltra Low Power MPPのようなテーマについての研究開発を早く盛んにすることが、今後のHPC分野の競争力を強くするためには大変重要だと思います
● 製造業界向け HPC最新情報セミナー (10/24、日本IBM)
株式会社 アライドエンジニアリング 社長の秋葉 博氏の"グリッド環境に最適な構造設計ソリューションADVCのご紹介"の発表を聴きました。
・エレクトロニクス産業界の解析対象は、問題が非常に難しいものが多くて解析に要する計算時間もかかるため、いままで手をつけられなかったものが多い。しかしBlue Geneくらいの能力があれば状況は変わってくるという趣旨の講演だったと思います。
・このブログでも紹介していますが、SC06サイトに掲載されているように、Blue Geneによる携帯電話機の落下衝撃解析の論文が、11月にフロリダ州タンパで開催されるSC06のGordon Bell賞ファイナリストに選ばれています。その性能はBlue Geneの4,096 node(8,192プロセッサー) を使用し538 GFLOPSとなっています。Gordon Bell賞では、最新データが審査対象になるというルールがあるので、その後も記録を伸ばす努力をIBM Research等と一緒にしているそうです。最終記録はSC06で発表されます。
・さてベクトル・スーパーコンピューターが全盛だったころは、大学や国立研究所よりもむしろ産業界に高額のスーパーコンピューターが多数導入利用されていた印象がありましたが、最近は逆転したようです。
超並列型スーパーコンピューターへの流れが定着し、価格性能比や電力性能比も以前のスーパーコンピュータに比べてはるかに良くなったのに対し、産業界でよく使われているアプリケーション・ソフトウェア側にそれを使いこなすための対応がほとんど見えてきていません。全くもったいない話です。
秋葉氏チームの仕事はそうした現状の弱点と、今後の高い可能性をまさに実証するものです。
● International Workshop on Collaboration between Numerical Methods and Large-Scale Scientific Computation 2006 (10/25、東大)
この中のApplication and PerformanceのセッションでCell BEの性能評価についての発表がありました。
"The Performance of Key Scientific Computing Algorithms on SONY/Toshiba/IBM Cell Broad Band Engine"
・講演者のJohn Shalf氏(NERSC)の好奇心と実行力にあふれた個性のせいか、Cell BEのプログラミングについて非常に具体的で面白い発表をしました。司会の東大 中島研吾先生曰く、JohnはVisualizationの専門家だと思っていたのに、実は何でもできる人だね。
・Cell BEの200GFLOPS@3.2GHzというものすごいピーク・スピードは単精度演算の場合で、倍精度演算については14.6GFLOPS@3.2GHzぐっと遅くなるために、HPCの世界では倍精度演算の性能が改良されるまでCell BEは使えないとよく言われています。
・これに対して彼の結論は、それでもCell BEの倍精度演算性能は他よりずっと速く魅力的だというものです。
・カーネルのGEMM、SpMV、Stencil、1D FFT、2D FFTをCell BE用に倍精度演算にプログラミングして計算速度と電力効率をスーパースカラー(AMD Opteron)、VLIW(Intel Itanium2)、ベクトル(Cray X1E)について比較した彼の結果を見ると、計算速度ではGEMMと2D FFTでベクトル型のCray X1Eにやや劣る以外は1倍〜13倍程度速いという結果、電力効率ではすべてのケースに対して2倍〜40倍も優れているという結果でした。
・彼が力説した点は、Cell BEの8個のSPU (Synergistic Processing Unit)はキャッシュを経由せずに高速かつ高価なXDRメモリーをDMAにより直接アクセスするため、それが演算性能と相乗してベクトル機X1Eに勝るとも劣らない高い実効性能につながっているという点です。
・NERSCのLBMHD(Lattice Boltzmann 2D-MHD)コードをCell BEに載せる予定とのことですが、上のToy programでもプログラミングに莫大な時間がかかったと話していました
Cell BEのアーキテクチャの利点を享受するためには、Johnに代表されるように今このバリアを独力でも越えようとするか、あるいはソフトウェア開発環境の充実を期待して待つかどちらかに分かれるようです。
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」
● First International Symposium for "Integrated Predictive Simulation System for Earthquake and Tsunami Disaster" (10/23-24, 東大 小柴ホール)
・1988年にGordon Bell賞を受け、NASA時代にNASベンチマーク・プログラムの開発メンバーだった、Horst Simon (NERSC, Lawrence Berkley National Laboratory)氏による"Challenges in Petascale Computing"の発表を聴きました。
・まず最初にNERSCの最新ニュースということでAMD Opteron Dual Core (2.6GHz)ベースの次期システムNERSC5について簡単に触れた後で本論が始まりました。
・Simon氏が考えるPetascale computingの定義は、ピークではなく持続性能がペタFLOPSのシステムで、かつ広範囲のユーザー(アプリケーション)に利用されるというものです。
その観点で見ると、彼は今三つの挑戦課題があるといいます。それらは
1) Scalingの課題: 外挿による予測では2010〜11年に持続性能がペタFLOPSのシステムが出てくる。ただそのシステムは500万から1,000万プロセッサーになるだろう。今や1980年当時のMC68000プロセッサーのトランジスター数(68,000個)に匹敵するプロセッサー数からシステムができている時代だ(ちなみにBlue Gene/Lはその倍の13万プロセッサー)。
2) 電力消費の課題: ここ二、三年で低電力テクノロジーに切り替わる。ただそれでもペタスケール・コンピューティング規模のセンターは一部の国立研究所や、Google、MSN、Yahooといった大企業のコンピューティング・センターくらいしかできないだろう。
3) Petascaleバブル: ペタスケールについてみんな過度に楽観的だ。見方によっては、2011年までは市場が増え、どこでもクラスターという一番よい時代であるとも言えるし、最悪の時代とも言える。
HPCの経験が豊富かつ造詣の深いHorst氏らしい見方ですが、過去数年を見ても超並列コンピューティングの流れのいっそうの加速や、Intel、AMD製のコモディティ・プロセッサーの高速化、低電力化など、こうした冷静な見方を越えて現実の方が先に進んで行っているというのが実感です。
もちろん彼もそのへんはよく理解していて、
・IBM Blue Gene/Pや、AMD OpteronとCell BEのハイブリッドによるロスアラモス(LANL)のRoadRunnerのようなシステムがPetascale Computingにおそらく最も近いところにいるだろう
と話していました。
・次の筑波大 朴 泰祐教授は"Low Power and High-Performance Massively Parallel Processor for Post-PFLOPS Computing"という題名で、組み込み型のプロセッサーによるUltra Low Power MPPのアーキテクチャの発表です。仮に地球シミュレータのテクノロジーのまま外挿して10PetaFLOPSのシステムを考えると、その電力使用量は1.75GW(175万KW)になるそうです。
・調べてみると、最近の原子力発電所の1ユニットの発電能力は110万KWなので、1ユニット4,000億円近い建設費の原子力発電所が2ユニット必要になる勘定です。
・この試算からも、低電力化が今後HPCにとってたいへん本質的な課題になるということがわかります。
・地球シミュレータはCRAY-1から始まり日本が席巻したベクトル型スーパーコンピューターの集大成でした。いっぽう、Blue Geneはこれから主流になっていくだろうPetaFLOPS級の低電力スーパーコンピューターの原点になっていくように見えます。
時の流れに乗り。ビジネスとして将来性のあるUltra Low Power MPPのようなテーマについての研究開発を早く盛んにすることが、今後のHPC分野の競争力を強くするためには大変重要だと思います
● 製造業界向け HPC最新情報セミナー (10/24、日本IBM)
株式会社 アライドエンジニアリング 社長の秋葉 博氏の"グリッド環境に最適な構造設計ソリューションADVCのご紹介"の発表を聴きました。
・エレクトロニクス産業界の解析対象は、問題が非常に難しいものが多くて解析に要する計算時間もかかるため、いままで手をつけられなかったものが多い。しかしBlue Geneくらいの能力があれば状況は変わってくるという趣旨の講演だったと思います。
・このブログでも紹介していますが、SC06サイトに掲載されているように、Blue Geneによる携帯電話機の落下衝撃解析の論文が、11月にフロリダ州タンパで開催されるSC06のGordon Bell賞ファイナリストに選ばれています。その性能はBlue Geneの4,096 node(8,192プロセッサー) を使用し538 GFLOPSとなっています。Gordon Bell賞では、最新データが審査対象になるというルールがあるので、その後も記録を伸ばす努力をIBM Research等と一緒にしているそうです。最終記録はSC06で発表されます。
・さてベクトル・スーパーコンピューターが全盛だったころは、大学や国立研究所よりもむしろ産業界に高額のスーパーコンピューターが多数導入利用されていた印象がありましたが、最近は逆転したようです。
超並列型スーパーコンピューターへの流れが定着し、価格性能比や電力性能比も以前のスーパーコンピュータに比べてはるかに良くなったのに対し、産業界でよく使われているアプリケーション・ソフトウェア側にそれを使いこなすための対応がほとんど見えてきていません。全くもったいない話です。
秋葉氏チームの仕事はそうした現状の弱点と、今後の高い可能性をまさに実証するものです。
● International Workshop on Collaboration between Numerical Methods and Large-Scale Scientific Computation 2006 (10/25、東大)
この中のApplication and PerformanceのセッションでCell BEの性能評価についての発表がありました。
"The Performance of Key Scientific Computing Algorithms on SONY/Toshiba/IBM Cell Broad Band Engine"
・講演者のJohn Shalf氏(NERSC)の好奇心と実行力にあふれた個性のせいか、Cell BEのプログラミングについて非常に具体的で面白い発表をしました。司会の東大 中島研吾先生曰く、JohnはVisualizationの専門家だと思っていたのに、実は何でもできる人だね。
・Cell BEの200GFLOPS@3.2GHzというものすごいピーク・スピードは単精度演算の場合で、倍精度演算については14.6GFLOPS@3.2GHzぐっと遅くなるために、HPCの世界では倍精度演算の性能が改良されるまでCell BEは使えないとよく言われています。
・これに対して彼の結論は、それでもCell BEの倍精度演算性能は他よりずっと速く魅力的だというものです。
・カーネルのGEMM、SpMV、Stencil、1D FFT、2D FFTをCell BE用に倍精度演算にプログラミングして計算速度と電力効率をスーパースカラー(AMD Opteron)、VLIW(Intel Itanium2)、ベクトル(Cray X1E)について比較した彼の結果を見ると、計算速度ではGEMMと2D FFTでベクトル型のCray X1Eにやや劣る以外は1倍〜13倍程度速いという結果、電力効率ではすべてのケースに対して2倍〜40倍も優れているという結果でした。
・彼が力説した点は、Cell BEの8個のSPU (Synergistic Processing Unit)はキャッシュを経由せずに高速かつ高価なXDRメモリーをDMAにより直接アクセスするため、それが演算性能と相乗してベクトル機X1Eに勝るとも劣らない高い実効性能につながっているという点です。
・NERSCのLBMHD(Lattice Boltzmann 2D-MHD)コードをCell BEに載せる予定とのことですが、上のToy programでもプログラミングに莫大な時間がかかったと話していました
Cell BEのアーキテクチャの利点を享受するためには、Johnに代表されるように今このバリアを独力でも越えようとするか、あるいはソフトウェア開発環境の充実を期待して待つかどちらかに分かれるようです。
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」
2006年10月22日
● Opteronベースのブレードサーバー LS21のメモリバンド幅
・この夏に発表されたIBMブレードサーバーLS21について遅ればせですがメモリーバンド幅から見た紹介をしたいと思います。
・ベンチマーク・データは、ホワイトペーパー
"Performance of the AMD Opteron
LS21 for IBM BladeCenter" からのものです。
・130n SOIから90ns SOIテクノロジーになり、メモリーもDDR1からDDR2へと高速化されたAMD Opteron dual core(2.6GHz)を搭載した新しいブレードサーバー LS21は、前モデルのLS20が2.0GHz AMD Opteron dual coreと400MHz DDR(16GB)メモリだったのに比べて、メモリも667MHz DDR2 (最大32GB)へと高速になり、いっそうHPC用途に魅力的になってきました。
・LS21は2個のOpteronプロセッサー構成のため、最大32GBのメモリー空間が両方のプロセッサーから共有されています。二つのプロセッサーのそれぞれに、最大16GBづつのメモリが直結されているため、他方のプロセッサ側のメモリをアクセスするためにはプロセッサー間を結ぶ高速のcHT経由を通っていくアーキテクチャになっています。ということで、マルチプロセッサー・システムで一般的なSMPアーキテクチャではなくNUMAアーキテクチャになります。
・ただNUMAといってもcHTが高速なことやプロセッサー数が2個なので、数百のプロセッサー構成による大型NUMAシステムのイメージとは異なりますが。
・フル構成時のメモリ・バンド幅は21.3GB/s、Stream Triadベンチマークによる実測は12.4GB/sです。前モデルLS20は実測が9.6GB/sなのでそれから見ると約29%向上しています。ちょうどプロセッサーののクロック・アップ分がそのままバンド幅の向上になった計算です。
・Stream Triadベンチマークとは、a(i) = b(i) + q*c(i) のループを実行させ、そのときのメモリー転送スピードを計るものです。但し、a, b,cのサイズが小さいとキャッシュとのデータ転送になってしまうので、それを避けるためにa,b,cのサイズは最終レベルのキャッシュ総量の少なくとも4倍にしなければならないというルールがあります。
・x3755についてのblogで紹介したように、Node Interleaveはメモリー・バンド幅性能を低下させ、Chipkillはほとんど影響しないということから、測定はBIOSでNode InterleaveとChipkill両方をdisableにセットした条件でおこなっています。
・LS21のようにマルチプロセッサー・システムで気になることは、シングル・プロセッサーのときに比べ本当に二倍近いメモリバンド幅が得られるかどうかです。STRAEMによる実測ではほとんど二倍で、スケーラブルな性能になっています。メモリー・コントローラがプロセッサーに統合されているためにプロセッサー追加とメモリーコントローラ追加が同時になされることが大きな理由と思われます。
・たとえばライフサイエンス分野で有名なGaussianのように、HPC分野の大規模アプリケーションでは、演算性能だけでなくメモリー・バンド幅が実効処理速度に影響するものが少なくありません。
スペース効率のよいHPC向けサーバーが必要な場合、LS21だと9Uのシャシーに14個のブレードサーバー(28プロセッサーまたは48プロセッサーコア)を格納でき、かつ演算性能とメモリー・バンド幅両方が高性能なため、ひときわ魅力的に感じます。
・ベンチマーク・データは、ホワイトペーパー
"Performance of the AMD Opteron
LS21 for IBM BladeCenter" からのものです。
・130n SOIから90ns SOIテクノロジーになり、メモリーもDDR1からDDR2へと高速化されたAMD Opteron dual core(2.6GHz)を搭載した新しいブレードサーバー LS21は、前モデルのLS20が2.0GHz AMD Opteron dual coreと400MHz DDR(16GB)メモリだったのに比べて、メモリも667MHz DDR2 (最大32GB)へと高速になり、いっそうHPC用途に魅力的になってきました。
・LS21は2個のOpteronプロセッサー構成のため、最大32GBのメモリー空間が両方のプロセッサーから共有されています。二つのプロセッサーのそれぞれに、最大16GBづつのメモリが直結されているため、他方のプロセッサ側のメモリをアクセスするためにはプロセッサー間を結ぶ高速のcHT経由を通っていくアーキテクチャになっています。ということで、マルチプロセッサー・システムで一般的なSMPアーキテクチャではなくNUMAアーキテクチャになります。
・ただNUMAといってもcHTが高速なことやプロセッサー数が2個なので、数百のプロセッサー構成による大型NUMAシステムのイメージとは異なりますが。
・フル構成時のメモリ・バンド幅は21.3GB/s、Stream Triadベンチマークによる実測は12.4GB/sです。前モデルLS20は実測が9.6GB/sなのでそれから見ると約29%向上しています。ちょうどプロセッサーののクロック・アップ分がそのままバンド幅の向上になった計算です。
・Stream Triadベンチマークとは、a(i) = b(i) + q*c(i) のループを実行させ、そのときのメモリー転送スピードを計るものです。但し、a, b,cのサイズが小さいとキャッシュとのデータ転送になってしまうので、それを避けるためにa,b,cのサイズは最終レベルのキャッシュ総量の少なくとも4倍にしなければならないというルールがあります。
・x3755についてのblogで紹介したように、Node Interleaveはメモリー・バンド幅性能を低下させ、Chipkillはほとんど影響しないということから、測定はBIOSでNode InterleaveとChipkill両方をdisableにセットした条件でおこなっています。
・LS21のようにマルチプロセッサー・システムで気になることは、シングル・プロセッサーのときに比べ本当に二倍近いメモリバンド幅が得られるかどうかです。STRAEMによる実測ではほとんど二倍で、スケーラブルな性能になっています。メモリー・コントローラがプロセッサーに統合されているためにプロセッサー追加とメモリーコントローラ追加が同時になされることが大きな理由と思われます。
・たとえばライフサイエンス分野で有名なGaussianのように、HPC分野の大規模アプリケーションでは、演算性能だけでなくメモリー・バンド幅が実効処理速度に影響するものが少なくありません。
スペース効率のよいHPC向けサーバーが必要な場合、LS21だと9Uのシャシーに14個のブレードサーバー(28プロセッサーまたは48プロセッサーコア)を格納でき、かつ演算性能とメモリー・バンド幅両方が高性能なため、ひときわ魅力的に感じます。
2006年10月20日
● I blog. You blog. Weblog.
・このタイトルは今米国IBMサイトのトップ・ページに現れるコピーです。
・副題は、"Communicating, collaborating, and changing the face of business"となっています。
・HPCな方は特に違和感はないと思いますが、米国では研究所や工場勤務を除けば、専門家は転居はあまりせずに、むしろ週末以外は国中を飛び回る方を好みますし、IBM社員でもオフィスが自宅という人もめずらしくありません。自宅をオフィスにしていた米国IBMの知人が、税金もホームオフィスが得になるようになっているというのを聞いてなるほどと思いました。
・特に必要もないのに頻繁に顔を合わせて、いかにも汗をかいているのを見せないとビジネスに結びつかないといった例もまだまだあるでしょうが、最近は過度のFace-to-faceは談合・癒着のイメージ、それになによりお互い忙しくてオフィスにいないことも多いためにe-mailの方が便利になったりと、コミュニケーションの方法も変わってきました。
・いま米国では大企業がblogの急速な広がりやコミュニケーションへの影響力を理解してきていて、たとえばHP社のように役員blogを中心に掲載したり、米国IBMのようにWebのトップページで取り上げて多数のIBM bloggerを顔写真入りで掲載したりと積極的です。これはユーモアなのか大真面目なのかよくわかりませんが、IBMではEditor's choiceを紹介しています。ちなみにEditor's choiceには、HPCで知る人ぞ知るーSP1を開発したIrvingが選ばれています。
確かにcommunicationの方法としてblogはWebよりずっと負担(時間、費用)が少なく、いろんなフィードバックも得られやすいなというのがblog開始1ヶ月半の実感です。
・副題は、"Communicating, collaborating, and changing the face of business"となっています。
・HPCな方は特に違和感はないと思いますが、米国では研究所や工場勤務を除けば、専門家は転居はあまりせずに、むしろ週末以外は国中を飛び回る方を好みますし、IBM社員でもオフィスが自宅という人もめずらしくありません。自宅をオフィスにしていた米国IBMの知人が、税金もホームオフィスが得になるようになっているというのを聞いてなるほどと思いました。
・特に必要もないのに頻繁に顔を合わせて、いかにも汗をかいているのを見せないとビジネスに結びつかないといった例もまだまだあるでしょうが、最近は過度のFace-to-faceは談合・癒着のイメージ、それになによりお互い忙しくてオフィスにいないことも多いためにe-mailの方が便利になったりと、コミュニケーションの方法も変わってきました。
・いま米国では大企業がblogの急速な広がりやコミュニケーションへの影響力を理解してきていて、たとえばHP社のように役員blogを中心に掲載したり、米国IBMのようにWebのトップページで取り上げて多数のIBM bloggerを顔写真入りで掲載したりと積極的です。これはユーモアなのか大真面目なのかよくわかりませんが、IBMではEditor's choiceを紹介しています。ちなみにEditor's choiceには、HPCで知る人ぞ知るーSP1を開発したIrvingが選ばれています。
確かにcommunicationの方法としてblogはWebよりずっと負担(時間、費用)が少なく、いろんなフィードバックも得られやすいなというのがblog開始1ヶ月半の実感です。
● 「数値解析手法と大規模科学技術計算」国際ワークショップ開催間近
・以前に紹介の「数値解析手法と大規模科学技術計算」に関する国際ワークショップが10月25日(水)に開催されます。
・Cell BEプロセッサーが最近関心を呼んでいますが、それについての講演が午前中に予定されています。
"The Performance of Key Scientific Computing Algorithms on the Sony/Toshiba/IBM Cell Broadband Engine"。スピーカーは、John Shalf (Lawrence Berkeley National Laboratory) 氏です。
・このblogでも紹介したRichard Varga先生の講演は、残念ながらご高齢ということもあって今回は見送られたようです。
・このほか来週月・火には、これも既案内の「観測・計算を融合した階層連結地震・津波災害予測システム」第1回国際シンポジウムが開催されます。
・どちらも事前登録不要となっています。
この三日間は興味深い内容が盛りだくさんなので、時間を縫ってでも、できるだけ多くのセッションに参加したいところです。
・Cell BEプロセッサーが最近関心を呼んでいますが、それについての講演が午前中に予定されています。
"The Performance of Key Scientific Computing Algorithms on the Sony/Toshiba/IBM Cell Broadband Engine"。スピーカーは、John Shalf (Lawrence Berkeley National Laboratory) 氏です。
・このblogでも紹介したRichard Varga先生の講演は、残念ながらご高齢ということもあって今回は見送られたようです。
・このほか来週月・火には、これも既案内の「観測・計算を融合した階層連結地震・津波災害予測システム」第1回国際シンポジウムが開催されます。
・どちらも事前登録不要となっています。
この三日間は興味深い内容が盛りだくさんなので、時間を縫ってでも、できるだけ多くのセッションに参加したいところです。
2006年10月15日
● SC06 アップデート
・SC06の事前登録割引は今日10/15までですね。私も495$でWebからTechnical programの登録をしました。10/16以降は700$と40%も高くなるので、選択の余地はないでしょう。
・ さて、しばらくぶりに最新のプログラムを見ているとpdfが付いているセッションがだいぶ増えてきました。
・SC05小柳レポートに「SCではいろいろな賞が与えられるが、Sidney Fernbach AwardとSeyour Cray AwardとはIEEE Computer Societyが与える特別に価値のある賞である。」と書かれている、そのSeymour Cray Award Lectureの招待講演者として現在は理研の次世代スーパーコンピューター開発実施本部プロジェクトリーダーの渡辺 貞氏の名前が載っているではないですか。ということは今年のSeymour Cray Awardは渡辺氏に贈られるということで、これは快挙です。
・ 前後しますが、去年マイクロソフトの会長ビル・ゲーツ氏が登場した、毎年呼び物のKeynote(基調講演)スピーカーには有名な発明家のレイ・カーツワイル(Ray Kurzweil)氏が決まっていました。
・ ビル・ゲーツやクリントン元大統領なども彼のファンだそうで、発明だけでなくベストセラーを出したり、三人の大統領から表彰されたりと大変な人らしいです。私はまったく知りませんでしたが・・・。
講演内容は"The Coming Merger of Biological and Non Biological Intelligence"と、なにやら超未来的というか、いかにもアメリカという雰囲気がむんむんしたテーマに見えます。
・ さて、しばらくぶりに最新のプログラムを見ているとpdfが付いているセッションがだいぶ増えてきました。
・SC05小柳レポートに「SCではいろいろな賞が与えられるが、Sidney Fernbach AwardとSeyour Cray AwardとはIEEE Computer Societyが与える特別に価値のある賞である。」と書かれている、そのSeymour Cray Award Lectureの招待講演者として現在は理研の次世代スーパーコンピューター開発実施本部プロジェクトリーダーの渡辺 貞氏の名前が載っているではないですか。ということは今年のSeymour Cray Awardは渡辺氏に贈られるということで、これは快挙です。
・ 前後しますが、去年マイクロソフトの会長ビル・ゲーツ氏が登場した、毎年呼び物のKeynote(基調講演)スピーカーには有名な発明家のレイ・カーツワイル(Ray Kurzweil)氏が決まっていました。
・ ビル・ゲーツやクリントン元大統領なども彼のファンだそうで、発明だけでなくベストセラーを出したり、三人の大統領から表彰されたりと大変な人らしいです。私はまったく知りませんでしたが・・・。
講演内容は"The Coming Merger of Biological and Non Biological Intelligence"と、なにやら超未来的というか、いかにもアメリカという雰囲気がむんむんしたテーマに見えます。
2006年10月14日
● サーバーも省エネが重要課題に
・世の中がエネルギー消費に敏感になってきたことから、性能が高いから電力消費は大目に見ようということが世界的にも認められなくなりつつあります。
・特にHPC分野ではクラスター・システムやグリッド・コンピューティングのような大規模システムも多く、省エネはシステム設計上さけては通れない考慮点になっていきます。
・PCの例をあげるまでもなく、性能あたりのコンピューター価格が毎年低下していっているのに、電力使用量の方は増加していく現象は、大型システムであればあるほどTotal Cost of Ownershipの面からも耐えられないことです。
・コンピューター・メーカーの目から見れば、"ギガヘルツは去り、次はワットか?"というわけで、IBMがこの夏に発表した“Cool Blue”のようなテクノロジーに、ビジネス競争の差別化の重要な要素として力が入っていくことが予想できます。
・HPC分野に限れば、(ピーク性能/ピーク消費電力)をインデックスにすればほぼ十分という考えもありそうですが、一般には性能、消費電力をどう評価するか案外ややこしい問題のようです。
・評価方法については標準化のための非営利団体SPECも、いまメンバー企業が参加してSPEC Powerというベンチマークを検討しています。
・IBMもホワイトペーパーでこんな議論をしています。→ Power Benchmarking: A New Methodology for Analyzing Performance by Applying Energy Efficiency Metrics (June 2, 2006)
コンピューターも自動車並みに環境に影響する地位になってきたとも言えます。ますます注目されるテーマです。
・特にHPC分野ではクラスター・システムやグリッド・コンピューティングのような大規模システムも多く、省エネはシステム設計上さけては通れない考慮点になっていきます。
・PCの例をあげるまでもなく、性能あたりのコンピューター価格が毎年低下していっているのに、電力使用量の方は増加していく現象は、大型システムであればあるほどTotal Cost of Ownershipの面からも耐えられないことです。
・コンピューター・メーカーの目から見れば、"ギガヘルツは去り、次はワットか?"というわけで、IBMがこの夏に発表した“Cool Blue”のようなテクノロジーに、ビジネス競争の差別化の重要な要素として力が入っていくことが予想できます。
・HPC分野に限れば、(ピーク性能/ピーク消費電力)をインデックスにすればほぼ十分という考えもありそうですが、一般には性能、消費電力をどう評価するか案外ややこしい問題のようです。
・評価方法については標準化のための非営利団体SPECも、いまメンバー企業が参加してSPEC Powerというベンチマークを検討しています。
・IBMもホワイトペーパーでこんな議論をしています。→ Power Benchmarking: A New Methodology for Analyzing Performance by Applying Energy Efficiency Metrics (June 2, 2006)
コンピューターも自動車並みに環境に影響する地位になってきたとも言えます。ますます注目されるテーマです。
2006年10月11日
●「Cellのプログラミング手法及び活用事例紹介」セミナー開催案内
Cell BEのプログラミングに関心をもたれている方も多数いらっしゃると思いますが、
・Cellのプログラミング手法や活用事例紹介のセミナーが、日本マーキュリーコンピュータシステムズ株式会社主催、日本アイ・ビー・エム株式会社共催で、11月10日(金)午後に下記のとおり開催されます。
・参加ご希望の方は、案内状・参加申込書に必要事項をご記入の上、お手数ですがファクシミリにてお申し込み下さい。
尚、申し込みの締め切りは、11月6日(月)とさせていただきますが、定員になり次第申し込みを締め切らせて頂くこともありますので、あらかじめご了承下さいませ。
とのことですので、お早めにどうぞ。
・開催概要
日時 :平成18年11月10日(金)13:30〜17:30 (13:00より受付開始)
会場 :青山テピア(東京都港区北青山2丁目8番44号) 4Fテピアホール
>>> http://www.tepia.jp/access/index.html
主催 :日本マーキュリーコンピュータシステムズ株式会社
協賛 :日本アイ・ビー・エム株式会社
定員 :150名
参加費:無料
プログラム:(同時通訳サービス付)
13:30 - 13:35 ご挨拶 日本アイ・ビー・エム
13:35 - 14:05 IBM Cell製品のご紹介、Cell BEプロセッサのアップデートと応用事例
日本アイ・ビー・エム
14:05 - 14:35 Cell BEのビジネスアップデートと応用事例
Randy Dean, VP, Mercury Computer Systems, Inc.
14:35 – 14:50 休憩
14:50 - 15:50 Cell開発ツール(ライブラリー)の紹介
- プログラミング開発を経験して(実践編)
日本マーキュリーコンピュータ 黒澤 晃
- Mercury Cell開発ツールの特長 John Brickman
Director, Mercury Computer Systems, Inc.
15:50 – 16:05 休憩
16:05 - 17:05 Cell を使った活用事例
(1)Ray tracing におけるCellの可能性
(2)NTTアドバンステクノロジー株式会社様
(3)株式会社ターボデータラボラトリー様
(4)半導体製造分野における活用事例
17:05 - 17:20 質疑応答
17:20 閉会の挨拶 日本マーキュリーコンピュータ 木村 兼
17:30 - 19:00 懇親会(18:30中締め)
・Cellのプログラミング手法や活用事例紹介のセミナーが、日本マーキュリーコンピュータシステムズ株式会社主催、日本アイ・ビー・エム株式会社共催で、11月10日(金)午後に下記のとおり開催されます。
・参加ご希望の方は、案内状・参加申込書に必要事項をご記入の上、お手数ですがファクシミリにてお申し込み下さい。
尚、申し込みの締め切りは、11月6日(月)とさせていただきますが、定員になり次第申し込みを締め切らせて頂くこともありますので、あらかじめご了承下さいませ。
とのことですので、お早めにどうぞ。
・開催概要
日時 :平成18年11月10日(金)13:30〜17:30 (13:00より受付開始)
会場 :青山テピア(東京都港区北青山2丁目8番44号) 4Fテピアホール
>>> http://www.tepia.jp/access/index.html
主催 :日本マーキュリーコンピュータシステムズ株式会社
協賛 :日本アイ・ビー・エム株式会社
定員 :150名
参加費:無料
プログラム:(同時通訳サービス付)
13:30 - 13:35 ご挨拶 日本アイ・ビー・エム
13:35 - 14:05 IBM Cell製品のご紹介、Cell BEプロセッサのアップデートと応用事例
日本アイ・ビー・エム
14:05 - 14:35 Cell BEのビジネスアップデートと応用事例
Randy Dean, VP, Mercury Computer Systems, Inc.
14:35 – 14:50 休憩
14:50 - 15:50 Cell開発ツール(ライブラリー)の紹介
- プログラミング開発を経験して(実践編)
日本マーキュリーコンピュータ 黒澤 晃
- Mercury Cell開発ツールの特長 John Brickman
Director, Mercury Computer Systems, Inc.
15:50 – 16:05 休憩
16:05 - 17:05 Cell を使った活用事例
(1)Ray tracing におけるCellの可能性
(2)NTTアドバンステクノロジー株式会社様
(3)株式会社ターボデータラボラトリー様
(4)半導体製造分野における活用事例
17:05 - 17:20 質疑応答
17:20 閉会の挨拶 日本マーキュリーコンピュータ 木村 兼
17:30 - 19:00 懇親会(18:30中締め)
2006年10月09日
●GEO Grid シンポジウム2006
・ 産業技術総合研究所主催のGEO Grid シンポジウム2006が今週水曜日(10月11日)に秋葉原ダイビルで開かれます。
・GEO Gridは産総研グリッド研究センターの研究プロジェクトのひとつで、地球観測衛星からのデータをデータグリッド技術を利用して安全で高速にユーザーに提供する実用化技術を目指し、グリッド・コンピューティングの分野ではよく知られているプロジェクトです。
シンポジウムのプログラムには、プロジェクトの紹介の他、San Diego Supercomputer Centerからの招待講演や事例の紹介、デモなどもあり、最近別の面でも注目されている衛星データですが、産業界がこうした衛星データを広く活用するための実用化技術の状況を理解する機会として興味深いシンポジウムだと思います。
・GEO Gridは産総研グリッド研究センターの研究プロジェクトのひとつで、地球観測衛星からのデータをデータグリッド技術を利用して安全で高速にユーザーに提供する実用化技術を目指し、グリッド・コンピューティングの分野ではよく知られているプロジェクトです。
シンポジウムのプログラムには、プロジェクトの紹介の他、San Diego Supercomputer Centerからの招待講演や事例の紹介、デモなどもあり、最近別の面でも注目されている衛星データですが、産業界がこうした衛星データを広く活用するための実用化技術の状況を理解する機会として興味深いシンポジウムだと思います。
2006年10月06日
● CellブレードQS20によるビジュアリゼーションのデモ
IBMリサーチの研究者が持ってきたCellブレードQS20によるVisualizationのデモを見ることができました。
・使ったシステムは、ブレードセンターシャシーに入っているCellブレードQS20 1枚 (cell BE 2個あり)、画像表示のためのNVIDIA Quadro FX 4500グラフィックスカードを入れたIBM IntelliStationとディスプレイ・モニター、そしてコントロール用PCという簡単なものです。
・画像デモは
(1)8つのキューブに絵柄の違うハンカチが一枚ずつ入っていて、これが独立にひらひら(?)舞うもの。物理的な計算とレンダリングを同時に行っているようです。マウスに追随してキューブも回転できる。
(2)水溜りのある床の上においてある自動車のレイトレーシングによる表示。マウスに追従してゆっくりと回転するもの。水面に車体が反射したりして非常にきれい。
(3)牧場に拡がった16,000羽の雌鳥が一羽の雄鶏に向かって集まっていく漫画的なアニメーション。拡大すると一羽ごとに個々の羽まで見える。この制作は一人が一週間でしてしまったとのこと。もちろん元になるプログラムはあったでしょうが、思ったよりプログラミングは簡単?
(4)フライトシミュレーション。ただこれはリアルのデモがたまたま見れず、PC上のムービーで、Mac G5とCellブレードを同時に表示したもの。
G5は0.9〜1 フレーム/secで表示されているが、Cellブレードでは32フレーム/sec前後で表示されるというもの。
ビジュアリゼーションの経験がないので専門的なことは言えませんが、自動車のレイトレーシング画像を見たときには、高々数百万円以内のシステムでここまでできるようになったのかと、隔世の感を覚えました。
来週京都で開催されるIBM インダストリアル・フォーラム京都 2006に参加される方は、たぶん同じようなデモを見ることができるかと思います。
・使ったシステムは、ブレードセンターシャシーに入っているCellブレードQS20 1枚 (cell BE 2個あり)、画像表示のためのNVIDIA Quadro FX 4500グラフィックスカードを入れたIBM IntelliStationとディスプレイ・モニター、そしてコントロール用PCという簡単なものです。
・画像デモは
(1)8つのキューブに絵柄の違うハンカチが一枚ずつ入っていて、これが独立にひらひら(?)舞うもの。物理的な計算とレンダリングを同時に行っているようです。マウスに追随してキューブも回転できる。
(2)水溜りのある床の上においてある自動車のレイトレーシングによる表示。マウスに追従してゆっくりと回転するもの。水面に車体が反射したりして非常にきれい。
(3)牧場に拡がった16,000羽の雌鳥が一羽の雄鶏に向かって集まっていく漫画的なアニメーション。拡大すると一羽ごとに個々の羽まで見える。この制作は一人が一週間でしてしまったとのこと。もちろん元になるプログラムはあったでしょうが、思ったよりプログラミングは簡単?
(4)フライトシミュレーション。ただこれはリアルのデモがたまたま見れず、PC上のムービーで、Mac G5とCellブレードを同時に表示したもの。
G5は0.9〜1 フレーム/secで表示されているが、Cellブレードでは32フレーム/sec前後で表示されるというもの。
ビジュアリゼーションの経験がないので専門的なことは言えませんが、自動車のレイトレーシング画像を見たときには、高々数百万円以内のシステムでここまでできるようになったのかと、隔世の感を覚えました。
来週京都で開催されるIBM インダストリアル・フォーラム京都 2006に参加される方は、たぶん同じようなデモを見ることができるかと思います。
● 製造業界向け HPC最新情報セミナー (IBM)
・製造業界向け HPC最新情報セミナーが、
・ 東京 2006年10月24日(火) 13:30〜17:00 (受付開始 13:00)
・ 名古屋 2006年10月25日(水) 13:30〜17:00 (受付開始 13:00)
で開催されます。
・「IBM Blue GeneとCellによるHigh Performance Computingの展望」や、
・ 秋葉 博氏(SC06のゴードン・ベル賞ファイナリスト)による「グリッド環境に最適な構造設計ソリューションADVCのご紹介」、その他グリッド・コンピューティングを活用した先進ソリューションなど合わせて5つの講演から成るセミナーです。
Faxで申し込みというのが今時ややレトロですが、ご興味のある方はぜひお出でくださいとの主催者からの伝言です。
・ 東京 2006年10月24日(火) 13:30〜17:00 (受付開始 13:00)
・ 名古屋 2006年10月25日(水) 13:30〜17:00 (受付開始 13:00)
で開催されます。
・「IBM Blue GeneとCellによるHigh Performance Computingの展望」や、
・ 秋葉 博氏(SC06のゴードン・ベル賞ファイナリスト)による「グリッド環境に最適な構造設計ソリューションADVCのご紹介」、その他グリッド・コンピューティングを活用した先進ソリューションなど合わせて5つの講演から成るセミナーです。
Faxで申し込みというのが今時ややレトロですが、ご興味のある方はぜひお出でくださいとの主催者からの伝言です。
2006年10月05日
● SCといえば小柳レポート
・ 今年東大を定年退官され4月から工学院大学の情報学部長になられた小柳義夫先生による「小柳レポート」はHPCの世界では有名すぎるレポートですが、1992年11月(第5回)のSupercomputing '92から去年11月のSC05 (第18回)まで欠席なしの記述内容は、すでに歴史的な価値のある記録になっていることがわかります。
・ 最初の1992年のレポートには、当時のSupercomputing'92の規模は日本で開催していたSupercomputing Japan (そういえばありました)よりも小さいとか、ETA社の社長のThorndike 氏が「最初にTFLOPSのMPPを作るのは実装技術のあるIBMだ」と言ったとか面白い話がレポートされています。
ちなみに最初の1TFLOPS達成は5年後の1997年に7,264プロセッサーを備えたIntel製のASCI Red(1.3TFLOPS)によってなされ、IBMがTFLOPSを越えてトップを取るのはさらに3年後の2000年11月、8,192個のPOWER3プロセッサーを持ったASCI White (4.9TFLOPS)の出現まで待たなければなりません。
・ この時までは日本製のベクトル・コンピューターが総力戦で世界を圧倒していた感がします。
・ Supercomputing 2000の小柳レポートには、このときBlue Geneと地球シミュレータの講演が多くの聴衆を集めていたとあります。今読むとMPPとベクトル・プロセッサーの決戦かという印象です。
・ そしてご存知のとおり、まず地球シミュレータ(36TFLOPS)が2002年にトップをASCI Whiteから奪還し、そして2004年にはBlue Gene/L(70TFLOPS)がトップに踊り出ました。両者ともに、国際会議で話したことをきっちり実現したなどということも小柳レポートからわかります。
HPCに関して量・質とも備わったこのようなレポートは世界でも例がないでしょう。すごいの一言です。
さてSC06も来月になってきました。契約ホテルの予約締め切りが近づいています。
・ 最初の1992年のレポートには、当時のSupercomputing'92の規模は日本で開催していたSupercomputing Japan (そういえばありました)よりも小さいとか、ETA社の社長のThorndike 氏が「最初にTFLOPSのMPPを作るのは実装技術のあるIBMだ」と言ったとか面白い話がレポートされています。
ちなみに最初の1TFLOPS達成は5年後の1997年に7,264プロセッサーを備えたIntel製のASCI Red(1.3TFLOPS)によってなされ、IBMがTFLOPSを越えてトップを取るのはさらに3年後の2000年11月、8,192個のPOWER3プロセッサーを持ったASCI White (4.9TFLOPS)の出現まで待たなければなりません。
・ この時までは日本製のベクトル・コンピューターが総力戦で世界を圧倒していた感がします。
・ Supercomputing 2000の小柳レポートには、このときBlue Geneと地球シミュレータの講演が多くの聴衆を集めていたとあります。今読むとMPPとベクトル・プロセッサーの決戦かという印象です。
・ そしてご存知のとおり、まず地球シミュレータ(36TFLOPS)が2002年にトップをASCI Whiteから奪還し、そして2004年にはBlue Gene/L(70TFLOPS)がトップに踊り出ました。両者ともに、国際会議で話したことをきっちり実現したなどということも小柳レポートからわかります。
HPCに関して量・質とも備わったこのようなレポートは世界でも例がないでしょう。すごいの一言です。
さてSC06も来月になってきました。契約ホテルの予約締め切りが近づいています。

