2009年04月01日

● Cell/B.E., GPU 三大プログラミング・コンテストの結果発表

3/30にNehalem-EPが正式に発表され、IBMが大々的にNehalem使用のSystem x サーバー群を発表したりと、いまそちらがホットなのかもしれませんが、それはさておき、HPCの主要テーマのひとつはなんと言ってもAcceleratorです。

そのCell/B.E.プロセッサーとGPUを対象にした3つのプログラミング・コンテストの結果が3月末にかけて主催者のホームページで次々と発表されました。

それぞれの主催者による講評にもありますが、入賞者のレベルは予想以上に(?)高く感じられました。Cell/B.E.プロセッサーやGPUのプログラミング・スキルを持つ層が確実に拡大・成長しているようです。その一方、Acceleratorという性格もあって参加者による性能のばらつきが大きく示される結果にもなっています。

こうしたコンテストの大事な価値として、コンテストの結果がスキルとして広く共有され、ユーザー層のボトムアップにつながるという期待がありますが、その点、特に入賞者による最適化レポートとソースコードが公開されているHack the Cell '09 の結果は私にとっては非常に刺激的です。そしてやはり社会人 (プロフェッショナル)は強い!

三つのコンテストの主催者、関係者のご苦労もしのばれますが、それぞれのコンテストから少し転載して並べて見ると下記のようになります。この分野は盛況になってきていますね。

Cell Challenge 2009 
(日本情報処理学会の三研究会 主催)

規定課題: 文字列の編集距離計算
参加者数:35チーム(みたところ完走は25チーム)
第1位: チーム(≧ω≦) 94点
第2位: チーム RunSeptet 88点
第3位: チーム konagayalab 54点

自由課題:
第1位:チーム 仙台電波高専 園田研究室
「Cellプロセッサにおける時空間パイプラインによるFDTD法の高速化」
第2位:チーム 電気通信大学 今村研究室
「Cell/B.E. による倍精度粒子法の高速化」
第3位:チーム itotlabo
「Cell Broadband Engine を用いた輪郭抽出処理の高速化」

GPU Challenge 2009
(日本情報処理学会の二研究会 主催)

規定課題: 文字列の編集距離計算
参加者数:43チーム 86名参加
第1位: チーム piyopiyo (東大)
第2位: チーム りんだ一人だ (長崎大)
第3位: チーム EEIC-T2 (東大)

自由課題:
参加者数:16チーム 33名
最優秀賞: チーム cube GTX
「GPUによる計算機合成ホログラムのソフトウェア開発」
奨励賞: チーム patternmatchers
"Online Approximate String Matching with CUDA"
奨励賞: チーム 防衛大学校情報工学科黒川研究室
「CUDAを用いたAESアルゴリズムcudaAESの開発と評価」

Hack the Cell '09
(株式会社フイックスターズ主催)

参加者数:160人(学生部門:68人、社会人部門:92人)
課題提出数:40人(オリジナルより10倍以上高速化した提出者数)

学生部門
1位: 福澤 太 (東工大) 82.2倍 (オリジナルからの倍率)
2位: 木下 正喬 (九工大) 68.1倍

社会人部門
1位: 菊池 正史(レピダム) 126.3倍
2位: 小寺 春樹 (-) 120.2倍

フィックスターズ賞
野村 達雄 (信州大) 60.9倍

cheer_hpc at 11:54|PermalinkComments(0)この記事をクリップ!一般 | イベント・セミナー

2009年03月26日

● 巨象も踊る (Who Says Elephants Can't Dance?)

・1993年から2002年春まで9年間異業種からIBM CEOに就任、IBMを再生させたルー・ガースナーの「巨象も踊る」(日本経済新聞社、2002年)をいまごろ読んでいます。IBM社員のときにはこういったものを読むのは当事者感覚が強すぎて敬遠していました。タイトルからはいつもダンボの映画の1シーンを連想していましたが、今読んでみると内容のある面白い本です。

・IBMが創業以来始めての赤字連続急増決算に転落し、マスコミが悲観的将来予想を書き立てていたさなか、ガースナーがCEOに就任しIBM再生を成功させたわけです。そうした危機の中 1993年2月にIBMへHPCにおける現在のポジションをもたらす導火線になった最初の超並列処理システム IBM SP1が登場し、その後大成功をおさめています。日本でそのSP1にかかわっていたせいか危機的状況をそれほど強く感じた記憶はないのですが、海外出張がそれまでのビジネス・クラスから一斉にディスカウント・エコノミーへと社内ルールが変わりこちらのほうがショックでした。

・「巨象も踊る」によるとIBM CEOの選考当時だれも引き受け手がいなくて、ビル・ゲーツの名が挙ったり、競合するIT経営者の助言を得ようとしたりと、IBMの未来は風前の灯(?)だったようです。当時絶好調のサン・マイクロシステムズのCEO、スコット・マクネリーがだれでもいいから「冴えない人物」を選ぶべきだと新聞記者に率直に語っていたとガースナーは書いています。

・おりしも、それから16年たった2009年3月、HPに断られたサン・マイクロシステムズがIBMに自社買い取りの提案をしたといううわさ記事がウォール・ストリート・ジャーナル印刷版で流れました。

・この本の中でガースナーは、「IBMの成功のうちかなりの部分が、持ち込まれた買収案件(コンパック、SGI等々)を断ったためであることに疑問の余地はない。」と強調したり、「売上げ高を増やせるが利益を増やせない買収を行わなかった」と総括していることから、もしガースナーだったらどういう結論を出すのか想像できる気がしますが、(このうわさ記事が本当だとした場合) ガースナーの後継者として高い信頼を得て就任したパルミサーノCEOははたしてどういう結論をだすのか。

cheer_hpc at 22:06|PermalinkComments(0)この記事をクリップ!閑話休題 

2009年03月18日

● 理研シンポジウム「第3世代 PC クラスタ」から

・独立行政法人 理化学研究所 情報基盤センターと次世代スーパーコンピュータ開発実施本部主催のシンポジウム「第3世代 PC クラスタ」が先週、和光本所 鈴木梅太郎ホールで行われましたが、その全講演資料が公開されています。

今年のシンポジウムは理研がRIKEN Super Combined Cluster (RSCC)を2004年6月に本格稼働(Top500 7位だった)してから5年経ち、今年8月に次期RSCC (RIKEN Integrated Cluster of Clusters (RICC)と呼称)が稼働を予定していることからひとつの区切りの時期になります。そうしたことから過去5年間を総括した内容発表に加え、T2Kの東京大学版について紹介がなされたこともあり、興味深いシンポジウムでした。

神戸ポートアイランドに次世代スーパーコンピューター用の建屋骨組みも姿を現わし、今年はシステム演算部の試作・評価の段階に入る計画になっていますが、その中で理研のRSCCとその後継システムRICCの役割
1. 次世代スパコンで計算するアプリ開発の場
2. 次次世代以降のスパコンへのハード・ソフト的なテストの場
3. 既存の利用者へ更なる高性能システムの提供
4. 理研内の新たな利用分野の開拓
とあり、今後さらに高度、広範囲な分野に渡った貢献が期待されます。

午後の前半ではGPGPUについて、性能評価などの講演がありましたが、RICCシステムの多目的PCクラスタ(100ノード)部分にはAcceleratorとして100個のGPGPUを搭載する予定とのこと (機種は今後発表される)です。

(追加) このシンポジウムの取材報告がマイコミジャーナルのレポートに紹介されていました。タイトルは少し混乱しているように見受けられますが、シンポジウムの内容が詳しく紹介されています。

cheer_hpc at 21:40|PermalinkComments(0)この記事をクリップ!イベント・セミナー | 一般

2009年03月13日

● 学士院賞、HPCで業績の矢川元基、渡辺貞両氏へ

・日本学士院は昨日2009年度の日本学士院賞に10人を選びましたが、HPC分野で優れた業績を顕彰して矢川元基 東大名誉教授(日本学術会議会員、東洋大学計算力学研究センター長・大学院教授)と渡辺貞 理化学研究所次世代スーパーコンピュータ開発実施本部プロジェクトリーダーが共同受賞となりました。

・個人的には、東大の原子力工学科で原子炉圧力容器の大規模構造解析で活躍されていた矢川先生という印象が強いのですが、近年はそれをさらに推し進めてマルチスケール・マルチフィジックス現象のコンピューター・シミュレーションのリーダー役なのはご存知のとおりです。

次世代スーパーコンピュータ開発のプロジェクトリーダー 渡辺貞氏はスーパーコンピューターのトップ・アーキテクトに贈られるCray Awardを過去に受賞されるなど、スーパーコンピューターの世界的設計者の一人として知られています。たしかCray Awardの受賞講演で「スーパーコンピューター開発から学んだ教訓 (Lessons Learned from the Development of Supercomputers)」として9個紹介されていましたが、メモを見ると、Lesson 1: Project should be led by a visionary with deep in sight and strong will rather than the consensus with committee と力強い言葉がありました。

伝統的な実験および理論研究が盛んな中で、両氏の受賞は第三の科学 (HPC)における業績が学会で高い評価を受けたと言えますから、これもたいへん画期的なことだと思います。おめでとうございます!!

cheer_hpc at 09:59|PermalinkComments(0)この記事をクリップ!一般 | ニュース

2009年03月10日

● HPC ASIA & APAN 2009 (高雄) 盛大掲幕

・ 先週の3月2日〜5日に台湾の高雄でHPC ASIA & APAN 2009が開催されていますが、その講演資料やプロシーディングが同サイトのAdvanced Programのサイトで公開されています。

・ 今回が10回目となるHPC ASIA 2009ですが、ホストは台湾のNational Center for High-Performance Computing (NCHC)です。日本は第7回のHPC Asia 2004にパレスホテル(大宮市)で開催、そのあと2005年に中国、2007年に韓国と続き、今年が台湾開催でした。

・台湾は以前からHPCに熱心でしたが、加えてDeep Blueを開発したHsuさん、最近ではBlue Geneを開発しているChiuさんなど、台湾出身の研究者が米国で活躍しています。

・イベントの初日はTutorialなので、論文発表は正味3日間ですがプロシーディングには産総研、東工大、慶応大、九州大、九州先端研、理研のHPC関連の発表が見受けられます。

・ キーノートにはTOP500などでよく知られているJack Dongarraの他に、いまHPCのホットな話題であるBlue Waters projectのDeputy DirectorになったWilliam Kramer (前はNERSCのGeneral manager)、Top500でアジアのトップになったDawning 5000のZhiwei Xu、そして20 PetaFLOPSを目指すASC Sequoiaを手がけているMark Seagerも講演をしています。

講演資料を見る限りでは内容に特別目新しいものはないようですが、Blue Waters Projectの5人のLeadership teamの顔ぶれがRob Pennington (去年の秋に来日)から今回のスピーカー William Kramerに、そしてEdward SeidelからWillian Groppへと変わっていました。


余談ですが、今年から1年に2回TOP500のアジア版「TOP500 Asia」を発表するということがアナウンスされています。主旨はTOP500に載ることができないアジア、中東の小規模HPCサーバーを把握するということのようです。こちらのTOP500リストはリヤドとドバイで開催されるGITEXで発表と、本家とはちょっと違う趣きです。

cheer_hpc at 11:37|PermalinkComments(0)この記事をクリップ!一般 | イベント・セミナー

2009年03月04日

● 新地球シミュレータES2と新プラズマシミュレータ

ここ1、2週間の間に海洋研究開発機構(JAMSTEC)の地球シミュレータ後継機(ES2)と、核融合科学研究所(NIFS)の新プラズマシミュレータ
のふたつの大きなスーパーコンピュータの稼働が発表されています。ES2は地球シミュレータと同様ベクトル型スーパーコンピュータNEC SX-9/E、新プラズマシミュレータはIBM POWER6プロセッサー搭載のHitachi SR16000 model L2で、最近急増の汎用目的の価格性能比の高いコモディティ・ベース・クラスターとは異なるシステムとなっています。

両シミュレータとも、はじめから主要アプリケーションが明確でメモリ容量やバンド幅などの性能に対する要求がはっきりしていること、既存の主要ソフトウェアやプログラム・ノウハウの継承が重視されると言ったことなどからも、こうしたアーキテクチャのスーパーコンピューターが高評価されたのだろうと思います。

それぞれのシステムの仕様を定量的に対比してみるとおよそ次のことがわかります。

・CPUコア当りの浮動小数点演算性能はSX-9のベクトル型がPOWER6より5倍以上速い。(SX-9のコアには8個もベクトルユニットが入っているので当然)
・メモリ・バンド幅もSX-9が大きく、演算当りのメモリ転送量 (Byte/FLOP)がキャッシュがないため一定し、2.5と驚異的に大きい。
・SX-9はそのための物量が大量投下されているためか、電力当りのピーク性能が低いのでエコとは言えず、価格も高い。
・ノード当りのピーク性能はES2が約820 GFLOPS、新プラズマシミュレータ(SR16000)が約600GFLOPSとCPUほどの大きな差はない。1 TFLOPSには達していない。
・POWER6搭載のSR16000はデータがキャッシュ上にあるかどうかにより演算当りのメモリ転送が0.21 〜4 (Byte/FLOP)と振れる。
(高性能を出すためにはキャッシュを意識したプログラミングが必要)
・SR16000の電力当りのピーク性能はSX-9の3倍以上の102 MFLOPS/W。
(Green500で上を見れば、Blue Gene/Pで372、さらにCell/B.E.搭載Bladeサーバー IBM QS22の536というのが現在のトップレベル。Xeon Quad coreサーバーでも200 MFLOPS/W強)
・従来からの空冷のSX-9に対し、SR16000は熱除去効率の高い直接水冷式を採用。

(ここで対比の便宜上、公表データの欠けているところは、ES2 (NEC SX-9/E)が、SX-9 モデルAと同じ仕様と仮定し代用。また、Hitachi SR16000については仕様が酷似しているIBM p575と同じ仕様と仮定し、POWER6の公開資料で代用。
**マークが代用した値です。間違っていたらごめんなさい)

● ES2 (NEX SX-9/E)

(システム)
- ベクトル・ピーク性能: 131 TFLOPS、20 TB メモリ、Fat-tree Network
- ノード数: 160
- 空冷
- 電力当りのピーク性能: **約27.3 MFLOPS/W (819.2 GFLOPS/30 KVA)
- OS: NEC SUPER-UX
- 工費+6年間リース料: 約189億円(朝日新聞の記事による)

(CPU)
- ベクトル・ピーク性能 102.4 GFLOPS (3.2 GHz クロック)
- 8 ベクトル・ユニット + 1 スカラー・ユニット
- 32 ポート Memory port crossbar
- 65 nm CMOS 11銅配線レイヤ

(ノード)
- ベクトル・ピーク性能 819.2 GFLOPS
- CPU/node: 8
- メモリ/node: 128 GB (SMP構成)
- メモリ・バンド幅: **2,048 GB/s (8 CPU)
- Byte/FLOP: **2.5
- ノード間転送性能: 128 GB/s (8 GB/s x 8 x 2)

● 新プラズマシミュレータ (フェーズ1: Hitachi SR16000 model L2)

(システム)

- ピーク性能: 77 TFLOPS、16 TB メモリ、InfiniBand Fat Tree Network
- ノード数: 128
- 外部記憶容量: 0.5 PB
- 直接水冷
- 電力当りのピーク性能: 102.1 MFLOPS/W
- OS: IBM AIX5L
- 落札価格: 約54億円 (文科省公示による。フェーズ2 (2012/10〜2015/3)では315 TFLOPSへ性能アップ)


(CPUチップ)

- チップ・ピーク性能: 37.6 GFLOPS (Dual core)
- Dual core POWER6プロセッサ (4.7 GHz クロック)
- 32MB L3キャッシュ
- 8 channel メモリ コントローラ (DDR2/DDR3)
- 65 nm CMOS 銅配線 + SOI

(ノード)
- ピーク性能: 601.6 GFLOPS
- CPU core/node: 32
- メモリ/node: 128 GB (**32 way cc-NUMA SMP)
- メモリ・バンド幅: **128〜160 GB/s (**4〜5 GB/s x 32 core)
(ただしデータがL2キャッシュやL3キャッシュにあるときにはこの値を大きく上回る。ほぼ一定値となるベクトル・プロセッサーとは振舞が異なる)
- Byte/FLOP: **0.21 (メモリー上にデータ)〜4 (L2キャッシュ上にデータ)
- ノード間転送性能: 32 GB/s (双方向)

ちなみにメモリーとストレージは小さめになりますが、気象予測で有名な米国NCARのBLUEFIREは、ピーク性能76.4 TFLOPSと新プラズマシミュレータと同様のピーク性能を持ったIBM p575システムになります。



単純にピーク性能/価格をものさしにすればコモディティ・ベース・クラスターがベストな選択になるのでしょうが、HPCでは利用アプリケーションに対する実際の性能や価格に加え、大型化により信頼性(MTBF)、所要電力、スペース性もいっそう重要視されてきているので、利用者のものさしにあわせた選択ができるような複数アーキテクチャのスーパーコンピュータが存在することは大変重要です。

言うは易くですが、1985〜1995年ころに日本製ベクトル・スーパーコンピュータの性能にきりきり舞いさせられた経験からは、価格や電力消費といった弱点にチャレンジし、他では得難いベクトル・アーキテクチャの利点をユーザーに受け入れられ易くするということが今後必須のイノベーションではないかと感じます。


cheer_hpc at 23:57|PermalinkComments(0)この記事をクリップ!一般 | ニュース

2009年02月26日

● 3月のHPC関連のセミナー

花粉も今のところ思ったより少ないし、なにより心配されていたインフルエンザもパンデミックにならず、感染症関係者のかたはほっとして3月を迎えられるのではないでしょうか。

さて3月のHPCに関係したセミナーについて、知っている範囲をかけあしで日付順にリストします。

・先駆的科学計算に関するフォーラム2009
分子科学計算「研究報告及び紹介と新システムの紹介」

 
開催日時: 3月9日(月)13時00分〜
会場:九州大学情報基盤研究開発センター3階 多目的講習室

大学からの発表に加えて、企業からはバイオベンチャー創成期から続いている株式会社ワールドフュージョンの緑川 淳氏の講演、「分子設計支援システムSYBYLでのDocking 計算」があります。

詳細 http://www.cc.kyushu-u.ac.jp/scp/users/c_news/2008/158.html#1

・理研HPCシンポジウム

開催日時: 3月12日(木)午前10時00分〜
(懇親会 午後5時40分〜午後8時)
会場: 独立行政法人 理化学研究所 和光本所 鈴木梅太郎ホール

今年度は、「第3世代 PC クラスタ」がテーマとなっています。

詳細 http://accc.riken.jp/HPC/Symposium/2008/index.html

また、 RIKEN BMT コンテストも健在で、今年のべンチマーク問題は、非圧縮性流体の Poisson 方程式ソルバー Poisson FDM-BMTと、Hartree-Fock MO(Molecular Orbital)法における二電子積分計算ソルバー ERI MO-BMTのふたつです.

詳細 http://accc.riken.jp/HPC/Symposium/2008/bmt.html

・ PCクラスタワークショップin大阪

開催日時:3月13日(金) 10:00 - 17:45
会場: 富士通株式会社 関西システムラボラトリ
申込締切: 3月6日(金)

大阪で開催されるPCクラスタコンソーシアム主催の、クラスタに関するワークショップです。高性能並列プログラミング環境SCoreの最新リリースSCore7の紹介はじめ、盛りだくさんな内容です。

詳細 http://www.pccluster.org/event/workshop/pcc2009osaka/

PC クラスタコンソーシアムも並列プログラミングコンテスト − SACSIS2009 併設企画のクラスターシステム上での並列プログラミングコンテスト −の参加者受付中です。参加登録の締め切りが3月2日に延長されていました。プログラミング期間は3月4日から4月14日です。

詳細 https://www2.cc.u-tokyo.ac.jp/procon/


・ 2009年第1回並列・チューニング講習会

開催日時
(1) MPI並列プログラミング講習会 (3月26日(木) 9:30〜17:30)
(2) チューニング講習会 (3月27日(金) 9:30〜15:00)
(3) MPI並列プログラミング講習会 (4月2日(木) 9:30〜17:30)
(4) チューニング講習会 (4月3日(金) 9:30〜15:00)
会場: 理化学研究所(和光本所)

講師は、理化学研究所 情報基盤センターの青山幸也氏。単にMPI並列プログラミングについての講習ではなく、スカラー・プログラムの高速化チューニングと、MPI並列プログラミングのふたつについておこなっている実践的なところがみそです。これも長寿命の講習会です。実質20年近く続いているのでは?

詳細 http://accc.riken.jp/HPC/training/2009-1.html


蛇足ですが、海外では

・ HPC User Forum - April 20 to 22, 2009 - In Roanoke, VA

調査会社IDCが運営しているHPC User Forumです。

詳細 http://www.hpcuserforum.com

・ISC'09 - Hamburg, Germany  June 23-26

毎年6月のTop500が発表されるISC'09のonline registrationが3月2日から始まります。企業からの参加者は、参加費900 EUR。ユーロ安といってもけっこうな金額(今日現在で約11万5千円)です。

詳細 http://www.supercomp.de/isc09/

cheer_hpc at 12:08|PermalinkComments(0)この記事をクリップ!イベント・セミナー | 一般

2009年02月23日

● 米景気刺激策成立で研究者が議会へ拍手かっさい

強力な科学技術投資を盛り込んだ米下院の景気刺激策予算案に対抗して上院が大幅な削減案を提示したことで一時はどう決着するのか見えなくなりましたが、コンピューターやHPC関係の研究者にとってハッピーな内容で議会を通過しています。この景気刺激策はオバマ大統領が2月17日に署名して発効になりましたが、2月13日のComputer Research Association (CRA)の policy blogがこのことで議会を称賛しています。1月15日の下院案提出から2月17日の発効までわずか1ヶ月でした。

・ ご同慶の至りと言いたいところですが日本は要約にあるような内容の2009年度政府予算案が関連法案と合わせて衆院を通過しそうだと、やっと今日報道される段階ですからあいかわらず日米の意思決定プロセスのスピードの違いが目立ちます。

・CRA policy blogが議会を称賛した理由は、National Science Foundation(NSF), Department of Energy(DOE)のOffice of Science, National Institute of Standards and Technology(NIST)などの中核国立研究機関に対する70億ドル(約6,500億円)強の補正予算を含む景気刺激策を下院・上院が合意したからと言っています。

(景気刺激策全体では7,870億ドル(約72兆円)。米国の2009会計年度(2008年10月〜2009年9月)の予算は約3兆ドル(約276兆円)ですから、景気刺激策は補正予算といえます)。

総額で150億ドル(約1.4兆円)を超える景気刺激策の科学研究投資の内訳は:
NSFに30億ドル(約2,800億円)、DOE Office of Scienceに16億ドル(約1,500億円)、NISTに5.8億ドル(約550億円)、NASAに10億ドル(約920億円)、そして医療・ライフサイエンスのNIHが85億ドル(約8,000億円)などとなっています。


これもCRAの「Action Alert!: Stimulus Headed to Conference!」に応えてメンバーが直接議員にFAXなどで強く要請した結果のあらわれなのでしょう。イノベーションの米国のことですからこの勢いをかってとんでもない新規大型プロジェクトが出現するのかも・・・




cheer_hpc at 11:55|PermalinkComments(0)この記事をクリップ!一般 | ニュース

2009年02月18日

● ヨーロッパ初の1PetaFLOPSシステムがドイツに

・ドイツのユーリッヒにあるヨーロッパ最大規模級の研究センター、ユーリッヒ研究センター(Forschungszentrum Juelich)がヨーロッパ初の1PetaFLOPSシステムを今年前半に導入します。ユーリッヒ研究センターにはすでにヨーロッパ最速のIBM Blue Gene/PのJUGEN (ピーク性能222.82TFLOPS、Top500の11位)が動いていますが、新システムはこのIBM Blue Gene/Pの72ラック・フル構成、ピーク性能が1PetaFLOPSというものです。

・新しい点としてはBlue Gene初の水冷技術を使用してユーリッヒのデータセンターの空調ユニットの個数を91%削減しています。

・このシステムの名称は今年半ばのオープニング・セレモニーでお披露目されるそうです。ちなみにいままでの名前は JUBL (Juelich Blue Gene/L) → JUGEN (Juelich Blue Gene/P)、そして → JU?? (Juelich Blue Gene/P Full System)。

主な仕様は、つぎのとおりです。
Processors: 294,912 Processor
Type: PowerPC 450 core 850 MHz
Compute node: 4-way SMP processor
Memory: 144 Terabytes
Racks: 72
Network Latency: 160 Nanoseconds
Network Bandwidth: 5.1 Gigabytes
Energy consumption: 2200 Kilowatts

・ユーリッヒ研究センターでは、他にも日本も深く関係しているITER核融合実験炉の研究用にピーク性能100TFLOPSのHPC-FF(for Fusion)の導入を決めています。HPC-FFはフランスBull社がインテグレートし、2.93 GHzのNehalem EP Quad Coreプロセッサーを8,640個、イスラエルのMellanox社Infiniband ConnectX QDRを使用した水冷クラスター・システムです。 既存のJuRoPA 200TFLOPSシステムと結び合計300TFLOPSのピーク性能になります。

・ちなみに、ITER(イーター)とは2018年に運用に入る500MWの国際熱核融合実験炉で、EU, 日本, 米国, 中国, ロシア, インド、韓国のコンソーシアムによって南フランスのカダラッシェに建設されます。


ドイツ(EU)はアメリカの1〜2年遅れでHPCのトップクラスのシステムを導入していることになり、だいぶ前に比べるとかなりの予算をHPC分野にかけてきていることがわかります。日本はいまのところT2Kの東大クラスター・システムの140TFLOPSが最速で、今年中に200TFLPSを超えるシステムの導入はなさそうですから、しばらくはドイツ(EU)の背中も見なければならないという、あまり楽しくない状況が続きます。

cheer_hpc at 20:51|PermalinkComments(0)この記事をクリップ!ニュース | 一般

2009年02月17日

● オーストラリアの大森林火災と大洪水

・先週半ばから予定どおり、オーストラリアの北東にあるケアンズに滞在してきました。この時期、熱帯性気候の雨季にあたるため降水量が多いのは当たり前ですが、今年は特別で、ケアンズがあるクイーンズランド州の北部の川が氾濫しワニ(オーストラリアのワニは獰猛なクロコダイル)がどこかの町の住宅地にまで流れてきたそうです。

・ケアンズも南からの幹線道路が水没したため輸送トラックが来れず、スーパーマーケットでは野菜がなくなってしまいました。さいわい滞在前日に幹線道路が開通したため、滞在中は物も豊富、町並みもきれいな状態で大洪水の影響はまったく感じることができませんでした。TVの天気予報は曇・雷雨の予報を毎日流しつづけていましたが、実際はよい天気でした。お天気には日本ほど頓着しない国なのかもしれません。

・一方オーストラリアの南東部(ビクトリア州)では100年に1度という大森林火災(TVではブッシュファイアと言っていた)が続き、ついに陸軍も出動しました。地元ABC TVが毎朝「依然Uncontrolled」と言っていたのが印象に残ります。

・オーストラリア南東部にはコアラの好むユーカリの木が多く、この葉っぱは油分を多く含みます。適当なブッシュファイアはオーストラリアの自然現象(ユーカリの種はブッシュファイア時の高温によっ発芽するとか)だそうです。ただ、これだけ火災規模が大きくなり全財産や生命を失った人の数が多いのと、当局の警告や対応が遅れたことなどから社会的な問題にもなっていくようです。

なぜ厳しい旱魃がオーストラリア南東部で起こっているのか知るキーワードが、インド洋ダイポールモード現象 (Indian Ocean Dipole (IOD))です。IODは1999年に地球環境フロンティア研究センターの山形プログラムディレクタ(当時)らが発見しネーチャー誌に発表しています。
また2007年には地球シミュレータを使用して、インド洋のダイポールモード現象の予測に世界で初めて成功しています。

・こうした研究結果をオーストラリア政府がどれだけ理解して旱魃対策を進めたかが、今年のような大森林火災で被害軽減に結びつくわけですが、残念ながらすでに答は見えてしまったわけです。


たぶん冒険旅行になるだろうと覚悟して行ったのが、実際は拍子抜けしたケアンズ滞在でした。

唯一のトラブルは、帰りの飛行機(格安と言われているJetStar)。出発が6時間近くも遅れ、到着が深夜になるため成田に降りれず関空着となってしまいました。その夜は関空のホテルニッコーに泊められ月曜朝に羽田便に乗って帰ってきました。格安運賃なのにホテルニッコーの宿泊費や羽田便の金額まで負担したらたぶん赤字でしょう。高い信頼性が経済性からも大事というよくある例に遭遇してしまいました。


cheer_hpc at 11:39|PermalinkComments(0)この記事をクリップ!閑話休題 

2009年02月09日

● 景気刺激策(科学技術)での米国下院・上院の攻防

・先のブログにも書きましたが、1月15日に発表された民主党下院主導の景気刺激策では潤沢な科学技術予算配分が織り込まれていました。ところが1月26日に発表された景気刺激策の上院案では大幅に削減する案になったため科学技術予算配分も気前のよいものではなくなる可能性が出てきました。

・Computing Research Association (CRA)のブログによると、これに危機感を持って2月2日にCRAの会員に対して下院議員に陳情FAXをするように要請しています。

・2月6日にはマイクロソフトのCEOのSteve Ballmerが、House Democratic Caucus Retreat(民主党下院幹部会議保養施設?)で科学・技術・教育と基礎科学、そして科学技術のインフラへの投資の支援を依頼する演説をおこなっています。Steve Ballmerのこの演説はマイクロソフトのサイト:Steve Ballmer's Comments at Democratic Caucus Retreatで読めます。しっかりした内容で、好評な理由もわかります。

・こうした巻き返しが効を奏したのでしょう、$3B(約2,800億円)の下院案にもかかわらず先週の土曜日には0になると報道されていたNSFの増加予算分は$1.2B(約1,000億円)と持ちこたえ、DOEのOffice of Sciencesの増加分$430M(約390億円)も$330M(約300億円)、NISTの増加分も$595M(約535億円)が$495M(約450億円)と回復しています。

・先週末のCRAブログでは、今後上院の投票が火曜日に行われた後に下院で差額折衝がなされ、2月16日のワシントン誕生日(President Day)までにはまとまると期待しています。これで潤沢な下院刺激策の予算案ほどでないにしても、米国のHPC大型予算を握るNSF、DOE Office of Sciencesなどは景気刺激策の恩恵にあずかれそうです。


たしかにその国の研究機関や大学の科学技術分野の高い能力は、CRAやBallmerが指摘するように国の成長にも大きく影響するでしょうが、一方では1990年前後にGM Research(GMR)という自動車業界で飛び抜けた水準の研究所を持っていたGMがなぜこうも没落してしまったのかと考えるといろいろ興味深いものがあります。米国IBMにいた知人のCFD専門家がこのGMR出身で優秀な人間でした。


cheer_hpc at 22:28|PermalinkComments(0)この記事をクリップ!一般 | ニュース

2009年02月04日

● 「Cray CX1体験セミナー」から

・ 1月27日の午後に秋葉原コンベンションホールでクレイ・ジャパンの主催によるCray CX1体験セミナーがありました。Cray CX1は去年11月のSC08のCray社ブースの床に何気なく転がっていたのを見てから興味を抱いていたシステムです。

・ フリーになったのをよい機会に、このセミナーに出席させていただきました (この業界は、競合他社のセミナー参加はお互いにお断りというケースが多いのです。とはいえ、今回は古いおつきあいの中野クレイ・ジャパン社長のご好意に多謝)。

・当日のプログラムはCX1にちなんだわけではないでしょうが、次のようにオール・イン・ワン構成のためかけあし気味の進行でしたが、わかりやすい内容でした。当日は130名収容の会場も満員になる盛況で、Acceleratorありのパーソナル・スーパーコンピューターについては様々な関心がもたれたのかもしれません。

(プログラム)
- HPCの今後の動向 (クレイ・ジャパン)
- CX1概要説明とそのアドバンテージ (クレイ・ジャパン)
- CUDAによる並列コンピューティング:序章 (NVIDIA Japan)
- CX1のデモ 
(1) Cray CX1ジョブランチャーによるScryu/TetraとLS-DYNAの運用 (クレイ・ジャパン)
(2) Windows HPC Server 2008上でのSCRYU/Tetraデモ (ソフトウェアクレイドル)
(3) LS-DYNAデモ (JSOL)
- CPU情報と最新ロードマップ (インテル)
- マイクロソフトのHPCへの取り組み (マイクロソフト)

・ Cray CX1自体は、100Vで稼動可能の一般的なブレード・サーバーの形式で、ブレードには計算ブレード(2モデル)、ストレージブレード(2種類)に加えNVIDIA QUADRO FXシリーズ、TESLAを搭載するグラフィックス・ブレードが用意されています。当日配布されたシステム構成例のパンフレットによると4ブレードの構成でキャンペーン価格が数百万円ですから、ワークグループ・サーバーの価格帯です。数億円以上のスーパーコンピューター・システムで実績のあるCray社が、HPCの最小価格帯のワークグループの製品を提供するというのは意外性があります。今後もインテルやNVIDIA、マイクロソフトと協力しながら強化改良を続けていくことになるようです。

NVIDIA社による講演ですが、TESLAはプロ用の高価なQUADROからグラフィックスを除いたものなのでだいたい半額で提供できている。(その後にはコンシューマー用のGEFORCEによる膨大な販売台数からの売り上げがある)。性能は18ヶ月で2倍向上が目標で、倍精度計算の機能も昨年11月に付加しているということです。Cell/B.E.におけるPS3もそうでしょうが、コンシューマー製品がバックにあるTESLAの低価格の魅力には抗しがたいものがあるようです。

・ またGPU開発環境であるCUDAのダウンロード人数はすでに12万人を超えたということで、CUDA ZONEに紹介されている事例発表が、そのあたりの盛んな開発状況を表しています。

・国内CAEソフトウェア・ベンダーのソフトウェア・クレードルによるSCRYU/TetraのデモはエンジンのインテークマニホールドからシリンダーにかけてのCFD計算をしたもので、18万要素では8コアまで、100万要素〜800万要素では16コアまでほぼスケーラブル (16コアで1コア時の約10倍の性能。InfiniBand使用。100万要素以上では要素数にはほとんどよらない結果)。

JSOL(旧日本総研ソリューションズ)によるLS-DYNAのデモでは自動車衝突解析の標準問題(Neon refinedと3 Vehicle Collision)について、32コアまでスケーラブルな結果を示していました (後者のケースで32コア使用時に26.8倍 (IB使用)、23.7倍(GbE使用))。

・高速低遅延のIB使用時と低速のGbE使用時の性能差が少ないのが目立ちますが、これはSCRYU/Tetraのときも同じだったので両ソフトとも並列化チューニングが上手に行われていて通信が最小限になっているのかもしれませんが未確認です。



今のHPCプラットホームの動向から見れば、これらの代表的な市販CAEソフトウェアが1,024コア程度まで良好なスケーラブル性能を示してくれて、ライセンス料金も1,000コア以上の大型並列システムでも利用しやすいものになれば製造業でのHPCの利用はもっと大規模化され、その内容も変ってくると思うのですが・・・。


cheer_hpc at 17:30|PermalinkComments(0)この記事をクリップ!一般 | イベント・セミナー

● DOEが20PetaFLOPSシステムをIBMに発注

・米国エネルギー省 (DOE)のNational Nuclear Security Administration (NNSA)が2月3日付けで、セコイア(Sequoia)と呼ぶ20PetaFLOPSのシステムをIBMに発注したと発表しています。設置場所はいまBlue Gene/Lが稼動しているLawrence Livermore National Laboratory (LLNL)です。

・IBMが次世代Blue Geneテクノロジーによる20PetaFLOPSのセコイア(Sequoia)システムを2011年に据付を開始、2012年に利用できるようにするとしています。その前座としてDawnと呼ぶ500TFLOPSのBlue Gene/Pを今年3月末までに導入し、数PetaFLOPS級の大規模計算アプリケーションの基礎がために利用します。

日本の次世代スーパーコンピューター開発・利用プロジェクトの完成予定は2011年度末ですので、性能、稼動開始時期ではたがいに競い合う関係になりました。

・発表によるとセコイアの構成は、メモリー1.6 petaバイト, 96 ラック, 98,304 計算ノード, そして160万コアです。Blue Gene/Qといわれていたものが基本になると思いますが、2012年にはいよいよ100万コアを超えるシステムが登場するわけです。アプリケーション側から見てなかなかイメージしにくくなってきています。

・米国も下院が大規模な景気刺激策を出したことは以前紹介しましたが、国立天文台の小川さんによると、下記の比較に示されているように上院案では大幅減額(特にコンピュータ関係)とのことです。これを見ると今後も順調に進むのかどうか、まだまだ目が離せません。
http://www.cra.org/govaffairs/blog/archives/comparison_chart.html

・米国中心のHPC分野ですから、今年いろいろな変化が起こっても不思議でない気がします。

(初稿では下院(House)と上院(Senate)が入れ違っていたので訂正しました)

cheer_hpc at 09:36|PermalinkComments(0)この記事をクリップ!ニュース | 一般

2009年01月30日

● Cell/B.E.に加えてGPUのプログラミング・コンテストも

・1月28日が参加申し込み締め切りだったマルチコア・プログラミング・コンテスト Cell Challenge 2009ですが、今回の規定課題は「文字列の編集距離計算」です。実行速度の順位で得点を与え、予選ラウンドと決勝ラウンドの合計得点で優勝者を決定するコンテスト形式で、決勝ラウンドは3月20日が終了日となっています。

・主催が情報処理学会のHPC研究会など3研究会、協賛がCell/B.E.の開発を担った企業4社と北九州産業学術推進機構(FAIS)なのは昨年と同じです。

・ことしはこれに加え、新たにCell Challenge 2009併設企画としてGPU Challenge 2009の参加募集が1月21日から始まっていました。こちらの協賛はGPU活用でも先陣を切った東京工業大学学術国際情報センター (GSIC)やエヌビディアなどです。

GPU Challenge 2009の規定課題は Cell Challengeと同様,「文字列の編集距離計算」で、GPU Challenge 2009実行委員会が用意するNVIDIA社GPU(Tesla S1070-400相当) を搭載した計算機で,CUDAプログラミング環境を用いてプログラムを作成する形式をとっています。規定課題については東京工業大学学術国際情報センター(GSIC)に設置されたNVIDIA GPU搭載計算機を利用することになっていますが、自由課題部門では各自用意の計算機も利用可能です。

・参加申し込み締め切りは2月13日、プログラム提出締め切りが3月25日です。

・上記と時期的に重なりますが、Cell/B.E.トータルソリューションカンパニーに向けて実績を積み重ねてきた(株)フィックスターズが独自にHack the Cell 2009というCell Programing Contestを実施しています。こちらの参加申し込み締め切りは明日1月31日、課題提出締め切りが3月6日です。

Hack the Cell 2009の課題は、「メルセンヌ・ツイスタの最適化」です。

・学生部門の優勝者の賞品は、同社奨学金優先枠60万円/年とサンフランシスコ5日間ペアご招待(期間限定)という力の入ったものです。

・Cell/B.E.のような高性能プロセッサの能力を最大限引き出すことができる優れたプログラマの数は明らかに不足し、同時にその能力を発揮する機会のないまま埋もれているプログラマも多数存在するのを深刻な問題と捉え、このような優秀なプログラマの活躍が賞賛される場を設けることに意義があるという同社CTOのメッセージに共感する方は多いのではないでしょうか。



さて課題の「文字列の編集距離計算」や「メルセンヌ・ツイスタの最適化」と言われてもピンとこない私にはコンテストに参加する資格はないのですが、1994年から数年続いていたJSPP Parallel Software Contest (PSC)のメーカー側委員の末席にいた者としては、いかにコンテスト用の問題作りが手間のかかる作業か、非日常のコンテスト利用環境を提供・管理することがどれだけ提供者の負担になるかなどを推察できるだけに、主催者の熱意と努力に脱帽あるのみです。



cheer_hpc at 10:14|Permalinkこの記事をクリップ!一般 | イベント・セミナー

2009年01月26日

● ドイツの気象研究機関でIBM iDataPlexサーバーが稼動開始

・ 30TFLOPSのIBM iDataPlexサーバーがドイツの気象研究機関であるPotsdam Institute for Climate Impact Research (PIK)(ポツダム気候影響研究所)で稼動を始めました。

Potsdam Scientists to Tackle New Type of Weather Simulations with IBM iDataPlex

・ iDataPlexに決定した主な理由のひとつが、概算値で230MFLOPS/Wとx86クラスターのトップ10に入るエネルギー効率の高さにあったとあります。

・ IBMはだいぶ前から“Big Green”というイニシャティブを始めていますが、iDataPlexもその一環として水冷熱交換によるリアドアはじめHPCの環境やニーズに合わせたユニークな特長を持っています。x86プロセッサーによるコモディティ・クラスターの中でももっと認識されてよいサーバーですが、わかりやすい解説があまりないようです。

・ その中で、Linux MagazineのHPCエディター Douglas Eadlineが、ニューヨークのIBM Wall Street Center of Excellenceを訪問したときの体験によるくだけた解説(英文)をしています。

Doug Meets The iDataPlex
(ダッグ、iDataPlexに出会う)

・ 最初、IDataPlexがLarge Scale Internet Data Centerの意味だと聞いて、HPCの自分は場違いのところに来てしまったかもしれないと心配するところから始まって、IBMの相手と一問一答しながら、サーバー・ノードについて

This was obviously not your typical 1U server node. Indeed, it was almost like someone ask a group of HPC users to design a node. (HPC用そのもののノード設計だ)

と感想をいいつつ、低電力ファンやケーブリングについての会話、コモディティ・パーツの組み合わせの妙、省エネ、価格性能比やTCO (Total Cost of Ownership) といった内容が続きます。

・ 最後に、

Instead of calling it the “iDataPlex for Web 2.0″, they should have just called it the “iDataPlex for HPC 2.0!”

と言って終わっています。
この感覚は私とも通じるところがあって、IBMのiDataPlexの取り上げ方にはもっとHPC側のウェイトを増す必要があります。

cheer_hpc at 12:03|Permalinkこの記事をクリップ!一般 | ニュース