2007年12月
2007年12月28日
●専用システムか、それとも汎用システムか?
・次世代生命体統合シミュレーション研究開発プロジェクトのシンポジウムの続きになりますが、医薬品メーカーの方がMO(Molecular Orbital Method)専用機(Special Purpose Computer)もあるといいなというコメントをしていました。その心は、MO計算が超高速かつ少ないコストでできるようになると創薬研究におおいに役立つということだったと思います。MD(Molecular Dynamics)専用機 MDGRAPE-3の開発者の泰地さんに直接うかがったところではMO専用機も技術的には可能ということでした。
・このように専用機というのは圧倒的高性能とコスト・パフォーマンスとが両立するので常に引きつける魅力があります。
・対する汎用機(General Purpose Computer)ですが、その代名詞が360度オールラウンドに使えるコンピューターとして1960年代に発表されたIBM System/360です。それ以前は科学技術計算向けのコンピューターと、商用向けのコンピューターが別々に開発されてきましたが、S/360があっという間にシェアを獲得し、科学技術計算向け、商用向けともに汎用機に吸収されてしまいました。
・その後もアレイ・プロセッサーのような実験的なシステムやQCD専用機などが企画・製作されたものの専用機の大半が短寿命で衰退してしまったのは、やはりある程度汎用性のあるものでないと開発投資が続けられず、そのうちに専用機としての競争力が失なわれてしまったという現実があるのでしょう。
・その中でも比較的長い間生き残ってきたのがベクトル型コンピューターですが、これも2007年11月のTop500リストによるとシェア0.8%へと衰退してしまいました。
一方、汎用機の代名詞だったメインフレームも、絶対に故障してはならない基幹システムのためのプラットフォームへ進化したものの、科学技術計算分野では使われなくなってしまいました。一回りして1950-60年代当時と同じ状況になってしまったとも言えます。
・それではいま先を争って開発が進められている超並列型コンピューターはどうなのでしょうか。ここで少し強引にIBM Blue Geneを引き合いに出してみます。
・もともとBlue Geneはタンパク質の折りたたみ現象のシミュレーション 1ケースを1年で完了できる性能(1ペタFLOPS)の専用機として、設計がスタートしたものです。自己修復機能を備えるなどいくつかの革新的なアイデアがその中から生まれましたが、実際のシステムは当初描いていた先鋭的専用機にはならず、プログラム開発環境やI/OノードにLinux OSを採用するなど相当に汎用性を持たせたものになりました。性能の方も約1/3と控えめです。しかし最初のタンパク折りたたみ計算専用機のイメージが強いために、いまだに専用機(Special Purpose Computer)と思われているふしがあります。
・ちょうどIBM Journal of Research and Developmentの最新号が"Applications of Massively Parallel Systems" 特集ですので、これを参考に、進化を続けるためにはある程度の汎用性がないと難しいという視点からBlue Geneを見てみます。
・この号には、Blue Gene/Lのアプリケーション・ユーザーの16編の論文で埋まっています。それらのアプリケーションは、
1) タンパク構造の予測
2) MDシミュレーション
3) 大脳新皮質コラムのシミュレーション
4) 同上
5) リガンド発見のための並列計算
6) 創薬のための分子のドッキング・シミュレーション
7) 3-D 地震探査計算
8) 炭化水素の電気伝導度計算
9) 閉じこめプラズマ乱流の粒子シミュレーション
10) 気象シミュレーション
11) 弱圧縮性乱流のシミュレーション
12) 第一原理によるMD計算
13) N-体分子シミュレーション
14) ab initio MD計算
15) スケーラブルMD計算
16) QCD計算
ですが、個人的にはこれらに
17) 携帯電話の3-D落下衝撃解析 ((株)アライドエンジニアリング 秋葉博氏他)というSC06でゴードン・ベル賞のファイナリストに残った論文を加えたいと思います。
・これらを眺めてわかるとおり、隣接相互作用の計算が得意なBlue Geneらしく粒子系シミュレーションがやや目立ちますが、それだけにとどまらない様々な分野のアプリケーションに適用されています。
・最新のBlue Gene/Pでは、低消費電力を維持しつつ7万2千ノードで1ペタ・ピークFLOPS性能を実現するというだけではなく、ノードの4-way SMP化、メモリー倍増(2GB、オプションで4GB)、ネットワークの性能アップ(バンド幅拡大と遅延短縮)というように、アプリケーションに対してより制約の少ない方向(より汎用化)に進化しているように見えます。Blue Geneはなるほどすごいなと思いました。
・もうひとつ注目の超並列型コンピューターが、複合汎用システムとして理研が開発を進めている次世代スーパーコンピューターです。性能目標10ペタFLOPSを実現するテクノロジーには非常に興味がもたれます。
・このように専用機というのは圧倒的高性能とコスト・パフォーマンスとが両立するので常に引きつける魅力があります。
・対する汎用機(General Purpose Computer)ですが、その代名詞が360度オールラウンドに使えるコンピューターとして1960年代に発表されたIBM System/360です。それ以前は科学技術計算向けのコンピューターと、商用向けのコンピューターが別々に開発されてきましたが、S/360があっという間にシェアを獲得し、科学技術計算向け、商用向けともに汎用機に吸収されてしまいました。
・その後もアレイ・プロセッサーのような実験的なシステムやQCD専用機などが企画・製作されたものの専用機の大半が短寿命で衰退してしまったのは、やはりある程度汎用性のあるものでないと開発投資が続けられず、そのうちに専用機としての競争力が失なわれてしまったという現実があるのでしょう。
・その中でも比較的長い間生き残ってきたのがベクトル型コンピューターですが、これも2007年11月のTop500リストによるとシェア0.8%へと衰退してしまいました。
一方、汎用機の代名詞だったメインフレームも、絶対に故障してはならない基幹システムのためのプラットフォームへ進化したものの、科学技術計算分野では使われなくなってしまいました。一回りして1950-60年代当時と同じ状況になってしまったとも言えます。
・それではいま先を争って開発が進められている超並列型コンピューターはどうなのでしょうか。ここで少し強引にIBM Blue Geneを引き合いに出してみます。
・もともとBlue Geneはタンパク質の折りたたみ現象のシミュレーション 1ケースを1年で完了できる性能(1ペタFLOPS)の専用機として、設計がスタートしたものです。自己修復機能を備えるなどいくつかの革新的なアイデアがその中から生まれましたが、実際のシステムは当初描いていた先鋭的専用機にはならず、プログラム開発環境やI/OノードにLinux OSを採用するなど相当に汎用性を持たせたものになりました。性能の方も約1/3と控えめです。しかし最初のタンパク折りたたみ計算専用機のイメージが強いために、いまだに専用機(Special Purpose Computer)と思われているふしがあります。
・ちょうどIBM Journal of Research and Developmentの最新号が"Applications of Massively Parallel Systems" 特集ですので、これを参考に、進化を続けるためにはある程度の汎用性がないと難しいという視点からBlue Geneを見てみます。
・この号には、Blue Gene/Lのアプリケーション・ユーザーの16編の論文で埋まっています。それらのアプリケーションは、
1) タンパク構造の予測
2) MDシミュレーション
3) 大脳新皮質コラムのシミュレーション
4) 同上
5) リガンド発見のための並列計算
6) 創薬のための分子のドッキング・シミュレーション
7) 3-D 地震探査計算
8) 炭化水素の電気伝導度計算
9) 閉じこめプラズマ乱流の粒子シミュレーション
10) 気象シミュレーション
11) 弱圧縮性乱流のシミュレーション
12) 第一原理によるMD計算
13) N-体分子シミュレーション
14) ab initio MD計算
15) スケーラブルMD計算
16) QCD計算
ですが、個人的にはこれらに
17) 携帯電話の3-D落下衝撃解析 ((株)アライドエンジニアリング 秋葉博氏他)というSC06でゴードン・ベル賞のファイナリストに残った論文を加えたいと思います。
・これらを眺めてわかるとおり、隣接相互作用の計算が得意なBlue Geneらしく粒子系シミュレーションがやや目立ちますが、それだけにとどまらない様々な分野のアプリケーションに適用されています。
・最新のBlue Gene/Pでは、低消費電力を維持しつつ7万2千ノードで1ペタ・ピークFLOPS性能を実現するというだけではなく、ノードの4-way SMP化、メモリー倍増(2GB、オプションで4GB)、ネットワークの性能アップ(バンド幅拡大と遅延短縮)というように、アプリケーションに対してより制約の少ない方向(より汎用化)に進化しているように見えます。Blue Geneはなるほどすごいなと思いました。
・もうひとつ注目の超並列型コンピューターが、複合汎用システムとして理研が開発を進めている次世代スーパーコンピューターです。性能目標10ペタFLOPSを実現するテクノロジーには非常に興味がもたれます。
2007年12月26日
●Blue Brain Projectが第一フェーズを完了
・昨日開催された理研主催の次世代生命体統合シミュレーション研究開発プロジェクトのシンポジウムで、理研脳科学総合研究センターの甘利センター長の招待講演でも触れられていたローザンヌ工科大学のBlue Brain Projectが11月26日に第一フェーズを完了しました。
・このプロジェクトは哺乳類の脳をリバース・エンジニアリングにより研究しようとするもので、ねずみの脳を対象に取り8,192プロセッサーのBlue Geneによるシミュレーションでその機能を理解しようと試みています。
・2005年の7月にローザンヌ工科大学(EPFL)とIBMがこの研究開始を発表し、SC06でのマークマル教授の講演は非常にわくわくする内容だったことを覚えています。
・開始にあたってリーダーのマークマル教授が「脳研究者の半分以上はこの研究に懐疑的だろうが、今がはじめるのにちょうどよいタイミングだ」と言っていましたが、相当アンビシャスなプロジェクトだったようです。
・第一フェーズの成果として、大脳新皮質のコラム1個を10,000個のニューロンと3,000万個のシナプス接続でモデル化したもののシミュレーションで、ニューロンからニューロンへと電気信号が伝わる様子が可視化されたものをBlue Brain Projectのギャラリーで見ることができます。
・MITの11月のTechnology Reviewでも取り上げられていますが、脳科学に大きなインパクトを与えうる驚くべき仕事と評価しています。
・このように、脳科学でもインシリコ (コンピューター・シミュレーション)を研究に利用できることが示されたということも第一フェーズの大きな成果になるでしょう。
・次世代生命体統合シミュレーション研究開発プロジェクトが生体分子スケールから臓器全身スケールまで対象とするビッグ・プロジェクトだと今回シンポジウムに参加してわかりましたが、今は含まれていない脳・自律神経系という制御機能が含まれるようになると、実にわくわくするものになるのではないかと想像をめぐらしてしまいます。
・このプロジェクトは哺乳類の脳をリバース・エンジニアリングにより研究しようとするもので、ねずみの脳を対象に取り8,192プロセッサーのBlue Geneによるシミュレーションでその機能を理解しようと試みています。
・2005年の7月にローザンヌ工科大学(EPFL)とIBMがこの研究開始を発表し、SC06でのマークマル教授の講演は非常にわくわくする内容だったことを覚えています。
・開始にあたってリーダーのマークマル教授が「脳研究者の半分以上はこの研究に懐疑的だろうが、今がはじめるのにちょうどよいタイミングだ」と言っていましたが、相当アンビシャスなプロジェクトだったようです。
・第一フェーズの成果として、大脳新皮質のコラム1個を10,000個のニューロンと3,000万個のシナプス接続でモデル化したもののシミュレーションで、ニューロンからニューロンへと電気信号が伝わる様子が可視化されたものをBlue Brain Projectのギャラリーで見ることができます。
・MITの11月のTechnology Reviewでも取り上げられていますが、脳科学に大きなインパクトを与えうる驚くべき仕事と評価しています。
・このように、脳科学でもインシリコ (コンピューター・シミュレーション)を研究に利用できることが示されたということも第一フェーズの大きな成果になるでしょう。
・次世代生命体統合シミュレーション研究開発プロジェクトが生体分子スケールから臓器全身スケールまで対象とするビッグ・プロジェクトだと今回シンポジウムに参加してわかりましたが、今は含まれていない脳・自律神経系という制御機能が含まれるようになると、実にわくわくするものになるのではないかと想像をめぐらしてしまいます。
2007年12月21日
●「次世代生命体統合シミュレーション研究開発プロジェクト」のシンポジウム
・暮れも押し迫ってきましたが、12月25日(火)に理研主催の「次世代生命体統合シミュレーション・シンポジウム2007」が都内大手町MY PLAZA ホールで開催されます。
・プログラムを見ると、特に計算中心というわけではなく、バイオロジーとヘルスケアについてかなり幅広い観点からの講演や議論で構成されているように見えるので、個人的には興味深いシンポジウムです。
・プログラムを見ると、特に計算中心というわけではなく、バイオロジーとヘルスケアについてかなり幅広い観点からの講演や議論で構成されているように見えるので、個人的には興味深いシンポジウムです。
2007年12月18日
●1PetaFLOPSのRoadrunnerが最終フェーズに
・1PetaFLOPSの持続性能を目標にしたロスアラモス国立研究所(LANL)のRoadrunnerが、いよいよ最終フェーズに入り、そのお祝いが行われたそうです。楽しそうな写真も紹介されています。
・RoadrunnerはCell BroadBand Engineをアクセルレータにした最初のスーパーコンピューターで、LANLとIBMの共同開発プロジェクトとして2006年始めにスタートしています。最初に第一フェーズの71TFLOPSのクラスター・システムから始まり、この10月に第二フェーズを終え、National Nuclear Security Administration(NNSA)と、独立HPC専門家チームという二つの外部アセスメントを受けていました。
・その結果を受けてLANLは最終フェーズすなわちフル・スケールのRoadrunnerの開発に入ることを決め、NNSAの承認が降り次第フル・スケールのRoadrunnerの入手を進めます。マシンがIBMからLANLに到着するのが2008年秋、最初のアプリケーションが走るのが2009年1月ということです。
・このスケジュールどおりだと、SC08のタイミングではTop500の1位は依然LLNLのBlue Gene/Lになっている可能性が高いので、LANLとしてはもう少しスケジュールを前倒ししたいところだと思います。
・ともあれ、このテクニカルアセスメントのための資料が紹介されています。この中の"Roadrunner Applications Team: Cell and Hybrid Results to Date"というのを見るとLANLは2003年からすでにAcceleration modelを検討していてFPGAとGPによる小規模システムの結果から自信を得、2006年、いっきにCell/B.E.で1 PetaFLOPSの挑戦に出たようです。決して唐突ではなかったわけです。
・Roadrunner projectにはLANLの100人以上のスタッフが参加し、プロジェクトのコストは約$120M (ざっと130億円)の予定とあります。LLNLとIBMとのBlue Gene/Lの共同プロジェクトでもそうですが、特にRoadrunnerでは製品を使用することを前提に設計しているので、計画がたてやすいという利点がIBM, LANL双方にありそうです。
・ただし、この種のシステムの性能と開発コストの関係は、使用目的、信頼性(MTBFなど)、それらを反映したアーキテクチャの先進性の度合い、さらには開発コストの回収計画等々でさまざまに変わるものなので、表面的なコスト-性能比の比較はもはや無意味でしょう。
別の見方をすれば、使用するアプリケーションを通じてその性能のシステムから得られる価値をいくらに評価するかがプロジェクトの価値でしょうから、米国National Nuclear Securityのプロジェクトというのは強いですね。日本では何にあたるのでしょうか。おそらく、省石油に関したものすべて?
・RoadrunnerはCell BroadBand Engineをアクセルレータにした最初のスーパーコンピューターで、LANLとIBMの共同開発プロジェクトとして2006年始めにスタートしています。最初に第一フェーズの71TFLOPSのクラスター・システムから始まり、この10月に第二フェーズを終え、National Nuclear Security Administration(NNSA)と、独立HPC専門家チームという二つの外部アセスメントを受けていました。
・その結果を受けてLANLは最終フェーズすなわちフル・スケールのRoadrunnerの開発に入ることを決め、NNSAの承認が降り次第フル・スケールのRoadrunnerの入手を進めます。マシンがIBMからLANLに到着するのが2008年秋、最初のアプリケーションが走るのが2009年1月ということです。
・このスケジュールどおりだと、SC08のタイミングではTop500の1位は依然LLNLのBlue Gene/Lになっている可能性が高いので、LANLとしてはもう少しスケジュールを前倒ししたいところだと思います。
・ともあれ、このテクニカルアセスメントのための資料が紹介されています。この中の"Roadrunner Applications Team: Cell and Hybrid Results to Date"というのを見るとLANLは2003年からすでにAcceleration modelを検討していてFPGAとGPによる小規模システムの結果から自信を得、2006年、いっきにCell/B.E.で1 PetaFLOPSの挑戦に出たようです。決して唐突ではなかったわけです。
・Roadrunner projectにはLANLの100人以上のスタッフが参加し、プロジェクトのコストは約$120M (ざっと130億円)の予定とあります。LLNLとIBMとのBlue Gene/Lの共同プロジェクトでもそうですが、特にRoadrunnerでは製品を使用することを前提に設計しているので、計画がたてやすいという利点がIBM, LANL双方にありそうです。
・ただし、この種のシステムの性能と開発コストの関係は、使用目的、信頼性(MTBFなど)、それらを反映したアーキテクチャの先進性の度合い、さらには開発コストの回収計画等々でさまざまに変わるものなので、表面的なコスト-性能比の比較はもはや無意味でしょう。
別の見方をすれば、使用するアプリケーションを通じてその性能のシステムから得られる価値をいくらに評価するかがプロジェクトの価値でしょうから、米国National Nuclear Securityのプロジェクトというのは強いですね。日本では何にあたるのでしょうか。おそらく、省石油に関したものすべて?
2007年12月14日
●スーパーコンピューターも立体構造に?
・もう12月半ばとなると、近い将来に期待したいものがいろいろ浮かんできますが、その中で最たるもののひとつが三次元回路集積技術の実用化です。
・現在のチップは平面上に配線しているため線幅がミクロン以下の超極細で、想像を超えた長さ(初期のIBM POWERプロセッサーでもチップ内配線は全長1kmくらいあったと記憶)の配線が必要となります。このため、熱やリーク電流、信号遅延が大きな問題になっています。しかしこれらは配線を立体的におこなう三次元配線にすることで劇的に改善できます。
・たとえば今年発表になったIBMの研究成果では、回路を作ったシリコン・ウエハーを複数重ねたものに数千の貫通孔を空けてその中を金属で満たす"Through-Silicon Via"という方法で積層チップ内の三次元配線を実用化しています。この結果、配線長は1/1000になるそうです。この量産が2008年に始まります。
・三次元配線の技術も、アナロジーで言うと、初期はあたかも上下階の連絡をするために建物の外壁に外階段をつける方法しか取れなかったのが、TSVによってエレベーター方式で信号が行き来できるようになったわけです。
・これができると、現在平面上に展開しているプロセッサー・チップ自体を立体的に作る技術も必要になります。
・2006年9月にMany-coreの実験チップとしてインテルが8x10コア(簡単な処理エンジンとルータの組み合わせのタイルと呼ばれる小規模コア)の二次元構造を持ったチップを発表していますし、
Cell/B.E.も9コアの二次元構造のチップでできています。東大のGRAPE-DRプロジェクトでは実に1024コアのチップの研究開発に成功しています。
・これらはすべて平面状に回路を展開している二次元チップですが、もしチップの三次元化が可能になれば、サンドイッチのように下をCPUコア、中をメモリー、その上にインターコネクト・スイッチと重ね、このサンドイッチを16層重ねた三次元ICチップにするといったことも夢でなくなります。
・そうした微小インターコネクト・スイッチの研究開発では、この12月にIBMが発表したブレークスルーに、電気信号を光パルスに変換するモジュレータを従来の1/100〜1/1000の大きさにできたという“Ultra-compact, low RF power, 10 Gb/s silicon Mach-Zehnder modulator”があります。
・この技術は高性能と低電力消費を兼ね備えた"Tiny Supercomputers-on-a-chip"の実現をめざす上で、大きな影響を与えると思います。
・ついこの前まで90nmテクノロジーだったのがみるみるうちに小さくなって今は32nmテクノロジーも話題になっています。たいへんな速さで微小化が進行してきたわけですが、これはCPUチップだけの話。コンピューター・システムを見ればわかるように、(<100nmの世界から見ると)はるか遠く離れた場所にメモリーやインターコネクト・スイッチが配置され、システム全体が教室〜体育館程度の平面に分散配置されているというのが実際です。こうしただれが見ても異常なほどのアンバランスを解消するテクノロジーの研究開発は時代の要請ですから、今後さらに急速に進んでいくはずです。
・オン・チップ・メモリーも微小化、高速化、低電力化の研究開発が進んでいます。従来のSRAMに比べて1/3の大きさと1/4の電力の世界最速組み込みDRAM(embedded DRAM)です。
・最新のBlue Gene/Pのチップには、このeDRAMとプロセッサーが三次元積層されたチップを使います。
・さて、技術の粋とも言える地球シミュレーターでは合計2,400kmというノード間インターコネクトの太いケーブルが床下を這っています。地球シミュレーターよりも大食いの、巨大なモンスターへとばく進しているスーパーコンピューターが、このようにプロセッサー・チップやシステムが三次元的に集積統合されていくことで、一転して羊になるのも夢ではないかもしれません。
・ということで、ここからは半分夢物語ですが、いま1チップが16x16x16 コア(大メモリー、インターコネクト付き)のサイコロ形状の三次元プロセッサーができたとすると1チップのコア数は4,096です。このコアの性能をBlue Gene/Pと同じ14GFLOPSとします。
・このサイコロ・チップをルービック・キューブのように4x4x4 (=64)の立方体に組み立てると全体のコア数は262,144個になり、2007年にTop500で首位のBlue Gene/L(596ピークTFLOPS)のコア数106,496の倍以上になる勘定です。
・このときのピーク性能は3,670TFLOS(3.7ペタFLOPS)になります。
・最速スーパーコンピューターのひとつ、Blue Gene/Pの性能がルービック・キューブくらいの大きさで実現するという妄想でしたが、いままでの経験から見てさほど遠くない時期に実現しても驚きません。
・ルービック・キューブには熱除去のための強力な冷却装置が取り付けられ、さらに宇宙線や自然放射能からの回路の誤動作から護るため、鉛の分厚い放射線シールド容器の中に鎮座していて、現在のスーパーコンピューターの姿とはだいぶ異なっているでしょうが。
・現在のチップは平面上に配線しているため線幅がミクロン以下の超極細で、想像を超えた長さ(初期のIBM POWERプロセッサーでもチップ内配線は全長1kmくらいあったと記憶)の配線が必要となります。このため、熱やリーク電流、信号遅延が大きな問題になっています。しかしこれらは配線を立体的におこなう三次元配線にすることで劇的に改善できます。
・たとえば今年発表になったIBMの研究成果では、回路を作ったシリコン・ウエハーを複数重ねたものに数千の貫通孔を空けてその中を金属で満たす"Through-Silicon Via"という方法で積層チップ内の三次元配線を実用化しています。この結果、配線長は1/1000になるそうです。この量産が2008年に始まります。
・三次元配線の技術も、アナロジーで言うと、初期はあたかも上下階の連絡をするために建物の外壁に外階段をつける方法しか取れなかったのが、TSVによってエレベーター方式で信号が行き来できるようになったわけです。
・これができると、現在平面上に展開しているプロセッサー・チップ自体を立体的に作る技術も必要になります。
・2006年9月にMany-coreの実験チップとしてインテルが8x10コア(簡単な処理エンジンとルータの組み合わせのタイルと呼ばれる小規模コア)の二次元構造を持ったチップを発表していますし、
Cell/B.E.も9コアの二次元構造のチップでできています。東大のGRAPE-DRプロジェクトでは実に1024コアのチップの研究開発に成功しています。
・これらはすべて平面状に回路を展開している二次元チップですが、もしチップの三次元化が可能になれば、サンドイッチのように下をCPUコア、中をメモリー、その上にインターコネクト・スイッチと重ね、このサンドイッチを16層重ねた三次元ICチップにするといったことも夢でなくなります。
・そうした微小インターコネクト・スイッチの研究開発では、この12月にIBMが発表したブレークスルーに、電気信号を光パルスに変換するモジュレータを従来の1/100〜1/1000の大きさにできたという“Ultra-compact, low RF power, 10 Gb/s silicon Mach-Zehnder modulator”があります。
・この技術は高性能と低電力消費を兼ね備えた"Tiny Supercomputers-on-a-chip"の実現をめざす上で、大きな影響を与えると思います。
・ついこの前まで90nmテクノロジーだったのがみるみるうちに小さくなって今は32nmテクノロジーも話題になっています。たいへんな速さで微小化が進行してきたわけですが、これはCPUチップだけの話。コンピューター・システムを見ればわかるように、(<100nmの世界から見ると)はるか遠く離れた場所にメモリーやインターコネクト・スイッチが配置され、システム全体が教室〜体育館程度の平面に分散配置されているというのが実際です。こうしただれが見ても異常なほどのアンバランスを解消するテクノロジーの研究開発は時代の要請ですから、今後さらに急速に進んでいくはずです。
・オン・チップ・メモリーも微小化、高速化、低電力化の研究開発が進んでいます。従来のSRAMに比べて1/3の大きさと1/4の電力の世界最速組み込みDRAM(embedded DRAM)です。
・最新のBlue Gene/Pのチップには、このeDRAMとプロセッサーが三次元積層されたチップを使います。
・さて、技術の粋とも言える地球シミュレーターでは合計2,400kmというノード間インターコネクトの太いケーブルが床下を這っています。地球シミュレーターよりも大食いの、巨大なモンスターへとばく進しているスーパーコンピューターが、このようにプロセッサー・チップやシステムが三次元的に集積統合されていくことで、一転して羊になるのも夢ではないかもしれません。
・ということで、ここからは半分夢物語ですが、いま1チップが16x16x16 コア(大メモリー、インターコネクト付き)のサイコロ形状の三次元プロセッサーができたとすると1チップのコア数は4,096です。このコアの性能をBlue Gene/Pと同じ14GFLOPSとします。
・このサイコロ・チップをルービック・キューブのように4x4x4 (=64)の立方体に組み立てると全体のコア数は262,144個になり、2007年にTop500で首位のBlue Gene/L(596ピークTFLOPS)のコア数106,496の倍以上になる勘定です。
・このときのピーク性能は3,670TFLOS(3.7ペタFLOPS)になります。
・最速スーパーコンピューターのひとつ、Blue Gene/Pの性能がルービック・キューブくらいの大きさで実現するという妄想でしたが、いままでの経験から見てさほど遠くない時期に実現しても驚きません。
・ルービック・キューブには熱除去のための強力な冷却装置が取り付けられ、さらに宇宙線や自然放射能からの回路の誤動作から護るため、鉛の分厚い放射線シールド容器の中に鎮座していて、現在のスーパーコンピューターの姿とはだいぶ異なっているでしょうが。
2007年12月11日
●Cellスピードチャレンジ2008 参加受付中
・2007年に続いて、Cell Broadband Engine (Cell/B.E.)を対象にしたマルチコア・プログラミング・コンテスト Cellスピードチャレンジ2008の受付が始まっています。
・2008年も課題は規定課題(「連立一次方程式の求解」)と自由課題の二本立てで、日程については参加受付開始が2007年11月20日、参加受付〆切と予選ラウンド開始が2008年2月1日等々となっています。
・リーフレットによると、今回は(財) 北九州産業学術推進機構 (FAIS)のCell/B.E.のオンライン環境を借用してスピード測定をすることになったようです。
・二、三の大学研究室の方とお話しした例から類推するとプログラミングで多そうなケースは、プログラミングとテストまでは研究室に設置したソニーのPLAYSTATION3 (PS3)を使用することですが、プログラミング・テスト環境として考えてもPS3は実に安価と言えます (なにせPCよりも低価格!)。
・先月にはSC07の会場で、Yellow Dog Linux for PLAYSTATION3 をTerra Soft SolutionsのCEO、Kai Staatsさんからいただいたので、これはPS3を買わないとまずいかなと思いつつ、まだ積んどくになっています。
・PS3は電力消費が少ない新モデルも発売されましたが、HPCから見てどれがいいかかぐらいは知った上でと思っています。さて何になるのか。ちなみにコンテスト参加のためには、協賛各社の従業員でないこと、または協賛各社でインターンシップ中の学生でないこととあるので、私は参加資格なし。
Kaiさんはフットワークの軽そうな、まだ学生の雰囲気が残っている(知人の弁)方で、IT系の(Web系ではない)先進ベンチャーはこんな感じの人が起業しているんだと思わせられました。
・2008年も課題は規定課題(「連立一次方程式の求解」)と自由課題の二本立てで、日程については参加受付開始が2007年11月20日、参加受付〆切と予選ラウンド開始が2008年2月1日等々となっています。
・リーフレットによると、今回は(財) 北九州産業学術推進機構 (FAIS)のCell/B.E.のオンライン環境を借用してスピード測定をすることになったようです。
・二、三の大学研究室の方とお話しした例から類推するとプログラミングで多そうなケースは、プログラミングとテストまでは研究室に設置したソニーのPLAYSTATION3 (PS3)を使用することですが、プログラミング・テスト環境として考えてもPS3は実に安価と言えます (なにせPCよりも低価格!)。
・PS3は電力消費が少ない新モデルも発売されましたが、HPCから見てどれがいいかかぐらいは知った上でと思っています。さて何になるのか。ちなみにコンテスト参加のためには、協賛各社の従業員でないこと、または協賛各社でインターンシップ中の学生でないこととあるので、私は参加資格なし。
Kaiさんはフットワークの軽そうな、まだ学生の雰囲気が残っている(知人の弁)方で、IT系の(Web系ではない)先進ベンチャーはこんな感じの人が起業しているんだと思わせられました。
2007年12月09日
日本 巻き返しなるか
・今頃という感がありますが、ホンダF1の記事と同じ今日の読売新聞朝刊25面に"スパコン 日本また後退"という大きな記事が載っています。
・"日本また後退"という意味は、Top500リストで"日本の代表的スーパーコンピューターが順位を下げた(同記事)"ということを言っています。
・この記事の"日本の代表的スーパーコンピューター"というのが、国産メーカーが納入したスーパーコンピューターを指していて、日本国内で利用されているスーパーコンピューターを指しているわけではないという粗さが個人的には少なからず気になりますが、しかしどちらから見てもこのところ日本が米国はもとよりヨーロッパに対してもHPC分野の元気度合いがめっきり弱くなってきた印象は否めません。
・しかし先日発表されたIDC社の予測では、世界全体のHPCサーバー売り上げ高は強い成長を続け、2011年には2006年の1.5倍以上になるとあります。
研究開発では、お金のかかる実験からコストの小さくなってきたコンピューター・シミュレーションへのシフトが続くというのがこの予測の主要な裏付けのひとつになっていて、日本もその点では例外でないはずですので、巻き返す元気さが必要です。
・さて読売新聞の記事ですが、東工大の松岡聡教授が"長期計画で一台だけ作るのではなく、常に先を見越して世界トップに届く計画を次々と打ち立てていかないと新興国に負けてしまう"という指摘をしています。
・これは日本のHPC戦略の弱点を指摘していて、まったくそのとおりだと思いますし、スーパーコンピューターのリーダー格と目されているIBMやCray社は、企業としてこのことを必死に実行しているように見えます。
コンピューター・シミュレーションについては国内に長い経験を蓄積してきた強みがあるので、いまHPCの巻き返しに必要なものはなんと言っても海外に負けない若手・中堅層の開拓者精神と戦略立案・実行力と思っています。
・"日本また後退"という意味は、Top500リストで"日本の代表的スーパーコンピューターが順位を下げた(同記事)"ということを言っています。
・この記事の"日本の代表的スーパーコンピューター"というのが、国産メーカーが納入したスーパーコンピューターを指していて、日本国内で利用されているスーパーコンピューターを指しているわけではないという粗さが個人的には少なからず気になりますが、しかしどちらから見てもこのところ日本が米国はもとよりヨーロッパに対してもHPC分野の元気度合いがめっきり弱くなってきた印象は否めません。
・しかし先日発表されたIDC社の予測では、世界全体のHPCサーバー売り上げ高は強い成長を続け、2011年には2006年の1.5倍以上になるとあります。
研究開発では、お金のかかる実験からコストの小さくなってきたコンピューター・シミュレーションへのシフトが続くというのがこの予測の主要な裏付けのひとつになっていて、日本もその点では例外でないはずですので、巻き返す元気さが必要です。
・さて読売新聞の記事ですが、東工大の松岡聡教授が"長期計画で一台だけ作るのではなく、常に先を見越して世界トップに届く計画を次々と打ち立てていかないと新興国に負けてしまう"という指摘をしています。
・これは日本のHPC戦略の弱点を指摘していて、まったくそのとおりだと思いますし、スーパーコンピューターのリーダー格と目されているIBMやCray社は、企業としてこのことを必死に実行しているように見えます。
コンピューター・シミュレーションについては国内に長い経験を蓄積してきた強みがあるので、いまHPCの巻き返しに必要なものはなんと言っても海外に負けない若手・中堅層の開拓者精神と戦略立案・実行力と思っています。
ホンダF1の成績を決めた空力設計
・「ホンダ設計ミスに泣く」という記事が今日の読売新聞朝刊の34面に載っていました。今年のF1世界選手権でトヨタ、ホンダの日本チーム勢が不調だったことについての記事ですが、ホンダの不振の原因は車体空力設計にあったと分析しています。
・空気抵抗が大きかった上に、走行中のダウンフォースも小さいために直線、カーブとも後れを取ったとあります。
・SC07(その2)で、BMWのF1のCFDシミュレーションの発表を紹介しましたが、600kgという軽い車体が時速350kmで運動する世界ですから、仮にドライバーの技量が同じであれば、規格はあるものの自由度が残されている空力設計での優劣しか設計者には残されていないわけです。
・国内では地球シミュレーターを使用してフォーミュラカーの詳細なCFDシミュレーションも発表されていますが、実戦に応用しようとすると風洞実験では難しい高速走行時の路面、タイヤからの影響の予測や、コーナリング時の空力チューニングなど膨大な計算ケースが必要だとBMWのLarsson氏が話していたのを思い出します。(どのレベルまでBMWが実現しているかはわかりませんが)。
HPCに関係する一人としては、" F1日本勢がCFDを活用した空力設計で勝利 "という見出しが現れる日が来ることを期待するばかりです。
もちろん地球シミュレーターでなければできない問題ではなく、むしろ最新の大型HPCシステムを企業がCFD専用に利用できる環境とCFD専門家の存在が大事なことがBMWの例からわかります。
・空気抵抗が大きかった上に、走行中のダウンフォースも小さいために直線、カーブとも後れを取ったとあります。
・SC07(その2)で、BMWのF1のCFDシミュレーションの発表を紹介しましたが、600kgという軽い車体が時速350kmで運動する世界ですから、仮にドライバーの技量が同じであれば、規格はあるものの自由度が残されている空力設計での優劣しか設計者には残されていないわけです。
・国内では地球シミュレーターを使用してフォーミュラカーの詳細なCFDシミュレーションも発表されていますが、実戦に応用しようとすると風洞実験では難しい高速走行時の路面、タイヤからの影響の予測や、コーナリング時の空力チューニングなど膨大な計算ケースが必要だとBMWのLarsson氏が話していたのを思い出します。(どのレベルまでBMWが実現しているかはわかりませんが)。
HPCに関係する一人としては、" F1日本勢がCFDを活用した空力設計で勝利 "という見出しが現れる日が来ることを期待するばかりです。
もちろん地球シミュレーターでなければできない問題ではなく、むしろ最新の大型HPCシステムを企業がCFD専用に利用できる環境とCFD専門家の存在が大事なことがBMWの例からわかります。

