2007年03月
2007年03月30日
●64テラFLOPSのMDGRAPE-3が来週サービス開始に
・理化学研究所(理研)のゲノム科学総合研究センターの泰地真弘人(たいち まこと)氏がチームリーダーとなって開発に成功したMDGRAPE-3のシステムが4月2日からサービス開始というニュースが理研から3月27日に発表されていました。
・このシステムは、16ユニットのMDGRAPE-3から構成されています。1ユニットの理論ピーク性能は4テラFLOPS(TFLOPS)のため、全体で64TFLOPSのピーク性能を持つ分子動力学シミュレーション専用計算機ということです。1ユニットにはMDGRAPE-3チップが24個入っています。
・一緒に掲載されている写真を見ると1ユニットが42Uのラック一個に格納されているようにみえます。実物は4月21日(土)の理研 和光研究所一般公開で見学できるようです。
・アメリカでは統計データを見るかぎり、創薬などライフサイエンス分野に圧倒的なR&D投資が振り向けられています。そのためかハイエンドHPCシステムではライフサイエンスを利用目的のトップに持ってくるケースが一般的です。その成果がまだ顕在化していないだけに、ある日突然画期的な内容が発表されるという可能性もあります。
・日本はライフサイエンス分野へのハイエンドHPCの活用という面ではAIST CBRCのBlue Proteinシステム(理論ピーク性能23TFLOPS)による研究や同グリッド研究センター(理論ピーク性能15TFLOPS)による研究などまだまだ限られています。これに今回サービスが始まるMDGRAPE-3を利用したアプリケーションによる研究成果が加わり、遅れ気味のライフサイエンス分野においてHPCの価値が高まっていくことを個人的には期待しています。
言い古されていますが、PCもスーパーコンピューターもアプリケーションのための道具といえば道具。コンピューター投資に見合う成果を引き出すにはアプリケーション面(やっぱり人材か)への投資が必要です。たとえばASCIプログラム初期の1997年の予算では年間予算$121.6 millionのうちアプリケーションに$54.9 millionを要求しています。日本もこれがあたり前と思って戦略をたてなければ、本当の国際競争には勝てないのでは。
・このシステムは、16ユニットのMDGRAPE-3から構成されています。1ユニットの理論ピーク性能は4テラFLOPS(TFLOPS)のため、全体で64TFLOPSのピーク性能を持つ分子動力学シミュレーション専用計算機ということです。1ユニットにはMDGRAPE-3チップが24個入っています。
・一緒に掲載されている写真を見ると1ユニットが42Uのラック一個に格納されているようにみえます。実物は4月21日(土)の理研 和光研究所一般公開で見学できるようです。
・アメリカでは統計データを見るかぎり、創薬などライフサイエンス分野に圧倒的なR&D投資が振り向けられています。そのためかハイエンドHPCシステムではライフサイエンスを利用目的のトップに持ってくるケースが一般的です。その成果がまだ顕在化していないだけに、ある日突然画期的な内容が発表されるという可能性もあります。
・日本はライフサイエンス分野へのハイエンドHPCの活用という面ではAIST CBRCのBlue Proteinシステム(理論ピーク性能23TFLOPS)による研究や同グリッド研究センター(理論ピーク性能15TFLOPS)による研究などまだまだ限られています。これに今回サービスが始まるMDGRAPE-3を利用したアプリケーションによる研究成果が加わり、遅れ気味のライフサイエンス分野においてHPCの価値が高まっていくことを個人的には期待しています。
言い古されていますが、PCもスーパーコンピューターもアプリケーションのための道具といえば道具。コンピューター投資に見合う成果を引き出すにはアプリケーション面(やっぱり人材か)への投資が必要です。たとえばASCIプログラム初期の1997年の予算では年間予算$121.6 millionのうちアプリケーションに$54.9 millionを要求しています。日本もこれがあたり前と思って戦略をたてなければ、本当の国際競争には勝てないのでは。
2007年03月23日
●FORTRAN開発で有名な元IBMフェローのバッカス氏死去
・CNN.co.jpのサイエンス欄に"「FORTRAN」開発のジョン・バッカス氏が死去、82歳"とバッカス氏の訃報が伝えられています。
・コロンビア大学の歴史サイトのバッカス氏のページでは最後の一行が
John Backus died at his home in Ashland, Oregon, March 17, 2007.
となっていました。
・バッカス氏がIBMでFORTRANを開発(1954-57)したことを知る人は、今はもう少ないかもしれません(コンピューターに触りはじめて大分たってから私も知った、というのはさておき)。
・コロンビア大学のWebサイトによると、バッカス氏はコロンビア大学の敷地にあった古色蒼然とした建物のIBMワトソン・ラボラトリー(正確に言うとThomas J. Watson Scientific Computing Laboratoryと長い名前)で1950-1952の間プログラマーとして働いた後にIBMのプログラミング研究グループのリーダーになってFORTRANを開発したようです。そして1963年にIBMフェローに遇されています。
・IBMの研究所というとニューヨーク郊外のヨークタウンハイツにあるモダンなIBM Thomas J. Watson Research Centerが有名ですが、実はニューヨークのど真ん中が最初だったとは、今の今まで知りませんでした。
・このワトソン・ラボが1946-47に開発したコンピューターがSSEC(The Selective Sequence Electronic Calculator)で、これがまた現在の無機的な外観のコンピューターと違ってたいへん雰囲気があります。マンハッタンはマディソン街にあったIBM本社ビルに設置したSSECは昔のSF映画を思い出させますし、そのコントロールデスクなどは芸術品のようです。
こうしたコンピュータ黎明期の当時の写真などを眺めていると建屋、システム、人間、どれからも新しい息吹というかエネルギーが立ち上ってくるようで、なにか生き生きした気分になってきませんか。
・コロンビア大学の歴史サイトのバッカス氏のページでは最後の一行が
John Backus died at his home in Ashland, Oregon, March 17, 2007.
となっていました。
・バッカス氏がIBMでFORTRANを開発(1954-57)したことを知る人は、今はもう少ないかもしれません(コンピューターに触りはじめて大分たってから私も知った、というのはさておき)。
・コロンビア大学のWebサイトによると、バッカス氏はコロンビア大学の敷地にあった古色蒼然とした建物のIBMワトソン・ラボラトリー(正確に言うとThomas J. Watson Scientific Computing Laboratoryと長い名前)で1950-1952の間プログラマーとして働いた後にIBMのプログラミング研究グループのリーダーになってFORTRANを開発したようです。そして1963年にIBMフェローに遇されています。
・IBMの研究所というとニューヨーク郊外のヨークタウンハイツにあるモダンなIBM Thomas J. Watson Research Centerが有名ですが、実はニューヨークのど真ん中が最初だったとは、今の今まで知りませんでした。
・このワトソン・ラボが1946-47に開発したコンピューターがSSEC(The Selective Sequence Electronic Calculator)で、これがまた現在の無機的な外観のコンピューターと違ってたいへん雰囲気があります。マンハッタンはマディソン街にあったIBM本社ビルに設置したSSECは昔のSF映画を思い出させますし、そのコントロールデスクなどは芸術品のようです。
こうしたコンピュータ黎明期の当時の写真などを眺めていると建屋、システム、人間、どれからも新しい息吹というかエネルギーが立ち上ってくるようで、なにか生き生きした気分になってきませんか。
2007年03月17日
● 35年前のスーパーコンピューター
・先週ある20代の方から、5年前のサーバーを新機種に変えたら、その性能の違いに思わず感激したという話を聞きました。では私が同年代の35年前のときはどうだったかと考えてみると、キーパンチャーという職種の人にカードをキーパンチしてもらい、それを大型計算センターの受付に運んで、やっとコンピューターに仕事をさせたという状況でした。数千枚のカードを誤って廊下に落として順番がばらばらになって途方にくれるという光景も時たま見られた頃です。

・この時のスーパー・コンピューターというとIBM System/360 モデル195とCDC 7600の二つの大型システムでした。ベクトル・コンピューター Cray-1が発売される前です。
・IBM S/360モデル195は日本ではスーパー・コンピューターとして余り取り上げられませんが、一台だけ使われていました。写真(*)のようにランプが並ぶコントロール・パネルがタタミ一畳はあろうかという、いかにも超大型コンピューター・システムという魅力的なシステムでした。そのせいか発表当初は世界にモデル195が10台あればすべての計算をまかなえると言った人がいたとか。
・とはいえ、クロック・サイクルが54ナノ秒、メモリーは最大でもたったの4,096Kバイト(4MB)です。

記憶違いかと思って当時の資料(Functional Characteristicsの手書き訳(**))を見ると確かにそのとおりです。ただしアーキテクチャは革新的で、今で言うキャッシュ・メモリーが本格的に実装(バッファー・ストレージ 32Kバイトというのがそれ)され、最近話題になってきた4倍精度浮動小数点演算も考慮した、掛けねなく革新的で高い性能のシステムになっていました。
・IBM製のシステムには、この時の革新的なアーキテクチャが人を通じて有形無形で延々と受け継がれて来ているように見えます。
・ドッグ・イヤーといわれる現在ですから過去の35年間はこれからの6年―まあ10年だとして、その時にはどこまで進んでいるのでしょうか。
* IBM System/360 Model 195 Operation Procedures, Order No. GC28-6540
** IBM System/360 Model 195 Functional Characteristics (日本語訳ノート)
・この時のスーパー・コンピューターというとIBM System/360 モデル195とCDC 7600の二つの大型システムでした。ベクトル・コンピューター Cray-1が発売される前です。
・IBM S/360モデル195は日本ではスーパー・コンピューターとして余り取り上げられませんが、一台だけ使われていました。写真(*)のようにランプが並ぶコントロール・パネルがタタミ一畳はあろうかという、いかにも超大型コンピューター・システムという魅力的なシステムでした。そのせいか発表当初は世界にモデル195が10台あればすべての計算をまかなえると言った人がいたとか。
・とはいえ、クロック・サイクルが54ナノ秒、メモリーは最大でもたったの4,096Kバイト(4MB)です。
記憶違いかと思って当時の資料(Functional Characteristicsの手書き訳(**))を見ると確かにそのとおりです。ただしアーキテクチャは革新的で、今で言うキャッシュ・メモリーが本格的に実装(バッファー・ストレージ 32Kバイトというのがそれ)され、最近話題になってきた4倍精度浮動小数点演算も考慮した、掛けねなく革新的で高い性能のシステムになっていました。
・IBM製のシステムには、この時の革新的なアーキテクチャが人を通じて有形無形で延々と受け継がれて来ているように見えます。
・ドッグ・イヤーといわれる現在ですから過去の35年間はこれからの6年―まあ10年だとして、その時にはどこまで進んでいるのでしょうか。
* IBM System/360 Model 195 Operation Procedures, Order No. GC28-6540
** IBM System/360 Model 195 Functional Characteristics (日本語訳ノート)
2007年03月12日
● Top500 Listはなぜ500
・今日・明日の二日間、理研シンポジウム 「スーパーコンピュータの最新動向」が和光の理化学研究所でおこなわれています。
・最初のスピーカーが、1993年にTop500 Supercomputing Siteを創設したマンハイム大学のハンス・モイヤー教授でした。彼はすでに1986年からマンハイム・スーパーコンピューティング・スタティスティクスという統計を発表していました。これを改善しデータ源として重要なアメリカからジャック・ドンガラ教授とホルスト・サイモン氏に協力をお願いして、1993年にLinpackベンチマークでの性能のみを指標とした現在のTop500リストを開始したと開始当時の状況を話しています。
・なぜTop500にしたかというと、当時フォーブス500で代表されるようにランキングのリストでは500を使うことがかなり一般的だったのでTop500にしたそうです。
・今日の講演で使用したパワーポイントはISC07のサイト( //http:www.isc07.org/top500_tokyo_slides )からダウンロードできますが、Top500について非常に良い資料にまとめられています。
・年二回ある更新ごとに、競争の結果180システム程度がランクの外にドロップしているとも話していました。
教授は日本勢が元気のあった1993年のTop500リストと、最近の2006年のTop500リストを並べて示していましたが、その差にいまさらながら軽いショックを受けます。不断の実行だけでなく、勝つためのクールな中長期戦略がいかに重要かということを示す例のひとつでしょう。
・最初のスピーカーが、1993年にTop500 Supercomputing Siteを創設したマンハイム大学のハンス・モイヤー教授でした。彼はすでに1986年からマンハイム・スーパーコンピューティング・スタティスティクスという統計を発表していました。これを改善しデータ源として重要なアメリカからジャック・ドンガラ教授とホルスト・サイモン氏に協力をお願いして、1993年にLinpackベンチマークでの性能のみを指標とした現在のTop500リストを開始したと開始当時の状況を話しています。
・なぜTop500にしたかというと、当時フォーブス500で代表されるようにランキングのリストでは500を使うことがかなり一般的だったのでTop500にしたそうです。
・今日の講演で使用したパワーポイントはISC07のサイト( //http:www.isc07.org/top500_tokyo_slides )からダウンロードできますが、Top500について非常に良い資料にまとめられています。
・年二回ある更新ごとに、競争の結果180システム程度がランクの外にドロップしているとも話していました。
教授は日本勢が元気のあった1993年のTop500リストと、最近の2006年のTop500リストを並べて示していましたが、その差にいまさらながら軽いショックを受けます。不断の実行だけでなく、勝つためのクールな中長期戦略がいかに重要かということを示す例のひとつでしょう。
2007年03月02日
●Cell BEの利用環境いろいろ
・「Cellスピードチャレンジ2007」が情報処理学会の3つの研究会主催で始まるなど、ややハードルが高いと思われているCellのプログラミングに挑戦する活動が目に触れるようになってきました。このCellスピードチャレンジ2007ではインターネットを使って(株)東芝のCellリファレンスセットというAV指向のCell BEシステムにアクセスしてプログラミングや性能実測をするという、かなり力の入ったコンテスト形式をとっています。
(株)東芝がオープンな組織として立ち上げたCell Users' Groupの活動内容によるとCellリファレンスセットは、Cellスピードチャレンジ2007の挑戦者だけでなく、会員(個人はだめで法人のみ)になると利用できるとありました。
・他にCellを使える環境がないかといえば、どうしても(株)ソニー・コンピュータエンタテインメントの PLAYSTATION3 (PS3)が浮かびます。実際、私の友人・知人からもPS3購入したよという連絡が入ってきているので、かなりの数のHPCな人がすでにPS3にトライしているのではないかと想像しています。技術と時間とその気があれば数万円のPS3を買ってきて、以前には夢物語だった100GFLOPS級のPersonal HPCができるという、まったくよい時代になったものです。PS3をHPCに使うために役立つリンク集としてPS3 Linux関連リンク集という、いわば日本語Cell BE リンク集というべきものがすでにできていました。
・私のようにゲーム無関心のせっかち人間としては、もっと簡単にCell BEのプログラミングを試してみたいのですが、そのときはオーソドックスにPC上のシミュレータを使う手があります。この手は欧米中心に始まっているCell BEのコンテスト(Cell BE Challenge/Beyond Gaming!)で使われている方法です。こちらのコンテストでは自分のPCにIBM Cell BE SDKとIBMフルスケール・シミュレータを入れてプログラム開発をし、最後に自作プログラムとドキュメントを提出する形をとっています。英語圏でない国からは使いにくいでしょうが必要なソフトウェアはIBMのCell Broadband Engine resource centerにあるので、PCのみ用意できればいつでもできるという利点があります。
・本格的にHPCをCell BE搭載のサーバーで行おうとすると、米国ロスアラモス国立研究所のRoadRunnerのようにブレード・サーバーIBM QS20を使用したブレード・クラスター・システムになってきます。現行Cell BEの特性―短精度浮動小数点演算に比べて倍精度浮動小数点演算が遅い―を改善するロードマップも昨年タンパで開催されたSC06でのIBMブースのプレゼンテーションで紹介されていましたので、これからのHPCの技術トレンドのひとつになっていくと思います。今のQS20の構成では、一枚のQS20ブレードがCell BEを2個持っているため、ユーザー・プロセス一個から計16個のSPEと1GBのXDRAMメモリー、PCI-Xカード等を利用でき、短精度浮動小数点論理ピーク性能は410GFLOPS(*訂正)にもなります。
ブレード・センターのシャシーにはQS20が7枚入るので合計すると2.9テラFLOPS(短精度での論理ピーク性能ですが)(*訂正)。これを見るとやはり「もちはもちや」と言えます。
(*訂正)現行Cell BEのクロックは4GHzではなく3.2GHzなので、ピーク性能は
Clock値(3.2GHZ) x SPEの数(8) x 積和演算での並列性(2x4) = 204.8GFPSでした。QS20は2個 Cell BEが入っているのでこの2倍がピーク性能です。(3月19日)
(株)東芝がオープンな組織として立ち上げたCell Users' Groupの活動内容によるとCellリファレンスセットは、Cellスピードチャレンジ2007の挑戦者だけでなく、会員(個人はだめで法人のみ)になると利用できるとありました。
・他にCellを使える環境がないかといえば、どうしても(株)ソニー・コンピュータエンタテインメントの PLAYSTATION3 (PS3)が浮かびます。実際、私の友人・知人からもPS3購入したよという連絡が入ってきているので、かなりの数のHPCな人がすでにPS3にトライしているのではないかと想像しています。技術と時間とその気があれば数万円のPS3を買ってきて、以前には夢物語だった100GFLOPS級のPersonal HPCができるという、まったくよい時代になったものです。PS3をHPCに使うために役立つリンク集としてPS3 Linux関連リンク集という、いわば日本語Cell BE リンク集というべきものがすでにできていました。
・私のようにゲーム無関心のせっかち人間としては、もっと簡単にCell BEのプログラミングを試してみたいのですが、そのときはオーソドックスにPC上のシミュレータを使う手があります。この手は欧米中心に始まっているCell BEのコンテスト(Cell BE Challenge/Beyond Gaming!)で使われている方法です。こちらのコンテストでは自分のPCにIBM Cell BE SDKとIBMフルスケール・シミュレータを入れてプログラム開発をし、最後に自作プログラムとドキュメントを提出する形をとっています。英語圏でない国からは使いにくいでしょうが必要なソフトウェアはIBMのCell Broadband Engine resource centerにあるので、PCのみ用意できればいつでもできるという利点があります。
・本格的にHPCをCell BE搭載のサーバーで行おうとすると、米国ロスアラモス国立研究所のRoadRunnerのようにブレード・サーバーIBM QS20を使用したブレード・クラスター・システムになってきます。現行Cell BEの特性―短精度浮動小数点演算に比べて倍精度浮動小数点演算が遅い―を改善するロードマップも昨年タンパで開催されたSC06でのIBMブースのプレゼンテーションで紹介されていましたので、これからのHPCの技術トレンドのひとつになっていくと思います。今のQS20の構成では、一枚のQS20ブレードがCell BEを2個持っているため、ユーザー・プロセス一個から計16個のSPEと1GBのXDRAMメモリー、PCI-Xカード等を利用でき、短精度浮動小数点論理ピーク性能は410GFLOPS(*訂正)にもなります。
ブレード・センターのシャシーにはQS20が7枚入るので合計すると2.9テラFLOPS(短精度での論理ピーク性能ですが)(*訂正)。これを見るとやはり「もちはもちや」と言えます。
(*訂正)現行Cell BEのクロックは4GHzではなく3.2GHzなので、ピーク性能は
Clock値(3.2GHZ) x SPEの数(8) x 積和演算での並列性(2x4) = 204.8GFPSでした。QS20は2個 Cell BEが入っているのでこの2倍がピーク性能です。(3月19日)

