2007年02月

2007年02月27日

●女性初のチューリング賞受賞

・はじめて女性がチューリング賞受賞をしたということでいろいろニュースになっています。女性だからという枕ことばで話題になるというのも意外な感じです。米国も例外ではないということでしょう。先日もハーバード大の学長が「女性学長ではなく学長です」と言ったとかで話題を提供していました。Allen in Seoul

・さて今年の受賞者のフランセス・アレンは江崎玲於奈氏と同じようにIBMフェローだった方で、長年IBMワトソン・リサーチ・センターでHPCの基盤であるコンパイラー設計やマシン・アーキテクチャの分野で功績をあげてきた研究者です。

・ソウルで1991年の厳冬の時期に開催されたSUPERCOM'91というワークショップで、お互い講演者としてお会いする機会がありました。そのときの写真がこれですが、周りのIBM研究者からたいへん慕われているおば様という雰囲気でした。推察するにこの時すでに60才近かったのではないかと思います(女性の年を尋ねるのはご法度なので)。ちなみに右端がIBM Fortran H-Extendedコンパイラーという最適化コンパイラーの開発で名をはせたスカボローです。

cheer_hpc at 00:01|PermalinkComments(0)TrackBack(0)clip!閑話休題  | ニュース

2007年02月17日

●今年はいよいよPOWER6の幕開けに

・ドイツ屈指の研究組織マックス・プランク協会が100 TFLOPSを超えるPOWER6システム採用を決定し、2008年に完成というIBMからの発表が1月31日にありました。
IBM Selected to Build New Supercomputer of the Max Planck Society
IBM POWER6 Technology Will Bring to Bear over 100 Teraflops of Computing Power to Grand Challenges in Fundamental Scientific Research」

・これに象徴されるように、今年はPOWER6がHPCで目を離せない存在になりそうです。昨年10月のFall Microprocessor Forum 2006でIBMがPOWER6プロセッサーの詳細を発表し、高クロック周波数など一部意表をついた内容がわかってきました。(たとえばMYCOMジャーナル) 「Fall Microprocessor Forum 2006 - IBMが次世代サーバプロセッサPOWER6を発表

・そして2月のInternational Solid State Circuits Conference(ISSCC)」でさらに具体的な内容が発表されました。
(たとえばPC Watch)「ISSCC 2007レポート IBMの次世代プロセッサ「POWER6」の全容」。POWER6搭載サーバーいよいよ今年から登場というスケジュールのようです。

・POWER6の公開情報が少ないため個人的には詳しくないのですが、Real World Technologiesの「Fall Processor Forum 2006: IBM's POWER6」というpreviewがその点ていねいな説明で読み応えがあります。

・数年前まではAlphaプロセッサーやペンティアム・プロセッサーによるクロック周波数競争を横目に、複数演算ユニットによる並列処理や高メモリバンド幅で独自に高性能を実現してきたPOWERプロセッサーですが、Alphaもペンティアム4も消えクロック周波数競争が頭打ちだという意見が定着した矢先に、当のPOWER6プロセッサーが電力消費を増やすことなしに4〜5GHzという高クロック数を可能にするというのは結構衝撃的ではないでしょうか。ZDNetはこう伝えています。
A peek at faster Power6, Cell chips

・こうした記事では米国の方が分析も加え、ストレートに性能の比較を試みる傾向が強いようです。(たとえばThe INQUIRER)「IBM POWER6潜水艦がItanium Montvale巡洋艦を撃沈
IBM POWER6 sub torpedoes Itanium Montvale cruiser


このように技術的な内容は事前にいろいろオープンになってきていますが、肝心のPOWER6搭載システムの製品としての仕様、性能、そして、それが何月何日に出荷開始になり、価格はいくらかということは正式発表を待たなければなりません。可能だということと、実行するということは別というひとつの例で、製品発表となるといろいろなビジネス上の判断も必要になり、製品担当者の緊張がしばらく続くことになります。
1985年の真夏、超大型システムの発表の支援をしていましたが、確か明日は世紀の(?)大発表という日にIBM本社から発表延期のテレックスが入り一同愕然放心(もう時効の話)。やたらに蒸し暑い日でした。


このサイトの掲載内容は個人の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません。


cheer_hpc at 15:54|PermalinkComments(0)TrackBack(0)clip!一般 

2007年02月14日

●HPCはライフサイエンスにどこまで貢献できるか?

・12月に続いて、先週の建国記念日の3連休はライフサイエンスをテーマに30人ほどで天城高原にこもって来ました。前回とは一変、絶好の天気となり富士も見えハッピーな三日間でした。
天城から富士を
・ライフサイエンス、ライフサイエンスと世界中で言われるようになって早6-7年以上が経っています。Blue Geneや次世代スーパーコンピューターでもわかるようにHPCからの大きな貢献が期待されている分野ですが、生命現象がわかってくるにつれますます理解への道のりが遠くなってきているというのが私の実感です。それはさておき、

・その天城で、大手製薬企業のR&D担当役員氏からは、あるブロックバスター薬(年間売上高10億ドル―約1000億円以上の医薬品のことを言います)の開発実例を引かれて、つぎの4点で貢献できるようにならないと本当にHPCが創薬に役立つとは言えないと具体的かつ貴重な指摘です。

1) 創薬ターゲットの構造から、薬となる低分子化合物のデザインと最適化ができること 
2) ねずみや犬などの特定の動物を選んで薬理作用のシミュレーションができるようになること
3) 特定のブロックバスター薬をさらに強力にするための要件が抽出できるようになること。たとえば薬物の体内での代謝、薬物の標的となる臓器での薬物滞留性がシミュレーションなどから推定できるようになること
4) 特定のブロックバスター薬によって副作用を起こす患者かどうかをPharmacoGenomics(PGx)から判定できること。

私はこの分野に精通した専門家ではありませんが、現状としては:
- 1)については一般にドッキング・シミュレーションと言われ、いま急ピッチで研究が進められている分野が答えになります。今はまだ計算量を配慮しての比較的簡単なシミュレーション・モデルによるものが中心ですが、今からでも最もHPCが役立ちそうな分野です。
- 2)は体内の代謝ネットワークが絡む問題で、非常に複雑な問題になることが想像されます。細胞レベルに限ったこの種のアプローチとしてはE-CELLが世界的に有名ですが、体が対象となるとまだこれからです。
- 3)は、2)の人間版といった内容のため、人体の代謝などについての十分なデータ・ペースがどれだけ確立できるかがカギになってきます。
- 4)は、今回のメインテーマだったものですが、いわば研究開発の初期段階にあります。

単にライフサイエンスとHPCというようにひとくくりに言うのではなく、この4点で示されるような創薬研究現場の問題提示からHPCの貢献度を時々考えることも大事だと再認識させられた山ごもりでした。

cheer_hpc at 22:19|PermalinkComments(0)TrackBack(0)clip!閑話休題 

2007年02月04日

●X86系プロセッサーの性能評価は難しい

・先月10日にQuad-CoreのインテルXeon搭載のIBMブレードサーバーHS21の新モデルが発表・出荷開始されましたが、このQuad-CoreのインテルXeonと従来からHPCで評価の高いAMD OpteronのDual-Coreとではベンチマーク性能にどのような特徴が見られるのか、ベンチマーク性能値はどうかと思い、外出もする気にならない寒風の休日昼下がりにWebに公開されているデータから調べてみました。

・まずインテル社とAMD社のWebベンチマーク・サイトを訪ねてみました。インテル社のCompetive Comparisonという資料を見ると、Linpackベンチマーク(Dense Floating-point Operationsのタイトル)で2個のQuad core Xeon X5355(2.66GHz)搭載サーバーによる62GFLOPSというすばらしく高い性能値が引用されています。後で見つけたHPCテクノロジー社のベンチマーク・サイトによると「SSSE3で浮動小数点演算が1クロックで4つできることを考慮すると、理論ピーク性能は2.66GHzの1CPUコアで(2+4)*2.66=15.96GFlops、4coreでは63.84GFlops 」ということなので、理論ピークの97%というVerari Sytems社のベンチマークでは非常に最適化されたコンパイラーを使ったのかもしれませんが、あくまで推察するしかありません。一方、HPCテクノロジー社による基本的に同じ構成によるX5355のベンチマークでは45GFLOPSの性能となっていて、かなり大きな差があります。ただしピーク性能の70%強の性能というのは特に低いものではなく普通のレベルです。
(気づかれたように、いづれも8コアあるうちの4コア使用と勝手に仮定して話を進めています)

・AMD社、インテル社のwebサイトには両社のプロセッサーを比較した各種のベンチマーク結果が紹介されています。同じX86アーキテクチャのため差別化が重要視されているのかもしれません。その中にCFDコードのFluentや衝突解析コードのLS-Dynaの例があります。インテル社のWebサイトではdual-core, quad-core XeonともにAMD Dual-core Opteronよりも高いという性能データを紹介しています。

・しかしDual-Core XeonとQuad-Core Xeonとでは1.67倍の性能比を示したLinpackと違い、FluentとLS-Dynaではそれぞれ1.38倍、1.21倍の性能比に落ちています。

・つぎにAMD社のベンチマーク・サイトのCompute Intensive Application Benchmarksを訪ねてみると、こちらはdual-core同志のみの比較をスレッド数が1、2、4について紹介しています。スレッド数が1、2ではインテル優位、4になると逆転してAMD優勢というデータです。これを見ると8コアを考えたとき、2xQuad-Core Xeonにするかそれとも4xDual-Core Xeonまたは4xDual-Core Opteronにするかという選択肢がどうしても浮かんできます。

・ほかにもVisual Technology社のベンチマーク・サイトが見つかったのでこちらも訪ねると、Quad-Core Xeonについてはないものの、Dual-Core XeonとDual-Core OpteronシステムのLinpackと姫野ベンチマークによるベンチマーク結果が紹介されていました。

姫野ベンチマークではプロセッサー演算速度とメモリバンド幅のバランスが効くので、予想はしていたもののDual-Core OpteronがDual-Core Xeonよりも優勢です。

・最後にIBMのベンチマーク・サイトはいろいろありますがHPC系ベンチマークはこちらが便利です。

・以上ざっと眺めた程度ですが結局のところ、あまりよくわからないな〜というのが今の感想です。

・理由は:
(1) Webで報告・引用されている同一ベンチマーク(たとえばLinpack)でも測定データに幅があること、その理由を推察してもホワイトペーパー並の十分な情報がないため推察にとどまってしまう

(2)ベンチマーク問題の種類に想像以上にセンシティブで、性能比較による優劣が大きく変わる傾向が強く見られる―やってみるまでわからない

(3)分析する側の課題として、プロセッサーの世代交代が早く、プロセッサーのモデルも多岐なのでアーキテクチャまで理解した性能評価がよほどの専門家以外は繁雑で追うのが難しい。

・たとえばwebで紹介されているベンチマーク結果でも、違う世代のAMD OpteronあるいはDual-Core Xeonによるデータがベンチマーク結果として同列に比較対象されていたりするので、注意深く見ないと現状での比較になりません。もっとも製品サイクルが短いため、現状で横並びに比較するということがすでに成立しなくなったという気もします。

公表された一般的なベンチマークではなく、古くから言われているように、自分の部門の主要なプログラムから構成された自分のベンチマーク・セットを使って、自分のためのベンチマークを行うという基本がやはり正解でしょうか。

cheer_hpc at 22:42|PermalinkComments(0)TrackBack(0)clip!一般