2006年09月
2006年09月30日
● IBM POWERフォーラム2006 秋 講演資料掲載中
IBM System p 製品やAIX、Linux, 事例紹介などを盛り込んだ
"IBM POWERフォーラム2006〜秋〜"(2006年9月26日開催)の講演資料が、11月30日までの期間限定でIBMサイトに掲載されました。
・POWER EverywhereとCell最新情報
というのも入っていますので、ご興味のある方は覗いてみてください。
"IBM POWERフォーラム2006〜秋〜"(2006年9月26日開催)の講演資料が、11月30日までの期間限定でIBMサイトに掲載されました。
・POWER EverywhereとCell最新情報
というのも入っていますので、ご興味のある方は覗いてみてください。
2006年09月29日
● ThinkPad バッテリー自主回収のお知らせ
バッテリー自主回収のお知らせが出ています。
なんと、ThinkPadのソニー製バッテリーもリコール対象になってしまいました。
・2005年2月から2006年9月の期間に販売いたしました。以下のいずれかのシステムを購入されたお客様は、今回の自主回収対象のバッテリーをご使用になられている場合がございます。
* ThinkPad R シリーズ (R51e、R52、R60、R60e)
* ThinkPad T シリーズ (T43、T43p、T60)
* ThinkPad X シリーズ (X60、X60s)
ということで、私の持っているX30とX41は対象外になっていました。
・ 念のためレノポのサイトにある"自動ソリューション"で確認すると、
と出てまず一安心。
なんと、ThinkPadのソニー製バッテリーもリコール対象になってしまいました。
・2005年2月から2006年9月の期間に販売いたしました。以下のいずれかのシステムを購入されたお客様は、今回の自主回収対象のバッテリーをご使用になられている場合がございます。
* ThinkPad R シリーズ (R51e、R52、R60、R60e)
* ThinkPad T シリーズ (T43、T43p、T60)
* ThinkPad X シリーズ (X60、X60s)
ということで、私の持っているX30とX41は対象外になっていました。
・ 念のためレノポのサイトにある"自動ソリューション"で確認すると、

と出てまず一安心。
● 論文投稿〆切まであと1週間: HPCS2007 ハイパフォーマンスコンピューティングと計算科学シンポジウム
年明け恒例の、
HPCS2000 ハイパフォーマンスコンピューティングと計算科学シンポジウム
・2007年1月17日(水)-18日(木)
・つくば国際会議場(EPOCHAL TSUKUBA)
の
論文投稿受付締切:2006年 10月6日(金)17時(時間厳守)
論文アップロード締切:2006年 10月9日(月)17時(時間厳守)
が間近です。奮ってご投稿どうぞ
とのことです。
HPCS2000 ハイパフォーマンスコンピューティングと計算科学シンポジウム
・2007年1月17日(水)-18日(木)
・つくば国際会議場(EPOCHAL TSUKUBA)
の
論文投稿受付締切:2006年 10月6日(金)17時(時間厳守)
論文アップロード締切:2006年 10月9日(月)17時(時間厳守)
が間近です。奮ってご投稿どうぞ
とのことです。
2006年09月27日
● AMD・Crayテクニカルワークショップ(東京)が明日開催
東京での開催は明日ですね。
・ 2006年9月28日(木)13:00−17:00 (受付開始12:30〜)
・ 日本AMD株式会社内セミナールーム(新宿区西新宿)
講演と新製品のAMD Opteron(TM) プロセッサに焦点を当てた紹介、コンパイラーや事例紹介などのプログラム構成になっているようです。
・ 2006年9月28日(木)13:00−17:00 (受付開始12:30〜)
・ 日本AMD株式会社内セミナールーム(新宿区西新宿)
講演と新製品のAMD Opteron(TM) プロセッサに焦点を当てた紹介、コンパイラーや事例紹介などのプログラム構成になっているようです。
2006年09月23日
● SC06 - Blue Gene, Cell, そしてAward
SC06, "International Conference on High Performance Computing, Networking and Storage"が11月11日(土)〜17日(金)にフロリダのタンパで開催されます。
ボルチモアでのSC2002以降は足が遠のいてたSCですが、今年は参加してみようと思い直し、AAのディスカウント・エコノミー・チケットとホテルを予約したところです。会場のタンパ・コンベンションセンターに歩いていける範囲にはホテルはあまりなく、しかもSC06が用意したホテルはあらかた満室になっていたため、空港近くのSpringhill Suites Tampa Westshore というホテルを一泊129$で予約するはめになってしまいました。
最初の三日間はtutorial中心に進み、盛況になるのはコンファレンスが始まる11月14日(火)からなので、それに合わせての短期日程です。
このところ海外に出なかったためAAのプラチナ会員が失効していたのに気がつき、ちょっとがっかり。
ことしのプログラムはどんな感じかなと目を皿にしてながめてみると、ペタスケール・コンピューティングが手に届くところにきているということでしょうか、
・ BOF: The Pathway to Petascale Science
・ BOF: Approaching Petascale
・ パネル: High Productivity Computing and Usable Petascale Systems (HPCS)
と、ペタFLOPSをさかなに議論を盛り上げる魂胆のようです。
実現できたときの評価もそろそろ考えようということで、
・ BOF:Evaluating Petascale Infrastructure Systems: Benchmarks, Models, and Applications
というもあります。
BOFというのはBirds of a Featherのことで、特定のテーマに関連や関心のある人が集まり、自由に議論したり情報交換したりする場を指す(英辞郎 on the Web)ということでSC06では、40以上のBOFが開かれます。
■ ペタスケール・コンピューティング実現への先鋒をつとめているBlue Geneについては、ゴードン・ベル賞のファイナリストの論文にも見られるように、応用結果が発表される段階に入ってきました。ファイナリスト論文の他にも、
・ Blue Brain Project (Ecole Polytechnique Federale de Lausanne)
・ Blue Matter (IBM Research)
ソフトウェアについては、
・ Topology Mapping for Blue Gene/L Supercomputer (IBM Research)
があります。
■ そして今年注目のニューカマーはと言えばなんといってもCell BEのようです。特にそのプログラミングが関心事でしょう。
・ CellSs: A Programming Model for the Cell BE Architecture (Barcelona Supercomputing Center)
・ BOF: Cell BE Software Programming and Toolkits (IBM)
とあります。
そして、さらに
・ 招待講演: Real-time Supercomputing and Technology for Games and Entertainment (Cell BE Synergistic Processor Unit(SPU)のIBM チーフ・アーキテクト)
IBMのペタFLOPSに関したテクノロジー等について総括しているのが、Exhibitor Forumでの
・ Innovation beyond Imagination: The Road to PetaFLOPS Computing (IBM)
です。
☆★ さてSC06といえば、日本からも例年受賞者が出ている下の各種の賞が気になります。
・ Cray and Fernbach Awards
・ Gordon Bell Awards
・ Best Paper Awards
・ Best Student Paper Awards
・ HPC Competitions
-- HPC Analytics Challenge
-- HPC Bandwidth Challenge
-- HPC Storage Challenge
・ACM Student Research Competition
ゴードンベル賞のファイナリストについては、以前のブログのとおりですが、他の賞でもファイナリストに
・ HPC Analytics Challenge: 大阪大チーム
・ HPC Bandwidth Challenge: JAXA(宇宙航空研究開発機構)チーム
・ HPC Storage Challenge: KEK/筑波大チーム
が入っています。
(漏れがあったらごめんなさい)。
発表は、11月16日(木)の午後のようです。ゴードンベル賞も合わせて、いい結果に期待!です。
ボルチモアでのSC2002以降は足が遠のいてたSCですが、今年は参加してみようと思い直し、AAのディスカウント・エコノミー・チケットとホテルを予約したところです。会場のタンパ・コンベンションセンターに歩いていける範囲にはホテルはあまりなく、しかもSC06が用意したホテルはあらかた満室になっていたため、空港近くのSpringhill Suites Tampa Westshore というホテルを一泊129$で予約するはめになってしまいました。
最初の三日間はtutorial中心に進み、盛況になるのはコンファレンスが始まる11月14日(火)からなので、それに合わせての短期日程です。
このところ海外に出なかったためAAのプラチナ会員が失効していたのに気がつき、ちょっとがっかり。
ことしのプログラムはどんな感じかなと目を皿にしてながめてみると、ペタスケール・コンピューティングが手に届くところにきているということでしょうか、
・ BOF: The Pathway to Petascale Science
・ BOF: Approaching Petascale
・ パネル: High Productivity Computing and Usable Petascale Systems (HPCS)
と、ペタFLOPSをさかなに議論を盛り上げる魂胆のようです。
実現できたときの評価もそろそろ考えようということで、
・ BOF:Evaluating Petascale Infrastructure Systems: Benchmarks, Models, and Applications
というもあります。
BOFというのはBirds of a Featherのことで、特定のテーマに関連や関心のある人が集まり、自由に議論したり情報交換したりする場を指す(英辞郎 on the Web)ということでSC06では、40以上のBOFが開かれます。
■ ペタスケール・コンピューティング実現への先鋒をつとめているBlue Geneについては、ゴードン・ベル賞のファイナリストの論文にも見られるように、応用結果が発表される段階に入ってきました。ファイナリスト論文の他にも、
・ Blue Brain Project (Ecole Polytechnique Federale de Lausanne)
・ Blue Matter (IBM Research)
ソフトウェアについては、
・ Topology Mapping for Blue Gene/L Supercomputer (IBM Research)
があります。
■ そして今年注目のニューカマーはと言えばなんといってもCell BEのようです。特にそのプログラミングが関心事でしょう。
・ CellSs: A Programming Model for the Cell BE Architecture (Barcelona Supercomputing Center)
・ BOF: Cell BE Software Programming and Toolkits (IBM)
とあります。
そして、さらに
・ 招待講演: Real-time Supercomputing and Technology for Games and Entertainment (Cell BE Synergistic Processor Unit(SPU)のIBM チーフ・アーキテクト)
IBMのペタFLOPSに関したテクノロジー等について総括しているのが、Exhibitor Forumでの
・ Innovation beyond Imagination: The Road to PetaFLOPS Computing (IBM)
です。
☆★ さてSC06といえば、日本からも例年受賞者が出ている下の各種の賞が気になります。
・ Cray and Fernbach Awards
・ Gordon Bell Awards
・ Best Paper Awards
・ Best Student Paper Awards
・ HPC Competitions
-- HPC Analytics Challenge
-- HPC Bandwidth Challenge
-- HPC Storage Challenge
・ACM Student Research Competition
ゴードンベル賞のファイナリストについては、以前のブログのとおりですが、他の賞でもファイナリストに
・ HPC Analytics Challenge: 大阪大チーム
・ HPC Bandwidth Challenge: JAXA(宇宙航空研究開発機構)チーム
・ HPC Storage Challenge: KEK/筑波大チーム
が入っています。
(漏れがあったらごめんなさい)。
発表は、11月16日(木)の午後のようです。ゴードンベル賞も合わせて、いい結果に期待!です。
2006年09月22日
● Grid, Autonomic Computing & OSS 論文コンテスト
日本IBMが、人材育成支援を目的にした論文コンテストを実施中です。
・ コンテスト名:
Scholars Challenge Program 2006
IBM アカデミック・イニシアティブ・プレゼンツ
Grid, Autonomic Computing & OSS 論文コンテスト
・ 対象は大学生および専門学校生
・ 論文テーマは、グリッド・コンピューティング、オートノミック・コンピューティング、オープン・スタンダード・テクノロジーのいずれかに関したもの
・論文締め切り: 10月31日(火)
このコンテストには、卒業論文の内容で応募することも可能です。
なお、優秀者には米国のIBM研究所見学ツアーにご招待します。
とあります。
教官のみなさま、優秀な学生に応募をすすめられたらいかがですか。
・ コンテスト名:
Scholars Challenge Program 2006
IBM アカデミック・イニシアティブ・プレゼンツ
Grid, Autonomic Computing & OSS 論文コンテスト
・ 対象は大学生および専門学校生
・ 論文テーマは、グリッド・コンピューティング、オートノミック・コンピューティング、オープン・スタンダード・テクノロジーのいずれかに関したもの
・論文締め切り: 10月31日(火)
このコンテストには、卒業論文の内容で応募することも可能です。
なお、優秀者には米国のIBM研究所見学ツアーにご招待します。
とあります。
教官のみなさま、優秀な学生に応募をすすめられたらいかがですか。
● 世界一の並列化コンパイラーを作る
世界一の並列化コンパイラーを作る - マルチコア・Everywhereの21世紀プロセッサーを先取り
日本の競争力持続という観点から、イノベーティブな研究の重要性はいうまでもありません。
「情報家電の製品開発サイクルは半年から一年程度とスーパーコンピューターに比べて非常に短いです・・・それを実現するのが自動並列化コンパイラーと協調型マルチコア・チップの組み合わせです。こうした研究開発が日本製品の競争力強化へとつながっていくと考えています」(早稲田大学 笠原 博徳教授)
Innovativeとはこういうことだという例のひとつですね。
日本の競争力持続という観点から、イノベーティブな研究の重要性はいうまでもありません。
「情報家電の製品開発サイクルは半年から一年程度とスーパーコンピューターに比べて非常に短いです・・・それを実現するのが自動並列化コンパイラーと協調型マルチコア・チップの組み合わせです。こうした研究開発が日本製品の競争力強化へとつながっていくと考えています」(早稲田大学 笠原 博徳教授)
Innovativeとはこういうことだという例のひとつですね。
2006年09月20日
● 「次世代スーパーコンピューティング・シンポジウム2006」から
理化学研究所(理研)主催の「次世代スーパーコンピューティング・シンポジウム2006」が昨日と今日の二日間東京で開催されました。
今年は基調講演(鈴木 盛雄 日産自動車株式会社 技術開発本部統合CAE部 部長による「クルマの開発におけるCAEの役割と今後の可能性―計算スピードの飛躍的向上で何が変わるか―」)と立花隆氏による招待講演以外はつぎの6種類のパネル・ディスカッションで構成され、10ペタFLOPS級性能のスーパーコンピューターを使うユーザーの観点から担当分野でのブレークスルーの可能性や産業界による実利用への展開などを主題に様々な主張、議論がなされました。
A. (ライフサイエンス)「生命科学の新たな可能性を拓く」 (モデレータ:郷 通子 お茶の水女子大学 学長)
B. (工学)「シミュレーションが拓く知的モノづくりの夢」 (モデレータ:小林 敏雄 (財)日本自動車研究所 所長)
C. (ナノ・材料)「量子シミュレーションが拓くナノの世界」 (モデレータ:平尾 公彦 東京大学大学院工学系研究科 教授)
D. (環境・防災)「持続的発展と安全・安心な社会のために」 (モデレータ:沖 大幹 東京大学生産技術研究所 助教授)
E. (利用環境)「サイバー・サイエンス・インフラストラクチャ(最先端学術情報基盤)の構築に向けて」 (モデレータ:西尾 章治郎 大阪大学大学院情報科学研究科長 教授)、
F. (物理・天文)「理論・実験・観測と計算科学の展望」 (モデレータ:小柳 義夫 工学院大学情報学部長・教授)
パネルでは、各分野の第一級の国内研究者で構成されているモデレータ、パネリスト(各5名)のフランクで深い洞察からの主張、ディスカッションが続けられ、最後に有志の名前で提言にまとめ上げた上で主催者の理研に提出するなど、予想していた以上に充実したシンポジウムになったと思います。
システムのアーキテクチャが不明な中のパネル・ディスカッションのせいもあり、対象分野が360度に渡っていて期待もたいへん高い印象を受けました。しかし、決定された特定のアーキテクチャに対してどのように提言を活かすことができるかは未知数の面があり、参加者の多くはそう感じられたと思います。逆に、それ故アーキテクチャに拘束されない本質的で重要な提言としてまとめることができたかもしれません。
次世代スーパーコンピュータ開発実施本部副本部長 坂田 東一 理化学研究所理事の閉会の挨拶によると、来年のシンポジウムは若い人で会場がうまるように内容を企画するそうです。確かに完成時のユーザー層に大きな関心を持ってもらわないことには。
・ なおアーキテクチャについては、シンポジウム初日に理研と企業二チームが概念設計の契約を締結しました。この結果を元に来年3月末までにアーキテクチャが決定されます。
「次世代スーパーコンピュータ・システムの概念設計を開始
−世界最高性能のスパコン開発に挑む−」
今年は基調講演(鈴木 盛雄 日産自動車株式会社 技術開発本部統合CAE部 部長による「クルマの開発におけるCAEの役割と今後の可能性―計算スピードの飛躍的向上で何が変わるか―」)と立花隆氏による招待講演以外はつぎの6種類のパネル・ディスカッションで構成され、10ペタFLOPS級性能のスーパーコンピューターを使うユーザーの観点から担当分野でのブレークスルーの可能性や産業界による実利用への展開などを主題に様々な主張、議論がなされました。
A. (ライフサイエンス)「生命科学の新たな可能性を拓く」 (モデレータ:郷 通子 お茶の水女子大学 学長)
B. (工学)「シミュレーションが拓く知的モノづくりの夢」 (モデレータ:小林 敏雄 (財)日本自動車研究所 所長)
C. (ナノ・材料)「量子シミュレーションが拓くナノの世界」 (モデレータ:平尾 公彦 東京大学大学院工学系研究科 教授)
D. (環境・防災)「持続的発展と安全・安心な社会のために」 (モデレータ:沖 大幹 東京大学生産技術研究所 助教授)
E. (利用環境)「サイバー・サイエンス・インフラストラクチャ(最先端学術情報基盤)の構築に向けて」 (モデレータ:西尾 章治郎 大阪大学大学院情報科学研究科長 教授)、
F. (物理・天文)「理論・実験・観測と計算科学の展望」 (モデレータ:小柳 義夫 工学院大学情報学部長・教授)
パネルでは、各分野の第一級の国内研究者で構成されているモデレータ、パネリスト(各5名)のフランクで深い洞察からの主張、ディスカッションが続けられ、最後に有志の名前で提言にまとめ上げた上で主催者の理研に提出するなど、予想していた以上に充実したシンポジウムになったと思います。
システムのアーキテクチャが不明な中のパネル・ディスカッションのせいもあり、対象分野が360度に渡っていて期待もたいへん高い印象を受けました。しかし、決定された特定のアーキテクチャに対してどのように提言を活かすことができるかは未知数の面があり、参加者の多くはそう感じられたと思います。逆に、それ故アーキテクチャに拘束されない本質的で重要な提言としてまとめることができたかもしれません。
次世代スーパーコンピュータ開発実施本部副本部長 坂田 東一 理化学研究所理事の閉会の挨拶によると、来年のシンポジウムは若い人で会場がうまるように内容を企画するそうです。確かに完成時のユーザー層に大きな関心を持ってもらわないことには。
・ なおアーキテクチャについては、シンポジウム初日に理研と企業二チームが概念設計の契約を締結しました。この結果を元に来年3月末までにアーキテクチャが決定されます。
「次世代スーパーコンピュータ・システムの概念設計を開始
−世界最高性能のスパコン開発に挑む−」
2006年09月18日
● HPC向け実力十分のブレード・サーバーがにぎやかに

・ ブレード・サーバーというと、最初に登場した省スペースなだけの非力なWebサーバーのイメージが残っているかもしれませんが、それも今は昔の話。形も刃物というよりは厚板です。
・Top500スーパーコンピュータ・リストで現在11位のバルセロナ・スーパーコンピュータ・センターのMarenostrum(地中海という意味)を例にあげるまでもなく、HPCでも通用する実力十分な製品があり、さらに8月から9月にかけてAMD Opteron dual core搭載のIBM LS21ブレード・センターや9コアのCell BE搭載のIBM QS20 ブレード・センターが発表され、急ににぎやかになってきました。
・ 8月30日に発表されたOpteron dual core搭載のIBM LS21ブレード・センターは、SPEC fp_rate2000が89.2で、3年前であればUltraSPARC IIIを使用したSun Fire 4800 (8-way)(同 86.3)や、 Power4+を使用したIBM pSeries 655 (1500 MHz, 8-way) (同 92.8) クラスのSPEC fp_rate2000の性能です。
・ いま4-wayでこれ以上の性能を求めようとするとIBM System p5 550 (2100 MHz, 4 コア)(同 149)のようにPOWER5+ dual coreによるシステムを選ばなければならなくなるほどの高いHPC性能を示しています。
・ IBMのブレードはすべて高さが7Uに統一されていて、7Uまたは9Uの高さの専用シャシーに14枚のブレード(LS21では14x4 プロセッサー・コアで合計 56 コア) が納まるので、1U当たり 8または6.2 コア(7U または9Uシャシー使用時)の計算になります。4 コア搭載どまりの1Uサーバーよりも省スペースなのがわかります。
・LS21ブレードセンターのHigh Performance LINPACK性能は、ホワイトペーパーによると18.2 GFLOPS(ピーク性能の87.5%)ですので、1シャシーの単純合計ではその14倍の255 GFLOPSになります。本当はこのホワイトペーパーの内容を紹介したかったのですが、今日は時間ぎれ・・・
・ もっともブレード・サーバーは単に省スペースなだけでなく、いろいろ革新的な面を持っています。ブレードを納めるシャシーの構造もモジュラー構造になっていて、シンプルによくできていると思います。
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」
2006年09月13日
● Cell ベースのブレード・センターをIBMが発表
Cellペースのブレード・センターQS20が9月12日(米国時間)にIBMから発表されました。
IBM Makes First Cell Computer Generally Available
Cell-Based BladeCenter System Poised to Boost Performance for New Applications in Aerospace, Oil & Gas and Medical Industries
特徴は、
・3.2GHzのCell Broadband Engineを2個搭載
・ 1GB XDRAM
・ ピーク・パフォーマンス:500 GFLOPS(単精度演算)
・ ブレードに40GB IDE HDDを搭載
・ 1Gbイーサネット・コントローラを2個搭載
・ ダブル・ワイド・ブレード(シャーシのスロットを2個占有)
・ InfiniBand(IB)オプション(Mellanox IB 4x Host Channel Adapter を2個サポート)
・ ブレード・シャーシ当たりのピークパフォーマンス:3.5 TFLOPS(単精度演算)
とりあえず速報まで。
IBM Makes First Cell Computer Generally Available
Cell-Based BladeCenter System Poised to Boost Performance for New Applications in Aerospace, Oil & Gas and Medical Industries
特徴は、
・3.2GHzのCell Broadband Engineを2個搭載
・ 1GB XDRAM
・ ピーク・パフォーマンス:500 GFLOPS(単精度演算)
・ ブレードに40GB IDE HDDを搭載
・ 1Gbイーサネット・コントローラを2個搭載
・ ダブル・ワイド・ブレード(シャーシのスロットを2個占有)
・ InfiniBand(IB)オプション(Mellanox IB 4x Host Channel Adapter を2個サポート)
・ ブレード・シャーシ当たりのピークパフォーマンス:3.5 TFLOPS(単精度演算)
とりあえず速報まで。
2006年09月12日
● ロスアラモスとRoadrunner
RoadrunnerというとTVアニメの「ワイリーとロードランナー」の主役の一匹、砂漠の中を砂煙をあげて走りまくるあのキャラクター鳥、ロードランナーが有名です。この鳥はロスアラモスのあるニューメキシコ州ではよく知られた鳥のようです。

ニューメキシコ州の州都アルバカーキのAlbuquerque High Performance Computing Centerは、スーパークラスター開発の草分けとして知られています。ここに元祖(?)ロードランナーがあります。これはそのクラスター上に置いてあったロードランナーのマスコット人形。
ロードランナーの猛疾走をあの手この手でさえぎるコヨーテのワイリーのキャラクターの方も何とも楽しいものです。ただ郊外では家の窓をあけておくとコヨーテが入ってくることがあるので赤ちゃんがいる家では要注意とか。
ニューメキシコ州の州都アルバカーキのAlbuquerque High Performance Computing Centerは、スーパークラスター開発の草分けとして知られています。ここに元祖(?)ロードランナーがあります。これはそのクラスター上に置いてあったロードランナーのマスコット人形。
ロードランナーの猛疾走をあの手この手でさえぎるコヨーテのワイリーのキャラクターの方も何とも楽しいものです。ただ郊外では家の窓をあけておくとコヨーテが入ってくることがあるので赤ちゃんがいる家では要注意とか。
●「次世代スーパーコンピューティング・シンポジウム2006」
独立行政法人理化学研究所主催の「次世代スーパーコンピューティング・シンポジウム2006」の受付締め切りがまもなくです。
受付締め切りは9月14日(木)午後1時まで。先着順 300名程度ということで、すでに満席のパネル・ディカッションも。
申込方法 :Webページhttp://www.nsc.riken.jp/symposium2006.htmlから事前申込。
受付締め切りは9月14日(木)午後1時まで。先着順 300名程度ということで、すでに満席のパネル・ディカッションも。
申込方法 :Webページhttp://www.nsc.riken.jp/symposium2006.htmlから事前申込。
2006年09月10日
● Roadrunnerに使われる「x3755」とはなにものか
RoadrunnerにはCellブレードの他に、合計で16,000個超のAMD Opteron プロセッサー・コアを搭載した多数のIBM® System x™ 3755 サーバーが利用されると発表されています。
このx3755にも興味があったので、例の通りホワイトペーパー 「Performance of the IBM System x 3755」をながめたところ、なかなか面白いサーバーのようなので、ホワイトペーパーを参考にその特徴などを紹介してみます。
なお引用した数字はすべてこのホワイトペーパーからのものです。
x3755は2.0 GHz, 2.2 GHz, 2.6 GHzそして2.8 GHzのAMD Opteron dual-coreプロセッサー用のソケットを4個と、32個の667 MHz DDR2高速メモリ用DIMM slot、さらにHTX slotやPCI-ExpressといったI/Oスロットを持った4Uサイズのラック・マウント型サーバーです。
DIMMは現在4GBまであるので、x3755は最大で128GBという大容量メモリーを利用できます。
● IBMデザインのみそ
ただし、標準の4ソケットOpteronプロセッサー・デザインと違う点が二点あります。実はそれがx3755がさらに高性能を得られるみそなのです。まずAMDのガイドラインではタイミング等の問題から複数DIMMを使う場合のクロックを533MHzと指定しているところを、
1. x3755では32個DIMMでも667MHzとしました。これはタイミングを上げても安全な、IBM独自の方法を発見したためです。その結果高速の128GBという大容量メモリが実現でき、クロック増加に対してスケーラブルなメモリー・スループット性能が得られました。
2. パススルー・モジュール(PT)と呼ばれるものが、もうひとつのx3755におけるイノベーションです。
・ x3755では4プロセッサー(プロセッサー1個が2個のプロセッサー・コアを持っている)が正方形の頂点に配置されます。辺に当たるところがコヒーレントHyperTranport(cHT)に該当し、データ転送を行います。このようにx3755はリング・トポロジー構成です。
・ そのため向かい合ったプロセッサー間のデータ授受のためにはcHTを2個(2ホップ)通らなければならず遅延が大きくなります。これを避けるためにx3755ではAMDの標準設計とは異なり、コロンブスの卵のようなアイデアですが、3プロセッサー構成の場合にはパススルー・モジュールを4個目のプロセッサーの代わりに入れ、どのプロセッサー間も1ホップで通信できるようにしています。
このアイデアがシステム性能にどれだけ効果的かは、3プロセッサー構成のSTREAMベンチマークがPTなしで14GB/sなのに対して、PTありでは18GB/sになることからもわかります。
● x3755はNUMAデザイン
x3755に限らず、Opteronを使用したマルチプロセッサー・システムはSMPではなく、アドレス共有のNUMA(Non-Uniform Memory Access)デザインになります。
その理由は、自分のプロセッサー側にあるメモリー(ローカルメモリー)にあるデータは速くアクセスできる一方、構造的に、別のプロセッサー側にあるメモリーのデータについてはキャッシュの確認やデータ転送にもっと時間がかかるためです。
NUMAでのメモリーのアドレス管理の方法も、
1. ローカルメモリーを4Kバイトのページに分割して各プロセッサーに順番に割り当ててやり、それを各プロセッサーで繰り返すことで全体としてフラットなメモリー管理にするノード・インターリービングの方法と、
2.ローカルメモリーはすべて自分のプロセッサーに割当て、そのアドレスの終わりに次のプロセッサーのローカルメモリーのアドレスを続けて割り当てていくことを繰り返すインターリービングの方法ー
これらのふたつの方法が用意されBIOSで選択できるようになっています。
ベンチマークからの結論は、ノード・インターリービングではない後者の方が約2倍高いメモリー・スループットが得られるというものです。
このようにX3755は性能面でいろいろ工夫されているため、使いこなしのための知識が少し必要のようです。
NUMAというとConvex社や昔IBMが買収したSEQUENT社が有名でした。どちらももう存在しない企業ですがテクノロジーはいろいろなところで脈々と続いているということでしょうか。
● HPC性能は?
・ HPL(High Performance LINPACK) 性能
2.8GHzのdual-core Opteron 4プロセッサー構成で、64GBメモリーの場合のHPL(High Performance LINPACK)性能は39GFLOPSと理論値性能48.1GFLOPSの87.5%と非常に良好です。(もちろんメモリーを減らすと問題サイズNも小さくなるためにHPLの性能は下がりますが)
・ SPEC CPU2000 性能
Intergerおよび64bit floating point性能ともにクロックを上げるにつれてリニアに性能があがります。これはメモリー性能が十分なためと、もうひとつはプロセッサー・クロック増加につれてメモリー・コントローラーへのリクエストも速くなるからです。
● 結論
x3755は、標準的大容量メモリ搭載Opteron 8-way (4 dual-core processor)サーバーを越え、HPC向けにIBMのイノべーティブな改良を施した高性能NUMA計算サーバーだとわかります。
Roadrunnerに採用されたのも一理あります。
また高メモリスループットに加え、HTXやPCI-ExpressのI/Oスロットも豊富なため高性能ファイルサーバーにも適しています。
ところで、Roadrunnerには4プロセッサーx3755ではなく3プロセッサーx3755を使うのでしょうか。 たぶんそうはならないでしょうね。
もしあなたが設計者ならどっちにします?
(2006.9.12更新)
このサイトの掲載内容は個人の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません。
このx3755にも興味があったので、例の通りホワイトペーパー 「Performance of the IBM System x 3755」をながめたところ、なかなか面白いサーバーのようなので、ホワイトペーパーを参考にその特徴などを紹介してみます。
なお引用した数字はすべてこのホワイトペーパーからのものです。
x3755は2.0 GHz, 2.2 GHz, 2.6 GHzそして2.8 GHzのAMD Opteron dual-coreプロセッサー用のソケットを4個と、32個の667 MHz DDR2高速メモリ用DIMM slot、さらにHTX slotやPCI-ExpressといったI/Oスロットを持った4Uサイズのラック・マウント型サーバーです。
DIMMは現在4GBまであるので、x3755は最大で128GBという大容量メモリーを利用できます。
● IBMデザインのみそ
ただし、標準の4ソケットOpteronプロセッサー・デザインと違う点が二点あります。実はそれがx3755がさらに高性能を得られるみそなのです。まずAMDのガイドラインではタイミング等の問題から複数DIMMを使う場合のクロックを533MHzと指定しているところを、
1. x3755では32個DIMMでも667MHzとしました。これはタイミングを上げても安全な、IBM独自の方法を発見したためです。その結果高速の128GBという大容量メモリが実現でき、クロック増加に対してスケーラブルなメモリー・スループット性能が得られました。
2. パススルー・モジュール(PT)と呼ばれるものが、もうひとつのx3755におけるイノベーションです。
・ x3755では4プロセッサー(プロセッサー1個が2個のプロセッサー・コアを持っている)が正方形の頂点に配置されます。辺に当たるところがコヒーレントHyperTranport(cHT)に該当し、データ転送を行います。このようにx3755はリング・トポロジー構成です。
・ そのため向かい合ったプロセッサー間のデータ授受のためにはcHTを2個(2ホップ)通らなければならず遅延が大きくなります。これを避けるためにx3755ではAMDの標準設計とは異なり、コロンブスの卵のようなアイデアですが、3プロセッサー構成の場合にはパススルー・モジュールを4個目のプロセッサーの代わりに入れ、どのプロセッサー間も1ホップで通信できるようにしています。
このアイデアがシステム性能にどれだけ効果的かは、3プロセッサー構成のSTREAMベンチマークがPTなしで14GB/sなのに対して、PTありでは18GB/sになることからもわかります。
● x3755はNUMAデザイン
x3755に限らず、Opteronを使用したマルチプロセッサー・システムはSMPではなく、アドレス共有のNUMA(Non-Uniform Memory Access)デザインになります。
その理由は、自分のプロセッサー側にあるメモリー(ローカルメモリー)にあるデータは速くアクセスできる一方、構造的に、別のプロセッサー側にあるメモリーのデータについてはキャッシュの確認やデータ転送にもっと時間がかかるためです。
NUMAでのメモリーのアドレス管理の方法も、
1. ローカルメモリーを4Kバイトのページに分割して各プロセッサーに順番に割り当ててやり、それを各プロセッサーで繰り返すことで全体としてフラットなメモリー管理にするノード・インターリービングの方法と、
2.ローカルメモリーはすべて自分のプロセッサーに割当て、そのアドレスの終わりに次のプロセッサーのローカルメモリーのアドレスを続けて割り当てていくことを繰り返すインターリービングの方法ー
これらのふたつの方法が用意されBIOSで選択できるようになっています。
ベンチマークからの結論は、ノード・インターリービングではない後者の方が約2倍高いメモリー・スループットが得られるというものです。
このようにX3755は性能面でいろいろ工夫されているため、使いこなしのための知識が少し必要のようです。
NUMAというとConvex社や昔IBMが買収したSEQUENT社が有名でした。どちらももう存在しない企業ですがテクノロジーはいろいろなところで脈々と続いているということでしょうか。
● HPC性能は?
・ HPL(High Performance LINPACK) 性能
2.8GHzのdual-core Opteron 4プロセッサー構成で、64GBメモリーの場合のHPL(High Performance LINPACK)性能は39GFLOPSと理論値性能48.1GFLOPSの87.5%と非常に良好です。(もちろんメモリーを減らすと問題サイズNも小さくなるためにHPLの性能は下がりますが)
・ SPEC CPU2000 性能
Intergerおよび64bit floating point性能ともにクロックを上げるにつれてリニアに性能があがります。これはメモリー性能が十分なためと、もうひとつはプロセッサー・クロック増加につれてメモリー・コントローラーへのリクエストも速くなるからです。
● 結論
x3755は、標準的大容量メモリ搭載Opteron 8-way (4 dual-core processor)サーバーを越え、HPC向けにIBMのイノべーティブな改良を施した高性能NUMA計算サーバーだとわかります。
Roadrunnerに採用されたのも一理あります。
また高メモリスループットに加え、HTXやPCI-ExpressのI/Oスロットも豊富なため高性能ファイルサーバーにも適しています。
ところで、Roadrunnerには4プロセッサーx3755ではなく3プロセッサーx3755を使うのでしょうか。 たぶんそうはならないでしょうね。
もしあなたが設計者ならどっちにします?
(2006.9.12更新)
このサイトの掲載内容は個人の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません。
2006年09月08日
● Cellのプログラミング・モデルとは
昨日のブログでは舌足らずになったCellのプログラミング・モデルについて、IBMの「Cell Broadband Engine
Programming Tutorial, Version 1.1」を参考にして少し紹介します。
ちなみにCell Broadband Engine (Cellアーキテクチャの正式名称)の様々な資料やSDKなどのソフトウェアはIBM DeveloperWorksのCell Broadband Engine resource centerに膨大な量が公開されています。このチュートリアルも185ページあります。
チュートリアルの4章プログラミング・モデルの冒頭には、「どんなプロセッサーであれ、コーディングの最適化はハードウェアのユニークな特徴を活用することで到達される。」と強烈な主張が書かれています。
さてその特徴はというと、Cellでは、PPE(PowerPC Processor Element)に加え8個という大量のSPE(Synergistic Processor Element)ーほとんどSIMDエンジンそのもの、から構成されます。
SPEそれぞれは大容量レジスター・ファイル(128ビットx128エントリー)と、計算と同時平行に作動できデータ転送時のメモリー遅延を隠してくれるDMAとを備えています。
各SPEのLS(ローカル・ストア)と呼ばれる命令およびデータ共用のメモリーは256Kバイトと小容量です。
プログラミングにはC言語が使われますが、その7つのプログラミング・モデルと言われているものは、
1.機能オフロード モデル(Function-Offload Model)
・性能に影響する処理部分をPPEからSPEに移して、その処理をSPEに任せるモデル。Remote Procedure Call(RPC)モデルといわれるものと同じ。
2.デバイス拡張モデル(Device-Extension Model)
・1.と同じだがSPEはI/Oデバイスとしてみなされ、I/O処理がオフロードされるモデル。
3.計算加速モデル (Computation-Acceleration Model)
・いわばSPEが主役になるモデルで、小粒度スレッドをSPE同志がやり取りする処理により高速の計算を行なうモデル。このモデルではPPEはコントロールとシステムサービスのみ行う。
4.ストリーミング モデル (Streaming Model)
・SPE間でデータを流しながら計算していくモデル。チップ内のデータバンド幅はDMAによるオフチップのデータバンド幅に比べ一桁大きいため、Cellの利点を生かしたモデル。
5.SMPモデル (Shared-Memory Multiprocessor Model)
・キャッシュ・コヒーレントなSMPモデルと同一にPPEとSPPが働くモデル。このときSPPのDMAはすべてキャッシャ・コヒーレントで動作する。
6.非対称スレッド・ランタイム モデル (Asymmetric-Thread Runtime Model)
・各スレッドがPPEまたはSPPで実行するようにスケジュールされ、通常のSMPのときと同じように相互に対話しながら実行するモデル。スレッドのスケジューリング・ポリシーは性能最適化。
7.ユーザーモード・スレッド モデル(User-Mode Thread Model)
・マイクロスレッドと呼ぶユーザー・レベル機能でSPEのスレッドを管理し、OSは感知しないモデル。
・オーバーヘッドのタイミングを正確に計算できるので、ゲーム・プログラミングなどに向いている?
わかったようなわからないような説明もあり、いろいろ経験していかないと使い分けについてはっきりしたことは言えませんが、プログラム例を見るとさほど難しくはなさそうです。
知的好奇心を満たしてくれるのに加え、なにより最適化がうまくできると1チップでも100GFLOPS(但し単精度計算)以上出そうだという実利面も期待できます。
(ちなみにCell Broadband Engine Architecture and its first implementationによると3.2GHzクロックCell BEでLinpack (S.P.) 4kx4kが156 GFLOPS.)。
というようなことを友人に話すと、う〜んとうなって終わってしまいました。
アグレッシブな方、挑戦いかがですか。
(2006年9月12日更新)
Programming Tutorial, Version 1.1」を参考にして少し紹介します。
ちなみにCell Broadband Engine (Cellアーキテクチャの正式名称)の様々な資料やSDKなどのソフトウェアはIBM DeveloperWorksのCell Broadband Engine resource centerに膨大な量が公開されています。このチュートリアルも185ページあります。
チュートリアルの4章プログラミング・モデルの冒頭には、「どんなプロセッサーであれ、コーディングの最適化はハードウェアのユニークな特徴を活用することで到達される。」と強烈な主張が書かれています。
さてその特徴はというと、Cellでは、PPE(PowerPC Processor Element)に加え8個という大量のSPE(Synergistic Processor Element)ーほとんどSIMDエンジンそのもの、から構成されます。
SPEそれぞれは大容量レジスター・ファイル(128ビットx128エントリー)と、計算と同時平行に作動できデータ転送時のメモリー遅延を隠してくれるDMAとを備えています。
各SPEのLS(ローカル・ストア)と呼ばれる命令およびデータ共用のメモリーは256Kバイトと小容量です。
プログラミングにはC言語が使われますが、その7つのプログラミング・モデルと言われているものは、
1.機能オフロード モデル(Function-Offload Model)
・性能に影響する処理部分をPPEからSPEに移して、その処理をSPEに任せるモデル。Remote Procedure Call(RPC)モデルといわれるものと同じ。
2.デバイス拡張モデル(Device-Extension Model)
・1.と同じだがSPEはI/Oデバイスとしてみなされ、I/O処理がオフロードされるモデル。
3.計算加速モデル (Computation-Acceleration Model)
・いわばSPEが主役になるモデルで、小粒度スレッドをSPE同志がやり取りする処理により高速の計算を行なうモデル。このモデルではPPEはコントロールとシステムサービスのみ行う。
4.ストリーミング モデル (Streaming Model)
・SPE間でデータを流しながら計算していくモデル。チップ内のデータバンド幅はDMAによるオフチップのデータバンド幅に比べ一桁大きいため、Cellの利点を生かしたモデル。
5.SMPモデル (Shared-Memory Multiprocessor Model)
・キャッシュ・コヒーレントなSMPモデルと同一にPPEとSPPが働くモデル。このときSPPのDMAはすべてキャッシャ・コヒーレントで動作する。
6.非対称スレッド・ランタイム モデル (Asymmetric-Thread Runtime Model)
・各スレッドがPPEまたはSPPで実行するようにスケジュールされ、通常のSMPのときと同じように相互に対話しながら実行するモデル。スレッドのスケジューリング・ポリシーは性能最適化。
7.ユーザーモード・スレッド モデル(User-Mode Thread Model)
・マイクロスレッドと呼ぶユーザー・レベル機能でSPEのスレッドを管理し、OSは感知しないモデル。
・オーバーヘッドのタイミングを正確に計算できるので、ゲーム・プログラミングなどに向いている?
わかったようなわからないような説明もあり、いろいろ経験していかないと使い分けについてはっきりしたことは言えませんが、プログラム例を見るとさほど難しくはなさそうです。
知的好奇心を満たしてくれるのに加え、なにより最適化がうまくできると1チップでも100GFLOPS(但し単精度計算)以上出そうだという実利面も期待できます。
(ちなみにCell Broadband Engine Architecture and its first implementationによると3.2GHzクロックCell BEでLinpack (S.P.) 4kx4kが156 GFLOPS.)。
というようなことを友人に話すと、う〜んとうなって終わってしまいました。
アグレッシブな方、挑戦いかがですか。
(2006年9月12日更新)
2006年09月07日
● CellとOpteronによる1ペタFLOPSマシンを2008年に完成
世界最速のスパコン発注 米、PS3のセル採用
出るべくして出てきた感がありますが、海の向こうは決断が早いです。
受注した企業、IBMのプレスリリースでは、
IBM to Build World's First Cell Broadband Engine Based Supercomputer と世界最速と特に言っていませんが、ピーク性能で1.6ペタFLOPS超、サステイン性能で1ペタFLOPSとのことです。
今年末からロスアラモス国立研究所に導入を開始し、2008年に完成予定です。こうした段階的な開発方法はASCIプロジェクトでも取られていました。
面白いのはハードウェアが既製品の組み合わせ―AMD OpteronベースのサーバーIBM x3755サーバーによる16,000個超のprocessor core、それにCell Broad Band Engine搭載ブレード 16,000台超で構成されたヘテロジニアス構成のスーパーコンピューターという点です。(x3755とCellブレードの情報はIBM HPCサイトにもあります)
HWは既製品ですから、こうしたシステムは日本でも開発しようと思えばできますし、もともとがCellは日米共同開発(IBM, Sony Corporation, Sony Computer Entertainment Inc. Toshiba Corporation.)の製品です。
ただし、ここからが大事な点で、Cellは9コア/チップで、そのうち8コアが高性能単精度SIMDエンジン(8コアの合計で256GFLOPS性能(4GHzのクロック仮定時))という新アーキテクチャのため、それにふさわしい新プログラミング・モデルを使う必要があります。
さらにOpteronサーバーとCellが共存したヘテロなシステムなので、普通にMPIで並列化するというわけにはいきません。
言ってみれば、プログラミングに猛烈に汗をかける研究者やプログラマーがいることが大前提です。
ロスアラモス国立研究所は、全米で一番優れた頭脳が集まると言われていた研究所で経験も豊富、こうした腕力への自信が感じられます。
さらに、IBMとロスアラモスは、共同で"Hybrid Programming" ソフトウェアを開発します。将来はヘテロな超並列システムでのアプリケーション開発環境が重要と言っているように思われます。
このソフトウェア開発面での馬力の日米差は、一部の例外を除いて、まだ埋まっていません。
いまはPS3のゲーム・プログラマーが一生懸命汗をかいているのかも知れません。
日本でもロスアラモスに劣らず、HPCの分野でCellのような魅力的なアーキテクチャを存分に使いこなしてほしいものです。
(参考)IBM、世界初のCell Broadband Engine搭載のスーパーコンピューターの開発に着手
(2006年9月12日更新)
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」
出るべくして出てきた感がありますが、海の向こうは決断が早いです。
受注した企業、IBMのプレスリリースでは、
IBM to Build World's First Cell Broadband Engine Based Supercomputer と世界最速と特に言っていませんが、ピーク性能で1.6ペタFLOPS超、サステイン性能で1ペタFLOPSとのことです。
今年末からロスアラモス国立研究所に導入を開始し、2008年に完成予定です。こうした段階的な開発方法はASCIプロジェクトでも取られていました。
面白いのはハードウェアが既製品の組み合わせ―AMD OpteronベースのサーバーIBM x3755サーバーによる16,000個超のprocessor core、それにCell Broad Band Engine搭載ブレード 16,000台超で構成されたヘテロジニアス構成のスーパーコンピューターという点です。(x3755とCellブレードの情報はIBM HPCサイトにもあります)
HWは既製品ですから、こうしたシステムは日本でも開発しようと思えばできますし、もともとがCellは日米共同開発(IBM, Sony Corporation, Sony Computer Entertainment Inc. Toshiba Corporation.)の製品です。
ただし、ここからが大事な点で、Cellは9コア/チップで、そのうち8コアが高性能単精度SIMDエンジン(8コアの合計で256GFLOPS性能(4GHzのクロック仮定時))という新アーキテクチャのため、それにふさわしい新プログラミング・モデルを使う必要があります。
さらにOpteronサーバーとCellが共存したヘテロなシステムなので、普通にMPIで並列化するというわけにはいきません。
言ってみれば、プログラミングに猛烈に汗をかける研究者やプログラマーがいることが大前提です。
ロスアラモス国立研究所は、全米で一番優れた頭脳が集まると言われていた研究所で経験も豊富、こうした腕力への自信が感じられます。
さらに、IBMとロスアラモスは、共同で"Hybrid Programming" ソフトウェアを開発します。将来はヘテロな超並列システムでのアプリケーション開発環境が重要と言っているように思われます。
このソフトウェア開発面での馬力の日米差は、一部の例外を除いて、まだ埋まっていません。
いまはPS3のゲーム・プログラマーが一生懸命汗をかいているのかも知れません。
日本でもロスアラモスに劣らず、HPCの分野でCellのような魅力的なアーキテクチャを存分に使いこなしてほしいものです。
(参考)IBM、世界初のCell Broadband Engine搭載のスーパーコンピューターの開発に着手
(2006年9月12日更新)
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」
2006年09月06日
● 「IBM ハイパフォーマンス・コンピューティング」 Webサイトがスタート
「IBM ハイパフォーマンス・コンピューティング」 Webサイトがスタートしました。
Blue Geneに代表されるギンギンのスーパーコンピューティングのことを、IBMは Deep Computing という造語で呼んでいて、すでにDeep ComputingのWebサイトがあります。
その点、今回スタートさせたHPCのサイトでは、研究者の方にとってもっと身近なHPC ―
1. 中小規模程度のシミュレーションや解析のための科学技術計算
2. バイオインフォマティクスなどでの大規模なデータ解析・処理、そして
3. ビジュアリゼーション (たとえばセル・チッブの応用)など
― を対象にした、わかりやすいサイトにしていきたいと考えています。
一番目については注目の新AMD Opteron搭載の新型サーバーなどを紹介しています。
後の二つについてはこれから順次追加していく予定ですので、まずはこのサイトをブックマークしていただければうれしいです。
Blue Geneに代表されるギンギンのスーパーコンピューティングのことを、IBMは Deep Computing という造語で呼んでいて、すでにDeep ComputingのWebサイトがあります。
その点、今回スタートさせたHPCのサイトでは、研究者の方にとってもっと身近なHPC ―
1. 中小規模程度のシミュレーションや解析のための科学技術計算
2. バイオインフォマティクスなどでの大規模なデータ解析・処理、そして
3. ビジュアリゼーション (たとえばセル・チッブの応用)など
― を対象にした、わかりやすいサイトにしていきたいと考えています。
一番目については注目の新AMD Opteron搭載の新型サーバーなどを紹介しています。
後の二つについてはこれから順次追加していく予定ですので、まずはこのサイトをブックマークしていただければうれしいです。
2006年09月03日
● SC06 のゴードン・ベル賞ファイナリスト
HPC恒例の大イベント SC06(International Conference on High Performance Computing, Networking, Storage and Analysis)が 11月11日-17日にフロリダ州タンパで開催されます。
この期間中に発表される有名なゴードン・ベル賞(Gordon Bell Prizes)のファイナリスト 6チームが公表されていました。
今年のゴードン・ベル賞は4カテゴリー:
1. Sustained FLOPSベースのピーク性能
2. 価格性能比 (1$当りのSustained FLOPS)
3. イノベーションによるスケーラビリティへの画期的な成功
4. コンパイラで達成したスケーラビリティ(?)(原文は* Scalability achieved through language constructs)
に分かれていて、ちなみにファイナリストの使用したシステムは
- Blue Gene使用が3チーム (米国2、日本1)、
- 地球シミュレータ使用が1チーム(日本)、
- MD-GRAPE使用が1チーム(日本)、
- FPGAベース・システム使用が1チーム(日本)となっています。
このうちBlue Gene使用チームは、
1. 米国がLLNLチーム (電子構造計算で200TFLOPS)、
2. IBM チーム(格子QCDで12 TFLOPS)、そして
3. 日本のアライドエンジニアリング・チーム(携帯電話の落下時衝撃解析)
の3チームでした。
3.のような産業界向けの解析がファイナリストになったのはたぶん始めてでしょう。
ともすれば特殊目的と思われがちなBGのような超並列アーキテクチャ・システムが産業界に役立つことを実証しているという意味でもイノベーティブな成果と言えるのではないでしょうか。
この期間中に発表される有名なゴードン・ベル賞(Gordon Bell Prizes)のファイナリスト 6チームが公表されていました。
今年のゴードン・ベル賞は4カテゴリー:
1. Sustained FLOPSベースのピーク性能
2. 価格性能比 (1$当りのSustained FLOPS)
3. イノベーションによるスケーラビリティへの画期的な成功
4. コンパイラで達成したスケーラビリティ(?)(原文は* Scalability achieved through language constructs)
に分かれていて、ちなみにファイナリストの使用したシステムは
- Blue Gene使用が3チーム (米国2、日本1)、
- 地球シミュレータ使用が1チーム(日本)、
- MD-GRAPE使用が1チーム(日本)、
- FPGAベース・システム使用が1チーム(日本)となっています。
このうちBlue Gene使用チームは、
1. 米国がLLNLチーム (電子構造計算で200TFLOPS)、
2. IBM チーム(格子QCDで12 TFLOPS)、そして
3. 日本のアライドエンジニアリング・チーム(携帯電話の落下時衝撃解析)
の3チームでした。
3.のような産業界向けの解析がファイナリストになったのはたぶん始めてでしょう。
ともすれば特殊目的と思われがちなBGのような超並列アーキテクチャ・システムが産業界に役立つことを実証しているという意味でもイノベーティブな成果と言えるのではないでしょうか。
2006年09月02日
● First International Symposium for “Integrated Predictive Simulation System for Earthquake and Tsunami Disaster"
CREST/JST主催によるシンポジウムです(10月23日-24日)。
プレート運動による地殻応力の蓄積を経て大地震が発生し,地震波が構造物を揺らし,津波が海岸部を襲うまでの一連の過程を「地球シミュレータ」上で再現・予測する観測・計算融合の階層連結型高精度シミュレーション・システムを世界に先駆けて開発するプロジェクトの開始1年を機に開催されます。
まだ暫定プログラムとのことですが、HPCセッションが二つあり、NASAからNERSCに移ったHorst SimonがChallenges in Petascale Computingの題で話すなど、地震・津波の専門でなくてもHPCに関係する方であればだれでも興味を引くホットな講演が並んでいます。
10月23日には懇親会もあります。
プレート運動による地殻応力の蓄積を経て大地震が発生し,地震波が構造物を揺らし,津波が海岸部を襲うまでの一連の過程を「地球シミュレータ」上で再現・予測する観測・計算融合の階層連結型高精度シミュレーション・システムを世界に先駆けて開発するプロジェクトの開始1年を機に開催されます。
まだ暫定プログラムとのことですが、HPCセッションが二つあり、NASAからNERSCに移ったHorst SimonがChallenges in Petascale Computingの題で話すなど、地震・津波の専門でなくてもHPCに関係する方であればだれでも興味を引くホットな講演が並んでいます。
10月23日には懇親会もあります。
● 「数値解析手法と大規模科学技術計算」に関する国際ワークショップ
反復解法の教科書でお世話になった人も多い(私や先輩逹もそうでした)Varga先生が招待講演者の一人の「数値解析手法と大規模科学技術計算」に関する国際ワークショップが10月25日に開催されます。
ベクトル・プロセッサー初期のころは大変活発な領域でしたが、パラレル・プロセッサーの流れが広まる中、この分野がどんな展開になっていくのか興味深いところです。
ベクトル・プロセッサー初期のころは大変活発な領域でしたが、パラレル・プロセッサーの流れが広まる中、この分野がどんな展開になっていくのか興味深いところです。
● HPCのIBM Webサイトと個人blog スタート
High Performance ComputingのIBM Webサイトがもまなくオープンしますが、それに合わせて個人ブログの「Cheer! High Performance Computing」を始めることにしました。
IBMはネットを使って外の世界に出て行くことを1997年から奨めていて、たとえばIBM SP1を成功させた、わが尊敬すべきIrving Wladawsky-Bergerも個人ブログを続けています。
こうしたIBMブロガーのために全世界共通のガイドライン(A4で二ページくらい)があることからも、Irvingのような役員クラスをはじめとして、世界中で様々なIBMブロガーがコミュニケーションをしているようです。
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」
IBMはネットを使って外の世界に出て行くことを1997年から奨めていて、たとえばIBM SP1を成功させた、わが尊敬すべきIrving Wladawsky-Bergerも個人ブログを続けています。
こうしたIBMブロガーのために全世界共通のガイドライン(A4で二ページくらい)があることからも、Irvingのような役員クラスをはじめとして、世界中で様々なIBMブロガーがコミュニケーションをしているようです。
「このサイトの掲載内容は私自身の見解であり、必ずしもIBMの立場、戦略、意見を代表するものではありません」

