English
科学研究費補助金「特定領域研究」情報爆発IT基盤

  支援班 A02サブグループ

プラットフォームInTriggerの構築

[ユーザ登録ページ]



はじめに

本特定領域の支援班は, 研究に必要な各種リソース(プラットフォーム,ソフトウェア,データなど) ならびにそれを共有する仕組みを整備する役割を担います.
支援班ではその活動の一環として,
多拠点にまたがる分散計算環境(InTrigger) の構築と提供,
およびその環境を基盤とした,ソフトウェア/データレポジトリの構築を行います. これによって,
  • 複数の研究グループ間の交流や協調を促進すること,
  • 単独のグループでは容易になし得ない規模の実験を可能にすること,
を支援します.基盤ソフトウェア(分散,ネットワーク,Grid など)分野,大 規模情報処理(情報検索,マイニング,自然言語処理 など)分野など,本領域 に関係するあらゆる分野の研究が,このプラットフォームを活用して研究を推 進されることを歓迎いたします. また,InTrigger環境と,その他のテストベッドや各種計算機センターとの連 携を模索し,本特定領域研究に関わる研究者が本プラットフォームを基点とし てさらに大規模な計算環境へアクセスできるようにすることも計画しています. 現在, 東工大学術国際情報センター (TSUBAME Grid Cluster), 東大 情報基盤センター との連携を計画しています.さらに Grid'5000などの 先進的テストベッドの利用や相互乗入れにむけた交渉も行っております.

基本計画

本特定領域の研究期間で,
  • 20-30程度の拠点にまたがり,
  • 統一的に管理された,
  • 1,000以上のCPUを持つ
分散プラットフォームを構築します.

これは本特定領域の中でまかなわれる部分のみをカウントしており,本特定領 域以外の研究計画との連携は含みません.毎年の導入機種の選定・仕様は,本 特定領域研究参加者との意見交換を行いながら,支援班が主導し,統一・策定 します.このことによってある程度システム全体の一様性が保たれ,多拠点に またがった大規模な計算や,システムの研究を行う際の非本質的な障害を取り 除くことを狙います.拠点の選択は研究参加者からのボランティアを募りつつ, 支援班が全体を俯瞰しながらバランスの取れた配置を行います.そしてもちろ ん,
本特定領域の研究者が,本特定領域の研究成果を出すためであれば (もちろん利用規則と利用可能な資源の範囲内で), 誰でも利用することが可能です.
InTriggerは,支援班の一部メンバと,研究参加者からのボランティアによっ て構成された管理グループが,全体を統一的に管理します.システム全体の構 成を一様に保ったり,研究に必要なソフトウェアの導入や構成変更を一括して 行う方式を実践し,大規模な実験を効率的に行える環境を構築します.

狙いと機会

計算設備を共有するという発想はまったく新しいものではありませんが, InTriggerは本領域研究,そして新時代の情報技術研究の起爆剤となるべく研 究者自ら設計,運用される新しいタイプのプラットフォームです. 運用上の特徴として,
縦割り管理の廃止,水平管理方式の実践:
システムは拠点ごとに勝手に (自律的に) 導入,管理するのではなく,導入時から,「遠隔にある拠点の管 理,構成変更,再インストール」などが行えるよう設計します.これによって, 単に自律的に運用される各拠点の相互乗り入れでは不可能な,多拠点にまたが る実験環境を構築することを可能にします.これにより,特に基盤ソフトウェ ア分野で大規模な実証実験をする際の障壁を取り除きます.
オープンな管理community:
拠点の壁に阻まれない,オープンな管理者 communityを作成し,運用方針も研究成果をmaximizeするという観点から柔軟 に決定します.たとえばバックグラウンドで多数のCPU集約処理を行いたいユー ザ,短い時間でも占有された環境が欲しいユーザ,短い時間でも多数のノード を使いたいユーザ,負荷は軽いが常時稼動するデーモンを仕掛けたいユーザな どがいかにして同一環境で共存できるかはチャレンジであり,そのための方針 とメカニズム作りを議論・検討・実装します.
研究成果ソフトウェアやツールの共有:
常時利用可能な環境を多数の研究 者が共有することで,研究成果ソフトウェアや,研究に利用できるソフトウェ アを,この環境上で容易に共有することを可能にします.研究成果ソフトウェ アの宣伝の場を提供することも目指します.
ソフトウェア研究の評価基盤:
このようなプラットフォームを広く利用可 能にすることで,特に基盤ソフトウェア分野では,論文に書かれた評価結果以 上に信頼できる「活きた評価」をする機会を提供できると考えています.
実利用データの取得:
ネットワークのトラフィックやジョブの資源利用パ ターンなど,活きた環境を長時間共有することにより,広域で共有された基盤 に関する新しい知見が得られ,資源管理,ネットワーク,など様々なの研究が 推進されることを期待します.

現状と今年度の予定

本年度は7拠点にまたがり,300程度のCPU (core)の調達がこれから年末にかけ て行われる予定です.Core 2 Duo CPUが300 core程度,総メモリ容量600GB, 総ディスク容量100TB程度のシステムとなる予定です(詳細は変更の可能性があ ります).同規模のシステムが毎年増強され,来年度はさらに5つの拠点が加わ る予定です. 支援班では現在,システムの構成維持,変更を容易に行うための仕組みの構築 実験を行っています.本年度の残りの期間で,実験的に導入されたクラスタ (100 CPU程度)の利用サービス開始を行う予定です.

関連研究

  • Grid'5000は, フランスの9拠点にまたがったGrid Computing, eScienceのための基盤です.
  • PlanetLab, Private PlanetLab in Japan は主にネットワーク研究を対象とした,広域テストベッドです.