成果報告票(データ解析拠点・代表機関のマネジメ...

26
成果報告票(データ解析拠点・代表機関のマネジメント) データ解析拠点の構築と情報研究開発 情報システム研究機構 国立遺伝学研究所 五條堀 孝 1.当初計画における達成目標 ①大量情報集積のための Pipeline 構築 シーケンス拠点から大量に産生される次世代シーケンサー(NGS)によるゲノム関連情報を、遺伝研 に設置する大規模計算機システムに集積し、細胞内機序に基づくパノラミックセルDBを構築し、ゲノ ム情報や組織、時間、多様性などにより異なる細胞特性の情報検索を可能とする以下の研究開発を行う。 (ア)セルイノベーションのために、既存の有用データや技術等の資産活用 (イ)ゲノムマッピングなど解析基盤システムの構築 (ウ)大規模集積に基づくパノラミックセル DB 基盤構築 ②大量データ解析のための基盤技術の研究開発 NGS などにより大規模に産生されるゲノム、RNA、エピジェネティクス、遺伝子発現の情報等とリ アルタイム発現イメージ情報等を統合し、細胞の様々な形態やその変化に至るまでの情報を駆使して細 胞内の活動機序を解析するための技術研究を行う。 ③研究成果と連携したパノラミックセル DB の開発 国と遺伝学研究所で進める「大量情報集積」 および「大量解析技術研究」における研究成果 や技術リソースなどを先導研究やシーケンス 拠点と共有し連携するため有用となる情報シ ステムやプラットフォームを構築する。 ④プロジェクトの総合的推進 プロジェクト全体の連携を密に円滑な運営 を推進するために、分担機関と協力し運営委 員会や技術検討会の開催等、参画各機関の連 携・調整にあたる。 2.平成23年5月末時点における事業計画に対する成果 (1)成果概要 初年度に整備したハードウェアの活用を図る活動を中心に行い、プロジェクト2年目は公共データの 取込みや初年度に構築した大規模データ解析パイプラインとビューワシステムを機能強化し、プロジェ クト内に一斉公開を開始するとともに、シークエンス拠点からの配列データを先導研究機関向けに、シ ークエンス拠点からのデータを処理し、統計データ、ビューワを含めて一元的な提供を開始した。3年 目は多型解析を中心に特徴抽出・比較解析技術の開発整備を進めている。また、先導研究機関との連携 に加えて22年度後半に採択された18協力研究機関へのヒアリングをシーケンス拠点と共同で実施 し、いくつかの協力研究機関に対し個別の解析サポートを開始するとともに、協力機関への今後の対応 に備え、システムのエンハンスを進めてきた。

Upload: others

Post on 06-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

成果報告票(データ解析拠点・代表機関のマネジメント)

課 題 名 データ解析拠点の構築と情報研究開発

機 関 名 情報システム研究機構 国立遺伝学研究所

代 表 研 究 者 名 五條堀 孝

1.当初計画における達成目標

①大量情報集積のための Pipeline 構築

シーケンス拠点から大量に産生される次世代シーケンサー(NGS)によるゲノム関連情報を、遺伝研

に設置する大規模計算機システムに集積し、細胞内機序に基づくパノラミックセルDBを構築し、ゲノ

ム情報や組織、時間、多様性などにより異なる細胞特性の情報検索を可能とする以下の研究開発を行う。

(ア)セルイノベーションのために、既存の有用データや技術等の資産活用

(イ)ゲノムマッピングなど解析基盤システムの構築

(ウ)大規模集積に基づくパノラミックセル DB 基盤構築

②大量データ解析のための基盤技術の研究開発

NGS などにより大規模に産生されるゲノム、RNA、エピジェネティクス、遺伝子発現の情報等とリ

アルタイム発現イメージ情報等を統合し、細胞の様々な形態やその変化に至るまでの情報を駆使して細

胞内の活動機序を解析するための技術研究を行う。

③研究成果と連携したパノラミックセル DB の開発

国と遺伝学研究所で進める「大量情報集積」

および「大量解析技術研究」における研究成果

や技術リソースなどを先導研究やシーケンス

拠点と共有し連携するため有用となる情報シ

ステムやプラットフォームを構築する。

④プロジェクトの総合的推進

プロジェクト全体の連携を密に円滑な運営

を推進するために、分担機関と協力し運営委

員会や技術検討会の開催等、参画各機関の連

携・調整にあたる。

2.平成23年5月末時点における事業計画に対する成果

(1)成果概要

初年度に整備したハードウェアの活用を図る活動を中心に行い、プロジェクト2年目は公共データの

取込みや初年度に構築した大規模データ解析パイプラインとビューワシステムを機能強化し、プロジェ

クト内に一斉公開を開始するとともに、シークエンス拠点からの配列データを先導研究機関向けに、シ

ークエンス拠点からのデータを処理し、統計データ、ビューワを含めて一元的な提供を開始した。3年

目は多型解析を中心に特徴抽出・比較解析技術の開発整備を進めている。また、先導研究機関との連携

に加えて22年度後半に採択された18協力研究機関へのヒアリングをシーケンス拠点と共同で実施

し、いくつかの協力研究機関に対し個別の解析サポートを開始するとともに、協力機関への今後の対応

に備え、システムのエンハンスを進めてきた。

Page 2: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

(2)進捗及び成果

①大量情報集積のための Pipeline 構築

(ア)セルイノベーションのために既存の有用データや技術等の資産活用

利用者が様々な角度から解析を進める環境整備を目指し、前身プロジェクトであるゲノムネットワー

ク(GNP)の転写制御に関わる豊富な蓄積データの活用を行った。GNP で構築したシステムを取込み、

タンパク質間相互作用や転写制御領域情報などの転写制御制御ネットワークに関係する遺伝子を探索

可能とした。また、NGS データを利用した解析の幅を広げる目的で、DRA(DDBJ)で公開されている

NGS データを、これまでに 1,386 件(SRX 単位)取込み、マッピング解析済みの状態で蓄積し、下記の

データ解析システムを介して利用可能とした。

(イ)ゲノムマッピングなど解析基盤システムの構築

NGS データは従来に比べ桁違いに大規模なために、研究者にとって利用頻度の高い解析(マッピン

グなど)の処理が研究効率を左右する状況にある。そこ

で、データ解析拠点では利用頻度の高い解析処理をパイ

プラインとして整備し、NGS データを高速かつ効率的

に扱う基盤を構築した。豊富な解析サーバを有効活用

し。並列処理を行うことによりマッピングの高速化を実

現した。 NGS データの塩基レベルデの解像度と網羅性の高さは

大きな強みであり、配列解析は基礎技術として重要である。データ解析拠点では配列データを入力とし

てマッピング結果をビューワで閲覧するまでの一連の処理をパイプラインとして構築した。また、マッ

ピング後のデータをアプリケーション別に解析する為のパイプライン(ChIP-seq 用、RNA-seq 用、

BS-seq 用一つずつ)と、ゲノム全体でのマッピング結果の俯瞰表示や複数データの比較解析を行うた

めの解析パイプラインを整備し、プロジェクトメンバに提供している。 (ウ)大規模集積に基づくパノラミックセル DB 基盤構築

データ解析拠点では、1サンプルから得られる配列数が数億~数十億と大量データを数千のオーダー

で蓄積している。これら膨大なデータの活用法として、直感的な特徴把握を実現する可視化技術の開発

や、軽快なデータ検索・集計を実現する工夫が重要となる。NGS データのマッピング結果は、その後

の解析の基礎データとしてデータベースに格納し管理している。このデータを直感的に見せる仕組みの

一つとして独自のゲノムブラウザ(Genome Explorer)を開発した。広範囲を俯瞰した画像として見せ

るとともに、一塩基表示から 10Mbp 領域までズームイン・アウトをインタラクティブに操作可能とし

た。また、大規模データに対応したデータベース設計とパフォーマンスチューニングを行うことにより

従来に比べて約 50 倍の検索速度向上を図り、軽快な操作を実現しプログラム内で利用公開している。

②大量データ解析のための基盤技術の研究開発

NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

ッピングツール/アセンブルツール)では不得手な点が指摘されていた。そこで、データ解析拠点では、

独自基盤技術として以下の特徴をもつ配列解析ツールの開発を行いプロジェクト内に公開を行ってい

る。また、分担研究機関と連携し、遺伝子ネットワーク予測やデータ可視化技術の研究開発を推進し、

データ解析拠点と連携した形での研究成果公開を今年度目指している。

• 挿入/欠失の検出に優れた NGS データ用マッピングツールの開発(MLA)

• メモリ使用量の上限値を指定し分散処理可能な NGS データ用アセンブルツールの開発(HASSP)

Page 3: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

MLA はシミュレーションデータを用い、挿入/欠失の検出力が優れていることが確認できている。

ペアエンドにも対応しており、検証の為に HapMap からアフリカ系ヨルバ人(YRI)とコーカソイド

(CEU)で挿入・欠失に着目した変異を調べ、予想以上に長い挿入・欠失が存在することを明らかにした。

HASSP は、よく利用されている Velvet や Soapdenovo、Abyss と比較したところ、アセンブル精度が

向上されていた。検証評価は Gambiae と Zebrafish のゲノムからリード長 75bp で冗長度 75 のシミュレ

ーションデータを作成し、最長 contig と Cov50 のコンティグ長、その精度の3つ指標に比較を行った。

Max: 最長 contig 長 ()内は精度 Cov50

③研究成果と連携したパノラミックセル DB の開発

上述の①、②における研究成果をシーケンス拠点や先導研究と共有し連携するために有用な情報シス

テム基盤の構築を行った。※詳細は「補足資料1 情報システム基盤の概要」に記載。

• 拠点間で大量データ受け渡しのためのデータ転送システム構築

• プログラム研究支援のためのデータ解析システムの構築

• 外部への情報発信のためのデータ解析拠点 Web ポータルの構築/運用

データ転送システム:拠点間で円滑でセキュアなデータ転送を行うための仕組みとしてネットワーク経

由データ転送とハードディスクによる物理搬送の2経路を整備した。拠点間でデータ転送専用システム

を配備することで、従来に比べ約6倍(1日あたり約1TB)のデータ転送性能を実現し、これまでに

294 サンプル(約 5.0TB)のデータ転送を円滑に実施している。

データ解析システム:データ解析拠点で整備した資産(計算機環境や解析ツール、解析ノウハウ)をプ

ログラム内外に展開し研究を促進するための基盤システムを整備し、プログラム内に公開している。シ

ーケンス拠点でシーケンスした結果はデータ解析拠点システムで一元管理し、マッピングなど基礎的な

解析が完了した状態で各機関に公開している。また、目的別に一連の解析処理をパイプラインとして整

備し、利用者が解析できる環境を提供している。

データ解析拠点Webポータル:データ解析拠点の活動を広く一般に情報発信し、データ解析拠点で蓄積

した知見を役立ててもらうこと目的にWebポータルを立ち上げた。データ解析拠点の取組み紹介の他、

NGSデータ解析の現場担当者のノウハウをWikiで情報発信している。NGS現場の会(NGS-Field)との協力

関係も構築し、コンテンツの拡充を図り利用者も着実に増加している。

④プロジェクトの総合的推進

理研、先導研究機関、事務局、ライフ課との協議を適期的(月1回以上)に持ち、総合的推進に努めた。

Page 4: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

3.課題全体の論文発表件数 32 件

4.課題全体の公開したツールやデータベース等の件数 (1) データ解析システム(Maser)を

介して利用可能とした解析パイ

プライン 40 件

(2) DRA のデータを取込みマッピン

グ解析処理が完了したデータ数

(SRX 単位)1,386 件

5.課題全体の特許出願件数 0 件(うち国外 0件)

6.課題全体の成果を活用した共同研究数(プログラム内外含む) 22 件

(うち産業界との共同研究数 1件)

7.先導研究からのデータ解析依頼数及び解析数(返却したデータの件数)

※ 解析内容(進捗状況)の詳細は、「補足資料2 データ受領・進捗状況」に記載。

※ 22年度から追加で参画となった3研究機関からのサンプルは未受領。

8.当初計画に対する進捗の達成度

当初計画に対する達成状況(青色が取組んだ箇所)

分担機関を含め、概ね計画通りに進んでいる。初年

度後半の3先導研究機関追加や、2年目の18協力機

関の追加の影響で個別対応が増え影響がでているが、

明らかになった問題点に関しては既に対応策を講じ

ており、年間計画に影響が生じることはないと考えら

れる。全体に想定の範囲内である。

9.課題内の情報共有・連携体制

各分担研究機関とは連携をして進めている。各分担期間の成果は本年度中の提供を目処に、東大・宮野

悟チームとは担当者間も情報交換を進め、CelliP(Cell Illustrator と連携する解析システム)の活用方法

について検討が進めており、先導研究機関、協力機関の高次解析への利用開始のため、データ解析拠点

から提供する予定である。また、理研・豊田哲郎チームとは、個別に進めている研究開発の研究成果を、

データ解析拠点を通じ利用公開する方向で進めており課題内の情報共有・連携体制は良好に機能してい

る。

Page 5: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

10.他の課題との情報共有・連携

• 本プログラムの他の課題との連携状況

シーケンス拠点とは月に一回以上の頻度で情報交換を行い、拠点間のデータ連携やシーケンス状況な

ど情報交換を行っている。また、先導研究先導研究機関への2回目のヒアリングを開始予定であるとと

もに、機関とは、共同研究の取組みや担当者レベルでの情報交換・解析サポートが行われており良好で

ある。協力機関とは、シーケンス拠点と共同でヒアリングを実施し、2 機関については具体的な解析サ

ポートを進めている。

• 本プログラム以外の研究者、企業との連携状況

国立遺伝学研究所内の2グループとデータ解析の情報交換や協力を行っている。また、シーケンス拠

点を通じライフテクノロジーズジャパン株式会社やイルミナ株式会社からシーケンサー附属ソフト

(BioScope™、CASAVA™)をデータ解析拠点で利用可能とした。その他、関連プロジェクトのターゲ

ットタンパクプログラム(TPRP)と連携方法について具体的な検討を進めており良好である。

11.人材育成

データ解析拠点では、情報発信、人材育成という観点で以下の取組みを行った。

• NGS Surfer’s wiki (http://cell-innovation.nig.ac.jp/wiki/)の立上げ • 先導研究機関(京大松田研)から若手研究者を受け入れ、解析手法の個別トレーニングを実施 • シーケンス拠点と共同で講習会の開催

一般の研究者を対象にデータ解析のノウハウの情報共有を図った(講習会の内容は YouTube 公開中)。

解析拠点独自の講習会の開催も予定している。

12.終了までの具体的な見通し

今後はこれまでに整備してきた大規模データ解析パイプライン(一次解析、二次解析)を活用し、シ

ーケンス拠点からの大量データを効率的に処理、蓄積していくとともに、先導研究機関・協力研究機関

の研究課題支援に更に高度かつ有用な比較解析やゲノム多様性解析などの高次解析フローの開発に注

力していく。その際、分担研究機関で取り組んでいる遺伝子ネットワーク推定モデルや統合解析フレー

ムワークへ連携も配慮し、細胞内の複雑な生命現象を解明するためのプラットフォームとして充実させ

ていく。また、一層分担期間との連携にも力を入れていく。

NGS のデータを解析するためには、多くのノウハウが必要で障壁が高いことがわかってきた。データ解

析拠点としては、データ解析の障壁を低くするための取組みとして、プロジェクト内外の NGS データ

の解析担当者のノウハウを集積し、情報発信をすると共に、データ解析拠点プラットフォームを活用し

た一般ユーザへのサービス公開を進めることで国内研究者の研究推進に貢献していく計画である。

13.本プログラムにおける成果が我が国の科学技術発展及び産業応用等に与える効果について

科学技術の発展には NGS 関連の新たな分野を産業界も巻き込み育成することが重要と考える。既に、

これまでの成果として、本課題でデータ解析拠点システムの開発に携わっている企業が、本プログラム

の成果をベースにした NGS データ解析システムを京都大学 iPS 細胞研究所に納入し、iPS 細胞技術の医

療応用・実用化研究の推進に寄与している。また、医療や産業に直結した課題が協力機関には多いこと

から、協力機関への解析サポートを通じて、基礎科学のみならず病気の診断や治療といった医療への貢

献を目指している。プロジェクト終了後は、プロジェクト期間中に蓄積した解析データや解析ノウハウ

を再利用可能な形で一般に公開し、若手研究者が気軽に利用可能な環境を維持することで、我が国の科

学技術発展及び産業応用に貢献する計画である。

Page 6: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

14.特記事項

先導研究メンバーを中心としたサイトビジットを 2010 年 5 月 28 日に事務局と協力して開催した。月

に一度、ライフ課を含め事務局を含む両拠点間の打ち合わせを行っている。また、必要に応じて PO に、

進捗の報告を理研とともに行ってきた。セルイノベーション公開セミナーにおける拠点活動内容の紹

介。各種関連学会(Bioculation2010, etc)におけるパンフレットの配布。事務局によるニュースレターの

発行、ホームページ上での広報、分子生物学会 NBRP 展示ブースでのセルイノベーションプログラムの

紹介等に積極的に協力してきた。

15.研究費一覧

21年度 22年度 23年度 計

設備備品費(千円) 384 0 物品費(千円) 792

試作品費(千円) 0 0 人件費・謝金(千円) 29,065

人件費(千円) 32,192 31,593 旅費(千円) 1,368

業務実施費(千円) 77,964 64,525 その他(千円) 61,850

間接経費(千円) 222,475 28,846 間接経費(千円) 27,923 279,244

合計(千円) 333,015 124,964 合計(千円) 120,998 578,977

Page 7: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

成果報告票(データ解析拠点・各機関)

代表/分担機関の課題名 データ解析拠点の構築と情報研究開発

代 表 / 分 担 機 関 名 情報システム研究機構 国立遺伝学研究所

機 関 の 代 表 研 究 者 名 五條堀 孝

1.当初計画における達成目標

①大量情報集積のための Pipeline 構築

シーケンス拠点から大量に産生される次世代シーケンサー(NGS)によるゲノム関連情報を、遺伝研

に設置する大規模計算機システムに集積し、細胞内機序に基づくパノラミックセルDBを構築し、ゲノ

ム情報や組織、時間、多様性などにより異なる細胞特性の情報検索を可能とする以下の研究開発を行う。

(ア)セルイノベーションのために、既存の有用データや技術等の資産活用

(イ)ゲノムマッピングなど解析基盤システムの構築

(ウ)大規模集積に基づくパノラミックセル DB 基盤構築

②大量データ解析のための基盤技術の研究開発

NGS などにより大規模に産生されるゲノム、RNA、エピジェネティクス、遺伝子発現の情報等とリア

ルタイム発現イメージ情報等を統合し、細胞の様々な形態やその変化に至るまでの情報を駆使して細胞

内の活動機序を解析するための技術研究を行う。

③研究成果と連携したパノラミックセル DB の開発

国と遺伝学研究所で進める「大量情報集積」

および「大量解析技術研究」における研究成果

や技術リソースなどを先導研究やシーケンス

拠点と共有し連携するため有用となる情報シ

ステムやプラットフォームを構築する。

④プロジェクトの総合的推進

プロジェクト全体の連携を密に円滑な運営

を推進するために、運営委員会や技術検討会

の開催等、参画各機関の連携・調整にあたる。

2.平成23年5月末時点における各機関の事業計画に対する研究成果

(1)成果概要

初年度に整備したハードウェアの活用を図る活動を中心に行い、プロジェクト2年目からは公共デー

タの取込みや初年度に構築した大規模データ解析パイプライン、ビューワシステムを機能強化し、プロ

ジェクト内に一斉公開を開始するとともに配列拠点の産生した配列データの処理と各研究機関への提

供を開始した。3年目は、加えて多型解析を中心に特徴抽出・比較解析技術の開発整備を進めている。

また、22年度後半に採択された18協力研究機関へのヒアリングをシーケンス拠点と共同で実施し、

いくつかの協力研究機関に対し個別の解析サポートを開始するとともに、協力機関への今後の対応に備

え、システムのエンハンスを進めてきた。

(2)進捗及び成果

①大量情報集積のための Pipeline 構築

(ア)セルイノベーションのために既存の有用データや技術等の資産活用

Page 8: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

利用者が様々な角度から解析を進める環境整備を目指し、前身プロジェクトであるゲノムネットワー

ク(GNP)の転写制御に関わる豊富な蓄積データの活用を行った。GNP で構築したシステムを取込み、

タンパク質間相互作用や転写制御領域情報などの転写制御制御ネットワークに関係する遺伝子を探索

可能とした。また、NGS データを利用した解析の幅を広げる目的で、DRA(DDBJ)で公開されている

NGS データを、これまでに 1,386 件(SRX 単位)取込み、マッピング解析済みの状態で蓄積し、下記の

データ解析システムを介して利用可能とした。

(イ)ゲノムマッピングなど解析基盤システムの構築

NGS データは従来に比べ桁違いに大規模なために、研究者にとって利用頻度の高い解析(マッピン

グなど)の処理効率が研究を左右する状況にある。そこで、データ解析拠点では利用頻度の高い解析処

理パイプラインを整備し、NGS データを高速かつ効率的に扱う基盤を構築した。高性能解析サーバを

有効活用して並列処理を行い、マッピングの高速化を実現した。 また、NGS データの1塩基解像度と網羅性の高さは大

きな強みであり、配列解析は基礎技術として重要であ

る。データ解析拠点では配列データを入力としてマッピ

ング結果をビューワで閲覧するまでの一連の処理をパ

イプラインとして構築した。また、現在、リードマッピ

ング後のアプリケーション別解析パイプラインを3つ

(ChIP-seq 用、RNA-seq 用、BS-seq 用一つずつ)と、

ゲノム全体でのマッピング結果の全体図表示や複数データの比較解析を行うための解析パイプライン

を整備し、プロジェクトメンバーに提供している。 (ウ)大規模集積に基づくパノラミックセル DB 基盤構築

データ解析拠点では、1サンプルから得られる配列数が数億~数十億と大量データを数千のオーダー

で蓄積している。これら膨大なデータの活用法として、直感的な特徴把握を実現する可視化技術の開発

や、軽快なデータ検索・集計を実現する工夫が重要となる。データを直感的に見せる仕組みの一つとし

て独自のゲノムブラウザ(Genome Explorer)を開発した。広範囲を俯瞰した画像として見せるととも

に、一塩基表示から 10Mbp 領域までズームイン・アウトをインタラクティブに操作可能とした。また、

大規模データに対応したデータベース設計とパフォーマンスチューニングを行い、従来に比べて約 50倍の検索速度向上を図り軽快な操作を実現しプログラム内で利用公開している。 ②大量データ解析のための基盤技術の研究開発

NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

ッピングツール/アセンブルツール)では機能不足が指摘されていた。データ解析拠点では、独自基盤

技術を用いて、以下の特徴をもつ配列解析ツールの開発を行いプロジェクト内に公開を行っている。

• 挿入/欠失の検出に優れた NGS データ用マッピングツールの開発(MLA)

• メモリ使用量の上限値を指定し分散処理可能な NGS データ用アセンブルツールの開発(HASSP)

MLA はシミュレーションデータを用い、挿入/欠失の検出力が優れていることが確認できている。

ペアエンドにも対応しており、検証の為に HapMap からアフリカ系ヨルバ人(YRI)とコーカソイド

(CEU)間で挿入・欠失に着目した変異調査を行い、比較的長い挿入・欠失が存在することを明らかにす

ることができた。

Page 9: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

自己開発の HASSP では、Velvet や Soapdenovo、Abyss 等のよく使われる類似ツールに比べて精度良く

アセンブルできた。検証評価は Gambiae と Zebrafish のゲノムからリード長 75bp で冗長度 75 のシミュ

レーションデータを作成し、最長 contig と Cov50 のコンティグ長、その精度の3つ指標に比較を行った。

Max: 最長 contig 長 ()内は精度 Cov50

③研究成果と連携したパノラミックセル DB の開発

上述の①、②における研究成果をシーケンス拠点や先導研究と共有し連携するために有用な情報シス

テム基盤の構築を行った。※詳細は「補足資料1 情報システム基盤の概要」に記載。

• 拠点間で大量データ受け渡しのためのデータ転送システム構築

• プログラム研究支援のためのデータ解析システムの構築

• 外部への情報発信のためのデータ解析拠点 Web ポータルの構築/運用

データ転送システム:拠点間で円滑でセキュアなデータ転送を行うための仕組みとしてネットワーク経

由データ転送とハードディスクによる物理搬送の2経路を整備した。拠点間でデータ転送専用システム

を配備することで、従来に比べ約6倍(1日あたり約1TB)のデータ転送を実現し、これまで 294 サン

プル(約 5.0TB)のデータ転送を円滑に実施している。

データ解析システム:データ解析拠点で整備した豊富な資産(計算機環境や解析ツール、解析ノウハウ)

をプログラム内外に展開し研究を促進するための基盤システムを整備しプログラム内に公開している。

シーケンス拠点でシーケンスした結果はデータ解析拠点システムで一元管理し、マッピングなど基礎的

な解析が完了した状態で各機関に公開している。同時に、目的別に一連の解析処理をパイプラインとし

て整備し、利用者が独自に解析できる環境を提供している。

データ解析拠点Webポータル:データ解析拠点の活動を広く一般に情報発信し、データ解析拠点で蓄積

した知見を役立てること目的にWebポータルを立ち上げた。データ解析拠点の取組み紹介の他、NGSデ

ータ解析の現場担当者が出会うノウハウを情報発信している。NGS現場の会(NGS-Field)の協力関係を構

築し、コンテンツの拡充を図るとともに利用者も着実に増加している。

④プロジェクトの総合的推進

理研、先導研究機関、事務局、ライフ課との連携を通じて総合的推進に努めた。

3.各機関の論文発表件数 32 件

4.各機関の公開したツールやデータベース等の

件数

(1) データ解析システム(Maser)を介して利用可能

とした解析パイプライン 40 件

Page 10: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

(2) DRA のデータを取込みマッピング解析処理が完

了したデータ数(SRX 単位)1,386 件

5.各機関の特許出願件数 0 件(うち国外 0件)

6.各機関の成果を活用した共同研究数(プログ

ラム内外含む)

22 件

(うち産業界との共同研究数 1件)

7.先導研究からのデータ解析依頼数及び解析数(返却したデータの件数)

※ 解析内容(進捗状況)の詳細は、「補足資料2 データ受領・進捗状況」に記載。

※ 22年度から追加で参画となった3研究機関からのサンプルは未受領。

8.当初計画に対する各機関の達成度

当初計画に対する達成状況(青色が取組んだ箇所

分担機関を含め、概ね計画通りに進んでいる。初年

度後半の3先導研究機関追加や、2年目の18協力機

関の追加の影響で個別対応が増え影響がでているが、

明らかになった問題点に関しては既に対応策を講じ

ており、年間計画に影響が生じることはないと考えら

れる。全体に想定の範囲内である

9.課題内の情報共有・連携体制

各分担研究機関とは連携をして進めている。東大・宮野悟チームとは担当者間も情報交換を進め、

CelliP(Cell Illustrator と連携する解析システム)の活用方法について検討が進んでおり、データ解析拠

点の解析サーバを用いて CelliP が動作する環境が整備できている。また、理研・豊田哲郎チームとは、

個別に進めている研究開発の研究成果を、データ解析拠点を通じ利用公開する方向で進めており課題内

の情報共有・連携体制は本年度は更に連携を強化する予定である。

10.他の課題との情報共有・連携

• 本プログラムの他の課題との連携状況

シーケンス拠点とは月に一回以上の頻度で情報交換を行い、拠点間のデータ連携やシーケンス状況な

ど情報交換を行っている。また、先導研究機関とは、共同研究の取組みや担当者レベルでの情報交換・

解析サポートを進めている。協力機関とは、シーケンス拠点と共同でヒアリングを実施し 2 機関につい

ては、既に具体的な解析サポートを進めている。

Page 11: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

• 本プログラム以外の研究者、企業との連携状況

国立遺伝学研究所内の2グループとデータ解析の情報交換や協力を行っている。また、シーケンス拠

点を通じライフテクノロジーズジャパン株式会社やイルミナ株式会社からシーケンサー附属ソフト

(BioScope™、CASAVA™)をデータ解析拠点で利用可能とした。その他、関連プロジェクトのターゲ

ットタンパクプログラム(TPRP)と連携方法について具体的な検討を進めている。

11.人材育成

データ解析拠点では、情報発信、人材育成という観点で以下の取組みを行った。

• NGS Surfer’s wiki (http://cell-innovation.nig.ac.jp/wiki/)の立上げ • 先導研究機関(京大松田研)から若手研究者を受け入れ、解析手法の個別トレーニングを実施 • シーケンス拠点と共同で講習会の開催 一般の研究者を対象にデータ解析のノウハウの情報共有を図った(講習会の内容は YouTube 公開中)。

解析拠点独自の講習会の開催も予定している。

12.終了までの具体的な見通し

今後はこれまでに整備してきた大規模データ解析パイプライン(一次解析、二次解析)を活用し、シ

ーケンス拠点からの大量データを効率的に処理、蓄積していくとともに、先導研究機関・協力研究機関

の研究課題支援に有用な比較解析やゲノム多様性解析などの高次解析フローの開発に注力していく。そ

の際、分担研究機関で取り組んでいる遺伝子ネットワーク推定モデルや統合解析フレームワークへ連携

も考慮し、細胞内の複雑な生命現象を解明するためのプラットフォームとして充実させていく。

現在、NGS のデータを解析するためには、多くのノウハウが必要で障壁が高いことがわかってきた。

データ解析拠点としては、データ解析の障壁を低くするための取組みとして、プロジェクト内外の NGS

データの解析担当者のノウハウを集積し、情報発信をすると共に、データ解析拠点プラットフォームを

活用した一般ユーザへのサービス公開を進めることで国内研究者の研究推進に貢献していく。

13.本プログラムにおける成果が我が国の科学技術発展及び産業応用に与える効果について

科学技術の発展には NGS 関連の新たな分野を産業界も巻き込み育成することが重要と考える。これ

までに、本課題でデータ解析拠点システムの開発に携わっている企業が、本プログラムの成果をベース

にした NGS データ解析システムが京都大学 iPS 細胞研究所に導入し iPS 細胞技術の医療応用・実用化研

究の推進に寄与している。また、医療や産業に直結した課題が協力機関には多いことから、協力機関へ

の解析サポートを通じて病気の診断や治療といった医療への貢献を目指している。プロジェクト終了後

は、プロジェクト期間中に蓄積した解析データや解析ノウハウを再利用可能な形で一般に公開し、研究

者が気軽に利用可能な環境を維持することで、我が国の科学技術発展及び産業応用に貢献する予定であ

る。

14.特記事項

先導研究メンバーを中心としたサイトビジットを 2010 年 5 月 28 日に事務局と協力して開催した。月に

一度、ライフ課、事務局を含む両拠点間の打ち合わせを行っている。また、必要に応じて PO に、進捗

の報告を理研とともに行ってきた。セルイノベーション公開セミナーにおける拠点活動内容の紹介。各

種関連学会(Bioculation2010, etc)におけるパンフレットの配布。事務局によるニュースレターの発行、

ホームページ上での広報、分子生物学会 NBRP 展示ブースでのセルイノベーションプログラムの紹介等

に積極的に参加するようにし、情報発信に努力している。

Page 12: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

15.研究費一覧

21年度 22年度 23年度 計

設備備品費(千円) 384 0 物品費(千円) 792

試作品費(千円) 0 0 人件費・謝金(千円) 29,065

人件費(千円) 32,192 31,593 旅費(千円) 1,368

業務実施費(千円) 77,964 64,525 その他(千円) 61,850

間接経費(千円) 222,475 28,846 間接経費(千円) 27,923 279,244

合計(千円) 333,015 124,964 合計(千円) 120,998 578,977

Page 13: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

成果報告票(データ解析拠点・各機関) 代表/分担機関の課題名 オミックス統合解析による高精度センシング技術の開発、および、イメー

ジ解析のアノテーションDB構築への対応 代 表 / 分 担 機 関 名 独立行政法人理化学研究所 機 関 の 代 表 研 究 者 名 豊田 哲郎

1.当初計画における達成目標

本分担研究は、2 つの研究課題「高精度センシング技術の開発」と「イメージ解析のアノテーション

DB 構築基盤の提供」から構成される。前者では複数の条件もしくは異なる観測装置を用いて得られた

オミックス情報を統合して、データに隠された本質的な生命現象を高精度にセンシングする技術の開

発を行う。プロジェクトの前半では主にトランスクリプトームのデータを扱い、後半においてはさら

にフェノタイプ情報を統合した解析を行う。後者「イメージ解析のアノテーション DB 構築基盤の提

供」については、本分担研究の予算規模が申請時に比べ縮小したため優先度を落とさざるを得ない状

況にある。このため理研生命情報基盤研究部門(以下、理研 BASE)のデータベース開発の成果と関連

させることで、セルイノベーションプログラム内でニーズが生じた際には対応をする準備を整えてい

くことを計画している。

2.平成23年5月末時点における各機関の事業計画に対する研究成果 (1)成果概要 事業計画に従い「複数種類オミックス情報統合による高精度センシング技術」である ARTADE2 の

開発を行った。この手法は、タイリングアレイから得られた複数のトランスクリプトーム情報を統合

し、転写産物の構造や RNA 代謝の現象を高精度に検出する。我々はこの方法が既存遺伝子のリアノテ

ーションおよび新規遺伝子の発見において高い精度を示すことを確認した(Kawaguchi et al. submitted)。また開発技術を次世代シークエンサーデータへいち早く対応するため計画を約 1 年分前

倒しし、平成 22 年度末の段階において、次世代シークエンサーデータからの転写産物構造のセンシ

ングに目処をつけた。これは、先導研究を担っている京都大学の萩原正敏教授と議論を行った結果、

次世代シークエンサーに立脚したRNA代謝の研究に対するニーズが高いことが分かったためである。

平成21年度

平成22年度

平成23年度

平成24年度

平成25年度

同一サンプルから得られる複数種類オミックス情報統合による高精度センシング技術の

試作・提供新型シーケンサーおよびその利用技術から得られる新型オミックスデータへの対応イメージデータ等フェノタイプ情報も加味した統合解析による細胞統合センシング技術の

試作・提供イメージ解析のアノテーション

DB構築基盤の提供イメージ解析のアノテーションDB構築基盤の提供と公開および統合DB事業との連携

高精度センシング技術の開発

イメージ解析のアノテーションDB構築基盤の提供

Page 14: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

また、セルイノベーションプログラムが進められている中での話し合いにおいて提案された、「デー

タベース拠点と先導研究者は積極的に直接的な協力関係を結ぶべきである」との方向性に応じて、京

都大学・松田道行グループと細胞イメージ解析について協力関係を構築し、解析手法の開発・提供を

行った。

(2)進捗及び成果 [オミックス情報統合解析のためのツールの開発・改良]

本分担研究では多種・多様なオミックスデータに含まれる本質的な生命現象を高精度にセンシング

する手法の開発を進めている。平成 21 年度までに我々は“ARTADE2”と呼ばれる、複数コンディシ

ョンから得たゲノムタイリングアレイ発現解析データから転写産物の構造をセンシングする技術を

開発した。ARTADE2 では同一種の RNA 分子に由来する観測点において発現量が相関していることを

利用して転写物のセンシングを行い、従来の予測法より高精度に転写産物をセンシングできることを

示した(Kawaguchi et al. submitted)。先導研究からのニーズや次世代シークエンサーの使用が広がっ

てきた状況を鑑みて、次世代シーケンサーで取得した発現データである mRNA-seq データへの対応に

ついて計画を前倒しして進め、平成 22 年度末の段階でプログラムの試作版を開発することが出来た。

プログラムの開発には検証用のデータが豊富であるシロイヌナズナを用いた。7 コンディション・16

実験のシロイヌナズナ mRNA-seq のデータ(SOLiD3Plus, 50 bases/1tag * 288 Million tags, 図 1A)を取

得し、これに対して ARTADE2 を適用した。mRNA-seq によって得たデータにおいても、適切な前処理

を行うことで発現相関を観察可能であった(図 1B)。ARTADE2 によりセンシングされた転写産物の

構造は、現在一般的に用いられているプログラム:Cufflinks では解決困難であった問題に対しても

有効であることが確認できた(図 1C)。今後さらに改良を進めるとともに、ヒト・マウス等のトラン

スクリプトームへ対応を確認し、セルイノベーションプログラムで産出されるデータに適用していく

予定である。

また、転写産物を高精度にセンシングすることはゲノム・遺伝子の注釈付けの進展にも繋がること

を着想した我々は、これを実装・証明しDSDE法(Dynamic- Structure-based Dynamic Expression)と名

づけた。DSDE法によりデータベースなどに存在する予測遺伝子セットに依存せず、トランスクリプ

トームの観察結果に基づき動的に予測された転写産物セット(Dynamic Gene Structures)を構築し、こ

の転写産物セットを用いることで正確に共発現遺伝子群を定義(Dynamic Expression解析)、そしてそ

の遺伝子群を特徴付ける遺伝子機能の推測が可能となった。(Iida, Kawaguchi et al. 2011. Plant Cell Phys.)。

本分担研究で開発した ARTADE2 の実行環境は、順次 web からの公開を行っている(解析プログラ

ム・ARTADE2 on web; http://matome.base.riken.jp/WebARTADE2/ , 解析結果・ARTADE2DB:http://artade.org)。

[イメージアノテーション基盤構築]

この委託業務では京都大学松田グループとの共同研究により蛍光顕微鏡画像から自動的に細胞の

位置を特定し解析を行う研究を支援することである。松田グループでは FRET (fluorescent resonance energy transfer)を応用した細胞内イメージングシステムを構築している。FRET センサーはタンパク質

の構造によって波長の異なる2種類の蛍光が観測されるが、時系列的にこの2波長を観測することに

より細胞内活動を細胞が生存している環境のまま調べることが可能になる。

この研究においては蛍光顕微鏡画像として多数の画像の取得は可能であったが、これを自動的に効

率よく解析するシステムがなかったことが問題であった。この問題に対し我々は、蛍光顕微鏡から出

力された一連の細胞の画像から自動的に細胞の位置を認識し、細胞を追跡するシステムの開発を行っ

た。これまでは少数の細胞を手作業で追跡していたが、自動化により多数の細胞の追跡を短時間で解

析することが可能となり、統計処理を行った信頼性のある結果を得ることができるようになった。

Page 15: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

解析システムでは蛍光顕微鏡画像の特徴を反映した細胞の認識および追跡を行っている。多数の、

数時間に渡る観察の結果からなる画像においては全体の光量および背景からのノイズが変化するこ

とがあり得る。そのため単独のパラメタとして背景を認識、除去するのではある時点の画像では正確

に判定が行えても次の画像では細胞の認識に失敗することがあり得た。そこで、個々の画像ごとに信

号のレベルを認識し、統計的処理によって背景となる画素の判定を行い、違う時点の画像であっても

細胞を背景から区別できるように適応的な処理を組み込んだ。細胞の認識を個々の画像で行った後に

蛍光の波長の分析から細胞内の動的な状態変化を解析し、自動的に数値化するシステムを構築した

(図 3)。これらの処理は多数の処理ステップを含むが、数秒から数分以内の効率的な時間で1実験

の処理が可能であり、いくつかの実験データに対する適用を行っている。

3.各機関の論文発表件数 1 件

4.各機関の公開したツールやデータベース

等の件数 3件 (うち1件は先導研究への限定的な公開)

5.各機関の特許出願件数 0 件(うち国外 0 件)

6.各機関の成果を活用した共同研究数(プ

ログラム内外含む) 3件 (うち産業界との共同研究数 0 件)

7.先導研究からのデータ解析依頼数及び解析数(返却したデータの件数) 本分担研究においては、既存の手法の適用のみで解決できるタイプのデータ解析依頼は受け取ってお

らず、解析手法の確立されていないチャレンジングな解析に対してのニーズを受け取り、それにアプ

ローチするための解析手法を開発し、先導研究への貢献を行う形をとっている。現在までに3つの研

究テーマについて解析手法の解析を行っている。

1. 「次世代シークエンサー・mRNA-seq データからの転写産物構造のセンシング (京都大学・萩原

グループからのニーズに応じて開発)」

次世代シークエンサー・mRNA-seq 法を用いてトランスクリプトームについての膨大な情報を得ること

が出来るが、その情報を整理して転写産物の構造やRNA代謝について正確に知ることは容易ではない。

本分担研究ではこの問題を解決する新しい手法を開発している。詳細については研究成果(項目 2)

「オミックス情報統合解析のためのツールの開発・改良」、および図 1 に記載した。平成 23 年度中に

手法の試作を完了し、萩原グループを初めとした先導グループのデータに対して適用を開始する予定

である。

2. 「次世代シークエンサー・転写開始点シークエンスデータからのことなる制御をうけるプロモー

タ領域のセンシング(シークエンス拠点との共同)」

次世代シークエンサーを用いて転写開始点の情報を得ることが出来るが(oligo-capping 法/cap-trapper法)それらのデータから機能単位となるプロモータ領域を定義することは容易ではない。我々は転写

産物センシング手法を応用し、異なる制御を受けるプロモータ領域を記述する方法を開発している。

解析結果の例を図 2 に記載した。

3. 「細胞画像解析ソフトウェアの開発(京都大学・松田グループからのニーズに応じて開発)」

松田グループでは FRET を応用した細胞内イメージングシステムを構築しているが、この画像から

FRET のシグナルを定量化することや細胞を特定した上で時系列に沿った FRET シグナルの変動を解

析することが困難であった。本分担研究においてこの点を解決するソフトウェアを開発し、解析結果

およびソフトウェアの提供を行った。詳細については、研究成果(項目 2)「オミックス情報統合解析

のためのツールの開発・改良」、および図 3 に記載した。

Page 16: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

8.当初計画に対する各機関の達成度

現時点(平成 23 年度 5 月末)での到達点を円で示した。新型シークエンサーデータへの対応につい

ては、先導研究からのニーズに応じて当初の予定を前倒しして進めた。このため現時点において平成

23 年度末に予定していた達成目標(新型シークエンサーデータを用いた転写産物のセンシング)をほ

ぼ達成している。その他の目標についてはすべて予定通りに進行している。

9.課題内の情報共有・連携体制

本分担研究では、配分された予算で雇用された 1 人の研究員と理研 BASE で雇用されている複数人の

研究員が活動を行っている。セルイノベーションプログラムで雇用されている研究員と理研 BASE の

研究員らの間では積極的に研究ディスカッションを行い、情報共有・連携を行っている。

また、代表研究機関である遺伝学研究所・五條堀孝教授や研究グループのメンバーとはこれまでに複

数回の交流・話し合いをもち、分担研究の方向性についての確認を行った。また、本年 5 月の日本バ

イオインダストリー協会で行われた勉強会の際には、セルイノベーションプログラムの Program Officer である菅野純夫教授に現在までの研究成果を伝えるとともに、今後の研究方針の確認を行っ

た。

10.他の課題との情報共有・連携 セルイノベーションプログラム内の他の課題との連携については、特に京大松田グループ、および萩

原グループとの間で行っている。松田グループとは細胞画像の解析手法の開発について連絡をとりあ

い、研究の現場で必要とされている機能をソフトウェア上に実装している。また、萩原グループとの

連携においては昨年の段階でディスカッションを持ち、必要とされる機能について確認をしていただ

いた上で、解析プログラムの開発に取り組んでいる。

本プログラム以外では、本研究グループは理研オミックスサイエンスセンターの林崎良英センター長

の主催する FANTOM5 プロジェクトの中での連携を進めている。セルイノベーションプログラムにお

いても FANTOM5 プロジェクトにおいても次世代シークエンサーのデータに立脚して転写制御・RNA

動態を捉えることは重要なテーマであり、FANTOM5 プロジェクトでの連携は本分担研究を推進するに

あたって良い効果を生み出している。

11.人材育成

本課題で得ている研究予算のほとんどは研究員 1 人分の人件費として使用されており、この点で本分

担研究の主要な部分が人材育成に充てられているとも言える。雇用されている研究員は、本分担研究

の活動の中で様々な研究指導を受け、研究ディスカッションに参加することで、研究者として育成さ

れている。また、研究成果を国内外での発表や筆頭著者としての論文執筆に精力的に取り組んでいる。

平成21年度

平成22年度

平成23年度

平成24年度

平成25年度

同一サンプルから得られる複数種類オミックス情報統合による高精度センシング技術の

試作・提供新型シーケンサーおよびその利用技術から得られる新型オミックスデータへの対応イメージデータ等フェノタイプ情報も加味した統合解析による細胞統合センシング技術の

試作・提供イメージ解析のアノテーション

DB構築基盤の提供イメージ解析のアノテーションDB構築基盤の提供と公開および統合DB事業との連携

高精度センシング技術の開発

イメージ解析のアノテーョンDB構築基盤の提供シ

Page 17: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

本プログラム終了後の予定については未定であるが、プロジェクト取り組んでいる技術開発が普遍的

な重要性を持ち応用範囲の広いものであることからも、研究者としての大きな活躍が出来るものと考

えている。

12.終了までの具体的な見通し

本分担研究では、次世代シークエンサーから得られたデータからのセンシング技術の開発、および細

胞イメージの解析技術の開発を行っている。センシング技術の開発においては、現状では転写産物構

造・RNA 動態に焦点を当てている。平成 23 年度中に、技術開発に目処をつけ、萩原グループを初めと

したトランスクリプトーム情報を扱っているグループと共同し、重要な生命現象の解明を目指すとと

もに、今後の手法改良へのフィードバックを得ていく方針である。次世代シークエンサーを用いたデ

ータ取得は今後も主要な方法であると考えられる。本分担研究で開発された手法はいずれ公開し、次

世代シーケンサーを利用している幅広い研究分野における研究の発展に貢献できるものと考える。ま

た細胞イメージの解析手法についても、他の細胞画像解析でのニーズと照らし合わせ、必要に応じて

公開を行っていくことで、画像情報に基づく科学の発展に貢献できるものと考える。

13.本プログラムにおける成果が我が国の科学技術発展及び産業応用に与える効果について

RNA 動態は細胞・生体の機能調節に非常に重要な役割を果たす。幹細胞から分化やガンなどの疾病に

おいても転写調節・転写後調節の関与は大きい。本分担研究で開発している転写産物構造・RNA 動態

のセンシング技術を用いることで、次世代シークエンサー技術を用いて重要な生物学的・医学的現象

を発見するプロセスが加速することが期待でき、我が国の科学技術発展及び産業応用に大いに貢献す

ると考えられる。

14.特記事項

次世代シークエンサーにより大量のデータを得ることが可能となってきているが、その大量データを

解析して重要な生命現象を記述する手法の開発はまだまだ発展途上である。本分担研究ではポストゲ

ノムシークエンス時代における最も重要な研究テーマの1つである RNA 動態に焦点を絞り、次世代シ

ークエンサーデータを解析する手法の開発を進めている。この方向性はセルイノベーションプログラ

ムの方向性とも合致する。我々の手法は開発途中であるが、現在主に使われている Cufflinks よりも良

い精度で転写産物の構造を検出できる場合があることがわかっている。平成 23 年度中に予定してい

る先導研究グループ・シークエンス拠点で産出されたデータへの手法の適用の開始により、次世代シ

ークエンサーに立脚して重要な生命現象にアプローチする研究の効率化に寄与できるものと考える。

15.研究費一覧 21年度 22年度 23年度 計

設備備品費(千円) 0 0 物品費(千円) 37

試作品費(千円) 0 0 人件費・謝金(千円) 5,332

人件費(千円) 4,296 4,745 旅費(千円) 157

業務実施費(千円) 1,695 909 その他(千円) 282

間接経費(千円) 1,797 1,696 間接経費(千円) 1,742 5,235

合計(千円) 7,788 7,350 合計(千円) 7,550 22,688

Page 18: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

成果報告票(データ解析拠点・各機関) 分 担 機 関 の 課 題 名 「データ解析拠点の構築と情報研究開発」

(イン・シリコ細胞システム解析のための技術開発)

分 担 機 関 名 国立大学法人東京大学

機 関 の 代 表 研 究 者 名 宮野 悟

1.当初計画における達成目標

次世代シーケンサーが可能にしたゲノム分析のアプ

ローチの一つに、ゲノム全域にわたるエピゲノム情報

の収集と分析がある。このためのゲノムワイド・エピゲ

ノム解析ソフトウエアの研究開発を行うことを第一の

目標とする。具体的には、以下の研究開発を行う。 ・DNA メチル化がヌクレオソーム構造をダイナミッ

クに変化させ、転写開始点と転写量を制御するプロ

セスを解明するため、ヌクレオソームコアの DNA断片を次世代シーケンサーにより数億本程度解読

し、そこからクロマチン構造を高速かつ高解像度で

描出するデータ解析ソフトウエアを研究開発する。 ・次世代シーケンサーを利用してゲノムワイドに観

測した転写開始点と転写量をデータ解析するソフ

トウエアを研究開発する。 ・これらのソフトウエアをバイサルファイトシーケ

ンシングによる DNA メチル化解析ソフトと組合せ、「DNA メチル化 → ヌクレオソーム構造 → 転写開始点」のプロセスを解明するソフトウエア群として統合化する。

次に、CSMLpipeline (平成22年度にこのソフトウエアの開発コード名を Cell integrative Pipeline に

改訂し、略称を CelliP とした)を様々な細胞内機序システムの解明に応用することを目的とし、この目

的のために必要となるデータ解析機能、可視化機能、シミュレーション解析機能を本ソフトウエアに整

備し、またデータ解析拠点として必要とされる技術開発に貢献し、プロジェクト全体の連携に寄与する

ことを第二の目標とする。

図は、データ解析拠点全体における、本分担研究の担当部分を示す。

2.平成23年5月末時点における各機関の事業計画に対する研究成果

(1)成果概要

・ データ解析および大規模データ保存のための計算機サーバーを購入し、エピゲノム情報解析の

ためのソフトウエア群を整備した。当初の目標通りに DNA メチル化情報を分析する情報解析

パイプラインを構築し、独自に開発したゲノムブラウザーUTGB から表示可能とした。その結

果、エピゲノムに関するいくつかの新しい性質が見出された。

・ 細胞統合解析パイプラインソフトウェア Cell System integrative Pipeline (CelliP)の開発を進め、ソフ

トウエアのドキュメンテーションを整備するとともに、国立遺伝学研究所のデータ解析拠点サーバ

ーへの導入を行った。これによりデータ解析拠点の体制を推進した。さらに、CelliP の導入・利用

法の説明(英文・和文)とともに、ソフトウエアをオープンソースで公開した(http://cellip.hgc.jp/)。

Page 19: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

(2)進捗及び成果

○ゲノムワイド・エピゲノム解析ソフトウエアの研究開発 ヌクレオソームコアの DNA 断片を次世代シーケンサーにより数億本程度解読し、そこからクロ

マチン構造を高速かつ高解像度で描出するデータ解析ソフトウエアを研究開発した。この結果、転

写開始点の位置が進化的に保存されている周辺配列に特異的な塩基の分布と、ヌクレオソーム存在

分布が発見された(投稿準備中)。 ・ 次世代シーケンサーを利用してゲノムワイドに観測した転写開始点と転写量をデータ解析する

ソフトウエアを研究開発した。転写開始点は通常1点ではなく広く分布しており、ガウス分布

に近い分布を持っている。そのため、転写開始点の分布に対してガウス分布を適合するソフト

ウエアを作成し、分布とプロモータ領域における cis-element の関係を分析した。 ・ これらのソフトウエアを平成21年度に開発したバイサルファイトシーケンシングによる

DNA メチル化解析ソフトと組合せ、「DNA メチル化 → ヌクレオソーム構造 → 転写開始点」

のプロセスを解明するソフトウエア群として統合化した。 ・ プロジェクト内連携を促進するために、先導研究「細胞解析研究革新のための高性能エピゲノ

ムシーケンス技術の開発」(研究代表者 伊藤隆司)が開発中の技術が産出するデータを解析す

るため本ソフトウエアを利用した。 ・ ヒトゲノムを 10 倍で被覆するDNAメチル化情報(バイサルファイトシーケンシングで取得)

を分析するための計算時間は、標準的なクラスター計算機 1 ノード(Xeon X5670, 6CPU core クロック速度 2.93GHz, 主記憶 96GB) を使っても 1 日以下であり、シーケンシングする時間より

短くなるところまで漕ぎ着けた。この結果、高いメチル化サイトと低メチル化サイトに特異的

に存在する配列モチーフを同定することが出来た(投稿中)。Allele Specific Methylation を制御す

る配列の候補として注目しており、解析を続行している。 ○細胞統合解析パイプラインソフトウェア CelliP の開発

ソフトウエア CSMLpipeline は、業務担当者らが平成20年度までの研究で開発してきたもので、動

的パスウェイなどの生命システムに関する情報やシークエンス、CAGE、qRT-PCR、マイクロアレイな

どのデータを Cell System Markup Language (以下、CSML)形式で統一表現し CSML データベースマネー

ジメントシステムで管理し、このシステムと連動して、時系列データから動的ネットワーク構造を抽出

するプロセスや、データ同化技術により時系列データを動的モデルに同化させることでモデルの精緻化

を行うプロセスなど、一連の解析プロセスを、パイプラインとしてグラフィカルにコンピュータ上で構

築し、データ解析、可視化、シミュレーション解析を行うことができるツールである。このソフトウエ

アをベースにして本研究開発を行ってきた。平成21年度は、細胞がん化シグナルネットワークなどの

細胞内機序システムの解析研究を調査することにより、CSMLpipeline に新規開発して整備すべき機能を

調査し、GUI デザイン、や Cell Illustrator の改良(Nagasaki et al. In Silico Biol. 10: 0002 , 2010)など、

ユーザビリティの向上を行った。平成22年度は、コンポーネント(データ解析や解析支援のためのツ

ール)の新規開発(Jeong et al. BMC Bioinformatics. 12(Suppl 1):S8, 2011; Jeong et al. Bioinformatics, in

printing)、及び既開発のコンポーネントの改良を行った。さらに、本ソフトとウェアで作成された解析

フローを単体のソフトウエアとしてパッケージ化し Java Web Start の機能を用いて Web 上から簡単に実

行するためのフレームワークの実装を行った。国立遺伝学研究所のデータ解析拠点サーバーへの導入を

行い、データ解析拠点の体制を推進した。そして、この細胞統合解析パイプラインソフトウエアの開発

コード名を Cell integrative Pipeline に改訂し、略称を CelliP とした。さらに、CelliP の導入・利用法の説

Page 20: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

明(英文・和文)を作成し、ドキュメンテーションとともにオープンソースでソフトウエアを公開した

(http://cellip.hgc.jp/)。CelliP は、本研究開発のためのソフトウエアとして7割程度の整備状況に達したの

で、平成23年度は、現在、CelliP で作成したデータ解析フローが遺伝研のセルイノベーション用のク

ラスタマシンのグリッドエンジン上で並列動作するように、データ解析拠点・国立遺伝学研究所の五條

堀教授と引き続き連携し整備を進めている。CelliP は、細胞・生命プログラムの統合的理解を目的とし

た先導研究において、実験データとコンピュータ解析をシームレスにつなぐ共通性・汎用性の高い基盤

ソフトウエアとなることを目指して開発を進めている。

3.各機関の論文発表件数 10 件

4.各機関の公開したツールやデータベース等

の件数

4 件

5.各機関の特許出願件数 0 件(うち国外 0件)

6.各機関の成果を活用した共同研究数(プロ

グラム内外含む)

8 件

(うち産業界との共同研究数 0件)

7.先導研究からのデータ解析依頼数及び解析数(返却したデータの件数)

次世代シーケンサーを利用してマウス、メダカ、アカパンカビのゲノム全域から収集した DNA メ

チル化情報を分析した。

8.当初計画に対する各機関の達成度

ゲノムワイド・エピゲノム解析ソフトウエアの研究開発については、当初の計画通りに研究は進展して

いる。細胞統合解析パイプラインソフトウェアの開発については、ソフトウエア開発としては7割程度

達成しており、今後、先導研究との連携が課題として残っている。

9.課題内の情報共有・連携体制

・エピゲノム研究を推進している伊藤隆司グループとの連携は緊密であり、マウス、アカパンカビを使

った研究が進展している。他のグループからの共同研究の要望があれば、いつでも対応できる状態であ

る。

・データ解析拠点・国立遺伝学研究所の五條堀教授と、フェース・ツー・フェース打合せ及びビデオ会

議システムによる打合せ、メール等を活用して、情報の共有と連携を行い、進捗の達成度のところで述

べたようにCelliPの導入を共同して行った(2010 年 6 月~8 月)。データ解析拠点内部向けに、CelliPの

利用方法講習会を開催し連携強化を進めた。利用を促進するためにセルイノベーション用のためのホー

ムページ(http://cellip.hgc.jp/)(英文、及び和文)を整備し、ソフトウエアの配布を開始した。

Page 21: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

10.他の課題との情報共有・連携

・上記のように本プログラムの伊藤隆司グループ(含 中島研究室)との情報共有と連携は継続している。

本プログラム以外でエピゲノム研究に関しては連携している研究機関は、スタンフォード大学、コロラ

ド大学、東京大学内の4研究室である。

・CelliP の開発における本プログラム以外との連携では、文部科学省のプログラムであるターゲットタ

ンパク研究情報プラットフォーム(http://www.tanpaku.org/) で既に利用されている Cell Illustrator で作成

された 35 課題のモデル(TPAtlus; http://net.genes.nig.ac.jp/networkdb/) を CelliP を用いてどのように有

効に編集・解析できるかについての講習会をあわせて行い、今後の相互の連携強化を行った。

11.人材育成

森下真一:現在雇用しているのは1名であり、着実な研究成果を挙げている (Genome Research, PLoS

One 等で論文報告)。

12.終了までの具体的な見通し

・DNA修飾、ヒストン修飾、ヌクレオソーム構造、転写の理解は、次世代シーケンサーの普及もあり、

この2年ぐらいで急速に進展している。あたらしい発見には、ソフトウエア解析が欠かせず、とどめを

刺すといっても過言ではない。新しく大規模なデータを高速に解析する技術研究開発を進めた結果、共

同研究は広がり、研究成果も増えてきている。今後も 3C, 4C, Hi-C などのクロマチン高次構造の謎を

解くカギとなる実験手法に対応したソフトウエア開発をすすめ、共同研究の輪を広げたい。

・CelliP は現在のバージョンをオープンソースで公開しているが、今後は先導研等の研究の現場での利

用・応用を推進するために、ソフトウエアのバージョン管理と配布を継続し行える体制を作り、ホーム

ページ、利用講習会、ビデオを利用した利用手引き等により、本ソフトウエアの普及に努める。

13.本プログラムにおける成果が我が国の科学技術発展及び産業応用に与える効果について

・ゲノムワイド・エピゲノム解析ソフトウエアの研究開発について、出口は、パーソナルゲノム解析に

あり、東大病院と連携しながら、疾患関連領域に頻出する大規模変異とクロマチン高次構造の関係を探

ってゆきたい。

・CelliP は産業利用も含めオープンソースで公開しており、様々な生命データ解析に必要なツールをそ

ろえているため(Java だけでなく R で書かれたツールが使え、データフォーマットをあわせることで、

データ解析法を容易にかつ独自に導入できる)、セルイノベーションプログラムだけでなく今後計画さ

れるさまざまな生命科学研究を推進するための基盤ソフトウエアとして有用であると考えている。

14.特記事項

特になし。

15.研究費一覧

21年度 22年度 23年度 計

設備備品費(千円) 400 250 物品費(千円) 7,122

試作品費(千円) 0 0 人件費・謝金(千円) 7,190

人件費(千円) 0 10,820 旅費(千円) 840

業務実施費(千円) 3,446 8,161 その他(千円) 3,448

間接経費(千円) 1,154 5,769 間接経費(千円) 5,580 12,503

合計(千円) 5,000 25,000 合計(千円) 24,180 54,180

Page 22: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

成果報告票(データ解析拠点・各機関)

代表/分担機関の課題名 データ解析拠点の構築と情報研究開発(セルイノベーションにおける動向

調査業務並びに研究推進業務

代 表 / 分 担 機 関 名 情報システム研究機構国立遺伝学研究所/国立大学法人東京大学

機 関 の 代 表 研 究 者 名 見原 明

1.当初計画における達成目標

プロジェクト全体の事務局機能を担って参加機関間の調整業務を行う。

①セルイノベーションの研究に関わる国内外の情報の収集

セルイノベーションの先導研究や研究拠点での研究に関わる国内外の情報の収集し、プログラムの推

進に活用する。

②セルイノベーションに係る研究推進業務

(あ)研究推進のための活動、業務

・PD/PO の指導のもとにセルイノベーション内の研究の進捗状況を把握する。特に次世代シーケンサ

ー利用状況の把握は拠点と協力し進める。

・成果発表会、研究連絡会等の開催による研究成果情報の共有、交流の支援

(い)セルイノベーションに係わる普及啓発事業

・セルイノベーションの研究活動を国内外に発信する

1)パンフレット・ニュースレター等の作成、ホームページの運用

2)セルイノベーション公開セミナー等の開催

セルイノベーションの成果を広く紹介する目的で公開セミナーを開催する。

③委員会運営

セルイノベーション実施に係る会議の定期的な開催に関し、資料作成、会議運営を行う。これにより

プログラムの実施計画等についての審議を行い、セルイノベーションの研究推進に資する。

2.平成23年5月末時点における各機関の事業計画に対する研究成果

(1)成果概要

セルイノベーションに関わる国内外の情報収集、研究推進業務及び委員会運営の業務を実施した。情報

収集においては、各種学会、論文やインターネットを通じて情報収集を行った。研究推進業務において

は、拠点との打合せ、サイトビジット、及び成果発表会等を開催し進捗状況の把握及び研究者間の交流

を図った。特に拠点の進捗状況を把握することに努め PD/PO へ報告した。普及啓発事業については、

パンフレット、ニュースレターの作成配布、ホームページの立ち上げ運用、公開セミナーの実施等を行

った。委員会運営については、適宜 PD/PO/委員の日程調整、資料の作成、運営の支援を行った。

Page 23: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

(2)進捗及び成果

①セルイノベーションの研究に関わる国内外の情報の収集

セルイノベーションの研究に係わる国内外の情報の収集では特に次世代シーケンサーを中心とした

調査を行った。

次世代シーケンサーの原理や仕様等に関する調査、国内外における次世代シ-ケンサーを用いたプロ

ジェクト研究等の動向について、セミナー、研究会、日本分生物学会年会、日本生化学会等の学会への

参加、学術論文及びインターネットを通して幅広く情報収集し、リアルタイムの最新情報を関係者に提

供するとともに一部についてはセルイノベーションのホームページに掲載した。

②セルイノベーションに係る研究推進業務

(あ)研究推進のための活動、業務

定期的な拠点/文科省との打合せ行った。研究報告会、拠点サイトビジットを開催した。

文科省拠点打合せ:平成 21 年 11 月 11 日、12 月 22 日、平成 22 年 2 月 8 日、4 月 8 日、5 月 14 日、8

月 2 日、及び 10 月 29 日の 7 回開催。

サイトビジット:シーケンス拠点(平成 21 年 11 月 26 日及び平成 22 年 8 月 25 日)、データ解析拠点

(平成 22 年 5 月 28 日)各施設や導入機器の見学及びプログラム運営に関しての意見交換を行った。

成果発表会:平成 22 年 9 月 17-18 日に静岡県三島にて開催。各代表研究機関から口頭発表を、分担

研究機関からポスター発表を行い、進捗状況の把握、情報の共有を図った。また今後の方針についても

討議した。

(い)セルイノベーションに係わる普及啓発事業

パンフレットの発行及び改訂版の作成、ニュースレター発行 3 回、ホームページによるセルイノベー

ションの紹介、分子生物学会及び生化学会分子生物学会合同大会の NBRP 展示ブースでのセルイノベー

ションの紹介を実施した。また公開セミナー、国際シンポジウムを企画・実施した。

1)パンフレット・ニュースレター等の作成、ホームページの立上・運用

平成 21 年 12 月、セルイノベーションの日本語のホームページの運用を開始した。平成 22 年 4 月に

英語版を立ち上げ、以後適宜改訂及び新着情報を追加して運営している。

・パンフレットの発行

日本語パンフレット(平成 21 年 12 月)、英文パンフレット(平成 22 年 3 月)

日本語パンフレット(改訂版)(平成 22 年 10 月)、英文パンフレット(改訂版)(平成 22 年 12 月)

・ニュースレターの発行

第 1 号(平成 21 年 3 月)、第 2 号(平成 22 年 10 月)、第 3 号(平成 23 年 3 月)

2)セルイノベーション公開セミナー等の開催

セルイノベーション・セミナー「Innovative Cell Biology by Innovative Technology」(平成 21 年 10 月 30

日、東京ガーデンパレス)参加者数 230 名

第 1 回国際シンポジウム「第 1 回セルイノベーション国際シンポジウム」(平成 22 年 3 月 29 日、東

京国際フォーラム)参加者数 120 名

平成 22 年度公開セミナー「次 n世代シーケンサーの急速な発展と生命科学への活用」(平成 22 年 11

月 3 日、TEPIA ホール:機械産業記念事業財団)参加者数 142 名

3)その他広報

第 32 回日本分子生物学会 NBRP 展示(平成 21 年 12 月 9-12 日横浜)

第 33 回日本分子生物学会/第 83 回日本生化学会合同大会 NBRP 展示(平成 22 年 12 月 7-10 日神戸)

Page 24: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

バイオインダストリー協会(JBA)“未来へのバイオ技術”勉強会

セルイノベーション勉強会第 1 回「セルイノベーションと現代疾患」(平成 23 年 5 月 16 日 JBA 会議

室)参加者 37 名

セルイノベーション勉強会第 2 回「セルイノベーション データ解析点における研究動向」(平成 23

年 5 月 23 日 JBA 会議室)参加者 31 名

③委員会運営

シーケンス拠点運営 WG,、運営委員会及び実施者会議を以下の日程で開催した。それらについて資料

作成、運営の支援を事務局業務として行った。

平成 21 年度シーケンス拠点運営 WG

第 1 回(平成 21 年 7 月 27 日)、第 2 回(平成 21 年 11 月 26 日)を開催し、シーケンス拠点の活動報

告、シーケンス解析の進め方について議論した。

平成 21 年度運営委員会

第 1 回(平成 21 年 7 月 27 日)、第 2 回(平成 22 年 3 月 9 日)、第 1 回はキックオフミーティングと

して各課題の研究概要報告を第 2 回については成果報告及び今後の研究計画について議論した。

平成 22 年度運営委員会

第 1 回(平成 22 年 4 月 23 日)、2 回(平成 22 年 9 月 28 日)、第 3 回(平成 22 年 11 月 30 日)、第 4

回(平成 23 年 1 月 6 日)、第 5 回(平成 23 年 2 月 1 日)を開催した。平成 22 年度の運営委員会では

主に拠点の進捗状況の把握、スケージュールの確認等を行った。第 3 回及び第 4 回運営委員会では協

力機関の募集及び採択について討議した。

平成 22 年度実施者会議

平成 22 年 9 月 18 日に開催し、各課題代表研究者による実施者会議では主にシーケンス解析の進め方

について先導研究と拠点との間で意見交換がなされた。

平成 22 年度協力機関選定 WG

第 1 回(平成 22 年 12 月 16 日)、第 2 回(平成 23 年 1 月 5 日)を開催し、協力機関の募集要領の決

定及び応募申請書の審査を行った。

平成 23 年度倫理 WG

第 1 回を平成 23 年 5 月 20 日に開催し、セルイノベーションにおけるヒトゲノム・遺伝子研究の倫理

方針について意見交換が行われた。

3.各機関の論文発表件数

4.各機関の公開したツールやデータベース等

の件数

5.各機関の特許出願件数 (うち国外)

6.各機関の成果を活用した共同研究数(プロ

グラム内外含む)

(うち産業界との共同研究数)

7.先導研究からのデータ解析依頼数及び解析数(返却したデータの件数)

Page 25: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

8.当初計画に対する各機関の達成度

セルイノベーションに関わる国内外の情報収集、研究推進業務及び各種委員会運営について十分に当初

計画通りに達成されている。各種委員会開催及び情報の発信の実績について図を示した。

9.課題内の情報共有・連携体制

各種委員会、打合せ、成果発表会、サイトビジットを通じて、課題内の情報共有を行った。特にシ

ーケンス拠点、データ解析拠点とは定期的に打合せを行い、プログラムの進捗状況や問題点を把握

し、PD/PO へ適宜報告した。

10.他の課題との情報共有・連携

・シーケンス拠点及びデータ解析拠点とは文科省を含め定期的に打合せを行い、プログラムの進捗状況

の把握及び情報共有を行っている。

・公開セミナー、JBA勉強会の開催及びニュースレターの発行送付等を通じて本プログラム以外の研

究者や企業等に向けて、セルイノベーションの研究の紹介を行った。

・協力機関選定に関わる事務的業務を通して、拠点と協力機関研究者との連携を支援した。

11.人材育成

成果発表会の実施、研究実施者間の情報交換及び研究者間の交流を図るために平成 22 年 9 月 17 日―

18 日の 2 日間にわたり静岡県三島にて実施した。

拠点へのサイトビジット シーケンス拠点サイトビジット(平成 21 年 11 月 26 日、平成 22 年 8 月 25

日、理化学研究所横浜研究所)及びデータ解析拠点サイトビジット(平成 22 年 5 月 28 日、国立遺伝学

研究所)を実施し施設や導入機器の見学及びプログラム運営に関しての意見交換を行った。

若手実務担当者会議の実施 若手実務担当者の交流の場として企画し、平成 23 年 1 月 25 日に東京大

学医科学研究所にて実施してプログラム内でのコミュニケーションの円滑化を図った。また、実務者向

けメーリングリスト、情報交換のサイトの設置などについてもディスカッションした。

Page 26: 成果報告票(データ解析拠点・代表機関のマネジメ …...②大量データ解析のための基盤技術の研究開発 NGS の普及に伴い、発現解析や変異解析の需要はますます高まっているが、従来の配列解析ツール(マ

12.終了までの具体的な見通し

・本プロジェクトの終了までに、プロジェクトの運営が円滑に行われるために、各機関間の調整業務と

して各種委員会の開催運営、成果発表会等の開催、拠点との打合せ等を引き続き行う。特許についての

方針をまとめ、必要に応じて取得の支援体制を築く。成果の取りまとめや広報活動として、公開セミナ

ーの開催、ホームページの維持管理、パンフレットの改訂配布等を実施する。

13.本プログラムにおける成果が我が国の科学技術発展及び産業応用に与える効果について

セルイノベーションの成果を広く学界、産業界へ知らしめる目的で毎年、公開セミナーを開催している。

産業界に向けてセルイノベーションの成果を発信するとともに、バイオインダストリー協会等の産学連

携勉強会を行うことにより、プログラムにおける成果の産業応用推進の一助となると期待される。

14.特記事項

各種委員会、打合せの開催や情報収集を通じて、文科省/PD/PO/各研究者間の円滑なプログラム運営等

を維持できるよう、支援を行ってきた。今後も連絡を密にとりプログラム研究の推進を支援する。特許

取得について弁理士の協力の下に支援体制を構築する。セルイノベーション公開セミナーの開催、パン

フレットの改訂及び配布、ニュースレターの発行、ホームページ上での広報、分子生物学会 NBRP 展示

等を通じてセルイノベーションの普及啓発を継続していく。JBA と協力して産業界向けにセルイノベー

ションの活動を広く紹介している。

15.研究費一覧

21年度 22年度 23年度 計

設備備品費(千円) 0 0 物品費(千円) 230

試作品費(千円) 0 0 人件費・謝金(千円) 24,184

人件費(千円) 19,396 27,872 旅費(千円) 2,477

業務実施費(千円) 25,604 13,371 その他(千円) 14,047

間接経費(千円) 4,500 4,124 間接経費(千円) 4,094 12,718

合計(千円) 49,500 45,367 合計(千円) 45,032 139,899