特集:腸内細菌と免疫疾患 - semantic...

11
412 Jpn. J. Clin. Immunol., 37 5412422 20142014 The Japan Society for Clinical Immunology はじめに ヒト腸管には数百種の腸内常在菌(腸内細菌)が 数百兆個生息している.この様々な種類の細菌が形 成するヒト腸内細菌叢の解析法として,1960 年代 の嫌気培養法の開発を背景にした構成細菌を個別に 分離培養する培養法がある.また,分子生物学的手 法が出て来た 1980 年代には,細菌叢から調製した 構成細菌のゲノム集合体から 16S リボソーム RNA 16S rRNA)遺伝子データを解析する PCR 法(ポ リメラーゼ連鎖反応)の普及を背景にしたメタ 16S 解析法がある(1 ).培養を介さない 16S 解析法 を用いた研究から,未だ分離培養されていない細菌 種(いわゆる,難培養性細菌)がヒト腸内細菌叢に 多数存在することが明らかになった.しかし,16S 解析だけでは細菌種が分かっても細菌叢がもつ代謝 系等の機能に関する情報を得ることはできず,結局 のところ,腸内細菌叢の全体機能を知るには多数を 占める難培養性細菌の正体を明らかにする必要が あった. 特集:腸内細菌と免疫疾患 総  説 ヒト腸内マイクロバイオーム解析のための最新技術 服部正平 Advanced technologies for the human gut microbiome analysis Masahira HATTORI Center for Omics and Bioinformatics, Graduate School of Frontier Sciences, The University of Tokyo Accepted September 8, 2014summary Analysis of the human gut microbiome, collective genomes of over 100 trillion cells of intestinal microbes which form the complex bacterial community, has recently become more practical due to remarkable advances in next-generation sequencing technologies (NGS). Several studies using NGS-based metagenomic approaches have been conducted to comprehensively ana- lyze genes/functions and species composition in the human gut microbiome. These NGS-based approaches have demonstrated that their ecological and biological features that have been rather difficult to pursue can now be characterized with relative ease and high-throughput. There have also been several analytical developments and improvements to accurately evaluate the microbiome data from viewpoint of biology and ecology. In addition to the impact of external factors such as diet, these NGS- based studies have strongly suggested that the human gut microbiome has profound influences on various host physiologies including disease, of which the gut microbiome exhibited ecologically and functionally aberrant structure as compared with that of healthy control. On the other hand, the detailed assessment of the effect of experimental protocols including sample storage and delivery, DNA preparation, and sequencers used on the gut microbiome structure is also necessary. I herein present the NGS-based methodology for the human gut microbiome analysis. Key words microbiome; microbiota; gut; metagenome; 16S rRNA gene 抄  録 近年の DNA シークエンシング技術の革新的進歩(いわゆる,次世代シークエンサー ; NGS)により,数百兆個 の細菌から構成されるヒト腸内細菌叢の集合ゲノム(マイクロバイオーム)の網羅的で高速な解析が可能となった. また,細菌叢の生物学的あるいは生態学的知見を正確に得るための解析技術の開発や改良もなされ,細菌叢の包括 的な研究が世界的に進められるようになった.その結果,ヒト腸内細菌叢の基本的な全体構造や機能,食事等の外 的因子による影響,さらには様々な疾患における腸内細菌叢の異常(dysbiosis)等が明らかとなり,腸内細菌叢と 宿主ヒトの生理現象がこれまでの想像を越えて密接な関係にあることが示唆された.一方で,サンプルの保存や搬 送法,DNA 抽出法,用いるシークエンサーの種類等の解析プロトコールによる影響についての詳細な精査も必要 になっている.本稿では,NGS を用いたヒト腸内マイクロバイオームの解析法について解説する. 東京大学大学院新領域創成科学研究科附属オーミクス 情報センター

Upload: others

Post on 13-Mar-2020

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

412 Jpn. J. Clin. Immunol., 37 (5) 412~422 (2014) Ⓒ 2014 The Japan Society for Clinical Immunology

は じ め に

ヒト腸管には数百種の腸内常在菌(腸内細菌)が数百兆個生息している.この様々な種類の細菌が形成するヒト腸内細菌叢の解析法として,1960年代の嫌気培養法の開発を背景にした構成細菌を個別に分離培養する培養法がある.また,分子生物学的手法が出て来た 1980年代には,細菌叢から調製した構成細菌のゲノム集合体から 16Sリボソーム RNA

(16S rRNA)遺伝子データを解析する PCR法(ポリメラーゼ連鎖反応)の普及を背景にしたメタ 16S

解析法がある(図 1).培養を介さない 16S解析法を用いた研究から,未だ分離培養されていない細菌種(いわゆる,難培養性細菌)がヒト腸内細菌叢に多数存在することが明らかになった.しかし,16S

解析だけでは細菌種が分かっても細菌叢がもつ代謝系等の機能に関する情報を得ることはできず,結局のところ,腸内細菌叢の全体機能を知るには多数を占める難培養性細菌の正体を明らかにする必要があった.

特集:腸内細菌と免疫疾患総  説

ヒト腸内マイクロバイオーム解析のための最新技術

服 部 正 平

Advanced technologies for the human gut microbiome analysis

Masahira Hattori

Center for Omics and Bioinformatics, Graduate School of Frontier Sciences, The University of Tokyo

(Accepted September 8, 2014)

summary

Analysis of the human gut microbiome, collective genomes of over 100 trillion cells of intestinal microbes which form the complex bacterial community, has recently become more practical due to remarkable advances in next-generation sequencing technologies (NGS). Several studies using NGS-based metagenomic approaches have been conducted to comprehensively ana-lyze genes/functions and species composition in the human gut microbiome. These NGS-based approaches have demonstrated that their ecological and biological features that have been rather difficult to pursue can now be characterized with relative ease and high-throughput. There have also been several analytical developments and improvements to accurately evaluate the microbiome data from viewpoint of biology and ecology. In addition to the impact of external factors such as diet, these NGS-based studies have strongly suggested that the human gut microbiome has profound influences on various host physiologies including disease, of which the gut microbiome exhibited ecologically and functionally aberrant structure as compared with that of healthy control. On the other hand, the detailed assessment of the effect of experimental protocols including sample storage and delivery, DNA preparation, and sequencers used on the gut microbiome structure is also necessary. I herein present the NGS-based methodology for the human gut microbiome analysis.

Key words    microbiome; microbiota; gut; metagenome; 16S rRNA gene

抄  録

近年の DNAシークエンシング技術の革新的進歩(いわゆる,次世代シークエンサー ; NGS)により,数百兆個の細菌から構成されるヒト腸内細菌叢の集合ゲノム(マイクロバイオーム)の網羅的で高速な解析が可能となった.また,細菌叢の生物学的あるいは生態学的知見を正確に得るための解析技術の開発や改良もなされ,細菌叢の包括的な研究が世界的に進められるようになった.その結果,ヒト腸内細菌叢の基本的な全体構造や機能,食事等の外的因子による影響,さらには様々な疾患における腸内細菌叢の異常(dysbiosis)等が明らかとなり,腸内細菌叢と宿主ヒトの生理現象がこれまでの想像を越えて密接な関係にあることが示唆された.一方で,サンプルの保存や搬送法,DNA抽出法,用いるシークエンサーの種類等の解析プロトコールによる影響についての詳細な精査も必要になっている.本稿では,NGSを用いたヒト腸内マイクロバイオームの解析法について解説する.

東京大学大学院新領域創成科学研究科附属オーミクス情報センター

Page 2: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

服部・ヒト腸内細菌叢の解析技術 413

このような状況下で,1998年にこの両方法の間隙を埋める第 3番目の方法として,メタゲノム解析法が提唱された1).この当初のメタゲノム解析法では細菌叢メタゲノムは,有用な遺伝子を狙い撃ちで探索,獲得することを目的としたリソースであった.その後,細菌叢メタゲノムを網羅的にシークエンスして,得られる配列データ中に存在する遺伝子を情報学的に枚挙する方法が 2004年に発表された2).今日では,前者を環境ゲノミクス(または,機能メタゲノミクス),後者をメタゲノミクスと区別される(図 1).このようにメタゲノム解析法の開発により,細菌叢の全体を細菌(生態学)と機能(生物学)の両面から解明することが可能になった.しかし,メタゲノム解析には大量のシークエンスデータが必要であり,当初のサンガー法による解析ではその網羅性に限界があった.この限界を克服したのが,近年その技術進歩が著しい NGSである.NGSを用いることにより従来の数百~数千倍の大量のシークエンス

データを容易に収集でき,きわめて網羅性の高いメタゲノム解析が可能になった.

1.次世代シークエンサー(NGS)

ヒト個人のゲノムを 1,000ドルで解読することをめざして,様々なタイプの NGSの開発が今日進められている(表 1).NGSと従来のキャピラリ式シークエンサー(ABI3730xl)との決定的な違いは,NGSの1回の稼働(ラン)で並列解析できるサンプル(鋳型 DNA)数が ABI3730xlの~数千万倍となったことである.これを可能にしたのは,emulsion PCRや bridge PCRといったナノスケールの鋳型 DNA調製法やシークエンス反応基板,高感度な検出センサーの開発等である.より最近では,PCR増幅せずに 1分子の DNAを鋳型としたより高速で長いリード長の配列データを生産できる機種(PacBio RS)も実用化されている.このように,NGSの開発は「より高速に,より長く,より安く,より多く,より精度高く」を目標に今日も進められており,その登場はヒトゲノムよりも推定ゲノムサイズが大きく,高い配列多様性と新規な遺伝子が多い腸内マイクロバイオームを高い網羅性と低コストで解析することを実現化した.

2.NGSを用いたマイクロバイオーム解析の全体プロセス

NGSを用いた腸内細菌叢の基本的な全体工程を図 2に示す.1)メタ 16S遺伝子データによる菌種解析,2)メタゲノムデータによる遺伝子及び菌種解析,3)分離培養された細菌株の個別ゲノム解析

図 1 細菌叢の解析方法

表 1 市販次世代シークエンサーの機種と平均的仕様

シークエンサー 市販元 平均リード長 平均リード数/ラン

総塩基数/ラン

稼働時間/ラン 検出物質

454 GS FLX+ロシュ

900 1 M(百万) 900 Mb 24 hピロリン酸

454 GS Junior 400 0.1 M 40 Mb 4 h

PacBio RS PacBio 3,000 0.35 M 100 Mb 1.5 h

蛍光色素HiSeq 2500

イルミナ100 6,000 M 600 Gb 2週間

MiSeq 300 50 M 15 Gb 3日

5500xl SOLiD ライフテクノロジーズ 75 2,800 M 200 Gb 2週間

Ion PGMライフテクノロジーズ

400 5 M 2 Gb 6 hH+イオン

Ion Proton 200 80 M 16 Gb 6 h

ABI 3730xl1 ライフテクノロジーズ 800 96 80 Kb 2 h 蛍光色素1 サンガー法を原理とした従来のキャピラリ式シークエンサー

Page 3: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

日本臨床免疫学会会誌(Vol. 37 No. 5)414

とリファレンスゲノムデータベースの構築の 3つが柱となっている.メタ 16S解析は,構成細菌種の16S遺伝子の可変領域を共通 PCRプライマーで一括増幅し,その 16Sアンプリコンの配列データをNGSで取得する.得られる 16S配列データは菌種の特定や菌種組成の解析等に用いる.メタゲノム解析は,細菌叢 DNAを NGSにより直接シークエンスして大量のゲノム配列を取得する.ついで,そこにコードされる遺伝子や代謝系等の機能をインフォマティクスにより解析する.ヒトから分離された個々の菌株は NGSによりゲノムシークエンスされ,それらはレファレンスゲノムとして活用されている.現在までに 7,000株以上がデータベース化されている(http://www.hmpdacc.org/).このほか,被験者のさまざまなメタデータ(年齢,BMI,投薬,食事等)も収集されており,これらは細菌叢データとの関連性の解明に重要となる.以下個別にその詳細を解説する.

2-1.NGSによるメタ 16S解析メタ 16S解析は今日もっとも汎用されている菌種解析法である.その理由として,1)共通 PCRプライマーによる 16S遺伝子の一括増幅が可能等の実験操作が容易であること,2)多数の分離細菌株の16S配列データがデータベース化されていること,3)微量の細菌叢サンプルも解析可能であること等が挙げられる(図 3).

従来の 16S解析では,16Sアンプリコンの大腸菌へのクローニング・培養等の煩雑な操作と長い時間が必要であったため,細菌叢を十分に網羅できるデータ量を取得することが困難であった.しかし,NGSではクローニング工程がなく,16Sアンプリコンをそのままシークエンスに供することができることや,バーコード配列をもつ PCRプライマーを用いることにより,異なったサンプルを1回の稼働

で同時にシークエンスでき(~100サンプル/稼働),サンプルあたり十分量の配列データ(~数万データ/サンプル)を数日以内に得ることができる等,簡便性,高速性,網羅性,経済性の様々な面ですぐれている.

16S遺伝子に存在する 9個(V1~V9)の可変領域のうちどれを解析するかは,可変領域の長さ(あるいは個数)とそれぞれの配列多様性の程度,用いる PCRプライマーがカバーする細菌種の数などに依存する.可変領域が長く(あるいは個数が多く),細菌間の塩基変異率が高い可変領域を解析すれば,菌種特定や菌種組成データの正確さ(精度)は向上するが,一方で,それらの増幅に用いる共通 PCR

プライマー配列が構成菌種の 16S遺伝子の多くとミスマッチ塩基があると,PCR増幅に偏りが生じ,結果的に,一部の菌種の過小評価と全体的に定量性に欠けたデータになる3).また,解析したい領域の塩基数は用いる NGSのリード長以下でなければならない.筆者のグループは,一部配列を改変した共

図 2 ヒト腸内マイクロバイオーム解析の全体プロセス

Page 4: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

服部・ヒト腸内細菌叢の解析技術 415

通 PCRプライマー(27Fmod)と従来の 338Rを用いて可変領域(V1と V2,~400 bp)をシークエンスする定量性の高いヒト腸内細菌叢のメタ 16S解析法をあらかじめ組成比が分かった人工の合成細菌叢を用いて評価することで確立した(図 3)4).得られた配列データ(リード)には不完全なシークエンス反応等による低精度データが多分に含まれる.そのため,これらを除外する一連のクオリティーチェック工程が必要である.筆者らの場合,この工程で約 30%の低精度リードが除去される.選択された高品質リード(3,000~5,000/サンプ

ル)は両端のプライマー配列を除去後,96%の配列類似度(閾値)でクラスタリングする.この操作をOTU(Operational taxonomic unit)解析と言い,閾値以上の配列類似度を互いにもつリード同士をひとつの分類ユニット(OTU)としてグループ化する.生

じた OTU数はその細菌叢を構成する(種レベルでの)菌種数に見積もられ,菌種数は細菌叢の多様性を計る尺度になる.NGSの高品質リードにはシークエンスエラー(~平均 1 %)が含まれるため,解析するリード数が多くなればなるほどクラスタリングで形成される OTU数は実際の菌種数よりも多くなる傾向がある4).筆者のグループはこの菌種数の過大見積りを最小限にするために,ヒト腸内細菌叢のサンプルあたりのリード数を 3,000と設定している.各 OTUを構成するリードの数は各 OTUの存在量を反映しており,その割合から各 OTUの組成比が見積もられる.ついで,各 OTUの代表配列を

Ribosomal Database Project(http://rdp.cme.msu.edu)等の公共 16Sデータベースに対して類似度検索(96%閾値)を行い,各 OTUを既知菌種に帰属する.96%以上で既知菌種にヒットする OTUはそのヒットした菌種(種レベル)であるとアサインされる.一方,既知菌種に 96%以下でヒットした OTU

は,さらに大きな分類である属(genus)あるいは科(family),最大の分類指標である門(phylum)レベルでの帰属となる.筆者らは,曖昧さは拭えないが,95%以上の類似度を示す OTUについては属レベルでの帰属,90%以上の OTUには門レベルへの帰属としている.この帰属ルールで,ヒト腸内細菌叢の場合,種レベルで帰属できる OTUは全リードの約 80%,属レベルで帰属できる OTUは約90%,門レベルで帰属できる OTUは約 97%となる.配列類似度 90%以下のどの既知菌種にも帰属不可能な OTU(約 3 %)は,新菌種の可能性が高く,best-hitした菌種名とその配列類似度を記録することにしている.いずれにしても,得られた OTUの約 97%は何らかの既知菌種(門)に帰属できることになる.上述した一連の 16S解析から得られた 100名以上の健常者(成人)の腸内細菌叢の菌種組成の門レベルでの解析例を図 4 Aに示す(筆者らのグループ,未発表).これから,ヒト腸内細菌叢はおもに 4門(Firmicutes, Bacteroidetes, Actinobacteria, Proteobacte-

ria)に属する菌種で構成されることがわかる.表 2

には腸内細菌叢を含めたヒト常在菌叢中で高頻度に

図 3 メタ 16S解析:16S rRNA遺伝子をベースとした腸内細菌叢解析

Page 5: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

日本臨床免疫学会会誌(Vol. 37 No. 5)416

検出される菌種(門と属レベル)をリストする.なお,この 4門の組成比は異なるが,口腔や皮膚等の他のヒト常在菌叢においてもこの 4門の優占性は変わらない5).

16Sデータから異なった細菌叢間の全体的な類似性も評価できる(図 3).ひとつは検出される OTU

数をベースにした細菌叢間の多様性の相違を調べる解析である(上述).二つ目は検出された OTU間の配列類似度から各細菌叢の系統樹を作成し,その系統樹の類似性(比較する細菌叢との系統樹間で共有する枝の長さとそれぞれの細菌叢に固有な枝の割

合)から,細菌叢間の全体構造の相違の程度を求める.この解析を UniFrac解析と言い,細菌叢間の類似性を 0(100%類似する)~ 1(100%類似しない)の距離(UniFrac距離)で表す6).UniFrac解析にはOTUに含まれるリード数(組成比)を考慮しないunweightedと考慮した weighted UniFrac解析がある. 前者は菌種の有無だけが,後者は同一菌種の組成比の相違が両細菌叢間の類似性の距離に反映される.図 5 Aに,健常者群と疾患患者群で検出されたOTU数の比較例を示す.検出された OTU数が両群間で有意に異なっている場合は,両群の腸内細菌叢

図 4 ヒト腸内細菌叢の菌種組成と遺伝子組成(A)16Sデータによる門レベルでの菌種組成.(B)メタゲノムデータによる属レベルでの菌種組成.(C)メタゲノムデータによる遺伝子組成.横軸:100名の成人被験者.解析した 16Sリード数=3000/被験者(A).解析したメタゲノムデータ数≧100万/被験者(B, C).

表 2 ヒト常在菌叢を構成する主な細菌種

門 属 門 属 門 属

Firmicutes ClostridiumEubacteriumLactobacillusRuminococcus

RoseburiaBlautiaDorea

EnterococcusFaecalibacterium

GemellaLachnospiraceae

StreptococcusStaphylococcus

Veillonella

Bacteroidetes BacteroidesPrevotella

ParabacteroidesPorphyromonas

Actinobacteria BifidobacteriumEggerthellaActinomycesCollinsella

RothiaCorynebacterium

Propionibacterium

Proteobacteria EscherichiaHaemophilus

KlebsiellaNeisseria

Pseudomonas

Fusobacteria FusobacteriumLeptotrichia

Spirochaetes Treponema

TM7 TM7

Verrucomicrobia Akkermansia

Page 6: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

服部・ヒト腸内細菌叢の解析技術 417

の多様性は有意に異なると判断される.炎症性腸疾患(IBD)等の疾患患者の OTU数は健常者群よりも低く(多様性の減少)検出されることが多い.図5 Bと Cには,健常者群と疾患患者群の腸内細菌叢間の weighted UniFrac解析で求めた距離行列に基づく主座標分析(Principle coordinate analysis: PCoA)とその平均値の棒グラフ解析例を示す.図 5 BではPCoAによるバラツキが個人ごとにドットされており,両群が目視で分かれている(異なっている)ことを確認できる.図 5 Cには,健常者群の個人間の平均距離と標準偏差(左バー),疾患患者群の個人間の平均距離と標準偏差(左バー),健常者と疾患患者間の平均距離と標準偏差(真ん中バー)を示している.統計的有意さをもって健常者と疾患患者間の平均距離>健常者群の個人間の平均距離および疾患患者群の個人間の平均距離となれば,疾患患者群に特徴的な異常な腸内細菌叢(dysbiosis)が形成されていると判断される.時折,疾患患者群の個人間の平均距離>健常者と疾患患者間の平均距離>健常者群の個人間の平均距離となる場合がある.この場合,疾患患者の細菌叢は dysbiosisと判断されるが,患者間の距離が患者-健常者間の距離よりも大きいので,疾患患者に特徴的な菌叢構造の存在は不確定となる.上述のとおり,UniFrac解析から 2つの細菌叢間の違いの程度を知ることができるが,この全体的な

違いに寄与する細菌種の特定も可能である. 2つ(または 2以上)の細菌叢の 16Sリードを一緒にクラスタリングし,両細菌叢に共通した OTUsを得る.ついで,各 OTUにおける各細菌叢由来のリード数を直接比較することで,両細菌叢間で有意に増減する OTUをピンポイントで探索できる(図 6).ただし,個人内でも日々変動する細菌叢間の比較から両群のいずれかで有意に変動する菌種を特定するには,厳密な統計検定ができる十分な検体数が必要となる.また,16S rRNA遺伝子を PCR増幅するステップには増幅バイアスが少なからずあることは否めないので,定量 PCR等による検証実験も必要である.

2-2.NGSによるメタゲノム解析メタゲノム解析の基本的な操作は,NGSから生成したメタゲノムリードのアセンブリにより非重複(ユニーク)ゲノム配列データを取得し,その配列中に遺伝子予測プログラムを用いて遺伝子配列を同定する.ついで,同定された遺伝子配列を COG

(Clusters of Orthologous Groups)や KEGG(Kyoto Encyclopedia of Genes and Genomes)等の遺伝子/機能データベースに類似度検索することで,各遺伝子の機能や代謝経路等の情報を収集し,細菌叢全体の機能特性を解明する(図 2,図 7).メタゲノム解析では,対象とする細菌叢の複雑さ

図 5 健常者群と疾患患者群間の腸内細菌叢の UniFrac解析(A) 健常者群と疾患患者群間の OTU(菌種)数比較:患者群の OTU(菌種)数が健常群よりも有意に低いことを示す(エラー

バーは標準誤差).(B) UniFrac距離(weighted)に基づく PCoA(主座標分析):健常者(●)と疾患患者(▲)の細菌叢がそれぞれ異なるクラス

ターを形成している(横軸,縦軸は両群間の違いの原因となる 2つの主成分のそれぞれの寄与率を示す).(C) 平均 UniFrac距離(weighted)解析:健常者群⊖疾患患者群間の平均 UniFrac距離が健常者群内および疾患患者群内の各平

均距離よりも有意に高い.すなわち,両群間の細菌叢構造が有意に異なることを示す(エラーバーは標準誤差,*p<0.01).

Page 7: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

日本臨床免疫学会会誌(Vol. 37 No. 5)418

や多様性に依存して,取得する配列データ量を考慮する必要がある.少ないデータ量では同定される遺伝子の多くは優占菌種に由来することになり,細菌叢全体の機能特性を正確に評価することはできない.幸い NGSを用いることにより,今日では,サンプルあたり数ギガベース(数十億塩基)という膨大なデータ取得も容易であり, 1つのプロジェクトで100名あるいはそれ以上の被験者の腸内細菌叢から数百万のユニーク遺伝子が同定されている(後述,表 3).様々な人体部位からの常在菌株の分離培養も国際的に進められている.これらのヒト常在菌株は個々

にゲノムシークエンスされ,現在までに 7,000株以上のゲノム配列がリファレンスゲノムとして NCBI

(The National Center for Biotechnology Information)や米国 Human Microbiome Project(HMP,後述)のウェブサイト(上述)から公開されている.分離株のゲノム情報はそれぞれの細菌株の特性解明に有効である以外に,メタゲノムデータが由来する細菌種の帰属にも有効である.メタゲノムリードをリファレンスゲノムにマッピング(配列類似度≧ 95%,カバー率≧ 90%)することにより菌種帰属を行う(図 2).メタゲノム解析には PCR工程がないため,メタ 16S解析よりも定量性が高いが,マップされ

図 6 異なった細菌叢間の比較 16S解析

図 7 細菌叢のメタゲノム解析

Page 8: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

服部・ヒト腸内細菌叢の解析技術 419

ないリードが 30%程度あり(それらが由来する菌種/ゲノムは不明),メタ 16S解析よりも細菌叢全体のカバー率は低い.このカバー率を上げるため現在もヒト常在菌の分離培養と分離株のゲノム解析が進められている.また,リファレンスゲノムにマップされたメタゲノムリードの数をカウントすることで,それぞれのゲノム(=菌種)の組成比解析も可能である.図4 Bには 100名の健常な日本人のメタゲノムデータを用いた属レベルでの菌種組成解析例を示す(筆者ら,未発表).さらに,異なった細菌叢間(例えば,健常者群と疾患患者群間)の相違もマッピングデータから得られた菌種組成や遺伝子組成データを主成分分析等で評価できる.近年では,メタゲノムデータを用いて 2型糖尿病と肥満の発症に強い相関を示すマーカーの探索とその評価が行われている7⊖9).例えば, 2型糖尿病(T2D)患者の腸内細菌叢の大規模解析が 2つのグループ(スウェーデンと中国)によって報告されている8, 9).中国人コホートでは,健常者群と T2D群のメタゲノムデータを菌種と遺伝子組成から比較した.健常者群と T2D患者群の多様性解析から T2Dの細菌叢の dysbiosisの程度は,IBD患者の場合よりも低く,中程度であることが示された.T2Dで増加していた細菌種の多くは,いわゆる日和見細菌(Bacteroides caccae, Clostridium hathewayi, Clostridium ramosum, Clostridium symbiosum, Eggerthella lenta, Escherichia coli)であった.また,ムチン分解菌である Akkermansia muciniphilaや硫酸還元菌である Desulfovibrio菌種も増加していた.一方で,酪酸(代謝的には有用物質)を生産する様々な菌種(Clostridiales sp. SS3/4, Eubacterium rectale, Faecalibacterium prausnitzii, Roseburia intestinalis, Roseburia inulinivorans)が有意に減少していた.遺伝子比較では,T2D群と健常者群間で有意に増減していた約 5.2万の遺伝子が検出された.T2Dで増加していた機能は,糖類や枝分かれアミノ酸の膜トランスポート,メタン代謝系,異物の分解と代謝,硫酸還元,酸化ストレス耐性等であった.一方で,減少していた機能は,細胞運動性に関わる鞭毛や化学走化性,補酵素やビタミンの代謝に関わる遺伝子等であった.細胞運動性と酪酸生産菌の減少は相関していた.さらに,50の特徴的な遺伝子(T2D増加が 22,T2D減少が 28)を選択し,それらの the receiver operating characteristic curve(ROC)下における AUC(area under the curve)は 0.81となった.

すなわち,この 50遺伝子セットは T2Dを高い精度で予測できることを意味する.一方,スウェーデン人コホートでは,中国と同様に T2Dでは種々のClostridium系の菌種とともに,特徴的に Lactobacil-lus gasseriと Streptococcus mutansが増加していた.一方,酪酸生産に関わる Roseburia, Clostridium系菌種,Eubacterium eligens, Coriobacteriaceae, Faecali-bacterium prausnitzii等が T2Dで減少していた.機械学習プログラムであるランダムフォレストで選択された菌種及び metagenomic cluster(同一ゲノムに存在する確率が有意に高い遺伝子セット)の AUC

がそれぞれ 0.72と 0.83となり,有用な T2Dマーカーとなることが示唆された.中国コホートと機能的に類似していたのは,T2Dでの膜トランスポートや酸化ストレス耐性等の増大と鞭毛やビタミン代謝の減少であった.しかしながら,両コホートのT2D患者群は PCAで有意にオーバーラップせず,全体としては異なった菌叢構造を有していた.この結果はコホートの均一性の違い(ヨーロッパは年齢が 70歳で,すべて女性である.一方で,中国コホートは年齢がより高く,多くの男性を含んでいる)が影響している可能性もあるが,同じ疾患でありながら細菌叢の dysbiosisには国あるいは人種特異性(すなわち,異なった疾患マーカー)が存在するのかもしれない.

2-3.プロトコール効果上述したように,この 5年間で細菌叢解析におけるウェット及びインフォマティクス技術が確立されてきた.これに沿って,世界中の様々なデータの比較解析も多く報告されるようになった.これらの異なったグループ間による比較解析で現在大きな問題となりつつあるのは,糞便サンプルの保存や搬送法,細菌叢 DNA抽出法,用いるシークエンサーの種類等の種々のプロトコールの違いがおよぼす解析結果への影響である.ラボ間でのこれらプロトコールのある程度の違いは否めないが,これらの違いによる解析結果のバラツキ程度を考慮した比較解析が必要になる.例えば, 3つのシークエンサー(454,MiSeq,Ion PGM)のメタゲノムデータからそれぞれに得られた菌種組成(属レベル)間の相関係数は0.9以上となり,シークエンサーの違いは菌種や遺伝子組成に大きく影響しない(筆者ら,未発表データ).また,DNA抽出法であるビーズ法10)と酵素法11)によって得られた 16Sデータを用いた UniFrac

Page 9: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

日本臨床免疫学会会誌(Vol. 37 No. 5)420

解析データ間のバラツキには有意さはなく,両データに互換性がある12).糞便の外側と内部からのサンプル間の菌叢構造の違いに有意さはない13).また,糞便の保存や搬送条件については,室温での保存時間は 24~72時間の範囲であれば菌叢構造は有意に変化しない.しかし,24時間で大きく変動する個人サンプルもあり,室温での保存時間は個人に依存するらしい14).すなわち,このような異なったプロトコールから得られたデータ間の比較解析では,各プロトコールにおけるバラツキの程度を基準にした厳密な統計評価が必要である.そうしないと,プロトコールによる違いを真の菌叢間の違いとミスリードする可能性がある.

3.ヒト腸内マイクロバイーム研究の国際動向

メタゲノム解析によるヒト腸内細菌叢研究は,2006年の米国グループと 2007年の筆者らのグループ(HMGJ: Human MetaGenome Consortium Japan)による論文発表が最初である(表 3)15, 16).この先行研究によって,腸内細菌叢がヒト自身の代謝機能を補完する広範囲な代謝機能を有することや腸内細菌叢に豊富な機能が炭水化物代謝に関するものであること等,その機能実態の一面が初めて明らかにされた.その後,2008年に日米欧中などからなるInternational Human Microbiome Consortium(IHMC)の設立17),米国の HMP(前述),欧州連合(EU)と中国 BGI(Beijing Genomics Institute)の Metag-enomics of the Human Intestinal Tract(MetaHIT)Projectが開始され,腸内細菌叢研究はより国際的となった.また同時に,NGSの普及によってヒト腸内マイクロバイオーム研究は急速に大規模化していった(表 3).2010年以降のプロジェクトでは,

100名以上の被験者から数 Gb(ギガ塩基対= 10億塩基対)の配列データが収集され,そこから数百万オーダーの遺伝子が情報学的に同定された5, 8, 9, 18⊖21). これら欧米中のデータと筆者らによる日本人データを加えると,今日,1,000人以上の被験者から 1,000

万以上のユニーク遺伝子が同定されている(筆者ら,未発表).この数字はヒトの遺伝子数(~2.5

万)をはるかに凌駕しており,腸内細菌叢が宿主ヒトよりもはるかに多様な遺伝子をもっていることを示している.

4.ヒト腸内細菌叢構造の特徴

上述したように,健常な成人ヒト腸内細菌叢の大部分は 4門の細菌種で占められ,また,個人間で大きく多様化している(図 4 A,4 B).属レベルでの菌種組成解析において,ヒト腸内細菌叢は 3つのタイプ(エンテロタイプ)に分類できることが報告された22).Ruminococcus, Prevotella, Bacteroidesの 3属がそれぞれのタイプで優占菌種となる特徴をもち,これら 3属の組成比は負の相関を示す(図 8).このうち,Prevotellaタイプは炭水化物が豊富な食事,Bacteroidesタイプはタンパク質や動物脂質が豊富な食事と概ね相関する23).一方,Ruminococcusタイプは Prevotellaタイプと Bacteroidesの中間的な食事内容と関係すると考えられる.食事介入試験から,エンテロタイプは長期食事と強く相関することが示されている23).エンテロタイプは当初,地域性,健康状態,年齢等に依存せず,ヒト集団中に一様に分布すると考えられていた.しかし,筆者らの最近の解析では,日本人の多くは Ruminococcusタイプであり,欧米人や中国人の多くは Bacteroidesタイプとなり,エンテロタイプの分布はヒト集団(国)ごと

表 3 おもなヒト腸内細菌叢のメタゲノム解析

年 被験者国 被験者数 シークエンサー 遺伝子数

2006 アメリカ 2 従来機種(サンガー法) 5万

2007 日本 13 従来機種(サンガー法) 66万

2008 国際コンソーシアム IHMCの発足

2010 スペイン+デンマーク 124 NGS (Illumina) 330万

2012 アメリカ 90 NGS (Illumina) 490万

中国 363 NGS (Illumina) 430万

2013 スウェーデン 146 NGS (Illumina) 600万

ロシア 95 NGS (SOLiD) -

未発表(筆者ら) 日本 100 NGS (454/Illumina/Ion) 460万

Page 10: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

服部・ヒト腸内細菌叢の解析技術 421

で偏っているらしい(筆者ら,未発表).

5.ヒト腸内細菌叢の遺伝子(機能)組成

上述したように細菌叢の菌種構成は高い多様性を示すのに対して,それらがコードする遺伝子組成は個人間でよく類似(共通)している24).図 4 Cには,成人日本人健常者(100名)の遺伝子組成の解析例を示す(筆者ら,未発表).この個人間での菌種組成の高い多様性と遺伝子組成の高い共通性は,細菌の種類よりも細菌のもつ機能が腸内細菌叢の形成に大きく関与していることを示唆する.つまり,宿主ヒトとの共進化の過程で,宿主の腸内環境への適応に必要な機能への強い選択圧によって腸内細菌およびそれらの集合体である腸内細菌叢の形成が進められて来たことが示唆される.図 4 Cの遺伝子組成データから,ヒト腸内細菌叢を特徴づける機能は,豊富な炭水化物代謝系の遺伝子群であることがわかる15, 16).腸内細菌の主たるエネルギー源は,宿主が消化できない植物由来の多糖類であり,多くの腸内細菌はこれらを代謝することでエネルギーを得ている.また,その代謝産物は酢酸や酪酸,ビタミンなどのヒト細胞に有用なものである.もうひとつの特徴は,腸内細菌叢には鞭毛や化学走性などの細胞運動性に関わる遺伝子群がきわめて少ないことである15).すなわち,腸内では腸管の蠕動運動によって細菌は自ら餌に向かって移動する必要がなく,また,鞭毛を持つ多くの外来性病原菌と識別することで,宿主と腸内細菌の両方に不利な過剰の炎症応答を最小限にする方向(恒常性の維持)への細菌の適応進化を示唆している.

お わ り に

上述したように細菌叢研究の国際化と NGSの実用化により,健常者の腸内細菌叢の菌種と機能にかかわる多くの知見がこの 5年間に蓄積された.また,疾患患者の細菌叢解析によって,疾患と腸内細

菌叢異常の関係も明らかになって来た.また,大規模なメタゲノム解析からは, 2型糖尿病や肥満に強い相関を示す細菌マーカーの探索も現実味を帯びて来た.このほか,膨大な細菌群の中から宿主に直接的な生理作用をもつ常在菌種やその代謝産物を同定する研究も始められている25, 26).これらの研究及び今後進められる様々な研究からは,これまでの想像を越えた腸内細菌叢の様々な生理機能が明らかになると期待される.

文   献

1) Handelsman, J., et al.: Molecular biological access to the chemistry of unknown soil microbes: a new frontier for natural products. Chem Biol. 5: R245⊖249, 1998.

2) Tyson, G.W., et al.: Community structure and metabolism through reconstruction of microbial genomes from the environment. Nature. 428: 37⊖43, 2004.

3) Hattori, M., Taylor, T.D.: The human intestinal micro biome: A new frontier of human biology. DNA Res. 16: 1⊖12, 2009.

4) Kim, S.W., et al.: Robustness of gut microbiota of healthy adult in response to probiotic intervention revealed by high-throughput pyrosequencing. DNA Res. 20: 241⊖253, 2013.

5) The Human Microbiome Project Consortium: Structure, function and diversity of the healthy human microbiome. Nature. 486: 207⊖214, 2012.

6) Hamady, M., et al.: Fast UniFrac: facilitating high-throughput phylogenetic analyses of microbi-al communities including analysis of pyrosequenc-ing and PhyloChip data. ISME J. 4: 17⊖27, 2010.

7) Le Chatelier, E., et al.: Richness of human gut microbiome correlates with metabolic markers. Nature. 500: 541⊖546, 2013.

8) Qin, J., et al.: A metagenome-wide association study of gut microbiota in type 2 diabetes. Nature. 490: 55⊖60, 2012.

図 8 ヒト腸内細菌叢の 3つのエンテロタイプ

Page 11: 特集:腸内細菌と免疫疾患 - Semantic Scholar...服部・ヒト腸内細菌叢の解析技術 413 このような状況下で,1998 年にこの両方法の間 隙を埋める第3

日本臨床免疫学会会誌(Vol. 37 No. 5)422

9) Karlsson, F.H., et al.: Gut metagenome in Euro-pean women with normal, impaired and diabetic glucose control. Nature. 498: 99⊖103, 2013.

10) Salonen, A., et al.: Comparative analysis of fecal DNA extraction methods with phylogenetic micro-array: Effective recovery of bacterial and archaeal DNA using mechanical cell lysis. J Microbiol Methods. 81: 127⊖134, 2010.

11) Morita, H., et al.: An improved isolation method for metagenomic analysis of the microbial flora of the human intestine. Microbes Environ. 22: 214⊖222, 2007.

12) Ueno, M., et al.: Assessment and improvement of methods for microbial DNA preparation from fecal samples. Handbook of Molecular Microbial Ecolo-gy II (Frans J. de Bruijn eds., John Wiley & Sons, Inc) pp. 191⊖198, 2011.

13) Santiago, A., et al.: Processing faecal samples: a step forward for standards in microbial community analysis. BMC Microbiol. 14: 112, 2014.

14) Roesch, L.F., et al.: Influence of fecal sample stor-age on bacterial community diversity. Open Micro-biol J. 3: 40⊖46, 2009.

15) Gill, S.R., et al.: Metagenomic analysis of the human distal gut microbiome. Science. 312: 1355⊖1359, 2006.

16) Kurokawa, K., et al.: Comparative metagenomics revealed commonly enriched gene sets in human gut microbiomes. DNA Res. 14: 169⊖181, 2007.

17) Mullard, A.: Microbiology: the inside story. Nature. 453: 578⊖580, 2008.

18) Qin, J., et al.: A human gut microbial gene cata-logue established by metagenomic sequencing. Nature. 464: 59⊖65, 2010.

19) Claesson, M.J., et al.: Gut microbiota composi-tion correlates with diet and health in the elderly. Nature. 488: 178⊖184, 2012.

20) Tyakht, A.V., et al.: Human gut microbiota com-munity structures in urban and rural populations in Russia. Nat Commun. 4: 2469, 2013.

21) Yatsunenko, T., et al.: Human gut microbiome viewed across age and geography. Nature. 486: 222⊖227, 2012.

22) Arumugam, M., et al.: Enterotypes of the human gut microbiome. Nature. 473: 174⊖180, 2011.

23) Wu, G.D., et al.: Linking long-term dietary pat-terns with gut microbial enterotypes. Science. 334: 105⊖108, 2011.

24) Turnbaugh, P.J., et al.: A core gut microbiome in obese and lean twins. Nature. 457: 480⊖484, 2009.

25) Atarashi, K., et al.: Treg induction by a rational-ly selected mixture of Clostridia strains from the human microbiota. Nature. 500: 232⊖236, 2013.

26) Furusawa, Y., et al.: Commensal microbe-derived butyrate induces the differentiation of colonic reg-ulatory T cells. Nature. 504: 446⊖450, 2013.