生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器...

45
生工生物 宏基因组微生物分类测序 项目介绍 扫描生工微博、微信二维码 了解更多优惠信息 微信 微博 本项目流程介绍适用于细菌、真菌、古菌、微 藻类、各功能基因(如硝化/反硝化基因、固氮 基因、氨氧化基因、厌氧氨氧化基因等等)以 及其他客户定制性片段不超过500的DNA多样 性片段;不同的类群在分析内容上会有差异。 适用范围

Upload: others

Post on 18-Jan-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

生工生物宏基因组微生物分类测序项目介绍

扫描生工微博、微信二维码

了解更多优惠信息

微信微博

本项目流程介绍适用于细菌、真菌、古菌、微

藻类、各功能基因(如硝化/反硝化基因、固氮

基因、氨氧化基因、厌氧氨氧化基因等等)以

及其他客户定制性片段不超过500的DNA多样

性片段;不同的类群在分析内容上会有差异。

适用范围

Page 2: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

1. 名词解释

2. 本项目使用软件与数据库

2.1 软件

2.2 数据库

3. 实验流程简介

4. 实验流程详述

4.1. 材料

4.2. 关键试剂

4.3. 仪器

4.4. 实验步骤

5. 分析流程

6. 项目分析内容

7. 分析流程简介以及方法说明

8. 分析结果展示

8.1 数据预处理

8.1.1 方法说明

8.1.2 结果展示

8.2 去除嵌合体及靶区域外序列

8.2.1 方法说明

8.2.2 结果展示

8.3 操作分类单元(OTU)分类

8.3.1 方法说明

8.3.2 结果展示

8.4 赋予物种分类单元

.................................................................................... 1

........................................................... 2

..................................................................................... 2

................................................................................. 2

............................................................................. 2

............................................................................. 2

.................................................................................... 2

............................................................................. 2

.................................................................................... 3

............................................................................. 3

.................................................................................... 5

............................................................................. 6

....................................................... 6

............................................................................. 7

.......................................................................... 7

....................................................................... 7

....................................................................... 8

................................................. 9

....................................................................... 9

..................................................................... 10

................................................... 10

..................................................................... 10

..................................................................... 10

.............................................................. 13

Page 3: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

8.4.1 方法说明

8.4.2 结果展示

8.5 Alpha多样性分析

8.5.1 方法说明

8.5.2 结果展示

8.6 Beta多样性分析

8.6.1 方法说明

8.6.2 结果展示

8.7 样本间菌群丰度差异分析

8.7.1 方法说明

8.7.2 结果展示

8.8 PTCA/POCA分析

8.8.1 方法说明

8.8.2 结果展示

8.9 RDA/CCA分析

8.9.1 方法说明

8.9.2 结果展示

8.10 进化树分析

8.10.1 方法说明

8.10.2 结果展示

8.11 MEGAN分析

8.11.1 方法说明

8.11.2 结果展示

9. 结果说明

10. 参考文献

..................................................................... 13

..................................................................... 13

............................................................... 19

..................................................................... 19

..................................................................... 20

................................................................. 24

..................................................................... 24

..................................................................... 24

................................................... 28

..................................................................... 28

..................................................................... 28

............................................................... 29

..................................................................... 29

..................................................................... 29

................................................................... 30

..................................................................... 30

..................................................................... 30

...................................................................... 35

................................................................... 35

................................................................... 35

.................................................................... 37

................................................................... 37

................................................................... 37

.................................................................................. 38

............................................................................... 41

Page 4: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

1邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

Bp:base-pair,碱

Read:读长,测

Raw_reads: 原始

Clean_reads:Q

Barcode:标签序

Fastq: 序列数据

Fasta: 序列数据

Pair-end 测序:

Single-end 测序

质量评分:指的

QC: Quality c

低复杂度序列:

嵌合体:是 PCR

靶区域外序列:

OTU: operatio

以根据序列的相

RDP: Ribosom

OTU 代表序列进

Node:网络图概

Edge: 网络图概

Alpha 多样性:是

Beta 多样性:不

PCA 分析:pcoA

主要的,排在前

RDA/CCA 分析:

多元直接梯度分

NMDS 分析:非

的数据分析方法

的距离体现的,

滑窗法:检测一

下一个单位进行

RDP 分类阈值:

碱基对,读长的单

测序数据中每一条

始数据

QC 之后的数据

序列,位于 read

据存储的标准格式

据存储的标准格式

双端测序,两端

序:单端测序,只

的是一个碱基的错

ontrol,即质量控

即有大量简单重

R 过程中,因为不

引物非特异性靶

nal taxonomic u

似度分成很多分

mal Database Pro

行分类学分析,

念,每一个点就

念,在 OTU-net

是指一个特定区

同生态系统之间

A 分析(principa

前几位的特征值,

:是基于对应分析

分析。

非度量多维尺度分

法。其特点是根据

最终获得样品的

一个窗口内的碱基

行检测,直到检测

即分类可信度,

单位,每一个 bp

条序列就是一个 r

s 的开头,用于区

式之一,每 4 行为

式之一,每两行为

端均测序,随后合

只测一端,即为一

错误概率的对数值

控制。

重复的序列

不同的模板混杂,

定产生的序列。

nit ,操作单元分

分组,每一个分组

oject。为了得到

并在界门纲目科

就是一个 node,在

twork 中,两点之

域或生态系统内的

多样性的比较,是

al co-ordinates a

对样本之间的关

析发展而来的一种

分析,是一种将多

据样品中包含的物

的空间定位点图。

基质量值,如果满

完所有的数据。

在 RDP classifi

p 指一对互补的碱

read。

区分这一条 read

为一条 read 的信息

为一条 read 信息。

合并成一条 read。

一条 read。

值,即质量评分越

,错误产生的序列

分类。要了解样品

组就是一个 OTU。

每个 OTU 对应的

科属种水平,统计

在本项目 OTU-n

之间的连线就是 e

的多样性,经常用

是物种组成沿环境

analysis)是一种

关系进行描述。

种排序方法,将对

多维空间的研究对

物种信息,以点的

满足条件则向前移

ier 中,使用 boo

碱基。

s 属于哪一个样本

息。包含测序 re

。包含测序 read

越高,错误概率越

列,这条序列并非

品测序中菌群信息

的物种分类信息,

计各个样品的菌落

network 中,nod

edge。

用物种丰富度来度

境梯度或者在群落

种研究数据相似性

对应分析与多远回

对象简化到低维空

形式反映在多维

移动一个单位继续

otstrapping 方法估

本。分配完毕之后

ad 名,序列,正

ds 名和序列。通常

越小。

非真实存在。

息,就需要对序列

,采用 RDP clas

落组成。

e 有两种形式:样

度量。

落间的变化率,用

性和差异性的可

回归分析相结合,

空间进行定位,分

维空间上,而对不

续检测,如果不满

估计分类的可信度

后 barcode 会被删

正反链标示,序列

常在 QC 之后,以

列进行归类(clus

ssifier 贝叶斯算法

样本和 OTU。

用来表示生物种类

视化方法。进过一

,每一步计算均与

分析和归类,同时

同样品间的差异

足条件即做删除

度。当可信度设置

区的的序列可以正确分分配到属的概率分分别是 98.1%和 995.7%,满足分析析需要。[22]

删除。

列质量值

以此格式保存数据

ster),通过归类

法对 97%相似度水

类对环境异质性的

一系列的计算之后

与环境因子回归,

时又保留对象间原

程度,则是通过

处理,随后继续

置为≥80%时,V

据。

类,就可

水平的

的反应。

后,选择

,又称

原始关系

点与点

移动到

V3、V4

1. 名词解释

Table 2. Factions of variable regions that were correctly classified by the RDP-classifier.

Variable region

Bootstrap cutoff ( ≥ )

Fraction of sequences classified to genus

Farction of sequences correctly classified to genus

0%

100%

92.0%

50%

92.4%

95.0%

80%

82.3%

98.1%

0%

100%

79.0%

50%

73.5%

96.5%

80%

40.4%

98.7%

0%

100%

92.8%

50%

97.0%

94.5%

80%

87.9%

95.7%

V3 V6 V4

Of 7, 208 full-length 165 reference sequences from the human gut 6,054 were classified at genus-level with 80% bootstrap support. The RDP-classifier was trained with the latest training set No. 4 from December 2008. For each of the three extracted variable regions fragments were classified again, at three different bootstrapthresholds, and compared with the full-length classifications (last row).doi:10.1371/journal.pone.0006669.t002

Page 5: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

2地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

Prinseq[1]:http://prinseq.sourceforge.net/版本 0.20.4

FLASH[2]:http://sourceforge.net/projects/flashpage/版本 1.2.3

Mothur[3]:http://mothur.org/版本 1.30.1

Uclust[4]:http://www.drive5.com/uclust/downloads1_1_579.html 版本 1.1.579

Cytoscape:http://cytoscape.org/版本 3.2

Qiime[5]:http://qiime.org/

R:http://www.r-project.org/版本 3.2

Muscle[6]: http://www.drive5.com/muscle 版本 3.8.31

MEGAN[7]: http://ab.inf.uni-tuebingen.de/software/megan/, 版本 5.7.1

RDP classifier[8]: http://rdp.cme.msu.edu/

Fasttree[21]: http://www.microbesonline.org/fasttree/,版本 2.1.3

R 包:vegan、ape、scatterplot3D、VennDiagram、gplots、pheatmap。

2.1 软件:

2.2 数据库

RDP classifier 数据库,16s, fungal 28s: http://rdp.cme.msu.edu/misc/resources.jsp

Silva[9] 数据库, 16s, 18s:http://www.arb-silva.de/

Unite[10] 数据库 its : http://www.mothur.org/wiki/UNITE_ITS_database

对提取到的基因组 DNA 进行琼脂糖电泳检测,查看基因组 DNA 的完整性与浓度。利用 Qubit2.0 DNA 检测试剂盒对基因组 DNA

精确定量,以确定 PCR 反应应加入的 DNA 量。PCR 所用的引物已经融合了 Miseq 测序平台的通用引物

PCR 结束后,对 PCR 产物进行琼脂糖电泳,采用生工琼脂糖回收试剂盒(cat:SK8131)对 DNA 进行回收。回收产物用 Qubit2.0

定量,根据测得的 DNA 浓度,将所有样品按照 1:1 的比例进行混合;混合后充分震荡均匀。该混合样品可用于后续的样品建库(加测

序标签)与测序。

4.1. 材料

客户提供原始样本:涵盖土壤、污泥、污水、发酵、油污、空气、口腔、粪便、海泥、母乳、动植物内生菌、积雪、岩石、根基共生等

等,几乎存在微生物的各种样品均可进行实验。

客户提供 DNA 样本:DNA 电泳检测有基因组目的带,土壤、污水类样本仅接受采用 Mobil/OMEGA 试剂盒提取的 DNA。Qubit2.0 DNA

检测大于 10 ng/ul, 每管 DNA20-50 ul 即可。

4.2. 关键试剂

号货商厂材耗/剂试

10-5265DAGEMOtiKANDlioS.A.N.Z.E

Qubit2.0 DNA 检测试剂盒 21201QefiL

6040pEomrehTesaremyloPANDqaT

SanPrep 柱式 DNA 胶回收试剂盒 上海生工 SK8192

2. 本项目使用软件与数据库

3. 实验流程介绍

4. 实验流程详述

Page 6: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

3邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

4.3. 仪器

号型商厂器仪

台式离心机 12-ociPrehsiFomrehT

漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B

混匀型干式恒温器 深圳拓能达科技有限公司 TND03-H-H

电泳仪电源 北京市六一仪器厂 C6-YYD 型

电泳槽 北京市六一仪器厂 DYCZ-21

凝胶成像系统 美国 UVP

Qubit® 2.0 荧光计 66823QnegortivnI

4.4. 实验步骤

(一)基因组提取方法-以 OMEGA 土壤提取试剂盒为例

1 称取 0.5 克的磁珠于 5 毫升离心管中,加入 0.2 克样本,加入 1 ml 缓冲液 SLX-Mlus Buffer,涡旋 2 分钟。

2 加入 100 μl 缓冲液 DS Buffer 涡旋 30 秒。

3 70℃孵育 10 分钟,期间颠倒混匀数次。

4 室温,3000 rpm 离心 3 分钟,吸取 800μl 上清到新的 2ml 离心管中。

5 加入 270μL P2 Buffer,涡旋混匀。

6 在冰上孵育 5 分钟,4℃,12000 rpm 离心 5 分钟。

7 小心转移上清至新的 1.5 ml 管中,加入 0.7 倍体积的异丙醇,颠倒混匀,-20℃下放置 1 小时。

8 4℃,12000 rpm 离心 5 分钟。

9 除去上清液,加入 200 μl Elution Buffer,涡旋 10 秒,70℃孵育 10 分钟。

10 加入 200 μl HTR Reagent,涡旋混匀,室温放置 2 分钟(HTR Reagent 使用前需混匀)

11 室温,12000 rpm 离心 5 分钟。

12 转移上清至新的 1.5ml 离心管中,加入等体积 XP1 Buffe,涡旋混匀。

13 将吸附柱 HiBind® DNA Mini Column 插入 2 毫升收集管中

14 将 12 步中所得溶液转移至吸附柱中,室温,12000 rpm 离心 2 分钟,弃去废液。

15 将吸附柱放回 2 ml 收集管中,加入 300 μl XP1 Buffe。室温,12000rpm 离心 2 分钟,弃去废液及收集管。

16 将吸附柱插入新的 2 毫升收集管中,加入 700 μL SPW Wash Buffe,室温,12000 rpm 离心 2 分钟,弃去废液。

17 重复步骤 16。

18 将吸附柱放入干净的 1.5 ml 离心管,加入 60μl 70℃预热的 Elution Buffer 至吸附柱中心,60-70℃孵育 5 分钟。

19 室温,12000 rpm 离心 3 分钟,收集 DNA 溶液。

20 Qubit2.0 检测 DNA 浓度,琼脂糖凝胶检测 DNA 完整性。

实验图 1:基因组 DNA 检测示意图

Page 7: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

4地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

(二)初次 PCR 扩增 利用 Qubit2.0 DNA 检测试剂盒对基因组 DNA 精确定量,以确定 PCR 反应应加入的 DNA 量。PCR 所用的引物已经融合了 Miseq

测序平台的通用引物:

PCR 扩增必须设置负对照与正对照,特别是负对照可以检验环境、试剂等无微生物污染;任何负对照有条带的扩增样本群均不可

用于后续实验。

PCR 体系按照如下进行:

10×PCR buffer 5 ul

dNTP(10mM each) 0.5 ul

Genomic DNA 10 ng

Bar-PCR primer F(50uM) 0.5 ul

Primer R (50uM) 0.5 ul

Plantium Taq(5U/ul) 0.5 ul

H20 add to 50 ul

PCR 结束后进行第二轮扩增。

(三)第二轮扩增;延伸测序引物

PCR 体系按照如下进行:

10×PCR buffer 5 ul

dNTP(10mM each) 0.5 ul

DNA 20 ng

primer F(50uM) 0.5 ul

Primer R (50uM) 0.5 ul

Plantium Taq(5U/ul) 0.5 ul

H20 add to 50 ul

配置好的 PCR 体系按照如下反应条件进行 PCR 扩增:

95 度 30s

95 度 15s

55 度 15s 5cycles

72 度 30s

72 度 5min

10 度 -

PCR 结束后,PCR 产物进行琼脂糖电泳,对 DNA 进行回收。

所得 PCR 产物电泳如下(示例):

实验图 2:PCR 检测示意图

Page 8: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

5邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

(四)定量混合

利用 Qubit2.0 D

DNA 检测试剂盒对对回收的 DNA 精确定量,以方便按按照 1:1 的等量量混合后测序。

5. 项目分析流程

Page 9: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

6地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

·

·

·

·

·

1. 数据处理

1) 通过 ba

2) 去除非靶

2. 基于 OTU 聚

(OTU)。

1) 在 OTU

(abund

2) Alpha 多

五种指数

Chao 指

Simpso

ACE 指数

Shanno

Coverag

3) beta 多样

列队列构

3. 基于物种分

分类单元序

1) 样本间菌

arcode 区分样品序

靶区域序列及嵌合

聚类分析,将多条

聚类结果的基础

dance),所有序

多样性分析,计算

数分别是:

指数

n 指数

on 指数

ge 指数

样性分析,Beta

构建代表性序列为

分类分析,采用 R

序列丰度矩阵。

菌群丰度差异分析

序列,并对各样本

合体。

条序列根据其序列

础上,获取每一个

序列(ALL),形

算丰富度指数。计

多样性指标用来

为节点的进化树,

RDP classifier 将

析,根据物种分类

本序列做 QC。

列之间的距离来对

个 OTU 聚类中的代

形成三份结果:O

计算 5 种物种多样

来比较多组样本之

利用 Unifrac 算

将序列进行物种分

类单元和样本丰度

对它们进行聚类

代表性序列,分别

OTU_length,OT

样性指数,衡量样

之间的差别度量,

算法计算样本距离

分类,对每个样本

度矩阵,利用统计

,后根据序列之

别是长度最长的序

TU_abundance,

样本物种多样性。

将代表性序列比

离、样本聚类、样

本和每个物种单元

计检验筛选样本组

间的相似性作为域

序列(length)和

OTU_ALL,并进

并制作所有样品

比对参考核心 16S

样本 PCA。

分类进行序列丰

组间的差异物种分

域值分成操作分类

和丰度最高的序列

进行各类 RDP 分

品这五种指数的盒

S rDNA 序列,根

度计算构建样本

分类单元。

类单元

分析。

盒装图。

根据多序

本和物种

6. 项目分析内容

7. 分析流程简介以及方法说明

原始序列统计

标准分析内容 高级分析项目 特别分析项目

QC 序列统计

OTU 分布统计

RDP 分析

Alpha 多样性分析

Beta 多样性分析

Rank-abundance 分析图

物种累积曲线图

样本聚类分析图

样本聚类与柱状图组合分析

OTU 聚类 VENN 图

PCA 分析

样本距离 heatmap 图

OTU 数目与 OTU 聚类

similarity 值关系图

OTU-Network 分析图

Classifier 分类图

单样本菌群丰度柱状图

菌群丰度 3D 柱状图

PTCA/POCA 分析

NMDS 分析

RDA/CCA 分析

样本间菌群丰度差异分析

系统发育进化树分析

分类学树状图

MEGAN 分析

五种指数稀疏曲线图 五种指数组间盒状图OTU聚类长度最长代表序列

所有分析内容全套分析

OTU聚类丰度最高代表列

所有分析内容全套分析

分组与分组之间的比较

所有分析内容全套分析

Page 10: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

7邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

2) MEGAN 分析,反映的是在每一个层级上各样本菌群丰度。除了计算单样本菌群分度图,也会根据客户的分组,计算组内样本菌

群分析比较图

3) 物种丰度图。基于物种分类分析,绘制物种分类条形图,物种丰度饼图,物种丰度热图,classifier 分类图,单样本菌群丰度柱

状图,菌群分度 3D 图,样本聚类与柱状图组合分析图。

4. 基于 OTU 聚类和 RDP 分类的共有分析

1) PTCA/POCA分析,选择OTU分组结果中 reads数目最多的三个OTU ,RDP分析结果中 reads数目最多的三个RDP种属结果,

制作 3D 图,观察样本之间的关系。

2) RDA/CCA 分析,分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。同时也进行 NMDS 分析和 CCA 分

析。环境因子信息需要客户自行提供

3) 进化树分析,绘制所有菌群之间的进化树图,同时绘制 OTU 聚类结果中,reads 数目最多的前 50 个 OTU 的代表序列(分别是

丰度最大,长度最长的序列)的进化树图,并标注其所属的菌群信息。

8.1 数据预处理

8.1.1 方法说明

测序数据质量控制经过如下 3 个步骤:

①根据 barcode 序列区分样本并去除 Barcode。文件保存为*.fasta 和*.qual

②去除短片段序列,短片段的定义是小于 50 bp。

③去除低复杂度序列,采用的软件为 prinseq。

8.1.1.1 提取样本与原始数据统计

根据 barcode 序列区分样本,提取出的数据以标准的 fastq 格式保存。以双端测序(PE:paired-end)数据为例,每一个样本有

R1.fastq 和 R2.fastq 两个文件,分别代表 5’ -> 3’和 3’->5’的测序结果。R1.fastq 与 R2.fastq 中的文件行数是一致的,且根据 reads name

一一对应。

FASTQ: Fastq 是 Solexa 测序技术中一种反映测序序列的碱基质量的文件格式。每条 read 包含 4 行信息。第一行以“@”开头,

随后是序列标示和相关的描述信息,第三行以“+” 开头,随后是序列描述信息或者什么都不加;),第二行为碱基序列,第四行是质量

信息,与第二行中的碱基序列一一对应,根据评分体系不同每个字符的含义所表示的数字有所差别。例如:

@SEQ_ID

GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT

+

!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65

质量评分:质量评分指的是一个碱基的错误概率的对数值。其最初在 Phred 拼接软件中定义与使用,其后在许多软件中得到使用。其质

量得分与错误概率的对应关系见下表:

Phred quality scores are logarithmically linked to error probabilities

Phred Quality Score Probability of incorrect

base call

Base call accuracy

%0901ni101

%99001ni102

%9.990001ni103

%99.9900001ni104

对于每个碱基的质量编码标示,不同的软件采用不同的方案,本项目中使用的方案是,Phred quality score,值的范围从 0 到 62

对应的 ASCII 码从 64 到 126,得分在 0 到 40 之间;

8. 分析结果展示

Page 11: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

8地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8.1.1.2

对于 Mise

分样品,并进行

数据过滤的

1. 首先将

2. 去除短

3. 去除

端的碱

4. 随后再

拼接使用软

质量控制使

结果目录:

Clean_read_len

满足基本分析要

Raw_read_len_

Sample_infor.xls

数据优化统计

eq 双端测序数据

行质量控制过滤。

的参数:

将 R1.fastq 与 R

短片段序列,短片

融合后的 reads 尾

碱基。

再对低复杂度的序

软件:FLASH。

使用软件:Prinse

8.1.2 结果展示

:1_data_for_an

n_distribution.pdf

要求。详细结果见

_distribution.pdf :

s:QC 之后序列

,首先需要根据

R2.fastq 拼接起来

片段的定义是 50

尾部质量值在 20

序列进行过滤。

FLASH 主要参数

eq。Prinseq 主要

nalysis/

f: QC 之后序列长

见图 1.1。

: QC 之前原始序

列统计总表。详细

说明:原始序

PE reads 之间 o

来。拼接序列的 o

0 bp,融合后的

0 以下的碱基。设

数设置:-x 0.1ht

要参数设置:-lc_m

长度大部分分布在

序列长度分布图。

细结果见表 1.1。

图 1.1 原

列使用 Flash 融合

overlap 的关系,

overlap 区域允许

reads 在 50 bp 长

设置 10bp 的端口

ttp://sourceforge

method dust -lc_

在 400-600 之间,

详细结果见图 1.

原始数据长度分布

合后的序列长度

将成对的 reads

许的最大错配比率

长度以下的则去除

,如果窗口内的

e.net/projects/flas

_threshold 40 -mi

平均长度均在 4

.2

,以及该长度 re

拼接成一条序列

率是 0.1,不符合要

除。

平均质量值低于

shpage/

in_len 50http://p

440 以上,各样本

eads 数目。

列,随后根据 barc

要求的序列会被筛

20,从窗口开始

rinseq.sourcefor

本序列数均在 500

code 区

筛选。

始去除后

rge.net/

以上,

Length distribution fo reads

Page 12: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

9邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

说明:QC 之

原始 reads 数

8.2 去除嵌

8.2.1 方法说明

去除预处理后序

chimeras.uchim

Pre.cluster: 软件

算法根据序列的丰度

是丰度较高序列产生

Chimeras.uchim

使用软件: Mothu

说明:质

后序列统计总表

数目。Mean_len

嵌合体及靶区

序列中非扩增区域

me 去除序列中的嵌

件使用的算法叫做

排序,然后遍历

生的测序错误。

me: 在给定的 ref

ur。http://mothu

质控后的序列长度

。Group:样本的

n:原始序列的平均

区域外序列

域序列,而后对序

嵌合体。

做 pseudo-single

历产生的序列列表

ference 下,去除

r.org/

图 1.2 质控

为去除 barcode

表 1.1 各

分组信息。Sam

均长度。Clean_n

序列进行测序错误

e linkage。其算法

表,根据设置的一

除序列中的嵌合体

控后序列长度分布

e、两端 primer、

样本数据信息统

mple_name:样本名

num:QC 之后剩

误校正,校正用到

法基本的原理是,

一些阀值,从中寻

体。

布图

以及部分低质量

统计

名。Barcode:区分

剩余 reads 数目。

的软件为 mothu

丰度越高的序列

寻找丰度较低的序

序列的统计结果

分样本使用的 ba

Mean_len:QC

r 中的 pre.cluste

列越容易产生一些

列,随后认为这

果。

arcode 信息 Raw

C 之后序列平均长

er,最后采用

些测序错误,所以

这些丰度较低的序

w_num:

长度

以该

Group

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

TACGCAC

CATATCA

AGCGAGT

AGACTAC

TCGACTG

AGTACGA

TATGAGT

ATCACTG

CTGATGA

GACGACG

CTGAGCT

CGATGAT

CAGATCA

CATCGAC

ACGTGAC

26132

24336

24283

25490

29037

27939

25406

28005

24795

22840

25114

25568

26253

27993

30062

456.7

457.3

451.5

462.2

454.5

451.2

456.4

452.7

461.1

449

447.4

456.1

454.9

458.6

457.3

26131

24336

24283

25490

29037

27938

25406

28005

24794

22840

25114

25567

26252

27993

30062

418.5

419.1

413.4

424.1

416.3

413

418.3

414.6

423

410.9

409.3

417.9

416.8

420.5

419.1

Sample_name Bracode Raw_num Mean_len Clean_num Mean_len

Length distribution fo reads

Page 13: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

10地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8.2.2 结

结果目录:

filter_chim

说明:上表第一

将多条序列

相似性定为 0.97

uclust 首先筛选

直到所有序列均

在OTU聚

所有序列(ALL)

接下来所有

Uclust 参考

结果总目录

8.3.2.1

8.3.2.1.

网络分析通

有效的方式。此分

一种是 OTU-nod

间就会有一条连

使用软件:

结果目录:

ALL_no_c

ALL_no_c

结果展示

:2_filter_chimer

meras_result.xls:

一列为样本名,第

8.3.1 方方法说明

列按其序列间的距

7,操作分类单元

出序列中最长的

均聚好类,每一个

聚类结果的基础上

),形成三份结果

有的展示,均使用

考网址:http://ww

8.3.2 结结果展示

录:4_OTU/

OTU 网络聚类图

1 分析方法

通常用来展示和分

分析根据样本之间

de,一种是 sam

连线,这条连线就

:QIIME 与 Cyto

cytoscape_wind

cut_OTU_netwo

cut_OTU_netwo

ras/

去除嵌合体与靶

第二列为处理之前

8.3 操作分分类单元(OTUU)分类

距离对它们进行聚

元被认为可能属于

reads 最为种子序

个类作为一个 OTU

上,获取每一个OT

果:OTU_length

用 OTU_ALL 中的

ww.drive5.com/u

分析样本之间 OT

间共有的 OTU 生

mple-node。如果

就叫做 edge。随后

oscape

8.3.2.1.22 结果说明明

dows/

rk/:制作 OTU 网络

rk.pdf:OTU-netw

靶区域外序列统计

前序列总数,第三

聚类,后根据序列

于属,域值的序列

序列,找出所有与

U。

TU聚类中的代表

h,OTU_abunda

的结果。

uclust/download

TU 的分布情况。

生成聚类,即共有

一个 OTU 在一个

后可以通过对点和

络聚类图原始数据

work 图

计表,结果见表 2

三列为非把区域序

列之间的相似性作

列相似性定为 0.99

与该序列相似在

表性序列,分别是长

ance,OTU_ALL

s1_1_579.html

可以突出样本之

的 OTU 越多,样

个样本中出现的话

和线的处理,勾勒

2.1。

表 2.1 处理后结果统计计表

序列,第四列为嵌

作为域值分成操作

9 被认为可能属于

阈值范围内的序列

长度最长的序列(

L,并进行各类 O

之间的相似和不同

样本之间的关系越

话,那么这个样本

勒出整个 OTU-ne

嵌合体序列,第五

作分类单元(OT

于种。OTU 聚类

列把其归为一个类

length)和丰度最

OTU 分析。

同,对于大型复杂

越近。在网络图中

本的 sample-nod

etwork 的样貌。

五列为处理后剩余

TU),通常域值的

采用的软件为 uc

类,而后依次做此

最高的序列(abun

杂的数据来说是一

,有两种节点(no

de 与这个 OTU-n

余序列。

的序列

clust,

此步,

dance),

一种非常

ode),

node 之

Group

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

bio_film

1

2

3

4

5

6

7

8

9

10

11

12

13

14

26131

24336

24283

25490

29037

27938

25406

28005

24794

22840

25114

25567

26252

27993

0

0

0

0

0

0

0

0

1

0

0

0

0

0

711

788

2291

1491

1990

3715

1467

735

965

991

475

1707

857

859

25420

23548

21992

23999

27047

24223

23939

27270

23828

21849

24639

23860

25395

27134

Sample Seq_num Out_target_num Chimeras_num Filtered_num

Page 14: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

11邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

说明:OT

不同颜色代表不

8.3.2.2

8.3.2.2.

VENN[11]

软件:mo

8.3.2.2.2

结果目录:

需要注意的

格式。当样本

ALL_no_c

U-network 图是从

不同样本,小白点

OTU VENN 分析

1 分析方法

]图可以用来统计

othur 以及 R 语言

2 结果说明

:VENN/

的是:当样本数目

本数目大于 5 个时

cut_venn5_*.pdf

图 3

从空间上展示不同

点表示 OTU,白

析图

计样本中共有的和

言程序包”VennDia

目为 5 个时,生成

时,不绘制 VENN

: 五样本 venn 分

3.1OTU-network

同样本间共有的

白点的大小表示该

和独有的 OTU 的数

agram”。

成的 VENN 图格式

N 图。

分析图, 见图 3.2

k 图(选做,样本

OTU 及特有的 O

该 OTU 下面 read

数目,直观的展现

式为 PDF 格式,当

本数太多不可做)

OTU,该图可从

ds 数,白点越大表

现出环境中样品之

当样本数目为不足

OTU 层面上反应

表示该 OTU 分配

之间的异同。

足 5 个时,生成的

应出样本间的异同

配到的 reads 目越

的 VENN 图格式为

同。图中

越多。

为 SVG

Page 15: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

12地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8.3.2.3

8.3.2.3.

为了获取最

OTU 和 RDP 分

软件:uclu

8.3.2.3.2

结果目录:

gradient_p

说明:

OTU 数目与聚类

1 分析方法

最佳 similarity 值

分析。

ust 与 R

2 结果说明

:gradient/

plot.pdf:OTU 数

展示了 uclust 参

类 similarity 值关

值设置,绘制了 OT

数目与聚类 simila

参数 similarity 值

系图

TU 数目变化与 u

arity 值关系图

图 3.3OTU 数目

值(0.86–0.99)与 O

uclust 参数 simila

目与聚类 similari

OTU 数目之间的关

arity 值之间的关

ity 值关系图

关系。红字标示的

系图。从中选择最

的是本次程序使用

最佳的 similarity

用的 similarity 值

值进行

值。

图3.2 OTU 4样本韦恩图4样本分别为GG25,CG20,CG13,CG7之间的venn关系图

cluster similarity VS OTU NUM

Page 16: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

13邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.4.1 方

对处理后序

Bergey's taxono

大于 0.8,即 RD

taxonomy 分为 6

同时,基于 OTU

的序列(ALL)形

OTU_ALL

OTU_leng

OTU_abu

接下来所有

8.4.2 结果展示

结果总目录

8.4.2.1

8.4.2.1.

根据分类学

1. 样本

2. 样本

8.4.2.1.2

结果目录:

ALL_ALL_

表 3.1 说明

8.4.2.2

8.4.2.2.

根据分类学

此绘制了菌群分

8.4.2.2.2

结果目录:

ALL_distri

ALL

ALL

法说明

序列进行物种分类

omy,采用 Naïve

DP 分类阈值。则

6 层,它们依次为

U 聚类的结果,获

形成三份结果,并

L: 使用 OTU 聚类

gth:使用 OTU 聚

ndance: 使用 O

有的展示,均使用

录:6_Taxonom

各样本主要 rank

1 分析方法

学分析结果,可以

中含有什么菌群

中菌群的 reads 数

2 结果展示

:plot_raw_file/

_sample_ALL_*.

明:上表中第一列

各样本菌群分布

1 分析方法

学分析结果,需要

分布条形图和饼图

2 结果展示

:barplot/

ibution_of_ALL_

L_groupmerge_d

L_group1_distribu

8.4 赋予物物种分类单元元

类,采用的软件为

e Bayesian assig

说明此分类结果

为域(domain)

获取每一个 OTU

并进行各类 RDP 分

类结果全部序列进

聚类结果中长度最

OTU 聚类结果中丰

用 OTU_ALL 中的

ic_Classification

k reads 数目统计表

以得知样品在各个

数目,也就是菌群

.xls : 各样本主要

列表示 taxonomy

布条形图

要直观的观测样品

_*.pdf: 各样本菌群

distribution_of_A

ution_of_ALL_*.

为 RDP classifier

gnment 算法对每

可信(测序片段长

、门(phylum)

聚类的代表性序

分析:

进行计算。

最长的代表性序列

丰度最高的代表性

的数据,phylum

n/

个分类水平上的分

群的丰度值。

要 rank reads 数目

表 3.1 phylum 水平

y 名字,后面每两

品在不同分类水平

群分布图,同时

ALL_*.pdf:组与组

.pdf: group1 分组

r,RDP classifie

每条序列在 genus

长度<250 时可适

、纲(class)、

序列,分别是长度

列进行计算。

性序列进行计算。

水平进行展示。

分类学情况。在以

平上各样本主要 r

两列分别为样本中

比例。

平的菌群结构,并

组之间菌群分布图

组内菌群分布图。

er 是基于

s 水平上计算其分

适当调低此值到 0

目(order)、科

度最长序列(length

以下的统计结果中

rank reads 数目

中分类到该 taxon

并观察样本与样本

图.

分配到此 rank 中

0.5,如只测 V3、

科(family)、属

h)和丰度最大的序

中,包含了以下的

nomy 中的 reads

本之间,分组与分

的概率值,一般

V6、V4 区)。B

属(genus)。

序列(abundance)

的信息

数及占样本总 re

分组之间的菌群结

般概率值

ergey's

),所有

eads 数

结构。因

rank

Rhizophagus

Funneliformis

Blyttiomyces

Spizellomyces

Powellomyces

Sebacina

Boletus

7182

1325

268

215

121

78

76

1166

127

1229

213

195

324

1

23.96

2.61

25.25

4.38

4.01

6.66

0.02

1034

540

544

553

2926

30

0

10.32

5.39

5.43

5.52

29.2

0.3

0

71.86

13.26

2.68

2.15

1.21

0.78

0.76

B16_reads B16_ratio B17_reads B17_ratio B18_reads B18_rratio

Page 17: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

14地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

图 4.1 说明

例根据菌群在

8.4.2.3

结果目录:pie_s

ALL_*_AL

ALL_group1_AL

图 4.2

明:上图中横坐标

在所有样本中总体

sample/

LL_*_pie.pdf: 样

LL_*_pie.pdf: gro

2 说明:菌落信息

标代表样本,纵坐

体 reads 从大到小

样本物种丰度饼饼图

样本物种丰度饼图

oup1 分组内物种

息与对应的 barp

坐标为丰度,不同

小进行排布。同时

,同时:

种丰度饼图。

lot 条形图一致,

同颜色表示不同菌

时为了显示效果更

同时为了更好显

图 4.1 phylumm 水平所有样本菌菌群分布图

菌群,其中灰色为

更好,将丰度极低

显示,将丰度极低

为 unclassified 序

低的部分合并为 O

低的部分合并成 o

序列,即未分类序

OTHER 显示在图

other 显示在图上

序列。图

图上。

上。

图4.2 autumnsite 1 样本在 phylum 水平上物种丰度饼图

Distribution Barplot

Page 18: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

15邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.4.2.4

8.4.2.4.

Heatmap[

信息进行聚类并

色热图可选,黑

使用软件:

8.4.2.4.2

结果目录:heat

ALL_heat

ALL_group1_he

ALL

说明:物种

相对丰度越高,

8.4.2.5

8.4.2.5.

根据分类学

计不同水平下每

使用软件:

8.4.2.5.2

结果目录:

物种丰度热图

1 分析方法

[12]可以用颜色变

并重新排布,将聚

黑红色与彩虹色。

:R 语言包”gplot

2 结果展示

map/

map_ALL_*.pdf:

eatmap_ALL_*.p

L_groupmerge_h

种丰度热图,用物

颜色越蓝反之。

classifier 分类图

1 分析说明

学分析结果,可以

每个样本中 unclas

:R。

2 结果展示

:classifier_plot/

变化来反映菌群的

类之后的结果显

ts”

:genus 水平物种

pdf: group1 分组内

heatmap_ALL_*.

物种丰度矩阵绘制

另外热图对样本

以直观的比较样本

ssifier 占比,绘制

/

的丰度信息,可以

示在 heatmap 中

种丰度热图,同时

内物种丰度热图。

pdf:分组与分组之

图 4.3 phy

制,图中每一列代

本做了聚类,样本

左:蓝红图

本之间菌群的分布

制成线状图和柱状

以直观的将菌群丰

中。因此可以很好

时:

之间物种丰度热图

ylum 水平物种丰

代表一个样本,行

本菌群分布越类似

图,图右:彩虹图

布情况。样本各水

状图。

丰度值用定义的颜

好的反映各分类水

图。

度热图

行代表菌群,颜色

似则样本距离越近

水平未分类的序列

颜色深浅表示出来

水平上菌群组成的

色块代表相对物种

近,在图上方聚类

列的占比是一个重

来。同时将样品以

的异同。同时提供

种丰度值,颜色越

类树中的位置越靠

重要的参考指标。

以及菌群

供两种颜

越红表示

靠近。图

通过统

Page 19: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

16地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

ALL_ALL_

ALL_ALL_

ALL

ALL

ALL

ALL

说明:图 4

示。不同的样本使

8.4.2.6

8.4.2.6.

单个样本中

丰度分布情况。

_unclassifier_line

_unclassified_nu

L_ALL_groupme

L_ALL_groupme

L_ALL_group1_u

L_ALL_group1_u

4.6:门纲目科属

使用不同的颜色表

样本菌群丰度柱

1 分析方法

中菌群的丰度排序

按照总体菌群丰

es.pdf: 所有水平

um.pdf: 所有水平

rge_unclassifier_

rge_unclassified

unclassifier_lines

unclassified_num

属水平下,样本 RD

表示。可以直观的

样本 RDP 分类

状图

序情况图。将所有

丰度从大到小的顺

平 classifier 分类情

平 classifier 分类情

_lines.pdf:组与

d_num.pdf:组与

s.pdf:分组内 cla

m.pdf:分组内 clas

图 4.4 所有水平

图 4.5 所有水平

DP 分类中 uncla

的看到不同样本,

类中 unclassified

有样本菌群的丰度

顺序从左到右排列

情况线状图

情况柱状图

与组之间 classifie

与组之间 classifie

assifier 分类线状

ssifier 分类柱状图

平 classifier 分类

平 classifier 分类

assified 分类的百

不同分组之间 u

分类的 reads nu

度相加,得到前 5

,如果不足 50 个

r 分类线状图

er 分类柱状图

状图

类情况线状图

类情况柱状图

百分比水平变化情

unclassified 水平

um 变化情况柱状

50 个丰度最大的

个菌群则全部展示

情况线状图。相同

平变化情况。图 4.6

状图。

的菌群。展示所有

示。

同的分组用同一种

6:门纲目科属水

有样本中这 50 个菌

种线型表

水平下,

菌群的

classified plot

classifier barplot

Page 20: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

17邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

使用软件:R

8.4.2.6.2

结果目录:

ALL_no_c

ALL

说明:ge

8.4.2.7

8.4.2.7.

菌群丰度 3

表该菌落的门水

使用软件:

8.4.2.7.2

结果目录:

ALL_ALL_

ALL_ALL_

ALL

R

2 结果展示

:barplot_sampl

cut_*_ALL_*_ba

L_no_cut_group1

nus 水平下,样本

菌群丰度 3D柱状图

1 分析方法

3D 图可以更立体

水平。任意一个样

:R 语言程序包”

2

:3D_map/

_*_3d_bar_plot.p

_groupmerge_*_

L_ALL_group1_*

e/

rplot_sample.pd

1_ALL_*_barplot

本 RDP 分类中丰

是,在所有样本中

体的观察所有样本

样本中的丰度超过

scatterplot3D”

pdf:单分组菌群丰

_3d_bar_plot.pdf

*_3d_bar_plot.pd

f: 单样本菌群丰

t_sample.pdf: 分

丰度占比最高的前

中菌群 reads num

本中菌群的分布情

过阀值,则会用箭

丰度 3D 柱状图,同

f:分组之间菌群丰

df: group1 分组的

丰度柱状图,同时

分组的菌群丰度柱

前 50 个菌群的分

m 的总值。如果菌

情况。菌群的分布

头特别的标记出

同时在有多个分组

丰度 3D 柱状图

的菌群丰度 3D 柱

时:

柱状图。

分布情况,并按照

菌群不足 50 个,

布顺序是按照菌群

这个菌落的名字

组的情况下:

柱状图

总体丰度从大到

则全取。

群所属门水平排序

小排序。总体丰

序的。X 轴上方的

丰度指的

的标签代

结果展示示

图 4.6 样本在 水平上物种丰度柱状图phylum

Barplot Sample Plot

Page 21: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

18地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

说明:所有

落的门水平,X

8.4.2.8

结果目录:

ALL_*_*_c

ALL_grou

说明:图分

有样本在 genus 水

X 轴菌落的顺序是

:Taxonomy/CLU

cluster_bar.pdf:水

p1_*_*_cluster_

分为左、中、右三

水平下的菌群丰度

是根据门水平进行

USTER_BAR/

水平样品聚类与柱

_bar.pdf:分组水平

三个部分。图左:

图 4.7 样本

度 3D 柱状图。X

行排列。当菌落的

水平样品聚类与与柱状图组合分析析图

只有 RDP 分类

柱状图组合分析图

平样品聚类与柱状

图 4.8phylum 水平

:基于 Bray-Curt

样色与

本在菌群丰度 3D

X 轴代表菌落,Y

的丰度水平在任意

类中绘制此图。

图,另外:

状图组合分析图

平样品聚类与柱状

tis 指数的聚类图

与菌群的图示。

柱状图

Y 轴代表丰度,Z

意一个样本中超过

状图组合分析图

图。图中:根据聚

Z 轴代表样本。X

过阀值,会用箭头

聚类顺序排序的菌

轴上方的标签代

头将此菌落标记出

菌群丰度条形图。

代表该菌

出来。

图右:

Page 22: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

19邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.5 Alpha

8.5.1 方法说明

计算 Alp

等。丰富度指数

-∑Pi*lnPi 来计

采用的是 mothu

Chao:用 chao

如下:

其中,Sc

Sobs= 实

N1 = 只有

N2 = 只有

Ace:用来估计群

算公式如下:

其中

ni= 含有 i

Srare=含有

Sabund=多于

abund =“优

Coverage:是指

本的真实情况。

其中,n1

N =抽样中

多样性分析

ha 多样性指标,

数用于衡量单个样

计算,其中 Pi 为各

ur,相关网址为:

1 算法估计群落

chao1 = 估计的 O

实际 OTU 数;

有一条序列的 O

有两条序列的 O

群落中含有 OTU

条序列的 OTU

有“abund”条序列或

于“abund”条序列

优势”OTU 的阈值

指各样品文库的覆

计算公式为:

1 =只含有一条序

中出现的总的序列

包括丰富度指数

样本中物种种类个

各种群物种数与样

http://www.mot

中含 OTU 数目的

OTU 数;

OTU 数目(如"si

OTU 数目(如"do

U 数目的指数,

数目;

或者少于“abund”

列的 OTU 数目;

值,默认为 10。

覆盖率,其数值越

序列的 OTU 的数

列数目。

数(richness)、香农

个数,实际通过操

样本总物种比值,

thur.org/。其它四

的指数,chao1

ingletons");

oubletons")。

由 Chao 提出,

的 OTU 数目;

越高,则样本中序

数目;

农指数(Shanno

操作分类单元的个

稀疏分析图[13

四个指数介绍如下

在生态学中常用

是生态学中估计

序列没有被测出的

on Index)、ACE

个数来计算,香农

]是从样本中随机

下:

来估计物种总数

计物种总数的常用

的概率越低。该指

指数、Chao1 指

农指数衡量群落的

机抽取序列数为横

数,由 Chao (1984

用指数之一,与 C

指数实际反映了本

数、Coverage,S

异质性,实际公

横坐标。Alpha 多

4) 最早提出。计

Chao I 的算法不

本次测序结果是否

impson

式 H=

多样分析

计算公式

不同。计

否代表样

Page 23: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

20地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

Simpson: 用来

物多样性。即 S

=观测到的

=含有 i 条序列

= 所有序列数

8.5.2 结果展示

结果总目录

8.5.2.1

结果目录:

ALL_no_c

ALL_no_c

ALL_no_c

来估算样品中微生

impson 指数越大

的 OTU 数目

列的 OTU 数目

:5_alpha_index

稀疏性曲线(Ra

:Rarefaction/

cut_*_rarefaction

cut_*_rarefaction

cut_group1_*_ra

生物多样性指数之

大,说明群落多样

x/

arefraction curve

n_plot.pdf:稀疏

n_result.xls:稀疏

arefaction.pdf:不

之一,由 Edward H

样性越低

e)

疏分析图

疏曲线分析统计表

不同分组的稀疏曲

图 5.1

Hugh Simpson(1

表,同时:

曲线分析图

丰富度稀疏分析

1949)提出,在生

析图

生态学中常常用来来定量描述一个区区域的生

S abs

ni

N

ALL_no_cut Richness rarefaction plot

Page 24: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

21邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

说明:图 5

香农指数稀疏分

5.1 丰富度稀疏分

分析图是以样本中

分析图是以样本

分析图是以样本中

随机抽取序列数

本中随机抽取序列

图 5.2 香

图 5.3 Sim

中随机抽取序列数

为横坐标, 相应的

列数为横坐标, 相应

香农指数稀疏分析

mpson 指数稀疏分

为横坐标,相应

的香农指数为纵坐

应的 Simpson 指

析图

分析图

应的 OTU 数目为

坐标所得,每条曲

指数为纵坐标所得

为纵坐标,每条曲

线是一个样本。

得,每条曲线是一

曲线是一个样本。

图 5.3Simpson

一个样本。

图 5.2

指数稀

ALL_no_cut Shannon rarefaction plot

Simpson1 rarefaction plot

Page 25: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

22地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

说明:Sam

数值

8.5.2.2

8.5.2.2.

基于表 5.1

使用软件:

8.5.2.2.2

结果目录:

Alpha_div

mple_ID:样本名称

组间指数盒状图

1 分析方法

1,可以将各分组

:R

2 结果展示

:5_alpha_index

versity_*.pdf:组间

说明:每一个分组

。Seq_num:

组中样本的指数值

x/

间指数盒状图

组下的所有样本的

表 5.1 各样

样本的 reads 数

值做盒状图,观察

图 5.4 分组

的 Simpson 指数

样本 Alpha 多样性

目。OTU_num:

其指数的离散情

组间 Simpson 指数

制作盒装图,直观

性统计表

样本形成的 OT

情况。值越小离散

盒状图

观的看出所有分组

TU 数目。接下来

散程度越小说明该

组的 Simpson 指

来 5 列分别是 5 种

该分组中的样品越

指数分布情况。

指数的

越稳定

sample_ID

BC10

BC20

BC30

BG13

BG17

BG21

BG6

BG9

CC2

5499

5145

6726

6422

6418

13280

5409

5452

7577

623

534

714

818

652

750

610

404

846

4.142154

3.919977

4.471064

4.601742

4.282076

3.589943

4.303426

4.009946

4.575032

3012.917

2344.195

2568.888

3081.027

2127.96

2373.267

2501.854

982.0164

3191.145

1942.516

1333.214

1657.958

1849.275

1352.788

1618.143

1652.294

749.6316

2016.709

0.92635

0.934888

0.936961

0.922454

0.941882

0.968901

0.930301

0.9635

0.932955

0.055743

0.071874

0.034904

0.035627

0.044687

0.111615

0.03906

0.046768

0.032394

seq_num OTU_num Shannon_index ACE_index Chao 1_index Coverage Simpson

Simpson diversity Plot

Page 26: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

23邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.5.2.3

8.5.2.3.

Rank-abu

单个样本来说,

Rank-abu

反映了样品中物

同时为了去

丰度总值的 95%

使用软件:

8.5.2.3.2

结果目录:

ALL_no_c

ALL_no_c

95%累积计

ALL_no_c

ALL_no_c

同时:

ALL_no_c

ALL_no_c

说明:OT

OTU 相对丰度曲

1 分析方法

ndance[14]曲线

OTU 聚类结果中

ndance 曲线可用

物种的分布均匀度

去掉一些极低丰度

%时即停止。剩下

:R

2 结果展示

:Rank_abundan

cut_*_rank_abun

cut_*_rank_abun

计算的方法,不显

cut_*_rank_abun

cut_*_rank_abun

cut_groupmerge_

cut_group1_rank

TU 相对丰度曲线

丰度最高的 OTU

曲线分析图

是分析多样性的

中总体丰度最高的

用来解释物种丰度

度,曲线越平缓,

度的 OTU,使用

下的 OTU Rank 则

nce/

ndance_abosolu

ndance_abosolu

显示 5%reads 特

ndance_with_R.p

ndance_qiime.pd

_rank_abundanc

k_abundance*.pd

线分析,用来表示

U 的位置是 1,总

方式之一。用来表

的 OTU 的位置是

度和物种均匀度。

物种分布越均匀

了 95%累积计算

则不再显示。因此

te_with_R.pdf: 使

te_zoom_with_R

特别低的 OTU

pdf:使用 R 语言

df: 使用 QIIME 绘

ce*.pdf:组与组

df:分组内的相对

图 5.5 O

示样本之间丰度的

总体丰度第二高的

表示样本之间丰度

是 1,总体丰度第

物种的丰度越高

算的方法。即从 O

此能更好的发现物

使用 R 语言绘制

R.pdf:使用 R 语

言绘制的相对丰度

绘制的相对丰度曲

组之间的相对丰度

对丰度曲线图

TU 相对丰度曲线

的相对关系,反映

的 OTU 位置是 2

度的相对关系,反

第二高的 OTU 位置

高,曲线在横轴上

OTU Rank 第一位

物种丰度和均匀度

制的相对丰度曲线

语言绘制的相对丰

度曲线图,纵坐标

曲线图

度曲线图

线分析

映 OTU reads 数目

2,以此类推。Y

反映 OTU reads

置是 2,以此类推

上的范围越大;曲

位开始,累计丰度

度的规律。

线图,纵坐标为 re

丰度曲线图,纵坐

标为 reads 占比。

目的分布情况。X

轴:样本的丰度

数目的分布情况

推,并绘制成一条

曲线的形状(平滑

度值,当丰度值超

eads 数目。

坐标为 reads 数目

X 轴:OTU RAN

数值。

况。对于

条曲线。

滑程度)

超过样本

目。使用

K.总体

Rank Abundance Plot(accumulationg)

Page 27: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

24地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8.5.2.4

8.5.2.4.

物种累积曲

的用于样品量是

使用软件:

8.5.2.4.2

结果目录:

*specaccu

说明:物种

率。如果曲线表

的增加而增加

说明样品量充分

8.6 Beta 多

8.6.1 方法说明

Beta 多样

本间 Beta 多样性

基于系统发育树

序列中,根据多

中不同环境样本

计算 Unifrac 值时

unweighted Unif

差异。

Weighted unifra

作为权重,一般

8.6.2 结

结果总目录

Weighted/

Unweighted/

物种累积曲线图

1 分析方法

曲线图是用于描述

是否充分的判断以

:R 语言程序包”

2 结果展示

:5_alpha_index

um.pdf:物种累积

种累积曲线图,X

表现为急速上升

,即环境内的菌群

分(默认样品数

样性分析

样性指标是用来比

性,分别为本样本

树的计算值,可很好

多序列队列构建以

本间 Unique branc

时有两种方式,一

frac:未加权重计

ac:加权重的计算

般最终结果采用分

果展示

:7_beta_divers

述随着样品量的加

及物种丰富度的

vegan”

x/

积曲线图

X 轴代表样本数目

(斜率大)则说明

群种类趋于完整

目大于 10 个时分

比较多组样本之间

本距离计算、样本

好的用于衡量样本

种子序列为节点

ch 长度总和获得

一种为未加权重方

计算方式,计算时

算方式,计算不仅评

分析结果。

sity/

加大物种增加的情

估计

图 5.

目,Y 轴代表抽样

明有大量物种发现

。因此,如果曲线

分析)

间的差别度量,分

本聚类、样本 PC

本间物种组成的相

的系统发育树,

得。Unifrac metri

方式,另外一种为

时仅考虑样本中是

评估样本间物种的

情况,是调查样本

6 物种累积曲线

样后的 OTU 数目

现,反之平缓上升

线表现为急速上升

分析中通过三个方

A 分析。该三类分

相似度。分析中首

而后通过进化树

c 值在 0-1 之间,

为加权重计算方式

是否有无某 OUT

的差异,并且加入

本的物种组成和预

。结果反映,在持

升(斜率小)则说

升,则说明样品量

方面来衡量样

分析均是基于 Un

首先将 OTU 种子

树计算 Unifrac me

,值越小说明样本

式,区别如下:

,等同于只评估样

了物种丰度(即 O

预测样品中物种丰

持续抽样的情况下

说明此环境内 OT

量不足,如果曲线

nifrac metric[15]

序列比对到 Gree

etric,Unifrac me

本间相似度越高。

样本间物种的差

OTU 分配到的 re

丰度的有效工具,

下,新的 OTU 增

TU 数目并不随着

线表现为平缓上升

,Unifrac metric

engene 核心 16S

etric 是通过计算进

异,不考虑物种丰

eads 数及样本总

被广泛

增加的速

着样品量

升,则

是一种

S rDNA

进化树

丰度的

reads)

Page 28: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

25邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.6.2.1

8.6.2.1.

距离热图展

因此距离热图可

使用软件:

8.6.2.1.2

ALL_no_c

说明:距离

8.6.2.2

8.6.2.2.

利用树枝结

组成的相似度。

目前提供两

*_unifrac_

*_unifrac_

使用软件:

8.6.2.2.2

ALL_n

样本距离 heatm

1 分析方法

现了样本与样本

可以很好的衡量样

:R 语言程序包”

2 结果展示

cut_*_unifrac_dis

离热图,采用样本

则距离

样本聚类图

1 分析方法

结构描述和比较多

两种计算方法的树

_cluster.pdf : 基于

_cluster_sample_

:FastTree

2 结果展示

no_cut_*_unifrac

map 图

之间的距离关系

本间物种组成的

pheatmap”

stance_matrix.xl

本间 unifrac 距离

离越远。热图中对

多个样品间的相似

树状图:

于 unifrac 距离计

_tree : 基于 Fas

c_cluster.pdf:样

系,也就是表明了

相似度。

ls_heatmap.pdf:

图 6.1 样

离矩阵绘制,颜色

对样本间做了聚类

似性和差异关系。

计算的树状图

sttree 软件的近似

样本聚类图

样本与样本之间

样本距离热图

样本距离 heatma

块代表距离值,

类,通过聚类树亦

。基于系统发育树

似最大似然法的算

的相似程度,距离

ap 图

颜色越红表示样

亦可看出样本间的

树的计算值生成的

算法构建的树状图

离之越小则表明样

样本间距离越近,

的距离关系。

的树状图,可很好

样本之间的相似度

相似度越高,越

好的用于衡量样本

度越高。

越是越蓝

本间物种

Page 29: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

26地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

说明:样本

8.6.2.3

8.6.2.3.

PcoA 分析

要的,排在前几

8.6.2.3.2

ALL_no_c

ALL_no_c

本聚类树图,分支

PCA 分析

1 分析方法

析(principal co-o

几位的特征值,对

2 结果展示

cut_*_unifrac_pc

cut_*_unifrac_pc

支每一个点代表一

ordinates analys

对样本之间的关系

coa.xls_3d_PCA

coa.xls_*vs*_PC

图 6.2 样

一个样本,长度值

使用同

is)[16]是一种研

进行描述。

A.pdf: PCA 分析 3

A.pdf : PCA 分析

样本聚类图(距离值

值代表样本间距离

同样的颜色代表

研究数据相似性和

3D 图

析 2D 图

值聚类)

离值,样本相似度越

和差异性的可视化

越高,则在树中距

化方法。进过一系

距离越近。相同的

系列的计算之后,

的 group

选择主

Unifrac Cluster Sample Tree

Page 30: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

27邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

说明:PC

说明:PC

CA 三维散点图,

CA 二维散点图,

图中不同颜色的

图中不同颜色的

图 6.3

的点代表不同 grou

低则在空

图 6.4 PCA 分

的点代表不同 grou

低则在空

3 PCA 分析 3dp

up 中的样本,样

空间距离越远。

分析 2dplot(P1

up 中的样本,样

空间距离越远。

lot

样本间相似度越高

V SP2)

样本间相似度越高

高则在图中越聚集

高则在图中越聚集

集,反之样本间相

集,反之样本间相

相似度越

相似度越

PCA 3dplot

P1 VS P2

Page 31: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

28地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8.6.2.4

8.6.2.4.

对不同分组

箱形图[17

度和分布情况。

8.6.2.4.2

ALL_no_c

说明:样本

8.7.1 方

基于 RDP

的菌群,一般筛

比较,采用的为

样本丰度矩阵做

correction,采用

8.7.2 结果展示

各样本对比较结

样本距离盒状图

1 分析方法

组之间的距离进行

7]:利用数据计算

2 结果展示

cut_*_distance_b

本相对于其他样本

方法说明

P classifier 分类结

筛选条件为 P<=0.

T statistics perm

做指定次数的随机

用的方法为 FDR。

结果见文件夹 4_d

行四分位值计算,

算 5 个统计量:最

boxplot.pdf:分组

本的距离制作出每

8.7 样本间间菌群丰度差差异分析

结果,计算在不同

05 或者 Q 值<=0

mutation test,首

机 permutation,计

if_analysis/

,也就是箱形图的

最小值,第一四分

组距离盒状图

图 6.

每一个样本的距离

同水平上各 rank

0.05,Q 值为 FD

首先计算出各个样

计算每次 permut

的计算,比较不同

分位数,中位数,

.5 样本距离盒状

离盒状图。因此盒

本越相似。

的丰度,比较样本

DR 值。若样本间

样本在不同 rank 中

tation 的 T 值,统

同的分组之间距离

第二四分位数,

盒状图的离散程度

本或组间丰度差异

间两两比较采用的

中的丰度比例(该

统计 T 值大于原始

离分布的差异。

最大值。可以粗

度越小,值越小,

异,找出样本或组

的检验方法为 fish

该 rank 下 reads

始 T 值的概率,最

粗略的看出数据的

代表该样本与其

组间丰度存在显著

her 精确检验,若

数/总 reads 数)

最后做 Multiple t

的离散程

其他的样

著差异

若为组间

通过对

test

Sample Distance boxplot

Page 32: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

29邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.6.2.4

8.6.2.4.

对不同分组

箱形图[17

度和分布情况。

8.6.2.4.2

ALL_no_c

说明:样本

8.7.1 方

基于 RDP

的菌群,一般筛

比较,采用的为

样本丰度矩阵做

correction,采用

8.7.2 结果展示

各样本对比较结

样本距离盒状图

1 分析方法

组之间的距离进行

7]:利用数据计算

2 结果展示

cut_*_distance_b

本相对于其他样本

方法说明

P classifier 分类结

筛选条件为 P<=0.

T statistics perm

做指定次数的随机

用的方法为 FDR。

结果见文件夹 4_d

行四分位值计算,

算 5 个统计量:最

boxplot.pdf:分组

本的距离制作出每

8.7 样本间间菌群丰度差差异分析

结果,计算在不同

05 或者 Q 值<=0

mutation test,首

机 permutation,计

if_analysis/

,也就是箱形图的

最小值,第一四分

组距离盒状图

图 6.

每一个样本的距离

同水平上各 rank

0.05,Q 值为 FD

首先计算出各个样

计算每次 permut

的计算,比较不同

分位数,中位数,

.5 样本距离盒状

离盒状图。因此盒

本越相似。

的丰度,比较样本

DR 值。若样本间

样本在不同 rank 中

tation 的 T 值,统

同的分组之间距离

第二四分位数,

盒状图的离散程度

本或组间丰度差异

间两两比较采用的

中的丰度比例(该

统计 T 值大于原始

离分布的差异。

最大值。可以粗

度越小,值越小,

异,找出样本或组

的检验方法为 fish

该 rank 下 reads

始 T 值的概率,最

粗略的看出数据的

代表该样本与其

组间丰度存在显著

her 精确检验,若

数/总 reads 数)

最后做 Multiple t

的离散程

其他的样

著差异

若为组间

通过对

test

Sample Distance boxplot

8.8.1 方

基于 OUT 聚类与

作为分析的三个维度

8.8.2 结果展示

结果目录:

OTU/: OT

Taxonomy

说明:xyz

数目

方法说明

与 RDPclassifier

,绘制 3D 图以及

:8_PTCA_POC

TU 聚类结果

y/: RDPclassifier

z 轴的刻度是百分

是 1000,样本 B

分类的结果,截

及 2D 图,用于展

CA/

r 结果

分比,即该 OTU

BC10 中所有 OT

截取其中总体丰度

展示样本之间的关

图 7.1 OTU 聚类

图 7.2 OTU 聚类

reads 数目在该样

TU 聚类的 reads

度最高的三个 OTU

关系。

PTCA/POCA 分

类 PTCA/POCA 分

样品所有 OTU 聚

数目是 10000,

U 聚类以及菌群,

分析 3D 图

分析 P1VP2 图

聚类 reads 数目中

则 BC10 在 OTU

,以这三个结果的

中的占比。比如

U800 维度上的数

的 reads num 数

OTU800 的 read

数值是 0.1。

ds num

8.8 PTCAA/POCA 分析

First Three OTU 3D PLOT

Otu808(1) VS Otu1287(2)

Page 33: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

30地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8.9.1 方

RDA 或者 CCA

又称多元直接梯度分

两两之间的关系。

NMDS 非度量多

的数据分析方法。

距离体现的,最

Bray-Curtis[20]差

8.9.2 结果展示

结果总

OTU/

Taxon

8.9.2.1

结果目录:R

ALL_*_*_

ALL_*_*_

ALL_grou

ALL

8.9 RDA/CCCA 分析

方法说明 [18] 是基于对应分

分析。此分析主要

多维尺度分析[19]

其特点是根据样

最终获得样品的空

差异指数:用于绘

总目录:13_PCA

: OTU 聚类结果分

nomy/: RDPclas

RDA 分析

RDA/ &&RDA_3

rda_3d.pdf: RDA

rda.pdf: RDA 2D

p1_*_*_rda.pdf:

L_group1_*_*_rd

分析发展而来的一

要是用来反映菌群

,是一种将多维空

样品中包含的物种

空间定位点图。

绘制样本之间的树

A_RDA_CCA_NM

分析

sifier 聚类结果分

3D/

A 3D 图

D 图同时,

分组的 RDA 2D

da_3D.pdf: 分组

一种排序方法,将

群与环境因子之间

空间的研究对象简

信息,以点的形

树状图。

MDS_analysis/

分析

的 RDA 3D 图

将对应分析与多远

的关系。分析可

简化到低维空间进

形式反映在多维空

远回归分析相结合

可以检测环境因子

进行定位,分析和

空间上,而对不同

图 8.1OTUU 聚类 RDA 分析析 3D 图

合,每一步计算均

,样品,菌群三

和归类,同时又保

样品间的差异程

均与环境因子回归

者之间的关系或

留对象间原始关

度,则是通过点

归,

关系

与点的

OTU RDA 3D Plot

Page 34: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

31邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

图 8.2OTU 聚类类 RDA 分析与环境境因子 3D 图

图 8.3OTUU 聚类 RDA 分析析 2D 图

OTU RDA 3D Plot

OTU RDA Analysis PLOT

Page 35: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

32地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

说明:OT

是:HCO3,CO2

连线与箭头之间

OTU)对环境因

8.9.2.2

结果目录:

ALL_*_*_N

ALL_*_*_N

ALL_gr

ALL_gr

TU 聚类 RDA 分析

2,Ca,Tempature

间的夹角,代表了

因子箭头的连线做

NMDS 分析

:NMDS/ &&NM

NMDS.pdf: NM

NMDS_tree.pdf:

roup1_*_*_NMD

roup1_*_*_NMD

析的 3D 图和 2D

e,Oxygen,nitroge

了样本与环境因子

做投影,投影点距

MDS_TREE/

MDS 图

: NMDS 聚类树

DS.pdf:分组 NM

DS_tree.pdf:分组

图 8.4OTU 聚类

D 图,以及对应 6

en。箭头表明了环

子之间的相关关系

距离箭头越近,说

树图,另外

MDS 图

组 NMDS 聚类树

类 RDA 分析与环境

6 个环境因子的 R

环境因子在平面上

系(锐角,正相关

说明该环境因子对

树图

境因子 2D 图

RDA 分析图。箭

上的相对位置,箭

关;钝角,负相关

对样本产生的影响

头标示环境因子

箭头越长,说明其

关;直角,不相关

响越大。环境因子

,这 6 个环境因

其作用越大。样本

关)。样本(或者

子需要客户自行提

因子分别

本-中心

者菌群、

提供。

OTU RDA Analysis PLOT

Page 36: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

33邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

图 8.5OTU

图 8.6OTU 聚

U 聚类 NMDS 分

类树状图(Bray-C

分析 2D 图

Curtis 算法)

NMDS TREE PLOT

OTU NMDS Analysis PLOT

Page 37: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

34地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

说明:图 8

8.9.2.3

结果目录

ALL_*_*_c

ALL_*_*_c

ALL_grou

ALL

8.5 是 OTU 聚类

CCA 分析

CCA/ && CCA_

cca_3d.pdf: CCA

cca.pdf: CCA 2D

p1_*_*_cca_3d.

L_group1_*_*_cc

类的 NMDS 分析 2

_3D/

A 3D 图

D 图,另外:

.pdf:分组 CCA

ca_3d.pdf:分组

2D 图,表明的是

3D 图

组 CCA 2D 图

图 8.7OTU 聚类

图 8.8OTU 聚类

是 OTU 与样本之

间的树图

类 CCA 分析与环境

类 CCA 分析与环境

间的关系。图 8.6

境因子 3D 图

境因子 2D 图

6 是基于 Bray-CCurtis 指数计算的的样本之

OTU CCA 3D Plot

OTU CCA Analysisi PLOT

Page 38: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

35邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

说明:OTU 聚类 CCA 分析与环境因子的 3D 图与 2D 图。这 6 个环境因子分别是:HCO3,CO2,Ca,Tempature,Oxygen,nitrogen。

箭头表明了环境因子在平面上的相对位置,箭头越长,说明其作用越大。样本-中心连线与箭头之间的夹角,代表了样本与环境因子之间

的相关关系(锐角,正相关;钝角,负相关;直角,不相关)。样本(或者菌群、OTU)对环境因子箭头的连线做投影,投影点距离箭

头越近,说明该环境因子对样本产生的影响越大。环境因子需要客户自行提供。

8.10 进化树分析

8.10.1 方法说明

通过某一分类水平上序列碱基之间的差异构建进化树并分析,可以推断有关生物进化的发展过程,了解生物进化历史和机制。使用

FastTree 通过选择 OTU 或某一水平上分类信息对应的序列根据最大似然法构建进化树,再使用 R 语言作图绘制进化树。

同时,选取 OTU 聚类结果中总体丰度最大的前 50 个 OTU 聚类的代表性序列:丰度最高和最长的序列,使用 MUSCLE 软件,构建

进化树,并用R 语言绘图

目前,默认使用 genus 水平的信息绘制进化树图,其格式为

Genus 信息(OTU):如 Tepidimicrobium ( OTU 3031 )

所有分类信息(OTU): 如 Bacteria;Firmicutes;Clostridia;Clostridiales;Clostridiales Incertae Sedis XI;Tissierella ( OTU 2441 ),分别

表示界,门,纲,目,科,属,OTU

8.10.2 结果展示

结果总目录:10_evolutionary_phylogenetic_tree/

ALL_no_cut_*_first50_tree_all.pdf: 前 50 个代表序列树状图(所有分类信息)

ALL_no_cut_*_first50_tree_genus.circular.pdf:前 50 个代表序列圆形树图

ALL_no_cut_*_first50_tree_genus.nocircular.pdf:前 50 个代表序列环状树图

ALL_no_cut_*_first50_tree_genus.pdf:前 50 个代表序列树状图(genus 分类信息)

ALL_no_cut_*_tree_all.pdf: 所有序列树状图(所有分类信息)

ALL_no_cut_*_tree_genus.circular.pdf:所有序列圆形树图

ALL_no_cut_*_tree_genus.nocircular.pdf:所有序列环状树图

ALL_no_cut_*_tree_genus.pdf:所有序列树状图(genus 分类信息)

Page 39: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

36地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

说明:图 99.1 前 50 个代表

图 9.1 前 50 个

图 9.2

表性序列标注 gen

列标注 genus

个丰度最大代表性

2 前 50 个丰度最

nus 水平信息的环

水平信息的树状

性序列标注 genu

最大代表性序列 ge

环状进化树图,使

状图,使用的是 ge

us 水平信息的环状

enus 水平进化树

使用的是 genus 水

enus 水平信息绘

状进化树图

树图

水平信息绘制。图

绘制。

图 9.2 前 50 个代代表性序

Page 40: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

37邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

8.11 MEGAN 分析

8.11.1 方法说明

使用 MEGAN 软件,通过交互式搜索 NCBI 中的分类数据库信息,以树状图形式表现物种的丰度情况与菌落结构,反映微生物的组

成情况。除了计算单样本菌群丰度图,也会根据客户的分组,计算组内样本菌群分析比较图

8.11.2 结果展示

结果目录:9_Taxonomi_tree_comparation/

ALL/: 样本比较 MEGAN 图

Single/:单样本 MEGAN 图

ALL_main_MEGAN_*_*.pdf: 所有样本 MEGAN 比较图

ALL_no_cut_group1_main_MEGAN_*_*.pdf: 组内样本 MEGAN 比较图

图 10.1 门水平单样品 MEGAN 分类树以及丰度图

说明:每个节点处标示的英文代表该处在 NCBI 中的 Taxonomy 记录。英文后有两个数字,分别代表比对至该 Taxonomy 的序列条

数,包含该 Taxonomy 以及所有下级 Taxonomy 的序列条数。

图 10.2 门水平多样品 MEGAN 丰度比较图

说明:图形左上角显示的是样本与对应的颜色。由于版面限制,不显示节点对应的序列条数。颜色代表了样本在此 Taxonomy 的分

布情况。

Page 41: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

38地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

关于 ALL_per_cut,ALL_num_cut,ALL_no_cut 前缀的说明:

根据客户的要求,可以选择去除低丰度的 OTU 聚类。可以选择两种方式:

Per_cut : 根据设定的百分数,删除低丰度百分之多少的 OTU 序列,之后的分析结果前缀均使用 ALL_per_cut。

Num_cut:根据设定的数目,删除指定数目的低丰度的 OTU 序列,之后的分析结果前缀均使用 ALL_num_cut。

如果不修改,则前缀设置为 ALL_no_cut。

1_data_for_analysis/原始数据结果文件夹

1-1_raw_data/

*.fastq 原始 fastq 格式文件

1-2_merge_data/

merge.extendedFrags.fastq: 融合后的 fastq 文件

1-3_sample_raw_data/

*.qual:各样本测序质量值文件

*.fasta: 各样本原始测序 fasta 格式文件

*_raw_read_len_distribution.pdf: 各分组的读长统计图

1-4_QC_data/

*.qual:QC 之后各样本测序质量值文件

*.fasta: QC 之后各样本原始测序 fasta 格式文件

*_raw_read_len_distribution.pdf: QC 之后各分组的读长统计图

Sample_data_infor.xls:质控之后统计统计文件

clean_read_len_distribution.pdf:QC 之后序列长度分布图

2_filter_chimeras/去除嵌合体及非靶区域序列结果

ALL_merge_precluster_uchime_uniq.fasta : 去除嵌合体及非靶区域序列结果总文件

*_precluster_uchime_uniq.fasta:去除嵌合体及非靶区域序列各样本文件

filter_chimeras_result.xls:去除嵌合体及非靶区域后统计表

3_other_commmunity_deletion/ 删除菌群信息之前原始数据的备份,只有当需要筛选菌群信息时,才会有此文件夹

ALL_merge_precluster_uchime_uniq.fasta.classifier RDP 分类结果备份

ALL_merge_precluster_uchime_uniq.fasta 去除嵌合体及非靶区域序列结果总文件备份

4_OTU/ OTU 分析结果

*OTU _count.xlsx:各样品 OTU 序列数统计结果

*OTU_to_reads.xlsx :(OTU 与序列一一对应结果)

*OTU_count_add_taxonomy: OTU 聚类结果与对应的丰度最高最长代表性序列统计结果

gradient/选作项目。

gradient_plot.pdf: OTU 聚类中 OTU 数目与 similarity 参数的关系图、

VENN/

Venn5*.pdf: 5 样本 OTU venn 分析图。只有当样本数目或者分组数目为 5 个时,才会有此文件。

*.svg : 1-4 OTU venn 分析图,需用浏览器打开。只有当样本数目或者分组数目为小于 5 个时,才会有此文件。

OTUNETWORK/ : 用于制作网络图的原始文件,选做项目。

cytoscape_windows/

*.pdf:使用 cytoscape 绘制的网络图,选做项目。

5_Alpha_index/ Alpha 多样性分析结果

Alpha_diversity_Simpson.pdf:样品分组之间的 Simpson 指数盒状图

9. 结果说明

Page 42: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

39邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

Alpha_diversity_shannon.pdf:样品分组之间的 shannon 指数盒状图

Alpha_diversity_chao1.pdf:样品分组之间的 chao1 指数盒状图

Alpha_diversity_ACE.pdf:样品分组之间的 ACE 指数盒状图

Alpha_diversity_richness.pdf:样品分组之间的 richness 指数盒状图

*_specaccum.pdf:物种累积分布图

Rarefaction/

richness_rarefaction_plot.pdf:丰富度稀疏曲线图

Shannon_rarefaction_plot.pdf:香浓指数稀疏度曲线图

ACE_rarefaction_plot.pdf:ACE 指数稀疏度曲线图

Chao1_rarefaction_plot.pdf:Chao 指数稀疏曲线

Simpson_rarefraction_plot.pdf: Simpson 指数稀疏曲线

All_Sample_alpha_diversity.xls:各指数汇总表

*rarefaction_result.xls:稀疏曲线表

Rank_abundance/

*rank_abundance.pdf: 使用 qiime 制作的 rank_abundance 图

*rank_abundance_with_R.pdf:使用 R 制作的 rank_abundance 图,数值使用百分比表示

*rank_abundance_abosolute_with_R.pdf: 使用 R 制作的 rank_abundance 图,数值使用 reads_num 表示

*rank_abundance_abosolute_zoom_with_R.pdf:使用 R 制作的 rank_abundance 累积图,在此图中展示 reads_num 较高的数据

6_Taxonomic_Classification / classifier 结果

OTU_length_reads_classification/

OTU_ALL_reads_classification/

OTU_abundance_reads_classification/

classifier_plot/所有样本 classifier 分布情况图

3D_map/菌落丰度 3D 图

reads2taxon/ 各序列 ID 对应 genus 水平分类结果

pie_sample/ 物种丰度饼图

histogram_sample/物种丰度非堆叠条形图, 只有当样本数小于 10 个才会绘制

heatmap/ 物种丰度热图

barplot_sample/物种丰度条形图文件夹

barplot/物种丰度堆叠条形图

cluster_bar/聚类与柱状图组合分析图

7_beta_diversity/ beta多样性分析结果

unweighted/unweighted unifrac计算结果

weighted/ Weighted unifrac 计算结果

weighted_unifrac_cluster:样本聚类结果

weighted_unifrac_cluster.pdf:样本距离树状图

weighted_unifrac_distance_matrix.xls:样本距离矩阵

weighted_unifrac_distance_matrix.xls_heatmap.pdf:样本距离热图

weighted_unifrac_pcoa.xls:pcoa 分析结果

*_ 3d_PCA.pdf:PCA 分析三维图

*_*vs*_PCA.pdf:PCA 分析二维图

*distance_boxplot.pdf : 样本相对于其他样本的距离盒状图

Page 43: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

40地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

8_PTCA_POCA PTCA/POCA 分析

OTU/

Taxonomy/

*first_three_3d.pdf: PTCA/POCA 3D 图

*first_three_2D_*_VS_*.pdf: PTCA/POCA 2D 图

9_Taxonomi_tree_comparation MEGAN 分析图

ALL/ 分组 MEGAN 丰度比较图

Single/ 单样品 MEGAN 丰度图

10_evolutionary_phylogenetic_tree

*tree_genus.pdf: 标记 OTU 和 genus 水平菌群分类的树状图

*tree_genus.nocircular.pdf 标记 OTU 和 genus 水平菌群分类的环状图

*tree_genus.circular.pdf 标记 OTU 和 genus 水平菌群分类的球形图

*tree_all.pdf 标记 OTU 和所有水平菌群分类的树状图

*first50_tree_genus.pdf 前 50 个代表序列标记 OTU 和 genus 水平菌群分类的树状图

* first50_tree_genus.nocircular.pdf 前 50 个代表序列标记 OTU 和 genus 水平菌群分类的环状图

* first50_tree_genus.circular.pdf 前 50 个代表序列标记 OTU 和 genus 水平菌群分类的球形图

* first50_tree_all.pdf 前 50 个代表序列标记 OTU 和所有水平菌群分类的树状图

11_dif_analysis/ 物种丰度差异分析结果,选作项目。

*dif_AB.xlsx:两两样品差异比较文件

*dif_AB_p0.05.xlsx:P 值检验显著的差异统计

13_PCA_RDA_CCA_NMDS_analysis

OTU/

Taxonomy/

*rda_3d.pdf: RDA 3D 图

*rda.pdf:RDA 2D 图

*_NMDS_tree.pdf:NMDS 2D 图

*_NMDS.pdf:NMDS 树状图

*cca_3d.pdf: CCA 3D 图

*cca.pdf:CCA 2D 图

Page 44: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

41邮箱 /Email:[email protected]; [email protected]网址 /Web:www.sangon.com

[1] Schmieder R and Edwards R: Quality control and preprocessing of metagenomic datasets. Bioinformatics 2011, 27:863-864.

[2] Tanja Magoč and Steven L. Salzberg: FLASH: Fast Length Adjustment of Short Reads to Improve Genome Assemblies

Bioinformatics (2011)doi:10.1093/bioinformatics/btr507

[3] Schloss, P.D., et al., Introducing mothur: Open-source, platform-independent, community-supported software for describing and

comparing microbial communities. Appl Environ Microbiol, 2009. 75(23):7537-41.

[4] Edgar,RC (2010) Search and clustering orders of magnitude faster than BLAST, Bioinformatics 26(19), 2460-2461.

[5] Caporaso JG, Kuczynski J. et al. QIIME allows analysis of high-throughput community sequencing data. Nature Methods 7(5):

335-336(2010).

[6] Edgar, R.C. (2004) MUSCLE: multiple sequence alignment with high accuracy and high throughput.Nucleic Acids

Res.32(5):1792-1797.

[7] Daniel H Huson, Suparna Mitra, Nico Weber, Hans-Joachim Ruscheweyh, and Stephan C Schuster (2011). Integrative analysis

of environmental sequences using MEGAN4 Genome Research, 21:1552-1560.

[8] Wang, Q, G. M. Garrity, J. M. Tiedje, and J. R. Cole. 2007. Naïve Bayesian Classifier for Rapid Assignment of rRNA Sequences

into the New Bacterial Taxonomy. Appl Environ Microbiol. 73(16):5261-5267; doi:10.1128/AEM.00062-07 [PMID: 17586664]

[9] Quast C, Pruesse E, Yilmaz P, Gerken J, Schweer T, Yarza P, Peplies J, Glöckner FO . The SILVA ribosomal RNA gene

database project: improved data processing and web-based tools. Nucl. Acids Res. 41 (D1): D590-D596(2013).

[10] Urmas Kõljalg, R. Henrik Nilsson, Kessy Abarenkov, Leho Tedersoo, et al. Towards a unified paradigm for sequence-based

identification of fungi. Molecular Ecology (2013)22,5271–5277DOI: 10.1111/mec.12481

[11] Fouts DE, Szpakowski S, Purushe J, Torralba M, Waterman RC, et al. (2012) Next Generation Sequencing to Define Prokaryotic

and Fungal Diversity in the Bovine Rumen. PLoS ONE 7(11): e48289. doi:10.1371/journal.pone.0048289.

[12] Elie Jami, Adi Israel, et al. Exploring the bovine rumen bacterial community from birth to adulthood. The ISME Journal advance

online publication, 21 February 2013; doi:10.1038/ismej.2013.2

[13] Katherine R Amato. et al. Habitat degradation impacts black howler monkey (Alouatta pigra) gastrointestinal microbiomes. The

ISME Journal (2013) 7, 1344–1353; doi:10.1038/ismej.

[14] Scott T Bates, Jose C Clemente, et al. Global biogeography of highly diverse protistan communities in soil. The ISME Journal

(2013) 7, 652–659; doi:10.1038/ismej.2012.147.

[15] Tanya Yatsunenko, Federico, et al. Human gut microbiome viewed across age and geography. Nature 486, 222–227 (14 June

2012) doi:10.1038.nature11053.

[16] Xiao-Tao Jiang ,Xin Peng, et al.Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a

Mangrove Wetland. Microb Ecol (2013) 66:96–104.DOI 10.1007/s00248-013-0238-8.

[17] Abrahamsson T.R., Jakobsson H.E., Andersson A.F., Bjorksten B., Engstrand L., Jenmalm M.C. Low diversity of the gut

microbiota in infants with atopic eczema. (2012) Journal of Allergy and Clinical Immunology, 129(2).

[18] Sheik CS, Mitchell TW, Rizvi FZ, Rehman Y, Faisal M, et al. (2012) Exposure of Soil Microbial Communities to Chromium and

Arsenic Alters Their Diversity and Structure. PLoS ONE 7(6): e40059. doi:10.1371/journal.pone.0040059.

[19] Magali Noval Rivas, PhD, Oliver T. Burton, et al. A microbita signature associated with experimental food allergy promotes

allergic senitization and anaphylaxis. The Journal of Allergy and Clinical Immunology.Volume 131, Issue 1 , Pages 201-212, January

2013.

[20] Luo J, Zhang J, Tan X, McDougald D, Zhuang G, Fane AG,Kjelleberg S, Cohen Y, Rice SA Characterization of the archaeal

community fouling a membrane bioreactor. J Environ Sci (China). 2015 Mar 1;29:115-123. doi: 10.1016/j.jes.2014.07.025.Epub 2015

Jan 5.

10. 参考文献

Page 45: 生工生物 宏基因组微生物分类测序 项目介绍®¢户专区... · 漩涡混合器 海门市其林贝尔仪器制造有限公司 GL-88B 混匀型干式恒温器 深圳拓能达科技有限公司

宏基因组微生物分类项目介绍

宏基因组微生物分类项目介绍

42地址:上海市松江区香闵路 698 号 Add: 698 Xiang Min Road SongJiang Shanghai China技术支持:021-37772413/57072083/57072061

[21] Price MN, Dehal PS, Arkin AP (2010) FastTree 2 – Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE

5(3): e9490. doi:10.1371.journal.pone.0009490.

[22]Claesson MJ(1), O'Sullivan O, Wang Q, Nikkilä J, Marchesi JR, Smidt H, de Vos WM,

Ross RP, O'Toole PW.Comparative analysis of pyrosequencing and a phylogenetic microarray forexploring microbial community

structures in the human distal intestine. PLoS One. 2009 Aug 20;4(8):e6669. doi: 10.1371/journal.pone.0006669.