metagenom analiz stratejilerimikrobiyota2016.ftskongre.org/webkontrol/uploads/files... ·...
TRANSCRIPT
Metagenom Analiz Stratejileri
Prof.Dr. Engin YılmazAcıbadem Üniversitesi
Tıbbi Biyoloji AD
1. Ulusal İnsan Mikrobiyotası veSağlığımıza Etkileri Kongresi
8-10 Aralık 2016, Ankara
İnsan Genom Projesiİnsan genomunu ve onun insan sağlığı üzerinde oynadığı rolü anlamaya çalışmak.
1990
2000
2003
2006
2008
2005
2003/2007
İnsan Mikrobiyom Projesiİnsan vücudunun farklı bölgelerinde bulunan mikroorganizmagruplarını karakterize etmek, mikrobiyom ve insan sağlığındaki değişiklikler arasındaki ilişkiyi anlamak.
Our second genome
2008
• İnsan vücudu içinde ve üzerinde ~ 100 trilyon bakteri bulunmaktave vücut ağırlığının ~ % 3'ünü oluşturmaktadır.
• Rolleri konusunda sınırlı bir bilgiye sahip olsak da, bu çeşitliliği sağlık ve hastalıkta sorgulayabilen teknolojilere sahibiz.
• Sağlıklı bireylerin normal florası, yeni modülatörler ve doğal ürünlerin tanımlanması için bir kaynak oluşturmaktadır.
• Popülasyondaki değişiklikler ve kaymalar, sağlık durumunun göstergeleri olarak kullanılabilir.
• Mikrobiyom, hastalığın seyrinin izlenmesi için kullanılabilir.
İnsan Mikrobiyom ProjesiPotansiyel Etkisi
• Mikrobiyom bağışıklık gelişiminde önemli rol oynamaktadır.
• Mikrobiyota / antibiyotik ve immün aracılı hastalıkların gelişimi
arasındaki ilişkiler belirlendi.
• Gelişmiş sanitizasyon, antibiyotik kullanımı ve bağışıklama,
mikrobiyotayı değiştirebilen faktörlerdir.
• Mikrobiyal populasyonlar coğrafi bölgeye göre değişebilir.
• Mikrobiyom akıl sağlığı ve insan davranışını etkileyebilir.
– Ağırlık / BMI‘e bağlı olarak mikrobiyomda farklılıklargözlenebilir.
– Diyete bağlı olarak mikrobiyomda farklılıklar gözlenebilir.
– Sağlık durumuna bağlı olarak mikrobiyomda farklılıklargözlenebilir.
İnsan Mikrobiyom ProjesiPotansiyel Etkisi
metabolizma
Mikrobiyomun insandaki rolünü anlamak için hangi biyolojik özelliklere ihtiyacımız var?
transkriptler?proteinler?metabolitler?
Metagenom: mikrobiyomun genetik taslağı
Metagenom Analiz Stratejisi
16s rRNA amplikon dizilimi ile kimlerin olduğu belirlenir?
2,3 milyonun üzerinde bilinen bakteri 16s rRNA'sı
Tür ve miktarının belirlenmesi
Metagenomik dizilim - ne yapabilirler?
Pan-genom içeriğinin belirlenmesi
Metagenomik transkriptomikler - aktif genler?
RNA’nın cDNA’ya cevrilmesi ve dizilenmesi
Aktif olarak transkribe olan bakteriyel genlerin belirlenmesi
için insan dizilerinin ve bakteriyel rRNA‘nın filtrelenmesi
Diğer “omics” teknolojileri: Proteomics, transcriptomics, metabolomics
Biyolojik yorumlamayı yapabilmek için terabayt düzeyindeki datanın analizi
Kültüre bağlı analiz:
• Organizmanın laboratuvarda üretilmesi ve saf kolonilerin sağlanması.
• Genom dizisinin tamamlanması.
Kültüre bağlı olmayan analiz:
• 16S ribosomal RNA (rRNA) dizilemesi.
• Son yıllardaki teknolojik gelişmeler sayesinde, tüm genomun fragmanlar
halinde dizilenmesi, biraraya getirilmesi ve referans genomlar ile
karşılaştırılması mümkün olmaktadır.
• Biyoinformatik analiz metodları ve modellerinin geliştirilmesi ile büyük
data setlerinin analizedilmesi.
• Elde edilen veriler diğer “omics” teknolojileri ile birlikte
değerlendirilerek daha fazla bilgiye sahip olabilmek.
Metagenom Analiz Stratejisi
16S rRNA Gen Analizi
Korunmuş bölgelerTüm bakterilerde aynı
Tek PCR primer çifti, çeşitli bakterilerden gelen 16S
rRNA genlerini çoğaltabilir
Değişken bölgelerTürler arasında korunmuşTürler arasında farklılık
Bakteri "türlerinin" çeşitlerini ve bolluklarını tanımlamak için diziden "bilgi" çıkarma.
Bakteri türleriBelirlenen türlerin zenginliğinin belirlenmesiTürler arası ilişkilerin belirlenmesi
Popülasyon çeşitliliğinin analizi.
Popülasyonlar arasındaki çeşitliliğin karşılaştırılması.
Tür Zenginliği ve Doğruluğunun Tahmini
• 16S rRNA geni kütüphane analizi
Genom kapsama alanı kütüphanedeki bolluk ile orantılıdır
yoğun türler > orta yoğunluktaki türler > nadir türler
16S rRNA Veri Analizi
QIIME (Quantitative Insights Into Microbial Ecology)
http://qiime.sourceforge.net
mothur http://www.mothur.org
MG-RAST (Metagenomics - Rapid Annotation using Subsystems Technology)
http://metagenomics.nmpdr.org
Genboree http://genboree.org/java-bin/workbench.jsp
EzTaxon http://eztaxon-e.ezbiocloud.net
Pheonix2 http://sourceforge.net/projects/phoenix2.
METAGENassist http://www.metagenassist.ca.
MEGAN http://www-ab.informatik.uni-tuebingen.de/software/megan
VAMPS http://vamps.mbl.edu
CloVR-16S http://clovr.org/developers
RDPipeline (Ribosomal Database Project Pipeline) http://rdp.cme.msu.edu
Plummer et al., J Proteomics Bioinform 2015, 8:12
Neden Metagenom Gerekli?
Hücre yapısının veişlevinin araştırılması
Metabolizmanınanlaşılması
Genomun yenidendüzenlenmesi
İlaç ve aşıgeliştirilmesi Protein protein
ilişkilerininanlaşılması
Minimal gen setinintanımlanması
DNA varyasyonlarınıntanımlanması
Genotipleme ve Adlitıp
Gen ifadesinin anlaşılması(RNA-Protein)
Konakcı ile ilişkininanlaşılması
Dizileme Yöntemleri
Sentez ile dizileme
Sanger sequencing (Applied Biosystems)
Pyrosequencing (Roche/454)
Reversible terminator (Illumina)
Ion torrent (Life Technologies)
Single Molecule Real Time Sequencing (Pacific Biosciences)
Oligo ligasyon ile dizileme
SOLiD (Applied Biosystems)
DNA dizisinin direk okunması
Nanopore sequencing (Oxford Nanopore Thec.)
Yeni Nesil Oyuncaklar
PacBio RS II: long-read sequencer
Sequel System: SMRT Sequencing
DNA dizi analiz metodlarının karşılaştırılması
Metod Okuma UzunluğuDoğruluk %(tek okuma)
Okuma/Koşum Zaman/Koşum Fiyat/milyon baz Avantaj Dezavantaj
Gerçek zamanlıdizileme(PacBio)
avg 14,000 bpmax >40,000 bp
8750,000/ SMRT cell, 500–1000
mbaz
30 dk4 saat
$0.13–$0.60En uzun okuma
uzunluğuHızlı tanımlama
Orta ölcekliEkipman çokpahalı olabilir
Düşük doğruluk
Yarı iletken iyon(Ion Torrent)
>400 bp 98 >80 milyon 2 saat $1Daha ucuz
ekipman HızHomopolimer
hatası
Pyrosequencing (454)
700 bp 99.9 1 milyon 24 saat $10Uzun okuma
boyuHız
Koşumlar pahalıHomopolimer
hatası
Sentez iledizileme
(Illumina)50 - 300 bp 99.9
>6 milyar(TruSeq )
1 - 11 günCihaza ve okumauzunluğuna bağlı
$0.05 - $0.15
Sıralama modülüne ve
istenen uygulamaya bağlı olarak yüksek dizi
verimipotansiyeli
Ekipman çokpahalı olabilirYüksek DNA
konsantrasyonugerekli
Ligasyon iledizileme
(ABI SOLiD) 50+35 / 50+50 bp 99.9 1.2 - 1.4 milyar 1 - 2 hafta $0.13
Baz başına düşükmaliyet
Diğermetodlardandaha yavaşPalindromik
dizilerin sekansıkonusu?
Zincirterminasyonu
(Sanger)400 - 900 bp 99.9 N/A 20 dk - 3 saat $2400
Uzun bireyselokuma
Birçok uygulama için kullanışlı
Büyük dizileme projeleri için
pahalı ve pratik değil
Klonlama veyaPCR zaman alıcı
basamak
Yüksek Ölçekli Veri Analizi
Data Analizi
Sorgulama, karşılaştırma,veri kümelerini analiz etme
Metadata bağlamında sekans verilerini analiz etmek için çokdeğişkenli istatistikler
Örnek Karşılaştırma- Taksonomik profiller- Fonksiyonel ve
metabolik profiller
Noncoding özelliklerinbelirlenmesi
(16S, 18S, tRNA)Protein işlevi
Bir araya getirme- Metagenomik- Metatranskriptomik- Kısa Peptidler
Taksonomik Sınıflandırma
Referans genom ve karşılaştırmalıgenom değerlendirmesi içinokumanın planlanması
Metagenomik Verilerin Analiz Şeması
Bioinformatics and Biology Insights 2015:9 75–88
Çalışmanın tasarımı, grupların oluşturulması ve
örneklemin sayısı
Metaveri standartlarıve gizlilik
Örneklerin toplanmasıkodlanması ve dağıtımı
Dizileme tipi primerler vemetodun seçimi
Dizileme Merkezleri
Verilerin depolanmasıtransferi Biyoinformatik
Kalite kontrol
16S rRNADizileme
WGS
OTU FilotiplerRef GenomHaritalama
Metabolikyapılandırma
GruplamaFiltreleme
SınıflandırmaSınıflandırma
Genomunokunması
Gen veYolaklar
Verilerin olgunlaştırılması, fenotipler ile ilişkilendirme ve yorumlama
BirleştirmeDeğerlendirme
Metagenomve genler