Pengertian:
• Aplikasi teknologi informasi dalam bidang biologi molekuler
• Istilah Bioinformatik pertama kali dikemukakan oleh: Paulien Hogeweg (1979).
• Digunakan dalam bidang genomik dan genetika khususnya aplikasi untuk analisis sekuens DNA dalam jumlah besar
Ruang lingkup:
• Saat ini mencakup juga aktifitas
pembuatan dan pemutakhiran
database, algorithme,
komputasional dan teknik statistik,
dan teori untuk memecahkan
persoala-persoalan manajemen
data-data percobaan biologis.
Aktifitas Bioinformatik
• Mapping (pemetaan) DNA dan
kromosom
• Analisis sekeuens DNA dan Protein
• Alligning (penjajaran) sekuens DNA
dan protein yang berbeda untuk
membandingkannya
• Pembuatan dan visualisasi model 3
dimensi struktur protein
Fokus Kegiatan
Pengembangan dan aplikasi teknik-
teknik komputasional:
pattern recognition (pengenalan
pola), data mining (penambangan
data), machine learning
algorithms, and visualization
(visualisasi)
Aktifitas penelitian Bioinformatik
• sequence alignment (penjajaran sekuens),
• gene finding (pencarian gen),
• genome assembly (assembling genom),
• protein structure alignment(penjajaran struktur protein),
• protein structure prediction(prediksi struktur protein),
Aktifitas penelitian Bioinformatik
• prediction of gene expression(prediksi ekspresi gen)
• protein-protein interactions(interaksi protein-protein),
• genome-wide association studiesand (kajian hubungan genom secara luas)
• the modeling of evolution(modeling evolusi)
Annotation (Anotasi)
• Perhitungan dalam upaya men-
cari gen untuk menemukan
gen-gen pengkode protein, gen-
gen RNA, and sekuens fungsio-
nal lainnya didalam genom
Tidak semua sekuen nukleotid bersifat
fungsional = Junk DNA
Junk DNA (DNA sampah)
• Sebagian besar DNA di dalam genom tidak memiliki fungsi yang jelas.
• Bioinformatik membantu menjembatani antara genomik dan proteomik dalam penggunaan sekuens DNA untuk identifikasi protein.
Anotasi
• Proses penandaan gen-gen dan
karakteristik biologis lain pada level
sekuens DNA.
• Sistem software pertama: Dr. Owen
White (1995): The Institute for
Genomic Research
• Sekuens pertama: Haemophilus
influenzae
Computational evolutionary biology
• Kajian asal-usul dan keturunan spesies dan perubahannya sepanjang waktu.
• Menjejaki evolusi populasi organisme dengan mengukur perubahan DNA dibandingkan: physical taxonomy or observasi physiologis
• Perbandingan keseluruhan genomes, memungkinkan studi gene duplication, horizontal gene transfer, dan prediksi factor-faktor penting dalam spesiasi,
• Modeling prediksi populasi masa depan
• Pencarian dan pembagian informasi spesies dan organsime berbasis DNA.
Analisis Ekspresi Gen
• Level mRNA melalui berbagai teknik:
• microarrays,
• expressed cDNA sequence tag (EST)
sequencing,
• serial analysis of gene expression
(SAGE) tag sequencing,
• massively parallel signature sequencing
(MPSS), or
• Aplikasi multiplexin-situ hybridization
Regulasi Gen
• Regulasi gen adalah kejadian orkestra kompleks yang dimulai dengan sinyal ekstraselluler seperti hormon, nutrisi (ion-ion) yang mengarah kepada peningkatan atau penurunan aktifitas satu atau beberapa protein.
Regulasi Gen
• Promoter analysis: identifikasi dan studi motif sequence di sekitar daerag pengkode suatu gen
• Motif tersebut mempengaruhi ke arah mana proses transkripsi menjadi mRNA.
• Data ekspresi digunakan untuk memperkirakan regulasi gen
• Perbandingan dengan data microarraydapat memperkirakan gen-gen yang terlibat dalam proses regulasi gen.
Regulasi Gen
• Pada organisme sel tungga, dapat digunakan untuk mempelajari siklus sel,
• Berbagai kondisi stress (heat shock, starvation, etc.) dapat dipelajari gen-gen apa saja yang terlibat.
• Data Clustering algorithms dapat memperkirakan gen-gen yang bersifat co-expressi
• Dapat digunakan untuk memperlkiarkan regulatory elements.
Analysis of protein expression
• Protein microarrays (PM) dan high throughput (HT) mass spectrometry(HTMS) dapat memperkirakan protein-protein yang terdapat dalam sampel biologis.
• PM dan HTMS, problem identifikasi yang kompleks, statistik yang rumit, serta ketidaksempurnaan ikatan peptida protein.
Analisis Mutasi Kasus Kanker
• affected cells are rearranged in complex or even unpredictable ways.
• Massive sekuensing data are produced
• Kompleksitas analisis dan manajemen data
• oligonucleotide microarrays to identify chromosomal gains and losses (called comparative genomic hybridization), and single nucleotide polymorphism arrays to detect known point mutations
• Ratusan ribu sisi sepenjaang genome harus dianalisis, menghasilkan terabytes data per experiment.
Prediksi struktur protein
• Struktur primer protein (primary structure) dapat ditentukan dari sekuens asam amino.
• Struktur primer protein akan menentukan fungsi dari protein.
• Homologi bisa dipergunakan untuk memprediksi struktur protein yang belum diketahui, contoh:hemoglobin pada manusia dan hemoglobin in legumes (leghemoglobin) berfungsi dalam transportasi oksigen, keduanya memiliki struktur protein yang sama meskipun sekuens asam aminonya berbeda.
Comparative Genomics
• Korespondensi antara beberapa gen (analisis orthologus) pada organisme berbeda.
• Analisis divergensi dua genome atau lebih
• Level paling bawah point mutations
• Segmen kromosomal: duplication, lateral transfer, inversion, transposition, deletion and insertion
Software dalam Bioinformatik
• BLAST, algoritma untuk penentuan similaritas sekuens random dengan sekuens yang lain yang biasanya terdapat dalam database baik DNA ataupun protein.
• BLAST dapat digunakan untuk melakukan allignment sekuens.
• NCBI : National Center for Biotechnology Information.
Sequence alignment: penyusunan
sekuens-sekuens baik, DNA, RNA,
atau protein untuk mengidenti-
fikasi daerah-daerah yang sama
yang kemungkinan memiliki
hubungan fungsional, struktural
ataupun evolusi.
• Sekuens nucleotide atau amino
acid yang dijajarkan dalam
bentuk baris pada suatu
matriks.
• Gaps disisipkan diantara
residues sehingga karakter
yang identik ataupun sama
berada pada kolom yang sama.
Contoh sekuens allignment
DNA/Nukleotid
Asam amino: human zinc finger protein
Key: Single letters: amino acids.
• Red: small, hydrophobic, aromatic, not Y. Blue:
acidic.
• Magenta: basic.
• Green: hydroxyl, amine, amide, basic.
• Gray: others.
• "*": identical.
• ":": conserved substitutions (same colour group).
".": semi-conserved substitution (similar shapes).
Kode genetik (kodon), asam amino dan
lambang tiga serta satu hurufAla/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA,
CUG
Arg/R CGU, CGC, CGA, CGG,
AGA, AGG
Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU,
AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAA, UGA, UAG
Jenis allignment
• Global alignments: penjajaran
antara sekuens yang dimiliki
secara keseluruhan.
• Local alignments: identifikasi
daerah yang sama didalam
sekuens yang panjang yang
biasanya mengalami divergensi.
Global allignment
Lebih cocok digunakan untuk:
• Allignment dimana set query
memiliki tingkat kesamaan yang
tinggi
• Memiliki ukuran yang hampir
sama
• Mengunakan:Needleman-Wunsch
algorithm, berbasis dynamic
programming
Local alligment
• Lebih cocok untuk sekuens dimana
memiliki banyak ketidaksamaan,
• Ada daerah tertentu disepanjang
sekuens yang memiliki kesamaan
didalamnya
• Menggunakan Smith-Waterman
algorithm berbasis dynamic
programming
Global dan local allignment
• Jika sekuens yang dianalisis
memiliki tingkat kesamaan yang
tinggi maka tidak ada perbedaan
antara local allignment dan
global allignment.
Multiple sequence alignment
• Perluasan dari pairwise alignment yang memungkinkan analisis lebih dari dua sequences sekaligus.
• Digunakan untuk mengidentifikasi daerah konservatif dari kelompok sekuens yang diduga berkerabat.
• Mengidentifikasi informasi struktural dan mechanistic sisi active dari enzymes.
• Membantu menyusuna hubungan evolutionari dalam penyusunan pohon phylogenetic
Homology
• Kesamaan karakteristik dari
beberapa organisme dikarenakan
asal-usul yang sama.
• Dalam konteks genetika, homologi
mengacu kepada kesamaan sekuens
DNA
Orthologs
• Orthologs/ gen orthologous: gen-gen
pada spesies yang berbeda yang sama
karena berasal dari tetua yang sama
• Ortologus muncul karena ada
divergensi dalam konteks evolusi.
• Divergensi mengarah pada
pembentuka spesies baru
(spesiasi=speciation)
Paralogous
• Paralogous (paralog) homologi
antara dua sekuens gen yang
terbentuk karena peristiwa
duplikasi gen (gene duplication).
• Suatu gen dalam satu organisme
mengalami duplikasi dan
menempati posisi berbeda pada
genom sel yang sama, maka kedua
kedua gen tersebut bersifat paralog.
Gen-gen Paralog
Contoh-contoh gen paralog:
• Myoglobin and hemoglobin
• Empat kelas hemoglobin:
(hemoglobin A, hemoglobin A2,
hemoglobin B, dan hemoglobin F).
• Fungsi: transportasi oksigen,
hemoglobin F pada fetal memiliki
affiniti lebih kuat dibandingkan
kelas lainnya.
Ohnologous
• Ohnologous: gen-gen paralogous
yang berasal dari duplikasi genom
secara keseluruhan (whole-
genome duplication :WGD).
• Istilah ohnologus diberikan
sebagai penghargaan terhadap
Susumu Ohno oleh: Ken Wolfe
Xenologs
• Homologi yang dihasilkan dari
proses transfer gen horizontal
(mikroba) antara dua organisme.
• Xenologs dapat menyebabkan
fungsi kedua gen berbeda, jika
lingkungan organisme akseptor
sangat jauh berbeda.
Kromosom Homolog
• Kromosom Homologous : kromosom non identik yang dapat berpasangan/bersinapsis selama meiosis.
• Kecuali kromosom kelamin, kromosom homolog memiliki kesamaan sekuens yang sangat tinggi disepanjang kromosomnya.
• Mengandung gen-gen yang sama sekuensnya sehingga memungkinkan saat meiosis untuk berpasangan.
Gene Finding
• Kegiatan identifikasi secara
algorithmik terhadap sekuens DNA
(genomic DNA) yang diduga memiliki
fungsi secara biologis.
• Meliputi identifikasi: gen-gen
pengkode protein, dan elemen
fungsional lainnya seperti gen-gen
pengkode RNA (tRNA, rRNA) dan
daerah regulator.
Gene finding
• Penentuan fungsi suatu gen dan
produknya harus dibedakan
dengan penentuan sekuens-
sekuens fungsional.
• Fungsi suatu gen hanya dapat
ditentukan melalui eksperimen in-
Vivo seperti gene knockout atau
metode lainnya.
Beberapa pendekatan
• Pendekatan Ekstrinsik (evidence
based)
Target sekuens dibandingkan dengan
sekuens yang mRNA atau produk
proteinnya telah diketahui.
• Tingkat kesamaan yang tinggi dengan
mRNA atau produk protein indikasi
kuat bahwa sekuen target adalah gen
pengkode protein.
Beberapa pendekatan
• Dibutuhkan informasi sekuens
mRNA yang sangat besar (organisme
kompleks)
• Kelemahan pada organisme yang
kompleks, tidak semua gen
berekspresi pada setiap saat.
• Gen-gen yang hanya berekspresi
pada saat fetus tidak bisa dianalisis
secara bebas dengan alasan etika.
Pendekatan Ekstrinsik
• RefSeq database: mengandung
sekuens transkrip dan protein dari
berbagai species
• Ensembl database memetakan
berbagai data sekuens pada
manusia.
Pendekatan Ab initio
• Sekuens fungsional ditentukan
secara sistematis
• Penentuan terhadap komponen
sinyal sekuens (promoter) atau
Protein coding sekuens (ORF), serta
stop kodon
• Lebih mudah pada sekuens
prokaryot
Pendekatan Ab initio eukaryot lebih
kompleks
• Pertama: sekuens promoter dan
regulator lebih kompleks dan baru
sedikit difahami dibandingkan dengan
prokaryot sehingga sulit dikenali.
• Kedua, mekanisme splicing yang
disebabkan oleh adanya sekuens
exons, dan introns.
Gene finder untuk pro-
eukaryot
• Model untuk pro- eukaryot :
• Kompleks probabilistic models, (hidden
Markov models)
• GLIMMER, GeneMark : prokaryot
• GENSCAN and GENEID: eukaryot
• mSplicer, CONTRAST, atau mGene
• SLAM, SGP and Twinscan/N-SCAN:genome
comparison
• Projector, GeneWise and GeneMapper
A Adenosine W A T (Weak interaction)
C Cytosine B G T C (not A) (B comes after A)
G Guanine D G A T (not C) (D comes after C)
T Thymidine H A C T (not G) (H comes after G)
U Uracil VG C A (not T, not U) (V comes
after U)
R G A (puRine) N A G C T (aNy)
Y T C (pYrimidine) W A T (Weak interaction)
K G T (Ketone) X masked
M A C (aMino group) - gap of indeterminate length
S G C (Strong interaction)
Simbol Nukleotid
Motif sekuens
• Motif sekuens: pola suatu sekuen nukleotida atau asam amino yang dianggap memiliki fungsi biologis penting.
• Motif sekuens motif pada protein harus dibedakan dengan motif struktural yang dibentuk oleh penyusunan tiga dimensi asam amino.
Primer yang ideal :
1.Memiliki panjang sekitar 15-35 nukleotid
2.Memiliki titik didih yang relatif tinggi
3.Sekuens primer hanya hadir satu kali pada
templet DNA
4.Tidak berkomplementer dengan primer
pasangannya
5.Tidak membentuk struktur sekunder
dengan primer pasangannya
6.Memiliki proporsi GC dan AT yang
seimbang
7.Primer pasangannya memiliki titik didih
yang relatif sama
Dr. Jamsari, Prog. Studi Pemuliaan Tanaman Jurusan BDP-FPUA
Bioteknologi Tanaman
Tm = ((G+C) x 4°C) + ((A + T) x 2°C).
Suhu Annealing
CATAAGTCTGATACTTGCTG
Contoh:
suhu annealing sekitar 54-58°C
PCR
dimana:
jumlah basa C = 4, G = 4, A = 5, T = 7,
maka besarnya Tm adalah:
Tm = ((4+4)x4) + ((5+7)x2) = 32 + 24 = 56°C
http://www.ncbi.nlm.nih.gov/tools/primer-blast/
http://biotools.umassmed.edu/bioapps/primer3_www.cgi