vjezba 3-geneticki kod
TRANSCRIPT
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
14
Vježba 3: Genetički kod, čitanje ORF-a i translacija
Priprema za vježbu
1. Napravite vlastitu tablicu genetičkog koda i zalijepite na komadić kartona. Istu tu
tablicu možete zalijepiti u svesku, kako bi vam uvijek bila pri ruci.
2. Ponovite skraćenice za aminokiseline u one letter code i three letter code.
Ukupna genetička informacija, skup gena jednog organizma naziva se genom.
Cjelokupna genetička informacija sadržana je u molekuli DNK. Svaka funkcionalna
regija molekule DNK čini gen. Gen je tačno određeni slijed nukleotida na tačno
određenom mjestu (lokus) u molekuli DNK, koji daje funkcionalni produkt. Produkti
ekspresije gena mogu biti proteini, rRNK, tRNK, miRNK, snRNK i razne druge
molekule RNK. Dakle, produkti ekspresije gena, odnosno funkcionalni genski produkti
se tokom ekspresije mogu translatirati u protein (produkti ekspresije proteinskih gena) ili
se samo transkribiraju (geni za različite RNK se eksprimiraju samo traskripcijom).
Tablica 3.1: Tablica standardnog genetičkog koda (Kod 1)
Sekvenca gena koja se nalazi na DNK i RNK molekulama, sastoji se od tri
nukleotida i oni čine triplet baza koji nazivamo kodon. Svaki kodon kodira jednu
aminokiselinu.
Kako se kodon sastoji od po tri nukleotida, a postoje četiri različite baze, moguće
su 64 različite kombinacije 43 = 64. Na primjer, RNK slijed 5'- UUUGGGCCC -3', se
sastoji od kodona UUU, GGG i CCC, i svaki od tri kodona kodira po tri amino kiseline.
Tako da ova RNK sekvenca predstavlja sekvencu proteina, koji je dug tri aminokiseline.
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
15
Kod (franc. code – šifra, ključ, skup dogovorenih znakova tajne poruke). Pod
pojmom genetičkog koda podrazumjevamo niz pravila koja se odnose na način kodiranja
genetičke informacije i prijevoda (DNK ili RNK slijedu) u aminokiselinske sljedove.
Genetički kod pokazuje tri važne osobine: univerzalnost, degenerativnost i čitanje
bez preklapanja.
1. Univerzalnost podrazumijeva da je genetički kod isti za sve biološke vrste, odnosno da
pojedini kodoni kod svih bioloških vrsta odgovaraju istoj aminokiselini,
2. Degenerativnost genetičkog koda podrazumijeva da jednu aminokiselinu najčešće
određuje veći broj kodona. Kodoni koji određuju istu aminokiselinu često su vrlo slični i
najčešće se razlikuju samo na trećoj bazi kodona.
Tablica 3.2: Aminokiseline sa datim kodonima za odgovarajuću aminokiselinu.
Ala A GCU, GCC, GCA, GCG Leu L UUA, UUG, CUU, CUC, CUA, CUG
Arg R CGU, CGC, CGA, CGG, AGA, AGG Lys K AAA, AAG
Asn N AAU, AAC Met M AUG
Asp D GAU, GAC Phe F UUU, UUC
Cys C UGU, UGC Pro P CCU, CCC, CCA, CCG
Gln Q CAA, CAG Ser S UCU, UCC, UCA, UCG, AGU,AGC
Glu E GAA, GAG Thr T ACU, ACC, ACA, ACG
Gly G GGU, GGC, GGA, GGG Trp W UGG
His H CAU, CAC Tyr Y UAU, UAC
Ile I AUU, AUC, AUA Val V GUU, GUC, GUA, GUG
Start AUG, GUG Stop UAG, UGA, UAA
Na primjer kodoni GAA i GAG kodiraju glutamin. Aminokiselinu leucin kodiraju
kodoni CUU, CUC, CUA, CUG, te UUA, UUG. Prva četiri kodona, koji se razlikuju
samo na trećoj bazi kodona – čine jednu kodonsku obitelj kodona za leucin. Kodoni UUA
i UUG, razlikuju se od prve obitelji kodona za leucin, po tome što do promjene dolazi na
prvoj bazi kodona, te ova dva kodona čine drugu kodonsku obitelj kodona za leucin.
Samo dvije aminokiseline (u standardnom genetičkom kodu) imaju isključivo jedan
kodon, a to su metionin (AUG) i triptofan (UGG). Zahvaljujući postojanju više kodona za
jednu aminokiselinu, zamjena nukleotida u kodonu najčešće ne mora uzrokovati i
zamjenu aminokiseline u proteinu. Prednost ovakvog načina kodiranja je u tome što
spriječava negativan efekat mutacija na organizam.
3. Čitanje bez preklapanja znači da nukleotidi jednog kodona nikada ne pripadaju
istovremeno i susjednim kodonima. Genetički kod se smatrao univerzalnim, jednakim za
cjelokupni živi svijet, sve do 1979. godine kada je otkriveno da se genetički kod u
mitohondrijskim genima sisavaca razlikuje od standardnog u upotrebi kodona AUA,
UGA, AGA i AGG (Barrell et al., 1979). Kasnije je postojanje nestandardnog genetičkog
koda potvrđeno u sva tri carstva: Archaea, Bacteria i Eucaryota. Osim u genomima
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
16
staničnih organela, nestandarni genetički kod nađen je i u velikim genomima jezgre,
uključujući kvasac i Protozoe.
Slika 3.1: Tablica genetičkog koda uz prikaz adaptorske uloge molekula tRNK prilikom
translacije (prevođenja genetičke informacije sa mRNK u protein
Različite upotrebe kodona, u odnosu na standardni genetički kod (slika 3.1.), u
mitohondrijskim genima posjeduju: kralješnjaci (2), kvasac (3), plijesni, Protozoa,
Coelenterata, Mycoplasma/Spiroplasma (4), beskralješnjaci (5); Echinodermata (9);
Ascidia (13), Platyhelminthes (14); Chlorophyceae (16); Trematoda (21) Scenedesmus
obliquus (22); Thraustochytrium aureum (Labyrinthulida) (23). Varijacije genetičkog
koda uočene su u mitohondrijima svih organizama, osim u biljkama (Lukić-Bilela L,
2005).
Pojam ORF – otvoreni okvir čitanja
U molekularnoj genetici, open reading frame (ORF) predstavlja porciju genoma
koja sadrži slijed nukleotida koji potencijalno kodira protein. ORF je regija između start i
stop kodona, no to ne znači da on uvijek kodira za funkcionalni protein. Kada je jednom
gen sekvenciran (određen slijed nukleotida) i provjerena funkcionalnost njegovog
produkta, tada tom genu dajemo ime i on prestaje biti putativni gen za neki protein.
Možemo reći da gen uvijek podrazumijeva ORF koji je lociran između
inicijacijskog (start) i terminacijskog (stop) kodona, no ORF nije uvijek i gen. Otvoreni
okvir čitanja ne mora kodirati funkcionalni protein, mada dug ORF uvijek indicira da se
ipak radi o prisustvu gena, što je dalje potrebno provjeriti. U slučaju eukariotske DNK,
ORF je isprekidan jer se unutar njega nalaze introni. Teoretski, sekvencu DNK
NCBI (National Center for Biotechnology
Information) danas citira 17 različitih
upotreba kodona, uključujući i standardni
genetički kod. Njih 11 koristi se u
mitohondrijskim genima tačno određenih
grupa organizama, a označeni su brojevima
po kojima se prepoznaje o kojoj se grupi
organizama radi.
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
17
(dvolančlanu DNK) možemo čitati u 6 okvira čitanja, po 3 sa svake strane, u pravcu 5'-3'
i 3'-5'.
Naprimjer, u slijedu nukleotida 5'-UCUAAAAUGGGUGAC-3', vidimo 2 od 3
moguća ORF-a. Naime, ovaj slijed u pravcu 5'-3' možemo pokušati pročitati u 3 okvira
čitanja.
1. UCU AAA AUG GGU GAC
2. ..CUA AAA UGG GUG AC
3. ....UAA AAU GGG UGA C
No, treći (posljednji) okvir čitanja počinje sa stop kodonom, dakle nije ga moguće
čitati. Taj okvir ne možemo smatrati otvorenim za čitanje. U prvom okviru čitanja, pak
zapažamo start kodon AUG, pa je sasvim izvijesno da je to korektan okvir čitanja u
kojem čitamo ovaj slijed nukleotida, koji je mogući gen.
Slika 3.2: „Output“ pretraživanja mogućih ORF-ova u datoj sekvenci, u programskom
paketu StarORF
Danas postoje brojni i besplatno dostupni programski i software paketi u okviru
kojih je moguće pretraživati otvorene okvire čitanja u svih 6 okvira. Jedan od njih je
StarORF čiji je „output“ (rezultat pretraživanja) prikazan je slici 3.2. Slijed nukleotida
(sekvenca DNK) prikazana u gornjem dijelu prozora naziva se „input“. To je ono što
insertiramo u program i šaljemo na pretraživanje. Rezultat pretrage, bioinformatičkim
jezikom, nazivamo „output“.
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
18
TRANSLACIJA DNK
Uloga ribosoma u sintezi proteina
Ćelija E.coli sadrži oko 20 000 ribosoma, raspoređenih u citoplazmi. Prosječna
humana ćelija sadrži i mnogo više ribosoma; neki su slobodni u citoplazmi, a neki vezani
za spoljašnju površinu endoplazmatskog retikuluma. Prvobitno, na ribosome se gledalo
kao na pasivne učesnike u proteinskoj sintezi, strukturu na kojoj se dešava translacija.
Ovo stajalište se promjenilo tokom godina i danas se smatra da ribosomi igraju dvije
važne uloge u proteinskoj sintezi:
Ribosomi koordiniraju proteinsku sintezu pozicionirajući iRNK, aminoacil-tRNK
i odgovarajuće proteinske faktore u pravilne položaje u odnosu jedne na drugih.
Komponente ribosoma, uključujući rRNK, kataliziraju bar neke od hemijskih
reakcija koje se odvijaju tokom translacije.
Građa ribosoma
Svaki ribosom se sastoji od dvije podjedinice. Kod eukariota to su 60S i 40S, a kod
bakterija 50S i 30S. Veća podjedinica sadrži tri molekule rRNK kod eukariota (28S, 5.8S
i 5S), a samo dvije kod bakterija (23S i 5S). Mala podjedinica sadrži jednu molekulu
rRNK kod oba tipa organizama: 18S rRNK kod eukariota i 16S rRNK kod bakterija.
Translacija i sinteza proteina
Transportne RNK igraju centralnu ulogu u
translaciji. One predstavljaju akceptor molekule
i čine vezu između iRNK i polipeptida koji se
sintetiše.
Bakterije sadrže 30-45 različitih tRNK, dok
eukarioti imaju i do 50. Obzirom da je samo 20
aminokiselina određeno genetičkim kodom, to
znači da svi organizmi imaju bar nekoliko
izoformi tRNK, različitih tRNK specifičnih za
istu aminokiselinu.
Najmanje tRNK su samo 74 nukleotida duge,
dok su najveće rijetko duže od 90 nukleotida.
Obzirom da se radi o malim molekulama koje je
moguće pojedinačno purificirati, tRNK su bile
među prvim nukleinskim kiselinama koje su
sekvencirane. Analizom prve tRNK sekvence za
tRNKAla
za Saccharomyces cerevisiae, utvrđeno
je da molekula može zauzeti različite sekundarne
Akceptor
Antikodon krak
Antikodon
V petlja
TYC krak
D krak
Slika 3.3: Shema strukture molekule tRNK
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
19
strukture. Nakon što su sekvencirane još neke tRNK, postalo je jasno da sve tRNK
molekule mogu zauzeti jednu određenu strukturu – strukturu lista djeteline (Slika 3.3.),
koja ima slijedeće osobine:
Akceptor krak sastoji se od sedam parova baza između 5′ i 3′ kraja molekule.
Aminokiselina je vezana za krajnji 3' kraj tRNK, za adenozin invarijantne CCA
terminalne sekvence;
D krak, nazvan prema modifikovanom nukleozid dihidrouridinu, koji je uvijek
prisutan u ovoj strukturi.
Antikodon krak sadrži triplet nukleotida nazvanih antikodon koji se
komplementarno veže za iRNK tokom translacije.
V petlja sadrži 3–5 nukleotida kod tRNK klase I ili 13–21 nukleotida kod tRNK
klase II.
TYC krak, nazvan po sekvenci timidin-pseudouridin-citosina, koji je uvijek
prisutan.
INICIJACIJA TRANSLACIJE
Iako je struktura ribosoma slična kod bakterija i eukariota, postoje razlike u načinu na
koji se dešava translacija kod ovih organizama. Najvažnija od ovih razlika javlja se
tokom prve faze translacije, kada se ribosom veže za iRNK na poziciji prije inicijacijskog
kodona. Razlika u inicijalnoj fazi translacije sastoji se u tome da se kod bakterija
inicijacijski kompleks formira direktno na inicijacijskom kodonu, tački na kojoj počinje
sinteza proteina, dok eukarioti koriste indirektniji princip lociranja inicijalne tačke.
Naime, kod eukariota manja ribosomalna podjedinica se veže za 5' kraj iRNK i kliže niz
molekulu dok ne naiđe na inicijalni kodon.
ELONGACIJA KOD BAKTERIJA I EUKARIOTA
Vezivanje veće podjedinice rezultira formiranjem dvaju pozicija na koje se može
vezati aminoacil-tRNK. Prva, P ili peptidil pozicija, je već zauzeta inicijatorom
tRNKiMet
, koji nosi N-formilmetionin ili metionin, i vezan je za inicijalni kodon. Druga
pozicija, A ili aminoacil pozicija, pokriva drugi kodon u otvorenom okviru čitanja (open
reading frame – ORF).
A pozicija biva popunjena odgovarajućom aminoacil-tRNK, koju kod E.coli na
poziciju donosi elongacijski faktor EF-Tu. Ovaj faktor osigurava da samo tRNK koja
nosi odgovarajuću aminokiselinu može ući u ribosom. Specifične veze između tRNK,
iRNK i 16S rRNK sa A pozicijom osiguravaju da samo odgovarajuća tRNK bude
prihvaćena.
Kada aminoacil-tRNK stigne na A poziciju, formira se peptidna veza između dvije
aminokiseline. U ovu reakciju je uključen enzim peptidil transferaza, koji raskida vezu
između aminokiseline i inicijatora tRNKiMet
i potom formira peptidnu vezu između te
aminokiseline i one koja je vezana za drugu tRNK. Kod bakterija, aktivnost peptidil
transferaze počiva na 23S rRNK veće podjedinice i stoga predstavlja primjer ribozima.
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
20
Za ovu reakciju neophodna je energija, te zato zahtijeva hidrolizu GTP vezanog za EF-Tu
(Eef-1 kod eukariota). To dovodi do inaktivacije EF-Tu, koji biva izbačen iz ribosoma i
regeneriran djelovanjem EF-Ts. Ekvivalent EF-Ts kod eukariota još nije otkriven, i
moguće je da podjedinica eEF-1 ima sposobnost regeneracije.
U ovoj fazi translacije dipeptid koji korespondira sa prva dva kodona u otvorenom
okviru čitanja je vezan za tRNK na A poziciji. Idući korak je translokacija, tokom koje se
istovremeno dešavaju tri stvari:
Ribosom se kreće niz tri nukleotida, tako da idući kodon dolazi na A poziciju
Dipeptid-tRNK na A poziciji se pomjera na P poziciju
Deacilirana tRNK na P poziciji stiže na treću poziciju, E – izlaznu poziciju (exit
site), kod bakterija, ili, kod eukariota, jednostavno bude izbačena iz ribosoma.
Translokacija zahtijeva hidrolizu molekule GTP, sa EF-G kao medijatorom kod
bakterija i eEF-2 kod eukariota. Elektronskom mikroskopijom ribosoma u različitim
međufazama translokacije utvrđeno je da se dvije podjedinice unekoliko zarotiraju u
suprotnom smjeru, otvarajući prostor između njih i omogućujući ribosomu da klizi niz
iRNK (Frank and Agrawal, 2000). Translokacija za rezultat ima oslobađanje A pozicije,
što otvara mogućnost novoj aminoacil-tRNK da dođe na nju. Elongacijski ciklus se
potom ponavlja, i nastavlja dok se ne dosegne kraj otvorenog okvira čitanja.
TERMINACIJA TRANSLACIJE
Sinteza proteina se završava kada ribosom stigne do jednog od tri terminacijska
kodona. Na A poziciju tada dolazi protein otpuštajući faktor. Kod bakterija su prisutna tri
ovakva faktora: RF-1 koji prepoznaje terminacijske kodone 5'-UAA-3' i 5'-UAG-3'; RF-2
koji prepoznaje 5'-UAA-3' i 5'-UGA-3'; te RF-3 koji stimulira otpuštanje RF1 i RF2 sa
ribosoma nakon terminacije, u reakciji za koju je potrebna energija generirana hidrolizom
GTP. Eukarioti imaju samo dva otpuštajuća faktora: eRF-1, koji prepoznaje terminacijski
kodon, i eRF-3, koji moguće ima istu ulogu kao RF-3, iako to još nije dokazano (Kisselev
and Buckingham, 2000).
Protein otpuštajući faktori okončavaju translaciju, ali se čini da nisu odgovorni za
disocijaciju ribosomalnih podjedinica, barem ne kod bakterija. Tu ulogu ima protein –
ribosom reciklirajući faktor (RRF), koji kao i eRF-1 ima strukturu sličnu tRNK (Selmer
et al., 1999). Reakcija disocijacije zahtjeva energiju iz GTP, a također i uključivanje
inicijalnog faktora IF-3, kako bi se spriječilo da se ribosomske podjedinice ponovo
povežu. Ekvivalent RRF-a kod eukariota još nije otkriven, i to bi mogla biti jedna od
funkcija eRF-3. Odvojene ribosomske podjedinice ostaju u citoplazmi sve dok ne budu
ponovo upotrebljene u idućem ciklusu translacije.
Literatura:
Barrell, B.G., Bankier, A.T., & Drouin, J. (1979). A different genetic code in human
mitochondria. Nature, 282(5735), 189-94.
Brown, T.A. (2002). Genomes, 2nd
edition, BIOS Scientific Publishers Ltd.
Lukić Bilela L. i Kalamujić B. (2013) Vježba 3: Genetički kod, čitanje ORF-a i
translacija
21
Frank, J. & R.K. Agarwal. (2000). A ratchet-like inter-subunit reorganization of the
ribosome during translocation Nature 406, 318-322.
Kisselev, L.L. & R.H. Buckingham. (2000). Translational termination comes of age
Trends Biochem. Sci. 25, 561-566.
Lukić-Bilela, L. (2005). Primarna struktura i filogenetska analiza mitohondrijskih gena
morske spužve Suberites domuncula (Olivi, 1792). Doktorska disertacija. Institut
Ruđer Bošković, Zagreb.
Selmer, M., S. Al-Karadaghi, G. Hirokawa, A. Kaji & A. Liljas. (1999). Crystal structure
of Thermatoga maritima ribosome recycling factor: a tRNA mimic Science 286,
2349-2352.
Yokobori, S., Suzuku, T., & Watanabe, K. (2001). Genetic code variations in
mitochondria: tRNA as a major determinant of genetic code plasticity. Journal of
Molecular Evolution, 53(4-5), 314-326.
ZADACI:
1. Uočite postojanje različitih kodonskih obitelji za aminokiseline arginin, leucin, serin.
2. Pronađite na web stranici http://www.ncbi.nlm.nih.gov/taxonomy/utils/wprintgc.cgi
(the genetic code) različite načine upotrebe kodona i usporedite ih i uočite razlike.
3. Vježbajte čitanje genske sekvence u različitim genetičkim kodovima.
4. Riješite zadatak:
Ako promatrate navedeni slijed nukleotida 5'-UCUAAAGGUGAC-3' koliko vidite
mogućih otvorenih okvira čitanja u smjeru 5'-3' i navedite koji su to okviri.
5. Pročitajte navedeni slijed nukleotida u svih 6 okvira čitanja, koristeći tablicu
standardnog genetičkog koda (kod br. 1).
ATGGTAAGTGATATATTAGCAGGTTCAAAAATTCGTTGATGGGTTGGAATTC
6. Navedni slijed nukleotida sada pročitajte koristeći tablicu koda broj 4 (mold, protozoa,
coelenterata, mycoplasma/spiroplasma). Genetički kod broj 4 koji koriste grupe navedene
u zagradi, podrazumijeva jednu glavnu razliku u odnosu na standardni genetički kod: uga
nije stop kodon, nego se prevodi u aminokiselinu triptofan (w).
22
U vašim ćelijama troslovne DNK „riječi“ kodiraju za specifične aminokiseline koje izgrađuju proteine. U ovdje prikazanom kodu, svaka troslovna DNK „riječ“ kodira za jedno slovo abecede.
Koristeći dati kod dešifirajte pitanje ispod, te odgovorite na njega.
AAA = A AAC = B CCC = C CCA = Č CCG = Ć ACT = D GCG = DŽ GTG = Đ GTT = E GGC = F GGG = G ACG = H GAC = I GAT = J GTA = K GCC = L GAA = LJ CAC = M CAT = N CGG = O CTA = P CAG = R CCT = S TCC = Š TTT = T TGT = U TGC = V TAT = Z TTG = Ž
GTA CGG GAT AAA CGG CAG GGG AAA CAT GTT GCC AAA
CTA CAG GTT ACT CCT TTT AAA TGC GAA AAA
GTT CAT GTT CAG GGG GTT TTT CCT GTA GAC
CCC GTT CAT TTT AAA CAG CCT TTT AAA CAT GAC CCC GTT ?
Odgovor:
23
Preuzeto sa: http://www.revisionworld.co.uk/files/geneticcode2%20copy.jpg
Preuzeto sa: http://www.monde-solidaire.org/spip/IMG/jpg/UniversalGeneticCode.jpg