1
Varijacije u broju kopija
1. Novo pitanje genomike : Genom čoveka ili genomi ljudi?
Genomika je naučna oblast koja je nastala kao rezultat dostignuća molekularne
biologije i razvoja tehnika kojima je moguće odrediti redosled nukleotida u molekulima
nukleinskih kiselina. Naziv genomika nastao je dodavanjem sufiksa omika na reč gen. Sufiks
omika je grčkog porekla i znači sve, svako, potpuno, kompletno. Predmet istraživanja
genomike su genomi kako živećih tako i izumrlih vrsta.
Početak 21. veka obeležen je završetkom najvećeg i najskupljeg naučnog projekta iz
oblasti molekularne biologije, dešifrovanje sekvence genoma čoveka. Internacionalni
konzorcijum „Genom čoveka“ rezultate svoga rada objavljuje 15. februara 2001. godine u
časopisu „Nature“. Samo dan kasnije tim naučnika kompanije Celera Genomics objavljuje
svoje rezultate dešifrovanja genoma čoveka u časopisu „Science“. Tom prilikom data je i
preliminarna procena da genomi različitih individua poseduju 99,9% identičnu sekvencu.
Aprila 2003. godine dobijena je kompletna sekvenca genoma čoveka, dok je broj gena
procenjen na oko 30000 u oktobru 2004. godine. Od tada, svake godine svedoci smo nove
revizije broja gena čoveka. Prema skorašnjim podacima naš genom poseduje manje od
20000 gena koji kodiraju za proteine. Rezultati projekta ENCODE (eng. Encyclopedia of
DNA Elements) pokazuju da genom čoveka poseduje više gena koji kodiraju regulatorne
molekule RNK nego gena koji kodiraju proteine (Tabela 1).
Tabela 1. Inventar genoma čoveka
Vrste gena Broj gena
Geni koji kodiraju proteine 19797
Geni koji kodiraju duge nekodirajuće RNK 15931
Geni koji kodiraju male nekodirajuće RNK 9882
Psudogeni 14477
Ukupan broj gena 60498
Do početka 2016. godine kompletno su dešifrovani genomi preko 8000 vrsta, dok su za
preko 33000 vrsta objavljeni preliminarni draftovi genoma. U toku je i sekvenciranje preko
35000 genoma. Na osnovu dešifrovanja genoma razlizičitih vrsta razvila se i nova naučna
disciplina komparativna genomika. Osnovni cilj ove naučne discipline je upoređivanje
genoma različitih vrsta u cilju identifikacija njihovih sličnosti i razlika, naročito na nivou gena i
drugih funkcionalnih elemenata genoma, kao što su promotori i regulatorni elemenati. Na
osnovu rezultata ovih istraživanja smatra se da će komparativna genomika pomoći u
razumevanju funkcija i evolucije genoma.
Jedan od glavnih ciljeva genomike je i istraživanje genoma čoveka, njegove strukture
i funkcije. Zahvaljujući tehnološkom napretku u poslednjih deset godina sve je veći broj
laboratorija koje su u mogućnosti da vrše brzo i relativno jeftino sekvenciranje kompletnih
2
genoma individua, kao i da vrše upoređivanja iščitanih genoma u cilju identifikacije sličnosti i
razlika. Poređenjem sekvenci genoma različitih individua, pokazano je da postoje
kvantitativne strukturne razlike u genomima ljudi koje se danas nazivaju varijacije u broju
kopija (eng. copy number variation, CNV). To su segmenti molekula DNK veličine od 50bp
do 1Mb (ili veći) koji se u jednom genomu pojavljuje u različitom broju kopija u odnosu na
referentni genom. Varijacije u broju kopija su kvantitativne strukturne varijante genoma.
Pored kvantitativnih, razlikuju se i pozicione strukturne varijante (translokacije) i orijentacione
strukturne varijante (inverzije).
Kombinacijom genskog čipa i komparativne genomske hibridizacije razvijena je nova
molekularno-biološka metoda koja se naziva komparativna genomska hibridizacija
bazirana na genskom čipu (aCGH) (slika 1). Komparativna genomska hibridizacija je
molekularno-biološka metoda za ispitivanje duplikacija i delecija velikih hromozomskih
regiona, i numeričkih hromozomskih aberacija. Korišćenjem aCGH moguće je vršiti
simulatno upoređivanje genoma dve individue. Razvoj ove metode omogućen je
konstruisanjem genskog čipa na kome je „istačkan“ genom jedne osobe predstavljen u vidu
oligonukleotida. Zbog prirode istačkanih proba ovako „istačkan“ genski čip naziva se genski
čip reprezentativnih oligonukleotida (eng. Representational Oligonucleotide Microarray), a
sama analiza poznata je po svom engleskom akronimu ROMA (eng. Representational
Oligonucleotide Microarray Analysis). Rezolucija prvih oligonukleotidnih genskih čipova koji
su se koristili tokom razvoja metode aCGH iznosila je 30kb.
Slika 1. Komparativna genomska hibridizacija bazirana na genskom čipu (aCGH). Ova metoda bazira se na simultanoj hibridizaciji dve genomske DNK (izolovane iz uzoraka poreklom od dve osobe) na genskom čipu na čijoj podlozi se nalazi „istačkan“ genom treće osobe.
3
U analizi inidividualnih razlika između genoma ljudi, pored aCGH, svoju primenu imaju i
strategije nove generacije sekvenciranja. Svaki sekvenciran genom može biti predmet
analize CNV ako se sekvenca tog genoma uporedi sa sekvencom nekog prethodno očitanog
genoma korišćenjem odgovarajućih bioinformatičkih algoritama. Danas, postoji najmanje 12
različitih metodoloških platofirmi za detekciju i analizu razlika između genoma različitih
individua. One se međusobno razlikuju po korišćenim metodama za identifikaciju razlika u
genomima ljudi (različite modifikacije aCGH ili različite strategije nove generacije
sekvenciranja) i po matematičkim algoritimima za selekciju i analizu dobijenih rezultata.
Zajednička osobina prethodno navedenih platformi je neophodnost da se identifikovane
razlike u genomima analiziranih individua potvrde korišćenjem neke od konvencionalnih
metoda molekularne biologije kao što su: fluorescentna in situ hibridizacija (FISH); lančana
reakcija polimerizacije u realnom vremenu (eng. real-time PCR), sekvenciranja definisane
sekvence molekula DNK ili multipleks amplifikacija ligiranih proba (metoda MLPA).
Multipleks amplifikacija ligiranih proba (eng. Multiplex Ligation-dependent Probe
Amplification, MLPA) je metoda koja omogućava brzo detektovanje promena u broju kopija
(delecija ili duplikacija). Najznačajnija odlika MLPA je što se ne umnožavaju ciljne sekvence
DNK, već probe koje hibridizuju s njima. Svaka MLPA proba sastoji se od dva
oligonukleotida, koja hibridizuju sa susednim ciljnim sekvencama na takvom rastojanju da
između njih može da se odigra proces ligacije (slika 2).
Slika 2. Multipleks amplifikacija ligiranih proba (MLPA). Metoda podrazumeva denaturaciju DNK (nije prikazana na slici), hibridizaciju MLPA proba sa ciljnima sekvencama, amplifikaciju ligiranih proba PCR-om. Umnoženi fragmenti se identifikuju i kvantifikuju fragment analizom.
Jedan oligonukleotid svake MLPA probe na 3’ kraju sadrži sekvencu komplementarnu
specifičnoj ciljnoj sekvenci, dok na 5’ kraju sadrži sekvencu koja je zajednička za sve MLPA
probe i komplementaran je fluorescentno obeleženom PCR prajmeru. Drugi oligonukleotid
svake MLPA probe na 5’ kraju poseduje sekvencu komplementarnu specifičnoj ciljnoj
sekvenci, na 3’ kraju sadrži sekvencu zajedničku za sve MLPA probe koja je
komplementarna neobeleženom prajmeru. Između ova dva kraja nalazi se insert ili “stuffer”
Hibridizacija Ligacija PCR
MLPA probe
4
sekvenca različite dužine. Ligacijom oligonukleotida MLPA probe (koji su hibridizovali sa
susednim ciljnim sekvencama) formiraju se uspešno ligirane probe koje imaju identične
sekvence na 5’ i 3’ krajevima. Zahvaljujući ovoj njihovoj osobini omogućena je istovremena
amplifikacija i do 50 različitih MLPA proba korišćenjem samo jednog para prajmera. Kao
rezultat procesa amplifikacije ligiranih MLPA proba, nastaju PCR produkti jedinstvene
dužine, odnosno kombinacija jedinstvenih, PCR-om umnoženih fragmenata čiji je opseg
dužina od nekoliko desetina do nekoliko stotina bp. Umnoženi fragmenti se analiziraju
fragment analizom, metodom za razdvajanje fragmenata molekula DNK na osnovu njihovih
dužina sa senzitivnošću od 1bp. Primenom specifičnog softvera za obradu podataka utvrđuje
se broj kopija (delecija ili duplikacija) analiziranih segmenata molekula DNK.
U prošloj deceniji, naučnici su koristili različite nazive za identifikovane kvantitativne
strukturne razlike u genomima ljudi. Jonathan Sebat ih je nazvao polimorfizmi u broju kopija
(eng. copy number polymorphism, CNP), dok ih je Anthony John Lafrate nazvao velika skala
varijacija u broju kopija (eng. large-scale copy-number variation, LCV). Eray Tuzun je
identifikovane razlike nazvao ISV (eng. intermediate – sized variant, ISV). Svi ovi pojmovi
danas su objedinjeni pojom CNV. Najznačajniji eksperimenti u periodu otkrića i identifikacije
varijacija u broju kopija u genomu čoveka nalaze se u tabeli 2.
Tabela 2. Eksperimenti kojima je otkriveno postojanje varijacija u broju kopija
Godina Naučnici Otkrića
2003. Wigler i Lucito Otkriće tehnike ROMA (genski čip reprezentativnih
oligonukleotida)
2004. Iafrate i saradnici 255 duplikacija i delecija između genoma 55 nesrodnih
individua
2004. Sebat i saradnici 221 razlika između genoma 20 nesrodnih individua
2005. Tuzin i saradnici 241 razlika i 56 inverzija između genoma datog od strane
internacionalnog konzorcijuma „Genom čoveka“ (HGP) i
genoma anonimnog muškarca
2005. Conrad i saradnici Upoređivanjem dva genoma identifikovali 586 delecionih
varijanti veličine od 300bp do 1,2Mb, pri čemu su 92 gena
bilo kompletno deletirana dok su 109 gena bila delimično
deletirana
2006. Hinds i saradnici Identifikovali 215 potencijalnih delecionih varijanti veličine
od 70bp do 10kb kod 24 nesrodnih individua
2006. Redon i saradnici Identifikovali 1,447 CNVs koje zauzimaju veličinu od
360Mb (12% genoma) i sadrže hiljade gena (3000),
lokuse povezane sa bolestima čoveka, funkcionalne
elemente i segmetne duplikacije tokom analize genoma
270 individua iz 4 evropske populacije
2007. Lipson i saradnici Optimizacija metode aCGH i unapređenje matematičkog
algoritma za analizu dobijenih rezultata
Prvobitno korišćeni termin polimorfizam zamenjen je terminom varijanta jer se
polimorfizam definiše kao genetička varijanta sa učestalošću ređeg alela ≥ 1%. Dosadašnja
5
istraživanja pokazuju da su određene CNV u opštoj populaciji prisutne sa frekvencom
manjom od 1% te se zbog toga ne ubrajaju u polimorfizame sekvenci molekula DNK. Upravo
zbog male učestalosti pojedinih CNV, i pored razlika u genomima pojedinačnih individua koje
mogu da obuhvataju i 15% ukupne dužine genoma, još uvek se na genome različitih ljudi
gleda kao na jedinstven genom čoveka.
Drugim rečima, ove razlike ne daju osnovu da se govori o genomima ljudi umesto o
„jedinstvenom“ genomu čoveka. Na taj način osnažuju se etički, moralni i socijalni principi na
kojima se baziraju savremena istraživanja genoma čoveka i obesmišljena svaka nenaučna
namera konstruisanja tzv. „novih naučnih činjenica“ koje bi opravdavali neku novu
eugenetiku.
2. Opšte odlike varijacija u broju kopija
Po svojoj prirodi, CNV mogu biti duplikacije, delecije ili insercije sekvence molekula
DNK, i kompleksniji genetički rearanžmani koji obuhvataju veći broj hromozoma (kompleksne
CNV).
Varijacije u broju kopija po tipu duplikacija dele se na tandemske i multialelske.
Tandemske duplikacije podrazumevaju duplikacije određenog segmenta molekula DNK koji
se u svim analiziranim genomima dupliciraju na isti način, dok multialelske duplikacije
podrazumevaju duplikacije čiji se broj dupliciranih segmenata molekula DNK razlikuje između
analiziranih genoma (slika 3). Kompleksna CNV podrazumeva segment molekula DNK koji
u jednom genomu može biti dupliciran a u drugom deletiran. Sve, do sada otkrivene, CNV
mogu se naći u katalogu genetičkih varijanti genoma čoveka (eng. Database of Genomic
Variants, DGV) na internet strani http://projects.tcag.ca/variation.
Slika 3. Tipovi varijacija u broju kopija (CNV). Varijacija u broju kopija je segment molekula DNK koji u jednom genomu u odnosu na drugi genom može biti a. deletiran, b. tandemski dupliciran, c. insertovan, d. različiti broj puta dupliciran (multialelska duplikacija) ili e. može biti kompleksno izmenjen u smislu duplikacija i delecija (kompleksna CNV).
U genomu čoveka detektovano je i prisustvo triplikata. Po svojoj strukturi razlikuju se
dva tipa triplikata. Tipu I pripadaju segmenti molekula DNK koji predstavljaju tandemski
6
ponovljene triplikate, a tipu II triplikati koji su međusobno invertni i razdvojeni segmentima
molekula DNK koji su duplicirani (slika 4).
Slika 4. Triplikati kao varijacije u broju kopija. a. Triplikati tipa I predstavljaju tandemski ponovljene (po principu glava-rep) tri kopije određenog segmenta molekula DNK; b. Triplikati tipa II su triplikati koji su međusobno invertni i razvojeni segmentima molekula DNK koji su duplicirani.
CNV po tipu duplikacija treba razlikovati od mikrosatelita i minisatelita. Istovremeno,
CNV po tipu delecija treba razlikovati od mikro-delecija veličine od preko 1 Mb koje se
ubrajaju u hromozomske aberacije. Takođe, u CNV po tipu insercija ne ubrajaju se insercije
nastale kao posledica aktivnosti transpozona. Poslednjih godina, pojedini autori insercije i ne
ubrajaju u CNV.
Preliminarna istraživanja pokazuju da se preko 99% CNV nasleđuju, dok tokom života
jedne individue de novo nastaje 1% CNV. Takođe, prema dosadašnjim analizama genom
jedne individue poseduje najmanje 12 CNV u odnosu na referentni genom čoveka. U
istraživanjima distribucije CNV u genomima ljudi kao referentni genom uzima se genom
iščitan tokom projekta „Genom čoveka“.
CNV u protein kodirajućim delovima genoma najčešće obuhvataju gene za proteine
uključene u puteve prenosa signala u ćelijama imunskog sistema, međućelijskoj komunikaciji
i interakciji sa spoljašnom sredinom (čulo mirisa npr.). Takođe, geni za proteine uključene u
mehanizme transpozicije prisutni su u različitom broju kopija kao posledica CNV.
Duplikacija gena ne znači obavezno i povećan nivo ekspresije proteinskog produkta.
Na ekspresiju dupliciranih gena utiče pozicioni efekat, kao i da li varijacija u broju kopija
obuhvata regulatorne elemente gena. U slučajevima kada CNV po tipu duplikacije obuhvata i
regulatorni region, ekspresija gena može biti povećana (slika 5a). Međutim, duplikacije koje
ne obuhvataju regulatorne elemente (slika 5b) ili multialelske duplikacije (slika 5c) usled
pozicionog efekta, ne moraju biti povezane sa povećanim nivom ekspresije dupliciranog
gena. Na kraju, duplikacija može dovesti do promena u strukturi hromatinske petlje koja
ograničava region molekula DNK u kojima regulatorni elementi ostvaruju svoj efekat na
ekspresiju gena. U takvim okolnostima, ekspresija dupliciranog gena može biti značajno
smanjena ili potpuno blokirana (slika 5d).
7
Slika 5. Efekat CNV na eksresiju gena. a. CNV po tipu duplikacije može uzrokovati povećan nivo ekspresije gena ukoliko duplikacija obuhvata i regulatorni region datog gena; b. U slučajevima kada CNV ne obuhvata regulatorni region, ekspresija gena može biti samo neznatno uvećana i pored toga što je gen prisutan u dve kopije; c. Kada je gen dupliciran kao posledica kompleksne CNV, jedna kopija gena (locirana na drugom hromozomu) može biti potpuno utišana usled pozicionog efekta, d. Smanjen nivo ekspresije dupliciranog gena može biti posledica promene u strukturi hromatinske petlje koja nastaje kao posledica CNV i koja ograničava domen dejstva okolnih regulatornih regiona.
Međutim, najveće iznenađenje bilo je otkriće kompletno deletiranih gena u genomima
pojedinih individua bez efekata na normalno funkcionisanje organizma, odnosno bez
povezanosti takvih delecija sa patofiziološkim mehanizma razvoja bolesti. Procenjeno je da
oko 3000 gena čoveka mogu biti meta delimične ili kompletne delecije. Do danas je u
genomu čoveka identifikovano preko 100 protein kodirajućih gena koji su kompletno dilatirani
kao posledica postojanja CNV. Jedino objašnjenje za prisustvo delecija gena bez efekta na
funkcionisanje ćelija je da ćelije imaju sposobnost uključivanja kompenzatornih mehanizama
ili aktiviranja alternativnih metaboličkih puteva kojima imaju mogućnost anuliranja nedostatka
pojedinačnog gena.
Pored genoma čoveka, CNV otkrivene su i u genomima drugih vrsta kao što su
šimpanze (2006. godine), laboratorijski miševi (2007. godine), pernate životinje (2008.
godine), rezuzus makaki (2008. godine), psi (2009. godine), krave (2010. godine). Pored
genoma životinja, CNV detektovane su i u genomima biljaka kao što je Arabidopsis thaliana
(2008. godine) ili kukuruz (2009. godine). Varijacije u broju kopija detektovane su i kod
Drosophila (2007. godine), pivskog kvasca (2008. godine) i Caenorhabditis elegans (2010.
godine).
Od ukupno 331 detektovane CNV u genomu šimpaze, njih 74 obuhvata iste regione
genoma kao i kod čoveka. Uočeni obrazac distribucije CNV u genomima šimpanze i čoveka
podržava hipotezu da je dupliciranje gena bio jedan od mehanizama povećanja broja gena u
genomima tokom evolucije.
8
3. Molekularni mehanizmi nastanaka varijacija u broju kopija
Do danas nije poznat tačan molekularni mehanizam nastanka CNV (slika 6). Moguće
je da CNV nastaju kao posledica određenih replikacionih i rekombinacionih procesa:
a) nealelske homologne rekombinacije
b) nehomolognog (prostog) spajanja krajeva (NHEJ) kao mehanizma reparacije
dvolančanih prekida
c) mehanizma FoSTeS tokom reparacije prekida u molekulu DNK
d) transpozicije L1 elemenata.
Slika 6. Molekularni mehanizmi nastanka CNV. a. nealelska homologna rekombinacija, b. nehomologno spajanje krajeva, c. reparacijom prekida u molekulu DNK mehanizmom FoSTeS, d. tokom transpozicije L1 elemenata.
Nealelska homologna rekombinacija na tri načina može dovesti do duplikacija ili
delecija segmenta molekula DNK. Duplikacije i delecije mogu biti posledica kako
interhromozomskog (slika 7a), tako i intrahromozomskog (slika 7b) krosingovera. Rezultat
nealelske homologne rekombinacije koja se odvija u okviru iste hromatide može biti delecija
određenog segmenta molekula DNK (slika 7c). Kao posledica odvijanja nealelske homologne
rekombinacije između sestrinskih hromatida formira se izohromozom koji sadrži segment
molekula DNK koji je invertovan (slika 7d).
Dvolančani prekidi u molekulu DNK čoveka najčešće se repariraju nehomologim
spajanjem krajeva. Ovaj mehanizam može biti uzrok delecije određenog segmenta molekula
DNK (slika 6b). Transpozicija retrotranspozona može generisati duplikacije u genomu čoveka
koje se zbog načina nastanka nazivaju i retro CNV (slika 6d).
9
Slika 7. Nealelska homologna rekombinacija. Kao rezultat nealelske homologne rekombinacije može doći do delecije ili duplikacije segmenta molekula DNK koji se rekombinuje. a. Nealelska homologna rekombinacija između dva hromozoma za posledicu može imati deleciju ili duplikaciju segmenta molekula DNK; b. Genetički rearanžmani po tipu delecije ili duplikacije rezultat su i nealelske homologne rekombinacije koja se odigrava unutar jednog hromozoma; c. Ukoliko se ova vrsta rekombinacije odigrava u okviru jedne hromatide, rezultat je delecija segmenta molekula DNK koji se rekombinuje; d) Ako se nealaleska homologna rekombinacija odigrava između dve sestrinske hromatide rezultat može biti genetički rearanžman po tipu inverzije (izohromozom).
Kompleksne CNV verovatno nastaju kao posledica reparacije jednolančanih prekida
u molekulu DNK tokom replikacije mehanizmom koji je poznat po svojoj skraćenici
mehanizam FoSTeS (eng. fork stalling and template switching, FoSTeS) (slika 6c).
Mehanizam FoSTeS aktivira se zaustavljanjem replikacione viljuške na mestu jednolančanog
prekida u molekulu DNK. Zbog zaustavljanja i kolapsa replikacione viljuške zaostajući lanac
se razdvaja od lanca koji je bio matrica za njegovu sintezu. Zaostajući lanac, na osnovu
mikrohomologije, nastavlja replikaciju korišćenjem druge replikacione viljuške koja se nalazi
u blizini one koja je zaustavljena na mestu jednolančanog prekida. U zavisnosti da li se nova
replikaciona viljuška nalazi uzvodno ili nizvodno od mesta jednolančanog prekida, nastavak
replikacije dovodi do delecije ili duplikacije određenog segmenta molekula DNK. Nastali
duplicirani segmenti mogu biti direktno ponovljeni ili invertovani.
4. Varijacije u broju kopija i bolesti čoveka
Neposredno nakon otkrića varijacija u broju kopija počela su istraživanja o mogućoj
ulozi CNV u patogenezi bolesti čoveka. Dosadašnja istraživanja pokazala su snažnu
asocijaciju pojedinih CNV koje obuhvataju protein kodirajuće gene sa razvojem psihijatrijskih
bolesti (uključujući i autizam), gojaznosti, psorijaze (autoimunska bolest kože), šećerne
bolesti, zapaljenskih bolesti creva, itd. Poslednjih godina istražuje se moguća uloga CNV u
procesima neoplastične transformacije koji su odogovorni za razvoj karicinoma debelog
creva, pluća i prostate.
Za neke bolesti čoveka molekularno-biološkim analizama pokazano je da su jedini do
sada utvrđeni genetički uzročnici razvoja bolesti CNV. Takve bolesti se bez obzira na kliničku
sliku ili organ koji pogađaju jednim imenom nazivaju oboljenja broja kopija (eng. copy-
number disorder). Određene kongentalne bolesti srca ili bubrega su neke od njih.
10
Međutim, CNV koje obuhvataju protein kodirajuće gene mogu imati i pozitivan efekat po
individue koji je poseduju. Primer su infektivne bolesti, kao što su infekcija HIV-a ili malarija.
Naime, upoređivanjem distribucije CNV u 13 gena kod zdrave dece i njihovih vršnjaka
zaraženih HIV-om u populaciji Brazila pokazana je pozitivna korelacija između broja kopija
gena DEFB104 i rezistentnosti na infekciju ovim virusom.
U okviru farmakogenomike danas se intezivno istražuje uloga CNV u individualnim
odgovorima na primenjenu terapiju za lečenje brojnih bolesti čoveka.
Kada je genom čoveka u pitanju, u toku je veliki naučni projekat koji za cilj ima
identifikaciju varijacija u broju kopija (eng. Copy Number Variation Project) u genomima
269 nasumično izabranih individua iz svih krajeva sveta (Amerike, Evrope, Kine, Japana,
Nigerije, itd,). Cilj ovog projekta je i otkriće uloge CNV u fenomenima odgovornim za
ekspresiju genoma. Kao jedno od ključnih pitanja budućih istraživanja izdvaja se pitanje
značaja CNV za evoluciju genoma čoveka. Dosadašnja istraživanja ukazuju da CNV po tipu
duplikacija koje obuhvataju protein kodirajuće gene u genomu čoveka imaju adaptivini značaj
preko efekta povećanja doze gena.
11
Ključni koncepti
U okviru genomike, razvojem metode komparativne genomske hibridizacije bazirane
na genskom čipu (aCGH) počela je analiza individualnih razlika u genomima ljudi i
ustanovljeno je da se zbog varijacija u broju kopija genomi ljudi međusobno razlikuju
preko 12%.
Varijacije u broju kopija (CNV) su segmenti molekula DNK veličine od 50bp do 1Mb ili
veći koji se u jednom genomu pojavljuje u različitom broju kopija u odnosu na
referentni genom. Po svojoj prirodi, CNV mogu biti duplikacije, delecije ili insercije
sekvence molekula DNK, ili kompleksniji genetički rearanžmani koji obuhvataju veći
broj hromozoma (kompleksne CNV). U CNV ubrajaju se i triplikati koji se po svojoj
prirodi dele u triplikate tipa I i tipa II. Varijacije u broju kopija su kvantitativne
strukturne varijante genoma.
Dosadašnja istraživanja pokazuju da se određene CNV u opštoj populaciji registruju
sa frekvencom manjom od 1%, zbog čega se ne ubrajaju u polimorfizam sekvenci
molekula DNK. Upravo zbog toga, i pored razlika u genomima pojedinačnih individua
koje mogu da obuhvataju i 15% ukupne dužine genoma a nastaju kao posledica
CNV, još uvek se na genome ljudi gleda kao na jedinstven genom.
U slučaju da CNV po tipu duplikacija obuhvataju gene, ekspresija takvih gena zavisi
od toga da li je duplikacija tandemska ili multialelska i da li duplikacija obuhvata i
regulatorne regione dupliciranog gena.
CNV otkrivene su i u genomima šimpanza, laboratorijskih miševa, kokošaka, rezuzus
majmuna, pasa, krava, Arabidopsis thaliana, kukuruza, pivskog kvasca, Drosophila i
Caenorhabditis elegans.
Mogući molekularni mehanizmi nastanka CNV su: nealelska homologna
rekombinacije, nehomologno spajanje krajeva tokom reparacije dvolančanih prekida,
reparacija prekida u molekulu DNK mehanizmom FoSTeS ili transpozicija L1
elemenata.
Pojedine CNV koje obuhvataju protein kodirajuće gene asocirane su sa razvojem
psihijatrijskih bolesti, autizma, gojaznosti, psorijaze (autoimunska bolest kože),
šećerne bolesti, zapaljenskih bolesti creva, itd. Poslednjih godina istražuje se i uloga
CNV u procesima neoplastične transformacije koji su odogovorni za razvoj
karicinoma kolona, pluća i prostate.
U toku je veliki naučni projekat koji za cilj ima identifikaciju svih varijacija u broju
kopija u genomu čoveka (eng. Copy Number Variation Project). Ciljevi ovog projekta
su i ispitivanje uloge CNV u procesima odgovornim za ekspresiju genoma, kao i
njihovog značaja za evoluciju genoma čoveka.
12
Pitanja
1. Šta su varijacije u broju kopija (CNV)?
2. Zašto se varijacije u broju kopija ne ubarajaju u polimorfizme sekvence molekula
DNK?
3. Koje vrste duplikacija se ubrajaju u CNV?
4. Šta je ROMA tehnika, a šta metoda aCGH?
5. Koje se molekularno-biološke metode koriste za proveru identifikovanih CNV?
6. Koji su molekularno-biološki mehanizmi odgovorni za nastanak CNV?
7. Kakve efekte CNV mogu imati na ekspresiju gena?
8. Koji je značaj CNV u istraživanjima molekularne osnove bolesti čoveka?
9. Pored genoma čoveka, kod kojih vrsta je detektovana pojava CNV?
10. Koji su ciljevi Projekta „Varijacije u broju kopija“?
13
Literatura
1. Carter NP. Methods and strategies for analyzing copy number variation using DNA
microarrays. Nat Genet. 2007; 39(7 Suppl):S16-21.
2. Conrad DF, Pinto D, Redon R, Feuk L, Gokcumen O, Zhang Y, Aerts J, Andrews TD,
Barnes C, Campbell P, Fitzgerald T, Hu M, Ihm CH, Kristiansson K, Macarthur DG,
Macdonald JR, Onyiah I, Pang AW, Robson S, Stirrups K, Valsesia A, Walter K, Wei
J; Wellcome Trust Case Control Consortium, Tyler-Smith C, Carter NP, Lee C,
Scherer SW, Hurles ME. Origins and functional impact of copy number variation in
the human genome. Nature. 2010;464(7289):704-12.
3. He Y, Hoskins JM, McLeod HL. Copy number variants in pharmacogenetic genes.
Trends Mol Med. 2011;17(5):244-51.
4. Iafrate AJ, Feuk L, Rivera MN, Listewnik ML, Donahoe PK, Qi Y, Scherer SW, Lee C.
Detection of large-scale variation in the human genome. Nat Genet. 2004; 36(9):949-
51.
5. Lee C, Scherer SW. The clinical context of copy number variation in the human
genome. Expert Rev Mol Med. 2010;12:e8.
6. Li W, Olivier M. Current analysis platforms and methods for detecting copy number
variation. Physiol Genomics. 2013;45(1):1-16.
7. Perry GH, Tchinda J, McGrath SD, Zhang J, Picker SR, Cáceres AM, Iafrate AJ,
Tyler-Smith C, Scherer SW, Eichler EE, Stone AC, Lee C. Hotspots for copy number
variation in chimpanzees and humans. Proc Natl Acad Sci U S A. 2006;
103(21):8006-11.
8. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, Fiegler H, Shapero
MH, Carson AR, Chen W, Cho EK, Dallaire S, Freeman JL, González JR, Gratacòs
M, Huang J, Kalaitzopoulos D, Komura D, MacDonald JR, Marshall CR, Mei R,
Montgomery L, Nishimura K, Okamura K, Shen F, Somerville MJ, Tchinda J, Valsesia
A, Woodwark C, Yang F, Zhang J, Zerjal T, Zhang J, Armengol L, Conrad DF, Estivill
X, Tyler-Smith C, Carter NP, Aburatani H, Lee C, Jones KW, Scherer SW, Hurles ME.
Global variation in copy number in the human genome. Nature. 2006; 444(7118):444-
54.
9. Sebat J, Lakshmi B, Troge J, Alexander J, Young J, Lundin P, Månér S, Massa H,
Walker M, Chi M, Navin N, Lucito R, Healy J, Hicks J, Ye K, Reiner A, Gilliam TC,
Trask B, Patterson N, Zetterberg A, Wigler M. Large-scale copy number
polymorphism in the human genome. Science. 2004;305(5683):525-8.
10. Wellcome Trust Case Control Consortium. Genome-wide association study of CNVs
in 16,000 cases of eight common diseases and 3,000 shared controls. Nature. 2010;
464(7289):713-20.