in s ilico eljárás makromolekulák tervezéséhez
DESCRIPTION
In s ilico eljárás makromolekulák tervezéséhez. ELTE eScience RET 2.4-es alprojekt. Szoftverfejlesztés Ittzés Péter , Ph.D., ELTE RET eScience Horváth Arnold , szoftverfejlesztő, informatikus Kun Ádám , Ph.D., Collegium Budapest. Kovács Attila , Ph.D. Tátrai Antal , doktorandusz. - PowerPoint PPT PresentationTRANSCRIPT
In silico eljárás makromolekulák tervezéséhez
ELTE eScience RET
2.4-es alprojekt
Résztvevők:
Projektvezető: Jakó Éena, Ph.D., ELTE RET eScience
ICF alkalmazása molekuláris filogenetikai analízisbenAri Eszter, doktorandusz, Genetikai TanszékPodani János, D.Sc., Növényrendszertani és Ökol. Tanszék
In silico molekulatervezési módszer in vitro tesztelésePál Gábor, Ph.D., Biokémiai TanszékSzenes Áron, doktorandusz, Biokémiai Tanszék
SzoftverfejlesztésIttzés Péter, Ph.D., ELTE RET eScience Horváth Arnold, szoftverfejlesztő, informatikusKun Ádám, Ph.D., Collegium Budapest
Kovács Attila, Ph.D. Tátrai Antal, doktorandusz
Az ICF (Iterative Canonical Form) rövid ismertetése
• Eredetileg Boole függvények minimalizálására (Normálforma)• Részben-rendezett halmazokon értelmezhető• Kódolás: a részben-rendezett halmaz megfeleltetése a vizsgált strukúrának• A részben-rendezést meghatározó reláció alapján a kódolt adatstrukúrát átrendezhetjük és ez az esetek egy jelentős részében információ vesztés nélküli tömörítés• Megkönnyíti az osztályozást• A struktúra átalakítása reflektálhat a funkcióra
Az ICF elméleti háttere
Példa I.
• bináris string: 00111010•3 logikai változóval kódolva: a’bc’ + abc’ + a’b’c + a’bc
Példa távolságra
• Többféle távolságformulát alkalmaztunk: Euklideszi, Manhattan, Jaccard…
Bináris eset, x = 3, y = 0ED = 1,73
yxED
Az ICF eddigi alkalmazásai
• Mérnöki alkalmazás: kombinációs hálózatok és programozható logikai modulok tervezése (Hazai szabadalom)• Kémiai alkalmazás: molekuláris shape analízis• Ökológiai: fajkombinációk elemzése• Molekuláris taxonómia• Makromolekulák leírása
Ponttértkép
Matematikaimodell
fA = 01010010fT = 10000100fC = 00001000fG = 00100001Kódolás ICF
ICFeredménye
DendrogramICF Gráf
TAGACTAG
Szekvenciák
Az ICF 1.0 programcsomag I.
• ICF számítás•Többféle input:
•Bináris •Decimális •Nukleinsav•File import
•Eredmények mentése•Eredmények ábrázolása gráfokon
ICF alapú szoftverfejlesztés 2006
Az ICF 1.0 programcsomag II.
• Távolságok ICF alapján•Az ICF számításnál bemutatott input•Több távolságformula•Eredmények exportja•További elemzőprogramokhoz való kapcsolódás Pl.: SynTax 2000
Az ICF 1.0 programcsomag IV.
• Felhasználói kéziköny•Angol és magyar nyelven•A program menüjéből elérhető HTML formátumban
• Telepítő program•Windows•Mac
Az ICF 1.0 programcsomag V.
•Moduláris szerkezet•Általános, diszkrét matematikai feladatokra alkalmas központi mag•Erre épülnek az ICF-fel kapcsolatos modulok•A megjelenítést egy különálló grafikus réteg végzi•Könnyen bővíthető input/output modulokkal
•Objektum orientált - Java 1.5 alapú•Platformfüggetlen•Az algoritmust hatékonyabbá tettük, 263 hosszúságú bináris stringeket is kezel•Számokban:
•22 811 db kódsor•120 osztály•9 template
•Tesztelés: ~ 200 teszt eset, jegyzőkönyv
A hagyományos és az ICF alapú megközelítések összehasonlítása
• Hagyományos filogenetikai módszerek:– Alap feltevés: az egyes
nukleotidok egymástól függetlenül evolválódnak
– Az egyes pozíciókon lévő nukleotidok hasonlóságán alapszik
– Nagyon hasonló ill. nagyon különböző szekvenciák nem elemezhetőek ilyen módszerekkel
• ICF módszer:
– Alap feltevés: az egyes nukleotidok egymástól NEM függetlenül evolválódnak
– A szekvenciák absztrakt szerkezetének hasonlóságán alapszik
– Nagyon hasonló ill. nagyon különböző szekvenciákat is lehet elemezni
Az ICF, mint molekuláris filogenetikai módszer
Az ICF alkalmazásai I.
A nagy emberszabású majmok leszármazási viszonyai
ICF vektorokMP
ML
Bayes analízis
NJ
Jaccard
ICF
Manhattan
távolság mátrix
NJ
szubsztitúciós modell
távolság mátrix
Hagyományos módszerek
Diszkrét matematikaimódszer
• 22 mitokondriális tRNS gén
• Öt módszer
• Számos fa
• Konszenzus törzsfák
Az eredmények
ésBayes
másodlagos szerkezete harmadlagos szerkezete
A transzfer RNS
DHU hurok
antikodon hurok
Tψ C hurok
Extra hurok
aminosav kötő hely
aminosav kötő hely
Az ICF validálása identitásváltást okozó tRNS mutációk vizsgálatával
Az ICF validálása identitásváltást okozó tRNS mutációk vizsgálatával
Gráfok közötti távolságok ábrázolása
Az ICF validálása identitásváltást okozó tRNS mutációk vizsgálatával
Új antibiotikum célpontok keresése az ICF módszerrel
• az antibiotikumok használhatósága rohamosan csökken a rezisztens mikroba törzsek kifejlődése miatt
Az ICF alkalmazásai II.
• A patogének elleni küzdelem egyik módja eddig nem kiaknázott molekuláris célpontok elleni antibiotikumok kifejlesztése.
• A célpont esszenciális kell, hogy legyen a mikroba számára.
• A célpontnak el kell térnie a humán megfelelőjétől.• A tRNS és aminoacil-tRNS szintetáz (AARS)
kölcsönhatás gátlása ideális antibiotikum mechanizmus lehet.
• Az AARS enzimek működése esszenciális a sejt számára.
• 20-féle AARS enzim van, mindegyikből csak egyféle (nincsenek izoenzimek).
• Mind az AARS enzimek, mind a tRNS-ek mutatnak eltéréseket prokarióta – eukarióta vonatkozásban.
• Melyik tRNS-szintetáz kapcsolat a leginkább eltérő a humán-mikroba rendszerekben?
1111111111122222222222333333333334444444444555555555566666666667777 1234567890123456778900012345678901234567890123456789012345678901234567890123 a abhsapi_Ala_TGC: GGGGATGTAGCTCAGT--GGT--AGAGCGCATGCTTTGCATGTATGAGGTCCCGGGTTCGATCCCCGGCATCTCCAhsapi_Ala_TGC: GGGGGTGTAGCTCAGT--GGT--AGAGCACATGCTTTGCATGTGTGAGGCCCCGGGTTCGATCCCCGGCACCTCCAhsapi_Ala_TGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCATGCTTTGCATGTATGAGGTCCCGGGTTCGATCCCCGGCACCTCCAhsapi_Ala_TGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCATGCTTTGCATGTATGAGGCCTCGGGTTCGATCCCCGACACCTCCAhsapi_Ala_CGC: GGGGATGTAGCTCAGT--GGT--AGAGCGCATGCTTCGCATGTATGAGGCCCCGGGTTCGATCCCCGGCATCTCCAhsapi_Ala_AGC: GGGGATGTAGCTCAGT--GGT--AGAGCGCATGCTTAGCATGCATGAGGTCCCGGGTTCGATCCCCAGCATCTCCAhsapi_Ala_AGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCGTGCTTAGCATGTACGAGGTCCCGGGTTCAATCCCCGGCACCTCCAhsapi_Ala_AGC: GGGGGTATAGCTCAGT--GGT--AGAGCGCGTGCTTAGCATGCACGAGGTCCTGGGTTCGATCCCCAGTACCTCCAhsapi_Ala_AGC: GGGGGTATAGCTCAGC--GGT--AGAGCGCGTGCTTAGCATGCACGAGGTCCTGGGTTCAATCCCCAATACCTCCAhsapi_Ala_AGC: GGGGGTGTAGCTCAGT--GGT--AGAGCGCGTGCTTAGCATGCACGAGGCCCCGGGTTCAATCCCCGGCACCTCCAhsapi_Ala_AGC: GGGGAATTAGCTCAAGC-GGT--AGAGCGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCAhsapi_Ala_AGC: GGGGAATTAGCTCAAGT-GGT--AGAGCGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCAhsapi_Ala_AGC: GGGGAATTAGCGCAAGT-GGT--AGAGTGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCAhsapi_Ala_AGC: GGGGAATTAGCCCAAGT-GGT--AGAGCGCTTGCTTAGCATGCAAGAGGTAGTGGGATCGATGCCCACATTCTCCAhsapi_Ala_AGC: GGGGAATTAGCTCAAGT-GGT--AGAGCGCTCGCTTAGCATGCGAGAGGTAGTGGGATCGATGCCCGCATTCTCCAhsapi_Phe_GAA: GCTGAAATAGCTCAGTT-GGG--AGAGCGTTAGACTGAAGATCTTAAAG-CCCTGGTTCAACCCTGGGTTTCAGCChsapi_Phe_GAA: GCCGAAATAGCTCAGTT-GGG--AGAGCGTTAGACTGAAGATCTAAAGGTCCCTGGTTCGATCCCGGGTTTCGGCAhsapi_Phe_GAA: GCCGAGATAGCTCAGTT-GGG--AGAGCGTTAGACTGAAGATCTAAAGGTCCCTGGTTCAATCCCGGGTTTCGGCAhsapi_Phe_GAA: GCCGAAATAGCTCAGTT-GGG–-AGAGCGTTAGACCGAAGATCTTAAAG-CCCTGGTTCAATCCCGGGTTTCGGCA
.
.
.
??
1111111111122222222222333333333334444444444555555555566666666667777 1234567890123456778900012345678901234567890123456789012345678901234567890123 a ab vchol_Ala_TGC: GGGGTTATAGCTCAGCT-GGG--AGAGCGCCTGCCTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAACTCCA vchol_Ala_GGC: GGGGCTATAGCTCAGCT-GGG--AGAGCGCTTGCATGGCATGCAAGAGGTCTGCGGTTCGATCCCGCATAGCTCCA vchol_Phe_GAA: GCCCGGATAGCTCAGTC-GGT--AGAGCAGAGGATTGAAAATCCTCGTGTCGGTGGTTCGATTCCGCCTCCGGGCA vchol_Phe_GAA: GCCTCGATAGCTCAGTC-GGT–-AGAGCAGAGGATTGAAAATCCTCGTGTCGGTGGTTCGATTCCGCCTCGAGGCA
.
.
.
• Teljes humán tRNS szett ICF analízise • Teljes patogén mikroba tRNS szett ICF analízise • A legnagyobb mértékben eltérő humán-mikroba tRNS
párok azonosítása• Az azonosított párok funkcionális ellenőrzése• A nem-működő párokhoz tartozó mikroba szintetáz lesz
a potenciális antibiotikum célpont
A kísérletek végzése nemzetközi együttműködésben
• Együttműködési megállapodáson dolgozunk a világ egyik legelismertebb tRNS-kutató csoportjával, melyet Catherine Florentz vezet a Pasteur Egyetemen (Strasbourg)
• Az ICF tesztelése a Pasteur Egyetemen már karakterizált, de még nem közölt tRNS-eken jelenleg zajlik.
• Sikeres tesztelés esetén beindulhatnak a nagy volumenű kísérletek.
További tervek és lehetőségek
SzoftverfejlesztésAz ICF kiterjesztése:• fehérjeszekvenciák analízisére,• CHIP adatok kiértékelésére,• szociológiai adatok elemzésére
tRNS mutációk okozta mitokondriális rendellenességek vizsgálataCatherine Florentz, D.Sc. Pasteur Egyetemen (Strasbourg)
Expressziós CHIP alapú gyógyszer hatóanyag keresés (csontritkulás)Orosz László, D.Sc. Genetikai TanszékPonyi Tamás, Ph.D. Genetikai TanszékVellai Tibor, Ph.D. Genetikai TanszékBorsy Adrienn, doktorandusz Genetikai TanszékPodani János, D.Sc. Növényrendszertani és Ökológiai Tanszék
tRNS - AARS komplexek 3D modellezésePaul G. Mezey, D.Sc. Newfoundlandi Egyetem (Canada)Simon Éva, doktorandusz Newfoundlandi Egyetem (Canada)