cancergrid -grid alkalmazása rákellenes hatóanyagok ...a cancergrid projekt • alapadatok – eu...

32
CancerGrid - Grid alkalmazása rákellenes hatóanyagok keresésének felgyorsítására Kovács József [email protected] MTA SZTAKI Networkshop, Debrecen 2010

Upload: others

Post on 08-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • CancerGrid - Grid alkalmazása rákellenes hatóanyagok keresésének felgyorsítására

    Kovács Jó[email protected]

    MTA SZTAKI

    Networkshop, Debrecen2010

  • Tartalom

    • A CancerGrid projekt– Főbb adatai/célja– Rövid vegyészeti háttere– Számítási alkalmazások / algoritmusok– Összetett alkalmazások – SZTAKI Desktop Grid– gUSE portál– CancerGrid infrastruktúra

  • A CancerGrid projekt

    • Alapadatok– EU Framework Program 6 (FP-6, 2006-2010)– Life sciences, genomics and biotechnology for health– FP6-2005-LIFESCTHTALTH-7 – Proposal No.: 37559

    • Cím– Grid Aided Computer System For Rapid Anti-Cancer Drug Design

    • Projekt időtartam– 2007 Január 1, – 2010 Június 31

    • Költségvetés– Teljes: 3,847,425 EUR– Támogatás: 2,804,075 EUR

    • Elérhetőség– www.cancergrid.eu

  • • TargetEx, Inc., Hungary(coordinator) [chemistry]

    • AMRI Hungary, Inc., Hungary [chemistry]

    • Inte:Ligand, Austria[chemoinformatics]

    • Tallinn University of Technology, Estonia [chemoinformatics]

    • University of Helsinki, Finland[biotechnology]

    • GKI Economic Research, Hungary[economics]

    • SZTAKI, Hungary[computer science]

    • University of Jerusalem, Israel[chemoinformatics]

    • DAC, Italy[biotechnology]

    • University of Bari, Italy[chemistry]

    • University of Pompeu Fabra, Spain[chemoinformatics]

    A CancerGrid konzorcium

  • A CancerGrid projekt fő céljai

    • 1. fókuszált, rákellenes molekulákat nagy eséllyel tartalmazókémiai könyvtárak kifejlesztése,

    • 2. a betegséggel összefüggő citotoxicitás előrejelzésére alkalmas modellek kialakítása, a kináz/HDAC/MMP és egyéb enzim inhibíciós folyamatok és receptor antagonizmusok modellezése a HTS eredmények felhasználásával, illetve

    • 3. olyan Grid-technológián alapuló számítógépes rendszer kifejlesztése, amelynek segítségével felgyorsítható és automatizálható a gyógyszertervezés “in silico” fázisa. Ez a rendszer remélhetőleg alkalmas lesz más cél-fehérjemolekulákra épülő gyógyszerkutatási projektek kémiai könyvtártervezésének felgyorsítására is.

  • Gyógyszerkutatás

  • Molekulatervezés

    Struktúra

    O

    N

    N

    N

    N

    OH

    Tulajdonság• Biológiai

    IC50; LD50

    • FizikokémailogP; pKa; TPSA

    • KémiaiLogK; % yield

    Tulajdonság-becslés

    Struktúratervezés

  • Kvantitatív szerkezet-hatás összefüggések

    • QSAR (Quantitative Structure-Activity Relationship) módszer, szerves vegyületek, gyógyszermolekulák kémiai szerkezete és biológiai, toxikológiai vagy farmakológiai hatásai közötti kvantitatív összefüggéseket vizsgálja és lehetővé teszi egy szerkezetileg rokon molekula hatékonyságának matematikai és statisztikai módszerekkel való előrejelzését.

    • A molekulák biológiai hatékonyságát assay-kel (biológiai próbákkal) mérik amelyekben meghatározzák a gátlási szintet bizonyos jeltovábbítási vagy metabolikus folyamatokban. A gyógyszerkutatásban gyakran használnak QSAR módszereket olyan szerkezetek azonosításához amelyeknek jó gátló hatásuk van bizonyos specifikus biológiai célpontokon viszont alacsony a toxicitásuk (nem-specifikus aktivitásuk).

    • A 3D-QSAR három dimenziós szerkezet-hatás összefüggések vizsgálatával foglalkozik. Ilyenkor a molekulák 3D szerkezetét (konformációját) vizsgálják.

    Forrás: hu.wikipedia.org/wiki/Kvantitatív_szerkezet-hatás_összefüggések

  • QSAR modellépítés és tulajdonság-becslés

    Mért tulajdonság adatok(IC50, LD50, logP, stb.)

    QSAR modell építése(BMLR, PLS, PCR, ANN)

    2D-3D struktúrakonvertálás

    (molekula mechanika)

    Becslési algoritmus

    Molekulárisdeszkriptorok

    számítása

    OH

    O

    3D struktúraoptimalizálása

    (kvantumkémia)

    O

    NN

    N NOH

    Becsült tulajdonság adatok(IC50, LD50, logP, stb.)

  • A deszkriptor osztályok áttekintése

    Szám

    ítás i

    dőig

    énye

    Információ tartalom

    Konstitúciós

    Topológiai

    Geometriai

    Elektrosztatikai

    Kvantumkémiai

  • Alkalmazások CancerGrid-ben

    • A projekt infrastruktúrájában jelenleg elérhető biokémiai alkalmazások– Cmol3d

    • 2D/3D molekula konverter• Konformer generátor és kiválasztó algoritmus

    – Mopac (quantum chemical calculation software)• Qvantum kémiai számításokat végző eszköz

    – MDC (molecule descriptor calculation)• Deszkriptor számoló eszköz (Codessa programcsaládból)

    – Fmt (matrix forming application)• Deszkriptor mátrix készítő eszköz

    – MDA (model building and prediction)• QSAR model készítő eszköz

  • Segéd alkalmazások

    • A projekt infrastruktúrájában jelenleg elérhető egyéb kiegészítő eszközök:– File konverterek

    • XML ⇒ MOL• SD ⇒ MOL• XML ⇒ PROP• XML ⇒ DESC

    – Adatbázis beszúró/kiolvasó eszközök• DBread

    – molekula– property– deszkriptor

    • DBwrite– konformer– deszkriptor– model– deszkriptor

  • Összetett alkalmazások (workflowk) aCancerGrid projektben

    Deszkriptor számítás Tulajdonság előrejelzés

    Model építés Virtual Screening

  • Desktop Grid, mint végrehajtó rendszer

    Cél: szabad erőforrások kihasználása

  • SZTAKI Desktop Grid: BOINC projekt

    http://szdg.lpds.sztaki.hu/szdg

  • SZTAKI Desktop Grid: BOINC kiterjesztések

    SZTAKI Desktop Grid egy BOINC alapú rendszer kiegészítése különböző fejlesztési irányokba:

    • BOINC server debian csomagolása• Alkalmazás programozói interfész: DC-API• Integráció különböző job menedzserekkel: pl.: Condor• Különböző nem DG típusú alkalmazások támogatása: pl.: Java, MPI• BOINC projektek teljesítményének egyesítése: hierarhikus DG-k• Alkalmazások portolásának könnyítése: genwrapper• Biztonsági fejlesztések: jogosítványok bevezetése, sandboxing• Feladat (job) generálás könnyítése: 3GBridge

    Többségük letölthető a www.desktopgrid.hu címről, a többi fejlesztés alatti, kérhető innen ⇒ [email protected]

  • Alkalmazás a DesktopGriden

    • Speciális előkészületet igényel, a BOINC API-t kell használnia– Fájlkezeléshez

    – Indítás után Init(),minden kilépési pontnál finish() függvények

    – Eseményfigyelés állapotlementéshez

    • Alkalmazás csak egy binárisból állhat, nem indíthat továbbiakat

    BOINC kliens

    Alkalmazás

  • Alkalmazás a DG-enGenWrapper-el

    • alkalmazás fejlesztőnek nem kell ismernie a BOINC alkalmazások fejlesztési metodológiáját

    • meglévő szekvenciális alkalmazásokat módosítás nélkül tudja futtatni

    – egy shell szkript segítségével• az alkalmazás több binárisból is állhat, egy

    bináris indíthat másikat is• Főbb technikai paraméterek:

    – Cross-platform: Windows, Linux, Mac OS X– Flexibilis: POSIX Shell környezetet biztosít– beépítve tartalmazza az összes főbb UNIX

    shell parancsot (pl.: sed, grep, awk, unzip, gzip, tar)

    – Alkalmazások indítása shell szkripből történik– Indítás előtt/ után tetszőleges előkészítő/

    takarító függvények lehetnek• olyan alkalmazást is be tudunk így illeszteni,

    amely forrásához nem ferünk hozzá

    BOINC kliens

    GenWrapper

    Szkript…myprg $*

    Alkalmazás

  • Workflowk a gUSE/WS-PGRADE rendszerben

    • Külön alkalmazás-logika és adat

    • “Cross & dot product” adatpárosítás

    • Generátor komponens: 1 inputból sok output készítése

    • Kollektor components: sok inputból 1 output készítése

    • Bármely komponens lehet generátor v. kollektor.

    • Feltételes végrehajtás• Beágyazás• Rekurzió

    40

    401000

    50 20

    5000

    1

    5000 1

    7042 tasks

  • gUSE – Aciklikus workflow

    • Feladat dedikált gépre• Feladat gLite VO-ba• Feladat Globus 2 VO-ba• Feladat Globus 4 VO-ba• Feladat Desktop Grid-be• Web service hívás• Adatbázis manipuláció (R / W)

    • File kliens gépről• File GridFTP-ről• File LFC katalógusból • Szöveg• Adatbázis lekérdezés eredménye

  • moleculedatabase

    workflowkkezelése

    molekulákvizsgálata

    DG kliensek a partnerektől Molekula adatbázis szerver

    Portál ésDesktopGrid

    szerver

    BOINCserver

    3GBridge

    Portál

    DG jobs

    WU 1WU 2WU N

    Job 1Job 2Job N

    GenWrapper forbatch execution

    BOINC client

    LegacyApplication

    PortalStorage

    LocalResource

    Local jobs

    LegacyApplication

    WU XWU Y

  • Workflow fejlesztés & konfiguráció

    Algoritmusokkonfiguráció

    Workflow futtatás

    Molekulaadatbázisböngésző

    A CancerGrid portal által integrált komponensek

    A CancerGrid portál kezelőfelülete

    Struktúramegjelenítő

  • Molekula adatbázis kezelő felület

  • Példányosítás

  • Workflow konfiguráció

  • Workflowk listája

  • Job példány állapot (Részletes nézet)

  • gUSE alkalmazás monitor

  • Kliens monitor

  • A rendszer számokban…

    Statisztika• kb. 70 gép van csatlakoztatva a rendszerhez kliensként, új gépek beállítása az

    útóbbi időszakban folyamatos• Mindössze 1 központi szerver, amelyet üzemeltetni kell (a kliensek nem

    igényelnek felügyeletet!)• 13 algoritmus került beépítésre• 4 workflow elérhető a rendszerben jelenleg• 5-6 konzorciumi partner használta ezidáig különböző célokraTeljesítmény• Pl. deszkriptor számítás 30.000 vegyületre (10 konformerrel) mindössze 5 nap

    alatt (ez a következő algoritmusok futását jelenti: CMOL3D, MOPAC és MDC). 1 PC-vel ez kb. 1 évig tartana…Megjegyzés: Vannak gyorsabb algoritmusok, de a jelenleg használt számításintenzív algoritmusok sokkal hatékonyabban használják ki a Grid-et.

    • A konformerek csökkentésével és a gépek növelésével a teljesítmény könnyen akár 100-szorosára is nőhet, azaz lehetőség van milliós számú molekulák 1 hét alatti feldolgozására. Jelenleg ez az irány…

  • Konklúzió

    • A CancerGrid projektben kifejlesztésre került egy zárt desktopgrid rendszer, melyet egy portálon keresztül hajtunk meg összetett alkalmazásokkal

    • Tehát elkészült egy keretrendszer mely áll– egy böngészőből elérhető portálból

    – egy hozzáillesztett desktop grid szerverből

    – alkalmazások desktop grides integrációját segítő eszközökből

    • A keretrendszert a konzorciumi tagok segítségével kiegészítettük– alkalmazásokkal/algoritmusokkal

    – erőforrásokkal

    – összetett (workflow) alkalmazásokkal

    – tetszőleges kezelő felülettel

    • Maga a keretrendszer tetszőleges igényekre szabható

  • További technikai információka [email protected] címen vagy

    a www.desktopgrid.hu oldalon

    Acknowledgement: CancerGrid EU FP6 project (FP6-2005-LIFESCTHTALTH-7)http://www.cancergrid.eu