prof kacsuk péter mta sztaki€¦ · a tanfolyam ca tanfolyam célja ... bárki kipróbálhatja a...
TRANSCRIPT
Bevezetés a Grid rendszerekbe
Prof Kacsuk PéterMTA SZTAKI
Párhuzamos és elosztott rendszerek laboratórium
www.lpds.sztaki.hu
Tartalom
● Mi a grid, miért és mire használják?Ált lá id hit ktú● Általános grid architektúra
● Szolgáltatás Gridek● Hozzáférés szolgálatás gridhez
● Desktop Gridekp● Hozzáférés desktop gridhez
A tanfolyam célja● A tanfolyam célja● Konklúziók
Mi az a Grid?Mi az a Grid?
A Grid számítógépek● A Grid számítógépek, tárolóegységek, speciális berendezések és szolgáltatások gegyüttese, amik dinamikusancsatlakozhatnak és hagyhatják
● Ezek az erőforrások heterogénekel a Gridet
Internet● Földrajzilag elosztottak és tipikusan Internettel vannak összekötvevannak összekötve
● Igény szerint (on-demand) érhetők eldemand) érhetők el
Miért használnak Gridet?Miért használnak Gridet?
● A felhasználónak olyan komplex● A felhasználónak olyan komplex problémát kell megoldani, ami sok szolgáltatás és erőforrás együttes alkalmazását igényli azért hogyalkalmazását igényli azért, hogy
• Csökkentse a feldolgozási időt• Elérjen nagy adatbázisokat és
iáli ké ülék k tspeciális készülékeket• Együttműködjön másokkal
I t tInternet
Tipikus Grid alkalmazásiterületekterületek
• Nagy számítási kapacitást igénylő alkalmazások• Nagy teljesítményű számítás
(High Performance Computing)(High Performance Computing)• Egyetlen párhuzamos program végrehajtásának idejét lerövidíteni
• Nagy áteresztőképességű számítások (High Throughtput Computing)(High Throughtput Computing)
• Minél több hasonló méretű, egymástól független jobot lefuttatni egységnyi idő alatt
N d t i é k l d l ó lk l á k• Nagy adatmennyiségekel dolgozó alkalmazások• Általában több adatbázis, tudásbázis együttes bevonásával
• Kollaboratív munka• Kollaboratív munka• Több felhasználó együttes bevonásával összetett tudást igénylő
problémák megoldása
Példa: Large Hidron Collider CERN GenfLarge Hidron Collider, CERN, Genf
ATLAS CMSATLAS CMS
~10-15 PetaBytes /year~108 events/year
3~103 batch and interactive users
LHCb
Példa:Rolls Royce repülőgép motorokRolls Royce repülőgép motorok
1Gb data per engine per1Gb data per engine per flight
R l ti d tl tölté bá i● Real-time adatletöltés a bázis repülőtérre
● Historikus összehasonlításá ó● Adatintegráció repterek között
● Elemzés, analizálás● Számítás elosztott architektúrán
● Kiszolgáló személyzet felkészítése
Példa:Orvosi képfeldolgozásOrvosi képfeldolgozás
• ~ 1 millió kép / paciensp p• 1024 x 1024 felbontás / kép• ~ 1 gByte / paciens• 5 paciens / nap
...Push imagesin the workflow
Image + metadata
Metadata Server LFN Other medical metadata
További példák
• In silico gyógyszerkutatás –molekula szimulációk, alkalmatlan
ül t k ki ű évegyületek kiszűrése• Földtudományok, űrkutatás –
szatellit és távcső képekszatellit és távcső képek megosztása, elemzése
• Archeologia – digitális archivumok létrehozása és megosztásalétrehozása és megosztása, szimulációk futtatása
• Időjárás előrejelzés –d tb űjté d ll ál táadatbegyűjtés, modellválasztás,
szimulációk, összegzés• Mérnöki tudományok – épületek, é ö udo á yo épü e e ,
közlekedési eszközök szimulációja
Miért célszerű erre Grid rendszert használni?rendszert használni?
A il ti ú blé ák 5 10 é é• Az ilyen tipusú problémákra 5-10 éve még szuperszámítógépeket használtak
• Ma nagy részükre Grid rendszert használnak• Az okok:
• A Grid képes egyesíteni és kihasználni az intézetek szabad számítógép kapacitását gmindenféle extra beruházás nélkül
• Virtuálisan és igény szerint megnöveli minden csatlakozó intézmény gépparkjának kapacitását
• Elosztott erőforrásokat integrál• Rugalmas hozzáférést tesz lehetővé
Grid vízió
Mobile Access
GRI
Mobile Access
Supercomputer, PC-Cluster
ID
MIIDDLE
Workstation
Data-storage, Sensors, ExperimentsEWAREE
VisualisingInternet, networks
Megoldandó problémák
● Erőforrások standard elérése● Számítógépek
Tá ló kö ök● Tárolóeszközök● Speciális eszközök● SzoftverekS o t e e
● Hozzáférés szabályozás (biztonságtechnika)● Terheléselosztás● Erőforrások állapotának monitorozása● Alkalmazások monitorozása● Hibakezelés● Alkalmazási metodika, programozási koncepció● ...
Általános Grid modell
Szabad kapacitás kiajánlásaInt1 Int4
InternetInt2 Int3
Kapacitás igénylésKapacitás igénylés
A Grid két szereplője
• Erőforrás felajánlók (donorok) = D• Erőforrás felhasználók = HErőforrás felhasználók H• A kettő közötti viszony adja meg az
alkalmazott Grid modell típusát:alkalmazott Grid modell típusát:• Ha H ~ D => általános Grid modell
Ha H >> D > szolgáltatói Grid modell• Ha H >> D => szolgáltatói Grid modell• Ha H << D => desktop Grid modell
Általános Grid modell jellemzői
• Bárki felajánlhat erőforrást• Heterogén erőforrások, amikHeterogén erőforrások, amik
dinamikusan jönnek, mennek• Bárki felhasználhatja a felajánlott• Bárki felhasználhatja a felajánlott
erőforrásokat SAJÁT alkalmazásának megoldásáramegoldására
• Szimmetrikus és egyenjogú kapcsolat az őf á d k é h álók kö ötterőforrás donorok és használók között:
H ~ D
Az általános grid modell bonyolult...
● Számtalan felhasználási lehetőség● Bonyolult biztonsági megoldásoky g g● Fejlett erőforrás információs rendszer● Fejlett brókerezési rendszer● Bonyolult installálni és karbantartani
Nagyon megbízhatatlan● Nagyon megbízhatatlan
Gyakorlatban két irányba egyszerűsödött:● Gyakorlatban két irányba egyszerűsödött:● Szolgáltatás Gridek● Dekstop Gridek
Szolgáltatás Gridek
Szolgáltatói Grid modell példa: Enabling Grids for E-sciencE (EGEE)Enabling Grids for E sciencE (EGEE)
Szabad kapacitás kiajánlásaSzabad kapacitás kiajánlása napi 24 órában (statikusan)
Kutatóhely1 Kutatóhely2
Donor és Donor és
Internet
Donor és Felhasználó
Donor és Felhasználó
Felhasználó 1 Felhasználó N
Kapacitás igénylésKapacitás igénylés dinamikusan
Szolgáltatói Grid modell jellemzői
• Csak “professzionális” szolgáltatók ajánlhatnak fel erőforrást
• Homogén erőforrások – egyszerűbb karbantarthatóság, alkalmazás fejlesztésá k f lh álh f l á l őf á k• Bárki felhasználhatja a felajánlott erőforrásokat
SAJÁT alkalmazásának megoldásáraA i t ik é j ú k l t• Asszimmetrikus és nem egyenjogú kapcsolat az erőforrás donorok és használók között:
H >> DH >> D
Generic Grid ArchitectureApplications
ApplicationEnvironments Instrument
ManagementAnalysis &
Visualisation CollaboratoriesProblemSolving
EnvironmentsGrid Portals
ApplicationSupport MPI CONDOR CORBA JAVA/JINI OLE
DCOM Other...
Grid CommonServices:
Middleware orm
atio
ner
vice
s
esou
rce
edul
ing
a Acc
ess
achi
ng
esou
rce
Allo
catio
n
entic
atio
nho
risat
ion
onito
ring
Faul
tna
gem
ent
Polic
y
coun
ting
Middleware services In
fo Se Re
Sce
Dat
aC
a
Re
Co-
A
Aut
hA
uth
Mo F
Man P
Acc
CPUs TertiarySt
OnlineSt CommunicationsI
ScientificI t t
Resource Management Resource ManagementGrid Fabric
- localresources
Storage Storage InstrumentsInstruments
Szolgáltatói Grid példa: EGEE
Country participating
in EGEE
● > 200 sites in 40 countries● ~ 36 000 CPUs
5 PB storage● ~ 5 PB storage● 98k jobs/day● > 200 Virtual Organizationsg● ⇨The world’s largest multi-disciplinary Grid● gLite middleware http://www.eu-egee.org/
Szolgáltatói Grid példa: Open Science GridOpen Science Grid
30 Virtual Organizations105 Resources26 Support Agencies26 Support Agencies
Middleware:Virtual Data Toolkit– Virtual Data Toolkit (VDT): collection of grid tools
– Condor– Condor– Globus– VO Management Service
http://www.opensciencegrid.org/
Szolgáltatói Grid példa : NorduGrid
Dynamic Grid~ 33 sites, ~1400 CPUS 33 sites, 1400 CPUS
Production GridApplications f om– Applications from various scientific disciplines Sites operate 24/7– Sites operate 24/7
– Mostly unattended by administrators
Middleware:– Advanced Resource
Connector (ARC)
http://www.nordugrid.org/
HunGrid – EGEE magyar VO-ja
l űk dé ű ( ó áb űk d k)● Folyamatos működésű (napi 24 órában működik)● Cél: az akadémiai intézetek kutatóinak folyamatos
támogatásatámogatása● Az EGEE Grid magyar adaptációja, virtuális szervezete
2005 januárban lett felállítva● 2005. januárban lett felállítva● Résztvevő telephelyek:
● RMKI: 200 proc.● RMKI: 200 proc.● ELTE: 64 proc.● BME: 32 proc.● NIIF: 12 proc.● Összes proc. kapacitás: 308 proc.
www.lcg.kfki.hu/index_eng.pl?hungrid&hungridgeneral
Limitált szolgálatás grid változat:Magyar KlaszterGridMagyar KlaszterGrid
Szabad kapacitás kiajánlása éjszakaEgyetem1 Egyetem4
InternetEgyetem2 Egyetem3
Kapacitás igénylésKapacitás igénylés éjszakahttp://www.clustergrid.iif.hu/
ClusterGrid
● Szakaszos működésű: A nappal oktatásban használt PC laborokat köti Gridbe ● éjszakánként ● hétvégekeng
● ~1400 PC 26 egyetemen ill. főiskolánA grid teljesítmény ~0 5 Tflop● A grid teljesítmény ~0.5 Tflop
● 70 tudományos projekt● 2003 július óta üzemel és folyamatosan nő a
kapacitása
Szolgáltatás Grid hozzáférésSzolgáltatás Grid hozzáférés
Szolgáltatás gridek és Virtuális organizációkVirtuális organizációk
• VO: erőforrások és f lh álókfelhasználók csoportja VirtuálisVirtuális
• Logikai egységHo áférési határ Grid
szervezetszervezet• Hozzáférési határ Grid
Szolgáltatás grid hozzáférés
● Grid tanusítvány beszerzése egy elismert● Grid tanusítvány beszerzése egy elismert Tanusítvány Szolgáltatótól (CA)
M á i CA NIIF htt // iif h /● Magyarországi CA: NIIF http://www.ca.niif.hu/● Regisztráció egy Virtuális Organizációbag gy g
● EGEE VO-k listája: Central Operations portal: http://cic.gridops.org/http://cic.gridops.org/
● HunGrid VO: www lcg kfki hu/index eng pl?hungrid&hungridgwww.lcg.kfki.hu/index_eng.pl?hungrid&hungridgeneral
Grid használat parancssorból vagy P GRADE● Grid használat parancssorból vagy P-GRADE portálból
P-GRADE Portál röviden
Fájl tároló Fájl tároló szolgáltatásokszolgáltatások
S ámításiS ámításiSzámítási Számítási erőforrásokerőforrások
HTTP Fájl replika és Fájl replika és katalógus katalógus
szolgáltatásokszolgáltatások
HTTP
gg
Tanusítvány
Információs Információs rendszerrendszer
P-GRADE Portal
ErőforrásErőforrás
Tanusítványalapú
azonosításErőforrás Erőforrás
brókerbrókerwww.portal.p-grade.hu
A P-GRADE Portal szolgáltatásaiWORKFLOW CERTIFICATE PERFORMANCE EXECUTIONDESIGN MANAGEMENT ANALYSIS ON GRID(S)DESIGN MANAGEMENT ANALYSIS ON GRID(S)
Egy P-GRADE Portál alkalmazás
● Irányított aciklikus áf l bgráf, amelyben
● Csomópontok: végrehajtható programok
● Portok: input/output fájlok melyeket a programok olvasnak vagy írnakÉ● Élek: programok közötti adatfüggőségek
● Workflow szemantikája:● Egy csomópontban lévő● Egy csomópontban lévő
program akkor indítható ha minden input fájlja rendelkezésre áll
● A portál szerverbe épített workflow menedzser felelőssége
Programok párhuzamosításaEgyidőben több példánya
fut
– Párhuzamos futás egy szolgáltatás grid csomóponton belülcsomóponton belül (MPI)– Párhuzamos futás a workflow gráfon belül
Egyidőben több processze fut
g
Egyidőben több programja fut
– A workflow futtatása több példányban paraméter vizsgálatként
Desktop Gridek
Desktop Grid modell
Szabad kapacitás kiajánlása dinamikusanVállalati/
egyetemiegyetemiszerver
Vállalati/egyetemi
PCM ld dó
InternetMegoldandó
feladat
Vállalati/egyetemi Vállalati/
iegyetemiPC egyetemi
PC
Munkacsomagok kiosztása
Desktop Grid modell jellemzői
• Bárki felajánlhat erőforrást• Heterogén erőforrások, amik g ,
dinamikusan jönnek, mennek• Egy vagy néhány projektgy gy y p j
használhatja fel a felajánlott erőforrásokat
• Asszimmetrikus és nem egyenjogú kapcsolat az erőforrás donorok és h álók kö ötthasználók között:
H << D
Desktop Grid fajtái
• Globális Desktop Grid (DG)• Célja nagy horderejű tudományos j gy j y
feladatokhoz donor PC-ket gyűjteni
• Lokális DG• Célja, hogy a DG koncepciót bármilyen
közösség (kut.intézet, egyetemi tsz., kar, g ( , gy , ,vállalat, város, stb.) tudja használni
SETI: egy globális DG
● SETI@home● 1 grid 1 alkalmazáshoz
● 3.8M önkéntes 226 országból
● 1200 CPU év/nap1200 CPU év/nap
● 38 TF fenntartható teljesítmény ~ 28. a TOP500 j ylistán(Japanese Earth Simulator
)30. ugyanitt)
● Alapját adó BOINC i f t ktú á külö iinfrastruktúra már külön is elérhető
SZTAKI Desktop Grid
● BOINC DG technológián alapuló rendszer● BOINC DG technológián alapuló rendszer● Megkönnyíteni DG alkalmazások létrehozását és futtatását● Megkönnyíteni DG infrastruktúra installálását és üzemeltetésétL káli é l báli i lé h tő● Lokális és globális csomag is elérhető
Globális minta installáció:● Globális minta installáció: ● 2005. júniusban lett felállítva a SZTAKI-ban:
http://www.lpds.sztaki.hu/desktopgrid/p // p / pg /● Megoldandó feladat: általánosított bináris számrendszerek keresése
(ELTE Matematikai Tanszék)● Több mint 22000 beregisztrált résztvevőg● ~ 30000 számítógép● 700-800 GFlop teljesítmény
• Demonstrálni és bizonyítani a DG koncepció működését• Meggyőzni a kételkedőket a DG használhatóságáról• Bárki beszállhat mint erőforrás felajánló
SZTAKI Desktop Grid globális verzió
SZTAKI Desktop Gridglobális mintarendszerglobális mintarendszer
SZTAKI DG mintainstalláció: 750 GFlopsSZTAKI DG mintainstalláció: 750 GFlops
NIIF Supercomputer: 300 GFlopsS p p pNIIF ClusterGrid: 500 GFlopsOMSZ Supercomputer: 900 GFlops
TOP 500 entry performance: 5929 GFlops
SZTAKI DG használatának fokozataifokozatai
1. Bárki kipróbálhatja a DG koncepció működését PC-jét beregisztrálva a mintarendszerbe
2. Bárki hozhat alkalmazást, amit szeretne az SZDG-re feltelepíteni. Ekkor segítünk az alkalmazás SZDG adaptálásában és elvégezzük a telepítéstSZDG adaptálásában és elvégezzük a telepítést
3. Bármely szervezet felállíthatja saját DG rendszerét az SZDG mintájára:az SZDG mintájára:
• Egyetlen PC szervert kell beruháznia• Mi vállaljuk, hogy egyetlen nap alatt felállítjuk a DG-tj , gy gy p j• Segítünk a szervezet alkalmazásait adaptálni és telepíteni
a saját DG-re
Két alapvető Grid irányzat
Grid Technológia Desktop Grid Utility Grid
(EGEE, ( G ,HunGrid)
Alkalmazás fejlesztés DC API P-GRADE
portalportal
Tipikus alkalmazás Mester-szolga Ált.párhuzam.
(Workflow)(Workflow)
Kihasználható párhuzamosság típusok a Gridbentípusok a Gridben
• Szolgáltatás GridMaster-slave (paraméter
• Desktop GridMaster-slave– Master-slave (paraméter
vizsgálat)– Telephelyen belüli
– Master-slave (paraméter vizsgálat)
p ypárhuzamosság
– Telephelyek közötti párhuzamosságpárhuzamosság
– WorkflowEzek kompinációi pl– Ezek kompinációi, pl
• Telephelyen belüli paraméter vizsgálat
• Workflow paraméter vizsgálat
Paraméter vizsgálat v.Mester/szolga párhuzamosságMester/szolga párhuzamosság
Mester
munkacsomag1munkacsomag1
munkacsomag2
munkacsomag3
InternetmunkacsomagN
Telephelyen belüli párhuzamosság
I t tInternet
Telephelyek közötti párhuzamosság
I t tInternet
Workflow párhuzamosság
I t tInternet
Kombinált párhuzamosság:Telephelyen belüli és paraméter vizsgálatTelephelyen belüli és paraméter vizsgálat
I t tInternet
Kombinált párhuzamosság:Worlkflow parameter vizsgalatWorlkflow parameter vizsgalat
I t tInternet
A Grid Computing három hulláma
A kutatási hullám Az ipari hullám A vásárlói hullámp
Technológia, Prototípus Griden futó termékek Comm
Virtuális Organizációk Vállalati megoldásokStandardok Együttműködési képességStandardok Együttműködési képesség
GGF, IETF, OASIS GGF, EGA, IETF, OASIS Jogi, polit
“Grid lehetőségek tudatosítása” “Könnyű elérés” “Grid Service Provider”
Itt tartunk
A tanfolyam célja
● Bemutatni azokat a grid infrastruktúrákat, amiket a magyar kutatók elérhetnekamiket a magyar kutatók elérhetnek
● Megmutatni, hogy ezeket hogyan kell h ál ihasználni:● Grid tanusítványok beszerzése● Alkalmazások fejlesztés a gridre● Futtatás a gridben
● Mind elvi, mind gyakorlati képzés lesz
Mit tegyünk a tanfolyam után
● Ha tényleg akarjuk használni a gridet, akkor forduljunk a SZTAKI GASuC szolgáltatásáhozforduljunk a SZTAKI GASuC szolgáltatásához
● GASuC (Grid Application Support Centre):● Segit az alkalmazás gridesítésében● Segít a kezdeti nehézségeket áthídalni az új grid
f lh álók á áfelhasználók számára
● http://www.lpds.sztaki.hu/gasuc/
Konkluzió
• Általános Grid modell jó, de megvalósítani bonyolultj , g y• Kutatási témák TDK, diplomamunka, PhD téma• Témavezetést vállalunk minden szinten
• Gyakorlatban Szolgáltatás Gridek és Desktop Gridek
• Léteznek működő Grid infrastruktúrák hazánkban:• ClusterGrid: PVM programok számára• HunGrid: workflow és paraméter vizsgálat• SZTAKI DG: Mester-szolga alkalmazásokra
• Elérhetők európai grid infrastruktúrák is:• SEEGRID, VOCE, GILDA
• Mindezek a P-GRADE portál interfészen keresztül transzparensen használhatók
• Bárki regisztrálhat, mint erőforrás felajánló, vagy mint alkalmazó• Bármely magyar kutató ingyenesen igénybe veheti a GASuC szolgáltatást
Köszönöm a figyelmetKöszönöm a figyelmetf gyf gy
??
További információ: www lpds sztaki huTovábbi információ: www.lpds.sztaki.hu