prof kacsuk péter mta sztaki€¦ · a tanfolyam ca tanfolyam célja ... bárki kipróbálhatja a...

Post on 23-Sep-2020

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Bevezetés a Grid rendszerekbe

Prof Kacsuk PéterMTA SZTAKI

Párhuzamos és elosztott rendszerek laboratórium

www.lpds.sztaki.hu

kacsuk@sztaki.hu

Tartalom

● Mi a grid, miért és mire használják?Ált lá id hit ktú● Általános grid architektúra

● Szolgáltatás Gridek● Hozzáférés szolgálatás gridhez

● Desktop Gridekp● Hozzáférés desktop gridhez

A tanfolyam célja● A tanfolyam célja● Konklúziók

Mi az a Grid?Mi az a Grid?

A Grid számítógépek● A Grid számítógépek, tárolóegységek, speciális berendezések és szolgáltatások gegyüttese, amik dinamikusancsatlakozhatnak és hagyhatják

● Ezek az erőforrások heterogénekel a Gridet

Internet● Földrajzilag elosztottak és tipikusan Internettel vannak összekötvevannak összekötve

● Igény szerint (on-demand) érhetők eldemand) érhetők el

Miért használnak Gridet?Miért használnak Gridet?

● A felhasználónak olyan komplex● A felhasználónak olyan komplex problémát kell megoldani, ami sok szolgáltatás és erőforrás együttes alkalmazását igényli azért hogyalkalmazását igényli azért, hogy

• Csökkentse a feldolgozási időt• Elérjen nagy adatbázisokat és

iáli ké ülék k tspeciális készülékeket• Együttműködjön másokkal

I t tInternet

Tipikus Grid alkalmazásiterületekterületek

• Nagy számítási kapacitást igénylő alkalmazások• Nagy teljesítményű számítás

(High Performance Computing)(High Performance Computing)• Egyetlen párhuzamos program végrehajtásának idejét lerövidíteni

• Nagy áteresztőképességű számítások (High Throughtput Computing)(High Throughtput Computing)

• Minél több hasonló méretű, egymástól független jobot lefuttatni egységnyi idő alatt

N d t i é k l d l ó lk l á k• Nagy adatmennyiségekel dolgozó alkalmazások• Általában több adatbázis, tudásbázis együttes bevonásával

• Kollaboratív munka• Kollaboratív munka• Több felhasználó együttes bevonásával összetett tudást igénylő

problémák megoldása

Példa: Large Hidron Collider CERN GenfLarge Hidron Collider, CERN, Genf

ATLAS CMSATLAS CMS

~10-15 PetaBytes /year~108 events/year

3~103 batch and interactive users

LHCb

Példa:Rolls Royce repülőgép motorokRolls Royce repülőgép motorok

1Gb data per engine per1Gb data per engine per flight

R l ti d tl tölté bá i● Real-time adatletöltés a bázis repülőtérre

● Historikus összehasonlításá ó● Adatintegráció repterek között

● Elemzés, analizálás● Számítás elosztott architektúrán

● Kiszolgáló személyzet felkészítése

Példa:Orvosi képfeldolgozásOrvosi képfeldolgozás

• ~ 1 millió kép / paciensp p• 1024 x 1024 felbontás / kép• ~ 1 gByte / paciens• 5 paciens / nap

...Push imagesin the workflow

Image + metadata

Metadata Server LFN Other medical metadata

További példák

• In silico gyógyszerkutatás –molekula szimulációk, alkalmatlan

ül t k ki ű évegyületek kiszűrése• Földtudományok, űrkutatás –

szatellit és távcső képekszatellit és távcső képek megosztása, elemzése

• Archeologia – digitális archivumok létrehozása és megosztásalétrehozása és megosztása, szimulációk futtatása

• Időjárás előrejelzés –d tb űjté d ll ál táadatbegyűjtés, modellválasztás,

szimulációk, összegzés• Mérnöki tudományok – épületek, é ö udo á yo épü e e ,

közlekedési eszközök szimulációja

Miért célszerű erre Grid rendszert használni?rendszert használni?

A il ti ú blé ák 5 10 é é• Az ilyen tipusú problémákra 5-10 éve még szuperszámítógépeket használtak

• Ma nagy részükre Grid rendszert használnak• Az okok:

• A Grid képes egyesíteni és kihasználni az intézetek szabad számítógép kapacitását gmindenféle extra beruházás nélkül

• Virtuálisan és igény szerint megnöveli minden csatlakozó intézmény gépparkjának kapacitását

• Elosztott erőforrásokat integrál• Rugalmas hozzáférést tesz lehetővé

Grid vízió

Mobile Access

GRI

Mobile Access

Supercomputer, PC-Cluster

ID

MIIDDLE

Workstation

Data-storage, Sensors, ExperimentsEWAREE

VisualisingInternet, networks

Megoldandó problémák

● Erőforrások standard elérése● Számítógépek

Tá ló kö ök● Tárolóeszközök● Speciális eszközök● SzoftverekS o t e e

● Hozzáférés szabályozás (biztonságtechnika)● Terheléselosztás● Erőforrások állapotának monitorozása● Alkalmazások monitorozása● Hibakezelés● Alkalmazási metodika, programozási koncepció● ...

Általános Grid modell

Szabad kapacitás kiajánlásaInt1 Int4

InternetInt2 Int3

Kapacitás igénylésKapacitás igénylés

A Grid két szereplője

• Erőforrás felajánlók (donorok) = D• Erőforrás felhasználók = HErőforrás felhasználók H• A kettő közötti viszony adja meg az

alkalmazott Grid modell típusát:alkalmazott Grid modell típusát:• Ha H ~ D => általános Grid modell

Ha H >> D > szolgáltatói Grid modell• Ha H >> D => szolgáltatói Grid modell• Ha H << D => desktop Grid modell

Általános Grid modell jellemzői

• Bárki felajánlhat erőforrást• Heterogén erőforrások, amikHeterogén erőforrások, amik

dinamikusan jönnek, mennek• Bárki felhasználhatja a felajánlott• Bárki felhasználhatja a felajánlott

erőforrásokat SAJÁT alkalmazásának megoldásáramegoldására

• Szimmetrikus és egyenjogú kapcsolat az őf á d k é h álók kö ötterőforrás donorok és használók között:

H ~ D

Az általános grid modell bonyolult...

● Számtalan felhasználási lehetőség● Bonyolult biztonsági megoldásoky g g● Fejlett erőforrás információs rendszer● Fejlett brókerezési rendszer● Bonyolult installálni és karbantartani

Nagyon megbízhatatlan● Nagyon megbízhatatlan

Gyakorlatban két irányba egyszerűsödött:● Gyakorlatban két irányba egyszerűsödött:● Szolgáltatás Gridek● Dekstop Gridek

Szolgáltatás Gridek

Szolgáltatói Grid modell példa: Enabling Grids for E-sciencE (EGEE)Enabling Grids for E sciencE (EGEE)

Szabad kapacitás kiajánlásaSzabad kapacitás kiajánlása napi 24 órában (statikusan)

Kutatóhely1 Kutatóhely2

Donor és Donor és

Internet

Donor és Felhasználó

Donor és Felhasználó

Felhasználó 1 Felhasználó N

Kapacitás igénylésKapacitás igénylés dinamikusan

Szolgáltatói Grid modell jellemzői

• Csak “professzionális” szolgáltatók ajánlhatnak fel erőforrást

• Homogén erőforrások – egyszerűbb karbantarthatóság, alkalmazás fejlesztésá k f lh álh f l á l őf á k• Bárki felhasználhatja a felajánlott erőforrásokat

SAJÁT alkalmazásának megoldásáraA i t ik é j ú k l t• Asszimmetrikus és nem egyenjogú kapcsolat az erőforrás donorok és használók között:

H >> DH >> D

Generic Grid ArchitectureApplications

ApplicationEnvironments Instrument

ManagementAnalysis &

Visualisation CollaboratoriesProblemSolving

EnvironmentsGrid Portals

ApplicationSupport MPI CONDOR CORBA JAVA/JINI OLE

DCOM Other...

Grid CommonServices:

Middleware orm

atio

ner

vice

s

esou

rce

edul

ing

a Acc

ess

achi

ng

esou

rce

Allo

catio

n

entic

atio

nho

risat

ion

onito

ring

Faul

tna

gem

ent

Polic

y

coun

ting

Middleware services In

fo Se Re

Sce

Dat

aC

a

Re

Co-

A

Aut

hA

uth

Mo F

Man P

Acc

CPUs TertiarySt

OnlineSt CommunicationsI

ScientificI t t

Resource Management Resource ManagementGrid Fabric

- localresources

Storage Storage InstrumentsInstruments

Szolgáltatói Grid példa: EGEE

Country participating

in EGEE

● > 200 sites in 40 countries● ~ 36 000 CPUs

5 PB storage● ~ 5 PB storage● 98k jobs/day● > 200 Virtual Organizationsg● ⇨The world’s largest multi-disciplinary Grid● gLite middleware http://www.eu-egee.org/

Szolgáltatói Grid példa: Open Science GridOpen Science Grid

30 Virtual Organizations105 Resources26 Support Agencies26 Support Agencies

Middleware:Virtual Data Toolkit– Virtual Data Toolkit (VDT): collection of grid tools

– Condor– Condor– Globus– VO Management Service

http://www.opensciencegrid.org/

Szolgáltatói Grid példa : NorduGrid

Dynamic Grid~ 33 sites, ~1400 CPUS 33 sites, 1400 CPUS

Production GridApplications f om– Applications from various scientific disciplines Sites operate 24/7– Sites operate 24/7

– Mostly unattended by administrators

Middleware:– Advanced Resource

Connector (ARC)

http://www.nordugrid.org/

HunGrid – EGEE magyar VO-ja

l űk dé ű ( ó áb űk d k)● Folyamatos működésű (napi 24 órában működik)● Cél: az akadémiai intézetek kutatóinak folyamatos

támogatásatámogatása● Az EGEE Grid magyar adaptációja, virtuális szervezete

2005 januárban lett felállítva● 2005. januárban lett felállítva● Résztvevő telephelyek:

● RMKI: 200 proc.● RMKI: 200 proc.● ELTE: 64 proc.● BME: 32 proc.● NIIF: 12 proc.● Összes proc. kapacitás: 308 proc.

www.lcg.kfki.hu/index_eng.pl?hungrid&hungridgeneral

Limitált szolgálatás grid változat:Magyar KlaszterGridMagyar KlaszterGrid

Szabad kapacitás kiajánlása éjszakaEgyetem1 Egyetem4

InternetEgyetem2 Egyetem3

Kapacitás igénylésKapacitás igénylés éjszakahttp://www.clustergrid.iif.hu/

ClusterGrid

● Szakaszos működésű: A nappal oktatásban használt PC laborokat köti Gridbe ● éjszakánként ● hétvégekeng

● ~1400 PC 26 egyetemen ill. főiskolánA grid teljesítmény ~0 5 Tflop● A grid teljesítmény ~0.5 Tflop

● 70 tudományos projekt● 2003 július óta üzemel és folyamatosan nő a

kapacitása

Szolgáltatás Grid hozzáférésSzolgáltatás Grid hozzáférés

Szolgáltatás gridek és Virtuális organizációkVirtuális organizációk

• VO: erőforrások és f lh álókfelhasználók csoportja VirtuálisVirtuális

• Logikai egységHo áférési határ Grid

szervezetszervezet• Hozzáférési határ Grid

Szolgáltatás grid hozzáférés

● Grid tanusítvány beszerzése egy elismert● Grid tanusítvány beszerzése egy elismert Tanusítvány Szolgáltatótól (CA)

M á i CA NIIF htt // iif h /● Magyarországi CA: NIIF http://www.ca.niif.hu/● Regisztráció egy Virtuális Organizációbag gy g

● EGEE VO-k listája: Central Operations portal: http://cic.gridops.org/http://cic.gridops.org/

● HunGrid VO: www lcg kfki hu/index eng pl?hungrid&hungridgwww.lcg.kfki.hu/index_eng.pl?hungrid&hungridgeneral

Grid használat parancssorból vagy P GRADE● Grid használat parancssorból vagy P-GRADE portálból

P-GRADE Portál röviden

Fájl tároló Fájl tároló szolgáltatásokszolgáltatások

S ámításiS ámításiSzámítási Számítási erőforrásokerőforrások

HTTP Fájl replika és Fájl replika és katalógus katalógus

szolgáltatásokszolgáltatások

HTTP

gg

Tanusítvány

Információs Információs rendszerrendszer

P-GRADE Portal

ErőforrásErőforrás

Tanusítványalapú

azonosításErőforrás Erőforrás

brókerbrókerwww.portal.p-grade.hu

A P-GRADE Portal szolgáltatásaiWORKFLOW CERTIFICATE PERFORMANCE EXECUTIONDESIGN MANAGEMENT ANALYSIS ON GRID(S)DESIGN MANAGEMENT ANALYSIS ON GRID(S)

Egy P-GRADE Portál alkalmazás

● Irányított aciklikus áf l bgráf, amelyben

● Csomópontok: végrehajtható programok

● Portok: input/output fájlok melyeket a programok olvasnak vagy írnakÉ● Élek: programok közötti adatfüggőségek

● Workflow szemantikája:● Egy csomópontban lévő● Egy csomópontban lévő

program akkor indítható ha minden input fájlja rendelkezésre áll

● A portál szerverbe épített workflow menedzser felelőssége

Programok párhuzamosításaEgyidőben több példánya

fut

– Párhuzamos futás egy szolgáltatás grid csomóponton belülcsomóponton belül (MPI)– Párhuzamos futás a workflow gráfon belül

Egyidőben több processze fut

g

Egyidőben több programja fut

– A workflow futtatása több példányban paraméter vizsgálatként

Desktop Gridek

Desktop Grid modell

Szabad kapacitás kiajánlása dinamikusanVállalati/

egyetemiegyetemiszerver

Vállalati/egyetemi

PCM ld dó

InternetMegoldandó

feladat

Vállalati/egyetemi Vállalati/

iegyetemiPC egyetemi

PC

Munkacsomagok kiosztása

Desktop Grid modell jellemzői

• Bárki felajánlhat erőforrást• Heterogén erőforrások, amik g ,

dinamikusan jönnek, mennek• Egy vagy néhány projektgy gy y p j

használhatja fel a felajánlott erőforrásokat

• Asszimmetrikus és nem egyenjogú kapcsolat az erőforrás donorok és h álók kö ötthasználók között:

H << D

Desktop Grid fajtái

• Globális Desktop Grid (DG)• Célja nagy horderejű tudományos j gy j y

feladatokhoz donor PC-ket gyűjteni

• Lokális DG• Célja, hogy a DG koncepciót bármilyen

közösség (kut.intézet, egyetemi tsz., kar, g ( , gy , ,vállalat, város, stb.) tudja használni

SETI: egy globális DG

● SETI@home● 1 grid 1 alkalmazáshoz

● 3.8M önkéntes 226 országból

● 1200 CPU év/nap1200 CPU év/nap

● 38 TF fenntartható teljesítmény ~ 28. a TOP500 j ylistán(Japanese Earth Simulator

)30. ugyanitt)

● Alapját adó BOINC i f t ktú á külö iinfrastruktúra már külön is elérhető

SZTAKI Desktop Grid

● BOINC DG technológián alapuló rendszer● BOINC DG technológián alapuló rendszer● Megkönnyíteni DG alkalmazások létrehozását és futtatását● Megkönnyíteni DG infrastruktúra installálását és üzemeltetésétL káli é l báli i lé h tő● Lokális és globális csomag is elérhető

Globális minta installáció:● Globális minta installáció: ● 2005. júniusban lett felállítva a SZTAKI-ban:

http://www.lpds.sztaki.hu/desktopgrid/p // p / pg /● Megoldandó feladat: általánosított bináris számrendszerek keresése

(ELTE Matematikai Tanszék)● Több mint 22000 beregisztrált résztvevőg● ~ 30000 számítógép● 700-800 GFlop teljesítmény

• Demonstrálni és bizonyítani a DG koncepció működését• Meggyőzni a kételkedőket a DG használhatóságáról• Bárki beszállhat mint erőforrás felajánló

SZTAKI Desktop Grid globális verzió

SZTAKI Desktop Gridglobális mintarendszerglobális mintarendszer

SZTAKI DG mintainstalláció: 750 GFlopsSZTAKI DG mintainstalláció: 750 GFlops

NIIF Supercomputer: 300 GFlopsS p p pNIIF ClusterGrid: 500 GFlopsOMSZ Supercomputer: 900 GFlops

TOP 500 entry performance: 5929 GFlops

SZTAKI DG használatának fokozataifokozatai

1. Bárki kipróbálhatja a DG koncepció működését PC-jét beregisztrálva a mintarendszerbe

2. Bárki hozhat alkalmazást, amit szeretne az SZDG-re feltelepíteni. Ekkor segítünk az alkalmazás SZDG adaptálásában és elvégezzük a telepítéstSZDG adaptálásában és elvégezzük a telepítést

3. Bármely szervezet felállíthatja saját DG rendszerét az SZDG mintájára:az SZDG mintájára:

• Egyetlen PC szervert kell beruháznia• Mi vállaljuk, hogy egyetlen nap alatt felállítjuk a DG-tj , gy gy p j• Segítünk a szervezet alkalmazásait adaptálni és telepíteni

a saját DG-re

Két alapvető Grid irányzat

Grid Technológia Desktop Grid Utility Grid

(EGEE, ( G ,HunGrid)

Alkalmazás fejlesztés DC API P-GRADE

portalportal

Tipikus alkalmazás Mester-szolga Ált.párhuzam.

(Workflow)(Workflow)

Kihasználható párhuzamosság típusok a Gridbentípusok a Gridben

• Szolgáltatás GridMaster-slave (paraméter

• Desktop GridMaster-slave– Master-slave (paraméter

vizsgálat)– Telephelyen belüli

– Master-slave (paraméter vizsgálat)

p ypárhuzamosság

– Telephelyek közötti párhuzamosságpárhuzamosság

– WorkflowEzek kompinációi pl– Ezek kompinációi, pl

• Telephelyen belüli paraméter vizsgálat

• Workflow paraméter vizsgálat

Paraméter vizsgálat v.Mester/szolga párhuzamosságMester/szolga párhuzamosság

Mester

munkacsomag1munkacsomag1

munkacsomag2

munkacsomag3

InternetmunkacsomagN

Telephelyen belüli párhuzamosság

I t tInternet

Telephelyek közötti párhuzamosság

I t tInternet

Workflow párhuzamosság

I t tInternet

Kombinált párhuzamosság:Telephelyen belüli és paraméter vizsgálatTelephelyen belüli és paraméter vizsgálat

I t tInternet

Kombinált párhuzamosság:Worlkflow parameter vizsgalatWorlkflow parameter vizsgalat

I t tInternet

A Grid Computing három hulláma

A kutatási hullám Az ipari hullám A vásárlói hullámp

Technológia, Prototípus Griden futó termékek Comm

Virtuális Organizációk Vállalati megoldásokStandardok Együttműködési képességStandardok Együttműködési képesség

GGF, IETF, OASIS GGF, EGA, IETF, OASIS Jogi, polit

“Grid lehetőségek tudatosítása” “Könnyű elérés” “Grid Service Provider”

Itt tartunk

A tanfolyam célja

● Bemutatni azokat a grid infrastruktúrákat, amiket a magyar kutatók elérhetnekamiket a magyar kutatók elérhetnek

● Megmutatni, hogy ezeket hogyan kell h ál ihasználni:● Grid tanusítványok beszerzése● Alkalmazások fejlesztés a gridre● Futtatás a gridben

● Mind elvi, mind gyakorlati képzés lesz

Mit tegyünk a tanfolyam után

● Ha tényleg akarjuk használni a gridet, akkor forduljunk a SZTAKI GASuC szolgáltatásáhozforduljunk a SZTAKI GASuC szolgáltatásához

● GASuC (Grid Application Support Centre):● Segit az alkalmazás gridesítésében● Segít a kezdeti nehézségeket áthídalni az új grid

f lh álók á áfelhasználók számára

● http://www.lpds.sztaki.hu/gasuc/

Konkluzió

• Általános Grid modell jó, de megvalósítani bonyolultj , g y• Kutatási témák TDK, diplomamunka, PhD téma• Témavezetést vállalunk minden szinten

• Gyakorlatban Szolgáltatás Gridek és Desktop Gridek

• Léteznek működő Grid infrastruktúrák hazánkban:• ClusterGrid: PVM programok számára• HunGrid: workflow és paraméter vizsgálat• SZTAKI DG: Mester-szolga alkalmazásokra

• Elérhetők európai grid infrastruktúrák is:• SEEGRID, VOCE, GILDA

• Mindezek a P-GRADE portál interfészen keresztül transzparensen használhatók

• Bárki regisztrálhat, mint erőforrás felajánló, vagy mint alkalmazó• Bármely magyar kutató ingyenesen igénybe veheti a GASuC szolgáltatást

Köszönöm a figyelmetKöszönöm a figyelmetf gyf gy

??

További információ: www lpds sztaki huTovábbi információ: www.lpds.sztaki.hu

top related