julien chidiakdess assjoël takvorian ___________________________________________________________

72
Julien CHIDIAK DESS ASS Joël TAKVORIAN _________________________________________________ __________ GRID COMPUTING & CALCUL DISTRIBUE Année universitaire 2003-2004

Upload: kynthia-rose

Post on 01-Jan-2016

22 views

Category:

Documents


0 download

DESCRIPTION

Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________. GRID COMPUTING & CALCUL DISTRIBUE. Année universitaire 2003-2004. Plan de l’exposé:. Définitions Enjeux Fonctionnement Projets existants Perspectives. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Julien CHIDIAK DESS ASS Joël TAKVORIAN___________________________________________________________

GRID COMPUTING & CALCUL DISTRIBUE

Année universitaire 2003-2004

Page 2: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Plan de l’exposé:

Définitions

Enjeux

Fonctionnement

Projets existants

Perspectives

Page 3: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Définitions

Enjeux

Fonctionnement

Projets existants

Perspectives

Page 4: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Le calcul distribué

Répartir un projet en une multitude de calculs qui seront exécutés en parallèle par

plusieurs machines.

Page 5: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Le grid computing

Forme particulière du calcul distribué:

Chaque PC peut avoir accès aux ressources du réseau de son organisation virtuelle.

C’est un mode de partage de ressources décentralisé.

Page 6: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Définitions

Enjeux

Fonctionnement

Projets existants

Perspectives

Page 7: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Enjeux du calcul distribué :

Utiliser la puissance laissée disponible pour permettre de donner des ressources nécessaires à des utilisateurs en ayant le besoin :

Diminution des coûts matériels (par ex : recherche médicale)

Augmentation des capacités de calculs  (diminution de la durée des calculs)

Page 8: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Intérêts du grid computing :• Toute la capacité des serveurs est exploitée en les interconnectant

dans un réseau et en leur faisant exécuter en commun différentes tâches.

• Aujourd'hui, on travaille avec des serveurs séparés par application, ainsi nombre d'entre eux ne sont pas utilisés pendant de longues périodes.

• En combinant les serveurs, il est possible d'économiser sur le matériel.

• La fiabilité des réseaux informatiques augmente, permettant aux serveurs de reprendre les tâches d'autres ordinateurs refusant tout service.

Le grid computing devient le cheval de bataille de compagnies telles Oracle, IBM, HP ou encore Google.

Page 9: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Exemples de chiffres expliquant les intérêts du Grid computing :

Pour le décryphton :6 supercalculateurs extrêmement coûteux pour

réaliser le calcul en 50 jours 10 000 PC participants à raison de 2 heures par

jour : décryptage réalisé en 500 jours soit 17 mois 100 000 PC participants à raison de 2 heures par

jour : décryptage réalisé en 50 jours 200 000 PC participants à raison de 2 heures par

jour : décryptage réalisé en 25 jours, moins d'1 mois !

Page 10: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Définitions

Enjeux

Fonctionnement

Projets existants

Perspectives

Page 11: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 12: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Plusieurs types de systèmes distribués

● Système dédié à un unique projet.

● Système dédié à plusieurs projets.

● Grilles informatiques.

Page 13: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Système pour un unique projet

Un tel système sera construit sur une architecture client-serveur.

Programme serveur :

définit de petites unités de calcul

distribue ces unités aux programmes clients

reçoit les résultats

Programme client :

reçoit les données brutes du serveur

analyse ces données

envoie les résultats au serveur.

Page 14: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 15: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

• Difficultés : sécurité et authenticité des données au niveau du serveur.

cryptage des données transmises

détection des incohérences au niveau du serveur

• Système d’authentification de l’utilisateur pour générer des statistiques personnalisées.

Page 16: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Système dédié à plusieurs projets

Il s'agit d'un système capable de gérer plusieurs projets sans que ceux-ci soient nécessairement connus à l'avance.

• Le programme client devra être capable d'exécuter un algorithme qu'il ne connait pas. Pour cela, il devra reconnaitre un langage de script, ou pouvoir exécuter un programme Java.

• Le programme client aura également besoin de disposer de fonctionnalités génériques (envoi et réception de données, statistiques, etc.) afin de faciliter le développement des scripts de projet.

Page 17: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Dans ce système distribué, il faut en plus sécuriser le programme client afin de l'empêcher d'interprêter un script indésirable.

nécessité d'instaurer un système d'authentification de l'envoyeur envoyé avec le script.

l'utilisateur doit pouvoir être maître des types de projets auxquels il désire participer. Le système devrait donc attendre d'obtenir son accord avant le traîtement d'un calcul concernant un nouveau projet sur sa machine.

Système dédié à plusieurs projetsSécurité

Page 18: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Les "Grilles Informatiques"système non hiérarchisé

• Ce système fonctionne sur un mode "peer-to-peer" : tous les participants partagent des ressources, et chacun (sous certaines conditions) pourra utiliser ces ressources pour son propre compte.

• Le réseau sur lequel est implanté un tel système s'appelle une grille.

• Il s'agit d'un modèle complexe, plus difficile à mettre en oeuvre que ceux vus précédemment.

Page 19: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 20: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Grilles informatiques

Deux points cruciaux à développer :

• la mise au point des protocoles d'échanges standards, qui serviront à la communication entre les sites participants.

• l'élaboration d'outils de développement (outils de bas niveau et middleware).

Page 21: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Grilles informatiques

Le mode peer-to-peer nécessite davantage de mesures de contrôle pour plus de sécurité. On utilisera donc des règles de partages qui ont pour but :

• de définir clairement l'objet du partage• de définir qui est autorisé à y accéder, et dans

quelles mesures.

Par exemple, le programme P à le droit d'accéder au répertoire R en lecture et écriture dans la limite de 100 Mo de données écrites.

Page 22: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Grilles informatiquesProtocoles

Ils doivent être :

• standards, pour assurer l'interopérabilité entre différentes grilles et pour faciliter le partage du code source

• extensibles pour satisfaire à des besoins spécifiques.

Page 23: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Grilles informatiquesOutils de développement

Ils doivent :

• intégrer les protocoles précédemment définis• être portables, pour permettre de créer des

applications multi-plateformes• être extensibles.

Page 24: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Les Organisations Virtuelles

• Il s'agit d'un ensemble d'individus et/ou d'institutions réunis sur une grille informatique.

• Exemples d'OVs : un consortium d'industriels travaillant sur un nouvel avion, les membres d'un programme de collaboration internationale en physique nucléaire, ou même un fournisseur de puissance de calcul, ou d'espace de stockage.

• Grâce aux standards garantissant l'interopérabilité, plusieurs organisations virtuelles peuvent collaborer sur un ou plusieurs projets.

Page 25: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 26: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Globus

"Globus Toolkit" est un outil de développement bas niveau. C'est la solution la plus utilisée pour le développement de grilles.

• Ensemble de services distincts et autonomes pour un développement adapté à l'objectif.

• Chaque service bénéficie d'une API qui lui est propre.

• Les standards sont massivement utilisés.

Page 27: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Globus

Liste non exhaustive de fonctionnalités :• authentification unique• définition des ressources• localisation de ressources• acquisition des ressources• débuter un calcul réparti• fournir un accès aux fichiers distants• contrôle permanent des calculs en cours• permettre une collaborations sur les calculs• etc.

Page 28: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Globus

the globus hourglass

Page 29: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Globus

Page 30: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Unicore

• Unicore est le principal système concurrent à Globus.

• D'origine allemande, il est surtout utilisé en Europe.• Il fournit des outils graphiques pour la gestion d'une

grille. Il est plus adapté aux utilisateurs finaux.• Il existe des solutions d'interopérabilité entre

Globus et Unicore.

Page 31: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

ProActive

ProActive est une bibliothèque 100% Java créée par l'équipe OASIS de l' INRIA. Elle est destinée à toute sorte d'applications distribuées.

Utilisée conjointement à Globus, elle simplifie grandement la programmation des grilles informatiques.

Page 32: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Middlewares

• Ils fournissent des méthodes de haut niveau pour simplifier la programmation.

• Apportent le support de web services.• Apportent le support de XML.• Permettent une adaptation de Globus à d'autres

langages de programmation. (Java, Python, etc.)• etc.

Page 33: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Middlewares - exemples

• Le Java CoG kit : fournit un mapping entre le toolkit Globus et l'API Java.

• Le Condor Project de l'université du Wisconsin, est un système clé en main dédié aux calculs intensifs scientifiques.

• Le Grid Engine, de Sun Microsystem.• etc.

Page 34: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Définitions

Enjeux

Fonctionnement

Projets existants

Perspectives

Page 35: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Les utilisations du Grid Computing (ou calcul distribué)

La recherche médicale

La recherche spatiale

Les calculs mathématiques

Le business d’entreprise

Page 36: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Les types d’institutions concernées :

• Laboratoires pharmaceutiques (publique ou privé)

• Les laboratoires universitaires (publique)

• Les groupes de recherche (publique)

• Les entreprises (publique ou privé)

• Concours de communautés

Page 37: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Exemples de projets :

• Décrypthon

• genome@home & folding@home

• seti@home

• UnitedDevice

• Distributed.net

Page 38: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

DECRYPTHON

• Projet Français lancé avec le télethon 2001

• Groupe de recherche Genoming

• Cartographier le protéome

• Réalisé entre décembre 2001 et mai 2002.

• Une base de données au service de la lutte contre les maladies génétiques (myopathie…)

Page 39: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

DECRYPTHON en quelques chiffres :

• 550.000 protéines comparées et classifiées

• Pour ces travaux, les chercheurs se sont appuyés sur la puissance de 75 000 ordinateurs contribuant chacun à hauteur d'environ 200 heures de calcul. Si l'on n'utilisait qu'un seul ordinateur personnel standard, le calcul prendrait environ 625 000 jours, soit environ 1 710 années.

Page 40: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Université de Stanford (Etats Unis)

2 grands projets :

Commencé en 2001

Commencé

en 2000

Page 41: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Comprendre le Génome humain pour :

Créer de nouvelles protéines pour des thérapies

Créer de nouveaux médicaments

Comprendre l’évolution des protéines

Constituer une base de données de gènes utile à la recherche médicale

Page 42: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Genome@home en quelques chiffres :

Page 43: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 44: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 45: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Comprendre les associations de protéines. 

Prévenir des maladies telles que :

• Alzheimer

• Vache folle

• Parkinson…

Dues à de mauvaises associations de protéines.

Page 46: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

 

Number CPUs

Number Active CPUs

Number Users

Number Teams

Last Update

572990 118185 272838 28185 2003-11-26 01:05:46

OS type Active Total

Windows 106502 500059

Mac OS X 3912 28491

Linux 7771 44396

Other 0 13

Total 118185 572959

Page 47: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

 

Page 48: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

• Recherche d’intelligence extraterrestre via décryptage de signaux radio

• Créé en 1996

• Ouvert au public en 1999

Page 49: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

seti@home en quelques chiffres :

  Total

Users 4768803

Results received 1132024000

Total CPU time 1710992.095 years

Floating PointOperations

3.999078e+21

Average CPU timeper work unit

13 hr 14 min 24.9 sec

Page 50: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Les lieux de calcul :

Location Users Resultsreceived

Total CPU time

Average CPU time

per work unit

home 3483525

687502931

1030544.912 years

13 hr 07 min 51.4 sec

work939992

371708026

566026.958 years

13 hr 20 min 22.1 sec

school191784

56895304

88742.404 years13 hr 39 min 48.2 sec

none52727

15923336

25930.312 years14 hr 15 min 54.7 sec

Page 51: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 52: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 53: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 54: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

INRIA

• Mène une part importante de la recherche française sur les grilles.

• Participe à l’objectif de standardisation mondiale des infrastructures informatiques dans le domaine des technologies de grilles.

Page 55: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

INRIA: Principaux projets en cours 

• PARIS 

• OASIS

• APACHE

• ReMaP

• RESO

• I-Cluster2

Page 56: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Descriptif des projets en cours :

PARIS :

Assurer une communication efficace entre les composants logiciels

Basé sur CORBA

Globalisation des données

Page 57: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Descriptif des projets en cours :

APACHE :Assurer un accès rapide aux données et

couplage de modes de calculs:Développement de méthodes de

parallélisatonCouplages de nœuds de calculs en

différents points de la grille, pour optimiser les enchaînements.

Page 58: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Descriptif des projets en cours :

ReMaP :Répartition optimale des taches et des

données lors de calculs.Ordonnancement optimal des calculs via

algorithmique appropriée.Développement de couches logicielles

permettant l’exportation de calculs d’une grille à une autre.

Page 59: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Descriptif des projets en cours (suite)

OASIS :

Constitution d’une bibliothèque d’applications java pour le calcul réparti ou parallèle

Bibliothèque ProActive

Fait partie du consortium ObjectWeb créé par France Telecom, l’INRIA et Bull.

Page 60: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Descriptif des projets en cours (suite)

RESO :Adaptation des protocoles aux structures

hétérogènes et au haut débit Prise en compte au maximum des capacités

des connexions.Elaboration de protocoles de

communication, d’outils de mesures et de prédiction de performances

Page 61: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Descriptif des projets en cours (suite)

I-Cluster2 :

Plate forme expérimentale partagée.

104 duals processeurs de 900MHz

312 Go de RAM

Permet d’effectuer 560GFlops/s (août 2003)

Ceci n’est plus du Grid Computing, mais du méta computing

Page 62: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Distributed.net

• Communauté cherchant à développer le calcul distribué

• Existe depuis 1997

• Spécialisée dans les calculs mathématique et plus particulièrement les calculs liés à la cryptographie.

Page 63: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Concours CS-Cipher:

• organisé par CS Communications & Systems pour durer au moins un an (jusqu'au 17 mars 2000)

• distributed.net a trouvé la clé pour déchiffrer le message caché le 16 janvier 2000, après avoir testé plus de 98% de l'espace clé en moins de 2 mois.

• challenge fait pour démontrer la faiblesse du cryptage à 56 bits contre une attaque de force brute.

Page 64: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

RC5-56:

la solution au concours de décryptage RC5-32/12/7 56-bit des laboratoires RSA

clé trouvée après 250 jours de recherche, le 19 octobre 1997 à 13:25 UTC.

Page 65: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Autres projets envisagés :

• Les nombres de Fermat

• Factorisation principale de RSA

• Le Elliptic Curve Cryptosystem

Page 66: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

United Device :

• Fournisseur de solutions sur le grid computing

• Fondée en 1999

• Equipe des entreprises qui cherchent à pouvoir réaliser des calculs complexes (laboratoires pharmaceutiques,…)

Page 67: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

United Device en quelques chiffres :United Devices Grid MP Global™ Service Statistics

Statistics Last Updated: 11/29/2003 00:00:00 (UTC)

Totals

Members 1,104,009

Devices 2,486,204

Total CPU Time (y:d:h:m:s) 281,306:019:16:57:17

Averages

Avg. CPU Time Per Calendar Day (y:d:h:m:s) 243:356:18:52:24

Avg. CPU Time Per Result (y:d:h:m:s) 0:000:10:48:36

Yesterday

Total CPU Time (y:d:h:m:s) 265:135:16:20:37

Results Returned215,385

 

Page 68: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

EADS, EDF,….

Expérimentation du grid computing pour la simulation.

Nouveaux airbus pour EADS

Collisions d’atomes pour le CERN

Basés sur les systèmes GLOBUS ou UNICORE

Page 69: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Définitions

Enjeux

Fonctionnement

Projets existants

Perspectives

Page 70: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Perspectives:

Essor du grid computing au détriment de solutions onéreuses (supercalculateurs…)

Distribution des ressources informatiques sur le modèle de l’électricité.

Page 71: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________
Page 72: Julien CHIDIAKDESS ASSJoël TAKVORIAN ___________________________________________________________

Sources• Document "The anatomy of the grid" :

http://www.globus.org/research/papers/anatomy.pdf• Document "The physilogy of the grid" :

http://www.globus.org/research/papers/ogsa.pdf• Doc "Le "Grid Computing" à l’INRIA" :

http://www.inria.org/presse/themes/gridcomputing/grid.fr.pdf• Globus : http://www.globus.org/• Unicore : http://www.unicore.org/• Condor Project : http://www.cs.wisc.edu/condor/• Sun One Grid Engine : http://wwws.sun.com/software/grid/• IBM : http://www-1.ibm.com/grid/• seti@home : http://setiathome.ssl.berkeley.edu/• folding@home : http://www.stanford.edu/group/pandegroup/folding/• genome@home : http://www.stanford.edu/group/pandegroup/genome/• distributed.net : http://www.distributed.net/• UD : http://www.grid.org/home.htm