Download - Modélisation et Optimisation du Web
![Page 1: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/1.jpg)
Modélisation et Optimisation du Web
César JALPA VILLANUEVA
Directeur: Zhen LIU
Projet MISTRAL
![Page 2: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/2.jpg)
2
Plan d ’exposé1. Motivation
2. WAGON: Web trAffic GeneratOr and beNchmark
3. Expérimentations
4. Analyse Statistique
5. Conclusions et Perspectives
![Page 3: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/3.jpg)
3
1. Motivation
WWW : World Wide Wait?
Popularité Croissance
Saturation de serveurs et réseaux
16% de nouvelles pages chaque mois
1 nouveau serveur toutes les 2 secondes
WWW : World Wide Web ou World Wide Wait?
70% de trafic de l ’Internet
![Page 4: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/4.jpg)
4
Qui, Quoi, Comment?Qui Quoi Comment
serveur distribution sous-dimensionnement,
mauvaise configuration, etc.
réseaux support de sous-dimensionnement
transmission
protocoles transfert mauvaise conception,
mauvais paramétrage, etc.
navigateur récupération mauvaise conception,
mauvais paramétrage, etc.
cache … ...
![Page 5: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/5.jpg)
5
Outils d’Evaluation de Performance et de Dimensionnement pour le Web• Objectifs
– évaluation et prédiction de performances– dimensionnement– optimisation des architectures et des paramètres
• Approches– modèles analytiques– simulation– benchmarks
![Page 6: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/6.jpg)
6
Benchmarks pour serveurs Web
• Un mécanisme pour générer un flux contrôlé de requêtes HTTP avec des métriques pour rapporter les résultats
• Scénario de base: clients qui émettent un flux de requêtes et mesurent la réponse du système– processus de génération de trafic– jeu d ’essai (workload)– mesures de performance
![Page 7: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/7.jpg)
7
Benchmarks existants
• WebSTONE
• SPECweb96
• S-Client
• httperf
• hbenchWeb
• SURGE
![Page 8: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/8.jpg)
8
2. WAGON: Web trAffic GeneratOr and beNchmark
• Nouveau modèle de trafic: plus réaliste, facile à paramétrer.
• Approche objets et java
• Emulation réseaux et transport• Analyse Statistique• Monitoring• Interface Graphique
extensibilité (HTTP-NG).Facilité de déploiement: Internet 2 (VTHD)Probabilité: Solaris, FreeBSD, Linux, Windows
![Page 9: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/9.jpg)
9
WAGON: Historique• V.0 (1997): F. Ah-Yave et V. Marquion• V.1 (1998): en collaboration avec N. Niclausse (thèse)
– test, déboguage– ajout de fonctionnalités: fichier de traces, approche objets, monitoring, émulation réseau.
• V.2 (2000): avec concours de N. Niclausse• amélioration de l ’architecture• extension du modèle de trafic
– multiple classes de clients (profiles)– émulation du réseau
• module d’analyse statistique– algorithme EM– tests d ’ajustement
![Page 10: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/10.jpg)
10
WAGON: Vue globale
Serveur Web
Fichier de traces
Module d’analyse
Structuredu serveur
Popularité des documentsProbabilité de routage
Paramètres dumodèle de trafic
Synthèse duworkload
Expérimentation
Générationdu trafic
rapport
![Page 11: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/11.jpg)
11
WAGON: Générateur de trafic
• Modèle de trafic– le processus d'arrivées des sessions– la distribution du nombre de clics– la distribution du temps de réflexion
Session A
clicA1 clicA2 clicA3 clicA4ic
Session B
ia
![Page 12: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/12.jpg)
12
WAGON: Générateur de trafic (suite)
• Modèle de navigation– popularité– routage
clicA1 clicA2 clicA3 clicA4
?A1
A2
A3
A4
![Page 13: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/13.jpg)
13
3. Expérimentation
• Comparaison des protocoles (HTTP1.0 et 1.1)
• Comparaison de serveurs (Apache, Jigsaw)
• Paramétrage de serveurs
• Auto-similarité du trafic généré par WAGON
• VTHD (Internet 2)
• Analyse Statistique
![Page 14: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/14.jpg)
14
Conditions de réalisation
DUMMYNET
WAGON
• Réseau expérimental7 Pentium II,128Moctets
2PentiumPro, 64Moctets
FreeBSD3.2
deux switchs, 100Mbps
DUMMYNET
![Page 15: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/15.jpg)
15
Conditions de réalisation (suite)
• Serveur Web– Apache, configuration par défaut (MaxClients 150,
KeepAliveTimeout 15s)
– sous-ensemble du serveur INRIA (www.inria.fr)
• Paramètres du modèle de trafic– analyse des fichiers de traces du serveur INRIA
– arrivée de sessions: processus de Poisson, 0.002 ≤ λ ≤ 0.008
– nombre de clics: Gaussienne Inverse (μ = 5, λ = 3) (5, 1.28)
– temps inter-clics: LogNormal(m = 3, σ = 1.1) (36.8s, 56.40s)
![Page 16: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/16.jpg)
16
Conditions de réalisation (suite)
Classes de clientstype d’accès délai (msec.) bande passante
modem1 250 56 kps
modem2 250 33 kps
T1, DLS 20 1.5 Mbps
WAN 80 150 kps
satellite 500 2 Mbps
Ethernet 0.1 100 Mbps
Protocole – HTTP1.0, 4 connexions– HTTP1.1, 1 connexion, persistance «Clasique», (HTTP1.1-D)
– HTTP1.1, 1 connexion, persistance «Early Close», (HTTP1.1-EC)
![Page 17: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/17.jpg)
17
Comparaison des protocoles HTTP1.0 et 1.1
Accès par modem Accès lien T1
![Page 18: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/18.jpg)
18
Comparaison des protocoles HTTP1.0 et 1.1 (suite)
• À faible charge: – HTTP1.1-D meilleur que HTTP1.0 et HTTP1.1-EC
– HTTP1.1-EC comparable à HTTP1.1-D
• À forte charge: – HTTP1.0 meilleur que HTTP1.1-D
– HTTP1.1-EC meilleur HTTP1.0
– HTTP1.1-EC significativement meilleur que HTTP1.1-D
![Page 19: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/19.jpg)
19
Performance subjective: Latence HTML
Accès par modem Accès par WAN
![Page 20: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/20.jpg)
20
Combien de connexions persistantes?
Latence HTML (modem)
Netscape: 6, IE: 2
Temps de réponse (modem)
![Page 21: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/21.jpg)
21
4. Analyse Statistique
• Travaux de caracterisation: – moyenne, ecart type– distributions simples: Pareto, Weibull, LogNormal,
…– Combinaison de Distributions: corps + queue
• Invariances?
• Mixage de distributions
• Algorithme EM
![Page 22: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/22.jpg)
22
Algorithme EM
k
k
kk xfxfxp
,,
1
)()()(
1
1
11
mm
k
k
nxxx
)(
)0(
1
1
1
),,(
),,(
),(
),,(
Calculer ),(,)(log )()( mm QxypE
Trouver )1( m pour maximiser ),( )(mQ
L ’algorithme converge vers un maximum global à partir de presque n’importe quel point de départ
![Page 23: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/23.jpg)
23
Statistiques et Identification de Paramètres
• fichiers de traces de trois serveurs WWW et un Proxy (Clarknet, Inria, Boeing, Worldcup98)
• Variables analysées– tailles des fichiers (réponses)– nombre de clics par session– temps inter-clic – temps d ’inter-arrivée des sessions
![Page 24: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/24.jpg)
24
Analyse des variablesTaille des fichiers
![Page 25: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/25.jpg)
25
Analyse des variables…(suite)
• Traces Clarknet [Arlitt and Williamson, 1996a]
![Page 26: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/26.jpg)
26
Analyse des variables… (suite)
Nombre de clics
![Page 27: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/27.jpg)
27
Analyse des variables… (suite)
Temps inter-clic
![Page 28: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/28.jpg)
28
Analyse des variables ... (suite)
inter-arrivée de sessions
![Page 29: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/29.jpg)
29
5. Conclusions et Perspectives• Conclusions
– Développement d ’un outil de génération de trafic
– Expérimentations
– Nouvelle approche pour la caractérisation du Web
– Découverte d ’invariances
![Page 30: Modélisation et Optimisation du Web](https://reader035.vdocuments.pub/reader035/viewer/2022062221/56813b7f550346895da4a1f9/html5/thumbnails/30.jpg)
30
5. Conclusions et Perspectives• Perspectives
– Evolution de WAGON:• mélanges de distributions pour la génération de trafic
• HTTPn.m
• Autres protocoles que HTTP
• Autres applications
• benchmark pour serveurs proxy-cache
– Caractérisation• raffinement de la méthodologie
• autres variables
• autres fichiers de traces