du data warehouse au webhouse : le croisement des réseaux et des bases de données du data...
Post on 03-Apr-2015
112 Views
Preview:
TRANSCRIPT
Du Data WareHouse au Du Data WareHouse au WebHouse : WebHouse :
le croisement des réseaux et le croisement des réseaux et des bases de donnéesdes bases de données
Du Data WareHouse au Du Data WareHouse au WebHouse : WebHouse :
le croisement des réseaux et le croisement des réseaux et des bases de donnéesdes bases de données
Samira Silhadi-HacidSamira Silhadi-HacidMalika TarafiMalika Tarafi
SommaireSommaire
1. Des Bases de Données au Data Warehouse2. Du Data Warehouse au Data Webhouse
Aide à la décison en ligne
Evolution des systèmes d’aide à la décisionEvolution des systèmes d’aide à la décision
1960
- Fichiers- Programmes (Cobol)- Rapports
1965
- ComplexitéMaintenanceDéveloppement
- Synchronisation des données- Matériel
Beaucoup de fichiers
SSADSGBD
Base de données – ’’Source unique pour tous les traitements’’
1970
OLTP1975
OLTP
1980
SAD
PCs, Technologie 4GL
OLTP
1985
ExtracteurExtracteur
Pourquoi l’extraction ?- Performance- Contrôle
1990
’’Attitude laissez-faire’’
- Crédibilité des données- Productivité- Difficulté à transformer les données en information
Problèmes :Problèmes :
ProductivitéProductivité
Ex: Produire un rapport consolidé => Localiser les données
Localiser les données : 9-12 moisLocaliser les données : 9-12 mois
Obtenir les données : 15-24 moisObtenir les données : 15-24 mois
=> explorer de nombreux fichiers
Solution!Solution!
Changement dans l’approcheChangement dans l’approche
Fichier BD
Donnéesexternes
EntrepôtEntrepôtde Donnéesde Données
EntrepôtEntrepôtde Donnéesde Données
DM DM
SIG OLAP
SAD
MétaDonnées
MétaDonnées
Administrateur
SourcesSources
ChargeursChargeurs
ClientsClients
Entrepôts de Entrepôts de donnéesdonnées
Un entrepôt est défini comme un ensemble de données intégrées, variables dans le temps qui sont utilisées dansle processus d’aide à la décision. C’est une grosse base de données qui organise les données opérationnelles pour faciliter l’analyse.
-Marché estimé à plus de $20 Milliards avec une
progression de 10 à 20% par année.- 95% des 1000 grandes entreprises américaines équipées
d’un ED.
Il y a dix ans : Le DW est une sorte de ressource pour la gestion. Il est interrogé de façon non urgente.
Aujourd’hui :
-Volume de données généré par le Web important ex.: Pages Microsoft analysées => plus de 1 Milliard
d’événements
-Temps de réponse : le Web rend critique ’’ les temps de réponse aux requêtes’’
Ces considérations vont changer la façon de concevoir et d’implanter les entrepôts de données.
- Tout entrepôt de données doit être visible à partir des interfaces de navigation du Web- Il est demandé à l’entrepôt de données d’enregistrer les requêtes (manipulations) des clients et de les rendre disponibles pour l’analyse
Le E-commerce :
- Collection de données propres (récupérées électroniquement)
Yahoo! 1 milliard de pages visitées par jour
Le Web est un laboratoire expérimental pour les entrepôts de données
Quelques applicationsQuelques applications
’’Business Intelligence’’
Proposé par IBM, Microsoft, Oracle, …
’’Consolider la quantité gigantesque de données atomiques que les entreprises génèrent en information que les gens peuvent accéder, comprendre et utiliser’’
- Data Mining
’’Business Intelligence’’: présenter l’information dans des formats plus utiles, en utilisant des outils de visualisation avancés et des techniques d’IA
Marché : $3.5M (2002) $8.8M (2004)
Vente de livres par amazon
ED TraditionnelED Traditionnel
Achats Achats précédentsprécédents
Achats Achats précédentsprécédents
RecommandationsRecommandationsRecommandationsRecommandationsEDED ComportementsComportements
EDTREDTR
Achats Achats actuelsactuelsAchats Achats actuelsactuels
RecommandationsRecommandationsRecommandationsRecommandationsEDED ComportementsComportements
Exemple d’application : offres ciblées – offres personnalisées en temps réel.
FichiersFichiersLogsLogs
Transfor-Transfor-mateurmateur
WebhouseWebhouse
AutreBD
DataMining
AnalyseurAnalyseurGénérateurGénérateurde rapportsde rapports
RapportsRapports
Possibilités pour le traitement de gros volumes de données
Taille Fichiers Logs
Temps de traitementFichiers Logs sur réseau
Temps de traitementFichiers Logs sur Même machine
100 Mo 8 min 4 min1 Go 44 min 23 min2.5 Go 1h12min 48 min5 Go 2h8min 1h32min
Pentium III700 MHz1 Go RAM100 Mbit Ethernet
Système ’’Peer-to-Peer’’
ApplicationApplication ServeurServeurServeurServeur
PC
PC
PC
PC
PC
DWDW
DonnéesDonnéesMarchéMarché
(Application Wall Street)
Internet : - Faciliter la gestion de la chaîne d’approvisionnement
(Just-in-Time)
ConclusionConclusion
- Recherche de l’emploi
- Achats, …
- Faire passer l’OLAP du domaine de l’analyste au domaine du consommateur => aide à la décision sur Internet
Prochaine grande étape pour les entrepôts de données
« Support des fonctions de planification collaborative »
Unifier marketing, finance et opérations prévisionsprévisions
BibliographieBibliographie
http://www.cs.toronto.edu/~mendel/dwbib.html
http://www.dwinfocenter.org/
http://www.datawarehousingonline.com/
http://www.cio.com/research/data/
http://www.intelligententerprise.com/
top related