Download - Le Datamining dans le business décisionnel
-
8/14/2019 Le Datamining dans le business dcisionnel
1/24
-
8/14/2019 Le Datamining dans le business dcisionnel
2/24
Parmi les axes danalyses, on retrouve rgulirement le client, le centre de profit, les produits,
ou le temps auxquels sont associs tout un ensemble de paramtres associs.
Le DataMining prend une ampleur relle et stratgique par rapport un ensemble de facteurs
convergents et notamment :
1. Les progrs technologiques
spectaculaires dans le domaine du DataMining, proprement dit.
2. Linstallation de plus en plus rpandue
des DataWarehouse ainsi que laugmentation exponentielle du nombre de
donnes. De fait, on trouve dans le DataWarehouse de plus en plus de donnes
aussi bien externes quinternes.
3. Les volutions technologiques du
hardware et du software soutiennent lorientation des possibilits danalyses
performantes sur des volumes de donnes de plus en plus importantes.
4. La maturit technologique et
commerciale des outils OLAP (On-line Analytical Process) qui automatisent
les reportings et facilite lanalyse des donnes multidimensionnelles.
5. La gnralisation des besoins
dintelligence mtier pour les diffrents niveaux dutilisateurs.
6. Le besoin de rapprocher des sources de
donnes htrognes nombreuses pour analyser une problmatique de
lentreprise.
De plus, il y a de toute vidence un effet marketing dans le dveloppement des outils du
DataMining, mais il est associ un effet tangible qui est une synthse :
de la chronologiedes concepts dcisionnels, cest--dire, il fallait que lacollecte des donnes soit matrise, que laccs aux donnes soit facilit et enfin que le DataWarehouse se positionnepour que le DataMining commence simposer.
de lvolution technologique et des cots qui font quon peut envisager de mettre en place aujourdhui un projetDataMining un cot intressant.
de laspect OLAP, la base multidimensionnelle qui a permis lutilisateur de se familiariser dans lexploration etlutilisation des donnes dcisionnelles sous un format multidimensionnel.
de la maturit des algorithmes de DataMining qui ont acquis une fiabilit et une diversit qui justifient une rellevaleur ajoute par rapport aux anciennes mthodes statistiques.
En rsum, la prsence concrte du DataMining actuellement est due la conjonction dune
maturit technologie, dune prsence des systmes stabiliss qui rpondent une maturit et
une curiosit de la part des utilisateurs.
2/ Qu'est ce que le DataMining ?
-
8/14/2019 Le Datamining dans le business dcisionnel
3/24
Le DataMining dans son sens le plus large veut dire la recherche des liens schmatiques
dans une base dinformations volumineuse ou complexe dans le but de les transformer en
connaissance.
Ce que lon dsigne comme outils du DataMining dans cette tude sera plus prcisment des
outils automatiss du DataMining, cest--dire, la dcouverte de la connaissance en utilisantune combinaison des techniques inspires des statistiques traditionnelles, de lintelligence
artificielle et des graphiques.
Le DataMining sassimile ainsi une recherche perptuelle des schmas utiles dans les
donnes.
Cette recherche peut tre automatise ou guide manuellement. Linconvnient dun systme
guid manuellement (OLAP, outils de Reporting & de Query) est que lutilisateur doit crer
lui-mme les types de schmas utiliser et il se peut que dans la foule, il ne saperoive pas
ou nglige des schmas moins vidents.
Le DataMining est une mthode de recherche automatise dans la mesure o mme si
lutilisateur doit fournir une certaine quantit de donnes au systme, il ne les orchestre pas
lui-mme pour trouver les schmas exploitables.
Le DataMining permet de donner un sens aux informations dont dispose lentreprise. Cet outil
relve essentiellement de la smantique.
Le DataMining a vu le jour dans les annes 80, quand les professionnels ont commenc se
soucier des grands volumes de donnes informatiques inutilisables tels quels par les
entreprises.
Le DataMining d'alors consistait essentiellement extraire de l'information de gigantesques
bases de donnes de la manire la plus automatise possible; contrairement aujourd'hui o le
DataMining consiste l'analyse qui suit l'extraction des donnes. Le dataMining s'est donc
dissoc du Datawarehouse.
3/ Les objectifs du DataMining
Dans un premier temps, les entreprises ont t appeles constituer des bases oprationnelles
pour permettre de rcuprer des donnes.
Dans un deuxime temps, les entreprises ont essay de valider ces donnes par des outils de
pilotage comme lEIS et le DataWarehouse. Elles se sont mises transformer des donnes en
informations afin de prendre une dcision.
Cest ainsi quon a pu dcouvrir lmergence du systme dcisionnel.
A ce stade du processus, lutilisateur est amen donner une "intelligence" linformation,
par consquent, la problmatique nest plus seulement daccder linformation mais de faire
en sorte que cette information soit interprte selon des rgles de statistique ou dintelligence
artificielle pour lui donner toute sa valeur.
Les principales actions du DataMining sont :
-
8/14/2019 Le Datamining dans le business dcisionnel
4/24
3.1 EXPLIQUER un vnement ou un incidentindiscernable
Par la consultation des donnes grce des outils de tableaux de bord papier ou lectronique,
on peut etre en mesure de formuler la question suivante :
Comment se fait-il que lon perd des clients sur tel segment dans telle rgion ?
En scrutant les donnes automatiquement loutil de DataMining va essayer de trouver un
certain nombre dexplications cette question en se basant sur des donnes connectes ou des
mises en signification de paramtres lis.
Le DataMining va aider trouver des hypothses dexplications.
3.2 CONFIRMER : un comportement ou une hypothse
Par la consultation des donnes grce des outils de tableaux de bord papier ou lectronique,
on peut tre en mesure de formuler la question suivante :
Comment se fait-il que nous perdons des clients sur tel segment dans telle rgion ?
Toujours par la consultation, on essai de trouver un certain nombre dexplications cette
question en se basant sur des donnes connectes ou des mises en signification de paramtreslis.
En appliquant des mthodes statistiques ou dintelligence artificielle, le DataMining va
aider valider les hypothses dexplications que nous avons dcouvertes.
3.3 EXPLORER : les donnes pour dcouvrir un lien"inconnu" jusqu l.
Il ny a pas dide sur une hypothse ou sur un fait prcis. Par consquent, on demande au
systme de proposer des associations ou des corrlations qui pourraient aider dcouvrir des
vnements marquants puis dcouvrir des lments dexplication.
Il serait certainement exagr de croire quun tat de technologie puisse remplacer la
rflexion; par contre, linformatique dcisionnelle par le biais du DataMining peut tout fait
suggrer des associations et des corrlations entre les donnes afin didentifier des hypothses
et faire des propositions mais il reste toujours lhomme-utilisateur de les vrifier et de les
valider dfinitivement.
-
8/14/2019 Le Datamining dans le business dcisionnel
5/24
LE SCHEMA DU
DATAMINING
La connaissance peut se dfinir comme une information enrichie dun contexte et dun savoir
faire.
Les donnes :les donnes sont des donnes brutes provenant des bases de donnes diffrentes comme celles de lacomptabilit, des ventes, dachats ou autres.
Les informations :
X a un revenu suprieur 200KF
X & Y vivent dans les banlieues A & B
La connaissance :
si S a un ordinateur, S est
abonn la revue J
le produit B est achet par des gens qui achtent
les produits E
-
8/14/2019 Le Datamining dans le business dcisionnel
6/24
La dcision :
-
8/14/2019 Le Datamining dans le business dcisionnel
7/24
Bien videmment, lhomognit de la problmatique permet de mieux segmenter le
rfrentiel et dobtenir un systme plus performant.
Pour cela, le DataMining va se baser sur la typologie de la question voque et dans cette
perspective, fournir larchitecte du systme des lments pour son analyse de la structure de
la base de donnes. Le rle de larchitecte du systme consiste alors intgrer les hypothsesafin de proposer le modle de donnes le plus performant en terme de rduction de volumes et
de temps daccs aux donnes.
Aprs ce premier niveau de manipulation (par exemple une segmentation gographique
ralise partir dune notion dadresse), On constitue un DataWarehouse et on est en mesure
de raliser des agrgats plus sophistiqus et plus cibls lintrieur d environnements
relationnels ou multidimensionnels.
Ainsi, seront constitus les datamarts qui peuvent tre de type OLAP si la base
multidimensionnelle permet de faciliter la manipulation des agrgats et des modles
constitus.
De fait, dans lutilisation du terme DataMining cohabitent deux concepts qui ne se situent
pas au mme niveau de la chane du systme dinformations. Dans le schma du
DataWarehouse, lun se trouve trs en amont et lautre se trouve trs en aval.
Dans sa version oriente utilisateur final, le deuxime concept, le DataMining va permettre de
travailler des donnes prsentes dans lenvironnement relationnel aussi bien que
multidimensionnel de type OLAP.
A ce niveau, les informations sont passes par le filtre du DataWarehouse et ont pu tre
enrichies ou orientes lors de leur passage dans les datamarts.
Le travail de loutil DataMining est ainsi facilit ou orient par ce premier niveau de
qualification.
En fait, il est aussi intressant daller chercher des hypothses ou dexpliquer des phnomnes
sur des donnes agrges que de poser des questions sur des donnes plus brutes du
DataWarehouse.
Dans le schma de linformatique dcisionnelle, les diffrentes technologies cohabitent en
remplissant une segmentation de fonction. Le DataMining, simpose aujourdhui comme undes segments stratgiques dans le schma dcisionnel dans la catgorie des outils qui
apportent une valeur ajoute linformation.
5/ Les differents modules
Le DataMining utilise la technique de la modlisation pour faire des dcouvertes ou des
prvisions.
La modlisation comme son nom lindique est le fait de crer un modle partir des situationsconnues dans le but de lappliquer des situations inconnues. Par consquent, le processus de
la cration dun modle partir du balayage et du filtrage des donnes est une tapeprimordiale.
-
8/14/2019 Le Datamining dans le business dcisionnel
8/24
Selon le domaine dapplication, loutil DataMining est en mesure de proposer une technique
diffrente correspondant des algorithmes et une mthode dapproche des donnes adquates.
Ainsi, le DataMining va rpondre des problmatiques de :
5.1 Segmentation
La segmentation permet de fragmenter la base de donnes en segments ayant descaractristiques similaires.
Il sagit ici de dfinir des caractristiques prototypes qui ont des comportements homognes.
5.2 Classification
Ce module est caractristique du DataMining amont. Il se propose de caractriser des groupes
de populations homognes en rapprochant des paramtres possds par chacun des membres.
Ainsi, la classification permet de dvelopper des profils de groupe partir des critres des
enregistrements.
5.3 Prvision
La prvision permet de mesurer linfluence d'un paramtre prsent dans une population sur
lensemble des autres paramtres de cette population.
-
8/14/2019 Le Datamining dans le business dcisionnel
9/24
Ce module partant des informations agrges se situerait plutt sur la partie aval du schma
dcisionnel.
5.4 Association
Lassociation permet danalyser la prsence simultane de valeur de paramtres sur un mme
critre ou sur deux paramtres diffrents.
A lintrieur dun mme critre qui peut avoir plusieurs occurrences pour un membre donn
ou entre deux paramtres, cela peut permettre de constater des liens entre des valeurs
possibles (rappel : critre = paramtre).
5.5Modle Squentiel
Le modle squentiel induit des dcouvertes lies laxe temporel.
Il permet de trouver des modles de comportement qui prsupposent des enchanements
systmatiques qui suivront sur une priode de temps.
5.6 Exemple
Pour concrtiser les notions dcrites par ces modules, on peut effectuer un exemple simplifi
dune population qualifier par rapport un acte dachat d'une voiture haut de gamme dans
les six mois venir.
Les membres de cette population ont des revenus quil conviendra de segmenter pour obtenir
une nomenclature significative et pertinente, cest dire ni trop dilue (trop de segments) ni
trop rduite (pas assez de dtail).
On obtient ainsi des tranches de revenus et lon va devoir connecter cet lment avec dautres
lments intressants par rapport la cible recherche.
Aprs avoir segment les paramtres, afin de prciser la population type par rapport
lobjectif recherch, on classifie les membres de la population pour dterminer une classe de
membre ayant par exemple un type de revenus donn, une voiture moyenne ou haut de
gamme, propritaire de leur logement, ayant une carte de crdit "premier", etc...
Lensemble des critres choisis permet de caractriser une population homogne sur laquelle
on a pu vrifier certains liens entre paramtres. Par exemple, une prvision de probabilit
dachat de vhicule neuf dcrot selon la rcence de la date dachat du logement.
On va donc affiner notre population en la limitant aux personnes ayant acquis leur logementprincipal depuis plus de trois ans.
-
8/14/2019 Le Datamining dans le business dcisionnel
10/24
Par ailleurs, toujours avec la volont daffiner, on remarque grce loutil que lachat de
prestation dhtellerie haut de gamme tait associ souvent lachat de voiture haut de
gamme.
Ainsi on peut rajouter ce critre la dfinition de la population et rduire ainsi le primtre
des personnes potentielles.
Enfin, en analysant les modles squentiels de comportements dachat de voitures, on peut
remarqu grce loutil, une tendance racheter un vhicule neuf de gamme suprieure tous
les deux ans environ ou un achat de vhicule neuf ou doccasion de gamme identique au bout
de trois quatre ans environ.
On peut ainsi se concentrer sur les possesseurs de vhicules depuis deux trois ans maximum.
6/ La methodologie
6.1Mthodologie dexploitation
La mthodologie de mise en uvre du DataMining peut tre dfinie en quatre phases
principales.
6.1.1Pr-tude thmatique
Avant de slectionner les donnes il est primordial de dfinir les typologies dobjectifs et le
cadre mthodologique dans lequel la dmarche DataMining peut amener une valeur ajoute.
Au mme titre, il conviendra de commencer une phase de sensibilisation et dimplication desgroupes dutilisateurs potentiels et notamment parmi ceux de la direction gnrale.
Ayant dfini les diffrents cadres de projet susceptible de correspondre, il convient par la suite
de dterminer les sources et les types de donnes disponibles. Ces donnes internes ou externe
lentreprise , doivent converger vers une zone de stockage de type datawarehouse, mme
de garantir lhomognit, la qualit, lunicit, la lablisation, de linformation
Il est indispensable de rendre les donnes recueillies le plus homogne possible afin dviter
la prolifration des dfinitions pour un seul terme ainsi que la surcharge dinformations
inutiles.
Par exemple, la notion de client est typiquement difficile dfinir quand elle implique
diffrents services de lentreprise.
A la fin de cette tape lentreprise obtient un ensemble de projets sappuyant chacun sur une
base de donnes structure, volumineuses mais identifie.
6.1.2Analyse de la structure des donnes
Lobjectif de cette phase est doptimiser la structure de la base de donne.
-
8/14/2019 Le Datamining dans le business dcisionnel
11/24
Il est possible de rduire le volume
dinformations en diminuant dune
faon pertinente les attributs
concernant ces informations et en
nettoyant la base de donnes.
Ce travail en profondeur sur les
informations reprsente un passage
oblig. Il implique des comptences
"mtier" et des comptences
"DataMining" qui seront
dterminantes pour la qualit des
donnes. La qualit de lanalyse
dpend de la qualit des donnes.
6.1.3Choix dun outil
Il est ncessaire de bien connatre les objectifs et la nature des analyses attendues afin de
dterminer larchitecture technique et les plates-formes outils impliques dans le processus de
DataMining.
Il est galement primordial de dterminer les profils des utilisateurs concerns afin de
comprendre leur capacit apprhender un outil ou une technologie plutt quune autre.
Il existe actuellement sur le march franais un certain nombre doutils de DataMining. Les
principaux sont cits dans les fiches dditeurs se trouvant la fin de cet ouvrage.
Certains outils de DataMining sont englobs dans dautres outils dcisionnels tels que des
requteurs ou des EIS.
Ainsi dans le choix de loutil interviendront plusieurs critres tels que :
la technologie
les types dutilisateurs
les sources de donnes
les typologies danalyse
le mtier
....
6.1.4Mise en uvre de loutil choisi
La mthodologie dexploitation de loutil DataMining peut se dfinir en huit tapes comme
dcrit ci dessous :
-
8/14/2019 Le Datamining dans le business dcisionnel
12/24
Lune des caractristiques principales de la mthodologie du DataMining sappuie surle fait quelle est itrative et quelle permet de rcuprer les informations obtenues afin de les intgrer dans le systmedcisionnel de lentreprise.
7/ Les techniques
Derrire la terminologie du DataMining se positionnent des outils bass sur des techniques
diffrentes.
Dcouverte de rgles
Arbres de dcision
Signal Processing
Fractales
Rseaux neuronaux
Hybride
7.1Dcouverte de rglesValider ou proposer un schma de fonctionnement des donnes partir de rgles connues ou inconnues.
Cette technique consiste demander au systme daller chercher dans les donnes une
validation dune rgle connue ou de dcouvrir lui-mme une rgle. On essais ici de construire
une logique procdurale dans les donnes.
7.2Arbres de dcision
Dterminer les critres significatifs dans un arbre de paramtres selon les poids statistiques
des valeurs constates.
-
8/14/2019 Le Datamining dans le business dcisionnel
13/24
Cette technique consiste formaliser un arbre qui va procder une analyse critre par
critre.
Loutil DataMining va scanner diffrents critres possibles afin dessayer dy retrouver des
propositions en arbre daprs les poids statistiques qui auront un sens et qui permettront
ensuite de trouver des liens entre les chemins qui ont une signification par rapport laproblmatique donne.
7.3Signal Processing
Filtrer les donnes afin de mettre en vidence des comportements de donnes.
Cette technique consiste positionner les donnes et les filtrer travers une hypothse pour
essayer de faire apparatre un lien entre ces donnes.
7.4Fractales
Composer des segmentations partir de modles mathmatiques bass sur des regroupements
irrguliers de donnes.
7.5Rseaux neuronaux
Utiliser des technologies dintelligence artificielle afin de dcouvrir par lapprentissage du
moteur des liens non procduraux.
Ces deux dernires techniques sappuient sur des algorithmes mathmatiques (Fractales) et
dintelligence artificielle (Rseaux neuronaux) et tentent travers des mthodes
dapprentissage de constituer des logiques non procdurales.
8/ Les outils du DataMining
Editeur
Outil
Technique utilise
Angoss
Knowledgeseeker Arbres de dcision
Business Forecast
Systems
Forecast Pro Prvision
Cross/Z International F-DBMS Fractales
-
8/14/2019 Le Datamining dans le business dcisionnel
14/24
Inc.
Datamind
Datamind Dtection de modles,
prdictions, hybride
IBM
Intelligent Miner Prvision
Information Discovery
IDIS Dcouverte de rgles
Integrated Solutions
Ltd.
Clmentine Arbres de dcision,
Rseaux neuronaux
Isoft
Alice Arbres de dcision
MIT GMbH
Data Engine Signal Processing
Netral
Neuro One Rseaux neuronaux
NeuralWare
Predict Rseaux neuronaux
PMSI
Saxon Rseaux neuronaux
RIS
4Thought Rseaux neuronaux
SAS Institute
SAS System Statistiques, arbres de
dcision, rseaux
neuronaux
Silicon Graphics
Mine Set Arbres de dcision,
dcouverte de rgles
SLP Infoware
STATlab Statistiques
SPSS
Neural Connection
SPSS Chaid
Rseaux neuronaux
Arbres de dcision
9/ Les diverses applications
Depuis lapparition du concept de DataMining, il existe une tendance lassocier
exclusivement aux domaines du marketing et de la grande distribution.
Il est certain que le DataMining reprsente un outil "exceptionnel" pour les directionsmarketing, mais de nombreuses autres fonctions de lentreprise peuvent tre concernes.
-
8/14/2019 Le Datamining dans le business dcisionnel
15/24
Afin de mieux comprendre les liens et les corrlations caches quun outil de DataMining
peut dnicher, voici quelques exemples concrets dinformations provenant de lutilisation de
cette famille doutils.
9.1Par fonctionMarketing:
Comportement des consommateurs : dcouverte de comportements dachats coupls dans le cadre dune
politique promotionnelle. Cela a permis un accroissement de la rentabilit des politiques promotionnelles dune chanede magasins.
Marketing direct: augmentation du taux de retour des mailings (75 80%) grce un meilleur ciblage des envois.
Fidlisation de la clientle : une banque a trouv des relations et des comportements inconnus jusqualors en
vrifiant lactivit des comptes clients. Cela lui a permis de dfinir une nouvelle cible marketing et de la fidliser pardes moyens plus appropris son comportement.
Segmentation de clientle : dcouverte dune niche de petite taille dont le revenu est trs lev, inconnue par le
service marketing.
Optimisation dun rseau dagence grce la dcouverte des couples cible/produit et produit/march.
Ressources humaines:
Politique dacceptation et de rejet des candidatures
Politique dvolution des carrires
Ventes:
Prvision des ventes
Dcouverte de cycles de ventes
Qualit:
Analyse de satisfaction des clients
Typologie des clients
Dtection des fraudes
Pricing:
Dtermination des prix par rapport des catgories et des comportements dachat.
-
8/14/2019 Le Datamining dans le business dcisionnel
16/24
etc... :
Analyse financire, Gestion des stocks, Logistique, etc..
9.2 Par Secteur
Les secteurs dactivit dans lesquels le DataMining est dj prsent sont de plus en plus
nombreux.
Aprs la grande distribution aux Etats-Unis, cible historique, le DataMining est apparu dans
dautres secteurs tels que :
Transport : pour rduire lover-booking qui cotait trs cher aux entreprises.
Sant
Assurance
Tlcommunications
Gouvernement : Trsor amricain.
Banque : American Express - pour rduire le nombre de rsiliations des cartes
de crdit.
Electronique : pour cibler les garanties des appareils.
Automobile : pour dterminer le niveau de fabrication qui provoque le plus de pannes.
Electricit
9.3Par Utilisateur
Aujourdhui le DataMining est utilis par des personnes ayant un profil et des exigences bien
particulires. Nous les avons classs en quatre groupes distincts :
Lutilisateur final = est lutilisateur qui ne connat pas la technologie duDataMining et ne veut surtout pas y tre confront. Il est en gnral protg par des crans "presse-boutons". Ildemande loutil de DataMining de lui apporter des solutions ses problmes particuliers.
Le statisticien = est lutilisateur qui est passionn par la technique et souhaite y treconfront. Il demande loutil de DataMining dtre "puissant" et riche en fonctionnalits.
Le business analyste = est lutilisateur le plus hybride car il connat un peula technique et trs bien son mtier. Il demande loutil de DataMining dtre facile utiliser tout en lui laissantquelques choix technologiques.
Le scientifique = est lutilisateur le plus difficile satisfaire car il a toujours une longueurdavance par rapport la technique. Cest le scientifique qui permet aux outils de DataMining dvoluer.
10/ Fiches diteurs
-
8/14/2019 Le Datamining dans le business dcisionnel
17/24
Les diteurs cits sont les principaux acteurs du DataMining prsents sur le march franais.
Ce mmoire est un aspect volutif par rapport aux diteurs.
En effet, le march du DataMining est en pleine croissance et de nombreux acteurs du march
amricain vont sans doute arriver en France.
Par consquent, il ne sera pas possible de pouvoir tous les cits.
10.1 ANGOSS
IDENTITE SOCIETE :
ANGOSS SOFTWARE
66, rueEscudier
92100 Boulogne
PRINCIPAUX OUTILS DE LEDITEUR :
- Knowledge seecker
10.2 DATA MIND
IDENTITE SOCIETE :
DATAMIND France S.A.
31, rue du Pontjkh
92200 Neuilly-Sur-Seine
PRINCIPAUX OUTILS DE LEDITEUR :
- DataMind Professional Edition (version monoposte Windows)
- DataMind Data Cruncher TM (version serveur Unix, NT)
DOMAINES DAPPLICATION :
- Marketing
- Commercial
- Production/Qualit
- Ressources Humaines
-
8/14/2019 Le Datamining dans le business dcisionnel
18/24
- Contrle de gestion
- SAV
TECHNOLOGIES ASSOCIEES :
Extraction faite partir des bases relationnelles, des bases multidimensionnelles et des
fichiers plats.
10.3 HOLISTIC
IDENTITE SOCIETE :
HOLISTIC FRANCE
31, bld de la Paix
78200 Saint-Germain-en-Laye
PRINCIPAUX OUTILS DE LEDITEUR :
- Holos
10.4 IBM
IDENTITE SOCIETE :
IBM FRANCE
Tour Descartes - La Dfense 5
2, avenue Gambetta
Courbevoie
Hauts de Seine.
PRINCIPAUX OUTILS DE LEDITEUR :
- Intelligent Miner (S/390, RS/600, AS/400)
DOMAINES DAPPLICATION :
- Marketing- Vente
TECHNOLOGIES ASSOCIEES :
Extraction faite partir des bases relationnelles et des fichiers plat.
-
8/14/2019 Le Datamining dans le business dcisionnel
19/24
10.5 ISOFT
IDENTITE SOCIETE :
ISOFT SA / ALICE SA
Chemin de Moulon
91190 Gif-sur-Yvette
PRINCIPAUX OUTILS DE LEDITEUR :
- ALICE (Version standard & Windows 3.11, Windows 95/NT)- AC2 (Windows 16 et 32 bits, Unix)
DOMAINES DAPPLICATION :
- Marketing commercial
- Marketing direct
- Finance (Analyse et risque)
- Etude et sondage
- Ressources humaines
- Etude clinique (sant)
TECHNOLOGIES ASSOCIEES :
Extraction faite partir des bases relationnelles, des bases multidimensionnelles et des tableurs.
10.6 PILOT
IDENTITE SOCIETE :
PILOT SOFTWARE
101-109, rue Jean Jaurs
92300 Levallois-Perret
PRINCIPAUX OUTILS DE LEDITEUR :
- Pilot discovery server
DOMAINES DAPPLICATION :
- Marketing
-
8/14/2019 Le Datamining dans le business dcisionnel
20/24
TECHNOLOGIES ASSOCIEES :
Extraction faite partir des bases relationnelles
10.7 SAS Institute
IDENTITE SOCIETE :
SAS INSTITUTE
BP 5
77166 Evry Gregy
DOMAINES DAPPLICATION :
- Marketing
- Marketing direct
- Scoring
- Analyse comportementale
- Ressources humaines
- Etude clinique (sant)
TECHNOLOGIES ASSOCIEES :
Extraction faite partir des bases relationnelles, des bases multidimensionnelle SAS, des fichiers plat, des feuilles decalcul et des progiciels.
10.8 Silicon Graphics
IDENTITE SOCIETE :
SILICON GRAPHICS
21, rue Albert Calmette
78350 Jouy-en-Josas
PRINCIPAUX OUTILS DE LEDITEUR :
- Logiciel MINESET
TECHNOLOGIES ASSOCIEES :
-
8/14/2019 Le Datamining dans le business dcisionnel
21/24
Extraction faite partir des bases relationnelles
10.9 SLP INFOWARE
IDENTITE SOCIETE :
SLP Infoware
51, rue Ledru Rollin
94853 Ivry-sur-Seine Cedex
PRINCIPAUX OUTILS DE LEDITEUR :
- STATlab : Analyse exploratoire
- DATAboard : Gnrateur de tableaux de bord et de rapports- DATAMAN : Datamart multidimensionnelle
DOMAINES DAPPLICATION :
- Marketing
- Commercial
- Qualit de service
- Ressources humaines
- Contrle de gestion
- Etudes
TECHNOLOGIES ASSOCIEES :
Extraction des donnes faites partir des bases relationnelles, des tableurs, des fichiers statistiques et des progiciels.
11/ Glossaire
11.1 Agents intelligents.Les agents intelligents sont des programmes d'exploration de rseaux dans le but d'analyser et d'en extraire de l'information.On peut les diviser en deux groupes principaux :
Les agents de recherche dinformation peuvent apporter des lments de rponse la question pose par unutilisateur, dans un langage plus ou moins proche du langage naturel, en explorant rapidement des volumesimportants dinformations et en triant celles qui ont un rapport avec la question de lutilisateur. Citons lexemple de laquestion suivante laquelle ils peuvent apporter une aide prcieuse : "Quelles sont les agences de la rgion Ouest ola vente de placements financiers est suprieure la moyenne franaise ?"
Les agents de traitement peuvent tre programms par lutilisateur ou ladministrateur pour effectuer intervallesrguliers des tches de recherche, de mise jour de bases, dextraction ou de traitement. Par exemple : lelancement durant la nuit de requtes personnalises pour chaque responsable dagence bancaire, lalimentation duncube multidimensionnel de ces donnes et ldition dun tableau de bord quotidien sur limprimante de lutilisateur.
-
8/14/2019 Le Datamining dans le business dcisionnel
22/24
11.2 Base de donnes
La base de donnes o sont stockes les informations extraites des bases de production est le
composant principal du DataWarehouse.
On peut y retrouver des diffrents fichiers concernant les clients ainsi que des " tiquettes" quiindiquent les liens entre les diverses donnes -client/article ou client/facture, par exemple.
La cration de ces nombreux index ncessite un volume de stockage important, par
consquent, une base de donnes DataWarehouse ou "entrept de donnes" peut atteindre des
tailles considrables, savoir, plusieurs Gigaoctets ou mme des Teraoctets de donnes .
Les bases de donnes peuvent tre de diffrentes types :
- hirarchiques.
- relationnelles (stockage des donnes sous forme de tables).
- multimdia (stockage non seulement des donnes mais aussi des images et des sons).
- orientes objets.
-multidimensionnelles (stockage/rangement des donnes en plusieurs "dimensions" que
l'utilisateur peut croiser sa convenance pour rpondre la question pose).
11.3 Base de donnes mutlidimensionnelles
Une base de donnes multidimensionnelle est une base dont les donnes sont stockes de
manire optimiser le croisement entre les donnes.
La base multidimensionnelle est reprsente par un cube en 3D bien quelle ne soit pas limite
aux trois dimensions. En effet, elle peut grer jusqu quinze ou vingt dimensions la fois.
Seul inconvnient, laugmentation des dimensions fait accrotre galement le nombre des
croisements entre les donnes et ceci ralentit considrablement les temps de rponse.
11.4 Base de donnes relationnelles
La base de donnes relationnelle, modle de stockage le plus utilis en informatique, prsente
une organisation de linformation sous forme de tables.
11.5 Base de production
Dans un environnement DataWarehouse, on appelle frquemment bases de production, ou
encore systmes oprants, les bases de donnes utilises par les applications non
dcisionnelles de lentreprise.
Dans cette catgorie, entrent les systmes comptables, les bases de gestion commerciale, les
systmes de paie, les bases de gestion de production industrielle....
-
8/14/2019 Le Datamining dans le business dcisionnel
23/24
11.6 Business intelligence
Ce terme, cre par le Gartner Group, regroupe les requteurs, les outils danalyse
multidimensionnels dont la base est stocke en local, ainsi que certains outils de DataMining -
des outils de bureautique destins un oprationnel par opposition un informaticien.
11.7 Data Marts
Le Datamart est un sous ensemble du DataWarehouse. Il contient les donnes de lentreprise,
lis un mtier tels que le marketing ou la comptabilit, par exemple.
Il peut contenir des donnes provenant des divers domaines de lentreprise linverse de la
base de production. Il maintient le lien avec lentrept de donnes et le dictionnaire,
permettant ainsi de retrouver lorigine dune information.
11.8 DataMiningLes outils dits de DataMining, traduisible par "forage des donnes", ou "prospection des donnes", permettent de slectionner, la place de lutilisateur un certain nombre de donnes.
Les diffrentes techniques utilises dans les outils de DataMining sont les suivantes :- Dcouverte des rgles- Arbres de dcision- Signal Processing- Fractales- Rseaux neuronaux- Hybride
11.9 DataWareHouse
Le DataWarehouse ou l entrept de donnes a deux dsignations :
- la base dans laquelle sont stockes lensemble des informations
- lensemble du systme dinformation dcisionnel.
11.10 EISUn EIS (Executive Information System) est un outil qui permet de visualiser des donnes de
lentreprise sous forme de tableaux de bord prablement conus. A la diffrence dun SIAD, il
ne permet pas de poser une question qui naurait pas t prvue initialement.
11.11 Mta-donnes.Les mta-donnes sont les donnes sur les donnes, cest--dire, lensemble des informations qui vont qualifier une donne.
-
8/14/2019 Le Datamining dans le business dcisionnel
24/24
11.12 OLAP
Le systme OLAP (On-Line Analytical Processing) Processing) est une architecture qui
privligie lanalyse multidimensionnelle li linformatique dcisionnelle sur le traitement
transactionnel li aux bases de production.
La norme OLAP a t dfinie par un chercheur amricain, E.F. Codd.
Dans linformatique dcisionnelle, lOLAP se situe gnralement au niveau des data marts.
11.13 OLTP
Le systme OLTP (On-Line Transaction Processing), galement dfinis par E.F. Codd dans
les annes 1970 est appliqu dans les bases de production (comptabilit, gestion commerciale,
gestion de production, gestion bancaire,...).
Il gre des transactions dtailles (ligne de commande, mouvement bancaire,...).
11.14 Outils d'alimentation
Les outils dalimentation figurent en amont dans le schma de linformatique dcisionnelle.
Ces outils sont utiliss pour rcuprer les donnes des bases de production, systmes oprants,
les convertir, les transformer et enfin les stocker dans lentrept de donnes. Ils serventgalement grer et mettre jour les mtadonnes.
Conclusion
LE FUTUR ... DES OUTILS DECISIONNELS :
Le DataMining pourrait reprsenter une avance importante dans linformatique dcisionnelle.
Dans la phase pr-DataMining, les outils dcisionnels servaient principalement accder aux
donnes ou mettre en place des simulations simples connues et prouves.
Aujourdhui, avec le DataMining et le DataWarehouse, les outils dcisionnels accdent ltape danalyse des donnes.
Et demain, de quoi sera fait la phase post-DataMining ?
Les outils dcisionnels de demain arriveront-ils un tel niveau de sophistication quils
permettront de prendre des dcisions en donnant aux utilisateurs des "recommandations" en
temps rel ?
Dans tout les cas, il restera aux utilisateurs en faire bon usage... et cela n'est certainement
pas la partie la moins intressante du processus de management.