intégration des données et etl - cours.etsmtl.ca · source: “eii - etl – eai what, why, and...

Post on 16-Apr-2018

245 Views

Category:

Documents

12 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MTI820 −Entrepôtsdedonnéesetintelligenced’affaires

IntégrationdesdonnéesetETL

1DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers

Lecycledevied’unprojetenBI• Diagrammedefluxdetravail:

2

Planificationdeprojet/programme

Définitiondes

besoinsd’affaires

Conceptiondel’architecturetechnique

Modélisationdesdonnées

Conceptiondesapplicationde

BI

Sélectionetinstallationdes

produits

Conceptionphysique

ConceptionetdéveloppementdusystèmeETL

Développementdesapplications

deBI

Déploiement

Croissance

Maintenance

Gestiondeprojet/programme

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers

Question• Pourquoiest-ilnécessairedefairel’intégrationdes

données?

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 3

Lesproblèmesdessourcesdedonnées1. Sourcesdiversesetdisparates;

2. SourcessurdifférentesplateformesetOS;

3. Applicationslegacy utilisantdesBDetautrestechnologiesobsolètes;

4. Historiquedechangementnon-préservédanslessources;

5. Qualitédedonnéesdouteuse etchangeantedansletemps;

6. Structuredessystèmessourceschangeantedansletemps;

7. Incohérenceentrelesdifférentessources;

8. Donnéesdansunformatdifficilementinterprétableouambigu.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 4

Question• Quellessontlesprincipalesapprochesd’intégrationet

quelssontleursprincipauxavantages/inconvénients?

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 5

Approches d’intégration

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 6

Source:“EII- ETL– EAIWhat,Why,andHow!”,TomYu,2005

IBM Software Group

13

Information Integration – Data Patterns

EII

StructuredData Source

unstructured

LegacyData Source

Data Virtualization

SQL(or Content)

� Real-time information access� Federation of data from multiple

sources� Dynamic drill down� Semi-structured & unstructured

data

EAI

Application

Application

Application

InterpretTransform

Route

� Process based integration of application data

� Message-based, transaction-oriented processing

� Workflow and data orchestration, content-based routing

DataSource

DataSource

extract

transform

load

Target /Data

Warehouse

ETL

� Bulk data integration � Set-based & hierarchical

transformations� High scale, batch-oriented data

delivery

Extract,TransformandLoad• Intégrationetlivraison desdonnées enlot

• Transformationsappliquéessur lesdonnées

EnterpriseInformationIntergration• Fédération dedonnées provenantdeplusieurs sources

• Accès temps-réel auxdonnées• Données structuréesou semi-structurées

IBM Software Group

13

Information Integration – Data Patterns

EII

StructuredData Source

unstructuredLegacy

Data Source

Data Virtualization

SQL(or Content)

� Real-time information access� Federation of data from multiple

sources� Dynamic drill down� Semi-structured & unstructured

data

EAI

Application

Application

Application

InterpretTransform

Route

� Process based integration of application data

� Message-based, transaction-oriented processing

� Workflow and data orchestration, content-based routing

DataSource

DataSource

extract

transform

load

Target /Data

Warehouse

ETL

� Bulk data integration � Set-based & hierarchical

transformations� High scale, batch-oriented data

delivery

EnterpriseApplicationIntergration• Processus d’intégrationdesdonnées d’applications

• Basé sur l’échange demessagessur unbuscommun

IBM Software Group

13

Information Integration – Data Patterns

EII

StructuredData Source

unstructuredLegacy

Data Source

Data Virtualization

SQL(or Content)

� Real-time information access� Federation of data from multiple

sources� Dynamic drill down� Semi-structured & unstructured

data

EAI

Application

Application

Application

InterpretTransform

Route

� Process based integration of application data

� Message-based, transaction-oriented processing

� Workflow and data orchestration, content-based routing

DataSource

DataSource

extract

transform

load

Target /Data

Warehouse

ETL

� Bulk data integration � Set-based & hierarchical

transformations� High scale, batch-oriented data

delivery

Extract,TransformandLoad(ETL)• Caractéristiques:

– Permetlaconsolidationdesdonnéesàl’aidedestroisopérationssuivantes:• Extraction:identifieretextrairelesdonnéesdesourcesayantsubiunemodificationdepuisladernièreexécution;

• Transformation:appliquerdiverses transformationsauxdonnéespourlesnettoyer,lesintégreretlesagréger;

• Chargement:insérerlesdonnéestransforméesdansl’entrepôtetgérerleschangementsauxdonnéesexistantes(ex:stratégiesSCD).

– Traitenormalement degrandequantitésdedonnéesenlotscédulés;

– Estsurtoututiliséaveclesentrepôtsdedonnéesetlescomptoirsdedonnées.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 7

Extract,TransformandLoad(ETL)• Avantages:

– Optimisépourlastructuredel’entrepôtdedonnées;– Peuttraiterdegrandesquantitésdedonnéesdansunemême

exécution(traitementenlot);– Permetdestransformationscomplexesetagrégationssurles

données;– Lacéduled’exécutionpeutêtrecontrôléeparl’administrateur;– Ladisponibilitéd’outilsGUIsurlemarchépermetd’améliorer la

productivité;– Permetlaréutilisationdesprocessusettransformations(ex:

packages dansSSIS).

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 8

Extract,TransformandLoad(ETL)• Inconvénients:

– Processusdedéveloppement longetcoûteux;– Gestiondeschangementsnécessaire;– Exigedel’espacedisquepoureffectuerlestransformations

(staging area);– Exécutéindépendamment dubesoinréel;– Latencedesdonnéesentrelasourceetl’entrepôt;– Unidirectionnel (dessourcesversl’entrepôtdedonnées).

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 9

EntrepriseInformationIntegration (EII)• Caractéristiques:

– Fournitunevueunifiéedesdonnéesdel'entreprise,oùlessourcesdedonnéesformentunefédération;

– Lessourcesdedonnéesdispersées sontconsolidées àl'aided'uneBDvirtuelle, demanièretransparenteauxapplicationsutilisantcesdonnées;

– TouterequêteàlaBDvirtuelle estdécomposéeensous-requêtesauxsourcesrespectives,dontlesréponsessontassembléesenunrésultatunifiéetconsolidé;

– Permetdeconsolideruniquement lesdonnéesutilisées,aumomentoùellessontutilisées (sourcedata pulling).

– Letraitementen-ligne desdonnéespeutcependantentraînerdesdélais importants.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 10

EntrepriseInformationIntegration (EII)• Avantages:

– Accèsrelationnelàdessourcesnon-relationnelles;

– Permetd’explorerlesdonnéesaveclacréationdumodèledel’entrepôtdedonnées;

– Accélèreledéploiement delasolution;

– PeutêtreréutiliséparlesystèmeETLdansuneitérationfuture;

– Aucundéplacementdedonnées.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 11

EntrepriseInformationIntegration (EII)• Inconvénients:

– Requiert lacorrespondancedesclésd’unesourceàl’autre;

– Consolidationdesdonnéespluscomplexequedansl’ETL;

– Surtaxelessystèmesources;

– Pluslimitéquel’ETLdanslaquantitédedonnéespouvantêtretraitée;

– Transformationslimitées surlesdonnées;

– Peutconsommerunegrandebandepassanteduréseau.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 12

EntrepriseApplicationIntegration (EAI)• Caractéristiques:

– Approchepermettantdefourniràl'entrepôtdesdonnéesprovenantdessources(sourcedatapushing);

– Reposesurl'intégrationetlepartagedesfonctionnalitésdesapplicationssourcesàl'aided'unearchitectureSOA;

– Généralementutiliséentempsréelouensemi-temps réel(NearRealTime);

– L'EAIneremplacepasleprocessusETL,maispermetdesimplifiercedernier.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 13

EntrepriseApplicationIntegration (EAI)• Avantages:

– Facilitel’interopérabilitédesapplications;– Permetl’accèsen(quasi)temps-réel;– Netransfèrequelesdonnéesnécessaires;– Contrôleduflotdel’information.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 14

EntrepriseApplicationIntegration (EAI)• Inconvénients:

– Supportlimitéauxtransformationsetagrégationsdesdonnées;– Tailledestransactionslimitée(ennombredelignes);– Développement complexe;– Gestioncomplexedel’intégritésémantiquedesdonnées (e.g.,

règlesd’affaires);– Utiliselabandepassanteduréseaudurantlesheuresdepointe.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 15

Comparaison entrelesapproches d’intégrationETL EII EAI

Flot dedonnées Unidirectionnel(sourcesà l’entrepôt)

Bidirectionnel Bidirectionnel

Mouvement dedonnées

Lotscédulés Aumoment delarequête

Déclenché parlatransaction

Latence Journalier à mensuel Temps-réel Quasitemps-réel

Transformations/agrégations desdonnées

Grandecapacité Moyenne capacité Faible capacité

Volumedesdonnées Grand(millionsoumilliardsdelignes)

Moyen(10,000 –1,000,000delignes)

Petit(100-1000 lignes)

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 16

Quand utiliser lesapproches d’intégration• ApprocheETL:

– Consolidationd’unegrandequantitédedonnées– Transformationscomplexes

• ApprocheEII:– Relierunentrepôt(EDW)existantavecdesdonnéesdesources

spécifiques– Donnéessourcesvolatilesetaccessiblesàl’aidederequêtes

simples(ex:SQL).

• ApprocheEAI:– Intégrationdetransactions– Requêtesanalytiques simples– Sourcesnon-accessiblesdirectement

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 17

Exemplesdeproduitscommerciaux• OutilsETL:

– OracleWarehouse Builder;– IBMInfosphere InformationServer;– MicrosoftSQLServerIntegration Services(SSIS);– SASDataIntegration Studio.

• OutilsEAI:– IBMWebSphereMessageBroker;– MicrosoftBizTalkServer;– OracleSOASuite.

• OutilsEII:– SAPBusinessObjects DataFederator;– IBMWebSphereFederation Server.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 18

Question• Quellessontlesprincipalesétapesdansle

développementdusystèmeETL?

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 19

Tâchesetétapesdel'ETL

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 20

Déterminer lesdonnéesnécessairesàlasolutiondeBI

Déterminer lessourcesinternesetexternesrenfermantcesdonnées

Définirlesrèglesd'extractiondesdonnéescibles

Définirlesrèglesdetransformationetdenettoyagedesdonnées

Planifierlesagrégationsdedonnées

Préparerlestaging area etlesoutilsd'assurancequalité

Définirlesprocédurespourlechargementdedonnées

ETLdestablesdedimension

ETLdestablesdefaits

Extractiondesdonnées• Identificationdessources:

1. Énumérer lesitemscibles(métriquesetattributsdedimension)nécessairesàl'entrepôtdedonnées;

2. Pourchaqueitemcible,trouverlasourceetl'itemcorrespondantdecettesource;

3. Siplusieurssourcessonttrouvées,choisirlapluspertinente;4. Sil'itemcibleexigedesdonnéesdeplusieurssources,former

desrèglesdeconsolidation;5. Sil'itemsourcerefermeplusieursitemscibles(ex:unseul

champspourlenometl'adresseduclient),définirdesrèglesdedécoupage;

6. Inspecterlessourcespourdesvaleursmanquantes.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 21

Extractiondesdonnées• Extractioncomplète:

– Capturel'ensemble desdonnéesàuncertaininstant(snapshotdel'étatopérationnel);

– Normalementemployée dansdeuxsituations:1. Chargementinitialdesdonnées;2. Rafraîchissementcompletdesdonnées(ex:modification

d'unesource).– Peutêtretrèscoûteuseentemps(ex:plusieursheures/jours).

• Extraction incrémentale:– Captureuniquement lesdonnéesquiontchangéesouontété

ajoutéesdepuisladernièreextraction;– Peutêtrefaitededeuxfaçons:

1. Extractiontemps-réel;2. Extractiondifférée(enlot).

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 22

Question• Commentpeut-onextrairelesdonnéesquiontchangées

danslessources:– Entemps-réel?– Endifféré(lot)?

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 23

BDsources

Extractiondesdonnées• Extractiontemps-réel:

– S'effectueaumomentoùlestransactionssurviennentdanslessystèmessources.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 24

triggersOption1:Captureàl'aidedesjournauxdetransactions

Journaldetransactions

Fichiersgénérésparlessources

Systèmesopérationnels

sources

Fichiersgénérésparlestriggers

Zonedepréparationdedonnées(staging area)

Option3:Capturedanslesapplicationssources

Option2:Captureàl'aidedetriggers

Extractiondesdonnées• Option1:Captureàl'aidedujournaldestransactions

– UtiliseleslogsdetransactionsdelaBDservantàlarécupérationencasdepanne;

– AucunemodificationrequiseàlaBDouauxsources;– Doitêtrefaitavantlerafraîchissementpériodiquedujournal;

– Paspossibleaveclessystèmeslegacy oulessourcesàbasedefichiers(ilfautuneBDjournalisée).

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 25

Extractiondesdonnées• Option2:Captureàl'aidedetriggers

– Desprocéduresdéclenchées(triggers)sontdéfiniesdanslaBDpourrecopierlesdonnées àextrairedansunfichierdesortie;

– Meilleurcontrôledelacaptured'évènements;– ExigedemodifierlesBDsources;– Paspossibleaveclessystèmeslegacy oulessourcesàbasedefichiers.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 26

Extractiondesdonnées• Option3:Captureàl'aidedesapplicationssources

– Lesapplicationssourcessontmodifiées pourécrirechaqueajoutetmodificationdedonnéesdansunfichierd'extraction;

– Exigedesmodificationsauxapplicationsexistantes;– Entraînedescoûtsadditionnelsdedéveloppement etde

maintenance;– Peutêtreemployé surdessystèmes legacy etlessystèmesà

basedefichiers.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 27

BDsources

Extractiondesdonnées• Extractiondifférée:

– Extraittousleschangementssurvenusdurantunepériodedonnée(ex:heure,jour,semaine,mois).

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 28

Extractiond'aujourd'hui

Fichiersd'extractionutilisantlestimestamps

Systèmesopérationnels

sources

Fichiersd'extractionutilisantla

comparaisonZonedepréparation

dedonnées(staging area)

Option1:Capturebaséesurlestimestamps

Option2:Captureparcomparaisondefichiers

Programmed'extraction

Extractiond'hier

Programmedecomparaison

Extractiondesdonnées• Option1:Capturebaséesurlestimestamps

– Uneestampille(timestamp)d'écritureestajoutéeàchaquelignedessystèmessources;

– L'extractionsefaituniquement surlesdonnéesdontletimestamp estplusrécentqueladernièreextraction;

– Fonctionneaveclessystèmeslegacy etlesfichiersplats,maispeutexigerdesmodificationsauxsystèmessources;

– Gestioncompliquéedessuppressions.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 29

Extractiondesdonnées• Option2:Captureparcomparaisondefichiers

– Comparedeuxsnapshots successifsdesdonnéessources;– Extraitseulement lesdifférences(ajouts,modifications,suppressions)entrelesdeuxsnapshots;

– Peutêtreemployésurdessystèmeslegacy etlessystèmesàbasedefichiers,sansaucunemodification;

– Exigedeconserverunecopiedel'étatdesdonnéessources;

– Approcherelativement coûteuse.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 30

Extractiondesdonnées• Considérations pratiques:

– Choisir,pourchaquesource,lafenêtretemporelledurantlaquelle serafaitel'extraction;

– Déterminer laséquencedestâchesd'extraction;– Déterminer commentgérerlesexceptions.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 31

Question• Quellessontlestransformationsàeffectuersurles

donnéessourcesavantdeleschargerdansl’entrepôt?

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 32

Transformationdesdonnées• Typesdetransformation:

1. Révisiondeformat:• Ex:Changerletypeoulalongueurdechampsindividuels.

2. Décodagedechamps:• Consoliderlesdonnéesdesourcesmultiples

– Ex:['homme','femme']vs['M','F']vs[1,2].• Traduirelesvaleurscryptiques

– Ex:'AC','IN','SU'pourlesstatutsactif,inactif etsuspendu.

3. Pré-calculdesvaleursdérivées:• Ex:profit calculéàpartirdeventes etcoûts.

4. Découpagedechampscomplexes:• Ex:extrairelesvaleursprénom,secondPrénom etnomFamille

àpartird'uneseulechaînedecaractèresnomComplet.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 33

Transformationdesdonnées• Typesdetransformation(suite):

5. Fusiondeplusieurschamps:• Ex:informationd'unproduit

– Source1:codeetdescription;– Source2:typesdeforfaits;– Source3:coût.

6. Conversiondejeudecaractères:• Ex:EBCDIC(IBM)versASCII.

7. Conversiondesunitésdemesure:• Ex:impérialàmétrique.

8. Conversiondedates:• Ex:'24FEB2011'vs'24/02/2011'vs'02/24/2011'.

9. Pré-calculdesagrégations:• Ex:ventesparproduitparsemaineparrégion.

10. Déduplication:• Ex:Plusieursenregistrementspourunmêmeclient.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 34

Transformationdesdonnées• Problèmederésolutiond'entités:

– Survientlorsqu'unemêmeentitéseretrouvesurdifférentes sources,sansqu'onaitlacorrespondanceentrecessources;• Ex:clientsdelonguedateayantunidentifiantdifférentsurlesdifférentessources;

– L'intégrationdesdonnées requiertderetrouverlacorrespondance;– Approchesbaséessurdesrèglesderésolution

• Ex:lesentitésdoiventavoiraumoinsNchampsidentiques(fuzzylookup /matching).

• Problèmedessourcesmultiples:– Survientlorsqu'uneentitépossèdeunereprésentationdifférentesur

plusieurssources;– Approchesdesélection:

• Choisirlasourcelaplusprioritaire;• Choisirlasourceayantl'informationlaplusrécente.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 35

Transformationdesdonnées• Gestiondeschangementsdimensionnels:

– Déterminer lastratégiedegestiondeschangements(SCDType1,2ou3)dechaqueattributdimensionnelmodifié;

– Préparerl'imagedechargement(load image)enconséquence:• SCDType1:anciennevaleurécrasée;• SCDType2:nouvelleligneajoutée;• SCDType3:déplacementdel'anciennevaleurdanslacolonned'historiqueetécrituredelanouvellevaleurdanslacolonnecourante.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 36

Exemplesdetransformations:(SSIS)

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 37

Transformationdesdonnées• Matricedetransformation:

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 38

Champs cible Table cible Champs source Table source Règle de transformation

Chargementdesdonnées• Typesdechargement:

– Chargementinitial:• Faituneseulefoislorsdel'activationdel'entrepôtdedonnées;• Lesindexesetcontraintesd'intégritéréférentielle (cléétrangères) sontnormalementdésactivés temporairement;

• Peutprendreplusieursheures.

– Chargementincrémental:• Faitunefoislechargementinitialcomplété;• Tientcomptedelanaturedeschangements(ex:SCDType1,2ou3);• Peutêtrefaitentemps-réelouenlot.

– Rafraîchissement complet:• Employélorsquelenombredechangementsrendlechargementincrémentaltropcomplexe;

• Ex:lorsqueplusde20%desenregistrementsontchangédepuisledernierchargement.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 39

Chargementdesdonnées• Considération additionnelles:

– Faireleschargementsenlotdansunepériode creuse(entrepôtdedonnéesnonutilisé);

– Considérer labandepassanterequisepourlechargement;– Avoirunplanpourévaluer laqualitédesdonnéeschargéesdans

l'entrepôt;– Commencerparchargerlesdonnéesdestablesdedimension.

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 40

Extract,Load andTransform (ELT)

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 41

Source:RalfGoetz,Whatisthefundamentaldifferencebetween“ETL”and“ELT”intheworldofbigdata?,2017

Datalake

Extract,Load andTransform (ELT)• ProblèmesavecETL:

– Traite lesdonnées importantesaumomentdelaconception;– Développement longetcomplexe.

• SolutionELT:– UtiliselestechnologiesBigData (ex:Hadoop,Spark,etc.);– Chargementsrapides,potentiellement temps-réels;– Lacsdedonnées(datalakes)permettent lesdonnéesnon-structurées;

– Transformationsfaitesaumomentdelarequête;– TechnologiesmoinsmaturesqueETLetimplémentation pluscomplexe(ex:codeJavavsoutildédié).

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 42

Extract,Load andTransform (ELT)

DépartementdegénielogicieletdesTI MTI820Hiver2011– ©S.Chafki,C.Desrosiers 43

Entrepôts dedonnées Lacsdedonnées

Données Structurées,traitées Semi-/non-structurées,brutes

Traitement Schéma-à-l’écriture Schéma-à-la-lecture

Stockage Coûteux pourgrandesquantités

Stockage à faible coût

Agilité Moins agile,configurationfixe Hautement agile,reconfiguration aubesoin

Sécurité Mature Moins mature

Utilisateurs Professionnels d’affaires Experts en datascience

top related