nrb - plateforme big data pour la wallonie
TRANSCRIPT
2
La solution : La PFI BigData
Les enjeux pour la Région wallonne1
2
BigData: les concepts3
Différentes applications par secteur4
La plateforme BigData pour les Pôles: le Hub5
Les services offerts par la plateforme6
L’architecture de la plateforme
The B
ig D
ata
Pla
tform
7
Comment conserver l’avantage concurrentiel obtenu grâce au Plan Marshall?Maîtriser l’information globale
Comment garantir une politique de Gouvernance et de sécurité des données pour certains secteurs?Healthcare
Comment éviter la fuite des cerveaux? Emplois à haut potentiel
Comment industrialiser plus rapidement les résultats de la rechercheTime to Market
3
Les enjeux pour la Région wallonne
3
2
1
4
• Master global Information• Local Data• Open Data
Conserver l’avantage compétitif apporté par le
Plan Marshall
• Private Cloud• Local Storage
• 2 Data centersProtection des données
• Emplois à haut potentiel• Data Scientist• Business Scenario Modeler (BSM)
Eviter la fuite des cerveaux
• Centres de recherche• Universités• Entreprises IT
Mettre les compétences en commun
4
La solution: La PFI(*) Bigdata
(*) – Plateforme d’Innovation
5
Volume : énorme volume de données (presque illimité)
Varieté : structuré, non-structuré, documents, videos, sons, social media (Facebook, Twitter, …)
Vélocité : quasi temps réel or temps réel
Valeur : identifie la valeur réelle de la donnée (modèles prédictifs, modèles analytiques)
Visualisation : cela compte vraiment (Web 2.0, maps, smartphone, …)
BigData: Les Concepts
BI Traditionnel Advanced Analytics
J.Wieczorek 20/04/2015
Data Mart/Warehouse
Traditional BI
ERP
Data Visualization
Application 1
StructuredData
External
Analysis Scorecards Dashboards KPI’s
Unstructured
DataExternal
Predictive
DescriptivePrescriptiv
eCognitiv
e
+ Advanced Analytics
7
Dans l’assurance et la Banque:• Détection de
Fraude• Churn
Prediction• Risk
Management
Dans l’Industrie :• Capacity
Management• Predictive
Maintenance• Marketing
Dans le Healthcare:• Monitoring
temps réel des patients
• Validation de diagnostic
Les Pouvoirs Locaux :• Smartcities• Building
intelligents• Services à la
population• Sécurité
Dans les Utilities:• Smart Metering• Grid
Management
Différentes applications du BigData par secteur
J.Wieczorek 20/04/2015
Quelques valeurs ajoutées
Valeur ajoutéeAu travers du Bigdata
AugmenterCash Flow
AssetEfficiency
Gouvernance
Améliorationprocessus
Productivité
RisqueSecurité
Intelligence
CustomerInsight
OptimisationRessources
9
La plateforme BigData pour les Pôles de compétitivité : le Hub
9
Big Data Infrastructure
Plateforme BigData
10
Les services offerts par la plateforme Bigdata
10
ExplorationExploration
Descriptive AnalyticsDescriptive Analytics
Diagnostic AnalyticsDiagnostic Analytics
Prescriptive & Predictive AnalyticsPrescriptive & Predictive Analytics
Value Chain
CREATION COLLECT STORAGE PROCESS ANALYZE VISUALIZE
DashboardDashboard
PACKAGESPACKAGES
Adhoc-QueryAdhoc-Query
ReportingReporting
OutsourcingOutsourcing
Enabled
Disabled
Portefeuille de services
Consultance Design Implementation
Run
Définition du scope ( choix du service Analytics )
Experts Business
Business scenario modeller
Design
Customisation de l’existant
packages Analytics :
predictive, prescriptive, descriptive,diagnostic,..
Recherche & Experimentation
de nouveaux algorithms ou de nouveaux package analytics
Deploiement du package analytics ou bien de l’ algorithme
Execution
Maintenance
Un service « end-to-end »
Computation cloud based on dedicated Vblock Two dedicated infrastructures for Hadoop
service Shared infrastructure in secondary data center
PowerfullInfrastructure
High Velocy
L’architecture de la Plateforme
13
Stream
Batch Collector (ETL)
Capture (CDC)
Social Media
ClusterHadoop
Appliance
Predictive
Visualization
Analytics
Exploration
Master Data Management (MDM) Data security et Data privacy (Audit / Non répudiation)
StreamBatch Collector (ETL)
Capture (CDC) Social Media
Predictive
Visualisation
Analytics
Exploration ClusterHadoop
Our pricing Model
Pour chaque Package, Equation du type:
aX + bY + cZ = …………€/moisVolume Processing Visualisati
on
valeur a b c
unité Giga Time of processing (hour)
# users/tool
Un modèle flexible et instantané
Exemple: Package Dashboard• 500 giga de données mensuelles;• processées sur 24 heures;• 5 users Dashboard
TOTAL: 500 x 3 + 24 x 10 + 5 x 70 = 2.090 €/mois