NoSql : Schémas, requêtage et optimisation
Pierre Couzy, MicrosoftAlexandre Morgaut, 4D
Code / Développement
@piercou@amorgaut
• Les trois V de Big Data– Vitesse– Volume– Versatilité
• Quelques spécificités Cloud
Quel intérêt ?
Quel NoSql ?
http://highlyscalable.wordpress.com/2012/03/01/nosql-data-modeling-techniques/
• Tous des descendants de memcache ?– Memcache – Redis– Azure Table storage – Mongo– Neo4j– Wakanda
Quel NoSql ?
demoTRY XXX ON LINE
• En apparence, juste quelques verbes
• Des problèmes de format
• Des problèmes de contexte
REST
demoCONNECTÉ OU REST(Concurrence et Transactions)
• La gestion d’état
• L’impact sur la concurrence
• L’impact sur les transactions
Les spécificités
• Les structures apportées par chaque base
Schémas et capacités de modélisation
demoEXPLORATION DES BASES
• Le schéma est dans l’application
• La base n’assure pas d’intégrité
• Les transactions ont un impact
Conception des Schémas
• Index• Table scan• Map Reduce• Jointures– Document embeddé ou collection externe
• Vues
Les modes de requêtage
• Conception du schéma– 1/ Modélisation logique des entités– 2/ Recensement des requêtes depuis les besoins– 3/ Phase de modélisation sur les
entités/relations
• En apparence du très standard.
Le processus de conception
• Peu ou pas de jointures
• Le requêtage pilote la conception du schéma
• Pas d’index
La modélisation
• Optimisation– 1/ dev (processus plus itératif que d’habitude)– 2/ Ops (splitter sa charge / monitorer)– 3/ Evaluer l’impact du (futur) sharding
Rapprochez-vous
Regroupez-vous
N’attendez plus
Composez tout ça
Séparez vos workloads
Une anecdote pour terminer ..
• Questions / Réponses
Merci !