duombazė. didelĖ ir judri

29
Duombazė DIDELĖ ir judri judri

Upload: agile-lietuva

Post on 05-Dec-2014

562 views

Category:

Documents


0 download

DESCRIPTION

Tado Makčinsko skaitytas pranešimas Agile Dienoje 2013 gegužės 9d. Pastoviai susiduriame su problemomis valdant ir administruojant duomenų bazes. NoSQL duomenų bazės dėl savo lankstumo padeda spręsti nemažai DB architektams ir administratoriams kylančių iššūkių. NoSQL padeda susidoroti su neprognozuojama plėtra, dideliais duomenų srautus, lengvai integruojasi su iteratyviu procesu, leidžia pamiršti skausmingą DB migravimo procesą. DB schemų projektavimas, toks kokį mes žinome šiandiena, jau praeityje?

TRANSCRIPT

Page 1: Duombazė. DIDELĖ ir judri

Duombazė

DIDELĖ ir j u d r i j u d r i

Page 2: Duombazė. DIDELĖ ir judri

/urs/bin/whoami

Didelių duomenų technologinis architektas [email protected]

@mctadas

http://bit.ly/12a0hkB

Page 3: Duombazė. DIDELĖ ir judri

Kur

Page 4: Duombazė. DIDELĖ ir judri

siaubo istorija

http://bit.ly/15wOJfI

Page 5: Duombazė. DIDELĖ ir judri

Reliacinė duomenų

bazė

Page 6: Duombazė. DIDELĖ ir judri

ACID savybės

Neskaidoma (angl. ATOMICITY): Viskas arba nieko

Vientisa (angl. CONSISTENCY): Bet kuri transakcija perkelia

DB iš vienos vientisos būsenos į kitą nepažeisdama kitų savybių

Izoliuota (angl. ISOLATION): Operacijos negali prieiti prie

duomenų, kurie šiuos metu yra modifikuojami kitos dar nepasibaigusios transakcijos

Tvari (angl. DURABILITY): Galimybė atstatyti patvirtintas

transakcijos nutikus bet kokiam sistemos sutrikimui (transakcijų log’as)

Page 7: Duombazė. DIDELĖ ir judri

DB schemų apjungimas

http://bit.ly/140wISs

Page 8: Duombazė. DIDELĖ ir judri

Startuolis

Didelis neapibrėžtumas

Greiti ir dažni pokyčiai

Laukiamas eksponentinis augimas

Visuomet pasiekiamas servisas

http://bit.ly/YC4wr0

Page 9: Duombazė. DIDELĖ ir judri

Sistemos poreikiai

Nepertraukiamas prieinamumas

Atsarginė sistema

Greitas duomenų prieinamumas

Užklausų balansavimas

Geografiškai jautrūs duomenys

Page 10: Duombazė. DIDELĖ ir judri

NoSQL

Page 11: Duombazė. DIDELĖ ir judri
Page 12: Duombazė. DIDELĖ ir judri

Gidas į NoSQL

http://bit.ly/12OBIY9

Vientisumas

Prieinamumas

Toleruoja atskyrimą

Page 13: Duombazė. DIDELĖ ir judri

Analitika Architektūra Programavimas Testavimas

Krioklinis metodas

Analitika Architektūra Programavimas Testavimas Analitika Architektūra Programavimas Testavimas

Agile procesas

Analitika Architektūra Programavimas Testavimas Analitika Architektūra Programavimas Testavimas

Agile procesas + Agile įrankiai

Page 14: Duombazė. DIDELĖ ir judri

Mitas ar realybė

Page 15: Duombazė. DIDELĖ ir judri

DB architektas

Page 16: Duombazė. DIDELĖ ir judri

Pirmieji sprintai (db schema)

Lankstūs duomenų tipai

Iš anksto neapibrėžta schema

Key-Value duomenų surišimas

DB migravimas, praeitis

DB projektavimas paprastas

Page 17: Duombazė. DIDELĖ ir judri

Lenglvas DB projektavimas

Page 18: Duombazė. DIDELĖ ir judri

Lengvas DB plečiamumas

Page 19: Duombazė. DIDELĖ ir judri

Pavojai skaidant DB (sharding)

Page 20: Duombazė. DIDELĖ ir judri

Automatizuotas duomenų skaidymas

Page 21: Duombazė. DIDELĖ ir judri

DB savininkas ir tvarka

Page 22: Duombazė. DIDELĖ ir judri

Harmonija tarp kodo ir DB

Page 23: Duombazė. DIDELĖ ir judri

Transakcijų kompromisas

Page 24: Duombazė. DIDELĖ ir judri

Palaikomos transakcijos

Page 25: Duombazė. DIDELĖ ir judri

pasirinkti

Page 26: Duombazė. DIDELĖ ir judri

Reliacinė DB geras pasirinkimas

OLTP – programų aibė vykdanti ACID transakcijas. (geriausias kombinacija tarp duomenų kokybės ir greitaveikos)

Reikia užtikrinti duomenų teisingumą nepriklauso nuo

jais besinaudojančių sistemų.

Klausimus užduodami DB nėra žinomi (ad-hoc)

Sudėtingi duomenų tarpusavio sąryšiai

Yra poreikis palaikyti SQL

Page 27: Duombazė. DIDELĖ ir judri

NoSQL DB geras pasirinkimas

Įvykiais paremtos transakcijos

Hierarchiniai objektai sistemoje

Paskirstyta sistema veikianti debesyje.

Masiškai įrašomi duomenys

Reikalinga lanksti schema ir lankstūs duomenų tipai

Greiti ir nepriklausomi nuo apkrovimo DB skaitymai

Dinaminis lentelių kūrimas

Programuotojų komanda atsakinga už duomenų DB

Page 28: Duombazė. DIDELĖ ir judri

Hadoop geras pasirinkimas

Jeigu duomenys tampa per dideli paskaičiuoti ant vieno serverio (DWH)

Jeigu reikia išsaugoti TB-us įvairių duomenų su galimybe juose atlikti analizę ir reikia jus analizuoti laiko intervalais (angl. time series analysis)

Page 29: Duombazė. DIDELĖ ir judri

Kiti klausimai