adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes ›...

14
Adattárház kialakítása nyílt forráskódú eszközökkel Ragasits Csaba Sopron Bank Zrt. 2012

Upload: others

Post on 25-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Adattárh áz kialak ítása ny ílt forrásk ódú eszk özökkel

Ragasits CsabaSopron Bank Zrt.

2012

Page 2: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Sopron Bank Zrt.

Page 3: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Bank és az Open Source

Page 4: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Miért kezdtünk adattárházat építeni?

• Nagyon kevés a lekérdezési lehetőség– Szövegfájl kimenet, manuális futtatás

– Optimalizálás tranzakciókra

• Új lekérdezés csak a szállítón keresztül– Lassú átfutás– Magas költség

• Helyi nyilvántartások

Page 5: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Fejlesztési folyamatok

• Fejlesztés nulláról, kis lépésekben• SCRUM• Mindig csak az adott feladatra

koncentrálunk:– Gyorsan tudunk használható megoldást adni– Sokszor kell visszatérni az alapokhoz

– Van amit utólag nehéz berakni

Page 6: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Felhasználói csoportok

• Halandók– Előre gyártott, paraméterezhető riportok,

lekérdezések– Csak a szükséges adatokhoz lehet hozzáférni

• Félistenek– Saját adatpiac, munkaterület– Lekérdezések készítése

• Szerénységem– A fejlesztő

Page 7: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Adatbázis-kezelő

• PostgreSQL– A Bank preferált adatbázis-kezelője– OLTP, DW rendszerek szétválasztása

• Replikáció (Master + Slave)• Terheléseloszlás (pgpool)

– Monitorozás (Nagios, Munin)– Kis adatbázis méret

• Csak a szükséges adatok tárolása, nézetek használata• Horizontális, vertikális particionálás, materializált nézetek

– IO a szűk keresztmetszet

Page 8: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

ETL

• Saját eszköz– Egy forrásrendszer– Soros feldolgozás– Primitív hibakezelés

• Pentaho PDI (Kettle)– Több forrásrendszer– Párhuzamos

feldolgozás– Intelligens hibakezelés

• Főbb feldolgozások– Forrásrendszerek– Historizmus, OLAP– Előkészítés– Adatszolgáltatás– Külső adatok

feldolgozása– Felhasználó

tevékenységek

Page 9: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Riportok

• Jaspersoft BI Community Edition– Fontos, hogy mindenki csak az engedélyezett

adatokhoz férhessen hozzá– Bevezetéskor megoldott feladatok

• AD authentikáció• AD-ban megadott jogosultságok• Forrásrendszerekben megadott jogosultságok• Magyar nyelvű kezelőfelület

– Riportok ütemezett futtatása– Verzióváltás 3.7 -> 4.5

• Font problémák javítása

Page 10: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Egyedi lekérdezések

• MS Access– Lassú lekérdezések– Riport készítéshez újra kell

írni

• Fly Speed SQL Query– Natív SQL, optimalizálási

lehetőség– lekérdezések– Könnyű riportkészítés

• Jelenleg az Access teljesen visszaszorult

• Lekérdezési szigetek– Egyedi lekérdezés gyűjtemények– Párhuzamos lekérdezés készítés eltérő

eredményekkel– A megoldásra eszköz keresése, vagy saját fejlesztés

Page 11: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Analízis

• Felhasznált eszközök– Pentaho Mondrian

– Jasperserver + jPivot

• Hópehely séma• Felhasználói fogadtatás

– jPivot nehezen használható

– FlySpeed-ben gyorsabb megírni– A jövőben talán a Jedox PALO

Page 12: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Jövőbeli lehetőségeink

• Folyamatos a fejlesztés

• Elértük a FOSS lehetőségek határait• Az analízis megszerettetése

• Az üzleti terület támogatása (Dashboard, KPI)• A DW beépítése üzleti folyamatokba, előtét

rendszer

• Az első adatbányászat (RapidMiner)

Page 13: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Összefoglalás

• Létrehoztunk egy adattárházat• Ahol lehetett nyílt forráskódú eszközöket

használunk• A fejlesztés nem áll meg• Az adattárház a Bank mindennapi

életének szerves része

Page 14: Adattárház kialakítása nyílt forráskódú eszközökkelopensourcebi.hu › letoltes › osbi2012 › open_source_bi... · • Pentaho PDI (Kettle) – Több forrásrendszer

Köszönöm a figyelmet!

Ragasits [email protected]@ragasits