andmeladu ja mitmemõõtmeline vaade andmetele

16
Andmeladu ja Mitmemõõtmeline vaade andmetele SEMINAR POLITSEIAMETIS 11.09.2006 HENN SARV WWW.SARV.EE/FTP/HENN/POLAMET

Upload: azana

Post on 11-Jan-2016

62 views

Category:

Documents


4 download

DESCRIPTION

Andmeladu ja Mitmemõõtmeline vaade andmetele. SEMINAR POLITSEIAMETIS 11.09.2006 HENN SARV WWW.SARV.EE/FTP/HENN/POLAMET. Ariprotsess versus analüüs. Andmed tekivad äriportsessis Neid talletatakse Andmeid analüüsitakse otsustusprotsessis Otsused mõjutavad äriprotsessi. Infosüsteemi ootused. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Andmeladu ja Mitmemõõtmeline vaade andmetele

Andmeladu ja Mitmemõõtmeline vaade

andmetele

SEMINAR POLITSEIAMETIS11.09.2006HENN SARV

WWW.SARV.EE/FTP/HENN/POLAMET

Page 2: Andmeladu ja Mitmemõõtmeline vaade andmetele

Ariprotsess versus analüüs

Andmed tekivad äriportsessis

Neid talletatakseAndmeid

analüüsitakse otsustusprotsessis

Otsused mõjutavad äriprotsessi

Page 3: Andmeladu ja Mitmemõõtmeline vaade andmetele

Infosüsteemi ootused

Äriprotsessis – Business Support Systems Hõlbutsada äriprotsess Kiiresti leida üksikuid Kiiresti talletada toiminguid Täpsus ja kiirus andmete muutmisel Reaalajas toimingud - OLTP

Otsustusprotsessis – Desicion Support Systems Hõlbutsada otsustusprotsessi Kiiresti leida seoseid, hulki Kiiresti teha üldistusi Reaalajas analüüs - OLAP

Page 4: Andmeladu ja Mitmemõõtmeline vaade andmetele

OLAP versus OLTP

OLTPOLTP OLAPOLAP

Äriprotsess Palju tabeleid Normaliseeritud Jooksvad andmed Muutuvad andmed Mõõdukalt indekseid

Analüüs Vähe tabeleid Denormaliseeritud Andmed ajas Staatilised andmed Palju indekseid

Page 5: Andmeladu ja Mitmemõõtmeline vaade andmetele

Normaliseerimine

3-normaalkuju3-normaalkuju denormaliseerituddenormaliseeritud

Kiired muudatused Väike andmemaht Optimeeritud

kindlatele muudatustele (toimingutele)

Kiired päringud Suur andmemaht Optimeeritud

“suvalistele” päringutele

Page 6: Andmeladu ja Mitmemõõtmeline vaade andmetele

Andmelao komponendid

Data Warehouse

Andmete poole pöördumine (vaade)

Kasutaja rakendusLähteandmed

Andmete liikumine (ülekanne)

AndmehoidlaAndmeaidad

Page 7: Andmeladu ja Mitmemõõtmeline vaade andmetele

DW terminid

Lähteandmed (OLTP-süsteemid)Andmeladu (andmete kogumiskoht, ka kogu

DW)Andmeait (spetsiaalselt korrastatud

analüütilised andmed)

Andmekaevandus – kogutud andmete baasil uue info loomine

Page 8: Andmeladu ja Mitmemõõtmeline vaade andmetele

Andmeülekanne

Andmete reorganiseerimineAndmete teisendusedAndmete vääristamineAndmete valideerimine

Page 9: Andmeladu ja Mitmemõõtmeline vaade andmetele

Andmekaevamise võtted

Kruvimine, puurimine, drill Down – sisse, detailiseerimine Up – välja, üldistamine Läbi – cross, kõrvutamine Üle – through, lähteandmete lappamine

Statistilised meetodid Klastrid Otsustusteed

Page 10: Andmeladu ja Mitmemõõtmeline vaade andmetele

Andmelao ülesehitus

Dimensioonid Kirjeldavad tabelid andmete mingi aspekti kohta Palju veerge (tunnuseid) Keskmiselt või palju kirjeid

Faktitabelid Andmetabelid ühe või mitme äriportsessi tegelike

andmetega Vähe veerge (võtmed ja faktid) Väga palju ridu

Page 11: Andmeladu ja Mitmemõõtmeline vaade andmetele

Tähtskeem

Fact TableDimension Table

Employee_DimEmployee_DimEmployee_DimEmployee_Dim

EmployeeKeyEmployeeKey

EmployeeID...

EmployeeID...

Time_DimTime_DimTime_DimTime_Dim

TimeKeyTimeKey

TheDate...

TheDate...

Product_DimProduct_DimProduct_DimProduct_Dim

ProductKeyProductKey

ProductID...

ProductID...

Customer_DimCustomer_DimCustomer_DimCustomer_Dim

CustomerKeyCustomerKey

CustomerID...

CustomerID...

Shipper_DimShipper_DimShipper_DimShipper_Dim

ShipperKeyShipperKey

ShipperID...

ShipperID...

Sales_FactSales_Fact

TimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey

TimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey

Sales AmountUnit Sales ...

Sales AmountUnit Sales ...

Page 12: Andmeladu ja Mitmemõõtmeline vaade andmetele

Dimensioonid

LiikmedTasemedHierarhiad

Page 13: Andmeladu ja Mitmemõõtmeline vaade andmetele

Dimensioonid, tasemed, liikmed

Product DimensionNeli taset: All,

Category, Sub-Category, Product

Category taseme liikmed: Bread, Dairy, Meat

Page 14: Andmeladu ja Mitmemõõtmeline vaade andmetele

Faktitabel

Suur, kitsas ja lameVälisvõtmed

Naturaalvõti versus surrogaatvõti

Faktid Liidetavad Loendatavad Osaliselt liidetavad

Degenereeritud dimensioonid

Page 15: Andmeladu ja Mitmemõõtmeline vaade andmetele

Q4Q1 Q2 Q3Time Dimension

Produ

cts D

imen

sionDallas

Denver

Chicago

Mar

kets

Dim

ensi

on

Apples

CherriesGrapes

AtlantaSales Fact

Melons

Mitmedimensiooniline vaade andmetele

Page 16: Andmeladu ja Mitmemõõtmeline vaade andmetele

Mõned tüüpilised dimensioonid

Aeg Võti Erinevad kalendrid Erinevad skaalad Erinevad tunnused

Isik Võti Isikukood Nimed Muud jaotused