bdm_11122012_4
DESCRIPTION
upravljanje poslovnim podacima slajdoviTRANSCRIPT
-
12/16/2012
1
SKLADITE PODATAKA 2.0
PROF. DR.SC. DRAENA GAPAR
11.12.2012.
UPRAVLJANJE POSLOVNIM
PODACIMA
OCJENJIVANJE - izmjena
Pronai poduzee za case study
Analiza izvora podataka za donoenje odluka u odabranom poduzeu [Z1] prezentiranje rezultata (max 10 bodova)
Istraiti mogunosti uporabe drugih izvora podataka prezentiranje rezultata [Z2] (max 10 bodova)
Izrada dimenzijskog modela za data mart prezentiranje rezultata [Z3] (max 40 bodova)
Definiranje izvora podataka za data mart prezentiranje rezultata [Z4] (max 10 bodova)
Izrada Politike upravljanja podacima prezentiranje rezultata [Z5] (max 15 bodova)
Preporuke za unapreenje upravljanja podacima u poduzeu [Z6] (max 15 bodova)
Aktivnost na nastavi max 20 bodova
5
10
5
-
12/16/2012
2
TEST 15 MINUTA
PITANJA ZA DISKUSIJU
Prva generacija skladita podataka otvorena pitanja
DW 2.0
Osnovne znaajke DW 2.0
DW 2.0 komponente
-
12/16/2012
3
PRVA DW GENERACIJA OTVORENA PITANJA
Naglasak na izgradnji DW i pohranjivanju
podataka, danas na odravanju
Integriranje podataka se dominatno odnosilo na
numerike, transakcijske podatke
Nije bilo razmiljanja o ivotnom ciklusu podataka
Upravljanje meta i matinim podacima
U poetku je DW bilo novitet, danas je osnovica za potporu odluivanju
U poetku je DW vieno kao podatkovna osnovica za statistike analize, dans je to istraivako (exploration) DW
DW 2.0. GENERACIJA
Nova paradigma se fokusira na:
Osnovne tipove podataka
Podatkovne strukture
Kako povezati podatke i formirati mono skladite podataka koje ispunjava potrebe organizacije za
informacijama
-
12/16/2012
4
DW 2.0. GENERACIJA
Trokovi DW infrastrukture se ne poveavaju kontinuirano
Infrastruktura se dri na okupu pomou meta podataka, meta podaci su kimeni stup DW 2.0
Podaci su brzo dostupni. Podaci se smjetaju prema vjerojatnosti pristupa
Prepoznata je potreba za arhiviranjem
DW privlai ogromne koliine podataka. Ali, u DW 2.0 podaci su smjeteni po sektorima, tako da krajnji korisnik ima posla sa znaajno manje podataka
Inmon, Strauss, Neushloss
DW 2.0 The Architecture for the Next Generation of Data Warehousing.
2008.
-
12/16/2012
5
DW 2.0. OSNOVNE ZNAAJKE
ivotni ciklus podataka
Meta podaci
Pristup podacima
Strukturirani / nestrukturirani podaci
Tekstualna analitika
Tehnoloka osnovica
Promjene poslovnih zahtjeva
Tok podataka unutar DW 2.0
Koliine podataka
Korisne aplikacije
DW 2.0. OSNOVNE ZNAAJKE
IVOTNI CIKLUS PODATAKA
DW 1.0 nije prepoznavalo potrebu za praenjem ivotnog ciklusa podataka
DW 2.0 prepoznaje ivotni ciklus podataka ukljuuje razliite sektore:
1. podaci brzo ulaze u Interaktivni (Interactive) sektor
2. podaci se integriraju i prosljeuju u Integrirani (Integrated ) sektor i ostaju tu dok se ne smanji vjerojatnost pristupa (3-4
godine)
3. Iz Inegriranog sektora podaci se mogu prebaciti u jedan od
dva sektora. Jedan je Blizu linije (Near line) sektor
(opcionalan), kao proirenje Integriranog sektora u situaciji kada postoji iznimno velika koliina podataka i gdje se vjerojatnost pristupa znaajno razlikuje
4. Posljednji sektor arhivski (archival) sektor
-
12/16/2012
6
DW 2.0. OSNOVNE ZNAAJKE
IVOTNI CIKLUS PODATAKA
OnLine
obrada
Dozvoljeno
auriranje
DW 2.0. MAIN CHARACTERISTICS
THE LIFE CYCLE OF DATA
No update
Podaci se
agregiraju,
zbrajaju,
rekonstruiraju
Nema auriranja Pohrana kao
serija snapshota
-
12/16/2012
7
DW 2.0. MAIN CHARACTERISTICS
THE LIFE CYCLE OF DATA
Meta
podaci
Kriteriji:
-Starost -Vjerojatnost
pristupa
DW 2.0. MAIN CHARACTERISTICS
THE LIFE CYCLE OF DATA
Povezanost s
vremenom,
Rijetko kada
pohrana na
diskove,
Matapodaci
-
12/16/2012
8
DW 2.0. OSNOVNE ZNAAJKE
META PODACI
Tehniki i Poslovni
DW 2.0. OSNOVNE ZNAAJKE
META PODACI
-
12/16/2012
9
DW 2.0. OSNOVNE ZNAAJKE
META PODACI
DW 2.0. OSNOVNE ZNAAJKE
PRISTUP PODACIMA
-
12/16/2012
10
DW 2.0. OSNOVNE ZNAAJKE
STRUKTURIRANI / NESTRUKTURIRANI PODACI
Strukturirani podaci dolaze ponavljajui se u istom formatu i alatu (DBMS)
Nestrukturirani podaci dolaze u dva nazina oblika:
- tekstualni (e-mailovi, telefonski razgovori, PPT
prezentacije, ...)
- ne-tekstualni grafike i slike (fotografije, diijagrani, ilustracije, X-zrake, MRIs, ...)
Poboljanje rada s tekstualnim podacima
Netekstualni podaci a jo uvijek veliko pitanje
DW 2.0. OSNOVNE ZNAAJKE
TEKSTUALNA ANALITIKA
-
12/16/2012
11
DW 2.0. OSNOVNE ZNAAJKE
TEKSTUALNA ANALITIKA
Data that has no
meaning to the business
of the organization
One of the challenges of managing unstructured
data especially email is that of separating blather from meaningful communications. This is
accomplished by matching external categories with
unstructured communications. Any email that does
not have a hit as it passes through external category qualification is considered to be blather.
DW 2.0. OSNOVNE ZNAAJKE
KOLIINE PODATAKA
-
12/16/2012
12
DW 2.0. OSNOVNE ZNAAJKE
KORISNE APLIKACIJE
Integriranje stukturiranih i nestrukturiranih
podataka u
DW 2.0
Rezultira novim aplikacijama
Istinski 360 stupnjeva pogled na kupca
(integriranje e-maila i demografskih podataka)
Integriranje doktorskih biljeki s rezultatima laboratorijskih testova
DW 2.0. KOMPONENTE
4 razliita sektora:
Interaktivni (Interactive) sektor
Integrirani (Integrated) sektor
Blizu linije (Near line) sektor
Arhivski (Archival) sektor
-
12/16/2012
13
Inmon, Strauss, Neushloss
DW 2.0 The Architecture for the Next Generation of Data Warehousing.
2008.
DW 2.0. KOMPONENTE INTERACTIVE SEKTOR
-
12/16/2012
14
DW 2.0. KOMPONENTE INTERACTIVE SEKTOR
DW 2.0. KOMPONENTE INTERACTIVE SEKTOR
-
12/16/2012
15
DW 2.0. KOMPONENTE INTEGRATED SEKTOR
DW 2.0. KOMPONENTE INTEGRATED SEKTOR
Captured text comes from the unstructured environment.
Captured text may exist in the form of emails, documents,
transcripts of telephone conversations, or other textual
information. As a rule captured text is in the same unedited
state in which it exists in the unstructured environment.
However the unstructured text has been selected for
relevancy to the business environment. It would make no
sense to put massive amounts of unstructured text in the
DW2.0 environment unless the unstructured text is
important to the business represented by DW2.0.
LINKAGE TEXT TO SUBJECT Fig DW2.0.5 shows the linkage to text data found in
the DW2.0 environment.
Fig DW2.0.5 shows that there is linkage data. When unstructured data is
brought over to the data warehouse environment even when it has been edited and screened the textual data still can be more useful if it is linked to classical transaction and structured data found in DW2.0. Typical links can be
formed across email address and telephone numbers. Still other links can be
formed across names and mutations of names. This data is normally created
after the textual data has been brought across to the data warehouse
environment. Note that some textual data will have no linkage but will be
relevant to the business of the corporation.
TEXTUAL SUBJECTS
Textual subjects are depicted by Fig DW2.0.8.
-
12/16/2012
16
DW 2.0. KOMPONENTE INTEGRATED SEKTOR
Questions..