baze podataka-seminarski rad

12
INFORMACIONI SISTEMI BAZA PODATAKA

Upload: krstareci

Post on 25-Jul-2015

2.911 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

INFORMACIONI SISTEMI

BAZA PODATAKA

Page 2: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

. SADRŽAJ

1. UVOD ............................................................................................................................................. 1

2. CILJEVI BAZA PODATAKA ....................................................................................................... 2

3. ARHITEKTURA BAZE PODATAKA .......................................................................................... 3

4. JEZICI ZA RAD S BAZAMA PODATAKA ................................................................................. 4

5. SOFTVERSKI PAKETI ZA RAD S BAZAMA PODATAKA ..................................................... 6

6. RELACIONI MODEL BAZA PODATAKA ................................................................................. 7

7. LITERATURA .............................................................................................................................. 10

Page 3: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

1

1. UVOD

Baza podataka se definiše kao skup meĎusobno povezanih podataka, pohranjenih u

spoljnoj memoriji računarskog sistema. Podaci su istovremeno dostupni raznim korisnicima i

aplikacionim programima. Ubacivanje, promjena, brisanje i čitanje podataka obavlja se

posredstvom zajedničkog softvera. Korisnici i aplikacije pritom ne moraju poznavati detalje

fizičkog prikaza podataka, već se referenciraju na logičku strukturu baze.

Sistem za upravljanje bazom podataka (Data Base Management System - DBMS) je

poslužitelj (server) baze podataka. On oblikuje fizički prikaz baze u skladu s traženom

logičkom strukturom. Istovremeno, on obavlja u ime klijenata sve operacije s podacima.

Dalje, on je u stanju podržati razne baze, od kojih svaka može imati svoju logičku strukturu,

ali u skladu s istim modelom. Isto tako, brine se za sigurnost podataka, te automatizuje

administrativne poslove s bazom.

Podaci u bazi su logički organizovani u skladu s nekim modelom podataka. Model

podataka je skup pravila koja odreĎuju kako može izgledati logička struktura baze. Model čini

osnovu za koncipiranje, projektovanje i implementaciju baze. Dosadašnji DBMS-i obično su

podržavali neki od sljedećih modela:

Hijerarhijski model. Baza je predstavljena jednim stablom ili skupom stabala, čvorovi

su tipovi zapisa, a hijerarhijski odnos "nadreĎeni-podreĎeni" izražava veze meĎu tipovima

zapisa.

Mrežni model. Baza je predstavljena usmerenim grafom. Čvorovi su tipovi zapisa, a

lukovi definišu veze meĎu tipovima zapisa.

Relacioni model. Zasnovan na matematičkom pojmu relacije; I podaci i veze meĎu

podacima prikazuju se „pravougaonim“ dvodimenzionalnim tabelama.

Objektni model. Inspirisan je objektno-orijentisanim programskim jezicima. Baza je

skup trajno pohranjenih objekata koji se sastoje od svojih internih podataka i "metoda"

(operacija) za rukovanje s tim podacima. Svaki objekat pripada nekoj klasi. IzmeĎu klasa se

uspostavljaju veze nasleĎivanja, agregacija, odnosno meĎusobnog korišćenja operacija.

Hijerarhijski i mrežni model bili su u upotrebi u 60-tim i 70-tim godinama 20, veka.

Od 80-tih godina pa sve do danas dominira relacioni model.

Page 4: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

2

2. CILJEVI BAZA PODATAKA

Prihvatajući konstataciju da baze podataka predstavljaju viši nivo rada s podacima u

odnosu na klasične programske jezike, zaključuje se da se taj viši nivo rada ogleda u tome što

tehnologija baza podataka nastoji (i u velikoj mjeri uspeva) ispuniti sljedeće ciljeve.

Fizička nezavisnost podataka. Razdvaja se logička definicija baze od njene stvarne

fizičke strukture. To znači, ako se fizička struktura promijeni (na primjer, podaci se prepišu u

druge datoteke na drugim diskovima), to neće zahtijevati promjene u postojećim aplikacijama.

Logička nezavisnost podataka. Razdvaja se globalna logička definicija cijele baze

podataka od lokalne logičke definicije za jednu aplikaciju. Drugim riječima, ako se logička

definicija promijeni (npr. uvede se novi zapis ili veza), to neće zahtijevati promjene u

postojećim aplikacijama. Lokalna logička definicija obično se svodi na izdvajanje samo nekih

elemenata iz globalne definicije, uz neke jednostavne transformacije tih elemenata.

Fleksibilnost pristupa podacima. U starijim hijerarhijskim i mrežnim bazama

podataka, staze pristupanja podacima bile su naprijed definisane, dakle korisnik je mogao

pretraživati podatke jedino onim redosledom koji je bio predviĎen u vrijeme projektovanja i

implementacije baze. Danas se zahtijeva da korisnik može slobodno pretraživati po podacima,

te po svom nahoĎenju uspostavljati veze meĎu podacima. Ovom zahtjevu zaista

zadovoljavaju jedino relacione baze podataka.

Istovremeni pristup do podataka. Baza mora omogućiti da veći broj korisnika

istovremeno koristi iste podatke. Pri tom ti korisnici ne smiju ometati jedan drugoga, te svaki

od njih treba imati utisak da sam radi s bazom.

Čuvanje integriteta. Nastoji se automatski sačuvati korektnost i konsistencija

podataka, i to u situaciji kad postoje greške u aplikacijama, te konfliktne istovremene

aktivnosti korisnika.

Mogućnost oporavka nakon kvara. Mora postojati pouzdana zaštita baze u slučaju

kvara hardvera ili grešaka u radu sistemskog softvera.

Zaštita od neovlašćenog korišćenja. Mora postojati mogućnost da se korisnicima

ograniče prava korišćenja baze, dakle da se svakom korisniku regulišu ovlašćenja šta on smije

a šta ne smije raditi s podacima.

Page 5: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

3

Zadovoljavajuća brzina pristupa. Operacije s podacima moraju se odvijati dovoljno

brzo, u skladu s potrebama odreĎene aplikacije. Na brzinu pristupa može se uticati odabirom

pogodnih fizičkih struktura podataka, te izborom pogodnih algoritama za pretraživanje.

Mogućnost podešavanja i kontrole. Velika baza zahtijeva stalnu brigu: praćenje

performansi, mijenjanje parametara u fizičkoj strukturi rutinsko pohranjivanje rezervnih

kopija podataka, regulisanje ovlašćenja korisnika. TakoĎe, svrha baze se vremenom mijenja,

pa povremeno treba podesiti i logičku-strukturu. Ovakvi poslovi moraju se obavljati

centralizovano. Odgovorna osoba zove se administrator baze podataka, kome na raspolaganja

stoje razni alati u pomagala.

3. ARHITEKTURA BAZE PODATAKA

Arhitektura baze podataka strukturirana je od tri "sloja" i veza medu slojevima kako je

predstavljeno na Slici 1. Radi se o tri nivoa apstrakcije.

Slika 1. – Arhitektura baze podataka

Fizički nivo odnosi se na fizički prikaz i raspored podataka na jedinicama spoljne

memorije. To je aspekt kojeg vide samo sistemski programeri (oni koji su razvili DBMS).

Sam fizički nivo može se dalje podijeliti na više pod-nivoa apstrakcije, od sasvim konkretnih

staza i cilindara na disku, do već donekle apstraktnih pojmova datoteke i zapisa kakve

Page 6: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

4

susrećemo u klasičnim programskim jezicima. Raspored pohranjivanja opisuje kako se

elementi logičke definicije baze preslikavaju na fizičke ureĎaje.

Globalni logički nivo odnosi se na logičku strukturu cijele baze. To je aspekt kojeg

vidi projektant baze odnosno njen administrator. Zapis logičke definicije naziva se shema

(engleski takoĎe shema). Shema je tekst ili dijagram koji definiše logičku strukturu baze, i u

skladu je sa zadatim modelom. Dakle imenuju se i definišu svi tipovi podataka i veze medu

tim tipovima, u skladu s pravilima korišćenog modela. TakoĎe, shema uvodi i ograničenja

kojim se čuva integritet podataka.

Lokalni logički nivo odnosi se na logičku predstavu o dijelu baze kojeg koristi

pojedina aplikacija. To je aspekt kojeg vidi korisnik ili aplikacioni programer. Zapis jedne

lokalne logičke definicije zove se pogled (engleski view) ili pod-shema. To je tekst ili

dijagram kojim se imenuju i definišu svi lokalni tipovi podataka i veze medu tim tipovima,

opet u skladu s pravilima korišćenog modela. TakoĎe, pogled zadaje preslikavanje kojim se iz

globalnih podataka i veza izvode lokalni.

Za stvaranje baze podataka potrebno je zadati samo shemu, i poglede. DBMS tada

automatski generiše potrebni raspored pohranjivanja i fizičku bazu. Administrator može samo

donekle uticati na fizičku strukturu baze, podešavanjem njemu dostupnih parametara.

Programi i korisnici ne pristupaju direktno fizičkoj bazi, već dobijaju ili pohranjuju

podatke posredstvom DBMS-a. Komunikacija programa odnosno korisnika s DBMS-om

obavlja se na lokalnom logičkom nivou.

4. JEZICI ZA RAD S BAZAMA PODATAKA

Komunikacija korisnika odnosno aplikacionog programa i DBMS-a odvija se pomoću

posebnih jezika. Ti jezici tradicionalno se dijele na sljedeće kategorije.

Jezik z& opis podataka (Data Description Language - DDL). Služi projektantu baze ili

administratoru u svrhu zapisivanja sheme ili pogleda. Tim jezikom definišemo podatke i veze

«medu podacima, i to na logičkom nivou. Ponekad postoji posebna varijanta jezika za shemu,

a posebna za poglede. Naredbe DDL obično podsjećaju na naredbe za definisanje složenih

tipova podataka u jezicima poput COBOL, PL/I, C, Pascal

Page 7: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

5

Jezik za manipulisanje podacima (Data Manipulation Language - DML). Služi

programeru za uspostavljanje veze izmeĎu aplikacionog programa i baze. Naredbe DML

omogućuju "manevrisanje" po bazi, te jednostavne operacije kao što su upis, promjena,

brisanje ili čitanje zapisa. U nekim softverskim paketima, DML je zapravo biblioteka

potprograma: "naredba" u DML svodi se na poziv potprograma. U drugim paketima zaista se

radi o posebnom jeziku: programer tada piše program u kojem su izmiješane naredbe dvaju

jezika, pa takav program treba prevoditi s dva prevodioca (DML-precbmpiler, obični

compiler).

Jezik za postavljanje upita (Query Language - QL). Služi neposrednom korisniku ža

interaktivno pretraživanja baze. To je jezik koji podsjeća iia govorni (engleski) jezik Naredbe

su ne proceduralne, dakle takve da samo specificiraju rezultat kojeg želimo dobiti, a ne i

postupak za dobivanje rezultata.

Ovakva podjela na tri jezika danas je već prilično zastarjela. Kod relacionih baza

postoji tendencija da se sva tri jezika objedine u jedan sveobuhvatni. Primjer takvog

integrisanog jezika za relacione baze je SQL: on služi za definisanje. podataka, manipulisanje

i pretraživanje; Integrisani jezik se može koristiti interaktivno (preko on-line interpretera) ili

se on može pojavljivati uklopljen u aplikacione programe. Treba istaći da navedene vrste

jezika nisu programski jezici, dakle, ti jezici su nam neophodni da bi se povezali s bazom,ali

oni nam nisu dovoljni za razvoj aplikacija koje će nešto raditi s podacima iz baze.

Tradicionalni način razvoja aplikacija koje rade s bazom je korišćenje klasičnih

programskih jezika (GOBOL, PL/I, C, Pascal itd.) s inkorporisanim DML-naredbama.

Uv804im godinama 20-og veka bili su dosta popularni i tzv. jezici 4y generacije (44h

Generation Languages - 4<3L);.;radi se o jezicima koji su bili namijenjeni isključivo za rad s

bazama, te su zato u tom kontekstu bili produktivniji od klasičnih programskih jezika opšte

namene. Problem 5 jezicima 4. generacije je bio u njihovoj nestandardnosti svaki od njih je u

pravilu bio dio nekog odreĎenog softverskog paketa za baze podataka, te- se nije mogao

koristiti izvan tog paketa (baze).

U savremenom dobu, aplikacije se najčešće razvijaju u standardnim objektno

orijentisanim programskim jezicima (Java, C++, itd.) Za interakcije s bazom koriste se

unaprijed pripremljene klase objekata. Ovakva tehnika je dovoljno produktivna zbog

korišćenja gotovih klasa, a rezultujući program se lako dotjeruje, uklapa u veće sisteme ili

prenosi s jedne baze na drugu.

Page 8: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

6

5. SOFTVERSKI PAKETI ZA RAD S BAZAMA PODATAKA

Baze podataka se u pravilu realizuju korišćenjem nekog od provjerenih softverskih

paketa. Tabela 1. daje pregled softvera koji u ovom trenutku predstavljaju tehnološki vrh te

imaju značajan udio na svetskom tržištu. Gotovo svi današnji softverski paketi podržavaju

relacioni model i SQL. Svaki od njih sadrži svoj DBMS, uobičajene klijente (na primjer

interaktivni interpreter SQL), te biblioteke i alate za razvoj aplikacija. Svaki paket isporučuje

se u verzijama za razne računarske platforme (operacione sisteme).

Konkurencija meĎu proizvoĎačima softvera za baze podataka je izuzetno velika, tako

da je posljednjih godina često dolazilo do njihovog nestanka, spajanja ili preuzimanja. Lista

relevantnih softverskih paketa zato je svake godine sve kraća. Jedino osvježenje predstavlja

nedavna pojava public-domain sotvera poput MySQL.

Tabela 1. – Softverski paketi za rad sa bazama podataka

Page 9: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

7

6. RELACIONI MODEL BAZA PODATAKA

Relacioni model teoretski je zasnovan krajem 60-tih godina 20: veka, u radovima E. F.

Codd-a. Model se dugo pojavljivao samo u akademskim raspravama i knjigama. Prve

realizacije na računarima bile su suviše spore i neefikasne. Zahvaljujući intenzivnom

istraživanju, te napretku samih računara, efikasnost relacionih baza podataka postepeno se

poboljšavala. Sredinom 80-tih godina 20. veka relacioni model je postao prevladavajući. I

danas većina DBMS koristi taj model

Relaciona baza podataka se sastoji od serije dvodimenzionalnih tabela. Termin

"relaciona baza podataka" dolazi od činjenice da ona koristi relaciju (odnos) umesto datoteke.

Relacija je tabela sastavljena od slogova. Unutar jedne tabele može postojati samo jedna vrsta

slogova ili entiteta. Relacione tabele pokazuju logičke a ne fizičke odnose, a zanemaruje

redosled podataka odnosno slogova uključenih u relaciju. Relacioni model odvaja bazu

podataka od operativnog sistema kao i od aplikacije. Kada se da zahtjev za informacijama,

sistem napravi tabelu koja sadrži te informacije. Standardni programski jezik za izražavanje

pristupa podacima i manipulaciju sa tabelama u relacionoj bazi podataka se naziva SQL

(Structured Query Language), U ovom jeziku, pitanja na jednostavnom engleskom jeziku se

automatski prevode u SQL. U ovom slučaju softverski program, koji se zove Natural

language (prirodni jezik) i koji dozvoljava upite u ograničenoj formi prirodnog jezika,

analizira korisnikov upit, prevodi ga u upit na SQL, prenosi SQL zahtjev DBMS-u i daje na

displej podatke korisniku.

Pravila dr Codd-a za relacioni model baze podataka:

1. Relacioni DBMS mora biti u mogućnosti da manipuliše u potpunosti bazama podataka

kroz svoje relacione mogućnosti.

2. Pravila o informacijama - sve informacije u relacionoj bazi podataka, (uključujući

imena tabele i kolona) predstavljaju se eksplicitno kao vrijednosti i tabeli.

3. ObezbeĎivanje pristupa svakoj vrijednosti u relacionoj bazi podataka može se

pristupiti upotrebom kombinacije imena tabele, vrijednosti primarnog ključa i imena

kolone.

4. Sistemska podrška nedefinisanim vrednostima - DBMS obezbeĎuje sistemsku podršku

u radu sa nedefinisanim Veličinama (nepoznati ili nepromenljivi tipovi podataka), koji

se razlikuju od predefinisanih vrijednosti i nezavisni su od bilo kog domena.

Page 10: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

8

5. Aktivan, uvijek dostupan relacioni katalog - opis baze podataka i njenog sadržaja je

predstavljen na logičkom nivou u vidu tabela i može se pretraživati pomoću jezika

baze.

6. Razumljiv pod-jezik podataka – bar jedan podržani jezik mora da ima dobro

definisanu sintaksu i da bude razumljiv. Mora da podržava definiciju podataka,

manipulisanje podacima, pravila integriteta, autorizacije i transakcije.

7. Pravilo za ažuriranje pogleda - svi pogledi koji se teoretski mogu ažurirati, ažuriraju se

kroz sistem.

8. Unošenje, ažuriranje i uklapanje podataka na nivou skupova - DBMS za dobijanje

podataka na nivou skupova i za unošenja, ažuriranje i uklanjanje.

9. Fizička nezavisnost podataka - menjanje fizičkog zapisa strukture ili metoda pristupa

ne utiče na aplikacije i ad-hoc programe.

10. Logička nezavisnost podataka - koliko god je moguće, promjena strukture tabela ne

utiče na aplikacije i ad-hoc programe.

11. Nezavisnost integriteta - jezik baze podataka mora da obezbedi način za definisanje

pravila integriteta. Ona moraju biti sačuvana u katalogu* koji je uvijek dostupan i ne

mogu se predvidjeti.

12. Nezavisnost od distribucije - prva ili ponovna distribucija podataka ne utiče na

zahtjeve aplikacija i ad-hoc programe. 13. Zaštita podataka - ne smije postojati

mogućnost zaobliaženja pravila integriteta definisanih jezikom baza podataka

upotrebom jezika koji rade na niskom nivou.

Relacioni model zahtijeva da se baza podataka sastoji od skupa pravougaonih tabela

tzv. relacija. Svaka relacija ima svoje ime po kojem je razlikujemo od ostalih u istoj bazi.

Jedna kolona relacije obično sadrži vrijednost jednog atributa (za entitet ili vezu) - zato

kolonu poistovećujemo s atributom i obratno. Atribut ima svoje ime po kojem ga razlikujemo

od ostalih u istoj relaciji. Vrijednosti jednog atributa su podaci istog tipa. Dakle, definisanje

skup dozvoljenih vrijednosti za atribut, koji se zove domena atributa. Vrijednost atributa mora

biti jednostruka i jednostavna (ne može se rastaviti na dijelove). Pod nekim uslovima

tolerišemo situaciju da vrijednost atributa nedostaje (nije upisana).

Jedan red relacije obično predstavlja jedan primjerak entiteta, ili bilježi vezu izmeĎu

dva ili više primjeraka.

Page 11: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

9

Red nazivamo n-torka. U jednoj relaciji ne smiju postojati: dvije jednake n-torke. Broj

atributa je stepen relacije, a broj n-torki je kardinalnost relacije.

Normalizacija relacione sheme

Relaciona shema, dobivena iz ER-sheme na osnovu prethodnih, uputstava može

sadržavati nedorečenosti koje treba otkloniti prije implementacije. Proces daljnjeg

dotjerivanja sheme zove se normalizacija.

Teorija normalizacije zasnovana je na pojmu normalnih formi. Relacije prvobitno

dobivene morale bi u najmanju raku biti u prvoj normalnoj formi (INF). Naime, relacija je u

INF ako je vrijednost svakog atributa jednostruka i nedeljiva - to svojstvo već je uključeno u

definiciju relacije. U svojim radovima (1970-1974. godina) E.P. Codd je najpre definisao

drugu i treću normalnu formu (2NF, 3NF), a zatim i poboljšanu varijantu 3NF koja se zove

Boyce-Coddova normalna forma (BCNF). R. Fagin je 1977. i 1979. uveo četvrtu i petu

normalnu formu (4NF, 5NF). U praksi je lako naići na relacije koje odstupaju od 2NFi 3NF,

BCNF, no vrlo rijetko se susreću relacije u BCNF koje nisu u 4NF i 5NF. Zato su "više"

normalne forme prvenstveno od teoretskog značaja.

Teorija normalizacije je formalizacija nekih intuitivno prihvatljivih principa q

"zdravom" oblikovanju sheme. Ukoliko veo na početku dobro uočimo sve potrebne entitete,

atribute i yeze, tada nam nikakva daljnja normalizacija neće biti potrebna. MeĎutim, ako je

polazna relaciona shema bila loše oblikovana, tada će postupak normalizacije ispraviti te

greške.

Page 12: Baze Podataka-seminarski Rad

Baza podataka Seminarski rad

10

7. LITERATURA

Latinović, B.;Informacioni sistemi, Banja Luka, 2006

Vikipedia, http://hr.wikipedia.org