statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/sir/sir snezana...
TRANSCRIPT
![Page 1: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/1.jpg)
- 1 -
Statistička analiza broja dece u vaspitno – obrazovnim ustanovama
predškolskog obrazovanja
Snežana GloĎović
Fakultet tehničkih nauka, Čačak
Tehnika i informatika, integrisane studije, 2011/2012
Mentor rada: Prof. dr Vera Lazarević
Apstrakt – Ovaj rad opisuje statističku analizu broja dece u vaspitno – obrazovnim ustanovama
predškolskog obrazovanja po uzrastu u 2014. godini. Broj dece je grupisan po regionima:
Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine, Srbija JUG, region
Šumadije i Zapadne Srbije. Podaci su obraĎivani u softverskom paketu Statistica. Prvo su podaci
uneti u Excel-ovu tabelu koja je uvezena u Statisticu, a zatim su dobijane različite vrste
podataka, grafikona.
Ključne reči – matematička statistika, istraživanje, uzorak, deskriptivna statistika, analiza
vremenskih serija.
1 Uvod Statistika
Softverski paket “Statistica” je napredni analitički softverski paket originalno razvijen od
strane StatSoft kompanije. Statistica obezbeĎuje analizu i istraživanje podataka, upravljanje
podacima, mašinsko učenje, tekstualnu analitiku i procedure za vizuelizaciju.
Isprobana i pouzdana analitička platforma sa preko dve decenije dugim istorijatom u
ostvarenju uspešnih poslovnih rezultata, globalna baza korisnika sa više od milion korisnika.
Počeci razvoja statistike vezani su za proučavanje nekih pojava u društvu koje se odnose
na mnoštvo elemenata s nekim zajedničkim obeležjem; takve pojave su, na primer, pojave
kojima se bavi takozvana demografska statistika i koje su najneposrednije vezane za razvitak
stanovništva jedne zemlje, pokrajine (natalitet, smrtnost, zanimanje, dohodak, imovno stanje,
pitanje oporezivanja, stanje stočnog fonda), zatim meteorološke pojave, seizmičke pojave itd.
UporeĎivanje stanja (latinska reč znači stanje; otuda potiče naziv statistika) pojava u
kojima učestvuju mnogobrojne status jedinke, odnosno elementi, sa stanovišta bilo upravnog,
bilo ekonomskog, bilo političkog, postalo je predmet matematičke statistike, koja je u svom
daljem razvoju obuhvatila i tehnološke procese (njihovo proučavanje i organizaciju),
biohemijske procese, sve vrste radnih procesa, planiranje u raznim oblastima privrede, masovnu
produkciju itd.
![Page 2: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/2.jpg)
- 2 -
2 Uvod u istraživanje
Kao uzorak za istraživanje uzet je broj dece u vaspitno – obrazovnim ustanovama
predškolskog uzrasta u 2014. godini. Podaci su preuzeti sa sajta REPUBLIČKOG ZAVODA
ZA STATISTIKU REPUBLIKE SRBIJE. Uzoračka jedinica podrazumeva četiri uzrasta
dece (do 3. godine, od 3 – 4 godine, od 4 – 5 godina i od 5 – 7 godina).
Deskriptivna statistika je obično prvi korak u analizi podataka, a služi za opisivanje
prikupljenih podataka. Deskriptivna statistika obično prethodi statističkom zaključivanju i
predviĎanju, ali može biti i krajnji cilj statističke analize. IzvoĎenjem zaključaka se bavi drugo
područje statistike koje se zove statistika zaključivanja.
Pod opisnom promenljivom u ovom primeru podrazumeva se uzrast dece (do 3. godine,
od 3 – 4 godine, od 4 – 5 godina i od 5 – 7 godina).
Numeričke promenljive su:
ukupan broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta
Republike Srbije (Republika Srbija)
broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta na severu
Srbije (Srbija SEVER)
broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta u
Beogradskom region (Beogradski region)
broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta u regionu
Vojvodine (Region Vojvodine)
broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta na jugu
Srbije (Srbija JUG)
broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta u regionu
Šumadije i Zapadne Srbije (Region Šumadije i Zapadne Srbije)
Slika 2.1: Opisne i numeričke promenljive
![Page 3: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/3.jpg)
- 3 -
Drugi korak u postupku obrade podataka jeste pokretanje podprograma
DESKRIPTIVNA STATISTIKA. Postupak pokretanja ovog podprograma podrazumeva
sledeće: otvoriti karticu Statistic, zatim izabrati Basic Statistic and Tables, pa Descriptive
Statistics i potvrditi sa OK.
Slika 2.2: Postupak pokretanja podprograma
DESKRIPTIVNA STATISTIKA Slika 2.3: Izbor vrednosti koje
računamo
U kartici Advanced izabrali smo vrednosti koje želimo da izračunamo, a značenje svake
od njih sledi ispod:
ValidN – broj uzoračkih jedinica za izabranu promenljivu
Mean – Srednja vrednost za izabranu promenljivu
Sum – ukupan broj vrednosti za izabranu promenljivu
Median – Medijana je poziciona srednja vrednost koja je odreĎena pozicijom
koju zauzima u rastućem nizu vrednosti obeležja X.
Kako je aritmetička sredina Xn osetljiva na ekstremne vredosti obeležja, uticaj tih
ekstremnih vrednosti se isključuje upotrebom medijane ili moda (modusa).
Medijana je ona vrednost obeležja koja varijacioni niz vrednosti deli na dva
jednaka dela. Zato definicija pojma medijane zavisi od toga da li je broj n paran ili
neparan.
Mode - Modus ili mod je ona poziciona vrednost obeležja koja se najčešće
pojavljuje u realizovanom uzorku. Takvih vrednosti može biti jedna ili više.
Kod neprekidnih numeričkih obeležja merenih intervalnom skalom ili skalom
odnosa, nema velike potrebe za ovom vrednošću. U tom slučaju, aritmetička
sredina je najbolja mera centriranosti.
Geom. mean – Geometrijska sredina za izabranu promenljivu
Harm. mean – Harmonijska sredina za izabranu promenljivu
Standard Deviation – Standardna devijacija (koliko u proseku elementi skupa
odstupaju od aritmetičke sredine skupa).
![Page 4: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/4.jpg)
- 4 -
Minimum & maximum – najmanja i najveća vrednost za izabranu promenljivu
2.1 Prikazivanje podataka
2.1.1 Tabelarno prikazivanje podataka
Opcija Summary Statistics nam daje tabelarni prikaz broja uzoraka, srednju,
maksimalnu, minimalnu i ukupnu vrednost uzorka, medijanu, modus i standardnu devijaciju.
Slika 2.4: Tabelarni prikaz svih numeričkih promenljivih
U ovoj tabeli su prikazane sve numeričke promenljive za varijable Republika Srbija,
Srbija SEVER, Beogradski region, region Vojvodine, Srbija JUG i region Šumadije i
Zapadne Srbije.
Slika 2.5: Tabelarni prikaz za promenljivu region Šumadije i Zapadne Srbije
![Page 5: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/5.jpg)
- 5 -
Slika 2.6: Tabela učestanosti broja dece
2.1.2 Grafičko prikazivanje podataka Opcija Summary Graphs nam daje grafičke prikaze za izabranu promenljivu.
Slika 2.7: Dijagram za promenljivu ukupan broj dece u vaspitno – obrazovnim ustanovama
predškolskog obrazovanja po uzrastu u Regionu Šumadije i Zapadne Srbije
![Page 6: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/6.jpg)
- 6 -
Na ovoj slici prikazani su: histogram raspodele apsolutnih frekvenci, dijagram linearne
regresije i dijagram kutije sa brkovima. Za grafičko prikazivanje podataka se koriste i
histogrami.
Slika 2.8: Histogram apsolutnih frekvencija
Plava površina koja je prikazana pravougaonicima iznosi 1. Ukupna površina ispod
crvene krive je 1, jer cela plava površina staje pod nju. Na x-osi tačke se uzimaju na
ravnomernom rastojanju koje u našem primeru predstavlja vrednost za apsolutnu frekvenciju. Na
y-osi se prikazuje učestanost ponavljanja broja dece u vaspitno – obrazovnim ustanovama
predškolskog obrazovanja u 2014. godini.
Prvi stubić obuhvata uzrast dece do 3. godine, od 3 – 4 godine i od 4 – 5 godina, a to su
vrednosti: 8.402, 6528 i 7260. Drugi stubić označava uzrast dece od 5 – 7 godina i ta vrednost je
23.782.
Slika 2.9: Dijagram linearne regresije za promenljivu region Šumadije i Zapadne Srbije
![Page 7: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/7.jpg)
- 7 -
Na dijagramu linearne regresije tačkama je prikazan broj dece po uzrastima i te brojčane
vrednosti su prikazane na X osi, a na Y osi su prikazane očekivane normalne vrednosti za dati
broj dece. Npr. za broj 6.528 očekivana normalna vrednost je -1.1.
Slika 10: Dijagram kutije sa brkovima za promenljive region Vojvodine i region Šumadije i
Zapadne Srbije
Prvi mali kvadratić predstavlja aritmetičku sredinu za Region Vojvodine (Mean =
13.988,00). Pravougaonik predstavlja minimalno i maksimalno odstupanje od aritmetičke sredine
za vrednost standardna devijacije koja iznosi 7.957,00.
Drugi mali kvadratić predstavlja aritmetičku sredinu za Region Šumadije i Zapadne
Srbije (Mean = 11.493,00). Pravougaonik predstavlja minimalno i maksimalno odstupanje od
aritmetičke sredine za vrednost standardna devijacije koja iznosi 8.228,878
Slika 2.11: Poligonalna linija apsolutne frekvence za obeležje starost dece za region Srbija
SEVER u 2014.godini
![Page 8: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/8.jpg)
- 8 -
Slika 2.12: Kružni dijagram za obeležje starost dece za region Srbija SEVER u 2014.godini
3 Pirsonov test Ovaj test se odnosi na raspodelu obeležja X, a ne na parametre raspodele. Nulta
hipoteza je pretpostavka da obeležje X ima neku odreĎenu raspodelu (Pirsonovu ili
Gausovu). Alternativna hipoteza tvrdi da to nije tako. Ovaj test pretpostavlja da je n veliko
(bar veće od 50), jer koristi asimptotske tačne raspodele.
Skup vrednosti Rx obeležja X podelimono pod skupove ….Sr. Označim osa Mk,
k=1,2,..…r, r>n, slučajnu promenljivu koja predstavlja bro jslučajnih promenjivih iz uzorka
( ,…Xn) koje izuzimaju vrednost iz skupa Sk. Neka je = {X ∈ Sк}, (k=1). Sada
slučajna promenjiva : (n; ) i njeno očekivanje Е( )=n . Dokazuje se statistika:
4 Analiza vremenskih serija
Pod vremenskom serijom podrazumevamo niz posmatranja, obično poreĎanih u vremenu.
Posmatranja mogu biti registrovana diskretno ili neposredno u vremenu, ali pri njihovoj
statističkoj obradi na računskim mašinama se uzimaju vrednosti u diskretnim intervalima.
Opšti statistički model za vremenske serije može biti predstavljen u obliku
= g (t) + , t = 1,2,…, T,
Metod pokretnih proseka se koristi za odreĎivanje osnovnog toka pojave, tj. za
odreĎivanje trenda ukoliko ciklična komponenta ne postoji ili za odreĎivanje proizvoda trenda I
ciklične komponente
![Page 9: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,](https://reader031.vdocuments.pub/reader031/viewer/2022021817/5a8f12db7f8b9a7f398d57f6/html5/thumbnails/9.jpg)
- 9 -
Trend je osnovna razvojna tendencija obeležja i nastaje od regularnih uticaja na
posmatrano obeležje. On predstavlja dugoročnu tendenciju razvoja vremenske serije. Trend
komponentu vremenske serije obeležavamo sa T, odnosno sa T (i), i = 1,2,…,n.
Ciklična komponenta je varijacija koja se pojavljuje kao oscilacija oko trenda sa
promenljivom periodom koja je obično veća od jedne godine. Cikličnu komponentu vremenske
serije obeležavamo sa C, odnosno sa C (i), i = 1,2,…,n.
Sezonska komponenta je varijacija koja se pojavljuje kao oscilacija oko trenda sa istom
periodom koja je obično manja ili jednaka od jedne godine. Sezonsku komponentu vremenske
serije obeležavamo sa S, odnosno sa S (i), i = 1,2,…n.
Rezidualna komponenta je slučajna ili katastrofalna varijabla. Slučajne varijable imaju
karakter slučajnih grešaka, dok su katastrofalne varijable posledica nekih prirodnih ili društvenih
nepogoda (poplave, zemljotresi, ratovi,…). Rezidualnu komponentu vremenske serije
obeležavamo sa R, odnosno sa R (i), i = 1,2,…n.
Vremenska serija je jednaka proizvodu svojih osnovnih komponenti:
X = T * C * S * R
5 Zaključak Iz prethodnog teksta se moglo zaključiti da je upotreba paketa Statistika veoma pogodna
za obradu kako malog, tako i velikog broja podataka.
Svakodnevno se susrećemo sa podacima koji su prikazani zbirno, pregledno, a ne znamo
kako se do takvih podataka uopšte došlo. U ovom master radu su prikazani podaci preko
histograma, različitih vrsta dijagrama, poligonalnih linija.
6 Literatura [1] Lazarević, V., Đukić, M., Inženjerska matematika, Čačak: Tehnički fakultet,
2010
[2] Stojanović, S., Matematička statistika, Beograd, 1980
[3] Dajović, V., Matematika za IV razred Gimnazije prirodno – matematičkog smera, Beograd,
Zavod za udžebike i nastavna sredstva
[4] Programski paket Statistika 8: http://www.statsoft.com/
[5] Ivković, Z., Matematička statistika, "Naučna knjiga", Beograd, 1992