statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/sir/sir snezana...

9
- 1 - Statistička analiza broja dece u vaspitno obrazovnim ustanovama predškolskog obrazovanja Snežana GloĎović Fakultet tehničkih nauka, Čačak Tehnika i informatika, integrisane studije, 2011/2012 [email protected] Mentor rada: Prof. dr Vera Lazarević Apstrakt Ovaj rad opisuje statističku analizu broja dece u vaspitno – obrazovnim ustanovama predškolskog obrazovanja po uzrastu u 2014. godini. Broj dece je grupisan po regionima: Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine, Srbija JUG, region Šumadije i Zapadne Srbije. Podaci su obraĎivani u softverskom paketu Statistica. Prvo su podaci uneti u Excel-ovu tabelu koja je uvezena u Statisticu, a zatim su dobijane različite vrste podataka, grafikona. Ključne reči matematička statistika, istraživanje, uzorak, deskriptivna statistika, analiza vremenskih serija. 1 Uvod Statistika Softverski paket Statistica” je napredni analitički softverski paket originalno razvijen od strane StatSoft kompanije. Statistica obezbeĎuje analizu i istraživanje podataka, upravljanje podacima, mašinsko učenje, tekstualnu analitiku i procedure za vizuelizaciju. Isprobana i pouzdana analitička platforma sa preko dve decenije dugim istorijatom u ostvarenju uspešnih poslovnih rezultata, globalna baza korisnika sa više od milion korisnika. Počeci razvoja statistike vezani su za proučavanje nekih pojava u društvu koje se odnose na mnoštvo elemenata s nekim zajedničkim obeležjem; takve pojave su, na primer, pojave kojima se bavi takozvana demografska statistika i koje su najneposrednije vezane za razvitak stanovništva jedne zemlje, pokrajine (natalitet, smrtnost, zanimanje, dohodak, imovno stanje, pitanje oporezivanja, stanje stočnog fonda), zatim meteorološke pojave, seizmičke pojave itd. UporeĎivanje stanja (latinska reč znači stanje; otuda potiče naziv statistika) pojava u kojima učestvuju mnogobrojne status jedinke, odnosno elementi, sa stanovišta bilo upravnog, bilo ekonomskog, bilo političkog, postalo je predmet matematičke statistike, koja je u svom daljem razvoju obuhvatila i tehnološke procese (njihovo proučavanje i organizaciju), biohemijske procese, sve vrste radnih procesa, planiranje u raznim oblastima privrede, masovnu produkciju itd.

Upload: dangtuyen

Post on 23-Feb-2018

221 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 1 -

Statistička analiza broja dece u vaspitno – obrazovnim ustanovama

predškolskog obrazovanja

Snežana GloĎović

Fakultet tehničkih nauka, Čačak

Tehnika i informatika, integrisane studije, 2011/2012

[email protected]

Mentor rada: Prof. dr Vera Lazarević

Apstrakt – Ovaj rad opisuje statističku analizu broja dece u vaspitno – obrazovnim ustanovama

predškolskog obrazovanja po uzrastu u 2014. godini. Broj dece je grupisan po regionima:

Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine, Srbija JUG, region

Šumadije i Zapadne Srbije. Podaci su obraĎivani u softverskom paketu Statistica. Prvo su podaci

uneti u Excel-ovu tabelu koja je uvezena u Statisticu, a zatim su dobijane različite vrste

podataka, grafikona.

Ključne reči – matematička statistika, istraživanje, uzorak, deskriptivna statistika, analiza

vremenskih serija.

1 Uvod Statistika

Softverski paket “Statistica” je napredni analitički softverski paket originalno razvijen od

strane StatSoft kompanije. Statistica obezbeĎuje analizu i istraživanje podataka, upravljanje

podacima, mašinsko učenje, tekstualnu analitiku i procedure za vizuelizaciju.

Isprobana i pouzdana analitička platforma sa preko dve decenije dugim istorijatom u

ostvarenju uspešnih poslovnih rezultata, globalna baza korisnika sa više od milion korisnika.

Počeci razvoja statistike vezani su za proučavanje nekih pojava u društvu koje se odnose

na mnoštvo elemenata s nekim zajedničkim obeležjem; takve pojave su, na primer, pojave

kojima se bavi takozvana demografska statistika i koje su najneposrednije vezane za razvitak

stanovništva jedne zemlje, pokrajine (natalitet, smrtnost, zanimanje, dohodak, imovno stanje,

pitanje oporezivanja, stanje stočnog fonda), zatim meteorološke pojave, seizmičke pojave itd.

UporeĎivanje stanja (latinska reč znači stanje; otuda potiče naziv statistika) pojava u

kojima učestvuju mnogobrojne status jedinke, odnosno elementi, sa stanovišta bilo upravnog,

bilo ekonomskog, bilo političkog, postalo je predmet matematičke statistike, koja je u svom

daljem razvoju obuhvatila i tehnološke procese (njihovo proučavanje i organizaciju),

biohemijske procese, sve vrste radnih procesa, planiranje u raznim oblastima privrede, masovnu

produkciju itd.

Page 2: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 2 -

2 Uvod u istraživanje

Kao uzorak za istraživanje uzet je broj dece u vaspitno – obrazovnim ustanovama

predškolskog uzrasta u 2014. godini. Podaci su preuzeti sa sajta REPUBLIČKOG ZAVODA

ZA STATISTIKU REPUBLIKE SRBIJE. Uzoračka jedinica podrazumeva četiri uzrasta

dece (do 3. godine, od 3 – 4 godine, od 4 – 5 godina i od 5 – 7 godina).

Deskriptivna statistika je obično prvi korak u analizi podataka, a služi za opisivanje

prikupljenih podataka. Deskriptivna statistika obično prethodi statističkom zaključivanju i

predviĎanju, ali može biti i krajnji cilj statističke analize. IzvoĎenjem zaključaka se bavi drugo

područje statistike koje se zove statistika zaključivanja.

Pod opisnom promenljivom u ovom primeru podrazumeva se uzrast dece (do 3. godine,

od 3 – 4 godine, od 4 – 5 godina i od 5 – 7 godina).

Numeričke promenljive su:

ukupan broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta

Republike Srbije (Republika Srbija)

broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta na severu

Srbije (Srbija SEVER)

broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta u

Beogradskom region (Beogradski region)

broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta u regionu

Vojvodine (Region Vojvodine)

broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta na jugu

Srbije (Srbija JUG)

broj dece u vaspitno – obrazovnim ustanovama predškolskog uzrasta u regionu

Šumadije i Zapadne Srbije (Region Šumadije i Zapadne Srbije)

Slika 2.1: Opisne i numeričke promenljive

Page 3: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 3 -

Drugi korak u postupku obrade podataka jeste pokretanje podprograma

DESKRIPTIVNA STATISTIKA. Postupak pokretanja ovog podprograma podrazumeva

sledeće: otvoriti karticu Statistic, zatim izabrati Basic Statistic and Tables, pa Descriptive

Statistics i potvrditi sa OK.

Slika 2.2: Postupak pokretanja podprograma

DESKRIPTIVNA STATISTIKA Slika 2.3: Izbor vrednosti koje

računamo

U kartici Advanced izabrali smo vrednosti koje želimo da izračunamo, a značenje svake

od njih sledi ispod:

ValidN – broj uzoračkih jedinica za izabranu promenljivu

Mean – Srednja vrednost za izabranu promenljivu

Sum – ukupan broj vrednosti za izabranu promenljivu

Median – Medijana je poziciona srednja vrednost koja je odreĎena pozicijom

koju zauzima u rastućem nizu vrednosti obeležja X.

Kako je aritmetička sredina Xn osetljiva na ekstremne vredosti obeležja, uticaj tih

ekstremnih vrednosti se isključuje upotrebom medijane ili moda (modusa).

Medijana je ona vrednost obeležja koja varijacioni niz vrednosti deli na dva

jednaka dela. Zato definicija pojma medijane zavisi od toga da li je broj n paran ili

neparan.

Mode - Modus ili mod je ona poziciona vrednost obeležja koja se najčešće

pojavljuje u realizovanom uzorku. Takvih vrednosti može biti jedna ili više.

Kod neprekidnih numeričkih obeležja merenih intervalnom skalom ili skalom

odnosa, nema velike potrebe za ovom vrednošću. U tom slučaju, aritmetička

sredina je najbolja mera centriranosti.

Geom. mean – Geometrijska sredina za izabranu promenljivu

Harm. mean – Harmonijska sredina za izabranu promenljivu

Standard Deviation – Standardna devijacija (koliko u proseku elementi skupa

odstupaju od aritmetičke sredine skupa).

Page 4: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 4 -

Minimum & maximum – najmanja i najveća vrednost za izabranu promenljivu

2.1 Prikazivanje podataka

2.1.1 Tabelarno prikazivanje podataka

Opcija Summary Statistics nam daje tabelarni prikaz broja uzoraka, srednju,

maksimalnu, minimalnu i ukupnu vrednost uzorka, medijanu, modus i standardnu devijaciju.

Slika 2.4: Tabelarni prikaz svih numeričkih promenljivih

U ovoj tabeli su prikazane sve numeričke promenljive za varijable Republika Srbija,

Srbija SEVER, Beogradski region, region Vojvodine, Srbija JUG i region Šumadije i

Zapadne Srbije.

Slika 2.5: Tabelarni prikaz za promenljivu region Šumadije i Zapadne Srbije

Page 5: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 5 -

Slika 2.6: Tabela učestanosti broja dece

2.1.2 Grafičko prikazivanje podataka Opcija Summary Graphs nam daje grafičke prikaze za izabranu promenljivu.

Slika 2.7: Dijagram za promenljivu ukupan broj dece u vaspitno – obrazovnim ustanovama

predškolskog obrazovanja po uzrastu u Regionu Šumadije i Zapadne Srbije

Page 6: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 6 -

Na ovoj slici prikazani su: histogram raspodele apsolutnih frekvenci, dijagram linearne

regresije i dijagram kutije sa brkovima. Za grafičko prikazivanje podataka se koriste i

histogrami.

Slika 2.8: Histogram apsolutnih frekvencija

Plava površina koja je prikazana pravougaonicima iznosi 1. Ukupna površina ispod

crvene krive je 1, jer cela plava površina staje pod nju. Na x-osi tačke se uzimaju na

ravnomernom rastojanju koje u našem primeru predstavlja vrednost za apsolutnu frekvenciju. Na

y-osi se prikazuje učestanost ponavljanja broja dece u vaspitno – obrazovnim ustanovama

predškolskog obrazovanja u 2014. godini.

Prvi stubić obuhvata uzrast dece do 3. godine, od 3 – 4 godine i od 4 – 5 godina, a to su

vrednosti: 8.402, 6528 i 7260. Drugi stubić označava uzrast dece od 5 – 7 godina i ta vrednost je

23.782.

Slika 2.9: Dijagram linearne regresije za promenljivu region Šumadije i Zapadne Srbije

Page 7: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 7 -

Na dijagramu linearne regresije tačkama je prikazan broj dece po uzrastima i te brojčane

vrednosti su prikazane na X osi, a na Y osi su prikazane očekivane normalne vrednosti za dati

broj dece. Npr. za broj 6.528 očekivana normalna vrednost je -1.1.

Slika 10: Dijagram kutije sa brkovima za promenljive region Vojvodine i region Šumadije i

Zapadne Srbije

Prvi mali kvadratić predstavlja aritmetičku sredinu za Region Vojvodine (Mean =

13.988,00). Pravougaonik predstavlja minimalno i maksimalno odstupanje od aritmetičke sredine

za vrednost standardna devijacije koja iznosi 7.957,00.

Drugi mali kvadratić predstavlja aritmetičku sredinu za Region Šumadije i Zapadne

Srbije (Mean = 11.493,00). Pravougaonik predstavlja minimalno i maksimalno odstupanje od

aritmetičke sredine za vrednost standardna devijacije koja iznosi 8.228,878

Slika 2.11: Poligonalna linija apsolutne frekvence za obeležje starost dece za region Srbija

SEVER u 2014.godini

Page 8: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 8 -

Slika 2.12: Kružni dijagram za obeležje starost dece za region Srbija SEVER u 2014.godini

3 Pirsonov test Ovaj test se odnosi na raspodelu obeležja X, a ne na parametre raspodele. Nulta

hipoteza je pretpostavka da obeležje X ima neku odreĎenu raspodelu (Pirsonovu ili

Gausovu). Alternativna hipoteza tvrdi da to nije tako. Ovaj test pretpostavlja da je n veliko

(bar veće od 50), jer koristi asimptotske tačne raspodele.

Skup vrednosti Rx obeležja X podelimono pod skupove ….Sr. Označim osa Mk,

k=1,2,..…r, r>n, slučajnu promenljivu koja predstavlja bro jslučajnih promenjivih iz uzorka

( ,…Xn) koje izuzimaju vrednost iz skupa Sk. Neka je = {X ∈ Sк}, (k=1). Sada

slučajna promenjiva : (n; ) i njeno očekivanje Е( )=n . Dokazuje se statistika:

4 Analiza vremenskih serija

Pod vremenskom serijom podrazumevamo niz posmatranja, obično poreĎanih u vremenu.

Posmatranja mogu biti registrovana diskretno ili neposredno u vremenu, ali pri njihovoj

statističkoj obradi na računskim mašinama se uzimaju vrednosti u diskretnim intervalima.

Opšti statistički model za vremenske serije može biti predstavljen u obliku

= g (t) + , t = 1,2,…, T,

Metod pokretnih proseka se koristi za odreĎivanje osnovnog toka pojave, tj. za

odreĎivanje trenda ukoliko ciklična komponenta ne postoji ili za odreĎivanje proizvoda trenda I

ciklične komponente

Page 9: Statistička analiza broja dece u vaspitno obrazovnim ...ftn.kg.ac.rs/download/SIR/SIR Snezana Glodjovic 21_2011.pdf · Republika Srbija, Srbija SEVER, Beogradski region, region Vojvodine,

- 9 -

Trend je osnovna razvojna tendencija obeležja i nastaje od regularnih uticaja na

posmatrano obeležje. On predstavlja dugoročnu tendenciju razvoja vremenske serije. Trend

komponentu vremenske serije obeležavamo sa T, odnosno sa T (i), i = 1,2,…,n.

Ciklična komponenta je varijacija koja se pojavljuje kao oscilacija oko trenda sa

promenljivom periodom koja je obično veća od jedne godine. Cikličnu komponentu vremenske

serije obeležavamo sa C, odnosno sa C (i), i = 1,2,…,n.

Sezonska komponenta je varijacija koja se pojavljuje kao oscilacija oko trenda sa istom

periodom koja je obično manja ili jednaka od jedne godine. Sezonsku komponentu vremenske

serije obeležavamo sa S, odnosno sa S (i), i = 1,2,…n.

Rezidualna komponenta je slučajna ili katastrofalna varijabla. Slučajne varijable imaju

karakter slučajnih grešaka, dok su katastrofalne varijable posledica nekih prirodnih ili društvenih

nepogoda (poplave, zemljotresi, ratovi,…). Rezidualnu komponentu vremenske serije

obeležavamo sa R, odnosno sa R (i), i = 1,2,…n.

Vremenska serija je jednaka proizvodu svojih osnovnih komponenti:

X = T * C * S * R

5 Zaključak Iz prethodnog teksta se moglo zaključiti da je upotreba paketa Statistika veoma pogodna

za obradu kako malog, tako i velikog broja podataka.

Svakodnevno se susrećemo sa podacima koji su prikazani zbirno, pregledno, a ne znamo

kako se do takvih podataka uopšte došlo. U ovom master radu su prikazani podaci preko

histograma, različitih vrsta dijagrama, poligonalnih linija.

6 Literatura [1] Lazarević, V., Đukić, M., Inženjerska matematika, Čačak: Tehnički fakultet,

2010

[2] Stojanović, S., Matematička statistika, Beograd, 1980

[3] Dajović, V., Matematika za IV razred Gimnazije prirodno – matematičkog smera, Beograd,

Zavod za udžebike i nastavna sredstva

[4] Programski paket Statistika 8: http://www.statsoft.com/

[5] Ivković, Z., Matematička statistika, "Naučna knjiga", Beograd, 1992