statističke metode - tfzr 3.pdf · najviše i najčešće upotrebljavani statistički metod
TRANSCRIPT
Statističke metode
doc. dr Dijana Karuović
STATISTIČKE METODE
Danas jedan od glavnih metoda naučnog saznanja
Najvažnije statističke metode koje se upotrebljavaju:
Metod uzorka
Metod srednjih vrednosti
Metod korelacije
Metod verovatnoće
STATISTIČKE METODE
METOD UZORKA – jedinstvo metodoloških postupaka i
tehnika koje obezbeđuju da se iz nekog osnovnog skupa
pojava pravilno odabere jedan manji deo koji će
prezentovati celinu
Prema načinu formiranja, 3 tipa uzorka:
Slučajni
Sistematski i
Stratifikovani
STATISTIČKE METODE
METOD SREDNJIH VREDNOSTI
Njime se utvrđuju proseci, odnosno aritmetičke sredine, medijalne i modalne vrednosti masovnih društvenih pojava
Aritmetička sredina pokazuje prosečnu vrednost ili stanje određene pojave
Medijana je statistička vrednost koja izražava srednju pozicionu vrednost neke pojave na skali te pojave i zato se često naziva pozicionom vrednošću
Ekstremne vrednosti nemaju uticaj na položaj medijane
STATISTIČKE METODE
Modalna vrednost je statistička srednja vrednost koja je dominantna na skali pojave koja se ispituje
Na modalnu vrednost ne utiče ni veličina ni pozicija
rezultata, samo učestalost pojedinih pojava
Što je pojava manje varijabilna, aritmetička sredina,
medijana i modalna vrednost imaju sličnije vrednosti
METOD KORELACIJE
Najviše i najčešće upotrebljavani statistički metod
Metodom korelacije se utvrđuje povezanost dveju ili više pojava
Pozitivna korelacija – kada statističke veličine dveju pojava koje se upoređuju uporedo rastu
Negativna korelacija – kada jedna upoređivana statistička veličina raste, druga pada
METOD VEROVATNOĆE
Njime se proučava, odnosno predviđa razvoj najraznovrsnijih društvenih pojava, osobito onih koje su manje složene
Naučno saznanje se od laičkog saznanja upravo razlikuje po stepenu verovatnoće
UPOREDNI METOD
Naučno objašnjenje društvenih pojava uz primenu uporednog metoda može se vrsiti na tri nivoa:
Uporedna istraživanja u jednom društvu (uslov je da društvo nije homogeno)
Proučavanje društvenih pojava u više konrektnih društav koja pripadaju isto istorijskom tipu društva
Najopštija upoređenja, gde se uporedo proučavaju opšte osobine različitih tipova društava
ANALIZA SADRŽAJA
Istraživački postupak kojim se želi izgraditi sistematska iskustvena evidencija o simboličkom opštenju kao jednom od aspekata društvenog života
Opšti postupak analize sadržaja:
1. Stvaranje sistema kategorija analize i jedinica za klasifikaciju sadržaja i oblika simboličkog opštenja
2. Analiza simboličkog opštenja i statistička obrada podataka dobijenih analizom
3. Naučni opis sadržaja i oblik simboličkog opštenja
Prosečne srednje vrednosti
Grupisani podaci
Negrupisani podaci
Statistička metoda
slučajni uzorak; gde su slučajni ishodi kod
kojih se posmatraju obeležja X, tako se dobija n-
dimenzionalna slučajna veličina .
– registrovana vrednost uzorka, tj. realizovana
vrednost .
Slučajni uzorak je prost uzorak ako su sve slučajne
promenljive međusobno nezavisne i sve imaju
istu funkciju raspodele F(X).
Eksperiment sastoji od n nezavisnih registrovanja
vrednosti obeležja X.
nkXX kk ,...,2,1,
n ,...,, 21
nXXX ,...,, 21
nxxx ,...,, 21
nXXX ,...,, 21
nXXX ,...,, 21
Na osnovu uzorka definiše se empirijska funkcija
raspodele kao:
Centralna teorema matematičke statistike (teorema
Glivenka-Kantelija) je:
gde je F(X) teorijska funkcija raspodele obeležja X.
XFn
*
Ax
AxIRxxXI
nXF A
n
k
kn,0
,1,
1
1
*
10sup * xFxFp n
To znači da sve realizacije funkcije konvergiraju ka
odgovarajućim vrednostima funkcije .
Zaključci dobijeni na “dovoljno dobrom” uzorku tačni. Sa
verovatnoćom blizu 1 i za celu populaciju.
Za predstavljanje podataka koristimo:
XFn
*
XF
Statističke tablice
Poligoni relativne učestalosti
Histogrami
Tačkaste ocene parametara
Zadatak statistike da se na osnovu slučajnog uzorka uzetog
iz populacije sa obeležjem X koje ima raspodelu F(x, ϴ)
odredi parametar ϴ.
Ako je poznato da obeležje X ima određeni tip raspodele
(binomna, normalna), postavlja se kao problem ocena
parametara koji se pojavljuju u funkciji raspodele F (npr.
ako je X: N(m,) problem je oceniti parametre m i ).
Tačkaste ocene parametara
nepristrasnost ocene – ocena je centrirana: E(U)=,
U se izračunava na osnovu registrovanih vrednosti iz
slučajno uzetog uzorka, slučajna veličina koja može imati
svoje matematičko očekivanje.
korektnost ocene – da je ocena U asimptotski centrirana:
E(U), kada n, tj. Obim uzorka neograničeno raste
konzistentnost ocene – kada n, najmanja
moguća disperzija ocene u odnosu na dati raspored
022 UEU
Metod maksimalne verodostojnosti
familija dopustivih raspodela obeležja X. Funkcija verodostojnosti L se
definiše kao:
Ocena parametra koja se dobija metodom maksimalne
verodostojnosti je ona vrednost za koju funkcija L() ima
maksimum.
Traženje maksimuma za L može se obavljati:
izjednačavanjem izvoda funkcije po sa nulom
prvo logaritmovanjem pa onda diferenciranjem i izjednačavanjem sa
nulom
xf
xpxf
k
,
,...,, 21 nxfxfxfL