opis kategoricke varijable

29
STATISTIKA U PSIHOLOGIJI 1 STATISTIKA U ISTRAŽIVANJU OBRAZOVANJA OPIS KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE NUMERIČKIH VARIJABLI Oliver Tošković Univerzitet u Beogradu Filozofski fakultet

Upload: andirjafcb

Post on 20-Oct-2015

53 views

Category:

Documents


2 download

DESCRIPTION

opis kategoricke varijable

TRANSCRIPT

  • STATISTIKA U PSIHOLOGIJI 1STATISTIKA U ISTRAIVANJU OBRAZOVANJA

    OPIS KATEGORIKIH VARIJABLI GRAFIKO PREDSTAVLJANJE KATEGORIKIH VARIJABLI GRAFIKO PREDSTAVLJANJE NUMERIKIH VARIJABLIOliver TokoviUniverzitet u BeograduFilozofski fakultet

  • OPIS KATEGORIKE VARIJABLEE = { ei; i =1, 2,..., n} P ispitanici (Keni, Kajl, Sten, Kartman...)Q = { qk; k =1, 2,..., g}, g 2 varijabla sa dve i vie kategorija (pol, boja kose...)eik= ok ei qk oznaka kategorije kojoj ispitanik pripada (Keni je muko...)

  • OPIS KATEGORIKE VARIJABLEpresek razliitih kategorija = prazan skupne sme isti ispitanik biti u dve grupe (ako je Keni muko ne moe da bude i ensko)unija kategorija = varijablaiscrpnost svi moraju negde pripadati

  • KODIRANJE KATEGORIKE VARIJABLEFaktor vektorski oblik

    ISPITANIKSESKeni1 (siromaan)Kajl2 (srednji)Sten2 (srednji)Kartman3 (bogat)

  • KODIRANJE KATEGORIKE VARIJABLEKompletni disjunktni oblik matrica binarnih varijabli (0 ili 1)vie odgovora na istom pitanju!

    ISPITANIKsiromaansrednjibogatKeni100Kajl010Sten010Kartman001

  • STATISTIKI OPIS KATEGORIKE VARIJABLEPrebrojavanje frekvenca, uestalostProporcija relativna frekvencafrekvenca kategorije / ukupni broj ispitanika

    HOROSKOPSKI ZNAKbroj sportistaproporcijavodolija200200/1000=0,20ribe210210/1000=0,21...strelac1010/1000=0,01TOTAL10001000/1000=1

  • STATISTIKI OPIS KATEGORIKE VARIJABLEIndeks kvalitativne varijacije varijabilnost kategorike varijable raznovrsnost uzorka u pogledu kategorike varijable

    Zavisi od raspodele proporcija po kategorijama i broja kategorija.Kree se u granicama od 0 (najmanja raznovrsnost) do 1 (najvea raznovrsnost).

  • Indeks kvalitativne varijacije: primer

    KATEGORIJAfrekvenca 1(proporcija 1)frekvenca 2 (proporcija 2)I50 (0.25)197 (0.985)II50 (0.25)1 (0.005)III50 (0.25)1 (0.005)IV50 (0.25)1 (0.005)IKV 1 0.04

  • STATISTIKI OPIS KATEGORIKE VARIJABLEEntropija mera neureenosti sistemaH=-p*log10p jedinica hartli

    H=-p*log2p jedinica bit

    H=-p*logep prirodna jedinica (e)

    koliko informacija nosi injenica da znamo da je Keni iz South Park-a

  • TEORIJA INFORMACIJE

  • TEORIJA INFORMACIJEN = 1N = 2N = 4N = 8p = 1p = .500p = .250p = .125h = log2 8h = log2 4h = log2 2h = log2 1h = -log2 .125h = -log2 .250h = -log2 .500h = -log2 1,0h = 0h = 1h = 2h = 31

  • TEORIJA INFORMACIJEN = 1N = 2N = 4N = 8p = 1p = .500p = .250p = .125h = log2 8h = log2 4h = log2 2h = log2 1h = -log2 .125h = -log2 .250h = -log2 .500h = -log2 1,0h = 0h = 1h = 2h = 312

  • TEORIJA INFORMACIJEN = 1N = 2N = 4N = 8p = 1p = .500p = .250p = .125h = log2 8h = log2 4h = log2 2h = log2 1h = -log2 .125h = -log2 .250h = -log2 .500h = -log2 1,0h = 0h = 1h = 2h = 3123

  • TEORIJA INFORMACIJEShannon & Weaver (1949)H = - S p log2 pPROSENA KOLIINA INFORMACIJE: Entropija (H)

  • STATISTIKI OPIS KATEGORIKE VARIJABLEEntropija kategorike varijable = varijansa numerikeEntropija zavisi od:raspodele verovatnoa po kategorijamabroja kategorija

  • GRAFIKI PRIKAZ KATEGORIKE VARIJABLEtapiasti dijagram (barchart)

  • GRAFIKI PRIKAZ KATEGORIKE VARIJABLEtapiasti dijagram (barchart)

  • GRAFIKI PRIKAZ KATEGORIKE VARIJABLEPitasti dijagram (piechart)

  • GRAFIKI PRIKAZ KATEGORIKE VARIJABLEPitasti dijagram (piechart)

  • GRAFIKI PRIKAZ NUMERIKE VARIJABLEPoligon frekvenciHistogram poligon stubacaGrafik kumulativnih frekvenciGrafik kumulativnih procenata

  • POLIGON FREKVENCI

    ocenarazredfrekvencasredina razreda621-245022.5725-286126.5829-325530.5933-362334.51037-403038.5

  • POLIGON FREKVENCI

  • HISTOGRAMObe egzaktne granice donja i gornja +0.5

  • GRAFIK KUMULATIVNIH FREKVENCI

    ocenarazredfrekvencasredina razredakumulativna fgornja egzaktna granica621-245022.55024.5725-286126.511128.5829-325530.516632.5933-362334.518936.51037-403038.521940.5

  • GRAFIK KUMULATIVNIH FREKVENCI

  • GRAFIK KUMULATIVNIH PROCENATA - OGIVA

    ocenarazredfrekvencasredina razredakumulativna fkumulativna propgornja egzaktna granica621-245022.5500.2324.5725-286126.51110.5128.5829-325530.51660.7632.5933-362334.51890.8636.51037-403038.5219140.5

  • GRAFIK KUMULATIVNIH PROCENATA - OGIVA

  • BOX & WHISKERmedijanaokolinske vrednosti kvartili +/- 1.5*interkvratilni opseg