irena vipavc brvar adp, univerza v ljubljani, november 2012

60
Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012 ARHIV DRUŽBOSLOVNIH PODATKOV in SEKUNDARNA ANALIZA PODATKOV http://www.adp.fdv.uni-lj.si

Upload: giona

Post on 11-Jan-2016

42 views

Category:

Documents


5 download

DESCRIPTION

http://www.adp.fdv.uni-lj.si/. ARHIV DRUŽBOSLOVNIH PODATKOV in SEKUNDARNA ANALIZA PODATKOV. Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012. Vsebina predavanja. Splošno o arhivu in mikro podatkih Sekundarna analiza Metapodaki - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

ARHIV DRUŽBOSLOVNIH PODATKOVin

SEKUNDARNA ANALIZA PODATKOV

http://www.adp.fdv.uni-lj.si/

Page 2: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Vseb

inaVsebina predavanja

• Splošno o arhivu in mikro podatkih• Sekundarna analiza• Metapodaki• Dostop do metapodatkov in podatkov preko ADP• Analiza podatkov v Nesstarju• Mednarodne podatkovne baze

Page 3: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

AD

PArhiv družboslovnih podatkov

je osrednji slovenski družboslovni arhiv podatkov,pokriva vsa pomembnejša družboslovna področja,

Naloge:

shranjuje podatke iz preteklih raziskav za ponovno uporabo (zagotavlja, da so podatki ohranjeni pred tehnološko zastarelostjo in fizičnim uničenjem),preveri, potrdi in pripravi podatke in pripadajočo dokumentacijo raziskave,uporabnikom omogoča enostaven dostop do podatkov v številnih formatih innudi storitve s področja metodologije in statističnih obdelav.

Page 4: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

”podatki” - računalniško berljive podatkovne datoteke

.. prepisi intervjujev, avdio in video zapisi

O p

oda

tkihKaj so podatki?

Page 5: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Mikro p

oda

tkiVprašalnik

Page 6: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Mikro p

oda

tkiSeznam spremenljivk

Page 7: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Mikro p

oda

tkiPodatki

Page 8: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Se

kun

darn

a an

alizaShematski prikaz paradigne sekundarne

analize (Toš, 1988)

Page 9: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Se

kun

darn

a an

alizaSekundarna analiza

Uporabimo že zbrane podatke za testiranje hipotez in jih ne zbiramo sami.

Se nanaša na raziskovalno prakso, ki vključuje izkoriščanje podatkov, ki jih je zbral nekdo drugi ali podatkov, ki so bili primarno zbrani za nek drug namen (npr. administrativni zapisi).

Ključni elementi s katerimi se srečujemo so:- dostop do podatkov in njihova uporabnost- ohranjevanje zaupnosti in zasebnosti, ki jih je respondentom jamčil primarni raziskovalec- lastninske pravice in lastništvo nad podatki

Page 10: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Se

kun

darn

a an

aliza

Razloge za uporabo sekundarne analize lahko razdelimo v tri skupine (Hayman v Štebe, 1999):

- Konceptualno-vsebinski razlogi (primerjava med različnimi časovnimi obdobji; že testirani vprašalniki; različni nameni uporabe)

- Metodološki razlogi (kombinacija več virov podatkov; slabost – nepoznavanje podrobnosti zbranih podatkov- kakovost)

- Ekonomski razlogi (prihranek denarja in časa)

Page 11: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Me

tapo

datkiMetapodatke lahko definiramo kot “vse informacije

potrebne za obveščanje in procesiranje statističnih struktur”. (Grossmann v Vipavc in Klep, 2003).

Pri kakovostnem oblikovanju metapodatkovnih standardov imajo velik pomen uporabniki informacij.

razvoj standardov (DDI) Mednarodna izmenjava opisov raziskav (zapis v

XML) Možnost analize podatkov

Metapodatki

Page 12: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Meta

pod

atki

- podatke, - spremljajočo dokumentacijo, - informacije o vzorčenju,... podatke, ki se lahko

zgubijo.

Spremljajoča dokumentacija naj vsebuje informacije kot izvor podatkov; kaj je bil osnovni namen zbiranja; kdo so bili avtorji in naročniki oz. sponzorji; kako so bili podatki zbrani; kakšni so pravni pogoji uporabe podatkov; opis spremenljivk; kako so bili podatki združeni – kodirna shema; v kakšnem formatu je hranjena računalniško berljiva podatkovna datoteka; na katerem mediju je hranjena.......

Kaj hraniti

Page 13: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Standard na katerem temelji priprava vsebin za ADP je XML DDI (The Data Documentation Initiative).Po tem standardu je kodirna knjiga sestavljena iz:Opis dokumenta (Document Description)

Opis raziskave (Study Description)- Naslov, avtor, izdelava in distribucija- Vsebina raziskave- Metodologija- Dostop do podatkov

Opis podatkov (Data Files Description)Opis spremenljivk (Variable Description)Ostali dokumenti (Other Documentation)

Standard DDI 2.0

Page 14: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Motivacijski seminar, april 2009

Page 15: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Motivacijski seminar, april 2009

Page 16: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012
Page 17: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 18: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 19: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 20: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 21: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 22: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

NESSTAR je virtualna podatkovna knjižnica, ki

omogoča iskanje, lociranje, pregledovanje in snemanje mnogo raznovrstnih statističnih in drugih podatkov in metapodatkov.

Page 23: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 24: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 25: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 26: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 27: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 28: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Za analizo podatkov potrebujemo uporabniško ime in geslo za NESSTAR.

IZPOLNEM NAROČILO

Page 29: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 30: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 31: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Rezultate dvo dimenzionalnih tabel (predvsem, kadar se število enot med skupinami razlikuje) prikazujemo v odstotkih po neodvisni spremenljivki. Običaj je, da se neodvisna spremenljivka (npr. spol) prikazuje v stolpcu, odvisna pa v vrstici.

Page 32: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 33: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Op

is raziska

ve

Page 34: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Iskanje

Iskanje spremenljivke

Page 35: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Iskanje

Okno za napredno iskanje

Page 36: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Iskanje

Rezultat iskanja besede ZRTEV

Page 37: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

Dodamo še podatke iz mednarodne datoteke.

Ne pozabimo na ugodnosti, ki izhajajo iz mednarodnega sodelovanja arhivov!!

Page 38: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Ne pozabimo CITIRATI gradiva, ki smo ga uporabili.

Citiramo tako vprašalnike, kodirne knjige, kot tudi podatkovne datoteke.

Primeri citiranja so na razpolago v opisih raziskav. Seveda ga prilagodimo pravilom objave svojih gradiv.

Viri se navajajo tako na koncu kot pod samo tabelo ali grafom!

Page 39: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012
Page 40: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012
Page 41: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012
Page 42: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

• Mednarodna splošna družboslovna anketa (ISSP)

• Evrobarometer

• Evrobarometer držav kandidatk

• Evrobarometer srednje in vzhodne Evrope

• Evropska raziskava vrednot (EVS)

GESIS – Leibniz Institute for the Social Sciences

ME

DN

AR

OD

NI P

OD

ATK

I

Page 43: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

ME

DN

AR

OD

NI P

OD

ATK

I

Page 44: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

Pomembnejše mednarodne raziskave

Prosto dostopne za raziskovalne namene

ISSP – International Social Survey Programme

Mednarodna splošna družboslovna anketa [1985 – 2004)– Vloga države; razumevanje vloge državljana– Družbeni stiki– Neenakost– Družina– Stališča o delu; odnos do dela– Raziskava o vernosti in cerkvi– Ekologija– Narodna identiteta

Page 45: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

EB – Eurobarometer [1975 – 2002) CEEB – Central and Eastern EB [1990 – 1997]Evrobarometer srednje in vzhodne EvropeCCEB – Candidate Countries EB [2001 – 2004]Evrobarometer držav kandidatk

Politične in ekonomske spremembe; Evropska unija; mediji; družbene razmere v državah kandidatkah; mladina v novi Evropi; kultura; identiteta in vrednote; Euro, širitev EU in finančne storitve; pokojninski sistem; zdravje; itd..

Page 46: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

EVS – European Values Study [1981, 1990, 1999)http://zacat.gesis.org/webview/index.jsp

EES – European Election Study [2004]CSES – Comparative Study of Electoral Systems [1996 – 2001, 2001 – 2005)ESS – European Social Survey [2002, 2004)ICVS – International Crime Victimisation Survey [1998 – 2000)

Page 47: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Motivacijski seminar, april 2009

Page 48: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

Pri analizi vzorčenih podatkov je zelo pomembno uteževanje. Omogoča, da damo različne uteži različnim enotam v zgodbi analize. Običajno se uporablja za popravek odklona od vzorca, ki naj bi predstavljal določeno populacijo.

Če ste, na primer, zmerili višino 50 moških in 10 žensk v določeni državi z enako spolno porazdelitvijo bo povprečna višina tega vzorca odstopala od povprečne višine v celotni populaciji, saj so moški običajno višji od žensk. Vzorec je zato potrebno utežiti in tako “približati” dejanski populaciji. Potrebno je torej zmanjšati vpliv moške večine v vzorcu. Višine moških množimo z 0,2, višine žensk pa z 1 (moški: 50*0.2=10, ženske: 10*1=10).

Page 49: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

V ESS sta ponujeni dve uteži,ki jih lahko uporabimo (velikokrat moramo):

- vzorčna utež (design weight - dweight). Kar nekaj držav vključenih v raziskavo ni moglo zagotoviti enake verjetnosti za vključitev posameznikov starejših od 15 let. Tako so v določenih državah bolj zastopani posamezniki iz določenih skupin (npr. posamezniki iz večjih družin) in drugi manj. Te "napake" odpravimo z vzorčno utežjo.

- populacijska utež (the Population Size weight - pweight). To utež uporabljamo pri primerjavi dveh ali več držav. Utež upošteva, da je večina držav vključenih v raziskavo imela enako velikost vzorca ne glede na velikost njihove dejanske populacije. Verjetnostna teorija namreč dokazuje, da je vzorec 1000 respondentov enako uporaben za državo z 10 milijoni prebivalci kot za države s samo 1 milijonom. Brez uteževanja bi združeni podatki nad-reprezentirali manjše države. Populacijska utež torej uvaja takšno prilagoditev, da je država predstavljena proporcionalno glede na svojo velikost.

Page 50: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

Pri prikazovanju tabel v odstotkih morate vedno uporabiti utežene podatke.

Osnovni pravili:- vedno uporabimo vzorčno utež in- kadar primerjamo podatke dveh ali več držav in

kadar jih združujemo v skupine (npr. države članice EU) moramo uporabiti tako vzorčno kot populacijsko utež.

Page 51: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskaveUteževanje

Page 52: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Med

naro

dn

e ra

ziskave

Page 53: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Prednosti uporabe gradiv podatkovnih arhivov

Možnost kompleksnih analiz: • domačih in tujih kontinuiranih raziskav

- vključevanje časovne komponente- študij specializiranih populacij

• primerjalnih mednarodnih datotek- večnivojska analiza- upoštevanje merske kvalitete spremenljivk

Page 54: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Problemi mednarodnih anket• Princip ekvivalence – Jowel: How comparable is

comparative research?• Heterogenost populacije že na nacionalnem

nivoju (jezik, običaji izražanja, izobrazba) – mednarodne razlike v sistemih razmišljanja, institucionalnih okvirih in vrednotah

• Metodološki enotni standardi, prevajanje vprašalnikov

Page 55: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Me

dn

arod

no p

rimerja

lno

raziskovanje

Eden od osnovnih ciljev mednarodnega primerjalnega raziskovanja je primerjava konceptov med državami oz. kulturami. Zato je pomembno, da so ti koncepti, v vseh državah vključenih v raziskavo, merjeni na ustreznen način.

Še več, zato, da se lahko naredi ustrezna primerjava lestvice, morajo biti koncepti merjeni na ustrezno primerljiv način.

(J. Billiet, 2004)

(....primeri napačnih prevodov)

Page 56: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Pristo

p k raziskova

njuPRISTOP K RAZISKOVANJURaziskovanja in samo-izobraževanja o raziskovalnih tehnikah se najlažje naučimo skozi zglede. Le-te nam že nudijo večji raziskovalni centri in arhivi.

Nekaj uporabnih povezav:

- ESS EDUNET

(Nudi okolje raziskovanja teoretičnih vprašanj z empiričnimi podatki. Razviti moduli: Imigration, Well-being, Family, gender and work, Human values in Social and political trust.)

- How to guide: Survey Data Analysis for your Dissertation

(Vključuje napotke kako se lotiti raziskovanja, povezave na podatkovne datoteke, postopke analize (celo nekaj programskih stavkov v SPSS).)

- Analyses guide

(Primeri podatkovnih analiz s programom STATA, SPSS, predstavi problem uteževanja, analiza časovne vrste..)

Page 57: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Pristo

p k raziskova

njuPRISTOP K RAZISKOVANJU

Poslužujmo se javnih virov podatkov, čeprav agregatnih.

- Ministrstvo za pravosodje – sodna statistika

- Ministrstvo za notranje zadeve

- Statistični urad RS (letopis, statistične informacije)

Page 58: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Čla

nkiPrimeri člankov

Na internetu najdemo številne članke, ki vključujemo empirične podatke.

Na tem mestu povezujemo nekatere. S tem bi vaš želeli podučiti o količini tabel, grafov, ki jih avtorji uporabljajo in v splošnem na sestavo članka.

- Mills, Melinda in drugi (2008): Gender equality and fertility intentions in Italy and the Netherlands (na podlagi ESS podatkov)

- Ferrati Giulia in Dalla Zuanna Gianpiero (2010): Siblings and human capital: A comparison between Italy and France

- Martin, Valerie, Mills, Melinda in Le Bourdais Celine: The Consequences of Parental Divorce in the Life Course: Outcome o Canadian Children (na podlagi Canadian General Social Survey)

Page 59: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Prim

er

Kako NE prikazujemo podatkov

Vir: Sodna statistika 2007

Page 60: Irena Vipavc Brvar ADP, Univerza v Ljubljani, november 2012

Za dodatna pojasnila smo dostopni na [email protected]