querschnitt- und längsschnitterhebung
Post on 03-Jan-2016
36 Views
Preview:
DESCRIPTION
TRANSCRIPT
1
Querschnitt- und Längsschnitterhebung
Jian TONGValentin KASSINPeter STEBE
2
Querschnitt- und Längsschnitterhebungen
Überblick:
Daten: Querschnitt-, Trend- und Paneldaten Daten und Design Kohortendesign Auswahl von Erhebungsdesigns
3
Dimension von DatenElement Xijk
Untersuchungseinheiten: i Variablen: j Zeitpunkte: t i
Xijt j
t
4
Erhebungsdesign Erhebung von aussagekräftiger Daten zur Überprüfung von
Hypothese Zwei Arten der Datenerhebung von zeitliche Modus:
statische Bestandsgröße vs. Dynamische Größe Querschnittdesign Längsschnittdesign
(Trend- und Paneldesign)
i i
tt
5
Querschnittdesign Die Datenerhebung bezieht sich auf einen
Zeitpunkt oder eine kurze Zeitspanne, in der eine einmalige Erhebung der Eigenschaften (Variablenwerte) bei N Untersuchungseinheiten vorgenommen wird.
Bsp.1: Es werden die Einkommenswerte von verschiedenen Personen zu einem Zeitpunkt erhoben.
6
Bsp. 1: Querschnitterhebung
0
500
1000
1500
2000
2500
3000
3500
4000
1999 2000 2001 2002 2003
Zeitachse
Ein
kom
men
(V
aria
ble
)
Person 1
Person 2
Person 3
Person 4
Person 5
7
Trenderhebung Bei einem Trenddesign werden die Werte der
gleichen Variablen zu mehreren Zeitpunkten mit jeweils unterschiedlichen Stichproben erhoben.
Bsp.2: Es werden die Einkommen von jeweils anderen Personen zu verschiedenen Zeitpunkten erhoben.
8
Bsp. 2: Trenderhebung
0
500
1000
1500
2000
2500
3000
3500
4000
4500
1999 2000 2001 2002 2003
Zeitachse
Eink
omm
en (V
aria
ble)
Mittelw ert
9
Panelerhebung Mit einem Paneldesign werden die Werte der
gleichen Variablen zu mehreren Zeitpunkten, jedoch auf der Grundlage einer identischen Stichprobe erhoben (Panelwellen).
Bsp.3: Es werden die Einkommen von den gleichen Personen zu verschiedenen Zeitpunkten erhoben.
10
Bsp. 3: Panelerhebung
0
500
1000
1500
2000
2500
3000
3500
1999 2000 2001 2002 2003
Zeitachse
Ein
kom
men
(V
aria
ble
)
Person 1
Person 2
Person 3
Person 4
Person 5
11
Vergleichen Informationshierarchie:
Querschnittdaten < Trenddaten < Paneldaten
Trenddesign Aggregatebene Stichproben- und Meßfehler
Paneldesign Individuelle Ebene Panelmortalität (Schwundquote/Welle) Mittelschichtbias Stichproben- und Meßfehler entfällt
12
Daten und Designs Erhebungsdesigns dienen der Sammlung
aussagekräftiger Daten, die Hypothesen überprüfen sollen.
Bisherige Annahmen: Querschnittdesigns erzeugen Querschnittdaten Trenddesigns erzeugen Querschnitt oder Trenddaten Paneldesigns erzeugen Querschnitt, Trenddaten oder
Paneldaten Diese Annahmen setzen voraus:
Zeitpunkt der Messung = Erhebungszeitpunkt
Was passiert bei Ereignissen in der Vergangenheit?
13
Retrospektivfragen Bsp: Retrospektivfragen
Bildungsabschluss, Jahr der Eheschließung, etc. Der Erhebungszeitpunkt ist mit dem Zeitpunkt auf dem
sich die Messung bezieht nicht mehr identisch! Der Datentyp und der Typ des Erhebungsdesigns
müssen in so einem Fall nicht mehr notwendigerweise übereinstimmen.
Das kann Missverständnisse implizieren
Zur Veranschaulichung dieser Problematik soll eine Studie mit dem Ziel der Untersuchung der beruflichen Mobilität dienen
14
Vergleich zweier Designtypen
Interesse gilt Paneldaten zum Wechsel beruflicher Positionen
Design A: Paneldesign mit drei Wellen in den Jahren 95, 96 und 97.
Design B: Querschnittserhebung mit Retrospektivfragen im Jahr 97.
Gegenstand der Betragung:“ Erfragt wird die gegenwärtige Berufsposition sowie die berufliche Position vor einem Jahr und vor zwei Jahren.
Beide Erhebungen liefern Paneldaten zur beruflichen Position.
15
Vergleich zweier Designtypen Fazit:
Die Berufliche Position kann zwar erhoben werden aber..
Monatseinkommen der betreffenden Jahre? Subjektiven Befindlichkeiten?
Da die Ereignisse in der Vergangenheit liegen, müssen diese mit Hilfe von Retrospektivfragen abgefragt werden. Die Paneldaten, die mit Hilfe des Paneldesigns abgefragt wurden haben eine höhere Datenqualität.
16
Beispiel Wählerwanderungsstudien:
Erhebung von Paneldaten mit Hilfe eines Querschnittsdesigns
Befragung des Wählers nach Verlassen des Wahllokals:1. Aktuelle Stimmabgabe2. Stimmabgabe bei der letzten Wahl (Recallfrage)
Das Ergebnis sind Paneldaten Diese Daten werden in einer Matrix angeordnet, die
Auskunft über die Wählermobilität gibt (entspricht einer Mobilitätstabelle)
Sie geben Auskunft über den Ab- und Zustrom der Stammwähler
Die Recallfrage ist mit einer gewissen Ungenauigkeit behaftet.
17
Datentyp nach Kriterien des Zeitbezugs
Querschnittdaten Beobachtungen für
Beschäftigte, Konsumenten, Firmen, Regierungseinheiten zu einem bestimmten Zeitpunkt.
Mit Querschnittsdaten können wir Beziehungen zwischen Variablen erforschen, indem wir Unterschiede zwischen Individuen, Firmen oder anderen Beobachtungseinheiten zu einem bestimmten Zeitpunkt untersuchen.
18
Datentyp nach Kriterien des Zeitbezugs
Zeitreihendaten Daten für eine einzelne
Einheit (Person, Firma, Land etc.), die zu aufeinander folgenden Zeitpunkten beobachtet werden.
Zeitreihendaten können bspw. genutzt werden, um die Entwicklung von Variablen in der Zeit zu studieren und daraus zukünftige Werte dieser Variablen vorauszuschätzen
19
Datentyp nach Kriterien des Zeitbezugs
Paneldaten Paneldaten oder
Längsschnittdaten sind Daten für mehrere Einheiten, wobei für jede Einheit Beobachtungen für zwei oder mehr Zeitpunkte existieren.
Paneldaten können genutzt werden, um ökonomische Beziehungen zwischen den Beobachtungen für einzelne Einheiten sowie deren Entwicklung in der Zeit zu erforschen.
20
Datentyp nach Kriterien des Zeitbezugs Verlauf oder Ereignisdaten
21
Datentyp nach Kriterien des Zeitbezugs Verlauf oder Ereignisdaten
Panelerhebung 1 Panelerhebung 2
22
Datentyp nach Kriterien des Zeitbezugs
Verlaufs- oder Ereignisdaten Bei Ereignisdaten handelt es sich um Zeitintervalle
zwischen zwei Ereignissen Beispiele hierfür wären: Zeitraum zwischen Arbeitslosigkeit
und Wiederbeschäftigung, sowie der Zeitraum zwischen 2 Lebensabschnittspartnern.
Für die Erhebung kommen sowohl Querschnitts- als auch Paneldesigns in Frage. Die Ereignisgeschichte muss jedoch retrospektiv abgefragt werden.
Ereignisdaten werden bspw. bei folgenden Analysen verwendet:
Studien zur Langzeitarbeitslosigkeit Studien zur Berufsfluktuationen
23
Kohortendesign
Begriff
Kohorte in den Sozialwissenschaften
zeitlich gemeinsam, längerfristig prägendes Startereignis
24
Kohortenkonzept Idee: Auf eine Kohorte wirken kulturelle und
sozialökonomische Einflüsse Generationen als Träger sozialen Wandels Datenerhebung mittels Querschnitts- und
Paneldesigns. Ex ante und ex post Berücksichtigung Zeitbezug Bsp. 4 und Bsp. 5
25
Bsp. 4 Scheidungsrisiko nach Heiratskohorten
15 %
10 %
6,5 %
1955 1965 1975
Eheschließungsjahrgänge
26
Bsp. 5: Verlaufmuster des Scheidungsrisikos nach der Ehedauer (Lebenszykluseffekt)
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Ehedauer in Jahre
Sch
eid
un
gsr
isik
o
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Ehedauer in Jahre
Sch
eid
un
gsr
isik
o
27
Drei Effekte bei Kohortenuntersuchungen
Kohorteneffekte: gemeinsam Einflüssen ausgesetzt, systematische Unterschiede während Kalenderzeit
Lebenszykluseffekte: auch Alterseffekte, z.B. Sterbetafel; Abhängigkeiten von der Prozesszeit
Periodeneffekte (Bsp. 6): historisch einmalige Ereignisse (Scheidungsrisiko 1978 BRD)
28
Bsp. 6: Entwicklung der Scheidungsziffern mit Periodeneffekt 1978
0
10
20
30
40
50
60
70
80
90
55 58 60 62 64 66 68 70 72 74 76 78 79 80 82 84 86 88 90 92
Jahr
Sch
eid
un
gen
pro
10
000
Eh
en
29
Lebenszyklus-Fehlschluss Lebenszykluseffekt: Intelligenzabbau im Alter,
geringere Testdaten als jüngere Ältere Probanden gehören zu älteren
Geburtskohorten Mitglieder dieser Kohorten haben geringere
Schulbildung. Prospektive Panelerhebung: kein nennens-
werter Intelligenzabbau bis ins höhere Alter
30
Problem: Einkommensprofil Einkommensverlauf Typisch konkav E-Profil ist ein Lebenszykluseffekt Schätzung nach Querschnittdaten Kohorteneffekt: Niveauunters. des E-Profils Empfohlen: Paneldesign
31
Demographie Wenn möglich Alterseffekte nach Kohorten Kohortensterbetafel von 100t f/m über 100y Q: 1995-2095? A: Periodensterbetafel, Sterblichkeit der einjährigen
1994 etc. Mortalität und Lebenserwartung 100y zurück Sterbetafel erstreckt sich so über 200 Jahre Prognose nur ohne Kohorteneffekte korrekt
32
Probleme Unmöglichkeit der Separierung von Kohorten-
und Lebenszykluseffekten- erhebliche Prognoseprobleme- Lebenszyklus-Fehlschluss- Bsp. Wertwandel/Post(-Materialismus)- Bsp. Wählerpotential (Grüne 20-40y)
33
Auswahl des Erhebungsdesign
Kann man mit Retrospektivfragen Panel oder Ereignisdaten zuverlässig abfragen?
Ausgangspunkt: Hypothese
1. Zuerst wird der erforderliche Datentyp ermittelt2. Es wird ein geeignetes Erhebungsdesign gewählt
Es muss möglichst zuverlässig und mit geringem Aufwand erfasst werden können.
34
Dank für die Aufmerksamkeit
Jian TONGValentin KASSINPeter STEBE
35
Frage Welche Wahrnehmungsprobleme gibt es? Was
versteht man darunter? Erläuterung anhand eines Beispiels.
Was versteht man unter Werturteilen, welche Aspekte des Werturteils-problems lassen sich unterscheiden?
top related