German Stata User Meeting 2003
Tabellierung vonTabellierung von
Mehrfachantwort-Mehrfachantwort-
gruppengruppen
Zwei neue ProgrammeZwei neue Programme
Hilde Schaeper / [email protected]
2German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Bei HIS: Zwei Arten der Kodierung von Mehrfachantwortfragen
1. Set von binären Variablen
In welchem Rahmen haben Sie während Ihres Studiums an folgenden Lehr- und Lernformen aktiv mitgewirkt? (Mehrfachnennung möglich)
Ich habe in Gruppen an der Bearbeitung von Studienaufgaben mitgewirkt
Ich habe in praxis-/forschungsorientieten Projektstudien mitgearbeitet
Ich habe in kooperativen Studienprojekten von Hochschule und Betrieben/Dienststellen gearbeitet
Ich habe freiwillige betriebliche Praktika absolviert
Ich habe in internationalen Zusammenhängen studiert
Ich war als Tutor/Tutorin eingesetzt
lform2
lform1
lform3
lform4
lform5
lform6
3German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
2. Set von polytomen Merkmalen
In welchen Fächern haben Sie Ihre Abitur-prüfung abgelegt?
LK1 LK2 GK1 GK2
Mathematik 1
Physik 2
Chemie 3
Biologie 4
Geographie 5
Deutsch 6
Englisch 7
Französisch 8
Spanisch 9
Geschichte 10
Sozialkunde 11
usw. fach1 fach2 fach3 fach4
Haben Sie neben den für das Studium erfor-derlichen Lehrveranstaltungen auch Veran-staltungen innerhalb oder außerhalb der Hochschule speziell mit dem Ziel der Ver-besserung der Berufschancen besucht?
ja 1
nein 2
Wenn ja, welche?
1.
2.
3.
lv1 lv2 lv3
4German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Die SPSS-Prozedur <mult response> (Beispiele)
1. univariate Verteilung dichotomer Mehrfachantwortvariablen
mult response groups=lehrform(lform1 to lform9 (1)) /freq=lehrform.
Mehrfachantworten Group LEHRFORM (Value tabulated = 1)
Dichotomy label
Formen: Gruppen Formen: Projektstudien Formen: koop. Studienprojekte Formen: freiwillige Praktika Formen: internationales StudiumFormen: Tutor/in
--- snip ---
Name
LFORM1LFORM2LFORM3LFORM4LFORM5LFORM6
Count
5997 2557 814 2910 1432 1399
Pct of Responses
26,4 11,2 3,6 12,8 6,3
6,2
Pct of Cases
77,4 33,0 10,5 37,5 18,5 18,0
------- ----- -----Total responses 22728 100,0 293,2
350 missing cases; 7.752 valid cases
5German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
2. bivariate Verteilung dichotomer Mehrfachantwortvariablen
GESCHL
Count |männlich weiblich Row pct | Row Col pct | Total | 1 | 2 |LEHRFORM --------+--------+--------+ LFORM1 | 2490 | 3507 | 5997 Formen: Gruppen | 41,5 | 58,5 | 77,4 | 78,2 | 76,8 | +--------+--------+ LFORM2 | 1074 | 1483 | 2557 Formen: Projektstudi | 42,0 | 58,0 | 33,0 | 33,7 | 32,5 | +--------+--------+ --- snip --- +--------+--------+ Column 3186 4566 7752 Total 41,1 58,9 100,0
Percents and totals based on respondents
7.752 valid cases; 350 missing cases
6German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
3. Tabellierung polytomer Mehrfachantwortvariablen
mult response groups=lehrveranst(lv1 to lv3 (1, 99))/freq=lehrveranst.
Mehrfachantworten Group LEHRVERA Pct of Pct ofCategory label Code Count Responses Cases
Einsatz von EDV(-Programmen), Programmie 1 399 8,3 12,5techn. Grundlagen der DV 2 26 ,5 ,8EDV allgemein 3 80 1,7 2,5Wirschaftsveranstaltungen 4 358 7,4 11,2Jura-Veranstaltungen 5 94 1,9 3,0Regionalstudien 6 11 ,2 ,3Veranstaltungen zur Ökologie 7 33 ,7 1,0(Fremd-)Sprachenveranstaltungen 8 960 19,9 30,2Zusatzzertifikate 9 224 4,6 7,0
--- snip ---
Sonstiges 99 53 1,1 1,7 ------- ----- ----- Total responses 4826 100,0 151,6
4.919 missing cases; 3.183 valid cases
7German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Tabellierung von Mehrfachantwortvariablen in Stata
1. Dichotome Mehrfachantwortvariablen
a) <tabstat> (interner Ado-File)
tabstat lform1-lform6 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f)
variable | mean N------------+-------------------- lform1 | 75,5 7752,0 lform2 | 31,3 7752,0 lform3 | 10,1 7752,0 lform4 | 37,3 7752,0 lform5 | 18,3 7752,0 lform6 | 18,0 7752,0---------------------------------
8German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
a) <tabstat> mit by()-Option
tabstat lform1-lform3 [aw=gewinsg], statistics(mean count) /// columns(statistics) format(%3.1f) by(geschl)
Summary for variables: lform1 lform2 lform3 by categories of: geschl (Geschlecht)
geschl | mean N----------------+-------------------- männlich | 77,2 3186,0 | 31,6 3186,0 | 10,7 3186,0----------------+-------------------- weiblich | 73,5 4566,0 | 30,9 4566,0 | 9,4 4566,0----------------+-------------------- Total | 75,5 7752,0 | 31,3 7752,0 | 10,1 7752,0-------------------------------------
9German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften von <tabstat>
Übersichtlichkeit
Gewichte (aweights, fweights)
Formatierung der Statistiken
Präfix „by ... :“
Option by()
keine absoluten Häufig-keiten für „genannt“
keine Variablenetiketten
Formatanweisung gilt füralle Statistiken
für Prozentwerte ist vorhe-rige Rekodierung notwendig
Variablen müssen als Indi-katorvariablen vorliegen
keine Ausgabe in Formvon Kreuztabellen
10German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
b) <tabcond> (externer Ado-File)
tabcond variables lform1-lform9, cond("@==1")
-------------------------------------------- Variable | @==1--------------------------------+----------- Formen: Gruppen | 5997 Formen: Projektstudien | 2557 Formen: koop. Studienprojekte | 814 Formen: freiwillige Praktika | 2910 Formen: international | 1432 Formen: Tutor/in | 1399Formen: Studiengruppen geleitet | 603 Formen: Lernprogramme genutzt | 1387 Formen: Recheche mit PC | 5629--------------------------------------------
11German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften
Übersichtlichkeit
prozentuale Häufigkeiten auf Basis der Fälle und Antworten
Variablennamen u. -etiketten
Formatierung der Statistiken
Gewichte (aweight, iweight, fweight)
Definition von bis zu zwei „missing values“
Spezifikation des für die Tabellierung zu benutzenden Wertes
c) <mrditab> (neuer externer Ado-File)
Syntax
mrditab varlist [weight] [if exp] [in range][, response(integer) missing(integer) format(%fmt)]
Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung
keine Ausgabe von Kreuztabellen
nur numerische Variablen
12German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel ohne Optionen)
. qui mvdecode lform1-lform9, mv(-1)
. mrditab lform1-lform4
variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 |lform2 Formen: Projektstudien| 2557 33,0 20,8 |lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte |lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278
13German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Formatoption)
. qui mvdecode lform1-lform9, mv(-1)
. mrditab lform1-lform4, format(%5.2f)
variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,36 48,84 |lform2 Formen: Projektstudien| 2557 32,99 20,83 |lform3 Formen: koop. Studienp| 814 10,50 6,63 rojekte |lform4 Formen: freiwillige Pr| 2910 37,54 23,70 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278
14German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Gewichtsanweisung)
. qui mvdecode lform1-lform9, mv(-1)
. mrditab lform1-lform4 [aw=gewinsg], format(%5.2f)
!!!weighted analysis using aweight = gewinsg!!!
variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5828 75,46 47,46 |lform2 Formen: Projektstudien| 2415 31,27 19,67 |lform3 Formen: koop. Studienp| 777 10,06 6,33 rojekte |lform4 Formen: freiwillige Pr| 2881 37,30 23,46 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278
15German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Missing-Option)
. mrditab lform1-lform4, mis(-1)
variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 |lform2 Formen: Projektstudien| 2557 33,0 20,8 |lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte |lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278
16German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrditab> (Beispiel mit Response-Option)
. qui recode lform1-lform9 (1=2)(0=1)(-1=.)
. mrditab lform1-lform4, response(2)
variable variable | pct. of pct. of name label | freq. cases resp. ----------------------------------+-------------------------------lform1 Formen: Gruppen | 5997 77,4 48,8 |lform2 Formen: Projektstudien| 2557 33,0 20,8 |lform3 Formen: koop. Studienp| 814 10,5 6,6 rojekte |lform4 Formen: freiwillige Pr| 2910 37,5 23,7 aktika |------------------------------------------------------------------valid cases (unweighted): 7752missing cases (unweighted): 350total responses (unweighted): 12278
17German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Tabellierung von Mehrfachantwortvariablen in Stata
2. Polytome Mehrfachantwortvariablen
a) <mrdum> (externer Ado-File)
mrdum lv1-lv3, stub(lv) response(1 2 3 4) labels
--------------------------------------------------------------------- responses | code present percent-----------------------------------------+---------------------------Einsatz von EDV(-Programmen), Programmie | 399 12,54 techn. Grundlagen der DV | 26 0,82 EDV allgemein | 80 2,51 Wirschaftsveranstaltungen | 358 11,25---------------------------------------------------------------------Cases with at least one response : 3183 (39.29 %) Completely missing : 4919
Total cases : 8102
Variables created for 4 possible responses + 1 for missing
18German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften von <mrdum>
Übersichtstabelle der abso-luten und prozentualen Häufigkeiten
(Kreuz-)Tabellierung der re-sultierenden Dummy-Variab-len
keine Übersichtstabelle unter Verwendung von Gewichten
bei Verwendung von Gewich-ten oder Erstellen von Kreuz-tabellen : zweistufiges Vor-gehen erforderlich
19German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
b) <mtab> (externer Ado-File)
mtab lv1-lv3
Overall Between Within respset | Freq. Percent Freq. Percent Percent----------+----------------------------------------------------- Einsatz | 399 8,27 399 12,54 51,42 techn. G | 26 0,54 26 0,82 50,00 EDV allg | 80 1,66 80 2,51 47,06 Wirschaf | 358 7,42 358 11,25 52,65 Jura-Ver | 94 1,95 94 2,95 50,00 Regional | 11 0,23 11 0,35 45,83 Veransta | 33 0,68 33 1,04 47,83
--- snip ---
Kontakte | 51 1,06 51 1,60 54,26 zusätzl. | 16 0,33 16 0,50 69,57 sonstige | 53 1,10 53 1,67 49,53 ---------+----------------------------------------------------- Total | 4826 100,00 4826 151,62 55,74 (n = 3183)
pct. responses pct. cases
20German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften von <mtab>
übersichtliche Tabellierungder absoluten und prozentu-alen Häufigkeiten
Prozentuierung sowohl aufBasis der Antworten als auchauf Basis der Beobachtungen
keine Gewichte
keine Kreuztabellen
kein Präfix „by ...:“
21German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Eigenschaften
Übersichtlichkeit
ein- und zweidimensionale Häufigkeitstabellen
absol. Häufigkeiten, Spaltenprozente, Zeilenprozente (wählbar)
Formatierung der Statistiken
Gewichte (aweight, iweight, fweight)
Präfix „by ... :“, „if“-Bedingung und „in“-Bedingung
c) <mrtab> (neuer externer Ado-File)
Syntax
mrtab varlist [weight] [if exp] [in range] [, by(varname) format(%fmt) center count column row name(varname)]
keine Ausgabe von Randverteilungen
nur numerische Variablen
keine Spaltenvariablen mit negativen Werten
22German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (Beispiel für eindimensionale Häufigkeitstabellen)
. mrtab lv1-lv3, count col
----------------------------------------------------------------- respset | count col. pct-----------------------------------------+-----------------------Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0-----------------------------------------------------------------valid cases (unweighted) 3183missing cases (unweighted) 4919
23German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (Beispiel mit name-Option)
. mrtab lv1-lv3, count col name(lehrveranstaltungen)
----------------------------------------------------------------- lehrveranstaltungen | count col. pct-----------------------------------------+-----------------------Einsatz von EDV(-Programmen), Programmie | 399 12,5 techn. Grundlagen der DV | 26 0,8 EDV allgemein | 80 2,5 (Fremd-)Sprachenveranstaltungen | 960 30,2 Rhetorikkurse, Persönlichkeitstraining | 386 12,1 Veranstaltungen im eigenen Fach | 1060 33,3 Veranstaltungen im anderen Fach | 299 9,4 sonstiges | 1431 45,0-----------------------------------------------------------------valid cases (unweighted) 3183missing cases (unweighted) 4919
24German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
c) <mrtab> (Beispiel für Kreuztabellen (by-Option)). mrtab lv1-lv3 [aw=gewinsg], count col row by(geschl) /// name(lehrveranstaltungen)
!!!weighted analysis using aweight = gewinsg!!!+--------------------------------+| cell content ||--------------------------------|| 1. frequency || 2. row percent || 3. column percent (of cases) |+--------------------------------+----------------------------------------------------------------- | Geschlecht lehrveranstaltungen | männlich weiblich-----------------------------------------+-----------------------Einsatz von EDV(-Programmen), Programmie | 206 199 | 50,9 49,1 | 12,4 13,0 --- snip --- -----------------------------------------------------------------valid cases (unweighted) 1 = "männlich" 1294valid cases (unweighted) 2 = "weiblich" 1889missing cases (unweighted) 4919
25German Stata User Meeting, 12.08.2003
Hilde Schaeper: Tabellierung von Mehrfachantwortgruppen
Behandlung von identischen Wertenbei polytomen Mehrfachantwortvariablen
Beispielsdatensatz
id abifach1 abifach2 abifach3 abifach4
1 Biologie Deutsch Englisch sonst. Sprache
2 Deutsch Mathematik sonst. Sprache sonst. Sprache
Auswertung mit „mult response“
Pct ofCategory label Count Cases
Biologie 1 50,0Deutsch 2 100,0Englisch 1 50,0Mathematik 1 50,0sonst. Sprachen 3 150,0
Auswertung mit <mrtab>
---------------------------------- Abiturfächer | count col. pct ----------------+----------------- Biologie | 1 50,0 Deutsch | 2 100,0 Englisch | 1 50,0 Mathematik | 1 50,0 sonst. Sprachen | 2 100,0
----------------------------------