Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der VolksschuleÖsterreichischer ExpertenberichtHerausgegeben von Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner
PIRLS &TIMSS 2011
Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.)
PIRLS & TIMSS 2011Die Kompetenzen in Lesen, Mathematik und Naturwissenschaft am Ende der VolksschuleÖsterreichischer Expertenbericht
Leykam
Bundesministerium für Bildung und FrauenMinoritenplatz 5 1014 Wien
Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens Alpenstraße 1215020 Salzburg
www.bifie.at
PIRLS & TIMSS 2011. Die Kompetenzen in Lesen, Mathematik und Naturwissen-schaft am Ende der Volksschule. Österreichischer Expertenbericht. Birgit Suchań, Christina Wallner-Paschon & Claudia Schreiner (Hrsg.). Graz: Leykam 2015. ISBN 978-3-7011-8002-8Einbandgestaltung und Layout: Die Fliegenden Fische, Salzburg & Andreas Kamenik, BIFIE I Zentrales Management & Services Satz: Sandra Hechenberger, BIFIE I Zentrales Management & Services Druck: Steiermärkische Landesdruckerei GmbH, 8020 GrazVertrieb an den Buchhandel: Leykam Buchverlagsgesellschaft m. b. H. Nfg. & Co. KG www.leykamverlag.at
Kein Teil des Werks darf in irgendeiner Form (durch Fotografie, Mikrofilm oder ein anderes Verfahren) ohne schriftliche Genehmigung des Verlags reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.
Vorwort
Die internationalen Studien PIRLS und TIMSS beleuchten systemische Zusammenhänge des Kompetenzerwerbs durch den Vergleich mit anderen Ländern. Die Möglichkeit des System-vergleichs bietet dabei einen wichtigen Interpretationsrahmen für die Ergebnisse einzelner Länder und Bildungssysteme. PIRLS und TIMSS geben somit dem österreichischen Schul-system regelmäßig Rückmeldung darüber, wie gut es gelingt, bis zum Ende der Volksschule wesentliche Grundkompetenzen in Lesen sowie Mathematik und Naturwissenschaft zu ver-mitteln und damit einen wesentlichen Baustein für erfolgreiche Bildungskarrieren zu legen. Im Zentrum steht, Orientierungswissen für die Bildungsplanung, -steuerung, die Aus- und Fortbildung der Lehrerinnen und Lehrer sowie für die Qualitätsentwicklung zu gewinnen. Die Ergebnisse aus PIRLS und TIMSS dienen nicht der Steuerung von Einzelschulen – so wie das in Österreich die flächendeckenden Standardüberprüfungen mit Rückmeldungen für Schulen und Lehrer/innen intendieren. Sehr wohl können aber einzelne Erkenntnisse aus PIRLS und TIMSS auch für die konkrete pädagogische Arbeit am Schulstandort von Nutzen sein.
Der vorliegende Band geht verschiedenen Fragestellungen im Zusammenhang mit der Lese-, Mathematik- und Naturwissenschaftskompetenz von Kindern im Volksschulalter nach. Die Basis für die Analysen bilden vorrangig die Daten aus PIRLS und TIMSS 2011, aber auch Daten aus früheren Erhebungen dieser Studien sowie der OECD-Studie PISA. Abschnitt I widmet sich den Kompetenzen selbst – im internationalen Vergleich sowie im Längsschnitt, mit einem fokussierten Blick auf besonders leistungsstarke und besonders leistungsschwache Kinder, durch die Analyse der Schwierigkeit der einzelnen verwendeten Leseaufgaben für österreichische Kinder, aus der Perspektive der Geschlechtergerechtigkeit sowie durch eine spezifische methodische Fragestellung im Zusammenhang mit fehlenden Antworten im Test. Abschnitt II lenkt die Aufmerksamkeit auf außerschulische Rahmenbedingungen des Kom-petenzerwerbs – der Einfluss des Migrationshintergrunds auf die Schülerleistungen sowie verschiedene Faktoren familiärer Bedingungen und Unterstützung stehen hier im Mittel-punkt. Abschnitt III greift Themen des Unterrichts auf und zeigt, welche Rolle Hausauf-gaben sowie Methoden der inneren Differenzierung im Unterricht der Volksschule spielen.
Dieser Band ist vor allem das Ergebnis der Arbeit der Autorinnen und Autoren. Das Team der internationalen Studien am BIFIE unter der Leitung von Birgit Suchań und Christina Wallner- Paschon zeichnet nicht nur für die Durchführung von PIRLS und TIMSS in Österreich verantwortlich, sondern hat durch konzeptionelle, strukturelle und organisato-rische Arbeiten über verschiedene Autorengruppen hinaus wesentlich zum Entstehen dieses Buchs beigetragen. Für ihren Beitrag zur Qualitätssicherung gilt unser Dank den externen Reviewern Johann Bacher, Ferdinand Eder und Josef Thonhauser. Layout, Satz und Lektorat oblag dem Medienmanagement des BIFIE unter der Leitung von Hannes Kaschnig. Ganz besonderer Dank gebührt den Schülerinnen und Schülern, ohne deren Bereitschaft und Engagement die Durchführung von PIRLS und TIMSS 2011 nicht möglich gewesen wäre.
Salzburg, im Oktober 2015
Claudia SchreinerDirektorin des BIFIE
Inhalt
3 Vorwort 7 Einführung
13 I. Kompetenzen in Lesen, Mathematik & Naturwissenschaft
15 1.1 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 27 1.2 Analysen auf Itemebene in Lesen 39 1.3 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 55 1.4 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment
65 II. Familiäre und vorschulische Unterstützung
67 2.1 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 85 2.2 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 100 2.3 Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf schulische Kompetenzen
111 III. Unterricht in Lesen, Mathematik & Naturwissenschaft an Österreichs Volksschulen
113 3.1 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 127 3.2 Innere Differenzierung im Mathematikunterricht
143 Anhang
145 Anhangstabellen 151 Autorenverzeichnis
Einführung 7
EinführungBirgit Suchań & Christina Wallner-Paschon
Die Studien PIRLS (Progress in International Reading Lite-racy Study) und TIMSS (Trends in International Mathema-tics and Science Study) erfassen in regelmäßigen Abständen Schlüsselkompetenzen von Schülerinnen und Schülern der vierten Schulstufe1: PIRLS misst seit 2001 alle fünf Jahre die Lesekompetenz; TIMSS erhebt seit 1995 im Abstand von vier Jahren die Kenntnisse der Schüler/innen in Mathe-matik und Naturwissenschaft. Durch diesen unterschied-lichen Erhebungsrhythmus fielen PIRLS und TIMSS im Jahr 2011 erstmals zusammen. Die Teilnehmerländer hat-ten so die Möglichkeit, alle drei Kompetenzbereiche ge-meinsam bei denselben Schülerinnen und Schülern zu er-heben – eine Gelegenheit, die sich erst wieder in 20 Jahren bieten wird. Initiator dieser beiden Studien ist die unabhän-gige Forschergemeinschaft IEA (International Association for the Evaluation of Educational Achievement), die 1958 gegründet wurde. Seit über 50 Jahren hat die IEA zahlreiche groß angelegte Vergleichsstudien im Bereich der Bildung durchgeführt, um den politischen Entscheidungsträgern internationale Bildungsindikatoren bereitzustellen. Damit können Stärken und Schwächen im Bildungssystem im in-ternationalen Vergleich identifiziert werden.
Ziele von PIRLS und TIMSS
Internationale Studien wie PIRLS und TIMSS messen die Qualität von Bildungssystemen zu bestimmten Zeitpunkten der schulischen Ausbildung in Form ihres Ertrags (Outputs) und vergleichen diesen über alle Teilnehmerländer hinweg. Darüber hinaus wird eine Reihe an Hintergrundinformati-onen erhoben, die Hinweise auf mögliche Bedingungsfak-toren guter und schwacher Schulleistungen liefern. Daraus können faktenbasierte Maßnahmen für eine Qualitätsver-besserung im Bildungssystem abgeleitet werden.
Folgende Indikatoren können mit PIRLS und TIMSS ge-wonnen werden:
�� Basisindikatoren: Die Leistungsdaten aus PIRLS und TIMSS liefern Informationen über den Ist-Stand der Kompetenzen in Lesen, Mathematik und Naturwissen-schaft am Ende der vierten Schulstufe.�� Kontextindikatoren: Mithilfe von Fragebögen für Schü-
ler/innen, Eltern, Lehrkräfte, Schulleiter/innen sowie hinsichtlich des Lehrplans werden Kontextindikatoren erhoben, von denen angenommen wird, dass sie mit dem Lernen von Lesen, Mathematik und Naturwissen-schaft in Zusammenhang stehen. Sie können wichtige Erklärungsbeiträge für unterschiedliche Schülerleistun-gen liefern.�� Trendindikatoren: Die regelmäßige Durchführung von
PIRLS und TIMSS ermöglicht es, die Leistungen der Schüler/innen im Zeitverlauf zu beobachten und zu analysieren.
Teilnehmerländer und Organisation von PIRLS & TIMSS 2011
Teilnehmerländer
Abbildung 1.1 zeigt alle Teilnehmerländer von PIRLS & TIMSS 2011auf der 4. Schulstufe. An PIRLS haben sich ins-gesamt 45 Länder und acht Regionen2 beteiligt; an TIMSS 50 Länder und sieben Regionen. Insgesamt 37 Länder und sechs Regionen haben die Gelegenheit des Zusammenfalls beider Studien genützt und die Kinder sowohl in Lesen als auch in Mathematik und Naturwissenschaft getestet.
Österreich beteiligte sich 2011 zum zweiten Mal an der internationalen Lesestudie PIRLS und zum dritten Mal an der internationalen Studie TIMSS zur Erfassung der Mathematik- und Naturwissenschaftskompetenz von Schülerin-nen und Schülern auf der vierten Schulstufe. Dieses Kapitel bietet einen Überblick über wesentliche Aspekte bei der Durchführung von PIRLS und TIMSS. Neben einer Beschreibung der Ziele und der für die Studien verantwortlichen internationalen und nationalen Institutionen wird auf die Stichprobe, das Testdesign sowie auf wesentliche Aspekte bei der Interpretation der Ergebnisse eingegangen.
1 TIMSS bietet die Möglichkeit, auch die Schüler/innen der 8. Schulstufe zu testen. Österreich hat sowohl 2007 als auch 2011 nur an der Erhebung auf der 4. Schulstufe teilgenommen.
2 Bei den Regionen handelt es sich um Regionen/Teile eines Landes, die sich unabhängig von einer landesweiten Teilnahme an PIRLS und/oder TIMSS beteiligen, um eigene Vergleichsdaten zu erhalten. International werden diese als Benchmarking Participants bezeichnet. Sie werden in der Ergebnisdar-stellung des vorliegenden Berichts nicht berücksichtigt.
8 Einführung
Abbildung 1.1: Teilnehmerländer 4. Schulstufe (PIRLS & TIMSS 2011)
Deutschland DEU*
AlbertaCAN (AB)
Australien AUS
AserbaidschanAZE
nur TIMSSnur PIRLS PIRLS & TIMSS
Marokko MAR
Hongkong HKG
Litauen LTU*
Katar QAT
Kroatien HRV
Neuseeland NZL
Regionen (Benchmarking Participants)
Teilnehmende Länder PIRLS & TIMSS 2011
AndalusienESP (AN)*MaltaMLT (mt)*
Abu DhabiARE (AD)
Dubai ARE (DU)
Florida USA (FL) North CarolinaUSA (NC)
Finnland FIN*
England GBR (E)*
Malta MLT*
Niederlande NLD*
Spanien ESP*
Rumänien ROU*
Portugal PRT*
Taiwan TWN
Saudi-Arabien SAU
TschechischeRepublik CZE*
Slowenien SVN*
Slowakische Republik SVK*
Russland RUS
Polen POL*
Oman OMN
Schweden SWE*
Singapur SGP
Vereinigte Staatenvon Amerika USA
Vereinigte Arabische Emirate ARE
Ungarn HUN*
Österreich AUT*
Norwegen NOR
Dänemark DNK*
Bulgarien BGR*
Israel ISR
Belgien (fr)BEL (fr)*
Kolumbien COL
Indonesien IDN
Frankreich FRA*
Kanada CAN
Trinidad und Tobago TTO
Belgien (fl)BEL (fl)*
Chile CHL
Serbien SRB
Türkei TUR
Tunesien TUN
Kasachstan KAZ
Armenien ARM
Bahrain BHR
Japan JPN
Korea KOR
Kuwait KWT
Jemen YEM
Thailand THA
Nordirland GBR (N)*
Italien ITA*
Irland IRL*
Iran IRN
Georgien GEO
Quebec CAN (QC)
Ontario CAN (ON)
* Teilnehmerland ist Mitglied der Europäischen Unionausgewählte Vergleichsländer sind fett hervorgehoben
Einführung 9
Die internationale Organisation
Die IEA trägt als Initiatorin der beiden Studien die über-geordnete Projektverantwortung. Grundlegende Entschei-dungen, die neben PIRLS und TIMSS auch alle anderen IEA-Studien betreffen, werden in der jährlich stattfinden-den General Assembly (Generalversammlung) getroffen. Verantwortlich für die internationale Organisation und Koordination für PIRLS und TIMSS ist das International Study Center (ISC) am Boston College in den USA. Das ICS arbeitet dabei eng mit einem Konsortium zusammen, dem folgende Institutionen angehören:
�� IEA-Sekretariat (Amsterdam): Überprüfung der Über-setzungen aller Testinstrumente der teilnehmenden Län- der, Ausbildung der internationalen Qualitätsbeobach-ter/innen;�� IEA-Datenverarbeitungs- und Forschungszentrum
(Hamburg): Verarbeitung und Prüfung der bei PIRLS und TIMSS erhobenen Daten;�� Statistics Canada (Ottawa, Ontario): Stichprobenzie-
hung, Gewichtung;�� Educational Testing Service (Princeton, New Jersey):
Unterstützung in messtheoretischen Belangen.
Für die Entwicklung und Begutachtung der Testaufga-ben sowie der Hintergrundfragebögen gibt es jeweils eine Expertengruppe. 2011 bestand jede dieser Gruppen aus acht bis zwölf Expertinnen und Experten aus verschiedenen Teilnehmerländern. Somit wird eine breite wissenschaft-liche Expertise bei der Erstellung der Erhebungsinstrumente sichergestellt.
Für die nationale Umsetzung der Studien gibt es in jedem Land ein nationales Projektzentrum. Der National Research Coordinator (NRC) ist dabei für die Durchführung der Stu-die unter Einhaltung sämtlicher internationalen Richtlinien im eigenen Land verantwortlich.
Die nationale Organisation
In Österreich gehört die Durchführung internationaler Assessments zu den gesetzlichen Kernaufgaben des BI-FIE (Bundesinstitut für Bildungsforschung, Innovation & Entwicklung des österreichischen Schulwesens) unter der Leitung von Dr.in Claudia Schreiner (Direktorin). Umge-setzt werden diese im Department Bildungsstandards & Internationale Assessments in Salzburg unter der Leitung von Mag.a Simone Breit (Departmentleiterin). Aufgabe des BIFIE ist die wissenschaftliche Planung und praktische Umsetzung der Studien. In Zusammenarbeit mit dem ISC wurde am BIFIE das Untersuchungsdesign an die natio-
nalen Gegebenheiten angepasst, die Aufgaben und Frage - bögen wurden mitentwickelt, übersetzt und an österreich-ische Besonderheiten adaptiert. Darüber hinaus hat das BIFIE die Erhebungen an den Schulen durchgeführt, erfasst die Daten elek tronisch und analysiert sie für den Ergebnis-bericht.
Population und Stichprobe
Die Definition der Stichprobe erfolgt bei PIRLS und TIMSS über die Schulstufe: Zur Grundgesamtheit zählen alle Schüler/innen jener Schulstufe, die dem 4. Schuljahr entspricht3. Das Durchschnittsalter muss zum Testzeit-punkt mindestens bei 9,5 Jahren liegen. In Österreich sowie in den meisten Teilnehmerländern finden die Tests somit am Ende der 4. Schulstufe (4. Klasse Volksschule) statt.
Die Ziehung der Stichprobe erfolgte in zwei Schritten. Zunächst wurden in jedem Land aus allen Schulen mit Schülerinnen und Schülern der 4. Schulstufe die Test-schulen zufällig ausgewählt. Um dabei eine standardisierte Vorgehensweise zu gewährleisten, wurde dieser Schritt für alle Länder von Statistics Canada durchgeführt. Im zwei-ten Schritt wurde am jeweiligen nationalen Zentrum an diesen Schulen mindestens eine Klasse der 4. Schulstufe – ebenfalls zufällig – ausgewählt. Den Ländern stand es frei, jeweils mehr als eine Klasse pro Schule für die Stichprobe zu ziehen. Alle Schüler/innen der somit festgelegten Klassen waren Teil der PIRLS- und TIMSS-Stichprobe.
Sowohl auf Schul- als auch auf Schülerebene war es nach international definierten Kriterien möglich, Viertklässler/innen vom Test auszuschließen – die Ausschlüsse durften in Summe allerdings nicht mehr als 5 % der Population ausmachen. In Österreich wurden auf Schulebene Sonder-schulen sowie Schulen mit weniger als drei Schülerinnen und Schülern der 4. Schulstufe im Vorfeld (vor dem ersten Schritt der Stichprobenziehung) ausgeschlossen. Auf Schü-lerebene wurden (nach der Ziehung der Klassenstichprobe) folgende Schüler/innen ausgeschlossen:
�� Schüler/innen mit einer anhaltenden körperlichen Be-einträchtigung (0,2 % aller ausgewählten Schüler/innen in Österreich), �� Schüler/innen mit einer anhaltenden geistigen Beein-
trächtigung (2,6 %) und �� Schüler/innen mit einer anderen Muttersprache, wenn
gleichzeitig die Testsprache noch nicht ausreichend be-herrscht wird (0,7 %).
3 Das erste Schuljahr wird dabei über den ISCED-Level 1 definiert. ISCED ist eine internationale Standardklassifikation der Bildung, die von der UNESCO entwickelt wurde (Details dazu unter: http://www.uis.unesco.org/Library/Documents/2011-international-standard-classification-education-isced-2012-en.pdf ). ISCED-Level 1 ist jener Zeitpunkt in der Schullaufbahn, zu dem das systematische Lernen von Lesen, Schreiben und Mathematik sowie der Erwerb eines Basiswissens in anderen Bereichen beginnen.
10 Einführung
Die Entscheidung darüber hat in Österreich die Klassen-lehrerin/der Klassenlehrer in Absprache mit der für die Testdurchführung zuständigen Person getroffen und betraf 3,5 % aller ausgewählten Schüler/innen. Weitere 25 Kin-der (0,5 %) hatten die Schule zwischen der Erstellung der Schülerlisten und dem Testzeitpunkt verlassen.
Die österreichische Stichprobe für PIRLS & TIMSS 2011 besteht aus 158 Schulen, 276 Klassen und 4670 bzw. 4668 Schülerinnen und Schülern. Mit einer Teilnahmequote von 100 % sowohl auf Schul- als auch auf Klassenebene und 97,8 % (PIRLS) bzw. 97,7 % (TIMSS) auf Schülerebene konnte Österreich die international geforderten Teilnahme-quoten (85 % auf Schul- und Schülerebene, 95 % auf Klas-senebene) deutlich übertreffen.
Ablauf der Tests und Testinstrumente
Der PIRLS-Test
PIRLS misst die Leseleistung der Viertklässler/innen diffe-renziert für unterschiedliche (1) Leseabsichten und (2) Ver-stehensprozesse, die beim Lösen der Aufgabenstellung erfor-derlich sind. Darüber hinaus werden (3) das Leseverhalten und die Einstellungen zum Lesen erfasst.
Mithilfe von literarischen Texten und Informationstexten werden beim PIRLS-Test zwei unterschiedliche Leseabsich-ten generiert: Lesen, um literarische Erfahrung zu machen, und andererseits Lesen, um Informationen zu gewinnen. Die Lesekompetenzen der Schüler/innen können nach diesen beiden Subskalen getrennt analysiert werden.
Die Verstehensprozesse (kognitive Prozesse, die beim Lösen einer Aufgabe notwendig sind) werden durch unterschied-liche Aufgabentypen zu den Texten hervorgerufen. Es gibt (1) Aufgaben, bei denen die Schüler/innen explizit angege-bene Informationen „Erkennen und Wiedergeben“ müssen, (2) Aufgaben, die ein Ziehen von einfachen Schlussfolge-rungen verlangen, (3) Aufgaben, bei denen ein Interpretie-ren sowie Verknüpfen von Gedanken und Informationen notwendig sind, um zur richtigen Lösung zu kommen und (4) Aufgaben, bei denen Inhalt, Sprache und einzelne Text-elemente untersucht und bewertet werden müssen. Für eine Analyse der Lesekompetenz hinsichtlich der Verstehen-sprozesse werden jeweils zwei der eben genannten Anfor-derungen zu Subskalen zusammengefasst: Wiedergeben und Schlussfolgern sowie Interpretieren und Bewerten.
Der dritte Aspekt – das Leseverhalten und die Einstellungen zum Lesen – wird mit den Hintergrundfragen im Schüler-fragebogen erhoben.
Die Messung der Lesekompetenz erfolgt mit einem Papier- und-Bleistift-Test. Insgesamt gibt es zehn Texte (fünf Infor-
mationstexte und fünf literarische Texte) mit daran anschlie-ßenden Aufgaben. Die Texte wurden zu 13 verschiedenen Testheften kombiniert, wobei jedes Testheft aus 2 Texten besteht. Für die Bearbeitung des Testshefts hatten die Schü-ler/innen insgesamt 80 Minuten Zeit. Im Anschluss daran beantworteten sie den Schülerfragebogen. Dieser umfasst neben demographischen Informationen auch Fragen zum familiären Hintergrund, zu den Lesegewohnheiten außer-halb der Schule und zum Lesen in der Schule. Auch die Eltern sowie die Lehrkräfte der beteiligten Schüler/innen wurden gebeten, einen Fragebogen zu beantworten. Auf Schulebene wurden von den Schulleiterinnen und Schul-leitern Informationen zu Schulressourcen, Schulklima etc. erhoben. Der Fragebogen zum Lehrplan in den Teilnehmer-ländern ergänzt die Informationen auf Schul- und Klassen-ebene und fokussiert auf die national festgelegten Rahmen-bedingungen des Leseunterrichts an den Schulen.
Der TIMSS-Test
Um ein möglichst detailliertes Bild von den Kompetenzen der Schüler/innen zu erhalten, werden die Domänen Ma-thematik und Naturwissenschaft in jeweils drei inhaltliche und drei kognitive Bereiche (Subskalen) unterteilt. Die kog-nitiven Bereiche sind für beide Domänen ident und erfassen (1) das Wissen über mathematische bzw. naturwissenschaft-liche Fakten, Konzepte und Prozesse, (2) das Anwenden ihres Wissens in unterschiedlichen Situationen und (3) das Begründen von Schlussfolgerungen und Lösungen bzw. von Experimenten. Bei den Inhaltsbereichen in Mathematik wird unterschieden zwischen (1) Zahlen, (2) geometrische Formen und Maße sowie (3) Darstellen von Daten. In Natur-wissenschaft werden die Themen (1) Biologie, (2) Physik und (3) Erdkunde abgedeckt.
Auch bei TIMSS wird ein Papier-und-Bleistift-Test einge-setzt, um die Kompetenzen der Schüler/innen zu erfassen. Insgesamt gab es 14 verschiedene Testheftformen. Jedes Testheft bestand aus insgesamt zwei Aufgabenblöcken im Bereich Mathematik und zwei Aufgabenblöcken im Be-reich Naturwissenschaft. Für die Bearbeitung aller Aufga-ben in einem Testheft hatten die Schüler/innen insgesamt 72 Minuten Zeit. Darüber hinaus wurden wie bei PIRLS Fragebögen auf folgenden Ebenen eingesetzt: Schüler/in-nen, Eltern, Lehrkräfte, Schulleitung sowie ein Lehrplan-fragebogen.
Zur Interpretation der Ergebnisse
Die vorliegende Publikation fokussiert auf die österreichi-schen Ergebnisse. Da bei PIRLS & TIMSS, wie bei Lar-ge-Scale-Assessments üblich, nicht alle Schüler/innen der 4. Schulstufe eines Landes getestet wurden, sondern eine Stichprobe, muss bei der Interpretation der Daten Folgen-des beachtet werden:
Einführung 11
�� Die aus den Daten resultierenden statistischen Kenn-zahlen (z. B. Mittelwerte) sind Punktschätzungen der tatsächlichen Populationswerte. Sie sind aufgrund der Testung einer Stichprobe mit einem gewissen statisti-schen Messfehler – dem Standardfehler (SE) – behaftet. Dieser wird unter anderem dafür verwendet, einen Werte bereich (Konfidenzintervall) zu berechnen, inner-halb dessen sich der tatsächliche Populationsmittelwert mit einer bestimmten Wahrscheinlichkeit befindet. Für die vorliegende Publikation wurde diese Wahrschein-lichkeit mit 95 %, (d. h. p < .05) festgelegt4. Das heißt, die Werte der Population liegen mit 95-prozentiger Wahrscheinlichkeit innerhalb der berichteten Konfi-denzintervalle.
�� Der Standardfehler (statistischer Messfehler) spielt auch bei statistischen Tests eine Rolle, etwa wenn man die Er-gebnisse zweier Gruppen miteinander vergleicht (z. B. Mädchen und Buben). Alle Signifikanzprüfungen in dieser Publikation erfolgen, falls nicht explizit anders vermerkt, zweiseitig auf dem 5 %-Niveau.
�� Da es sich bei PIRLS & TIMSS um sehr große, präzise Stichproben handelt, können teilweise auch sehr kleine Unterschiede (etwa zwischen Mädchen und Buben) statistisch nachgewiesen werden. Diese existieren mit großer Wahrscheinlichkeit in der betreffenden Populati-on, sind aber manchmal so klein, dass sie in praktischer Hinsicht nicht relevant sind. Einige Ergebnisdarstellun-gen beinhalten deshalb Angaben zur Effektstärke eines Unterschieds.5 Damit wird zusätzlich zur statistischen Signifikanz auch die Größenordnung von gefundenen Unterschieden quantifiziert. Eine grobe Faustregel für die Einschätzung der Größenordnung sind die Richt-werte nach Cohen (1988), nach denen Effektstärken ab 0.2 als kleine, ab 0.5 als mittlere und ab 0.8 als große Unterschiede eingestuft werden. Demnach kann ab einer Effektstärke von 0.2 (d. h., der Unterschied macht 20 % der Standardabweichung aus) zusätzlich zu einer statistischen Signifikanz auch von einer praktischen Relevanz ausgegangen werden.
4 Das Konfidenzintervall errechnet sich damit aus dem Wert der Punktschätzung (z. B. Mittelwert) ±1,96 x SE.5 Das hier verwendete Effektstärkemaß für Mittelwertunterschiede (Cohens d) wird nach folgender Formel berechnet:
Darüber hinaus wird darauf hingewiesen, dass es sich bei den angegebenen Kennwerten (Mittelwerte, Standardfeh-ler, Prozentangaben etc.) um gerundete Werte handelt. Die Werte (inkl. jener in Tabellen und Abbildungen) werden zuerst – unter Berücksichtigung entsprechender Nachkom-mastellen – berechnet und dann kaufmännisch gerundet. Es kann daher vorkommen, dass beispielsweise die Summe von gerundeten Prozentangaben nicht exakt 100 ergibt oder Summen und Differenzen von Werten geringfügig inkon-sistent erscheinen.
Folgende Berichte zu PIRLS & TIMSS 2011 wurden be-reits publiziert:
B. Suchań & C. Schreiner (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissen-schaft in der Grundschule. Technischer Bericht. Verfügbar un-ter: https://www.bifie.at/buch/1740
B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schrei-ner (2012). PIRLS & TIMSS 2011. Schülerleistungen in Le-sen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick. Graz: Leykam.
B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schrei-ner (2012). PIRLS & TIMSS 2011. Schülerleistungen in Le-sen, Mathematik und Naturwissenschaft in der Grundschule. Die ersten Ergebnisse. Graz: Leykam.
Martin, M. O. & Mullis, I. V. S. (Eds.). (2013). TIMSS and PIRLS 2011: Relationships Among Reading, Mathematics, and Science Achievement at the Fourth Grade – Implications for Early Learning. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.
Mullis, I. V. S., Martin, M. O., Foy, P. & Drucker, K. T. (2012). The PIRLS 2011 International Results in Reading. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.
Literatur
Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum
I. Kompetenzen in Lesen, Mathematik &
Naturwissenschaft
Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 15
1.1 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
BirgitSuchań
Mittelwerte und Streuungen in den drei Kompetenzbereichen
Wie gut können Österreichs Viertklässler/innen im Ver-gleich zu jenen aus den teilnehmenden EU-Ländern sinnerfassend lesen? Wie hoch sind ihre mathematischen Fähigkeiten im EU-Vergleich und sind ihre Kenntnisse bei naturwissenschaftlichen Themen besser als jene der Kinder anderer Länder? Um diese Fragen zu beantworten, wird zu-nächst ein Überblick über das durchschnittliche Leistungs-niveau gegeben. Die Abbildungen 1.1.1 bis 1.1.3 zeigen für die teilnehmenden EU-Länder den Mittelwert und das dazugehörige 95 %ige Konfidenzintervall (in Orange) sowie die Streuung der Leistung in Form von Perzentilen (5., 25., 75. und 95.). Die Länder sind dabei absteigend nach dem Durchschnittswert gereiht. Hellblau hinterlegt sind jene Länder, in denen sich der Mittelwert nicht signifikant vom Österreich-Schnitt unterscheidet. Um zu überprüfen, ob die Unterschiede, die – auch wenn sie sehr gering sind – aufgrund der großen und präzisen Stichproben statistisch nachgewiesen werden können, auch in praktischer Hinsicht relevant sind, wurde für alle Ländervergleiche mit Öster-reich die Effektstärke2 berechnet. Die Effektstärken sind in Form von Sternsymbolen in den Abbildungen 1.1.1 bis 1.1.3 eingetragen. Die exakten Werte zu diesen Abbildun-gen befinden sich in den Anhangstabellen A.1 bis A.3.
Lesen
Im Durchschnitt erreichen die 23 teilnehmenden EU- Länder bei PIRLS einen Mittelwert von 534 Punkten (s. Ab-bildung 1.1.1). Finnland liegt an der Spitze. Die finnischen
Schüler/innen übertreffen mit 568 Punkten die Leseleistung eines jeden anderen EU-Teilnehmerlands. Nordirland folgt mit einem Mittelwert von 558 Punkten und ist ebenfalls signifikant besser als alle dahinter gereihten Länder. Danach folgen zwei nordeuropäische Länder und England, wo die Kinder eine etwa gleich hohe Lesekompetenz aufweisen: Dänemark (554), Irland (552) und England (552).
Die Kinder in Österreich erzielen 529 Punkte auf der Lese-Gesamtskala. Mit diesem Wert liegen sie knapp, aber dennoch statistisch signifikant unter dem EU-Mittel und 39 Punkte hinter Finnland. Neben Finnland übertreffen weitere 11 EU-Länder (darunter auch Deutschland) den Österreich-Schnitt. In sieben dieser 11 Länder ist diese höhere Lesekompetenz nicht nur statistisch gegeben, son-dern auch von praktischer Relevanz. So beträgt die Effekt-stärke für den Vergleich von Finnland und Österreich 0.61, was als mittlerer Effekt eingestuft werden kann. Die Effekt-stärken für Nordirland bis zur Tschechischen Republik be- tragen zwischen 0.42 und 0.27. Von Schweden bis Ungarn sind die Differenzen hinsichtlich der Lesekompetenz prak-tisch nicht relevant. Vergleichbare Lesekompetenzen mit Österreich haben die Schüler/innen der Slowakischen Republik (535), Bulgariens (532), Sloweniens (530), Litauens (528) sowie Polens (526) – gemeinsam mit Öster-reich befinden sie sich in der unteren Hälfte der Länder-reihung. Fünf Länder liegen deutlich hinter Österreich, wobei die Schüler/innen aus Malta mit 477 Punkten die niedrigste Lesekompetenz unter den hier dargestellten Ländern aufweisen. Mit Ausnahme von Frankreich sind die Effektstärken dieser Länder ebenfalls so hoch ausgeprägt, dass man auch von einer praktischen Bedeutsamkeit der
Dieser Abschnitt gibt einen Überblick über das Abschneiden der österreichischen Schüler/innen bei PIRLS & TIMSS 2011 im europäischen Vergleich. Dabei werden wesentliche Ergebnisse aus dem ersten nationalen Ergebnisbericht (Suchań, Wallner-Paschon, Bergmüller & Schreiner, 2012) zusammenfassend dargestellt und durch österreichspezifische Analysen ergänzt. Zunächst erfolgt eine Darstellung der Mittelwerte und Streuungen in den drei Kompetenzbereichen Lesen, Mathematik und Naturwissenschaft. Neben dem aktuellen Abschneiden der Schüler/innen wird darüber hinaus die Leistungsentwicklung seit dem Jahr 2001 (PIRLS) bzw. seit 1995 (TIMSS) analysiert. Weiters widmet sich dieser Abschnitt einer Charakterisierung der leistungsstarken und -schwachen Schüler/innen nach den Merkmalen Geschlecht, Migrationshintergrund und Bildung der Eltern sowie einer zusammenfassenden Darstellung der Geschlechterdifferenzen in allen Leistungsbereichen. Mit Ausnahme der Trendanalysen beschränken sich die Ländervergleiche in diesem Abschnitt auf die jeweils teilnehmenden EU-Länder1.
1 Es sei an dieser Stelle darauf hingewiesen, dass die europäischen Teilnehmerländer von PIRLS 2011 und jene von TIMSS 2011 nicht völlig ident sind. Die Darstellungen und Analysen von PIRLS beruhen auf 23 teilnehmenden EU-Ländern; jene von TIMSS auf 21. Insgesamt beteiligten sich 20 Mit-gliedsstaaten der EU sowohl an PIRLS als auch an TIMSS.
2 Details zur Berechnung der Effektstärke finden sich im Einführungskapitel.
16 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
Leistungsunterschiede sprechen kann. Sie reichen bei diesen Vergleichen von 0.63 in Malta bis hin zu 0.24 in Spanien.
Die gesamte Balkenlänge in Abbildung 1.1.1 zeigt den Abstand zwischen den Schülerinnen und Schülern mit den höchsten bzw. mit den niedrigsten Leseleistungen – exklu-sive der obersten bzw. der untersten 5 % der Schüler/innen. Zwischen den Leserinnen und Lesern in Österreich mit den höchsten Mittelwerten und jenen mit den geringsten Leis-tungen liegen 209 Punkte: Die erfolgreichsten Kinder (exkl. der besten 5 %) erreichen bis zu 626 Punkte (95. Perzentil); umgekehrt liegen die Werte der leseschwächeren Kinder bei 418 Punkten (5. Perzentil). Im Ländervergleich ist dieser Abstand relativ gering ausgeprägt. Nur in den Niederlan-den und in der Tschechischen Republik (beides Länder mit einem signifikant höheren Mittelwert als in Österreich) sind die Schülerleistungen noch homogener. Die Differenz zwischen dem 5. und dem 95. Perzentil beträgt in diesen Ländern 178 bzw. 205 Punkte. In Finnland liegen so wie in Österreich 209 Punkte zwischen den besten und den schwächsten Schülerinnen und Schülern – allerdings auf einem deutlich höheren Leistungsniveau. Im Vergleich dazu sind Rumänien und Malta nicht nur jene Länder mit den niedrigsten Mittelwerten, hier zeigen sich auch die größten Leistungsstreuungen, die jene von Österreich und Finnland um etwa 100 Punkte übertreffen (298 bzw. 317 Punkte Dif-ferenz zwischen 5. und 95. Perzentil).
Mathematik
In Mathematik beträgt der Mittelwert der 21 beteiligten EU-Länder 519 Punkte. Die höchste Mathematikkompe-tenz unter den in Abbildung 1.1.2 dargestellten Ländern haben die Schüler/innen aus Nordirland. Sie liegen mit ei-nem Mittelwert von 562 Punkten deutlich über dem EU-Schnitt und übertreffen alle anderen EU-Teilnehmerländer signifikant. Der flämischsprachige Teil Belgiens, Finnland sowie England folgen; sie unterscheiden sich im Leistungs-niveau mit Durchschnittswerten von 549, 545 und 542 Punkten kaum voneinander.
Ähnlich wie in Lesen befindet sich Österreich auch hin-sichtlich der Mathematikkompetenz in der unteren Hälfte der 21 teilnehmenden EU-Länder und signifikant unter dem EU-Durchschnittswert. Mit 508 Punkten liegen die heimischen Schüler/innen 54 Punkte hinter den Kindern aus Nordirland – dem bestgereihten EU-Teilnehmerland. In insgesamt 10 EU-Ländern ist die durchschnittliche Mathematikkompetenz deutlich höher als in Österreich. In all diesen Ländern ist die Leistungsdifferenz zu Öster -reich nicht nur statistisch signifikant, sondern auch von praktischer Bedeutung (Effektstärken zwischen 0.72 in Nordirland und 0.27 in Irland). In sechs weiteren Ländern zeigen sich keine signifikanten Leistungsunterschiede zu Österreich (Ungarn, Slowenien, Tschechische Republik, Italien, Slowakische Republik und Schweden). Die Schüler/innen aus Malta, Spanien, Rumänien und Polen schneiden
AU
T
300
400
500
600
700
FIN
**
DN
K*
IRL* N
LD*
CZE
*
SW
E
ITA
DE
U
PR
T
HU
N
SV
K
SV
N LTU
PO
L
FRA
ES
P*
MLT
**
BE
L (fr
)*
Lese
kom
pete
nz
hoch
nied
rig Perzentile (%)Mittelwert
5. 25. 75. 95.
Konfidenzintervall (+/–1.96 SE)
}
GB
R (N
)*
GB
R (E
)*
RO
U*B
GR
Lesekompetenz: Mittelwerte und Streuung (EU-Länder)
sig. besser als AUT sig. schlechter als AUTkein sig. Unterschied zu
AUT
EU-Mittel
Teilnehmerländer absteigend nach dem Mittelwert auf der Lese-Gesamtskala gereiht
* ... Effektstärke > 0.2** ... Effektstärke > 0.5
Abbildung 1.1.1: Lesekompetenz im EU-Vergleich (PIRLS 2011)
Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 17
hingegen signifikant schlechter ab und mit Ausnahme von Malta weisen die Effektstärken (0.40 bis 0.30) auch hier auf praktisch bedeutsame Unterschiede hin. Der Leistungsab-stand zwischen dem erst- und dem letztgereihten EU-Land (Nordirland und Polen) beträgt 81 Punkte.
Bezieht man in diese Analyse neben dem Leistungsniveau auch die Streuung der Schülerwerte innerhalb der Länder mit ein, so fällt auf, dass die Mathematikkompetenzen in Nordirland im europäischen Vergleich zwar sehr hoch aus-geprägt, allerdings auch sehr heterogen sind: Während die Höchstleistungen (exklusive der besten 5 %) bei 693 Punk-ten liegen, erreichen die leistungsschwächsten Kinder (ex-klusive der schwächsten 5 %) 411 Punkte. Ähnlich sieht es in England aus: ein relativ hoher Mittelwert bei einer Bandbreite von 292 Punkten zwischen dem 5. und dem 95. Perzentil. Österreich fällt nicht nur in Lesen, sondern auch in Mathematik mit relativ homogenen Leistungen auf: 204 Punkte liegen zwischen den besten (606 Punkte) und schwächsten Kindern (401 Punkte). Lediglich in den Niederlanden und im flämischsprachigen Teil Belgiens ist diese Differenz geringer (174 bzw. 195 Punkte). Dass die Viertklässler/innen aus Nordirland deutlich besser sind als die österreichischen, lässt sich neben der Mittelwertdifferenz auch daran erkennen, dass das 75. Perzentil für Nordirland (622) höher ist als das 95. für Österreich (606). Das bedeu-tet, dass jener Leistungswert, den in Österreich nur mehr jedes 20. Kind erreicht bzw. überschreitet (ab 606 Punkte aufwärts), in Nordirland von zumindest jedem 4. Kind er-zielt wird.
Naturwissenschaft
Im Kompetenzbereich Naturwissenschaft (s. Abbildung 1.1.3) schneiden – wie bereits in Lesen – die finnischen Schüler/innen (570) deutlich besser als die Kinder aller anderen EU-Teilnehmerländer ab. Sie liegen damit auch über dem Durchschnittswert der 21 beteiligten EU-Länder von 521 Punkten. Unmittelbar hinter Finnland folgt eine Gruppe von zehn Ländern (von der Tschechischen Repub-lik bis einschließlich Italien), deren Mittelwerte alle auf sehr ähnlichem Niveau sind. Zu diesen Ländern zählen auch Österreich (532) und Deutschland (528). Weitere zehn Länder schneiden deutlich schlechter als diese Gruppe ab, wobei wiederum Malta das letztgereihte Land ist (446). Die österreichischen Schüler/innen erreichen im Schnitt um 39 Punkte weniger als die finnischen; dieser Unterschied ist mit einer Effektstärke von 0.56 auch in praktischer Hin-sicht bedeutsam. Anders als in Lesen und Mathematik ist der österreichische Mittelwert in Naturwissenschaft signifi-kant über dem EU-Schnitt.
Die Naturwissenschaftsleistungen der österreichischen Kin-der sind nicht so homogen wie in Mathematik: 231 Punkte liegen zwischen dem 5. und dem 95. Perzentil, wobei die Schwächsten bis zu 408 und die Besten über 640 Punkte erreichen. Vor allem im unteren Leistungsbereich streuen die Werte in Naturwissenschaft stärker als in Mathematik. Deutlich einheitlicher sind die Kompetenzen der Schüler/innen in den Niederlanden (bei gleichem Leistungsniveau wie in Österreich beträgt der Abstand 174 Punkte), im
Mat
hem
atik
kom
pete
nz
hoch
nied
rig
300
400
500
600
700
AU
TFIN
**
DN
K*
IRL*
NLD
**
DE
U*
PR
T*
HU
N
LTU
*
PO
L*
MLT
BE
L (fl
)**
Perzentile (%)Mittelwert
5. 25. 75. 95.
Konfidenzintervall (+/–1.96 SE)
}
GB
R (N
)**
GB
R (E
)*
SV
N
CZE
SW
E
ITA
SV
K
RO
U*
ES
P*
Mathematikkompetenz: Mittelwerte und Streuung (EU-Länder)
sig. besser als AUT sig. schlechter als AUTkein sig. Unterschied zu AUT
EU-Mittel
Teilnehmerländer absteigend nach dem Mittelwert auf der Mathematik-Gesamtskala gereiht
* ... Effektstärke > 0.2** ... Effektstärke > 0.5
Abbildung 1.1.2: Mathematikkompetenz im EU-Vergleich (TIMSS 2011)
18 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
flämischsprachigen Teil Belgiens (189 Punkte; allerdings auf einem signifikant niedrigeren Leistungsniveau als in Österreich) und im führenden Land Finnland (217 Punkte Differenz zwischen 5. und 95. Perzentil).
Erklärung der Leistungsvarianz auf Individual-, Schul- und Klassenebene
Die oben dargestellten Leistungsunterschiede innerhalb der Länder können durch individuelle Voraussetzungen der Schüler/innen, aber auch durch Einflüsse auf Klassen- bzw. Schulebene entstehen. Mithilfe eines Mehrebenenmodells wurde für Österreich der Anteil dieser drei Ebenen (Schüler/ innen, Klasse und Schule) an der gesamten Leistungsvarianz in Lesen, Mathematik und Naturwissenschaft analysiert. Tabelle 1.1.1 zeigt, dass der Großteil der Leistungsvarianz in Lesen (87 %) auf individuelle Merkmale der Kinder zurückzuführen ist. Weitere 5 % lassen sich durch Unterschiede zwischen den Klassen jeweils innerhalb einer Schule und 8 % durch Unter-schiede zwischen den Schulen erklären.
In Mathematik ist der Anteil, der durch individuelle Un-terschiede zwischen den Schülerinnen und Schülern erklärt wird, mit 83 % etwas geringer. Die restliche Varianz ver-teilt sich zu 7 % auf Klassenebene und zu 11 % auf Schul - ebene. Ein ähnliches Bild zeigt sich in Naturwissenschaft.
84 % der Leistungsunterschiede zwischen den Schülerin-nen und Schülern werden durch individuelle Merkmale er-klärt, weitere 6 % kommen durch die Klassenzugehörigkeit hinzu und 10 % durch die Schulzugehörigkeit.
In allen drei Bereichen lässt sich somit der Großteil der Leis-tungsvarianz in Österreich durch individuelle Merkmale der Viertklässler/innen erklären. Der Anteil der Klassen-und Schulebene ist vergleichsweise geringer ausgeprägt. Dies ist allerdings kein österreichspezifisches Ergebnis. In jenen EU-Ländern, in denen eine derartige Analyse der Varianzkomponenten möglich ist (weil zumindest zwei Klassen pro Schule getestet wurden)3, liegt der Anteil auf Individualebene bei einem Großteil dieser Länder ebenfalls bei 80 % bzw. darüber. Im führenden EU-Land Finnland können beispielsweise zwischen 89 % (Naturwissenschaft und Mathematik) bzw. 90 % (Lesen) der Varianz auf indivi-duelle Schülermerkmale zurückgeführt werden.4 Dieser Be-fund, dass der Großteil der Leistungsunterschiede in einem Land durch individuelle Voraussetzungen der Schüler/in-nen erklärt werden kann, deckt sich auch mit einem Be-fund von Marzano (2000; zitiert nach Lipowski, 2006) aus einer Metaanalyse: Diese zeigt, dass 80 % der Unterschiede mit den individuellen Merkmalen der Lernenden erklärt werden können; auf die Klassenzugehörigkeit ent fallen 13 % und auf die Schulzugehörigkeit 7 % der Varianz.
* ... Effektstärke > 0.2** ... Effektstärke > 0.5
Nat
urw
isse
nsch
afts
kom
pete
nz
hoch
nied
rigNaturwissenschaftskompetenz: Mittelwerte und Streuung (EU-Länder)
300
400
500
600
700
AU
T
FIN
**
DN
K
IRL*SW
E
ITA
DE
U
PR
T
HU
N SV
K
SV
N LTU
*
ES
P*
RO
U*
BE
L (fl
)*
GB
R (N
)*
GB
R (E
)
PO
L*
MLT
**
CZE N
LD
EU-Mittel
sig. schlechter als AUTkein sig. Unterschied
zu AUT
Perzentile (%)Mittelwert
5. 25. 75. 95.
Konfidenzintervall (+/–1.96 SE)
}
Teilnehmerländer absteigend nach dem Mittelwert auf der Naturwissenschafts-Gesamtskala gereiht
Abbildung 1.1.3: Naturwissenschaftskompetenz im EU-Vergleich (TIMSS 2011)
3 In Lesen ist dies für 12 der teilnehmenden EU-Länder möglich und in Mathematik und Naturwissenschaft für 10 Länder.4 Ein derartiger Vergleich der Varianzanteile mit Deutschland ist nicht möglich, da in Deutschland pro Schule nur eine Klasse getestet wurde und somit
keine Varianz auf Klassenebene berechnet werden kann.
Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 19
Es gibt unter den EU-Ländern bei PIRLS & TIMSS 2011 allerdings auch welche, in denen der Schüleranteil gerin-ger ausfällt. So weicht beispielsweise Bulgarien in Lesen am stärksten von diesen Zahlen ab: Mit 63 % ist die Varianz-erklärung auf Schülerebene unter den EU-Vergleichsländern am geringsten; 30 % entfallen hingegen auf die Schul-ebene und 7 % auf die Klassenebene. In Mathematik und Naturwissenschaft ist der Anteil auf Schülerebene mit 69 bzw. 67 % in Ungarn vergleichsweise gering (jeweils ein Viertel der Leistungsschwankungen kann in Ungarn auf Schulebene und rund 7 % auf Klassenebene erklärt werden). Ein derartiger Ländervergleich im Hinblick auf die Varianz-komponenten sollte allerdings mit Vorsicht interpretiert werden, da in den Ländern die Einheit Schule bzw. Klasse unterschiedlich definiert wird und somit möglicherweise nicht vergleichbar ist (siehe dazu OECD, 2009, S. 221 f.).
Leistungsvarianz in Österreich (Lesen, Mathematik und Naturwissenschaft)
auf Schüler-, Klassen- und Schulebene
Kompetenzbereich
Ebene LesenMathe-matik
Natur-wissenschaft
Schüler 87,0 % 82,5 % 84,2 %
Klasse 5,2 % 6,8 % 5,9 %
Schule 7,8 % 10,7 % 9,9 %
Tabelle 1.1.1: Verteilung der Leistungsvarianz auf Individual-, Klassen- und Schulebene in Österreich
(PIRLS und TIMSS 2011)
Leistungstrend in den drei Kompetenzbereichen
Nachdem 2011 PIRLS bereits zum dritten Mal stattgefun-den hat und TIMSS zum fünften Mal, ist es möglich, die Veränderung der Schülerleistungen über die Jahre hinweg zu analysieren. Abbildung 1.1.4 zeigt für Österreich und drei weitere Länder die Kompetenzen der Viertklässler/ innen im Zeitverlauf – sowohl für alle Kinder gemeinsam (graue Linie) als auch getrennt nach Geschlecht (rote Linie für Mädchen, blaue Linie für Buben). Neben Deutschland als gleichsprachigem Nachbarland Österreichs wurden auch Slowenien und Singapur für diese Darstellung ausgewählt: In Slowenien haben sich unter den EU-Ländern die Leis-tungen der Schüler/innen in allen drei Kompetenzbereichen deutlich verbessert. Singapur wurde gewählt, um zu zeigen, wie sich die Leistungen in einem Land entwickeln, das in allen drei Bereichen zu den führenden Nationen zählt. Für PIRLS umfasst die Abbildung alle drei Erhebungsjahre seit
Beginn der Studie (da sich mit Ausnahme von Österreich die dargestellten Länder seit 2001 an PIRLS beteiligen); für TIMSS sind nur die Zeitpunkte mit österreichischer Beteiligung eingetragen. Signifikante Leistungsänderungen im Vergleich zur jeweils vorangegangenen Erhebung sind sowohl für den Ländermittelwert (in Schwarz) sowie für Mädchen (in Rot) und Buben (in Blau) mit einem Stern-symbol gekennzeichnet.5 Die exakten Werte zu Abbildung 1.1.4 befinden sich in Anhangstabelle A.4.
Lesen
In Österreich ist die Lesekompetenz von 2006 (538 Punkte) auf 2011 (529 Punkte) um neun Punkte zurückgegangen. Dieser Unterschied ist zwar gering, aber dennoch statistisch signifikant. Getrennt nach den Geschlechtern zeigt sich so-wohl für die Mädchen als auch für die Buben eine geringe, aber signifikante Abnahme von 10 bzw. 8 Punkten.
In Deutschland hat sich die Leistung von 2001 auf 2006 zunächst von 539 auf 548 Punkte verbessert (p < .05). Von 2006 auf 2011 ist sie allerdings wie in Österreich gering, aber dennoch signifikant zurückgegangen (–7 Punkte). Für die Geschlechter zeigt sich nur eine statistisch bedeutsame Verbesserung der Buben von 2001 auf 2006 (11 Punkte).
Das Leistungsniveau in Slowenien war zu Beginn von PIRLS mit 502 Punkten vergleichsweise gering. Bis zum Jahr 2006 hat sich der Mittelwert der Kinder allerdings um 20 Punkte gesteigert (p < .01) und bei der aktuellen Erhebung erfolgte nochmals eine kleine, aber statistisch bedeutsame Verbes-serung von neun Punkten. Dieser Leistungstrend lässt sich auch getrennt für beide Geschlechter feststellen: Die Buben haben sich um 22 bzw. 11 Punkte signifikant verbessert und die Mädchen um 19 bzw. 7 Punkte.
In Singapur hat sich die Lesekompetenz der Schüler/innen besonders stark von 2001 auf 2006 verbessert – der Leis-tungszuwachs beträgt 30 Punkte (p < .01). Von 2006 auf 2011 gab es nochmals eine kleine, aber statistisch bedeut-same Verbesserung von 9 Punkten. Mit diesem stetigen Kompetenzzuwachs ist das Leistungsniveau in der aktuellen Erhebung deutlich höher als in Österreich, Deutschland und Slowenien. Betrachtet man die Leistungsverände-rung getrennt nach Geschlecht, zeigt sich sowohl bei den Mädchen als auch bei den Buben von 2001 auf 2006 eine deutliche Verbesserung von 27 bzw. 34 Punkten (p < .01). Der Leistungszuwachs in den letzten 5 Jahren um jeweils 9 Punkte ist allerdings statistisch nicht signifikant.
Mathematik
Hinsichtlich der Mathematikkompetenz fällt das außer-ordentlich hohe Leistungsniveau der Kinder aus Singapur
5 Die Berechnungen der Leistungsveränderungen von einem Erhebungsjahr zum nächsten wurden in Anlehnung an die Vorgehensweise im internationalen Bericht nicht bonferronikorrigiert.
20 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
seit Beginn von TIMSS im Jahr 1995 auf. Sie erreichten damals im Schnitt 590 Punkte; das Österreich-Mittel lag 60 Punkte darunter. Während in Singapur die Mathema-tikkompetenz bis 2011 auf hohem Leistungsniveau kons-tant blieb, hat sich die Leistung der österreichischen Kinder
von 1995 auf 2007 um 25 Punkte verringert (p < .01). Die Veränderung von 2007 auf 2011 ist – wie in Deutschland und Singapur – nicht signifikant. Somit trennen die Kinder aus Österreich und Singapur aktuell 97 Leistungspunkte. Analysiert man die Kompetenzentwicklung der Mädchen
Abbildung 1.1.4: Leistungstrend in Lesen, Mathematik und Naturwissenschaft (PIRLS 2001, 2006 und 2011; TIMSS 1995, 2007 und 2011)
Leistungstrend in LesenAUT DEU SVN SGP
Leistungstrend in MathematikAUT DEU SVN SGP
Leistungstrend in NaturwissenschaftAUT DEU SVN SGP
Lese
kom
pete
nz
hoch
niedrig
Mat
hem
atik
kom
pete
nz
hoch
niedrig
Nat
urw
isse
nsch
afts
kom
pete
nz
hoch
niedrig
2001 2006* 2011*2001 2006* 2011*
1995 2007* 2011 1995 2007 2011
625
600
575
550
525
500
475
450
625
600
575
550
525
500
475
4501995 2007 20111995 2007* 2011*
600
575
550
525
500
475
4501995 2007 2011
600
550
525
500
475
450
600
575
550
525
500
475
450
600
550
525
500
475
4501995 2007 20111995 2007* 2011 1995 2007* 2011
600
575
550
525
500
475
625
600
575
550
525
500
475
450
600
550
525
500
475
450
600
575
550
525
500
475
45019951995 2007* 2011
600
575
550
525
500
475
625
600
575
550
525
500
475
450
600
575
550
525
500
475
450
600
550
525
500
475
4501995
LandesmittelwertMittelwert MädchenMittelwert Buben
... Landesmittelwert hat sich im Vergleich zur letzen Erhebung signifikant verbessert/verschlechtert
... Mittelwert Mädchen hat sich im Vergleich zur letzten Erhebung signifikant verbessert/verschlechtert
... Mittelwert Buben hat sich im Vergleich zur letzten Erhebung signfikant verbessert/verschlechtert
575
600
550
525
500
4752001 2006 2011*
**
*
***
**
575
600
550
525
500
4752001 2006* 2011*
*
**
* * *
*
*
***
**
**
*
Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 21
und Buben getrennt voneinander, so zeigt sich lediglich in Österreich von 1995 auf 2007 für beide Geschlechter ein deut - licher Leistungsrückgang von 27 bzw. 24 Punkten (p < .01).
Die mathematischen Fähigkeiten der slowenischen Schüler/ innen waren bei TIMSS 1995 vergleichsweise gering (462) und haben sich bis 2007 um 40 Punkte deutlich verbessert (p < .01). Bis 2011 sind ihre Leistungen nochmals um 11 Punkte (p < .01) gestiegen. Dieser Aufwärtstrend über alle Erhebungszeitpunkte hinweg lässt sich auch getrennt für Mädchen und Buben feststellen.
Naturwissenschaft
In Naturwissenschaft zeigt sich für alle Länder ein ähn-licher Leistungstrend wie in Mathematik. In Österreich ist die Naturwissenschaftskompetenz der Schüler/innen von 1995 auf 2007 zurückgegangen (–13 Punkte; p < .01). Der Mittelwert der Buben ist von 545 auf 532 Punkte gesunken (p < .05) und jener der Mädchen um 11 Punkte (p < .05). Von 2007 bis 2011 gab es, wie auch in Deutschland, Singa-pur und Slowenien, keine bedeutsame Veränderung (auch bei den Geschlechtern nicht). Die Viertklässler/innen in Slowenien konnten ihre naturwissenschaftlichen Fähigkeiten von 1995 auf 2007 deutlich verbessern (+54 Punkte; p < .01); von 2007 auf 2011 blieb das Niveau an nähernd gleich (dieses Bild spiegelt sich ebenfalls für die beiden Ge-schlechter getrennt betrachtet wider). Auch in Singapur gab es von 1995 auf 2007 einen deutlichen Leistungssprung. Der Durchschnittswert in Naturwissenschaft hat sich um 63 Punkte verbessert (p < .01); keine bedeutsame Verän-derung gab es hingegen von 2007 auf 2011. Das gleiche Muster zeigt sich ebenfalls, wenn man die Mittelwerte der Mädchen getrennt von jenen der Buben analysiert: Sowohl die Buben als auch die Mädchen haben sich von 1995 auf 2007 signifikant um 61 bzw. 66 Punkte verbessert; von 2007 auf 2011 blieben die Leistungen annähernd gleich.
Leistungsstarke und leistungsschwache Schüler/innen
Auch wenn bei den Ergebnisdarstellungen von internati-onalen Studien stets mit einem Vergleich der Mittelwerte begonnen wird, sollte nicht außer Acht gelassen werden, dass die Mittelwerte in erster Linie dazu geeignet sind, einen ersten Überblick über das Leistungsniveau der Länder zu geben. Ein und derselbe Leistungswert kann dabei allerdings durch völlig unterschiedliche Konstellationen entstehen: Ein bestimmter Mittelwert kann beispielsweise dadurch zustande kommen, dass es in einem Land viele Schüler/in-nen auf einem mittleren Leistungsniveau gibt, gleichzeitig jedoch wenige gute und wenige schwache Schüler/innen. Umgekehrt kann in einem anderen Land derselbe Mittel-
wert dadurch entstehen, dass es viele schwache und gleich-zeitig viele leistungsstarke Kinder gibt. Aus dem Mittelwert können also weder Aussagen über die Verteilung der Leis-tungen gemacht werden noch ist es möglich, die erbrachten Leistungen inhaltlich zu charakterisieren. Dazu gibt es bei PIRLS & TIMSS die sogenannten Kompetenzstufen. Diese bilden einen wesentlichen und pädagogisch wichtigen Teil bei den Ergebnisanalysen. In jedem Testbereich (Lesen, Mathematik und Naturwissenschaft) wurde die Leistungs-skala an bestimmten Punkten unterteilt, um dadurch fünf Stufen zu bilden (für eine Beschreibung dieser Methode und eine inhaltliche Beschreibung der Kompetenzstufen siehe Suchań & Wallner-Paschon, 2012, S. 69 ff.). Schüler/innen auf Stufe 1 (400–474 Punkte) bzw. unter Stufe 1 (< 400 Punkte) können aufgrund ihrer geringen Kompetenzen als leistungsschwache Schüler/innen bezeichnet werden. Sie besitzen maximal Basiskompetenzen und können nur die einfachsten Aufgaben von PIRLS bzw. TIMSS lösen – wie beispielsweise in Mathematik das Addieren von zwei ganzen Zahlen oder in Lesen das Heraussuchen von leicht auffindbaren Informationen in einem Text. Stufe 2 ver-langt von den Schülerinnen und Schülern, ihr Basiswissen in ein fachen Situationen anzuwenden; auf Stufe 3 müssen sie ihre erworbenen Fähigkeiten in mehreren unterschied-lichen Kontexten einsetzen. Kinder auf der höchsten Kom-petenzstufe 4 (≥ 625 Punkte) können hingegen komplexe Auf gaben (mit mehreren Zwischenschritten) in einer Reihe von unterschiedlichen Situationen erfolgreich bearbeiten; sie werden als leistungsstark bezeichnet.
Überschneidungen zwischen den Kompetenzbereichen hinsichtlich leistungsstarker und leistungsschwacher Schüler/innen
Im Erstbericht zu PIRLS und TIMSS 2011 (Suchań, Wall-ner-Paschon, Bergmüller & Schreiner, 2012) findet sich für jeden Kompetenzbereich getrennt eine Darstellung, wie sich die Schüler/innen der Teilnehmerländer auf die Kompetenzstufen verteilen. Abbildung 1.1.5 zeigt er-gänzend dazu, wie viele Schüler/innen in allen drei Leistungsbereichen, in zwei der drei Leistungsbereiche bzw. in einem Bereich zur leistungsstarken/leistungsschwachen Gruppe zählen. Dargestellt sind jene EU-Länder, die sich sowohl bei PIRLS als auch bei TIMSS mit der 4. Schulstufe beteiligt haben; insgesamt trifft dies auf 17 Länder zu.6 Auf der linken Seite der Abbildung finden sich die Überschnei-dungen der leistungsschwachen Schüler/innen; rechts jene der leistungsstarken. Die Teilnehmerländer sind dabei ab-steigend nach dem Anteil jener Kinder sortiert, die sowohl in Lesen als auch in Mathematik und Naturwissenschaft maximal Basiskompetenzen besitzen (Kompetenzstufe 1 bzw. unter 1). Diese Schüler/innen sollten besonders geför-dert werden; sie weisen bereits in der Volksschule in jenen Bereichen Defizite auf, die eine wesentliche Grundlage für die Entwicklung einer fundierten Allgemeinbildung sind.
6 Von den 20 EU-Ländern, die sich sowohl an PIRLS als auch an TIMSS 2011 beteiligt haben, haben 17 für beide Studien dieselben Schüler/innen getestet.
22 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
Der Anteil jener Viertklässler/innen, die besonderen För-derbedarf haben, da sie in allen drei Bereichen zu den Leistungsschwachen zählen, schwankt zwischen 3 % in Finnland und 27 % in Malta. In Österreich betrifft dies jedes 10. Kind; weitere 12 % erreichen in zwei von drei Bereichen maximal Kompetenzstufe 1 und 16 % zählen entweder in Lesen oder in Mathematik oder in Naturwis-senschaft zur leistungsschwachen Gruppe. Insgesamt hat somit etwa jedes 3. Kind in Österreich (38 %) in zumin-dest einer von drei grundlegenden Kompetenzen in der 4. Schulstufe Mängel. In Polen, Spanien, Rumänien und Malta trifft dies auf jeweils (knapp) über die Hälfte der Schüler/innen zu.
Den höchsten Anteil an Kindern, die in Lesen, Mathema-tik und Naturwissenschaft zu den Leistungsstarken zählen, gibt es erwartungsgemäß in Finnland: 5 % schaffen es hier in allen drei Domänen in die höchste Stufe. Mit weiteren 9 % in zwei Domänen und 18 % in einer erzielt insge-samt knapp ein Drittel der finnischen Viertklässler/innen in zumindest einem Bereich herausragende Leistungen. In Österreich ist dieser Anteil mit 12 % nicht einmal halb so groß; wobei nur 1 % sowohl in Lesen als auch in Mathe-matik und Naturwissenschaft leistungsstark ist, 3 % in zwei dieser Kompetenzen und 9 % in einem Kompetenzbereich.
Charakteristika leistungsstarker und leistungs-schwacher Schüler/innen in Österreich
Analysiert man die Leistungsstarken und -schwachen in Lesen, Mathematik und Naturwissenschaft getrennt von-einander, so zählen in Österreich 20 % der bei PIRLS ge- testeten Kinder (in Lesen) zur leistungsschwachen Gruppe; bei TIMSS-Mathematik sind es 30 % und in Naturwis-senschaft 21 %. Dem stehen 5 % leistungsstarke Schüler/innen in Lesen, 2 % in Mathematik und 8 % in Naturwis-senschaft gegenüber. In weiterer Folge werden diese Grup-pen nun für Österreich nach den Merkmalen Geschlecht, Migrationshintergrund und Schulbildung der Eltern ge-nauer charakterisiert. Abbildung 1.1.6 zeigt, getrennt für Lesen, Mathematik und Naturwissenschaft, zu welchen An-teilen die leistungsstarke bzw. -schwache Gruppe aus Mäd-chen und Buben, aus Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund besteht und welche Bildungs-abschlüsse ihre Eltern besitzen. Zum Vergleich ist für jedes Merkmal auch die Verteilung in der gesamten Population dargestellt.
In Lesen sind entsprechend dem Leistungsunterschied beim Mittelwert (s. Abbildung 1.1.4) die Mädchen in der leistungsstarken und die Buben in der leistungsschwachen Gruppe – im Vergleich zur Population – tendenziell über-
Abbildung 1.1.5: Überschneidungen zwischen leistungsstarken und leistungsschwachen Schülerinnen und Schülern in Lesen, Mathematik und Naturwissenschaft (PIRLS & TIMSS 2011)
1020 0 2010leistungsschwach leistungsstark
Überschneidungen zwischen leistungsschwachen und -starken Schülerinnen und Schülern
3030405060 0% %
MLT
ROU
ESP
POL
SVN
HUN
SKV
LTU
AUT
IRL
ITA
SWE
PRT
DEU
CZE
GBR (N)
FIN
20
16
20
18
13
13
15
13
16
13
17
17
14
13
14
12
20
14
16
16
12
10
11
10
12
12
13
12
11
10
11
9
5
27
23
17
17
13
12
11
11
10
9
9
9
8
8
8
7
3
6
10
6
8
8
12
10
9
9
14
11
12
11
10
11
20
18
6
3
5
4
4
3
5
4
4
5
3
4
9
9
15
5
3
3
4
Spitze in 3 Bereichen
Spitze in 2 Bereichen
Spitze in 1 Bereich
Leistungsschwach in 3 Bereichen
Leistungsschwach in 2 Bereichen
Leistungsschwach in 1 Bereich
Teilnehmerländer absteigend nach dem Anteil der leistungsschwachen Schüler/innen in allen drei Bereichen (Lesen, Mathematik und Naturwissenschaft) sortiert
Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 23
repräsentiert. In Mathematik und Naturwissenschaft ist die-ses Bild umgekehrt: Mit einem Verhältnis von etwa 2/3 zu 1/3 gibt es bei den Leistungsstarken deutlich mehr Buben als Mädchen. Unter den leistungsschwachen Schülerinnen und Schülern ist der Unterschied (mehr Mädchen als Bu-ben) nicht so deutlich ausgeprägt.
Hinsichtlich des Merkmals Migrationshintergrund zeigt sich, dass leistungsschwache Schüler/innen im Vergleich zu allen getesteten Kindern wesentlich häufiger aus Fami-lien mit Migrationshintergrund stammen. Dies gilt sowohl für Lesen als auch für Mathematik und Naturwissenschaft. Während in der Population 19 % der Kinder Migrations-hintergrund haben (Migrantinnen und Migranten der ers-ten bzw. zweiten Generation), sind es bei den Leistungs-schwachen je nach Domäne zwischen 31 % (Mathematik) und 43 % (Naturwissenschaft). Dennoch darf die Tatsache nicht unerwähnt bleiben, dass jeweils mehr als die Hälfte der Kinder in der leistungsschwachen Gruppe keinen Migrationshintergrund hat. Die leistungsstarken Gruppen
bestehen hingegen zu über 90 % aus einheimischen Kin-dern; das heißt, dass die Migrantinnen und Migranten in der höchsten Kompetenzstufe unterrepräsentiert sind.
Darüber hinaus lassen sich leistungsschwache Kinder da-durch charakterisieren, dass ihre Eltern häufiger geringere Bildungsabschlüsse aufweisen. In der Population hat etwa 1/4 der Kinder zumindest einen Elternteil mit einem Uni-versitätsabschluss oder einem Abschluss an einer Fachhoch-schule bzw. Pädagogischen Akademie/Sozialakademie. Sieht man sich die Verteilung der Abschlüsse bei jenen Kindern auf Kompetenzstufe 1 und darunter an, so haben nur 10–12 % von ihnen zumindest einen Elternteil mit Universitäts- oder Fachhochschulabschluss. Weitere 12–15 % stammen aus Familien, in denen die höchste absolvierte Ausbildung einem Pflichtschulabschluss entspricht. Die Mehrheit der leistungsschwachen Schüler/innen (etwa 60 %) hat Eltern mit einem Abschluss an einer berufs bildenden mittle-ren Schule oder mit einem Lehrabschluss. Ein anderes Bild zeigt sich in allen drei Kompetenzbereichen bei den
Anteile leistungsstarker und leistungsschwacher Schüler/innen in Österreich in Lesen nach ...
Anteile leistungsstarker und leistungsschwacher Schüler/innen in Österreich in Mathematik (M) und Naturwissenschaft (N) nach ...
Population
leistungsstark
leistungsschwach
Population
leistungsstark
leistungsschwach
Population
leistungsstark M
leistungsschwachM
NW
NW
Population
leistungsstark M
leistungsschwachM
NW
NW
... Geschlecht ... Migrationshintergrund ... Bildung der Eltern
... Geschlecht ... Migrationshintergrund ... Bildung der Eltern
Mädchen
Buben
max. Pflichtschule
BMS/Lehre
MaturaUni/PädAkPH/Soz/AK/FH
ohne Migrationshintergrund
Migrationshintergrund 2. Generation: Schüler/in in Österreich, beide Eltern im Ausland geborenMigrationshintergrund 1. Generation: Schüler/in und beide Eltern im Ausland geboren
100806040200 % % %100806040200 % 100806040200
100806040200 % % %100806040200 % 100806040200
Angaben in Prozent; Werte unter 4 % sind nicht eingetragen
5149
4753
5743
580 14
94
1064 26
580 14
94
96
869 23
1157 32
26225 47
512623
101414 61
26215 47
572220
4630 24
121712 60
101615 59
5149
6931
6535
4852
4753
Abbildung 1.1.6: Charakteristika der leistungsstarken und leistungsschwachen Schüler/innen (PIRLS & TIMSS 2011)
24 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
Viertkläss lerinnen und Viertklässlern auf der höchsten Leistungsstufe 4: etwa 50 % der Kinder (doppelt so viele wie in der Population) haben zumindest einen Elternteil mit Universitätsabschluss (oder mit einem vergleichbaren Abschluss). Die Anteile in der Kategorie Matura unterschei-den sich nur gering von jenen in der Population und jene mit einem Lehrabschluss bzw. einer berufsbildenden mittle-re Schule sind mit 20–30 % geringer als in der Population (47 %).
Geschlechterdifferenzen bei den Leistungs-skalen von PIRLS & TIMSS 2011
In Ergänzung zum Erstbericht folgt zum Abschluss die-ses Beitrags eine zusammenfassende Darstellung der Ge-schlechterdifferenzen sowohl im Hinblick auf die Gesamt- als auch auf die Subskalen von PIRLS & TIMSS 2011 (eine detaillierte Beschreibung der Subskalen findet sich in Grafendorfer, Wallner-Paschon, Suchań & Widauer, 2012). Im Erstbericht wurden lediglich die Mittelwerte aller Teil-nehmerländer bei den Subskalen berichtet – die Geschlech-terdifferenzen wurden in diesem Zusammenhang bislang nicht berücksichtigt. Weiterführende Analysen zu den an-deren beiden Faktoren, die im Hinblick auf die Chancen-gerechtigkeit von Bedeutung sind (Migrationshintergrund und Bildung der Eltern), finden sich in eigenen Beiträgen dieser Publikation (siehe Kapitel 2.1 sowie 2.2), weshalb dieser Beitrag – im Gegensatz zu den Geschlechterdifferen-zen – nicht gesondert darauf eingeht.
Abbildung 1.1.7 zeigt die Unterschiede zwischen Mädchen und Buben für alle Lesebereiche sowohl für Österreich als auch im Schnitt für die teilnehmenden EU-Länder. Neben der Punktdifferenz und der Signifikanz (Sternsymbol neben dem entsprechenden Balken) ist rechts daneben auch die Effektstärke eingetragen.
In Lesen übertreffen die österreichischen Mädchen die Buben um 8 Punkte; im EU-Schnitt sind es 12 Punkte (siehe Abbildung 1.1.7). In beiden Fällen ist die Differenz statistisch signifikant, aber inhaltlich kaum von Bedeutung (Effektstärke < 0.2). In den EU-Ländern gibt es – durch-schnittlich betrachtet – bei allen vier Lese-Subskalen signi-fikante Geschlechterdifferenzen. Allerdings zeigen sich nur beim Interpretieren, Verknüpfen und Bewerten von Inhalten bedeutende Effektstärken über 0.2 (in der Abbildung nur als Interpretieren bezeichnet). Es handelt sich dabei um den komplexeren der beiden Verstehensprozesse, die zur Lösung der Aufgaben von den Schülerinnen und Schülern verlangt werden. Im EU-Schnitt übertreffen die Mädchen die Buben dabei um 13 Punkte. In Österreich erbringen die Mädchen und Buben beim Lesen von Informationstexten und bei der kognitiven Skala Wiedergeben und einfaches Schluss folgern (in der Abbildung nur als Wiedergeben bezeichnet) ver-gleichbare Leistungen. Beim Lesen von literarischen Texten sowie beim komplexeren Verstehensprozess Interpretieren, Verknüpfen und Bewerten übertreffen die Mädchen die Buben um 13 bzw. 10 Punkte. Beide Unterschiede sind zwar signifikant, die Effektstärke liegt allerdings nur beim Interpretieren über 0.2.
In Mathematik (s. Abbildung 1.1.8) schwanken die Ge-schlechterdifferenzen in Österreich zwischen 5 und 16 Punkten zugunsten der Buben. Inhaltlich von Bedeutung ist allerdings nur die Differenz beim anspruchsvollsten der drei kognitiven Bereiche – beim Begründen. Wenn es also darum geht, in Mathematik Fragestellungen zu lösen, die sich auf unbekannte Situationen sowie komplexe Kontexte und Probleme beziehen, übertreffen die Buben der 4. Klasse ihre Alterskolleginnen um 16 Punkte. Im EU-Schnitt sind die Unterschiede zwischen Mädchen und Buben auf den meisten Skalen etwas geringer als in Österreich; sie sind zwar statistisch signifikant, inhaltlich allerdings kaum von Bedeutung (Effektstärke < 0.2).
Im Kompetenzbereich Naturwissenschaft (s. Abbildung 1.1.8) sind die Geschlechterdifferenzen in Österreich auf
Leseintentionen
GesamtskalaLesen
Information
Literarisch
Wiedergeben
InterpretierenVerstehensprozesse
–10–20 0 2010Mädchen besser Buben besser
Effektstärke
–0.12–0.17
Geschlechterdifferenzen in Lesen
812
–0.19–0.23
1013
–0.02–0.11
512
–0.07–0.16–0.16–0.18
18
1317
EU-Schnitt
AUT
Differenz ist signifikant (p < .05)
Abbildung 1.1.7: Geschlechterdifferenzen in Lesen (PIRLS 2011)
Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft 25
einigen Skalen deutlich höher als in Mathematik und Lesen. Bei den Aufgaben zu den Themen Physik und Erdkunde liegen die Buben im Schnitt um 18 bzw. 24 Punkte vor den Mädchen. Beide Unterschiede sind sowohl statistisch als auch praktisch bedeutsam. Aufgaben aus dem Inhalts-bereich Biologie werden in Österreich und im EU-Schnitt von beiden Geschlechtern jeweils gleich gut gelöst. Die Differenzen der kognitiven Subskalen schwanken in Öster-reich zwischen 12 und 15 Punkten (im EU-Schnitt sind sie mit 1–7 Punkten geringer); von inhaltlicher Relevanz sind diese allerdings wie in Mathematik nur beim komplexesten Bereich Begründen, bei dem die Schüler/innen beispiels-weise Ergebnisse aus Experimenten mit naturwissenschaft-lichen Konzepten in Verbindung bringen müssen.
Zusammenfassung
Die Lese- und Mathematikkompetenzen der österreichi-schen Schüler/innen liegen unter dem Durchschnittswert der jeweils teilnehmenden EU-Länder. In Naturwissen-schaft schneiden sie besser ab; das Österreich-Mittel liegt deutlich über dem EU-Schnitt und nur die finnischen Kinder erreichen einen signifikant höheren Mittelwert. Vor allem in Lesen und in Mathematik fällt Österreich durch eine vergleichsweise geringe Streuung der Leistung auf. Diese lässt sich hauptsächlich auf individuelle Schülermerk-male zurückführen und ist nur zu einem geringen Anteil durch die Zugehörigkeit zu einer bestimmten Klasse oder Schule erklärbar.
Inhaltsbereiche
GesamtskalaNaturwissenschaft
Biologie
Physik
Erdkunde
Wissen
AnwendenKognitive Bereiche
–10–20 0 2010Mädchen besser Buben besser
Effektstärke
Begründen
0.180.08
0.04–0.020.260.150.270.13
0.17
0.02
0.080.21
0.090.17
Inhaltsbereiche
GesamtskalaMathematik
Zahlen
Geom. Formen
Darstellen
Wissen
AnwendenKognitive Bereiche
–10–20 0 2010Mädchen besser Buben besser
Effektstärke
Begründen
0.150.09
0.150.110.130.050.130.03
0.18
0.08
0.090.23
0.090.09
Geschlechterdifferenzen in Mathematik
Geschlechterdifferenzen in Naturwissenschaft
96
94
103
167
127
56
98
126
1811
2411
151
126
127
31
EU-Schnitt
AUT
Differenz ist signifikant (p < .05)
EU-Schnitt
AUT
Differenz ist signifikant (p < .05)
Abbildung 1.1.8: Geschlechterdifferenzen in Mathematik & Naturwissenschaft (TIMSS 2011)
26 Die Leistungen der Schüler/innen in Lesen, Mathematik & Naturwissenschaft
Ein Vergleich der Leistung über die Zeit hinweg zeigt für Lesen einen geringen, aber dennoch statistisch signifikan-ten Leistungsrückgang von 9 Punkten. In Mathematik und Naturwissenschaft ist die Leistung nach einer deutlichen Abnahme von 1995 auf 2007 annähernd gleich geblieben.
Insgesamt 38 % der Viertklässler/innen in Österreich zäh - len in zumindest einem Kompetenzbereich zu den Leis-tungsschwachen; in Finnland sind es mit 17 % etwa halb so viele. Jedes 10. Kind in Österreich hat hingegen sowohl in Lesen als auch in Mathematik und Naturwissenschaft bereits am Ende der Volksschule Defizite. Diese leistungs-schwachen Schüler/innen stammen häufiger aus Familien mit Migrationshintergrund und ihre Eltern haben zum Großteil maximal eine berufsbildende mittlere Schule oder eine Lehre absolviert. Im Vergleich dazu sind über 90 %
der leistungsstarken Kinder Einheimische und etwa 50 % haben Eltern mit einem Universitätsabschluss bzw. einem Abschluss an einer Fachhochschule oder an einer Pädagogi-schen Akademie/Sozialakademie.
Die Leistungsunterschiede zwischen Mädchen und Buben in Österreich sind insgesamt gering. In Lesen liegen sie bei allen Subskalen jeweils etwas unter dem EU-Durchschnitt; in Mathematik und Naturwissenschaft zeigen sich hinge-gen für Österreich größere Differenzen im Vergleich zum Mittelwert aller teilnehmenden EU-Länder. Inhaltlich bedeutsam sind die Differenzen bei der anspruchsvollen Lesesubskala Interpretieren zugunsten der Mädchen; beim kognitiven Bereich Begründen in Mathematik und Natur-wissenschaft sowie bei Aufgaben aus den Bereichen Physik und Erdkunde zugunsten der Buben.
Literatur
Grafendorfer, A., Wallner-Paschon, C., Suchań, B. & Widauer, K. (2012). Was messen PIRLS & TIMSS? In: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S. 12–48). Graz: Leykam.
Lipowsky, F. (2006). Auf den Lehrer kommt es an. Zeitschrift für Pädagogik, 51, 47–70.
OECD (2009). PISA Data Analyses Manual. SPSS, Second Edition. Paris: OECD.
Suchań, B. & Wallner-Paschon, C. (2012). Datenaufbereitung für die Ergebnisanalysen. In: B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S. 68–79). Graz: Leykam.
Suchań, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.
Analysen auf Itemebene in Lesen 27
1.2 Analysen auf Itemebene in Lesen Karl Blüml & Sandra Filzmoser
Fragestellung
Lesekompetenz ist ein elementarer Bestandteil unserer Kultur. Sie bildet nicht nur das Fundament für das Lernen in allen Schulfächern, sondern ist auch für das Leben außerhalb der Schule unverzichtbar. Bei PIRLS wird Lesekompetenz definiert als „die Fähigkeit, jene geschriebenen Sprach-formen zu verstehen und zu nutzen, die von der Gesellschaft verlangt werden und/oder für die jeweilige Person nützlich und wertvoll sind. Junge Leser/innen können die Bedeutung von verschiedensten Texten erfassen. Sie lesen, um zu lernen, um an der Gemeinschaft der Lesenden in der Schule sowie im täglichen Leben teilzunehmen und zum Vergnügen“ (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009, S. 11; deutsche Übersetzung v. BIFIE). Lesen ist damit die Fähigkeit, Texte in allen Medien dekodieren, verstehen, verarbeiten und zum Lernen nutzen zu können (Renner, 2013, S. 5).
Man kann das Verstehen von Texten anhand einiger Verstehensprozesse überprüfen, die in ihrer Gesamtheit den kompetenten Umgang mit Texten beschreiben sollen. PIRLS überprüft die folgenden vier Verstehensprozesse anhand entsprechender Aufgabenstellungen (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009, S. 13 f.):
�� Erkennen und Wiedergeben explizit angegebener Informationen;�� Ziehen einfacher Schlussfolgerungen;�� Interpretieren sowie Verknüpfen von Gedanken und
Informationen;�� Untersuchen und Bewerten von Inhalt, Sprache und
einzelnen Textelementen.
Neben diesen vier Verstehensprozessen werden bei PIRLS zwei Leseabsichten untersucht: das „Lesen, um literarische Erfahrungen zu machen“ und das „Lesen, um Informationen zu gewinnen“ (Mullis, Martin, Kennedy, Trong & Sainsbury, 2009). Erstere wird anhand von literarischen Texten erhoben, zweitere anhand von Sachtexten. Die literarischen Texte sind durchwegs narrativer Art (keine Lyrik, kein dramatischer Text), die Informationstexte sind eben
falls zum überwiegenden Teil stark narrativer Art. Von den zehn eingesetzten Texten sind fünf literarische Texte und fünf Sachtexte. Jede der Leseaufgaben kann somit einem Verstehensprozess und einer Textart (und in diesem Verständnis einer angenommenen Leseabsicht) zugeordnet werden.
Um festzustellen, wie gut es den österreichischen Schülerinnen und Schülern gelingt, diese unterschiedlichen Verstehensprozesse und Textarten zu meistern, werden im Folgenden einzelne Testaufgaben analysiert. Dabei handelt es sich im Allgemeinen um veröffentlichte1, in Ausnahmefällen auch unveröffentlichte Aufgaben. Die unveröffentlichten Aufgaben müssen unter Verschluss gehalten werden, da sie in zukünftigen Erhebungen von PIRLS wieder eingesetzt werden. Diese können daher hier nur in sehr allgemeiner und verschlüsselter Form beschrieben werden, sodass kein Rückschluss auf die konkrete Aufgabe möglich ist. Um dennoch die Textart (Leseabsicht) herauslesen zu können, werden die Texte „INFO“ und „LIT“ inklusive einer durchlaufenden Ziffer genannt.
Neben einer Zuordnung der Aufgaben zu den Verstehensprozessen und Leseabsichten (Textarten) können diese auch nach ihrem Aufgabenformat eingeteilt werden. Bei Auf gaben mit geschlossenem Antwortformat müssen die Kinder das jeweils richtige Kästchen ankreuzen (Multiple Choice). Bei Fragen mit offenem Antwortformat müssen sie selbstständig Antworten formulieren.
In diesem Beitrag wird untersucht, welche Merkmale Aufgaben aufweisen, die den österreichischen Kindern auffällig leicht bzw. schwer fallen. Die Lösungshäufigkeiten der österreichischen Schüler/innen werden dabei mit jenen alle r PIRLSLänder im Durchschnitt sowie mit den Werten der Schüler/innen Deutschlands und Englands verglichen. Deutschland wurde wegen des ähnlichen Schulsystems und der gleichen Sprache als Vergleichsland gewählt. England wurde gewählt, weil es immer wiederkehrende Vermutungen gibt, dass die Schüler/innen in angelsächsischen Ländern vertrauter mit dem MultipleChoiceAufgabenformat sind und deshalb bessere Ergebnisse erzielen.
Bei PIRLS wird eine Vielzahl an Leseaufgaben (Items) eingesetzt. In Itemanalysen werden diese nach ihrer Schwierigkeit eingestuft. Schwierige Aufgaben zeichnen sich durch eine geringe Lösungshäufigkeit aus, leichte durch eine hohe. Im vorliegenden Beitrag wird untersucht, welche Aufgaben den österreichischen Kindern auffällig leicht bzw. schwer fallen. Die Lösungshäufigkeiten der österreichischen Schüler/innen werden dabei mit jenen aller PIRLS-Länder im Durch-schnitt sowie mit den Werten der Schüler/innen Deutschlands und Englands verglichen. Anschließend wird der Frage nachgegangen, welche spezifischen Merkmale die in Österreich auffälligen Aufgaben aufweisen. Daraus sollen didaktische Rückschlüsse auf den Unterricht gezogen werden.
1 Alle veröffentlichten PIRLSTestaufgaben und Texte können auf https://www.bifie.at/node/1947 nachgelesen werden.
28 Analysen auf Itemebene in Lesen
Insbesondere soll untersucht werden, ob die österreich ischen Schüler/innen Stärken oder Schwächen in Bezug auf bestimmte Verstehensprozesse, bestimmte Textarten, bestimmte Antwortformate oder auch in Bezug auf wesentliche Textmerkmale (z. B. Lesbarkeit, Integration von Tabellen, Grafiken) aufweisen.
Methode
Bei PIRLS 2011 wurden den Schülerinnen und Schülern 142 Testaufgaben (Items) zu 10 Texten auf 13 Testhefte aufgeteilt vorgelegt (s. WallnerPaschon & Widauer, 2012, S. 52 ff.). Die Grundlage der vorliegenden Analyse bilden die Lösungshäufigkeiten dieser 142 Items. Die Lösungs-häufigkeit entspricht dem Schüleranteil, der das jeweilige Item richtig beantwortet hat. Beispielsweise bedeutet eine Lösungshäufigkeit von 57 %, dass 57 % der Schüler/innen die Frage richtig gelöst haben.
Über die Schüler/innen aller Teilnehmerländer hinweg wird für jedes Item die durchschnittliche Lösungshäufigkeit berechnet. Auf Basis dieser Lösungshäufigkeit werden die Items unterschiedlichen Kompetenzstufen (I–IV) zugeordnet. Die Itemschwierigkeit ist hoch, wenn nur wenige Testteilnehmer/innen eine richtige Lösung gefunden haben und niedrig, wenn das Item von vielen beantwortet werden konnte. Items der Stufe I gelten somit als sehr leicht und jene auf Stufe IV als sehr schwer zu lösen. (Grundsätzlich setzt sich die Itemschwierigkeit zusammen aus Textschwierigkeit und Aufgabenschwierigkeit. Es kann ein einfacher Text durch schwer zu lösende Aufgaben schwierig werden und umgekehrt.)
In Abbildung 1.2.1 sind vier Items aus dem Text „Flieg, Adler, flieg!“2 dargestellt und anhand der angeführten Parameter erläutert. Im linken Balken ist die Itemschwierigkeit abgebildet. Rechts daneben sind die Lösungshäufigkeiten im PIRLSSchnitt, darunter für Österreich gesamt bzw. für die Buben und Mädchen separat und in der dritten Zeile für Deutschland und England angegeben. Die Testitems sind in der dritten Spalte abgebildet, so wie sie in den Testheften abgedruckt werden, woraus sich die Nummerierung ergibt. In Blau sind Musterlösungen eingetragen. Welchem Verstehensprozess die Items zugeordnet werden, ist in der rechten Spalte abzulesen.
Die ausgewählten Items aus dem Text „Flieg, Adler, flieg!“ sind in Abbildung 1.2.1 so dargestellt, dass die Anforderung an die Leseleistung von unten nach oben zunimmt. In manchen Fällen ist eine Frage mit einer reinen Suchleistung zu lösen, ohne die Bedeutung des Worts überhaupt zu verstehen. So zum Beispiel im ersten Item der Abbildung 1.2.1.
Der erste Satz der Geschichte lautet: „Eines Tages machte sich ein Bauer auf die Suche nach einem verloren gegangenen Kalb.“ Hier ist der Schwierigkeitsgrad eher niedrig, die Schüler/innen müssen die Bedeutung von „Kalb“ nicht kennen, sie müssen lediglich erkennen, dass „suchen gehen“ bedeutungsmäßig ident ist mit „machte sich auf die Suche“. Der direkte Verstehensprozess ist einfach, sprachlich ge sehen gibt es jedoch die Voraussetzung, dass die semantische Identität eines Funktionsverbgefüges und eines Verbs erkannt wird. Das Item wird dem Verstehensprozess Erkennen und Wiedergeben explizit angegebener Informationen zugeordnet.
Beim folgenden Verstehensprozess, Ziehen einfacher Schluss-folgerungen, ist die Anforderung an die Testkandidatinnen und kandidaten erkennbar höher. Sie müssen bei Item 3 den Schluss ziehen, dass man das InbeideHändeNehmen als Zeichen für vorsichtige Behandlung sehen kann bzw. muss.
Der Verstehensprozess Untersuchen und Bewerten von Inhalt, Sprache und einzelnen Textelementen stellt die komplexesten Anforderungen zur Lösungsfindung. Bei Item 10 muss Sprache bewertet werden. Man muss zunächst beurteilen, welche Wörter für die Schönheit des Himmels stehen können und sie sodann als Beleg aufschreiben. Das erfordert Weltwissen.
Bei Item 12 muss zunächst eine charakteristische Eigenschaft eines Menschen gefunden werden (klug, gescheit, schlau) und dann muss man diese Interpretation mit einem Zitat aus dem Text belegen. Eine anspruchsvolle Aufgabe, die dem Verstehensprozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeordnet wird. Überdies muss die Antwort selbstständig formuliert werden, was eine weitere Schwierigkeit darstellt.
Obwohl die Verstehensprozesse in ihrer Komplexität aufbauend sind, werden jeweils zugehörige Items in allen Schwierigkeitsstufen entworfen.
In Abbildung 1.2.2 wird deutlich, wie schwer die einzelnen Items den österreichischen Schülerinnen und Schülern gefallen sind. Es zeigt sich, dass die österreichischen Kinder nahezu nur bei den schwierigeren Items unter die durchschnittliche Lösungshäufigkeit von PIRLS gefallen sind. Das kann vorsichtig so interpretiert werden, dass den österreichischen Kindern nicht immer alle Items gleich leicht oder gleich schwer gefallen sind wie den Kindern der PIRLSLänder insgesamt.
Von den insgesamt 142 Items trifft auf 58 zu, dass der Unterschied in der Lösungshäufigkeit zwischen Österreich und dem PIRLSSchnitt bzw. den beiden Vergleichs ländern (Deutschland und England) über 10 Prozentpunkte be
2 Der Text „Flieg, Adler, flieg!“ ist ein literarischer Text, der bei PIRLS 2011 zum Einsatz kam und nun für die Öffentlichkeit freigegeben wurde. Dieser Text, inklusive aller Testitems, findet sich unter folgendem Link auf den Seiten 12–21: https://www.bifie.at/system/files/dl/PIRLS_freigegebene_Items_mit_Beispiell%C3%B6sungen_20130115.pdf
Analysen auf Itemebene in Lesen 29
Abbildung 1.2.1: Testitems aus dem Text „Flieg, Adler, flieg!“ (PIRLS 2011)
IV
Item-schwierigkeit
Lösungs-häufigkeit Item
Verstehens-prozess
III
II
I
PIRLSAT/B/MDE/EN
Angaben der Lösungshäufigkeit in Prozent für ... ... PIRLS gesamt... Österreich gesamt/Österreich Buben/Österreich Mädchen... Deutschland/England
8796/96/96
95/91
6379/77/81
83/73
5156/55/58
57/73
4059/56/63
36/61
hoch
Inte
rpre
tiere
n so
wie
Ver
knüp
fen
von
Ged
anke
n un
d In
form
atio
nen
Unt
ersu
chen
und
Bew
erte
n v
on In
halt,
Spr
ache
und
ein
zeln
en T
exte
lem
ente
n
Zieh
en e
infa
cher
S
chlu
ssfo
lger
unge
nE
rken
nen
und
Wie
derg
eben
exp
lizit
ange
gebe
ner
Info
rmat
ione
n
nied
rig
1. Was wollte der Bauer am Anfang der Geschichte suchen gehen?
ein Kalb
Hirten
felsige Abhänge
ein Adlerjunges
3. ?etlednaheb githcisrov egnujreldA sad reuaB red ssad ,nam tkrem naroW
Er nahm das Adlerjunge in beide Hände.
Er brachte das Adlerjunge zu seiner Familie.
Er setzte das Adlerjunge zurück in sein Nest.
Er suchte am Flussufer nach dem Adlerjungen.
A
B
C
D
A
B
C
D
1. Was wollte der Bauer am Anfang der Geschichte suchen gehen?
ein Kalb
Hirten
felsige Abhänge
ein Adlerjunges
3. ?etlednaheb githcisrov egnujreldA sad reuaB red ssad ,nam tkrem naroW
Er nahm das Adlerjunge in beide Hände.
Er brachte das Adlerjunge zu seiner Familie.
Er setzte das Adlerjunge zurück in sein Nest.
Er suchte am Flussufer nach dem Adlerjungen.
A
B
C
D
A
B
C
D
10. Suche Wörter, die beschreiben, wie schön der Himmel in der Morgendämmerung aussah und schreibe sie ab.
!
12. Du hast durch das, was der Freund des Bauern getan hat, erfahren, was für ein Mensch er war. Beschreibe zuerst, was der Freund für ein Mensch war. Nenne dann zur Begründung ein Beispiel, was er getan hat.
!
Die Wolkenfetzen am Himmel waren zuerst rosa,
dann begannen sie, golden zu glänzen.
Er war schlau. Er wusste, dass er den Adler zum
Berg bringen musste, damit er fliegen würde.
10. Suche Wörter, die beschreiben, wie schön der Himmel in der Morgendämmerung aussah und schreibe sie ab.
!
12. Du hast durch das, was der Freund des Bauern getan hat, erfahren, was für ein Mensch er war. Beschreibe zuerst, was der Freund für ein Mensch war. Nenne dann zur Begründung ein Beispiel, was er getan hat.
!
Die Wolkenfetzen am Himmel waren zuerst rosa,
dann begannen sie, golden zu glänzen.
Er war schlau. Er wusste, dass er den Adler zum
Berg bringen musste, damit er fliegen würde.
30 Analysen auf Itemebene in Lesen
trägt. Bei diesen schneidet Österreich bei 54 Items besser und bei 4 Items schlechter ab als der PIRLSSchnitt. Diese Items werden auf den folgenden Seiten bezüglich Aufgabenformat (geschlossene Fragestellung, zumeist Multiple Choice, gegenüber offener Fragestellung, die eine verbalisierte Antwort verlangt), Textart (literarisch oder informatorisch) analysiert und die Textschwierigkeit anhand von Lesbarkeits indizes untersucht.3
Ergebnisse
Überblick über alle Items
Im Gesamtergebnis haben die österreichischen Kinder 529 Punkte in Lesen erreicht. Der PIRLSSchnitt liegt bei 512 Punkten, Deutschland hat einen Durchschnitt von 541 Punkten und England einen von 552 Punkten erreicht. Im PIRLSErgebnisbericht (vgl. Suchań, WallnerPaschon, Bergmüller & Schreiner, 2012) wird dies ausführlich dargestellt. Die Einzelitemanalysen sollen Aufschluss darüber geben, worauf die Punktunterschiede zurückführbar sein können.In weiterer Folge wird gezeigt werden, dass die öster
reichischen Schüler/innen bei manchen Items eine bis zu 28 Prozentpunkte höhere Lösungshäufigkeit erreichen als im PIRLSSchnitt. Bei anderen Items erreichen sie eine bis zu 15 Prozentpunkte geringere Lösungshäufigkeit.
Im Hinblick auf die Leistung der Kinder bei den Text arten (literarischer Text gegenüber Informations/Sachtext) gibt die Abbildung 1.2.3 Aufschluss. Allgemein betrachtet ist Österreich bei den Informationstexten unter den Werten von Deutschland und England, aber über dem PIRLSSchnitt. Bei den literarischen Texten ist Österreich sehr nahe an diesen beiden Vergleichsländern und deutlich über dem PIRLSSchnitt. In der Einzelanalyse wollen wir untersuchen, ob es dafür verallgemeinerbare Gründe gibt.
Eine Analyse der Leistung getrennt für Mädchen und Buben zeigt, dass grundsätzlich die Mädchen besser abschneiden als die Buben (im Allgemeinen eher bei literarischen Texten), dass aber die Unterschiede in der Performanz in Österreich erkennbar geringer sind als in den Vergleichsländern (vgl. Abb. 1.2.4). Daraus kann der vorsichtige Schluss gezogen werden, dass die PIRLSTexte und Items keine besonderen geschlechtsspezifischen Bevorzugungen und Benachteiligungen enthalten.4
3 Dabei ist zu beachten, dass geringfügige Unterschiede in der Lösungshäufigkeit statistisch gesehen keine Aussagekraft haben. Wir führen daher nur jene Items an, deren Lösungshäufigkeit sich bei den österreichischen Schülerinnen und Schülern signifikant vom PIRLSSchnitt unterscheidet. Der kritische Differenzwert wird von uns bei 10 Prozentpunkten gesetzt. Die durchschnittliche Differenz zwischen der Lösungshäufigkeit von PIRLS und Österreich liegt bei 7,6 Prozentpunkten. Für allfällige didaktische Aussagen erscheint es uns jedoch erforderlich, den Wert bei mindestens 10 Prozentpunkten anzusetzen.
4 Es war erklärtes Ziel von PIRLS, sowohl Texte wie auch Aufgabenprofile so zu gestalten, dass es keine geschlechtsspezifischen Bevorzugungen oder Benachteiligungen gibt.
70
50
80
90
100
60
40
20
30
0
10
%
%
Pro
zent
ric
htig
e A
ntw
orte
nle
icht
schw
ierig
ÖsterreichPIRLS-SchnittWerte aufsteigend nach der Lösungshäufigkeit im PIRLS-Schnitt gereiht
Item leichtschwierig
Itemschwierigkeit für Österreich
315
26
40
16
sehr leicht (LH > 80 %)leicht (LH 60−80 %)mittel (LH 40−60 %)schwierig (LH 20−40 %)sehr schwierig (LH < 20 %)
LH = Lösungshäufigkeit
Abbildung. 1.2.2: Testitems nach Lösungshäufigkeit gereiht (PIRLS 2011)
Analysen auf Itemebene in Lesen 31
Zu dem Befund aus Abbildung 1.2.4 kommt noch eine wichtige Überlegung hinzu: Zu jedem der zehn Texte gibt es im Schnitt 14 Items von unterschiedlicher Art und Schwierigkeit. Die Frage ist nun, wie sich Items mit überdurchschnittlich hohen Lösungshäufigkeiten auf die Texte verteilen.
Zum Text LIT1 gibt es 13 Items, 10 davon haben die österreichischen Schüler/innen signifikant häufiger bewältigt als die Schüler/innen aller PIRLSLänder im Durchschnitt. Darunter befinden sich auch jene Items mit den höchsten Anforderungen im Hinblick auf die Schwierigkeitsstufe. Bei drei weiteren Items liegen die Kinder aus Österreich zwischen 6 und 9 Prozentpunkte über dem internationalen Schnitt (darunter findet sich allerdings kein Testitem aus einer höheren Schwierigkeitsstufe als III). Kurz gesagt, bei den einfacheren Items schneiden die österreichischen Schüler/innen erkennbar besser ab (10 von 13 besser).
Zum Text INFO1 gibt es 12 Items, drei davon haben die österreichischen Schüler/innen häufiger richtig gelöst als die Schüler/innen aller PIRLSLänder im Durchschnitt; diese liegen jedoch alle auf Schwierigkeitsstufe II und keine darüber.
Es zeigt sich, die österreichischen Schüler/innen lösen die eher einfachen Items erkennbar besser, nicht aber die schwierigeren. Das Muster zeichnet sich auch bei den übrigen Texten und Items ab.
70
50
80
60
40%
%
Pro
zent
ric
htig
e A
ntw
orte
nle
icht
schw
ierig
Österreich
PIRLS-Schnitt
England
Deutschland
Informationstext Literarischer Text
Texte aufsteigend nach Lösungshäufigkeit im PIRLS-Schnitt geordnet
Text
INFO
1
INFO
2
Wan
dern
Zahn
INFO
3
LIT1
LIT2
Adl
er
Folgende Texte sind freigegeben:
Kuc
hen
Wandern = „Wandern macht Spaß!“
Zahn = „Das Rätsel des riesigen Zahns“
Adler = „Flieg, Adler, flieg!“Kuchen = „Der Feindkuchen“
LIT3
70
50
80
60
40%
%
Pro
zent
ric
htig
e A
ntw
orte
nle
icht
schw
ierig
INFO
1
INFO
2
Wan
dern
Zahn
INFO
3
LIT1
LIT2
Adl
er
Kuc
hen
LIT3
INFO
1
INFO
2
Wan
dern
Zahn
INFO
3
LIT1
LIT2
Adl
er
Kuc
hen
LIT3
INFO
1
INFO
2
Wan
dern
Zahn
INFO
3
LIT1
LIT2
Adl
er
Kuc
hen
LIT3
Folgende Texte sind freigegeben:Wandern = „Wandern macht Spaß!“
Zahn = „Das Rätsel des riesigen Zahns“Adler = „Flieg, Adler, flieg!“
Kuchen = „Der Feindkuchen“
Österreich EnglandDeutschland
Texte aufsteigend nach Lösungshäufigkeit im PIRLS-Schnitt geordnet
Informationstext Literarischer Text Landesmittelwert
BubenMädchen
Text Text Text
Landesdurchschnitt PIRLS-Durchschnitt
Abbildung 1.2.3: Lösungshäufigkeit der Testitems nach Texten im Ländervergleich (PIRLS 2011)
Abbildung 1.2.4: Geschlechterunterschiede der Lösungshäufigkeit der Testitems nach Texten im Ländervergleich (PIRLS 2011)
32 Analysen auf Itemebene in Lesen
Zunächst wollen wir der Frage nachgehen, welche Items es sind, die den österreichischen Schülerinnen und Schülern deutlich leichter gefallen sind (sie eine höhere Lösungshäu
figkeit erreicht haben) als dem PIRLSSchnitt und welche ihnen schwerer gefallen sind (sie eine niedrigere Lösungshäufigkeit erreicht haben).
Tabelle 1.2.1: Items, bei denen Österreich besser abschneidet als der PIRLS-Schnitt
Item Nr.
Textart VerstehensprozessFormat
G/O
Lösungshäufigkeit Kompetenz- stufePIRLS Österreich Deutschland England
1 LIT1 Interpretieren G 63 85 84 87 IV2 LIT1 Schlussfolgern G 72 83 83 81 IV3 LIT1 Schlussfolgern G 64 78 85 82 III4 LIT1 Info suchen G 77 91 90 89 IV5 LIT1 Schlussfolgern G 62 75 75 58 IV7 LIT1 Interpretieren O 36 52 53 54 IV8 LIT1 Schlussfolgern O 52 74 71 76 III9 LIT1 Info suchen O 62 85 81 80 IV10 LIT1 Schlussfolgern O 74 96 92 92 IV11 LIT1 Untersuchen G 53 65 61 71 III15 INFO1 Schlussfolgern G 43 61 59 52 II21 INFO1 Schlussfolgern O 31 48 39 38 II24 INFO1 Untersuchen G 57 80 78 77 II27 Adler Info suchen G 66 78 82 76 III28 Adler Schlussfolgern G 63 79 83 74 II29 Adler Info suchen G 82 95 96 91 II33 Adler Interpretieren G 42 59 62 59 IV34 Adler Interpretieren O 30 40 38 46 IV37 Adler Interpretieren O 40 59 36 61 IV40 INFO2 Schlussfolgern G 49 77 80 67 IV43 INFO2 Schlussfolgern G 56 78 76 69 III48 INFO2 Schlussfolgern G 54 74 68 63 III53 Wandern Info suchen G 49 61 71 59 III56 Wandern Schlussfolgern G 58 74 57 62 III57 Wandern Schlussfolgern O 52 72 66 68 III58 Wandern Schlussfolgern G 70 85 86 87 III62 LIT2 Schlussfolgern G 52 70 77 65 III64 LIT2 Untersuchen O 32 53 62 62 IV65 LIT2 Info suchen G 55 69 73 65 III67 LIT2 Info suchen G 58 68 75 68 III68 LIT2 Info suchen G 75 89 91 80 II69 LIT2 Schlussfolgern G 65 81 81 72 III70 LIT2 Schlussfolgern O 61 74 78 74 IV72 Zahn Schlussfolgern O 48 61 67 63 III77 Zahn Info suchen G 62 73 77 75 III81 Zahn Schlussfolgern G 48 64 69 59 IV92 LIT3 Info suchen G 76 91 94 89 II93 LIT3 Info suchen O 72 89 92 83 II94 LIT3 Untersuchen G 62 75 74 69 III95 LIT3 Schlussfolgern G 74 86 86 84 II99 LIT3 Info suchen G 71 82 85 85 II100 LIT3 Interpretieren O 42 52 54 46 III104 LIT3 Interpretieren O 54 66 72 64 III105 LIT3 Schlussfolgern G 80 90 93 91 II106 LIT3 Interpretieren G 61 78 82 75 III110 LIT3 Interpretieren O 51 64 66 72 III117 Kuchen Info suchen O 65 78 82 83 II120 Kuchen Schlussfolgern O 61 78 84 83 II121 Kuchen Schlussfolgern G 73 84 90 90 II123 Kuchen Interpretieren G 52 65 71 66 III128 INFO3 Info suchen O 60 73 76 74 III138 INFO3 Schlussfolgern G 42 67 66 57 IV139 INFO3 Schlussfolgern G 41 58 58 59 IV140 INFO3 Interpretieren O 26 43 40 43 IV
Folgende Texte sind freigegeben: Adler = „Flieg, Adler, flieg!“; Wandern = „Wandern macht Spaß!“Zahn = „Das Rätsel des riesigen Zahns“; Kuchen = „Der Feindkuchen“
G = geschlossenes Antwortformat; O = offenes AntwortformatAngaben der Lösungshäufigkeit in Prozent
Analysen auf Itemebene in Lesen 33
Items, bei denen Österreich besser abschneidet als der Durchschnitt aller PIRLS-Länder
Es muss angemerkt werden, dass der PIRLSDurchschnitt zwar als Vergleichsbasis herangezogen werden kann und muss, dass aber der Vergleich mit Deutschland, das die gleiche Sprache, eine vergleichbare Kultur und Tradition und ein vergleichbares Schulsystem hat, aus Sicht der Autoren eine größere Relevanz bei der Interpretation der Ergebnisse hat. Das wird weiter unten im Detail ausgeführt.
Tabelle 1.2.1 beinhaltet alle 54 Items, bei denen die österreichischen Schüler/innen eine um mindestens 10 Prozentpunkte höhere Lösungshäufigkeit aufweisen als die Schüler/innen aller PIRLSLänder im Durchschnitt. Es werden die Textart, der erwartete Verstehensprozess, das Aufgabenformat und die Itemschwierigkeit angeführt und Lösungshäufigkeiten zwischen den interessierenden Ländern verglichen.
Die Tabelle beginnt in der ersten Spalte von links mit der durchlaufenden Itemnummer in PIRLS 2011. Die nächste Spalte gibt die Art des Texts an (LIT = Literarischer Text, INFO = Informationstext). Die dritte Spalte beschreibt, welche Verstehensleistung erwartet wird:
�� Erkennen und Wiedergeben explizit angegebener Informationen (Info suchen); �� Ziehen einfacher Schlussfolgerungen (Schlussfolgern); �� Interpretieren sowie Verknüpfen von Gedanken und
Informationen (Interpretieren); �� Untersuchen und Bewerten von Inhalt, Sprache und
einzelnen Textelementen (Untersuchen).
In der vierten Spalte wird das Aufgabenformat (geschlossen oder offen) angegeben, die Spalten fünf bis acht geben die Lösungshäufigkeiten (LH) in Prozentwerten an – PIRLSSchnitt, Österreich, Deutschland, England. Und die rechte
Spalte zeigt die Klassifizierung der Itemschwierigkeit laut PIRLS (I bis IV), wobei I die niedrigste ist.
In Abbildung 1.2.5 werden die Items aus Tabelle 1.2.1 nach relevanten Kategorien zusammengefasst. Hier zeigt sich, dass österreichische Kinder bei den geschlossenen Aufgabenformaten (Multiple Choice) öfter bessere Ergebnisse erzielen als bei den offenen (wo sie selbst eine Antwort formulieren müssen). Das ist zunächst ein wichtiger Indikator dafür, dass das Abschneiden der österreichischen Kinder in PIRLS nicht primär damit beantwortet werden kann, dass sie mit dem Testformat „Multiple Choice“ nicht so vertraut sind wie die Schüler/innen anderer Länder.
Wir können auch davon ausgehen, dass die österreichischen Schüler/innen beim Identifizieren direkt im Text genannter Informationen (Wiedergeben) und bei einfachen Schlussfolgerungen erkennbar besser sind als beim Verknüpfen und Interpretieren von Informationen und beim Untersuchen und Bewerten von Inhalt und Sprache in einem Text.
Im Hinblick auf die Kompetenzstufen zeichnet sich kein Muster ab. Über alle Stufen hinweg beantworteten die österreichischen Schüler/innen die Hälfte bis ein Drittel der Items besser als im PIRLSSchnitt.
Items, bei denen Österreich schlechter abschneidet
Wie Tabelle 1.2.2 zeigt, gibt es nur wenige Items, bei denen österreichische Kinder schlechter abschneiden als der PIRLSSchnitt. Die Unterschiede zu Deutschland und zu England sind jedoch bisweilen beträchtlich. Im Folgenden soll hinterfragt werden, was mögliche Ursachen für diese Unterschiede sein könnten.
Je zwei Items zählen zum offenen bzw. geschlossenen Aufgabenformat. Drei der vier Items werden dem Verstehens
FrageformatAnzahl der Items
Anzahl der Items
Anzahl der Items
Items80706050 1301201101004030 90 14020100
Itemschwierigkeit
Verstehensprozess
14 322 17 4523 63I II III IV
14 33 11 4525 46 4 18Wiedergeben Schlussfolgern Interpretieren Untersuchen
19 6835 74geschlossen offen
Anzahl der Items, die von österreichischen Schülerinnen und Schülern besser gelöst wurden als der PIRLS-SchnittItems gesamt
schwierigleicht
Abbildung 1.2.5: Anzahl der von österreichischen Schülerinnen und Schülern besser gelösten Items als vom PIRLS-Schnitt (PIRLS 2011)
34 Analysen auf Itemebene in Lesen
prozess Interpretieren sowie Verknüpfen von Gedanken und Informationen zugeschrieben. Das vierte zählt zu Ziehen einfacher Schlussfolgerungen. Zwei der Items befinden sich auf Schwierigkeitsstufe IV. Die anderen beiden jeweils eine Stufe darunter.
INFO1 (Text nicht freigegeben, daher nur verschlüsselt und abstrakt dargestellt) ist der Grundtext für ein Testitem, bei dem die österreichischen Schüler/innen zwei der vier Items eindeutig schlechter bewältigt haben als der internationale Schnitt. Da, wie oben angedeutet, die unterschiedliche Performanz mehrere Ursachen haben kann, untersuchen wir zunächst den Aufgabentext im Hinblick auf seine Lese VerstehensSchwierigkeit. Dazu kann man zur ersten Orientierung so genannte Lesbarkeitsindizes heranziehen. Wir nehmen diese Indizes, die für unterschiedliche Zwecke gemacht wurden, als erste Orientierung. Da PIRLS keine Begründung für die Schwierigkeitsstufen gibt außer der Lösungshäufigkeit (also rein empirisch – ohne sprachliche Analyse hinsichtlich Wortschatz, Satzlänge, Satztiefe ... und ohne Analyse des für das Verstehen erforderlichen „Weltwissens“), bieten diese Indizes eine erste grobe Einschätzung. Für unsere weitere Analyse sind sie nicht relevant. Wir haben den Text mit einigen gebräuchlichen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) überprüft und dabei folgende Resultate erhalten:
�� LIX: sehr niedriger bis niedriger Schwierigkeitsgrad (35)�� Flesch Reading Ease score: 51.3 (text scale)
ziemlich schwer zu lesen;�� The Coleman-Liau Index: 12
gut geeignet für 12. Schulstufe;�� The SMOG Index: 9.4
Grade level: 9. Schulstufe.
Didaktische Beurteilung: Ein linearer Text mit einigen unterstützenden Illustrationen, die jedoch nicht für das Verständnis notwendig sind. Die Lesbarkeitsindizes zeigen zwar, dass der Text an sich nicht für die 5. Schulstufe als typisch angesehen werden kann, aber er dürfte auch keine wirklichen Probleme verursachen – weder vom Wortschatz noch von den grammatischen Konstruktionen her. Er könnte aus einem Jugendlexikon, einem anderen Sachbuch, aus einem Magazin mit Künstlerbiografien für Jugendliche o. Ä. stammen, ist aber fast eher literarisch als informations
orientiert. Der Text ist im Duktus ausgesprochen narrativ gehalten.
Zwei von zwölf Items (18 und 20) wurden von den österreichischen Schülerinnen und Schülern signifikant weniger häufig gelöst als im PIRLSSchnitt und noch viel weniger häufig im Vergleich mit England (Deutschland fällt in beiden Fällen auch unter den PIRLSSchnitt). Beide Items sind geschlossen, d. h. sie verlangen eine Auswahl aus vier vorgegebenen Antworten.
Item 18 sieht das Ziehen von Schlussfolgerungen vor und ist auf Schwierigkeitsstufe III angesetzt. Es wird danach gefragt, was ein bestimmtes Wort in einem bestimmten Zusammenhang über die beschriebene Person aussagt.
Wie sehen die Distraktoren (falschen Antwortalternativen) aus? Es sind praktisch alle vorgegebenen Antworten „wahr“, d. h. sie enthalten keine falschen Angaben im Hinblick auf den Text. Die erwartete richtige Antwort kann jedoch nur gegeben werden, wenn man die Bedeutung des als richtig angesehenen Worts kennt.
In Item 20 wird das Interpretieren und Verknüpfen von Gedanken verlangt und es ist auf Stufe II (also eher niedrig) – aber die Lösung verlangt ein sehr genaues Lesen des Texts. Einer der Distraktoren schlägt eine in Bezug auf den Text offensichtlich falsche Antwort vor, d. h. die Aussage findet sich nirgends im Text, die beiden anderen sind jedoch grundsätzlich „richtig“, erklären aber den Sachverhalt nicht der Fragestellung entsprechend. Die richtige Antwort könnte ganz einfach mit „Weltwissen“ gefunden werden.
Es ist schwer erklärbar, warum die Ergebnisse in Österreich (und in Deutschland) so viel schlechter sind als im PIRLSSchnitt und vor allem im Vergleich zu England.
Beim Text INFO2, Item 44, ist wiederum der Unterschied zu Deutschland nicht sehr groß, wohl aber zum PIRLSSchnitt und noch deutlich mehr zu England. Die Fragestellung ist in diesem Fall offen. Bemerkenswerterweise erreichen die österreichischen Schüler/innen bei einem anderen Item zum selben Text die im Vergleich höchste Lösungshäufigkeit. Einfacher Schluss: An der Art und Schwierigkeit des Testtexts selbst kann es nicht liegen, dass sich ein solcher
Tabelle 1.2.2: Items, bei denen österreichische Schüler/innen schlechter abschneiden als der PIRLS-Schnitt
G = geschlossenes AntwortformatO = offenes Antwortformat
Angaben der Lösungshäufigkeit in ProzentFreigegebener Text: Kuchen = „Der Feindkuchen“
Item Nr.
Textart VerstehensprozessFormat
G/O
Lösungshäufigkeit Kompetenz-stufePIRLS Österreich Deutschland England
18 INFO1 Schlussfolgern G 48 34 42 72 III20 INFO1 Interpretieren G 43 33 32 53 II44 INFO2 Interpretieren O 44 34 39 56 IV126 Kuchen Interpretieren O 39 24 29 56 IV
Analysen auf Itemebene in Lesen 35
Unterschied ergibt, es muss also an der Aufgabenart bzw. der konkreten Aufgabenstellung liegen.
Der verlangte Verstehensprozess ist bei Item 44 „Interpretieren“, das Format ist offen. Es muss herausgefunden werden, inwiefern sich bestimmte Sinne von Menschen und Tieren unterscheiden. Die Unterschiede sind im Text zwar implizit genannt, müssen aber dennoch interpretiert bzw. müssen einzelne Teile miteinander verknüpft werden. Die Itemschwierigkeit ist IV, also hoch. Die Fragestellung ist an sich völlig eindeutig, es müssen jedoch im Text Belege dafür gefunden werden, warum eine Antwort richtig ist. Diese Art der Aufgabe hat sich schon mehrmals als eher schwierig für österreichische Kinder erwiesen. Es ist offenbar die Kombination aus genauem Lesen und der daraus zu ziehenden Interpretation, die Probleme macht.
Im Text „Der Feindkuchen“ handelt es sich es sich um einen vergleichsweise einfachen literarischen Text. Mit diesem Text gehen österreichische Kinder sehr unterschiedlich um, zumindest zwei Aufgaben lösen sie deutlich besser als der PIRLSSchnitt, Item 126 ganz schlecht und ein weiteres auch um 9,8 Prozentpunkte schlechter als der PIRLSSchnitt, was bemerkenswert ist. Das Item 126 wird weiter unten noch genauer besprochen.
Diese Heterogenität deutet darauf hin, dass es nicht der Text als solcher (also literarischer Text, eher gut zu verstehen) ist, der Probleme verursacht. Schlecht schneiden die Schüler/innen bei einer offenen Interpretationsfrage auf Stufe IV ab; gut hingegen bei einem offenen Item, das ein einfaches Schlussfolgern verlangt und Stufe II zugeordnet wurde.
Einzelitems
In diesem Abschnitt besprechen wir zunächst die beiden „Spitzenergebnisse“ in jede Richtung: Einmal, wo die österreichischen Kinder im hohen Ausmaß über dem PIRLSSchnitt liegen, das zweite Mal, wo sie im hohen Maß unter dem PIRLSSchnitt liegen.
Österreich schneidet besser ab
Das Item entstammt dem Text „INFO2“. Da dieser Text bisher nicht veröffentlicht wurde, wird er hier nur verschlüsselt und abstrakt besprochen.
Die größte Zahl österreichischer Schüler/innen hat dieses Testitem zu einem eklatant höheren Prozentsatz, nämlich 27,9 Prozentpunkte, richtig gelöst als der PIRLSSchnitt. Hier liegt die Lösungshäufigkeit in Österreich ungefähr wie in Deutschland, aber deutlich höher als in England und wesentlich höher als im PIRLSSchnitt.
Der zugrunde liegende Text ist vom Typus „Information“, ein linearer Text etwa aus einem Sachbuch, einem Jugendlexikon oder einem Kindermagazin mit einigen ansprechen
den Illustrationen, die mit Untertexten versehen sind. Die Aufgabenstellung ist klar und deutlich. Die Aufgabenart verlangt einfache Schlussfolgerungen, weil die Antwort nicht wörtlich im Text aufscheint – aber nahezu. Die Antwort findet sich jedoch nicht im Fließtext, sondern in einer Abbildungsbeschriftung. Das Aufgabenformat ist „geschlossen“, das heißt hier, aus vier vorgegebenen Antworten ist eine zu wählen. Das Item ist auf der Schwierigkeitsstufe III.
Der Text
Wir haben den Text wieder mit international üblichen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) untersucht und dabei Folgendes festgestellt:
�� Nach dem Lesbarkeitsindex (LIX) erreicht dieser spezielle Textausschnitt, der die gesuchte Information enthält, die Stufe 36, also geringe Schwierigkeit – etwa wie Kinder und Jugendliteratur und Belletristik.
Mit der FleschFormel wird ein etwas anderes Ergebnis erzielt:
�� Flesch Reading Ease score: 56.4 (text scale) Flesch Reading Ease ziemlich schwer zu lesen;�� The Coleman-Liau Index: 12
Grade level: 12. Schulstufe�� The SMOG Index: 8.3
Grade level: 8. Schulstufe.
Diese Befunde deuten darauf hin, dass es nicht die besondere „Einfachheit“ des Texts sein kann, die zu diesem positiven Ergebnis geführt hat – der Text ist danach zumindest als mittelschwer einzustufen und definitiv nicht so, dass ihn der Durchschnitt der Schüler/innen der Schulstufen 4 und 5 im überwiegenden Ausmaß leicht verstehen könnte.
Der verlangte Verstehensprozess
Hier geht es um das Ziehen einfacher Schlussfolgerungen, d. h. die gesuchte Information ist nicht wortwörtlich aus dem Text ablesbar. In diesem Fall ist es tatsächlich ein sehr einfacher Schluss, der gezogen werden muss, denn der
LH = Lösungshäufigkeit
Land LH
PIRLS-Schnitt 49 %Österreich 77 % österr. Mädchen 81 % österr. Buben 73 %Deutschland 80 %England 67 %
Tabelle 1.2.3: Lösungshäufigkeiten zum Item, bei dem Österreich die größte positive Differenz zum PIRLS-Schnitt
aufweist
36 Analysen auf Itemebene in Lesen
gesuchte Terminus wird im Text genannt, nicht aber im Fließtext (im linearen Haupttext), sondern in einer Abbildungsbeschriftung, die man beim Lesen möglicherweise gar nicht so genau zur Kenntnis nimmt. Es spricht für ein genaues Leseverhalten, wenn auch diese Nebentexte offensichtlich zur Kenntnis genommen werden.
Das Testformat (Art der Aufgabenstellung)
Hier wird ein geschlossenes Format angewendet, und zwar das MultipleChoiceFormat. Die Schwierigkeit dieses Formats hängt unter anderem von den vorgegebenen Alternativen (Distraktoren) ab. Sind die anderen drei Antwortmöglichkeiten völlig unwahrscheinlich, dann fällt die Wahl der richtigen Antwort nicht besonders schwer – immer vorausgesetzt, man hat Text und Fragestellung verstanden. In diesem Fall sind zwei Distraktoren (falsche Antworten) sehr unwahrscheinlich bis augenscheinlich unzutreffend. Zwei Antwortmöglichkeiten sind grundsätzlich plausibel und könnten als richtig eingestuft werden. Die erwartete richtige Antwort ist nicht so formuliert, dass Wörter aus dem Bezugstext verwendet werden, sondern dass man schlussfolgern muss. Man muss den Schluss ziehen, dass der Text der richtigen Antwort das mit anderen Worten beschreibt, was im Originaltext steht. Man muss kulturell (zivilisatorisch) wissen, dass die Dinge, von denen hier die Rede ist, auch in einem Mülleimer vorkommen können.
Als Nebenbemerkung zum MultipleChoiceTestformat muss noch angeführt werden, dass es ein gewisses Unsicherheitspotenzial hinsichtlich der Aussagekraft enthält: Man kann raten und zufällig das Richtige finden. Dies gilt jedoch für die Kinder aller Länder gleichermaßen.
Österreich schneidet schlechter ab
Das Item, bei dem die österreichischen Schüler/innen die größte negative Differenz zum PIRLSSchnitt aufweisen, entstammt einem bereits veröffentlichten Text „Der Feindkuchen“ (vgl. Item 126 in Tabelle 1.2.2).
Das auffälligste Ergebnis ist, dass bei diesem Item die österreichischen Schüler/innen eine um 15,2 Prozentpunkte geringere Lösungshäufigkeit aufweisen als der PIRLSSchnitt.
Hier liegt die Lösungshäufigkeit zwischen Deutschland und Österreich nicht sehr weit auseinander, sie ist jedoch wesentlich niedriger als in England. Selbst die österreichischen Mädchen erreichen nur knapp die Hälfte der Lösungshäufigkeiten aller Schüler/innen in England.
Der zugrunde liegende Text ist vom Typus her ein „literarischer Text“. Es ist ein völlig linearer Text etwa aus einem Literaturmagazin, einem Jugendbuch, einer Jugendzeitschrift mit einigen ansprechenden Illustrationen, die nicht mit Untertexten versehen sind und in diesem Sinne nicht zur Information gehören (Typus illustrative Grafik im Gegensatz zu einer funktionalen Grafik). Die Aufgabenstellung hingegen ist schwierig: „Was für ein Mensch ist Toms Vater? Nenne dazu ein Beispiel, was er in der Geschichte getan hat.“ Die Aufgabenart verlangt Interpretieren sowie Verknüp-fen von Gedanken und Informationen. Die Antwort findet sich nicht im Fließtext, sondern muss aus Handlungen der Person interpretiert werden. Das Aufgabenformat ist „offen“, das heißt hier, die Schüler/innen müssen die Antwort selbst formulieren – und aus dem Text eine entsprechende Belegstelle herausfinden. PIRLS stuft das Item auf der Schwierigkeitsstufe IV ein.
Der Text
Nach den internationalen Lesbarkeitsindizes (vgl. Scott, 2013 und Lenhard & Lenhard 2011) ergibt sich für den zugrunde liegenden Text folgende Bewertung:
�� Nach LIX hat der Text einen Schwierigkeitsindex von 26 (der obige Text – INFO2 – einen Index von 35: etwa Stufe Comic, LutherBibel, Werbetext). Der Schwierigkeitsgrad wird also niedriger bemessen als bei dem Text oben, den die österreichischen Kinder wesentlich besser bearbeiten konnten.�� Flesch Reading Ease score: 68.4 (text scale)
Flesch Reading Ease: Standard/durchschnittlich schwer;�� The Coleman-Liau Index: 10
Empfehlung: 10. Schulstufe;�� The SMOG Index: 5.9
Empfehlung: 6. Schulstufe.
Alle Lesbarkeitsindizes zeigen, dass der Text als ziemlich einfach zu lesen anzusehen und durchaus mit der Schulstufe kompatibel ist.
Der verlangte Verstehensprozess
Die Aufgabenstellung ist dem Verstehensprozess Interpre-tieren sowie Verknüpfen von Gedanken und Informationen zugeordnet und ist nach dem internationalen PIRLSVerständnis als beträchtlich schwerer einzuschätzen als das Auffinden von Informationen im Text oder das Ziehen einfacher Schlussfolgerungen (wie im obigen Beispiel). Es gibt im Text keinerlei wörtliche Anhaltspunkte, d. h. die Schüler/innen können nicht einfach nur schauen, ob die
LH = Lösungshäufigkeit
Land LHPIRLS-Schnitt 39 %Österreich 24 % österr. Mädchen 28 % österr. Buben 19 %Deutschland 29 %England 56 %
Land LH
PIRLS-Schnitt 39 %Österreich 24 % österr. Mädchen 28 % österr. Buben 19 %Deutschland 29 %England 56 %
Tabelle 1.2.4: Lösungshäufigkeiten zum Item, bei dem Österreich die größte negative Differenz zum PIRLS-Schnitt
aufweist
Analysen auf Itemebene in Lesen 37
Wörter des Items irgendwo im Text zu finden sind. Sie müssen den Textsinn erfassen, um die Frage beantworten zu können, und sie müssen die Antwort auch selbstständig formulieren. Der zweite Teil der Aufgabenstellung verlangt, dass die Schüler/innen im Text eine Passage finden, die ihre Charakteristik von Toms Vater belegt, d. h. sie müssen im Text einen Satz oder eine Satzfolge finden, mit der sie untermauern können, dass ihre Aussage (die Antwort auf die Frage, was für ein Mensch Toms Papa ist) richtig ist. Das ist eine Vorgangsweise, die bei einer guten textbezogenen Interpretation literarischer Texte üblich ist – allerdings nicht auf dieser Schulstufe.
Das Testformat (Art der Aufgabenstellung)
Eine offene Aufgabenstellung verlangt von den Schülerinnen und Schülern, dass sie die Antwort selbstständig formulieren. Sie kreuzen nicht einfach an, was sie für richtig halten (wie im MCFormat), sondern sie müssen die Fragestellung voll verstehen und darauf eine passende Antwort formulieren können. Sie müssen – wie in diesem Beispiel – darüber hinaus ihre Ansicht aus dem Text belegen können, d. h. sie müssen erkennen, welche Textstelle(n) ihre Aussage wahrscheinlich begründen kann (können). Diese Art der Aufgabenstellung ist eindeutig anspruchsvoller als die meisten geschlossenen.
1.2.4 Schlussfolgerungen
Bildungspolitisch wird es kaum im Sinne der österreichischen Verantwortlichen sein, sich damit zufrieden zu geben, dass die österreichischen Schüler/innen bei circa einem Drittel der Items (54 von 142) höhere Lösungshäufigkeiten aufweisen als der PIRLSSchnitt und in 4 (von 142) Fällen signifikant schlechter abschneiden. Der Rest liegt mehr oder minder im PIRLSSchnitt. Man wird Maßnahmen entweder im curricularen und/oder methodischdidaktischen Bereich überlegen müssen, wie die Lesekompetenzen der Schüler/innen in einem Land mit einem elaborierten und vergleichsweise teuren Schulsystem verbessert werden können.
Grosso modo lassen sich im Vergleich zu Deutschland und England keine gravierenden und durchgehenden Unterschiede erkennen, vor allem lässt sich kaum bestätigen, dass die „Gewöhnung“ der Kinder anderer Länder an solche Tests (vor allem des geschlossenen Typs – Multiple Choice) einen ausschlaggebenden Unterschied erbrächte:
Im geschlossenen Testformat (MultipleChoice) lösen die österreichischen Kinder bei literarischen Texten 75 %, die deutschen 77 % und die englischen 75 %, der PIRLSSchnitt liegt bei 64 %. Bei Informationstexten liegt die PIRLSLösungshäufigkeit bei 58 %, für Österreich bei 67 %, für Deutschland bei 68 % und für England bei 69 %.
Es ist also eindeutig nicht das Multiple-Choice-Testformat, das den österreichischen Kindern größere Schwierigkeiten bereitet als denen anderer Länder.
Bei den offenen Antworten, also jenen, die selbst formuliert werden müssen, ergeben sich deutlichere Unterschiede:
Bei den literarischen Texten liegt der PIRLSSchnitt bei 48 %, Österreich bei 56 %, Deutschland bei 61 % und England bei 65 % Lösungshäufigkeit. Bei den Informationstexten hat PIRLS eine Lösungshäufigkeit von 40 %, Österreich 42 %, Deutschland 48 % und England 53 %. Somit zeigt sich ein deutlicher Trend: Österreichische Kinder haben mit offenen Antworten bei Informationstexten deutlich größere Schwierigkeiten als deutsche und englische, sie liegen nur knapp über dem PIRLSSchnitt.
Ein deutlicher Unterschied ergibt sich auch bei den Verstehensprozessen: Es gibt nur geringe Unterschiede beim Auffinden expliziter Information, ebenso wenig beim Ziehen einfacher Schlussfolgerungen. Die Österreicher liegen jedoch 6 Prozentpunkte hinter den Deutschen und 11 hinter den Engländern, was das „Interpretieren“ betrifft, und 4 Prozentpunkte bzw. 10 hinter den beiden Ländern beim „Untersuchen und Bewerten“. Diese Unterschiede ergeben sich vor allem bei Informationstexten. Erstaunlicherweise bereitet auch das Auffinden expliziter Information in literarischen Texten ein Problem (46 % Lösungshäufigkeit gegenüber 52 % in Deutschland und 60 % bei den englischen Kindern). Dies könnte allerdings auch heißen, dass österreichische Schüler/innen nicht gelernt haben, literarische Texte als Informationsquellen zu nutzen und somit faktische Details eher weniger beachten. Das mag zwar zunächst als Erklärungsoption dienen, ist aber letztlich keine Tugend, denn zum Verstehen der durch den jeweiligen Text geschaffenen „Welt“ ist ein Erkennen der konstituierenden Faktoren dieser (fiktionalen) Welt erforderlich.
Unseres Erachtens zeigt die Datenlage folgendes Bild:
Österreichische Kinder …
�� erzielen bei den geschlossenen Aufgabenformaten (Multiple Choice) öfter bessere Ergebnisse als bei den offenen (wo sie selbst eine Antwort formulieren müssen). Das ist ein wichtiger Indikator dafür, dass das eher bescheidene Abschneiden der österreichischen Kinder in PIRLS nicht primär damit beantwortet werden kann, dass sie mit dem Testformat „Multiple Choice“ nicht so vertraut wären wie die Schüler/innen anderer Länder. Und das erfolgt bei denselben Ausgangstexten. Es ist also nicht die relative Schwierigkeit eines Testtexts, der unseren Kindern Probleme bereitet, sondern die Art der Aufgabenstellung und die Art der erwarteten Antwort; �� haben Schwierigkeiten mit offenen Aufgabenformaten,
d. h. sie arbeiten besser, wenn sie aus mehreren Möglichkeiten die richtige wählen können (geschlossenes
38 Analysen auf Itemebene in Lesen
Format) und nicht die Antwort selbst formulieren müssen;�� sind beim Identifizieren direkt im Text genannter In
formationen (Wiedergeben) und bei einfachen Schlussfolgerungen erkennbar besser als beim Verknüpfen und Interpretieren von Informationen und beim Untersuchen und Bewerten von Inhalt und Sprache in einem Text;�� haben wenig Probleme mit dem Verstehen von eher
schwer eingestuften Texten;�� haben wenig Schwierigkeiten, wenn sie aus einem Text
Informationen entnehmen und daraus einfache Schlüsse ziehen sollen;�� haben ein Problem damit, wenn sie in literarischen
Texten Interpretationen vornehmen sollen, die nicht direkt aus dem Text erschließbar sind und die sie dennoch aus dem Text belegen sollen.
Daraus können mit aller gebotenen Vorsicht didaktische Rückschlüsse für den Unterricht gezogen werden:
Österreichische Kinder …
�� brauchen mehr Anleitung zum genauen Lesen, um Details wahrnehmen und diese Details in einen interpretatorischen Zusammenhang bringen zu können;�� brauchen ganz grundsätzlich mehr Übung im Umgang
mit Informationstexten, das bedeutet jedoch, dass die NichtSprachFächer in der Schule stärker gefordert sind, Leseverstehen/Textverstehen mit den Kindern zu trainieren und einzufordern (z. B. auf der Basis der Texte in den jeweiligen Fachlehrbüchern);
�� brauchen mehr Übung im Interpretieren von Textsinn auf der Basis von Evidenz, d. h. sie müssen Textbelege finden lernen, um ihre Interpretationen zu belegen. Sie müssen auch in literarischen Texten die relevanten Informationen/Belegstellen finden;�� brauchen mehr Übung im eigenständigen Formulieren
von Antworten.
Diese didaktischen Rückschlüsse müssen vor allem deshalb mit Vorsicht gezogen werden, weil es sich bei internationalen Tests wie PIRLS oder PISA nicht um flächendeckende Überprüfungen aller Schüler/innen einer Jahrgangskohorte handelt, sondern „nur“ um eine statistisch ausreichende Auswahl, die eine Hochrechnung erlaubt. Die Auswahl folgt zwar im Prinzip nachvollziehbaren sozioökonomischen Kriterien, dennoch ist ein verlässlicher Rückschluss methodischdidaktischer Art nur im Grundsatz möglich, nicht aber als direkte Handlungsanweisung an die Lehrerinnen und Lehrer.
Das Abschneiden der österreichischen Kinder bei PIRLS 2011 ist keineswegs „katastrophal“ oder erschreckend, es ist an sich insgesamt nicht schlecht. Jedoch, wie schon oben angedeutet, ist es erstaunlich, dass das Ergebnis nicht deutlich besser ist – in einem traditionsreichen und eher teuren Schulsystem. PIRLS (und auch PISA) erlaubt nur diese Rückschlüsse, die Bildungsverantwortlichen müssen sich allerdings fragen, warum das Ergebnis „nur“ so ist, wie es ist.
Literatur
Lenhard, A. & Lenhard, W. (2011). Lesbarkeitsindex (LIX). Zugriff am 15.10.2013 unter http://psychometrica.de/lix.html
Mullis, I. V. S., Martin, M. O., Kennedy, A. M., Trong, K. L. & Sainsbury, M. (2009). PIRLS 2011 Assessment Framework. Chest-nut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.
Renner, M. (2013). Textkompetenz in allen Unterrichtsgegenständen. Handreichung für Autorinnen und Autoren von Unter-richtsmaterialien. Wien: Kopierzentrale BMUKK.
Scott, B. (2013). Text Readability Consensus Calculator. Retrieved October 15, 2013, from http://www.readabilityformulas.com/free-readability-formula-tests.php
Suchań, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.
Wallner-Paschon, C. & Widauer, K. (2012). Tests und Fragebögen. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Die Studie im Überblick (S. 52–59). Graz: Leykam.
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 39
1.3 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
Silvia Salchegger
Einleitung
Die Frage, ob es Geschlechterunterschiede in Mathematik gibt, wurde bereits eingehend beforscht. In der folgenden Einleitung wird zunächst ein Überblick über die Ergebnisse dieser Forschungsarbeiten zur Mathematikleistung, zum Mathematikselbstkonzept und zu Studienraten in mathe-matikintensiven Fächern gegeben. Darüber hinaus wird auf mög liche Gründe für die gefundenen Geschlechterunter-schiede eingegangen.
Geschlechterunterschiede in der Mathematikleistung
Unterscheiden sich Mädchen und Buben in ihrer Mathe-matikleistung? Großangelegte Metaanalysen, in denen eine Vielzahl von Ländern und Erhebungen berücksichtigt wurden, kamen zum Konsens, dass Leistungsunterschiede zwischen Buben und Mädchen in Mathematik meist un - bedeutend sind (Else-Quest, Hyde & Linn, 2010; Hyde, Lindberg, Linn, Ellis & Williams, 2008; Lindberg, Hyde, Peterson & Linn, 2010). Zwar weisen internationale Schüler leistungsvergleiche immer wieder für einige Län-der – darunter auch Österreich – statistisch signifikante Leistungsunterschiede zwischen Mädchen und Burschen nach (z. B. Filzmoser & Suchań, 2013; OECD, 2009; OECD, 2013; Wallner-Paschon, 2012a), diese sind aller-dings in der Regel von geringer praktischer Bedeutsamkeit.
Eine Metaanalyse von Else-Quest et al. (2010), die sich auf Daten aus 69 Ländern stützt, zeigt, dass es nur in acht Ländern Geschlechterunterschiede in der Mathematikkom-petenz gibt, die die Schwelle zur praktischen Bedeutsamkeit (d +/–0.20; vgl. Methodenteil) überschreiten (zugunsten der 14- bis 16-jährigen Burschen in sechs Ländern, zu-gunsten der gleichaltrigen Mädchen in zwei Ländern). In den rest lichen 61 Ländern sind die Leistungs unterschiede
kleiner als d +/–0.20 und können als praktisch unbedeu-tend ein gestuft werden. Unter diesen Ländern befindet sich auch Österreich mit einer Effektstärke von d = 0.08 (bezogen auf die PISA-2003-Daten). Hier muss jedoch darauf hingewiesen werden, dass die Effektstärken der Geschlechterunterschiede in der Mathematikleistung in Österreich normalerweise größer ausfallen und bei den sonstigen PISA-Erhebungen (2000, 2006, 2009 und 2012) im Bereich von 0.20 bis 0.24 lagen. Am Ende der Grundschule (4. Schulstufe) liegen die Geschlechterunter-schiede in der Mathematikkompetenz fast gleich hoch wie bei den 15-/16-jährigen PISA-Schülerinnen und Schülern (zwischen 0.15 bei TIMSS 1995 sowie TIMSS 2011 und 0.20 bei TIMSS 2007; Wallner-Paschon, 2010, 2012a). Im internationalen Vergleich weist Österreich in den meisten Erhebungen eine überdurchschnittlich hohe Leistungsdiffe-renz in Mathematik auf: Beispielsweise ist der Leistungsvor-sprung von Burschen gegenüber Mädchen bei PISA 2012 OECD-weit nur in Luxemburg und Chile noch größer als in Österreich (Filzmoser & Suchań, 2013). Trotz dieser im Ländervergleich hohen Geschlechterunterschiede wird selbst in Österreich die Schwelle, ab der von einem klei-nen Effekt gesprochen wird (d = 0.20), in allen bisherigen Erhebungen, wenn überhaupt, dann nur geringfügig über-schritten. Bezogen auf die Leistung lässt sich demnach keine bedeutungsvolle männliche Dominanz in Mathematik feststellen: Buben erzielen in der Regel keine praktisch bedeutsam besseren Mathematikleistungen als Mädchen.
Geschlechterunterschiede im Mathematikselbstkonzept
Ausgehend von diesen geringen Leistungsunterschieden wäre anzunehmen, dass sich Mädchen und Buben nicht wesentlich in der Selbsteinschätzung ihrer Mathematik-kompetenz unterscheiden. Studien zum Mathematikselbst-
Ist die Mathematik eine männliche Domäne? Diese Frage wird anhand von Geschlechterunterschieden in drei mathematikbezogenen Merkmalen untersucht: der Mathematikleistung, dem Mathematikselbstkonzept und den Absolventenraten in mathematikintensiven Studienfächern. Während sich bei der Leistung kaum bedeutsame Geschlechterunterschiede finden lassen, schätzen Mädchen in den meisten Ländern ihre mathematischen Fähigkeiten schlechter ein als Buben (d. h. sie verfügen über ein niedrigeres Mathematikselbstkonzept). Auch beim Abschluss mathematikintensiver Studienrichtungen sind Frauen in den OECDLändern in der Regel unterrepräsentiert. Es zeigt sich, dass Frauen in jenen Ländern häufiger mathematikintensive Studienrichtungen absolvieren, in denen auch schon bei 10jährigen Mädchen das Mathematikselbstkonzept positiver ausgeprägt ist.
40 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
konzept zeigen jedoch, dass Mädchen selbst bei gleicher oder besserer Leistung ihre Mathematikkompetenz geringer einschätzen als Buben (Gabriel, Mösko & Lipowsky, 2011; Helmke, 1997; Marsh & Yeung, 1998; Sáinz & Eccles, 2012). Auch die bereits oben erwähnte ländervergleichende Metaanalyse von Else-Quest et al. (2010) zeigt, dass 14- bis 16-jährige Burschen in der Regel ein deutlich höheres Mathematikselbstkonzept aufweisen als gleichaltrige Mäd-chen, obwohl es kaum Leistungsunterschiede gibt: Die Selbstkonzeptunterschiede zwischen Mädchen und Bur-schen erreichen in 42 Ländern (von 69) die Schwelle von d = 0.20 (ohne Ausnahme immer zugunsten der Buben). In elf Ländern liegt die Effektstärke sogar über 0.40, was von Hattie (2009) als Schwelle für einen mittleren Effekt definiert wird (vgl. Methodenteil). Mit einer Effektstärke von 0.44 reiht sich auch Österreich unter diese elf Länder mit den größten Geschlechterunterschieden im Mathema- tikselbstkonzept 15-Jähriger bei PISA 2003 ein. Auch bei den Kindern am Ende der Volksschule liegen die Geschlech- terdifferenzen im Mathematikselbstkonzept in Österreich bereits ähnlich hoch (d = 0.48 bei TIMSS 2007; Wallner-Paschon, 2010). Bezogen auf das Selbstkonzept ist Mathematik demnach eine stärkere männliche Domäne: Burschen schätzen ihre Mathematikleistungen in der Regel bedeutsam höher ein als Mädchen, insbesondere auch in Österreich.
Geschlechterunterschiede bei der Beteiligung an mathematikintensiven Studienrichtungen
Eine dritte wesentliche Komponente bei der Untersuchung von Geschlechterunterschieden in Mathematik ist die Be-rufs- und Bildungswahl. Hier zeigt sich, dass Frauen in mathematisch-naturwissenschaftlichen Fächern unterreprä-sentiert sind (Ceci, Williams & Barnett, 2009; European Commission, 2013; OECD, 2011). Beispielsweise belegen Statistiken der OECD (2011, Tab. A4.6), dass in Öster-reich unter den 25- bis 34-jährigen Erwerbstätigen 2,4 % der Männer, aber nur 0.9 % der Frauen ein naturwissen-schaftliches oder technisches Studium absolviert haben. Im EU-Schnitt ist diese Diskrepanz mit 2,3 % vs. 1,2 % etwas weniger gravierend. Daten der EU (European Commission, 2013) belegen, dass in Österreich der Frauenanteil unter den Doktorandinnen und Doktoranden in Natur wissenschaft, Mathematik und Informatik bei 36 % liegt, im EU-Schnitt beträgt dieser 40 %. Tabelle 1.3.1 (letzte Spalte) gibt einen Überblick über den Anteil von Frauen, der ein mathema-tikintensives Studium (Biowissenschaften, physikalische Wissenschaften, Mathematik und Statistik, Computer-wissenschaften) absolviert hat, für die Teilnehmerländer von TIMSS 2011. Diese Angaben basieren auf Daten der UNESCO (n. d.). Im Durchschnitt der hier berichteten Länder sind 43 % der Absolventinnen und Absolventen weiblich, in Österreich liegt der Anteil mit 34 % deutlich
niedriger. Bemerkenswert sind die hohen Absolventen-quoten von Frauen in arabischen Ländern (Saudi-Arabien, Iran, Oman und Katar). Für die OECD-/EU-Staaten kann jedoch in der Regel festgestellt werden, dass bezogen auf die Abschlussquoten mathematikintensiver Studienrichtungen Mathe matik männlich dominiert ist.
Mögliche Gründe für Geschlechterunterschiede
Woran könnte es liegen, dass Frauen viel seltener mathe-matikintensive Studienrichtungen absolvieren als Männer, obwohl sie etwa dasselbe Leistungspotenzial dazu hätten? Eccles (1994) versucht Bildungs- und Berufsentscheidun-gen anhand eines Erwartung-mal-Wert-Modells zu erklären. Demnach wird die Berufs- und Bildungswahl durch zwei wesentliche Komponenten bestimmt: Der Erwartung für Erfolg und dem subjektiven Wert einer Tätigkeit. Personen werden eher jene Tätigkeiten wählen, von denen sie über-zeugt sind, dass sie sie schaffen werden und denen sie einen hohen Wert zuschreiben. Frauen werden sich also eher dann für mathematikintensive Studienfächer entscheiden, wenn sie a) davon überzeugt sind, über eine hohe Mathematik-kompetenz zu verfügen (d. h. ein hohes Mathematikselbst-konzept aufweisen)1 und b) der Mathematik einen hohen subjektiven Wert zuschreiben (d. h. großes Interesse daran haben, ihr hohe Wichtigkeit und Nützlichkeit beimessen). Im vorliegenden Beitrag wird genauer auf die Bedeutung des Mathematikselbstkonzepts für die geschlechtsspezifi-sche Berufs- und Studienwahl eingegangen. Zur Entwick-lung des Selbstkonzepts wurde gezeigt, dass dieses stark von vorausgehenden Leistungserfahrungen (vor allem Noten) abhängt. Es wird aber auch durch Sozialisationserfahrungen in Schule und Elternhaus sowie durch Vergleichsprozesse mit-bestimmt (vgl. Hellmich & Günther, 2011). Im Folgenden wird genauer darauf eingegangen, inwiefern diese Faktoren dafür verantwortlich sein könnten, dass Mädchen ein deut-lich schlechteres Mathematikselbstkonzept entwickeln als Buben. Zunächst kann festgestellt werden, dass die schlech-teren Fähigkeitseinschätzungen der Mädchen nicht durch schlechtere Mathematiknoten von Mädchen erklärt werden können: Mädchen erhalten in Mathematik etwa gleich gute Noten wie Burschen (vgl. Bacher, Beham & Lachmayr, 2008; Spiel, Schober & Litzenberger, 2008; Schreiner, Breit & Haider, 2008; Voyer & Voyer, 2014).
Bei den Vergleichsprozessen werden soziale und dimensionale Vergleiche als bedeutsam für die Selbstkonzeptentwicklung erachtet. Beim sozialen Vergleich setzen die Kinder ihre eige-ne Leistung in Beziehung zu den Leistungen ihrer Mitschü-ler/innen. Dies hat zur Folge, dass gleich kompetente Kinder in leistungsstarken Klassen im Durchschnitt ein niedrigeres Fähigkeitsselbstkonzept aufweisen als in Klassen mit schwa-
1 Die Komponenten „Erwartung für Erfolg“ und „Selbstkonzept“, werden in Eccles� (1994) Modell als getrennte Faktoren betrachtet. Empirisch lassen sie sich jedoch nicht unterscheiden und werden daher in neueren Studien bedeutungsgleich verwendet (z. B. Nagy et al., 2008). Auch im vorliegenden Beitrag wird nicht zwischen diesen beiden Komponenten unterschieden.
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 41
chem Leistungsniveau (z. B. Marsh, 2005). Bisher liegen allerdings keine Befunde vor, dass diese sozialen Vergleiche geschlechtsspezifischen Mustern folgen würden und somit die unterschiedliche Ausprägung im Selbstkonzept von Mäd-chen und Buben erklären könnten (vgl. Gabriel et al., 2011).
Während bei den sozialen Vergleichen ein Kind seine Leis-tung mit jener der Mitschüler/innen in Beziehung setzt, erfolgt ein dimensionaler Vergleich innerhalb einer Person zwischen unterschiedlichen Domänen. Sind die eigenen Leistungen zum Beispiel in Deutsch besser als in Mathe-matik, so erfährt das Deutschselbstkonzept eine Aufwer-tung, während das Mathematikselbstkonzept abgewertet wird (vgl. Marsh, 1986). Bei der Entwicklung geschlechts-spezifischer Mathematikselbstkonzepte könnte dies relevant sein, da Mädchen den Buben in Lesen in fast allen Ländern deutlich überlegen sind (Wallner-Paschon, 2012b), und sie dadurch häufiger zur Feststellung gelangen können, gut in Lesen zu sein; im Sinne des dimensionalen Vergleichs ist die Feststellung, gut in Lesen zu sein, auch gleichzeitig mit der Feststellung, weniger gut in Mathematik zu sein, verbunden und die Mathematikkompetenz wird abgewertet (vgl. Möller & Marsh, 2013). Es wurde gezeigt, dass Effekte dimensionaler Vergleiche für die Selbstkonzepte bei Kindern im Grundschulalter (und damit bei der im vorliegenden Beitrag untersuchten Population) noch keine wesentliche Rolle spielen (vgl. Möller, Kuska & Zaunbauer, 2011), bei älteren Kindern und Jugendlichen jedoch sehr bedeutsam sind (Möller, Pohlmann, Köller & Marsh, 2009).
Eine weitere wesentliche Komponente für die Selbstkonzept-entwicklung von Kindern sind Sozialisationserfahrungen in Schule und Elternhaus (vgl. Hellmich & Günther, 2011). Eltern und Lehrkräfte sind zentrale Vermittler dieser Sozia-lisationserfahrungen. Bisherige Befunde weisen darauf hin, dass die Entwicklung des Selbstkonzepts bedeutsam durch Geschlechtsrollenzuschreibungen und Geschlechterstereo-type von Eltern und Lehrkräften geprägt wird (z B. Frome & Eccles, 1998; Retelsdorf, Schwartz & Asbrock, 2015). Studien hierzu zeigen, dass Einschätzungen von Eltern und Lehrkräften häufig Geschlechterstereotypen folgen, etwa dass Mathematik eher für Buben und weniger für Mädchen ist. Beispielsweise überschätzen Eltern die numerische und figurale Intelligenz ihrer Söhne, die ihrer Töchter unter-schätzten sie dagegen (Steinmayr & Spinath, 2009); auch trauen Eltern Söhnen in Mathematik mehr zu als Töchtern (Buff, Reusser, Dinkelmann & Steiner, 2011). Und diese elterlichen Fähigkeitseinschätzungen beeinflussen über die tatsächliche Leistung hinaus das Mathematikselbstkonzept der Schüler/innen (Frome & Eccles, 1998).
Auch die Lehrkräfte neigen zu geschlechterverzerrten Wahr-nehmungen. So zeigten Ziegler, Kuhn & Heller (1998), dass 27 % der Mathematiklehrer/innen und 30 % der Physiklehrer/innen Buben für begabter halten als Mädchen; umgekehrt hält jedoch keine der befragten Lehrpersonen Mädchen für be-gabter als Buben. Entsprechend würden die Lehrkräfte auch
Mädchen eher Karrieren in Erziehung, Medizin oder Philolo-gie empfehlen, Buben sehen sie hingegen für mathematisch-naturwissenschaftlich-technische Berufe besser geeignet.
In einer Studie von Tiedemann (2000a) schätzten Lehrkräfte Mädchen gegenüber Buben im Durchschnitt als weniger talentiert in Mathematik ein, waren überzeugt, dass Mäd-chen weniger von zusätzlicher Unterstützung profitieren und dass Mädchen sich mehr anstrengen müssen, um gut in Mathematik zu sein. Darüber hinaus führten sie bei Mäd-chen ein Scheitern eher auf mangelnde Fähigkeit und bei Buben eher auf mangelnde Anstrengung zurück. Ähnlich zeigt der Literaturüberblick von Li (1999), dass Lehrkräfte dazu neigen, die Mathematikfähigkeiten von männlichen Schülern zu überschätzen und höhere Erwartungen in die Mathematikleistung von Buben zu setzen.
Ebenso wie die Fähigkeitseinschätzungen der Eltern wirken sich auch jene der Lehrkräfte auf das Selbstkonzept der Kinder aus (Tiedemann, 2000b). Die Einschätzungen der Lehrkräfte scheinen aber noch bedeutsamer zu sein, da diese auch Einfluss auf die Fähigkeitseinschätzungen der Eltern nehmen (Tiedemann, 2000b).
Insgesamt verdeutlichen diese Befunde, dass Mädchen und Buben unterschiedliche soziale Erfahrungen in Bezug auf Mathematik machen. Wie stark etwa diese sozialen Erfah-rungen geschlechtsspezifisch gefärbt sind, wird auch durch kulturelle Faktoren mitbestimmt (vgl. Else-Quest et al., 2010; Tiedemann, 2002). Etwa wurde gezeigt, dass es in einer Vielzahl an Kulturen Geschlechterstereotype dahin-gehend gibt, dass Naturwissenschaft stärker männlich als weiblich konnotiert ist (Nosek et al., 2009). Diese Stereo-type sind zwar unterschiedlich stark ausgeprägt, jedoch in allen 34 untersuchten Ländern nachweisbar.
Kinder internalisieren durch soziale Erfahrungen diese Ste-reotype – etwa im Umgang mit Eltern und Lehrpersonen (vgl. oben). Gesellschaftliche Stereotype spiegeln sich auch in den Berufen wider, die von Frauen und Männern ausge-übt werden. Augenscheinlich für die österreichischen Schü-ler/innen ist dabei, dass Lehrpersonen in der Volksschule fast zur Gänze Frauen sind, mit sozialen und kulturellen Interessen und praktisch nicht ausgeprägten naturwissen-schaftlichen Orientierungen.
Geschlechtsspezifische Unterschiede in der Berufswahl ver-gegenwärtigen den Kindern geschlechtstypische Rollen bilder und beeinflussen auch die Vorstellung der Kinder über Ge-schlechterrollen (z. B. welcher Beruf für Mädchen passend ist; vgl. Eccles, 1994). Hierzu zeigten Else-Quest et al. (2010) einen signifikanten Zusammenhang zwischen Frauenquoten in der Wissenschaft und Geschlechterunterschieden im Mathematikselbstkonzept 14- bis 16-Jähriger: In Ländern, in denen Frauen häufiger in wissenschaftlichen Positionen anzutreffen sind, liegt das Mathematikselbstkonzept von Mädchen weniger hinter jenem von Burschen zurück.
42 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
Das Selbstkonzept kann in diesem Sinn als „Output“ ge-sellschaftlicher Werte und Normen gesehen werden. Es kann auf der anderen Seite aber auch als „Input“ betrachtet werden, das dazu beiträgt, geschlechterspezifische Rollen-verteilungen in der Gesellschaft aufrechtzuerhalten, indem es die individuelle Berufs- und Bildungswahl mitbestimmt. Beispielsweise zeigten Parker et al. (2012), dass die Ent-scheidung junger Erwachsener, ob sie studieren, stark von schulischen Selbstkonzepten abhängt und das Mathema-tikselbstkonzept ein starker Prädiktor für die Wahl mathe-matikintensiver Hauptfächer ist. Ähnlich belegten Köller, Daniels, Schnabel und Baumert (2000), dass das Mathe-matikselbstkonzept auf der 10. Schulstufe einen hohen Vorhersagewert für die Leistungskurswahl in Mathematik zwei Jahre später hat. Insbesondere konnte die häufigere Leistungskurswahl von Buben zu einem erheblichen Teil durch ihr höheres Selbstkonzept erklärt werden. Eine wei-tere Studie (Guay, Larose & Boivin, 2004) zeigte, dass das schulische Selbstkonzept von Kindern der vierten bis sechsten Schulstufe auf den zehn Jahre später erreichten Bildungsgrad schließen lässt: Ein höheres Selbstkonzept sagt einen höheren Bildungsgrad voraus. Das Selbstkonzept bleibt auch dann ein signifikanter Prädiktor, wenn nach Leistung und sozialem Status kontrolliert wird. Eder (2012) erklärt die geschlechtsspezifische Berufswahl damit, dass es ab dem elften Lebensjahr zu einer fähigkeitsbezogenen Abgrenzung gegenüber bestimmten Aktivitäten kommt. Ausgegrenzt werden jene Aktivitäten, die nicht mit den eigenen Fähigkeiten vereinbar erscheinen. Ist das Mathe-matikselbstkonzept folglich in diesem Alter niedrig, werden mathematikbezogene Interessen ausgegrenzt. Im Geschlech-tervergleich zeigt sich, dass mathematiknahe praktisch-technische Interessen bei 15-jährigen Mädchen deutlich geringer ausgeprägt sind als bei Burschen (vgl. Eder, 2012). Eine Hebung des Mathematikselbstkonzepts von Mädchen könnte daher auch ihre Entwicklung einschlägiger beruf-licher Interessen positiv beeinflussen.
Doch nicht nur auf individueller Ebene wurde ein enger Zusammenhang zwischen Selbstkonzept und Berufs- und Bildungsentscheidungen nachgewiesen, sondern auch auf Länderebene. So hat Lenzer (2006) für die 38 Teilneh-merländer von TIMSS 1999 belegt, dass die Größe der Geschlechterunterschiede im Mathematikselbstkonzept ein signifikanter Prädiktor der Studienrate von Frauen in Mathematik und Computerwissenschaft ist: In Ländern, in denen das Mathematikselbstkonzept 14-jähriger Mädchen stärker hinter jenem ihrer männlichen Altersgenossen zu-rückliegt, wählen Frauen seltener Mathematik und Com-puterwissenschaft als Studienfach.
Das Selbstkonzept scheint somit einen zentralen Angel-punkt einzunehmen: Einerseits wird es durch gesellschaft-liche Normen mitbestimmt, andererseits trägt es zur Berufs- und Bildungswahl bei, womit gesellschaftliche Rollenver-hältnisse aufrechterhalten und weitergeführt werden.
Fragestellung
Der vorliegende Beitrag geht der Frage nach, wie stark Ge-schlechterunterschiede in der Mathematikleistung und im Mathematikselbstkonzept bei 10-Jährigen ausgeprägt sind. Die Analysen beziehen sich auf jene 50 Länder, die sich an TIMSS 2011 mit der vierten Schulstufe beteiligt haben. Darüber hinaus wird untersucht, ob Geschlechterunterschie-de im Mathematikselbstkonzept 10-Jähriger in Zusammen-hang mit Frauenraten in mathematikintensiven Studienrich-tungen stehen. Die vorliegende Studie ist die erste, die diesen Zusammenhang bei einer so jungen Altersgruppe untersucht. Konkret werden die folgenden Hypothesen getestet:
�� Geschlechterunterschiede in der Mathematikleistung 10-Jähriger sind in allen Ländern nur von geringer Effektstärke (zwischen –0.20 und +0.20).�� Geschlechterunterschiede im Mathematikselbstkonzept
sind wesentlich größer als in der Mathematikleistung. Es wird für den Großteil der Länder erwartet, dass Buben ein praktisch bedeutsam höheres Mathematikselbstkon-zept aufweisen als Mädchen; konkret wird angenom-men, dass die Effektstärke des Geschlechterunterschieds im Mathematikselbstkonzept in mehr als der Hälfte der Länder über 0.20 liegt.�� Die Geschlechterunterschiede im Mathematikselbst-
konzept von 10-Jährigen stehen in einem praktisch bedeutsamen Zusammenhang mit der Frauenquote unter den Absolventinnen und Absolventen mathe- matikintensiver Studienrichtungen: In Ländern, in denen Mädchen ihre Mathematikkompetenz ähnlich gut einschätzen wie Buben, ist der Frauenanteil unter den Absolventinnen und Absolventen mathematik-intensiver Studienrichtungen höher. Je weiter die 10-jährigen Mädchen in der Einschätzung ihrer mathe-matischen Fähigkeiten hinter den Buben zurückliegen, desto geringer ist die Beteiligung von Frauen an mathe-matik intensiven Fächern.
Methode
Beschreibung der verwendeten Variablen
Die Skala zum Mathematikselbstkonzept von TIMSS 2011 basiert auf den folgenden sieben Items aus dem Schüler-fragebogen:
�� Normalerweise bin ich gut in Mathematik; �� Mathematik fällt mir schwerer als vielen Kindern
meiner Klasse;�� Ich bin einfach nicht gut in Mathematik;�� Ich lerne schnell in Mathematik;�� Ich kann schwierige Mathematikaufgaben gut lösen;�� Meine Lehrerin sagt, ich bin gut in Mathematik;�� Mathematik fällt mir schwerer als alle anderen Fächer.
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 43
Die Kinder sollten für jede dieser Aussagen angeben, wie sehr sie ihr zustimmen. Vier Antwortkategorien standen zur Auswahl, von „stimme völlig zu“ über „stimme eher zu“ und „stimme eher nicht zu“ bis zu „stimme überhaupt nicht zu“. Die kursiv gesetzten Items sind negativ formu-liert und wurden bei der Skalenkonstruktion umgepolt. Die Mathematikselbstkonzept-Skala wurde so konstruiert, dass der Mittelwert über alle Länder bei 10 liegt und die Standardabweichung bei 2. Höhere Werte indizieren ein positiveres Selbstkonzept. Die genaue Skalenkonstruktion wird bei Martin, Mullis, Foy und Arora (2012) beschrieben.
In diesem Dokument wird auch die hohe Reliabilität der Selbstkonzeptskala belegt: In mehr als der Hälfte der Teil-nehmerländer liegt Cronbachs α über 0,80, nur in einem (Marokko) unter 0,60. Die Mittelwerte der Mädchen und Buben jedes Landes sind in Tabelle 1.3.1 eingetragen. Der Anteil fehlender Werte liegt überall unter 10 %, außer für Aserbaidschan (Mädchen 17 %, Buben 18 %) und für die Buben Deutschlands (12 %).
Der Frauenanteil unter den Absolventinnen und Absolventen mathematikintensiver Studienrichtungen (Biowissenschaf ten,
Mathematikleistung MathematikselbstkonzeptFrauenanteil (%) an den Absolvent/innen mathematikintensiver
StudienrichtungenLand MW Buben MW Mädchen d MW Buben MW Mädchen d
ARE 430 (106) 438 (91) –0.08 10.3 (2.0) 10.51 (2.0) –0.09 m
ARM 451 (90) 454 (87) –0.04 10.2 (2.1) 10.17 (2.1) 0.03 49
AUS 519 (89) 513 (83) 0.07 10.3 (2.2) 9.88 (2.1) 0.22 35
AUT 513 (63) 504 (61) 0.15 10.7 (2.1) 9.97 (2.0) 0.37 34
AZE 460 (101) 466 (101) –0.07 10.0 (1.9) 10.19 (1.9) –0.07 56
BEL (fl) 553 (60) 545 (59) 0.13 10.1 (1.9) 9.38 (1.8) 0.41 30
BHR 432 (98) 440 (81) –0.08 10.2 (1.8) 10.30 (1.8) –0.06 m
CHL 466 (83) 457 (77) 0.12 9.6 (1.9) 9.26 (1.9) 0.20 23
CZE 516 (71) 505 (69) 0.16 10.0 (1.9) 9.54 (1.8) 0.27 38
DEU 532 (63) 523 (61) 0.14 10.7 (2.2) 9.79 (2.1) 0.43 44
DNK 540 (71) 534 (70) 0.08 10.2 (1.9) 9.61 (1.7) 0.31 35
ESP 488 (72) 477 (68) 0.16 10.3 (2.1) 9.59 (2.0) 0.36 35
FIN 549 (71) 542 (66) 0.10 10.3 (2.0) 9.49 (2.0) 0.41 46
GBR (E) 544 (93) 541 (85) 0.03 10.3 (1.9) 9.74 (1.8) 0.28 37
GBR (N) 563 (88) 562 (83) 0.00 10.2 (2.0) 9.76 (1.9) 0.22 37
GEO 447 (94) 454 (85) –0.08 10.6 (2.1) 10.46 (2.0) 0.05 49
HKG 604 (69) 598 (63) 0.09 9.8 (2.0) 8.91 (2.0) 0.44 m
HRV 495 (69) 485 (65) 0.16 10.4 (2.3) 9.95 (2.2) 0.20 53
HUN 517 (93) 514 (87) 0.03 10.5 (2.3) 10.11 (2.3) 0.18 38
IRL 529 (81) 526 (75) 0.04 10.5 (2.1) 10.18 (2.1) 0.15 41
IRN 431 (95) 431 (90) 0.00 10.5 (2.0) 10.54 (2.1) –0.04 70
ITA 512 (73) 503 (71) 0.12 10.2 (1.8) 9.69 (1.7) 0.27 m
JPN 587 (75) 584 (70) 0.04 8.9 (1.5) 8.33 (1.4) 0.39 26
KAZ 504 (87) 498 (80) 0.06 10.5 (2.1) 10.47 (1.9) 0.01 m
KOR 608 (70) 601 (66) 0.10 9.1 (1.6) 8.82 (1.3) 0.21 38
KWT 323 (104) 358 (96) –0.35 10.2 (1.9) 10.46 (2.0) –0.15 m
LTU 534 (76) 533 (72) 0.02 10.1 (1.9) 9.56 (1.9) 0.28 37
MAR 331 (104) 338 (101) –0.07 9.6 (1.5) 9.75 (1.6) –0.10 44
MLT 499 (80) 492 (75) 0.09 10.7 (2.3) 10.10 (2.2) 0.25 33
NLD 544 (53) 536 (53) 0.15 10.6 (2.0) 9.62 (2.0) 0.48 23
NOR 499 (71) 492 (66) 0.10 10.7 (2.0) 10.32 (1.8) 0.22 36
NZL 486 (86) 486 (81) 0.00 9.8 (1.8) 9.47 (1.7) 0.17 40
OMN 372 (109) 398 (97) –0.25 10.3 (2.0) 10.63 (2.0) –0.14 67
POL 486 (76) 476 (70) 0.12 10.9 (2.1) 10.40 (2.0) 0.22 45
PRT 535 (70) 529 (67) 0.09 9.9 (1.9) 9.32 (1.6) 0.34 54
QAT 407 (110) 420 (100) –0.13 10.1 (2.0) 10.37 (2.0) –0.13 63
44 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
physikalische Wissenschaften, Mathematik und Sta tistik, Computerwissenschaften) wurde der Datenbank der UNESCO (n. d.) entnommen. Die Frauenraten beziehen sich auf das Jahr 2010, außer in Australien, Marokko und Korea, wo das Jahr 2009 als Referenzpunkt herangezo-gen wurde, da keine Daten für 2010 vorliegen. Für Eng-land und Nordirland wurde die Rate von Großbritannien insgesamt herangezogen. Für elf der 50 TIMSS-Teilneh-merländer liegen keine Angaben zu Absolventenraten vor (vgl. Tab. 1.3.1). In den übrigen Ländern schwankt der Frauen anteil unter den Absolventinnen und Absolventen mathematikinten siver Studienrichtungen zwischen 23 % in den Niederlanden und 73 % in Saudi-Arabien. In 30 von 39 Ländern liegt der Frauenanteil unter der Schwelle von 50 %, die Geschlechterparität kennzeichnet.
Ermittlung der Effektstärke
Um die Größen der Geschlechterunterschiede über unter- schiedliche Metriken (Mathematik-Leistungsskala, Mathe-matik-Selbstkonzept skala) hinweg vergleichbar zu machen, werden absolute Geschlechterunterschiede in das Effekt-stärkenmaß Cohen’s d transformiert. Dies ist ein etabliertes Maß zur Ermittlung der praktischen Bedeutsamkeit von Mittelwertdifferenzen (Cohen, 1988; Ellis, 2010; vgl. auch die Einleitung zu diesem Bericht). Die Effektstärke d wurde nach folgender Formel berechnet (M steht dabei für Mittel-wert, SD für Standardabweichung des Mittelwerts):
Im vorliegenden Beitrag wird, wie in Studien zu Geschlech-terunterschieden üblich (z. B. Else-Quest et al., 2010), der Mittelwert der Mädchen vom Mittelwert der Buben abge-zogen, womit positive Werte von d anzeigen, dass Buben im Durchschnitt eine höhere Ausprägung als Mädchen aufweisen (d. h. eine höhere Leistung oder ein positiveres Selbstkonzept), negative Werte indizieren eine höhere Aus-prägung der Mädchen.
Angelehnt an Hattie (2009) werden Effekte ab einer Größe von d = 0.20 als klein eingestuft und ab einer Größe von d = 0.40 als mittel. Effekte unter einer Größe von 0.20 werden als praktisch nicht bedeutsam erachtet (vgl. Cohen, 1988; Else- Quest et al., 2010; Hattie, 2009). Eine Effekt-stärke von 0.20 bedeutet, dass sich 85,3 % der Wertever-teilungen von zwei Gruppen (im vorliegenden Beitrag von Mädchen und Buben) überlappen. Bei einer Effektstärke von 0.40 überlappen sich die Verteilungskurven nur mehr zu 72,6 % und der Unterschied zwischen zwei Mittelwerten beträgt 40 % einer Standardabweichung.
Ergebnisse
In Abbildung 1.3.1 werden Effektstärken von Geschlechter-unterschieden in der Mathematikleistung und im Mathe-matikselbstkonzept dargestellt. Auf der linken Seite der Abbildung sind die Länder entsprechend der Effektstärke der Geschlechterdifferenzen in der Mathematikleistung eingetragen, auf der rechten Seite erfolgt eine Darstellung nach Geschlechterdifferenzen im Mathematikselbstkon-
Tabelle 1.3.1: Mathematikleistung, Mathematikselbstkonzept und Abschluss mathematikintensiver Studienrichtungen im Geschlechtervergleich
Mathematikleistung MathematikselbstkonzeptFrauenanteil (%) an den Absolvent/innen mathematikintensiver
StudienrichtungenLand MW Buben MW Mädchen d MW Buben MW Mädchen d
ROU 484 (105) 481 (106) 0.03 10.3 (2.2) 10.12 (2.1) 0.06 56
RUS 542 (75) 543 (72) –0.02 10.0 (2.0) 9.68 (2.1) 0.15 m
SAU 402 (114) 418 (84) –0.16 10.0 (1.7) 10.73 (1.9) –0.40 73
SGP 604 (81) 608 (75) –0.05 9.5 (2.1) 8.87 (1.9) 0.30 m
SRB 519 (91) 513 (87) 0.07 10.2 (2.0) 9.98 (1.9) 0.12 45
SVK 511 (80) 503 (79) 0.10 10.2 (2.1) 9.69 (2.0) 0.26 43
SVN 518 (70) 508 (67) 0.14 10.7 (2.0) 10.15 (1.9) 0.30 40
SWE 506 (67) 501 (66) 0.07 10.5 (2.0) 10.20 (1.7) 0.15 43
THA 451 (85) 465 (74) –0.18 9.3 (1.3) 9.32 (1.3) –0.04 66
TUN 356 (97) 363 (92) –0.07 10.1 (1.7) 10.12 (1.7) –0.03 m
TUR 469 (102) 470 (99) –0.02 10.4 (2.0) 10.25 (2.0) 0.05 42
TWN 590 (74) 592 (72) –0.02 9.4 (2.1) 8.87 (2.0) 0.27 m
USA 545 (77) 536 (73) 0.11 10.4 (2.1) 10.00 (2.1) 0.21 41
YEM 243 (111) 255 (108) –0.11 9.4 (1.6) 9.63 (1.7) –0.14 m
MW = Mittelwert; d = Effektstärke des Geschlechterunterschieds; m = Werte fehlen; Standardabweichungen stehen in Klammern; Länderkürzel vgl. Abb. 1 (Einführung).
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 45
zept. Der Wertebereich zwischen –/+ 0.20 wurde weiß be-lassen. Für Länder in diesem Bereich liegen keine praktisch bedeutsamen Geschlechterunterschiede vor. Im hellblau gekennzeichneten Wertebereich befinden sich Länder, in denen Geschlechterdifferenzen praktisch bedeutsam sind, der Effekt aber insgesamt klein ist. Im mittelblau gekenn-zeichneten Wertebereich befinden sich Länder, in denen Geschlechterdifferenzen praktisch bedeutsam sind und der Effekt eine mittlere Größe erreicht (mindestens 0.40).
Aufseiten der Mathematikleistung wird deutlich, dass in keinem der 50 Länder Buben praktisch bedeutsam höhere Leistungen erbringen als Mädchen. Bemerkenswert ist,
dass im Oman und in Kuwait im Gegenteil sogar Mädchen eine bedeutsam höhere Mathematikleistung aufweisen als Buben. Österreich befindet sich zwar unter den Ländern mit den höchsten Geschlechterunterschieden in der Mathe-matikleistung zugunsten der Buben, bleibt mit d = 0.15 aber trotzdem unter der Schwelle zur praktischen Bedeutsamkeit. Hypothese 1, in der angenommen wurde, dass Leistungsun-terschiede in Mathematik in allen Ländern nur von geringer Effektstärke sind, konnte somit größtenteils bestätigt wer-den: Abgesehen vom Oman und von Kuwait, wo Mädchen eine bedeutsam höhere Mathematikkompetenz aufweisen als Buben, sind keine praktisch bedeutsamen Geschlechter-unterschiede in der Mathematikleistung feststellbar.
NLD
0.45HKGDEU
BEL (fl) FIN0.40
JPN
AUTESP
0.35PRT
DNK0.30 SGP SVN
LTU GBR (E)TWN ITA CZESVK
0.25 MLT
NOR POL GBR (N) AUSUSA KOR
0.20 HRV CHL
HUNNZL
CZE HRV ESPNLD AUT 0.15 SWE IRL RUSDEU SVN
BEL (fl)CHL POL ITA SRB
USAKOR NOR SVK FIN 0.10
PRT MLT HKGDNK
SRB AUS SWEKAZ ROU
0.05 TUR GEOJPN IRL
ROU HUN GBR (E) ARMLTU
KAZ
Effektstärke des G
eschlechterunterschieds
mittlerer E
ffektkleiner E
ffekt
keine praktisch bedeutsamen
Geschlechterunterschiede
praktisch bedeutsame G
eschlechterunterschiede zugung
sten der B
uben
Mathematikleistung Mathematikselbstkonzept0.50
46 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
Anders verhält es sich beim Mathematikselbstkonzept. Hier schätzen in 27 der 50 Länder Buben ihre Mathematikleis-tung bedeutsam höher ein als Mädchen. Einzig in Saudi-Arabien ist das Mathematikselbstkonzept der Mädchen be-deutsam positiver als jenes der Buben. In Österreich sind die geschlechterspezifischen Selbstkonzeptunterschiede am siebthöchsten unter den 50 Ländern: Die Effektstärke, mit der Mädchen hinter den Buben zurückliegen, beträgt 0.37, womit fast schon die Schwelle für einen mittleren Effekt
(d = 0.40) erreicht wird. Länder, in denen ein solcher mitt-lerer Effekt vorliegt, sind die Niederlande, Hongkong, Deutschland, der flämische Teil Belgiens und Finnland. Somit kann auch Hypothese 2 bestätigt werden: Tatsäch-lich weisen im Großteil der Länder (27 von 50) Buben ein praktisch bedeutsam höheres Mathematikselbstkonzept auf als Mädchen.
IRN NZL GBR (N) 0
TWN RUS TURTUN
ARM THA IRNSGP −0.05
BHRTUN MAR AZE AZEBHR ARE GEO
AREMAR
YEM
QAT QATYEM OMN
−0.15
−0.10
SAU KWT
THA
OMN −0.25
−0.30
−0.50
Länderkürzel vgl. Abb. 1 (Einführung)
−0.40
−0.45
KWT −0.35
SAU
−0.20
mittlerer E
ffektkleiner E
ffekt
keine praktisch bedeutsamen
Geschlechterunterschiede
praktisch bedeutsame G
eschlechterunterschiede zugung
sten der M
ädchen
Mathematikleistung Mathematikselbstkonzept
Abbildung 1.3.1: Effektstärken von Geschlechterunterschieden in der Mathematikleistung und im Mathematikselbstkonzept im internationalen Vergleich (TIMSS 2011)
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 47
Abbildung 1.3.2 zeigt den Zusammenhang zwischen dem Mathematikselbstkonzept und der Absolventenrate von Frauen in mathematikintensiven Studienrichtungen. Hier ergibt sich ein sowohl statistisch als auch praktisch hoch bedeutsamer Zusammenhang von r (38) = –.77 (p < .01). Das heißt, je höher in einem Land die Absolventenrate von Frauen in mathematikintensiven Studienrichtungen ist, desto positiver ist das Selbstkonzept von Mädchen ge-genüber jenem von Buben ausgeprägt. Da es sich um ein Zusammenhangsergebnis handelt, kann es natürlich auch umgekehrt gelesen werden: Je positiver das Selbstkonzept von 10-jährigen Mädchen gegenüber jenem gleichaltriger Buben in einem Land ausgeprägt ist, desto höher ist die Absolventenrate von Frauen in mathematikintensiven Studienrichtungen. Zu dieser zweiten Interpretationsmög-lichkeit muss angemerkt werden, dass das Selbstkonzept der aktuell Zehnjährigen natürlich keinen Einfluss auf
die derzeitigen Studienquoten nehmen kann. Ein Längs-schnittvergleich zwischen TIMSS 1995 und TIMSS 2011 deutet jedoch darauf hin, dass Geschlechterunterschiede im Mathe matikselbstkonzept über die Zeit hinweg ziemlich stabil sind. So haben im Jahr 1995 87 % der österreichi-schen Buben und 80 % der Mädchen die Aussage „Ich bin normalerweise gut in Mathematik“2 mit „stimmt genau“ oder „stimmt eher schon“ beantwortet. Im Jahr 2011 haben 81 % der Buben und 75 % der Mädchen der fast iden-ten Aussage „Normalerweise bin ich gut in Mathematik“ etwas oder sehr zugestimmt. Mit 7 bzw. 6 Prozentpunkten Unterschied sind die Geschlechterdifferenzen damit an-nähernd gleich geblieben. Das heißt, bei den heutigen Endzwanzigern (und damit den potenziellen Studienab-solventen von heute) waren die Geschlechterunterschiede im Selbstkonzept am Ende der Volksschule bereits ähnlich hoch ausgeprägt wie bei den aktuell 10-Jährigen. Bemer-
2 Dies ist das einzige Item der aktuellen TIMSS-Selbstkonzeptskala, das auch bereits bei TIMSS 1995 in nahezu identer Form erhoben wurde.
Abbildung 1.3.2: Zusammenhang zwischen dem Mathematikselbstkonzept und dem Anteil von Frauen in mathematikintensiven Studienrichtungen (TIMSS 2011, UNESCO 2010)
AUT
Mädchen haben höheres MSK Buben haben höheres MSK
Länderkürzel vgl. Abb. 1 (Einführung)
Effektstärke des Geschlechterunterschieds im Mathematikselbstkonzept (MSK) 10-Jähriger
.60.40.20.00−.20−.40−.60
Frau
enan
teil
an d
en A
bslo
vent
/inne
n m
athe
mat
ikin
tens
iver
Stu
dien
richt
unge
n
100
90
80
70
60
50
40
30
20
10
% 0
TUR
THA
SWE
ESP
SVN
SVKSRB
ROU
QAT
PRT
POL
OMN
NOR
NZL
NLD
MAR
MLT
KOR
JPN
IRL
IRN
HUN
DEUFIN
DNK
HRV
CHL
AUS
ARM
GBR (E)GBR (N)
AZE
GEO
USACZE
LTU
BEL (fl)
SAU
r = −.77 (p < .01)
48 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
kenswert ist, dass sowohl die Mädchen als auch die Buben ihre Mathematikkompetenz heute kritischer einschätzen als Mitte der 1990er Jahre.
Im folgenden Diskussionsteil wird die Rolle des Selbst-konzepts als Ursache und Folge von geschlechterverzerrten Studienraten genauer beleuchtet.
Diskussion
Die vorliegende Studie hat gezeigt, dass es bei 10-Jährigen in keinem der 50 untersuchten Länder einen praktisch be-deutsamen Geschlechterunterschied in der Mathematikleis-tung zugunsten der Buben gibt. Geschlechterunterschiede im Mathematikselbstkonzept sind jedoch im Großteil der TIMSS-Länder bedeutsam. Das heißt, obwohl Mäd-chen und Buben etwa gleich gute Mathematikleistungen erbringen, sind Mädchen weniger als Buben davon über-zeugt, gut in Mathematik zu sein. Dies gilt insbesondere auch für Österreich. Zwar ist in Österreich der Geschlechter-unterschied in der Mathematikleistung im Ländervergleich relativ hoch ausgeprägt, die Schwelle zur praktischen Be-deutsamkeit wird aber trotzdem nicht überschritten. Der Geschlechterunterschied im Mathematikselbstkonzept ist hingegen praktisch bedeutsam: Buben schätzen ihre Mathe-matikleistung deutlich besser ein als Mädchen. Ähnliche Ergebnisse lassen sich auch für die OECD-Länder fest-stellen, nicht aber für die arabischen. Vor allem Saudi-Ara-bien fällt aus dem Rahmen: Hier schätzen Mädchen ihre Mathe matikleistungen bedeutsam besser ein als Buben. In einer Reihe weiterer arabischer Länder (z. B. Kuwait, Jemen, Oman und Katar) weisen Mädchen ein tendenziell höhe-res Mathematikselbstkonzept auf als Buben. Auch bei der Mathematikleistung zeigt sich in den arabischen Ländern eher eine Überlegenheit der Mädchen.
Hohe Frauenbeteiligung in arabischen Ländern
Woran könnte es liegen, dass gerade in den arabischen Ländern Mädchen ein positiveres Selbstkonzept aufweisen als Buben? Eine Erklärung geht davon aus, dass in diesen Kulturen Vergleiche mit anderen eher gruppenintern durch-geführt werden (z. B. Costa, Terracciano & McCrae, 2001). Dies hieße, dass sich Mädchen in arabischen Ländern eher nur mit Mädchen vergleichen und Buben mit Buben – ge-schlechterübergreifende Vergleiche finden kaum statt. Dies ist plausibel, da auch die Schulen in diesen Ländern stark geschlechtersegregiert sind (vgl. Wiseman, 2008). Den-noch warnen Else-Quest et al. (2010) davor, den einfachen Schluss zu ziehen, Geschlechtersegregation würde zu mehr Geschlechtergerechtigkeit führen. Wisemann (2008) zeigt, dass in Ländern mit einem hohen Anteil monoedukativer Schulen Leistungsunterschiede in Mathematik sehr hete-r ogen ausfallen. Auch die OECD (2009) bestätigt, dass monoedukativ unterrichtete Mädchen in der Regel keinen
Leistungsvorteil gegenüber koedukativ unterrichteten Mäd-chen haben – insbesondere dann, wenn nach sozialem Status kontrolliert wird. Zuletzt zeigte eine groß angelegte Meta-analyse über 184 Studien aus 21 Nationen (Pahlke, Hyde & Allison, 2014), dass monoedukativer Unterricht keinen Vorteil gegenüber koedukativem hat, weder für Buben noch für Mädchen. Dies gilt für eine breite Reihe an Ergebnis-größen, insbesondere auch für die Mathematikleistung, das Selbstkonzept und Bildungsaspirationen.
Bemerkenswert an den arabischen Ländern ist nicht nur das relativ positive Mathematikselbstkonzept der Mädchen, sondern auch die hohen Frauenanteile in mathematik-intensiven Studienrichtungen (vgl. Tab. 1.3.1). Laut Lenzer (2006) haben Frauen in der arabischen Welt das Bedürfnis, sich in einer männerdominierten Gesellschaft zu beweisen, indem sie herausfordernde Studienrichtungen wählen. Weiters berichtet Lenzer davon, dass in arabischen Ländern jene Berufe als passend für Frauen angesehen werden, die wenig Kontakt mit Männern erfordern, ein Anspruch, den die Arbeit von Mathematikern und Computerwissenschaft-lern in der Regel erfüllt. Charles (2011) geht auch davon aus, dass Frauen in weniger entwickelten Ländern ihre Studienwahl eher nach praktisch-ökonomischen Gesichts-punkten treffen, während in westlichen Gesellschaften der Wunsch nach Selbstverwirklichung im Vordergrund steht.
Im Gegensatz zu den arabischen Ländern sind Frauen in OECD-Staaten in mathematikintensiven Studienrichtun-gen in der Regel unterrepräsentiert. Auch Österreich macht hier keine Ausnahme: Frauen stellen nur 34 % aller Ab-solventinnen und Absolventen in mathematikintensiven Studienrichtungen. Nur in fünf Vergleichsländern ist diese Rate noch niedriger (den Niederlanden, Chile, Japan, dem flämischen Teil Belgiens und in Malta). Eine größere Anzahl von Frauen in MINT (Mathematik, Informatik, Naturwissenschaften, Technik) wäre einerseits mit einem persönlichen Nutzen für diese Frauen verknüpft, da mathe-matikintensive Berufe mit einem höheren Ansehen und einer höheren Entlohnung verbunden sind (Watt, 2008). Mehr Frauen in MINT würden damit eine allgemeine Hebung der beruflichen Stellung von Frauen bedeuten. Andererseits wären mehr Frauen in MINT auch mit einem hohen volkswirtschaftlichen Nutzen verbunden. So weist etwa die Industriellenvereinigung (2013) auf einen starken Mangel an technisch-naturwissenschaftlich qualifizierten Arbeitskräften hin und betont, dass es die gemeinsame Ziel-setzung von Politik, Industrie und Gesellschaft sein muss, „künftig mehr junge Menschen – und hier im Speziellen junge Frauen und Mädchen – für MINT zu interessieren und für entsprechende Bildungswege, Studienrichtungen und berufliche Tätigkeiten zu motivieren“ (S. 4). Auch die OECD (2009, S. 12) sieht Mädchen als „the most obvious resource for increasing science and technology enrolments“.
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 49
Wie können mehr Frauen für MINT gewonnen werden?
Um mehr Mädchen für mathematikintensive Berufe zu gewinnen, ist es wichtig jene Faktoren zu kennen, die Mädchen zu solchen Karrieren führen bzw. sie davon abhalten. Wie im Modell von Eccles (1994) in der Ein-leitung erwähnt, spielt das Mathematikselbstkonzept eine wesentliche Rolle für die Berufswahl: Personen mit hohem Mathematikselbstkonzept entscheiden sich eher für mathe-matikintensive Karrieren (vgl. Guay et al., 2004; Parker et al., 2012). Das Mathematikselbstkonzept wird wiederum gespeist durch gesellschaftliche Werte und Normen. Der vorliegende Beitrag konnte erstmals zeigen, dass sich die Beteiligung von Frauen an mathematikintensiven Studien- disziplinen bereits in den Selbstkonzepten 10-Jähriger wider spiegelt: In Ländern mit geringerer Frauenbeteiligung an mathematikintensiven Studienrichtungen hinkt auch das Mathematikselbstkonzept 10-jähriger Mädchen stärker hinter jenem gleichaltriger Buben nach als in Ländern mit starker Frauenbeteiligung. Geschlechtsstereotype werden demnach schon so früh internalisiert, dass sie sich be-reits am Ende der Grundschulzeit in einem verminderten Mathematikselbstkonzept der Mädchen niederschlagen.
Wenn man die Wichtigkeit des Selbstkonzepts für die spätere Berufswahl miteinbezieht, so scheint es in Gesell-schaften mit geringer MINT-Beteiligung von Frauen bereits für 10-jährige Mädchen grundgelegt zu sein, eher keine mathematikbezogenen Berufe zu ergreifen. Somit kann von einem negativen Kreislauf ausgegangen werden: Da nur wenige Frauen mathematikintensiven Berufen nachgehen, haben Mädchen kaum Rollenvorbilder, was sich negativ im eigenen Mathematikselbstkonzept niederschlägt. Das nega-tive Selbstkonzept wiederum lässt Mädchen seltener mathe-matikintensive Studien- und Berufsrichtungen wählen. Auf diese Weise reproduzieren sich Geschlechterverhältnisse in einer Gesellschaft. Wie könnte dieser Reproduktions-mechanismus entschärft werden?
Zunächst kann festgestellt werden, dass Mädchen allein schon aufgrund ihres breiteren Potenzials – sie sind häufiger als Burschen sowohl in Mathematik als auch in Lesen gut (Wang, Eccles & Kenny, 2013) – mehr Wahlmöglichkeit für unterschiedliche Berufe haben. Burschen verfügen da gegen häufiger zwar über gute mathematische, aber nur moderate sprachliche Fähigkeiten, womit sie eher auf die Wahl mathematikintensiver Berufe eingeschränkt sind. Warum aber entscheiden sich Mädchen oft gegen MINT, obwohl sie sich aufgrund ihrer Fähigkeiten auch dafür entscheiden könnten? Hierzu gibt es Indizien, dass bei einer größeren und früheren Spezialisierungsmöglichkeit auf Ebene des Bildungssystems Mädchen eher geschlechtsstereotype Be- rufs- und Bildungsentscheidungen treffen (Charles, 2011; Yazilitas, Svensson, de Vries & Saharso, 2013). So ver-weisen Yazilitas et al. (2013) auf eine englische Studie, in der festgestellt wurde, dass sich der Anteil an weiblichen
Studierenden in MINT-Fächern erhöht hat, nachdem bei den Abschlussprüfungen (A-Levels) mehr MINT-Fächer Pflicht wurden. Ähnlich wurde gezeigt, dass in gesamt-schulartigen Bildungssystemen die Mathematikleistungen von Mädchen (15-/16-Jährigen) weniger hinter jener der Burschen zurückliegen als in differenzierten Bildungssys-temen, in denen eine Auswahl zwischen unterschiedlichen Bildungsgängen getroffen werden muss (van Langen, Bos-ker & Dekkers, 2006). Bradley und Charles (2004) fanden darüber hinaus, dass es in Ländern mit sehr differenzierten und berufsorientierten Sekundarschulsystemen eine stärke-re Geschlechter segregation im tertiären Bereich gibt als in Ländern mit Gesamtschulsystemen (siehe auch Lassnigg, 2012). Bradley und Charles (2004) erklären dies damit, dass a) stark differenzierte Systeme mehr Möglichkeit für die Wahl geschlechtsstereotyper Bildungswege bieten und b) dass diese Entscheidung in der Adoleszenz getroffen werden muss, also in einer Entwicklungsphase, in der der Druck, Geschlechterstereotypen zu entsprechen, besonders groß ist.
Insbesondere in Österreich liegt durch die starke Zerglie-derung des Schulsystems schon relativ früh eine große Wahlmöglichkeit vor und Schüler/innen können sich bereits mit 14 bis 15 Jahren für Bildungsgänge mit sehr unterschiedlich hohem MINT-Anteil entscheiden. Diese Wahl erfolgt stark geschlechtsstereotyp: Burschen sind in Schulformen mit hohem MINT-Anteil drastisch in der Überzahl (vgl. Vogtenhuber et al., 2012). Auch Lassnigg und Laimer (2012) bemängeln die enge zeitliche Verknüpfung zwischen der adoleszenten Geschlechtsidentitätsentwick-lung und der ersten beruflichen Weichenstellung auf der 9. Schulstufe, deren vorbereitende Prozesse in das sensible Alter zwischen 13 und 15 Jahren fallen. Möglicherweise könnten mehr Mädchen an MINT-Studien herangeführt werden, wenn der Zeitpunkt einer berufsbildenden Spezia-lisierung verschoben wird bzw. wenn auch in typischer weise von Mädchen gewählten Schulformen MINT-Fächern ein höher Stellenwert eingeräumt wird und diese auch zu Pflichtgegenständen bei der Matura gemacht werden.
Eine weitere Möglichkeit mehr Mädchen an MINT her-anzuführen wäre, Frauen, die sich für MINT entscheiden, stärker (für Mädchen) sichtbar zu machen und ihnen hohe Wertschätzung entgegenzubringen. Denn Rollenvorbil-der spielen eine wichtige Rolle für die Berufswahl (Eccles, 1994). Nehmen Mädchen es als normal und erwünscht wahr, dass Frauen mathematikintensive Berufe ergreifen, werden sie dies selbst auch eher tun. Auch Else-Quest et al. (2010) betonen, dass Mädchen sehen müssen, dass sich Frauen mit MINT beschäftigen, um MINT als eine Op-tion für sich selbst wahrzunehmen. Wenn also Mädchen in einem gesellschaftlichen Kontext aufwachsen, in dem es geschätzt wird, dass Frauen MINT-Karrieren verfolgen, erhalten sie die Botschaft, dass ein mathematisch-naturwis-senschaftlicher Beruf eine gute Option für sie selbst sein könnte.
50 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
Ceci et al. (2009) stellen darüber hinaus fest, dass es für Frauen schwieriger ist als für Männer, höhere Positionen in mathematikintensiven Berufen zu erreichen. Auch Valenduc et al. (2004) weisen auf diese mangelnde Geschlechter - gerechtigkeit hin: „The same level of education as men and comparable qualifications are not enough to guarantee a woman’s career in informatics“ (S. 31). Wenn durch ge-schlechtergerechtere Beförderungsstrategien oder auch durch verpflichtend vorgegebene Frauenquoten mehr Frauen in höheren MINT-Positionen zu finden wären, wäre dies ein Signal für Mädchen, dass es sich sehr wohl lohnt, MINT-Berufe zu ergreifen. Und es könnte auch dazu be itragen, die wenigen Frauen, die sich für mathematik-intensive Karrieren entscheiden, stärker dort zu halten; denn wie die aktuelle Forschung zeigt, neigen Frauen eher dazu als Männer, nach einem absolvierten MINT-Studium keine naturwissenschaftliche Karriere einzuschlagen (OECD, 2012) oder bereits eingeschlagene mathematikintensive Karrieren wieder zu verlassen (Ceci et al., 2009). Auch für Österreich ist bekannt, dass weibliche Fachkräfte in Handwerk und Technik wesentlich kürzer in ihrem Beruf verbleiben als ihre männlichen Kollegen (Europäischer Sozialfonds, 2013).
Kessels (2012) betont, dass es nicht nur wichtig ist, Mäd-chen stärker an MINT-Fächer heranzuführen, sondern auch MINT an die Mädchen, indem etwa im naturwissen-schaftlichen Unterricht stärker auf die Interessen von Mäd-chen eingegangen wird. So zeigen Häußler und Hoffmann (1995), dass Mädchen sehr intensiv auf den Wechsel des Kontexts reagieren und es für sie beispielsweise wesentlich interessanter ist, etwas über eine Pumpe zu erfahren, die als künstliches Herz Blut pumpt, als über eine Pumpe, die Erdöl aus großer Tiefe heraufpumpt. Ähnlich zeigen Kerger, Martin und Brunner (2011), dass das mathematisch-natur-wissenschaftliche Interesse von Mädchen wesentlich erhöht werden kann, wenn die Unterrichtsinhalte im Kontext weiblicher Themen präsentiert werden. Darüber hinaus scheint sich ein stark strukturierter naturwissenschaftlicher Unterricht insbesondere positiv auf die Leistungen von Mädchen auszuwirken (Blumberg, Hardy & Möller, 2008).Auch sollte das Image von MINT-Berufen stärker an die
Interessen von Mädchen herangeführt werden, etwa in-dem gezeigt wird, dass auch in diesen Berufen gemeinsam mit Menschen gearbeitet werden kann, diese Berufe einen Nutzen für die Gesellschaft mit sich bringen und sich mit den Bedürfnissen einer eigenen Familie vereinbaren lassen. Auf diese Weise könnten junge Frauen, die sowohl in Mathematik als auch in sprachlichen Domänen hohe Leis-tungen erzielen, vermehrt dazu gewonnen werden, MINT-Karrieren zu ergreifen (vgl. Wang et al., 2013).
Resümee
Die Ergebnisse des vorliegenden Beitrags verweisen auf die Wichtigkeit, die Begeisterung von Mädchen für Mathe-matik bereits im Grundschulalter und davor anzuregen. Denn schon bei 10-Jährigen lassen sich in Österreich – wie in vielen anderen Ländern auch – bedeutsame Geschlech-terdifferenzen im Mathematikselbstkonzept feststellen. Dennoch sollte auch zu späteren Zeitpunkten ständig dar-an weitergearbeitet werden, Mädchen die Nützlichkeit von MINT zu verdeutlichen und ihnen vor Augen zu halten, wie Selbstverwirklichung auch in mathematikintensiven Be-rufen möglich ist. Ein wichtiger Schritt zu mehr Frauen in mathematikintensiven Studiengängen wäre, dass Mädchen bis einschließlich zur Matura mit MINT-Fächern konfron-tiert werden und sie sich nicht frühzeitig für Schulformen mit geringem MINT-Anteil entscheiden können. Denn je früher Bildungsentscheidungen getroffen werden müssen, desto stärker fallen sie in eine sensible Entwicklungsphase der (Geschlechts-)Identität (Erikson, 1968) und desto eher erfolgen sie geschlechtsstereotyp (Bradley & Charles 2004; Lassnigg & Laimer, 2012; Yazilitas et al., 2013). Mädchen haben in der Regel breitere Potenziale als Burschen (Wang et al., 2013). Durch die frühzeitige Abwahlmöglichkeit von MINT bleibt ein Teil dieser Potenziale unentdeckt und un-genutzt.
Der vorliegende Beitrag zeigt ganz klar: Die Überzeugung von Mädchen, nicht gut in Mathematik zu sein, ist stark gesellschaftlich geprägt und sie ist den Mädchen keinesfalls angeboren.
Literatur
Bacher, J., Beham, M. & Lachmayr, N. (Hrsg.) (2008). Geschlechterunterschiede in der Bildungswahl. Wiesbaden: Verlag für Sozialwissenschaften.
Blumberg, E., Hardy, I. & Möller, K. (2008). Anspruchsvolles naturwissenschaftsbezogenes Lernen im Sachunterricht der Grundschule – auch für Mädchen? Zeitschrift für Grundschulforschung, 1, 59–72.
Bradley, K. & Charles, M. (2004). Uneven inroads: Understanding women’s status in higher education. Research in the Socio-logy of Education, 14, 247–274
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 51
Buff, A., Reusser, K., Dinkelmann, I. & Steiner, E. (2011). Unser Kind ist gut in Mathematik! – Zur Bedeutung elterlicher kind-bezogener Kompetenzüberzeugungen hinsichtlich Selbstkonzept und Schulerfolg von Schülerinnen und Schülern. In F. Hell-mich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 209–227). Stuttgart: Kohlhammer.
Ceci, S. J., Williams, W. M. & Barnett, S. M. (2009). Women’s underrepresentation in science: Sociocultural and biological considerations. Psychological Bulletin, 135, 218–261.
Charles, M. (2011). A world of difference: International trends in women’s economic status. Annual Review of Sociology, 37, 355–371.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.
Costa, P. T., Jr., Terracciano, A. & McCrae, R. R. (2001). Gender differences in personality traits across cultures: Robust and surprising findings. Journal of Personality and Social Psychology, 81, 322–331.
Eccles, J. S. (1994). Understanding women’s educational and occupational choices. Psychology of Women Quarterly, 18, 585–609.
Eder, F. (2012). Die beruflichen Interessen der 15- und 16-Jährigen. In F. Eder (Hrsg.), PISA 2009. Nationale Zusatzanalysen für Österreich (S. 257–284). Münster: Waxmann.
Ellis, P. D. (2010). The essential guide to effect sizes. Cambridge: Cambridge University Press.
Else-Quest, N. M., Hyde, J. S. & Linn, M. C. (2010). Cross-national patterns of gender differences in mathematics: A meta-analysis. Psychological Bulletin, 136, 103–127.
Erikson, E. H. (1968). Identity, Youth and Crisis. New York: Norton.
Europäischer Sozialfonds (2013). InSight – Magazin des europäischen Sozialfonds, September 2013. Zugriff am 23.06.2014 unter http://www.equi.at/dateien/ESF_InSight_3_2013_web.pdf
European Commission (2013). She figures 2012. Gender in research and innovation. Retrieved September 18, 2013 from http://ec.europa.eu/research/science-society/document_library/pdf_06/she-figures-2012_en.pdf
Filzmoser, S. & Suchań, B. (2013). Mathematik: Unterschiede zwischen Mädchen und Burschen. In U. Schwantner, B. Toferer & C. Schreiner (Hrsg.), PISA 2012. Internationaler Vergleich von Schülerleistungen. Erste Ergebnisse Mathematik, Lesen, Naturwissenschaft (S. 24–25). Graz: Leykam.
Frome, P. M. & Eccles, J. S. (1998). Parents’ influence on children’s achievement-related perceptions. Journal of Personality and Social Psychology, 74, 435–452.
Gabriel, K., Mösko, E. & Lipowsky, F. (2011). Selbstkonzeptentwicklung von Jungen und Mädchen im Anfangsunterricht – Er-gebnisse aus der PERLE-Studie. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 133–158). Stuttgart: Kohlhammer.
Guay, F., Larose, S. & Boivin, M. (2004). Academic self-concept and educational attainment level: A ten-year longitudinal study. Self and Identity, 3, 53–68.
Hattie, J. (2009). Visible Learning – A synthesis of over 800 meta-analyses relating to achievement. New York: Routledge.
Häußler, P. & Hoffmann, L. (1995). Physikunterricht – an den Interessen von Mädchen und Jungen orientiert. Unterrichtswis-senschaft, 23, 107–126.
Hellmich, F. & Günther, F. (2011). Entwicklung von Selbstkonzepten bei Kindern im Grundschulalter – ein Überblick. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen ( 19–46). Stuttgart: Kohlhammer.
52 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
Helmke, A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Ergebnisse aus dem SCHOLASTIK-Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 203–216). Weinheim: Beltz.
Hyde, J. S., Lindberg, S. M., Linn, M. C., Ellis, A. & Williams, C. (2008). Gender similarities characterize math performance. Science, 321, 494–495.
Industriellenvereinigung (2013). MINT 2020 – Der Unterricht von morgen. Wien: Autor.
Kerger, S., Martin, R. & Brunner, M. (2011). How can we enhance girls’ interest in scientific topics? British Journal of Educa-tional Psychology, 81, 606–628.
Kessels, U. (2012). Selbstkonzept: Geschlechterunterschiede und Interventionsmöglichkeiten. In H. Stöger, A. Ziegler & M. Heilemann (Hrsg.), Mädchen und Frauen in MINT (S. 163–191). Berlin: LIT.
Köller, O., Daniels, Z., Schnabel, K. U. & Baumert, J. (2000). Kurswahlen von Mädchen und Jungen im Fach Mathematik: Zur Rolle von fachspezifischem Selbstkonzept und Interesse. Zeitschrift für Pädagogische Psychologie, 14, 26–37.
Lassnigg, L. (2012). Die berufliche Erstausbildung zwischen Wettbewerbsfähigkeit, sozialen Ansprüchen und Lifelong Lear-ning – eine Policy-Analyse. In B. Herzog-Punzenberger (Hrsg.), Nationaler Bildungsbericht Österreich 2012. Band 2. Fokus-sierte Analysen bildungspolitischer Schwerpunktthemen (S. 313–354). Graz: Leykam.
Lassnigg, L. & Laimer, A. (2012). Berufsbildung in Österreich: Hintergrundbericht zum Nationalen Bildungsbericht Österreich 2012. Zugriff am 23.06.2014 unter http://www.equi.at/dateien/nbb-hintergrund.pdf
Lenzer, A. (2006). Women in mathematics. Münster: Waxmann.
Li, Q. (1999). Teachers’ beliefs and gender differences in mathematics: A review. Educational Research, 41, 63–76.
Lindberg, S. M., Hyde, J. S., Petersen, J. L. & Linn, M. C. (2010). New trends in gender and mathematics performance: A metaanalysis. Psychological Bulletin, 136, 1123–1135.
Marsh, H. W. (1986). Verbal and math self-concepts: An internal/external frame of reference model. American Educational Research Journal, 23, 129–149.
Marsh, H. W. (2005). The big-fish–little-pond effect on academic self-concept. Zeitschrift für Pädagogische Psychologie, 19, 119–127.
Marsh, H. W. & Yeung, A. S. (1998). Longitudinal structural models of academic self-concept and achievement: Gender diffe-rences in the development of math and English constructs. American Educational Research Journal, 35, 705–738.
Martin, M. O., Mullis, I. V. S., Foy, P. & Arora, A. (2012). Creating and Interpreting the TIMSS and PIRLS 2011 Context Ques-tionnaire Scales. In Martin, M. O. & Mullis, I. V. S. (Eds.), Methods and procedures in TIMSS and PIRLS 2011. Retrieved Sep-tember 18, 2013 from http://timssandpirls.bc.edu/methods/t-context-q-scales.html
Möller, J., Kuska, K. & Zaunbauer, A. M. C. (2011). Internale und externale Bezugsrahmen in der Grundschule. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter – Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 159–172). Stuttgart: Kohlhammer.
Möller, J. & Marsh, H. W. (2013). Dimensional comparison theory. Psychological Review, 120, 544–560.
Möller, J., Pohlmann, B., Köller, O. & Marsh, H. W. (2009). A meta-analytic path analysis of the internal/external frame of refe-rence model of academic achievement and academic self-concept. Review of Educational Research, 79, 1129–1167.
Nagy, G., Garrett, J., Trautwein, U., Cortina, K., Baumert, J. & Eccles, J. (2008). Gendered high school course selection as a precursor of gendered careers: The mediating role of self-concept and intrinsic value. In H. Watt & J. Eccles (Eds.), Gender and occupational outcomes: Longitudinal assessments of individual, social, and cultural influences (pp. 115–143). Washing-ton, DC: American Psychological Association.
Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich 53
Nosek, B. A., Smyth, F., Sriram, N., Lindner, N., Devos, T., Ayala, A. … Greenwald, A. G. (2009). National differences in gender-science stereotypes predict national sex differences in science and math achievement. Proceedings of the National Academy of Sciences of the United States of America, 106, 10593–10597. Retrieved September 18, 2013 from http://www.pnas.org/content/106/26/10593.full
OECD (2009). Equally prepared for life? How 15-year-old boys and girls perform in school. Paris, France: Author.
OECD (2011). Education at a Glance. Paris, France: Author.
OECD (2012). Closing the gender gap: Act now. Paris, France: Author.
OECD (2013). PISA 2012 Results: What students know and can do. Student Performance in Mathematics, Reading and Science (Vol. I). Paris, France: Author.
Pahlke, E., Hyde, J. S. & Allison, C. M. (2014). The effects of single-sex compared with coeducational schooling on students’ performance and attitudes: A meta-analysis. Psychological Bulletin, 140, 1042–1072.
Parker, P. D., Schoon, I., Tsai, Y.-M., Nagy, G., Trautwein, U. & Eccles, J. S. (2012). Achievement, agency, gender, and socioeco-nomic background as predictors of postschool choices: A multicontext study. Developmental Psychology, 48, 1629–1642.
Retelsdorf, J., Schwartz, K. & Asbrock, F. (2015). „Michael can’t read!“ Teachers’ gender stereotypes and boys’ reading self-concept. Journal of Educational Psychology, 107, 186–194.
Sáinz, M. & Eccles, J. (2012). Self-concept of computer and math ability: Gender implications across time and within ICT studies. Journal of Vocational Behavior, 80, 486–499.
Schreiner, C., Breit, S. & Haider, G. (2008). Zur Validität der Mathematiknoten. In F. Hofmann, C. Schreiner & J. Thonhauser (Hrsg.), Qualitative und quantitative Aspekte. Zu ihrer Komplementarität in der erziehungswissenschaftlichen Forschung (S. 211–223). Münster: Waxmann.
Spiel, C., Schober, B. & Litzenberger, M. (2008). Evaluation der Eignungstests für das Medizinstudium in Österreich. Zugriff am 23.06.2014 unter http://homepage.univie.ac.at/margarete.halmetschlager/download/Zusammenfassung_Medtest_2008.pdf
Steinmayr, R. & Spinath, B. (2009). What explains boys’ stronger confidence in their intelligence? Sex roles, 61, 736–749.
Tiedemann, J. (2000a). Gender-related beliefs of teachers in elementary school mathematics. Educational Studies in Mathe-matics, 41, 191–207.
Tiedemann, J. (2000b). Parents̓ gender stereotypes and teachers̓ beliefs as predictors of children‘s concept of their mathe-matical ability in elementary school. Journal of Educational Psychology, 92, 144–151.
Tiedemann, J. (2002). Teachers’ gender stereotypes as determinants of teacher perceptions in elementary school mathe-matics. Educational Studies in Mathematics, 50, 49–62.
UNESCO (n. d.). Table 16: Graduates by broad field of education in tertiary education. Retrieved September 18, 2013 from http://stats.uis.unesco.org/unesco/TableViewer/tableView.aspx?ReportId=169
Valenduc, G., Vendramin, P., Guffens, C, Ponzellini, A. M., Lebano, A., D’Ouville, L., Isabelle Collet, I. … Webster, J. (2004). Widening women’s work in information and communication technology. Retrieved September 18, 2013 from http://www. ftu-namur.org/fichiers/D12-print.pdf
van Langen, A., Bosker, R. & Dekkers, H. (2006). Exploring cross-national differences in gender gaps in education. Educatio-nal Research and Evaluation, 12, 155–177.
Vogtenhuber, S., Lassnigg, L., Bruneforth, M., Gumpoldsberger, H., Toferer, B., Schmich, J. … Bergmüller, S. (2012). Indika-toren C: Prozess. In: M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich 2012. Band 1. Das Schulsys-tem im Spiegel von Daten und Indikatoren (S. 61–107). Graz: Leykam.
54 Mathematik ≠ weiblich? Leistung, Selbstkonzept und Studienabschlüsse im Geschlechtervergleich
Voyer, D. & Voyer, S. (2014). Gender differences in scholastic achievement: A meta-analysis. Psychological Bulletin, 140, 1174–1204.
Wang, M., Eccles, J. S. & Kenny, S. (2013). Not lack of ability but more choice: Individual and gender difference in choice of careers in sciences, technology, engineering, and Mathematics. Psychological Sciences, 24, 770–775.
Wallner-Paschon, C. (2010). Kompetenzunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner-Paschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik & Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 115–129). Graz: Leykam.
Wallner-Paschon, C. (2012a). Mathematik: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwis-senschaft in der Grundschule. Erste Ergebnisse (S. 30–31). Graz: Leykam.
Wallner-Paschon, C. (2012b). Lesen: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. Wallner- Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwis-senschaft in der Grundschule. Erste Ergebnisse (S. 18–19). Graz: Leykam.
Watt, H. M. G. (2008). What motivates females and males to pursue sex-stereotyped careers? In H. Watt & J. Eccles (Eds.), Gender and occupational outcomes: Longitudinal assessments of individual, social, and cultural influences (pp. 87–113). Washington, DC: American Psychological Association.
Wiseman, A. W. (2008). A culture of (in)equality?: A cross-national study of gender parity and gender segregation in national school systems. Research in Comparative & International Education, 3, 179–201.
Yazilitas, D., Svensson, J., de Vries, G. & Saharso, S. (2013). Gendered study choice: A literature review. A review of theory and research into the unequal representation of male and female students in mathematics, science, and technology. Educa-tional Research and Evaluation, 1–17.
Ziegler, A., Kuhn, C. & Heller, K. A. (1998). Implicit theories of mathematics and physics teachers of the German gymnasium on gender specific giftedness and motivation. Psychologische Beiträge, 40, 271–287.
Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 55
1.4 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item
Responses im Large-Scale-Assessment Alexander Robitzsch
Fehlende Item Responses in Large-Scale- Assessments
In Large-Scale-Assessments wie PIRLS, TIMSS, PISA oder den österreichischen Bildungsstandard-Erhebungen werden Kompetenzen von Schülerinnen und Schülern mithilfe von Testitems erfasst. Häufig geben Schülerinnen und Schüler allerdings keine Antwort bei bestimmten Items (fehlender Item Response; fehlende Itemantwort), sodass unklar ist, in-wiefern sich eine Nichtbeantwortung eines Items auf die Bestimmung der Kompetenzwerte niederschlagen soll.
Während die Behandlung fehlender Daten im Rahmen statistischer Analysen in den Sozialwissenschaften mittler-weile verbreitet zu sein scheint (Graham, 2009; Lüdtke & Robitzsch, 2010), ist in jüngerer Literatur (Pohl et al., 2014; Rose et al., 2010) Kritik an konventionellen Verfahren der Behandlung fehlender Item Responses in Item-Response-Modellen (IRT-Modelle) der Kompetenzmessung in Large-Scale-Assessments zu finden. Typischerweise wird dabei die Missing-Behandlung zwischen dem Prozess der Kalibrie-rung (Ermittlung von Itemparametern) und der Skalierung (Ermittlung von Kompetenzwerten) unterschieden.
In PIRLS/TIMSS und PISA werden bei der Kalibrierung ausschließlich fehlende Item Responses am Ende eines Test-hefts (sog. Not Reached Items) weggelassen (d. h. igno riert), um Schätzungen der Itemschwierigkeiten nicht zu „ver-zerren“. Für die Skalierung werden fehlende Item Responses typischerweise als falsch bewertet.
Die o. g. Literatur argumentiert jedoch, dass alle fehlenden Item Responses niemals (d. h. sowohl in Kalibrierung als Skalierung) als falsch zu kodieren seien (Rose, 2013; Pohl et al., 2014) und schlägt alternative Item-Response-Modelle
zur Behandlung der fehlenden Itemantworten vor. Der folgende Beitrag geht dabei zunächst auf die in der Literatur angebrachten Kritikpunkte (Rose, 2013; Pohl et al. 2014) zur Behandlung fehlender Item Responses als Falschantwort und die vorgeschlagenen modell basierten Alternativen ein. Ich argumentiere in diesem Beitrag im Gegensatz zur o. g. Literatur, dass nur aus Gründen der Validität und nicht aus (schein baren) testtheoretischen Gründen eine bestimmte Methode für den Umgang mit fehlenden Item Responses präferiert werden sollte. Da im Allgemeinen Annahmen über den Datenausfall bei Item Responses empirisch nicht testbar sind, werden zwei alternative Item-Response-Modelle vorge-schlagen, in denen verschiedene Annahmen an den Ausfall-prozess parametrisiert werden. Abschließend diskutiere ich mög liche psychometrische Konsequenzen im Large-Scale- Assessment zur Erfassung von Kompetenzen bei unterschied-lichen Behandlungsweisen fehlender Itemantworten.
Eine Auseinandersetzung mit Kritikpunkten des „traditionellen“ Vorgehens bei fehlenden Item Responses
Für die Ermittlung von Kompetenzwerten werden im Large- Scale-Assessment bei einer Skalierung typischerweise fehlende Item Responses als falsch bewertet. Konträr dazu wird in einer Reihe aktueller Publikationen (Rose, 2013; Pohl & Carstensen, 2012, 2013; Pohl et al., 2014) behauptet, dass fehlende Item Responses niemals als falsch zu bewerten seien, und es wird empfohlen, diese traditionelle „Ad-Hoc-Methode“ nicht im Large-Scale-Assessment einzusetzen. Im Folgenden gehe ich dabei auf die Begründungen der Autorinnen und Autoren ein und gelange zur Feststellung, dass diese auf Annahmen und Schlussfolgerungen beruhen,
In neuerer Literatur werden alternative Modellierungen fehlender Item Responses im Large-Scale-Assessment vorgeschlagen. Prinzipiell argumentieren diese Ansätze auf Basis von Simulationen und testtheoretischen Überlegungen, dass fehlende Item Responses niemals als falsch zu bepunkten, sondern eher als ignorierbar zu behandeln seien (z. B. Pohl, Gräfe & Rose, 2014). Der vorliegende Beitrag zeigt auf, dass diese Argumentationen eingeschränkte Gültigkeit besitzen und illus-triert anhand eines Ländervergleichs in PIRLS 2011, dass eine andere Bewertung der fehlenden Item Responses als die einer Falschantwort zu deutlichen Änderungen in Länderreihenfolgen führt und daher nichtignorierbare Konsequenzen hinsichtlich der Validität der Ergebnisse besitzt. Zusätzlich werden zwei alternative Item-Response-Modelle vorgeschlagen, mit denen verschiedene Annahmen für das Zustandekommen fehlender Werte bei den Item Responses beschrieben werden können.
56 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment
die in der Anwendung von Item-Response- Modellen unty-pisch sind und daher die in der o. g. Literatur befindlichen Empfehlungen als fragwürdig zu erachten sind.
Nützlich für die folgenden Überlegungen erweist sich dabei die von Denoeux (2011) vorgeschlagene Unterschei-dung bei der Quantifikation der Unsicherheit in Daten (den Item Responses) und damit korrespondierenden Modellierungen, die in der Abgrenzung der Konzepte der „Probability“ (Wahrscheinlichkeit) und „Possibility“ (Möglichkeit) bedeutsam sind. Durch Stichproben ziehung oder Modellierung existierender Daten (Datensatz mit allen Item Responses) entstehende Unsicherheit wird dabei als aleatorische Unsicherheit bezeichnet. Unsicherheit (bzw. Unschärfe in der Terminologie von Fuzzy-Daten) für jedes einzelne Datum (jede einzelne Itemantwort) wird als epistemische Unsicherheit bezeichnet. Denoeux (2011) argumentiert, dass man aleatorische Unsicherheit mittels Wahrscheinlichkeiten modellieren solle, was im Falle des vorliegenden Kompetenztests bedeutet, ein IRT-Modell für fest vorgegebene Item Responses anzupassen. Die Beobach-tung der einzelnen Daten (der einzelnen Item Responses jeder Schülerin oder jedes Schülers) erfolgt dabei mit dem Konzept epistemischer Unsicherheit, das in Anwendungen dann häufig in unscharfen Beobachtungen (sog. Fuzzy- Daten) mündet (Denoeux, 2011, 2013). Bei fehlenden Item Responses ist demzufolge unklar, welche Bepunktung das Fehlen eines Item Response nach sich ziehen soll. Es ist aber in dieser Konzeption offensichtlich, dass Annahmen an die einzelnen Daten (den einzelnen Item Responses) strikt von Annahmen in einem Wahrscheinlichkeitsmodell (ein gemeinsames Modell für alle Item Responses) zu un-terscheiden sind. Zur Illustration dieser begrifflichen Un-terscheidung wird angenommen, dass man die Verteilung der Laufzeiten in einem 50-Meter-Lauf für eine definierte Population österreichischer Schüler/innen der 4. Schulstufe erfassen möge. Dazu wird eine Stichprobe von Schülerin-nen und Schülern ge zogen. Die mit dieser Stichprobenzie-hung verbundene Unsicherheit auf die Population wird mit Wahrscheinlich keiten im Kontext der aleatorischen Unsi-cherheit ausgedrückt. Jede Messung der Laufzeit einer Schü-lerin/eines Schülers ist aber niemals exakt, sondern immer nur unscharf (z. B. liegt die gemessene Laufzeit aufgrund der Messunsicherheit im Intervall zwischen 8.75 und 8.85 Sekunden, das ein Fuzzy-Datum darstellt). Diese Unsicher-heit entspricht dem Konzept epistemischer Unsicherheit.
Die Kritik der Falschbewertung fehlender Item Responses fußt dabei auf simulationsbasierten und testtheoretischen Begründungen (Rose, 2013), auf die ich in weiterer Folge jeweils näher eingehe.
Die meisten Simulationsstudien versuchen zu vermitteln, dass eine Falschbewertung von fehlenden Item Responses zu „verzerrten“ Itemparametern und Personenparametern führt. Dabei wird ein fehlender Item Response meist durch eine Abhängigkeit von einer weiteren latenten Variable oder
Personenkovariaten (nicht aber in Abhängigkeit des Items selbst) simuliert. Dann ist die berichtete Verzerrung bei einer Bewertung als falsch in Parametern folgerichtig, denn das der Simulation zugrunde liegende datengenerierende Modell stimmt nicht mit dem Analysemodell (Missings sind falsche Itemantworten) überein. Nimmt man jedoch um gekehrt an, dass ein IRT-Modell für die Item Responses passt und es werden bei allen Items fehlende Werte gene-riert, für die das Item falsch gelöst wurde, dann führt natür-lich jede zur Falschbewertung alternative Missingbehand-lung zu verzerrten Parametern (siehe Rohwer, 2013). Ob eine simulationsbasierte Argumentation gegen eine Falsch-bewertung von fehlenden Item Responses zutreffend ist, hängt dem zufolge von der Plausibilität des datengenerieren-den Modells für den Ausfallprozess ab. Ich argumentiere, dass Ansätze, die den Ausfall auf einem Item unabhängig von der unbekannten Itemantwort selbst modellieren, unplau sibel sind. Somit helfen Simulationsstudien bei der Frage nach der Begründung einer „richtigen Bewertung“ fehlender Item Responses nicht weiter.
In der testtheoretischen Begründung ist der Kern der Kritik, dass eine Falschbewertung fehlende Items „deterministisch“ behandeln würde und demzufolge modellimplizierte Wahr-scheinlichkeiten des IRT-Modells ungültig seien (Rose, 2013; Pohl et al., 2014). Bezeichnet man mit Rni die Dummy-variable, dass für Person n das Item i beobachtet wird, so wird bei einer Falschbewertung der Item Response Yni auf null (d. h. falsch) gesetzt, also P(Yni = 1|Rni = 0) = 0 unabhängig von der Personenfähigkeit θn. Dadurch entstünde ein Widerspruch, denn über die Vorhersage im IRT-Modell (z. B. das Rasch-Modell) würde man eine Wahrscheinlichkeit P(Yni = 1|θn) > 0 annehmen, d. h. die Datenbehandlung sei deterministisch und das IRT-Modell sei probabilistisch (Rose, 2013), weshalb Modellannahmen im IRT-Modell verletzt seien. Formal ist der Widerspruch mit den beiden verschiedenen Konzepten der Unsicherheit nach Denoeux (2011) auflösbar, denn in der Argumentation von Rose (2013) und Pohl et al. (2014) erfolgt eine Konfundierung von epistemischer und aleatorischer Unsicherheit, so dass man damit gar nicht von einer Gleichsetzung der ver-schiedenen Wahrscheinlichkeiten ausgehen sollte. Bettet man die Überlegungen stärker in Begrifflichkeiten der Psychometrie ein, so fällt auf, dass die Argumentation der Ablehnung als Falschbewertung offenbar auf einer intra-individuellen Interpretation der Wahrscheinlichkeiten im IRT-Modell im Sinne der Stochastic-Subject-Perspektive (d. h. Wahrscheinlichkeiten des IRT-Modells können für jede Kombination einer Person n mit einem Item i inter-pretiert werden) beruht (siehe Holland, 1990; für eine auf der Stochastic Subject basierende Testtheorie siehe Steyer & Eid, 2001), die in Anwendungen des Large-Scale Assessments allenfalls historische und geringe praktische Bedeutung besitzt (Wainer, 2010). Stellt man eine Random- Sampling-Perspektive (Holland, 1990; Molenaar, 1995) an, so interpretiert man Wahrscheinlichkeiten als Ergebnis einer Stichprobenziehung von Personen und führt Item parameter
Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 57
sowie eine Verteilung für Personenfähigkeiten θ als Repräsen-tation einer hochdimensionalen Kontingenz tafel für multi-variate diskrete Beobachtungen Y ein. Dann ergibt sich for-mal als statistisches Modell eine Repräsen tation als Integral:
(1)
In dieser Schreibweise wird deutlich, dass in IRT-Modellen eine Verteilung für Personen spezifiziert wird und nicht ein-zelne Individuen repräsentiert werden (siehe auch Rohwer, 2013).
Wenn man jedoch die intraindividuelle Perspektive im Sinne der Stochastic-Subject-Perspektive annimmt, so beruht die Argumentation auf der Behauptung, dass bei einem Scoring der Missings als falsch die Wahrscheinlichkeit für eine korrekte Lösung eines Items deterministisch sei, denn die Bewertung als falsch führe zu einer falschen Antwort mit Wahrscheinlichkeit 1. Die Bewertung einer Antwort als falsch steht aber in keinem Zusammenhang zur proba-bilistischen Modellierung der Itemantworten einer Person. Denn es könnten auch die nichtfehlenden Items durch einen wie auch immer gearteten deterministischen Prozess zustande gekommen sein, was nicht der probabilistischen Modellierung im statistischen Modell für alle Item Respon-ses widerspricht. Man muss daher zwischen einem „realen Antwortprozess“ – der deterministisch oder probabilistisch erfolgen kann, aber sicher in den seltensten Fällen der vor-gegebenen probabilistischen Spezifikation des IRT-Modells folgt – und der statistischen Modellannahme zur Definition einer Fähigkeit im Sinne einer Skalenkonstruktion unter-scheiden (Rohwer, 2013).
Auch statistische Gründe im Sinne der Stochastic-Subject- Perspektive entkräften die Kritik an einer Falschbewertung der fehlenden Item Responses. Bei der Modellierung int-raindividueller Verteilungen in einem IRT-Modell für eine Person werden dabei Itemparameter als feste und bekannte Parameter vorausgesetzt und die Personenfähigkeit θn ist als ein der Person zugeordneter fester Effekt (fixed effect) zu interpretieren. Die Annahme der lokalen stochastischen Unabhängigkeit bezieht sich dann auf eine bedingte Unab-hängigkeit der Itemantworten für eine feste Person n an-hand der vorgegebenen Itemmenge und ist damit empirisch nicht widerlegbar, sondern eine Setzung zur Identifikation der Fähigkeit θn dieser Person. D. h. die Personenfähigkeit θn ist erst durch die Spezifikation der Likelihood und der Itemantworten Y definiert. Im Rasch-Modell ist bei einer festen Person n und Item i die Wahrscheinlichkeit einer korrekten Itemantwort durch P(Yni = 1|θn) = Ψ(θn – bi) (mit der logistischen Funktion Ψ) gegeben, die in der Likeli-hood-Schätzung für den Parameter θn verwendet wird. Ob eine einzelne Beobachtung dann in diesem Modell „passt“, ist empirisch nicht entscheidbar, so dass eine Falschbewer-tung der fehlenden Item Responses nicht per se das IRT-Modell verletzen kann.
Zusammenfassend sind die in der Literatur auffindbaren simulationsbasierten und testtheoretischen Begründungen, die gegen die Bewertung der fehlenden Antworten als falsch angebracht werden, aus meiner Sicht für typische Anwen-dungen im Large-Scale-Assessment nicht zutreffend. Es soll hier aber angemerkt werden, dass aus Gründen der Validi-tät durchaus andere Bewertungen als falsch in Anwendun-gen adäquat sein könnten. Zentral in der Argumentation der Kritik der Autorinnen und Autoren ist, dass aus dem Antwortverhalten von Schülerinnen und Schülern in einer querschnitt lichen Messung (inter -individuelle Perspektive) fälschlicherweise auf ein Antwortverhalten eines einzelnen Schülers (intraindividuelle Perspektive) rückgeschlossen wird (siehe Molenaar, 2004).
Modellbasierte Behandlung fehlender Item Responses
In diesem Abschnitt werden verschiedene modellbasierte Verfahren zur Behandlung fehlender Item Responses dis-kutiert, wobei im Folgenden nur IRT-Modelle für dicho-tome Daten in der Familie der Rasch-Modelle (Fischer & Molenaar, 1995) betrachtet werden. Allerdings sind unsere Über legungen auch für allgemeinere Modellklassen wie 2PL-Modelle oder IRT-Modelle für polytome Daten gültig.
Unter den modellbasierten Verfahren werden häufig IRT-Modelle für ignorierbare und nichtignorierbare Item Responses unterschieden (Holman & Glas, 2005). Bei einer Ignorierung fehlender Item Responses werden Items für Schüler/innen aus der Likelihood-Funktion in der Schätzung weggelassen (d. h. ignoriert), für die das jewei-lige Item fehlend ist. Ignoriert man die fehlenden Item Responses in der Schätzung, so kann man zeigen, dass fehlende Item Responses unter dieser Annahme mit einer Wahrscheinlichkeit von Pni(θn, M) als richtig imputiert (d. h. bepunktet) werden, wenn θn, M die Fähigkeit von Person n bezeichnet, die ausschließlich mit den nichtfehlenden Items ermittelt wurde. D. h. praktisch, dass das IRT-Modell und die beobachteten Item Responses genutzt werden, um die fehlenden Items zu ersetzen. Da die Wahrscheinlichkeit Pni(θn, M) immer größer als null ist, führt die Ignorierung von Item Responses bei fest gehaltenen Itemparametern immer zu höheren Personenfähigkeiten als eine Bewer-tung als falsch. Das Ignorieren fehlender Item Responses bedeutet nicht, dass der Ausfall unabhängig von der Fähigkeit ist (d. h. der Ausfall ist nicht missing completely at random, MCAR; siehe Lüdtke & Robitzsch, 2010). Er ist dadurch charakterisiert, dass die gesamte Information über die Fähigkeit θn bereits aus den beobachteten Item Responses rekonstruierbar ist, d. h. der Ausfall ist missing at random (MAR). D. h. unter dieser Annahme kann der Fall ein treten, dass der Anteil fehlender Item Responses bei leistungsschwächeren Schülerinnen und Schülern größer als bei leistungsstärkeren Schülerinnen und Schülern ist.
58 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment
Die Behandlung fehlender Item Responses als falsch kann dabei als ein Extremum, die Ignorierung als ein anderes Extremum angesehen werden (Rost, 2004, S. 324 ff.). Im ersten Fall besteht die Gefahr einer Unterschätzung der Personenfähigkeit, im zweiten gegebenenfalls eine Über-schätzung der Personenfähigkeit.
Alternativ zur Ignorierung fehlender Item Responses wurden mehrdimensionale IRT-Modelle für nichtignorierbare Item Responses vorgeschlagen (Holman & Glas, 2005; Rose et al., 2010). Das zweidimensionale Modell von Holman und Glas (2005) führt neben der latenten Fähigkeit θ eine latente individuelle Response Propensity (Antworttendenz) ξ ein, die dem Ausfall der Item Responses zugrunde liegt. Für die Responsevariablen Rni nimmt man dabei ebenso ein Rasch-Modell an:
P(Rni = 1|θn, ξn) = Ψ(ξn – βi) (2)
Die Wahrscheinlichkeit, eine Itemantwort zu produzie-ren, hängt demnach von der Antworttendenz ξn und von der „Schwierigkeit“ eines nichtfehlenden Responses βi ab. Ob ein Item fehlt oder nicht, hängt allerdings nicht vom Item Response selbst ab. Das zweidimensionale Modell schätzt damit eine bivariate Verteilung von (θ, ξ). Aller-dings existiert für jede Person nur eine EAP-Schätzung und keine Maximum-Likelihood-Schätzung (Yen & Fitzpatrick, 2006) für die Fähigkeit θn. Als Konsequenz ist dann nur unter Vorgabe einer Korrelation von Fähigkeit θ und Ant-worttendenz ξ eine Schätzung der Fähigkeit möglich.
Lässt sich dann die Antworttendenz ξ als ξ = ρθ + ε schrei-ben, so kann man zeigen, dass fehlende Item Responses eine Bepunktung von Pni(θn, M) erfahren (siehe Bertoli-Barsotti & Punzo, 2013). Im Unterschied zum Modell mit igno-rierbaren Item Responses werden Fähigkeitsschätzungen demzufolge in Abhängigkeit der Regression der Antwort-tendenz auf die Fähigkeit um die Konstante ρ adjustiert. Nur wenn Antworttendenz und Fähigkeit unkorreliert sind (ρ = 0), führen beide Modelle zu denselben Personenpara-meterschätzungen.
Als Approximation des zweidimensionalen Modells schla-gen Rose et al. (2010; siehe auch Pohl et al., 2014) ein eindimensionales IRT-Modell (bei Ignorierung fehlender Item Responses) für die Fähigkeit mit einem latenten Hintergrundmodell vor, in dem der Anteil fehlender Items als manifeste Kovariate verwendet wird. Diese Kovariate soll dabei näherungsweise die Rolle der Response Propensity ξ einnehmen. Ich bezweifle aber die Nützlichkeit dieses Mo-dells: Bei längeren Tests mit vielen Items dominiert bei der Schätzung der Personenfähigkeit die Likelihood der nicht-fehlenden Item Responses im Vergleich zur Priorverteilung des latenten Hintergrundmodells, so dass man für Tests mit hinreichend vielen Items näherungsweise das Vorgehen der Ignorierbarkeit fehlender Item Responses erhält.
Weitere modellbasierte Verfahren verallgemeinern das biva-riate IRT-Modell von Holman und Glas (siehe Rose, 2013, Bertoli-Barsotti & Punzo, 2013) oder setzen Mischvertei-lungsansätze ein (Bacci & Bartolucci, 2013; Pietsch, 2011). Ich beziehe diese Modelle allerdings nicht in die verglei-chenden Analysen dieses Beitrags ein.
Zwei alternative Item-Response-Modelle für nichtignorierbare Item Responses: Ansätze für eine Sensitivitätsanalyse
In diesem Abschnitt sollen zwei alternative modellbasierte Ansätze diskutiert werden, die die fehlenden Item Responses als nichtignorierbar behandeln. Im ersten Modell soll der Ansatz der teilrichtigen Bewertung von Lord (1974) ange-wendet werden. Ein zweites IRT-Modell erweitert das zwei-dimensionale IRT-Modell von Holman und Glas (2005) um eine mögliche Abhängigkeit des Ausfallens eines Items vom unbekannten Item Response selbst, sodass sich die Bewertung einer fehlenden Itemantwort als falsch als ein Spezialfall ergibt. Die beiden vorgeschlagenen Modelle können dabei als eine so genannte Sensitivitätsanalyse an-gesehen werden, bei der unter einer Variation verschiedener Annahmen an den Ausfallprozess die erhaltenen Ergebnisse studiert werden (z. B. Resseguier, Roch & Paoletti, 2011).
Ein Pseudo-Likelihood-Ansatz für partielles Scoring der Item Responses
Im Pseudo-Likelihood-Ansatz nach Lord (1974) können Item Responses als partiell korrekt (teilrichtige Bepunk-tung) bewertet werden. Die Pseudo-Likelihood-Funktion Ln (genauer: die Pseudo-Log-Likelihood) für Person n ist definiert als
(3)
Dabei ist Pni die Wahrscheinlichkeit der korrekten Beant-wortung von Item i durch Person n und wni ist der Punkt-wert (Score) von Person n auf Item i. Liegen keine fehlen-den Item Responses vor, dann sind die Scores wni entweder gleich 1 (bei einer richtigen Antwort) oder gleich 0 (bei einer falschen Antwort). Lord (1974) argumentiert, dass bei fehlenden Item Responses bei Multiple-Choice-Items mit M Antwortalternativen die Scores wni gleich einer Ratewahrscheinlichkeit von 1/M gesetzt werden können und die entstehende Likelihood (3) optimiert wird. Würde man die fehlenden Item Responses ignorieren, dann bedeutet e dies – wie oben argumentiert –, fehlende Items mit wni = Pni (θn, M) zu bepunkten, wobei θn, M die Fähigkeits-schätzung für Person n auf Basis der nichtfehlenden Item Responses ist. Bei einer Behandlung der fehlenden Item Responses als falsch wählt man die Scores wni = 0. Diese beiden Fälle sollen als „Extrema“ der Behandlung fehlen-
Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 59
der Item Responses aufgefasst werden (siehe Rost, 2004, S. 324 ff.) und „dazwischen liegende“ Annahmen durch einen Sensitivitätsparameter ρ = 0 (Behandlung der Missings als falsch) und ρ = 1 (Behandlung der Missings als igno-rierbar) im Rahmen einer Sensitivitätsanalyse studiert werden. Setzt man in diesem Ansatz als Bepunktung von Item i für Person n den Score wni = ρ ∙ Pni(θn, M) und ermit-telt die Ergebnisse der Skalierung bei Variation des Para-meters ρ. Diese Technik der Sensitivitätsanalysen ist bei der Imputation fehlender Daten für nichtignorierbare Missings verbreitet (van Buuren, 2012; Resseguier, Roch & Paoletti, 2011). Dabei ist zu bemerken, dass der Parameter ρ selbst nicht schätzbar ist, sondern für die Schätzung vorgegeben werden muss. Dies wird auch dadurch gestützt, dass die Pseudo-Likelihood-Funktion in Abhängigkeit von ρ nur ein Maximum bei ρ = 0 oder ρ = 1 annehmen kann.
Modellierung des Ausfallprozesses der Item Responses
Im zweiten Modell werden die fehlenden Item Responses ähnlich dem zweidimensionalen Modell von Holman und Glas (2005; siehe auch Rose et al., 2010) modelliert. Schreibt man wiederum Ψ als Abkürzung für die logistische Funktion, so gilt unter der Annahme des Rasch-Modells (Yen & Fitzpatrick, 2006) folgende Gleichung für die Wahrscheinlichkeit eines korrekten Item Responses:
P(Yi = 1|θ) = Ψ(θ – bi) (4)
Die Modellgleichung für einen fehlenden Wert des Items i mithilfe der Response Propensity (Ausfalltendenz) ξ möge nun allerdings auch vom unbekannten Item Response Yi selbst abhängen (siehe Mislevy & Wu, 1996). Dafür defi-nieren wir:
P(Ri = 1|Yi = k, ξ) = Ψ(ξ – βi + kδ) mit k = 0,1 (5)
Die Wahrscheinlichkeit eines nichtfehlenden Item Response (d. h. Ri =1) in Abhängigkeit des Item Response Yi entsteht dabei unter der Annahme δ ≠ 0. Wählt man δ = 0, so gelangt man zum IRT-Modell für nichtignorierbare Item Responses von Holman und Glas (2005). Der Parameter δ ist jedoch ebenso wie der Parameter ρ im Pseudo-Likelihood-Ansatz nicht aus den Daten schätzbar (d. h. nicht empirisch iden-tifizierbar). Wiederum können im Rahmen einer Sensiti-vitätsanalyse Skalierungsergebnisse in Abhängigkeit vorge-gebener Parameterwerte für δ studiert werden. Für sehr kleine Werte von δ (also z. B. δ = –10) erhält man P(Ri = 1|Yi = 1, ξ) = 1, also P(Ri = 0|Yi = 1, ξ) = 0. D. h. alle Schüler/innen, die die korrekte Itemantwort wissen, geben mit einer Wahrscheinlichkeit von 1 auch einen korrekten Item Res-ponse und lassen daher dieses Item nicht aus. Daraus folgt allerdings nach dem Satz von Bayes die Beziehung P(Yi = 1|Ri = 0; θ, ξ) = 0, d. h. fehlende Item Responses werden mit einer Wahrscheinlichkeit von 1 als falsch bewertet.
Wie im Pseudo-Likelihood-Ansatz modelliert man demzu-folge auch mit diesem Modell die Extrema der Ignorierbar-keit von Missings (δ = 0) und der Behandlung von Missings als falsch (δ = –10).
Das vorgeschlagene Item-Response-Modell schätzt Item-schwierigkeiten bi, Itemparameter bi für die Response- Tendenz sowie die bivariate Verteilung von (θ, ξ). Dabei werden in der Ermittlung der Likelihood für Item i die Wahrscheinlichkeiten dreier disjunkter Ereignisse P(Ri = 1, Yi = 0|θ, ξ), P(Ri = 1, Yi = 1|θ, ξ) und P(Ri = 0|θ, ξ) verwen-det. Die Wahrscheinlichkeit eines fehlenden Item Responses P(Ri = 0|θ, ξ) ist dabei durch die totale Wahrscheinlichkeit
P(Ri = 0|θ, ξ) = P(Ri = 0|Yi = 0|θ, ξ) P(Yi = 0|θ) + P(Ri = 0| Yi = 1|ξ) P(Yi = |θ) (6)
gegeben, die man aus den Itemparametern berechnen kann. Fehlende Item Responses Yi werden dabei praktisch in Ana-logie zu fehlenden Items in Large-Scale-Assessments mit der Marginal Maximum Likelihood (MML)-Schätzmethode ausintegriert (von Davier & Sinharay, 2014; siehe auch Mislevy & Wu, 1996; Hanson, 2000).
Ländervergleich von vier Ländern in PIRLS 2011
Im folgenden Abschnitt soll ein Vergleich der Lesekom-petenzleistungen in PIRLS 2011 anhand eines Testhefts für vier ausgewählte Länder, Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und die Niederlande (NLD), vorgenommen und die Abhängigkeit der Ländermittelwerte in Abhängigkeit verschiedener Behandlungen der fehlenden Item Responses untersucht werden.
Daten
Für die Analyse sollen die Schülerantworten des Testhefts 13 in PIRLS 2011 („PIRLS Reader“) mit 35 Items (da-von 15 Multiple-Choice-Items mit 4 Antwortalternativen) verwendet werden. Dabei resultierten 968 österreichische, 809 deutsche, 901 französische und 802 niederländische Schüler/innen in der Stichprobe. Zur Vereinfachung der Analysen wurden alle polytomen Items dichotomisiert, wobei nur der höchste Punktwert bei einem Item zu einer Richtigantwort führt.
Deskriptive Analysen zeigen, dass die mittleren Missing-anteile der Items zwischen den Ländern stark variierten (Ö: 11.2 %, DEU: 7.9 %, FRA: 13.6 %, NLD: 2.7 %). Diese Missinganteile waren bei den offenen Items deutlich stärker als bei den Multiple-Choice-Items ausgeprägt (z. B. Ö: offen – 17.7 %, Multiple Choice – 2.6 %). Bei einer Bewertung der fehlenden Item Responses als Falschantwort erreichten österreichische Schüler/innen im Mittel 55.1 %
60 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment
richtige Antworten und übertrafen damit leicht Frankreich (53.7 %), erreichten aber signifikant niedrigere Ergebnisse als deutsche Schüler/innen (63.0 %) und niederländische Schüler/innen (64.4 %).
Analysen
Für die Ländervergleiche werden sechs verschiedene Item-Response-Modelle (im Folgenden als M1, …, M6 bezeich-net) unter Berücksichtigung der Schülergewichte für das Testheft 13 berechnet. Für eine vereinfachte Beschreibung der Effekte der Länderreihenfolgen transformieren wir in jedem IRT-Modell erhaltene Fähigkeitsschätzungen so, dass österreichische Schüler/innen einen Mittelwert von 500 und eine Standardabweichung von 100 besitzen. Die Kompe-tenzwerte für Deutschland, Frankreich und die Niederlande wurden derselben Transformation unterworfen, so dass Ländervergleiche in allen Modellen immer relativ zur mitt-leren Leistung Österreichs vorgenommen wurden.
In Modell M1 werden in einem eindimensionalen Rasch-Modell mit vier Gruppen (den vier verschiedenen Ländern) fehlende Item Responses als falsch bepunktet. Im Modell M2 werden fehlende Item Responses ignoriert, d. h. als Missing in der Likelihood-Schätzung betrachtet und da-mit ignoriert. In Erweiterung zu M2 wird in Modell M3 ein zweidimensionales Rasch-Modell mit den zwei laten-ten Variablen der Fähigkeit θ und der Response-Tendenz ξ spezifiziert. In Modell M4 werden im Pseudo-Likelihood-Ansatz des Rasch-Modells nur fehlende Item Responses für die Multiple-Choice-Items mit vier Antwortalternativen mit dem Score wni =1/4 bepunktet, während fehlende Item Responses bei offenen Items als falsch bepunktet werden (d. h. Score wni = 0). In den Modellen M1 bis M4 werden Itemschwierigkeiten und die Fähigkeitsverteilung in den vier Ländern simultan geschätzt.
Für die Modelle M5 und M6 werden in einer ersten Analy-se durch eine Bewertung der fehlenden Item Response sals Falschantworten gemeinsame Itemschwierigkeiten für alle vier Länder erhalten, die in einem zweiten Schritt fixiert werden. In Modell M5 wird der Pseudo-Likelihood-An-satz (siehe 4.1) im Rahmen des Rasch-Modells eingesetzt, bei dem fehlende Item-Responses mit dem Score wni = ρ ∙ Pni (θn, M) versehen sind, wobei θn, M die Personenfähigkeit unter ausschließlicher Berücksichtigung der nichtfehlen-den Item Responses bezeichnet. Die Personenfähigkeit θn, M wurde dabei aus der individuellen Posteriorverteilung si-muliert. Die Ländermittelwerte werden in Abhängigkeit des Sensitivitätsparameters ρ = 0,0.01,…,0.99,1 berechnet. In Modell M6 wird die Erweiterung des zweidimensiona-len Modells M3 durch die Modellierung des Ausfallpro-zesses die Abhängigkeit des Fehlens eines Item Responses vom Item selbst vorgenommen (siehe 4.2). Dieses Modell wird in Abhängigkeit des Sensitivitätsparameters δ = –10, –9.5,…, –0.5, 0 berechnet.
Für alle Item-Response-Modelle sollen die Ländermittel-werte Deutschlands, Frankreichs und der Niederlande im Vergleich zu Österreich verglichen werden.
Die gesamte Datenaufbereitung und Schätzung der Modelle fand in der Software R (R Core Team, 2014) statt. Für die Berechnung der Modelle M1 bis M3 wurde das R-Paket TAM (Kiefer, Robitzsch & Wu, 2014) verwendet. Die in M4, M5 und M6 eingesetzten Modelle sind in der Funktion rasch.mml2 des R-Paketes sirt (Robitzsch, 2014) implemen-tiert.
Ergebnisse
In Tabelle 1.4.1 sind die Ländermittelwerte für alle Modelle M1 bis M6 dargestellt. Dabei fällt auf, dass zwischen den beiden Extrema der Missingbehandlung von Modell M1 (Missings werden als falsch bewertet) und Modell M2 (Missings sind ignorierbar) für Deutschland und Frankreich kleinere Unterschiede für die Differenz zum Österreich-Mittelwert entstehen (M1-DEU: 537.5, M2-DEU: 534.2; M1-FRA: 488.7, M2-FRA: 492.4), während die verschiede-nen Modelle für die Niederlande zu deutlichen Differenzen führen (M1-NLD: 540.3, M2-NLD: 523.4). Dieser Be-fund ist aufgrund der deutlich geringeren Missinganteile bei den Item Responses (2.7 %) der niederländischen Schüler/ innen im Vergleich zum Missinganteil der Referenz der österreichischen Schüler/innen (11.2 %) erklärbar.
Das Modell M3, das neben einer Fähigkeit auch eine Response-Tendenz als latente Variable enthält, weist nur geringe Abweichungen zum Modell M2 der Ignorierung von Missings auf (z. B. M2-DEU: 534.2, M3-DEU: 534.9). Dies steht im Einklang mit der Literatur (Rose et al., 2010; Pohl et al., 2014). Über die vier Länder hinweg ist die Fähigkeit mit der Response-Tendenz zu .37 korreliert, d. h. „fähigere Schüler/innen“ (wobei Fähigkeit hier modell - implizit in Modell M3 definiert ist) produzieren weniger häufig fehlende Item Responses. Imputiert man nur die fehlenden Item Responses der Multiple-Choice-Items im Pseudo-Likelihood-Ansatz von Modell M4 mit dem Kehr-wert der Anzahl der Antwortalternativen (1/4), so werden nur geringe Abweichungen zur Falschbewertung der Missings in Modell M1 beobachtet (z. B. M1-DEU: 537.5, M4-DEU: 537.6). Dies ist damit zu begründen, dass generell Multiple-Choice-Items einen niedrigen Missinganteil in PIRLS be-sitzen und daher diese Missings nur einen geringen Einfluss auf Analysen besitzen.
Die Modelle M5 und M6 variieren dabei die Sensitivitäts-parameter ρ bzw. δ im Rahmen einer Sensitivitätsanalyse hinsichtlich verschiedener Annahmen an den Ausfall prozess der Item Responses. Praktisch bilden die Befunde aus Tabelle 1.4.1 die Spannweite der Ländermittelwerte zwischen den Extrema der Falschbewertung (Modell M1) und der Ignorier barkeit (Modell M2). In Abbildung 1.4.1 erfolgt eine Darstellung der Ländermittelwerte in Abhängig keit
Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 61
der Sensitivitätsparameter der Modelle M5 und M6. Die Ränge von Deutschland und den Niederlanden tauschen dabei bei einem bestimmten Wert der Parameter ρ bzw. δ.
Die Ländermittelwerte sind dabei stetige und monotone Funktionen der Sensitivitätsparameter.
Modell Ö DEU FRA NLD
M1: Missing = falsch 500 537.5 488.7 540.3
M2: Missing = ignorierbar 500 534.2 492.4 523.4
M3: 2-dim. Modell 500 534.9 492.5 524.8
M4: Pseudo-Likelihood (für Multiple-Choice-Items) 500 537.6 489.4 539.5
M5: Pseudo-Likelihoodρ = 0 ρ = 0.3ρ = 0.7ρ = 1
500500500500
537.3537.0535.9534.6
488.9490.1491.8493.1
539.9535.9529.5524.0
M6: 2-dim. – Modellierung des Ausfallprozessesδ = –10 δ = –1.5 δ = –0.5 δ = 0
500500500500
538.0535.9535.1534.6
489.1490.6491.5492.1
540.7532.4528.0525.7
Tabelle 1.4.1: Mittelwerte für die Länder Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und die Niederlande (NLD). Der Mittelwert für Österreich wurde in allen Item-Response-Modellen auf 500 fixiert.
Abbildung 1.4.1: Sensitivitätsanalysen für Ländermittelwerte der Länder Österreich (Ö), Deutschland (DEU), Frankreich (FRA) und der Niederlande (NLD).
Links: Pseudo-Likelihood-Schätzung (Modell M5) in Abhängigkeit des Sensitivitätsparameters ρRechts: Zweidimensionales Modell M6 in Abhängigkeit des Sensitivitätsparameters δ
–10 –8 –6 –4 –2 0
490
500
510
520
530
540
490
500
510
520
530
540
Mitt
elw
ert
0.0 0.2 0.4 0.6 0.8 1.0
Mitt
elw
ert
ÖFRA
NLDDEU
ÖFRA
NLDDEU
δρ
62 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment
Diskussion
Im Gegensatz zu Behauptungen der neueren Literatur (Pohl & Carstensen, 2013; Pohl et al., 2014) wurde anhand von Analysen in PIRLS 2011 gezeigt, dass das Ignorieren feh-lender Item Responses einen Einfluss auf zentrale Resultate einer Studie besitzt. Länderunterschiede bei verschiedenen Behandlungen fehlender Item Responses fallen dabei deut-lich verschieden aus, was die Frage nach einer validen Analysemethode nach sich zieht.
Es kann argumentiert werden, dass die in der Literatur auffindbare testtheoretisch basierte Kritik an einer Falsch-bewertung fehlender Item Responses (Rose, 2013; Pohl et al., 2014) bestenfalls auf einer intraindividuellen Interpreta-tion von Wahrscheinlichkeiten beruht. In dieser Argumen-tation werden dann jedoch fälschlicherweise die Konzepte der aleatorischen Unsicherheit (das statistische Modell) und epistemischen Unsicherheit (das Zustandekommen der Daten betreffend) konfundiert. Es wurde ebenso auf-gezeigt, dass Simulationsstudien für die Wahl der „richti-gen Behandlung“ fehlender Item Responses keine Rele-vanz besitzen (siehe auch Rohwer, 2013). Da die Frage der Festlegung einer adäquaten Bepunktungsregel für die Missings nicht empirisch entscheidbar ist, wurden in diesem Beitrag zwei IRT-Modelle vorgeschlagen, die Sensititivitäts-analysen gegenüber der Annahme der Ignorierbarkeit feh-lender Item Responses vornehmen. Das erste alternative eindimensionale IRT-Modell (Modell M5) basiert auf einem Pseudo-Likelihood-Ansatz, bei dem für fehlende Item Responses Punktwerte zwischen 0 und 1 zugelassen werden. Dieser Ansatz besitzt jedoch gegenüber dem zweiten alter-nativen zweidimensionalen IRT-Modell den Nachteil, dass die Bepunktung für die fehlenden Item Responses von einer ausschließlich auf den nichtfehlenden Items bestimmten weiteren Fähigkeit abhängen. Im zweiten Modell (Modell M6) wird neben der Fähigkeit auch eine dazu korrelierte Response-Tendenz angenommen. Dabei kann das Fehlen eines Item Responses auch vom unbekannten Item Res-ponse selbst abhängen. Rechnerisch ist das zweidimensio-nale Modell aufwändiger als das ein dimensionale Modell und besitzt zusätzlich das Problem, dass keine Maximum-Likelihood-Schätzung der Personenfähigkeit existiert (wenn δ verschieden von null ist). Allerdings beruht in diesem Modell die Berechnung der Fähigkeit nicht wie bei Modell M5 auf einer zusätzlichen Ermittlung der Fähigkeit auf den nichtfehlenden Items.
Typischerweise werden die in diesem Artikel durchge-führten Sensitivitätsanalysen bei der Imputation fehlender Daten gegenüber komplexeren Modellspezifikationen wie Pattern-Mixture-Modellen (Pietsch, 2011) vorgezogen, wenn ein Bereich plausibler Analyseergebnisse unter einer Variation von plausiblen Annahmen an den Ausfallprozess vorgenommen wird (van Buuren, 2012).
Wird zusätzlich eine Priorverteilung über einen die An - nahmen des Ausfallprozesses charakterisierenden Sensitivi-tätsparameter spezifiziert, so kann man im Rahmen einer Multi-Model-Inference Analyseergebnisse entsprechend theoretischen Vorannahmen gewichten (Siddique, Harel & Crespi, 2012), was häufig zu größeren Standardfehlern interessierender Modellparameter führt. Eine integrierte statistische Inferenz im Hinblick auf die Generalisierbarkeit hinsichtlich Personen, Items und verschiedener statistischer Modelle hat daher auch im Large-Scale-Assessment Bedeu-tung (Robitzsch, Dörfler, Pfost & Artelt, 2011).
Im Rahmen der vorgestellten Analysen wurde auf eine Beschränkung auf die Familie der Rasch-Modelle vorge-nommen. Formal sind die Betrachtungen jedoch einfach auf komplexere IRT- Modelle wie das 2PL- oder das 3PL-Modell oder Modelle für polytome Daten übertragbar. An-stelle eines für alle Items gültigen Sensitivitätsparameters kann dieser separat für jedes einzelne Item oder für einzel-ne Itemgruppen (etwa Multiple- Choice Items und offene Items) spezifiziert werden.
Der vorgeschlagene Pseudo-Likelihood-Ansatz ermöglicht zusätzlich, Messfehler oder Unreliabilität bei der Erfassung der einzelnen Item Responses (etwa aufgrund eines Ra-tings bei einem offenen Item, das keine perfekte Reliabilität besitzt) zu berücksichtigen, indem beobachtete Item Res-ponses von 0 (falsch) bzw. 1 (richtig) auf nichtganzzahlige Scores modifiziert werden, die die Größe der Raterüber-einstimmung abbilden soll. Alternativ zum Pseudo-Likeli-hood-Ansatz kann allerdings auch mit dem statistischen Ansatz der Belief Functions nach Denoeux (2013) in IRT-Modellen gearbeitet werden, der auf anderen Modellannah-men der Likelihood-Funktion für die Schätzung beruht.
Neben der Betrachtung der Konsequenzen der Behandlung fehlender Item Responses für Personenfähigkeiten hat die Analysestrategie durchaus auch Bedeutung für Itempara-meterschätzungen (d. h. die Kalibrierung). Da offene Items meistens höhere Missinganteile als Multiple-Choice-Items besitzen, sind die Schwierigkeitsreihenfolgen der Items mit verschiedenen Itemformaten unter den Extrembehandlun-gen der Falschbewertung und der Ignorierbarkeit in vielen Large-Scale-Assessments mit substanziellen Missinganteilen bedeutsam voneinander verschieden. Die Wahl der Methode der Itemparameterbestimmung hat allerdings Konsequen-zen für die Verankerung von Items auf Kompetenzstufen und damit die Interpretation von Kompetenzwerten.
Die Konsequenzen einer Bewertung der fehlenden Item Responses als fehlende Itemantwort (und damit als igno-rierbar) können vor allem bei Skalierungen in Längsschnitt-studien bedeutsam sein, wenn Missinganteile schulform- und klassenstufen- oder zeitpunktspezifisch (sowie in deren Interaktion) variieren. In IRT-Modellen mit ignorierbaren fehlenden Item Responses scheint in dieser Situation die Bedeutung einer ermittelten Fähigkeit unklar. Wird eine
Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment 63
Fähigkeit in einer bestimmten Domäne in einem Test jedoch als Ausmaß der korrekten Beantwortung von Items einer vorgegebenen Itemmenge in einer vorgegebenen maximalen Testbearbeitungszeit definiert (wie dies beispielsweise in
PIRLS/TIMSS oder PISA der Fall ist), so führt dies zu einer nichtzirkulären und aus unserer Sicht valideren Definition dieser Fähigkeit. Daraus folgt die Konsequenz, dass fehlende Item Responses nicht ignorierbar sein können.
Literatur
Bacci, S. & Bartolucci, F. (2013). A multidimensional latent class IRT model for non-ignorable missing responses. Retrieved from http://ssrn.com/abstract=2213721.
Bertoli-Barsotti, L. & Punzo, A. (2013). Rasch analysis for binary data with nonignorable nonresponses. Psicologica, 34, 97–123.
Denoeux, T. (2011). Maximum likelihood estimation from fuzzy data using the EM algorithm. Fuzzy Sets and Systems, 183, 72–91.
Denoeux, T. (2013). Maximum likelihood estimation from uncertain data in the belief function framework. IEEE Transactions on Knowledge and Data Engineering, 25, 119–130.
Fischer, G. H. & Molenaar, I. W. (1995). Rasch models. Foundations, recent developments, and applications. Berlin: Springer.
Graham, J. W. (2009). Missing data analysis: Making it work in the real world. Annual Review of Psychology, 60, 549–576.
Hanson, B. (2000). IRT parameter estimation using the EM algorithm. Technical report. Retrieved from http://www.b-a-h.com/.
Holland, P. W. (1990). On the sampling theory foundations of item response theory models. Psychometrika, 55, 577–601.
Holman, R. & Glas, C. A. (2005). Modelling non‐ignorable missing‐data mechanisms with item response theory models. British Journal of Mathematical and Statistical Psychology, 58, 1–17.
Kiefer, T., Robitzsch, A. & Wu, M. (2014). TAM: Test analysis modules. R package version 1.0-2. http://CRAN.R-project.org/package=TAM
Lüdtke, O. & Robitzsch, A. (2010). Umgang mit fehlenden Daten in der empirischen Bildungsforschung. In S. Maschke & L. Stecher (Hrsg.), Enzyklopädie Erziehungswissenschaft Online. Fachgebiet Methoden der empirischen erziehungswissen-schaftlichen Forschung, Quantitative Forschungsmethoden. Weinheim: Juventa.
Mislevy, R. J. & Wu, P.-K. (1996). Missing responses and IRT ability estimation: Omits, choice, time limits, and adaptive testing. ETS Research Report No. RR-96-30. Princeton, NJ: Educational Testing Service.
Molenaar, I. W. (1995). Some background for item response theory and the Rasch model. In G. H. Fischer & I. W. Molenaar (Hrsg.), Rasch models. foundations, recent developments, and applications (S. 3–14). New York: Springer.
Molenaar, P. C. M. (2004). A manifesto on psychology as idiographic science: Bringing the person back into scientific psycho-logy, this time forever. Measurement: Interdisciplinary Research & Perspective, 2, 201–218.
Pietsch, M. (2011). Fehlende Daten bei Unterrichtsbeobachtungen: Eine Sensitivitätsanalyse anhand von Daten der Schulins-pektion Hamburg. Empirische Pädagogik, 25, 47–87.
Pohl, S. & Carstensen, C. H. (2012). NEPS technical report – Scaling the data of the competence tests. NEPS Working Paper No. 14. Bamberg: NEPS.
Pohl, S. & Carstensen, C. H. (2013). Scaling of competence tests in the National Educational Panel Study: Many questions, some answers, and further challenges. Journal for Educational Research Online, 5(2), 189–216.
Pohl, S., Gräfe, L. & Rose, N. (2014). Dealing with omitted and not-reached items in competence tests evaluating approa-ches accounting for missing responses in item response theory models. Educational and Psychological Measurement, 74, 3, 423 –452.
64 Zu nichtignorierbaren Konsequenzen des (partiellen) Ignorierens fehlender Item Responses im Large-Scale-Assessment
R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. http://www.R-project.org/.
Resseguier, N., Roch, G. & Paoletti, X. (2011). Sensitivity analysis: When data are missing not-at-random. Epidemiology, 22, 282–283.
Robitzsch, A. (2014). sirt: Supplementary item response theory models. R package version 0.44-48. http://CRAN.R-project.org/package=sirt.
Robitzsch, A., Dörfler, T., Pfost, M. & Artelt, C. (2011). Die Bedeutung der Itemauswahl und der Modellwahl für die längsschnitt-liche Erfassung von Kompetenzen. Zeitschrift für Entwicklungspsychologie und pädagogische Psychologie, 43, 213–227.
Rohwer, G. (2013). Making sense of missing answers in competence tests. NEPS Working Paper No. 30. Bamberg: NEPS.
Rose, N. (2013). Item nonresponses in educational and psychological assessment. Dissertationsschrift. Friedrich-Schiller-Universität Jena.
Rose, N., von Davier, M. & Xu, X. (2010). Modeling nonignorable missing data with item response theory (IRT). ETS Research Report No. RR-10-11. Princeton, NJ: Educational Testing Service.
Rost, J. (2004). Lehrbuch Testtheorie-Testkonstruktion. Bern: Hans Huber.
Siddique, J., Harel, O. & Crespi, C. M. (2012). Addressing missing data mechanism uncertainty using multiple-model multiple imputation: Application to a longitudinal clinical trial. Annals of Applied Statistics, 6, 1814–1837.
Steyer, R. & Eid, M. (2001). Messen und Testen. Berlin: Springer.
van Buuren, S. (2012). Flexible imputation of missing data. Boca Raton: CRC Press.
von Davier, M. & Sinharay, S. (2014). Analytics in international large-scale assessments: Item response theory and population models. In L. Rutkowski, M. von Davier & D. Rutkowski (Eds.), Handbook of international large-scale assessment (pp. 155–174). Boca Raton: CRC Press.
Wainer, H. (2010). Schrödinger̓s cat and the conception of probability in item response theory. Chance, 23, 53–56.
Yen, W. M. & Fitzpatrick, A. R. (2006). Item response theory. In R. L. Brennan (Hrsg.), Educational measurement (S. 111–154). Westport: Praeger Publisher.
II. Familiäre und vorschulische
Unterstützung
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 67
2.1 Migrationshintergrund und Lesekompe-tenz: Entwicklung seit dem Jahr 2000
Silvia Salchegger, Barbara Herzog-Punzenberger & Sandra Filzmoser
Einleitung
Im vorliegenden Beitrag wird der Frage nachgegangen, wie gut es dem österreichischen Bildungssystem gelingt, das Potenzial von Kindern mit Migrationshintergrund zur Entfaltung zu bringen. Ein wesentlicher Gradmesser für diese Bemühungen ist, wie gut Kinder und Jugendliche mit Migrationshintergrund die deutsche Sprache beherrschen. Deutsch sprechen und verstehen zu können, ist eine wesentliche Voraussetzung für die Teilhabe am gesellschaftlichen Leben in Österreich sowie für den persönlichen bildungsmäßigen und beruflichen Erfolg. Bei PISA und PIRLS wird ein wichtiger Teilaspekt des Sprachverständnisses gemessen, die Lesekompetenz. Anhand der Daten dieser Studien kann somit untersucht werden, wie gut Kinder und Jugendliche aus Zuwandererfamilien in der Lage sind, deutsche Texte zu verstehen und zu nutzen.
Kinder mit Migrationshintergrund kommen zu Hause in der Regel weniger mit der deutschen Sprache in Berührung als jene ohne. So sprechen 16 % der Kinder mit Migrationshintergrund zu Hause ausschließlich (eine) andere Sprache(n) als Deutsch, 68 % sprechen in der Familie sowohl Deutsch als auch zumindest eine andere Sprache und weitere 16 % sprechen dort ausschließlich Deutsch (Vogtenhuber, Lassnigg & Bruneforth 2012, S. 25). Bei den Kindern ohne Migrationshintergrund sprechen dagegen 87 % ausschließlich Deutsch zu Hause.
Mehrsprachigkeit ist eine wichtige Ressource in einer globalisierten Welt. Sie stellt jedoch auch besondere Herausforderungen an das Bildungssystem. Da Kinder mit Migrationshintergrund in ihren Elternhäusern die deutsche Sprache in der Regel weniger vermittelt bekommen, sind sie beim Deutschlernen stärker auf Bildungseinrichtungen (Kindergarten und Schule) angewiesen als Kinder ohne
Migrationshintergrund. Auch darüber hinaus sind Kinder mit Migrationshintergrund in besonderem Maße auf eine hohe Qualität der (vor)schulischen Bildung angewiesen: Ihre Eltern beherrschen die Landessprache fallweise nicht ausreichend, um ihren Kindern bei den schulbezogenen Aufgaben helfen zu können. Sie sind mit dem österreichischen Bildungssystem weniger vertraut und stärker mit Hürden in den unterschiedlichsten Lebensbereichen (wie z. B. dem Rechtssystem) konfrontiert als Eltern, die nicht zugewandert sind (Latcheva & HerzogPunzenberger, 2011). Das Bildungssystem sollte diese spezifischen Benachteiligungen möglichst kompensieren und die Kompetenzen von Kindern mit Migrationshintergrund im Laufe ihrer Schulkarriere an die Kompetenzen von jenen ohne Migrationshintergrund heranführen.
Bisherige Studien zeigen, dass dies nur unzureichend ge lingt. Starke Kompetenzunterschiede zwischen Kindern mit und ohne Migrationshintergrund lassen sich nicht nur bei der Sprachstandsmessung im Kindergarten (Breit & Schneider, 2009) und bei der Messung der Lesekompetenz am Ende der Volksschule (Unterwurzacher, 2009) feststellen, sondern auch noch bei den 15/16Jährigen am Ende der Schulpflicht (Breit, 2009b; Reiter, 2002; Schreiner & Breit, 2006; Wroblewski, 2012). Hierbei muss natürlich bedacht werden, dass Kinder mit Migrationshintergrund in der Regel unter schwierigeren sozioökonomischen Bedingungen aufwachsen und ein Teil der Leistungsunterschiede auf Unterschiede in der sozialen Lage zurückgeführt werden kann (vgl. unten). Neben sprachlichen und sozioökonomischen Faktoren werden auch interaktionale und institutionelle Diskriminierung (Gomolla & Radtke 2002; HerzogPunzenberger, 2009), ein geringer Grad an kulturellsprachlicher Responsivität der Bildungsinstitutionen und gesamtgesellschaftlich ein hoher „chill1 factor“ (Heath
Wie hat sich die Lesekompetenz von Kindern und Jugendlichen mit Migrationshintergrund im Vergleich zu jenen ohne Migrationshintergrund seit der Jahrtausendwende entwickelt? Die Daten von PIRLS (seit dem Jahr 2006) und PISA (seit dem Jahr 2000) zeigen, dass der Leistungsunterschied kleiner geworden ist. Dies ist darauf zurückzuführen, dass sich die Lesekompetenz der Schüler/innen mit Migrationshintergrund in Relation zu jenen ohne positiver entwickelt hat: Bei PIRLS ist die Lesekompetenz bei den Kindern ohne Migrationshintergrund zurückgegangen, bei jenen mit hingegen etwa gleich geblieben. Bei PISA ist von 2000 auf 2012 die Lesekompetenz von Jugendlichen ohne Migrationshintergrund etwa gleich geblieben, bei jenen aus Zuwandererfamilien ist sie hingegen signifikant gestiegen. Darüber hinaus zeigt sich, dass bei PIRLS (4. Schulstufe) die Leistungsunterschiede größer ausfallen als bei PISA (15-/16-Jährige), was auf einen positiven Effekt längerer Beschulung für Zuwandererkinder hindeuten könnte.
1 Das englische Wort „chill“ steht für „kühl, frostig“. Der „chillfactor“ gibt die gefühlte Temperatur an, die durch Wind oder Nässe wesentlich unter den mit dem Thermometer gemessenen Graden liegen kann.
68 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
& Li, 2010) als weitere Gründe für den Leistungsrückstand von Kindern mit Migrationshintergrund diskutiert. Allerdings gibt es auch gesellschaftliche Situationen und Zuwanderungsgruppen, bei denen die erreichten Kompetenzen jene der Kinder einheimischer Eltern mit demselben Bildungshintergrund übertreffen. Dieses Phänomen wird in der wissenschaftlichen Literatur „immigrant optimism“ genannt und beschreibt die hohe Motivation von Kindern aus zugewanderten Familien, aber auch die hohen Erwartungen der Eltern (Kao & Tienda 1998). Beispielhaft können hier Kinder von vietnamesischen Einwanderern in Deutschland erwähnt werden (Spiewak, 2009).
Die Sprachkompetenzen der mehrsprachigen Kinder messen
Über 100 Sprachen werden von Schulkindern in Österreich derzeit gesprochen (Brizic & Hufnagl, 2011, S. 27). Mehr als zwanzig Sprachen werden in der österreichischen Schule im Rahmen des muttersprachlichen Unterrichts angeboten (BMBF, 2014, S. 15). 230.000 Schüler/innen verwenden derzeit auch eine andere Sprache als Deutsch in ihrer familiären Kommunikation (BMBF, 2015, S. 14). Eine wesentliche Aufgabe der Schule ist es, systematische Benachteiligung mehrsprachiger Kinder, die sich am Ende ihrer Schullaufbahn in niedrigeren Deutschkompetenzen im Vergleich zu einsprachigen Kindern ausdrücken würde, zu verhindern. Gleichzeitig soll die Mehrsprachigkeit gefördert und sollen damit auch die Kompetenzen in der jeweiligen Erstsprache entwickelt werden. Es kann davon ausgegangen werden, dass selbst unter günstigen Voraussetzungen (strukturierte durchgängige Förderung) fünf bis sieben Jahre notwendig sind, um die Zweitsprache auf muttersprachenähnlichem Niveau zu beherrschen (de Cillia, n. d.). In Ermangelung verlässlicher Alternativen werden im vorliegenden Beitrag die sprachlichen Kompetenzen der Schüler/innen ohne Migrationshintergrund als Maßstab für den Erfolg der Beschulung von Kindern mit Migrationshintergrund verwendet. Hierbei muss jedoch bedacht werden, dass ein Teil der Schüler/innen die österreichische Schule (inklusive Kindergarten) zum Testzeitpunkt noch gar nicht fünf bis sieben Jahre besucht hat2.
Bisherige Analysen haben gezeigt, dass die soziale Situation von Schülerinnen und Schülern mit Migrationshintergrund wesentlich schlechter ist als jene ohne (z. B. HerzogPunzenberger & Gapp, 2009; Wroblewski, 2012). Zwar haben Kinder mit Migrationshintergrund fast ebenso häufig Eltern, die eine Universität oder Fachhochschule abgeschlossen haben, wie Kinder ohne Migrationshintergrund; der Anteil an Kindern, deren Eltern maximal über eine Pflichtschulausbildung verfügen, ist hingegen bei jenen mit Migrationshintergrund etwa fünfmal so hoch wie bei jenen ohne Migrationshintergrund (vgl. Vogtenhuber et
al., 2012, S. 23). Und selbst hoch qualifizierte Zuwanderer stehen oft auf einer niedrigeren sozialen Stufe als im Inland geborene Personen gleichwertiger Qualifikation, weil sie ihre Bildungszertifikate (aus dem Herkunftsland) auf dem österreichischen Arbeitsmarkt nicht einsetzen können und daher häufig Berufe ausüben, die deutlich unter ihrer Qualifikation liegen (Österreichischer Integrationsfonds, 2014). Bei einem Vergleich der Leistungen von Schülerinnen und Schülern mit und ohne Migrationshintergrund muss daher stets ihre ungleiche soziale Situation mitberücksichtigt werden. Der Spracherwerb ist neben dem familiären Kontext auch in einen schulischen und gesellschaftlichen Kontext eingebettet. Im Folgenden wird beleuchtet, wie sich der schulische und gesellschaftliche Kontext in Bezug auf den Deutschspracherwerb von Kindern mit Migrationshintergrund in den vergangenen Jahren verändert hat.
Entwicklung der Sprachförderung in Gesellschaft und Schule seit den 1990er Jahren
Nachdem in Österreich zu Beginn der 1990er Jahre die Rückkehrorientierung der österreichischen „Gastarbeiterpolitik“ und damit auch die Abkommen zum Muttersprachen und Heimatkundeunterricht mit den Entsendeländern Jugoslawien und der Türkei beendet wurden, wurde mit dem Schuljahr 1992/93 die österreichische Schulpolitik hinsichtlich der sprachlich und kulturell vielfältiger werdenden Schule neu ausgerichtet. Die darauffolgenden zwanzig Jahre, 1992–2012, können in drei Phasen eingeteilt werden. In der ersten Phase der 1990er Jahre konnte die ministerielle Verwaltung großzügige Rahmenbedingungen (außerordentlicher Status, Deutschförderung bis zu 22 Wochenstunden, muttersprachlicher Unterricht bis zu sechs Wochenstunden, zusätzliche Lehrerwerteinheiten pro Schüler/in mit einer anderen Erstsprache als Deutsch, interkulturelles Lernen als Unterrichtsprinzip, Sprachentausch; vgl. BMUKK, 2011) durchsetzen, die aber in der inhalt lichen Tiefe von den politischen Entscheidungsträgerinnen und trägern (u. a. auch wegen der zersplitterten Verantwortungsstruktur zwischen Bund und Ländern) nicht mitgetragen wurden. Dies war möglich, da sie kaum Verpflichtungscharakter hatten und schließlich nur in begrenztem Ausmaß umgesetzt wurden (vgl. Çinar & Davy, 1998).
Die zweite Phase in den 2000er Jahren war von LargeScaleAssessments wie PISA, PIRLS und TIMSS geprägt. Durch diese rückte der internationale Vergleich stärker in den Fokus und es wurde durch das mittelmäßige Abschneiden Österreichs in diesen Leistungsvergleichen von den Medien und der Zivilgesellschaft Handlungsdruck aufgebaut. Das Thema des Leistungsrückstands der Schüler/innen mit Migrationshintergrund wurde in Österreich ab Dezember 2004 (infolge der Veröffentlichung der PISA2003Ergebnisse) im nationalen Rahmen breit diskutiert. Dadurch stieg die
2 Dieser Anteil ist jedoch gering: Bei PISA 2012 waren 9 % der 15/16Jährigen mit Migrationshintergrund bei der Zuwanderung nach Österreich älter als 8 Jahre. Die allermeisten (67 %) wurden bereits in Österreich geboren.
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 69
allgemeine Sensibilität für diese Fragestellung sowie die Akzeptanz für etwaige Maßnahmen hierzulande erheblich. Als unmittelbare Reaktion wurde ab 2005/06 die Schuleinschreibung um ein Jahr vorgezogen und Kindern, die von der Schulleitung als förderbedürftig in der Unterrichtssprache eingestuft wurden, ein Sprachticket zur Verfügung gestellt. Da die Wirksamkeit dieser Maßnahme nicht nachgewiesen werden konnte, kam es zu neuen Maßnahmen im Elementarbereich wie der Sprachförderung im Kindergarten ab 2008, einer Sprachstandsfeststellung ab 2009 und schließlich dem verpflichtenden letzten Kindergartenjahr ab 2010.
Die dritte Phase kann mit dem Jahr 2008 angesetzt werden. In diesem Jahr wurden einerseits verpflichtende Maßnahmen in der vorschulischen Bildung für Kinder mit sprachlichem Aufholbedarf eingeführt und andererseits die Abteilung „Migration, interkulturelle Bildung, Sprachenpolitik“ im Bundesministerium für Unterricht, Kunst und Kultur eingerichtet. Dort entstanden nachhaltige und breit angelegte Strategien mit Dutzenden Einzelmaßnahmen, die die seit Anfang der 1990er Jahre prägenden Vorgangsweisen (siehe oben) komplettierten. Darunter auch die Handlungsempfehlungen der OECDLänderprüfung „Migration und Schulbildung“ (Nusche, Shewbridge & Rasmussen, 2009).
Das seit Dezember 2013 umbenannte BMBF (Bundesministerium für Bildung und Frauen, früher Bundesministerium für Unterricht, Kunst und Kultur: BMUKK) beschreibt seine Vorgangsweise anhand von fünf Strategien (BMUKK, n. d.):
1. Stärkung der Schüler/innen mit anderen Erstsprachen als Deutsch,
2. Professionalisierung von Lehrkräften, Schulleitungen und Schulaufsicht,
3. Unterstützung der Eltern mit Migrationshintergrund,4. Initiativen in der Erwachsenenbildung für Personen mit
Migrationshintergrund,5. Sensibilisierung der Öffentlichkeit für Mehrsprachig
keit, Interkulturalität und Integration.
Abgesehen von den ressorteigenen Aktivitäten des Unterrichtsministeriums wird die Effektivität einschlägiger Maßnahmen durch öffentlichkeitswirksame Aktivitäten anderer Spitzenpolitiker/innen und Ressorts im Bereich der Migration/Integration wesentlich beeinflusst. Daher ist es relevant, dass in diese dritte Phase auch die Einrichtung einer Koordinierungsstelle für Integration 2008 im Bundesministerium für Inneres, der Ausbau des österreichischen Integrationsfonds zu einem Hauptakteur der Umsetzung integrationspolitischer Maßnahmen (www.oeif.at) sowie schließlich 2011 die Erfüllung der langjährigen Forderung
zivilgesellschaftlicher Akteure nach einem „Staatssekretariat für Integration“ (2011)3 fällt. Was in den Jahrzehnten zuvor in Form von wissenschaftlichen Publikationen (Boeckmann et al., 1988; Busch & de Cillia, 2003; Çinar, 1998; Fischer, 1986; Matuschek, 1982; Plutzar & KerschhoferPuhalo, 2009; Viehböck & Bratić, 1994) und zivilgesellschaftlichen Forderungen in die öffentliche Debatte eingebracht und medial kaum wahrgenommen wurde, erlebt in der dritten Phase durch die Verankerung auf ministerieller Ebene und entsprechende finanzielle Mittel eine deutliche Aufwertung.
In ihrer Gesamtheit sollten die vielfältigen Maßnahmen zu einer Erhöhung der Kompetenzen der Schüler/innen mit Migrationshintergrund führen. Allerdings kann dies mit den vorliegenden Daten aus PISA und PIRLS nur mit Einschränkungen geprüft werden. Einerseits weil die Kinder und Jugendlichen von neueren Maßnahmen noch nicht profitieren konnten. So kann die allgemein verpflichtende Maßnahme der Sprachförderung im Kindergarten frühestens bei Schülerinnen und Schülern des Geburtenjahrgangs 2003 (und daher erst bei PIRLS 2016 bzw. PISA 2021) Wirkung zeigen. Andererseits sind die Maßnahmen in der ersten Implementierungsphase meist nicht voll wirksam bzw. kann es auch vorher ähnliche Maßnahmen auf anderen Ebenen (Bundesland, Stadt, …), unter anderem Titel oder in anderer Ausprägung (Sprachticket für den freiwilligen Gebrauch) gegeben haben. Außerdem ist bei Längsschnittvergleichen die Veränderung der Gruppenzusammensetzung, sei es nach Herkunftsländern oder nach sozioökonomischem Hintergrund, zu beachten. Trotz all dieser einschränkenden Faktoren sind die Daten aus den PIRLS und PISAErhebungen aufgrund ihrer Qualität und Repräsentativität ein wichtiger Anhaltspunkt, um Kompetenzveränderungen festzustellen.
Die vorliegende Untersuchung
Die vorliegende Untersuchung ist die erste für Österreich, die die Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund systematisch über unterschiedliche Studien (PIRLS und PISA) und unterschiedliche Erhebungszeitpunkte (ab dem Jahr 2000 bis zum Jahr 2012) darstellt. Dabei wird den folgenden Fragen nachgegangen:
1. Gibt es Veränderungen in der Zusammensetzung der Schüler/innen mit Migrationshintergrund seit dem Jahr 2000? Konkret, gibt es Veränderungen in den Anteilen der Schüler/innen, die selbst zugewandert sind (1. Generation) bzw. deren Eltern zugewandert sind (2. Generation), gibt es Veränderungen nach dem Geburtsland der Eltern und nach dem familiären Sprachgebrauch?
2. Wie sehr hat sich das Ausmaß des Leistungsunterschieds
3 Gleichzeitig gelang es nicht, die übergeordnete Koordinierungsstelle vom Innenministerium ins Bundeskanzleramt zu übersiedeln. Die Agenden des Staatssekretariats für Integration wurden ab Dezember 2013 gemeinsam mit dem Amtsträger Sebastian Kurz erstmals ins „Bundesministerium für Europa, Integration und Äußeres (BMEIA)“ überführt.
70 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund im Zeitverlauf verändert?
3. Wie viel des jeweiligen Leistungsunterschieds kann durch Faktoren des sozialen Hintergrunds erklärt werden?
4. Wie haben sich die Anteile an leseschwachen Schülerinnen und Schülern (bei PISA sogenannte Risikoschüler/innen) unter jenen mit Migrationshintergrund entwickelt?
5. Wie und in welchem Ausmaß wird bei der Gestaltung schulischer Rahmenbedingungen auf Multikulturalität und Mehrsprachigkeit eingegangen?
Methode
Stichprobe
Die vorliegende Untersuchung inkludiert Daten aus folgenden internationalen Schülerleistungsstudien, an denen sich Österreich beteiligte: PIRLS 2006, PIRLS 2011, PISA 2000, PISA 2003, PISA 2006, PISA 2009 und PISA 2012. Alle Studien umfassten repräsentative Stichproben von jeweils mehr als 4500 Schülerinnen und Schülern. Bei PIRLS sind diese Stichproben repräsentativ für Schüler/innen der vierten Schulstufe (vgl. Suchań & Wintersteller, 2012). Bei PISA sind die Stichproben repräsentativ für Schüler/innen, die 16 Jahre vor der Erhebung geboren worden sind und demnach zum Zeitpunkt der Testung 15/16 Jahre alt sind (vgl. Schwantner & Schreiner, 2013). Bei PISA 2012 war dies der Geburtsjahrgang 1996 (d. h. Schüler/innen, die von 1. 1. 1996 bis 31. 12. 1996 geboren worden sind), bei PISA 2009 war es der Geburtsjahrgang 1993 usw. Bemerkenswert ist, dass ein Großteil der bei PIRLS 2006 getesteten Schüler/innen (56 %) im Jahr 1996 geboren worden ist und demnach genau dem Jahrgang angehört, der auch bei PISA 2012 getestet wurde. Dem Vergleich von PIRLS 2006 und PISA 2012 kommt daher ein besonderer Stellenwert zu.
Tabelle 2.1.1 gibt einen Überblick über die Geburtsjahrgänge der Schüler/innen unterschiedlicher PISAErhebungen und zeigt zudem, in welchen beiden Jahren der Großteil der Schüler/innen, der bei PIRLS teilgenommen hat, geboren worden ist.
Für alle Berechnungen zu PISA 2000 wurden die im Jahr 2003 neu adjustierten Gewichte verwendet (Neuwirth,
2006). Für PISA 2009 muss beachtet werden, dass es zu einem bislang nicht geklärten Leistungsrückgang kam (vgl. Bacher, 2012) und die Ergebnisse mit Vorsicht interpretiert werden sollten.
Verwendete Maße
Migrationshintergrund
In den Schülerfragebögen von PIRLS und PISA wurde erhoben, ob die Schüler/innen sowie deren Eltern innerhalb oder außerhalb Österreichs geboren wurden. Die Einstufung des Migrationshintergrunds erfolgt nach den Regeln der OECD (z. B. OECD, 2012). Dabei werden drei Gruppen unterschieden:
1. Einheimische Schüler/innen (= Schüler/innen ohne Migrationshintergrund): zumindest ein Elternteil wurde im Inland geboren, unabhängig vom Geburtsland des Kinds.
2. Schüler/innen zweiter Generation: Schüler/in wurde im Inland geboren, beide Elternteile jedoch im Ausland.
3. Schüler/innen erster Generation: Sowohl die Schülerin/der Schüler selbst als auch beide Elternteile wurden im Ausland geboren.
Wie oben angeführt, wurden bei PIRLS sowohl die Eltern als auch die Schüler/innen danach gefragt, ob Eltern und/oder Kind im In oder Ausland geboren worden sind. Wenn sich die Angaben von Eltern und Kindern widersprechen, werden jene der Eltern herangezogen. Fehlende Angaben wurden jeweils wechselseitig ergänzt. In den meisten der folgenden Analysen werden Schüler/innen erster und zweiter Generation zusammengefasst und als „Schüler/innen mit Migrationshintergrund“ bezeichnet.
Wenn keine Angaben zum Geburtsland des Kinds und zumindest eines Elternteils vorlagen, konnte der Migrationshintergrund nicht rekodiert werden. Dies war jedoch nur bei einem sehr geringen Anteil an Schülerinnen und Schülern der Fall (bei PISA zwischen 0,5 % im Jahr 2000 und 2,1 % im Jahr 2009, bei PIRLS zwischen bei 0,6 % im Jahr 2006 und bei 0,3 % im Jahr 2011). Schüler/innen mit fehlenden Werten wurden in den nachfolgenden Analysen zum Migrationshintergrund ausgeschlossen. Da der Anteil fehlender Werte gering ist, ist auch die Wahrscheinlichkeit einer Ergebnisverzerrung durch den Ausschluss dieser
Altersgruppe 15-/16-Jährige4. Schulstufe
(in der Regel 10-Jährige)
Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011
Geburtsjahrgang1 1984 1987 1990 1993 19961996 (56 %)1995 (41 %)
2001 (57 %) 2000 (40 %)
1 Bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren; bei PIRLS sind jene beiden Jahre eingetragen, in denen die meisten getesteten Schüler/innen geboren wurden. Der genaue Anteil steht in Klammern.
Tabelle 2.1.1: Einbezogene Studien nach Geburtsjahrgang der Schüler/innen
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 71
beruhen auf diesen reskalierten Werten. In allen Analysen, in denen der ESCSIndex als Kontrollvariable dient, wurde jeweils der originale Index verwendet (mit Ausnahme von PISA 2000, wo im Originaldatenfile noch keine ESCS Variable enthalten ist – hier wurde der im Rahmen von PISA 2009 nachskalierte Index verwendet). Der Anteil fehlender Werte schwankte beim ESCS zwischen 0,3 % bei PISA 2003 und 2,4 % bei PISA 2009. In der Erhebung 2012 lag dieser Anteil bei 1 %.
Für PIRLS gibt es keinen vergleichbaren Index. Als Maß für den sozialen Hintergrund wurden hier zwei Variablen herangezogen: a) die Bildung der Eltern (laut Elternangaben) umgerechnet in die Anzahl der Bildungsjahre; diese Umrechnung erfolgte entsprechend den Vorgaben der OECD (2013a) und b) die Anzahl der Bücher im Elternhaus laut Schülerangaben; dabei handelt es sich um eine fünfstufige Variable: von „keine oder sehr wenige (0–10)“ bis „drei oder mehr Bücherregale (200 oder mehr)“. Der Schüleranteil mit fehlenden Werten zur Bildung der Eltern lag bei PIRLS 2006 bei 6,6 % und bei PIRLS 2011 bei 5,7 %. Von 2,8 % der Schüler/innen lagen 2006 und von 2,2 % lagen 2011 keine Angaben zum Buchbesitz vor. Bei der Interpretation der Ergebnisse muss beachtet werden, dass der soziale Hintergrund bei PISA durch ein breiteres Variablenspektrum erfasst wird als bei PIRLS und kein direkter Vergleich möglich ist.
Zu Hause gesprochene Sprache
Sowohl bei PISA als auch bei PIRLS wurden die Schüler/innen gefragt, ob sie zu Hause (auch) eine andere Sprache als Deutsch sprechen. Der konkrete Fragewortlaut unterschied sich geringfügig zwischen den beiden Studien. Bei PIRLS wurde gefragt: „Wie oft sprichst du zu Hause Deutsch?“ Die Antwortkategorien waren: „Ich spreche zu Hause immer oder fast immer Deutsch“, „Ich spreche zu Hause manchmal Deutsch und manchmal eine andere Sprache“ und „Ich spreche zu Hause nie Deutsch“. Bei PISA wurden die Jugendlichen gefragt: „Welche Sprache sprichst du zu Hause am häufigsten?“ In einer Liste von konkreten Sprachen sollten sie dann die entsprechende ankreuzen. Der Anteil fehlender Werte schwankte bei PISA zwischen 2,9 % bei der Erhebung 2006 und 8,8 % bei der Erhebung 2012. Bei PIRLS fehlte die Angabe zur Sprache bei 13,4 % der Schüler/innen im Jahr 2006 und bei 1,3 % im Jahr 2011.
Lesekompetenz
Bei PIRLS wird Lesekompetenz definiert als „die Fähigkeit, jene geschriebenen Sprachformen zu verstehen und zu nutzen, die von der Gesellschaft verlangt werden und/oder für die jeweilige Person nützlich und wertvoll sind. Junge Leser/innen können die Bedeutung von verschiedensten Texten erfassen. Sie lesen, um zu lernen, um an der Ge
4 Mazedonien und Slowenien wurden zumindest bei einer Erhebung nicht gesondert abgefragt, weshalb diese beiden Länder in der Kategorie „Exjugoslawien“ nicht berücksichtigt werden.
Schüler/innen gering. Es soll dennoch darauf hingewiesen werden, dass fehlende Werte nicht zufällig sind, sodass leistungsschwächere Schüler/innen mit Migrationshintergrund aus unteren sozialen Schichten untererfasst werden (vgl. Bacher, 2009, S. 84).
Herkunftsland der Eltern
Bei PISA wurde ab der Erhebung von 2003 das Herkunftsland der Eltern ermittelt, indem die Schüler/innen in einer Liste von Ländern ankreuzen sollten, in welchem Land ihr Vater und in welchem Land ihre Mutter geboren wurde. Bei PISA 2000 wurden noch keine konkreten Geburtsländer erfragt. Bei PIRLS wurden die Eltern (im Elternfragebogen) gebeten, aus einer Liste von Ländern jenes anzukreuzen, in dem sie geboren wurden (getrennt für Mutter und Vater). Die nachfolgenden Analysen zum Geburtsland der Eltern basieren damit bei PISA auf Schülerangaben und bei PIRLS auf den Angaben der Eltern.
In den Analysen dieses Beitrags werden bei Kindern mit Migrationshintergrund folgende Herkunftsländer der Eltern unterschieden:
�� Türkei: beide Eltern wurden in der Türkei geboren;�� Exjugoslawien: Mutter und Vater stammen aus einem
der folgenden Staaten: Serbien, Montenegro, Kosovo, BosnienHerzegowina oder Kroatien4;�� anderes Land oder gemischte Herkunft: beide Eltern wur
den in einem anderen Land geboren oder die Eltern wurden in zwei unterschiedlichen Ländern geboren.
Sozialer Hintergrund
Der soziale Hintergrund wurde bei PISA im Index des ökonomischen, sozialen und kulturellen Status (ESCS) zusammengefasst. Der ESCSIndex setzt sich aus folgenden drei Indizes zusammen: a) der beruflichen Stellung der Eltern, b) der Bildung der Eltern, umgerechnet in Bildungsjahre, c) Besitztümer zu Hause (Wohlstandsindikatoren, kulturelle Besitztümer, Bildungsressourcen und Bücher). Der ESCSIndex wurde so standardisiert, dass der Mittelwert über alle OECDLänder bei 0 liegt und die Standardabweichung bei 1. Eine detaillierte Beschreibung des ESCSIndex findet sich in OECD (2012) und OECD (2013a). Dieser Index wird von der OECD (2013a) unter anderem herangezogen, um zu kontrollieren, wie viel des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch Unterschiede in der Verteilung der sozioökonomischen Merkmale der beiden Gruppen erklärt werden kann. Diesem Standard wird auch im vorliegenden Beitrag gefolgt. Für Trendanalysen wurde der ESCSIndex auf der Basis der Erhebung von 2012 reskaliert (vgl. OECD, 2013a). Alle Analysen zur zeitlichen Entwicklung des ESCS
72 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
meinschaft der Lesenden in der Schule sowie im täglichen Leben teilzunehmen und zum Vergnügen“ (Grafendorfer, WallnerPaschon, Suchan & Widauer, 2012, S. 13). Lesekompetenz bedeutet bei PISA „geschriebene Texte zu verstehen, zu nutzen, über sie zu reflektieren und sich mit ihnen auseinanderzusetzen, um eigene Ziele zu erreichen, das eigene Wissen und Potenzial weiterzuentwickeln und am gesellschaftlichen Leben teilzunehmen“ (Schwantner & Schreiner, 2013, S. 20). In beiden Definitionen bedeutet Lesen weit mehr, als einen Text vorlesen zu können. Es geht darum, die Bedeutung von Texten zu erfassen und das Gelesene für sich nutzen zu können.
Bei der ersten PIRLSErhebung im Jahr 2001 (an der sich Österreich noch nicht beteiligte) wurde die PIRLSLeseskala so verankert, dass der Mittelwert über alle damaligen Teilnehmerländer 500 beträgt und die Standardabweichung 100. Höhere Werte indizieren eine höhere Kompetenz. Eine genaue Beschreibung der Leseskala von PIRLS erfolgt bei Gonzalez (2003) sowie bei Foy, Brossman & Galia (2012). Die PISALeseskala wurde im Jahr 2000 so verankert, dass der Mittelwert über alle OECDLänder, die sich an PISA 2000 beteiligten, 500 beträgt, die Standardabweichung 100 (Adams & Carstensen, 2002). Die Konstruktion der PISALeseskala wird durch die OECD (2012) genauer beschrieben.
Durch diese Verankerung auf einen bestimmten Erhebungszeitpunkt können die Leistungen unterschiedlicher Erhebungszeitpunkte derselben Studie (PIRLS bzw. PISA) miteinander verglichen werden. So kann etwa festgestellt werden, ob sich die Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund über die Zeit hinweg verändert hat. Ein direkter Vergleich von Leistungswerten zwischen den beiden Studien ist allerdings nicht möglich, da sich die Skalierung auf unterschiedliche Länder (vgl. oben) und Leseframeworks bezieht.
Über den Umweg der Berechnung von Effektstärken (Cohen, 1988; Ellis, 2010) ist es jedoch möglich, die Größe der Leistungsunterschiede zwischen Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund über unterschiedliche Studien hinweg vergleichbar zu machen. So kann festgestellt werden, ob der Leistungsunterschied zwischen Schülerinnen und Schülern mit bzw. ohne Migrationshintergrund am Ende der Volksschule (PIRLS) oder am Ende der Schulpflicht (PISA) größer ist. In der Einführung zu diesem Bericht sowie in Kapitel 1.3 wird die Berechnung und Interpretation von Effektstärken genauer beschrieben.
Die Berechnungen erfolgten für PISA mit SPSS 21 unter Verwendung des Replicates AddIn 8.1. Für PIRLS wurde der IEAIDBAnalyzer Version 3.1 verwendet. Diese Programme berücksichtigen das komplexe Stichprobendesign der beiden Studien. Alle Analysen wurden mit gewichteten Daten durchgeführt. Jede Schülerin/jeder Schüler geht damit gemäß ihrem/seinem Anteil in der Population in die Analysen ein. Genauere Informationen zu Stichproben
design und Datengewichtung finden sich für PISA z. B. bei der OECD (2009) und für PIRLS bei Foy (2012). Alle Signifikanzprüfungen erfolgten auf einem AlphaNiveau von < 0.05. Die statistische Signifikanz von Mittelwertdifferenzen wurde mittels tTests für unabhängige Stichproben ermittelt. Bei Analysen mit PISADaten wurde in die Standardfehler der Differenz bei Trendvergleichen zusätzlich ein Link Error eingerechnet (vgl. OECD, 2013b, S. 281 ff.). Schüler/innen mit fehlenden Werten zumindest einer für die jeweilige Analyse relevanten Variable wurden von der jeweiligen Analyse ausgeschlossen.
Ergebnisse
Anteile und Zusammensetzung der Schüler/innen mit Migrationshintergrund im Zeitverlauf
Abbildung 2.1.1 zeigt, dass sich der Anteil an Schülerinnen und Schülern mit Migrationshintergrund unter den 15/16Jährigen von PISA 2000 (Geburtsjahrgang 1984) bis PISA 2012 (Geburtsjahrgang 1996) von 11 % auf 17 % erhöht hat. Es wird deutlich, dass der Anteil an Schülerinnen und Schülern mit Migrationshintergrund, der bereits in Österreich geboren wurde (2. Generation), in diesem Zeitraum stark zugenommen hat, während der Anteil jener, die selbst erst nach Österreich zugewandert sind (1. Generation), rückläufig ist. Bei einem Zeitvergleich, der nur die PISADaten (also 15/16Jährige) berücksichtigt, fällt auf, dass sich zwischen 2006 und 2009 eine deutliche Änderung in der Zusammensetzung ergeben hat. Während bis 2006 die selbst zugewanderten Jugendlichen eindeutig in der Überzahl waren, bilden ab 2009 die in Österreich gebore
0
2000
2003
2012
2006
2009
5
10
15
20
25%
%
Sch
üler
/inne
n (g
esam
t)
2006
2011
Schüler/innen mit Migrationshintergrund gesamt
vgl. Tabelle A.5 im Anhang für genaue Werte
1. Generation 2. Generation
PISA PIRLS
Abbildung 2.1.1: Entwicklung der Anteile von Kindern und Jugendlichen mit Migrationshintergrund
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 73
nen Jugendlichen (2. Generation) die Mehrheit unter den Jugendlichen mit Migrationshintergrund5.
Abbildung 2.1.2 zeigt den Anteil an Kindern und Jugendlichen mit Migrationshintergrund, der zu Hause (auch) eine andere Sprache als Deutsch spricht. Zu allen Erhebungszeitpunkten gaben zumindest 70 % der Schüler/innen mit Migrationshintergrund an, zu Hause (auch) eine andere Sprache als Deutsch zu sprechen. Bei PIRLS liegen die Anteile noch etwas höher als bei PISA. Dies könnte einerseits damit zu tun haben, dass bei PIRLS die Frage nach Mehrsprachigkeit weiter gefasst war: Während bei PIRLS auch jene Schüler/innen zu den Mehrsprachigen zählen, die zu Hause nur manchmal eine andere Sprache als Deutsch sprechen, sind es bei PISA nur diejenigen, die zu Hause am häufigsten eine andere Sprache als Deutsch sprechen (vgl. Methodenteil). Andererseits könnte gerade die Dauer des Schulbesuchs, die von der deutschen Sprache geprägt ist, zu einer vermehrten Benutzung des Deutschen auch zuhause und insbesondere unter den Geschwistern führen. Insgesamt zeigt sich jedoch für beide Studien, dass ein Migrationshintergrund eng mit Mehrsprachigkeit verknüpft ist. Dabei ist zu beachten, dass etwa bei PISA 2012 4 % der zugewanderten Eltern aus Deutschland stammen und daher Deutsch mit großer Wahrscheinlichkeit ihre Erstsprache ist. Daten der BildungsstandardBaselineErhebung 2010 (4. Schulstufe) zeigen, dass in den meisten Herkunftsgruppen (z. B. Eltern aus der Türkei oder dem ehemaligen Jugoslawien) knapp über 10 % der zugewanderten Familien nur Deutsch zuhause sprechen, zwei Drittel bis drei Viertel Deutsch und eine andere Sprache und die verbleibenden 13 % bis 22 % (je nach Herkunftsgruppe) nur eine andere Sprache als Deutsch (Vogtenhuber et al., 2012, S. 25).
In Abbildung 2.1.3 wird der Anteil an Kindern und Jugendlichen mit Migrationshintergrund getrennt nach dem Geburtsland ihrer Eltern dargestellt. Bei PISA 2000 wurden noch keine konkreten Geburtsländer der Eltern erhoben. Bei PISA 2003 (Geburtsjahrgang 1987) zeigte sich, dass fast die Hälfte aller Jugendlichen mit Migrationshintergrund (46 %) Eltern hatten, die im ehemaligen Jugoslawien geboren worden waren. Jeweils weniger als 30 % hatten Eltern, die aus der Türkei (25 %) oder einem anderen Land (29 %) zugewandert waren. Die neuesten Erhebungen zeigen eine Zunahme an Schülerinnen und Schülern, deren Eltern aus anderen Ländern als der Türkei oder Exjugoslawien stammen. Diese machen nun 44 % der Kinder mit Migrationshintergrund in den Volksschulen aus (PIRLS 2011) und 37 % der 15/16Jährigen (PISA 2012). Die Vielfalt der Herkunftsländer ist insgesamt größer geworden.
Die Zusammensetzung der Schüler/innen mit Migrationshintergrund wird damit heterogener. Ein immer größerer Teil stammt nicht mehr aus den klassischen Zuwanderungsländern Exjugoslawien und Türkei, sondern aus einer Vielzahl unterschiedlicher Länder. Angesichts der immer größeren Anteile von Schülerinnen und Schülern mit Migrationshintergrund und auch ihrer größeren Diversität wird in der Folge untersucht, inwiefern dieser gesteigerten Multikulturalität im Unterrichtsalltag entsprochen wird.
PISA PIRLS
0
2000
2003
2012
2006
2009
20
40
60
80
100
10
30
50
70
90%
%
Sch
üler
ante
il m
it M
igra
tions
hint
ergr
und,
der
zwei
spra
chig
ist
2006
2011
7771
78 74 73
8879
5 Diese Veränderungen können mit einer sich verändernden Zusammensetzung der Elterngenerationen als Folge von politischen Gegebenheiten in den Auswanderungsländern zusammenhängen (z. B. keine Kriegsflüchtlinge mehr aus Exjugoslawien), aber auch mit Veränderungen in der Einwanderungspolitik Österreichs (z. B. Regelung des Familiennachzugs).
Abbildung 2.1.2: Anteile an Kindern und Jugendlichen mit Migrationshintergrund nach Sprachgebrauch zu HauseAbbildung 2.1.3: Entwicklung der Anteile von Kindern und
Jugendlichen mit Migrationshintergrund nach Herkunftsland der Eltern
0
2000
*
PISA PIRLS
2003
2012
2006
2009
10
20
30
40
50%
%
Sch
üler
/inne
n m
it M
igra
tions
hint
ergr
und
5
15
25
35
45
2006
2011
anderes Land oder gemischte Herkunft
Eltern in Exjugoslawien geborenEltern in der Türkei geboren
*Herkunftsland nicht erhoben
vgl. Tabelle A.5 im Anhang für genaue Werte
74 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
Die Beachtung von Mehrsprachigkeit und Multikulturalität im Unterrichtskontext
Im Rahmen von PIRLS und PISA wurden auch einige Fragen zum Unterrichtskontext gestellt, die sich auf Multikulturalität und Mehrsprachigkeit beziehen, vor allem auf die Kompetenzen der Lehrpersonen und die Aktivitäten der Schulleitungen. Diese Maßnahmen im Aus und Weiterbildungsbereich, aber auch die Durchführung entsprechender Aktivitäten im Schulalltag finden sich auch im Maßnahmenkatalog des BMUKK (n. d.) und wurden in den Nationalen Aktionsplan für Integration 2012 (Bundesministerium für Innere Angelegenheiten, 2012) aufgenommen. Kenntnisse zur Sprachentwicklung mehrsprachiger Kinder sowie zur Entwicklung von Deutsch als Zweitsprache sind besonders wichtig zur Führung mehrsprachiger Klassen. Daher wurden die Lehrkräfte bei PIRLS 2006 und bei PIRLS 2011 gefragt, wie intensiv sie sich im Rahmen ihrer Aus und Fortbildung mit Deutsch als Fremdsprache beschäftigt haben.
Im Jahr 2006 wurden 61 % der Kinder von Lehrkräften unterrichtet, die angaben, überhaupt keine derartige Aus oder Fortbildung zu haben, im Jahr 2011 waren es immer noch 57 % (vgl. Abb. 2.1.4). Darüber hinaus wurde analysiert, wie hoch der Anteil an Kindern mit Migrationshintergrund ist, deren Lehrkraft sich in der Aus und Fortbildung mit Deutsch als Fremdsprache beschäftigt hat. Hier zeigt sich, dass bei PIRLS 2011 45 % der Kinder mit Migrationshintergrund von einer Lehrkraft ohne entsprechende Aus oder Fortbildung unterrichtet worden sind. 42 % der Kinder mit Migrationshintergrund wurden von einer Lehrkraft unterrichtet, die im Rahmen ihrer Aus und Fortbildung einen Überblick oder eine Einführung in das Gebiet erhalten hat, nur 13 % der Kinder mit Migrationshintergrund hatten eine
Lehrkraft, die sich in ihrer Ausbildung schwerpunktmäßig mit „Deutsch als Fremdsprache“ auseinandergesetzt hat. Der Zeitvergleich zeigt, dass seit 2006 die Zahl der Lehrkräfte, die zumindest einen Überblick oder eine Einführung aufweisen kann, größer geworden ist. Dieser Anteil ist von 39 % bei PIRLS 2006 auf 44 % bei PIRLS 2011 gestiegen und der Anteil ohne derartige Ausbildung wurde geringer. Jedoch hatten 2011 (mit 13 %) sogar etwas weniger Kinder mit Migrationshintergrund eine Lehrkraft, die einen Schwerpunkt in dieser Ausbildung vorweisen konnte, als 2006 (17 %).
In diesem Zusammenhang bemängelt auch die Europäische Kommission (2013), dass in Österreich Kompetenzen im Bereich der kulturellen Diversität und Deutsch als Fremdsprache keine Voraussetzung sind, um Schüler/innen mit Migrationshintergrund unterrichten zu dürfen.
Im Rahmen von PISA 2012 wurden die Schulleiter/innen unter anderem gefragt, wie viele Lehrer/innen mit einer anderen Erstsprache als Deutsch an ihrer Schule beschäftigt sind und ob es an ihrer Schule im laufenden Schuljahr Aktivitäten gibt, die sich auf das Leben in einer multikulturellen Gesellschaft beziehen (interkulturelle Kompetenz, Antidiskriminierung, rassismusfreie Schule). Es wird deutlich, dass insgesamt 61 % der 15/16Jährigen ohne Migrationshintergrund und 68 % der Jugendlichen mit Migrationshintergrund eine Schule besuchten, in der es im Schuljahr 2011/12 laut Schulleiterangaben solche Aktivitäten gab. Dies bedeutet umgekehrt auch, dass fast ein Drittel der Jugendlichen mit Migrationshintergrund eine Schule besuchte, in der keine solche Aktivität durchgeführt wurde.
Analysen zum Lehreranteil mit einer anderen Erstsprache als Deutsch zeigen, dass 55 % der Jugendlichen von PISA 2012 eine Schule besuchen, in der es keine einzige Lehrkraft mit einer anderen Erstsprache als Deutsch gibt. Weitere 35 % besuchen eine Schule, in der es zwar zumindest eine Lehrkraft mit anderer Erstsprache gibt, ihr Anteil am Lehrkörper aber weniger als 5 % ausmacht. 15/16Jährige kommen damit im Rahmen ihrer Ausbildung nur sehr selten mit Lehrkräften, die eine andere Erstsprache sprechen, in Berührung.
Entwicklung der Lesekompetenz von Kindern und Jugendlichen mit Migrationshintergrund
Die bisher vorgestellten Ergebnisse haben gezeigt, dass die Schülerschaft kulturell vielfältiger wird und wie dieser Vielfalt im Unterrichtsalltag entsprochen wird. Im Folgenden wird der Frage nachgegangen, inwiefern sich die Lesekompetenz der Schüler/innen mit Migrationshintergrund im vergangenen Jahrzehnt verändert hat.
Abbildung 2.1.5 zeigt die Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit und ohne Migrationshintergrund im Zeitvergleich. Die Mittelwerte der Schüler/innen mit Migrationshintergrund werden durch dunkelrote Rautensymbole dargestellt, jene der Einheimischen mittels
0 20
gesamt
gesamt
mit Migrations-hintergrund
mit Migrations-hintergrund
40 60 80 100% %
PIRLS2006
PIRLS2011
PIRLS2006
PIRLS2011
keine Ausbildung im Bereich „Deutsch als Fremdsprache“
Schüleranteil, der von einer Lehrkraft mitentsprechender Qualifikation unterrichtet wird
Überblick oder Einführung in das Gebiet„Deutsch als Fremdsprache“ war ein Schwerpunkt
61 30 9
57 34 10
50 34 17
45 42 13
Abbildung 2.1.4: Aus- und Fortbildung der Lehrer/innen im Bereich „Deutsch als Fremdsprache“ (PIRLS 2006 & 2011)
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 75
hellroter Rautesymbole. Darüber hinaus sind für alle Mittelwerte die 95ProzentKonfidenzintervalle eingetragen (vgl. „Zur Interpretation der Ergebnisse“ in der Einführung zu diesem Bericht). Da sich der Geburtsjahrgang der bei PISA 2012 und PIRLS 2006 getesteten Schüler/innen zum Großteil deckt (Jahrgang 1996), wird in den folgenden Abbildungen PIRLS 2006 immer im Anschluss an PISA 2012 präsentiert. Diese chronologische Darstellung nach Geburtsjahrgang bringt es mit sich, dass die Ergebnisse für ältere Schüler/innen (PISA) vor den Ergebnissen jüngerer Schüler/innen (PIRLS) angeführt werden.
Der Vergleich der PISAErhebungen von 2000 und 2012 zeigt, dass sich die Lesekompetenz der Jugendlichen mit Migrationshintergrund signifikant verbessert hat: von 409 Punkten im Jahr 2000 auf 449 Punkte im Jahr 2012. Die Lesekompetenz der Jugendlichen ohne Migrationshintergrund ist hingegen etwa gleich geblieben (502 Punkte im Jahr 2000 und 499 Punkte im Jahr 2012). Dass 15jährige Schüler/innen mit Migrationshintergrund seit dem Jahr 2000 immer besser lesen (abgesehen von PISA 2009), diejenigen ohne Migrationshintergrund ihre Kompetenzen im Vergleich zu PISA 2000 aber nicht verbessern konnten, hat zur Folge, dass sich die Leistungsunterschiede zwischen diesen beiden Gruppen verringern. Während die Effektstärke des Leistungsunterschieds bei PISA 2000 noch d = –0,94 (großer Effekt) und 93 Leistungspunkte betrug, sind es bei PISA 2012 nur mehr 51 Leistungspunkte und der Effekt erreicht eine mittlere Größe (–0,56; siehe auch Tab. 2.1.2, Modell 1). Bei PIRLS entwickelt sich die Lesekompetenz bei den Kindern mit Migrationshintergrund weniger negativ als bei den Kindern ohne Migrationshintergrund. Bei
Ersteren beträgt der Leistungsrückgang von 2006 auf 2011 nur zwei Punkte und ist statistisch nicht signifikant. Kinder ohne Migrationshintergrund schneiden hingegen 2011 signifikant schlechter ab als 2006 (–10 Punkte; vgl. Abb. 2.1.5, rechte Grafik). Es ist somit der Unterschied in der Lesekompetenz zwischen Kindern mit und ohne Migrationshintergrund kleiner geworden: Während diese im Jahr 2006 noch 49 Kompetenzpunkte trennten (d = –0,77), sind es im Jahr 2011 nur mehr 42 Punkte (d = –0,67; siehe auch Tab. 2.1.3, Modell 1).
Auch wenn die vorliegenden Ergebnisse zeigen, dass die Leistungsunterschiede zwischen Kindern und Jugendlichen mit und ohne Migrationshintergrund geringer werden, muss im Auge behalten werden, dass über alle Erhebungszeitpunkte und über alle Studien (PISA und PIRLS) hinweg Schüler/innen mit Migrationshintergrund eine wesentlich geringere Lesekompetenz aufweisen als jene ohne. Dieser Unterschied ist stets statistisch signifikant und von mittlerer bis hoher praktischer Bedeutsamkeit (vgl. Tab. 2.1.3, Modell 1).
Für Kinder und Jugendliche macht es einen Unterschied, ob sie bereits im Einwanderungsland der Eltern geboren wurden (2. Generation) oder ob sie selbst eingewandert sind (1. Generation). Vergleicht man die erste und zweite Generation in ihren Leseleistungen, muss man allerdings auf ihre interne Zusammensetzung und die Veränderung derselben über die Zeit achten. Abbildung 2.1.6 zeigt die Leistungsentwicklung von Migrantinnen/Migranten der ersten und zweiten Generation im Trendvergleich. Seit dem Jahr 2000 kam es bei PISA insbesondere bei den 15Jährigen, die selbst mit ihren Eltern zugewandert sind – der ersten Ge
Schüler/innen mit Migrationshintergrund Schüler/innen ohne Migrationshintergrund
PISA
2000 2003 2006 2009 2012350
400
450
500
550
2006Erhebungsjahr
Geburtsjahr der gestesteten Schüler/innen1
2011
1984 1987 1990 1993 1996 1996 2001
450
500
550
600
Lese
kom
pete
nz
hoch
nied
rig
PIRLS
Mittelwert
Manche Konfidenzintervalle sind aufgrund ihrer geringen Größe nicht sichtbar
vgl. Tabelle A.6 im Anhang für genaue Werte
1Bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren; bei PIRLS ist jenes Jahr eingetragen, in dem der Großteil der getesteten Schüler/innen geboren wurde.
Konfidenzintervall (+/– 1.96 SE)}
Abbildung 2.1.5: Entwicklung der Lesekompetenz von Schülerinnen und Schülern mit und ohne Migrationshintergrund
76 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
neration – zu einer deutlichen und statistisch signifikanten Leistungssteigerung (plus 46 Punkte von 2000 auf 2012). Auch Jugendliche der zweiten Generation erreichten eine höhere Punktanzahl (plus 22 Punkte von 2000 auf 2012) – dieser Zuwachs ist jedoch statistisch nicht signifikant. Für die aktuellsten Erhebungen (PIRLS 2011 und PISA 2012) zeigt sich, dass Schüler/innen mit Migrationshintergrund, die bereits in Österreich geboren sind (2. Generation), keine signifikant besseren Leseleistungen aufweisen als Schüler/innen, die erst im Laufe ihres Lebens nach Österreich zugewandert sind (1. Generation).
Abbildung 2.1.7 zeigt die Leistungsentwicklung von Schülerinnen und Schülern mit Migrationshintergrund getrennt nach ihrem Herkunftsland. Es wird deutlich, dass Schüler/innen, deren Eltern in der Türkei geboren wurden, die relativ schwächste Lesekompetenz aufweisen. Schüler/innen mit Eltern aus Exjugoslawien liegen im Mittelfeld und lesen etwa gleich gut wie Schüler/innen mit Migrationshintergrund im Durchschnitt. Die relativ leistungsstärksten Schüler/innen mit Migrationshintergrund finden sich in der Gruppe „anderes Herkunftsland“. Das sind Kinder und Jugendliche mit Migrationshintergrund, die ihre Wurzeln nicht in Exjugoslawien oder der Türkei haben oder deren Eltern aus zwei unterschiedlichen Ländern stammen. Diese Gruppe besteht bei PISA 2012 zu 12 % aus Jugendlichen, deren Eltern aus Deutschland zugewandert sind und damit im Regelfall die gleiche Muttersprache haben wie einheimische Schüler/innen. Würde man die deutschen Schüler/innen aus der Berechnung ausschließen, würde sich der Mittelwert der Gruppe „andere oder gemischte Herkunft“ geringfügig verringern, von 481 auf 475 Punkte. Der Gesamtmittelwert der Jugendlichen mit Migrationshinter
grund würde unter Ausnahme der deutschen Jugendlichen leicht von 449 auf 445 Punkte zurückgehen. Das heißt, selbst bei PISA 2012, wo der Anteil deutschstämmiger Jugendlicher unter allen Erhebungen bisher am größten ist, spielt diese Gruppe kaum eine Rolle für die Leistungsentwicklung der Jugendlichen mit Migrationshintergrund insgesamt.
Es muss darauf hingewiesen werden, dass sich die unterschiedlichen Migrantengruppen in ihrem sozialen Hintergrund stark unterscheiden. Den eindeutig niedrigsten ESCS (ökonomischen, sozialen und kulturellen Status) weisen türkischstämmige Schüler/innen auf (M = –1,17; SE = 0,07), der ESCS für Jugendliche, die aus Exjugoslawien stammen, liegt signifikant höher (M = –0,54; SE = 0,04) und Jugendliche anderer oder gemischter Herkunft (M = –0,05; SE = 0,07) weisen einen signifikant höheren ESCS auf als beide eben genannten Gruppen (bezogen auf PISA 2012)6. Bei der Interpretation der Leseleistungen muss stets dieser ungleiche soziale Hintergrund mitbedacht werden. Wenn man die unterschiedliche soziale Herkunft statistisch kontrolliert, dann verringert sich bei PISA 2012 der Leistungsnachteil türkischer Jugendlicher von 87 auf 36 Punkte, bei exjugoslawischen von 60 auf 32 Punkte und bei Jugendlichen anderer oder gemischter ausländischer Herkunft von 18 auf 9 Punkte – jeweils gegenüber den Jugendlichen ohne Migrationshintergrund.
Im Zeitvergleich wird deutlich, dass sich die Lesekompetenz der türkischstämmigen Jugendlichen zuerst lange Zeit auf dem etwa gleichen Niveau befunden hat, bei PISA 2012 aber deutlich angestiegen ist: Während der Durchschnittswert dieser Gruppe in allen vorhergehenden PISAErhebungen
2006 2011
PIRLS
3502000
PISA
2003 20122006 2009
370
390
410
430
470
450
490
460
470
480
490
510
500
520
Lese
kom
pete
nz
hoch
nied
rig
Lese
kom
pete
nz
hoch
nied
rig
1. Generation
2. Generation
Schüler/innen mit Migrationshintergrund gesamt
Mittelwert Konfidenzintervall (+/– 1.96 SE)}
vgl. Tabelle A.6 im Anhang für genaue Werte
Abbildung 2.1.6: Leseleistungsentwicklung: 1. und 2. Generation im Vergleich
6 Jugendliche ohne Migrationshintergrund haben einen mittleren ESCS von 0,19 (SE = 0,02).
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 77
maximal 372 Punkte betrug, verbesserte er sich bei PISA 2012 signifikant auf 412 Punkte. Auch bei PIRLS lässt sich ein tendenzieller Leistungsanstieg bei den türkischstämmigen Kindern erkennen, während bei den anderen Gruppen die Tendenz eher rückläufig ist. Der Leistungsrückstand der türkischstämmigen Schüler/innen zu jenen der anderen Herkunftsgruppen ist damit sowohl bei PISA als auch bei PIRLS in neuester Zeit kleiner geworden.
Bildungsgerechtigkeit spiegelt sich nicht nur in (möglichst geringen) Mittelwertsunterschieden wider, sondern auch darin, dass möglichst alle Schüler/innen grundlegende Fähigkeiten erwerben sollen. Schüler/innen, die bei PISA oder PIRLS nur maximal Kompetenzstufe 1 erreichen, fehlt es an grundlegenden Lesefertigkeiten für die aktive Teil habe an der Gesellschaft. Abbildung 2.1.8 zeigt getrennt nach Migrationshintergrund, wie viele Schüler/innen zu den Leseschwachen7 zählen. Es wird deutlich, dass der Anteil an Schülerinnen und Schülern mit Migrationshintergrund unter den Leseschwachen zwar beständig kleiner wird (mit Ausnahme von PISA 2009), aber noch immer beachtlich hoch ist: Während im Jahr 2000 51 % der Jugendlichen mit Migrationshintergrund zur Risikogruppe zählten, sind es im Jahr 2012 mit 34 % zwar deutlich weniger, aber immer noch mehr als ein Drittel. Bei den Schülerinnen und Schülern ohne Migrationshintergrund ist der Risikoschüleranteil (mit 15 % im Jahr 2000 und 16 % im Jahr 2012) jedoch etwa gleich geblieben. Bei PIRLS zählen 2006 und 2011 konstant 37 % der Viertklässler/innen zu den Leseschwachen. Bei den Einheimischen ist der Anteil Leseschwacher jedoch größer geworden: von 12 % im Jahr 2006 auf 16 % im Jahr 2012. So zeigt sich auch beim Anteil leseschwacher Schüler/innen bei jenen mit Migrationshintergrund eine
vergleichsweise bessere Entwicklung als bei jenen ohne – sowohl für PISA als auch für PIRLS. Dennoch ist der Anteil an Schülerinnen und Schülern mit Migrationshintergrund, der zur Risikogruppe gehört, mit 34 % (bei PISA 2012) bzw. 37 % (bei PIRLS 2011) nach wie vor mehr als doppelt so hoch wie bei den Einheimischen mit 16 % (sowohl bei PISA 2012 als auch bei PIRLS 2011).
Es wurde bereits wiederholt gezeigt, dass Schüler/innen mit Migrationshintergrund im Durchschnitt unter schlechteren sozialen Bedingungen leben als Schüler/innen der Mehrheitsbevölkerung (z. B. Breit, 2009a; HerzogPunzenberger
PISA300
2000 2003 20122006 2009
340
380
320
360
400
440
500
480
420
460
Schüler/innen mit Migrationshintergrund gesamtanderes Land oder gemischte Herkunft
Lese
kom
pete
nz
hoch
nied
rig Lese
kom
pete
nz
hoch
nied
rig
Mittelwert Konfidenzintervall (+/– 1.96 SE)
2006
PIRLS
2011420
440
480
460
500
540
520
Eltern in Exjugoslawien geborenEltern in der Türkei geboren
vgl. Tabelle A.6 im Anhang für genaue Werte
}
Abbildung 2.1.7: Leseleistungsentwicklung nach Herkunftsland
PIRLS
2006
2011
0
20
40
60
10
30
50
%
%
Sch
üler
ante
il au
f ode
r un
ter
Leve
l 1PISA
2000
2003
2012
2006
2009
51
42 40
50
3437 37
15 17 1823
1612
16
Schüler/innen ohne MigrationshintergrundSchüler/innen mit Migrationshintergrund
Abbildung 2.1.8: Entwicklung des Anteils an Risikoschüler-innen und -schülern bei PISA bzw. leseschwacher Schüler/
innen bei PIRLS nach Migrationshintergrund
7 Es handelt sich hierbei um Schüler/innen, die maximal Kompetenzstufe 1 erreichen. Bei PISA werden diese Schüler/innen auch als „Risikogruppe“ bezeichnet.
78 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
& Gapp, 2009) und ein wesentlicher Teil der Leistungsunterschiede zwischen diesen beiden Gruppen durch ihre soziale Herkunft erklärt werden kann (Breit, 2009b; Unterwurzacher, 2009). Auch die PISA2012Daten zeigen, dass Jugendliche mit Migrationshintergrund (M = –0,49) einen signifikant schlechteren ökonomischen sozialen und kulturellen Status (ESCS) aufweisen als jene ohne (M = 0,19). Im Zeitvergleich (PISA 2000 zu PISA 2012) wird deutlich, dass der ESCS der Jugendlichen mit Migrationshintergrund (plus 0,42 Indexpunkte) etwa im gleichen Umfang gestiegen ist, wie bei den Jugendlichen ohne Migrationshintergrund (plus 0,40 Indexpunkte). Dass der Leistungsunterschied in Lesen zwischen Jugendlichen mit und ohne Migrationshintergrund kleiner geworden ist, kann somit definitiv nicht durch eine Verringerung sozialer Unterschiede erklärt werden. Denkbar wäre jedoch, dass sich die Wirkung des sozialen Hintergrunds verstärkt hat, sodass der gleiche Unterschied zu größeren Differenzen führt.
Die Tabellen 2.1.2 und 2.1.3 (jeweils Modell 2) zeigen die Ergebnisse von Regressionsmodellen, in denen nach dem ökonomischen sozialen und kulturellen Status (ESCS) kontrolliert wird. Es wird deutlich, dass je nach Studie 30–54 % des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch soziale Faktoren erklärt werden können. Wird beispielsweise bei PISA 2012 nach dem sozialen Hintergrund kontrolliert, verringert sich der Leistungsunterschied von 51 auf 23 Punkte. Bemerkenswert ist, dass der soziale Hintergrund über die Zeit hinweg immer mehr Varianz in den (rückläufigen) Leistungsunterschieden erklärt: Konnten bei PISA 2000 nur 30 % des Leistungsunterschieds zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund auf den sozialen Hintergrund zurückgeführt werden, sind es bei PISA 2012 54 %. Leistungsunterschiede werden also insgesamt kleiner und sie können in einem immer stärkeren Umfang auf soziale Faktoren zurückgeführt werden, ob
Tabelle 2.1.2: Unterschiede in der Lesekompetenz zwischen Jugendlichen mit und ohne Migrationshintergrund: ohne und mit Kontrolle des sozialen Hintergrunds (PISA 2000, 2003, 2006, 2009, 2012)
PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012
B SE B SE B SE B SE B SE
Modell 1
Konstante 502.48** 2.84 501.46** 3.81 499.07** 3.45 481.97** 2.95 499.09** 2.73
Migrationshintergrund –93.28** 7.89 –75.73** 8.47 –60.86** 13.90 –68.21** 6.75 –50.54** 5.78
R2 .09 .06 .04 .06 .04
Effektstärke des Leistungs-unterschieds zwischen Einheimischen und Migrant/innen (ohne Kontrolle des sozialen Hintergruns)
–0.94 –0.74 -0.55 –0.71 -0.56
Modell 2
Konstante 500.27** 2.77 496.61** 2.83 487.18** 3.53 474.76** 2.86 492.06** 2.68
Migrationshintergrund –64.99** 7.13 –41.87** 6.80 –34.40** 10.22 –37.02** 6.67 –23.33** 5.54
ESCS 36.87** 2.40 49.80** 2.39 43.11** 3.08 43.23** 2.39 39.13** 2.51
R2 .18 .23 .14 .18 .16
Effektstärke des Leistungs-unterschieds zwischen Einheimischen und Migrant/innen unter Kontrolle des sozialen Hintergrunds
–0.65 –0.41 –0.31 –0.38 -0.26
Anteil (%) des Leistungs-unterschieds zwischen Einheimischen und Migrant/innen, der durch den sozialen Hintergrund erklärt wird1
30 45 43 46 54
**Werte sind signifikant (p < .01); 1berechnet als (1-(B-Koeffizient zum Migrationshintergrund aus Modell 2/B-Koeffizient zum Migrations-hintergrund aus Modell 2))*100.
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 79
wohl der Unterschied im ESCS zwischen Jugendlichen mit und ohne Migrationshintergrund im Jahr 2012 etwa gleich hoch ausfällt wie im Jahr 2000.
Wie in der Einleitung erwähnt, kommt dem Vergleich von PIRLS 2006 mit PISA 2012 eine besondere Bedeutung zu, da sich die Schülerkohorte zu großen Teilen deckt. Beim Vergleich dieser beiden Studien zeigt sich, dass die Effektstärke des Leistungsunterschieds zwischen Schülerinnen
und Schülern mit und ohne Migrationshintergrund am Ende der Grundschule deutlich höher liegt (d = –0,77) als bei PISA (d = –0,56). Dies deutet darauf hin, dass die Leistungskluft zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund mit zunehmender Beschulung geringer wird8.
In der Folge werden die wichtigsten Ergebnisse zusammengefasst und mögliche Gründe für die positive Leistungsentwicklung bei Jugendlichen mit Migrationshintergrund diskutiert.
Diskussion
Wie bereits mehrfach für die Allgemeinbevölkerung dokumentiert (z. B. Statistik Austria, 2013), zeigt der vorliegende Beitrag, dass auch bei den Jugendlichen in der Schule der Migrantenanteil seit der Jahrtausendwende deutlich gestiegen ist. Unter den 15/16Jährigen hatten im Jahr 2000 11 % einen Migrationshintergrund (d. h. beide Elternteile wurden im Ausland geboren), im Jahr 2012 waren es 17 %. Und aus den neuesten Volksschuldaten zeichnet sich ab, dass auch dieser Anteil weiter steigen wird. So haben bei PIRLS 2011 19 % der Viertklässler/innen einen Migrationshintergrund. Auch zeigen die vorliegenden Ergebnisse, dass die kulturelle Vielfalt unter den Kindern mit Migrationshintergrund größer geworden ist. So stammen bei PIRLS 2011 nur mehr 55 % der Schüler/innen mit Migrationshintergrund aus den klassischen Zuwanderungsländern Exjugoslawien und Türkei (bei PISA 2003 waren es noch 71 %) und ein Anteil von 45 % kommt aus einer Vielzahl weiterer Länder.
Der vorliegende Beitrag zeigt erstmals für den langen Zeitraum von 12 Jahren, wie sich die Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund in Österreich entwickelt hat. Bei PISA konnte hier eine wesentliche Verringerung des Leistungsunterschieds zwischen Jugendlichen mit und ohne Migrationshintergrund festgestellt werden: Während im Jahr 2000 15/16Jährige mit Migrationshintergrund noch hoch bedeutsam (–93 Punkte) hinter Gleichaltrigen ohne Migrationshintergrund zurücklagen, fällt der Leistungsunterschied im Jahr 2012 mit 51 Punkten wesentlich geringer aus. Es muss aber dennoch betont werden, dass auch dieser Unterschied nach wie vor beträchtlich und statistisch signifikant ist.
Trendergebnisse belegen, dass sich die Leistungskluft zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund immer mehr schließt, weil sich die Lese
8 Hierbei muss bedacht werden, dass bei PISA etwa 5 % der Jugendlichen nicht mehr im Schulsystem zu finden sind (vgl. Pareiss, 2013). Es kann angenommen werden, dass es sich dabei überwiegend um sehr leistungsschwache Schüler/innen (oft mit Migrationshintergrund) handelt. Würden die Leistungen aller 15/16Jährigen erfasst werden und nicht nur jene der beschulten, würde der Leistungsunterschied zwischen Jugendlichen mit und ohne Migrationshintergrund bei PISA wahrscheinlich höher ausfallen.
PIRLS 2006 PIRLS 2011
B SE B SE
Modell 1
Konstante 546.72** 1.93 536.79** 1.74
Migrationshintergrund –49.17** 3.10 –41.70** 3.63
R2 .08 .07
Effektstärke des Leistungsunterschieds zwischen Einheimi-schen und Migrant/in-nen (ohne Kontrolle des sozialen Hintergrunds)
–0.77 –0.67
Modell 2
Konstante 439.53** 8.05 422.66** 6.30
Migrationshintergrund –27.70** 2.71 –22.66** 3.75
Bildung der Eltern (umgerechnet in Jahre)
5.44** 0.56 5.35** 0.51
Buchbesitz 12.25** 1.21 13.98** 1.05
R2 .16 .18
Effektstärke des Leis-tungsunterschieds zwi-schen Einheimischen und Migrant/innen unter Kontrolle des sozialen Hintergrunds
–0.43 –0.36
Anteil (%) des Leis-tungsunterschieds zwi-schen Einheimischen und Migrant/innen, der durch den sozialen Hintergrund erklärt wird1
44 46
**Werte sind signifikant (p < .01); 1berechnet als (1-(B-Koeffizi-ent zum Migrationshintergrund aus Modell 2/B-Koeffizient zum Migrationshintergrund aus Modell 2))*100.
Tabelle 2.1.3: Unterschiede in der Lesekompetenz zwischen Kindern mit und ohne Migrationshintergrund: ohne und mit
Kontrolle des sozialen Hintergrunds (PIRLS 2006, 2011)
80 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
kompetenz bei Jugendlichen mit Migrationshintergrund von PISA 2000 auf PISA 2012 positiv entwickelt hat (+39 Punkte), während sie bei Jugendlichen ohne Migrationshintergrund konstant geblieben ist (–3 Punkte, n. s.). Bei PIRLS ist die Lesekompetenz der Kinder mit Migrationshintergrund von 2006 auf 2011 etwa gleich geblieben (–2 Punkte, n. s.), Kinder ohne Migrationshintergrund haben sich hingegen signifikant verschlechtert (–10 Punkte).
Bemerkenswert ist die positive Entwicklung der Lesekompetenz von Jugendlichen mit türkischen Wurzeln. Zwischen 20039 und 2009 waren die Leistungswerte ungefähr gleich geblieben, verbesserten sich aber 2012 sehr deutlich um 40 Punkte. Und dies, obwohl der soziale Status bei den türkischen Jugendlichen im Zeitverlauf (2003–2012) in einem geringeren Ausmaß gestiegen ist (plus 0,13 ESCSIndexpunkte) als bei Jugendlichen mit Migrationshintergrund insgesamt (plus 0,28 Indexpunkte) und Jugendlichen ohne Migrationshintergrund (plus 0,37 Indexpunkte).
Nach wie vor lässt sich ein beachtlicher Teil der Leistungsunterschiede zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund durch Unterschiede im sozialen Hintergrund erklären. Kinder und Jugendliche mit Migrationshintergrund wachsen im Durchschnitt unter wesentlich schlechteren sozioökonomischen Bedingungen auf als jene ohne. Für PIRLS 2011 und PISA 2012 zeigt sich, dass die Leistungsunterschiede nur etwa halb so groß ausfallen würden, wenn Kinder und Jugendliche mit und ohne Migrationshintergrund unter denselben sozioökonomischen Bedingungen aufwachsen würden10. Über die Zeit hinweg ist der Anteil des Leistungsunterschieds, der durch sozioökonomische Faktoren erklärt werden kann, immer größer geworden. Waren dies bei PISA 2000 nur 30 %, sind es 12 Jahre später 54 %. Insgesamt zeigt sich damit, dass die Leistungsunterschiede zwischen Jugendlichen mit und ohne Migrationshintergrund kleiner werden, gleichzeitig aber der soziale Hintergrund eine immer größere Rolle bei der Erklärung dieser Leistungsunterschiede spielt.
Die vorliegenden Ergebnisse belegen, dass Jugendliche mit Migrationshintergrund heute im Durchschnitt eine höhere Lesekompetenz aufweisen als zur Jahrtausendwende. Die Ursachen für diese Verbesserung können mit den PISADaten allerdings nicht eindeutig geklärt werden. Es ist davon auszugehen, dass eine Vielzahl von Faktoren dafür verantwortlich ist. Diese Faktoren sind einerseits in der Zusammensetzung der Jugendlichen mit Migrationshintergrund zu suchen. Beispielsweise zeigt sich, dass der Anteil an Schülerinnen und Schülern, die nicht aus den klassischen Einwanderungsländern Exjugoslawien und Türkei stammen, deutlich gewachsen ist und gerade diese Jugend
lichen (Gruppe „anderes Herkunftsland oder gemischte Herkunft“) die höchste Lesekompetenz unter den Schülerinnen und Schülern mit Migrationshintergrund aufweisen. Gleichzeitig ist der Anteil türkischer Jugendlicher – und damit der traditionell leistungsschwächsten Zuwanderungsgruppe in Österreich – kleiner geworden. Dabei soll jedoch der deutliche Leistungsanstieg bei den türkischen Jugendlichen in letzter Zeit nicht übersehen werden, der bei dieser Gruppe in den letzten Jahren am stärksten war. Möglicherweise spielen hierfür Initiativen in der türkischen „Community“ selbst, die sich durch eine starke Bildungsorientierung auszeichnen, wie etwa die GülenBewegung, eine Rolle (vgl. für Deutschland Agai, 2010, 36–46; Geier & Frank, 2014).
Ein weiterer Grund für die Steigerung der Lesekompetenz bei Jugendlichen mit Migrationshintergrund könnte in verbesserten schulischen Rahmenbedingungen liegen. So wird in der Lehreraus und fortbildung ein stärkerer Fokus auf Interkulturalität, Mehrsprachigkeit und Deutsch als Zweitsprache gelegt. Die vorliegenden Ergebnisse zeigen, dass Volksschullehrer/innen 2011 häufiger eine Ausbildung in „Deutsch als Fremdsprache/Zweitsprache“ aufweisen als noch 2006. Dennoch wurden auch im Jahr 2011 noch immer 45 % der Kinder mit Migrationshintergrund von einer Lehrkraft ohne entsprechende Ausbildung unterrichtet. Auch zeigen die PISA2012Daten, dass es noch immer nur sehr selten Lehrkräfte mit einer anderen Erstsprache als Deutsch gibt: Mehr als die Hälfte der PISASchüler/innen hatte im Schuljahr 2011/12 überhaupt keine solche Lehrkraft an der Schule.
Neben Maßnahmen in der Schule wird in letzter Zeit der Sprachförderung im Kindergarten eine immer größere Bedeutung beigemessen (vgl. Einleitung). Von der frühen Sprachförderung (beginnend mit 2008) konnten allerdings die PISA und PIRLSSchüler/innen noch nicht profitieren. So wurden die bei PISA 2012 getesteten Jugendlichen in der Regel bereits im Jahr 2002 eingeschult und die bei PIRLS 2011 getesteten Kinder im Jahr 2007.
Bemerkenswert am Einflussfaktor Schule ist, dass die Effekt stärke der Leistungsdifferenz mit zunehmender Beschulung kleiner wird. Wie erwähnt, teilt sich ein großer Teil der Schülerkohorte von PIRLS 2006 und PISA 2012 das Geburtsjahr (1996). Als sich die (zum Großteil) 1996 Geborenen auf der vierten Schulstufe befanden (PIRLS 2006), betrug die Effektstärke der Leistungsdifferenz zwischen Kindern mit und ohne Migrationshintergrund –0,77. Sechs Jahre später, als die 1996 Geborenen bei PISA 2012 getestet wurden, betrug die Effektstärke nur mehr –0,54. Wenn man also Schülerkohorten untersucht, deren Geburtsjahrgang sich stark überlappt, zeigen sich mit längerer
9 Bei der PISATestung im Jahr 2000 wurde nur danach gefragt, ob Mutter und Vater im Inland oder im Ausland geboren wurden, sodass in den Analysen der PISA2000Daten nicht nach Geburtsland (z. B. Türkei) unterschieden werden kann.
10 Wie in der Einleitung erwähnt, wurde bei PIRLS und PISA der soziale Hintergrund unterschiedlich operationalisiert, wodurch die Vergleichbarkeit der Ergebnisse zwischen PIRLS und PISA in diesem Punkt eingeschränkt ist.
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 81
Beschulung geringere Leistungsunterschiede. Dies könnte auch darauf hindeuten, dass die Aufholprozesse mehrsprachiger Kinder mit zunehmendem Alter stärker zur Entfaltung kommen. Wie in der Einleitung erwähnt, ist eine durchgängige Sprachförderung von fünf bis sieben Jahren notwendig, um Kinder in der Zweitsprache an ein bildungssprachliches Niveau heranzuführen (de Cillia, n. d.). Eine längere Beschulung könnte bei geeigneten Rahmenbedingungen daher insbesondere für Kinder mit Migrationshintergrund weitergehende positive Effekte haben.
Darüber hinaus könnten sich auch die in der Einleitung beschriebenen gesellschaftlichen Veränderungen auf die Leistungen der Schüler/innen mit Migrationshintergrund auswirken. Integration wird auch auf gesamtgesellschaftlicher Ebene immer stärker wahrgenommen und die Handlungsempfehlungen im Bereich Bildung (Volf & Bauböck, 2001; HerzogPunzenberger & Unterwurzacher, 2009; Nusche, Shewbridge & Rasmussen, 2009) schrittweise umgesetzt.
Zusammenfassend belegen die vorliegenden Ergebnisse, dass die Lesekompetenz bei Jugendlichen (15/16Jährigen) mit Migrationshintergrund im Zeitraum 2000–2012 gestiegen ist, während sie bei Jugendlichen ohne Migrationshintergrund etwa gleich geblieben ist. Bei den Volksschulkindern mit Migrationshintergrund ist die Lesekompetenz etwa gleich geblieben, während sie bei den Kindern ohne Migrationshintergrund signifikant gesunken ist (von 2006 auf 2011). Damit sind die Leistungsunterschiede in Lesen zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund sowohl in der Volksschule als auch bei den 15/16Jährigen kleiner geworden. Die Gründe für diese positivere Leistungsentwicklung bei den Jugendlichen mit Migrationshintergrund (im Vergleich zu jenen ohne Migrationshintergrund) können mit den vorliegenden Daten allerdings nicht im Detail festgestellt werden. Anzunehmen ist ein Zusammenspiel von individuellen, schulischen und gesellschaftlichen Faktoren.
Literatur
Adams, R. & Carstensen, C. (2002). Scaling Outcomes. In R. Adams & M. Wu (Eds.), PISA 2000 Technical Report (pp. 149–162). Paris: OECD Publishing.
Agai, B. (2010). Die Arbeit der Gülen-Bewegung in Deutschland: Akteure, Rahmenbedingungen, Motivation und Diskurse. In W. Homolka, J. Hafner, A. Kosman & E. Karakoyun (Hrsg.), Muslime zwischen Tradition und Moderne. Die Gülen-Bewegung als Brücke zwischen den Kulturen (S. 9–55). Freiburg i. B.: Herder.
Bacher, J. (2009). Soziale Ungleichheit, Schullaufbahn und Testleistungen. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule (S. 79–101). Graz: Leykam.
Bacher, J. (2012). Repräsentativität der PISA2009-Erhebung. In F. Eder (Hrsg.), PISA 2009. Nationale Zusatzanalysen für Österreich (S. 483–511). Münster: Waxmann.
BMBF – Bundesministerium für Bildung und Frauen (2014). Der muttersprachliche Unterricht in Österreich. Statistische Aus-wertung für das Schuljahr 2012/13. Informationsblätter des Referats für Migration und Schule Nr. 5/2013/14. Zugriff am 23.06.2014 unter http://www.schule-mehrsprachig.at/fileadmin/schule_mehrsprachig/redaktion/Hintergrundinfo/info5-13-14.pdf
BMBF – Bundesministerium für Bildung und Frauen (2015). SchülerInnen mit anderen Erstsprachen als Deutsch. Statistische Übersicht Schuljahre 2007/08 bis 2013/14. Informationsblätter des Referats für Migration und Schule Nr. 2/2014/15. Zugriff am 16.04.2015 unter http://www.schule-mehrsprachig.at/fileadmin/schule_mehrsprachig/redaktion/Hintergrundinfo/info2-14-15.pdf
BMUKK – Bundesministerium für Unterricht, Kunst und Kultur (2011). Gesetzliche Grundlagen schulischer Maßnahmen für SchülerInnen mit anderen Erstsprachen als Deutsch. Gesetze und Verordnungen. Zugriff am 23.03.2014 unter http://www.grg23vbs.ac.at/fileadmin/media/infomat/leistungsbeurteilung/01_Gesetzliche_Grundlagen_fuer_Schueler_mit_nichtdeut-scher_Muttersprache.pdf
BMUKK – Bundesministerium für Unterricht, Kunst und Kultur (n.d.). Unveröffentlichtes Arbeitspapier der Abteilung I/5 Diver-sitäts- und Sprachenpolitik, Sonderpädagogik und inklusive Bildung, Begabungsförderung.
Boeckmann, B., Brunner, K. M., Egger, M., Gombos, G., Juric, M. & Larcher, D. (1988). Identität und Assimilation. In R. Bau-böck, G. Baumgartner & K. Pintér (Hrsg.), ...und raus bist du! Ethnische Minderheiten in der Politik (S. 209–223). Wien: Verlag für Gesellschaftskritik.
82 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
Breit, S. (2009a). Sozialisationsbedingungen von Schülerinnen und Schülern mit Migrationshintergrund. In C. Schreiner & U. Schwantner (Hrsg.), PISA 2006. Österreichischer Expertenbericht zum Naturwissenschaftsschwerpunkt (S. 136–145). Graz: Leykam.
Breit, S. (2009b). Kompetenzen von Schülerinnen und Schülern mit Migrationshintergrund. In C. Schreiner & U. Schwantner (Hrsg.), PISA 2006. Österreichischer Expertenbericht zum Naturwissenschaftsschwerpunkt (S. 146–158). Graz: Leykam.
Breit, S. & Schneider, P. (2009). Ergebnisse der Sprachstandsfeststellung. In S. Breit (Hrsg.), Frühkindliche Sprachstandsfest-stellung. Konzept und Ergebnisse der systematischen Beobachtung im Kindergarten (S. 22–44). Graz: Leykam.
Brizic, K. & Hufnagl, C. (2011). Multilingual Cities Wien: Bericht zur Sprachenerhebung in den 3. und 4. Volksschulklassen. Zugriff am 25.06.2014 unter http://www.academia.edu/1826419/Brizic_K._and_Hufnagl_Claudia_Lo_2011_Multilingual_ Cities_Vienna._Preliminary_school_report_on_a_home-language_survey_in_Viennese_primary_schools_in_German_._Austrian _Academy_of_Sciences._Online
Bundesministerium für Innere Angelegenheiten (2012). Nationaler Aktionsplan für Integration. Maßnahmen. Zugriff am 23.03.2014 unter http://www.bmi.gv.at/cms/cs03documentsbmi/817.pdf
Busch, B. & de Cillia, R. (Hrsg.). (2003). Sprachenpolitik in Österreich. Eine Bestandsaufnahme. Frankfurt am Main: Peter Lang.
Çinar, D. (Hrsg.). (1998). Gleichwertige Sprachen? Muttersprachlicher Unterricht für die Kinder von Einwanderern. Innsbruck: StudienVerlag.
Çinar, D. & Davy, U. (1998). Von der Rückkehrförderung zum Interkulturellen Lernen: Rahmenbedingungen des muttersprach-lichen Unterrichts. In D. Çinar (Hrsg.), Gleichwertige Sprachen? Muttersprachlicher Unterricht für die Kinder von Einwanderern (S. 23–80). Innsbruck: StudienVerlag.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.
de Cillia, R. (n.d.). Spracherwerb in der Migration – Deutsch als Zweitsprache. Bundesinstitut für Bildungsforschung, Innova-tion und Entwicklung des österreichischen Schulwesens BIFIE. Zugriff am 23.03.2014 unter https://www.bifie.at/system/files/dl/srdp_cillia_spracherwerb_migration_2011-10-11.pdf
Ellis, P. D. (2010). The essential guide to effect sizes. Cambridge: Cambridge University Press.
Europäische Kommission (2013). Study on educational support for newly arrived migrant children. Case study report Austria. Zugriff am 16.04.2015 unter http://edz.bib.uni-mannheim.de/daten/edz-b/gdbk/13/bld/migrant_austria_en.pdf
Fischer, G. (1986). Gastarbeiterkinder an österreichischen Pflichtschulen. In H. Wimmer (Hrsg.), Ausländische Arbeitskräfte in Österreich (S. 307–330). Frankfurt am Main: Campus.
Foy, P. (2012). Estimating standard errors for the TIMSS and PIRLS 2011 achievement scales. In M. O. Martin & I. V. S. Mullis (Eds.), Methods and procedures in TIMSS and PIRLS 2011. Retrieved September 18, 2013 from http://timssandpirls.bc.edu/methods/pdf/TP11_Estimating_Achievement.pdf
Foy, P., Brossman, B. & Galia, J. (2012). Scaling the TIMSS and PIRLS 2011 achievement data. In M. O. Martin & I. V. S. Mullis (Eds.), Methods and procedures in TIMSS and PIRLS 2011. Retrieved September 18, 2013 from http://timssandpirls.bc.edu/methods/pdf/TP11_Scaling_Achievement.pdf
Geier, T. & Frank M. (2014). Bildung im hizmet – zu Bildungspraxen und Biographien junger Studierender im Kontext der ‚Gülen-Bewegung‘. In T. Geier & K. U. Zaborowski (Hrsg.), Migration: Auflösungen und Grenzziehungen. Zu aktuellen Perspek-tiven einer erziehungswissenschaftlichen Migrationsforschung.
Gomolla, M. & Radtke, F. O. (2002). Institutionelle Diskriminierung. Die Herstellung ethnischer Differenz in der Schule. Opladen: Leske+Budrich.
Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000 83
Gonzalez, E. J. (2003). Scaling the PIRLS Reading Assessment Data. In M. O. Martin, I. V. S. Mullis & A. M. Kennedy (Eds.), PIRLS 2001 Technical Report (pp. 151–168). Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.
Grafendorfer, A., Wallner-Paschon, C., Suchan, B. & Widauer, K. (2012). Was messen PIRLS & TIMSS? In B. Suchan, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Die Studie im Überblick (S. 12–48). Graz: Leykam.
Heath, A. & Li, Y. (2010). The feasibility of constructing a race equality index. Research report No 695, Department for Work and Pensions. Retrieved March 23, 2014 from https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/214468/rrep695.pdf
Herzog-Punzenberger, B. (2009). Jenseits individueller Charakteristiken – welche Bedeutung haben gesellschaftliche Struktu-ren für den Bildungserfolg von Schülerinnen und Schülern mit Migrationshintergrund? In C. Schreiner & U. Schwantner (Hrsg.), PISA 2006. Österreichischer Expertenbericht zum Naturwissenschafts-Schwerpunkt (S. 159–166). Graz: Leykam.
Herzog-Punzenberger, B. & Gapp, P. (2009). Sozialisationsbedingungen von Schülerinnen und Schülern mit Migrationshinter-grund. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule (S. 55–65). Graz: Leykam.
Herzog-Punzenberger, B. & Unterwurzacher, A. (2009). Migration – Interkulturalität – Mehrsprachigkeit. In W. Specht (Hrsg.), Nationaler Bildungsbericht Österreich 2009 (S. 161–182). Graz: Leykam. Zugriff am 25.6.2014 unter https://www.bifie.at/buch/1024/b/2
Kao, G. & Tienda, M. (1998). Educational aspirations of minority youth. American Journal of Education, 106, 349–84.
Latcheva, R. & Herzog-Punzenberger, B. (2011). Integration revisited. Zur Dynamik und Kontextabhängigkeit individueller Integrationsverläufe am Beispiel von MigrantInnen der ersten Generation in Wien. Österreichische Zeitschrift für Soziologie, 36, 3–27.
Matuschek, H. (1982). Die Auswirkungen der „Ausländerpolitik“ auf Schul- und Berufsausbildung der jugoslawischen und türkischen Jugendlichen in Wien und Niederösterreich. Situation und Lösungsmöglichkeiten. Wien: Europäisches Zentrum für Ausbildung und Forschung auf dem Gebiet der Sozialen Wohlfahrt.
Neuwirth, E. (2006). PISA 2000. Sample weight problems in Austria. Retrieved September 18, 2013 from http://www.oecd-ilibrary.org/education/pisa-2000_220456725273
Nusche, D., Shewbridge, C. & Rasmussen, C. (2009). OECD Reviews of Migrant Education. Austria. Zugriff am 25.6.2014 unter http://www.oecd.org/austria/44192225.pdf
OECD (2009). PISA data analysis manual – SPSS (2nd ed.). Paris: OECD Publishing.
OECD (2012). PISA 2009 Technical Report. Paris: OECD Publishing.
OECD (2013a). PISA 2012 results: Excellence through equity: Giving every student the chance to succeed – Volume II. Paris: OECD Publishing.
OECD (2013b). PISA 2012 results: What students know and can do – Volume I. Paris: OECD Publishing.
Österreichischer Integrationsfonds (2014). Migration & Integration – Schwerpunkt: Arbeit und Beruf. Zugriff am 04.06.2014 unter http://www.integrationsfonds.at/zahlen_und_fakten/migration_integration_schwerpunkt_arbeit_und_beruf/
Pareiss, M. (2013). Sampling-Design und Stichproben. In U. Schwantner & C. Schreiner (Hrsg.), PISA 2012. Internationaler Vergleich von Schülerleistungen. Technischer Bericht. Zugriff am 30.01.2014 unter https://www.bifie.at/buch/2431/4
Plutzar, V. & Kerschhofer-Puhalo, N. (Hrsg.). (2009). Nachhaltige Sprachförderung. Zur veränderten Aufgabe des Bildungswesens in einer Zuwanderergesellschaft. Bestandsaufnahmen und Perspektiven. Innsbruck: StudienVerlag.
84 Migrationshintergrund und Lesekompetenz: Entwicklung seit dem Jahr 2000
Reiter, C. (2002). Wenn die Testsprache nicht der Muttersprache entspricht … In C. Reiter & G. Haider (Hrsg.), PISA 2000 Lernen für das Leben Österreichische Perspektiven des internationalen Vergleichs (S. 61–68). Innsbruck: StudienVerlag.
Schreiner, C. & Breit, S. (2006). Kompetenzen von Schüler/innen mit Migrationshintergrund. In G. Haider & C. Schreiner (Hrsg.), Die PISA-Studie. Österreichs Schulsystem im internationalen Wettbewerb (S. 179–194). Wien, Köln, Weimar: Böhlau.
Schwantner, U. & Schreiner, C. (Hrsg.). (2013). PISA 2012. Internationaler Vergleich von Schülerleistungen. Die Studie im Überblick. Graz: Leykam.
Spiewak, M. (2009). Das vietnamesische Wunder. Die Zeit, Nr. 5/2009. Zugriff am 27.03.2014 unter http://www.zeit.de/ 2009/05/B-Vietnamesen
Statistik Austria (2013). Migration & Integration. Zahlen – Daten – Indikatoren 2013. Zugriff am 04.06.2014 unter http://www.bmeia.gv.at/fileadmin/user_upload/bmeia/media/Integration/Integrationsbericht_2013/Statistische_Jahrbuch_2013.pdf
Suchań, B. & Wintersteller, A. (2012). Population und Stichprobe von PIRLS & TIMSS. In B. Suchań, C. Wallner-Paschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft. Die Studie im Überblick (S. 49–51). Graz: Leykam.
Unterwurzacher, A. (2009). Lesekompetenz von Schülerinnen und Schülern mit Migrationshintergrund: Einfluss das familiären Hintergrundes. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volks-schule (S. 66–78). Graz: Leykam.
Viehböck, E. & Bratić, L. (1994). Die zweite Generation. Migrantenjugendliche im deutschsprachigen Raum. Innsbruck: Studien -Verlag.
Vogtenhuber, S., Lassnigg, L., Bruneforth, M. (2012). Indikatoren A: Kontext des Schul- und Bildungswesens. In M. Bruneforth & L. Lassnigg (Hrsg.), Nationaler Bildungsbericht Österreich 2012. Band 1. Das Schulsystem im Spiegel von Daten und Indi-katoren (S. 15–30). Graz: Leykam.
Volf, P. & Bauböck, R. (2001). Wege zur Integration. Was man gegen Diskriminierung und Fremdenfeindlichkeit tun kann. Kla-genfurt: Drava.
Wroblewski, A. (2012). Situation und Kompetenzen von Schüler/inne/n mit Migrationshintergrund: Deskriptive und multivariate Analyse der Determinanten der Testleistung. In F. Eder (Hrsg.), PISA 2009. Nationale Zusatzanalysen für Österreich (S. 337–366). Münster: Waxmann.
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 85
2.2 Die Bedeutung von familiären, schuli-schen und individuellen Merkmalen für die Mathematikkompetenz
Christina Wallner-Paschon & Gerda Hagenauer
Die schulische Leistung wird von verschiedenen Faktoren beeinflusst, die in komplexer, wechselseitiger Abhängigkeit zueinander stehen. Helmke und Weinert (1997; entnommen aus Helmke, 1997, S. 203) gehen in ihrem Modell schulischer Leistung davon aus, dass sowohl Merkmale der Lernenden wie auch Faktoren der schulischen, außerschulischen und familiären Umwelt die Schulleistung bestimmen. Heller (1997, S. 185) schreibt dabei motivationalen Merkmalen, die wiederum, ebenso wie die Schulleistung, von den Kontextbedingungen beeinflusst werden, eine vermittelnde Funktion zwischen der Kognition (z. B. Vorwissen, IQ) und der aktuellen Schulleistung zu.
Aus diesen Annahmen zur Erklärung der schulischen Leistung im Allgemeinen wurde ein Modell zur Erklärung der Mathematikkompetenz am Ende der Grundschule abgeleitet, das im vorliegenden Beitrag empirisch überprüft wird. Dabei wird der Frage nachgegangen, inwieweit familiäre, schulische und individuelle Merkmale unter Berücksichtigung von Geschlecht und Migrationsstatus zur Aufklärung der Mathematikkompetenz beitragen können (s. Abbildung 2.2.1). Die folgenden Abschnitte gehen auf die wissenschaftliche Befundlage der einzelnen Merkmale dieses Modells und deren Bedeutung für die Mathematikleistung näher ein.
Der Beitrag hat das Ziel, die Mathematikkompetenz von Grundschülerinnen und schülern auf der 4. Schulstufe zu erklären. In Anlehnung an Schulleistungsmodelle und auf Basis bisheriger Ergebnisse wird ein Modell abgeleitet, das die Bedeutung familiärer, schulischer und individueller Merkmale für die Mathematikkompetenz untersucht. Die angenommenen Strukturen werden empirisch mit den TIMSS2011Daten überprüft. Die Analysen zeigen, dass der Zusammenhang zwischen sozioökonomischen Merkmalen der Eltern und der Mathematikleistung der Kinder vor allem indirekt, beispielsweise über kulturelle Ressourcen, vermittelt wird. Bei den Geschlechtereffekten ist vor allem das deutlich höhere Vertrauen der Buben in ihre Mathematikkompetenz trotz vergleichbarer familiärer Rahmenbedingungen hervorzuheben. Ihr tatsächlicher Leistungsvorsprung in Mathematik ist jedoch nur gering. Eine geringe Leistungsdifferenz bei gleichen Rahmenbedingungen gilt auch für Kinder mit und ohne Migrationshintergrund. Insgesamt kann durch das Modell ein wesentlicher Anteil an Leistungsunterschieden in Mathematik (41 %) erklärt werden, dessen Konsequenzen für Wissenschaft und Unterrichtspraxis am Ende des Beitrags diskutiert werden.
Familiäre und schulische Sozialisationseinflüsse
Kognitive Merkmale der Lernenden
Motivationale Merkmale der Lernenden
Mathematikkompetenz
Exogene Merkmale:GeschlechtMigrationsstatus
Abbildung 2.2.1: Rahmenmodell zur Erklärung der Mathematikleistung (eigene Illustration basierend auf Helmke & Weinert [1997] und Heller [1997])
86 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
Mathematikkompetenz und Merkmale der Lernenden
Im Hinblick auf die Lernenden spielen sowohl kognitive als auch motivationale Merkmale1 eine Rolle für die Entwicklung von Mathematikkompetenz. Als wichtigstes Merkmal zur Erklärung der Mathematikkompetenz gelten nach wie vor kognitive Merkmale der Lernenden. Neben der kognitiven Fähigkeit im Allgemeinen (numerische, räumliche, sprachliche Intelligenz etc.; z. B. Weinert & Stefanek, 1997) hat dabei insbesondere das Vorwissen der Schüler/innen eine wichtige Funktion (Helmke & Weinert, 1997). Umso mehr Vorwissen Schüler/innen in einem Unterrichtsfach mitbringen (z. B. zu Beginn des Schuljahrs), desto höher ist deren Leistung in diesem Fach (z. B. am Ende des Schuljahrs). Daher ist davon auszugehen, dass die mathematische Kompetenz, die Kinder vor dem Eintritt in die Grundschule aufweisen (= Vorwissen), eine hohe Erklärungskraft für die Kompetenz am Ende der Grundschule besitzt. Vorwissen und Intelligenz hängen dabei eng zusammen, da die Intelligenz – neben zahlreichen weiteren Faktoren (z. B.: Förderung im Elternhaus) – am Aufbau des Vorwissens beteiligt ist (z. B. Gröhlich, 2012; Grube & Hasselhorn, 2006; Weinert & Helmke, 1995).
Im Vergleich dazu ist die Erklärungskraft der motivationalen Faktoren der Lernenden als geringer einzustufen. Dennoch dürfen sie für die Leistungsentwicklung nicht vernachlässigt werden, da sie das Lernverhalten steuern und somit indirekt ebenfalls die Leistung beeinflussen. Als sehr fruchtbar zur Erklärung der schulischen Lernmotivation hat sich dabei das ErwartungsWertModell (Eccles et al., 1983; Wigfield & Eccles, 2000) erwiesen. Entsprechend diesem Modell entsteht Motivation dann, wenn eine Situation als kontrollierbar (erwartbar) und als wertvoll eingeschätzt wird. Das schulische Fähigkeitsselbstkonzept und die schulische Selbstwirksamkeitsüberzeugung haben sich bei diesem Modell als wichtige motivationale Merkmale durchgesetzt, welche die Erwartungskomponente des Modells widerspiegeln. Im Hinblick auf die Wertkomponente werden intrinsische und extrinsische Wertzuschreibungen unterschieden: Interesse (intrinsisch), Nützlichkeit (extrinsisch) und Wichtigkeit (subjektiver Wert). Gemäß der Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) ist eine intrinsische oder eine identifizierte (subjektiv wertvolle) Motivationslage der rein extrinsischen Motivation vorzuziehen. Intrinsisch und subjektiv wertvolle Motivationslagen (auch als autonome Motivationslagen bezeichnet) gehen häufiger mit einem optimalen Lernverhalten einher, wie beispielsweise tiefergehenden Lernstrategien, einer längeren Aufmerksamkeitsspanne, einer größeren Anstrengungsbereitschaft sowie
einer höheren Mitarbeit (Hagenauer & Hascher, 2011), und lösen auch häufiger positive Emotionen aus (z. B. Lernfreude, Hagenauer, 2011).
Mathematikkompetenz und Unterrichtsgestaltung
Unterricht kann auf verschiedenen Ebenen beschrieben werden, die wiederum von mehreren Merkmalen gekennzeichnet sind. So unterscheiden Helmke, Hosenfeld und Schrader (2002) Merkmale der Unterrichtsqualität (z. B. Klarheit, Strukturiertheit), der Unterrichtsquantität (Zeitnutzung im Unterricht), der Lehrerpersönlichkeit (z. B. Engagement, Enthusiasmus) und des LehrLernMaterials (z. B. individualisierte Aufgabengestaltung). Diese Unterrichtsfaktoren tragen alle für sich, jedoch in unterschiedlich starkem Ausmaß, zur Leistungsentwicklung der Schüler/innen bei. Das AngebotsNutzungsModell, entwickelt von Helmke (2000; entnommen aus Helmke, Hosenfeld & Schrader, 2002, S. 426), geht davon aus, dass die Angebote des Unterrichts allerdings nicht direkt auf die Schulleistung der Schüler/innen wirken, sondern diese durch das Nutzungsverhalten der Schüler/innen (z. B. aktive Lernzeit, Engagement) und deren Motivationslage vermittelt wird. Lehrkräfte können demnach im Unterricht zwar gezielte Angebote setzen (z. B. innere Differenzierung bei der Aufgabengestaltung), die Auswirkung dieses Angebots auf die schulische Leistung hängt jedoch nicht nur von dessen Qualität ab, sondern auch davon, wie dieses von den Schülerinnen und Schülern genutzt wird, und ob es in der Lage ist, Schüler/innen motivational anzusprechen.
Diese motivationale Anregung gelingt entsprechend der oben bereits angeführten Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) durch die Erfüllung der drei psychologischen Grundbedürfnisse – der Bedürfnisse nach Autonomie, Kompetenz und Eingebundenheit. Das Bedürfnis nach Autonomie kann durch eine autonomieunterstützende Lernumgebung gefördert werden, die sich beispielsweise durch wenig kontrollierendes Verhalten der Lehrperson, das Gewähren von Freiräumen/Wahlmöglichkeiten und auch durch das Aufzeigen der Relevanz von Inhalten charakterisiert. Kompetenzerleben kann durch das Ermöglichen von Erfolgen für alle Schüler/innen, z. B. durch individualisierte Aufgabengestaltung, unterstützt werden, während das Gefühl der Eingebundenheit auf positiven LehrerSchülerBeziehungen sowie auf positiven SchülerSchülerBeziehungen aufbaut (Reeve, Bolt & Cai, 1999). Klieme et al. (2006, S. 131) subsumieren all jene Methoden, die auf die Erfüllung der Grundbedürfnisse und
1 Geht es darum, Schüler/innen zu motivieren, wird in der Forschung zwischen Motivation (z. B. Interesse an Mathematik) und Emotionen (Freude an Mathe matik) unterschieden (Wild & Möller, 2014). In diesem Beitrag werden auch emotionale Faktoren, z. B. Freude an Mathematik, unter dem Begriff „motivationale Merkmale“ subsumiert. Diese sprachlich vereinfachte Darstellung erscheint sinnvoll, da aus Forschungsarbeiten bekannt ist, dass Motivationskonstrukte, wie z. B. das schulische Interesse (Krapp, 2009), neben persönlicher Bedeutsamkeit ebenso eine emotionale Komponente (positive Gefühle) enthalten.
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 87
somit auf die Erhöhung der Schülermotivation abzielen, unter dem Begriff „unterstützendes Unterrichtsklima“. Dieses ist abzugrenzen von weiteren – vordergründig auf die Förderung der Kognition gerichteten – Dimensionen der Unterrichtsqualität (z. B. kognitive Aktivierung).
Mathematikkompetenz und das Elternhaus
Neben der schulischen Umwelt spielt entsprechend dem Modell auch das Elternhaus eine bedeutende Rolle für die Entwicklung der Mathematikkompetenz. Die Leistungsentwicklung in Mathematik beginnt bereits vor dem Grundschulalter (im Überblick, siehe z. B. Krajewski, Grüßling und PeterKoop, 2009) und dem Elternhaus als primärer Sozialisationsinstanz kommt hier eine zentrale Schlüssel rolle zu. Weinert und Helmke (1997) konnten in der SCHOLASTIKGrundschulstudie zeigen, dass Kinder ihren Leistungsrückstand zu Beginn der Grundschulzeit während der Grundschulzeit nicht mehr aufholen konnten, d. h. Leistungspositionen bleiben im Grundschulalter relativ stabil (siehe auch Grube & Hasselhorn, 2006), weshalb die mathematische Frühförderung im Elternhaus und/oder auch die externe Frühförderung, z. B. in Kindergärten, wesentlich für die Leistungsentwicklung ist.
Familiäre Einflüsse können hinsichtlich struktureller und prozessualer Aspekte unterschieden werden. Die strukturellen Merkmale umfassen Statusmerkmale, wie z. B. Bildungsabschluss und Beruf der Eltern. Prozessuale Faktoren fokussieren auf den Prozess beim Erwerb von Mathematikkompetenz, wie z. B. die Qualität der elterlichen Unterstützung beim Lernen, Frühförderung im Elternhaus oder auch gemeinsame kulturelle Aktivitäten etc. (für ein entsprechendes Modell siehe Ehmke & Siegle, 2008, S. 256). Die Bedeutung der Statusmerkmale für die schulische Leistung der Kinder gilt als vielfach belegt, lediglich die Stärke des Einflusses ist länderspezifisch unterschiedlich. Österreich zählt dabei zu jenen Ländern mit den größten Chancenungleichheiten (Bruneforth, Weber, & Bacher, 2013). Bereits in TIMSS 2007 konnte ein enger Zusammenhang zwischen der Herkunft des Kinds und dessen Leistung in Mathematik festgestellt werden: Schwache Leistungen werden überdurchschnittlich häufig von Kindern aus Familien mit geringem sozialem Status erbracht (Bergmüller, 2010). Nach Bourdieu (1983) werden diese Rückstände in der Leistung durch Benachteiligung in den frühen Sozialisationserfahrungen, basierend auf Unterschieden im Vorhandensein kultureller Ressourcen und kultureller Praxis, ausgelöst.
Die Befunde bezüglich der Relevanz der Prozessmerkmale der familiären Umwelt für die Leistungsentwicklung der Kinder sind weniger eindeutig. Während sich eine anregende häusliche Umwelt positiv auf die Kompetenzentwicklung der Kinder auszuwirken scheint, gibt es eine weniger konsistente Befundlage im Hinblick auf die elterliche Lernunter
stützung. Diese scheint nicht per se positiv auf die Leistung der Kinder zu wirken, sondern von der Qualität der Unterstützungsleistung der Eltern bestimmt zu werden (Niggli et al., 2007).
Mathematikkompetenz in Abhängigkeit von Geschlecht und Migrationsstatus
Eine Vielzahl an empirischen Studien illustriert, dass Mädchen im Vergleich zu Buben eine geringere Schulleistung in Mathematik aufweisen und auch deren motivationale Merkmale weniger positiv ausgeprägt sind (z. B. Faber, Tiedemann & BillmannMahecha, 2011; Rustemeyer & Fischer, 2007). Dieser Unterschied zeigt sich bereits in der Grundschule. So weisen Mädchen beispielsweise ein geringeres Selbstkonzept in Mathematik auf, zeigen weniger Lernfreude (Helmke, 1993, 1997) und messen der Mathematik weniger Wert bei (Wigfield et al., 1997). Während die Unterschiede in motivationalen Faktoren relativ hoch sind, sind die tatsächlichen Leistungsunterschiede zwischen Mädchen und Buben in der Grundschule relativ gering ausgeprägt, wie eine Metaanalyse aus Deutschland, die Studien zwischen 1991 und 2008 umfasst, aufzeigt (Mücke, 2009). Ähnlich geringe Unterschiede in der Mathematikkompetenz zugunsten der Buben bestätigen sich im amerikanischen Raum (Hyde, Fennema & Lamon, 1990). Ebenso lassen sich in Österreich in TIMSS 1995, 2007 und 2011 die besseren Leistungen der Buben in Mathematik belegen, jedoch auch hier basierend auf einer (relativ) kleinen Effektstärke von 0.15 (1995, 2011) bzw. 0.20 (2007) (Cohen, 1988; WallnerPaschon, 2010; 2012). Die Unterschiede in der Mathematikkompetenz zwischen den Geschlechtern vergrößern sich jedoch im Laufe der Schulzeit, einhergehend mit einem Anstieg der Unterschiede im mathematischen Interesse und Selbstkonzept. Dies kann zur Folge haben, dass Mädchen weniger häufig Mathematik als Schwerpunktfach in der Oberstufe oder als Studienfach wählen als Buben (Köller, Daniels, Schnabel & Baumert, 2000).
Neben dem Geschlecht spielt auch der Migrationsstatus der Schüler/innen eine Rolle in der Erklärung der Mathematikleistung. Aus bisherigen Studien ist bekannt, dass Migrantinnen und Migranten durchschnittlich eine schlechtere Leistung in Mathematik zeigen als Schüler/innen ohne Migrationshintergrund. Dabei hängen Migrationsstatus und Mathematikleistung stärker zusammen als Geschlecht und Leistung. In Deutschland konnten Bos et al. (2003; zitiert nach Heinze et al. 2007) belegen, dass Migrantenkinder eine etwa um ein Schuljahr schlechtere Mathematikleistung erbringen als ihre einheimischen Klassenkameradinnen und Klassenkameraden. Auch Breit und Wanka (2010) errechneten einen Kompetenzunterschied von 44 Punkten für Österreichs Grundschüler/innen mit und ohne Migrationsstatus (TIMSS 2007; S. 101).
88 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
Neben den familiären und kulturellen Hintergrundmerkmalen, anhand derer sich Migrantenkinder häufig von einheimischen Schülerinnen und Schülern unterscheiden, wird insbesondere der Sprachbeherrschung im Hinblick auf die Entwicklung der Mathematikkompetenz eine wesentliche Funktion zugeschrieben, denn auch die Erbringung guter Leistungen in Mathematik setzt eine gute Sprachbeherrschung voraus. Heinze, HerwartzEmden und Reiss (2007) konnten die signifikante Korrelation (r = .35) zwischen dem Sprachstand und der Mathematikleistung in der Grundschule empirisch absichern. Wurde der Sprachstand kontrolliert, zeigten sich keine weiteren Unterschiede in der Mathematikleistung zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund. Während Migrantenkinder durchschnittlich schlechtere Leistungen in Mathematik zeigen, weisen sie im Vergleich zu den einheimischen Gleichaltrigen jedoch eine höhere Motivation auf (z. B. Faber, Tiedemann & BillmannMahecha, 2011; Helmke & Reich, 2001). Durchgehend berichten Kinder mit Migrationshintergrund in diversen Studien im deutschsprachigen Raum von einem höheren Selbstkonzept in Mathematik, obwohl sie in den (standardisierten) Mathematiktests schlechtere Leistungen erbringen.
Forschungsanliegen und Ableitung des Vorhersagemodells
Aufbauend auf dem theoretischen Rahmenmodell der schulischen Leistung (s. Abbildung 2.2.1) und der empirischen Befundlage zu den Prädiktoren wird im Folgenden das zu testende Wirkmodell zur Erklärung der Mathematikkompetenz näher beschrieben. Abbildung 2.2.2 zeigt dieses empirisch überprüfbare Wirkmodell, das zentrale Annahmen der Forschung über die Zusammenhänge von motivationalen Individualmerkmalen und schulischen Merkmalen sowie die Relevanz familiärer Struktur und Prozessmerkale integriert. Primäres Ziel der Analyse ist es, die Wirkung dieser Merkmale auf die Mathematikkompetenz der österreichischen Schüler/innen darzustellen. Konkret sollen mit dem vorliegenden Pfadmodell folgende Forschungsfragen beantwortet werden:
1. Inwieweit ist der in Österreich relativ starke Zusammenhang zwischen Schulbildung und Beruf der Eltern und der Mathematikleistung der Kinder durch indirekte Effekte vermittelt?
2. Welche familiären, schulischen und individuellen Merkmale wirken sich direkt auf motivationale Merkmale in Mathematik sowie auf die Mathematikleistung aus?
3. In welchen Bereichen zeigen sich Geschlechter und Migrationseffekte?
Der Modellaufbau erfolgt chronologisch nach dem zeitlichen Ablauf der Sozialisation. Die Anordnung der motivationalen Merkmale erfolgt theoriegeleitet entsprechend dem ErwartungsWertModell nach Eccles et al. (1983).
Die Modellannahmen lassen sich wie folgt skizzieren:
Als wichtiges Ausgangsmerkmal gelten die familiären Strukturmerkmale. Sie umfassen die Bildungsnähe sowie den Beruf der Eltern im Modell. Entsprechend der Theorie von Bourdieu (1983) wird angenommen, dass diese sozioökonomischen Faktoren indirekt über familiäre Prozessmerkmale wie kulturelle Ressourcen zu Hause und die kulturelle Praxis in der Familie (z. B. Theater und Museumsbesuche) auf die Mathematikkompetenz der Schüler/innen wirken. Als relevante Merkmale kultureller Ressourcen sind die Leseressourcen (ermittelt über den Besitz von Büchern), der Besitz eines Musikinstruments im Haushalt sowie das (Nicht)vorhandensein eines eigenen Fernsehers im Kinderzimmer im Modell berücksichtigt. Als Indikator für die kulturelle Praxis wurde die familiäre mathematische Frühförderung im Modell integriert. Es wird angenommen, dass der Zusammenhang zwischen strukturellen Merkmalen (Schulbildung und Beruf der Eltern) und der Schulleistung der Kinder nicht nur direkt, sondern primär indirekt über die familiären Prozessmerkmale gebildet wird. Das für die Leistungsentwicklung überaus bedeutende Vorwissen der Schüler/innen geht mit dem Merkmal Mathematikfähigkeit zu Schulbeginn in das Modell ein. Da die Leistungspositionen im Grundschulalter relativ stabil bleiben und ein zu Schulbeginn feststellbarer Leistungsrückstand in der Regel nicht mehr aufgeholt wird, werden deutliche Effekte des Vorwissens auf die Mathematikkompetenz auch noch am Ende der Grundschule erwartet. Es wird angenommen, dass sich das mathematische Wissen zu Schulbeginn sowohl direkt als auch indirekt über gute Noten und hohe Ausprägungen bei den motivationalen Merkmalen positiv auf die Mathematikleistung auswirkt.
Die Berücksichtigung der Unterrichtsqualität im Modell erfolgt über die beiden Merkmale autonomiegestützter und anregender Mathematikunterricht aus Schülersicht. Beide Merkmale sollen entsprechend der Selbstbestimmungstheorie der Motivation vor allem motivationsfördernd wirken. Es wird deshalb postuliert, dass diese Unterrichtsmerkmale primär positive Effekte auf die motivationalen Merkmale im Modell zeigen und keine bzw. nur geringfügige direkte Effekte auf die Mathematikleistung.
Als nächste Dimension werden die motivationalen Merkmale (mathematisches Selbstkonzept, Freude an Mathematik und subjektiver Wert der Mathematik) in das Modell integriert. Aufgrund der Annahme des ErwartungsWertModells wird zuerst das Selbstkonzept als Erwartungskomponente aufgenommen und anschließend die Freude an Mathematik sowie der subjektive Wert der Mathematik, die beide die Wertkomponente abbilden. Das Selbstkonzept entwickelt sich im Laufe der Grundschulzeit und wird von vorausgegangenen Leistungsvergleichen und Leistungsrückmeldungen wie beispielsweise durch Noten beeinflusst. Die Wertekomponente des Modells wird u. a von der Einschätzung des eigenen Könnens (Selbstkonzept) bestimmt. Entsprechend der Modellannahme wird davon ausgegan
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 89
gen, dass das mathematische Selbstkonzept sowohl direkt als auch über die Freude und den subjektiven Wert einen positiven Effekt auf die Mathematikleistung hat. Darüber hinaus werden auch direkte positive Effekte der Wertekomponente auf die Leistung erwartet.
Aufgrund der signifikanten, aber praktisch kaum relevanten Geschlechterunterschiede zugunsten der Buben am Ende der Grundschule (WallnerPaschon, 2012) werden nur geringe Geschlechtereffekte bei der vorschulischen Förderung in Mathematik sowie der Mathematikfähigkeit zu Schulbeginn angenommen. Deutlichere Effekte zugunsten der Buben werden bei den motivationalen Merkmalen erwartet. Es wird davon ausgegangen, dass Buben trotz gleicher familiärer Rahmenbedingen ein höheres Selbstkonzept und mehr Freude an Mathematik haben als Mädchen und darüber hinaus der subjektive Wert der Mathematik bei ihnen höher ist. In Bezug auf den Migrationshintergrund werden die aus anderen Studien bereits bekannten Effekte – hohe Motivation bei gleichzeitig geringerer Leistung – erwartet.
Methodischer Zugang
Untersuchungsvariablen
Als Indikator für den sozioökonomischen Status wurden die Elternangaben im Fragebogen über deren Bildungsnähe und den beruflichen Status herangezogen.
Die elterliche Bildungsnähe wurde aus den Elternangaben zu ihrer Schulbildung ermittelt. Der Index Höchste Schul bildung der Eltern untergliedert sich in die vier Kategorien (1) max. Pflichtschule, (2) Lehre/berufsbildende mittlere Schule/Meisterprüfung, (3) Matura und (4) akademischer Abschluss. Zur Indexbildung wurde jeweils der höchste Bildungsabschluss der beiden Elternteile verwendet.
Das Merkmal Höchste berufliche Position der Eltern untergliedert sich in sechs Kategorien: (1) nie einer beruflichen Tätigkeit nachgegangen, (2) Arbeiter, (3) Facharbeiter, (4) Angestellte, (5) Kleinunternehmer sowie (6) Fachkräfte (Akademiker/innen, Techniker/innen und Führungskräfte). Bei Unterschieden zwischen den beiden Elternteilen wurde jeweils der höhere Statuswert berücksichtigt.2
Die Operationalisierung der Leseressourcen erfolgte über zwei Fragen im Elternfragebogen (Cronbachs Alpha = .85). Zum einen wurde nach dem Buchbesitz zu Hause allgemein, zum anderen nach dem Besitz von Kinderbüchern gefragt. Als Antwortkategorien standen fünf Möglichkeiten zur Auswahl: 0–10 Bücher, 11–25, 26–100, 101–200 und über 200 Bücher. Bei den Kinderbüchern konnten Eltern zwischen 0–10, 11–25, 26–50, 51–100 und über 100 Bücher wählen. Fehlende Elternangaben bei den Kinderbüchern zu Hause wurden durch die Angaben ihrer Kinder im Schülerfragebogen ergänzt.
Die Frage, ob es zu Hause ein Musikinstrument gibt (aus dem Schülerfragbogen), wird als DummyKodierung (1 = es
2 Die berufliche Position der Eltern wurde im Fragebogen etwas detaillierter auf NominalskalenNiveau abgefragt und für Österreich zu sinnvollen Kategorien auf OrdinalskalenNiveau rekodiert. Die Ordinalität dieses Merkmals (also ob ein Kleinunternehmer tatsächlich eine höhere berufliche Position als ein Angestellter hat) wurde nicht überprüft bzw. konnte im Rahmen der vorliegenden Untersuchung mit den vorhandenen Daten auch nicht überprüft werden.
Leseressourcen
Mathe- fähigkeiten
zu Schulbeginn
Anregender Mathematik-
unterricht Beruf der Eltern
.44
Note in Mathematik
Mathematisches Selbstkonzept
Fernseher
Musikinstrument
Subjektiver Wert der Mathematik
Mathematische Frühförderung
Autonomiege- stützter
Mathematik- unterricht
Freude an Mathematik
Migrations- hintergrund Geschlecht
Schulbildung der Eltern
FamiliäreStrukturen
Familiäre Prozesse Schulische Merkmale
IndividuelleMerkmale
Mathematik- kompetenz
Abbildung 2.2.2: Empirisches Prüfmodell der Untersuchung
90 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
gib ein Musikinstrument; 0 = es gibt kein Musikins trument) im Modell verwendet. Die Frage zum eigenen Fernseher (im Kinderzimmer) geht ebenfalls als DummyKodierung in das Modell ein (1 = eigener Fernseher, 0 = kein eigener Fernseher).
Das Merkmal familiäre mathematische Frühförderung umfasst Fragen zu familiären Aktivitäten vor dem Schuleintritt, wie Zahlenreime sprechen, Abzähllieder singen oder verschiedene Dinge zählen. Die Fragen stammen aus dem Elternfragebogen und wurden mit den vorgegebenen Antwortkategorien nie oder fast nie, manchmal und oft erhoben. Es handelt sich dabei um eine nach der ItemResponseTheorie (IRT) konstruierte Skala.3 Die interne Konsistenz als Qualitätsmerkmal der Skala mit insgesamt 5 Items kann mit einem CronbachsAlphaWert von .68 als ausreichend beurteilt werden.
Beim Merkmal Mathematikfähigkeit zu Schulbeginn handelt es sich ebenfalls um ein IRTskaliertes Merkmal, das auf sechs Statements im Elternfragebogen zu einfachen mathematischen Fertigkeiten der Kinder bei Schulbeginn basiert. Diese Fertigkeiten inkludieren das Zählen, das Erkennen von Formen (z. B. Dreieck, Kreis) und von geschriebenen Zahlen, das Schreiben von Zahlen sowie das einfache Addieren und Subtrahieren. Die Qualität der Skala kann mit einem CronbachsAlphaWert von durchschnittlich .76 als gut beurteilt werden. Es ist jedoch darauf hinzuweisen, dass es sich hier um keinen objektiven Test zum Vorwissen handelt, sondern um eine retrospektive Einschätzung seitens der Eltern.
Die nationale Skala zum autonomiegestützten Mathematikunterricht besteht aus sechs Items (z. B. „Bei einer neuen Aufgabe darf ich selber probieren, wie das funktioniert.“) und wird im Kapitel Innere Differenzierung im Mathematikunterricht 4.3 im Detail beschrieben.
Beim anregenden Mathematikunterricht (IRT, Cronbachs Alpha = .68, 5 Items) handelt es sich um ein Merkmal, bei dem vor allem die wahrgenommene Instruktionsqualität bzw. die Strukturiertheit des Unterrichts (z. B. „Ich weiß, was meine Lehrerin von mir erwartet.“) sowie die motivationale Aktivierung (z. B. „Mich interessiert, was meine Lehrerin sagt.“) thematisiert wird.
Als Note in Mathematik ging ein Durchschnittswert der Eltern und Schülerangaben zur Mathematiknote im letzten Semesterzeugnis ein.
Die drei motivationalen Merkmale mathematisches Selbstkonzept, Freude an Mathematik und der subjektive Wert der
Mathematik basieren auf vierstufigen Likertskalen mit den Antwortkategorien „Stimme überhaupt nicht zu“, „Stimme eher nicht zu“, „Stimme eher zu“ und „Stimme völlig zu“. Das Merkmal mathematisches Selbstkonzept (IRT) wurde über sieben Aussagen (z. B. „Normalerweise bin ich gut in Mathematik.“, „Mathematik fällt mir schwerer als vielen Kindern meiner Klasse.“) erhoben (Cronbachs Alpha = .87). Das Merkmal Freude an Mathematik (IRT) beruht auf fünf Statements (z. B. „Ich lerne gern Mathematik.“, „Mathe matik ist langweilig.“). Die Qualität der Skala ist mit einem CronbachsAlphaWert von durchschnittlich .89 als sehr gut zu beurteilen. Der subjektive Wert der Mathematik wurde durch folgende zwei Items ermittelt: (1) Es ist wichtig, gut in Mathematik zu sein. (2) Für meine Zukunft ist es notwendig, gut rechnen zu können. Die Qualität der Skala mit einem Cronbachs Alpha von .65 ist noch ausreichend. Die bei TIMSS eingesetzten Indikatoren zur Messung des Selbstkonzepts erfassen die Bewertung der eigenen Fähigkeiten (evaluative Komponente), ohne den emotionalen Anteil des Selbstkonzepts zu berücksichtigen. Deshalb kann im Modell sehr gut zwischen der Erwartungskomponente (Selbstkonzept) und der Wertkomponente (Freude an Mathematik und subjektive Bedeutung des Fachs) differenziert werden.
Sowohl der Migrationshintergrund (1 = mit Migrationshintergrund, 0 = ohne Migrationshintergrund) als auch das Geschlecht (1 = Mädchen, 0 = Buben) gehen als DummyVariable in das Modell ein.4 Der Migrationshintergrund der Kinder definiert sich über das Geburtsland der Eltern. Demnach haben Kinder ohne Migrationshintergrund Eltern, die beide im Inland geboren wurden, und jene mit Migrationshintergrund haben zumindest einen Elternteil, der im Ausland geboren wurde.
Auswertungsverfahren
Für die Analyse der Wirkungszusammenhänge der familiären, schulischen und individuellen Merkmalsbereiche wurde ein Pfadmodell in Mplus 7 (Muthén & Muthén, 1998–2012) berechnet. Dabei wurden entsprechend der Fragestellung Regressionspfade von den beiden Strukturmerkmalen über die familiären Prozessmerkmale und individuellen Merkmale zur Mathematikkompetenz modelliert und ebenso von den Prozessmerkmalen über die individuellen Merkmale zur Mathematikkompetenz. Darüber hinaus wurden auch Pfade von den Unterrichtsmerkmalen zu den individuellen Merkmalen und zur Mathematikleistung spezifiziert (s. Abbildung 2.2.2). Interkorrelationen zwischen den im Modell untereinanderstehenden Merkmalen wurden im Modell berücksichtigt, aber grafisch nicht dar
3 Dabei wurde das PartialCreditModell als Erweiterung des RaschModells eingesetzt. Details zur Skalierung der Merkmale bei PIRLS & TIMSS 2011 sind im internationalen Technischen Bericht (Martin & Mullis, 2012) dokumentiert.
4 Zum einen zeigen sich dadurch die Effekte der familiären und schulischen Sozialisation um den Migrations und Geschlechtereffekt bereinigt und zum anderen kann überprüft werden, inwieweit der Migrationshintergrund und das Geschlecht unter Einbeziehung aller Modellvariablen einen eigenständigen und unabhängigen Einfluss haben.
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 91
gestellt. Nicht statistisch signifikante Pfade im Modell wurden zugelassen und nicht auf null gesetzt. Zur Beurteilung der Modellanpassung wurden der „Comparative Fit Index“(CFI) und der „Standardized Root Mean Square Residual“ (SRMR) herangezogen. Ein Modell weist eine zufriedenstellende Anpassung auf, wenn der CFI nahe bei 1 liegt sowie SRMR < .11 ausfallen (Bühner, 2011). Aufgrund der individualpsychologischen Fragestellung wurde auf die Modellierung eines Mehrebenenmodells verzichtet. Die mit der Ziehung von Schulklassen verbundene hierarchische Struktur der Daten wurde in der Spezifikation des Modells (Analyseoption Type = Complex in Mplus) berücksichtigt. Dabei verwendet das Programm Mplus standardmäßig den FullInformationMaximumLikelihoodAlgorithmus (FIML), der die Behandlung der fehlenden Werte und die Parameterschätzung des Modells in einem gemeinsamen Schritt vornimmt (Lüdtke et al., 2007). Bei dieser Methode werden keine fehlenden Werte imputiert oder geschätzt, sondern die Schätzung der Populationsparameter und ihrer Standardfehler wird auf der Basis der vorhandenen Daten vorgenommen (Lüdtke et al., 2007). Die Stichprobengröße, auf der das Pfadmodell beruht, beträgt demnach N = 4668.
Die Berechnung der indirekten Effekte erfolgte ebenfalls mit Mplus und mit den oben angeführten Analyseoptionen. Die Imputation der fünf Plausible Values ist jedoch bei
der Berechnung indirekter Effekte nicht möglich, weshalb die Analysen für jeden der fünf Plausible Values getrennt gerechnet und gemittelt wurden.
Ergebnisse
In Abbildung 2.2.3 sind die statistisch geprüften Wirkungszusammenhänge graphisch dargestellt. Bevor die Ergebnisse dieses Modells näher beschrieben werden, wird ausgeführt, wie dieses Modell zu lesen und zu verstehen ist:
Die Pfeile symbolisieren die direkten Effekte und zeigen in Richtung der abhängigen bzw. zu erklärenden Variablen. Der Pfeil von der höchsten Schulbildung der Eltern auf die Leseressourcen bedeutet beispielsweise, dass die Anzahl der Bücher direkt von der Schulbildung der Eltern abhängt. Bei den eingetragenen Effekten handelt es sich um partielle, standardisierte Effekte (standardisierte BetaKoeffizienten), die ab einem Absolutbetrag von größer/gleich .10 inhaltlich bedeutsam sind und im Modell eingetragen wurden. Die links stehenden Merkmale fungieren dabei immer als erklärende Variablen (Prädiktoren) für die jeweils rechts stehenden Merkmale, d. h. die hier dargestellten Effekte sind bereits um die Wirkung aller anderen Variablen, die
Leseressourcen (Bücher) R2 = .34
Mathe- fähigkeiten
zu Schulbeginn
R2 = .10
Mathematik- kompetenz
R2 = .41
.41
.17
.23
.26
.20 .12
–.19
Freude an Mathematik
R2 = .43
.29
.10 –.11
.16
Höchste berufliche Position der Eltern .22
–.15 –.10
.44
.16 .28
Note in Mathematik
R2 = .22
–.15 –.13
–.20
–.30
Mathematisches Selbstkonzept
R2 = .34
Eigener Fernseher R2 = .06
Musikinstrument R2 = .11
Subjektiver Wert der Mathematik
R2 = .14
–.12
.26
–.43
.26
Kind ist Mädchen Migrations- hintergrund
Familiäre Mathematische Frühförderung
R2 = .09
Autonomiege- stützter
Mathematik- unterricht R2 = .02
–.30
–.26
.13
.12
.44
Höchste Schulbildung der Eltern
–.11 .13
–.18
.33
Eingetragen sind standardisierte Effekte (standardisierte Beta-Koeffizienten), ab .10.Direkte Effekte auf die Leistung sind blau, Migrationseffekte grün und Geschlechtereffekte rot hervorgehoben. Indizes der Modellgüte: CFI = 0,884; SRMR = 0.060
FamiliäreStrukturen Familiäre Prozesse
Schulische Merkmale
IndividuelleMerkmale
–.14
Anregender Mathematik-
unterricht R2 = .07
Abbildung 2.2.3: Erklärungsmodell zur Mathematikleistung (TIMSS 2011)
92 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
weiter links davon stehen, bereinigt und wirken unabhängig davon (partielle Effekte).
Durch die Pfadanalyse können nicht nur direkte Pfade und damit die spezifische Wirkung eines Prädiktors auf eine abhängige Variable in Form von standardisierten BetaKoeffizienten gezeigt werden, sondern es ist auch eine Schätzung der gemeinsamen Wirkung aller Prädiktoren auf ein Merkmal möglich. Diese Wirkung wird in Form des Determinationskoeffizienten (R2) ausgedrückt, der den Anteil erklärter Varianz aller (links stehenden) Prädiktoren für die jeweils abhängige Variable angibt. Das in der Abbildung angegebene R2 von .34 beim Merkmal Leseressourcen bedeutet, dass 34 % der Streuung des Merkmals Bücher und Kinderbücher zu Hause (Leseressourcen) durch die links davon stehenden Merkmale (Schulbildung der Eltern, berufliche Position der Eltern) aufgeklärt werden können.
Bei der Ergebnisinterpretation werden nun einleitend jene Merkmale dargestellt, die einen direkten Einfluss auf die Mathematikleistung der österreichischen Kinder haben. Für die Mathematikkompetenz, deren Varianz zu 41 % durch das Modell erklärt werden kann, zeigen sich unter den hier berücksichtigten Merkmalen insgesamt sechs direkte Einflussgrößen (s. blaue Pfade in Abbildung 2.2.3):
Die erste Einflussgröße sind die Leseressourcen in Form der Anzahl an (Kinder)Büchern im Haushalt, die trotz Berücksichtigung der anderen Merkmale im Modell einen positiven Effekt auf die Mathematikkompetenz der Schüler/innen haben. Auch ein eigener Fernseher (im Kinderzimmer) zeigt bei Kontrolle der übrigen Merkmale einen deutlichen negativen Effekt auf die Mathematikleistung. Ebenso zeigen die mathematischen Fähigkeiten zu Schulbeginn noch am Ende der Grundschule einen positiven Effekt auf die Mathematik leistung. Auf der Unterrichtsebene geht der autonomiegestützte Mathematikunterricht mit schlechteren
Leistungen in Mathematik einher (Erklärung s. unten). Die deutlichsten Effekte zeigen sich bei den Noten und dem mathematischen Selbstkonzept. Erwartungsgemäß sind gute Noten sowie ein hohes mathematisches Selbstkonzept mit besseren Leistungen in Mathematik verbunden.
Die weitere Ergebnisinterpretation erfolgt der chronologischen und theoriegeleiteten Modellierung entsprechend von links nach rechts. Das postulierte Modell hat sich im Wesentlichen bestätigt und stellt sich wie folgt dar:
Die strukturellen Familienmerkmale (Schul und Berufsbildung der Eltern) haben unter Berücksichtigung der Modellmerkmale keinen direkten Effekt (<0.10) auf die Mathematikkompetenz. Beide Merkmale wirken primär indirekt über das kulturelle Kapital (Leseressourcen, Musik instrument im Haushalt oder Fernseher im eigenen Zimmer) und über die Schulnoten und das mathematische Selbstkonzept auf die Mathematikleistung. Somit lässt sich der relativ starke positive Zusammenhang zwischen Schulbildung und Beruf der Eltern und der Mathematikleistung der Kinder in erster Linie dadurch erklären, dass Kinder aus höheren Bildungs und Berufsschichten über mehr kulturelles Kapital (Bücher, Musikinstrumente, kein eigener Fernseher im Kinderzimmer) verfügen, bessere Noten bekommen und dadurch vermittelt auch ein besseres mathematisches Selbstkonzept aufbauen. Der Anteil der direkten und indirekten Effekte am Gesamteffekt ist in Tabelle 2.2.1 dargestellt. Hier zeigt sich sowohl für die Schulbildung als auch den Beruf der Eltern, dass ¾ der Gesamteffekte auf die Mathematikleistung indirekt bedingt sind.
Die mathematischen Fähigkeiten zu Schulbeginn (mathematisches Vorwissen) zeigen sowohl direkte als auch indirekte Effekte auf die Mathematikleistung. Der direkte Pfad von 0.10 wurde bereits anfangs beschrieben und besagt, dass auch bei gleichen familiären Bedingungen (von der Schulbil
„Bildung der Eltern“
„Beruf der Eltern“Mathematische Fähigkeiten zu Schulbeginn
„Autonomiege-stützter Mathe-
Unterricht“
„Anregender Mathe-
Unterricht“Mathematiknote
Gesamt-effekt
0.27 100 % 0.11 100 % 0.18 100 % 0.17 100 % 0.10 100 % –0.38 100 %
direkter Effekt
0.06 24 % 0.03 23 % 0.10 54 % 0.14 84 % n. s. n. s. –0.30 78 %
indirekter Effekt
0.20 76 % 0.08 77 % 0.08 46 % 0.03 16 % 0.10 100 % –0. 08 22 %
„primär bedingt durch …“
Noten, Bücher, Noten – Selbstkon-zept* Fernseher im Zimmer, Musikinst-
rument
Noten, Bücher, Noten – Selbstkon-zept*, Musikinstru-
ment
Noten, Noten – Selbstkonzept*, Selbstkonzept
Noten, Noten – Selbstkonzept*
Selbstkonzept, Noten, Noten – Selbstkonzept*subjektiver Wert der Mathematik
Selbstkonzept
* indirekter Effekt, der über das höhere Selbstkonzept bedingt durch gute Noten die Leistung beeinflusstn. s. = nicht signifikant
Tabelle 2.2.1: Direkte und indirekte Effekte auf die Mathematikleistung (TIMSS 2011)
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 93
dung und dem Beruf der Eltern bis hin zur mathe matischen Frühförderung) das mathematische Vorwissen zu Schulbeginn bessere Mathematikleistungen am Ende der Grundschule bedingt. Es zeigen sich aber auch indirekte Effekte von 0.08, die vor allem vermittelnd über bessere Noten und ein höheres Selbstkonzept sowie ein höheres Selbstkonzept bedingt durch bessere Noten die Mathe matik leistung positiv beeinflussen (s. Tabelle 2.2.1). Das mathematische Vorwissen zu Schulbeginn beeinflusst jedoch weder die Freude an Mathematik noch den subjektiven Wert, der Mathematik beigemessen wird.
Das Unterrichtsmerkmal autonomiegestützter Mathematikunterricht zeigt vor allem negative Effekte auf die Mathematikleistung: Autonomie im Mathematikunterricht geht demnach mit schlechteren Leistungen einher (Erklärung s. unten). Indirekt wird dieser Effekt vor allem über schlechtere Mathematiknoten vermittelt.
Der anregende Mathematikunterricht zeigt hingegen die erwartete positive Wirkung auf die Mathematikleistung, wenngleich sich diese Wirkung auch nur in indirekter Form zeigt: Die Leistung wird im anregenden Unterrichtssetting primär über bessere Noten, ein höheres mathematisches Selbstkonzept sowie ein höheres Selbstkonzept bedingt durch bessere Noten positiv beeinflusst. Ein anregender Mathematikunterricht wird auch von mehr Freude und einem höheren subjektiven Wert, der Mathematik zugeschrieben wird, begleitet.
Gute Mathematiknoten gehen auch bei gleichen familiären und schulischen Bedingungen mit einem höheren Selbstkonzept und besseren Mathematikleistungen einher. Effekte auf die motivationalen Merkmale, wie Freude und subjektiver Wert der Mathematik, können keine beobachtet werden. Somit werden auch die indirekten Effekte von 0.08 ausschließlich über das Selbstkonzept vermittelt (s. Tabelle 2.2.1).
Das mathematische Selbstkonzept zeigt, wie angenommen, einen direkten positiven Effekt auf die Mathematikleistung sowie positive Effekte auf die Freude und den subjektiven Wert. Ein vermittelter Effekt über Freude und subjektiven Wert auf die Mathematikleistung kann jedoch nicht bestätigt werden. Ebenso bleibt auch der direkte Effekt der beiden Merkmale „Freude an Mathematik“ und „subjektiver Wert der Mathematik“ auf die Leistung aus.
Migrationseffekte
Wie erwartet, geht der Migrationshintergrund mit geringeren sozioökonomischen Merkmalsausprägungen einher5. Vor allem die berufliche Position der Eltern zeigt dahinge
hend deutliche Effekte: Kinder mit Migrationshintergrund haben häufiger Eltern in niedrigeren beruflichen Positionen. Sie besitzen auch deutlich weniger Leseressourcen zu Hause und erfahren weniger häufig eine mathematische Frühförderung im Elternhaus. Wie zu erwarten war, erfahren sie jedoch häufiger einen autonomiegestützten Mathematikunterricht. Ihre Mathematikfähigkeiten zu Schulbeginn werden von den Eltern aber höher eingeschätzt als bei Kindern ohne Migrationshintergrund. Kinder mit Migrationshintergrund haben mehr Freude an Mathematik und messen der Mathematik mehr subjektiven Wert bei (dabei handelt es sich um Effekte unter 0.10; diese sind aufgrund des strengen Schwellenwerts im Modell nicht eingetragen).
Werden die familiären, schulischen und individuellen Unterschiede statistisch kontrolliert, reduziert sich der ursprüngliche Effekt auf die Leistung von –0.25 auf –0.09. Das heißt, dass Kinder mit Migrationshintergrund unter gleichen Rahmenbedingungen nur geringfügig geringere Mathematikfähigkeiten aufweisen.
Geschlechtereffekte
Einige der im Folgenden berichteten Geschlechtereffekte im Modell sind zwar statistisch signifikant, praktisch jedoch von geringer Größe (Effektstärken kleiner .10), weshalb sie im Modell nicht eingezeichnet sind. Aufgrund der Bedeutung des Themas werden diese Ergebnisse dennoch berichtet.
Im Hinblick auf das kulturelle Kapital berichten Mädchen eine positivere familiäre Situation als Buben: Sie haben häufiger ein Musikinstrument im Haushalt (Effekt = .16) und besitzen seltener einen eigenen Fernseher im Kinder zimmer (Effekt = .10). Sie erwähnen auch eine höhere Anzahl von Büchern zu Hause, wobei dieser Effekt nur gering ist (Effekt: 0.04). Dennoch werden die mathematischen Fähigkeiten zu Schulbeginn bei den Buben von ihren Eltern höher eingestuft (Effekt = 0.09).
Während der Schulzeit spricht der anregende Unterricht eher die Mädchen an (Effekt = 0.08), wobei sich im Hinblick auf die Autonomieunterstützung im Unterricht keine Unterschiede zeigen. Ein deutlicher Effekt zeigt sich beim mathematischen Selbstkonzept, das bei den Buben deutlich höher ist als bei den Mädchen. Auch die Freude an Mathematik sowie die Leistung in Mathematik sind unter Berücksichtigung von sozioökonomischen, kulturellen, familiären und unterrichtlichen Unterschieden bei den Buben etwas höher (Effekte unter 0.10).
5 Der Migrationseffekt im Zusammenhang mit der Schulbildung der Eltern ist signifikant und beträgt –.09. Er liegt damit knapp unter dem strengen Schwellenwert und ist deshalb im Modell nicht eingetragen.
94 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
Diskussion
Im vorliegenden Beitrag wurde die Mathematikkompetenz durch individuelle, familiäre und unterrichtliche Merkmale anhand eines Pfadmodells erklärt. Dieses Modell basiert auf dem Rahmenmodell schulischer Leistung, wie es 1997 im Rahmen der SCHOLASTIKStudie von Helmke und Weinert postuliert wurde, und das um die Annahmen des AngebotsNutzungsModells (Helmke, 2006) ergänzt und erweitert wurde. Im Folgenden werden die zentralen Ergebnisse zusammengefasst, diskutiert und Konsequenzen für die Praxis abgeleitet.
Beginnend mit den Schülerinnen und Schülern selbst (= in dividuelle Faktoren), lässt sich die Bedeutung der motivationalen Faktoren für die Schülerleistung bestätigen. Das schulische Selbstkonzept, das neben der positiven Beziehung zur Leistung auch mit einer höheren Freude in Mathematik und einer höheren Wertzuschreibung für das Fach einhergeht, stellt dabei das wichtigste Merkmal dar. Für eine optimale Entwicklung der Mathematikkompetenz ist es daher von Relevanz, dass Schüler/innen Vertrauen in die eigene Leistungsfähigkeit in Mathematik entwickeln. Dies sollte möglichst frühzeitig erfolgen, da sich Selbstkonzepte mit zunehmenden Schuljahren kontinuierlich verfestigen und dadurch auch schwerer beeinflussbar werden (Möller & Trautwein, 2009). Konkret für die Unterrichtspraxis bedeutet dies, dass den Schülerinnen und Schülern ein positives Kompetenzerleben ermöglicht werden sollte. Dies könnte beispielsweise durch Klarheit in der Instruktion, durch Anwendung einer individuellen Bezugsnormorientierung und auch durch Individualisierung im Unterricht (z. B. durch die Darbietung von Aufgaben mit unterschiedlichem Anspruchsniveau) realisiert werden. Auch der Notenpraxis kommt eine bedeutende Rolle zu, beeinflusst die Schulnote doch deutlich die Entwicklung des Selbstkonzepts (Jung, 2014).
Insbesondere Mädchen sollten in ihrer Zuversicht, auch in Mathematik gute Leistungen erbringen zu können, gefördert werden, da sie ein niedrigeres Selbstkonzept als Buben aufweisen. Hier sollte auch an der geschlechtlichen Identität gezielt gearbeitet und ein Aufbrechen der geschlechtsbezogenen Interessen angestrebt werden (z. B. Lazarides & Ittel, 2011; Paseka, 2009). Dass Mädchen und Buben unterschiedliche Sozialisationserfahrungen bereits vor Schulbeginn haben, spiegelt sich auch in den Unterschieden im frühen mathematischen Bildungserfolg wider: Aus Elternsicht bestätigt sich die geringere Fähigkeit in Mathematik von Mädchen bereits vor Schuleintritt. Eine Förderung des mathematischen Selbstkonzepts der Mädchen sollte sinnvollerweise daher immer in Zusammenarbeit mit und unter Einbindung der Familie erfolgen. Dies steht auch in Einklang mit Erkenntnissen aus der Frühförderung: Frühförderungsprogramme sind langfristig nur dann wirksam, wenn auch das familiäre Umfeld in diese Programme einbezogen wird (Hany, 1997). Aus der Geschlechterforschung
ist des Weiteren bekannt, dass soziale Bezugspersonen, wozu neben den Mitschülerinnen und schülern sowohl die Lehrkräfte wie auch die Familie und der nähere Bekannten und Freundeskreis zählen, insbesondere dann an Bedeutung gewinnen, wenn im geschlechtsuntypischen Fach Vertrauen und Interesse aufgebaut werden soll. Hier braucht es im Besonderen die Unterstützung, aber auch das Vorbild der sozialen Umwelt (Lazarides & Ittel, 2011).
Während die Mädchen ein geringeres Selbstkonzept entwickeln als die Buben, stellt dieses eine Ressource von Schülerinnen und Schülern mit Migrationshintergrund dar. Wie auch schon in früheren Studien aufgezeigt (z. B. Faber et al., 2011), berichten Migrantenkinder von einem höheren Selbstkonzept in Mathematik trotz geringerer vorhandener Mathematikleistung. Neben möglicherweise kulturellen Unterschieden im Einschätzungsverhalten (= Schüler/innen mit Migrationshintergrund beurteilen „optimistischer“) oder auch der Bedeutung der Note für die Selbstkonzeptentwicklung (= Migrantinnen und Migranten weisen keine inhaltlich bedeutsam schlechteren Schulnoten in Mathematik auf ), könnte dieser Effekt auf die Art der herangezogenen Vergleichs dimension zurückgeführt werden. Es ist wahrscheinlich, dass das Selbstkonzept in Mathematik durch vergleichsweise geringe Leistungen im Fach Deutsch aufgewertet wird. Man nennt dies „dimensionales Vergleichen“ (= internal frame of reference): Schüler/innen vergleichen ihre Leistungen nicht nur mit ihren Klassenkameraden (= external frame of reference), sondern es finden auch intraindividuelle Vergleiche statt (siehe z. B. Dickhäuser, 2003). Dadurch, dass Migrantinnen und Migranten aufgrund von Schwierigkeiten in der Sprachbeherrschung meist ein geringeres Selbstkonzept in Deutsch aufweisen, ist es sehr wahrscheinlich, dass im Vergleich dazu die mathematische Fähigkeit überdurchschnittlich positiv eingeschätzt – folglich auch „überschätzt“ – wird. Man spricht hier von „Kontrasteffekten“ (Möller & Trautwein, 2009, S. 193). Die Schule ist aufgrund des Wissens um auftretende Kontrasteffekte daher besonders gefordert, realistische Selbsteinschätzungen der Schüler/innen zu fördern, ohne dabei aber die Ressource des „positiven Selbstkonzepts“ zu gefährden. Dies könnte zum Beispiel durch den Einsatz einer gezielten regelmäßigen Feedbackpraxis gekoppelt mit Selbsteinschätzungselementen erfolgen. Im Hinblick auf die Form des Feedbacks erscheint eine Kombination aus einer auf den Leistungsfortschritt bezogenen Rückmeldung (individuelle Bezugsnorm) verbunden mit Informationen über die Erreichung des Leistungsziels (= Kriterium; kriteriale Bezugsnorm) sinnvoll.
Neben dem Selbstkonzept erweist sich die schulische Leistungsfähigkeit der Kinder vor Beginn der Grundschule (= Vorwissen) direkt und auch indirekt – vermittelt über die motivationalen Variablen – als die Mathematikleistung am Ende der Grundschule beeinflussend. Entsprechend bisherigen Befunden bestätigt sich also auch in TIMSS 2011 die Bedeutung des Vorwissens für die Leistungsentwicklung der Kinder. Wie bereits bei Helmke und Weinert (1997) auf
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 95
gezeigt, lassen sich somit Leistungsvorsprünge respektive nachteile, die bereits zu Beginn der Grundschulzeit existieren, nicht mehr vollständig aufholen, womit dem Elternhaus sowie den vorschulischen Einrichtungen eine zentrale Rolle für die Leistungsentwicklung zukommt.
Am Ausmaß des Vorwissens maßgeblich beteiligt sind vor allem der Zugang zu Leseressourcen im Elternhaus und die mathematische familiäre Frühförderung. Leseressourcen im Elternhaus, deren Vorhandensein wiederum vom sozioökonomischen Status der Eltern (= operationalisiert durch Schulbildung und Beruf der Eltern) abhängt, weisen auch einen direkten Einfluss auf die Mathematikleistung am Ende der 4. Klasse auf. Insbesondere Migrantenkinder sind im Hinblick auf das im Elternhaus vorhandene kulturelle Kapital benachteiligt, was sich sowohl durch einen geringeren Zugang zu Büchern als auch in einer weniger häufig stattfindenden mathematischen Frühförderung in der Familie äußert. Laut Elternangaben sollten Schüler/innen mit Migrationshintergrund jedoch ein höheres mathematisches Vorwissen zu Schulbeginn aufweisen. Dass ein geringeres kulturelles Kapital zu einer höheren Mathematikleistung zu Schulbeginn führen sollte, scheint jedoch sehr unplausibel und ist möglicherweise durch kulturelle Unterschiede im Einschätzungsverhalten bedingt. Möglich wäre auch, dass die geringen Unterschiede in den Mathematiknoten zwischen Kindern mit und ohne Migrationshintergrund, die den Eltern als Basis zur Einschätzung der Mathematikkompetenz dienen, dazu beitragen, dass Eltern mit Migrationshintergrund das „Vorwissen“ der Kinder vor Beginn der Grundschule systematisch überschätzen.
Neben diesem vorerst unplausibel erscheinenden Befund, dem allerdings mit der aktuellen Datenlage nicht weiter nachgegangen werden kann (es liegt keine objektive Messung der Leistung zu Beginn der Grundschule vor), sprechen die Daten im Hinblick auf familiäre Merkmale jedoch ein klares Bild: Sie heben die Relevanz der vorschulischen Förderung und des im Elternhaus zur Verfügung stehenden kulturellen Kapitals hervor. Bildungsungleichheiten bzw. auch ungerechtigkeiten bilden sich demnach sehr früh und das österreichische Bildungssystem ist gefordert, dieser Entwicklung entgegenzusteuern. Die Verpflichtung zum mindestens ein Jahr dauernden Kindergartenbesuch ist ein Versuch, diese durch Unterschiede im kulturellen Kapital im Elternhaus verursachte Ungerechtigkeit zu verringern. Es ist jedoch nicht anzunehmen, dass die externe Frühförderung Unterschiede in den familiären Sozialisationsbedingungen vollständig kompensieren kann, wofür auch der direkte Pfad der Leseressourcen zur Mathematikleistung spricht. Um optimale Entwicklungen zu ermöglichen, ist die Einbindung der Eltern in die Bemühungen der Frühförderung erstrebenswert, wie bereits im Hinblick auf die Entwicklung des Vorwissens angesprochen wurde.
Eine weitere Möglichkeit, der bestehenden Bildungsungleichheit entgegenzuwirken, wäre eine Modifikation bei
der Anerkennung der beruflichen Ausbildung von Migrantinnen und Migranten in Österreich. Die Analysen zeigen, dass Kinder mit Migrationshintergrund vor allem Eltern in niedrigeren beruflichen Positionen und weniger mit geringer Schulbildung haben. Dieses Ergebnis steht im Einklang mit der Erkenntnis, dass in Österreich Migration, bei gleicher formaler Schulbildung, mit einer geringeren beruflichen Position verbunden ist (Gächter, 2010). Ergänzend muss jedoch hinzugefügt werden, dass es bis dato keine datenbasierten Untersuchungen gibt, die sich mit der Anerkennung beruflicher Ausbildung und einer damit einhergehenden Reduzierung von Bildungsungleichheit beschäftigt haben.
Als dritter Bereich wurden im Modell Faktoren des Unterrichts – konkret ein autonomieunterstützender Unterricht und eine anregende Unterrichtsgestaltung (z. B. Förderung des Interesses im Unterricht) – berücksichtigt. Während der anregende Mathematikunterricht die erwartete Wirkung zeigt, nämlich die Förderung der Schülermotivation (Selbstkonzept/Freude/Wert), und auch mit besseren Noten einhergeht, erweist sich die Wirkung des autonomieunterstützenden Unterrichts als komplexer und weniger eindeutig. Während Autonomieunterstützung im Unterricht wie erwartet von den Schülerinnen und Schülern als positiv anregend eingeschätzt wird, und in Folge mit einem erhöhten Selbstkonzept und einer höheren Wertzuschreibung einhergeht, erreichen Schüler/innen, die von einer höheren Autonomieunterstützung berichten, schlechtere Noten in der Schule. Die Noten wirken wiederum negativ auf das schulische Selbstkonzept und sind auch mit einer schlechteren Mathematikleistung in TIMSS assoziiert. Das heißt, Autonomieunterstützung wirkt entsprechend dem berechneten Modell zum einen motivational günstig, zum anderen jedoch eher ungünstig auf die Leistung. Eine Erklärungsmöglichkeit für diesen Befund könnte in der Selbstregulationsfähigkeit der Schüler/innen liegen: Um optimales Lernen in einer relativ frei gestalteten Lernumgebung (= hohe Autonomie) zu erzielen, müssen die Schüler/innen über eine entsprechende Selbstregulationskompetenz, wozu auch Lernstrategien zählen, verfügen, um diese Offenheit entsprechend nützen zu können. Fehlt diese Kompetenz im selbstgesteuerten Lernen, kann Autonomie im Klassenzimmer der Leistungsentwicklung auch hinderlich sein. Autonomieerleben ist demnach entsprechend der Selbst bestimmungstheorie der Motivation (Deci & Ryan, 1993) eine hilfreiche Unterrichtsstrategie, um Lernmotivation zu fördern. Soll sie jedoch auch leistungssteigernd sein, so sind Lehrkräfte darin beraten, die Selbstregulationsfähigkeiten der Schüler/innen explizit zu fördern. Hierzu gibt es bereits eine Reihe an Trainings (Götz & Nett, 2011). Damit der Transfer der Selbstregulationsfähigkeiten in den schu lischen Alltag gelingt, ist es notwendig, diese Trainings möglichst nah am schulischen Lernen und den dort zu verarbeitenden Inhalten zu orientieren (Hasselhorn & Labuhn, 2010).
96 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
Zusammenfassend lässt sich mit dem in diesem Beitrag berechneten Modell demnach belegen, dass die Mathematikkompetenz – wie es von Rahmenmodellen schulischer Leistung angenommen wird – multideterminiert ist. Im Bewusstsein, dass bei internationalen Schulleistungsstudien Restriktionen im Hinblick auf die Länge der Fragebögen vorliegen und Indikatoren sehr komprimiert erhoben werden müssen, wäre für zukünftige Zyklen von TIMSS die zusätzliche Aufnahme von Schülerverhaltensvariablen, wozu beispielsweise Selbstregulationsstrategien zählen wür
den, wünschenswert (für die Erfassung von Lernstrategien in Lesen siehe PISAStudie, z. B. Artelt, Naumann & Schneider, 2010). Entsprechend dem AngebotsNutzungsModell, das zu Beginn des Beitrags vorgestellt wurde, mediiert das Nutzungsverhalten die Beziehung zwischen dem Unterrichtsangebot, der ausgelösten Motivationslage und der daraus resultierenden Schülerleistung. Damit stellt das Schülerverhalten eine wesentliche Variable zur Erklärung der Schülerleistung dar.
Literatur
Artelt, C., Naumann, J. & Schneider, W. (2010). Lesemotivation und Lernstrategien. In E. Klieme et al. (Hrsg.), PISA 2009. Bilanz nach einem Jahrzehnt (S. 73–112). Münster: Waxmann.
Bergmüller, S. (2010). Leistungsschwache Schüler/innen: Kompetenzen und Charakteristika. In B. Suchan, C. Wallner Paschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 64–81). Graz: Leykam.
Breit, S. & Wanka, R. (2010). Schüler/innen mit Migrationshintergrund: Ein Portrait ihrer Kompetenzen im Licht ihrer familiären und schulischen Sozialisation. In B. Suchan, C. WallnerPaschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 96–114). Graz: Leykam.
Bourdieu, P. (1983). Ökonomisches Kapital, kulturelles Kapital, soziales Kapital. In R. Kreckel (Ed.), Soziale Ungleichheit (S. 183–198). Göttingen: Schwartz.
Bruneforth, M., Weber, C. & Bacher, J. (2013). Chancengleichheit und garantiertes Bildungsminimum in Österreich. In B. HerzogPunzenberger (Hrsg.), Nationaler Bildungsbericht Österreich 2012: Band 2 Fokussierte Analysen bildungspolitischer Schwerpunktthemen (S. 189–227). Graz: Leykam.
Bühner, M. (2011). Einführung in die Test und Fragebogenkonstruktion. München: Pearson Studium.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum.
Deci, E. L. & Ryan, R. M. (1993). Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. Zeitschrift für Pädagogik, 39 (2), 223–238.
Dickhäuser, O. (2003). Überprüfung des erweiterten Modells des internal/external frame of reference. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 35 (4), 200–207.
Eccles (Parsons), J., Adler, T. F., Futterman, R., Goff, S. B., Kaczala, C. M., Meece, J. L. & Midgley, C. (1983). Expectancies, values, and academic behaviors. In J. T. Spence (Ed.), Achievement and achievement motivation (pp. 75–146). San Francisco, CA.: W. H. Freeman.
Ehmke, T. & Siegle, T. (2008). Einfluss elterlicher Mathematikkompetenz und familialer Prozesse auf den Kompetenzerwerb von Kindern in Mathematik. Psychologie in Erziehung und Unterricht, 55 (4), 253–264.
Faber, G., Tiedemann, J. & BillmannMahecha, E. (2011). Selbstkonzept und Lernfreude in der Grundschulmathematik: Die Bedeutung von Migration und Geschlecht. Längsschnittliche Ergebnisse aus der Hannoverschen Grundschulstudie. Heilpädagogische Forschung, 37 (3), 127–143.
Gächter, A. (2010). Der Integrationserfolg des Arbeitsmarktes. In H. Langthaler (Hrsg.), Integration in Österreich: Sozialwissenschaftliche Befunde (S. 143–163). Wien: StudienVerlag.
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 97
Götz, T. & Nett, U. E. (2011). Selbstreguliertes Lernen. In T. Götz (Hrsg.), Emotion, Motivation und selbstgesteuertes Lernen (S. 143–183). Paderborn: Schöningh. Gröhlich, C. (2012). Bildungsqualität. Strukturen und Prozesse in Schule und Unterricht und ihre Bedeutung für den Kompetenzerwerb (Reihe: Empirische Erziehungswissenschaft). Münster: Waxmann.
Grube, D. & Hasselhorn, M. (2006). Längsschnittliche Analysen zur Lese, Rechtschreib und Mathematikleistung im Grundschulalter: zur Rolle von Vorwissen, Intelligenz, phonologischem Arbeitsgedächtnis und phonologischer Bewusstheit. In I. Hosenfeld & F.W. Schrader (Hrsg.), Schulische Leistung. Grundlagen, Bedingungen, Perspektiven (S. 87–105). Münster: Waxmann.
Hagenauer, G. (2011). Lernfreude in der Schule. Münster: Waxmann.
Hagenauer, G. & Hascher, T. (2011). Lernfreude, engagierte Mitarbeit im Unterricht und erfolgreiches Leisten bei instrumentellen Formen der Lernmotivation – ein Widerspruch in sich? Zeitschrift für Bildungsforschung, 1 (2), 97–113.
Hany, E. A. (1997). Entwicklung vor, während und nach der Grundschulzeit. Literaturüberblick über den Einfluss der vorschulischen Entwicklung auf die Entwicklung im Grundschulalter. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 391–404). Weinheim: Beltz.
Hasselhorn, M. & Labuhn, A. S. (2010). Lernstrategien. In T. Hascher & B. Schmitz (Hrsg.), Pädagogische Interventionsforschung (S. 73–84). Weinheim & München: Juventa.
Heinze, A., HerwartzEmden, L. & Reiss, K. (2007). Mathematikkenntnisse und sprachliche Kompetenz bei Kindern mit Migrationshintergrund zu Beginn der Grundschulzeit. Zeitschrift für Pädagogik, 53 (4), 562–581.
Heller, K. A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Literaturüberblick. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 183–202). Weinheim: Beltz
Helmke, A. (2006). Unterrichtsqualität: Erfassen, Bewerten, Verbessern (4. Aufl.). Seelze: Kallmeyersche Verlagsbuchhandlung.
Helmke, A. (1993). Die Entwicklung der Lernfreude vom Kindergarten bis zur 5. Klassenstufe. Zeitschrift für Pädagogische Psychologie, 7 (2–3), 77–86.
Helmke, A. (1997). Individuelle Bedingungsfaktoren der Schulleistung: Ergebnisse aus dem SCHOLASTIKProjekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 203–216). Weinheim: Beltz.
Helmke, A., Hosenfeld, I. & Schrader, F.W. (2002). Unterricht, Mathematikleistung und Lernmotivation. In A. Helmke & R. S. Jäger (Hrsg.), Das Projekt MARKUS. MathematikGesamterhebung Rheinland Pfalz: Kompetenzen, Unterrichtsmerkmale, Schulkontext (S. 413–480). Landau: Empirische Pädagogik.
Helmke, A. & Reich, H. H. (2001). Die Bedeutung der sprachlichen Herkunft für die Schulleistung. Empirische Pädagogik, 15 (4), 567–600.
Helmke, A. & Weinert, F. E. (1997). Bedingungsfaktoren schulischer Leistungen. In F. E. Weinert (Hrsg.), Psychologie des Unterrichts und der Schule (S. 71–176). Göttingen: Hogrefe.
Hyde, J. S., Fennema, E. & Lamon, S. J. (1990). Gender differences in mathematics performance: A metaanalysis. Psychological Bulletin, 107 (2), 139–155.
Jung, J. (2014). Reform und Alternativschulen. In W. Einsiedler, M. Götz, A. Hartinger & F. Heinzel (Hrsg.), Handbuch Grundschulpädagogik und Grundschuldidaktik (pp. 74–78): UTB GmbH.
Klieme, E., Lipowsky, F., Rakoczy, K. & Ratzka, N. (2006). Qualitätsdimensionen und Wirksamkeit von Mathematikunterricht. Theoretische Grundlagen und ausgewählte Ergebnisse des Projekts „Pythagoras“. In M. Prenzel & L. AllolioNäcke (Hrsg.), Untersuchungen zur Bildungsqualität von Schule (S. 127–146). Münster: Waxmann.
98 Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz
Köller, O., Zoe, D., Schnabel, K. U. & Baumert, J. (2000). Kurswahlen von Mädchen und Jungen im Fach Mathematik: Zur Rolle von fachspezifischem Selbstkonzept und Interesse. Zeitschrift für Pädagogische Psychologie, 14 (1), 26–37.
Krajewski, K., Grüßing, M. & PeterKoop, A. (2009). Die Entwicklung mathematischer Kompetenzen bis zum Beginn der Grundschulzeit. In A. Heinze & M. Grüßing (Hrsg.), Mathematiklernen vom Kindergarten bis zum Studium (S. 17–34). Münster: Waxmann.
Krapp, A. (2009). Interesse. In V. Brandstätter & J. H. Otto (Hrsg.), Handbuch der Allgemeinen Psychologie – Motivation und Emotion (S. 54–57). Göttingen: Hogrefe.
Lazarides, R. & Ittel, A. (2011). Soziale und individuelle Bedeutungsfaktoren für mathematisches Fachinteresse und geschlechtsspezifisches Verhalten. In A. Hadjar (Hrsg.), Geschlechtsspezifische Bildungsungleichheiten (S. 309–330) Wiesbaden: VS.
Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung. Probleme und Lösungen. Psychologische Rundschau, 58 (2), 103–117.
Martin, M. O. & Mullis, I. V. S. (Eds.). (2012). Methods and procedures in TIMSS and PIRLS 2011. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. [Zugriff am 09. 09. 2013 unter http://timssandpirls.bc.edu/methods/tcontextqscales.html].
Möller, J. & Trautwein, U. (2009). Selbstkonzept. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S. 179–203) Heidelberg: Springer.
Mücke, S. (2009). Schulleistungen von Jungen und Mädchen in der Grundschule – eine metaanalytische Bilanz. Empirische Pädagogik, 23 (3), 290–337.
Muthén, L. K. & Muthén, B. O. (1998–2012). Mplus User’s Guide. 7th Ed. Los Angeles, CA: Muthén & Muthén.
Niggli, A., Trautwein, U., Schnyder, I., Lüdtke, O. & Neumann, M. (2007). Elterliche Unterstützung kann hilfreich sein, aber Einmischung schadet. Psychologie in Erziehung und Unterricht, 54 (1), 1–14.
Paseka, A. (2009). Geschlecht lernen rekonstruieren – dekonstruieren – konstruieren. Einige Anregungen für eine geschlechtssensible Pädagogik und Didaktik. In T. Schweiger & T. Hascher (Hrsg.), Geschlecht, Bildung und Kunst (S. 15–39). Wiesbaden: VS.
Reeve, J., Bolt, E. & Cai, Y. (1999). Autonomysupportive teachers: How they teach and motivate students. Journal of Educational Psychology, 91, 537–548.
Rustemeyer, R. & Fischer, N. (2007). Geschlechterdifferenzen bei Leistungserwartung und Wertschätzung im Fach Mathematik. In P. H. Ludwig & H. Ludwig (Hrsg.), Erwartungen in himmelblau und rosarot. Effekte, Determinanten und Konsequenzen von Geschlechterdifferenzen in der Schule (S. 83–101). Weinheim & München: Juventa.
WallnerPaschon, C. (2010). Kompetenzunterschiede für Mädchen und Buben. In B. Suchan, C. WallnerPaschon & C. Schreiner (Hrsg.), TIMSS 2007. Mathematik und Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht (S. 96–114). Graz: Leykam.
WallnerPaschon, C. (2012). Mathematik: Leistungsunterschiede zwischen Mädchen und Buben. In B. Suchań, C. WallnerPaschon, S. Bergmüller & C. Schreiner (Hrsg.), PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse (S. 30–31). Graz: Leykam.
Weinert, F. E. & Helmke, A. (1995). Interclassroom differences in instructional quality and interindividual differences in cognitive development. Educational Psychologist, 30, 15–20. Weinert, F. E. & Helmke, A. (1997). Entwicklung im Grundschulalter. Weinheim: Beltz.
Weinert, F. E. & Stefanek, J. (1997). Entwicklung vor, während und nach der Grundschulzeit. Ergebnisse aus dem SCHOLASTIKProjekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 423–452). Weinheim: Beltz.
Die Bedeutung von familiären, schulischen und individuellen Merkmalen für die Mathematikkompetenz 99
Wigfield, A. & Eccles, J. S. (2000). Expectancy – value theory of motivation. Contemporary Educational Psychology, 25 (1), 68–81.
Wigfield, A., Eccles, J. S., Suk Yoom, K., Harold, R., Abreton, A. J. A., FreedmanDoan, C. & Blumenfeld, P. C. (1997). Change in children’s competence beliefs and subjective task values across the elementary school years: a 3year study. Journal of Educational Psychology, 89 (3), 451–469.
Wild, E. & Möller, J. (2014). Pädagogische Psychologie. Springer: Berlin Heidelberg.
100 Effekte der Geschwisterkonstellation auf schulische Kompetenzen
2.3 Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf schulische Kompetenzen
Christine Schmid & Anna Glaeser
Einleitung
Der vorliegende Beitrag widmet sich der Frage, ob und in welcher Weise Geschwister mit der Entwicklung von schulischen Kompetenzen in Lesen, Mathematik und Naturwissenschaft im Zusammenhang stehen. In der Literatur zu Geschwisterbeziehungen wird beschrieben, dass ältere Geschwister gegenüber den jüngeren häufig die Rolle von Lehrenden und Betreuenden übernehmen und in dieser Funktion sogar erfolgreicher sein können als die Eltern (Kasten, 1993; Liegle, 2006). Die Vermutung liegt nahe, dass ältere Geschwister mit den jüngeren auch für die Schule lernen und es stellt sich die Frage, ob Kindern mit älteren Geschwistern dadurch ein systematischer Vorteil beim Erwerb schulischer Kompetenzen erwächst.
Der Vermutung, dass Kinder mit älteren Geschwistern einen Lernvorteil haben, steht die Annahme gegenüber, dass Kinder mit jüngeren Geschwistern einen Kompetenzvorsprung aufweisen. Diese Annahme ist durch den sogenannten teaching effect begründet, den Zajonc und Markus (1975) auf der Grundlage des in den 1970er Jahren entwickelten confluence models in die Diskussion brachten (s. auch Zajonc, 2001; Zajonc & Sulloway, 2007). Kinder mit jüngeren Geschwistern sollen davon profitieren, dass sie die Möglichkeit haben, lehrendes Verhalten auszuüben. Tatsächlich belegen experimentelle Untersuchungen einen positiven Effekt solchen Verhaltens auf die Entwicklung von kognitiven Kompetenzen bei Kindern (z. B. Bargh & Shul, 1980; Kagan, 1992). Anderen etwas beibringen führt demnach zu einer Strukturierung des eigenen Wissens und der eigenen Fähigkeiten, die auch der Entwicklung schulischer Kompetenzen förderlich sein könnte.
Inwieweit sich Evidenzen für die eine wie für die andere Annahme ergeben, soll im Folgenden auf der Grundlage der im Jahr 2011 im Rahmen von PIRLS & TIMSS erhobenen Daten für österreichische Schüler/innen der 4. Schulstufe geprüft werden.
Die Geschwisterbeziehung als Lernkontext
Geschwisterbeziehungen weisen eine Reihe von Charakteristika auf, die als besonders lernförderlich gelten können (Azmitia & Perlmutter, 1989; Rogoff, 1990). Ein älteres Geschwister mit hinreichend großem Altersabstand verfügt im Vergleich zum jüngeren Geschwister über weiterent wickelte soziale und kognitive Fähigkeiten und ist dadurch ab einem gewissen Alter in der Lage, die gemeinsamen Interaktionen zu strukturieren. Gleichzeitig ist die kognitive Überlegenheit älterer Geschwister geringer als diejenige der Eltern, weshalb es älteren Geschwistern unter Umständen leichter gelingt, an die Sichtweisen und den Erfahrungshorizont des jüngeren Geschwisters anzuknüpfen.
Experimentelle Untersuchungen belegen zum einen, dass ältere Geschwister das sogenannte scaffolding beherrschen (McGillicuddyDe Lisi, 1993). Der Begriff des scaffolding ist schwer ins Deutsche zu übersetzen. Er bedeutet, dass ältere Geschwister in der Lage sind, Lernkontexte für jüngere Geschwister so zu gestalten, dass deren „Zone der nächsten Entwicklung“ stimuliert wird (Vygotsky, 1978). Nach Vygotsky werden kognitive Fähigkeiten schrittweise erworben und zwar zuerst interaktiv unter der Anleitung kompetenterer sozialer Agenten, bevor sie dann in das eigene, selbstständig ausführbare Repertoire übernommen werden. Die „Zone der nächsten Entwicklung“ ist durch die Differenz zwischen den zunächst nur interaktiv
Lernen Kinder von älteren Geschwistern und erwächst Kindern mit älteren Geschwistern dadurch ein Vorteil für den schulischen Kompetenzerwerb? Welche Rolle spielt in diesem Zusammenhang die Hausaufgabenhilfe? Der Annahme des Lernens von älteren Geschwistern steht die Annahme des Lernens durch Lehren jüngerer Geschwister gegenüber. Profitieren Kinder mit jüngeren Geschwistern davon, dass sie diesen etwas beibringen? Einen solchen „teaching effect“ haben Zajonc und Markus (1975; vgl. auch Zajonc, 2001) im Rahmen des von ihnen entwickelten „confluence models“ postuliert. Im vorliegenden Beitrag werden sowohl die beiden genannten Hypothesen als auch weitere Annahmen zur elterlichen Ressourcenverdünnung wie zum „confluence model“ überprüft.
Effekte der Geschwisterkonstellation auf schulische Kompetenzen 101
vorhandenen und den bereits eigenständig anwendbaren Fähigkeiten definiert. Zum anderen zeigte sich in Studien zur kooperativen Bearbeitung von Problemlöseaufgaben, dass Kinder, die mit ihrem älteren Geschwister zusammenarbeiteten, bessere Ergebnisse erzielten als Kinder, die mit Freunden, Fremden (Azmitia & Hesser, 1993; Cicirelli, 1972) oder alleine (Cicirelli, 1974) arbeiteten.
Untersuchungen, in denen das kooperative Problemlösen von Kindern mit ihren Müttern mit dem von Kindern in Zusammenarbeit mit ihren älteren Geschwistern verglichen wurde, zeigten, dass nicht nur Mütter, sondern auch ältere Geschwister lehrende Verhaltensweisen, sogenanntes tuto-ring, ausüben (Cicirelli, 1975; 1976). Die Art und Qualität dieser Verhaltensweisen erwies sich allerdings als abhängig von der Geschlechterkonstellation: Die Zusammenarbeit mit älteren Schwestern war erfolgreicher als jene mit älteren Brüdern (Cicirelli 1972; 1974). Zudem schienen Mädchen vor allem von der Zusammenarbeit mit älteren Schwestern zu profitieren, während Buben eher durch die Rivalität mit älteren Brüdern angespornt wurden. Schließlich schienen die Mütter mit ihrem eigenen Verhalten auf die Geschlech terkonstellation zu reagieren: Sie gaben jüngeren Geschwistern weniger Hilfe und Feedback, wenn das jüngere Geschwister männlich und das ältere Geschwister weiblich war.
In experimentellen Untersuchungen werden nur kurzfristige Effekte erfasst, sie können von daher keine Auskunft darüber geben, inwieweit jüngeren Geschwistern durch das Vorhandensein älterer ein systematischer Entwicklungsvorteil erwächst. Das Auftreten eines solchen Vorteils dürfte unter anderem davon abhängen, in welchem Ausmaß Eltern und ältere Geschwister die Rolle des Tutors/der Tutorin übernehmen, beispielsweise indem sie Hausaufgabenhilfe leisten. Auch dieser Frage soll im vorliegenden Beitrag nachgegangen werden.
Das „confluence model“
In Studien zu BildungsOutcomes zeigt sich häufig ein negativer Effekt der Zahl der Kinder in der Familie auf entsprechende abhängige Größen wie beispielsweise die Zahl der besuchten Schuljahre, Bildungsabschlüsse, Schulnoten oder auch Leistungstestwerte (z. B. Black, Devereux & Salvanes, 2005; Blake 1989; Booth & Kee, 2009; Kanazawa, 2012). Sozialökonomen erklären diesen Zusammenhang in der Regel im Rahmen eines Ressourcenverdünnungsmo-dells (im Überblick s. Downey, 2001). Mit zunehmender Zahl der Kinder werden die begrenzten elterlichen Ressourcen – finanzieller, affektiver wie intellektueller Art – auf eine h öhere Anzahl an Kindern verteilt, so dass für jedes einzelne Kind ein entsprechend geringerer Anteil verbleibt. Erstgeborene erhalten zunächst die volle Zuwendung ihrer Eltern, der Anteil verringert sich jedoch mit der Geburt jedes weiteren Kinds. Da Kinder mit steigendem Geburtsrangplatz in für sie zunehmend ungünstigere familiäre Ressourcenverhältnisse geboren werden, kann
vor dem Hintergrund dieses Erklärungsmodells nicht nur ein negativer Effekt der Zahl der Kinder, sondern auch des Geburtsrangplatzes auf die BildungsOutcomes erwartet werden. Ein solch negativer Effekt des Geburtsrangplatzes konnte allerdings nur vereinzelt in Studien bestätigt werden (z. B. Black et al., 2005; Booth & Kee, 2009; Taubmann & Behrmann, 1986; dazu auch Hertwig, Davis & Sulloway, 2002), sodass verschiedene Autoren zu dem Schluss kamen, der Geburtsrangplatz hätte offenbar – im Unterschied zur Zahl der Kinder – keinen systematischen Einfluss auf den Erwerb von schulischen Kompetenzen (Ernst & Angst, 1983; Kanazawa 2012; Retherford & Sewell, 1991; Rodgers, Cleveland, van den Oord & Rowe, 2000; Schooler, 1972).
Dieser Schlussfolgerung widersprachen Zajonc und Mull ally (1997), Zajonc und Sulloway (2007) sowie Sulloway (2007) vor dem Hintergrund des confluence models (Zajonc, 1983; Zajonc, 2001; Zajonc & Bargh, 1980; Zajonc & Markus, 1975). Die Grundlage der Überlegungen zum con-fluence model bildete eine Studie über holländische Militärrekruten (Belmont & Marolla, 1973), deren Intelligenztestscores, erhoben im Alter von 19 Jahren, ein charakteristisches Muster aufwiesen: Rekruten aus Zweikindfamilien zeigten höhere Intelligenzwerte als Rekruten aus Dreikindfamilien, diese wiederum höhere als Rekruten aus Vierkindfamilien, letztere wiederum höhere als Rekruten aus Fünfkindfamilien usw. Bis zu diesem Punkt erscheint die Abnahme der Intelligenztestscores rein durch die zunehmende Zahl der Kinder begründbar. Zusätzlich zeigte sich jedoch eine Abhängigkeit der Scores vom Geburtsrangplatz. Während in Zwei bis Vierkindfamilien die Intelligenzscores mit steigendem Geburtsrangplatz abnahmen, begannen die Werte in Familien mit mehr als vier Kindern mit den späteren Geburtsrangplätzen wieder anzusteigen. Die Verläufe nach Geburtsrangplatz waren demnach nicht linear, sondern zumindest in größeren Familien kurvilinear. Außerdem traten in den Daten zwei Anomalien auf, die weder mit der Familiengröße noch mit dem Geburtsrangplatz der Rekruten zu erklären waren: Die Intelligenztestscores von Einzelkindern lagen unter den Werten der Erstgeborenen aus Zwei und Dreikindfamilien, etwa auf der Höhe der Erstgeborenen aus Vierkindfamilien. Zudem ergab sich in allen Familiengrößen ein stärkerer Abfall der Werte der Letzt geborenen im Vergleich zu den Vorgeborenen. Diese Anomalien veranlassten Zajonc und Markus (1975) zur Annahme des teaching effect. Einzelkindern und Letztge borenen soll ein systematischer Nachteil dadurch erwachsen, dass sie keine jüngeren Geschwister haben, denen sie etwas beibringen können.
Theoretisch postuliert das confluence model, dass die Entwicklung der intellektuellen Fähigkeiten von Kindern vom durchschnittlichen Fähigkeitsniveau der Familie abhängig sei. In das durchschnittliche Fähigkeitsniveau der Familie fließen die Niveaus aller Familienmitglieder inklusive dem des Zielkinds ein. Es verändert sich demnach mit dem Alter
102 Effekte der Geschwisterkonstellation auf schulische Kompetenzen
und der Zahl der Kinder. Mit steigender Zahl der Kinder nimmt das durchschnittliche Familienniveau ab – hier teilt das confluence model die Annahme der Ressourcenverdün-nung, denn das hohe elterliche Niveau verliert mit der Zahl der Kinder an Gewicht im familiären Gesamtniveau.1 Mit steigendem Geburtsrangplatz muss sich jedoch keineswegs eine solche Abnahme ergeben, dies konnten Zajonc und Markus (1975) anhand von mathematischen Modellrechnungen zeigen. Beispielsweise kann ein Zweitgeborenes schon nach wenigen Jahren eine günstigere familiäre Umwelt vorfinden, als das Erstgeborene im selben Alter vorfand.2 Dieser Effekt, bei dem die familiäre Umwelt für die später Geborenen günstiger wird als für die vorher Geborenen, ist abhängig vom Altersabstand zwischen den Kindern. Er tritt umso eher auf, je größer der Altersabstand ist. Daneben spielt aber auch das Testalter der Kinder eine Rolle. In großen Datensätzen zeigten sich mit höherem Geburtsrangplatz umso eher positive Effekte, je niedriger das Testalter war. Erst ab einem Testalter von etwa 11 Jahren (+/– 2 Jahre) ergab sich ein Abfall von Intelligenz oder Leistungstestwerten bei den später Geborenen (Zajonc, 1976; Zajonc & Bargh, 1980; Zajonc, 2001). Die Ursache für diese abfallenden Werte bei höherem Testalter sehen die Autoren in der Zeit, welche der teaching effect braucht, um seine Wirkung zu entfalten. In jedem Fall liefert das confluence model durch diesen Umkehreffekt eine stichhaltige Erklärung für den häufig fehlenden negativen Effekt des Geburtsrangplatzes und prognostiziert gleichzeitig einen möglichen positiven oder auch kurvilinearen Effekt bei niedrigerem Testalter.
Im vorliegenden Beitrag soll überprüft werden, ob sich in den Daten aus PIRLS & TIMSS 2011 ein ähnliches Muster nach der Zahl der Kinder und dem Geburtsrangplatz zeigt, wie bei Zajonc und Markus (1975) oder Zajonc und Bargh (1980) berichtet. Außerdem soll geprüft werden, ob sich Hinweise auf den durch das confluence model postulierten teaching effect auch bei österreichischen Schülerinnen und Schülern der 4. Schulstufe zeigen. Hinweise auf einen solchen ergäben sich vor allem durch ein Handicap von Einzelkindern und von Letztgeborenen sowie durch eine Bestätigung der Übernahme lehrender Verhaltensweisen aufseiten älterer Geschwister.
Vorgehensweise und Hypothesen
Im ersten Schritt wird deshalb zunächst untersucht, in welchem Ausmaß Kinder von Geschwistern Unterstützung
bei den Hausaufgaben erhalten und ob eine derartige Unterstützung vom Vorhandensein älterer Geschwister sowie von der Zahl der Kinder abhängt. Aufgrund begrenzter zeitlicher Ressourcen sollte die elterliche Hausaufgabenhilfe mit steigender Zahl der Kinder abnehmen. Im Gegenzug könnte die geschwisterliche Hausaufgabenhilfe zunehmen, insbesondere wenn ältere Geschwister vorhanden sind. Zudem wird überprüft, inwieweit sich das Vorhandensein älterer Geschwister und die Zahl der Kinder negativ auf die Häufigkeit von privater Nachhilfe und Nachmittagsbetreuung auswirken. Ersteres ist anzunehmen, wenn ältere Geschwister häufiger die Betreuung jüngerer Geschwister übernehmen und Hilfestellung bei der Hausübung geben, anstatt dass auf private Nachhilfe und externe Nachmittagsbetreuung zurückgegriffen wird. Letzteres könnte mit begrenzten finanziellen Ressourcen in größeren Familien im Zusammenhang stehen, aber auch durch ein häufigeres Zuhausebleiben von Müttern im Falle mehrerer Kinder begründet sein.
Um zu überprüfen, ob sich im vorliegenden Datensatz ähnliche Muster ergeben, wie bei Zajonc und Markus (1975) oder bei Zajonc und Bargh (1980) berichtet, werden im zweiten Schritt die Kompetenzwerte für Lesen, Mathematik und Naturwissenschaft nach der Zahl der Kinder und dem Geburtsrangplatz dargestellt. Erwartet werden abnehmende Kompetenzwerte mit höherer Zahl der Kinder sowie, insbesondere in Familien mit mehreren Kindern, eventuell ein Wiederanstieg der Kompetenzwerte mit höherem Geburtsrangplatz. Vor dem Hintergrund des teaching effect ist außerdem zu erwarten, dass die Kompetenzwerte der Einzelkinder unter den Werten der Erstgeborenen aus Zwei und Dreikindfamilien liegen sowie die Werte der Letztgeborenen jeweils einen Abfall gegenüber den Werten der Vorgeborenen zeigen. Die Erwartung eines Abfalls der Kompetenzwerte mit steigender Zahl der Kinder sowie eines möglichen kurvilinearen Verlaufs mit höherem Geburtsrangplatz wird anschließend einer regressionsanalytischen Prüfung unterzogen.
Im dritten Schritt sollen die beiden Hypothesen des Lernens von älteren Geschwistern sowie des Lernens durch Lehren (teaching effect) einer regressionsanalytischen Prüfung unterzogen werden. Hierzu werden Kinder mit und ohne ältere Geschwister sowie Kinder mit und ohne jüngere Geschwister jeweils miteinander verglichen. Im Falle des Lernens von älteren Geschwistern wäre zu erwarten, dass Kinder mit
1 Um die Annahmen des confluence model zu verdeutlichen, soll idealtypisch angenommen werden, dass Erwachsene ein intellektuelles Niveau von 30 besitzen, Neugeborene mit einem Niveau von 0 in das Gesamtniveau eingehen und Kinder pro Lebensjahr einen Zuwachs von 1 verzeichnen. Die intellektuelle Umgebung eines Erstgeborenen im Alter von 10 Jahren aus einer Zweikindfamilie mit einem siebenjährigen Geschwister ((30 + 30 + 10 + 7) /4 = 19,25) wäre demnach höher als die eines Erstgeborenen im Alter von 10 Jahren aus einer Dreikindfamilie mit einem sieben und einem vierjährigen Geschwister ((30 + 30 + 10 + 7 + 4)/5 = 16,2). Ähnliche Modellrechnungen finden sich bei Zajonc (2001).
2 Obwohl die Bedingungen für das Erstgeborene bei der Geburt denjenigen des Zweitgeborenen überlegen sind, ist das Verhältnis im folgenden Beispiel im Alter von vier Jahren umgedreht: Bei der Geburt liegt das Niveau für das Erstgeborene mit (30 + 30 + 0)/3 = 20 über dem Niveau für das Zweitgeborene (30 + 30 + 4 + 0)/4 = 16, im Alter von vier Jahren liegt das Niveau für das Erstgeborene mit (30 + 30 + 4 + 0)/4 = 16 unter dem Niveau für das Zweitgeborene (30 + 30 + 8 + 4)/4 = 18.
Effekte der Geschwisterkonstellation auf schulische Kompetenzen 103
älteren Geschwistern höhere Kompetenzwerte aufweisen als Kinder ohne ältere Geschwister. Im Fall des Lernens durch Lehren sollten Kinder mit jüngeren Geschwistern höhere Werte aufweisen als Kinder ohne jüngere Geschwister.
Methode
Die Analysen basieren auf den österreichischen Datensätzen der Studien PIRLS & TIMSS von 2011. Getestet wurden Schüler/innen auf der 4. Schulstufe im Frühjahr 2011. Das Durchschnittsalter der Schüler/innen lag bei 10,3 Jahren.
Für die Analysen wurden die Gesamtwerte der Kompetenzmessungen für die Lesekompetenz aus dem PIRLSDatensatz (N = 4670) sowie für die Mathematik und Natur wissenschaftskompetenz aus dem TIMSSDatensatz (N = 4668) herangezogen, die jeweils in Form von fünf plausible values vorliegen.
Die Angaben zur Hausaufgabenhilfe entstammen dem Schülerfragebogen der PIRLSTestung („Wer hilft dir am meisten bei den Hausübungen?“).3 Die Angaben zu Geschwistern wurden dem Elternfragebogen entnommen.4 Die Eltern wurden nach der Anzahl der Schwestern sowie nach der Anzahl der Brüder gefragt, die mit dem bei PIRLS & TIMSS 2011 getesteten Kind im gemeinsamen Haushalt leben. Außerdem wurde gefragt, wie viele dieser Geschwister jünger sind als das Zielkind. Aus diesen Angaben ließ sich die Zahl der Kinder im Haushalt, der Geburtsrangplatz (Erst, Zweit, Drittgeborene/r usw.) sowie die Geschwisterposition (Einzelkind, ältestes, mittleres oder jüngstes Kind) ermitteln.5 Die Geschwisterposition diente dann der Bildung von zwei DummyVariablen: 1. „Älteres Geschwister vorhanden“ – mit dieser werden mittlere und jüngste Kinder gegen Einzelkinder und älteste getestet – und 2. „Jüngeres Geschwister vorhanden“, mit der älteste und mittlere Kinder gegen Einzelkinder und jüngste getestet werden.
Da mit den Variablen Zahl der Kinder und Geburtsrangplatz sehr differenzierte Analysen durchgeführt wurden und es sich um kategoriale Größen handelt, wurden fehlende Werte für diese Variablen (solche ergaben sich in beiden Datensätzen für 5,8 % der Fälle) nicht imputiert. Außerdem wurden Familiengrößen ab fünf Kindern aus dem Daten satz ausgeschlossen, weil für diese Familiengrößen die Fallzahlen für eine Auswertung zu gering waren und zum
Teil unplausible Werte im Datensatz vorlagen (dies betrifft weitere 5 % der Fälle in beiden Datensätzen). Dadurch reduzierte sich die Zahl der gültigen Fälle für Berechnungen mit den PIRLSDaten auf 4167 Schüler/innen und für Berechnungen mit den TIMSSDaten auf 4166 Schüler/innen. Alle im Folgenden berichteten Ergebnisse lassen sich somit nur auf Familien mit ein bis vier Kindern verallgemeinern.
Auf Grundlage dieser Fallzahlen wurden fehlende Werte in den abhängigen Variablen sowie in den Variablen zur Hausaufgabenhilfe, Nachmittagsbetreuung und privaten Nachhilfe mittels multipler Imputation ersetzt. Für die Imputation wurde ein umfangreiches Variablenset herangezogen, das sowohl Größen aus dem Elternfragebogen wie auch aus dem Schülerfragebogen enthielt (z. B. Geschlecht, kulturelles Kapital,6 Migrationshintergrund, Bildung der Eltern, häusliche Lernressourcen). Es wurden für jeden Kompetenz bereich (Lesen, Mathematik, Naturwissenschaft) fünf Datensätze mit imputierten Daten generiert. Der ite imputierte Datensatz (i = 1, …, 5) verwendet dabei jeweils den i-ten plausible value. Die Imputationen wurden mit dem Modul „Impute Missing Data Values“ in SPSS (Version 20) unter Anwendung der Methode „Predictive Mean Matching“ (PMM) durchgeführt. Die Analysen wurden mit MPlus7 (Muthen & Muthen, 1998–2012) unter Berücksichtigung der Populations und der Replikationsgewichte sowie der geschachtelten Datenstruktur durchgeführt.7 Als Schätzverfahren wurde „MaximumLikelihood“ (ML) verwendet.
Im Folgenden werden sowohl standardisierte Regressionskoeffizienten (BetaGewichte) als auch in einzelnen Fällen unstandardisierte Regressionskoeffizienten (BGewichte) berichtet. An Stellen, an denen es nicht sinnvoll ist, BetaGewichte zu berichten,8 werden die BGewichte herangezogen. Diese geben direkt den Unterschied in den Kompetenzwerten zwischen den verglichenen Gruppen wieder.
Ergebnisse
Hausaufgabenhilfe, private Nachhilfe und Nach- mittagsbetreuung in Abhängigkeit von älteren Geschwistern und der Zahl der Kinder
Auf die Frage „Wer hilft dir am meisten bei den Hausübungen?“ gaben insgesamt 27 % der Kinder an, keine Hilfe zu
3 https://www.bifie.at/system/files/dl/Sch%C3%BClerfragebogen.pdf (S. 35)4 https://www.bifie.at/system/files/dl/Elternfragebogen.pdf (S. 20)5 Missings wurden durch den Wert 0 ersetzt, wenn eine der beiden anderen Fragen beantwortet wurde. Dieser Vorgehensweise liegt die Annahme zugrunde,
dass die Frage bei Nichtzutreffen übersprungen wurde. Die Variablen zur Geschwisterkonstellation würden sonst über 30 % fehlende Werte aufweisen.6 Anzahl der Bücher zu Hause7 Spezifikation in MPLUS: TYPE = COMPLEX, REPSE = JACKKNIFE28 An einigen Stellen geht es nicht um den Zusammenhang zweier Größen, sondern um den Unterschied von Gruppen.
104 Effekte der Geschwisterkonstellation auf schulische Kompetenzen
benötigen, 50 % erhielten Hilfe von Eltern oder Groß eltern, nur 1 % erhielt private Nachhilfe, 7 % erhielten am meisten Hilfe in der Nachmittagsbetreuung, 6 % bekamen Unterstützung durch andere Personen und 3 % der Kinder gaben an, von niemandem Hilfe zu bekommen. Nur etwa 7 % der Kinder erhielten am meisten Hilfe von Geschwistern. Ob ein älteres Geschwister vorhanden ist oder nicht, stand in keinem signifikanten Zusammenhang mit dem Anteil an Hilfe durch andere Personen (6 %) oder dem Anteil an privater Nachhilfe (1 %). Dagegen erhielten Kinder mit älteren Geschwistern signifikant seltener Hausaufgabenhilfe durch Eltern oder Großeltern (47 % zu 52 %, BetaGewicht = –.05, p < .01) aber häufiger durch Geschwister im Vergleich zu Kindern ohne ältere Geschwister (11 % zu 2 %, BetaGewicht = .19, p < .01). Hilfe in der Nachmittagsbetreuung erhielten Kinder mit älteren Geschwistern ebenfalls signifikant seltener im Vergleich zu Kindern ohne ältere Geschwister (6 % zu 8 %, BetaGewicht = –.05, p < .01). Sind ein oder mehrere ältere Geschwister vorhanden, nimmt demnach die Hausaufgabenhilfe durch Eltern oder Großeltern sowie in der Nachmittagsbetreuung ab, während die Hausaufgabenhilfe durch Geschwister zunimmt.
Gemäß der Annahme der Ressourcenverdünnung sollte die Hausaufgabenhilfe durch Eltern und Großeltern jedoch nicht in erster Linie vom Vorhandensein älterer Geschwister, sondern vor allem von der Zahl der Kinder abhängen. Abbildung 2.3.1 dokumentiert die entsprechenden Prozentanteile. Bei der Überprüfung dieser Annahme ergab sich zwar ein niedriges negatives BetaGewicht für den Effekt der Zahl der Kinder auf die Häufigkeit der Hausaufgabehilfe durch Eltern oder Großeltern, dieser war jedoch nicht signifikant. Statistisch absichern ließ sich dagegen die Zunahme der Häufigkeit der Hausaufgabenhilfe durch Geschwister mit steigender Zahl der Kinder (von 6 % in Zweikind familien auf 18 % in Vierkindfamilien;9 BetaGewicht = .15, p < .01). Für die Häufigkeit von privater Nachhilfe ergab sich kein signifikanter Zusammenhang mit der Zahl der Kinder. Die Häufigkeit von Hilfe in der Nachmittags betreuung jedoch nahm mit steigender Zahl der Kinder signifikant ab (von 13 % in Einkindfamilien auf 3 % in Vierkindfamilien; BetaGewicht = –.10, p < .01).
Insgesamt ergab sich also keine Abhängigkeit der elterlichen Hausaufgabenhilfe von der Zahl der Kinder, wohl aber vom Vorhandensein älterer Geschwister. Offenbar sehen sich Eltern seltener veranlasst, selbst Hausaufgabenhilfe zu leisten, wenn ältere Geschwister dies übernehmen können. Möglicherweise wird auch eine nachmittägliche Betreuung häufiger den älteren Geschwistern überlassen, was sich letztlich negativ auf den Anteil an Hilfe in der Nachmittagsbetreuung ausgewirkt haben könnte. Allerdings kann hier nicht ausgeschlossen werden, dass bei einer höheren Zahl an Kindern die Mütter häufiger zu Hause blieben und eine
externe Nachmittagsbetreuung deshalb seltener in Anspruch genommen wurde. Aus lerntheoretischer Sicht müsste Kindern durch die Hilfe und Betreuung durch ältere Geschwister kein Nachteil entstehen. Es könnte sich im Gegenteil sogar als ein Vorteil erweisen, denn ältere Geschwister liegen näher am Erfahrungshorizont ihrer jüngeren Geschwister als Eltern und können deshalb möglicherweise besser an deren Wissensstand anschließen.
Entgegen der Erwartung wirkte sich die Zahl der Kinder nicht auf die Häufigkeit privater Nachhilfe aus, wobei angemerkt werden muss, dass der Anteil an Kindern, die angaben, private Nachhilfe zu erhalten, insgesamt auf einem sehr niedrigen Niveau lag. Auf die Häufigkeit von Hilfe in der Nachmittagsbetreuung dagegen zeigte die Zahl der Kinder einen Effekt: Solche Unterstützung war umso unwahrscheinlicher, je mehr Kinder in einer Familie waren. Wie bereits erwähnt, muss dieser Befund nicht bedeuten, dass ältere Geschwister in größeren Familien häufiger die Nachmittagsbetreuung übernehmen. Ebenso wahrscheinlich ist, dass bei mehr als einem Kind die Mütter ihre Berufstätigkeit aufgeben und dann, weil sie selbst zu Hause sind, auf eine externe Nachmittagsbetreuung für die Kinder verzichten.
9 Bei den nicht plausiblen Angaben zur Hausaufgabenhilfe durch Geschwister in Einkindfamilien (2 %) in Abbildung 2.3.1 dürfte es sich um Messfehler handeln.
0
100 %
%
90
80
70
60
50
40
10
30
20
21 3 4Zahl der Kinder in der Familie
Angaben in Prozent; Werte unter 4 % sind nicht eingetragen;
brauche keine Hilfe Eltern/Großeltern Geschwisterprivate Nachhilfe
Nachmittagbetreuungandere Personkeine/r hilft mir
24
51
14
7
28
48
45
9
23
46
5
18
28
51
66
6
Abbildung 2.3.1: Hilfe bei den Hausaufgaben in Abhängigkeit von der Zahl der Kinder (Angaben der
Schüler/innen; PIRLS 2011)
Effekte der Geschwisterkonstellation auf schulische Kompetenzen 105
Ein genauer Blick auf die Daten zeigte außerdem, dass bei Weitem nicht alle Kinder mit älteren Geschwistern Hausaufgabenhilfe durch Geschwister erhielten. 52 % der Kinder im Datensatz hatten ältere Geschwister, aber nur 11 % dieser Kinder (7 % insgesamt) gaben an, von Geschwistern Hausaufgabenhilfe zu erhalten. In Familien mit vier Kindern lag der Anteil an Hausaufgabenhilfe durch Geschwister jedoch immerhin bei 18 %.
Kompetenzniveaus nach Anzahl der Kinder und Geburtsrangplatz
Nachfolgend soll überprüft werden, ob sich für die Kompetenzwerte im vorliegenden Datensatz ähnliche Muster ergeben, wie bei Zajonc (1976, S. 228) oder Zajonc und Bargh (1980) berichtet. Dazu wurde in den Abbildungen 2.3.2 bis 2.3.4 die Lese, Mathematik und Naturwissenschaftskompetenz nach der Zahl der Kinder in der Familie und dem Geburtsrangplatz des im Rahmen von PIRLS & TIMSS 2011 getesteten Kinds dargestellt. Wie im Methodenteil bereits angesprochen, liegen für Familien mit mehr als vier Kindern keine ausreichenden Fallzahlen vor, sodass auf deren Darstellung verzichtet wird. Schon die Darstellung der Kompetenzwerte von Kindern aus Vierkindfamilien gerät deutlich an die Grenzen. Hier betragen die Fallzahlen für die Lese/Mathematik/Naturwissenschaftskompetenz n = 38/38/38 für Erstgeborene, n = 62/63/63 für Zweitgeborene, n = 103/102/102 für Drittgeborene und n = 102/102/102 für Viertgeborene.
Im Groben bestätigte sich das Bild, das sich auch bei Zajonc (1976) oder Zajonc und Bargh (1980) zeigte: Die Erst und Zweitgeborenen aus Zweikindfamilien liegen rein deskriptiv betrachtet mit ihren Kompetenzwerten über den Werten der Erst, Zweit und Drittgeborenen aus Dreikindfamilien und diese wiederum über den Werten der Erst, Zweit, Dritt und Viertgeborenen aus Vierkindfamilien. Lediglich bei der Lese kompetenz ergab sich eine Abweichung von diesem Muster, hier liegen die Werte für die Erst und Zweitgeborenen aus Vierkindfamilien höher als erwartet. Diese Abweichung vom erwarteten Muster ist schwer zu erklären, insbesondere da sie auch nur in einem der drei Kompetenzbereiche auftritt.
In allen drei Kompetenzbereichen liegen die Werte der Einzelkinder nicht, wie vor dem Hintergrund eines reinen Ressourcenverdünnungsmodells zu erwarten wäre, über den Werten der Erstgeborenen aus Zweikindfamilien, sondern eher, wie vor dem Hintergrund des confluence model und dem damit verbundenen Einzelkindhandicap erwartet werden würde, auf der Höhe der Erstgeborenen aus Dreikindfamilien (Mathematik) oder zumindest zwischen den Erstgeborenen aus Zwei und Dreikindfamilien (Lesen und Naturwissenschaft). In allen drei Kompetenzbereichen erwies sich der Unterschied zwischen den Einzelkindern und den Erstgeborenen aus Zweikindfamilien als signifikant (Lesekompetenz: BGewicht = 8.14, p < .05; Mathematik kompetenz: BGe
wicht = 10.81, p < .01; Naturwissenschaftskompetenz: BGewicht = 6.88, p < .05; die unstandardisierten BGewichte geben hier den Punktunterschied in den Kompetenzmessungen wieder). Die Unterschiede zwischen den Einzelkindern und den Erstgeborenen aus Drei und Vier
540
550
530
520
500
510
490
480
Lesekompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds
Erst- Zweit-
geborene/r
Dritt- Viert-
ZweikindfamilienEinkindfamilien Dreikindfamilien
VierkindfamilienLe
seko
mpe
tenz
hoch
nied
rig
540
550
530
520
500
510
490
480
Mathematikkompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds
Mat
hem
atik
kom
pete
nz
hoch
nied
rig
Erst- Zweit-
geborene/r
Dritt- Viert-
ZweikindfamilienEinkindfamilien Dreikindfamilien
Vierkindfamilien
Abbildung 2.3.2: Lesekompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (PIRLS 2011)
Abbildung 2.3.3: Mathematikkompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (TIMSS 2011)
106 Effekte der Geschwisterkonstellation auf schulische Kompetenzen
kindfamilien waren dagegen allesamt nicht signifikant, auch nicht im Falle der Lesekompetenz, wo die Erst und Zweitgeborenen aus Vierkindfamilien – vom üblichen Muster abweichend – ungewöhnlich hohe Kompetenzwerte aufwiesen.
Der prognostizierte mögliche kurvilineare Verlauf nach Geburtsrangplatz ab einer Familiengröße von vier Kindern zeigte sich ebenfalls deskriptiv in allen drei Kompetenzbereichen, auch wenn der Unterschied zwischen den Dritt und den Viertgeborenen in keinem der Fälle signifikant wurde. Der erwartete Abfall der Letztgeborenen gegenüber den jeweils vorgeborenen Kindern, der gleichfalls erst ab einer Familiengröße von vier Kindern sichtbar werden sollte, war dagegen in den Daten nicht zu erkennen.
Die regressionsanalytische Überprüfung eines Abfalls der schulischen Kompetenzwerte mit steigender Zahl der Kinder erwies sich für alle drei Kompetenzbereiche als signifikant (Lesekompetenz: BetaGewicht = –.08, p < .01; Mathematikkompetenz: BetaGewicht = –.06, p < .01; Natur wissenschaftskompetenz: BetaGewicht = –.10, p <.01). Eine Überprüfung des kurvilinearen Verlaufs der Kompetenzwerte nach Geburtsrangplatz mittels Regressionsanalysen, die neben einem linearen Term außerdem einen quadrierten Term für den Geburtsrangplatz enthielten,10 erbrachte dagegen bei Kontrolle der Zahl der Kinder weder für den linearen noch für den quadrierten Term s ignifikante Ergebnisse; dies gilt für alle drei Kompetenzbereiche. In den vor
540
550
530
520
500
510
490
480
Naturwissenschaftskompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds
Nat
urw
isse
nsch
afts
kom
pete
nz
hoch
nied
rig
Erst- Zweit-
geborene/r
Dritt- Viert-
ZweikindfamilienEinkindfamilien Dreikindfamilien
Vierkindfamilien
Abbildung 2.3.4: Naturwissenschaftskompetenz nach Zahl der Kinder und Geburtsrangplatz des Zielkinds (TIMSS 2011)
liegenden Daten ergaben sich demnach keine signifikanten Effekte des Geburtsrangplatzes über einen Effekt der Zahl der Kinder hinaus. Der durch das confluence model prognostizierte mögliche Wieder anstieg der Werte später Geborener gegenüber mittleren Geburtsrangplätzen, der insbesondere in größeren Familien auftreten sollte, ließ sich somit inferenzstatistisch nicht absichern.
Zusammengefasst kann festgehalten werden, dass sich eine höhere Zahl der Kinder, wie durch die Annahme der Res-sourcenverdünnung und das confluence model prognostiziert, linear negativ auf die Kompetenzwerte der Zielkinder auswirkte. Der prognostizierte mögliche kurvilineare Verlauf des Geburtsrangplatzes ab einer Familiengröße von vier Kindern zeichnete sich lediglich deskriptiv ab. Mög licherweise wäre ein solcher Effekt deutlicher hervorgetreten, wenn größere Familien in der Stichprobe stärker vertreten gewesen wären. Für einen Abfall der Letztgeborenen gegenüber den Vorgeborenen ergaben sich ebenfalls keine Hinweise. Hierzu ist anzumerken, dass sich ein solcher Abfall der Letztgeborenen auch in den von Zajonc (1976, S. 192) sowie Zajonc und Bargh (1980) berichteten Daten keineswegs durchgängig zeigte. Was sich jedoch in den vorliegenden Daten abzuzeichnen scheint, sind relativ niedrige Werte von Einzelkindern. Diese niedrigen Werte sind mit einem reinen Ressourcenverdünnungsmodell nicht in Einklang zu bringen, denn gemäß diesem müssten Einzelkinder die höchsten Kompetenzwerte aufweisen, da sie in den alleinigen Genuss sämtlicher elterlicher Ressourcen kommen. Das confluence model hingegen postuliert ein Handicap von Einzelkindern, da diese keine jüngeren Geschwister haben, denen gegenüber sie lehrende Verhaltensweisen ausüben können. Ein solches Einzelkindhandicap sollte umso stärker ausgeprägt sein, je höher das Testalter von Kindern ist und der teaching effect Zeit hatte, seine Wirkung zu entfalten. Einschränkend angemerkt werden muss allerdings, dass es für die vorgefundenen niedrigen Werte von Einzelkindern auch alternative Erklärungen geben könnte, die hier nicht geprüft wurden, wie beispielsweise eine häufigere Herkunft aus alleinerziehenden Haushalten, was mit besonderen ökonomischen Härten einhergehen könnte, oder eine schwierige Persönlichkeit der Kinder, welche die Entscheidung für weiteren Nachwuchs verhindert hat (Downey, 2001; Steelman, 1985; Sulloway, 2007).
Lernen von älteren versus Lernen durch jüngere Geschwister
Die Prüfung der Hypothese, nach der jüngere Geschwister systematisch von älteren Geschwistern profitieren könnten, weil diese effektive Tutoren/Tutorinnen für jüngere Geschwister darstellen, ist im oberen Teil der Tabelle 2.3.1 dokumentiert. Entgegen der Annahme wirkte sich das Vorhandensein älterer Geschwister in allen drei Kompetenzbereichen zunächst einmal signifikant negativ aus (vgl.
10 Kurvilineare Zusammenhänge können im regressionsanalytischen Ansatz mittels einfacher und quadrierter Terme geprüft werden (Aiken & West, 1991).
Effekte der Geschwisterkonstellation auf schulische Kompetenzen 107
Tabelle 2.3.1 oberer Teil, BetaGewichte für Modell 1). Da Kinder mit älteren Geschwistern sehr wahrscheinlich häufiger aus größeren Familien stammen als die Referenzgruppe der Kinder ohne ältere Geschwister – zu letzteren zählen auch die Einzelkinder – und die Zahl der Kinder einen negativen Effekt auf die Kompetenzwerte hat, wurde in einem zweiten Modell die Zahl der Kinder kontrolliert. Die BetaGewichte des Modells 2 zeigen, dass sich der Effekt des Vorhandenseins älterer Geschwister durch die Kontrolle der Zahl der Kinder verringerte, allerdings blieb er im Falle der Lese und der Naturwissenschaftskompetenz signifikant negativ. Die Analysen ergaben somit keine Hinweise darauf, dass jüngeren Geschwistern durch das Vorhandensein älterer Geschwister hinsichtlich schulischer Kompetenzen ein systematischer Vorteil erwächst. Sie scheinen im Gegenteil, auch bei Konstanthaltung der Familiengröße, eher einen Nachteil zu haben.
Im unteren Teil der Tabelle 2.3.1 ist die Prüfung der gegenteiligen Hypothese dargestellt. Diese besagt, dass älteren Geschwistern durch das Vorhandensein von jüngeren Geschwistern ein systematischer Vorteil erwächst, weil erstere davon profitieren, letzteren etwas beibringen zu können. Die BetaGewichte für das Vorhandensein eines jüngeren Geschwisters ohne die Kontrolle der Zahl der Kinder waren für alle drei Kompetenzbereiche niedrig und nur im Falle der Lesekompetenz schwach signifikant positiv (s. Tabelle 2.3.1 unterer Teil, BetaGewichte für Modell 1). Da Kinder mit jüngeren Geschwistern auch hier eine höhere Wahrscheinlichkeit haben, aus Familien mit einer höheren Zahl an Kindern zu stammen als die Referenzgruppe, wurde wiederum ein zweites Modell unter Kontrolle der Zahl der Kinder berechnet. Bei konstanter Familiengröße erhöhten sich die Effekte für das Vorhandensein eines jüngeren Geschwisters und die entsprechenden BetaGewichte waren nun für alle drei Kompetenzbereiche signifikant positiv (s. Tabelle 2.3.1 unterer Teil, BetaGewichte für Modell 2). Somit kann festgehalten werden, dass sich deutliche Hinweise darauf ergaben, dass Kinder mit jüngeren Geschwistern einen systematischen Vorteil in der Entwicklung ihrer schulischen Kompetenzen haben.
Diskussion
Die Ergebnisse unterstützen insgesamt einige zentrale Thesen, die vor dem Hintergrund des Erklärungsmodells der Ressourcenverdünnung sowie des confluence model formuliert wurden: Mit zunehmender Zahl der Kinder nahmen die Kompetenzwerte signifikant ab. Der Geburtsrangplatz dagegen hatte keinen signifikanten Effekt über die Zahl der Kinder hinaus, auch wenn sich deskriptiv, insbesondere in größeren Familien, ein kurvilinearer Verlauf der Kompetenzwerte nach Geburtsrangplatz abzeichnete. Wie eingangs beschrieben, hängen gemäß dem confluence model Effekte des Geburtsrangplatzes mit dem Testalter der Kinder zusammen. Negative Effekte des Geburtsrangplatzes wären eher bei höherem Testalter als dem hier vorliegenden zu erwarten, positive Effekte eher bei niedrigerem Testalter (Zajonc, 2001; Zajonc & Bargh, 1980).
Gleichzeitig bestätigte sich, dass Kinder mit älteren Geschwistern seltener Hausaufgabenhilfe durch Eltern und Großeltern, häufiger aber von Geschwistern erhielten. Dieses Ergebnis stützt die Annahme des confluence model, nach dem ältere Geschwister lehrende Verhaltensweisen gegenüber ihren jüngeren Geschwistern ausüben. Die Zahl der Kinder wirkte sich ebenfalls in erwarteter Weise auf die Häufigkeit der Hausaufgabenhilfe durch Geschwister aus, nicht aber auf diejenige durch Eltern und Großeltern. Die Annahme der elterlichen Ressourcenverdünnung konnte mit Blick auf die Unterstützung bei Hausübungen somit nicht bestätigt werden.
Das Vorhandensein von älteren Geschwistern zeigte keinen positiven, sondern im Gegenteil einen negativen Effekt auf die schulischen Kompetenzen. Dieses Ergebnis schließt keineswegs aus, dass jüngere Geschwister von den älteren lernen. Es bedeutet lediglich, dass jüngeren Geschwistern dadurch kein systematischer Vorteil gegenüber Kindern ohne ältere Geschwister erwächst. Umgekehrt zeigten Kinder mit jüngeren Geschwistern auch bei Konstanthaltung der Familiengröße höhere schulische Kompetenzen im Vergleich zu Kindern ohne jüngere Geschwister. Dieser Befund
LesekompetenzMathematik-kompetenz
Naturwissenschafts-kompetenz
Modell 1 Modell 2 Modell 1 Modell 2 Modell 1 Modell 2
Ältere Geschwister vorhanden –.09*** –.07** –.05* –.03 –.08*** –.04*Zahl der Kinder –.05* –.05* –.08***R2 .01 .01 .00 .00 .01 .01Jüngere Geschwister vorhanden .04* .08*** .03 .06** .02 .07***Zahl der Kinder –.12*** –.08*** –.13***R2 .00 .01 .00 .01 .00 .01
Legende: *** p < .001; ** p < .01; * p < .05
Tabelle 2.3.1: Betagewichte einfacher und multipler Regressionen der Kompetenzwerte auf Geschwistervariablen (PIRLS & TIMSS 2011)
108 Effekte der Geschwisterkonstellation auf schulische Kompetenzen
kann durch das im Rahmen des confluence model postulierte Lernen durch Lehren (teaching effect) erklärt werden. Im Unterschied zu Einzelkindern und zu Letztgeborenen haben ältere Geschwister ein jüngeres, dem sie etwas beibringen können. Kindern ohne ein jüngeres Geschwister fehlt diese Lerngelegenheit. Hinweise auf einen teaching effect erbrachte auch die deskriptive Darstellung der Kompetenzwerte nach Zahl der Kinder und dem Geburtsrangplatz: Im Vergleich mit den Erstgeborenen aus Zweikindfamilien wiesen die Einzelkinder signifikant niedrigere schulische Kompetenzwerte auf. Dieses Einzelkindhandicap ist nicht mit den Annahmen eines reinen Ressourcenverdünnungsmodells, aber mit dem durch das confluence model postulierten teaching effect vereinbar. Einzelkindern fehlt das jüngere Geschwister, demgegenüber sie lehrende Verhaltensweisen ausüben könnten. Bereits erwähnt wurde, dass es für dieses Einzelkindhandicap auch alternative Erklärungen geben könnte.
Um solche alternativen Erklärungen in Zukunft ausschließen zu können, sollte in nachfolgenden Analysen für Größen kontrolliert werden, welche mit der Zahl der Kinder oder der Geschwisterposition im Zusammenhang stehen könnten. Dazu gehören in erster Linie der sozioökonomische Status der Familie und der Migrationshintergrund, aber auch die Herkunft aus einem alleinerziehenden Haushalt oder einer Stieffamilie sowie die Berufstätigkeit von Müttern. Ohne die kontrollierende Berücksichtigung dieser Größen müssen die hier favorisierten Erklärungen für den Einfluss der Zahl der Kinder und des Einzelkindhandicaps als vorläufig bezeichnet werden.11
Im Rahmen von Schulleistungsstudien wäre allerdings relativ einfach nachprüfbar, inwieweit schulische Kompetenzvorteile älterer Geschwister tatsächlich dem postulierten teaching effect geschuldet sind. Dazu bedürfte es allerdings der Aufnahme einer weiteren Frage in den Fragebogen: Neben der Frage nach der erhaltenen Hausaufgabenhilfe durch Geschwister und andere Bezugspersonen müsste die Frage gestellt werden, wie häufig die Kinder selbst jüngeren Geschwistern Hausaufgabenhilfe erteilen oder anderen Kindern Nachhilfe geben. Mithilfe der entsprechenden Angaben könnte ein Mediationsmodell berechnet werden, das prüft, inwieweit der gefundene Kompetenzvorsprung älterer Geschwister tatsächlich auf solch lehrende Verhaltensweisen zurückzuführen ist. In einem ähnlichen Modell unter Hinzuziehung der Angaben zur erhaltenen Hausaufgabenhilfe durch Geschwister konnte bereits gezeigt werden, dass sich der Unterschied in der Lesekompetenz in PISA 2000 zwischen Kindern mit und ohne ältere Geschwister durch die geschwisterliche Hausaufgabenhilfe verringerte, die Hausaufgabenhilfe durch ältere Geschwister somit einen positiven Effekt erzielte, der allerdings den negativen Effekt nicht aufwiegen konnte, der sich dadurch ergab, dass Kinder mit
älteren Geschwistern weniger Unterstützung durch Eltern erhielten (vgl. Schmid, 2015).
Abschließend bleibt noch anzumerken, dass die Geschwisterkonstellationsvariablen insgesamt nur relativ schwache Zusammenhänge mit den schulischen Kompetenzwerten aufwiesen. Der Anteil an aufgeklärter Varianz lag in den Modellen mit Kontrolle der Zahl der Kinder gerade einmal bei einem Prozent. Allerdings betrug der Unterschied zwischen Kindern ohne und mit älteren Geschwistern bei der Lesekompetenz immerhin 12 Testpunkte ohne die Kontrolle der Zahl der Kinder, und noch 9 Testpunkte mit entsprechender Kontrolle. Der Unterschied zwischen Buben und Mädchen lag in PIRLS 2011 im Vergleich dazu bei nur 8 Testpunkten zugunsten der Mädchen (Suchan, WallnerPaschon, Bergmüller & Schreiner, 2012). Die Effekte der Geschwisterkonstellation liegen somit etwa in derselben Größenordnung wie der Geschlechtseffekt und sind damit als nicht ganz unerheblich zu bezeichnen.
11 Entsprechende Analysen auf der Grundlage der deutschen PISAStudie 2000 erbrachten auch unter Einbezug der genannten Kontrollgrößen weit gehend vergleichbare Ergebnisse (Schmid, 2015).
Effekte der Geschwisterkonstellation auf schulische Kompetenzen 109
Literatur
Aiken, L. S. & West, S. G. (1991). Multiple regression. Testing and interpreting interactions. Thousand Oaks, CA: Sage.
Azmitia, M. & Hesser, J. (1993). Why siblings are important agents of cognitive development: A comparison of siblings and peers. Child Development, 64, 430–444.
Azmitia, M. & Perlmutter, M. (1989). Social influences on children’s cognition: State of the art and future directions. Advances in Child Development and Behaviour, 22, 89–144.
Bargh, J. A. & Shul, Y. (1980). On the cognitive benefit of teaching. Journal of Educational Psychology, 72 (5), 593–604.
Belmont, L. & Marolla, F. (1973). Birth order, family size, and intelligence. A study of a total population of 19-year-old men born in Netherlands is presented. Science, 182, 1096–1101.
Black, S. E., Devereux, P. J. & Salvanes, K. G. (2005). The more the merrier? The effect of family size and birth order on children’s education. The Quarterly Journal of Economics, 120 (2), 669–700.
Blake, J. (1989). Family size and achievement. Los Angeles: University of California Press.
Booth, A. L. & Kee, H. J. (2009). Birth order matters: The effect of family size and birth order on educational attainment. Jour-nal of Population Economics, 22, 367–397.
Cicirelli, V. G. (1972). The effect of sibling relationship on concept learning of young children taught by childteachers. Child Development, 43, 282–287.
Cicirelli, V. G. (1974). Relationship of sibling structure and interaction to younger sib’s cenceptual style. The Journal of Genetic Psychology, 125, 37–49.
Cicirelli, V. G. (1975). Effects of mother and older sibling on the problemsolving behavior of the younger child. Developmental Psychology, 11 (6), 749–756.
Cicirelli, V. G. (1976). Motherchild and sibling-sibling interactions on a problem solving task. Child Development, 47, 588–596.
Downey, D. B. (2001). Number of siblings and intellectual development. The resource dilution explanation. American Psycho-logist, 56 (6/7), 497–504.
Ernst, C. & Angst, J. (1983). Birth order: Its influence on personality. Berlin: Springer.
Hertwig, R., Davis, J. N. & Sulloway, F. J. (2002). Parental investment: How an equity motive can produce inequality. Psycho-logical Bulletin, 128 (5), 728–745.
Kagan, S. (1992). Cooperative learning. San Juan Capistrano, CA: Resources for Teacher.
Kanazawa, S. (2012). Intelligence, birth order, and family size. Personality and Social Psychology Bulletin, 38 (9), 1157–1164.
Kasten, H. (1993). Die Geschwisterbeziehung. Göttingen: Hogrefe.
Liegle, L. (2006). Bildung und Erziehung in früher Kindheit. Stuttgart: Kohlhammer.
McGillicuddy-De Lisi, A. V. (1993). Sibling interactions and children’s communicative competency. Journal of Applied Develop-mental Psychology, 14, 365–383.
Muthén, L. K. & Muthén, B. O. (1998–2012). Mplus User’s Guide. Seventh Edition. Los Angeles, CA: Muthén & Muthén.
Retherford, R. D. & Sewell, W. H. (1991). Birth order and intelligence: Further tests of the confluence model. American Socio-logical Review, 56 (2), 141–158.
110 Effekte der Geschwisterkonstellation auf schulische Kompetenzen
Rodgers, J. L., Cleveland, H. H., van den Oord, E. & Rowe, D. C. (2000). Resolving the debate over birth order, family size, and intelligence. American Psychologist, 55 (6), 599–612.
Rogoff, B. (1990). Apprenticeship in thinking. Cognitive development in social context. New York NY: Oxford University Press.
Schmid, C. (2015). Lernen von älteren oder Lernen durch jüngere Geschwister? Effekte der Geschwisterkonstellation auf die Lesekompetenz und Hausaufgabenhilfe in PISA 2000. Zeitschrift für Erziehungswissenschaft 18, 3, 591–615.
Schooler, C. (1972). Birth order effects: Not here not now! Psychological Bulletin, 78, 161–175.
Steelman, L. C. (1985). A tale of two variables: A review of the intellectual consequences of sibship size and birth order. Review of Educational Research, 55 (3), 353–386.
Suchan, B., Wallner-Paschon, C., Bergmüller, S. & Schreiner, C. (Hrsg.). (2012). PIRLS & TIMSS 2011. Schülerleistungen in Lesen, Mathematik und Naturwissenschaft in der Grundschule. Erste Ergebnisse. Graz: Leykam.
Sulloway, F. J. (2007). Psychology. Birth order and intelligence. Science, 316 (5832), 1711–1712.
Taubmann, P. & Behrmann, J. R. (1986). Effects of number and position of siblings on child and adult outcomes. Social Bio-logy, 33, 22–34.
Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes. Cambridge, MA: Havard Univer-sity Press.
Zajonc, R. B. (1976). Familiy configuration and intelligence. Science, 192 (4236), 227–236.
Zajonc, R. B. (1983). Validating the confluence model. Pschological Bulletin, 95 (3), 457–480.
Zajonc, R. B. (2001). The family dynamics of intellectual development. American Psychologist, 56 (6/7), 490–496.
Zajonc, R. B. & Bargh, J. (1980). The confluence model: parameter estimation for six divergent data sets on family factors and intelligence. Intelligence, 4, 349–361.
Zajonc, R. B. & Markus, G. B. (1975). Birth order and intellectual development. Psychological Review, 82 (1), 74–88.
Zajonc, R. B. & Mullally, P. R. (1997). Birth order: Reconciling conflicting effects. American Psychologist, 52 (7), 685–699.
Zajonc, R. B. & Sulloway, F. J. (2007). The confluence model: Birth order as a within-family or between-family dynamic? Per-sonality and Social Psychology Bulletin, 33 (9), 1187–1194.
III. Unterricht in Lesen, Mathematik & Naturwissenschaft an Österreichs Volksschulen
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 113
3.1 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
Gerda Hagenauer & Konrad Oberwimmer
In der schulischen Praxis wird von Lehrkräften, Eltern und auch Schülerinnen und Schülern der Wert von Hausauf-gaben für die schulische Leistung selten in Frage gestellt. Unter Hausaufgaben werden dabei „solche Aufgaben ver-standen, die vom Lehrer den Schülern zugewiesen werden und die von den Schülern außerhalb der Schule bearbeitet werden sollen“ (Mischo & Haag, 2006, S. 226; in Anleh-nung an Trautwein und Köller, 2003a). In ganztägigen Schulformen liegt häufig eine in den Ganztagsbetrieb „integrierte Hausaufgabenpraxis“ (Hascher & Bischof, 2000) vor. Es herrscht die gängige Überzeugung, dass bei Hausaufgaben durch die Wiederholung des Lernstoffs die Inhalte memorierend gefestigt und die Anwendung von Re-geln bzw. Algorithmen geübt werden, was wiederum eine Leistungssteigerung nach sich ziehen sollte. Nach Ansicht der (meisten) Lehrkräfte stellen Hausaufgaben somit ein didaktisches Werkzeug zur Förderung schulischen Lernens dar (z. B. Trautwein, Niggli, Schnyder & Lüdtke, 2009). In der empirischen Bildungsforschung wird die Sinnhaf-tigkeit von Hausauf gaben allerdings kontrovers diskutiert (Trautwein & Köller, 2003a). Ein klar positiver Effekt von Hausaufgaben auf die schulische Leistung konnte in einer Zusammenschau unterschiedlichster Studien im deutsch-sprachigen Raum bisher nicht belegt werden (Trautwein, Schnyder, Niggli, Neumann & Lüdtke, 2009). Insbeson-dere im Grundschulalter ist der Link Hausaufgaben – Leistung noch überwiegend ungeklärt, da sich bisher nur wenige Studien dieser Altersstufe gewidmet haben (Roß-bach, 1995). Es besteht allerdings nicht nur Zweifel an der Effektivität von Hausaufgaben bezüglich der Schulleistung, die Hausaufgabenpraxis wurde ebenfalls im Hinblick auf die mit ihr einhergehende Belastung kritisch diskutiert (Spiel, Wagner & Fellner, 2002; Wagner, Hirten lehner, Bacher & Schober, 2010). Müssen Schüler/innen zu viele oder zu schwierige Hausaufgaben erledigen, steigt die Be-lastung durch die außerschulische Arbeit und negative Folgeeffekte sind sehr wahrscheinlich, z. B. das Erleben von negativen Emotionen oder auch die Beeinträchti-gung der Eltern-Kind-Beziehung durch mögliche auftre-tende Konflikte bei der Hausaufgabener ledigung (z. B. bei einer mangelnden Arbeitsbereitschaft des Kinds; Xu & Corno, 1998). Somit können Hausaufgaben nicht nur zu Belastungen auf Schülerseite, sondern auch zu zeit-
lichen und emotionalen Belastungen der Eltern führen (Jäger, Stuck, Jäger-Flor & Riebel, 2010).
Hausaufgaben als Mittel der Lernförderung bzw. Lern-unterstützung sind folglich nur dann zu rechtfertigen, wenn diese tatsächlich zum gewünschten Lernerfolg führen, und dabei auch das Wohlbefinden aller Beteiligten, insbesondere jenes der Schüler/innen, nicht beeinträchtigt wird.
Mit der Bedeutung von Hausaufgaben für die schulische Leistung befasst sich der folgende Beitrag. Nach einer deskriptiven Darstellung der Hausaufgabenpraxis in Lesen (PIRLS) und Mathematik (TIMSS) am Ende der Grund-schulzeit in Österreich wird ein Modell aufgestellt, das mithilfe von Variablen der Hausaufgabenpraxis Teile der schulischen Leistung in Lesen und Mathematik zu erklären versucht.
Die Hausaufgabenpraxis
Im österreichischen Schulorganisationsgesetz (SchOG § 17/2) wird die Vergabe von Hausaufgaben nur grob ge-regelt. Als Ziel von Hausaufgaben wird neben der Erzie-hung zur Selbstständigkeit (durch den Erwerb von Selbst-regulation) die Vertiefung und Wiederholung des Gelernten angeführt. Dabei zählen Hausaufgaben zu den Mitarbeits-leistungen, sie sollen an die Belastbarkeit der Schüler/innen angepasst werden, ihre Erledigung soll ohne fremde Hilfe gelingen und über die Art der Kontrolle dürfen Lehrpersonen frei entscheiden.
Wie sich die Hausaufgabenpraxis auf Grundlage dieser relativ weit gefassten Regelung nun tatsächlich an österrei-chischen Grundschulen gestaltet, darauf soll im folgenden Abschnitt unter Bezugnahme auf Schüler-, Lehrer- und auch Elterneinschätzungen näher eingegangen werden. Diese Darstellung bezieht auch die aktuelle empirische Be-fundlage der Hausaufgabenforschung mit ein.
Die Effektivität von Hausaufgaben für die Leistung der Schüler/innen ist nach wie vor nicht eindeutig geklärt, weshalb diese Beziehung im Fokus des folgenden Beitrags steht. Im ersten Abschnitt wird die Hausaufgabenpraxis in Lesen und Mathematik unter deskriptiven Gesichtspunkten beschrieben. Im zweiten Abschnitt wird ein Modell zur Erklärung bzw. Vorhersage der Mathematik- und Leseleistung durch die Hausaufgabenpraxis geprüft.
114 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
Dauer und Häufigkeit von Hausaufgaben in Lesen und Mathematik
Bisherige Studien zeigen auf, dass für die Erzielung eines positiven Effekts der Hausaufgaben auf die Leistung weniger die Dauer der Erledigung, als vielmehr die Regel mäßigkeit der Hausaufgabenvergabe entscheidend ist (z. B. Lipowsky et al., 2004; Trautwein, Köller & Baumert, 2001 für Sekun-darschüler/innen im Fach Mathematik). Die Hausaufga-bendauer steht häufig negativ mit der schulischen Leistung in Verbindung. Dies ist insofern erwartungsgemäß, als zu-meist leistungsschwächere Schüler/innen auch längere Zeit für die Hausaufgabenerledigung benötigen (De Jong et al., 2000; Trautwein, 2007).
In PIRLS und TIMSS wurden sowohl Lehrpersonen als auch Schüler/innen zur Häufigkeit und Dauer der Haus-aufgaben befragt. Abbildung 3.1.1 vergleicht die Angaben der Schüler/innen und der Lehrpersonen zu diesen beiden Merkmalen. Bezüglich der Häufigkeit der Hausaufgaben ge-ben über 80 % der Schüler/innen an, jeden oder fast jeden Tag Hausaufgaben in Mathematik zu erledigen. Ebenso vie-le Schüler/innen haben eine Lehrkraft, die diese Häufigkeit von Hausaufgaben nennt. Etwas weniger häufig kommen Lesehausaufgaben vor, aber auch diese werden mehrmals wöchentlich aufgegeben/erledigt. Nur etwa 1 % der Schü-ler/innen geben an, nie Mathematikhausaufgaben zu bear-beiten. Etwa so viele haben einen Lehrer/eine Lehrerin, der oder die nie Mathematikhausaufgaben vergibt. Hingegen wird ein Lesehausaufgaben-Verzicht von 7,5 % der Schüler/innen berichtet, während nur 0,5 % von einer Lehrkraft un-terrichtet werden, die angibt, nie Lesehausaufgaben zu ver-geben. Diese Diskrepanz in den Antworthäufigkeiten von Schülerinnen und Schülern und Lehrkräften kann mit den vorliegenden Daten nicht geklärt werden. Es geht jedoch sowohl aus den Schülerangaben als auch aus den Lehrkräfte-angaben klar hervor, dass Hausaufgaben einen integralen Bestandteil der schulischen Unterrichtspraxis darstellen.
Während Schüler/innen und Lehrpersonen die Frage nach der Dauer der Hausaufgaben getrennt nach Lesen und Mathematik beantworteten, gaben die Eltern eine gene-relle Einschätzung der gesamten aufgewendeten Zeit für Hausaufgaben pro Tag ab. Der Großteil der Kinder in der 4. Klasse Grundschule benötigt nach Elternangaben zwi-schen 30 und 60 Minuten für die Erledigung der Haus-aufgaben (46,4 %). 33,7 % der Kinder verbringen zwischen einer Viertel- und einer halben Stunde mit Hausaufgaben, weitere 4,6 % benötigen rund eine Viertelstunde. Lediglich 1,4 % der Eltern geben an, dass das Kind keine Hausauf-gaben bekommt. Immerhin 13,8 % der Kinder benötigen täglich über eine Stunde für das Erledigen der Hausauf gaben.
Die getrennte Bearbeitungsdauer von Lese- und Mathema-tikhausaufgaben aus Lehrpersonen- und Schülersicht ist in Abbildung 3.1.2 dargestellt. Hier wird zum einen deutlich, dass die Mathematikhausaufgaben im Schnitt länger dau-ern als die Lesehausaufgaben, und zum anderen, dass die Lehrpersonen die Dauer der Hausaufgaben etwas höher einschätzen als die Schüler/innen. So geben beispielsweise 31,4 % der Schüler/innen an, die Mathematikhausauf-gaben innerhalb von 15 Minuten lösen zu können, wäh-rend im Vergleich „nur“ 6,5 % einen Lehrer/eine Lehrerin haben, der oder die von diesem kurzen Zeitfenster ausgeht. Die höhere Einschätzung der Hausaufgabendauer durch die Lehrpersonen steht im Widerspruch zu bisherigen Befun-den, die tendenziell eher gezeigt haben, dass Lehrpersonen die Dauer der Hausaufgaben unterschätzen, wobei sich diese Vergleichsbefunde überwiegend auf den Sekundarstu-fenbereich beziehen (im Überblick, siehe Spiel et al., 2002)
Die Daten spiegeln demnach eine große zeitliche Streuung im Hinblick auf die Hausaufgabenbearbeitung wider. Dies zeigte sich auch in der von Spiel et al. (2002) durchgeführten Studie an Schülerinnen und Schülern der 3. Klasse Grund-schule, in der sich eine Variation von 0,75 bis 11,25 Stunden Arbeitszeit pro Woche für die Schule (Hausaufgaben- und Übungszeit) aus den Angaben der Drittklässler errechnete.
0 % 20 % 40 % 60 % 80 % 100 %
Häufigkeit der Hausaufgaben
S/S: Lesen 43.9 34.2 14.3 7.5
LP: Lesen 57.5 33.3 8.7
S/S: Mathematik 83.4 13.4
LP: Mathematik 10.888.3
nieweniger als 1-mal die Woche1- bis 2-mal die Wochejeden oder fast jeden Tag
Abbildung 3.1.1: Häufigkeit von Lese- und Mathematikhausaufgaben aus Schüler/innen (S/S)- und Lehrpersonensicht (LP) (PIRLS & TIMSS 2011)
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 115
Werden die Häufigkeit und die Dauer der Hausaufgaben nun in einem weiteren Schritt klassenspezifisch betrachtet, d. h., werden die Angaben der Lehrkraft direkt mit den An-gaben der eigenen Schüler/innen – gefasst als Median ihrer Angaben – verglichen, so bestätigt sich das eben berichtete Bild: Die Häufigkeit von Lese hausaufgaben (siehe Abbil-dung 3.1.3) und die Dauer von Mathematikhausaufgaben (siehe Abbildung 3.1.4) wird von Lehrkräften höher einge-schätzt als von ihren eigenen Schüler/innen. Es zeigen sich demnach auch im internen Klassen vergleich Unterschiede in den Einschätzungen.
Ein wesentlicher Faktor, der die Bearbeitungszeit von Haus-aufgaben beeinflusst, ist das Kompetenzniveau der Schüler/innen. Die Daten aus PIRLS und TIMSS belegen, dass Schüler/innen auf den unteren Kompetenzstufen deutlich länger für das Erledigen von Mathematik- und Lesehaus-aufgaben benötigen als Schüler/innen auf den höheren Kompetenzstufen, wodurch sich auch hier die in empi-rischen Studien vielfach belegte negative Beziehung auf Schülerebene zwischen Hausaufgabendauer und Leistungs-stärke bestätigen lässt (im Überblick, siehe z. B. Trautwein & Köller, 2003a). Leistungsschwache Schüler/innen stellen
0 % 20 % 40 % 60 % 80 % 100 %
bis zu 15 Minuten16−30 Minuten31−60 Minutenüber 60 Minuten
Dauer der Hausaufgaben
S/S: Lesen 5.5 23.4 68.4
LP: Lesen 44.8 53.8
S/S: Mathematik 16.7 47.1 31.4
LP: Mathematik 13.3 80.2 6.6
Abbildung 3.1.2: Dauer von Lese- und Mathematikhausaufgaben aus Schüler/innen (S/S)- und Lehrpersonensicht (LP) (PIRLS & TIMSS 2011)
0 % 20 % 40 % 60 % 80 % 100 %
Gegenüberstellung Lehrperson und Klasse (Median): Häufigkeit Hausaufgaben
Lesen 7.4 59.1 33.6
Mathematik 7.9 90.3
Lehrer länger als Klassenmediangleiche EinschätzungLehrer kürzer als Klassenmedian
Abbildung 3.1.3: Einschätzung der Hausaufgabenhäufigkeit aus der Sicht der Klassenlehrperson im Vergleich zu den eigenen Schülerinnen und Schülern (PIRLS & TIMSS 2011)
0 % 20 % 40 % 60 % 80 % 100 %
Lehrer länger als Klassenmediangleiche EinschätzungLehrer kürzer als Klassenmedian
Gegenüberstellung Lehrperson und Klasse (Median): Dauer Hausaufgaben
Mathematik 8.7 20.371.0
Lesen 90.37.9
Abbildung 3.1.4: Einschätzung der Hausaufgabendauer aus der Sicht der Klassenlehrperson im Vergleich zu den eigenen Schülerinnen und Schülern (PIRLS & TIMSS 2011)
116 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
somit eine gefährdete Gruppe bezüglich einer zeitlichen Be- und möglicherweise ebenso Überlastung ausgelöst durch die gängige Hausaufgabenpraxis dar. Die Unterschiede sind dabei besonders stark im Bereich Lesen ausgeprägt: 85,5 % der leistungsstarken Schüler/innen geben an, weniger als 15 Minuten für die Lesehausaufgaben zu benötigen, während von dieser kurzen Bearbeitungsdauer lediglich 49,8 % der Risikoschüler/innen berichten (Kompetenzstufe < 1). In Mathematik sind die leistungsschwachen Schüler/innen insbesondere durch eine lange Hausaufgabenzeit von über einer Stunde betroffen (12,7 % im Vergleich zu 0 % der Spitzenschüler/innen). Die exakten Unterschiede in Prozent sind Abbildung 3.1.5 für die Lesehausaufgabendauer und Abbildung 3.1.6 für die Mathematikhausaufgabendauer zu entnehmen.
Unterstützung bei den Hausaufgaben
Entsprechend dem Schulorganisationsgesetz sollten Haus-aufgaben so vergeben werden, dass diese selbstständig von den Schülerinnen und Schülern gelöst werden können. Angaben aus PIRLS und TIMSS 2011 zur häuslichen Unterstützung bei den Hausaufgaben zeigen jedoch klar, dass Hausaufgaben sehr häufig nicht alleine, sondern mit Unterstützung gemacht werden. Diese Unterstützungsleis-tung ist in Mathematik häufiger vorzufinden als in Lesen. Während die Eltern in 43,2 % der Fälle angeben, dass das Kind keine Hilfe bei den Leseaufgaben benötigt, kommen bei den Mathematikhausaufgaben im Vergleich nur 21,7 % der Schüler/innen ohne elterliche Hilfe aus. Die Mutter ist dabei die zentrale Bezugsperson, die am häufigsten um Hilfe gefragt wird: 43 % der Kinder wenden sich bei Leseauf-
0 % 20 % 40 % 60 % 80 % 100 %
bis zu 15 Minuten16−30 Minuten31−60 Minutenüber 60 Minuten
Stufe 4
Stufe 3
Stufe 2
Stufe 1
< Stufe 1
Zeitliche Beanspruchung durch Lesehausaufgaben nach Kompetenz
49.826.813.89.7
55.929.88.75.5
65.525.46.4
76.919.1
85.513.1
0 % 20 % 40 % 60 % 80 % 100 %
bis zu 15 Minuten16−30 Minuten31−60 Minutenüber 60 Minuten
Stufe 4
Stufe 3
Stufe 2
Stufe 1
< Stufe 1
Zeitliche Beanspruchung durch Mathematikhausaufgaben nach Kompetenz
32.450.716.9
33.149.215.4
31.748.016.43.9
28.544.818.48.3
32.836.817.612.7
Abbildung 3.1.6: Schüler/innen unterschiedlicher Kompetenzniveaus in Mathematik und benötigte Zeit für Mathematikhausaufgaben (PIRLS & TIMSS 2011)
Abbildung 3.1.5: Schüler/innen unterschiedlicher Kompetenzniveaus in Lesen und benötigte Zeit für Lesehausaufgaben (PIRLS & TIMSS 2011)
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 117
gaben und 52,4 % bei den Mathematikhausaufgaben an die Mutter. Der Vater wird bei den Mathematikhausaufgaben stärker zu Rate gezogen (13 %) als bei den Lesehausauf-gaben (3 %). Neben den Eltern spielen auch institutionelle Nachmittagsbetreuungen eine Rolle bei der Hausaufgaben-unterstützung (5–6 %).
Die Unterstützungsleistung der Eltern ist nicht per se als positiv für die Leistungsentwicklung der Kinder zu beur-teilen. Vielmehr ist deren Effektivität von der Qualität der gewährleisteten Unterstützung abhängig. Studien konn-ten belegen, dass kontrollierendes, „produktorientiertes“ (lösungsorientiertes) und bewertendes Verhalten der Eltern von den Kindern als wenig unterstützend erlebt wird und die Hausaufgabenmotivation und infolge auch die Leistung negativ beeinflussen kann (Cooper, Lindsay & Nye, 2000; Mischo & Haag, 2006; Pomerantz & Eaton, 2001; Pome-rantz, Wang & Ng, 2005; Wild & Gerber, 2007). Dieser negative Effekt kann durch die Selbstbestimmungstheorie der Motivation (Deci & Ryan, 1993) erklärt werden. Diese postuliert, dass autonome Lernumgebungen, in denen die drei grundlegenden Bedürfnisse nach Autonomie, sozialer Eingebundenheit und Kompetenz erfüllt werden, die Basis für das Entstehen von (Lern-)Motivation und infolge auch für die Leistung bilden.
Den Eltern wurden bei PIRLS und TIMSS sieben Fragen zu ihrem Unterstützungsverhalten gestellt. Diese Verhal-tensweisen werden im Folgenden deskriptiv dargestellt. Ob diese Unterstützungsleistung von den Kindern als (negativ) kontrollierend oder (positiv) begleitend/unterstützend er- lebt wurde, kann aus den vorliegenden Daten jedoch nicht beantwortet werden.
Abbildung 3.1.7 zeigt, dass sich Eltern sehr häufig für die Hausaufgaben der Kinder interessieren und sich um eine ge-wissenhafte Erledigung kümmern. So geben immerhin zwi-schen 70 und 80 % der Eltern an, dass sie täglich oder fast
täglich die Hausaufgabenerledigung kontrollieren. Weiters achten sie darauf, dass sich das Kind Zeit für die Hausauf-gaben nimmt, sowie zeigen ebenso daran Interesse, was das Kind in der Schule macht und was zu Hause für die Schule zu erledigen ist. Etwas weniger häufig werden die Kinder auch tatsächlich bei der Hausaufgabenerledigung unter-stützt (47,3 % geben an, dies täglich/fast täglich zu tun) und am wenigsten oft wird mit dem Kind gemeinsam Lesen oder Mathematik geübt. Die hohe häusliche Unterstützung ist im Allgemeinen bezeichnend für das Grundschulalter, während diese im Sekundarschulalter abnimmt. Gründe hierfür könnten die erhöhte Selbstständigkeit der Schüler/innen oder auch ein Anstieg der Komplexität des Lernstoffs bzw. der Aufgaben sein (siehe z. B. Jäger et al., 2010).
Hausaufgabenpraxis in der Schule
Nicht nur die Qualität der elterlichen Unterstützung spielt eine Rolle für die Effektivität der Hausaufgaben, sondern auch die Qualität der Hausaufgabenpraxis in der Schule. Didaktische Professionalität bezogen auf die Hausaufga-bengestaltung lässt sich entsprechend empirischen Erkennt-nissen durch einen differenzierten Einsatz von Hausauf-gaben im Unterricht verbunden mit einem entsprechenden Monitoring und hoher Kompetenz in der kognitiv aktivie-renden und motivierenden Aufgabenauswahl beschreiben (z. B. Dettmer, Trautwein & Lüdtke, 2009; Hascher & Hofmann, 2011).
In PIRLS und TIMSS liegen Daten zur Individualisierung der Hausaufgabenvergabe und zur Kontrolle der Hausauf-gabenerledigung vor. Die Daten lassen jedoch keine Rück-schlüsse auf die Aufgabenqualität zu.
Hausaufgabenvergabe
In Österreichs Grundschulklassen haben Lehrkräfte eine he-terogene Schülerschaft zu unterrichten. Um dieser Hetero -
0 % 20 % 40 % 60 % 80 % 100 %
nie oder fast nie1- bis 2-mal im Monat1- bis 2-mal die Wochejeden oder fast jeden Tag
Mit meinem Kind Mathematik üben
Mit meinem Kind Lesen üben
Meinem Kind bei Schulaufgaben helfen
Mein Kind fragen, was es in der Schule gemacht hat
Überprüfen, ob die Hausaufgaben gemacht wurden
Darauf achten, dass das Kind sich Zeit für Hausaufgaben nimmt
Besprechen, was für die Schule zu tun ist
Elterliche Unterstützung
77.8 16.6
74.1 11.2 11.2
79.1 11.1 7.5
75.3 20.7
47.3 32.9 10.2 9.6
22.9 34.3 12.9 29.9
20.9 40.3 21.5 17.3
Abbildung 3.1.7: Häusliche Unterstützung bei Hausaufgaben (Angaben der Eltern) (PIRLS & TIMSS 2011)
118 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
genität bestmöglich gerecht zu werden und Schüler innen und Schülern eine optimale Förderung zukommen zu las-sen, wird als didaktisches Werkzeug die Individualisierung des Unterrichts und infolge auch die Individualisierung der Hausaufgabenpraxis empfohlen. Nach Grasedieck (2009) kann Individualisierung auf verschiedenen Ebenen ansetzen, z. B. Individualisierung unter Berücksichtigung des Inter-esses, der Lernmuster oder auch des Lerntempos. Bezug-nehmend auf das Lerntempo sollte beispielsweise dem Um-stand Rechnung getragen werden, dass leistungsschwächere Schüler/innen deutlich länger für die Erledigung von Haus-aufgaben brauchen. Daher sollte auch die Länge der Haus-aufgaben entsprechend individualisiert werden. Wesent lich hierbei ist jedoch, dass auch leistungsschwächere Schüler/innen das mit den Hausaufgaben verbundene Lernziel erreichen können.
Diese Form der individualisierten Hausaufgabenvergabe, die die Leistungsstärke der Schüler/innen berücksichtigt, wurde in PIRLS und TIMSS erfasst. Ähnlich, wie die Befunde von
Hascher und Hofmann (2008; 2011) sowie von Schnyder et al. (2008) im Sekundarschulbereich zeigen, berichten auch die Grundschullehrer/innen selten von einer indivi-dualisierten Hausaufgabenvergabe: 75,2 % der Schüler/in-nen in Lesen und 82,3 % der Schüler/innen in Mathematik werden von einer Lehrkraft unterrichtet, welche die gleiche Hausaufgabe für alle Kinder einer Klasse standardmäßig einsetzt. In einzelnen Fällen wird bei der Hausaufgabenver-gabe nach Leistungsstärke differenziert. Leistungsschwache Schüler/innen bekommen dann zumeist weniger Hausauf-gaben, was zu einer zeitlichen Entlastung führen soll, oder andere Aufgaben, um eine möglichst optimale Passung zum Kompetenzniveau zu erzielen. Leistungsschwachen Schüle-rinnen und Schülern mehr Hausaufgaben zu erteilen, wird im schulischen Alltag entsprechend den Angaben der Lehr-kräfte fast nie oder nur sehr selten realisiert. In den Fällen, in denen die Lehrkräfte die individualisierte Hausaufgaben-praxis einsetzen, orientieren sie sich demnach überwiegend am wünschenswerten pädagogischen Förderprinzip (= indi-viduelle Hausaufgabe je nach Leistungsstand; Vermeidung
0 % 20 % 40 % 60 % 80 % 100 %
nie oder fast niemanchmalimmer oder fast immer
Individualisierung der Mathematikhausaufgaben
Die gleiche HA für alle S/S 83.0 14.8
Schwache S/S weniger HA 9.9 59.3 30.8
Schwache S/S mehr HA 8.1 90.9
Schwache S/S eine individuelle HA 9.0 63.5 27.5
0 % 20 % 40 % 60 % 80 % 100 %
nie oder fast niemanchmalimmer oder fast immer
Individualisierung der Lesehausaufgaben
Die gleiche HA für alle S/S 75.5 21.0
Schwache S/S weniger HA 11.2 50.2 38.6
Schwache S/S mehr HA 8.6 88.8
Schwache S/S eine individuelle HA 15.2 49.0 35.7
Abbildung 3.1.9: Häufigkeit der Vergabe von individualisierten Mathematikhausaufgaben in Abhängigkeit vom Leistungsniveau der Schüler/innen (S/S) (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)
Abbildung 3.1.8: Häufigkeit der Vergabe von individualisierten Lesehausaufgaben in Abhängigkeit vom Leistungsniveau der Schüler/innen (S/S) (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 119
von Überforderung) (siehe Abbildung 3.1.8 und Abbildung 3.1.9).
Hausaufgabenkontrolle
Es ist davon auszugehen, dass Hausaufgaben, die nicht kon-trolliert werden, entweder keinen Effekt oder womöglich sogar einen negativen Effekt im Hinblick auf die Leistungs-entwicklung der Schüler/innen bewirken, da Fehlkonzepte, Missverständnisse, Fehler oder Schwächen nicht aufgedeckt und daher auch nicht bearbeitet werden können. Die Haus-aufgabenkontrolle ist demnach ein wesentlicher Bestandteil qualitätsvoller Hausaufgabenpraxis. Aber auch in der Schule ist die Hausaufgabenkontrolle nicht per se ein leistungsför-dernder Indikator, sondern sie muss im Hinblick auf ihre Qualität, d. h. auf die Art der Umsetzung diskutiert werden. So konnten bisherige Studien zur Hausaufgabenkontrolle in der Schule – ähnlich wie im Elternhaus – belegen, dass die Wahrnehmung der Hausaufgabenkontrolle durch die Schüler/innen (kontrollierend vs. unterstützend) eine ent-scheidende Rolle spielt, ob sich diese positiv oder negativ für die schulische Leistung erweist (z. B. Trautwein, Niggli, Schnyder & Lüdtke, 2009).
In PIRLS und TIMSS haben die Lehrkräfte Angaben zur Hausaufgabenkontrolle gemacht. Sie wurden zum einen gefragt, ob sie Hausaufgaben auf deren Vollständigkeit kontrollieren, zum anderen, ob sie diese auch korrigieren und rückmelden bzw. in der Klasse besprechen. Die Abbil-dungen 3.1.10 und 3.1.11 illustrieren, dass die Hausauf-gabenkontrolle sehr hoch ausgeprägt ist. Beinahe alle Schü-ler/innen (98,6 % in Mathematik und 89,9 % in Lesen) haben einen Lehrer/eine Lehrerin, der oder die kontrolliert, ob die Hausaufgaben vollständig erledigt wurden. Auch die Hausaufgabenkorrektur und -rückmeldung wird in Mathe-matik fast immer (96,3 %) und in Lesen in den überwie-genden Fällen (75,8 %) vorgenommen. Weniger häufig, aber immer noch regelmäßig werden Hausauf gaben in der Klasse gemeinsam (d. h. ohne Differenzierung) besprochen. Zusammenfassend spiegeln die Daten also ein hohes Haus-aufgabenmonitoring in Österreichs Grundschulklassen wider. Es kann allerdings auch hier keine Aussage darüber getroffen werden, wie dieses Monitoring von den Schülerin-nen und Schülern wahrgenommen wird („kontrollierend“ vs. „unterstützend“).
0 % 20 % 40 % 60 % 80 % 100 %
nie oder fast niemanchmalimmer oder fast immer
Hausaufgabenmonitoring in Lesen
Korrigieren und Rückmeldung geben 76.1 21.2
Hausaufgaben in der Klasse besprechen 64.2 31.6
Kontrollieren, ob Hausaufgaben vollständig erledigt 8.889.9
0 % 20 % 40 % 60 % 80 % 100 %
nie oder fast niemanchmalimmer oder fast immer
Hausaufgabenmonitoring in Mathematik
Korrigieren und Rückmeldung geben 96.3
Hausaufgaben in der Klasse besprechen 53.6 44.3
Kontrollieren, ob Hausaufgaben vollständig erledigt 98.4
Abbildung 3.1.11: Art der Hausaufgabenüberprüfung in Mathematik durch die Lehrkraft (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)
Abbildung 3.1.10: Art der Hausaufgabenüberprüfung in Lesen durch die Lehrkraft (Angaben der Lehrkraft) (PIRLS & TIMSS 2011)
120 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
Vorhersage der Lese- und Mathematik-leistung durch die Hausaufgabenpraxis
Bisher wurde die Hausaufgabenpraxis vornehmlich deskrip-tiv behandelt. Im Zuge dieser Analysen wurde der über-wiegende Anteil an Indikatoren, die im folgenden Modell zur Erklärung, wie sehr die Schulleistung von der Hausauf-gabenpraxis beeinflusst wird, bereits erläutert und in den Kontext der aktuellen Befundlage der Hausaufgabenfor-schung gesetzt.
Im folgenden Abschnitt wird ein Modell zur Vorhersage der Leistung in Lesen und Mathematik abgeleitet und berech-net. Dabei wird der Forderung von Trautwein und Kolle-ginnen und Kollegen (z. B. 2009) nach Berücksichtigung der hierarchischen Struktur der Daten Rechnung getragen, indem Mehrebenenmodelle mit Prädiktoren auf Schüler-ebene (Level 1) und Klassenebene (Level 2) berechnet wer-den. Die Intraclasscorrelation beträgt .13 für Lesen und .20 für Mathematik, weshalb es notwendig und sinnvoll erscheint, mehrebenenanalytisch vorzugehen und Indika-toren ebenso auf der Klassenebene zu berücksichtigen.
Modellspezifikation
Die Mehrebenenmodelle sind als Random-Intercept- Modelle spezifiziert. Das bedeutet, dass zu individuellen Einflussfaktoren auf die Lese- bzw. Mathematikleistung (= Level 1: bspw. Lernressourcen im Elternhaus, Ge-schlecht oder Dauer der Hausaufgabenerledigung) ein unterschied licher Grundwert pro Klasse geschätzt wird, der von Faktoren auf Klassenebene abhängt (= Level 2: bspw. Schulstandort, Häufigkeit von Hausübungen in der Klasse oder individualisierender Umgang mit Hausübungen durch die Lehrkraft). Eine mögliche unterschiedliche Bedeutsam-keit der Faktoren der individuellen Ebene in verschiedenen Klassen wurde nicht modelliert.
Die Modelle folgen einem schrittweisen Aufbau, der in Tabelle 3.1.1 dargestellt ist. Modell 1 beinhaltet lediglich Kontrollvariablen auf individueller und Klassenebene, die nach bisherigen Untersuchungen vermutlich einen Ein-fluss auf die Lese- bzw. Mathematikleistung zeigen. In Modell 2 werden Variablen eingeführt, welche sich auf die individuelle Hausaufgabenpraxis und das elterliche Monitoring beziehen. Modell 3 ergänzt die Prädiktoren auf Klassenebene um die durchschnittliche Häufigkeit und Dauer der Hausauf gaben in der Klasse sowie das Monito-ring und den differenzierenden Umgang mit Hausaufgaben durch die Lehrperson.
Die Ergebnisse in Tabelle 3.1.1 beschreiben unstandardi-sierte lineare Koeffizienten (Standardfehler und Signifikanz in Klammern). Diese sind so zu lesen, dass mit der Verände-rung der Prädiktorvariablen um eine Einheit eine geschätzte Veränderung des Lese- oder Mathematikleistungswerts (auf individueller oder Klassenebene) um eine dem Koeffizienten
entsprechende Anzahl an Einheiten einhergeht. Um diese Koeffizienten in Effektstärken interpretieren zu können, ist es notwendig zu beachten, ob es sich um Dummy-Variablen für Gruppenunterschiede handelt bzw. auf welchen Stan-dardabweichungen die stetigen Variablen beruhen. Tabelle 3.1.1 gibt darüber Auskunft.
Fehlende Werte wurden nicht ersetzt, sondern listenweise ausgeschlossen. Im vollständigen Modell 3 mit allen Vari- ablen befinden sich bei PIRLS noch 3600 Fälle (77 % der Stichprobe) und bei TIMSS 3548 Fälle (76 % der Stich-probe). Keine der in den Modellen verwendeten Variablen weist für sich genommen eine relative Häufigkeit an Missings über 10 % auf, sodass von unsystematischen Aus-fällen ausgegangen werden kann.
Die Modelle wurden in MPlus 7 geschätzt, dabei wurde der MLR-Schätzer verwendet, die entsprechenden Gewichte auf individueller und Klassenebene herangezogen und die Berechnung für alle fünf plausible values repliziert (und gemittelt), um exakte Standardfehler berichten zu können.
Ergebnisse der mehrebenenanalytischen Überprüfungen
Tabelle 3.1.2 gibt die Ergebnisse der stufenweise aufgebau-ten Mehrebenenmodelle wieder. Als abhängige Variablen fungierten die Lese- und die Mathematikleistung.
In Modell 1 werden Merkmale kontrolliert, die sich aus der bisherigen Forschung als relevant für die Lese- und Mathe-matikleistung herausgestellt haben (siehe z. B. Trautwein et al., 2002), lediglich die kognitive Grundfähigkeit der Schüler/innen (z. B. Intelligenz) kann auf Grundlage die-ses Datenmaterials nicht kontrolliert werden. Die erfassten Merkmale erklären 26,2 % der Varianz/Streuung in der Leseleistung und 28,9 % der Varianz in der Mathematik-leistung. Auf Individualebene zeigt sich wie erwartet, dass Mädchen die besseren Leserinnen sind, während Buben eine höhere Leistung in Mathematik aufweisen. Des Wei-teren sind die Leistungen in Lesen und Mathematik besser, wenn die Lernressourcen zu Hause höher sind. Motivation und das (fachliche) Selbstkonzept sind eng miteinander ver-bunden (r = 0.46 bei PIRLS und r = 0.55 bei TIMSS), wo-bei die Modellschätzung vor allem dem (fachlichen) Selbst-konzept der Schüler/innen einen positiven Zusammenhang mit den Leistungsergebnissen zuschreibt. Als Indikator für die Deutschkenntnisse wurde die Angabe der Eltern heran-gezogen, ob das Kind bereits vor dem Schuleintritt Deutsch gesprochen hat. Auch hier zeigt sich erwartungsgemäß, dass jene Schüler/innen, die bereits vor Schuleintritt Deutsch sprechen konnten, bessere Leistungen in Lesen und Mathe-matik aufweisen. Auf Level 2 (Klassenebene) wurden Unter-schiede im Hinblick auf die Umgebung des Schul standorts kontrolliert. Die Ergebnisse sprechen für bessere Leistungen in Lesen und Mathematik für Schüler/innen, die Schulen in Kleinstädten oder Dörfern besuchen, im Vergleich zu Schü-
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 121
TypModell und
EbeneBezeichnung Herkunft
Std.-Abw. PIRLS (Ö)
Std.-Abw. TIMSS (Ö)
UV
Modell 1 – Level 1
Home Resources for Learning (HRL)
Schülerfragebogen: Internationaler Index Home Resources for Learning (HRL)a
1.52 1.52
TIMSS (Ö) Schülerfragebogen: Der Koeffizient gibt die Veränderung des Schätzwerts für Buben an.
Motivation Schülerfragebogen: Internationaler Index Students Like Reading bzw. Students Like Learning Mathematics
2.16 2.13
Selbstkonzept Schülerfragebogen: Internationaler Index Students Confidence in Reading bzw. Student Confidence with Mathematics
2.17 2.12
Deutsch vor Schule Elternfragebogen: Der Koeffizient gibt die Veränderung des Schätzwerts für Schüler/innen an, die nach Angabe der Eltern bereits vor der Schule Deutsch gesprochen haben.
Modell 1 – Level 2
Schulstandort Schulfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „Großstadt – dicht bevölkert“ an.
Modell 2 – Level 1
Häufigkeit der fach-spezifischen Hausauf-gaben (HA)
Schülerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „jeden Tag oder fast jeden Tag“ an.
Dauer der fachspezifi-schen Hausaufgaben (HA)
Schülerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „15 Minuten oder weniger“ an.
Elterliche Unterstüt-zung und Monitoring
Elternfragebogen: Mittelwertscore aus 5 Itemsb (PIRLS: alpha = .745; TIMSS: alpha = .768). Je höher, desto mehr elter-liche Unterstützung und Monitoring bei den Hausaufgaben.
0.66 0.65
Modell 3 – Level 2
Häufigkeit der Haus-aufgaben im Klassen-durchschnitt
Schülerfragebogen: Median der entsprechenden Frage (siehe Mo-dell 2 – Level 1) pro Klasse; je höher, desto seltener beschäftigen sich die Schüler/innen der Klasse mit Hausaufgaben im Fach.
0.68 0.35
Dauer der Hausaufga-ben im Klassendurch-schnitt
Schülerfragebogen: Median der entsprechenden Frage (siehe Modell 2 – Level 1) pro Klasse; je höher, desto mehr Zeit investieren die Schüler/innen der Klasse in die Hausaufgaben im Fach.
0.35 0.36
Monitoring durch Kontrolle und Rück-meldung zu den Hausaufgaben
Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „immer oder fast immer“ an.
Monitoring durch Dis-kussion der Hausauf-gaben in der Klasse
Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts von der Referenzkategorie „immer oder fast immer“ an.
Individualisieren-der Umgang mit Hausaufgaben durch Lehrperson
Lehrerfragebogen: Die Koeffizienten geben die Veränderung des Schätzwerts für Lehrer/innen an, die wenigstens „manchmal“ nicht allen Schüler/innen die gleiche Hausaufgabe geben.
AVAlle Modelle Allgemeine Lese- bzw.
Mathematikleistung5 Plausible Values lt. PIRLS-/TIMSS-Manualc 63.38 62.70
a) Siehe http://timss.bc.edu/methods/pdf/T11_G4_G_Scales_HRL.pdf; dieser Index beinhaltet Merkmale der Eltern der Schüler/innen, welche auch für die Bestimmung eines sozioökonomischen Status relevant sind (höchste abgeschlossene Ausbildung der Eltern, höchster beruflicher Status der Eltern), sodass von einer starken Korrelation mit den bekannten – und in PIRLS und TIMSS 2011 nicht verfügbaren – sozioökonomischen Indizes (bspw. ESCS) ausgegangen werden kann. b) Items a, b, c, e und f/g der Frage 9 im Elternfragebogen (siehe https://www.bifie.at/system/files/dl/Elternfragebogen.pdf). c) Martin, M. O. & Mullis, I. V. S. (Eds.). (2012). Methods and procedures in TIMSS and PIRLS 2011. Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College. Online verfügbar unter: http://timss.bc.edu/methods/index.html
Tabelle 3.1.1: Analysevariablen
122 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
lerinnen und Schülern aus einer Großstadt. Zudem zeigen sich Schüler/innen aus entlegen-ländlichen Schulen besser in Mathematik als Schüler/innen aus den Großstädten. Es ist anzunehmen, dass bei diesen Unterschieden weitere ver-mittelnde Faktoren wirksam werden (z. B. die Qualität der häuslichen Förderung).
Modell 2, in dem Merkmale der Hausaufgabenpraxis auf Schülerebene (Level 1) berücksichtigt werden (R2 Lesen = 31,8 %, R2 Mathematik = 33,7 %), ergibt, dass elterliches Unterstützungsverhalten/Monitoring sowohl mit der Lese- als auch der Mathematikleistung negativ in Verbindung steht. D. h., unter Kontrolle der Variablen im ersten Modell zeigt sich, dass die Schulleistung geringer ausgeprägt ist, wenn im Elternhaus bei Hausaufgaben stark geholfen/kontrol-liert wird (siehe auch Cooper, Lindsay & Nye, 2000). Für diesen Befund können nun mehrere Erklärungen greifen. Zum einen könnte der bereits besprochene autonomie- unterdrückende Effekt, der durch kontrollierende Haus-aufgabenunterstützung ausgelöst werden kann, eintreten. Eine weitere Erklärungsmöglichkeit ergibt sich aus dem meist höheren Unterstützungsbedürfnis leistungsschwacher Schüler/innen bei der Hausaufgabenerledigung. Auch diese Denkrichtung würde den negativen Zusammenhang zwischen Leistung und Unterstützung durch die Eltern plausibel erklären und kann empirisch durch Befunde von Wild und Gerber (2007) im Längsschnitt gestützt werden (Klassenstufen 4–7; Mathematik). Diese Studie belegt, dass leistungsschwache Kinder nicht nur häufiger unterstützt werden, sondern dass diese Unterstützungsleistung auch stärker kontrollierend erfolgt. Hier spannt sich der Bogen zum ersten Erklärungsansatz (siehe auch Niggli et al., 2007).
Im Hinblick auf die schulische Hausaufgabenpraxis spiegeln die Daten ein zum Teil konträres Bild bezüglich der Lese- und Mathematikleistung auf Individualebene wider. Im Folgenden soll nur auf die Häufigkeit der Hausaufgaben-vergabe und deren Relation zur Leistung Bezug genommen werden, da zwischen der Dauer der Hausaufgaben und der Leistungsstärke eine wechselseitige Beeinflussung zu vermuten ist. Bezogen auf die Häufigkeit von Hausauf-gaben zeigt sich, dass die Leseleistung der Schüler/innen höher ist, wenn weniger Hausaufgaben zu erledigen sind, während Schüler/innen bessere Leistungen in Mathema-tik erbringen, wenn regelmäßig/häufig Hausaufgaben gegeben werden (z. B. auch Trautwein, 2007 für TIMSS Deutschland). Allerdings gilt ebenso, dass keine Hausauf-gaben in Lesen negativ mit der Leseleistung der Schüler/innen korrelieren – ein Mindestmaß an Lesehausaufgaben scheint demnach auch für die Leseleistung bedeutsam zu sein. Zwischen der Leseleistung und der Regelmäßigkeit von Hausauf gaben liegt folglich ein kurvilinearer Zusam-menhang vor, während sich für die Mathematikleistung ein linearer zeigt. Diese Ergebnisse lassen den Schluss zu, dass sich das beständige Üben von Inhalten durch eine regel-mäßige Hausaufgabenvergabe positiv für die Entwicklung der Mathematikkompetenz erweist. Die Leistungsentwick-
lung in Lesen scheint dahingegen weniger von der Übungs- und Festigungsfunktion der schulischen Hausaufgaben abhängig zu sein, sondern sie unterliegt vermutlich stärker der Selbststeuerung/Selbstregulierung der Schüler/innen. Möglicherweise spielen für die Leseleistung außerschulische Faktoren, wie z. B. der Zugang zu Büchern (Buchbesitz), der sich bereits in PIRLS 2006 als wesent licher Prädiktor für die Leseleistung erwiesen hat (Bergmüller & Böck, 2009), und motivationale Faktoren der Schüler/innen (z. B. deren Lesefreude) eine stärkere Rolle, da sie das (Lesen-)Üben mitbestimmen.
Modell 3 berücksichtigt zusätzlich Merkmale auf Ebene 2, der Klassenebene. Es zeigen sich hier keine weiteren signifi-kanten Effekte. Die Erklärung der Varianz durch das Modell steigt ebenso nur geringfügig an (R2 Lesen = 33,7 %, R2 Mathematik = 34,5 %, das bedeutet eine Varianzsteigerung von knapp 2 Prozentpunkten pro Kompetenzbereich, siehe hierzu auch Wallner-Paschon & Schneider, 2009). Daher ist das Modell 2 zur Erklärung der Lese- und Mathematik-leistung dem Modell 3 vorzuziehen.
Resümee
Der vorliegende Beitrag hat geprüft, inwieweit Hausauf-gaben mit der Schülerleistung in Lesen und Mathematik in Verbindung stehen. Des Weiteren hat er die Hausauf-gabenpraxis in Österreich am Ende der Grundschule be-schreibend dargestellt. Diese Ergebnisse werden im Fol-genden kurz zusammengefasst sowie überlegt, welche praktischen Konsequenzen diese nahelegen.
Im Gegensatz zu den Befunden von PIRLS 2006 (Suchan & Breitfuß-Muhr, 2009), in denen kein Effekt der Hausauf-gabenpraxis auf die Leseleistung aufgezeigt werden konnte, ergaben die in diesem Beitrag berechneten Modelle, ge-stützt auf die PIRLS- und TIMSS-2011-Daten, kleinere Effekte, die jedoch mit einer inkrementellen Varianzauf-klärung von 6 % (nach Kontrolle einiger Drittvariablen) nicht sehr hoch sind. Diese relativ geringe Erklärungskraft stellt allerdings keinen überraschenden Befund dar, da sehr viele unterschiedliche Faktoren die Schulleistung determi-nieren (für ein Rahmenmodell schulischer Leistung siehe z. B. Helmke, Hosenfeld & Schrader, 2002, S. 426). Des Weiteren wurden wesentliche Variablen, welche die Effekti-vität der Hausaufgaben beeinflussen, wie sie beispielsweise im Prozessmodell der Wirkungsweise von Hausaufgaben von Kohler (2011) angeführt werden, bei den Erhebungen in PIRLS und TIMSS nicht berücksichtigt. Dazu zählen beispielsweise das Hausaufgabenverhalten der Schülerinnen und Schüler (z. B. Engagement, Selbstregulation, Motiva-tion, Emotionsmanagement; Trautwein & Köller, 2003b; Xu, 2011) und die Funktionalität bzw. Dysfunktionalität des elterlichen Unterstützungsverhaltens (z. B. Adaptivität; Wild & Gerber, 2007). Auch die Qualität der Hausaufgaben
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 123
Variablen PIRLS TIMSS
Level 1 (Schüler-Ebene) Modell 1 Modell 2 Modell 3 Modell 1 Modell 2 Modell 3
– HRL – Geschlecht – Motivation – Selbstkonzept– Deutsch vor Schule
– Häufigkeit HA (vs. „jeden Tag“) * 1- bis 2-mal pro Woche * weniger als einmal pro Woche * nie oder fast nie– Zeit für HA (vs. „< = 15 Min.“) * 16–30 Minuten * 31–60 Minuten * mehr als 60 Minuten
– Elterliche Unterstützung/Monitoring
14.3 (0.8**)–1.07 (2.08)0.28 (0.58)
7.80 (0.58**)12.4 (4.5**)
12.7 (0.7**)–0.76 (2.08)0.51 (0.59)
6.51 (0.60**)11.5 (4.5*)
6.28 (2.59*)11.5 (3.3**)5.23 (4.15)
–4.05 (2.69)–17.3 (4.4**)–28.1 (6.5**)
–17.8 (1.7**)
12.7 (0.7**)–0.36 (2.11)0.54 (0.62)
6.55 (0.61**)12.0 (4.5**)
6.91 (2.73*)11.8 (3.7**)7.22 (4.43)
–4.10 (2.80)–17.2 (4.5**)–27.6 (6.6**)
–18.0 (1.7**)
13.1 (0.7**)4.03 (2.10)–1.21 (0.65)10.2 (0.7**)7.07 (3.87)
11.8 (0.8**)5.41 (2.16*)–0.75 (0.66)9.49 (0.68**)5.54 (4.14)
–7.71 (3.09*)–8.46 (7.49)–22.2 (7.9**)
7.09 (2.24**)11.1 (3.5**)–5.92 (5.07)
–17.4 (1.5**)
11.8 (0.8**)5.07 (2.19*)–0.70 (0.63)9.59 (0.70**)5.71 (4.12)
–6.67 (3.21*)–9.35 (8.25)–23.2 (9.0**)
7.27 (2.34**)11.3 (3.7**)–5.57 (5.15)
–17.3 (1.6**)
Level 2 (Klassen- bzw. Lehrer-Ebene) Modell 1 Modell 2 Modell 3 Modell 1 Modell 2 Modell 3
– Standort (vs. Großstadt): * städt. Randbezirk * mittelgroße Stadt * Kleinstadt/Dorf * entlegen-ländlich
– Häufigkeit HA (Klassenmedian) („je höher, desto seltener“)– Zeit für HA (Klassenmedian) („je höher, desto länger“)
– Monitoring d. Kontrolle und Rückmeldung (vs. „immer“) * manchmal * nie oder fast nie
– Monitoring d. Diskussion (vs. „immer“) * manchmal * nie oder fast nie– Individualisierte Hausaufgaben (wenigstens „manchmal“)
6.16 (4.58)5.01 (5.01)10.8 (4.7*)12.6 (6.5)
7.10 (4.36)6.92 (4.89)14.6 (4.4**)15.9 (5.9**)
5.58 (4.56)4.12 (5.12)11.4 (4.8*)10.1 (6.2)
–2.90 (2.32)
4.73 (5.07)
2.78 (3.66)–5.45 (11.28)
–3.21 (3.39)–9.39 (8.79)
–6.54 (3.60)
4.96 (5.63)–4.97 (6.07)15.2 (5.1**)24.7 (7.2**)
4.49 (5.61)–4.46 (5.98)15.5 (4.9**)25.8 (7.1**)
7.01 (5.67)–3.08 (5.94)16.8 (4.9**)26.3 (6.9**)
–9.77 (7.49)
4.06 (5.35)
9.1 (11.5)[n = 0]
–0.11 (3.61)12.6 (7.8)
–7.02 (4.18)
R2 Ind. LevelR2 Class LevelR2 Total
.279
.062
.262
.331
.125
.318
.335
.200
.326
.306
.179
.289
.355
.207
.337
.357
.258
.345
Anmerkungen: abhängige Variablen sind die Leseleistung (PIRLS) bzw. Mathematikleistung (TIMSS); unstandard. Regressionskoeffizien-ten mit Standardfehlern in Klammer; ** ... p < .01; * ... p < .05; [n = 0] ... unbesetzte Zelle
Tabelle 3.1.2: Ergebnisse der mehrebenenanalytischen Modellprüfung
(z. B. kognitives Anspruchsniveau; Dettmers et al., 2009) und deren Funktionen (z. B. Memorieren von Inhalten, Verbesserung von Fähigkeiten etc.) wurden nicht berück-sichtigt. Zukünftige Untersuchungen sollten die Haus-aufgabenpraxis daher deutlich differenzierter im Hinblick auf deren Qualität, Funktion und die sie beeinflussenden Rahmen bedingungen (Schüler- und Kontextmerkmale) er-fassen.
Die Ergebnisse zeigen, dass die überwiegende Mehrheit der Lehrpersonen in Österreichs Grundschulen häufig Haus-aufgaben in Lesen und Mathematik vergibt. Dabei bestätigt sich für Mathematik im Einklang mit bisherigen Befunden das Bild, dass die Regelmäßigkeit von Hausaufgaben im Sinne eines kontinuierlichen Übens wesentlich mit der schulischen Leistungsstärke korreliert. Für Lesen ergibt sich ein anderes Muster: Sehr häufige Lesehausaufgaben (immer/
124 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
Literatur
Bergmüller, S. & Böck, M. (2009). Leseeinstellung und Leseverhalten im Einflussbereich von Schule und Familie. In B. Suchan, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule. Österreichischer Expertenbericht (S. 117–125). Graz: Leykam.
Carroll, J. B. (1963). A model of school learning. Teachers’ College Record, 64, 723–733.
Cooper, H., Lindsay, J. J. & Nye, B. (2000). Homework in the home: How student, family, and parenting-style differences relate to the homework process. Contemporary Educational Psychology, 25 (4), 464–487.
Deci, E. & Ryan, R. (1993). Die Selbstbestimmungstheorie der Motivation und ihre Bedeutung für die Pädagogik. Zeitschrift für Pädagogik, 39, 223–238.
De Jong, R., Westerhof, K. J. & Creemers, B. P. M. (2000). Homework and student math achievement in junior high schools. Educational Research and Evaluation, 72, 278–292.
Dettmers, S., Trautwein, U. & Lüdtke, O. (2009). Eine Frage der Qualität? Die Rolle der Hausaufgabenqualität für Hausaufga-benverhalten und Leistung. Unterrichtswissenschaft, 37 (3), 196–212.
Grasedieck, D. (2008). Welchen Wert haben Hausaufgaben? – Plädoyer für individualisierte Hausaufgaben. Neue Didaktik, 1, 25–40.
fast immer) gehen mit einer geringeren Leseleistung einher, während fehlende Lesehausaufgaben die schlechtesten Lese-leistungen vorhersagen (= kurvilinearer Zusammenhang). Fehlende Hausaufgaben könnten somit das negative Poten-zial besitzen, die Schere zwischen leistungsschwachen und leistungsstarken Schülerinnen und Schülern zu vergrößern und die bereits existente Leistungsheterogenität in den Klassenzimmern zusätzlich zu erhöhen. Aus den Befun-den lässt sich für die konkrete Unterrichtspraxis demnach schlussfolgern, dass regelmäßige Hausaufgaben besonders förderlich für die schulische Leistung zu sein scheinen (z. B. auch Lipowsky et al, 2004; Trautwein, Köller & Baumert, 2001). Die additive Wirkung der Hausaufgabendauer für die unterschiedlichen Fächer ist hierbei zu beachten, damit der zeitliche Aufwand durch die Hausaufgaben pro Tag für Schüler/innen bewältigbar bleibt. Mehrmals wöchentlich – jedoch nicht täglich – Hausaufgaben in den verschiedenen Unterrichtsfächern könnten die Regelmäßigkeit des Übens gewährleisten und die zeitliche Überlastung der Schüler/ innen verhindern (siehe auch Trautwein, Köller & Bau-mert, 2001). Auch eine (in diesem Zusammenhang nicht kontrollierte) integrative Hausaufgabenpraxis („Haus“-Aufgaben in Form von selbstregulierten Übungsmöglich-keiten im regulären Unterricht) wäre eine Möglichkeit, das außerschulische Belastungserleben zu reduzieren (Hascher & Bischof, 2000). Wird nach der Bedeutung von Lese- und Mathematikhausaufgaben für die Entwicklung der Schü-lerleistung gewichtet, so ist insbesondere die regelmäßige Vergabe von Mathematikhausaufgaben von Relevanz, um ausreichend Übungsmöglichkeiten bzw. aktive Lernzeit zu gewährleisten („time-on-task“; Carroll, 1963). Lesegelegen- heiten, in denen das Lesen geübt werden kann, finden
sich dahingegen auch außerschulisch häufiger, weshalb das regelmäßige Üben von Lesen weniger stark an die schu-lische Hausaufgabenpraxis gekoppelt ist. Voraussetzung für das selbstgesteuerte Lesen in der Freizeit ist jedoch die Entwicklung des Leseinteresses und der Zugang zu Lese-gelegenheiten. Beide Faktoren werden in der Regel stark von der Herkunft der Kinder mitbestimmt.
Die Hausaufgaben werden sowohl im Elternhaus als auch in der Schule zum Großteil kontrolliert und besprochen. Demnach ist das Hausaufgabenmonitoring sehr hoch ausge-prägt. Zu Hause übernehmen die Eltern häufig die Rolle des Lernbegleiters, hier insbesondere die Mutter – sowohl in der unterstützenden (z. B. helfen) als auch in der kon-trollierenden (z. B. Hausaufgabenerledigung kontrollieren) Funktion. Ein negativer Zusammenhang konnte zwischen dem elterlichen Monitoring und der schulischen Leistung aufgezeigt werden – d. h., die Hausaufgaben wurden insbe-sondere bei leistungsschwachen Schülerinnen und Schülern stark kontrolliert bzw. deren Erledigung intensiv begleitet. Das Monitoring auf Klassenebene konnte dahingegen nicht signifikant mit der Leistung in Verbindung gebracht werden. Damit das Hausaufgabenmonitoring seine pädago-gische Wirksamkeit im Sinne einer kontinuierlichen Lern-begleitung und -unterstützung entfalten kann, ist darauf zu achten, dass dieses in einer positiv-unterstützenden, angst-freien Atmosphäre stattfindet. Angst, Leistungsdruck und Furcht vor Fehlern könnten beispielsweise reduziert werden, indem Hausaufgaben nicht bewertet werden, und sich die Hausaufgabenerledigung und deren Kontrolle folglich als Lern- und weniger als Leistungssituation gestaltet (Hascher & Hagenauer, 2010).
Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung 125
Hascher, T. & Bischof, F. (2000). Integrierte und traditionelle Hausaufgaben in der Primarschule. Psychologie in Erziehung und Unterricht, 47 (4), 252–265.
Hascher, T. & Hagenauer, G. (2010). Lernen aus Fehlern. In C. Spiel, B. Schober, P. Wagner & R. Reimann (Hrsg.), Bildungs-psychologie (S. 377–381). Göttingen: Hogrefe.
Hascher, T. & Hofmann, F. (2008). Kompetenzbereich Hausaufgaben. In M. Gläser-Zikuda & J. Seifried (Hrsg.), Lehrerexpertise. Analyse und Bedeutung unterrichtlichen Handelns (S. 143–164). Münster: Waxmann.
Hascher, T. & Hofmann, F. (2011). Hausaufgaben aus der Sicht von (angehenden) Lehrerinnen und Lehrern. DDS – Die Deut-sche Schule, 103 (3), 219–234.
Helmke, A., Hosenfeld, I. & Schrader, F.-W. (2002). Unterricht, Mathematikleistung und Lernmotivation. In A. Helmke & R. S. Jäger (Hrsg.), Das Projekt MARKUS. Mathematik-Gesamterhebung Rheinland-Pfalz: Kompetenzen, Unterrichtsmerkmale, Schulkontext (S. 413–480). Landau: Verlag Empirische Pädagogik.
Kohler, B. (2011). Hausaufgaben. Überblick über didaktische Überlegungen und empirische Untersuchungen. DDS – Die Deutsche Schule, 103 (3), 203–218.
Jäger, R. S., Stuck, A., Jäger-Flor, D. & Riebel, J. (2010). Hausaufgaben: Die andere Sicht der Medaille: die Sicht der Eltern. Empirische Pädagogik, 24 (1), 55–77.
Lipowsky, F., Rakoczy, K., Klieme, E., Reusser, K. & Pauli, C. (2004). Hausaufgabenpraxis im Mathematikunterricht – ein Thema für die Unterrichtsqualitätsforschung. In J. Doll & M. Prenzel (Hrsg.), Bildungsqualität von Schule (S. 252–266). Münster: Wax-mann.
Mischo, C. & Haag, L. (2006). Hausaufgaben. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (3. überarb. und erw. Auflage) (S. 226–233). Weinheim: Beltz.
Niggli, A., Trautwein, U., Schnyder, I., Lüdtke, O. & Neumann, M. (2007). Elterliche Unterstützung kann hilfreich sein, aber Einmischung schadet. Psychologie in Erziehung und Unterricht, 54 (1), 1–14.
Pomerantz, E. M. & Eaton, M. M. (2001). Maternal intrusive support in the academic context: transactional socialization pro-cesses. Developmental Psychology, 37 (2), 174–186.
Pomerantz, E. M., Wang, Q. & Ng, F. F.-Y. (2005). Mothers’ affect in the homework context: the importance of staying positive. Developmental Psychology, 41 (2), 414–427.
Roßbach, H.-G. (1995). Hausaufgaben in der Grundschule. DDS – Die Deutsche Schule, 87 (1), 103–112.
Schnyder, I., Niggli, A. & Trautwein, U. (2008). Hausaufgabenqualität im Französischunterricht. Zeitschrift für Pädagogische Psychologie, 22 (3–4), 233–246.
Spiel, C., Wagner, P. & Fellner, G. (2002). Wie lange arbeiten Kinder zu Hause für die Schule? Eine Analyse in Gymnasium und Grundschule. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 34 (3), 125–135.
Trautwein, U. (2007). The homework–achievement relation reconsidered: Differentiating homework time, homework frequency and homework effort. Learning and Instruction, 17, 372–388.
Trautwein, U. & Köller, O. (2003a). The relationship between homework and achievement – still much of a mystery. Educational Psychology Review, 15, 115–145.
Trautwein, U. & Köller, O. (2003b). Was lange währt, wird nicht immer gut. Zur Rolle selbstregulativer Strategien bei der Haus-aufgabenerledigung. Zeitschrift für Pädagogische Psychologie, 17 (3/4), 199–209.
Trautwein, U., Köller, O. & Baumert, J. (2001). Lieber oft als viel: Hausaufgaben und die Entwicklung von Leistung und Inter-esse im Mathematik-Unterricht der 7. Jahrgangsstufe. Zeitschrift für Pädagogik, 47 (5), 703–724.
126 Hausaufgaben und deren Bedeutung für die Mathematik- und Leseleistung
Trautwein, U., Köller, O., Schmitz, B. & Baumert J. (2002). Do homework assignments enhance achievement? A multilevel analysis in the 7th grade mathematics. Contemporary Educational Psychology, 27, 26–50.
Trautwein, U., Niggli, A., Schnyder, I. & Lüdtke, O. (2009). Between-differences in homework assignments and the development of students’ homework effort, homework emotions, and achievement. Journal of Educational Psychology, 101 (1), 176 –189.
Trautwein, U., Schnyder, I., Niggli, A., Neumann, M. & Lüdtke, O. (2009). Chameleon effects in homework research: The homework-achievement association depends on the measures used and the level of analysis chosen. Contemporary Educa-tional Psychology, 34, 77–88.
Wagner, P., Hirtenlehner, H., Bacher, J. & Schober, B. (2010). Zeitliche Belastung von Schülern durch die häusliche Arbeit für die Schule. Empirische Pädagogik, 24 (1), 6–25.
Wallner-Paschon, C. & Schneider, P. (2009). Lesesozialisation im Elternhaus. In B. Suchań, C. Wallner-Paschon & C. Schreiner (Hrsg.), PIRLS 2006. Die Lesekompetenz am Ende der Volksschule. Österreichischer Expertenbericht (S. 128–146). Graz: Leykam.
Wild, E. & Gerber, J. (2007). Charakteristika und Determinanten der Hausaufgabenpraxis in Deutschland von der vierten zur siebten Klassenstufe. Zeitschrift für Erziehungswissenschaft, 10 (3), 356–380.
Xu, J. (2011). Homework emotion management at the secondary school level: antecedents and homework completion. Teachers College Record, 113 (3), 529–560.
Xu, J. & Corno, L. (1998). Case studies of families doing third-grade homework. Teachers College Record, 100, 402–436.
Innere Differenzierung im Mathematikunterricht 127
3.2 InnereDifferenzierungim Mathematikunterricht
Ursula Schwantner
Einleitung
Innere Differenzierung gilt als ein zentraler Indikator für die Qualität schulischer Prozesse und wird als wichtiger Bestandteil kompetenzorientierten Unterrichts angesehen (Vogtenhuber et al., 2012). Während das Konzept der Kompetenzorientierung vor allem in den letzten 15 Jahren durch international vergleichende Schülerleistungsstudien und die Entwicklung und Einführung von Bildungsstan-dards in der österreichischen Bildungsforschung an Bedeu-tung gewonnen hat, war innere Differenzierung bereits in den 1960er und 70er Jahren Gegenstand pädagogischer Reformbestrebungen. Grundlegend für das Konzept der inneren Differenzierung sind vor allem Erkenntnisse aus dem Bereich der pädagogischen Psychologie (u. a. basierend auf Entwicklungs-, Motivations-, Kognitions-, Persönlich-keits-, Sozial- und Lernpsychologie – insbesondere konst-ruktivistischen Lerntheorien), die darlegen, dass Lernen ein komplexer individueller Prozess ist, der in Abhängigkeit von Lernvoraussetzungen und unter Einfluss verschiedener Faktoren zu unterschiedlichen Ergebnissen führt. Auch jüngere Ansätze wie die Neurodidaktik betonen die Unter-schiedlichkeit der Lernenden und versuchen, zentrale Faktoren für Lehren und Lernen zu identifizieren sowie zu beschreiben, wie Lernen bei jedem Schüler/jeder Schülerin erfolgreich stattfinden kann (z. B. Braun & Meier, 2006; Roth, 2006). Neurodidaktik fokussiert den Lernprozess der Schüler/innen und unterstützt die Selbstorganisation und das selbstständige Erarbeiten von Lerninhalten – im Gegensatz zur vermittlungsorientierten Didaktik, bei der die Lehrperson die grundlegenden Inhalte erschließt, syste-matisiert und für die Schüler/innen aufbereitet. Laut Roth (2006) muss Wissen „... im Gehirn eines jeden Lernenden neu geschaffen werden“ (ebd., S. 49) und kann nicht über-tragen werden. Die selbsttätige Aneignung von Wissen, die Verknüpfung mit Anwendungsbedingungen und deren adäquate und erfolgreiche Bewältigung in unterschiedlichen Anwendungssituationen und Aufgabenfeldern sind auch
Kernbereiche kompetenzorientierten Unterrichts (vgl. Beer & Benischek, 2011). Innere Differenzierung berücksichtigt dabei die kognitiven, motivationalen und emotionalen Lern - voraussetzungen der Schüler/innen und ermöglicht es ihnen dadurch, die Lernprozesse selbst zu gestalten, zu steuern und sich nach besten Möglichkeiten zu entwickeln.
Die individuelle Förderung eines jeden Kinds ist zudem fester Bestandteil im Grundschullehrplan (BGBl. Nr. 134/ 1963 in der Fassung BGBl. II Nr. 290/2008 vom 12. August 2008, S. 7 f.). Auch in der Verordnung zu den Bildungs-standards wird individuelle Förderung explizit gefordert (BGBl. II, 2009 – Nr. 1, S. 2). Aktuell beschäftigt sich die Initiative SQA (Schulqualität Allgemeinbildung) des BMUKK (n. d.), deren Ziel eine Verankerung von Qua-litätsentwicklung und -sicherung an allgemeinbildenden Schulen ist, mit der „Weiterentwicklung des Lernens und Lehrens in Richtung Individualisierung und Kompetenz-orientierung“ als Rahmenziele für das allgemeinbildende Schulwesen für die Jahre 2012–2016 (BMUKK 2013–14). Die unterschiedlichen Voraussetzungen der Schüler/innen werden dabei als Ansatzpunkte für die Planung der pädago-gischen Qualitätsentwicklung und -sicherung gesehen.
Aufgrund der Wichtigkeit und Notwendigkeit, die dem Thema der inneren Differenzierung beigemessen wird, wurden die PIRLS-TIMSS-2011-Kontextfragebögen in Österreich um Zusatzfragen zur inneren Differenzierung erweitert und die nationale Schwerpunktsetzung zur inneren Differenzierung im Mathematikunterricht aus TIMSS 2007 weitergeführt (vgl. Schwantner, 2010). Somit ist es möglich, die Häufigkeit der Umsetzung bestimmter Differenzierungsmaßnahmen oder das Ausmaß an Lehrer- oder Schülersteuerung im Unterricht zwischen den beiden Erhebungszeitpunkten zu vergleichen.
Der vorliegende Beitrag widmet sich zunächst den Prozess-standards für innere Differenzierung, die beschreiben, was
Konzepte innerer Differenzierung nehmen einen wichtigen Stellenwert bei Reformbestrebungen im Schulsystem ein. Im vorliegenden Abschnitt werden Prozessstandards für innere Differenzierung dargestellt, die den Unterricht von der Planung bis hin zur Leistungsrückmeldung umfassen und die individuellen Lernprozesse der Schüler/innen fokussieren. Anhand von TIMSS-Daten wird analysiert, für wie notwendig Lehrer/innen und Schulleiter/innen innere Differenzie-rung erachten und inwieweit Prozessstandards für innere Differenzierung im Mathematikunterricht in der Volksschule aus Schüler-, Lehrer- und Schulleitersicht umgesetzt werden. Darüber hinaus wird untersucht, ob Unterricht stärker lehrer- oder schülergesteuert durchgeführt wird und wie innere Differenzierung mit Unterrichtssteuerung zusammen-hängt. Die Analysen werden, wo möglich, mit Trendvergleichen zu TIMSS 2007 und Ergebnissen zum Leseunterricht aus PIRLS 2011 ergänzt.
128 Innere Differenzierung im Mathematikunterricht
innere Differenzierung ist und wodurch sich diese äußert. Danach wird anhand der Daten von TIMSS 2011 analy-siert, für wie notwendig Lehrer/innen und Schulleiter/innen innere Differenzierung im Unterricht allgemein erachten, und inwieweit Prozessstandards für innere Differenzierung im Mathematikunterricht in der Volksschule umgesetzt werden. Abschließend wird dargestellt, inwieweit Unter-richt lehrer- oder schülergesteuert durchgeführt wird und ob es einen Zusammenhang zwischen Unterrichtssteuerung und innerer Differenzierung gibt. Sowohl die Einschätzung der Umsetzung als auch der Unterrichtssteuerung wird zwischen den beiden Erhebungszeitpunkten verglichen. Wo es möglich und sinnvoll ist, fließen auch Ergebnisse zum Leseunterricht aus PIRLS 2011 ein (Details zum Leseunter-richt s. Abschnitt 4.1).
Prozessstandards für innere Differenzierung
Die Prozessstandards für innere Differenzierung stellen Grundelemente eines differenzierten Unterrichts dar und beschreiben Verhaltensweisen von Lehrerinnen und Lehrern sowie Unterrichtsmerkmale, die darauf abzielen, die unterschiedlichen Voraussetzungen der Schüler/innen zu berücksichtigen und darauf einzugehen, sodass sich je-der Schüler/jede Schülerin bestmöglich entfalten kann (Schwantner, 2013, S. 61). Sie wurden von Schwantner (2013) aus dem theoretisch fundierten und empirisch über-prüften Modell der inneren Differenzierung von Herber (1983) abgeleitet 1 und mit zentralen Merkmalen innerer Differenzierung aus der Forschungsliteratur abgestimmt. Dass die darin festgelegten Verhaltensweisen und Unter-richtsmerkmale für innere Differenzierung grundsätzlich als „Standard“ erwünscht sind, zeigt eine Übereinstimmung mit den gesetzlichen Rahmenbedingungen für innere Differenzierung im Lehrplan der Volksschule sowie in der Lehrerausbildung (Schwantner, 2013, S. 44 ff.). Mithilfe der Definition der Prozessstandards für innere Differenzie-rung soll dem Problem begegnet werden, welches Altrichter et al. (2009) aufgrund definitorischer Schwierigkeiten orten und folgendermaßen schildern:
Das Phänomen „Individualisierung im Unterricht“2 kann nur anhand verschiedener konkreter Realisierungsformen – also an verschiedenen Modellen „individualisierten Unter-richts“ – untersucht werden; diese sind „komplex“ in dem Sinn, dass sie sich aus unterschiedlichen Kombinationen verschiedener didaktischer Bausteine (und zwar aus solchen, die die Modellkonstrukteur/inn/en [sic] bewusst geplant haben, als auch aus solchen, die während der Realisierung „extemporierend“ hinzugefügt wurden) zusammensetzen (ebd., S. 345).
Die Prozessstandards bilden somit den Rahmen für die Erfassung im Feld. Sie sind in Anlehnung an wesentliche Phasen von Unterricht in vier Bereiche gegliedert: (1) Planen, (2) Diagnostizieren, (3) Erarbeiten und (4) Rückmelden (Schwantner, 2013, S. 61 ff.). Die Bereiche werden im Folgenden näher erläutert.
Planen und Diagnostizieren
Die Bereiche Planen und Diagnostizieren basieren auf den ersten beiden Schritten des Modells der inneren Differen-zierung von Herber (1983): (1) Festlegung und bildungs-theoretische Begründung von Lernzielen und (2) Erfassung der Lernvoraussetzungen der Schüler/innen im Hinblick auf die Erreichbarkeit der Lernziele. Planen und Diagnos-tizieren sind dabei zwei ineinandergreifende Prozesse, die gemeinsam größtmögliche Adaptivität ermöglichen, indem die kognitiven, motivationalen und emotionalen Lernvor-aussetzungen bestmöglich mit den Lernzielen abgestimmt werden. Dabei betont Herber (1983) sowohl die Erfassung der Lernvoraussetzungen der Schüler/innen als auch die selbstreflexive Feststellung der kognitiven und psychologi-schen Voraussetzungen der Lehrkraft (z. B. die Einschät-zung der eigenen fachwissenschaftlichen Kenntnisse, die Re-flexion über das eigene Lehrverhalten, ob gerne unterrichtet wird etc.). Bei der Planung werden die Kompetenzen, die die Schüler/innen vom fachwissenschaftlichen Standpunkt her (in Anlehnung an den Lehrplan) aufbauen sollen, fest-gelegt und in Fundamentum (Grundkompetenzen für alle Schüler/innen) und Additum (Erweiterungskompetenzen zur Entwicklung und Förderung spezifischer Interessen und Begabungen) gegliedert. Herber schafft dabei durch den Bezug auf den Lehrplan explizit eine curriculare Stabilität, die entscheidend für die formale Zuerkennung von Schul-erfolg ist. Bei der Festlegung der Lernziele werden sowohl die kognitiven als auch die motivationalen Lernvorausset-zungen der Schüler/innen berücksichtigt. Möglichkeiten für Schüler/innen, sich selbst aktiv bei der Planung und Auswahl der Unterrichtsinhalte einzubringen, unterstützen dabei die Passung. Am Beginn eines neuen Stoffgebiets werden die kognitiven Lernvoraussetzungen erfasst, um Fehler und Lernschwierigkeiten, die bereits bei der Planung antizipiert wurden, aufzudecken, um darauf entsprechend zu reagieren, mit dem Ziel, dass alle Schüler/innen über die notwendigen Lernvoraussetzungen für ein neues Stoffgebiet verfügen. Die motivationalen und emotionalen Lernvoraus-setzungen wie Interessen, Leistungsmotivation, Attribuie-rung von Erfolg und Misserfolg, Angst, Freude oder Trauer, bis hin zu gruppendynamischen und soziokulturellen Um-weltbedingungen können anhand regelmäßiger Schüler-beobachtungen und aktiver Einbindung der Schüler/innen ermittelt und – entsprechende Kompetenzen der Lehrer/ innen vorausgesetzt – berücksichtigt werden (Herber, 1983).
1 Eine Kurzbeschreibung des Modells der inneren Differenzierung von Herber (1983) findet sich in Schwantner, 2010, S. 192 f.; eine ausführliche Beschreibung in Schwantner, 2013.
2 Individualisierung im Unterricht wird hier synonym mit innerer Differenzierung verstanden.
Innere Differenzierung im Mathematikunterricht 129
Erarbeiten3
Im Mittelpunkt des Bereichs Erarbeiten steht die Selbst-tätigkeit der Schüler/innen, die dem Ablauf von Erarbeiten, Prüfen und Einüben folgt. Folgende Prozesse sind dabei zentral (Schwantner, 2013, S. 63 f.):
�� Neue Problemstellungen/neue Stoffgebiete werden von den Schülerinnen und Schülern – idealerweise anhand (eigens konzipierter) spezifischer Aufgaben, die die wesentliche Struktur der neuen Problemstellung/eines neuen Stoffgebiets repräsentieren – selbstständig er-arbeitet. Die individuellen, unterschiedlichen Lösungen der Schüler/innen werden gesammelt und besprochen sowie festgestellt, ob alle Schüler/innen die neue Pro-blemstellung auf ihre Weise richtig lösen können. Zu-mindest sollten verschiedene Lösungswege gemeinsam erarbeitet werden, sodass jeder Schüler/jede Schülerin eigene Lösungswege entwickeln kann.�� Hilfestellungen durch die Lehrperson sollen anhand
gezielter, direkter, sachbezogener Hinweise in Bezug auf den jeweiligen Lösungsweg des Schülers/der Schü-lerin erfolgen, sodass das Finden einer eigenständigen Lösung angeregt wird.�� Möglichkeiten zur Selbstkontrolle sollen bereitgestellt
werden, um die Selbststeuerung der Schüler/innen zu fördern.�� Eingesetzte Übungsaufgaben sollen anschaulich und
lebensnah sein, um die Schüler/innen anzusprechen. Aufgaben sollen sowohl für das Fundamentum als auch für das Additum und mit unterschiedlichem Schwierig-keitsgrad bereitgestellt werden.�� Die Schüler/innen wählen eigenverantwortlich unter
den angebotenen Aufgaben.�� Freiräume für selbstbestimmtes Arbeiten werden da-
durch geschaffen, indem die Schüler/innen parallel an unterschiedlichen Aufgaben arbeiten, die Sozialform frei wählen können (anstatt einer ausschließlich von der Lehrkraft vorgegebenen Variation der Sozialform) und auch die Aufgabenreihenfolge selbst wählen können. So kann sich jede/jeder in ihrem/seinem Tempo und nach ihren/seinen Fähigkeiten fortbewegen, während die Lehrkraft individuell angepasste Hilfestellungen geben kann.
Rückmelden
Rückmelden ist insofern ein wesentlicher Bestandteil innerer Differenzierung, als es zwei wichtige Funktionen erfüllt: Zum einen liefert Rückmelden Sachinformationen über das Ausmaß, in dem ein Lernziel erreicht wurde; zum anderen hat jede Rückmeldung auch „affektive Begleit-töne“ (Herber, 1983, S. 72) – im Sinne einer Beurteilung, die die Motivation der Schüler/innen und das Vertrauen in
die eigenen Fähigkeiten beeinflusst. In dieser Hinsicht ist es wichtig, dass Rückmeldung sachbezogen (lernziel- und aufgabenbezogen) und unter Heranziehen individueller Bezugsnormen (und nicht sozialer Bezugsnormen) erfolgt. Auf Basis der individuellen Rückmeldung können ge-meinsam Strategien zur Verbesserung und Korrektur von Misserfolgen erarbeitet werden. Die dabei getroffenen individuellen Zielvereinbarungen stellen realistische Erfolge in Aussicht, die den Schülerinnen und Schülern das Ge-fühl geben, die an sie gestellten Anforderungen bewältigen und sich stetig verbessern zu können (Herber, 1983, S. 102; Schwantner, 2013, S. 64).
Prozessstandards für innere Differenzierung im Rahmen von TIMSS 2011
Die konsequente Umsetzung der Prozessstandards in allen vier Bereichen – von der Planung bis zur Leistungsrück-meldung – ergibt eine Unterrichtskonzeption, die die individuellen Lernprozesse der Schüler/innen und den optimalen Lernerfolg eines jeden Schülers/einer jeden Schülerin fokussiert. Die Erhebung der Umsetzung der Prozess standards in allen vier Bereichen wäre jedoch im Rahmen von TIMSS 2011 zu umfangreich gewesen und musste daher beschränkt werden. Der Schwerpunkt wurde auf den Bereich Erarbeiten gelegt, da die Ermöglichung der selbsttätigen Auseinandersetzung mit dem Lernstoff ein wesentliches Element innerer Differenzierung dar-stellt, das zudem als bedeutsam für kompetenzorientierten Unterricht gilt (s. oben). Darüber hinaus können die Maß-nahmen des Bereichs Erarbeiten, die direkt im Unterricht stattfinden, sowohl durch die Befragung der Lehrer/innen als auch der Schüler/innen erfasst werden. Dazu wurden zwei Skalen zur inneren Differenzierung im Mathematik-unterricht aus TIMSS 2007 in etwas gekürzter Fassung in TIMSS 2011 aufgenommen, wodurch es möglich ist, die Umsetzung zwischen den beiden Erhebungszeitpunkten zu vergleichen. Ebenso für einen Trendvergleich wurde die Frage nach dem Ausmaß an Unterrichtssteuerung (Lehrer- vs. Schülersteuerung) aus TIMSS 2007 übernommen. In Anlehnung an die Erfassung der Wichtigkeitsüberzeu-gungen der Lehrer/innen und Schulleiter/innen gegenüber innerer Differenzierung bei TIMSS 2007 wurde bei TIMSS 2011 der Frage nachgegangen, für wie notwendig Lehrer/innen und Schulleiter/innen generell innere Differenzie-rung erachten.
Anmerkungen zur Interpretation der Ergebnisse zum Themenbereich innere Differenzierung
Bei der Interpretation der Ergebnisse der Schulleiter- und Lehrerbefragung ist es wichtig zu berücksichtigen, dass die
3 Der Bereich Erarbeiten basiert auf den Schritten 3 („Prototyp“) und 4 („Diskrimination“) in Herbers Modell der inneren Differenzierung (Herber, 1983).
130 Innere Differenzierung im Mathematikunterricht
TIMSS-Stichprobe repräsentativ für die Ziel-Schüler/innen gezogen wurde und daher die Aussagen der Lehrer/innen und Schulleiter/innen auf die Anteile der Schüler/innen bezogen werden.
Auf Lehrerebene ist zudem zu beachten, dass die Analysen zur inneren Differenzierung allgemein und im Mathematik-unterricht auf den Antworten jener Lehrer/innen beruhen, die den Mathematikteil des TIMSS-Fragebogens ausgefüllt haben.
Notwendigkeit innerer Differenzierung aus Lehrer- und Schulleitersicht
Wichtigkeitsüberzeugungen in Bezug auf innere Differen-zierung spielen für die konkrete Umsetzung im Unterricht eine bedeutende Rolle. TIMSS 2007 zeigte, dass Lehrer/ innen häufiger Maßnahmen zur inneren Differenzierung im Mathematikunterricht umsetzen, je wichtiger diese für sie sind (Schwantner, 2013, S. 116 f.). Bei TIMSS 2011 wurden Lehrer/innen und Schulleiter/innen gebeten ein-zuschätzen, inwieweit sie es für notwendig halten, ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen.
Tabelle 3.2.1 zeigt die Einschätzung der Notwendigkeit innerer Differenzierung aus Lehrersicht. Lehrkräfte von mehr als der Hälfte der Schüler/innen (58 %) geben dabei an, dies für sehr notwendig zu erachten, Lehrkräfte von 41 % antworteten mit „notwendig“. Demnach werden fast alle Schüler/innen in der 4. Klasse Volksschule von einer Lehrkraft unterrichtet, die von der Notwendigkeit, ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen, überzeugt ist.
Auch der Zusammenhang zwischen der Einschätzung der Notwendigkeit innerer Differenzierung durch die Lehrer/innen bei TIMSS 2011 und der Umsetzung im Mathema-tikunterricht ist signifikant (r = .24, p = .000), allerdings deutlich geringer als der Zusammenhang zwischen der Wichtigkeitsüberzeugung und der Umsetzung bei TIMSS 2007 (r = .62, p = .000; s. Schwantner, 2013, S. 116). Dies könnte darin begründet sein, dass die Notwendigkeit bei TIMSS 2011 lediglich mit einer Frage erfasst wurde, wo-hingegen die Frage zur Wichtigkeit im Lehrerfragebogen bei TIMSS 2007 aus 14 Einzelitems bestand, die sich zum Großteil mit spezifischen Maßnahmen des Prozessstandard-bereichs Erarbeiten decken (s. Schwantner, 2013, S. 89 f.).
Die Einschätzung der Notwendigkeit, den Unterricht an die individuellen Lernvoraussetzungen der Kinder anzupassen, ist auch aus Sicht der Schulleiter/innen gegeben. Knapp drei Viertel (74 %) der Schüler/innen besucht eine Schule, deren Leiter/in dies als sehr notwendig erachtet, Schulleiter/innen von einem Viertel der Schüler/innen erachten dies als notwendig (s. Tabelle 3.2.2).
Vergleicht man die Antworthäufigkeiten der Lehrer/innen und Schulleiter/innen, so fällt auf, dass Schulleiter/innen es häufiger als sehr notwendig erachten, den Unterricht an die Lernvoraussetzung der Schüler/innen anzupassen, wohin-gegen Lehrer/innen dies häufiger „nur“ als notwendig beur-teilen. Insgesamt ist jedoch klar feststellbar, dass sowohl ein Großteil der Lehrer/innen als auch der Schulleiter/innen es für erforderlich halten, dass im Unterricht auf die Lern-voraussetzungen der einzelnen Schüler/innen eingegangen wird.
Notwendigkeit innerer Differenzierung aus Lehrersichtsehr
notwendignotwendig
wenig notwendig
gar nicht notwendig
Inwieweit halten Sie es für notwendig, Ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anzupassen?
58 41 0 0
Angaben in Prozent der Schüler/innen
Tabelle 3.2.1: Notwendigkeit innerer Differenzierung aus Lehrersicht (TIMSS 2011)
Notwendigkeit innerer Differenzierung aus Schulleitersicht sehr
notwendignotwendig
wenig notwendig
gar nicht notwendig
Inwieweit halten Sie es für notwendig, dass die Lehrkräfte Ihrer Schule ihren Unterricht an die individuellen Lernvoraussetzungen eines jeden Schülers/einer jeden Schülerin anpassen?
74 25 1 0
Angaben in Prozent der Schüler/innen
Tabelle 3.2.2: Notwendigkeit innerer Differenzierung aus Sicht der Schulleiter/innen (TIMSS 2011)
Innere Differenzierung im Mathematikunterricht 131
Umsetzung innerer Differenzierung im Mathematikunterricht
Im folgenden Abschnitt wird der Frage nachgegangen, wie oft – in Anlehnung an die vorab beschriebenen Prozessstan-dards – spezifische Maßnahmen innerer Differenzierung im Mathematikunterricht in der Volksschule aus Sicht der Schüler/innen und Lehrer/innen umgesetzt werden. Die Ergebnisse können dabei zwischen den zwei Erhebungszeit-punkten TIMSS 2007 und 2011 verglichen werden. Wo es möglich und sinnvoll ist, fließen ergänzend Ergebnisse zum Leseunterricht aus PIRLS 2011 ein. Abschließend wird dargestellt, wie Schulleiter/innen die Umsetzung innerer Differenzierung an ihrer Schule einschätzen.
Umsetzung innerer Differenzierung im Mathematik-unterricht aus Schülersicht
Abbildung 3.2.1 zeigt, wie oft aus Sicht der Schüler/innen Maßnahmen innerer Differenzierung der Prozessstandard-bereiche Erarbeiten und Rückmelden im Mathematikun-terricht vorkommen. Betrachtet man die Verteilung der Antworthäufigkeiten zum Prozessstandardbereich Erarbeiten, fällt auf, dass mehr als die Hälfte der Schüler/innen (61 %) regelmäßig die Gelegenheit bekommen, neue Aufgabenstellungen selbst-ständig zu erarbeiten. In Bezug auf den Umgang mit unter-schiedlichen Lösungswegen ist festzustellen, dass es gängige Praxis ist, dass die Lehrkraft gemeinsam mit den Kindern
verschiedene Lösungswege erarbeitet. Dies ist laut Angabe von 77 % der Schüler/innen regelmäßig der Fall. Dem- gegenüber kommt es seltener vor, dass die Lehrkräfte eigen-ständige Lösungen der Schüler/innen bei einer neuen Auf-gabenstellung besprechen (46 % zumindest in den meisten Stunden). Ein Viertel der Schüler/innen gibt an, dass sie so gut wie nie bei einer neuen Aufgabe gefragt werden, wie sie diese gelöst haben. Maßnahmen, die den Kindern darüber hinaus Freiraum für selbstbestimmtes Arbeiten ermöglichen würden, und die relativ einfach umzusetzen wären, sind die freie Wahl der Sozialform und die freie Wahl der Aufgaben-reihenfolge. Während etwas mehr als die Hälfte der Schüler/innen (54 %) regelmäßig Gelegenheit hat, selbst zu bestim-men, in welcher Reihenfolge Aufgaben bearbeitet werden, kommt die freie Wahl der Sozialform nur sehr selten vor (24 % zumindest in den meisten Stunden). Fast die Hälfte der Kinder gibt an, fast nie aussuchen zu dürfen, ob sie alleine, zu zweit oder in einer kleinen Gruppe arbeiten.
Zum Bereich Rückmelden zeigt das Ergebnis, dass 41 % der Schüler/innen regelmäßig Auskunft über ihren Lernstand bekommen. Fast ein Drittel der Schüler/innen gibt jedoch an, dass die Lehrkraft so gut wie nie mit ihnen bespricht, was sie schon gut können, und was sie noch mehr üben müssen. Für ein weiteres knappes Drittel kommt dies „in einigen Stunden“ vor. Ein sehr ähnliches Ergebnis zeigt dieselbe Frage zum Leseunterricht im Rahmen von PIRLS 20114, wobei die unterschiedlichen Antwortkategorien zu beachten sind (s. Abbildung 3.2.2).
Abbildung 4.3.1: Umsetzung innerer Differenzierung aus Schülersicht (TIMSS 2011)
in den meisten Stunden nie oder fast niein jeder Stunde in einigen Stunden
Bei einer neuen Aufgabe fragt mich die Lehrerin, auf welche Weise ich sie gelöst habe.
Die Lehrerin erarbeitet mit uns verschiedene Wege, wie man eine Aufgabe lösen kann.
Ich darf mir aussuchen, ob ich alleine, zu zweit oder in einer kleinen Gruppe arbeite.
Rückmelden
Die Lehrerin bepricht mit mir, was ich bereits gut kann und was ich noch mehr üben muss.
0% 20 60 80 10040
Erarbeiten
Bei einer neuen Aufgabe darf ich selber probieren, wie das funktioniert.
Wenn mehrere Übungen zu machen sind, darf ich mir aussu-chen, in welcher Reihenfolge ich sie mache (auf einem Arbeitsblatt, im Mathematikbuch).
30 24 1431
43 20 434
12 27 4912
29 24 2325
21 29 2920
22 28 2524
Abbildung 3.2.1 Umsetzung innerer Differenzierung aus Schülersicht (TIMSS 2011)
4 Die Angaben beziehen sich auf die 4670 Schüler/innen, die den Lese-Teil des PIRLS-TIMSS-2011-Schülerfragebogens ausgefüllt haben.
132 Innere Differenzierung im Mathematikunterricht
Abbildung 3.2.2 Rückmeldung zum Lesen aus Schülersicht (PIRLS 2011)
Umsetzung innerer Differenzierung im Mathematik- unterricht aus Schülersicht im Trend
Die etwas ausführlichere Befragung der Schüler/innen zur Umsetzung der Prozessstandards zur inneren Diffe-renzierung im Mathematikunterricht bei TIMSS 2007 zeigte, dass jene Maßnahmen, die den Schülerinnen und Schülern selbstständiges Arbeiten und Freiräume ermög-lichen, im Vergleich zu Maßnahmen, die eine Führung durch die Lehrperson beinhalten, eher selten vorkommen (Schwantner, 2013, S. 92). Bei TIMSS 2011 lässt sich bei allen sechs Items, die auf Freiräume für selbstbestimmtes Arbeiten f okussieren, eine leichte Zunahme bei den beiden Kategorien „in jeder Stunde“ und „in den meisten Stunden“ bei gleichzeitiger leichter Abnahme bei den beiden „negati-ven“ Kategorien feststellen. So ist der Anteil an 10-Jährigen, die „in jeder Stunde“ eine neue Aufgabenstellung selbst erarbeiten dürfen, um acht Prozentpunkte gestiegen. Etwas größer ist auch der Anteil an 10-Jährigen, die zumindest „in den meisten Stunden“ nach ihrem individuellen Lösungs-weg gefragt werden sowie die Sozialform oder die Aufga-benreihenfolge frei wählen dürfen. Ebenso höher ist der Anteil jener Schüler/innen, die angeben, zumindest „in den meisten Stunden“ Rückmeldung über ihren Leistungsstand zu erhalten. Das Erarbeiten verschiedener Lösungswege ge-meinsam mit der Lehrkraft ist hingegen von 2007 auf 2011 etwas zurückgegangen (Schwantner, 2013, S. 94 f.). Dem-nach zeigt sich eine leichte Tendenz, dass Maßnahmen, die eine selbsttätige Auseinandersetzung mit dem Lehrstoff ermöglichen und Freiräume schaffen, häufiger umgesetzt werden. Auch ein Mittelwertvergleich über die sechs kor-respondierenden Items aus TIMSS 2007 und TIMSS 2011 zeigt, dass die Schüler/innen im Jahr 2011 insgesamt häufiger innere Differenzierung erleben als die Schüler/ innen im Jahr 2007 (t = 3.13, p = .000; s. Tabelle 3.2.3). Aufgrund der zugewiesenen Codes für die Ausprägungen (Wert 1 für „in jeder Stunde“ und Wert „4“ für „nie oder fast nie“), bedeutet der geringere Mittelwert im Erhebungs-jahr 2011, dass innere Differenzierung häufiger umgesetzt wird.
Umsetzung innerer Differenzierung im Mathematik-unterricht aus Lehrersicht
Abbildung 3.2.3 zeigt, wie oft nach Angaben der Lehrer/in-nen Differenzierungsmaßnahmen, die den beiden Prozess-standardbereichen Diagnostizieren und Erarbeiten zuge-ordnet sind, im Mathematikunterricht umgesetzt werden. Da bei den Lehrerangaben eine deutliche Tendenz zu den mittleren Antwortkategorien festzustellen ist, wurden die zwei Antwortkategorien, die eine regelmäßige Umsetzung repräsentieren, zu „zumindest in den meisten Stunden“ zusammengefasst, und die beiden Antwortkategorien, die eine weniger regelmäßige Umsetzung repräsentieren, zu „maximal in einigen Stunden“5.
Im Hinblick auf das Diagnostizieren scheint das Erfassen des Vorwissens der Schüler/innen in Bezug auf ein neues Stoffgebiet ein regelmäßiger Bestandteil des Unterrichts zu sein. Mehr als die Hälfte der Schüler/innen werden von einer Lehrkraft unterrichtet, die dies regelmäßig durchführt. Im Hinblick auf lösungswegbezogenes Erarbeiten fällt auf, dass jene Maßnahme am häufigsten zu beobachten ist, die indirekt am meisten Lenkung durch die Lehrkraft erfordert, nämlich das gemeinsame Erarbeiten verschiedener Lösungs-wege. Etwas weniger häufig kommt es vor, dass Lehrer/in-nen den Lösungsweg einzelner Schüler/innen besprechen. Nur ein Viertel der Schüler/innen erhält nach Angaben der Lehrer/innen zumindest in den meisten Stunden Ge-legenheit, eine neue Aufgabenstellung selbst zu erarbeiten, gegenüber 75 %, die dazu maximal in einigen Stunden Ge-legenheit bekommen.
Betrachtet man die strukturellen Maßnahmen zur Schaf-fung von Freiräumen, so wird die freie Wahl der Aufgaben-reihenfolge deutlich öfter und regelmäßiger umgesetzt als die freie Wahl der Sozialform, die nur bei einem Viertel der Schüler/innen regelmäßig umgesetzt wird. Interessant ist, dass sich Schüler/innen im Leseunterricht öfter selbst aus-suchen dürfen, ob sie allein, zu zweit oder in einer kleinen Gruppe arbeiten möchten (40 % zumindest in den meisten Stunden vs. 60 % maximal in einigen Stunden).
0% 20 40 60 80 100%
Meine Lehrerin bespricht mit mir, was ich beim Lesen bereits gut kann und was ich noch mehr üben muss.
Abbildung 4.3.2: Rückmeldung zum Lesen aus Schülersicht (PIRLS 2011)
jeden Tag oder fast jeden Tag
1- bis 2-mal pro Woche
1- bis 2-mal pro Monatnie oder fast nie
22 322324
MW SE
2007 2.54 0.01
2011 2.47 0.02 t-Wert
DIFF 0.07 0.02 3.13
Tabelle 3.2.3: Mittelwertvergleich der Items zur Umsetzung innerer Differenzierung aus Schülersicht zwischen
TIMSS 2007 und TIMSS 2011
5 Die vier Antwortkategorien lauten gleich wie im Schülerfragebogen: in jeder Stunde/in den meisten Stunden/in einigen Stunden/nie oder fast nie.
Innere Differenzierung im Mathematikunterricht 133
Das Ergebnis weist darauf hin, dass im (Mathematik-)Unterricht Maßnahmen vorrangig umgesetzt werden, die eine Lenkung durch die Lehrkraft und ein gemeinsames Vorgehen der Schüler/innen involvieren. Eine ergänzende Frage, die aus dem internationalen PIRLS-Fragebogen-teil auf nationaler Ebene auch für Mathematik eingesetzt wurde, zeigt, dass 86 % der Schüler/innen von einer Lehr-kraft unterrichtet werden, die angibt, die ganze Klasse oft gemeinsam in Mathematik zu unterrichten (s. Abbildung 3.2.4). Im Gegensatz dazu geben Lehrkräfte von weniger als einem Viertel der Kinder an, individuell abgestimmten Mathematikunterricht zu geben. Beim Lesen wird der Unterricht etwas häufiger individuell abgestimmt: gut ein Drittel der Kinder erhält nach Angaben der Lehrer/innen zumindest oft individuell abgestimmten Unterricht, jedoch berichten auch hier Lehrer/innen von 54 % der Kinder, die ganze Klasse oft gemeinsam zu unterrichten (s. Abbildung 3.2.4).
Umsetzung innerer Differenzierung im Mathematik- unterricht aus Lehrersicht im Trend
Beim Vergleich der Ergebnisse zur Umsetzung innerer Differenzierung aus Lehrersicht zwischen den beiden Erhebungszeitpunkten TIMSS 2007 und TIMSS 2011 ist im Gegensatz zur Schülersicht, aus der im Mittel eine leichte Zunahme an innerer Differenzierung hervorgeht, ein leichter Rückgang zu verzeichnen. Am stärksten ist dieser bei der Maßnahme, die Schüler/innen eine neue Aufgabenstellung selbst erarbeiten zu lassen. Setzten diese Maßnahme im Jahr 2007 Lehrer/innen von 34 % der Kinder in den meisten Stunden um, machten dies im Jahr 2011 20 %. Der Rückgang bei den restlichen Maßnahmen be-trägt zwischen minus neun Prozentpunkten (das Vorwissen der Schüler/innen erfassen) und minus 4 Prozentpunkten (den Lösungsweg einzelner Schüler/innen besprechen). Auch der Mittelwertvergleich über die sechs korrespon-
Abbildung 3.2.3: Umsetzung innerer Differenzierung im Mathematikunterricht aus Sicht der Lehrer/innen (TIMSS 2011)
Abbildung 3.2.4: Gemeinsamer Unterricht versus Individualisierung im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)
Abbildung 4.3.3: Umsetzung innerer Differenzierung im Mathematikunterricht aus Sicht der Lehrer/innen (TIMSS 2011)
zumindest in den meisten Stunden maximal in einigen Stunden
Angaben in Prozent der Schüler/innen
Erarbeiten
0% 20 60 80 10040
Diagnostizieren
Das Vorwissen der Schüler/innen in Bezug auf ein neues Stoffgebiet erfassen
Verschiedene Lösungswege für eine Aufgabenstellung mit den Schüler/innen erarbeiten
Den Lösungsweg einzelner Schüler/innen zu einer Fragestellung besprechen
Die Schüler/innen eine neue Aufgabenstellung selbst erarbeiten lassen
Die Schüler/innen aussuchen lassen, ob sie alleine, zu zweit oder in einer kleinen Gruppe arbeiten
Die Schüler/innen aussuchen lassen, in welcher Reihenfolge sie Aufgabestellungen/Übungen bearbeiten (z. B. im Lehrbuch, auf einem Arbeitsblatt)
54 46
50 50
45 55
25 75
49 51
25 75
Abbildung 4.3.4: Gemeinsamer Unterricht versus Individualisierung im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)
mindestens oft maximal manchmal
Angaben in Prozent der Schüler/innen
Mathematikunterricht Leseunterricht
(TIMSS 2011) (PIRLS 2011)
0% 20 60 80 10040 0 20 60 80 10040
Ich unterrichte die ganze Klasse gemeinsam in Mathematik/Lesen
Ich gebe individuell abgestimmten Mathematikunterricht/Leseunterricht
54 46
35 65
86 14
21 79
134 Innere Differenzierung im Mathematikunterricht
dierenden Items aus TIMSS 2007 und TIMSS 2011 zur Umsetzung aus Lehrersicht zeigt eine signifikante Verände-rung zwischen den beiden Erhebungszeitpunkten (t= 4.23, p= .000; s. Tabelle 3.2.4). Da aufgrund der Zuordnung der Codes zu den Antwortkategorien (1 = „in jeder Stunde“, 4 = „nie oder fast nie“) ein geringerer Mittelwert eine höhere Umsetzungshäufigkeit anzeigt, wurde bei TIMSS 2007 aus Sicht der Lehrer/innen insgesamt häufiger diffe-renziert als im Jahr 2011.
MW SE
2007 2.44 0.03
2011 2.57 0.03 t-Wert
DIFF 0.13 0.03 4.23
Tabelle 3.2.4: Mittelwertvergleich der Items zur Umsetzung aus Lehrersicht zwischen TIMSS 2007 und TIMSS 2011
Übereinstimmung der Lehrer- und Schülersicht bei der Umsetzung innerer Differenzierung
Das Ergebnis, dass innere Differenzierung aus Sicht der Lehrer/innen insgesamt abgenommen hat, aber aus Sicht der Schüler/innen häufiger vorkommt, kann zu einem großen Teil durch die geringe Übereinstimmung zwischen Lehrer- und Schülerangaben generell und zum anderen mit den spezifischen Entwicklungen der einzelnen Maßnahmen erklärt werden. Berechnet man das Übereinstimmungs-maß6 zwischen den fünf korrespondierenden Items aus Lehrer- und Schülerfragebogen zur Umsetzung innerer Differenzierung, so zeigt sich, dass die Übereinstimmung bei beiden Erhebungszeitpunkten7 nur gering ist. Die Kappa- Werte liegen je nach Maßnahme zwischen –.008 und .135.
Eine mögliche Erklärung dafür könnte das unterschied-liche Antwortverhalten von Lehrkräften und Schülerinnen/Schülern sein. So tendieren Lehrer/innen bei ihren Anga-ben zu den mittleren beiden Antwortkategorien, während die Schülerangaben mehr über alle vier Antwortkategorien verteilt sind.
Zwei der fünf Maßnahmen wurden bei beiden Erhebun-gen von den Kindern deutlich öfter angegeben als von den Lehrkräften: eine neue Aufgabenstellung selbst erarbeiten sowie verschiedene Lösungswege gemeinsam mit der Lehr-person erarbeiten. Die drei weiteren Maßnahmen werden hingegen von den Lehrkräften öfter und von den Kindern
seltener angegeben. So berichten 49 % der Schüler/innen, dass sie die Sozialform nie oder fast nie frei wählen dürfen, wohingegen die Lehrer/innen von nur 16 % der Kinder an-geben, dies nie oder fast nie zu erlauben. 23 % der Schüler/innen geben an, dass sie sich nie oder fast nie die Reihen-folge der zu bearbeitenden Aufgaben aussuchen dürfen, was von Lehrkräften von nur 7 % der Kinder bestätigt wird. Ähnlich starke Unterschiede zeigen sich auch bei der Be-sprechung individueller Lösungswege. Hier gibt immerhin gut ein Viertel der Kinder an, dass dies nie oder fast nie vor-kommt, während die Lehrkräfte in dieser Antwortkategorie rund 3 % der Kinder repräsentieren.
Betrachtet man die unterschiedliche Entwicklung der Ant-worthäufigkeiten nach Maßnahmen, so fällt dies bei der Maßnahme, Schüler/innen eine neue Aufgabenstellung selbst erarbeiten lassen, am stärksten ins Gewicht: 2011 gibt es bei dieser Maßnahme aus Lehrersicht den stärksten Rückgang (minus 16 Prozentpunkte), während 2011 mehr Schüler/innen angeben, dass dies in jeder Stunde vorkommt (plus 8 Prozentpunkte). Zudem ist bei allen Maßnahmen aus Schülersicht ein leichtes Plus ersichtlich, während aus Lehrersicht bei allen Maßnahmen ein leichter Rückgang festzustellen ist. Einzige Ausnahme ist das Erarbeiten ver-schiedener Lösungswege für eine neue Aufgabenstellung mit den Schülerinnen und Schülern, das sowohl aus Lehrer- als auch aus Schülersicht insgesamt weniger oft umgesetzt wird.
Umsetzung innerer Differenzierung aus Schulleitersicht
Auch die Schulleiter/innen wurden bei TIMSS 2011 um ihre Einschätzung gebeten, inwieweit an ihrer Schule in-dividualisierter Unterricht stattfindet. Abbildung 3.2.5 zeigt, dass mehr als drei Viertel (79 %) der Schüler/innen eine Schule besuchen, deren Leiter/in davon ausgeht, dass Lehrer/ innen den Unterricht an die individuellen Lernvor-
6 Als Maß für die Berechnung der Übereinstimmung zwischen der Umsetzungshäufigkeit aus Lehrer- und Schülersicht wurde Cohens Kappa für verbun-dene Stichproben verwendet. Kappa liegt zwischen –1 und +1. Werte nahe 1 zeigen eine hohe Übereinstimmung in den Aussagen, nahe 0 keine Über-einstimmung und Werte nahe –1 eine hohe Diskrepanz.
7 Für TIMSS 2007 vgl. Schwantner, 2010, S. 199.
Abbildung 3.2.5: Umsetzung innerer Differenzierung im Volksschulunterricht (TIMSS 2011)
0 % 20 40 60 80 100 %
Inwieweit passen die Lehrkräfte Ihrer Schule den Unterricht tatsächlich an die individuellen Lernvoraussetzungen der
Schüler/innen an?
in jeder oder fast jeder Klasse
in ungefähr der Hälfte der Klassen
Angaben in Prozent der Schüler/innen; Werte unter 1 % nicht eingetragen
in einigen Klassenin keiner Klasse
16 579
Innere Differenzierung im Mathematikunterricht 135
aussetzungen der Schüler/innen anpassen. 16 % gehen da-von aus, dass dies in ca. der Hälfte der Klassen umgesetzt wird, 5 % in einigen Klassen. Die Erwartungen der Schul-leiter/innen an die Umsetzung innerer Differenzierung sind damit durchaus hoch.
Unterrichtssteuerung
Im Folgenden wird das Ausmaß an Lehrer- und Schüler-steuerung im Unterricht dargestellt und analysiert, ob diffe-renzierter Unterricht mehr lehrer- oder schülergesteuert ist.
Differenzierter Unterricht, der auf den Lernprozess der Schüler/innen fokussiert und selbstständiges Arbeiten er-möglicht, setzt eine gute Balance aus Lehrer- und Schüler-steuerung voraus. Bezugnehmend auf die zu Beginn definier-ten Prozessstandards findet Lenkung durch die Lehrkraft im differenzierten Unterricht vor allem auf Basis der Festlegung und Gliederung der Lernziele in Fundamentum und Addi-tum – in Abstimmung mit den kognitiven und motivatio-nalen Lernvoraussetzungen der Schüler/innen – statt. Laut Herber (1983) ist es dabei wichtig, die Schüler/innen aktiv in die Planung einzubeziehen. Der Prozessstandardbereich Erarbeiten ist hingegen durchgehend von der Selbsttätigkeit der Schüler/innen gekennzeichnet, wobei die Lehrkraft mit gezielten Hilfestellungen und bereitgestellten Arbeitsauf-gaben den Lernprozess unterstützt. Eine adäquate Rückmel-dung wiederum gibt den Kindern Informationen darüber, was sie bereits gut können und wo noch Lernbedarf ist.
Im Rahmen von TIMSS 2011 und 2007 wurden die Leh-rer/innen gebeten, auf einer sechsstufigen Skala die Art der Unterrichtssteuerung einzuschätzen (1 = lehrergesteuert, 6 = schülergesteuert). Im Fragebogen wurde mit „lehrer-gesteuert“ ein Unterricht beschrieben, der ein fixes Lern-programm für alle Schüler/innen gleichermaßen vorsieht und dabei keine Wahlmöglichkeiten bietet und bei dem die ganze Klasse gemeinsam von Teilziel zu Teilziel geht. Als „schülergesteuert“ wurde ein Unterricht beschrieben, bei dem die Schüler/innen aus einem Angebot frei wählen
können, wie z. B. Themen, Materialien, die Sozialform oder das individuelle Lerntempo.
Abbildung 3.2.6 zeigt das Ausmaß an Lehrer- bzw. Schüler-steuerung im österreichischen Mathematikunterricht bei TIMSS 2011. Es zeigt sich, dass Mathematikunterricht in der Volksschule eher lehrergesteuert durchgeführt wird (69 % in den Kate-gorien 1–3). Knapp ein Drittel der Schüler/innen wird von einer Lehrkraft unterrichtet, die mehr zu Schülersteuerung tendiert. Vergleicht man – im Sinne einer ausgewogenen Balance aus Lehrer- und Schülersteuerung auf Basis der Prozessstandards – nur die beiden mittleren Antwortkate-gorien (3 und 4), so ist auch hier die deutliche Mehrheit auf Seiten der Lehrersteuerung ersichtlich (26 % gegenüber 11 % Schülersteuerung). Die Berechnungen wurden auch mit den PIRLS-Daten zum Leseunterricht durchgeführt und zeigen ein übereinstimmendes Ergebnis.
Unterrichtssteuerung in Mathematik im Trend
Da die Unterrichtssteuerung sowohl bei TIMSS 2007 als auch bei TIMSS 2011 erhoben wurde, können die Ergeb-nisse zwischen den beiden Erhebungszeitpunkten ver glichen werden. Dabei zeigen sich nur sehr kleine Veränderungen in den Antwortverteilungen über die sechs Stufen, die durch zufällige Schwankungen bedingt und statistisch unbedeu-tend sind. Auch der Mittelwertvergleich8 (s. Tabelle 3.2.5) zeigt keine statistisch signifikante Veränderung.
MW SE
2007 2.44 0.03
2011 2.57 0.03 t-Wert
DIFF 0.13 0.03 4.23
0 20 40 60 80 100
Lehrersteuerung
Angaben in Prozent der Schüler/innen
Schülersteuerung
Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich
Wert 1: stark lehrergesteuert Wert 2 Wert 3 Wert 5 Wert 6: stark schülergesteuertWert 4
Abbildung 4.3.5: Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich (TIMSS 2011)
43 9 2205 21
Abbildung 3.2.6: Lehrer- vs. Schülersteuerung im Mathematikunterricht in Österreich (TIMSS 2011)
8 Auf der sechsstufigen Skala steht 1 für „lehrergesteuert“ und 6 für „schülergesteuert“. Je höher der Mittelwert ist, desto mehr Schülersteuerung liegt vor.
Tabelle 3.2.5: Mittelwertvergleich der Unterrichtssteuerung aus Lehrersicht zwischen TIMSS 2007 und TIMSS 2011
136 Innere Differenzierung im Mathematikunterricht
Unterrichtssteuerung und innere Differenzierung
Im Folgenden wird analysiert, wie sich der Zusammenhang zwischen innerer Differenzierung und Unterrichtssteuerung im Mathematikunterricht gestaltet.
Sowohl bei TIMSS 2011 als auch bei TIMSS 2007 zeigt sich – nach der oben vorgenommenen Definition erwar-tungskonform –, dass eine höhere Umsetzungshäufigkeit von innerer Differenzierung im Mathematikunterricht mit einer stärkeren Schülersteuerung einhergeht9. Der Zusam-menhang ist dabei bei TIMSS 2007 um einiges stärker (r = –.44, p = .000) als bei TIMSS 2011 (r = –.28, p = .000). Dies lässt sich zum Großteil dadurch begründen, dass die Skala zur Umsetzung innerer Differenzierung aus Lehrersicht bei TIMSS 2007 insgesamt 14 Items umfasste, von denen bei TIMSS 2011 nur sechs eingesetzt wurden10.
Selbstständiges Arbeiten im Mathematik- und Leseunterricht
Ergänzend zur Frage nach der Unterrichtssteuerung sind auch die Ergebnisse auf die Frage, wie oft Schüler/innen selbstständig arbeiten11, interessant. Dabei wurde unter-schieden, ob die Kinder nach einem festgelegten Plan/ einer festgelegten Zielvorgabe arbeiten oder selbstständig auf ein selbst gewähltes Ziel hinarbeiten. Wie vorab beschrieben, sind im Sinne der Prozessstandards beides adäquate Möglichkeiten, je nachdem, zu welchem Zeitpunkt (z. B. während der Planung oder der Erarbeitung) und wie die Lenkung erfolgt (z. B. durch Festlegung und Kommunika-tion der Fundamentums- und Additumsziele, gezielte Hilfe-stellungen bei individuellen Lösungsmöglichkeiten etc.).
Abbildung 3.2.7 zeigt die Ergebnisse zur Frage nach den Zielvorgaben bei selbstständigem Arbeiten getrennt für den Mathematik- und den Leseunterricht. Laut Angaben der Lehrer/innen ist dabei die überwiegende Form des selbst-ständigen Arbeitens durch einen festgelegten Plan oder eine festgelegte Zielvorgabe gelenkt. Gelegenheit, auf ein selbst gewähltes Ziel hinzuarbeiten, bieten Lehrkräfte im Mathe-matikunterricht von 17 %, im Leseunterricht von mehr als einem Drittel der Schüler/innen regelmäßig. Insgesamt kommen im Leseunterricht beide Formen des selbstständi-gen Arbeitens etwas häufiger vor. Abgesehen von den Zielvorgaben, die dem Prozessstan-dardbereich Planen zugeschrieben werden können, ist für das selbstständige Arbeiten wichtig, dass auch die Prozess-standards der Bereiche Diagnose, Erarbeiten und Rück-meldung umgesetzt werden. Nur über die Vernetzung aller vier Bereiche wird sichergestellt, dass (a) alle Schüler/innen über die kognitiven Voraussetzungen (z. B. Vorwissen) ver-fügen, um die Anforderungen selbstständig bewältigen zu können, (b) es adäquate Aufgaben gibt, die das selbststän-dige Erarbeiten eines Stoffgebiets durch die Schüler/innen unterstützen, (c) individuelle Lösungswege ermöglicht und besprochen werden, (d) genügend Freiräume geschaffen werden (z. B. freie Wahl der Sozialform, Selbstkontrolle), (e) die Schüler/innen über ihren Lernstand informiert sind (z. B. regelmäßiges sachbezogenes Feedback, das sich am individuellen Referenzrahmen orientiert) und ihren Lernprozess zunehmend eigenständig und selbstbestimmt gestalten können.
9 Aufgrund der vergebenen Codes für die Antwortkategorien (1 = „in jeder Stunde“ und 4 = „nie oder fast nie“) bei der Frage nach der Umsetzung innerer Differenzierung bedeuten geringere Werte eine höhere Umsetzungshäufigkeit. Bei der Unterrichtssteuerung zeigen höhere Werte eine stärkere Schüler-steuerung an. Demnach bedeutet das negative Vorzeichen bei der Korrelation, dass niedrigere Werte bei der inneren Differenzierung (höhere Umset-zungshäufigkeit) mit höheren Werten bei der Steuerung (mehr Schülersteuerung) einhergehen, bzw. höhere Werte bei der inneren Differenzierung (ge-ringere Umsetzungshäufigkeit) mit niedrigeren Werten bei der Unterrichtssteuerung (mehr Lehrersteuerung).
10 Bei TIMSS 2007 wurde der Faktor zur Umsetzung innerer Differenzierung aus Lehrersicht aus 14 Items gebildet. Der Faktor klärt 34 % der Varianz auf und die Reliabilität beträgt .85 (Cronbachs Alpha). Bei TIMSS 2011 wurde der Faktor zur Umsetzung innerer Differenzierung aus Lehrersicht aus sechs Items gebildet. Der Faktor klärt 43 % der Varianz auf. Die Reliabilität beträgt .72 (Cronbachs Alpha). Bei beiden Faktoren entsprechen aufgrund der vergebenen Codes für die Antwortkategorien (1 = „in jeder Stunde“; 4 = „nie oder fast nie“) niedrigere Werte einer höheren Umsetzungshäufigkeit.
11 Diese Frage war Teil des internationalen PIRLS-Lehrerfragebogens und wurde auf nationaler Ebene auch für TIMSS (nur für den Mathematikunterricht) übernommen.
Abbildung 4.3.7: Selbstständiges Arbeiten im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)
mindestens oft maximal manchmal
Mathematikunterricht Leseunterricht
(TIMSS 2011) (PIRLS 2011)
0% 20 60 80 10040 0 20 60 80 10040
Die Schüler/innen arbeiten selbstständig nach einem festgelegten Plan oder einer Zielvorgabe.
Die Schüler/innen arbeiten selbstständig auf ein selbst gewähltes Ziel hin.
Angaben in Prozent der Schüler/innen
65 35
35 65
59 41
17 83
Abbildung 3.2.7: Selbstständiges Arbeiten im Mathematikunterricht (TIMSS 2011) und im Leseunterricht (PIRLS 2011)
Innere Differenzierung im Mathematikunterricht 137
Resümee
Die vorliegenden Ergebnisse zum Mathematikunterricht bei TIMSS 2011 zeigen, dass innere Differenzierung aus Sicht der Lehrer/innen und Schulleiter/innen als notwendig erachtet wird. Die Erwartungen der Schulleiter/innen an die Umsetzung innerer Differenzierung sind dabei durch-aus hoch. So gehen Schulleiter/innen überwiegend davon aus, dass Lehrer/innen den Unterricht an die individuellen Lernvoraussetzungen der Schüler/innen anpassen.
Hinsichtlich der Umsetzung innerer Differenzierung im Mathematikunterricht in der vierten Klasse Volksschu-le geben die Ergebnisse der Schüler- und Lehrerbefra-gung einen guten Überblick. Generell ist zur Umsetzung der Prozessstandards anzumerken, dass es schwierig ist, ein einheitliches Maß dafür festzulegen, ab welcher Um-setzungshäufigkeit ein Prozessstandard als „erfüllt“ gilt. So wird beispielsweise das Vorwissen der Schüler/innen in Bezug auf ein neues Stoffgebiet wohl immer erfasst, bevor ein neues Stoffgebiet begonnen wird. Eine neue Aufgabenstellung wird nur so oft selbstständig erarbei-tet werden, wie es auch eine neue Aufgabenstellung gibt. Unter der Annahme, dass die Prozessstandards ein um-fassendes Unterrichtskonzept repräsentieren, sollten je-doch alle Maßnahmen zumindest in den meisten Stunden vorkommen. Darauf bezogen zeigen die Ergebnisse zur Umsetzung der inneren Differenzierung, dass zentrale Pro-zessstandards der Bereiche Erarbeiten und Rückmelden – eine selbsttätige Auseinandersetzung mit dem Lernstoff (z. B. selbstständiges Erarbeiten einer neuen Aufgabenstel-lung, eigenständige Lösungswege besprechen), Freiräume für selbstbestimmtes Arbeiten (z. B. durch die freie Wahl der Sozialform) und eine regelmäßige systematische Leis-tungsrückmeldung – noch nicht hinreichend erfüllt sind.
Zudem wird die überwiegende Mehrheit der Schüler/in-nen in Mathematik von einer Lehrkraft unterrichtet, die angibt, die ganze Klasse meistens gemeinsam zu unter-richten. Schüler/ innen, die laut Angaben der Lehrer/innen individuell abgestimmten Unterricht erhalten, sind dem - gegenüber – sowohl im Mathematik- als auch im Lese-unterricht – in der Minderzahl. Dies deckt sich mit den Angaben der Volksschullehrerbefragung im Rahmen der Bildungsstandard-Baseline-Testung in der vierten Klasse im Jahr 2010 in Österreich. Auch hier zeigt sich, dass die Mehrheit der Kinder in der Gesamtgruppe unterrichtet wird, wenngleich diese Unterrichtsform laut Angaben der Autorinnen und Autoren zugunsten angeleiteter Kleingrup-pen-, Partner- und Einzelarbeit zurückgeht (Vogtenhuber et al., 2012, S. 80).
Auffallend ist das Ergebnis, dass innere Differenzierung zwischen den zwei Erhebungszeitpunkten TIMSS 2007 und 2011 aus Sicht der Schüler/innen zugenommen hat, wohingegen diese aus Lehrersicht etwas zurückgegangen ist. Aus Schülerperspektive ist dabei vor allem in Bezug auf
Maß nahmen, die Freiräume schaffen und selbstständiges Arbeiten ermöglichen, eine positive Entwicklung festzu-stellen. Die divergierende Entwicklung aus Schüler- und Lehrersicht kann zum Großteil durch generelle Divergenzen in den Schüler- und Lehrerangaben erklärt werden. Dazu ist kritisch anzumerken, dass es sich bei beiden um subjektive Einschätzungen handelt, die nicht überprüft wurden bzw. im Rahmen der vorliegenden Untersuchung auch nicht überprüft werden konnten (z. B. anhand von Verhaltensbe-obachtungen). Vor allem bei der Selbstauskunft der Lehrer/innen über die Häufigkeit der Umsetzung (aber auch bei der Einschätzung der Wichtigkeit von innerer Differen-zierung und der Vorbereitung auf innere Differenzierung) kann nicht ausgeschlossen werden, dass diese einer sozial erwünschten Bewertung unterliegt. Die in den Ergebnis-sen ersichtliche Tendenz im Antwortverhalten der Lehrer/innen zu den mittleren Antwortkategorien unterstützt diese Annahme. Eine Möglichkeit, das Ausmaß sozial erwünschen Antwortverhaltens zu kontrollieren, würde die Einbindung begleitender Dokumentenanalysen (z. B. klas-senweise Durchsicht der angebotenen Aufgaben und der Unterrichtspläne) in die Erhebung bieten.
Hinsichtlich Unterrichtssteuerung konnte festgestellt wer-den, dass diese überwiegend von der Lehrkraft ausgeht, obgleich in der Anregung der Selbststeuerung und Selbst-tätigkeit der Schüler/innen ein großes Potenzial für mehr innere Differenzierung liegt, indem die Schüler/innen zunehmend zu Expertinnen und Experten ihres eigenen Lernprozesses werden. Diesbezüglich konnte auch keine Weitere ntwicklung im Vergleich zur Erhebung im Jahr 2007 festgestellt werden. Bezüglich Lenkung bei selbst-ständigem Arbeiten zeigt sich, dass dies überwiegend durch einen festgelegten Plan oder eine festlegte Zielvorgabe durch die Lehrkraft geschieht. Gelegenheit, auf ein selbst-gewähltes Ziel hinzuarbeiten, gibt es nur für sehr wenige Schüler/innen. Dieses Ergebnis entspricht jenem der Volks-schullehrerbefragung im Rahmen der Bildungsstandard-Baseline- Testung 2010: Laut Angaben der Lehrer/innen kommen auch hier Maßnahmen wie das selbstständige Arbeiten nach einer Zielvorgabe (z. B. Wochenplan) viel häufiger vor, als dass die Schüler/innen aus einer Auswahl von Lernzielen eines wählen, auf das sie selbstständig hin-arbeiten (Vogtenhuber et al., 2012, S. 81).
Insgesamt zeigen die Ergebnisse, dass innere Differenzie-rung – bezogen auf die Prozessstandards – noch nicht hin-reichend umgesetzt wird. Aufgrund der Begrenztheit der Fragebogenerhebung ist es jedoch schwierig festzustellen, inwieweit innere Differenzierung überhaupt als Gesamt-konzept – von der Planung und Vorbereitung, über die Diagnose und das Erarbeiten bis hin zur Leistungsrück-meldung – realisiert wird. Die vorliegenden Daten geben vielmehr Auskunft über die Umsetzungshäufigkeit verschie-dener Maßnahmen. In diesem Zusammenhang kommen auch Bohl, Batzel & Richey (2012) nach Sichtung diverser Forschungsbefunde aus Deutschland zum Thema Binnen-
138 Innere Differenzierung im Mathematikunterricht
differenzierung zu dem Schluss: „Die Forschungslage macht deutlich, dass innerhalb einer gewissen methodischen Viel-falt – zumeist aus der Perspektive befragter Lehrkräfte – durchaus differenziert wird. Inwiefern Differenzierungs-maßnahmen in den realen Mikroprozessen des Unterrichts (z. B. Aufgaben) realisiert werden, kann derzeit nicht um-fassend geklärt werden“ (S. 54). In dieser Hinsicht geben die Befragungen über die Prozessstandards der inneren Differenzierung im Mathematikunterricht bei TIMSS 2007
und TIMSS 2011 zumindest einen guten Überblick über den Ist-Stand der inneren Differenzierung in der Volks-schule. Für eine zuverlässigere und validere Erfassung im Sinne einer Umsetzung der Prozessstandards als umfassende Unterrichtskonzeption wären zuzüglich zur Befragung der Lehrer/innen und Schüler/innen systematische Unterrichts-beobachtungen, ergänzt durch Dokumentenanalysen, not-wendig.
Literatur
AltrichterH.,TrautmannM.,WischerB.,SommerauerS.&Doppler,B. (2009).Unterrichten inheterogenenGruppen:DasQualitätspotenzialvonIndividualisierung,DifferenzierungundKlassenschülerzahl.InW.Specht(Hrsg.),Nationaler Bildungsbe-richt Österreich 2009. Band 2. Fokussierte Analysen bildungspolitischer Schwerpunktthemen(341–360).Graz:Leykam.
Beer,R.&Benischek,I.(2011).AspektekompetenzorientiertenLernensundLehrens.InBIFIE(Hrsg.),Kompetenzorientierter Unterricht in Theorie und Praxis(5–28).Graz:Leykam
BMUKK(n.d.).SQA–SchulqualitätAllgemeinbildungdesBMUKK.Zugriffam27.08.2013unterhttp://www.bmukk.gv.at/schulen/schubf/se/sqa.xml
BMUKK (2013–14). Rundschreiben des Bundesministeriums für Unterricht, Kunst und Kultur Rundschreiben: 2013–14 ;BMUKK-20.300/0080-I/4/2013 ;SQA–SchulqualitätAllgemeinbildung:Richtlinien für dasSchuljahr 2013/14. Zugriff am 02.09.2013unterhttp://www.bmukk.gv.at/ministerium/rs/2013_14.xml
Bohl,T.,Batzel,A.&Richey,P.(2012).Öffnung–Differenzierung–Individualisierung–Adaptivität.Charakteristika,didaktischeImplikationenundForschungsbefundeverwandterUnterrichtskonzeptezumUmgangmitHeterogenität.InT.Bohl,M.Bönsch,M.Trautmann&B.Wischer (Hrsg.),Binnendifferenzierung. Teil 1: Didaktische Grundlagen und Forschungsergebnisse zur Binnendifferenzierung im Unterricht(40–69).ImmenhausenbeiKassel:Prolog-Verlag.
Herber,H.-J.(1983).Innere Differenzierung im Unterricht.Stuttgart:Kohlhammer.
Schwantner, U. (2010). Differenzierende Maßnahmen im Mathematikunterricht. In B. Suchan, S. Wallner-Paschon & C.Schreiner(Hrsg.),TIMSS 2007. Mathematik & Naturwissenschaft in der Grundschule. Österreichischer Expertenbericht(192–206).Graz:Leykam.
Schwantner,U.(2013).EntwicklungvonProzessstandardsfürinnereDifferenzierungundderenÜberprüfungimMathematik-unterrichtinder4.Schulstufe.UnveröffentlichteDissertation:UniversitätSalzburg
Vogtenhuber,S.,Lassnigg,L.,Bruneforth,M.,Gumpoldsberger,H.,Toferer,B.,Schmich,J.,Schwantner,U.,Bergmüller,S.&Eder,F.(2012).IndikatorenC:Prozesse.InM.Bruneforth&L.Lassnigg(Hrsg.),Nationaler Bildungsbericht Österreich 2012, Band 1: Das Schulsystem im Spiegel von Daten und Indikatoren(61–110).Graz:Leykam.
Kommentar zu: Innere Differenzierung im Mathematikunterricht 139
Zur gegenwärtigen Dynamik im Kontext dieser Thematik
In der gegenwärtigen schulpädagogischen und didakti-schen Diskussion, die großflächig betrachtet durch Begriffe wie Bildungsstandards, teilstandardisierte Reifeprüfung oder SQA1 beeinflusst wird, haben didaktische Desiderate wie „Kompetenzorientierung im Unterricht“ (vgl. Beer & Benischek, 2011; Paechter, 2012) oder Prinzipien wie „innere Differenzierung im Unterricht“ (vgl. Altrichter et al., 2009) bisweilen keinen „leichten Stand“: Sehr schnell wähnen sich Lehrpersonen – wie einschlägige Erfahrungen des Autors aus zahlreichen Fortbildungssituationen zeigen – in einer antinomischen Situation: Die Perspektive, dass Ab-schlussprüfungen (zum Teil) zentral gesteuert und standar-disiert ablaufen, löst bei manchen Lehrpersonen Ängste und Befürchtungen aus; so sind Lehrpersonen bisweilen verunsi-chert, ob ihre Schülerinnen und Schüler bei starker Indivi-dualisierung des Unterrichts (d. h. wenn ihre individuellen Interessen, ihre persönlich bevorzugten Arbeitsformen etc. im Unterricht im Vordergrund stehen) den Anforderungen von (auch) external gesteuerten Prüfungssettings gewach-sen sind. Die Kompetenz, beide Entwicklungen (nationales Monitoring, Standardisierung sowie Externalisierung einer-seits und Kompetenzorientierung s owie Differenzierung im Unterricht andererseits) komplementär zu begreifen (vgl. Hofmann, 2011; Racherbäumer & Kühn, 2013) und damit als Lehrperson handlungsfähig zu bleiben, ist derzeit als ein wichtiges Fortbildungsthema zu betrachten, weil Lehrper-sonen hier eigenen Angaben zufolge Unterstützungsbedarf haben.
Im Kontext des hiesigen Kommentars stellt sich freilich die Frage, in welchem Ausmaß auch Lehrpersonen der Volks-schule von dieser widersprüchlichen Dynamik betroffen sind; die Tatsache, dass Bildungsstandard-Überprüfungen
jeweils gegen Ende der 4. Schulstufe stattfinden, mag aber die einleitenden Überlegungen auch für diese Zielgruppe als relevant erscheinen lassen2; eine mögliche Konsequenz im Hinblick auf das Antwortverhalten in Befragungen zum Thema „innere Differenzierung“ könnte darin bestehen, dass sich Lehrpersonen durch die derzeitige Entwicklung in ihrer Bereitschaft zur Umsetzung von Maßnahmen innerer Differenzierung gebremst fühlen.
Interpretation einiger Diskrepanzergebnisse vor dem Hintergrund der gegenwärtigen Dynamik
Zur Diskrepanz zwischen Lehrer- und Schülereinschätzungen
U. Schwantner widmet in ihrem Beitrag der Frage der Über-einstimmung der Lehrer- und Schülersicht bei der Umset-zung innerer Differenzierung breiten Raum: Sie kommt zum Ergebnis, dass Schüler/innen ein positiveres Bild im Hinblick auf die Häufigkeit der Realisierung von Maßnah-men innerer Differenzierung zeichnen als die Lehrpersonen; ein detaillierter Blick zeigt dabei, dass diese Diskrepanz insbesondere bei der Frage nach der Vielfalt von möglichen Lösungswegen („verschiedene Lösungswege gemeinsam mit der Lehrperson erarbeiten“) und bei der Frage nach dem Ausmaß an Eigenständigkeit bei der Lösungsfindung („eine neue Aufgabenstellung selbst erarbeiten“) existiert. Vor dem Hintergrund der einleitend geäußerten Dynamik könnte diese Diskrepanz folgendermaßen interpretiert werden: Die Ängste von Lehrpersonen, ihre Schüler/innen würden bei der Überprüfung der Bildungsstandards schlecht ab-schneiden, zeitigen die didaktische Konsequenz, dass Viel-falt zurückgefahren wird, weil Lehrpersonen befürchten
Kommentarzu3.2:InnereDifferenzierungimMathematikunterrichtFranz Hofmann
In diesem Kommentar wird der Befund zum Status quo innerer Differenzierung im Mathematikunterricht in der Volks-schule vor dem Hintergrund gegenwärtiger bildungspolitischer Trends beleuchtet; angesichts der Tatsache, dass manche Lehrpersonen diese Trends (Standardisierung und Zentralisierung vs. Appell zur Individualisierung) als nur schwer vereinbar erachten, wird darüber reflektiert, in welchem Ausmaß sich daraus resultierende Unsicherheiten in den Daten spiegeln. Weiterführende Überlegungen betreffen die Frage, welche forschungsmethodischen Implikationen sich für ähn-liche zukünftige Vorhaben ableiten lassen, damit ein qualitätsvoller Befund zur Frage der tatsächlichen Unterrichtsqua-lität in österreichischen Klassenzimmern erstellt werden kann.
1 Vgl. die entsprechende ministerielle Website zu „Schulqualität Allgemeinbildung“ (SQA) unter http://www.sqa.at/ (Zugriff vom 14.10.2013).2 Zudem sei an dieser Stelle angemerkt, dass die Lehrpersonen in der 4. Klasse Volksschule auch an der Entscheidung bezüglich der weiteren Schullaufbahn
ihrer Schülerinnen und Schüler beteiligt sind (im Hinblick auf die mögliche Zuerkennung der AHS-Reife; vgl. Eder & Thonhauser, 2006).
140 Kommentar zu: Innere Differenzierung im Mathematikunterricht
könnten, dass bestimmte Schüler/innen dadurch verwirrt werden und deshalb einheitlich klar auf der Tafel demons-trierte Lösungswege zu bevorzugen seien; eine weitere Konsequenz kann darin gesehen werden, dass die betref-fenden Lehrpersonen weniger auf Eigenständigkeit setzen, weil eine solche ja im Klassen plenum zu einer großen Viel-falt an Lösungsvorschlägen führen würde, folgte man der Empfehlung von Herber, dass die Lehrperson unkommen-tiert Lösungsvorschläge an der Tafel sammeln und erst in weiterer Folge – ohne Bezug auf die jeweiligen Urheber/innen des Lösungsvorschlags – unter Qualitätsdimensionen miteinander vergleichen sollte (vgl. Herber, 1983). Zu dieser Interpretation würde auch ein weiteres, allerdings umgekehrt gerichtetes Diskrepanzergebnis passen: Die befragten Schüler/innen berichten in geringerem Ausmaß als die Lehrpersonen, die Reihenfolge in der Aufgabenbe-arbeitung selbst bestimmen zu dürfen oder die Sozialform frei wählen zu dürfen; diese didaktischen Konzessionen sind – im Vergleich zur im Unterricht zugelassenen Viel-falt an Denkwegen – aus der Perspektive der Lehrperson als weniger risikoreich anzusehen. Ein weiterer Diskrepanzbe-fund, dass nämlich Schüler/innen vergleichsweise seltener be-richten, ihre Lehrpersonen würden Lösungswege individuell mit ihnen besprechen, könnte sich so auch erklären lassen (wo-bei bei dieser Erklärung den Schülerinnen und Schülern die realitätsgerechteren Antworten zuzuschreiben wären): Wenn die Ermöglichung individueller Vielfalt von Lehrpersonen zugunsten eines plenarartigen Erarbeitens von (exemplari-schen) Lösungen zurückgenommen wird, braucht es auch nicht mehr (so) viel Zeit zur Besprechung individuell gene-rierter Lösungen, weil es davon immer weniger gibt. Eine Bestätigung erfährt diese Interpretation durch die von U. Schwantner berichteten Ergebnisse zur Frage, in welchem Ausmaß die befragten Volksschullehrer/innen „lehrer-“ oder aber „schülergesteuert“ unterrichten, wobei das Ergeb-nis für den Mathematikunterricht zu zwei Dritteln in die erst genannte Richtung geht; der für den Zeitraum zwischen 2007 und 2011 errechnete Trend zeigt hier übrigens keine statistisch bedeutsamen Veränderungen.
Diskrepanz zwischen Ideal und Realität bei Erziehungszielen
So kann mit einem Blick auf die hohe Wertschätzung, die Lehrpersonen für die Notwendigkeit innerer Differen-zierung im Unterricht empfinden (alle Befragten halten es Schwantner zufolge für sehr notwendig oder zumindest notwendig, ihren Unterricht an die Voraussetzungen der Schüler/innen zu adaptieren [99 %]), festgehalten werden, dass es im Hinblick auf dieses didaktische Prinzip auch eine
intrapersonale Diskrepanz gibt, wie eine Synopse mit den von den Lehrpersonen berichteten Unterrichtsaktivitäten zeigt: Hier ist man von 99 %-Angaben, eine einschlägige Maßnahme „zumindest in den meisten Stunden“ zu rea-lisieren, sehr weit entfernt; die Zustimmungsraten liegen da in einem Spektrum zwischen 54 % und 25 %. Auch dieser Befund ist nicht neu, wenn man ihn in einen Kon-text zu Erziehungszielbefragungen – insbesondere im Zu-sammenhang mit der Dualität zwischen Heteronomie- und Autonomiezielen – setzt (vgl. Patry & Hofmann, 1998): Lehrpersonen können sich sehr für Autonomieziele begeistern; wenn es aber um deren Realisierung in einer bestimmten Klasse an einem bestimmten Tag in einem bestimmten Unterrichtsfach geht, tauchen viele Gründe auf, atmosphärisch (d. h. im Hinblick auf die Interaktions-qualität, auf die Genese der Regeln des Zusammenlebens3) oder didaktisch (d. h. bezogen auf Freiheitsgrade bei den Lernschritten) doch nicht zu viel davon zu „gewähren“, weil damit auch unerwünschte Wirkungen verbunden sein könnten, für deren Management Lehrpersonen ihre dies-bezüglichen Kompetenzen als (noch) zu wenig elaboriert einschätzen (vgl. Hofmann & Patry, 1999).
Kommentar zu den Ergebnissen vor dem Hintergrund der gewählten Forschungs-methode
Die hier zu kommentierenden Ergebnisse wurden sowohl auf Lehrpersonen- als auch auf Schüler-Ebene durch die Verwendung von Fragebögen generiert. Diese forschungs-methodische Entscheidung gibt Anlass zu folgen den kom-mentierenden Überlegungen:
�� Die Verwendung von Fragebögen bedeutet eine Beschrän-kung auf Selbstauskünfte, die mit Konsequenzen auf der Ebene der Datenqualität (insbesondere der Validität) ver-bunden ist: U. Schwantner merkt selbst an einer Stelle an, insbesondere die Lehrpersonen- Daten seien mit Ver-weis auf das Phänomen der sozialen Erwünschtheit mit Vorsicht zu interpretieren; diese Bedenken sind ernst zu nehmen. Zur Kontrolle der Wirkkraft dieses Phänomens hätten Unterrichts beobachtungen (also die Erhebung von Prozessmerk malen) Aufschluss dahingehend bringen können, in welcher Relation die berichteten Aktivitäts-frequenzen zum Prinzip der inneren Differenzierung zu tatsäch lichem Lehrerverhalten im Unterricht stehen (s. Ka-pitel 3. 2, Resümee); freilich ist anzumerken, dass solche Prozess analysen zeitlich aufwändig und daher teuer sind.
3 Eine Lehrperson hat im Kontext eines Schulentwicklungsprozesses, als es darum ging, ob mit jedem ersten Jahrgang die Regeln des Zusammenlebens neu ausverhandelt werden sollen oder das im ersten Jahr dieses Entwicklungsprozesses mit dem damaligen ersten Jahrgang generierte Regelwerk den nachfolgenden ersten Jahrgängen als Standardregelwerk ausgehändigt werden soll, gemeint: „Man braucht doch das Rad [der Schul- und Klassenord-nung] nicht jedes Jahr neu zu erfinden.“ Im Hinblick auf die Selbstverpflichtung macht es aber einen Unterschied, ob der Aushandlungsprozess statt-gefunden hat oder ob die Schüler/innen mit einem „Fremdprodukt“ konfrontiert und verpflichtet werden, es einzuhalten. Dann wird in aller Regel nur mehr der Sanktionskatalog besprochen.
Kommentar zu: Innere Differenzierung im Mathematikunterricht 141
�� Aus Forschungsarbeiten, die sich mit der Frage beschäf-tigen, in welchem Ausmaß implizite Motive didaktisches Handeln beeinflussen (vgl. Brunner, 2008), weiß man, dass Lehrpersonen, die sich unter einem Leistungsdruck oder als in Wettbewerbssituationen stehend empfinden (vgl. etwa den Druck, der bei einzelnen Lehrpersonen durch die Tatsache, dass „ihre“ Klasse zu Bildungsstan-dards überprüft wird, entstehen kann), geschlossenen Unterricht (mit weniger Rücksichtnahme auf indivi-duelle Bedürfnisse wie Fragen, Verstehensprobleme etc.) bevorzugen; das Gleiche gilt für Lehrpersonen, die sich ohnmächtig fühlen (etwa angesichts der einleitend beschriebenen antinomisch empfundenen bildungs-politischen Erwartungen, denen sie grundsätzlich im Sinne sorgfältigen Agierens ja entsprechen wollen): Auch solche Lehrpersonen bevor zugen geschlossenen Unterricht in der soeben kurz illustrierten Variante (vgl. zu diesem Aspekt ausführlicher Hofmann, 2011, S. 54). Es stellt sich in diesem Zusammenhang freilich die Frage, wie es um die Selbststeuerungsfähigkeiten von Lehr personen bestellt ist, die sie in die Lage versetzen würden, eigene Vorstellungen trotz bildungspolitischen „Gegenwinds“ im Klassenzimmer zu realisieren, (vgl. Kuhl, 2004); diese Fähigkeiten werden ja auch in Kompetenzprofilen, die Lehrpersonen grundsätzlich aufweisen sollen, an namhafter Stelle genannt (vgl. etwa Kunter et al., 2011). Eigene noch nicht publi-zierte Daten geben Anlass zur Vermutung, dass auch die Einschätzung der Ausprägung dieser Kompetenz von der gewählten Forschungsmethode abhängt: Folgt man den Daten, die durch die Verwendung operanter Instrumente (vgl. etwa den Operanten Multi-Motiv-test; Kuhl, 2013) generiert wurden, kommt man zum Ergebnis, dass die Selbststeuerungsfähigkeiten von Lehrpersonen (hier aber nicht auf Volks- oder allge-meinbildende Pflichtschule bezogen) vergleichsweise wenig ausgeprägt sind; legt man Lehrpersonen Frage-bögen vor, in denen Selbststeuerung auf die Subkons-trukte Selbstregulation, Selbstkontrolle, Willens- und Handlungsbahnung und Selbstzugang operationalisiert ist (vgl. Fuhrmann & Kuhl, 1998), zeigen die Ergeb-nisse, dass im Durchschnitt gute bis sehr gute Selbst-steuerungsfähigkeiten vorliegen. In dieser Richtung sind weitere Forschungsarbeiten notwendig und im Gange.
Resümee
Innere Differenzierung im Unterricht ist insbesondere aus schulpädagogischer Perspektive betrachtet ein in seiner Be-deutung (und wohl auch in seiner Realisierung) kaum zu unterschätzendes didaktisches Prinzip. Es ist zu begrüßen, dass empirisch darauf der Blick gerichtet wird und – wie U. Schwantner das praktiziert hat – dazu theoriengestützt Instrumente entwickelt und eingesetzt werden, um die Ver-breitung entsprechender Praktiken abschätzen zu können;
positiv ist anzumerken, dass nicht nur Lehrpersonen, sondern auch deren Schüler/innen um ihre Einschätzung gebeten wurden; auf dieser Altersstufe ist bezogen auf die Schüler/innen noch nicht davon auszugehen, dass deren Angaben etwa durch Phänomene sozialer Erwünschtheit (oder anderer Verzerrungseffekte) beeinträchtigt wären.
Aus dem Ergebnis wird deutlich, dass das Prinzip der inneren Differenzierung von Lehr- und Leitungspersonen hoch geschätzt wird und dass die Lehrpersonen durch-aus geeignete Strategien kennen und anwenden, um es zu realisieren. Freilich wird aus der Befundlage auch deut-lich, dass die Gewährung „großer“ Freiräume für Schüler/innen (Eigenständigkeit in der Bearbeitung, keine Ein-schränkungen im Hinblick auf die Lösungsfindung, son-dern Ermutigung zur Findung eigener Lösungsansätze) hinter der Gewährung risikoärmerer didaktischer Freiräu-me (Aufgabenreihenfolge festlegen etc.) zurückbleibt. Als eine Erklärung für diesen Befund wird auf die gegenwär-tige bildungspolitische Strategie verwiesen, Lehrpersonen mehr Autonomie im Prozess zu gewähren (vgl. sämtliche Diskussionen um schulautonome Möglichkeiten; Schratz & Hartmann, 2009), gleichzeitig aber stärkere Output-Maßnahmen zu etablieren. Freilich kann das Lehrperso-nen, die eher gewissenhaft und sorgfältig agieren wollen, schnell unter Druck bringen, was zur Konsequenz hat, dass diese – bei gering ausgeprägten Selbststeuerungsfähigkei-ten – im Unterricht eher auf Fremdsteuerung setzen; diese Vorgehensweise ist aber wiederum mit Maßnahmen der Individualisierung und inneren Differenzierung nur schwer vereinbar.
142 Kommentar zu: Innere Differenzierung im Mathematikunterricht
Literatur
Altrichter,H.,Trautmann,M.,Wischer,B.,Sommerauer,S.&Doppler,B.(2009).UnterrichteninheterogenenGruppen:DasQualitätspotenzialvonIndividualisierung,DifferenzierungundKlassenschülerzahl.InW.Specht(Hrsg.),Fokussierte Analysen bildungspolitischer Schwerpunktthemen(NationalerBildungsberichtÖsterreich2009/hrsg.vonWernerSpecht,S.341–360).Graz:Leykam.
Beer,R.&Benischek,I.(2011).AspektekompetenzorientiertenLehrensundLernens.InBIFIE(Hrsg.),Kompetenzorientierter Unterricht in Theorie und Praxis. [Information für Lehrer/innen](S.5–28).Graz:Leykam.
Braun,A.K.&Meier,M.(2006).WieGehirnelaufenlernen,oder:Frühübtsich,wereinMeisterwerdenwill.InU.Herrmann(Hrsg.),Neurodidaktik, 97–110.Weinheim:Beltz.
Brunner,J.(2008).MotivstrebenvonLehrerInnen,dieoffenen,vs.LehrerInnen,diefrontalenUnterrichtmachen.Masterarbeit,Universität.Salzburg.
Eder,F.,&Thonhauser,J.(2006).Bildungsaspirationen,NotenundBerechtigungenamÜbergangvonderVolksschulezurSekundarstufeI.Erziehung und Unterricht, 156 (3–4), 275–294.
Fuhrmann,A.&Kuhl,J.(1998).Maintainingahealthydiet:Effectsofpersonalityandself-rewardversusself-punishmentoncommitmenttoandenactmentofself-chosenandassignedgoals.Psychology and Health, 13,651–686.
Hofmann, F. (2011). Bildungsstandards und Individualisierung – einWiderspruch?Unterschiedliche Reaktionsmuster vonLehrpersonen–einHypothesengenerierenderBeitrag.InF.Hofmann,D.Martinek&U.Schwantner(Hrsg.), Binnendifferen-zierter Unterricht und Bildungsstandards – (k)ein Widerspruch? (ÖsterreichischeBeiträgezurBildungsforschung.7,S.47–62).Wien:LitVerl.
Hofmann,F.&Patry,J.-L.(1999).DasErziehungszielAutonomieinderUnterrichtspraxis.Psychologie in Erziehung und Unter-richt, 46, 126–135.
Herber,H.-J.(1983).Innere Differenzierung im Unterricht. Stuttgart:VerlagW.Kohlhammer.
Kuhl,J.(2004).WasbedeutetSelbststeuerungundwiekannmansieentwickeln? Personalführung, 37 (4),30–39.
Kuhl,J.(2013). Auswertungsmanual für den Operanten Multi-Motiv-Test OMT(Vollst.rev.Fassung).IMPART-Test-Manuale:Bd.2.Münster:Sonderpunkt-Verl.
Kunter,M.,Baumert,J.,Blum,W.,Klusmann,U.,Krauss,S.&Neubrand,M.(Hrsg.).(2011).Professionelle Kompetenz von Lehrkräften: Ergebnisse des Forschungsprogramms COACTIV.Münsteru.a:Waxmann.
Paechter, M. (Hrsg.). (2012).Handbuch kompetenzorientierter Unterricht: Handlungskompetenz, Schülerorientierung, Bil-dungsstandards, Unterrichtsentwicklung. Weinheim:Beltz.
Patry,J.-L.&Hofmann,F.(1998).ErziehungszielAutonomie–AnspruchundWirklichkeit.Psychologie in Erziehung und Un-terricht, 45, 53–66.
Racherbäumer,K.&Kühn,S.M.(2013).ZentralePrüfungenundindividuelleFörderung:Gegensatz,oderzweiSeitendersel-benMedaille?Zeitschrift für Bildungsforschung, 3(1),27–45.
Roth,G.(2006).MöglichkeitenundGrenzenvonWissensvermittlungundWissenserwerb.ErklärungsansätzeausLernpsy-chologieundHirnforschung.InR.Caspary(Hrsg.),Lernen und Gehirn. Der Weg zu einer neuen Pädagogoik,54–69.FreiburgimBreisgau:HerderVerlag.
Schratz,M.&Hartmann,M. (2009).Schulautonomie inÖsterreich:BilanzundPerspektiven füreineeigenverantwortlicheSchule.InW.Specht(Hrsg.),Fokussierte Analysen bildungspolitischer Schwerpunktthemen(NationalerBildungsberichtÖs-terreich2009,S.323–340).Graz:Leykam.
Anhang
Anhangstabellen 145
Perzentile 95.–5. Perzentil
Effekt-stärkeLand MW (SE) 5. 25. 50. 75. 95.
AUT 529 (2.0) 418 487 533 573 626 209
BEL (fr) 506 (2.9) 391 466 509 551 606 215 0.36
BGR 532 (4.1) 382 482 541 589 652 270 0.04
CZE 545 (2.2) 434 509 550 587 639 205 0.27
DEU 541 (2.2) 425 499 544 586 646 221 0.19
DNK 554 (1.7) 438 514 559 599 652 215 0.39
ESP 513 (2.3) 393 469 518 561 618 225 0.24
FIN 568 (1.9) 458 528 571 611 668 209 0.61
FRA 520 (2.6) 401 475 524 568 626 225 0.13
GBR (E) 552 (2.6) 404 500 558 609 678 274 0.31
GBR (N) 558 (2.4) 422 512 564 610 673 251 0.42
HUN 539 (2.9) 397 493 545 594 656 259 0.15
IRL 552 (2.3) 417 506 555 603 665 248 0.33
ITA 541 (2.2) 427 500 544 586 645 218 0.19
LTU 528 (2.0) 412 487 532 574 630 218 0.01
MLT 477 (1.4) 303 412 487 546 620 317 0.63
NLD 546 (1.9) 454 510 548 583 631 178 0.29
POL 526 (2.1) 397 480 531 576 637 240 0.05
PRT 541 (2.6) 425 499 546 586 643 218 0.19
ROU 502 (4.3) 336 445 512 567 634 298 0.35
SVK 535 (2.8) 408 495 541 582 638 230 0.09
SVN 530 (2.0) 405 487 535 579 637 232 0.02
SWE 542 (2.1) 426 502 545 585 643 217 0.20
Anhangstabelle A.1: Lese-Gesamtskala – EU-Teilnehmerländer (PIRLS 2011)
Anmerkungen: MW = Mittelwert; SE = StandardfehlerEffektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmer-lands mit Österreich
Anhangstabellen
146 Anhangstabellen
Perzentile 95.–5. Perzentil
Effekt-stärkeLand MW (SE) 5. 25. 50. 75. 95.
AUT 508 (2.6) 401 466 511 552 606 204
BEL (fl) 549 (1.9) 450 509 550 590 645 195 0.67
CZE 511 (2.4) 387 467 514 560 621 234 0.04
DEU 528 (2.2) 420 488 530 570 626 206 0.31
DNK 537 (2.6) 413 493 541 585 646 233 0.43
ESP 482 (2.9) 362 435 486 532 593 230 0.39
FIN 545 (2.3) 430 501 549 592 654 224 0.57
GBR (E) 542 (3.5) 385 483 549 605 677 292 0.44
GBR (N) 562 (2.9) 411 511 567 622 693 282 0.72
HUN 515 (3.4) 352 462 523 577 650 297 0.09
IRL 527 (2.6) 390 479 533 580 648 258 0.27
ITA 508 (2.6) 386 461 510 557 622 236 0.01
LTU 534 (2.4) 405 486 537 585 650 244 0.37
MLT 496 (1.3) 357 446 502 549 613 256 0.18
NLD 540 (1.7) 449 505 543 577 623 174 0.55
POL 481 (2.2) 352 435 485 531 595 243 0.40
PRT 532 (3.4) 417 488 534 578 642 225 0.36
ROU 482 (5.8) 287 416 494 557 636 349 0.30
SVK 507 (3.8) 365 460 513 561 626 261 0.02
SVN 513 (2.2) 395 468 517 561 619 223 0.07
SWE 504 (2.0) 388 462 507 549 610 222 0.07
Anhangstabelle A.2: Mathematik-Gesamtskala – EU-Teilnehmerländer (TIMSS 2011)
Anmerkungen: MW = Mittelwert; SE = StandardfehlerEffektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmer-lands mit Österreich
Anhangstabellen 147
Perzentile 95.–5. Perzentil
Effekt-stärkeLand MW (SE) 5. 25. 50. 75. 95.
AUT 532 (2.8) 408 485 535 581 640 231
BEL (fl) 509 (2.0) 411 471 511 548 600 189 0.36
CZE 536 (2.5) 412 491 539 586 648 236 0.07
DEU 528 (2.9) 406 482 532 577 636 230 0.05
DNK 528 (2.8) 401 483 531 578 640 239 0.05
ESP 505 (3.0) 378 458 509 556 620 242 0.37
FIN 570 (2.6) 456 529 574 615 674 217 0.56
GBR (E) 529 (2.9) 384 476 535 586 653 269 0.04
GBR (N) 517 (2.6) 388 473 522 566 625 237 0.21
HUN 534 (3.7) 377 484 542 594 662 285 0.04
IRL 516 (3.4) 379 466 521 571 637 257 0.21
ITA 524 (2.7) 397 477 527 573 641 243 0.11
LTU 515 (2.4) 397 471 518 561 620 223 0.24
MLT 446 (1.9) 271 384 453 514 594 324 1.01
NLD 531 (2.2) 439 497 534 568 613 174 0.01
POL 505 (2.6) 369 455 509 558 627 258 0.36
PRT 522 (3.9) 397 476 524 571 637 239 0.14
ROU 505 (5.9) 302 444 517 580 659 357 0.29
SVK 532 (3.8) 390 486 539 586 648 257 0.00
SVN 520 (2.7) 388 474 525 572 636 248 0.15
SWE 533 (2.7) 403 486 539 586 648 245 0.03
Anhangstabelle A 3: Naturwissenschaft-Gesamtskala – EU-Teilnehmerländer (TIMSS 2011)
Anmerkungen: MW = Mittelwert; SE = StandardfehlerEffektstärke: Effektstärke bezieht sich auf den Vergleich des jeweiligen EU-Teilnehmer-lands mit Österreich
148 Anhangstabellen
Land
Lese
n (P
IRLS
200
1)Le
sen
(PIR
LS 2
006)
Lese
n (P
IRLS
201
1)
MW
(SE
)B
uben
Mäd
chen
Ge-
schl
echt
er-
diff
eren
zM
W (S
E)
Bub
enM
ädch
enG
e-sc
hlec
hter
-d
iffer
enz
MW
(SE
)B
uben
Mäd
chen
Ge-
schl
echt
er-
diff
eren
z
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)
AU
T53
8(2
.2)
533
(2.6
)54
3(2
.3)
–10
(2.3
)52
9(2
.0)
525
(2.3
)53
3(2
.2)
–8(2
.3)
DE
U53
9(1
.9)
533
(2.5
)54
5(2
.2)
–13
(2.7
)54
8(2
.2)
544
(2.5
)55
1(2
.5)
–7(2
.6)
541
(2.2
)53
7(2
.7)
545
(2.3
)–8
(2.5
)
SG
P52
8(5
.2)
516
(5.7
)54
0(5
.3)
–24
(4.1
)55
8(2
.9)
550
(3.3
)56
7(3
.1)
–17
(2.9
)56
7(3
.3)
559
(3.6
)57
6(3
.5)
–17
(2.6
)
SV
N50
2(2
.0)
491
(2.4
)51
2(2
.5)
–22
(2.8
)52
2(2
.1)
512
(2.7
)53
2(2
.1)
–19
(2.5
)53
0(2
.0)
523
(2.7
)53
9(2
.2)
–16
(3.1
)
Anha
ngsta
belle
A.4
Mitt
elwer
te u
nd G
eschl
echt
erdi
ffere
nzen
im T
rend
(PIR
LS 2
001,
200
6 &
201
1; T
IMSS
199
5, 2
007
& 2
011)
A
nmer
kung
: MW
= M
ittel
wer
t; S
E =
Sta
ndar
dfeh
ler
Land
Mat
hem
atik
(TIM
SS
199
5)M
athe
mat
ik (T
IMS
S 2
007)
Mat
hem
atik
(TIM
SS
201
1)
MW
(SE
)B
uben
Mäd
chen
Ge-
schl
echt
er-
diff
eren
zM
W (S
E)
Bub
enM
ädch
enG
e-sc
hlec
hter
-d
iffer
enz
MW
(SE
)B
uben
Mäd
chen
Ge-
schl
echt
er-
diff
eren
z
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)
AU
T53
1(3
.2)
536
(3.2
)52
5(4
.5)
10(4
.2)
505
(2.0
)51
2(2
.3)
498
(2.5
)14
(2.6
)50
8(2
.6)
513
(3.3
)50
4(2
.7)
9(2
.8)
DE
U52
5(2
.3)
531
(2.5
)51
9(2
.5)
12(2
.1)
528
(2.2
)53
2(2
.6)
523
(2.7
)8
(2.7
)
SG
P59
0(4
.6)
586
(5.0
)59
5(5
.5)
–9(5
.0)
599
(3.7
)59
6(4
.1)
603
(3.8
)–6
(2.7
)60
6(3
.2)
604
(3.5
)60
8(3
.6)
–4(3
.0)
SV
N46
2(3
.4)
466
(3.9
)45
7(3
.9)
9(3
.7)
502
(1.8
)50
4(2
.1)
499
(2.4
)5
(2.6
)51
3(2
.2)
518
(3.1
)50
8(2
.2)
10(3
.2)
Land
Nat
urw
isse
nsch
aft
(TIM
SS
199
5)N
atur
wis
sens
chaf
t (T
IMS
S 2
007)
Nat
urw
isse
nsch
aft
(TIM
SS
201
1)
MW
(SE
)B
uben
Mäd
chen
Ge-
schl
echt
er-
diff
eren
zM
W (S
E)
Bub
enM
ädch
enG
e-sc
hlec
hter
-d
iffer
enz
MW
(SE
)B
uben
Mäd
chen
Ge-
schl
echt
er-
diff
eren
z
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)M
W(S
E)
MW
(SE
)
AU
T53
8(3
.9)
545
(4.1
)53
0(4
.8)
15(4
.2)
526
(2.5
)53
2(2
.9)
519
(2.7
)13
(2.6
)53
2(2
.8)
538
(3.6
)52
5(2
.8)
12(2
.9)
DE
U52
8(2
.4)
535
(2.9
)52
0(2
.6)
15(2
.7)
528
(2.9
)53
4(3
.2)
522
(3.0
)12
(2.5
)
SG
P52
3(5
.1)
526
(5.9
)52
1(5
.6)
5(5
.4)
587
(4.1
)58
7(4
.4)
587
(4.3
)0
(3.0
)53
8(3
.4)
585
(3.7
)58
1(3
.7)
4(2
.7)
SV
N46
4(3
.4)
470
(4.1
)45
8(3
.8)
12(4
.0)
518
(1.9
)51
8(2
.4)
518
(2.4
)0
(2.8
)52
0(2
.7)
523
(3.4
)51
7(2
.8)
6(3
.2)
Anhangstabellen 149
Anhangstabelle A.5: Anteile der Schüler/innen mit Migrationshintergrund im Zeitverlauf (PISA 2000, 2003, 2006, 2009, 2012; PIRLS 2006, 2011)
Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)
Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011
Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001
Anteil an der Population (%)2
Schüler/innen mit Migrationshintergrund
11.0 13.0 13.2 15.2 16.5 16.6 18.8
2. Generation 4.1 4.1 5.3 10.5 10.9 12.8 13.9
1. Generation 7.0 9.2 7.9 4.8 5.6 3.9 4.9
Anteil an Schülerinnen/Schülern mit Migrationshintergrund (%)
Eltern in Exjugoslawien geboren3
m 45.6 37.2 36.8 40.7 38.2 34.2
Eltern in der Türkei geboren m 25.5 27.6 26.0 22.5 24.9 21.6
Anderes Land oder gemischte Herkunft
m 28.9 35.2 37.2 36.8 36.9 44.2
1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.
2 Population bei PIRLS sind Schüler/innen der 4. Schulstufe; Population bei PISA sind Schüler/innen eines bestimmten Geburtsjahrgangs, die zum Testzeitpunkt 15/16 Jahre alt sind.
3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.
m = Daten nicht erhoben
Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)
Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011
Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001
Lesekompetenz2 MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE)
Schüler/innen ohne Migrationshintergrund
502 (2.8) 501 (3.8) 499 (3.4) 482 (2.9) 499 (2.7) 547 (1.9) 537 (1.7)
Schüler/innen mit Migrationshintergrund
409 (7.2) 426 (8.1) 438 (13.9) 414 (6.2) 449 (5.7) 498 (3.4) 495 (3.6)
2. Generation 429 (10.6) 428 (13.5) 420 (18.8) 427 (6.0) 451 (5.9) 500 (3.9) 493 (3.5)
1. Generation 398 (8.9) 425 (8.0) 451 (12.6) 384 (10.3) 443 (9.4) 489 (6.4) 500 (7.3)
Eltern in Exjugoslawien geboren3
m 433 (9.1) 449 (10.4) 419 (7.5) 439 (7.5) 504 (5.3) 498 (4.8)
Eltern in der Türkei geboren
m 372 (16.4) 369 (24.2) 372 (8.0) 412 (9.4) 461 (5.2) 465 (5.2)
Anderes Land oder gemischte Herkunft
m 462 (11.3) 481 (9.9) 438 (8.4) 481 (8.7) 522 (5.3) 512 (4.6)
1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.
2 Eingetragen sind Mittelwerte der jeweiligen Leseleistungsskala. Standardfehler stehen in Klammern.
3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.
m = Daten nicht erhoben
150 Anhangstabellen
Anhangstabelle A.6: Lesekompetenz der Schüler/innen mit Migrationshintergrund im Zeitverlauf (PISA 2000, 2003, 2006, 2009, 2012; PIRLS 2006, 2011)
Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)
Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011
Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001
Anteil an der Population (%)2
Schüler/innen mit Migrationshintergrund
11.0 13.0 13.2 15.2 16.5 16.6 18.8
2. Generation 4.1 4.1 5.3 10.5 10.9 12.8 13.9
1. Generation 7.0 9.2 7.9 4.8 5.6 3.9 4.9
Anteil an Schülerinnen/Schülern mit Migrationshintergrund (%)
Eltern in Exjugoslawien geboren3
m 45.6 37.2 36.8 40.7 38.2 34.2
Eltern in der Türkei geboren m 25.5 27.6 26.0 22.5 24.9 21.6
Anderes Land oder gemischte Herkunft
m 28.9 35.2 37.2 36.8 36.9 44.2
1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.
2 Population bei PIRLS sind Schüler/innen der 4. Schulstufe; Population bei PISA sind Schüler/innen eines bestimmten Geburtsjahrgangs, die zum Testzeitpunkt 15/16 Jahre alt sind.
3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.
m = Daten nicht erhoben
Altersgruppe 15-/16-Jährige4. Schulstufe (10-Jährige)
Studie PISA 2000 PISA 2003 PISA 2006 PISA 2009 PISA 2012 PIRLS 2006 PIRLS 2011
Geburtsjahrgang1 1984 1987 1990 1993 1996 1996 2001
Lesekompetenz2 MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE) MW (SE)
Schüler/innen ohne Migrationshintergrund
502 (2.8) 501 (3.8) 499 (3.4) 482 (2.9) 499 (2.7) 547 (1.9) 537 (1.7)
Schüler/innen mit Migrationshintergrund
409 (7.2) 426 (8.1) 438 (13.9) 414 (6.2) 449 (5.7) 498 (3.4) 495 (3.6)
2. Generation 429 (10.6) 428 (13.5) 420 (18.8) 427 (6.0) 451 (5.9) 500 (3.9) 493 (3.5)
1. Generation 398 (8.9) 425 (8.0) 451 (12.6) 384 (10.3) 443 (9.4) 489 (6.4) 500 (7.3)
Eltern in Exjugoslawien geboren3
m 433 (9.1) 449 (10.4) 419 (7.5) 439 (7.5) 504 (5.3) 498 (4.8)
Eltern in der Türkei geboren
m 372 (16.4) 369 (24.2) 372 (8.0) 412 (9.4) 461 (5.2) 465 (5.2)
Anderes Land oder gemischte Herkunft
m 462 (11.3) 481 (9.9) 438 (8.4) 481 (8.7) 522 (5.3) 512 (4.6)
1 Bei PIRLS ist jenes Jahr eingetragen, in dem die Mehrheit der getesteten Kinder geboren wurde; bei PISA wurden alle getesteten Schüler/innen im entsprechenden Jahr geboren.
2 Eingetragen sind Mittelwerte der jeweiligen Leseleistungsskala. Standardfehler stehen in Klammern.
3 Folgende Staaten werden abgedeckt: Serbien, Montenegro, Kosovo, Bosnien-Herzegowina und Kroatien.
m = Daten nicht erhoben
Autorenverzeichnis 151
AutorenverzeichnisDr. Karl Blüml Ehemaliger Landesschulinspektor für allgemeinbildende höhere Schulen; SOKO-Lesen am Stadtschulrat für Wien.
Sandra Filzmoser, MA Ehemaliger Junior Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.
Dipl.-Päd. Anna Glaeser, MA Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.
Dr. Gerda Hagenauer Oberassistentin am Institut für Erziehungswissenschaft der Universität Bern; Abteilung für Schul- und Unterrichtsforschung.
Dr. Barbara Herzog-Punzenberger Leiterin des Arbeitsbereichs Migration & Bildung an der Johannes-Kepler-Universität Linz, Institut für Pädagogik und Psychologie.
AO Univ.-Prof. Dr. Franz Hofmann Leiter der Abteilung Bildungswissenschaft, Schulforschung und Schulpraxis an der Universität Salzburg; School of Education.
Mag. Konrad Oberwimmer Wissenschaftlicher Mitarbeiter am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.
Dipl.-Math. Alexander Robitzsch Measurement Statistician am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.
Dr. Silvia Salchegger Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments.
Univ.-Prof. Dr. Christine Schmid Fachbereichsleiterin an der Universität Salzburg; Fachbereich Erziehungswissenschaft.
Dr. Ursula Schwantner Research Fellow beim Australian Council for Educational Research.
Dr. Birgit Suchań Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments; Projektleiterin PISA; Lektorin an der Universität Salzburg am Fachbereich Erziehungswissenschaft.
Mag. Christina Wallner-Paschon Researcher am Bundesinstitut für Bildungsforschung, Innovation und Entwicklung des österreichischen Schulwesens; Department Bildungsstandards & Internationale Assessments; Projektleiterin PIRLS; Lektorin an der Universität Salzburg am Fachbereich Erziehungswissenschaft.