Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Sitzungsübersicht
Ort: H06
Datum: Mittwoch, 25.03.2020
11:15 - 13:00M11‒H06: Schülerrückmeldungen zum Unterricht - Perspektiven für die Lehrer/innenbildung und Unterrichtsentwicklung
H06 
 

Schülerrückmeldungen zum Unterricht – Perspektiven für die Lehrer/innenbildung und Unterrichtsentwicklung

Chair(s): Alexander Gröschner (Friedrich-Schiller-Universität Jena), Katharina Neuber (Universität Duisburg-Essen, Deutschland), Kerstin Göbel (Universität Duisburg-Essen)

DiskutantIn(nen): Benjamin Fauth (Eberhard Karls Universität Tübingen)

In der schulpraktischen Ausbildung von Lehrkräften nimmt das Thema Feedback eine zentrale Rolle ein. Feedback im Sinne von Rückmeldungen zum eigenen unterrichtlichen Handeln dient der Weiterentwicklung der eigenen Professionalität von (angehenden) Lehrkräften, da es die eigene Perspektive auf den Unterricht sinnvoll erweitern kann (Altrichter, Posch & Spann, 2018; Göbel & Neuber, 2017). Als Grundlage für die Auseinandersetzung mit und die Reflexion über den eigenen Unterricht können Lehramtsstudierende in Praxisphasen auch die Rückmeldungen der Schülerinnen und Schüler zu ausgewählten Aspekten des Unterrichts nutzen. Bisherige Studien verweisen auf das Potenzial des Einsatzes von Schülerrückmeldungen zum Unterricht für eine demokratische Entwicklung des Unterrichts (Ditton & Arnoldt, 2004), für die Verbesserung der Schüler-Lehrer-Beziehung (Gärtner & Vogt, 2013) und für die Stärkung der unterrichtlichen Zusammenarbeit zwischen Lehrkräften und Lernenden (Schmidt, 2018). Der Einbezug von unterrichtsbezogenen Rückmeldungen der Lernenden kann darüber hinaus als Ausdruck einer produktiven Unterrichtskommunikation betrachtet werden. Eine produktive, d. h. dialogische Unterrichtskommunikation gilt als zentraler Aspekt des professionellen Handelns von (angehenden) Lehrpersonen, die das Lernen der Schülerinnen und Schüler positiv beeinflussen und die Schülerbeteiligung erhöhen kann (Alexander, 2018; Kiemer, Gröschner, Pehmer & Seidel, 2015). Eine „dialogische“ Unterrichtskommunikation ist jedoch bislang im Unterrichtsalltag von (angehenden) Lehrkräften noch wenig verbreitet (Jurik, Gröschner & Seidel, 2013). Auch die Nutzung von Schülerrückmeldungen zum Unterricht im Rahmen schulpraktischer Ausbildungsphasen stellt eher eine Ausnahme dar (Hascher, Baillod & Wehr, 2004). Entsprechend ist empirisch nur wenig bekannt über die Relevanz, die Rückmeldungen von Lernenden für die professionelle Entwicklung von Lehramtsstudierenden in Praxisphasen haben können (Lawson, Çakmak, Gündüz & Busher, 2015).

Die Beiträge des Symposiums widmen sich der Frage, wie Schülerrückmeldungen zum Unterricht sinnvoll eingesetzt werden und das professionelle Handeln angehender Lehrkräfte in Praxisphasen der Lehramtsausbildung unterstützen können. Der erste Beitrag widmet sich den messmethodischen Herausforderungen der Erfassung von Unterrichtsqualität aus der Perspektive der Lernenden. Im Rahmen einer Studie wurden die digital generierten Schülerrückmeldungen zum Unterricht hinsichtlich ihrer Dimensionalität, Validität und Generalisierbarkeit geprüft und den Unterrichtseinschätzungen von Lehrkräften gegenübergestellt. Im zweiten und dritten Beitrag steht der systematische Einsatz von Schülerrückmeldungen zum Unterricht angehender Lehrkräfte in der Schweiz bzw. in Deutschland im Fokus der Untersuchungen. Während der zweite Beitrag Befunde einer Schülerbefragung zur Beurteilung des Einsatzes der Rückmeldungen zum Unterricht sowie zu den wahrgenommenen Veränderungen im Unterrichtshandeln der angehenden Lehrkräfte präsentiert, wird im dritten Beitrag die Perspektive der Lehramtsstudierenden und deren wahrgenommener Ertrag der Nutzung der Schülerrückmeldungen für das eigene professionelle Handeln im Praxissemester beleuchtet. Der vierte Beitrag stellt Befunde einer Studie vor, in der die Unterrichtskommunikation der Studierenden im Praxissemester mit einem neuen Instrument aus Sicht der Schülerinnen und Schüler erfasst wurde. In den vier Beiträgen werden unterschiedliche Ansätze und empirische Befunde dargestellt, die allesamt relevante Implikationen für die weitere Forschung und Praxis zur Nutzung von Schülerrückmeldungen für das professionelle Handeln von (angehenden) Lehrpersonen liefern. Die Beiträge werden von einem Experten der Unterrichtsqualitätsforschung diskutiert.

 

Beiträge des Symposiums

 

Mehrere Faktoren, mehrere Ebenen, mehrere Kontexte – Zur Modellstruktur und Messinvarianz von Schüler*innenrückmeldungen

Benedikt Wisniewski
Universität Augsburg

Theoretischer Hintergrund

Rückmeldungen zur Unterrichtsqualität durch Schüler*innen sind zu einer wichtigen Informationsquelle für die Professionalisierung von Lehrpersonen geworden. Die Erfassung dieser erfordert gesicherte Erkenntnisse über die Reliabilität, Dimensionalität und Generalisierbarkeit. Es existieren mehrere theoretisch gut begründete Modelle zur Erfassung allgemeiner Unterrichtsqualität mit Hilfe von Schüler*innenrückmeldungen (Ferguson & Danielson, 2014; Helmke, 2012; Klieme et al., 2006; Praetorius et al., 2018; Slavin, 1994, 1997), deren Dimensionalität auch empirisch gut abgesichert ist (Fauth et al., 2014; Künsting et al., 2016; Kunter & Voss, 2013; Praetorius et al., 2018). Außerdem weisen Schüler*innenrückmeldungen eine hohe Reliabilität auf, wenn sie mit kriteriengeleiteten Instrumenten eingeholt werden (Kyriakides et al., 2014; Lüdtke et al., 2006; Marsh, 2019) und es konnte nachgewiesen werden, dass die Wahrnehmung von Merkmalen der Unterrichtsqualität durch Lernende über bestimmte Kontexte (Klassenstufen, Fächer) hinweg verallgemeinerbar ist, wobei bestimmte Dimensionen wie Strukturierung oder Klassenführung eine höhere Generalisierbarkeit aufweisen als andere (Gaertner & Brunner, 2018; Göllner et al., 2016). Der Vergleich verschiedener Perspektiven zeigt, dass niedrige bis mittlere Übereinstimmungen zwischen Schüler*innen-, Beobachter*innen und Selbsteinschätzungen von Lehrpersonen vorliegen (Clausen, 2002; Van der Scheer et al., 2019).

Bei der Erfassung von Schüler*innenrückmeldungen ergeben sich aus methodologischer Sicht jedoch bestimmte Herausforderungen: Die Annahme, dass die Einschätzungen von Schüler*innen unabhängig voneinander sind, wird durch die hierarchisch geschachtelte Struktur der Daten verletzt: da Schüler*innen in Klassen unterrichtet werden, kommt es durch Ähnlichkeiten innerhalb dieser Klassen zu ungenauen Schätzungen von Modellparametern, Standardfehlern und Fit-Indices sowie zu einem erhöhten Risiko von Alpha-Fehlern (Lüdtke et al., 2007; 2011). Eine weitere methodische Herausforderung ergibt sich daraus, dass Modelle auf verschiedene Kontexte angewendet werden (Schwab & Helm, 2015). Ein Modell, das für einen bestimmten Schultyp oder ein bestimmtes Schulfach funktioniert, ist möglicherweise nicht für einen anderen Kontext oder andere Personengruppen geeignet. Daher erfordert die Erfassung nicht nur die Berücksichtigung verschiedener Ebenen, sondern auch die Berücksichtigung verschiedener Kontexte.

Fragestellungen

Für die vorliegende Untersuchung ergaben sich drei zentrale Fragestellungen:

1. Mit welchem Modell/welchen Modellen allgemeiner Unterrichtsqualität können Daten aus Erhebungen von Schüler*innenrückmeldungen am besten beschrieben werden?

2. Sind die verwendeten Modelle über verschiedene Kontexte hinweg generalisierbar?

3. Wie hängen Schüler*innen- und Lehrer*innen-Einschätzung zusammen?

Methode

In einer Studie mit 15,005 deutschen Schüler*innen der Sekundarstufe aus 690 Klassen wurde die faktorielle Struktur von Schüler*innenrückmeldungen mit Hilfe konfirmatorischer Mehrebenen-Faktorenanalyen geprüft. Darauf aufbauend wurden Messinvarianzanalysen unter Berücksichtigung der Mehrebenenstruktur durchgeführt. Zur Prüfung der Validität über die faktorielle Struktur hinaus wurden die Schüler*innenrückmeldungen mit den Selbsteinschätzungen der Lehrpersonen verglichen.

Ergebnisse

Unsere Ergebnisse dokumentieren eine Eignung von zwei Messmodellen (7 Faktoren bzw. 7 Faktoren mit 3 Faktoren höherer Ordnung) für die Beschreibung unserer Daten. Die sieben Faktoren können als Subdimensionen der drei Basisdimensionen allgemeiner Unterrichtsqualität (Klieme & Rakoczy, 2003; Klieme et al., 2006; Praetorius et al., 2018) aufgefasst werden. Strikte Invarianz lag für Fächergruppen, Schultypen und Klassenstufen vor. Zwischen Schüler*inneneinschätzungen und Lehpersoneneinschätzungen lagen für die einzelnen Dimensionen latente Korrelationen zwischen .50 und .70 vor.

 

Wie Schülerinnen und Schüler Unterricht beurteilen – Chancen und Herausforderungen von Schülerrückmeldung als Instrument zur Unterrichtsentwicklung

Meike Raaflaub1, Corinne Wyss2, Nina Hüsler1
1Pädagogische Hochschule Zürich, 2Pädagogische Hochschule Fachhochschule Nordwestschweiz

Reflexion wird als eine wichtige Kompetenz von (angehenden) Lehrpersonen betrachtet (Wyss, 2013). Zur Unterstützung von reflexiven Prozessen kann Feedback dabei sehr wertvoll sein (Birgmeier, 2011). Im Rahmen des Lehramtsstudiums erhalten Studierende üblicherweise Rückmeldungen von Praxislehrpersonen, Dozierenden oder Peers. Rückmeldungen von Schülerinnen und Schülern werden in der Ausbildung und der Unterrichtspraxis noch wenig systematisch verwendet (Buhren, 2015; Kämpfe, 2009). Die Einschätzungen von Schülerinnen und Schülern sind jedoch bedeutsam, da sie eine Innensicht auf den Unterricht darstellen und sie dadurch die Wirkung von Unterricht und Lehrerhandeln auf ihr Lernen gut beurteilen können (Göbel & Neuber, 2017; Hascher, Baillod & Wehr, 2004; Clausen, 2002). Verschiedene Studien haben zudem gezeigt, dass die Rückmeldungen von Schülerinnen und Schülern zum Unterricht sehr differenziert ausfallen können (Buhren, 2015). Für die Schülerinnen und Schüler ergibt sich ausserdem die Möglichkeit, der Lehrperson die eigene, persönliche Sicht auf den Unterricht, Unterrichtserfahrungen und -einschätzungen mitzuteilen. Lehren und Lernen kann miteinander synchronisiert sowie Unterrichtsentwicklung angeregt werden (Helmke, 2015; Hattie, 2009).

Das Projekt SelFreflex widmet sich der übergreifenden Frage, wie Studierende im Berufspraktikum Schülerrückmeldungen für die Reflexion des eigenen Unterrichts nutzen. Im Rahmen dieses Beitrags wird danach gefragt, welche Qualität die Rückmeldungen von Schülerinnen und Schülern aufweisen und in wie weit diese als Zusatzinformation für die Unterrichtsreflexionen von Studierenden aufgenommen werden. Am Projekt nahmen angehende Lehrpersonen (FS17 & FS18, N=235) sowie Schülerinnen und Schüler der Sekundarstufe I (FS 17 & FS18, N=1993) teil. Im Rahmen des Quartalspraktikums befragten die Studierenden ihre Schülerinnen und Schüler zu ihrem Unterricht zu zwei Zeitpunkten. Bei der Auswahl der Feedbackfragebögen konnte zwischen den Schwerpunkten Klassenführung, Klassenklima und kognitive Aktivierung gewählt werden. Anschliessend verarbeiteten die Studierenden die Rückmeldungen schriftlich mittels eines Reflexionsbogens. Es wurde eine schriftliche Pre- und Posttest Befragung der Studierenden zu deren motivationalen und volitionalen Voraussetzungen sowie Erfahrungen mit Schülerrückmeldungen durchgeführt (Neuber & Göbel, 2018) wie auch die Feedbackbögen der Studierenden sowie der Schülerinnen und Schüler eingesammelt und mittels der Statistiksoftware SPSS analysiert. Die offenen Antworten aus den Feedbackfragebögen sowie die individuellen Reflexionen der Studierenden wurden inhaltsanalytisch unter anderem in Bezug auf Dimensionen von Unterrichtsqualität sowie Aspekte der Reflektion ausgewertet (Mayring, 2015). Die Schülerinnen und Schüler wurden nach Abschluss der Praktikumsphase in einem Fragebogen zu ihren Erfahrungen mit Schülerrückmeldungen befragt. Im Anschluss an die Untersuchung wurden Interviews mit ausgewählten Studierenden sowie Schülerinnen und Schülern geführt.

Die bisherigen Ergebnisse zeigen, dass sowohl die Studierenden als auch die Schülerinnen und Schüler Schülerfeedback grundsätzlich als wertvoll ansehen. In den individuellen Reflexionen wird deutlich, dass die angehenden Lehrpersonen ihren Unterricht sehr positiv bewerten. Auch berichten sie, dass die Schülerinnen und Schüler mehrheitlich positives Feedback gegeben haben. Die Auswertung der Reflexionen zeigt jedoch auch, dass sowohl in der Selbstwahrnehmung als auch in der berichteten Fremdwahrnehmung vor allem Merkmale von Unterrichtsqualität herangezogen wurden, die sich auf einer Sichtstruktur von Unterricht verorten lassen. Prozesse des Lernens wurden nur selten reflektiert. Die Ergebnisse der Auswertung der Feedbackfragebögen bestätigen zwar die von den Studierenden berichtete positive Unterrichtsbeurteilung der Lernenden, allerdings schätzen die angehenden Lehrpersonen ihren Unterricht signifikant besser ein als die Schülerinnen und Schüler. Erste Analysen der offenen Antworten aus den Feedbackfragebögen zeigen, dass die Wahrnehmungen der Schülerinnen und Schüler sehr heterogen sind und die generelle Rückmeldequalität als eher tief zu bezeichnen ist. Trotzdem ergeben sich konkrete Hinweise für die Unterrichtsentwicklung der Studierenden. Im Rahmen dieses Beitrags sollen Chancen wie auch Herausforderungen in Bezug auf den Einsatz von Schülerrückmeldungen als Instrument zur Unterrichtsreflexion diskutiert werden.

 

Rückmeldung gleich Rückmeldung? Befunde zur Relevanz von Schülerrückmeldungen zum eigenen Unterricht für die Unterrichtsreflexion und professionelle Entwicklung von Lehramtsstudierenden im Schulpraktikum

Katharina Neuber, Kerstin Göbel
Universität Duisburg-Essen

Das Thema Feedback spielt im Kontext des Lehrerberufs eine zentrale Rolle. Feedback in Form systematischer Rückmeldungen dient der Weiterentwicklung der eigenen Professionalität, da es die eigene Perspektive auf das Handeln im Unterricht sinnvoll erweitern kann (Altrichter, Posch & Spann, 2018). Auch im Rahmen schulpraktischer Phasen des Lehramtsstudiums stellt die Bereitstellung von Rückmeldungen zum unterrichtlichen Handeln von Studierenden ein zentrales Anliegen dar (Hascher, Baillod & Wehr, 2004). Zur Reflexion und Entwicklung des eigenen Unterrichts können Lehramtsstudierende in Praxisphasen auch die Rückmeldungen der Schülerinnen und Schüler nutzen; diese können der aktuellen Forschung folgend ausgewählte Aspekte der Unterrichtsqualität valide einschätzen (Lenske, 2016). Welche Relevanz die Unterrichtsrückmeldungen der Lernenden für die professionelle Entwicklung von Lehramtsstudierenden in Praxisphasen haben können, ist bislang jedoch noch wenig untersucht (Lawson, Çakmak, Gündüz & Busher, 2015).

Der Beitrag nimmt die Reflexion von Schülerrückmeldungen zum Unterricht im Praxissemester des Lehramtsstudiums in den Blick und stellt Befunde einer Interviewstudie vor, die im Rahmen des Forschungsprojekts ScRiPS an der Universität Duisburg-Essen durchgeführt wurde. Im ScRiPS-Projekt wurde der Einsatz von Schülerrückmeldungen zum Unterricht unter Rückgriff auf schriftliche Reflexionsbögen und kollegiale Reflexionsgespräche systematisch variiert und im Hinblick auf die Einstellungen zur Unterrichtsreflexion von Lehramtsstudierenden empirisch untersucht. Für die vorliegende Teilstudie des ScRiPS-Projekts wurden die persönlichen Erfahrungen der Praxissemesterstudierenden mit der Nutzung und Reflexion von Schülerrückmeldungen zum eigenen Unterricht in den Blick genommen. Hierzu wurden mithilfe leitfadengestützter Interviews insgesamt 17 Studierende befragt, die im Praxissemester Schülerrückmeldungen zum Unterricht genutzt und diese mithilfe der schriftlichen bzw. kollegialen Reflexionsgelegenheit reflektiert haben. Die Interviews wurden unter Anwendung der qualitativen Inhaltsanalyse nach Kuckartz (2016) ausgewertet. Für die Kodierungen der Kategorien wurde eine prozentuale Übereinstimmung von 84.95 % sowie eine Intercoderreliabilität nach Cohen’s Kappa von 0.80 erreicht.

Die Befunde der Interviewstudie verdeutlichen eine hohe Akzeptanz von Studierenden im Praxissemester gegenüber der Nutzung von Schülerrückmeldungen zum eigenen Unterricht. Die qualitativen Analysen zeigen, dass die inhaltliche Gestaltung der Schülerrückmeldungen zur Unterrichtsstunde für die Unterrichtsreflexion und für die professionelle Entwicklung der Studierenden im Praxissemester besonders relevant erscheint. Für Rückmeldungen, die sich auf konkrete Situationen im Unterricht beziehen und Aspekte der Klassenführung betreffen, zeigte sich zudem eine hohe praktische Relevanz im Sinne konkreter Handlungsvorsätze und Veränderungen im Unterricht. Insbesondere negative Rückmeldungen zu Aspekten der Klassenführung (z. B. Umgang mit Störungen) wurden im Rahmen der Interviews von den Studierenden reflektiert. Die Studierenden berichten, dass die Rückmeldungen der Lernenden sie dazu motiviert haben, strenger im Unterricht auftreten bzw. gezielter auf Unterrichtsstörungen reagieren zu wollen. Auch Schülerrückmeldungen zur Klarheit von Unterrichtsanweisungen oder zu eingesetzten Strukturierungshilfen im Unterricht wurden als praktisch relevant eingeschätzt, insbesondere im Hinblick auf das Zeitmanagement im Unterricht. Positive Rückmeldungen gehen mit einer (emotionalen) Bekräftigung und einer Fortführung bisheriger Verhaltensweisen der Studierenden einher, waren jedoch für aktive Veränderungen im Unterrichtshandeln der Praxissemesterstudierenden wenig relevant. Wenig differenzierte Rückmeldungen werden von den Studierenden im Hinblick auf eine geeignete Instrumentierung und Vorbereitungen der Lernenden auf die Rückmeldung reflektiert.

Die Befunde der Interviewstudie verdeutlichen die Relevanz der inhaltlichen Gestaltung von Schülerrückmeldeformaten zum Unterricht für die professionelle Entwicklung angehender Lehrkräfte im Kontext schulpraktischer Ausbildungsphasen, und weiterhin die Bereitschaft der Studierenden, über den Einsatz und die Instrumentierung von Schülerrückmeldungen nachzudenken. In weiteren Analysen muss in den Blick genommen werden, für welche Lernenden welche Rückmeldeformate geeignet sind und wie die Lernenden systematisch auf die Rückmeldung vorbereitet werden können, um differenzierte und konkrete Rückmeldungen zum Unterricht geben zu können.

 

Lernwirksame Unterrichtskommunikation aus Schüler/innensicht? Eine empirische Untersuchung im Praxissemester

Anne Israel, Alexander Gröschner, Mathias Dehne
Friedrich-Schiller-Universität Jena

HINTERGRUND

Unterrichtskommunikation ist ein relevanter Aspekt der Lehrer/in-Schüler/innen-Interaktion, der stark routinisiert abläuft (Howe & Abedin, 2013; Resnick, Asterhan & Clarke, 2015). Dabei profitieren Schüler/innen von einer lernwirksamen Unterrichtskommunikation, wenn Lehrpersonen eine aktive verbale Beteiligung fokussieren (Sedova et al., 2019) und kognitive sowie motivational-affektive Schülerlernprozesse anregen und unterstützen (Kiemer et al., 2015). Studien zur lernwirksamen Unterrichtskommunikation adressieren bislang vor allem Lehrpersonen im Beruf, weniger die Gruppe von Studierenden in der Ausbildung. Zudem liegen kaum Erhebungsinstrumente vor, die auch die Perspektive von Schüler/innen auf den Unterricht in den Blick nehmen (Osborne et al., 2019). Da Schüler/innenrückmeldungen zum Lehrpersonenhandeln im Praktikum nur selten eingeholt werden (Lawson et al., 2015), trägt die vorliegende Studie im Praxissemester neben der Entwicklung eines neuen Erhebungsinstruments auch neue Erkenntnisse zum Unterrichtshandeln von Studierenden im Praktikum bei.

Forschungsfragen:

1. Wie ist die Konstruktvalidität des Instruments zur Wahrnehmung lernwirksamer

Unterrichtskommunikation aus Schüler/innensicht? Was zeigen explorative (1.1.) sowie

konfirmatorische (1.2) Analysen?

2. Inwieweit bestehen Unterschiede in der Schülerwahrnehmung lernwirksamer

Unterrichtskommunikation von Studierenden im Praxissemester in Abhängigkeit der

Klassenstufe der Schüler/innen sowie den Fächern (bzw. Fächergruppen)?

METHODE

Im Rahmen der Studie wurden N=2676 Schüler/innen der Klassenstufe 5–12 in Thüringen (Mdn=7.00; MAlter=13.56, SD=1.97; 54.1% weiblich) durch Lehramtsstudierende im Praxissemester im Anschluss an eine eigene durchgeführte Unterrichtsstunde zu ihrer Unterrichtswahrnehmung befragt. Als Erhebungsinstrument wurde eine neue Skala zur „Wahrnehmung dialogischer Unterrichtskommunikation“ (ρ=.851; Gröschner, Jähne & Klaß, in press) auf die Perspektive von Schüler/innen angepasst. Der Fragebogen umfasst 14 Items, wobei in der Studie von Gröschner et al. (in press) die „Schüler/innenbeteiligung“ (Item: „Die Lehrperson hat immer die gleichen Schüler/innen dran genommen.“) sowie „Dialogizität“ (Item: „Die Lehrperson hat darauf geachtet, dass wir uns gegenseitig zuhören.“) als zwei Faktoren des Konstrukts identifiziert wurden. Um die Forschungsfrage 1 zu untersuchen, wurde die Stichprobe per Zufall bei der Hälfte geteilt. Im Rahmen der EFA-Analysen (1.1) wurden ein- bis fünffaktorielle Lösungen statistisch per χ2-Differenztest miteinander verglichen. Anschließend wurde die extrahierte Faktorlösung in CFA-Modellen überprüft (1.2). Die genestete Datenstruktur (Schüler/innen in Klassen) wurde in Mplus 7.4 mit dem Befehl type=complex berücksichtigt (NCluster=140). Um die Forschungsfrage 2 hinsichtlich

der Gruppenunterschiede zwischen Fächergruppen und Klassenstufen zu beantworten, wurden auf Basis der CFA-Analysen einfaktorielle ANOVAs mit anschließenden Post-Hoc-Tests berechnet. Fächergruppen wurden gruppiert nach Mathematik, Naturwissenschaften, Sprachen, Gesellschaftswissenschaften sowie musisch-künstlerische Fächer.

ERGEBNISSE

In Bezug auf die Forschungsfrage 1 zeigten EFA-Modelle eine statistisch wie auch inhaltlich plausible Faktorlösung mit zwei Faktoren (χ2[53]=139.82, p<.001, CFI=.967, RMSEA=.035 [.028, .042]), die signifikant von einer einfaktoriellen Lösung abweicht (Δχ2[12]=115.20, p<.001). Im CFA-Modell mit zwei Faktoren (χ2[43]=132.14, p<.001, CFI=.969, RMSEA=.039 [.032, .047]) resultierte eine hohe Faktorkorrelation (r=.898, p<.001), sodass auf Grund von Parsimonität und Differenzierbarkeit schließlich eine einfaktorielle Lösung (χ2[44]=150.60, p<.001, CFI=.963, RMSEA=.043 [.035, .050]) favorisiert wurde, die sowohl die Art der Schüler/innenbeteiligung als auch die Qualität der Unterrichtskommunikation umfasst. Die Ladungen in diesem Modell sind durchweg hoch ausgeprägt (λ: .447–.656). Hinsichtlich der zweiten Forschungsfrage zeigten sich Unterschiede zwischen den Fächergruppen (F[5, 1302]=11.90, p<.001), wobei Post-Hoc-Analysen insbesondere negative Unterschiede zwischen allen Fächergruppen und der musisch-künstlerischen Fächergruppe (ΔMMusik/Kunst: –.483 bis –.685, p<.001) verdeutlichen. Zwischen den Klassenstufen sind Unterschiede differenziell ausgeprägt (F[7, 1282]=5.89, p<.001). Post-Hoc-Analysen zeigten zusammenfassend, dass untere Klassen eher eine höher ausgeprägte lernwirksame Unterrichtskommunikation der Studierenden als Lehrpersonen wahrnehmen gegenüber höheren Klassenstufen (> Klasse 8).

DISKUSSION

Die Befunde zeigen, dass Schüler/innenwahrnehmungen zum Lernen der Studierenden im Praxissemester beitragen, wobei untere Klassen häufig eine positivere Einschätzung der Unterrichtskommunikation zeigen als Schüler/innen in höheren Klassenstufen (Sedova et al., 2019). Schüler/innen nehmen zudem in einem musisch-künstlerischen Fach eine geringere lernwirksame Unterrichtskommunikation wahr als Schüler/innen der anderen Fächergruppen. Limitationen (u.a. des Instruments) sowie Perspektiven (u.a. für die Unterrichtsgestaltung) für das Forschungsfeld werden im Vortrag erläutert.

 
14:30 - 16:15M14‒H06: From tools to theories: Wie nehmen statistische Modelle Einfluss auf unseren Erkenntnisgewinnn?
H06 
 

From tools to theories: Wie nehmen statistische Modelle Einfluss auf unseren Erkenntnisgewinn?

Chair(s): Sophie Stallasch (Universität Potsdam, Deutschland), Lena Keller (Universität Potsdam, Deutschland / Freie Universität Berlin, Deutschland), Martin Brunner (Universität Potsdam, Deutschland)

DiskutantIn(nen): Johannes Hartig (DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Frankfurt a. M., Deutschland)

Wissenschaftliche Erkenntnisse über Lehr-Lern-Prozesse und Bildungsergebnisse tragen substantiell dazu bei Bildung zu gestalten. So werden auf dieser Basis der Status quo oder Problemlagen im Bildungssystem erfasst, es können Interventionen geplant und durchgeführt sowie Perspektiven und Szenarien für gelingende Bildungsprozesse bewertet werden (z.B. Bromme, Prenzel, & Jäger, 2014). Im besten Fall münden die Ergebnisse der empirischen Bildungsforschung also in evidenzbasierten Entscheidungen in der Bildungspolitik und -praxis (Kultusministerkonferenz, 2015; Slavin, 2002). Dabei hängen die Befunde selbst sowie ihre Belastbarkeit und Aussagekraft auch von den gewählten Forschungsmethoden ab (Bromme et al., 2014).

Dieser Zusammenhang wird sehr eindrücklich in einer Allegorie von Eddington (1939; siehe Cacioppo & Bernston, 1994) dargestellt: Ein Wissenschaftler versucht die Größe der Fische im Meer zu bestimmen, indem er ein Fangnetz mit 5 cm weiten Maschen auswirft. Nach umfangreichem Fischen findet der Wissenschaftler keine Fische, die kleiner als 5 cm sind und schlussfolgert, dass es diese auch nicht gebe. Diese Allegorie zeigt auf, wie die Wahl unserer „methodischen Werkzeuge“ die empirische Befundlage und damit auch unsere Schlussfolgerungen beeinflussen kann. Das vorliegende Symposium diskutiert und illustriert anhand von vier Beispielstudien aus der Bildungsforschung wie statistische Modellierungsstrategien – also unsere methodischen „Fischernetze“ – Auswirkungen auf Forschungsergebnisse, Theorien und deren praktische Bedeutung haben können.

Der Beitrag von Keller et al. untersucht die Form des funktionalen Zusammenhangs zwischen Leistung und korrespondierenden Selbstkonzepten. Üblicherweise wird dieser Zusammenhang als linear modelliert. Mithilfe polynomialer Regressionen und Interrupted Regressions wird gezeigt, dass der Zusammenhang in Mathematik und im verbalen Bereich in der Sekundarstufe (und teilweise auch in der Primarstufe) besser mit nicht-linearen Modellen approximiert werden kann. Es werden repräsentative Daten dreier Large-Scale-Assessments (TIMSS, PIRLS, PISA) aus 13 Ländern genutzt.

Der Beitrag von Stallasch et al. beschäftigt sich mit cluster-randomisierten Studien, die mit dem Ziel geplant werden, verlässliches und (ökologisch-)valides Wissen zur Effektivität und Skalierbarkeit von Interventionen zur Kompetenzförderung zu schaffen. Es wird der Frage nachgegangen, wie sehr die Belastbarkeit der Ergebnisse solcher Interventionsstudien von methodischen Entscheidungen, konkret von der Wahl des Zeitabstandes und der inhaltlichen Passung zwischen Prätest und Kriterium, abhängt. Hierzu wird auf repräsentative Längsschnittdaten der Primar- und Sekundarstufe des Nationalen Bildungspanels (NEPS; Startkohorten 2 und 3) zurückgegriffen.

Der Beitrag von Nagy et al. analysiert, wie der Einfluss der Bearbeitungspersistenz auf die Schätzung des Zusammenhangs zwischen Kompetenz und Kovariaten in Leistungstests erfasst und kontrolliert werden kann. Dieser wird in gängigen Auswertungsverfahren meist vernachlässigt. Hierzu werden zwei verschiedene komplexere Item-Response-Modelle, das neu entwickelte C-HYBRID-Modell und das IRT-IPE-Modell, gegenübergestellt. In diesen werden Kovariatenbeziehungen der Kompetenz und Persistenz (unterschiedlich) modelliert. Die Ergebnisse werden schließlich mit denen des konventionellen, einfacheren 2PL-Modells verglichen. Es werden Lesetestdaten von Fünftklässlerinnen und Fünftklässlern aus Haupt- und Realschulen in Baden-Württemberg und Sachsen (TRAIN-Studie) verwendet.

Der Beitrag von Rieger et al. konzentriert sich auf die Anwendung von Marginal Structural Models zur Schätzung zeitlich variierender kausaler Effekte. Diese stellen eine Alternative zu konventionellen längsschnittlichen Cross-Lagged-Panel-Analysen dar. Dabei wird untersucht, wie die Auswahl unterschiedlicher Kovariatensets die Gewichtbildung und Effektschätzung in diesen Modellen beeinflusst. Die Auswirkungen auf die Studienergebnisse und auf die damit verbundenen kausalen Schlüsse werden am Beispiel des Einflusses der Lesehäufigkeit auf das Leseverständnis in der 5. bis 8. Klasse anhand von Längsschnittdaten aus Haupt- und Realschulen in Baden-Württemberg und Sachsen (TRAIN-Studie) illustriert.

 

Beiträge des Symposiums

 

Alles linear? Eine Untersuchung des funktionalen Zusammenhangs zwischen Leistung und akademischem Selbstkonzept im Rahmen einer integrativen Datenanalyse

Lena Keller1, Franzis Preckel2, Martin Brunner3
1Universität Potsdam, Deutschland / Freie Universität Berlin, Deutschland, 2Universität Trier, Deutschland, 3Universität Potsdam, Deutschland

Theoretischer Hintergrund: Leistung und akademische Selbstkonzepte sind bei Schülerinnen und Schülern (SuS) stark assoziiert. Empirische Studien und Theorien über den Zusammenhang zwischen Leistung und Selbstkonzept (wie z.B. das Internal/External Frame of Reference Model; Marsh, 1986) gehen meist (implizit) von einer linearen Beziehung zwischen den Konstrukten aus. Diese Annahme zum funktionalen Zusammenhang wurde jedoch bislang in empirischen Analysen kaum in Frage gestellt, obwohl die Ergebnisse einiger weniger Studien auf nicht-lineare Zusammenhänge hinweisen (Marsh, 2004; Möller & Pohlmann, 2010; Schurtz, Pfost, & Artelt, 2014). Dabei ist es aus theoretischer Sicht plausibel, dass die Beziehung zwischen Leistung und Selbstkonzept nicht über das gesamte Leistungskontinuum linear ist, da leistungsschwächere SuS bei der Bewertung ihrer eigenen Leistungen dazu neigen, selbstwertschützende Strategien anzuwenden um ein positives akademisches Selbstkonzept aufrechtzuerhalten (Alicke & Sedikides, 2009; Gramzow, Elliot, Asher, & McGregor, 2003). Da Selbstevaluationen und die Anwendung selbstwertschützender Strategien altersabhängig sind (Harter, 2012; Marsh, 1989), sind auch entwicklungsbedingte Unterschiede in der Form des funktionalen Zusammenhangs nicht auszuschließen.

Fragestellung: Im vorliegenden Beitrag soll im Rahmen einer integrativen Datenanalyse die Annahme der Linearität des Zusammenhangs von Leistung und akademischen Selbstkonzepten systematisch überprüft werden, und zwar in unterschiedlichen Domänen (Mathematik, verbaler Bereich), Altersgruppen (Primar- und Sekundarstufe) und 13 verschiedenen Ländern.

Methode: Basierend auf repräsentativen Daten dreier Large-Scale-Assessments (TIMSS, PIRLS und PISA; N = 470,804) wurden nicht-lineare Zusammenhangsmuster mithilfe quadratischer Regressionen sowie Interrupted Regressions (Simonsohn, 2018) in 13 Ländern bei SuS der Primarstufe (4. Klasse) und Sekundarstufe (8. Klasse, 15-Jährige) untersucht. Für die Analysen wurden diejenigen Länder ausgewählt, die sowohl an PISA 2000 als auch an TIMSS/PIRLS 2011 teilnahmen. In diesen Zyklen wurden Selbstkonzepte in beiden Domänen (Mathematik, verbaler Bereich) jeweils bei denselben SuS erhoben. Dies hat den Vorteil, dass die Zusammenhangsmuster in PISA bzw. TIMSS/PIRLS nur von der jeweiligen Domäne beeinflusst wurden, da andere konfundierende, personenbezogene Faktoren (z.B. SES, kognitive Fähigkeit, Kohortenzugehörigkeit) kontrolliert werden. Da die Ergebnisse einer einzelnen Studie durch Design, Stichprobe, sowie Messung und Quantifizierung der Konstrukte der Studie beeinflusst werden, wurde eine koordinierte Analyse durchgeführt, um die Robustheit und Generalisierbarkeit der Ergebnisse über mehrere Datensätze hinweg zu beurteilen (Hofer & Piccinin, 2009). In einer koordinierten Analyse, einer Form der integrativen Datenanalyse, wird zunächst das gleiche Analyseprotokoll auf unterschiedliche Datensätze angewendet. Danach werden die Ergebnisse mithilfe metaanalytischer Methoden zusammengefasst (Curran, & Hussong, 2009). Als zusätzliche Datensätze wurden TIMSS 2015, PIRLS 2016 sowie PISA 2003 und 2012 aufgenommen. Die Mathematik- und Leseleistung der SuS wurde mit Leistungstests erfasst. Die domänenspezifischen Selbstkonzepte wurden mit Selbstberichtskalen erhoben. Die Analysen wurden mit der Statistiksoftware R und den R-Paketen „BIFIEsurvey“, „mgcv” und „survey” durchgeführt. Fehlende Werte wurden mithilfe genesteter multipler Imputation mit dem R-Paket „miceadds“ imputiert.

Ergebnisse: Die Ergebnisse zeigen, dass nicht-lineare Zusammenhänge zwischen Leistung und korrespondierenden Selbstkonzepten in Mathematik und im verbalen Bereich bei SuS der Sekundarstufe vorlagen. Dabei deuten die Ergebnisse der quadratischen Regressionen und der Interrupted Regressions darauf hin, dass der Zusammenhang für leistungsschwächere SuS schwächer war als für leistungsstärkere SuS. Bei 15-Jährigen ging der Zusammenhang zwischen mathematischer Leistung und mathematischem Selbstkonzept für leistungsschwächere SuS sogar gegen Null, während er für leistungsstärkere SuS positiv war. Die positiven quadratischen Beziehungen in Mathematik konnten über drei (PISA 2000, 2003 und 2012) und zwei (TIMSS 2011 und 2015) Zyklen repliziert werden, was die Robustheit der Ergebnisse untermauert. Nicht-lineare Zusammenhänge zeigten sich auch für jüngere SuS, jedoch war die Befundlage für diese Altersgruppe über Länder und Analysemethoden hinweg heterogener.

Diskussion: Der Beitrag zeigt eindrücklich, dass vermeintlich etabliertes empirisches Wissen (hier: der funktionale Zusammenhang zwischen Leistung und Selbstkonzepten) von der verwendeten Methode (hier: lineares vs. nicht-lineares Modell) abhängig ist. Die Verwendung alternativer Methoden ist damit eine wichtige Voraussetzung für die Entwicklung empirisch abgesicherten Wissens.

 

Wie stark hängt die Belastbarkeit der Befunde cluster-randomisierter Interventionsstudien zur Kompetenzförderung vom Zeitabstand und der Domänenpassung von Prätests ab?

Sophie Stallasch1, Oliver Lüdtke2, Cordula Artelt3, Martin Brunner1
1Universität Potsdam, Deutschland, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Kiel, Deutschland / Zentrum für internationale Bildungsvergleichsstudien, München, Deutschland, 3Leibniz-Institut für Bildungsverläufe, Bamberg, Deutschland / Universität Bamberg, Deutschland

Theoretischer Hintergrund: Cluster-randomisierte Large-Scale-Studien (in welchen z.B. ganze Schulen zufällig den experimentellen Bedingungen zugewiesen werden) sind unverzichtbare Werkzeuge, um die Wirksamkeit von Interventionen zur Kompetenzförderung in ökologisch-validen Settings im großen Maßstab zu prüfen (Spybrook, Shi, & Kelcey, 2016). Ein wesentlicher Faktor für die Belastbarkeit dieser Studien ist ihre Designsensitivität. Diese lässt sich über die Minimum Detectable Effect Size (MDES; Bloom, 1995) quantifizieren, die den kleinstmöglichen standardisierten Mittelwertunterschied zwischen Interventions- und Kontrollgruppe erfasst, der bei gegebener Stichprobengröße mit hinreichender statistischer Power abgesichert werden kann (Power = .80, α= .05, zweiseitiger Test). Angestrebt wird typischerweise MDES ≤ .25 (Hill, Bloom, Black, & Lipsey, 2008). Eine der effizientesten Strategien zur Verbesserung der Designsensitivität ist die statistische Kontrolle von Prätestwerten, wodurch das „Signal-Rauschen-Verhältnis“ des Interventionseffekts deutlich optimiert werden kann (Konstantopoulos, 2012; Raudenbush, Martínez, & Spybrook, 2007). In der Praxis sind cluster-randomisierte Studien oftmals über mehrere Jahre implementiert und untersuchen mehrere Kompetenzdomänen. Inwiefern die Designsensitivität in Abhängigkeit des Zeitabstandes (z.B. Prätest vor 2 vs. 4 Jahren) oder der inhaltlichen Passung zwischen Prätest und Kriterium (z.B. Kriterium: Mathematik; Prätest: Mathematik vs. Lesen) variiert wurde bislang nur für die USA und überwiegend anhand von Zwei-Ebenen-Designs (Schülerinnen und Schüler [SuS] in Schulen) untersucht (z.B. Bloom, Richburg-Hayes, & Black, 2007).

Studienziel: Die Studie analysiert erstmals für den deutschen Bildungskontext auf Basis von Drei-Ebenen-Designs (SuS in Klassen in Schulen) die Auswirkungen (a) des Zeitabstandes und (b) der Domänenpassung zwischen Prätest und Kriterium auf die Designsensitivität, um die Belastbarkeit der Befunde cluster-randomisierter Studien abzuschätzen.

Methode: Die Analysen basierten auf bundesweit repräsentativen Längsschnittdaten von SuS der Startkohorten 2 (Kindergarten bis 4. Klasse; Primarstufe) und 3 (5. bis 9. Klasse, Sekundarstufe) des Nationalen Bildungspanels (NEPS; Blossfeld, Roßbach, & von Maurice, 2011). Die Stichprobengrößen variierten in Abhängigkeit des Kriteriums zwischen N = 4651 SuS (J = 627 Klassen, K = 239 Schulen; 9. Klasse) und N = 5554 (J = 888, K = 354; 3. Klasse). Als Kriterien wurden Kompetenzen in Mathematik (4. Klasse), Naturwissenschaften und Wortschatz (3. Klasse) für die Primarstufe sowie Mathematik, Lesen und Orthografie (9. Klasse) für die Sekundarstufe untersucht. Prätests lagen mit 1- bis 5-jährigem Zeitabstand vor. Über die Spezifikation von 47 Drei-Ebenen-Latent-(Covariate-)Modellen (Lüdtke et al., 2008) wurden Varianzkomponenten für die verschiedenen Kombinationen aus Prätest-Kriterium-Zeitabstand und Kompetenzdomäne geschätzt. Diese Varianzkomponenten wurden dann genutzt, um die Designsensitivität (MDES) beispielhaft für eine cluster-randomisierte Studie mit N = 1800 SuS (n = 20 SuS pro Klasse, j = 3 Klassen pro Schule, K = 30) zu illustrieren.

Ergebnisse: Für die Beispielstudie betrug die mittlere MDES in der Primarstufe .27 für einen 2-jährigen und .33 für einen 4-jährigen Zeitabstand zwischen domänenäquivalenten Prätests und Kriterien. Sofern Kriterien und Prätests verschiedenen Domänen angehörten, resultierten noch geringere Designsensitivitäten mit durchschnittlichen Werten von MDES = .30/.34 für das jeweils kürzeste/längste Prätest-Kriterium-Zeitintervall (1 bis 5 Jahre). In der Sekundarstufe blieb die MDES mit zunehmendem Zeitabstand zwischen Prätests und Kriterien im Mittel weitgehend stabil und stets kleiner als .25. Bei inhaltlicher Passung war die Designsensitivität etwas höher (Prätests vor 2/4 Jahren: mittlere MDES = .18/.21) als bei fehlender Passung (Prätests vor 2/4 Jahren: mittlere MDES = .24/.24). Dieses Befundmuster war auch nach kovarianzanalytischer Adjustierung um mittlere Kompetenzunterschiede zwischen Schulformen zu beobachten.

Diskussion: Insgesamt illustrieren die vorliegenden Ergebnisse, dass methodische Entscheidungen zur Wahl des Zeitabstands als auch zur inhaltlichen Passung von Prätestkovariaten die Belastbarkeit von cluster-randomisierten Interventionsstudien zur Kompetenzförderung (bemessen an deren Designsensitivität) in unterschiedlichem Maße beeinflussen können. Der Beitrag liefert damit praktisch-relevante Anhaltspunkte, um die Stichprobenplanung solcher Studien im deutschen Schulsystem zu unterstützen.

 

Evaluation von Korrelaten der Testleistung bei variierendem Testengagement: Anwendung von IRT-Modellen der Testbearbeitungspersistenz am Beispiel eines Lesetests

Gabriel Nagy1, Benjamin Nagengast2, Alexander Robitzsch1
1Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Kiel, Deutschland, 2Eberhard Karls Universität Tübingen, Deutschland

Theoretischer Hintergrund: Ein Ziel von Schulleistungsstudien ist die Bestimmung von Zusammenhängen zwischen Kompetenzen und Kovariaten. Die verwendeten Auswertungsverfahren basieren auf der impliziten Annahme, dass die Kompetenztests mit einem hohen Engagement bearbeitet werden. Diese Annahme steht im Widerspruch zu Befunden, die belegen, dass viele Personen eine geringe Testbearbeitungspersistenz aufweisen. So zeigt die Forschung zu Itempositionseffekten, dass die Wahrscheinlichkeit korrekter Antworten über den Verlauf der Testsitzung abnimmt (Debeer & Janssen, 2013) und die Forschung zum vorschnellen Antwortverhalten liefert Hinweise dafür, dass die Prävalenz des Rateverhaltens über den Testverlauf ansteigt (Wise, Pastor & Kong, 2009). Gängige Auswertungsverfahren vermengen Kompetenz und Persistenz. Somit stellt sich die Frage nach Möglichkeiten zur Abschätzung der Zusammenhänge von Kompetenz und Persistenz mit Kovariaten.

Studienziel: Im vorliegenden Beitrag werden Verfahren der Item Response Theorie (IRT) zur Erfassung und Kontrolle der Bearbeitungspersistenz vorgestellt. Die Ansätze werden um Kovariaten erweitert, sodass Kovariatenbeziehungen der Kompetenz und der Persistenz geschätzt werden können. Der erste Ansatz basiert auf der Modellierung variabler Itempositionseffekte (IRT-IPE-Modell; Debeer & Janssen, 2013), während das zweite Verfahren individuelle Unterschiede in den Übergangspunkten von engagierten zu nichtengagierten (Rateverhalten) Antwortprozessen schätzt (C-HYBRID-Modell; Nagy & Robitzsch, 2019). Die Modelle unterscheiden sich in der Spezifikation der Bearbeitungspersistenz und können somit zu unterschiedlichen Befunden führen.

Methode: Die Modelle werden anhand einer Stichprobe von Schülerinnen und Schülern der 5. Klasse, die im Rahmen der TRAIN-Studie erhoben wurden, veranschaulicht (N = 2774). Grundlage der Auswertungen bildete ein Leseverständnistest, der mit Maßen der Lesegeschwindigkeit in Verbindung gebracht wurde. Lesegeschwindigkeit lässt sich als eine Ressource verstehen, die gleichermaßen relevant für den Kompetenzerwerb und das situative Leseverhalten (Persistenz) ist. Von daher wurde erwartet, dass Lesegeschwindigkeit in den betrachteten Modellen mit der Kompetenz- und der Persistenzvariable assoziiert ist. Aufgrund der unterschiedlichen Spezifikation der Persistenzvariable erschienen graduelle Unterschiede in den Ergebnissen plausibel.

Ergebnisse: Als Ausgangspunkt wurde ein zweiparametrisches IRT-Modell (2PL) geschätzt. Gemessen am BIC-Index wies das 2PL-Modell die ungünstige Datenanpassung auf (BIC = 96725.0). In diesem Modell wurde die Korrelation zwischen Leseverständnis und Lesegeschwindigkeit auf r = .34 geschätzt. Das IRT-IPE-Modell erreichte eine günstigere Datenanpassung (BIC = 96516.1). Die Kompetenzkorrelation verringerte sich auf r = .28, während die Korrelation zwischen Lesegeschwindigkeit und Persistenz auf r = .14 geschätzt wurde. Im IRT-IPE-Modell betrug die Korrelation zwischen Kompetenz und Persistenz r = -.22. Das C-HYBRID-Modell wies die günstigste Datenanpassung auf (BIC = 96473.1), wobei die Kompetenzkorrelation gegenüber dem 2PL-Modell nahezu unverändert blieb (r = .32) und die Korrelation zwischen Lesegeschwindigkeit und Persistenz höher als im IRT-IPE-Modell geschätzt wurde (r = .33). Das C-HYBRID-Modell indizierte eine positive Kompetenz-Persistenz-Korrelation (r = .53).

Diskussion: Die Befunde liefern erneut Belege für die Existenz individueller Unterschiede in der Persistenz der Testbearbeitung. Die komplexen IRT-Modelle führten aber zu graduell unterschiedlichen Schlussfolgerungen. Dieser Befund verdeutlicht die Bedeutung einer theoretisch fundierten Spezifikation der Bearbeitungspersistenz. Vor diesem Hintergrund gilt festzuhalten, dass die Befunde des C-HYBRID-Modells eine höhere Übereinstimmung mit Befunden zum Rateverhalten in Leistungstests aufwiesen (Wiese et al., 2009). Die Integration des IRT-IPE- und des C-HYBRID-Modells zu einem übergreifenden Modell wird diskutiert.

 

Die Schätzung von zeitlich variierenden kausalen Effekten mit Längsschnittdaten: Wie stark beeinflusst die Kovariatenauswahl die Ergebnisse von Marginal Structural Models?

Sven Rieger1, Oliver Lüdtke2, Ulrich Trautwein1, Benjamin Nagengast1
1Eberhard Karls Universität Tübingen, Deutschland, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Kiel, Deutschland / Zentrum für internationale Bildungsvergleichsstudien, München, Deutschland

Theoretischer Hintergrund: Marginal Structural Models sind eine Klasse statistischer Modelle, die zur Schätzung von zeitlich variierenden kausalen Effekten in längsschnittlich angelegten Studien verwendet werden (Robins, Hernán, & Brumback, 2000). In einem mehrschrittigen Verfahren werden zunächst sogenannte Inverse Probability Treatment Weights geschätzt, welche anschließend bei der Effektschätzung modellbasiert berücksichtigt werden. Bei der Generierung der Gewichte sollen Kovariaten berücksichtigt werden, die sowohl mit der Zielvariable als auch mit der Treatment-Variable zusammenhängen (VanderWeele, 2019). Um die Strong Ignorability-Annahme zu rechtfertigen (Rosenbaum & Rubin, 1983), wird hierbei generell eine inklusive Kovariatenauswahl vorgeschlagen, in der auch nicht-lineare Effekte von Kovariaten berücksichtigt werden. Die inklusive Strategie der Berücksichtigung von Kovariaten ist allerdings mit dem Problem verbunden, dass bei einer großen Anzahl von Kovariaten (relativ zur Stichprobengröße) die Schätzung der Gewichte instabil werden kann.

Fragestellung: In der vorliegenden Untersuchung sollen folgende Fragen beantwortet werden: (1) Inwiefern wirkt sich die Auswahl verschiedener Kovariaten (z.B. nur Prätestvariablen, Prätestvariablen und zeitlich-invariante Kontrollvariablen, Prätestvariablen, zeitlich-invariante und zeitlich-abhängige Kontrollvariablen) auf die Gewichtbildung und deren Eigenschaften (z.B. Streuung und Kurtosis) aus? (2) Daran anknüpfend: Inwiefern wirken sich unterschiedliche Verfahren (z.B. unterschiedliche Algorithmen) und Vorgehensweisen (z.B. Aufnahme von nicht-linearen Effekten) zur Bestimmung der Gewichte auf die Effekt- bzw. Standardfehlerschätzung der Modelle aus? Diese Fragen sollen anhand einer Fragestellung aus der Leseforschung (der Einfluss der Lesehäufigkeit auf das Leseverständnis) betrachtet werden.

Methode: Die Daten für die vorliegende Untersuchung stammen aus der Studie „Tradition und Innovation: Entwicklungsverläufe an Haupt- und Realschulen in Baden-Württemberg und Mittelschulen in Sachsen“ (TRAIN; Jonkmann, Rose, & Trautwein, 2013).

Stichprobe. Genutzt wurden Daten der fünften bis achten Klassenstufe (136 Klassen). Es wurde sich auf die Startkohorte der 5. Klassenstufe beschränkt (N = 2.894 Schülerinnen und Schüler).

Instrumente. Die Lesehäufigkeit wurde mit einem Item gemessen („Wie oft liest du in deiner Freizeit einfach aus Spaß?“). Folgenden Antwortmöglichkeiten waren vorgegeben: 1 = nie, 2 = bis zu 30 Minuten täglich, 3 = 30 bis 60 Minuten, 4 = 1 bis 2 Stunden, 5 = mehr als 2 Stunden täglich. Die Erfassung des Leseverständnisses erfolgte anhand eines rotierten Matrix- bzw. Itemblockdesigns mit 60 bis 87 Items pro Messzeitpunkt. Der Leistungstest wurde anhand von Modellen aus der Item-Response-Theorie skaliert und es wurden Weighted Maximum Likelihood Estimates (WLEs; Warm, 1989) als Personenparameterschätzer generiert. WLE-Reliabilitäten reichten von .72 bis .80. Für die Gewichtbildung wurden folgende Kovariaten (zusätzlich zu den Prätestmessungen von Lesehäufigkeit und Leseverständnis) verwendet: Geschlecht, Migrationshintergrund, sozioökonomischer Hintergrund, Bücher im Haushalt, Schulform, Lese-Rechtschreib-Schwäche, Noten in Deutsch und Mathematik, Lesefreude, Leseschwierigkeiten, Selbstkonzept, Interesse, Anstrengungsbereitschaft in Deutsch, verbale kognitive Fähigkeit.

Statistische Analyse. Die Gewichte wurden mit verschiedenen Verfahren (z.B. Propensity Score Weighting, [Non-Parametric] Covariate Balancing Propensity Score Methodology) gebildet, welche in dem R-Paket „WeightIt“ (Greifer, 2019) implementiert sind. Die Effekte der Lesehäufigkeit auf das Leseverständnis wurden anhand generalisierter linearer Modelle (svyglm-Funktion aus dem R-Paket „survey“; Lumley, 2017) geschätzt. Diese Modelle ermöglichen die simultane Berücksichtig von Gewichten und die Korrektur der Standardfehler (Schülerinnen und Schüler genestet in Klassen). Fehlende Werte wurden zuvor durch das Verfahren der Multiplen Imputation in Mplus geschätzt (Enders, 2010).

Ergebnisse: Die Eigenschaften der Gewichte sowie die Effekt- bzw. Standardfehlerschätzung der Regressionsmodelle variieren in Abhängigkeit der unterschiedlichen Sets an Kovariaten (Anzahl und Inklusion von nicht-linearen Effekten). Die Ergebnismuster umspannen sowohl positiv signifikante Effekte der Lesehäufigkeit auf das Leseverständnis als auch Nulleffekte.

Diskussion: Die Ergebnisse werden kritisch diskutiert und werden mit Blick auf aktuelle Themen wie Open Science, Questionable Research Practices und Researcher Degrees of Freedom betrachtet. Es lässt sich zusammenfassend festhalten, dass die Kovariatenauswahl maßgeblich die Studienergebnisse und somit auch die jeweils gezogenen Schlussfolgerungen beeinflussen (können).

 
16:45 - 18:30M16‒H06: Zur Genese sozialer Ungleichheit in der Schule
H06 
 

Zur Genese sozialer Ungleichheit in der Schule

Chair(s): Hermann Josef Abs (Universität Duisburg-Essen, Deutschland)

DiskutantIn(nen): Linda Juang (Universität Potsdam)

Schulische Bildung wird gesamtgesellschaftlich hinsichtlich ihrer Effektivität und auch nach der Verteilung von Bildungschancen beurteilt (Bischof, 2017). Vor dem Hintergrund unzureichender Effektivität interessieren Bildungschancen, weil ihre Erhöhung für Schülergruppen, die zuvor strukturell geringere Chancen aufwiesen, zu einer Erhöhung der insgesamt erzielten Effektivität beiträgt (Quenzel & Hurrelmann, 2019). Von daher ist es (auch) aus einer Perspektive der Schuleffektivitätsforschung relevant, besser zu versehen, wie soziale Ungleichheit in Schule entsteht und welche Ansatzpunkte genutzt werden können, um präventiv gegen Ungleichheit zu arbeiten. Das vorliegende Symposium leistet dazu vier Beiträge. Die beiden ersten Beiträge fokussieren auf Angebotsmerkmale des Schulsystems (Beitrag 1) bzw. der Schule (Beitrag 2), während die beiden letzten Beiträge sich einer akteurstheoretischen Perspektive öffnen und (auch) den Einstellungen der Schüler*innen (Beitrag 3), bzw. den Verhaltensoptionen für Eltern (Beitrag 4) zuwenden.

Beitrag 1 (Bayer, Jude) nutzt den PISA 2012 Datensatz für Deutschland mit dem Schwerpunkt Mathematik. Die Analysen nehmen ihren Ausgangspunkt bei der Mehrgliedrigkeit des deutschen Schulsystems. Mehrgliedrigkeit als Strukturmerkmal zielt auf die Allokation von unterschiedlich leistungsstarken Schüler*innen in die verschiedenen Schularten. Der Beitrag bleibt jedoch nicht dabei stehen, sondern zeigt auf, wie die Zusammensetzung der Schülerschaft und die schulartspezifischen inhaltlichen Anforderungen der Lehrpläne zu einer geringeren Unterrichtsqualität in einzelnen Schularten beitragen. Der Dreiklang aus Schülerkomposition, Systemvorgaben und dadurch mitbedingter Unterrichtsqualität trägt zu einer besseren Aufklärung von Disparitäten bei.

Beitrag 2 (Deimel, Abs) verwendet die Daten aus ICCS 2016 für Belgien (Flandern), Deutschland (NRW), Dänemark und die Niederlande zur politischen Bildung. Die Analysen nehmen Ihren Ausgangspunkt bei der sozioökonomischen Zusammensetzung der Schülerschaft. Unabhängig vom Schulsystem korrelieren sozioökonomische Disparitäten mit Bildungsergebnissen. Der Beitrag stellt dar, wie sich die sozioökonomische Komposition von Schulklassen differentiell auf die Wahrnehmung von schulischen Lerngelegenheiten auswirkt. Dabei werden behandelte Unterrichtsinhalte (formell), Klassenklima (informell) und Schülerpartizipation (extracurricular) als Dimensionen der Lerngelegenheiten unterschieden. Die Chancen an formellen Lerngelegenheiten zu partizipieren erweisen sich als relativ gleichmäßiger verteilt, als die Teilhabechancen an informellen oder extracurricularen Lerngelegenheiten.

Beitrag 3 (Silke, Jude, Sälzer, Rohlfs, Kriegbaum) nutzt die PISA 2015 bzw. 2018 Datensätze mit einem Schwerpunkt zu naturwissenschaftlichen Kompetenzen. Der Beitrag fragt, inwiefern paradoxe Befunde zum Verhältnis von Aspiration und Leistung in Schülergruppen mit Zuwanderungshintergrund aufgelöst werden können, wenn unterschiedliche Merkmale der Schulkultur (Zugehörigkeitsgefühl) und der Lehrer-Schüler-Beziehung in Analysen einbezogen werden. Bei Schülerinnen mit Zuwanderungshintergrund erweisen sich Merkmale der Schulkultur anders als bei Schüler*innen ohne Zuwanderungshintergrund nicht als prädiktiv für die Leistung. Dahingegen erweisen sich Merkmale der Lehrer-Schüler-Beziehung bei Schüler*innen mit Zuwanderungsgeschichte als umfassender prädiktiv. Dies liefert zwar schon an sich Ansatzpunkte zur schulischen Arbeit, aber auch unter Kontrolle der zusätzlichen Leistungsprädiktoren bleiben die paradoxen Befunde zu Aspiration und Leistung bestehen.

Mit Beitrag 4 (Täschner, Hillmayr, Holzberger) wechselt die Perspektive von der schulischen Bedingungsanalyse sozial ungleich verteilter Bildungsergebnisse zur Prävention. Dabei wird differenziert auf Elternbeteiligung fokussiert. Elternbeteiligung interessiert im Sinne (a) einer akademischen Sozialisation im Elternhaus, (b) einer Elternmitwirkung in der Schule, und (c) des schulbezogenen Unterstützungsverhaltens der Eltern zuhause. Der Beitrag nutzt bestehende Metaanalysen und Literaturübersichten für ein „second order review“. Das Review geht der Frage nach, inwiefern sich differentiellen Effekte unterschiedlicher Formen von Elternbeteiligung für Schüler*innen mit Zuwanderungsgeschichte und mit niedrigem sozioökonomischem Status im Unterschied zu Schüler*innen ohne Zuwanderungsgeschichte bzw. mit höherem sozioökonomischem Status zeigen.

Insgesamt tragen die Beiträge des Symposiums zu einem tieferen Verständnis der Genese sozialer Ungleichheit in der Schule bei und eröffnen somit Perspektiven für neue Ansätze der Prävention auf den unterschiedlichen Ebenen der Gestaltung von Schule und pädagogischer Professionalisierung.

 

Beiträge des Symposiums

 

Bedeutung des selektiven Bildungssystems in Deutschland für die Prozesse des Mathematikunterrichts in der 9. Klasse

Sonja Bayer, Nina Jude
DIPF| Leibniz-Institut für Bildungsforschung und Bildungsinformation

Theoretischer Hintergrund & Fragestellung. Welche Schulart die Lernenden besuchen, entscheidet maßgeblich über den weiteren Bildungsverlauf (Ditton & Krüsken 2010). Dies bezieht sich nicht nur auf Unterschiede zwischen den Schularten in den angebotenen Fächern und auf die Wahrscheinlichkeit, einen bestimmten Abschluss zu erzielen, sondern auch auf die kognitiven und affektiven Entwicklungsmöglichkeiten der Lernenden: Vergleichende Untersuchungen legen offen, dass sich die Leistungsentwicklung der Lernenden in allgemeinen Kompetenzbereichen wie Mathematik oder Lesen zwischen den Schularten unterscheidet und zwar auch dann, wenn die individuellen Eingangsleistungen berücksichtigt werden (Becker et al. 2012; Guill et al. 2017; Pfost et al. 2010). Die jeweiligen Bedingungen von Schule und Unterricht scheinen also unterschiedlich förderlich für die kognitive wie auch die nicht kognitive Entwicklung der Lernenden zu sein (Bayer 2019).

Es stellt sich die Frage, was zu den unterschiedlichen Entwicklungsmöglichkeiten der Lernenden innerhalb der Schularten führt. Aus der Forschung zu Kompositionseffekten, welche den Einfluss der Schülergruppe auf die Leistungsentwicklung des einzelnen Lernenden untersucht, kann gefolgert werden, dass die spezifische Zusammensetzung der Schülergruppe an den Schularten eine Ursache sein kann (Dumont et al. 2013). In Abgrenzung zur Zusammensetzung der Schülergruppe werden in der Literatur Merkmale der Institution als Ursache für unterschiedliche Entwicklungsmöglichkeiten an den verschiedenen Schularten genannt. Hier gelten der Lehrplan, die Lehrerbildung sowie die Unterrichtsziele und methoden als Einflussfaktoren für die Entwicklungsmöglichkeiten der Lernenden (bspw. Baumert et al. 2006; Becker et al. 2012; Baumert et al. 2011; Scharenberg 2012). Ziel der Analysen in diesem Beitrag ist es, zum einen die Unterrichtsprozesse sowie die potentiellen Einflussfaktoren vergleichend zwischen den Schularten zu betrachten und zum anderen die potentiellen Vermittlungsmechanismen für Unterschiede in den Unterrichtsprozessen empirisch zu untersuchen (Bayer 2019).

Methode. Für die Analysen werden Daten der nationalen PISA 2012 Studie herangezogen, welche den Schwerpunkt auf den Mathematikunterricht der 9. Klasse legt und die Beschreibung des Unterrichts auf Klassenebene erlaubt (Heine et al. 2017; Prenzel et al. 2013). Die 2596 Schülerinnen (51,1 %) und Schüler (48,9 %) dieses Subsamples gingen in 220 Klassen, welche sich auf die vier untersuchten Schularten wie folgt verteilen: 30 Klassen gehören Schulen mit mehreren Bildungsgängen an, 66 Klassen waren an Realschulen und 21 Klassen an integrierten Gesamtschulen. Gymnasien stellen mit einer Anzahl von 103 Klassen den größten Anteil. Zusätzlich zu den Angaben der Lernenden werden die Aussagen der zugehörigen Mathematiklehrkräfte einbezogen.

Ergebnisse. Die deskriptive Beschreibung der Schularten basiert auf den auf Klassenebene aggregierten Schülerdaten sowie den Daten der Mathematiklehrkräfte. Die Schulartunterschiede werden varianzanalytisch unter Einbezug von Eta-quadrat betrachtet. Um potentielle Vermittlungsmechanismen für Unterschiede in den Unterrichtsprozessen zwischen den Schularten zu ergründen, werden Mediationsanalysen berechnet, wobei Merkmale der Schülergruppe, der Lehrenden und der Unterrichtsinhalte als Mediatoren untersucht werden.

Die Analysen zeigen, dass sich die Klassenmittelwerte der Schularten bei etwa der Hälfte der Merkmale bedeutend unterscheiden, wobei die Rangfolge der Schularten merkmalsabhängig variiert. Besondere Unterschiede finden sich bei Merkmalen, welche die kognitive Aktivierung adressieren. So sind Unterschiede zwischen den Schularten in den Überzeugungen der Lehrenden, den Unterrichtsinhalten und den Unterrichtsprozessen bezüglich der kognitiven Aktivierung und der Vermittlung von fachwissenschaftlichen Konzepten deutlich. Die großen Mittelwertdifferenzen im formativen Assessment und in schülerorientierten Unterrichtsmethoden zeigen darüber hinaus auch bedeutende Unterschiede im unterstützenden Umgang mit den Lernenden. Als vermittelnde Mechanismen für Unterschiede in den Unterrichtsprozessen zwischen den Schularten können Merkmale die Leistungskomposition sowie der Anteil reiner Mathematik im Unterricht identifiziert werden. Intendierte Schulartunterschiede in der Leistungskomposition und den Unterrichtsinhalten führen demnach zu Unterschieden in der Unterrichtsqualität. Daran schließt sich die Frage an, ob die intendierten Unterschiede der Schularten aus heutiger Perspektive haltbar sind.

 

Ungleicher Zugang zu schulischen Lerngelegenheiten begrenzt eine kompensatorische Funktion von Schule in der politischen Sozialisation von sozial benachteiligten Jugendlichen

Daniel Deimel, Hermann Josef Abs
Universität Duisburg-Essen

Theoretischer Hintergrund & Fragestellung. Politische Sozialisation vollzieht sich differentiell. Sozioökonomisch benachteiligte Jugendliche zeigen sich generell seltener bereit, zukünftig politisch zu partizipieren (Schulz et al., 2018). Dies lässt sich auf direkte und indirekte Einflüsse des Elternhauses rückführen. Direkte Einflüsse stehen mit dem Grad der Politisierung einer Familie in Zusammenhang. In stärker politisierten Familien sind politische Lerngelegenheiten vielfältiger und zahlreicher (Jennings, Stoker & Bowers, 2009). Der Grad der Politisierung hängt dabei vom Einkommen und Bildungsstand der Eltern ab (Hoskins & Janmaat, 2019). In weniger politisierten Familien gewinnt die politische Sozialisationsinstanz Schule relativ an Wichtigkeit. Indirekte familiäre Einflüsse verweisen auf die Platzierung eines Kindes in der Sozialstruktur (Glass, Bengtson & Dunham, 1986). Der elterliche soziale Status beeinflusst aufgrund direkter und indirekter Stratifizierung den Besuch einer konkreten Schule (Salchegger, 2016) und somit den Zugriff auf in diesem Fall politische Bildungsressourcen, die u.a. von Kompositionsmerkmalen der Klassen bestimmt werden (Scheerens, 2009). Die Effizienz schulischer politischer Bildung ist somit vor allem von der Interaktion direkter und indirekter Sozialisationseinflüsse abhängig. Vor diesem Hintergrund stellen sich zwei Fragen: Haben Jugendliche, unabhängig von ihrem sozioökonomischen Hintergrund, einen gleichen Zugang zu Lerngelegenheiten in der Schule, in denen sie politische Partizipationsbereitschaft entwickeln können? Inwiefern können diese Lerngelegenheiten dazu beitragen, Disparitäten in der politischen Sozialisation zu kompensieren?

Prinzipiell lassen sich drei verschiedene Arten von politischen Lerngelegenheiten in der Schule unterscheiden (Dassonneville, Quintelier, Hooghe & Claes, 2012): (1.) formalisierte politische Lerngelegenheiten, in denen etwa im Rahmen von Fachunterricht Wissen über politische Strukturen, Prozesse, Inhalte und Akteure vermittelt wird; (2.) ein offenes Klassenklima bei der Diskussion politischer Inhalte im Unterricht, welches den Austausch kontroverser Positionen begünstigt; sowie (3.) schulische Partizipationsmöglichkeiten, in denen Jugendliche anhand realweltlich situierter Probleme realistische Erwartungen an (politische) Partizipationsprozesse entwickeln können. Diese drei Modi schulischer politischer Lerngelegenheiten können sich auf den Zusammenhang zwischen individuellem sozioökonomischen Hintergrund und politischer Partizipationsbereitschaft prinzipiell entweder kompensierend oder negativ verstärkend auswirken (Campbell, 2008): kompensierend, wenn die Politische Bildung in der Schule einen größeren Effekt bei Schüler*innen mit ungünstigem sozioökonomischen Hintergrund hat und negativ verstärkend, wenn ein größerer Effekt bei Schüler*innen mit günstigem sozioökonomischen Hintergrund beschreibbar ist. Weiter lässt sich beurteilen, inwieweit benachteiligte und nicht-benachteiligte Jugendliche einen gleichen Zugang zu Lerngelegenheiten haben, die positiv mit ihrer politischen Partizipationsbereitschaft zusammenhängen (Hoskins, Janmaat & Melis, 2017).

Methode. Der Beitrag fokussiert auf die Teilstichproben der International Civic and Citizenship Education Study (ICCS 2016; Schulz et al., 2018) in Belgien (Flandern), Dänemark, Deutschland (NRW) und den Niederlanden mit insgesamt N=13.500 Schüler*innen in Jahrgangsstufe 8. Die Studie erfasst unter anderem politisches Wissen, politische Orientierungen sowie die schulischen Kontexte politischer Sozialisation. Der Beitrag nutzt einen Mehrebenen-Regressionsansatz (Raudenbush & Bryk, 2002) sowie Moderationsanalysen.

Ergebnisse. Insgesamt zeigt sich, dass schulische Lerngelegenheiten nur sehr begrenzt zu einer Annäherung der politischen Partizipationsbereitschaft von benachteiligten und nicht-benachteiligten Jugendlichen beitragen. Am ehesten dazu geeignet scheinen formalisierte politische Lerngelegenheiten, mit denen dies in Dänemark, Deutschland (NRW) und den Niederlanden gelingt. Ein offenes Diskussionsklima und die Erfahrung mit schulischer Partizipation stehen zwar unabhängig vom sozioökonomischen Hintergrund der Jugendlichen in positivem Zusammenhang mit ihrer Bereitschaft, sich zukünftig an Wahlen zu beteiligen. Allerdings unterliegen diese Lerngelegenheiten Kompositionseffekten: je niedriger der durchschnittliche sozioökonomische Hintergrund einer Klasse, desto weniger diskursiv wird der Unterricht eingeschätzt und desto seltener wurden schulische Partizipationsgelegenheiten individuell genutzt. Der Zugang zu diesen Lerngelegenheiten erweist sich für Schüler in Klassen mit ungünstigerem sozioökonomischem Hintergrund erschwert (Deimel et al., 2019). Wenn eine Änderung der Klassenkompositionen politisch nicht zur Disposition steht, stellt sich die Frage, wie Partizipationsmöglichkeiten und diskursives Klassenklima so gestaltet werden können, dass Sie auch bei ungünstigeren Kompositionen stärker positiv wahrgenommen werden.

 

Das Einstellungs-Leistungs-Paradoxon im Sekundarschulbereich

Silke Hertel1, Nina Jude2, Christine Sälzer3, Carsten Rohlfs4, Katharina Kriegbaum1
1Ruprecht-Karls Universität Heidelberg, 2DIPF| Leibniz-Institut für Bildungsforschung und Bildungsinformation, 3Universität Stuttgart, 4Pädagogische Hochschule Heidelberg

Theoretischer Hintergrund. Das Einstellungs-Leistungs-Paradoxon beschreibt das Phänomen, dass Schüler*innen trotz hoher Bildungsaspirationen und positiver Einstellungen zu Bildung schwache schulische Leistungen zeigen. Vor dem Hintergrund ausgeprägter sozialer Disparitäten an Schulen in Deutschland kommt dem eine hohe Bedeutung zu. Schüler*innen mit Zuwanderungshintergrund oder aus bildungsfernen Schichten weisen häufiger schlechtere akademische Leistungen auf als ihre Mitschüler*innen (z.B. Gebhardt et al., 2013; Jencks & Phillips, 1998; Rohlfs, 2011). Demgegenüber steht der Befund, dass Schüler*innen mit Zuwanderungshintergrund häufiger positive und optimistische Einstellungen zu Bildung aufweisen und hohe Bildungsaspirationen berichten (z.B. Kao & Tienda, 1998; Ogbu, 2008; Phalet and Claeys, 1993). Diese Befunde zeigen sich auch in internationalen Large-Scale-Assessments wie TIMMS und PISA (z.B. Lu & Bolt, 2015).

In der Literatur werden verschiedene Erklärungsmodelle diskutiert, die von unterschiedlichen Wirkmechanismen unspezifischer und spezifischer Einstellungen (u.a., Mickelson, 1990) über den „Big Fish Little Pond Effekt“ (z.B. Marsh et al., 2008) bis hin zu Antwortstil-Effekten im Kontext von Large-Scale-Assessments (z.B. Lu & Bolt, 2015) reichen.

Der vorliegende Beitrag zielt darauf ab, die Perspektive auf das Einstellungs-Leistungs-Paradoxon zu erweitern, indem zusätzlich zu den leistungsbezogenen Einstellungen auch Kerndimensionen von Schul- und Unterrichtsqualität betrachtet werden, um Leistungsunterschiede zu erklären. Hierzu gehören bspw. das Zugehörigkeitsgefühl zur Schule, die wahrgenommene Fairness und die Unterstützung der Lehrperson sowie das Klassenklima.

Fragestellung

1. Welchen Beitrag leisten schulbezogene Einstellungen zur Erklärung von schulischen Leistungen bei Schülerinnen und Schülern?

2. Welchen darüber hinausgehende Rolle spielen Merkmale der Schul- und Unterrichtsqualität?

3. Zeigen sich Unterschiede in den Zusammenhängen zwischen schulbezogenen Einstellungen und schulischen Leistungen bei Schüler*innen in Abhängigkeit vom Zuwanderungshintergrund?

Methode. Die Analysen beziehen sich auf Daten von N=5635 fünfzehnjährigen Schüler*innen der PISA 2015 –Stichprobe in Deutschland. Die Einstellungen der Schüler*innen wurden mittels Fragebogen erfasst. Die Reliabilitäten der Skalen lagen zwischen =.79 und =.89. Die Auswertungen erfolgten mit dem IDB Data Analyzer. In schrittweisen Mehrebenen-Regressionsanalysen – getrennt nach Gruppen mit und ohne Zuwanderungshintergrund – wurden sowohl die individuellen Einstellungen als auch die Merkmale von Schul- und Unterrichtsqualität als Prädiktoren für die Leistungen in den Naturwissenschaften aufgenommen.

Ergebnisse. Im Durchschnitt weisen Mädchen in den Naturwissenschaften niedrigere Kompetenzwerte auf als Jungen. Schüler*innen aus bildungsfernen Schichten sowie jene mit Zuwanderungshintergrund verfügen im Mittel über geringere Kompetenzen in den Naturwissenschaften als ihre Mitschüler*innen, die keiner benachteiligten Gruppe angehören.

Bezogen auf Forschungsfragen 1 und 2 zeigt sich, dass die Motivation der Schülerinnen und Schüler, ihr Zugehörigkeitsgefühl an der Schule, das Gefühl, von der Lehrperson fair behandelt und unterstützt zu werden sowie ein gutes Klassenklima mit höheren Kompetenzwerten in den Naturwissenschaften einhergehen. Hingegen weisen Schüler*innen, die über Schulangst berichten, schwächere Leistungen in den Naturwissenschaften auf.

Bei einer differenziellen Betrachtung der Unterschiede zwischen Schüler*innen mit und ohne Zuwanderungshintergrund (Forschungsfrage 3) zeigen sich Unterschiede bezogen auf die Zusammenhänge zwischen Motivation, Zugehörigkeitsempfinden und Unterstützung durch die Lehrperson mit den naturwissenschaftlichen Kompetenzen. Bei Schüler*innen mit Zuwanderungshintergrund korrelieren Motivation oder Zugehörigkeitsgefühl nicht systematisch mit den Kompetenzen im Bereich der Naturwissenschaften. Bei Jugendlichen ohne Zuwanderungshintergrund zeigt sich hingegen ein positiver Zusammenhang. Wahrgenommene Fairness der Lehrperson sowie ein positives Klassenklima stehen in beiden Gruppen in positivem Zusammenhang mit den Lernleistungen. Die wahrgenommene Unterstützung durch die Lehrperson hingegen ist nur in der Gruppe der Schüler*innen mit Zuwanderungshintergrund ein signifikanter Faktor für den Lernerfolg.

Die Befunde weisen darauf hin, dass sich das Einstellungs-Leistungs-Paradoxon auch bei Einbezug von Indikatoren für die Schul- und Unterrichtsqualität zeigt. Allerdings leisten Letztere auch einen eigenständigen Beitrag zur Erklärung von Kompetenzunterschieden zwischen Schüler*innen mit und ohne Zuwanderungshintergrund. Einschränkend ist die querschnittliche Anlage der Studie hervorzuheben, die keine kausalen Schlussfolgerungen erlaubt. Die Analysen werden mit Daten aus PISA 2018 repliziert, sodass auf der Tagung ergänzende Befunde aus dem aktuellsten PISA-Zyklus vorgestellt werden können.

 

Inwiefern kann Elternbeteiligung den schulischen Erfolg von benachteiligten Kindern fördern? Ein systematischer Überblick

Janina Täschner, Delia Hillmayr, Doris Holzberger
TU München, Zentrum für internationale Bildungsvergleichsstudien

Theoretischer Hintergrund. Bei der Frage, wie innerhalb der bestehenden Schulsysteme Schülerinnen und Schüler mit Migrationshintergrund oder mit niedrigem sozioökonomischem Status effektiv gefördert werden können, sind in den letzten Jahren vermehrt die Eltern in den Blick genommen worden (z.B. Hill & Tyson, 2009; Jeynes, 2003, 2007).

Die Beteiligung der Eltern an schulischen Prozessen ihrer Kinder wird in der internationalen Fachliteratur unter dem Begriff „parental involvement“ zusammengefasst (Boonk, Gijselaers, Ritzen, & Brand-Gruwel, 2018; Hill & Tyson, 2009). Hill und Tyson (2009) gliedern „parental involvement“ in die drei Dimensionen „academic socialization“, „school-based parental involvement“ und „home-based parental involvement“. In Anlehnung an diese Autoren gehören elterliche Bildungserwartungen etwa zur Dimension „academic socialization“. Elterliche Aktivitäten in der Schule (z.B. Mitwirkung im Elternbeirat) werden als „school-based parental involvement“ aufgefasst und die häusliche Hausaufgabenunterstützung oder gemeinsame Museumsbesuche fallen unter die Dimension „home-based parental involvement“.

In den letzten Jahren sind aufgrund der umfassenden Primärstudienlage einige Forschungssynthesen zu diesem Thema entstanden, die darauf hindeuten, dass „parental involvement“ den Schulerfolg von Schülerinnen und Schülern positiv beeinflussen kann (Hill & Tyson, 2009, 2009; Jeynes, 2003, 2007; Wilder, 2014). In diesen Studien zeigen sich zum Teil unterschiedlich hohe Effekte je nach Dimension des „parental involvements“ (Hill & Tyson, 2009) sowie je nach untersuchter Schülergruppe (Jeynes, 2003). Hill und Tyson (2009) kommen zu dem Ergebnis, dass die Dimension „academic socialization“ den größten positiven Zusammenhang mit der Schulleistung aufweist, während „home-based parental involvement“ nicht immer leistungsförderlich zu sein scheint. Auch verschiedene Indikatoren für den Schulerfolg können die Stärke des Zusammenhangs beeinflussen (Wilder, 2014). So zeigt sich bei Fan und Chen (2001) ein stärkerer Zusammenhang zwischen „parental involvement“ und Schulleistung, wenn der gesamte Notendurchschnitt zur Messung herangezogen wird im Vergleich zu einer einzelnen fachspezifischen Note (Fan & Chen, 2001).

Besonders für die Zielgruppe der benachteiligten Schülerinnen und Schüler, hier Schülerinnen und Schüler mit Migrationshintergrund oder niedrigem sozioökonomischem Status, kann „parental involvement“ ein entscheidender Faktor für schulischen Erfolg sein (z.B. Jeynes, 2003).

In bestehenden Forschungssynthesen wird diese Zielgruppe teilweise in der untersuchten Stichprobe berücksichtigt. Allerdings fehlt es an einer systematischen Auswertung dieser Forschungsbefunde und damit an evidenzbasiertem Wissen über die Auswirkungen der Elternbeteiligung auf den schulischen Erfolg von benachteiligten Schülerinnen und Schülern.

Fragestellung. Inwiefern können die unterschiedlichen Dimensionen des „parental involvement“ den schulischen Erfolg von Schülerinnen und Schülern mit Migrationshintergrund bzw. niedrigem sozioökonomischem Status fördern?

Methode. Zur Beantwortung der Fragestellungen wird ein Second-Order-Review durchgeführt (vgl. Siddaway, Wood, & Hedges, 2019). Zunächst erfolgte eine systematische Literaturrecherche in den internationalen Datenbanken PsycINFO, ERIC, EducationSource, Web of Science und ProQuest. Die dafür verwendeten Begriffe deckten die drei für die Fragestellung entscheidenden Bereiche „schulischer Erfolg“, „Elternbeteiligung“ und „Forschungssynthese“ ab. Für die Suche wurden datenbankspezifische Deskriptoren sowie theoriegestützte Synonyme verwendet. Die elektronische Suche ergab 1654 Treffer. Für die weitere Auswertung wurden diejenigen Studien eingeschlossen, die die folgenden Kriterien erfüllten:

Die Studie ist eine Meta-Analyse oder ein systematisches Review. Die Art der Elternbeteiligung ist spezifiziert und kann einer der drei genannten Dimensionen zugeordnet werden. Es wird eine Form des schulischen Erfolgs in Abhängigkeit von der elterlichen Beteiligung untersucht. Die Treffer werden derzeit hinsichtlich dieser Einschlusskriterien kodiert.

Ergebnisse. Die Forschungssynthese fasst den internationalen Forschungsstand zur Auswirkung von „parental involvement“ auf den Schulerfolg von Schülerinnen und Schülern mit Migrationshintergrund bzw. niedrigem sozioökonomischen Status systematisch zusammen. Dabei wird besonders auf die unterschiedliche Bedeutung der drei Dimensionen des „parental involvement“ für den schulischen Erfolg dieser Zielgruppe eingegangen. Schließlich soll diese Forschungsarbeit die evidenzbasierte Grundlage für die Frage der Praxis liefern, an welcher Stelle schulbasierte Elternprogramme für benachteiligte Schülerinnen und Schüler sinnvoll ansetzen können.

 

Datum: Donnerstag, 26.03.2020
9:00 - 10:45D9‒H06: Individualisierung im mathematisch-naturwissenschaftlichen Unterricht
H06 
 

Individualisierung im mathematisch-naturwissenschaftlichen Unterricht

Chair(s): Helena van Vorst (Universität zu Köln, Deutschland)

DiskutantIn(nen): Silvia-Iris Beutel (Technische Universität Dortmund)

Theoretische Einführung

Individualisierung, Binnendifferenzierung oder individuelle Förderung sind zu schillernden Begriffen der deutschen Bildungslandschaft geworden und stehen nicht zuletzt aufgrund der anhaltenden Inklusionsdebatte im Fokus bildungspolitischer Diskussionen. Dabei werden die unterschiedlichen Begrifflichkeiten zur Beschreibung der Adaptivität der inhaltlichen und strukturellen Gestaltung des Unterrichts an die Voraussetzungen und Bedarfe von Schülerinnen und Schülern häufig synonym genutzt, ohne dass eine klare Abgrenzung der dahinterliegenden Konzepte erfolgt (Klieme & Warwas, 2011). Damit einhergehend ist auch eine Vielseitigkeit der Umsetzungsmöglichkeiten adaptiver Unterrichtskonzepte. Dixon und Kollegen (2014) unterscheiden in diesem Zusammenhang eine Inhaltsdimension, mit der z. B. eine Unterscheidung der bearbeiteten Themen einhergeht, eine Prozessdimension, die eine Variation der methodischen und medialen Zugänge umfasst, und eine Produktdimension, die sich der Frage nach dem erwarteten Ergebnis des Lernprozesses widmet. Trotz der hohen bildungspolitischen Bedeutung der Anpassung schulischer Lernprozesse an die Voraussetzungen der Lernenden ist die Frage nach den Effekten eines individualisierten bzw. binnendifferenzierten Unterrichts nur unzureichend geklärt. Hattie (2009) berichtet in seiner Metastudie über keine nennenswerten Effekte. Kritisch sei hier jedoch angemerkt, dass die Vergleichbarkeit unterschiedlicher Studien aufgrund der Vielseitigkeit der Umsetzungsmöglichkeiten von Binnendifferenzierung oder individueller Förderung sowie der methodischen Anlage der Untersuchungen kaum möglich ist. Bohl, Batzel und Richey (2012) verweisen zudem auf die zahlreichen Voraussetzungen, die für eine erfolgreiche Adaptivität im Unterricht notwendig sind, wie beispielsweise eine offene und positive Haltung und Einstellung sowie entsprechende Kompetenzen der Lehrkräfte, das Vorhandensein materieller, räumlicher und zeitlicher Ressourcen vor Ort sowie eine entsprechende Programmatik der Einzelschule. Betrachtet man den naturwissenschaftlichen Unterricht im Speziellen zeigen die internationalen Ergebnisse der PISA-Studie 2015 einen positiven Zusammenhang zwischen der wahrgenommenen Häufigkeit adaptiver Verfahren im Unterricht und der erreichten Leistung (OECD, 2016). Gleichzeitig berichtet mehr als die Hälfte der Schülerinnen und Schüler in Deutschland über eine nur seltene oder gar keine Differenzierung in ihrem naturwissenschaftlichen Unterricht.

Ziele des Symposiums

Ausgehend von der bildungspolitischen Bedeutung einer angepassten Gestaltung schulischer Lernprozesse und der gleichzeitigen noch unzureichenden Forschungslage in diesem Bereich ist es das zentrale Ziel des Symposiums, einen vertieften Blick auf die theoretische sowie empirische Situation der Thematik aus der Perspektive mathematisch-naturwissenschaftlicher Fächer zu nehmen. Im ersten Beitrag werden dazu zunächst die unterschiedlichen Begriffe und Konzepte, wie Binnendifferenzierung, individuelle Förderung oder adaptiver Unterricht aus einer forschungstheoretischen Perspektive beleuchtet und kritisch diskutiert, sodass ein Beitrag zur Klärung und Abgrenzung der wesentlichen Begriffe dieses Themenfeldes erfolgt. Diese theoretische Einführung legt eine Grundlage für eine Verortung der übrigen Beiträge des Symposiums, die einen empirischen Blick auf die Effektivität unterschiedlicher Individualisierungsansätze werfen. Dabei wird zunächst ein Fokus auf das Fach Mathematik gelegt. Der Beitrag untersucht die Zusammenhänge zwischen Individualisierungsstrategien von Lehrkräften und der erlebten Motivationsqualität von Schülerinnen und Schülern mithilfe einer Mehrebenenpfadanalyse. Im Anschluss wird in einem dritten Symposiumsbeitrag das Experimentieren als Instrument der Erkenntnisgewinnung in den Naturwissenschaften fokussiert. Ziel des Beitrags ist es, Anforderungen an die Gestaltung individualisierter Experimentiersituationen im Unterricht abzuleiten, indem mithilfe einer Videostudie individualisierte Lernprozesse von Schülerinnen und Schülern während des Experimentierens untersucht werden. Der letzte Beitrag des Symposiums adressiert die binnendifferenzierte Förderung der Modellkompetenz von Lernenden unter Zuhilfenahme des Kompetenzmodells der Modellkompetenz nach Upmeier zu Belzen und Krüger (2010). Im Rahmen einer Interventionsstudie im Prä-Post-Kontrollgruppendesign wurde die Effektivität einer binnendifferenzierten Fördermaßnahme zum reflektierten Umgang mit Modellen im Chemieunterricht untersucht.

Insgesamt erlaubt das Symposium damit ausgehend von einer theoretischen Fundierung der relevanten Konstrukte einen breiten Zugang zu unterschiedlichen Perspektiven der Adaptation mathematisch-naturwissenschaftlichen Lernens. Mithilfe differenzieller methodischer Zugänge werden unterschiedliche Facetten der Differenzierung und individuellen Förderung angesprochen und auf exemplarische Fächer angewendet, sodass eine umfassende Diskussion über adaptive Ansätze des mathematisch-naturwissenschaftlichen Unterrichts ermöglicht wird.

 

Beiträge des Symposiums

 

Individualisierung und individuelle Förderung im (adaptiven) Unterricht – eine konzeptuelle und empirische Betrachtung

Hanna Dumont
DIPF - Leibniz-Institut für Bildungsforschung und Bildungsinformation

Im Rahmen der Diskussion um den adäquaten Umgang mit Heterogenität im Schulkontext wird in Bildungspolitik, Bildungspraxis und auch in der Bildungsforschung zunehmend eine Individualisierung des Unterrichtsangebots und eine individuelle Förderung der Schülerinnen und Schüler gefordert. Dabei wird jedoch selten expliziert, was darunter im Einzelnen verstanden wird und wie dies im regulären Unterricht umgesetzt werden kann. Das Fehlen eines einheitlichen Verständnisses von Individualisierung und individueller Förderung erschwert dabei nicht nur ihre Umsetzung in der Schulpraxis, sondern auch ihre systematische empirische Untersuchung. Vor diesem Hintergrund ist das Ziel des vorliegenden Beitrags, die Individualisierung des Unterrichtsangebots bzw. die individuelle Förderung von Schülerinnen und Schülern im Unterricht konzeptuell zu schärfen und zu konkretisieren. Anschließend wird darauf eingegangen, welche Konsequenzen und Herausforderungen sich für die empirische Untersuchung von Individualisierung und individueller Förderung im Unterricht ergeben.

Im wissenschaftlichen Diskurs lässt sich eine Reihe von Konzepten ausmachen, die eine Individualisierung von Unterricht bzw. eine individuelle Förderung von Schülerinnen und Schülern im Unterricht zum Kern haben oder thematisieren. Als bedeutsamstes Konzept ist dabei der sogenannte adaptive Unterricht zu nennen. Im adaptiven Unterricht wird das Unterrichtsangebot – gleichermaßen bestehend aus Phasen des selbstgesteuerten, instruktionsbasierten und kooperativen Lernens – kontinuierlich an die individuellen Lernvoraussetzungen der einzelnen Schülerinnen und Schüler angepasst wird (Corno, 2008). Zudem werden die Schülerinnen und Schüler im adaptiven Unterricht im Laufe der Zeit zunehmend dazu befähigt, ihren eigenen Lernprozess zu steuern (Van de Pol, Volman & Beishuizen, 2010). Entsprechend steht auch das Konzept des selbstregulierten Lernens (Pintrich, 2000) in einem engen Zusammenhang mit der Individualisierung von Unterricht. Ziel ist es, für jeden Einzelnen die richtige Balance zwischen Steuerung durch die Lehrkraft und Selbststeuerung zu finden (De Corte, 2010). Damit die Lehrkräfte wissen, wie viel Unterstützung sie wann bereitstellen müssen bzw. wann sie den einzelnen Schülerinnen und Schülern die Verantwortung übergeben, ist eine kontinuierliche, informelle Evaluation des Lernfortschritts erforderlich (Randi & Corno, 2005) – im Sinne eines formativen Assessments (Black & William, 2009). Die Anpassung des Unterrichtsangebots an die Lernvoraussetzungen der Schülerinnen und Schüler lässt sich durch den Einsatz von Methoden der Binnendifferenzierung in quantitativer, methodischer, medialer, qualitativer und inhaltlicher Hinsicht (Bräu und Schwerdt 2005) umsetzen. Da die Umsetzung einer solch umfassenden Differenzierung in einem klassisch lehrerzentrierten Unterrichtsarrangement an seine Grenzen stößt, wird wiederum eine Öffnung des Unterrichts notwendig (Brüning und Saum 2010), das heißt eine Flexibilisierung von Raum, Zeit und Sozialform sowie eine Bereitstellung unterschiedlicher Lern und Unterrichtsmethoden. Entsprechend führt eine konsequente Individualisierung und individueller Förderung im Unterricht häufig zu einer Dezentralisierung des Unterrichtsgeschehens sowie zu simultan stattfindenden Lehr-Lernprozessen.

Diese tiefgreifenden Veränderungen der Natur und Struktur von Unterricht mögen ein Grund dafür sein, dass es bislang kaum empirische Erkenntnisse über die Gelingensbedingungen und die Wirksamkeit von Individualisierung im adaptiven Unterricht gibt. So praktizieren erst wenige Schulen diese Art von Unterricht, was die empirische Untersuchung im Rahmen von repräsentativen Zufallsstichproben – die für die empirische Unterrichtsforschung typisch sind – schwierig macht (Dumont, 2016). Darüber hinaus ist die Analyse eines dezentralisierten Unterrichts, in dem verschiedene Unterrichtsaktivitäten zur gleichen Zeit stattfinden und sich die Schülerinnen und Schüler mit unterschiedlichen Unterrichtsgegenständen beschäftigen, in studienadministrativer, methodischer und inhaltlicher Hinsicht extrem komplex (Rademacher, 2017) und erfordert die Anpassung der üblichen Erhebungsverfahren zur Messung von Unterrichtsqualität.

 

Individualisierung im Mathematikunterricht: Welche Bedeutung hat Individualisierung für Motivationsqualität und Motivation in der Sekundarstufe?

Rebecca Lazarides1, Charlott Rubach2
1Universität Potsdam, 2University of California, Irvine, USA

(1) Theoretischer Hintergrund

Individuelle Förderung im Unterricht kann als Gesamtunterrichtsstrategie betrachtet werden, die sämtliche Unterrichtsaktivitäten einschließt (Dumont, 2019). Individualisierung gilt als ein Konzept einer solchen individuellen Förderung, bei dem das erzieherische Handeln der Lehrkräfte unter systematischer Berücksichtigung personaler Lern- und Bildungsvoraussetzungen der Lernenden im Vordergrund steht (Klieme & Warwas, 2011). Während Forschungsarbeiten auf eine eher geringe Bedeutung der Individualisierung für die Leistung Lernender verweisen (Effektstärke: 0.23; Hattie, 2008), ist bislang wenig bekannt über die Zusammenhänge zur Motivation Lernender in der Schule. Besonders im Fach Mathematik sind solche Fragen auf Grund des kontinuierlichen starken Absinkens der Motivation Lernender relevant (Fredricks & Eccles, 2002). Laut Selbstbestimmungstheorie der Motivation (Deci & Ryan, 2002) ist das Erleben von Autonomie, Kompetenz und sozialer Eingebundenheit eine notwendige Voraussetzung für selbstbestimmte Lernprozesse, die wiederum eine intrinsisch motivierte und an Erkenntnisgewinn ausgerichtete Auseinandersetzung mit dem Lerngegenstand begünstigen. Basierend auf bisherigen empirischen Ergebnissen kann angenommen werden, dass Lehrkräfte die Bedürfnisse der Lernenden im individualisierten Unterricht stärker berücksichtigen und so eine motivationsförderliche effektivere Unterstützung gelingt (McCombs, 2010). Daran anknüpfend könnte in Anlehnung an die Selbstbestimmungstheorie (Deci & Ryan, 2002) angenommen werden, dass ein individualisierter Unterricht zur Motivationsförderung beiträgt.

(2) Fragestellung

In der vorliegenden Studie verbinden wir Arbeiten der Unterrichtsforschung zur Individualisierung (Dumont, 2019; Klieme & Warwas, 2011) mit Arbeiten der Motivationspsychologie (Deci & Ryan, 2002) und untersuchen die Zusammenhänge zwischen von Lehrkräften berichteten Individualisierungsstrategien und der von Lernenden erlebten Motivationsqualität (Kompetenz- und Autonomieunterstützung und sozialer Eingebundenheit) im Fach Mathematik. Dabei gehen wir auch der Frage nach, inwiefern die von Lernenden berichtete Motivationsqualität mögliche Effekte der Individualisierung auf die Motivation Lernender im Mathematikunterricht auf Klassenebene erklären kann.

(3) Methode

Für die vorliegende Studie wurden Daten von 708 Lernenden (53,3 % weiblich; M = 14.59, SD = 0.88; 48,3% Integrierte Sekundarstufe/ 51,7 % Gymnasium) der neunten und zehnten Klasse (51,8 %) sowie die Angaben ihrer Mathematiklehrkräfte (N = 37; 55 % männlich) mittels Mehrebenenpfadanalysen ausgewertet. Die Lehrkräfte berichteten inwiefern sie in ihrem Mathematikunterricht Strategien der Individualisierung nutzten (z.B. „Bei der Stillarbeit variiere ich die Aufgabenstellungen, um Schülerinnen und Schüler unterschiedlicher Leistungsstärke gerecht zu werden.“; α =.85). Die Lernenden berichteten Angaben zur wahrgenommenen Unterstützung der Autonomieunterstützung (α=.74; ICC=.07), Kompetenzunterstützung (α=.76; ICC=.12), der sozialen Eingebundenheit im Mathematikunterricht (α=.77; ICC=.07), sowie zu ihrer Lernzielorientierung (α=.81; ICC=.08) und ihrer intrinsischen Motivation in Mathematik (α=.90; ICC=.03).

(4) Ergebnisse und Diskussion

Die Ergebnisse zeigen, dass die von den Mathematiklehrkräften berichtete Individualisierung im Mathematikunterricht in keinem direkten signifikanten Zusammenhang zur Lernzielorientierung oder der intrinsischen Motivation einer Klasse steht. Allerdings zeigten sich signifikant positive Effekte der berichteten Individualisierung im Mathematikunterricht auf die durch Schülerinnen und Schüler wahrgenommene Autonomie- und Kompetenzunterstützung, nicht aber auf die wahrgenommene soziale Eingebundenheit. Die in der Klasse wahrgenommene Autonomie- und Kompetenzunterstützung stehen in positivem Zusammenhang zur Lernzielorientierung im Fach Mathematik. Der indirekte Effekt von der Individualisierung im Unterricht über die Autonomie- und Kompetenzunterstützung der Lernenden auf die Lernzielorientierung war nicht signifikant (Individualisierung – Autonomieerleben – Lernzielorientierung: βind = .11, SE = 0.07, p > .05, 95 % CI [-.06, .24]; Individualisierung – Kompetenzerleben– Lernzielorientierung: βind = .11, SE = 0.09, p > .05, 95 % CI [-.06, .29]). Insgesamt verweisen die Ergebnisse darauf, dass die leistungsbezogene Individualisierung im Mathematikunterricht ein sinnvolles Mittel sein kann, um motivationsförderliche Lerngelegenheiten im Fach Mathematik zu gestalten, die wiederum eine an Lern- und Erkenntnisgewinn ausgerichtete Auseinandersetzung mit mathematischen Inhalten ermöglichen. Der Mehrwert der Studie liegt in der ersten explorativen Untersuchung des Zusammenwirkens der Individualisierung und Motivationsqualität des Unterrichts.

 

Jeder experimentiert anders - Individuelle Lernprozesse beim Experimentieren im Fach Chemie

Dennis Kirstein, Sebastian Habig, Maik Walpuski
Universität Duisburg-Essen

Individuelle Förderung spielt im naturwissenschaftlichen eine wichtige Rolle, damit jede Schülerin und jeder Schüler bei der Entwicklung einer naturwissenschaftlichen Grundbildung angemessen unterstützt werden kann (KMK, 2004; AAAS, 1990). Eine Schlüsselfunktion zur Entwicklung dafür notwendiger Kompetenzen nimmt im naturwissenschaftlichen Unterricht das Experimentieren ein (Wirth et al., 2008; Lederman et al., 2013). Bisherige Befunde zu individueller Förderung und Differenzierung (vgl. u.a. Anus, 2016; Kallweit, 2015; Groß, 2013) erlauben bisher keinen spezifischen Blick auf das Lernen beim Experimentieren. Als wichtige Voraussetzung wird zwar immer wieder der Einsatz offener und kooperativer Lernaufgaben (u.a. Altrichter et al., 2009) mit einer hohen Passung zwischen den individuellen Lernvoraussetzungen, den Lerngelegenheiten sowie angebotenen Unterstützungsformaten (Wagner, 2016) gefordert. Allerdings fehlt es zur Umsetzung bisher an spezifischem Wissen in Bezug auf das Lernen mit Experimenten. Ziel des hier vorgestellten Projekts ist es daher, die individuellen Lernprozesse von Schülerinnen und Schülern beim kooperativen Experimentieren näher zu untersuchen und Anforderungen an die Gestaltung individueller Förderangebote beim Experimentieren abzuleiten.

Dazu wurden kooperative Experimentieraufgaben zu den Themen Batterien, Ozeanversauerung und Mineralwasser in neun Klassen mit 146 Schülerinnen und Schülern der neunten Jahrgangsstufe an unterschiedlichen allgemeinbildenden Schulformen in Nordrhein-Westfalen im Fach Chemie eingesetzt und die Bearbeitung von 93 Schülerinnen und Schülern videographiert. Unmittelbar vor der Bearbeitung wurden das chemische Fachwissen über die bearbeiteten Inhalte (Celik & Walpuski, 2019; eigene Entwicklung), die kognitiven Fähigkeiten (Heller & Perleth, 2000) sowie das Wissen über naturwissenschaftliche Arbeitsweisen (Mannel, 2009; Koenen, 2014) mit Hilfe von Leistungstests erfasst. Der individuelle Lernerfolg wurde über den Einsatz des Tests zum chemischen Fachwissen vor und nach der Bearbeitung der Experimentieraufgaben operationalisiert.

Die Auswertung der Leistungsdaten erfolgte IRT-basiert mit Hilfe des Test-Analysis-Modules (TAM) in R (Robitzsch, Kiefer, & Wu, 2019). Hierbei zeigt sich eine hinreichend gute Qualität der Tests zu den kognitiven Fähigkeiten (RelEAP = .726; 0.83 < wMNSQ < 1.10; -1.30 < t < 1.40) und dem Wissen über naturwissenschaftliche Arbeitsweisen (RelEAP = .689; 0.87 < wMNSQ < 1.16; -1.23 < t < 1.82). Im Gegensatz dazu weist der Test zum chemischen Fachwissen (RelEAP (Pre/Post) = .552/.674; 0.65 < wMNSQ < 2.91; -3.00 < t < 2.86) einer weniger gute Eignung zur Erfassung des Konstrukts auf. Der Lernprozess wurde im Rahmen einer qualitativen Inhaltsanalyse (Mayring, 2015) induktiv aus dem Videomaterial rekonstruiert. Dazu wurden sämtliche aufgabenspezifischen Lernaktivitäten bei der Bearbeitung der Experimentieraufgaben in einem Kodiermanual systematisch zusammengetragen. In einem nächsten Schritt wurde das Kodiermanual zur Auswertung von 23 Arbeitsphasen zufällig ausgewählten Kleingruppen durch zwei unabhängige Kodierer angewendet. Die Qualität der Analyse liegt über alle Kleingruppen in einem akzeptablen bis guten Bereich (0.43 < κCohen < 0.72). In der quantifizierenden Betrachtung der über die Videolänge standardisierten Häufigkeiten einzelner Kategorien zeigte sich, dass mit steigender Heterogenität in der Kleingruppe im Fachwissen (Unterschied zwischen dem besten und dem schlechtesten Lerner innerhalb einer Kleingruppe) Aktivitäten zum Planen (r = .469; p = .024) und Auswerten (r = .691; p = .000) zunehmen, während gleichzeitig das experimentelle Tätigkeiten (r = -.358; p = .093) und reine Beobachtungen (r = -.470; p = .024) weniger Zeit in Anspruch nehmen. Insgesamt erlauben diese Erkenntnisse jedoch nur eine differenzierte Förderung einzelner Gruppen. Darüber hinaus scheinen die Aktivitäten auf der Gruppenebene nicht die individuellen Aktivitäten einzelner Schülerinnen und Schüler zu repräsentieren. Daher wurde in einem weiteren Schritt die Aktivitäten einzelner Schülerinnen und Schüler innerhalb des Gruppenprozesses einer Kleingruppe untersucht. Erste Ergebnisse dieses Vorgehens zeigen, dass eine Individualdiagnose von Aktivitäten beim kooperativen Experimentieren zu einer deutlich besseren Qualität der Diagnose führen (0.74 < κCohen < 0.89). Aktuell wird die Ausprägung individueller Aktivitäten sowie deren Einfluss auf den individuellen Lernerfolg an einer größeren Stichprobe näher untersucht. Im Vortrag werden die Ergebnisse der Analysen vorgestellt.

 

Binnendifferenzierte Förderung von Modellkompetenz im naturwissenschaftlichen Unterricht

Helena van Vorst1, Martina Strübe2
1Universität zu Köln, 2Universität Duisburg-Essen

Theoretischer Hintergrund

Modelle spielen in den Naturwissenschaften eine wichtige Rolle (Harrison & Treagust, 2000). Deshalb ist die Entwicklung einer Modellkompetenz ein wichtiges Ziel des naturwissenschaftlichen Unterrichts. Unter Modellkompetenz wird dabei die Fähigkeit verstanden, „[…] mit Modellen zweckbezogen Erkenntnisse gewinnen zu können und über Modelle […] urteilen zu können, […] über den Prozess der Erkenntnisgewinnung durch Modelle […] zu reflektieren sowie die Bereitschaft, diese Fähigkeiten in problemhaltigen Situationen anzuwenden“ (Upmeier zu Belzen & Krüger, 2010, S. 49). Um die Entwicklung von Modellkompetenz systematisch zu beschreiben, entwickelten Upmeier zu Belzen und Krüger (2010) ein Kompetenzmodell der Modellkompetenz, in welchem sie verschiedene Dimensionen und Teilkompetenzen auf drei Kompetenzstufen beschreiben.

Untersuchungen zur Modellkompetenz von Lernenden zeigen, dass ein Großteil der Schülerschaft nur über eine geringe Modellkompetenz verfügt (z.B. Grosslight, Unger & Jay, 1991; Leisner, 2005), diese jedoch im Verlauf der Sekundarstufen zunimmt und damit erlernbar ist (Terzer, 2013). Krell, Upmeier zu Belzen und Krüger (2012) sowie Gehlen (2016) zeigen außerdem in ihren Untersuchen, dass Lernende in den verschiedenen Teilkompetenzen unterschiedliche Niveaustufen der Modellkompetenz erreichen. Damit erscheint eine binnendifferenzierte Förderung der Modellkompetenz von Lernenden, anknüpfend am jeweiligen Vorwissen als geeigneter Ansatzpunkt für die Entwicklung einer umfassenden Modellkompetenz im naturwissenschaftlichen Unterricht.

Fragestellung

Ziel der vorgestellten Studie ist es, einen binnendifferenzierten Ansatz zur Förderung der Modellkompetenz von Lernenden zu entwickeln und zu evaluieren. Folgende Forschungsfragen sind leitend für diese Untersuchung:

FF1: Welchen Einfluss hat die binnendifferenzierte Förderung der Modellkompetenz auf die Entwicklung von Modellkompetenz im Verlauf einer Unterrichtseinheit im Chemieunterricht?

FF2: Welche Schülergruppe(n) profitieren von einer Förderung der Modellkompetenz im Chemieunterricht?

Methode

Zur Untersuchung der Forschungsfragen wurde eine Interventionsstudie im Prä-Post-Kontrollgruppendesign durchgeführt. Inhaltlich thematisierte die Intervention die Einführung des Bohrschen Atomkonzepts im Chemieunterricht, da gerade hier die Entwicklung einer Modellvorstellung der submikroskopischen Struktur der Materie eine besondere Relevanz erfährt. Für die etwa sechswöchige Intervention wurde ein integrierter Förderansatz gewählt, bei welchem die Förderung der Modellkompetenz in die Erarbeitung neuer Fachinhalte eingebettet wurde. Die Entwicklung der binnendifferenzierten Aufgaben für die Interventionsgruppe (IG) erfolgte entlang der Kompetenzstufen des Kompetenzmodells nach Upmeier zu Belzen und Krüger (2010). In der Kontrollgruppe (KG) erfolgte keine systematische Differenzierung der Modellkompetenz.

Um die Modellkompetenz der Lernenden vor und nach der Intervention zu erfassen, wurden insgesamt neun Items zu den einzelnen Teilkompetenzen des Kompetenzmodells im offenen Aufgabenformat entwickelt. Die schriftlichen Antworten wurden mithilfe eines Kodiermanuals durch zwei unabhängige Rater den drei Niveaustufen des Kompetenzmodells zugeordnet. Insgesamt nahmen 634 Schülerinnen und Schüler der Jahrgangsstufe 8 an Gymnasien an der Untersuchung teil. Für die Auswertung der offenen Aufgaben zur Modellkompetenz konnten jedoch nur Daten von 373 Lernenden berücksichtigt werden, da von den übrigen Teilnehmenden keine hinreichenden Datensätze zu beiden Messzeitpunkten vorlagen.

Ergebnisse

In Bezug auf die erste Forschungsfrage zeigt eine ANOVA mit Messwiederholung einen signifikanten Effekt der Zugehörigkeit zur IG oder KG auf die Entwicklung der Modellkompetenz (F(1,346) = 9.81, p < .001, ηp2 = .03). Dabei zeigen t-Tests für verbundene Stichproben einen signifikanten Zuwachs in der Modellkompetenz der Lernenden der IG (t(171) = 3.80, p < .001, d = .21), während die Modellkompetenz der KG signifikant abnimmt (t(175) = -2.58, p = .01, d = -.17).

Betrachtet man vor dem Hintergrund der zweiten Forschungsfrage die Ergebnisse getrennt nach unterschiedlichen Leistungsgruppen, zeigt sich in der IG eine Zunahme der Modellkompetenz für leistungsstarke Lernende (t(101) = 2.89, p = .005, d = .19) sowie für Lernende mit mittlerem Leistungsvermögen (t(65) = 2.05, p = .04, d = .21). In der KG kann eine signifikante Abnahme der Modellkompetenz leistungsschwacher Lernender festgestellt werden (t(95) = -2.27, p = .025, d = -.22). Für die übrigen Leistungsgruppen zeigen sich keine signifikanten Veränderungen der Modellkompetenz.

 
11:15 - 13:00D11‒H06: Diagnostik und Förderung von Lesekompetenz und Lesemotivation
H06 
 

Diagnostik und Förderung von Lesekompetenz und Lesemotivation

Chair(s): Chantal Lepper (Institut für Schulentwicklungsforschung, Deutschland), Justine Stang (Institut für Schulentwicklungsforschung, Deutschland), Nele McElvany (Institut für Schulentwicklungsforschung, Deutschland)

DiskutantIn(nen): Michael Becker-Mrotzek (Universität zu Köln)

Die Fähigkeit zu Lesen gilt nicht nur im schulischen Kontext als Schlüsselkompetenz, sondern auch als wichtige Voraussetzung für gesellschaftliche Teilhabe (Mullis & Martin, 2015). Kompetentes Lesen ist dabei zentral für das sinnentnehmende Verstehen schriftlicher Sprache und für die Generierung von Wissen im Allgemeinen (Fix, 2015). Grundlegend sind dabei die Beherrschung basaler Lesefähigkeiten und zugleich eine positive motivationale Orientierung gegenüber lesebezogener Tätigkeiten (Lundberg, 2002; Rosebrock, Nix, Rieckmann, & Gold, 2017). Die intrinsische Lesemotivation, welche durch Interesse und Freude am Lesen zum Ausdruck kommt, wird als begünstigender Faktor für das Leseverhalten und die Lesekompetenz von Lernenden erachtet (McElvany, Kortenbruck, & Becker, 2008; Schiefele, Schaffner, Möller, & Wigfield, 2012).

Allerdings konnte in Large-Scale-Assessments wie IGLU und PISA wiederholt gezeigt werden, dass ein substanzieller Anteil von Lernenden im Primar- und Sekundarschulbereich nur über geringe Lesekompetenzen verfügten und leseschwächere Lernende eine geringere Lesemotivation aufwiesen (Hußmann et al., 2017; Weis et al., 2016). Zudem wurden geschlechtsspezifische Unterschiede in den Ausprägungen der Lesemotivation sowie der Lesekompetenz zugunsten von Mädchen identifiziert (McElvany et al., 2017). Daher stellen die Diagnostik und Förderung der Lesemotivation und der Lesekompetenz von Lernenden im Unterricht relevante pädagogische Zielsetzungen dar. Programme und Strategien zur Leseförderung nehmen vor diesem Hintergrund eine zentrale Rolle ein. Sie fokussieren dabei auf verschiedene Zielkriterien, wie die Steigerung der Leseflüssigkeit oder des Textverständnisses. Dabei unterscheiden sich die Interventionen in ihren Modalitäten, beispielsweise peer-gestützte Interventionen oder digital-gestützte Leseförderung.

Das Symposium wird von übergeordneten Forschungsfragen gerahmt: Wie können Lesekompetenzen verlässlich erfasst werden? Welche Effekte zeigen sich anhand verschiedener Leseförderinterventionen auf die Lesekompetenzentwicklung und die Lesemotivation? Welche Faktoren begünstigen die Lesemotivation und die Lesekompetenz von Lernenden? Gibt es differentielle Befunde für Mädchen und Jungen oder für leistungsstärkere und leistungsschwächere Lernende?

Der erste Beitrag des Symposiums präsentiert ein neu entwickeltes computerbasiertes Testverfahren zur Lernverlaufsdiagnostik von Lernenden in der Grundschule, welches Lesekompetenzen auf Wort-, Satz-, und Textebene erfasst. Hierbei werden die konvergente und divergente Validität des Instrumentes sowie die Validität der Veränderungsmessung geprüft. Die Analysen bestätigen die Validität der Lesetests auf Satz- und Textebene.

Der zweite Beitrag beschäftigt sich mit der Förderung der Leseflüssigkeit unter Einbezug zentraler motivationstheoretischer Annahmen der Selbstbestimmungstheorie (Deci & Ryan, 1993). In der Studie werden Effekte einer digital gestützten Leseförderung, welche auf der Methode „Lesen mit Hören“ basiert, für Lernende der unteren Sekundarstufe analysiert. Erste Befunde deuten auf bedeutsame Interventionseffekte hinsichtlich einer gesteigerten Lesemotivation und eines besseren Wort- und Satzverstehens bei Lernenden hin.

In dem dritten Beitrag wird der Frage nachgegangen, inwiefern unterrichtsintegrierte Leseförderprogramme mit Co- und Selbstregulationsprozeduren zu einer Steigerung der Lesekompetenz von Lernenden in der Grundschule beitragen. Dazu werden systematisch unterschiedliche Förderprogramme für Lernende in der Grundschule und der Sekundarstufe skizziert und zentrale Ergebnisse resümiert. So konnte Evidenz dafür gewonnen werden, dass peer-gestützte Leseförderprogramme das Textverständnis und die Anwendung von Lesestrategien begünstigen.

In dem vierten Beitrag des Symposiums werden das Textinteresse von Grundschulkindern in Abhängigkeit von verschiedenen Textmerkmalen sowie die Relation von Textinteresse und Textverständnis untersucht. Die Studie fokussiert dabei insbesondere auf geschlechtsspezifische Wirkmechanismen. Es konnten unter anderem bedeutsame Relationen zwischen Textmerkmalen und lesebezogenen Interessen von Jungen und Mädchen identifiziert werden. Das Textverstehen hing statistisch nicht bedeutsam von dem spezifischen Textinteresse ab. Für sich gesehen war jedoch die allgemeine Lesemotivation der Lernenden bedeutsam für das Textverstehen der Lernenden.

Insgesamt können aus dem Symposium neue Erkenntnisse zur Diagnostik von Lesekompetenz sowie zu förderlichen Faktoren von Lesekompetenz und Lesemotivation gewonnen werden. Dabei werden verschiedene Altersgruppen (Primar- und Sekundarstufe) berücksichtigt. Resümierend werden die aktuellen Befunde kritisch diskutiert und hinsichtlich möglicher Implikationen für Forschung und Praxis reflektiert.

 

Beiträge des Symposiums

 

Lernverlaufsdiagnostik des Leseverständnisses: Analysen zur Validität der Veränderungsmessung

Natalie Förster, Mathis Erichsen, Boris Forthmann, Elmar Souvignier
Westfälische Wilhelms-Universität Münster

Theoretischer Hintergrund

Die Fähigkeit zu Lesen stellt eine wesentliche Voraussetzung sowohl für schulisches Lernen als auch für die gesellschaftliche Teilhabe dar. Lesekompetenzen werden üblicherweise zunächst in der Grundschule erworben und später weiter ausgebildet. Schülerinnen und Schüler zeigen dabei sowohl erhebliche interindividuelle Unterschiede im Ausmaß mit dem sie Wörter, Sätze oder auch kürzere Texte bereits vor dem Schuleintritt lesen können, als auch in der Geschwindigkeit, mit der sie Teilkompetenzen des Lesens während ihrer Schulzeit erwerben. Interventionsstudien deuten darauf hin, dass die Entwicklung der Lesekompetenz von Schülerinnen und Schülern umso höher ausfällt, je besser das unterrichtliche Angebot an die Lernvoraussetzungen der Schülerinnen und Schüler angepasst ist (Connor et al., 2004). Zudem zeigte sich, dass Lehrkräfte effektivere Leseförderung bereitstellen, wenn sie die Lernverläufe ihrer Schülerinnen und Schüler erfassen und basierend auf diesen diagnostischen Informationen individuelle Fördermaßnahmen ableiten (z. B. Förster, et. al 2018). Vor diesem Hintergrund haben wir eine computerbasierte Testreihe zur Lernverlaufsdiagnostik des Leseverständnisses für Zweitklässler entwickelt (quop-L2), die die Effizienz der Teilprozesse des Lesens differenziert auf Wort-, Satz- und Textebene erfasst, um Lehrkräfte bei der Diagnostik des Lesekompetenzerwerbs zu unterstützen.

Fragestellung

Die vorliegende Arbeit untersucht, inwiefern die neu konstruierten computerbasierten Lesetests a) konvergent und divergent valide im Sinne einer Statusdiagnostik sind, b) inwiefern die erfassten Lernverläufe eine valide Einschätzung des Kompetenzzuwachses erlauben und c) inwiefern die Information über den Lernverlauf (slope) über die Erfassung des Niveaus der Leseleistung hinaus inkrementell valide ist.

Methode

Im Rahmen einer größeren, längsschnittlichen Studie wurden an einer Teilstichprobe (N = 330) standardisierte Lese- und Mathematiktests (ELFE II, DEMAT 1+) sowie ein Intelligenztest (CFT 1-R) durchgeführt. Zudem bearbeiteten die Zweitklässler im Laufe des Schuljahres die neu entwickelte computerbasierte Testreihe quop-L2. Diese besteht aus insgesamt acht Paralleltests, die in Abständen von jeweils drei Wochen dargeboten werden. Jeder Test erfasst die Effizienz von Leseleistungen auf Wort-, Satz- und Textebene. In Anlehnung an PRODI-L (Richter et al., 2012) werden Leseleistungen auf Wortebene durch eine Wort-/Pseudowort-Unterscheidungsaufgabe erfasst, Leseleistungen auf Satzebene durch eine Satzverifikationsaufgabe und Leseleistungen auf Textebene, indem angegeben werden soll, ob ein Satz eine Geschichte sinnvoll weitererzählt. Neben der Akkuratheit der Antworten wird auch die Antwortlatenz erfasst. Am Ende des Schuljahres wurde erneut der standardisierte Lesetest (ELFE II) durchgeführt.

Die konvergente und divergente Validität der Einzeltests der Testreihe wird anhand von Korrelationen mit den Lese-, Mathematik- und Intelligenztestergebnissen ermittelt. Um die Validität der Veränderungsmessung zu bestimmen, wird der Lernzuwachs während des Schuljahres als latente Differenz der Prä-und Posttestergebnisse der Lesetests modelliert und mit dem linearen Slope eines latenten Wachstumskurvenmodells aus den acht Lernverlaufstests korreliert. Zur Bestimmung der inkrementellen Validität des Slope wird die Leistung im standardisierten Lesetest am Ende des Schuljahres durch die Leistung am Schuljahresbeginn, sowie den Intercept und den Slope der acht Lernverlaufstests vorhergesagt.

Ergebnisse

Das Korrelationsmuster mit den standardisierten Lese-, Mathematik-, und Intelligenztests bestätigt die konvergente und divergente Validität der Einzeltests (Lesen: > .53; Mathematik: .34; Intelligenz: .31). Die mit quop-L2 erfassten Lernzuwächse auf Satz- und Textebene korrelieren zudem signifikant positiv mit dem Lernzuwachs, der mit den standardisierten Lesetests erfasst wurde (Satz: .50; Text: .32). Dies gilt jedoch nicht für die Wortskala (.09, n.s.). Hinsichtlich der prädiktiven Validität zeigte sich, dass der mit quop-L2 erfasste Lernzuwachs über die Vortestleistung und den Intercept hinaus signifikant Varianz der Leseverständnisleistungen auf Wort-, Satz- und Textebene im standardisierten Schulleistungstest am Schuljahresende aufklären kann.

Diskussion

Insgesamt sprechen die Befunde für die Validität der neu entwickelten computerbasierten Testreihe zur Lernverlaufsdiagnostik im Lesen. Gleichzeitig deuten die Ergebnisse darauf hin, dass die Testreihe auf Wortebene andere Lernzuwächse erfasst, als mit dem standardisierten Lesetest ELFE gemessen werden. Unterschiede im Itemformat und insbesondere die Verwendung wenig frequenter Wörter in quop-L2 werden als mögliche Gründe diskutiert.

 

Die Förderung der Lesemotivation durch digital gestützte und individuell angepasste Leseaktivitäten

Franziska Stutz, Sabine Röttig, Guido Nottbusch
Universität Potsdam

Leseflüssigkeit ist ein wichtiger Aspekt der Lesekompetenz (Landerl & Wimmer 2008). Die Fähigkeit, flüssig zu lesen, wird bei geradliniger Entwicklung in den ersten Grundschuljahren automatisiert. So werden in den höheren Klassenstufen kognitive Kapazitäten für das Lesen und Verstehen von immer komplexeren und anspruchsvolleren Texten frei (z.B. Rosebrock & Nix, 2015). Diese Automatisierung findet jedoch nicht bei jedem Kind problemlos statt, sodass jede Lehrkraft in der Lage sein sollte, vielfältige Methoden zur Förderung der Leseflüssigkeit anzubieten. Vor dem Hintergrund, dass die Lesemotivation den Leseprozess über kognitive Faktoren hinaus signifikant beeinflusst, sollten diese Methoden die Prinzipien der Motivationsförderung ebenfalls berücksichtigen (Schiefele et al., 2012).

Eine Methode zur Förderung der Leseflüssigkeit ist das Lesen mit Hören, welches im englischen Sprachraum schon seit den 70er Jahren als Reading-while-Listening (RwL) bekannt ist (Carbo, 1978). Bei dieser Methode lesen Kinder (oder auch fremdsprachenlernende Erwachsene) laut oder leise mit, während ein kompetenterer Sprecher den gleichen Text flüssig und betont vorliest und somit als Lesevorbild fungiert. Dabei kann der Text ein- oder mehrmals gelesen werden. Eine praktische Variante dieser Methode ist das Lesen mit Hörbuch (LmH, z.B. Gailberger, 2011).

Die Wirkkraft dieser Methode konnte noch nicht eindeutig gezeigt werden. Zwar gibt es Hinweise auf positive Effekte auf die Leseflüssigkeit und die Einstellung zum Lesen, insbesondere bei schwachen Lesern (z.B. Gailberger, 2011), allerdings mangelt es an methodisch aussagekräftigen Studien (Walter, 2018). Wie genau und unter welchen Umständen LmH funktioniert, wurde somit noch nicht ausreichend empirisch untersucht.

Hinsichtlich der intrinsischen Lesemotivation ist zu vermuten, dass LmH dann am besten funktioniert, wenn die Bedürfnisse nach Autonomie, Kompetenzerleben und sozialer Zugehörigkeit erfüllt sind (Deci & Ryan, 1993). In der herkömmlichen Durchführung im Klassenraum hören alle Kinder gleichzeitig das Hörbuch und lesen gleichzeitig mit. Dies führt allerdings dazu, dass viele Kinder über oder unter ihrer optimalen Lesegeschwindigkeit bleiben, was den Erfolg der Methode beeinträchtigt (z.B. McMahon, 1983). Dadurch werden bei schwachen Lesern direkt sowohl Autonomie (durch die fehlende Wahlmöglichkeit) und Kompetenzerleben (durch das Verrutschen in der Zeile), als auch indirekt die soziale Zugehörigkeit (durch das fehlende Verstehen und die daran anschließende beeinträchtigte Anschlusskommunikation) gemindert. Starke Leser sind dem Hörbuchsprecher oft voraus und langweilen sich, wodurch der Spaß an der Aktivität verlorengeht.

Eine Lösung des Problems liegt darin, die Lesegeschwindigkeit an das einzelne Kind anzupassen. Zu diesem Zwecke eignen sich Apps, bei denen das Kind das Hörbuch über Kopfhörer hört, die Geschwindigkeit des Sprechers an die eigene Lesegeschwindigkeit anpasst und gleichzeitig mitliest (z.B. Menestrello).

Das Ziel unserer Bemühungen war es, die Wirksamkeit dieser Methode bei Fünft- und Sechstklässlern vorerst in einer Pilotstudie zu testen. Vorläufige Analysen haben ergeben, dass die Kinder in der Gruppe mit der App einen höheren Anstieg der intrinsischen Lesemotivation und des Wort- bzw. Satzverstehens zeigen als Kinder die den regulären Deutschunterricht besucht haben. Diese Ergebnisse werden vor dem Hintergrund der praktischen Umsetzbarkeit diskutiert. Sowohl Einschränkungen und Stärken der vorliegenden Studie, als auch weiterführende Forschungsansätze werden erörtert.

 

Förderung der Lesekompetenz durch Co- und Selbstregulationsprozeduren

Vanessa Völlinger1, Nadine Spörer2
1Technische Universität Dortmund, 2Universität Potsdam

Wenngleich die Bedeutung Verständnis unterstützender Lesestrategien für das Verstehen von Sachtexten vielfach untersucht wurde, liegen für den deutschsprachigen Raum nach wie vor kaum Studien vor, die die Implementation, Wirkung und Wirkmechanismen von unterrichtsintegrierten Leseförderprogrammen systematisch untersuchen. Der vorliegende Beitrag greift dieses Desiderat auf und möchte einen Überblick über zwei Forschungsprogramme zur unterrichtsintegrierten Leseförderung geben.

Im ersten Forschungsvorhaben wurde die Vermittlung von Lesestrategien mit spezifischen Co- und Selbstregulationsprozeduren kombiniert. Die Auswahl der betreffenden Elemente knüpfte dabei theoretisch an zyklische Selbstregulationsmodelle an (Zimmerman, 2002); es wurden jedoch zwei Phasen der Selbstregulation unterschieden, die in einer Unterrichtsstunde nacheinander durchlaufen werden können (Spörer & Schünemann, 2014). Die erste Phase zielt auf die Regulation der Strategieanwendung ab. Hierzu zählen das Setzen konkreter Strategieziele, die Überwachung der Strategieanwendung und die abschließende Bewertung des Strategieeinsatzes. In der nachgelagerten zweiten Phase steht dann die Frage im Mittelpunkt, ob sich Schüler zu kompetenten Lesern im Sinne der Steigerung des Leseverständnisses entwickeln. Hierzu gehören gleichfalls Prozesse der Zielsetzung, jedoch bezogen auf das angestrebte Leseverständnis, der Selbstbewertung sowie der Attribution von Leistungsverbesserungen auf einen Zuwachs an strategischer Kompetenz. Die Aneignung und das Einüben der Lesestrategien erfolgt mit Hilfe des evidenzbasierten reziproken Lehrens (Hattie, 2009; Palincsar & Brown, 1984). Co-Regulationsprozeduren während der Gruppenarbeitsphasen sollen die Selbstregulation unterstützen: In der Rolle des Lehrerkindes steuern und beobachten die Gruppenmitglieder das Lernen der Gruppe: Sie fordern die Mitglieder auf, eine bestimmte Lesestrategie anzuwenden, und unterstützen die korrekte Ausführung der betreffenden Strategie durch Feedback.

Ziel des Forschungsprogramms war es zu zeigen, dass durch die Vernetzung einer strategieorientierten Leseförderung mit spezifischen co- und selbstregulativen Elementen die Effektivität einer Leseförderung gesteigert werden kann. Zur Prüfung der Fragestellungen wurde eine Serie von feldexperimentellen Interventionsstudien mit multiplen Kontrollbedingungen, multiplen Outcome-Maßen und Prä-, Post- und Follow-up-Testungen realisiert. Im Ergebnis zeigten sich drei Hauptbefunde:

1) Die Anreicherung des Trainings um Co- und Selbstregulationsprozeduren führte längerfristig und im Vergleich zum klassischen reziproken Lehren zu höheren Werten im Leseverständnis und in der Anwendung der Lesestrategien (Interventionseffekt).

2) Besonders Schülerinnen und Schüler mit schwachen Ausgangsleistungen profitierten von einer Anreicherung des Trainings (Moderatoreffekt).

3) Die Anreicherung des Trainings um Co- und Selbstregulationsprozeduren führte zu einer qualitätsvolleren Gruppenarbeit und darüber vermittelt zu einer verbesserten Anwendung der Lesestrategien und zu einem verbesserten Leseverständnis (Mediatoreffekt).

Das zweite Forschungsprogramm, das im September 2019 gestartet ist, baut auf diesen Erkenntnissen auf und hat zum Ziel den Informationsstand zur Wirkweise peer-gestützter Leseförderprogramme bedeutsam zu erweitern. In diesem Projekt wird in 20 dritten Klassen eine Interventionsmaßnahme zur Förderung von Lesekompetenz in einem Switching Replications Design mit 5 Messzeitpunkten evaluiert. Informationen zur Wirkweise der Intervention sollen ergänzend aus Verlaufsmessungen und Videoanalysen der Zusammenarbeit von Kindern in Lesegruppen gewonnen werden. Die Daten aus Verlaufsmessungen ermöglichen die Entwicklung der Leseleistungen von Schülerinnen und Schülern im zeitlichen Verlauf differenzierter zu betrachten und damit eine bestehende Informationslücke über die Veränderung von Kompetenzen zwischen Prä- und Posttestung in Interventionsprogrammen zu schließen.

Geplant ist auch eine Auswertung der Daten anhand von Mediationsmodellen, um die Bedeutung der Programmkomponenten sowie der Schülerinteraktion für die Wirkung der Intervention zu beleuchten. Grundlage für diese Analysen sind theoretische und empirische Modelle der Lesekompetenz (Cromley & Azevedo, 2007; Völlinger, Spörer, Lubbe & Brunstein, 2018) sowie Modelle zur Bedeutung von Peer-Interaktionen für Leseprozesse und Leseleistungen in heterogenen Lerngruppen (Schünemann, Spörer, Völlinger & Brunstein, 2017).

Gemeinsam sollen die Forschungsprogramme den Informationsstand zur Wirkung und Wirkweise von Interventionsprogrammen im Regelunterricht erweitern und damit perspektivisch die Implementation evidenzbasierter, ökonomischer Interventionen zur effektiven Förderung der Leseleistungen von Schülerinnen und Schülern mit unterschiedlichen Eingangskompetenzen vorantreiben.

 

Lesebezogenes Interesse und Textverständnis: Geschlechtsspezifische Befunde unter der Betrachtung von spezifischen Textcharakteristika

Chantal Lepper, Justine Stang, Nele McElvany
Institut für Schulentwicklungsforschung, Deutschland

Theoretischer Hintergrund

Die Fähigkeit zu Lesen gilt als eine der wichtigsten schulisch vermittelten Kompetenzen und wird als begünstigende Bedingung für gesellschaftliche Teilhabe erachtet (Conradi et al., 2014; OECD, 2016; Pfost, Dörfler, & Artelt, 2012). Die Lesekompetenz von Lernenden steht dabei in einem bedeutsamen Zusammenhang zur Lesemotivation, welche die Freude an lesebezogenen Tätigkeiten widerspiegelt und das Leseverhalten begünstigt (Becker, McElvany, & Kortenbruck, 2010). Eine wichtige motivationale Variable stellt das Interesse von Schülerinnen und Schülern an Texten dar (Schiefele, Schaffner, Möller, & Wigfield, 2012).

Empirische Befunde verdeutlichen, dass es bedeutsame Unterschiede zwischen Mädchen und Jungen hinsichtlich erreichter Lesekompetenzstufen und der Ausprägung von Lesemotivation am Ende der Grundschulzeit gab (Bremerich-Vos et al. 2017; Becker & McElvany, 2017). Darüber hinaus unterschieden sich Jungen und Mädchen in ihren lesebezogenen Interessen und Textpräferenzen (z.B. Clark, 2011; McGeown, 2015; Philipp & Garbe, 2007; Richter & Plath, 2012). Interessensunterschiede von Lernenden konnten in verschiedenen Studien anhand von unterschiedlichen Textcharakteristika wie dem Thema, der Textschwierigkeit oder des Geschlechts der Hauptfiguren erklärt werden (Ainley, Hillman, & Hidi, 2002; Fulmer & Frijters, 2011; Lepper, Stang, & McElvany, in Vorbereitung). Zudem existieren empirische Befunde, welche einen stärkeren Zusammenhang zwischen dem Interesse an Texten und dem Textverständnis für Jungen als für Mädchen aufzeigten (Logan & Medford, 2011; Oakhill & Petrides, 2007).

Hingegen bedarf es einer systematischen Analyse, welche die Beziehung zwischen dem Interesse an Texten und dem Textverständnis der Lernenden prüft und untersucht, inwiefern relevante Textcharakteristika, wie beispielsweise die Textschwierigkeit, das Interesse an Texten beeinflussen. Allerdings existieren bislang nur wenige Befunde zu geschlechtsspezifischen Effekten, wenngleich das Geschlecht von Lernenden generell als bedeutsamer Faktor für das lesebezogene Interesse gilt (Philipp & Garbe, 2007).

Fragestellungen

In der vorliegenden Studie wird zum einen der Forschungsfrage nachgegangen, ob das Textverständnis von Jungen stärker von ihrem Interesse an Texten abhängen als die Leistungen von Mädchen. Darüber hinaus wird analysiert, ob Differenzen zwischen Mädchen und Jungen in dem Interesse an Texten in Abhängigkeit der Textmerkmale geschlechtskonnotiertes Thema, Geschlecht der Hauptfiguren und Textschwierigkeit bestehen.

Methode

An der Studie nahmen insgesamt 26 Schulklassen der vierten Jahrgangstufe mit insgesamt N = 496 Schülerinnen und Schülern (weiblich 47,2 %; Alter M = 10.30 [SD = 0.45]) teil. Zunächst lasen die Lernenden vierzehn Kurztexte (Schwabe & McElvany, 2013) und berichteten auf einer vierstufigen Likert-Skala (1 = Stimmt gar nicht bis 4 = Stimmt genau) ihr Interesse an den Einzeltexten (Anzahl der Items = 3; gemitteltes Cronbachs α = .89). Außerdem bearbeiteten die Lernenden jeweils eine inhaltsbezogene Textverständnisaufgabe pro Text. Die präsentierten Texte unterschieden sich hinsichtlich der Merkmale geschlechtskonnotiertes Thema (eher männlich vs. eher weiblich), Geschlecht der Hauptfiguren (männlich vs. weiblich) und der Textschwierigkeit (leicht, mittel, schwer) voneinander. Um die Forschungsfragen beantworten zu können, wurden Mehrgruppenanalysen und Strukturgleichungsmodelle mit Mplus 8.1 spezifiziert.

Ergebnisse

Die Analyse zur Überprüfung der Messinvarianz von Textinteresse und Lesemotivation für Jungen zeigte, dass metrische Messinvarianz für beide Konstrukte gegeben war. Mehrgruppenmodelle ergaben, dass weder das Textverständnis von Jungen noch das der Mädchen abhängig von ihrem Interesse an den gelesenen Texten war . Zusätzliche Analysen konnten jedoch aufzeigen, dass das Textverständnis von Mädchen und Jungen signifikant von der allgemeinen Lesemotivation abhing. Hinsichtlich der Bedeutung verschiedener Textmerkmale für das Interesse an Texten konnte festgestellt werden, dass die Merkmale Textthema, Geschlecht der Hauptfiguren im Text und Textschwierigkeit jeweils bedeutsam für das Interesse von Jungen und von Mädchen an den Texten waren. Dabei schätzten Jungen Texte als interessanter ein, wenn sie eine geringere Komplexität aufwiesen, das Textthema männlich konnotiert war oder männliche Hauptfiguren aufwiesen. Mädchen hingegen waren interessierter an Texten mit weiblich konnotierten Themen oder weiblichen Hauptfiguren sowie an Texten mit höherer Textschwierigkeit. Die Ergebnisse werden hinsichtlich ihrer Implikationen für weitere Forschung sowie für die Praxis kritisch reflektiert und diskutiert.

 

Datum: Freitag, 27.03.2020
9:00 - 10:45F9‒H06: Person-Environment-Fit im Lehramt – berufsrelevante Voraussetzungen von Lehramtsstudierenden im Vergleich
H06 
 

Person-Environment-Fit im Lehramt – berufsrelevante Voraussetzungen von Lehramtsstudierenden im Vergleich

Chair(s): Birgit Ziegler (Technische Universität Darmstadt, Deutschland), Stephan Abele (Technische Universität Dresden), Svenja Ohlemann (Technische Universität Berlin)

DiskutantIn(nen): Sylvia Rahn (Universität Wuppertal)

Lehrer*innen sind maßgebliche Gestalter*innen von Bildungsprozessen. Kaum ein anderer Beruf präsentiert sich so früh und mit so hoher Intensität im Lebenslauf von Individuen, beeinflusst deren Partizipationsmöglichkeiten im Bildungssystem sowie berufswahlrelevante Selbstselektionsprozesse im Zugang zum Lehramt. Schon Grundschulkinder, besonders Mädchen, äußern häufig den Wunsch, einmal Lehrerin oder Lehrer werden zu wollen (Baumgart 2012). Daher ist das Lehramt auch aus berufswahltheoretischer Perspektive interessant. Zahlreiche berufswahltheoretische Ansätze folgen dem Person-Environment-Fit Modell, wonach Menschen sich vorzugsweise beruflichen Umwelten zuwenden, die sie als zu ihrer Person passend wahrnehmen. Prominent ist der Ansatz von J. L. Holland (1997), der tätigkeitsbezogene Interessen als zentralen Wirkfaktor im Berufswahlprozess unterstellt. Entwicklungstheoretisch wird dagegen sozialen Passungserwägungen hinsichtlich Geschlecht und Prestige eine frühere und höhere Wirksamkeit im Berufswahlprozess zugeschrieben, als Interessen und Wertorientierungen (L. S. Gottfredson 1981, 2005). Dies bekräftigend zeigt sich beispielhaft für Pflegeberufe, dass eine mangelnde soziale Passung die Neigung einen Beruf zu ergreifen, trotz vorhandener Interessenkongruenz mindert. Zudem erweisen sich mangelnde Urteilsicherheit, ungünstige Einschätzungen der Zugänglichkeit zum Berufsfeld sowie eine mangelnde Passung der Rahmenbedingungen als die Berufswahlneigung mindernde Faktoren (Matthes 2019). Die Interaktionsintensität von Jugendlichen mit Lehrenden hängt mit Ausnahme der Grundschule von der besuchten Schulart ab und Unterschiede in der sozialen Hierarchie der Bildungsgänge spiegeln sich im Berufsprestige der Lehrämter wider (Ziegler 2018). Studienberechtigte sind überwiegend gymnasial sozialisiert, weshalb Studierenden im LaG eine hohe Urteilssicherheit und soziale Passung unterstellt werden kann, was mitunter dazu beiträgt, dass die Studierendennachfrage im gymnasialen Lehramt von ungünstigen Einstellungsprognosen relativ unbeeinträchtigt bleibt (Ziegler 2009; Rothland 2014). Dem Lehramt an berufsbildenden Schulen begegnen Jugendliche, wenn überhaupt, recht spät im Lebenslauf. Auch das soziale Prestige liegt unterhalb des gymnasialen Lehramts. Aus berufswahltheoretischer Perspektive sind daher die anhaltenden Versorgungsprobleme beruflicher Schulen mit Lehrkräften erklärbar. Nun hat sich der Lehrerberuf von einem eher männlichen zu einem eher weiblichen Beruf gewandelt (Kemnitz 2014). Davon ausgenommen sind lediglich die MINT-Fächer, besonders Physik, Informatik und Technik. Diese Fächer sind nach wie vor stärker männlich besetzt, weisen aber gleichzeitig nachhaltige Versorgungsprobleme auf. Nachdem Kinder in der Phase der Herausbildung ihrer Geschlechtsidentität stärker zu Berufen tendierend, die von Erwachsenen des gleichen Geschlechts repräsentiert werden (Ratschinski 2013), könnte der frühe Ausschluss des Lehramts aus dem beruflichen Aspirationsfeld von Jugendlichen mit MINT-Interessen ursächlich dafür sein. Bei älteren Studierenden, die über andere berufliche Vorbildungen oder als Studiengangwechsler*innen in das Lehramtsstudium einmünden, könnten dagegen Gelegenheitsstrukturen höher wiegen als Passungserwägungen (Gottfredson & Becker 1981). Beispielsweise können die antizipierten Rahmenbedingungen im Lehramt die Berufswahlneigung erhöhen oder die hohe Nachfrage im berufsbildenden Lehramt kann die Zugänglichkeitseinschätzungen positiv beeinflussen. Mit Blick auf die zuletzt genannte Gruppe ist daher von Interesse, ob z. B. die Einmündung in das Lehramt an berufsbildenden Schulen ein Ergebnis des Person-Environment-Fit oder vielmehr ein Produkt von Gelegenheitsstrukturen ist und sich demzufolge Studierende im beruflichen Lehramt hinsichtlich ihrer berufsbezogenen Interessen, Motive und Überzeugungen von anderen Studierendengruppen, insbesondere Studierenden allgemeinbildender Lehrämter abheben. Angesichts des Lehrkräftemangels und der zunehmenden Deckung des Bedarfs über Quer- und Seiteneinstiege ist die Wirksamkeit der Person-Umweltpassung aber auch für die Lehrkräftegewinnung an allgemeinbildenden Schulen bedeutsam.

Ausgehend von der übergreifenden Frage, ob abhängig von bildungsbiografischen Zugängen zum jeweils angestrebten Lehramt sich Tätigkeitsinteressen, Fachinteresse, Motiven, Überzeugungen und Vorwissen von Lehramtsstudierenden binnenstrukturell sowie von anderen Studierendengruppen unterscheiden, werden im Symposium vergleichende Analysen präsentiert. Der erste Beitrag analysiert Interessenstrukturen von Studierenden des berufsbildenden Lehramts und der Ingenieurwissenschaften. Der zweite Beitrag vergleicht Studienanfänger*innen im gymnasialen Lehramt und im berufsbildenden Lehramt. Beitrag 3 präsentiert Analysen zu Studierenden des Sekundarschullehramts und des berufsbildenden Lehramts. Im vierten Beitrag werden Mathematikstudierende mit Lehramts-studierenden im Fach Mathematik unterschiedlicher Schularten verglichen.

Es ergibt sich ein hochdifferenziertes Bild. Insgesamt wird das Modell einer Person-Umwelt-Passung im Lehramt eher bekräftigt.

 

Beiträge des Symposiums

 

Berufliche Interessenprofile – ein Grund und eine Lösungsoption für das Rekrutierungsproblem im gewerblich-technischen Lehramtsstudium?

Andreas Leon1, Marcel Köhler1, Nelly Schmechtig1, Gabriel Nagy2, Stephan Abele1
1Technische Universität Dresden, 2Universität Kiel

Theoretischer Hintergrund

Der Lehrkräftemangel an beruflichen Schulen in gewerblich-technischen Fachrichtungen stellt seit langem bundesweit ein anhaltendes, empirisch aber nur unzureichend erforschtes Problem dar. Gemäß der Person-Umwelt-Theorie Hollands (1997) entscheiden sich Personen u. a. dann für das Studium des gewerblich-technischen Lehramts, wenn sie ein überdurchschnittlich hohes soziales (S) und praktisch-technisches (R) Interesse haben. Unter Annahme der starken Calculus-Hypothese (Holland, 1997) entspricht dies einem inkonsistenten Interessenprofil. Solche Profile treten in der Population selten auf (Gurtmann & Balakrishnan, 1998), was den erwähnten Lehrermangel zumindest partiell erklären könnte. Dementsprechend deuten erste Analysen darauf hin, dass ein inkonsistentes Interessenprofil für Lehramtsstudierende gewerblich-technischer Fachrichtungen typisch ist (Köhler, Schmechtig & Abele, 2019). Offen ist, inwiefern diese Inkonsistenz aus der erwähnten R-S-Konstellation resultiert. Zudem legen erste Erkenntnisse nahe, dass Lehramtsstudierende im gewerblich-technischen Bereich ein spezifisches Interessenprofil aufweisen, das in gewissem Umfang auch bei Studierenden von Ingenieurwissenschaften vorkommt (Leon et al. 2018).

Fragestellung

Im Beitrag werden die Konsistenz und Profile beruflicher Interessen von ingenieurwissenschaftlichen Studierenden sowie Studierenden des berufsbildenden Lehramts und folgende Hypothesen untersucht: Die Interessenprofile von Studierenden des gewerblich-technischen Lehramts sind inkonsistenter als die Interessenprofile von Studierenden anderer Fächer ohne bzw. mit vergleichsweise geringem Rekrutierungsproblem (H1). Die Inkonsistenz ist bei den Studierenden des gewerblich-technischen Lehramts v.a. auf die erwähnte R-S-Kombination zurückzuführen (H2). Exploratorisch wird ferner untersucht, wie viele Ingenieurstudierende ein für Studierende des gewerblich-technischen Lehramts typisches Interessenprofil aufweisen.

Methode

Für die Analysen wird ein Datensatz herangezogen, der sich aus Studierenden der Ingenieurwissenschaften der Universität Stuttgart (N=252) (Gräber, 2018) sowie Lehramtsstudierenden gewerblich-technischer und weiterer beruflicher Fachrichtungen der TU Dresden (N=339) zusammensetzt und bislang nur partiell ausgewertet wurde. Die Dresdner Daten stammen aus Erstsemesterbefragungen, die vom Zentrum für Lehrerbildung, Schul- und Berufsbildungsforschung (ZLSB) der TU Dresden durchgeführt wurden (2015-2018). Hier wurde als Instrument eine Kurzform des allgemeinen Interessenstrukturtest (AIST-R) nach Lörz, Quast & Woisch (2011) verwendet. Die Stuttgarter Daten wurden in Studienveranstaltungen der Studienjahre 2017/2018 erhoben. Als Instrument wurde der AIST-R nach Bergmann & Eder (2005) verwendet. Das Matching der Interessendaten wird im Vortrag erläutert. Die Interessenskalen erreichten mindestens eine zufriedenstellende Reliabilität (R: α=.72; I: α=.73; A: α=.80; S: α=.84; E: α=.74; C: α=.71). Die Bestimmung der Interessenskonsistenz der Studierenden erfolgte in Anlehnung an Nagy, Trautwein & Maaz (2012) sowie Gurtmann & Balakrishnan (1998) unter Annahme einer starken Calculushypothese (Holland, 1997) mithilfe eines regressionsanalytischen Ansatzes, wobei die entsprechenden Sinus- und Cosinuswerte als Prädiktoren und die individuellen Interessenprofile als Kriterien fungierten; das resultierende R² wurde als Konsistenzmaß interpretiert.

Ergebnisse

Die bisherigen Analysen zeigten, dass die Interessenprofile der angehenden Lehrkräfte mit gewerblich-technischen Fachrichtungen inkonsistenter (F(1, 248)=11.28, p<.01, d=.36) sind als die Interessenprofile der Ingenieurstudierenden (H1). Ziel der weiteren Analysen ist es, Interessenskonstellationen zu finden, welche insbesondere für die Inkonsistenz der Interessenprofile der Lehramtsstudierenden gewerblich-technischer Fachrichtungen verantwortlich sind (H2). Hierzu werden Regressionsresiduen mithilfe einer Latent-Class-Analyse (LCA) untersucht (Nagy, Köller, & Leucht, 2016). Es wird davon ausgegangen, dass sich Studierende des gewerblich-technischen Lehramts wegen ihres ausgeprägten sozialen und praktisch-technischen Interesses bevorzugt in einer Klasse befinden. Um die exploratorische Frage zu klären, wird mithilfe einer LCA untersucht, ob für Studierende des gewerblich-technischen Lehramts charakteristische Klassen von Interessenprofilen identifizierbar sind und wie viele Ingenieurstudierende diese Klassen enthalten. Abschließend wird diskutiert, ob es angesichts der Befunde angemessen ist, die Inkonsistenz beruflicher Interessenprofile weiterhin als einen zentralen Grund für das Rekrutierungsproblem im gewerblich-technischen Lehramt zu betrachten und ob affine ingenieurwissenschaftliche Studiengänge als Rekrutierungsressource für Gewerbelehrinnen und Gewerbelehrer betrachtet werden können. In diesem Fall wären Maßnahmen angebracht, die entsprechenden Studierenden gezielt anzusprechen und für das gewerblich-technische Lehramtsstudium zu gewinnen. Schließlich wird der Nutzen von Folgestudien ausgelotet, in denen untersucht wird, ob jene Studierende der Ingenieurwissenschaften, die lehramtsspezifische Interessenprofile aufweisen, auch eher dazu neigen, das ingenieurwissenschaftliche Studium abzubrechen.

 

Berufswahlmotive angehender Lehrkräfte: Vergleich der beruflichen und allgemeinbildenden Fachrichtungen

Anne Stellmacher, Svenja Ohlemann
Technische Universität Berlin

Theoretischer Hintergrund

Die Gewinnung und Ausbildung von Lehrkräften an Universitäten ist aufgrund des deutschlandweiten Lehrkräftemangels in allen Schultypen nach wie vor bildungs- und arbeitsmarktpolitisch hoch relevant. Im beruflichen Lehramt kommt erschwerend dazu, dass sich bereits zu wenige junge Menschen für das Studium entscheiden, was anhand von zu geringen Studierendenzahlen deutlich wird. Davon besonders betroffen sind die gewerblich-technischen Fachrichtungen (Monitor Lehrerbildung, 2017). Als mögliche Ursachen für die geringen Zahlen werden eine mangelnde Attraktivität sowie ein geringer Bekanntheitsgrad des beruflichen Lehramts im Vergleich zum allgemeinbildenden Lehramt genannt (Frommberger & Lange, 2018). In der Behebung des aktuellen Mangels spielt das Wissen über die Motive, warum sich Studierende für das berufliche Lehramtsstudium entschieden haben, eine bedeutsame Rolle (Driesel-Lange, Morgenstern & Keune, 2017). Denn diese Erkenntnisse können von den Hochschulen genutzt werden, um erfolgreiche, an die Zielgruppe angepasste Rekrutierungsstrategien zu entwickeln und den Nachwuchs zielgerichtet anzusprechen und zu beraten. Die bisherige Forschung zu Berufswahlmotiven konzentrierte sich vor allem auf allgemeinbildende Lehramtstypen (u.a. Retelsdorf & Möller, 2012; Rothland, 2014), für das berufliche Lehramt bedarf es weiterer Forschung (Frommberger & Lange, 2018). Vergleichsstudien mit dem allgemeinbildenden Lehramt können diese Erkenntnisse noch schärfen.

Fragestellung

Die vorliegende vom Bundeministerium für Bildung und Forschung geförderte Studie untersucht die Berufswahlmotive angehender Berufsschullehrkräfte und vergleicht sie mit den Motiven ihrer Kommiliton*innen der allgemeinbildenden Fächer.

Methode

Vorgestellt werden Ergebnisse aus einer Studie im Mixed-Method-Design: In einer quantitativen Studie wurden 30 Lehramtsstudierende aus den beruflichen Fachrichtungen sowie 50 Studierende des allgemeinbildenden Fachs der Sekundarstufe I „Arbeitslehre“, die sich zum Befragungszeitpunkt im Bachelor befanden, befragt. Die Berufswahlmotive wurden mit der Skala FEMOLA (Pohlmann & Möller, 2010) erhoben, welche nach dem Erwartung-x-Wert-Modell (Eccles et al., 1983) aus den folgenden sechs Subskalen besteht: pädagogisches Interesse, fachliches Interesse, Nützlichkeit, Fähigkeitsüberzeugung, geringe Schwierigkeit des Lehramtsstudiums sowie soziale Einflüsse. Die Auswertung erfolgte mittels einer multivariaten Kovarianzanalyse (MANCOVA), um die Effekte der beiden Lehramtsstudienrichtungen auf die sechs Motivationsausprägungen zeitgleich unter Berücksichtigung der Kovariaten Geschlecht, Alter, Fachsemester sowie Anzahl an pädagogischen Vorerfahrungen testen zu können. Da der FEMOLA-Fragebogen für das allgemeinbildende Lehramt entwickelt wurde, bleibt unklar, ob die darin enthaltenen Facetten alle Berufswahlmotive im beruflichen Lehramt abdecken. Deshalb wurden im Rahmen einer qualitativen Untersuchung fünf Master-Lehramtsstudierende der beruflichen Fachrichtungen zu ihren Gründen und Motiven für die Wahl des Studiums befragt. Die biografischen Interviews wurden nach der Grounded Theory (Strauss & Corbin, 1996) ausgewertet.

Ergebnisse

Die quantitativen Ergebnisse zeigen für die angehenden Berufsschullehrkräfte die höchste Ausprägung im fachlichen Interesse, während bei den Studierenden der Arbeitslehre das pädagogische Interesse das wichtigste Motiv war. Die Studierenden des beruflichen und allgemeinbildenden Lehramts unterscheiden sich signifikant in der Einschätzung des pädagogischen Interesses, der Nützlichkeit (im Sinne von Work-Life-Balance und finanzieller Sicherheit) sowie der sozialen Einflüsse (von Eltern oder Freund*innen) als Motivatoren. Auf den übrigen drei Motivskalen zeigen sich keine signifikanten Unterschiede. Die qualitativen Ergebnisse zeigen, dass FEMOLA die Berufswahlmotive von beruflichen Lehramtsstudierenden zum Teil abdeckt. Die Studierenden berichten bspw. von einem starken didaktischen Interesse und das fachliche Interesse ist vor allem durch vorhergehende berufliche Erfahrungen, wie einer Berufsausbildung oder einem Studium, geprägt. Die Wahrnehmung einer geringeren Schwierigkeit des Lehramtsstudiums wird nicht genannt. Die Ergebnisse sowie Konsequenzen für die Lehrkräfteakquise der beruflichen Bildung werden diskutiert und methodische Stärken und Schwächen der vorliegenden Untersuchungen kritisch reflektiert.

 

Berufswahlmotive und Vorwissen von Studienanfängerinnen und Studienanfängern im (Lehramts)Fach Mathematik. Ein Vergleich diverser Studiengänge

Florina Ștefănică, Reinhold Nickolaus
Universität Stuttgart

Theoretischer Hintergrund

Lehrkräfte haben einen großen Einfluss auf zukünftige Generationen: Sie vermitteln Wissen bei den Schülerinnen und Schülern, formen Charaktere, dienen als Verhaltensmodelle. Doch wer nimmt ein Lehramtsstudium auf? Welches Wissen und welche Eigenschaften bringen die angehenden Lehrkräfte in den unterschiedlichen Lehramtsstudiengängen zu Studienbeginn mit (vgl. z. B. Rothland 2014a, Rothland 2014b)? Unterscheiden sich die Lehramtsstudierenden von den Nicht-Lehramtsstudierenden, mit denen sie an vielen Hochschulstandorten gemeinsame Lehrveranstaltungen besuchen? Bisherige Untersuchungen zu Studienbeginn (vgl. Klusmann et al. 2009; Neugebauer 2013; Drahmann et al. 2016; Klusmann 2011; Blömeke et al. 2008; Pohlmann / Möller 2010) belegen: (1) keine Unterschiede hinsichtlich Abiturnoten, kognitiven Grundfähigkeiten, mathematischem Vorwissen oder der Englischleistung zwischen Nicht-Lehramtsstudierenden und Studienanfängern des gymnasialen Lehramts, jedoch Vorteile für die letztgenannte Gruppe im Vergleich zu Studienanfängern nichtgymnasialer Lehramtsstudiengänge; (2) Vorteile im pädagogischen Vorwissen für nichtgymnasiale Lehramtsstudierende im Vergleich zu gymnasialen Lehramtsstudierenden; (3) unterschiedliche Relevanz der Berufswahlmotive je nach gewähltem Lehramtsstudiengang. Im Rahmen der oben genannten Studien wurden keine fachspezifischen Ausdifferenzierungen der Lehramts- oder Nicht-Lehramtsgruppen durchgeführt. Spinath und Kollegen (2005) nahmen eine Ausdifferenzierung der Nicht-Lehramtsgruppe in Naturwissenschaften, Wirtschaftswissenschaften und Pädagogik vor und stellten fest, dass sich Lehramtsstudierende nicht grundsätzlich in negativer Weise von Studierenden in Diplomstudiengängen hinsichtlich der kognitiven Fähigkeiten oder der Lesekompetenz unterscheiden. Bei einer fachspezifischen Ausdifferenzierung der Lehramtsstudierenden fanden Kaub und Kollegen (2012) heraus, dass Studierende mit den Fächern Sport bzw. Naturwissenschaften höhere kognitive Fähigkeiten als Studierende anderer Lehramtsfächer aufweisen.

Fragestellung

Im Folgenden wird eine erste fachspezifische Untersuchung vorgestellt. Am Beispiel des Fachs Mathematik fokussiert der vorliegende Beitrag (1) Unterschiede zwischen Lehramts- und Nicht-Lehramtsstudierenden und (2) Unterschiede zwischen Lehramtsstudierenden verschiedener Studiengänge zu Studienbeginn.

Methode

Hierfür werden Daten von Studierenden der Universität Stuttgart (145 Nicht-Lehramt Mathematik, 129 gymnasiales Lehramt) und der Pädagogischen Hochschule Ludwigsburg (145 Sekundarstufen1-Lehramt, 30 Sonderpädagogik) untersucht. Die Unterschiedsanalysen beziehen sich auf (1) das mathematische und pädagogische Vorwissen sowie die kognitiven Grundfähigkeiten und (2) weichere Faktoren wie z. B. Berufswahlmotive, Geschlecht, Erfahrungen vor Studienbeginn. Zur Erfassung des mathematischen Vorwissens wurde eine Kurzversion des Tests aus TIMSS (Baumert et al. 1999) eingesetzt. Das pädagogische Vorwissen wurde mithilfe einer Kurzversion des Tests aus den Studien KiL / KeiLa (Hohenstein et al. 2017) erhoben. Der CFT3 (Weiß 1999, Cattell 1961) diente zur Ermittlung der kognitiven Grundfähigkeit. Schließlich wurde der FEMOLA-Fragebogen (Pohlmann / Möller 2010) zur Erfassung der Berufswahlmotive für das Lehramt verwendet.

Ergebnisse

Erste Analysen zeigen, dass zu Studienbeginn Nicht-Lehramtsstudierende über ein ausgeprägteres mathematisches Vorwissen, bessere kognitive Grundfähigkeiten und bessere Abiturnoten als Lehramtsstudierende verfügen. Zusätzlich finden sich hinsichtlich dieser Indikatoren Unterschiede zwischen den verschiedenen Lehramtsstudiengängen: Am besten schneiden die Sekundarstufen2-Lehramtsstudierenden ab, gefolgt von den Sonderpädagogen und den Sekundarstufen1-Lehramtsstudierenden. Hingegen konnten im pädagogischen Vorwissen keine signifikanten Unterschiede zwischen den Studiengängen gefunden werden. Ca. 40% der Nicht-Lehramtsstudierenden haben während ihrer Schulzeit einen Vertiefungskurs in Mathematik besucht, während es in den Lehramtsstudiengängen ca. 15% sind. Dabei zeigt dieser Vertiefungskurs einen erwartungskonformen Zusammenhang mit dem mathematischen Vorwissen auf. Für alle Studiengänge mit Ausnahme des Lehramts für Sonderpädagogik gilt: Studienanfänger, die bereits Nachhilfe gegeben haben, verfügen über ein ausgeprägteres pädagogisches Vorwissen als jene Studienanfänger, die noch keine Nachhilfe gegeben haben. Schließlich unterscheiden sich die Studienanfänger der unterschiedlichen Lehramtszugänge hinsichtlich der Berufswahlmotive; Zusammenhänge zwischen den Berufswahlmotiven und dem Vorwissen können dabei nicht festgestellt werden. Die Ergebnisse machen deutlich, dass für die Gewinnung kompetenter Studierenden eine Steigerung der Attraktivität der Lehramtsausbildung notwendig ist. Zusätzlich soll die gefundene Heterogenität zwischen den Eingangsvoraussetzungen in den unterschiedlichen Studiengängen auf Herausforderungen bei der Vorbereitung gemeinsamer Lehrveranstaltungen aufmerksam machen.

 

Bildungswege, Studien- und Berufswahlmotive, Überzeugungen und Interessen – Ein Vergleich von Studienanfänger*innen im Lehramt an Gymnasien (LaG) und im Lehramt an beruflichen Schulen (LaB)

Sevil Mutlu, Josephine Berger, Birgit Ziegler
Technische Universität Darmstadt

Theoretischer Hintergrund

Professionelle Lehrerkompetenz basiert auf einer analytisch-kognitiven sowie einer motivational-affektiven Facette (Baumert & Kunter, 2011). Letztere umfasst Überzeugungen und Werthaltungen, motivationale Orientierungen, darunter auch Studien- und Berufswahlmotive sowie selbstregulative Fähigkeiten. Beide Facetten gelten auch als Basis für eine erfolgreiche Professionalisierung bzw. eine erfolgreiche Bewältigung des Lehrberufs (Klieme & Leutner, 2006; Cramer 2016). Trotz einer Varianz der methodischen Zugänge zeigen die motivationalen-affektiven Voraussetzungen von Lehramtsstudierenden der allgemeinbildenden Schulämter ein erstaunlich einheitliches Muster. Schulartspezifisch finden sich allenfalls höhere Ausprägungen der pädagogischen Orientierungen im Lehramt an Grund- und Sekundarschulen gegenüber einer stärkeren fachlichen Orientierung im Lehramt an Gymnasien (Rothland 2014, Cramer 2016). Wenig Erkenntnisse liegen darüber vor, welche motivationalen Orientierungen und Überzeugungen im Vergleich dazu Lehramtsstudierende an berufsbildenden Schulen aufweisen (Ziegler 2019, Driesel-Lange et al. 2017). Auf der Ebene der dienstrechtlichen Rahmenbedingungen sind das Lehramt an Gymnasien und das Lehramt an berufsbildenden Schulen seit etwa Mitte der 1960er Jahre gleichgestellt. Dementsprechend stellen Gymnasiallehrkräfte auch ein Viertel des Lehrpersonals an berufsbildenden Schulen, während nicht einmal die Hälfte des Lehrpersonals über einen regulären Studienabschluss in einem beruflichen Lehramt verfügt (Destatis 2018). Mitunter ist dies ein Resultat der nachhaltigen Rekrutierungsproblematik an berufsbildenden Schulen, wovon besonders die Hochtechnologiefachrichtungen, Elektro-, Fahrzeug- Metalltechnik und Informationstechnik betroffen sind. Dagegen ist die Nachfrage nach Studienplätzen im Lehramt an Gymnasien vergleichsweise robust (Rothland 2014), lediglich in den MINT-Fächern, besonders in Physik, besteht ebenfalls ein Nachfragemangel. Hinsichtlich erfolgsversprechender Strategien der Lehrkräftegewinnung in den Mangelbereichen sind daher Studien- und Berufswahlmotive, Interessen und berufsbezogenen Überzeugungen bei Studierenden im Lehramt an beruflichen Schulen und an Gymnasien in den MINT-Fächern von Interesse. Bezogen auf die Gruppe der Studierenden im Lehramt an beruflichen Schulen, die häufig erst später und über berufliche Erfahrungen oder andere Studiengänge in das berufliche Lehramt einmünden (Ziegler & Berger 2019) ist zudem zu prüfen, ob sie als sogenannte „Spätentscheider“ (Bergmann & Eder 1994) im Vergleich zu Studierenden im Lehramt an Gymnasien mit eher ungünstigen Motivlagen und Überzeugungen in das Studium einmünden oder ob die Passungserwägungen (Person-Umwelt-Modell) – ähnlich wie in den Lehrämtern an allgemeinbildenden Schulen – eher zu einer Homogenisierung im Bereich der motivational-affektiven Facette beitragen.

Fragestellung

Unterscheiden sich Studienanfänger*innen im LaG und LaB aufgrund der unterschiedlichen bildungsbiografischen Zugangswege in ihren motivational-affektiven Voraussetzungen? Gibt es innerhalb der Fächergruppen (MINT oder NICHT-MINT) Ähnlichkeiten und Unterschiede in den affektiv-motivationalen Voraussetzungen?

Methode

Im Zeitraum vom Wintersemester 16/17 bis zum Wintersemester 19/20 wurden insgesamt vier Kohorten Lehramtsstudierender (LaB und LaG) im ersten Semester an der TU Darmstadt erhoben und hinsichtlich ihrer Studienzugangswege und der motivationalen Voraussetzung untersucht. Insgesamt konnten 468 Studierende befragt werden, davon studieren 132 im LaB und 336 im LaG. Neben der Art der Hochschulzugangsberechtigung, der Tätigkeiten vor Studienbeginn, wurden auch die Fächerkombinationen, Motivation zu einem Hochschulstudium (sensu Richter 1995), Berufswahlmotivation mit FEMOLA-Skalen (Pohlmann et. al. 2010), Reflexionsbereitschaft (sensu Niggli 2004) sowie Selbstwirksamkeitserwartung (Schwarzer & Schmitz 1999) erhoben.

Ergebnisse

Die bisherige Datenlage zeigt, dass sich die Studierendengruppen in Bezug auf ihr Alter, die Art der Zugangsberechtigung und der Tätigkeit vor dem Studium signifikant unterscheiden, sich aber lediglich geringe Unterschiede hinsichtlich der Berufswahlmotivation, Selbstwirksamkeitserwartungen und Reflexionsbereitschaft belegen lassen. Lediglich die Motivation für ein Hochschulstudium ist bei LaB-Studierenden signifikant geringer ausgeprägt (t(341) = 2.617, p = .009). In einem Teil der Stichproben zeigen sich in den über das erste Studienjahr längsschnittlich erhobenen Daten, dass sich die Erwartungen an Inhaltsbereich und Leistungsanforderungen des ersten Fachs, den zeitlichen Aufwand und die Studienbedingungen der LaB-Studierenden signifikant weniger erfüllen als die der LaG-Studierenden. Es zeigt sich gleichzeitig, dass die allgemeinen Studienzufriedenheit und die Zufriedenheit mit dem ersten Fach im hohen Maß (R² = 0,98) davon abhängt, inwieweit die sich die Erwartungen an die Studieninhalte und Leistungsanforderungen im ersten Fach erfüllen.

 
11:15 - 13:00F11‒H06: Diagnostische Urteilsprozesse als Informationsverarbeitung und die Bedeutung von Personen- und Situationsmerkmalen
H06 
 

Diagnostische Urteilsprozesse als Informationsverarbeitung und die Bedeutung von Personen- und Situationsmerkmalen

Chair(s): Katharina Loibl (PH Freiburg), Timo Leuders (PH Freiburg), Tobias Dörfler (PH Heidelberg)

DiskutantIn(nen): Detlev Leutner (Universität Duisburg-Essen, Deutschland)

Diagnostizieren gilt als eine wesentliche Tätigkeit von Lehrkräften: Eine zutreffende Einschätzung über das Wissen, die Motivation oder das Denken der Schülerinnen und Schüler ist Voraussetzung für das Feedback an Lernende oder Eltern, für Übergangsentscheidungen und für die Anpassung des Unterrichts (z. B. Artelt & Gräsel, 2009; Baumert & Kunter, 2013; Glock, Krolak-Schwerdt & Pit-Ten Cate, 2015; Helmke, 2010; Hobfoll, Halbesleben, Neveu & Westman 2018; Praetorius, Berner, Zeinz, Scheunpflug & Dresel, 2013). Das Wissen und die Fähigkeiten der Lehrkräfte, die für die Vorbereitung, Durchführung und Reflexion von Beurteilungen – ob formal oder informell, formativ oder summativ – erforderlich sind, werden unter dem Oberbegriff diagnostische Kompetenz zusammengefasst (Herppich et al., 2018; Popham, 2009; Schrader, 2009; Weinert, Schrader & Helmke, 1990). Die meisten Forschungsarbeiten zur diagnostischen Kompetenz von Lehrkräften zielen darauf ab, den Einfluss verschiedener situativer Faktoren (z. B. der untersuchten Lerngruppe, des Leistungsniveaus der Schüler(innen) oder der Aufgabenschwierigkeiten) einerseits oder der Eigenschaften von Lehrpersonen (z. B. Alter der Lehrkraft, Berufserfahrung oder Fachwissen) andererseits auf die Urteilsgenauigkeit zu analysieren (für einen Überblick siehe Südkamp Kaiser & Möller, 2012). Andere Ansätze sind an der Untersuchung des breiten Spektrums von Lehrkräfteaktivitäten im Zusammenhang mit der Diagnose interessiert (z. B. Black & Wiliam, 2003; Herppich et al., 2018). Der Forschungsstand zum diagnostischen Urteilen wird in den Bildungs­wissen­schaften jedoch als unbefriedigend angesehen, da bisher noch keine überzeugenden Theorien über die kognitiven Prozesse beim Diagnostizieren aufgestellt wurden (Schrader, 2009; Spinath, 2005; Leuders, Dörfler, Leuders & Philipp, 2018; Herppich et al., 2018). Für das Verständnis der Genese eines Urteils scheint es entscheidend zu sein, welche Informationen in der Diagnosesituation von einer Lehrkraft wahrgenommen werden und wie diese Informationen (mehr oder weniger wissensbasiert) verarbeitet werden. Überraschen­derweise ist bislang nur wenig über den Informationsverarbeitungsprozess von Lehrkräften bekannt.

Als theoretische Basis für Forschungsansätze, die Informationsverarbeitung von Lehrkräften als kognitive Erklärung untersucht, wurde ein Rahmenmodell entwickelt, genannt DiaCoM (Explaining Teachers’ Diagnostic Judgements by Cognitive Modeling;). Das DiaCoM-Rahmenmodell konzeptualisiert diagnostisches Urteilen in Bildungskontexten als Schlussfolgern einer Lehrkraft über Schüler(innen) (z. B. deren Fähigkeit) oder über Anforderungen (z. B. Aufgabenschwierigkeiten) auf der Grundlage der Informationen, die durch eine diagnostische Situation definiert werden. Es bezieht sich somit auf Theorien der kognitiven Informationsverarbeitung. Dabei bietet das DiaCoM-Rahmenmodell einen theoretischen und forschungsstrategischen Rahmen für die Spezifikation von Situationscharakteristika (SC), Personencharakteristika der Lehrpersonen (PC), Prozessen der Informationsverarbeitung als diagnostisches Denken (DD) und diagnostischem Verhalten (DV). Diese Spezifikationen ermöglichen die experimentelle Überprüfung von Annahmen zur Genese diagnostischer Urteile. Im Symposium beziehen sich alle Beiträge auf das Rahmenmodell. Die Beiträge zeigen auf, wie die Spezifikation des diagnostischen Denkens als konkrete kognitive Prozesse der Verarbeitung von Informationen (DD), der Diagnosesituation hinsichtlich wahrnehmbarer Informationen (SC) und der diagnoserelevanten Personeneigenschaften über konkrete Wissenselemente und psychische Zustände(PC) erlaubt, Vorhersage des diagnostischen Verhaltens (DV) in Form überprüfbarer Hypothesen aufzustellen und zu untersuchen.

Der erste Beitrag testet den Prozess der Wahrnehmung schwierigkeitsgenerierender Merkmale (DD) als Voraussetzung für genaue Urteile (DV) mittels Eyetracking. Als Situationscharakteristik (SC) wurden Aufgaben generiert, die sich in ihren schwierigkeitsgenerierenden, visuell wahrnehmbaren Merkmalen unterscheiden.

Der zweite Beitrag untersucht in einem Experiment den Einfluss von Stress (PC) auf Blickbewegungen bei der Wahrnehmung (DD) und Einschätzung (DV) von Aufgabenschwierigkeiten (SC).

Der dritte Beitrag unterscheidet die Wahrnehmung und Gewichtung (DD) von relevanten und irrelevanten Merkmalen (SC) bei der Einschätzung von Aufgabenschwierigkeiten (DV) mit und ohne spezifischem fachdidaktischem Wissen (PC).

Der vierte Beitrag untersucht die unterschiedliche Wahrnehmung und Interpretationen (DD) von fachlichen und instruktionalen Merkmalen (SC) in einem within-subject Design. Spezifische Aspekte des fachdidaktischen Wissens (PC) werden bei Lehrkräften mit und ohne Berufserfahrung (PC) als potentiell moderierende Faktoren berücksichtigt.

 

Beiträge des Symposiums

 

Diagnoseprozesse der Schwierigkeitseinschätzung von Mathematikaufgaben – eine Analyse von Blickbewegungen

Kirsten Brunner, Andreas Obersteiner, Timo Leuders
PH Freiburg

Theoretischer Hintergrund und Ziel der Studie

Eine für die Unterrichtsgestaltung wesentliche Facette diagnostischer Kompetenz ist die Fähigkeit, fachdidaktisches Wissen zu nutzen, um die Schwierigkeiten von (Mathematik-)Aufgaben korrekt einzuschätzen. Bisherige Studien fokussierten dabei zumeist auf die Qualität diagnostischer Urteile (Karst, 2012; McElvany et al., 2009; Schrader, 1989). Hingegen ist über die zugrundeliegenden Diagnoseprozesse und insbesondere über die Rolle der Wahrnehmung relevanter Aufgabenmerkmale bislang wenig bekannt. Ostermann, Leuders, and Nückles (2017) konnten zeigen, dass sich Einschätzungen von Aufgabenschwierigkeiten nach einer fachdidaktischen Intervention verbessern. Unbekannt ist jedoch, ob tatsächlich das verstärkte Wahrnehmen der relevanten Aufgabenmerkmale für die verbesserten Einschätzungen verantwortlich war.

Hier setzt die vorliegende Studie an. Sie hat zum Ziel, den Prozess der diagnostischen Urteilsfindung (vgl. diagnostisches Denken DD im DiaCoM-Rhamenmodell) im Fach Mathematik, insbesondere Prozesse des Wahrnehmens und Interpretierens, in Abhängigkeit von der Urteilsgenauigkeit zu beschreiben. Ausgehend von der Eye-Mind-Hypothese (Just & Carpenter, 1976), welche besagt, dass Menschen hauptsächlich die Informationen verarbeiten, die sie gerade mit dem Auge fixieren, gehen wir davon aus, dass sich die Qualität der Wahrnehmung und Interpretation relevanter Aufgabenmerkmale in den Augenbewegungen widerspiegelt (vgl. diagnostisches Denken DV im DiaCoM-Rahmenmodell). In diesem Beitrag gehen wir der Frage nach, ob es gelingt konsistente Muster im Blickverhalten angehender Mathematiklehrkräfte zu identifizieren. Wir erwarten, dass genauere Einschätzungen mit längeren Blickzeiten auf relevante Merkmale einhergehen.

Methode

Es wurden 20 Aufgaben zu Funktionsgraphen konzipiert, deren Schwierigkeitsgrade sich auf Grund visuell wahrnehmbarer Merkmale unterscheiden. „Schwierige“ Aufgaben adressieren hierbei jeweils einen typischen und in der mathematikdidaktischen Literatur gut dokumentierten Schülerfehler (Hattikudur et al., 2012; Nitsch, 2015). „Leichte“ Aufgaben sind inhaltlich vollständig parallel konzipiert, enthalten aber nicht das für den jeweiligen Schülerfehler relevante Merkmal. Die zunächst theoretisch begründete Unterscheidung in „schwierige“ und „leichte“ Aufgaben wurde an einer Stichprobe von N = 110 Schüler*innen validiert. Erwartungskonform waren die mittleren Lösungsraten für schwierige Aufgaben signifikant niedriger (M = 34%, SD = 14) als die der leichten Aufgaben (M = 98%, SD = 2), t(18) = -8.55, p < 0.001, d = 0.81. Die Aufgaben wurden Studierenden des Lehramts Mathematik zur Einschätzung des Schwierigkeitsgrades vorgelegt. Zum gegenwärtigen Zeitpunkt liegen Daten von N = 48 Proband*innen vor. Die Aufgabe der Teilnehmenden war es, nacheinander den Schwierigkeitsgrad der Aufgaben auf einer Skala von 1 (sehr leicht) bis 4 (sehr schwer) zu beurteilen. Die Aufgaben wurden auf einem Bildschirm gezeigt. Während der Einschätzung wurden die Blickbewegungen mit einem Eyetracker aufgezeichnet. Nach jeder Einschätzung wurden die Teilnehmenden gebeten, ihre Urteile zu begründen.

Ergebnisse

Die bisherigen Analysen zeigen, dass der Schwierigkeitsgrad der „schwierigen“ Aufgaben auch signifikant höher eingeschätzt wurde (M = 2.4, SD = .41) als der der „leichten“ Aufgaben (M = 1.44, SD = .43), t(18) = -4.07, p = .001. In den Begründungen nannten allerdings lediglich 5% der Teilnehmenden den jeweils relevanten Fehlertyp, was auf unzureichendes fachdidaktisches Wissen hindeutet. In den Blickbewegungen zeigte sich, dass Aufgaben, welche den Fehlertyp „Steigung-Höhe-Verwechslung“ provozierten signifikant länger betrachtet wurden, als Aufgaben welche keinen der typischen Schülerfehler provozierten t(7) = -2.074, p = 0,039. Dies sehen wir als ersten Hinweis dafür, dass sich die Wahrnehmung der schwierigkeitsgenerierenden Merkmale in den Blickbewegungen widerspiegelt. In weiteren Analysen soll geprüft werden, ob genauere Urteile und bessere Begründungen für die Urteile mit längeren Fixationszeiten auf relevante Aufgabenmerkmale einhergehen. Hierbei soll die Qualität des Wahrnehmens als die relative Länge der Fixationszeiten auf den relevanten Aufgabenmerkmalen operationalisiert werden. Die Ergebnisse dieser Analysen werden auf der Tagung vorgestellt. Die Identifizierung dieser Muster ist ein erster Schritt zu einem besseren Verständnis dafür, wie (angehende) Lehrpersonen ihr fachdidaktisches Wissen zu typischen Schülerfehlern nutzen, um die Schwierigkeit von Mathematikaufgaben richtig einzuschätzen und somit passgenaue Aufgaben für Schüler*innen auszuwählen.

 

Der Einfluss von Stress auf Blickbewegungen bei der Wahrnehmung und Einschätzung von Aufgabenschwierigkeiten

Sara Becker1, Birgit Spinath2, Beate Ditzen3, Tobias Dörfler1
1PH Heidelberg, 2Universität Heidelberg, 3Universitätsklinikum Heidelberg

Theoretischer Hintergrund

Zentrales Anliegen der Studie war es, den situativen Einfluss von Stress auf Blickbewegungen sowie damit einhergehende diagnostische Urteilsprozesse während des Wahrnehmens und Beurteilens von Mathematikaufgaben zu untersuchen. Akkurate Schwierigkeitseinschätzungen von Aufgaben, als Teil situativ tragfähiger Diagnosen einer Lehrperson, finden nicht nur in der Unterrichtsvorbereitung, sondern auch in realen Unterrichtssituationen statt. In realen Unterrichtssituationen diagnostizieren Lehrkräfte jedoch oftmals unter Zeitdruck oder aufgrund der hohen Arbeitsbelastung unter psychischer Anspannung (Fidler, 2004). Dennoch besteht wenig empirische Evidenz zum möglicherweise verzerrenden Effekt situationsabhängiger Zustände, wie Stress, auf das diagnostische Denken sowie die Urteilsbildung.

Zahlreiche Befunde legen nahe, dass insbesondere psychische Anspannungen, wie Stress, kognitive Kapazitäten binden, die aufgrund der begrenzten Arbeitsgedächtniskapazität nicht mehr für die analytische Urteilsbildung zur Verfügung stehen (Chen & Chaiken, 1999). Es wird angenommen, dass die Lehrkräfte unter Stresserleben daher offensichtliche Aufgabenmerkmale für ihre Urteilsbildung fokussieren. Der Einfluss von Stress auf die Urteilsbildung kann anhand von Eyetracking-Daten nachvollzogen werden. Es wird angenommen, dass insbesondere Blickbewegungsdaten, die als Maß für kognitive Verarbeitung angesehen werden können, unter Stresserleben Veränderungen aufzeigen. Unter anderem wird daher für die Teilnehmenden unter Stresseinfluss eine kürzere Fixationsdauer, als Maß für die kognitive Verarbeitung, sowie eine geringere Anzahl von Fixationen ab einer Länge von 250 ms, die einen tiefergehenden und analytischeren Prozess widerspiegeln (Deubel, 2008), erwartet.

Retrospektive Verbalprotokolle helfen, die Eyetracking-Daten stringenter auszuwerten (Philipp, 2018). Sie ermöglichen Rückschlüsse auf das diagnostische Denken (König et al., 2016). Es wird erwartet, dass Teilnehmende unter Stresseinfluss insgesamt weniger diagnoserelevante Aufgabenmerkmale für ihr diagnostisches Urteil berücksichtigen, sowie mehr oberflächlich erkennbare Aufgabenmerkmale nennen. Die in Untersuchungen durchgeführten Messungen des Stresshormons Cortisol können als objektiver Indikator für eine zugrundeliegende Stressreaktion des Individuums angesehen werden (Kirschbaum & Hellhammer, 1999).

Methode

Eine experimentelle Eyetracking-Studie, basierend auf einem fachdidaktischen Mathematiktest, wurde mit 64 Mathematiklehramtsstudierenden (Alter: M=22.72, SD=4.16, 73 % Frauen) der Pädagogischen Hochschule Heidelberg durchgeführt. Die Teilnehmenden der Experimentalgruppe (n=33) wurden im Gegensatz zur Kontrollgruppe vor der Diagnoseaufgabe zusätzlich mithilfe des Sozialevaluativen Kaltwasserstresstests (engl. 'social evaluated cold-pressor test', SECPT) künstlich gestresst (Schwabe, Haddad & Schachinger, 2008). Anhand der Analyse von insgesamt vier Speichelproben wurde das Stressniveau der Teilnehmenden objektiv mithilfe des Stresshormons Cortisol erfasst. Der so erfasste Stress fungierte als Moderator der Diagnosegüte.

Das diagnostische Verhalten der Teilnehmenden bestand in der Einschätzung von Textaufgaben im Bereich der Bruchrechnung hinsichtlich der Schwierigkeit für Realschülerinnen und schüler Ende Klassenstufe 6 beziehungsweise Anfang Klassenstufe 7. Die Aufgaben variierten in der Auffälligkeit der schwierigkeitsgenerierenden Aufgabenmerkmale. Die Blickbewegungen während der Diagnosetätigkeit wurden mithilfe des Eyetrackings dokumentiert und anhand globaler Maße analysiert. Die Blickbewegungen dienten als Indikatoren des zugrundeliegenden diagnostischen Denkens. Retrospektive Verbalprotokolle gaben Auskunft über die Interpretation der wahrgenommenen Aufgabenmerkmale während des diagnostischen Denkens und über die Interpretation der Relevanz für das diagnostische Urteil.

Ergebnisse und Diskussion

Die Ergebnisse der Blickbewegungsanalysen zeigten unter anderem signifikant kürzere Fixationsdauern bei der Experimentalgruppe, als Maß für die kognitive Verarbeitung, (t(62)=1.79, p=.038) mit einer mittleren Effektstärke d=.45 (Cohen, 1988). Eine signifikant geringere mittlere Anzahl an Fixationen ab einer Dauer von 250 ms, ab der eine metakognitive Verarbeitung möglich ist (Deubel, 2008), konnte innerhalb der Experimentalgruppe im Vergleich zur Kontrollgruppe aufgezeigt werden (t(62)=1.86, p=.033). Die Effektstärke lag bei d=.46. Die Auswertung der Verbalprotokolle ergab, dass insbesondere mathematische Aspekte, im Vergleich zu sprachlichen Aspekten als schwierigkeitsgenerierend eingestuft wurden. Über alle Aufgaben hinweg wurden sowohl mathematisch als auch sprachlich schwierigkeitsgenerierende Aufgabenmerkmale signifikant häufiger von der Kontrollgruppe als von der Experimentalgruppe genannt und in ihrem diagnostischen Verhalten berücksichtigt.

Anhand der Eyetracking-Daten konnte zusammenfassend festgestellt werden, dass die Stressinduktion Einfluss auf Wahrnehmungsprozesse einer Aufgabe ausübt. Die Auswertung der Verbalprotokolle zeigte, dass insbesondere die Interpretation der wahrgenommenen Aufgabenmerkmale sowie das diagnostische Denken durch die Stressinduktion negativ beeinflusst wurden.

 

Kognitive Prozesse bei der Einschätzung von Aufgabenschwierigkeit - Einflüsse von Wissen und Zeitdruck

Andreas Rieu, Katharina Loibl, Timo Leuders
PH Freiburg

Theoretischer Hintergrund

Das Auswählen von Aufgaben ist eine zentrale Aktivität von Lehrkräften im Rahmen der adaptiven Anpassung des Unterrichts auf die Lernvoraussetzungen einer Lerngruppe (Beck, E., Baer, M., Guldimann, T., Bischoff, S., Brühwiler, C., Müller, P., & Vogt, F., 2008). Dabei stellt die Aufgabenschwierigkeit neben anderen ein Kriterium für die Auswahl dar (Neubrand, Jordan, Krauss, Blum, & Löwen, 2011).

Um die Aufgabenschwierigkeit einzuschätzen, kann in Anlehnung an Prozessmodelle des diagnostischen Urteilens (Loibl, Leuders, & Dörfler, subm.) angenommen werden, dass die Lehrkraft bei dieser Tätigkeit Aufgabenmerkmale zunächst identifiziert und anschließend entscheidet, ob diese relevanten Einfluss auf die Lösungshäufigkeit haben. Für diese Entscheidung benötigen sie fachdidaktisches Wissen über gegenstandsspezifische Schülerkognitionen (knowledge about content and students, Ball, Thames, & Phelps, 2008), konkret über den Einfluss von Aufgabenmerkmalen auf Schülerschwierigkeiten bei der Aufgabenbearbeitung.

Fragestellung

In der vorliegenden Studie sollen durch die systematische Variation von Faktoren in der Diagnosesituation (Aufgabenmerkmale, verfügbare Zeit) und der diagnostizierenden Person (spezifisches fachdidaktisches Wissen) die Einflüsse der situativen und der personalen Charakteristika auf das diagnostische Denken untersucht werden.

Anhand der Urteile der befragten Personen sollen die Annahmen über die kognitiven Prozesse der Identifizierung und der Gewichtung der Aufgabenmerkmale empirisch geprüft werden. Dies geschieht anhand der Fragestellungen: Erhöht die Vermittlung von fachdidaktischem Wissen durch die verbesserte Identifizierung und Gewichtung die Urteilsakkuratheit? Wirkt sich eine Zeitrestriktion vor allem negativ auf die (komplexere) Gewichtung von Aufgabenmerkmalen aus?

Methode

Die Grundlage für die Aufgabeneinschätzung bildet ein Pool mit Additions- und Subtraktionsaufgaben aus der Bruchrechnung, die die Aufgabenmerkmale der Bruchbeziehung, der Bruchdarstellung und des Operationsverständnisses variieren und welche für die empirische Lösungshäufigkeit von Lernenden der 6. und 7. Klasse (N=203) im Vorfeld gelöst wurden. Diese Aufgaben wurden in einer experimentellen Versuchsanordnung angehenden Mathematiklehrkräften (N=212) in paarweisen Vergleichen zur Einschätzung der Aufgabenschwierigkeit vorgelegt. Zur Untersuchung des Einflusses der personalen Charakteristika auf das Urteilsverhalten wurde eine Gruppe zufällig zur Experimentalgruppe definiert und erhielt eine domänenspezifische fachdidaktische Kurzintervention im Bereich der schwierigkeitsgenerierenden Merkmale. Hinsichtlich des Einflusses der situativen Merkmale wurden die Einschätzungen beider Gruppen anschließend an zwei Messzeitpunkten (unter Zeitdruck und ohne Zeitdruck) erhoben. Zur Unterscheidung der angenommenen kognitiven Prozesse wurden die sich gegenüberstehenden Aufgaben entweder in nur einem (zur Identifizierung der Merkmale) oder in zwei gegenläufig ausgeprägten Merkmalen (zu deren Gewichtung) unterschieden.

Ergebnisse

Der Einfluss von spezifischem fachdidaktischen Wissen auf die Urteilsprozesse zeigt sich in einem Gruppenvergleich der Experimentalgruppe mit der Kontrollgruppe. Die Varianzanalyse mit Messwiederholung bezüglich der allgemeinen mittleren Urteilsgüte zeigt, dass die Urteile unter Verwendung des spezifischen Wissens signifikant besser sind (F(1,148)=59.463, p≤.001).

Der situative Einfluss durch die Zeitrestriktion der einzelnen Gruppen unterteilt nach den Messzeitpunkten zeigt, dass die Kontrollgruppe selbst unter Bereitstellung von ausreichend Zeit ihr Urteilverhalten nicht signifikant verbessern kann (F(1,64)=.633, p=.429 ƞ²=.010). Die Experimentalgruppe konnte ihre mittlere Urteilsakkuratheit ohne Zeitdruck noch steigern (F(1,84)=5.659, p=.020, ƞ²=.063). Die Interaktion der beiden Einflussfaktoren Wissen und Zeit ist damit signifikant (F(1,148)=4.701, p=.032, ƞ²=.031) und bedeutet, dass die Anwendung des vermittelten Wissens unter Verwendung von ausreichend Zeit die Urteilsakkuratheit zusätzlich steigert.

Die Trennung der kognitiven Prozesse konnte über die beschriebene Verwendung von unterschiedlich konzeptionierten Aufgabenvergleichen operationalisiert werden. Eine Varianzanalyse mit Messwiederholung zeigt, dass sich die Wissensvermittlung signifikant auf die Verbesserung der Identifizierung (F(1,226)=4.120, p=.044, ƞ²=.018) und Gewichtung (F(1,119)=12.127, p=.001, ƞ²=.092) von Aufgabenmerkmalen auswirkt. Bei der Bestimmung des Einflusses von Zeitrestriktion zeigt sich, dass nur der Gewichtungsprozess ausreichend Zeit benötigt (F(1,119)=3.917, p=.050, ƞ²=.032), die Identifizierung von Aufgabenmerkmalen aber nicht anfällig auf Zeitdruck ist (F(1,226)=1.923, p=.679, ƞ²=.001). Dieses Ergebnis unterstützt die Annahme, dass diagnostische Urteile durch zwei unterscheidbare informationsverarbeitende Prozesse zustande kommen.

Die vorliegende Studie generiert sowohl einen empirischen Beitrag zur Beforschung der kognitiven Urteilsprozesse als auch Kenntnisse über wirksame Inhalte der Lehrerausbildung im Bereich der diagnostischen Kompetenzen.

 

Diagnostische Urteile zur Schwierigkeit von Mathematikaufgaben: Einfluss von fachlichen und instruktionalen Aufgabenmerkmalen auf die kognitiven Prozesse der Urteilsfindung

Saskia Schreiter, Markus Vogel, Markus Rehm, Tobias Dörfler
PH Heidelberg

Theoretischer Hintergrund und Fragestellung

Die Auswahl und Modifikation von Mathematikaufgaben setzen bei Lehrkräften eine adä-quate Einschätzung von Aufgabenschwierigkeiten voraus. Neben der Komplexität des ma-thematischen Inhalts (z. B. Addition gleichnamiger vs. ungleichnamiger Brüche) wird die Schwierigkeit von Aufgaben unter anderem auch von instruktionalen Merkmalen bestimmt, die gemäß der Cognitive Load Theorie (CLT) die kognitive Belastung von Lernenden beim Lösen der Aufgabe beeinflussen (z. B. split-attention vs. integrated format; Sweller, Ayres, & Kalyuga, 2011). Studien zur Urteilsgenauigkeit belegen, dass Lehrkräfte sich bei der Einschätzung der Aufgabenschwierigkeit insensitiv gegenüber dem Instruktionsdesign zei-gen (Hellmann & Nückles, 2013). Weiterhin weisen Studien darauf hin, dass die Genauig-keit des Urteils von bestimmten Personencharakteristika (z. B. fachdidaktisches Wissen) beeinflusst wird (Ostermann, Leuders, & Nückles, 2017). Wenig bekannt ist bisher über die kognitiven Prozesse, die diagnostischen Urteilen zugrunde liegen (Leuders, Dörfler, Leuders, & Philipp, 2018). Aufbauend auf den Ergebnissen und dem methodischen Design der Studie von Hellmann & Nückles (2013), fokussiert der vorliegende Beitrag die Wahr-nehmung und Verarbeitung (Loibl, Leuders, & Dörfler, subm.) von fachlichen und instruk-tionalen Aufgabenmerkmalen beim Diagnostizieren der Aufgabenschwierigkeit. Konkret werden die folgenden drei Forschungsfragen gestellt: 1. Welche schwierigkeitsgenerieren-den Aufgabenmerkmale (fachliche vs. instruktionale) werden von Lehrkräften beim Diag-nostizieren der Aufgabenschwierigkeit wahrgenommen und verarbeitet? 2. Besteht ein Zu-sammenhang zwischen spezifischen Aspekten des Pedagogical Content Knowledge (PCK)/Pedagogical Knowledge (PK) und der Wahrnehmung und Verarbeitung von Aufga-benmerkmalen? 3. Unterscheiden sich Lehrkräfte mit Berufserfahrung von Lehramtsstu-dierenden bezüglich der Wahrnehmung und Verarbeitung von Aufgabenmerkmalen?

Methode

Im Diagnosetest werden sechs Aufgaben aus dem Bereich der Bruchrechnung hintereinan-der präsentiert. In einem within-subject Design sind schwierigkeitsgenerierende Merkmale systematisch variiert: Im Bereich der Bruchrechnung durch Adaption des Schwierigkeits-grades (Padberg & Wartha 2017) und im Bereich des Instruktionsdesigns gemäß ausge-wählter Gestaltungsempfehlungen der CLT. Zu jeder Aufgabe werden drei Arten des diag-nostischen Verhaltens erfasst: Einschätzung der Lösungshäufigkeit (DV1), Begründung, was die Aufgabe leicht oder schwer macht (DV2) und Modifikation der Aufgabe zur Än-derung der Schwierigkeit (DV3). Die systematische Variation der Aufgabenmerkmale er-möglicht, von dem konkret erhobenen diagnostischen Verhalten Rückschlüsse auf die wahrgenommenen und verarbeiteten Aufgabenmerkmale zu ziehen. Im anschließenden PCK/PK Test wird die spezifische Wissensausprägung zu schwierigkeitsgenerierenden Aufgabenmerkmalen (Bruchrechnung und Instruktionsdesign) erfasst. Hierfür werden zwei Aufgaben, die sich nur in einem schwierigkeitsgenerierenden Merkmal unterscheiden, di-rekt nebeneinander präsentiert und die Einschätzung der schwierigeren Aufgabe erhoben. Um einen potentiellen Einfluss der Berufserfahrung zu untersuchen, wurde die Studie mit 35 praktizierenden Lehrkräften (Gymnasien, Real- und Gemeinschaftsschulen) und 55 Lehramtsstudierenden durchgeführt.

Ergebnisse

Die Ergebnisse zeigen, dass sowohl Lehrkräfte als auch Studierende überwiegend die Schwierigkeit des mathematischen Inhalts wahrnehmen, jedoch kaum die Schwierigkeit, die vom Instruktionsdesign ausgeht. Die drei erhobenen diagnostischen Verhaltensweisen lassen darauf schließen, dass die Teilnehmenden beim Diagnostizieren stets signifikant mehr fachliche als instruktionale Aufgabenmerkmale wahrgenommen und verarbeitet ha-ben (DV1: t(89) = 10.76, p < .001, d = 1.62 ; DV2: t(89) = 12.60, p < .001, d = 1.74; DV3: t(89) = 8.64, p < .001, d = 1.45). Unterschiede zwischen Studierenden und Lehrkräften konnten bei bei der Begründung der Aufgabenschwierigkeit (DV2) in Form eines Interakti-onseffektes festgestellt werden (F(1,88) = 4.46, p < .05, partielles η2 = .048). Entgegen der Erwartung zeigen die Ergebnisse, dass die Teilnehmenden über ein vergleichbar hohes PCK/PK bzgl. schwierigkeitsgenerierender Aufgabenmerkmale im Bereich der Bruchrech-nung (M = .74, SD = .33) und des Instruktionsdesigns (M = .73, SD = .28) verfügen. Diese Ergebnisse werfen die Frage auf, warum (angehende) Lehrkräfte bei der Schwierigkeitsein-schätzung von Aufgaben kaum instruktionale Merkmale wahrnehmen, obwohl sie über ein ausgeprägtes PK in diesem Bereich verfügen? Ausgehend von den vorliegenden Ergebnis-sen wird eine weitere Studie zur Untersuchung möglicher Erklärungsansätze geplant.