Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nach Track oder Beitragstyp der Sitzung filtern 
Nur Sitzungen am Veranstaltungsort 
 
 
Sitzungsübersicht
Ort: H02
Hörsaal, 150 TN
Datum: Montag, 18.03.2024
10:30 - 12:101-04: Ungleichheiten im lebenslangen Lernen und ihre Folgen: Längsschnittliche Erkenntnisse auf der Basis des Nationalen Bildungspanels
Ort: H02
 
Symposium

Ungleichheiten im lebenslangen Lernen und ihre Folgen: Längsschnittliche Erkenntnisse auf der Basis des Nationalen Bildungspanels

Chair(s): Corinna Kleinert (Leibniz-Institut für Bildungsverläufe (LIfBi) und Universität Bamberg), Steffen Schindler (Universität Bamberg)

Diskutant*in(nen): Sarah Widany (Deutsches Zentrum für Hochschul- und Wissenschaftsforschung (DZHW))

Heutige Wissensgesellschaften sind durch Prozesse des kontinuierlichen technologischen, ökonomischen und sozialen Wandels gekennzeichnet. Diese erfordern es, dass Menschen ihre Fähigkeiten fortwährend an veränderte Anforderungen anpassen (van Nieuwenhove und Wever 2021; Gorges, 2015). Lernprozessen nach der Schule und Erstausbildung kommt damit eine wachsende Relevanz zu. In der Realität ist das Lernen im Erwachsenenalter allerdings hochgradig sozial stratifiziert. Es partizipieren vor allem diejenigen, die sowieso schon bessere Voraussetzungen mitbringen (Kilpi-Jakonen et al. 2015). Vor diesem Hintergrund stellen sich zwei grundlegende Fragen: Wie universell sind diese sozialen Ungleichheiten im lebenslangen Lernen, das heißt, wie stark variieren sie über die Zeit und über unterschiedliche institutionelle Kontexte (Boeren et al. 2012)? Und welche Konsequenzen haben sie für die weiteren Lebensverläufe, Lebenschancen und Karrieren Erwachsener, aber auch für die Entwicklung gesamtgesellschaftlicher Ungleichheit? Antworten auf beide Fragen sind entscheidend, um die Relevanz sozial ungleicher Lernbeteiligung besser einordnen zu können und um zu verstehen, wo gesellschaftliche Anreize liegen könnten, diese zu verringern. Aufgrund der großen Heterogenität von Bildungsprozessen, Lernformen und Lernkontexten im Erwachsenenalter sind diese Fragen jedoch kaum universell zu beantworten (Kaufmann & Widany, 2013), und die Forschung dazu ist noch immer überschaubar.

Dies liegt vermutlich auch daran, dass man zu ihrer empirischen Bearbeitung reichhaltige Längsschnittdaten benötigt. In Deutschland stellt das Nationale Bildungspanel (NEPS) die einzige Datenquelle dar, die es erlaubt, heterogene Bildungsprozesse, -formen und -kontexte im Erwachsenenalter zu identifizieren, diese längerfristig bei den gleichen Personen zu beobachten und Einflüsse veränderter Gelegenheitsstrukturen sowie Erträge von lebenslangem Lernen zu analysieren. Daher versammelt dieses Symposium eine Diskussion und vier Beiträge aus unterschiedlichen disziplinären Perspektiven auf der Basis der Erwachsenenkohorte des NEPS (NEPS-SC6), die genuin längsschnittliche Fragestellungen im Kontext der Beteiligung an und der Erträge von Lernaktivitäten im Erwachsenenalter adressieren.

Die ersten zwei Beiträge nehmen die ungleiche Beteiligung an Lernprozessen im Erwachsenenalter in den Blick und untersuchen, welche Auswirkungen sich verändernde Gelegenheitsstrukturen darauf haben, die durch gesamtgesellschaftliche Krisen bedingt sind. Der erste Beitrag befasst sich mit Effekten von Konjunkturzyklen auf die individuelle Weiterbildungsbeteiligung. Dabei werden zwei Mechanismen beleuchtet, die die bisher vorliegenden widersprüchlichen Forschungsergebnisse dazu erklären können, nämlich die Rolle von Risikopräferenzen und Statuserwägungen. Außerdem werden unterschiedlich finanzierte Weiterbildungen unterschieden. Der zweite Beitrag befasst sich den Auswirkungen der COVID-19-Pandemie auf die Entwicklung geschlechts- und familienspezifischer Ungleichheiten in der Teilnahme an berufsbezogener Weiterbildung. Er untersucht, welchen Einfluss Inzidenzraten, staatliche Beschränkungen und Veränderungen der Arbeitssituation auf die Weiterbildungsteilnahme von Frauen und Männern mit und ohne Kindern hatten.

Die beiden folgenden Beiträge beleuchten Erträge von Lernprozessen im Erwachsenenalter. Der dritte Beitrag befasst sich mit der Rolle von Weiterbildung für Personen, deren berufliche Karrieren vom technologischen Wandel betroffen sind. Hier wird erstens analysiert, ob berufliche Weiterbildung vor Arbeitsplatzverlust und anschließender Arbeitslosigkeit schützt, und zweitens, ob dabei länderspezifische Unterschiede zu beobachten sind. Konkret werden dazu Deutschland und Großbritannien verglichen, wofür Analysen auf Basis des Haushaltspanels Understanding Society durchgeführt wurden. Der vierte Beitrag befasst sich grundlegend mit sozialen Reproduktionsprozessen und fragt, inwieweit eine formale Höherqualifizierung dazu beitragen kann, dass sich der enge Zusammenhang von sozialer Herkunft und sozialer Platzierung im Erwachsenenalter im Laufe des Lebens noch verändert. Konkret wird untersucht, ob formale Bildungsaufstiege dazu beitragen, den Zusammenhang zwischen sozialer Herkunft und Einkommen zu verändern. Dazu werden Daten der NEPS-SC6-ADIAB genutzt, in der das NEPS um administrative Daten angereichert wurde.

Zum Schluss werden alle vier Beiträge zusammenfassend diskutiert, insbesondere mit Blick auf interdisziplinäre Anschlüsse, künftige Forschungsbedarfe und Implikationen für Interventionen.

 

Beiträge des Symposiums

 

Die Rolle von Risikopräferenzen und Statuserwägungen bei der Vermittlung von Konjunktureffekten auf individuelle Weiterbildungsbeteiligung

Dominik Becker, Marion Thiele, Myriam Baum, Sandra Müller, Harald Pfeifer, Nele Tschöpe
Bundesinstitut für Berufsbildung (BIBB)

Konjunkturzyklen können das betriebliche Angebot an und die individuelle Nachfrage nach Weiterbildung beeinflussen (Dietz & Zwick, 2020). Dem aktuellen Forschungsstand lassen sich Inkonsistenzen konstatieren: Theoretisch könnten einerseits betriebliche Weiterbildungsinvestitionen rezessionsbedingt ansteigen, etwa durch geringere Opportunitätskosten (Brunello, 2009) oder ein geringeres Verlustrisiko von Fachkräften an konkurrierende Betriebe (Felstead & Green, 1996). Zudem könnten Rezessionen die betriebliche Übernahme neuer Technologien bestärken (Caballero & Hammour, 1994), somit betriebliche (Weiterbildungs-)Investitionen zur Deckung des resultierenden Fachkräftebedarfs befördern (Hershbein & Kahn, 2018). Andererseits könnten Rezessionen auch betriebliche Weiterbildungsinvestitionen verringern, etwa durch Einnahmeverluste bei gleichbleibenden Finanzbelastungen (Mason & Bishop, 2015) oder hohe Aus-/Weiterbildungskosten bei unklarer Ertragslage (Becker, 1962). Für Individuen verringern rückläufige betriebliche Weiterbildungsangebote die Weiterbildungschancen. Zudem verringern ggf. erhöhte relative Weiterbildungskosten bei niedrigeren verfügbaren finanziellen Ressourcen die Weiterbildungsteilnahmen. Dagegen könnten Individuen rezessionsbedingt freigesetzte Zeitressourcen – etwa bei Arbeitslosigkeit/Kurzarbeit – in ihre Weiterbildung investieren (Felstead et al., 2013), deren erwarteter Nutzen gleichzeitig zunehmen würde.

Der empirische Forschungsstand folgt diesen theoretischen Inkonsistenzen: Während die Studienlage mehrheitlich rezessionsbedingt geringere betriebliche Weiterbildungsinvestitionen nahelegt (Mason & Bishop, 2015; z.B. Popov, 2014), beobachteten andere Studien gegenläufige (Bassanini et al., 2007) oder keine Effekte (Felstead et al., 2012). Auch für die individuelle Weiterbildungsnachfrage wurden sowohl positive (Majumdar, 2007) als auch, häufiger, negative Konjunktureffekte beobachtet (Bassanini & Brunello, 2008; Dietz & Zwick, 2020; Sepulveda, 2004).

Wir adressieren zwei mögliche Gründe für diese Inkonsistenzen in bisherigen Studien: 1) heterogene Konjunktur- und Weiterbildungsmaße sowie 2) bislang ungenaue Messungen der den Konjunktureffekten zu Grunde liegenden Mechanismen. Ad 1) schätzen wir Konjunktureffekte für verschiedene Konjunkturmaße (z.B. jährliches BIP vs. monatlich/quartalsweise Arbeitslosenquoten auf regionaler/nationaler Ebene) auf die individuelle betrieblich- vs. individuell-finanzierte Weiterbildungsbeteiligung. Ad 2) untersuchen wir die Rolle individueller Risikopräferenzen (Dohmen et al., 2011) und Statuserwägungen (Breen & Goldthorpe, 1997) als potentielle Mediatoren vs. Moderatoren von Konjunktureffekten auf Weiterbildung.

Bewährt ist der Einfluss von Konjunktureffekten auf den Wandel individueller Risikopräferenzen (Guiso et al., 2018), zudem scheinen Risikopräferenzen individuelle Weiterbildungsinvestitionen zu bedingen (Caliendo et al., 2020) – dies spricht für Risikopräferenzen als Mediator von Konjunktureffekten auf Weiterbildung. Zur besseren Trennung investitionsbezogener und statusbezogener Vermittlungseffekte individueller Risikopräferenzen kontrollieren wir zudem individuelle Statuserwägungen. Wir vermuten, dass bei konstanten Statuspräferenzen Rezessionen zu höherer Risikoaversion und damit zu geringeren Weiterbildungsinvestition führen. Zur Herleitung von Moderationseffekten von Risikopräferenzen folgen wir der Idee von psychosozialen Traits als „Linse“, durch die Situationseinflüsse auf individuelles Handeln vermittelt werden (Huinink & Schröder, 2008). Konkret sollten bei konstanten Statuspräferenzen negative Konjunktureffekte auf individuelle Weiterbildungsinvestitionen für risikoaverse Individuen stärker wiegen.

Primäre Datenquelle ist die Erwachsenenstartkohorte des Nationalen Bildungspanels (NEPS-SC6; Blossfeld & Roßbach, 2019). Outcomes sind dichotome Indikatoren individuell vs. betrieblich-finanzierter non-formaler Weiterbildung. Da in NEPS-SC6 nur begrenzte Informationen über den jeweiligen Weiterbildungszeitpunkt vorliegen, spielen wir unter Rückgriff auf das Sozioökonomische Panel den für ausgewählte soziodemographische Hintergrundmerkmale geschätzten Weiterbildungsmonat mittels statistical matching (Alpman, 2016) an die jeweiligen „statistischen Zwillinge“ im NEPS. Auf Basis der imputierten Weiterbildungsmonate können extern vorliegende Konjunkturmerkmale monats- bzw. quartalsgenau ans NEPS angespielt werden. Risikopräferenzen wurden mittels subjektiver domänenübergreifender Risikobereitschaft (0=gering – 10=hoch) gemessen. Statuserwägungen liegen in Form von Einschätzungen des Weiterbildungsnutzens für Jobsicherheit/Statuserhalt sowie als subjektive Wichtigkeit von Jobsicherheit/Statuserhalt (jeweils 0=gering – 10=hoch) vor. Aufgrund der angenommenen Exogenität der Konjunkturindikatoren kontrollieren wir nur Bildung und Alter als wichtigste zeitvariante Kovariaten. Zeitinvariante Heterogenität wird mittels Fixed-Effects-Modellen aufgefangen.

Erste Ergebnisse zeigen antizyklische Konjunktureffekte auf betrieblich-finanzierte Weiterbildung und tendenziell prozyklische Konjunktureffekte auf individuell-finanzierte Weiterbildung, jedoch keine Befunde für eine mediierende Rolle von Risiko- und Statuspräferenzen. Der positive Zusammenhang zwischen subjektivem Weiterbildungsnutzen für den eigenen Statuserhalt und betrieblich-finanzierter Weiterbildungsteilnahme suggeriert für letztere ein vergleichsweise höheres Gewicht für den individuellen Statuserhalt. Als nächste Schritte werden wir die moderierende Rolle von Risikopräferenzen/Statuserwägungen sowie asymmetrische Konjunktureffekte zur Trennung von Auf- und Abschwungseffekten (Allison, 2019) untersuchen.

 

Geschlechterungleichheiten in der berufsbezogenen Weiterbildung während der Covid-19 Pandemie: längsschnittliche Evidenz aus Deutschland

Christina Haas1, Corinna Kleinert2, Gundula Zoch3
1Leibniz-Institut für Bildungsverläufe (LIfBi), 2Leibniz-Institut für Bildungsverläufe (LIfBi) und Universität Bamberg, 3Universität Oldenburg und Leibniz-Institut für Bildungsverläufe (LIfBi)

Von der COVID-19-Pandemie und ihren wirtschaftlichen und sozialen Folgen waren einige soziale Gruppen überproportional stark betroffen. Vor allem die Schließung von Kinderbetreuungseinrichtungen und Schulen führte zu einer Verstärkung der geschlechtstypischen Aufteilung unbezahlter Arbeit (z.B. Zoch et al. 2021), zu mehr Konflikten zwischen Beruf und Familie sowie zu einer Vergrößerung der geschlechtsspezifischen Unterschiede bei der Priorisierung von Arbeitsaufgaben und der Produktivität (z. B. Hipp & Konrad, 2022; Cui et al., 2021; Rusconi et al., 2020). Veränderungen in der Teilnahme an Bildungsprozessen während der Pandemie wurden jedoch erst selten untersucht (vgl. z.B. Kleinert & Zoch, 2023), und überhaupt nicht mit Blick auf Geschlechterungleichheiten. Aufbauend auf früheren Studien, die eine geringere Weiterbildungsbeteiligung von Frauen im Zuge der Mutterschaft konstatieren (Dämmrich et al. 2015; Zoch 2023), sowie auf den jüngsten Ergebnissen zu den geschlechtsspezifischen Auswirkungen von Covid-19 auf Beschäftigung und Familienleben untersuchen wir, wie sich die Pandemie auf geschlechts- und familienspezifische Unterschiede in der Beteiligung an berufsbezogener Weiterbildung ausgewirkt hat.

Wir nutzen dazu einen theoretischen Rahmen, der auf veränderten Gelegenheitsstrukturen, Ansätzen zeitlicher Verfügbarkeit und Überlegungen zu Geschlechterungleichheiten beruht (Becker, 2018; Diekhoff & Steiber, 2011; Massing & Gauly, 2017; Rüter & Martin, 2021). Grundsätzlich dürfte Covid-19 nichts an der intrinsischen Motivation verändert haben, sich weiterzubilden. Deutliche Veränderungen gab es jedoch in den Gelegenheitsstrukturen: Da Frauen häufiger als Männer in systemrelevanten Berufen arbeiten, waren sie während der Pandemie besonders belastet. Die Teilnahme an Weiterbildung dürfte in diesen Arbeitskontexten häufig wenig prioritär gewesen sein. Dies gilt auch für familiäre Kontexte, wo anzunehmen ist, dass Frauen und insbesondere Mütter aufgrund ihrer geringeren Verhandlungsmacht und traditionellen Rollenbildern stärkeren Zeitkonflikten ausgesetzt waren als ihre Partner. Diese Zeitkonflikte dürften in Zeiten und Regionen mit starken Corona-Beschränkungen und hohen Inzidenzen besonders ausgeprägt gewesen sein. Zusammenfassend nehmen wir folglich an, dass Frauen, insbesondere Mütter, anfälliger für staatliche Restriktionen und damit verbundene Konsequenzen waren als Männer, was sie dazu veranlasste, familiären und beruflichen Aufgaben Vorrang vor Weiterbildungsaktivitäten einzuräumen. Dies führte zu einer sinkenden Teilnahme während der COVID-19-Pandemie.

Unsere Studie verwendet Paneldaten aus Deutschland (NEPS-SC6, N=9.078), die Informationen über berufsbezogene nonformale Bildung zwei Jahre vor der Pandemie (2018/19) und zwei Jahre nach Ausbruch der Pandemie (2020/21) enthalten. Zusätzlich wurden regionale Daten zu täglichen COVID-19-Inzidenzraten und staatlichen Beschränkungen auf Kreisebene (INFAS 360) einbezogen. Auf der Grundlage zeitlicher und regionaler Variation im Weiterbildungsangebot, in pandemiebedingten Einschränkungen sowie den Inzidenzraten wurden lineare Wahrscheinlichkeitsmodelle mit individuellen fixen Effekten geschätzt, um Veränderungen der Beteiligung an beruflich motivierter Weiterbildung zu erklären.

Deskriptive Ergebnisse zeigen einen signifikanten Rückgang der Weiterbildungsbeteiligung bei allen Geschlechtern, mit oder ohne Kinder, im ersten Jahr der Pandemie (2020), wobei der Rückgang bei Männern stärker ausfällt als bei Frauen. Vorläufige Ergebnisse linearer Wahrscheinlichkeitsmodelle mit fixen Effekten bestätigen einen deutlichen negativen Effekt während des ersten Pandemiejahres, insbesondere für Frauen mit und ohne Kinder sowie für kinderlose Männer. Diese Rückgänge lassen sich in erster Linie auf regionale Infektionsraten und Veränderungen der Gelegenheitsstrukturen am Arbeitsplatz zurückführen. Interessanterweise deuten die Ergebnisse auf eine robustere Erholung in der Gruppe der Eltern, insbesondere bei Frauen, im Jahr 2021 hin. Im Vergleich dazu weisen kinderlose Erwachsene auch im zweiten Pandemiejahr eine geringere Weiterbildungsbeteiligung auf als vor der Pandemie. Dies deutet darauf hin, dass Kinder das berufliche Lernen über die regionale COVID-19-Dynamik hinaus nicht wesentlich stärker beeinträchtigt haben als pandemiebedingte Veränderungen der Angebotsseite von Weiterbildungen. Zusammenfassend lässt sich schlussfolgern, dass die bisherigen Ergebnisse zwar signifikante Verschiebungen in der berufsbezogenen Weiterbildungsbeteiligung während der COVID-19-Pandemie aufzeigen, diese jedoch nicht mit einer wesentlich stärkeren Benachteiligung von Frauen oder Eltern einhergehen.

 

Stabilisiert Weiterbildung Karrieren, die vom technologischen Wandel betroffen sind? Ergebnisse aus Deutschland und Großbritannien

Martin Ehlert1, Misun Lim2
1Wissenschaftszentrum Berlin für Sozialforschung und Freie Universität Berlin, 2Wissenschaftszentrum Berlin für Sozialforschung

Die Weiterbildung erwachsener Arbeitnehmer ist eine der wichtigsten Prioritäten der politischen Entscheidungsträger, um den negativen sozialen Folgen des technologischen Wandels entgegenzuwirken (OECD 2019). Um beschäftigungsfähig zu bleiben, müssen Arbeitnehmer durch Weiterbildung neue Kompetenzen erwerben. In dieser Studie wollen wir zwei miteinander verbundene Forschungsfragen beantworten: Erstens: Hilft Weiterbildung Arbeitnehmern, ihren Arbeitsplatz zu behalten oder zu einem neuen Arbeitsplatz zu wechseln, wenn ihr derzeitiger Arbeitsplatz von Automatisierung bedroht ist? Zweitens: Moderieren länderspezifische Institutionen die Auswirkungen von Weiterbildung auf die Arbeitsplatzmobilität gefährdeter Arbeitnehmer?

Nach der Humankapitaltheorie (Becker 1975) führen Investitionen in Weiterbildung zu höheren Qualifikationen. Die Teilnahme an Weiterbildungsmaßnahmen sollte es den Arbeitnehmern daher im Allgemeinen ermöglichen, mit den technischen und sozialen Veränderungen am Arbeitsplatz Schritt zu halten oder einfach ihr Wissen auf den neuesten Stand zu bringen. Dies dürfte insbesondere für Beschäftigte in Berufen relevant sein, die durch Automatisierung ersetzt werden könnten. Berücksichtigt man jedoch auch die Personalpolitik der Unternehmen und die Transaktionskosten, so ergeben sich andere Vorhersagen für die Arbeitsplatzmobilität. Die meisten Kurzausbildungen werden von den Unternehmen bezahlt (Cedefop 2015). Die Bereitstellung von Weiterbildungsangeboten stellt somit einen Kostenfaktor für die Unternehmen dar, der gemäß Transaktionskostentheorien ihr Verhalten beeinflusst (Williamson 1985; Wotschack 2020). Folgt man dieser Argumentation, würden Übergänge in neue Beschäftigungsverhältnisse nach der Weiterbildung vor allem innerhalb des Unternehmens stattfinden. Wir gehen davon aus, dass dies für Beschäftigte in schrumpfenden Berufen von größerer Bedeutung ist, da sie wahrscheinlich häufiger Weiterbildungsmaßnahmen nutzen, um neue Qualifikationen für neue Tätigkeiten zu erwerben.

Darüber hinaus erwarten wir Unterschiede zwischen Großbritannien und Deutschland. In Deutschland sind die beruflichen Veränderungen im Laufe des Erwerbslebens vergleichsweise geringer als in Großbritannien, was vermutlich auf die starke Fokussierung auf berufliche Fähigkeiten in der Erstausbildung (Allmendinger und Hinz 1998; Manzoni, Härkönen und Mayer 2014) und in den Arbeitsmarktinstitutionen (Dustmann und Pereira 2008; Hall und Soskice 2001) zurückzuführen ist. Zudem erfordern viele Berufe in Deutschland bestimmte formale Bildungsabschlüsse, insbesondere auf der mittleren Qualifikationsebene (Bol und Weeden 2015; Vicari und Unger 2020). Daher ist es unwahrscheinlich, dass kurze Weiterbildungsmaßnahmen, die fast nie zu einem Wechsel des formalen Qualifikationsniveaus führen, in Deutschland zu einem Wechsel zwischen Berufen führen. Im Vereinigten Königreich hingegen werden berufliche Qualifikationen häufiger "on the job" erworben. Außerdem gibt es einen höheren Anteil von Beschäftigten in Berufen, die keine formale Qualifikation erfordern (Bol und Weeden 2015).

Zur Beantwortung unserer Forschungsfragen greifen wir auf hochwertige Paneldaten aus Deutschland und Großbritannien zurück - das deutsche Nationale Bildungspanel (NEPS) und Understanding Society - The UK Household Longitudinal Study (UKHLS). Darüber hinaus verwenden wir ein neuartiges Maß für das Automatisierungsrisiko, das auf der Wahrnehmung von Personalfachleuten in Europa basiert. Für die Analysen benutzen wir multivariate Event-History Modelle.

Das Hauptergebnis unserer Analyse ist, dass berufliche Weiterbildung Arbeitslosigkeit verhindert (vgl. Dieckhoff, 2007; Ebner & Ehlert, 2018; McMullin & Kilpi-Jakonen, 2014). Dies ist insbesondere bei Arbeitnehmern mit hohem Automatisierungsrisiko der Fall, sowohl in Deutschland als auch im Vereinigten Königreich. Dies steht im Einklang mit unserer auf der Humankapitaltheorie basierenden Vorhersage, dass kurze Weiterbildungsmaßnahmen neue Fähigkeiten vermitteln und dass Arbeitnehmer mit hohem Automatisierungsrisiko am meisten davon profitieren, da sie eine höhere Nachfrage nach Fähigkeiten haben. Infolgedessen sind gefährdete Arbeitnehmer, die nicht an Weiterbildungsmaßnahmen teilnehmen, in beiden Ländern mit einer etwas höheren Beschäftigungsinstabilität konfrontiert. Trotz dieser Ähnlichkeiten haben wir deutliche länderübergreifende Unterschiede im Zusammenhang zwischen Ausbildung und beruflicher Mobilität festgestellt: Während Weiterbildung im Vereinigten Königreich den Arbeitsplatzwechsel zu fördern scheint, insbesondere bei Personen, die einem hohen Automatisierungsrisiko ausgesetzt sind, finden wir in Deutschland einen deutlich schwächeren Zusammenhang.

 

Formale Höherqualifizierung und soziale Ungleichheit auf gesamtgesellschaftlicher Ebene

Anja Grauenhorst, Steffen Schindler
Universität Bamberg

Weiterbildung und lebenslanges Lernen haben in den letzten Jahrzehnten zunehmend an Bedeutung gewonnen. Ihnen kommt zudem eine besondere Relevanz zu, um aktuellen Herausforderungen, wie z.B. veränderten Qualifikationsanforderungen aufgrund des strukturellen und technologischen Wandels oder Fachkräftemangel in bestimmten Branchen, zu begegnen. Andererseits wirft die zunehmende Bedeutung von Weiterbildung auch neue Fragen im Zusammenhang mit sozialer Ungleichheit und Mobilität auf. Da Bildung die zentrale vermittelnde Variable des Zusammenhangs zwischen sozialer Herkunft und sozialer Platzierung ist (Goldthorpe 2014), könnte eine sozial selektive Beteiligung an Weiterbildung diesen Zusammenhang im Lebensverlauf verändern.

In diesem Beitrag wird eine bestimmte Form der Weiterbildung untersucht: formale Höherqualifizierung nach dem Eintritt in den Arbeitsmarkt. Die Frage ist, ob und wie sich der Zusammenhang zwischen sozialer Herkunft und Arbeitslohn auf gesamtgesellschaftlicher Ebene durch diese Form der Weiterbildung verändert. Der Beitrag ist eine Replikation der Studie von Virdia und Schindler (2019), die zeigen, dass formale Höherqualifizierung die Stärke des Zusammenhangs zwischen sozialer Herkunft und sozialem Status nicht verändert. In dieser Studie wurde der soziale Status anhand des Internationalen sozioökonomischen Index des beruflichen Status (ISEI) analysiert. Dies hat zur Folge, dass Effekte der Weiterbildung lediglich im Zusammenhang mit Berufswechseln identifiziert werden können. Vor dem Hintergrund, dass das Ausmaß beruflicher Mobilität im Lebensverlauf in Deutschland eher gering ist (Hillmert 2011; Mayer, Grunow, Nitsche 2010), könnte das Ergebnis der Studie durch die Wahl des gewählten Indikators der Arbeitsmarkterträge beeinflusst sein. Daher erscheint als alternativer zu analysierender Arbeitsmarktertrag der Arbeitslohn besonders interessant, da dieser im individuellen Erwerbsverlauf auch innerhalb der gleichen Berufstätigkeit variieren kann. Wir folgen daher dem Vorschlag von Virdia und Schindler (2019) und betrachten den Arbeitslohn anstelle des ISEI.

Nach Virdia und Schindler (2019) beeinflussen vor allem drei Faktoren das Niveau sozialer Ungleichheit auf gesamtgesellschaftlicher Ebene. Erstens unterscheiden sich die Wahrscheinlichkeiten verschiedener sozialer Herkunftsgruppen im Erwerbsverlauf, nach dem Eintritt in den Arbeitsmarkt, eine formale Höherqualifizierung zu absolvieren. Dies ist vor allem auf Unterschiede in den Ausgangsqualifikationen und Arbeitsmarktpositionen zurückzuführen. Zweitens unterscheidet sich aufgrund der Unterschiede in den Ausgangspositionen die Qualität der Höherqualifizierung zwischen den unterschiedlichen zu analysierenden Gruppen. Hier ist die überbrückte Distanz zwischen anfänglich und neu erworbenem Bildungsabschluss und die damit verbundene Einkommensprämie von Bedeutung. Drittens sind die absoluten Gruppengrößen der sozialen Herkunftsgruppen von Bedeutung: So kann eine geringe Höherqualifizierungswahrscheinlichkeit einer großen Gruppe einen größeren Einfluss auf die gesamtgesellschaftliche Ungleichheit haben als eine hohe Wahrscheinlichkeit einer kleinen Gruppe. Vom Zusammenspiel dieser drei Faktoren hängt es ab, ob Höherqualifizierung im Lebensverlauf insgesamt zu einer Verringerung oder Verstärkung des Zusammenhangs zwischen sozialer Herkunft und dem Arbeitslohn führt.

Für die Analysen nutzen wir die NEPS-SC6-ADIAB-Daten, bestehend aus Befragungsdaten der Startkohorte Erwachsene des Nationalen Bildungspanels und administrativen Daten, aus den Meldungen zur Sozialversicherung, die Teil der Integrierten Erwerbsbiografien (IEB) des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) sind (Bachbauer, Wolf 2022). Wir stellen die Entwicklung des Zusammenhangs zwischen sozialer Herkunft und Arbeitslohn im Erwerbsverlauf anhand von Wachstumskurvenmodellen und Dekompositionsanalysen dar. Der individuelle Arbeitslohn (brutto) ist die zentrale abhängige Variable. Indikator für die soziale Herkunft ist die EGP-Klasse der Eltern (Erikson 1984).

Unsere Ergebnisse zeigen, dass eine ungleichheitsverstärkende Wirkung von formaler Höherqualifizierung im Erwerbsverlauf nicht zu erkennen ist. Man kann die Ergebnisse vorsichtig als Hinweis darauf interpretieren, dass, wenn formale Höherqualifizierung nach dem Arbeitsmarkteintritt in den letzten Jahrzehnten überhaupt einen Effekt auf die soziale Ungleichheit auf gesamtgesellschaftlicher Ebene hatte, dann wahrscheinlich bestenfalls einen geringen mildernden Effekt.

 
13:10 - 14:502-04: Aktuelle Entwicklungen im Bereich des automatisierten Assessments: Zur computergestützten Analyse und Überarbeitung von schriftlichen und mündlichen Texten
Ort: H02
 
Symposium

Aktuelle Entwicklungen im Bereich des automatisierten Assessments: Zur computergestützten Analyse und Überarbeitung von schriftlichen und mündlichen Texten

Chair(s): Birgit Heppt (Humboldt-Universität zu Berlin, Deutschland), Jennifer Meyer (IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und der Mathematik)

Diskutant*in(nen): Katrin Böhme (Universität Potsdam)

Sprache ist in den Bildungsinstitutionen sowohl Lernmedium als auch Lerngegenstand und -ergebnis (vgl. Heppt & Schröter, 2023). So werden Lerninhalte sprachlich vermittelt, etwa durch sprachliche Aushandlungsprozesse im Unterrichtsgespräch oder anhand anspruchsvoller Sachtexte. Gleichzeitig besteht ein zentrales Lernziel von Schule und Unterricht darin, dass Schüler:innen nicht nur in der Unterrichtssprache Deutsch, sondern auch in mindestens einer Fremdsprache solide kommunikative Kompetenzen erwerben. Bis zum Ende der Sekundarstufe I sollen sie beispielsweise in der Lage sein, orthografisch und grammatisch korrekte englischsprachige Texte zu verfassen, die sowohl adressat:innengerecht gestaltet als auch logisch-kohärent aufgebaut sind (KMK, 2023). Die differenzierte Analyse schriftlicher und mündlicher Texte ist somit sowohl für Beschreibung sprachlicher Lerngelegenheiten als auch für die Bewertung und Beurteilung von Lernprodukten von Bedeutung. Herkömmliche Verfahren zur Textanalyse und -bewertung, wie Kodierungen sprachlicher Merkmale oder analytische Bewertungsverfahren, gehen jedoch mit einem erheblichen Ressourcenaufwand einher (z. B. Meyer et al., 2023). Computerlinguistische Methoden erlauben es demgegenüber, Textproduktionen automatisiert und differenziert zu analysieren und ihre Qualität zu bewerten. Überdies ermöglichen sie die Erfassung prozessbezogener Merkmale, die zu einem besseren Verständnis der Bearbeitung von Texten beitragen können.

Ziel des Symposiums ist es, aktuelle Forschungsbefunde im Bereich des automatisierten Assessments komplexer Sprachproduktionen zusammenzutragen und im Hinblick auf zukünftige Potentiale zur Analyse und Förderung sprachlicher Kompetenzen zu diskutieren. Dabei verbindet das interdisziplinär ausgerichtete Symposium Expertise aus der Pädagogischen Psychologie, der Erziehungswissenschaft, der Computerlinguistik und der Sprachwissenschaft. Die drei empirischen Beiträge betrachten Sprachproduktionen entweder in ihrer Bedeutung als Lernmedium (Beitrag 1) oder als Lernergebnis (Beiträge 2 und 3) und setzen unterschiedliche computerlinguistische Maße ein: Während die Beiträge 1 und 2 auf die linguistische Komplexität von Sprachproduktionen fokussieren und diese als Zielvariable berücksichtigen, nimmt Beitrag 3 mithilfe computerlinguistischer Auswertungen den Überarbeitungsprozess schriftlicher Textproduktionen in den Blick. Als Ansatzpunkte zur Förderung (produktiver) sprachlicher Kompetenzen werden sowohl die Rolle der Lehrkraft (Beitrag 1) als auch die Effektivität automatisierten Feedbacks mithilfe computerlinguistischer Merkmale (Beitrag 3) adressiert.

In Studie 1 dienen ausgewählte Merkmale der linguistischen Komplexität (z. B. lexikalische Vielfalt) als differenzierte Zielvariable, um die Effektivität einer Lehrkraftprofessionalisierung im Bereich Sprachbildung bei Grundschullehrkräften zu überprüfen. Dabei wurde anhand von 50 Unterrichtstranskripten computerlinguistisch analysiert, inwiefern die mündliche Unterrichtssprache von Lehrkräften der Experimentalgruppe (EG) nach der Teilnahme an einer Fortbildung im Vergleich zu einer Kontrollgruppe (KG) eine höhere sprachliche Komplexität aufwies. Zwar sprachen Lehrkräfte der EG zunächst insgesamt mehr als Lehrkräfte der KG; unter Berücksichtigung der Textmenge bestanden jedoch nur vereinzelt Gruppenunterschiede in der sprachlichen Komplexität.

Auch in Beitrag 2 wird die linguistische Komplexität zur Messung der sprachlichen Qualität von Textproduktionen eingesetzt. Ziel ist es, die linguistische Komplexität schriftlicher Abiturleistungen im Fach Englisch in Abhängigkeit von den inhaltlichen und sprachlichen Anforderungen der Aufgaben zu analysieren. Die computerlinguistische Analyse der Englischaufsätze von 362 Abiturient:innen zeigt, dass die sprachliche Komplexität der Texte in Abhängigkeit von den Aufgabenmerkmalen variiert und dass bei Textformen mit höheren Anforderungen an die sprachliche Selbstständigkeit besonders starke Zusammenhänge zwischen der sprachlichen Komplexität und den Schulnoten im Fach Englisch bestehen .

In Beitrag 3 schließlich werden, ähnlich wie in Beitrag 1, linguistische Merkmale als Indikatoren für die Wirksamkeit einer Intervention analysiert. Im Falle von Beitrag 3 handelt es sich bei der Intervention um automatisiertes Feedback, welches Schüler:innen der Sekundarstufe I dabei unterstützen sollte, ihre englischsprachigen Texte zu überarbeiten. Die experimentelle Studie zeigt, dass anhand der computerlinguistischen Indikatoren das Ausmaß der Veränderungen am Text operationalisiert und damit die Leistungsverbesserung in der Textüberarbeitung erklärt werden kann.

In der abschließenden Diskussion der drei Beiträge durch eine Expertin in den Bereichen Sprachdiagnostik und Sprachförderung sowie Digitalisierung werden zukünftige Potentiale und Herausforderungen im Bereich des automatisierten Assessments sprachproduktiver Leistungen aufgezeigt.

 

Beiträge des Symposiums

 

Sprachlicher Input im naturwissenschaftlichen Sachunterricht der Grundschule: Bedeutung einer Professionalisierungsmaßnahme für die mündliche Unterrichtssprache von Lehrkräften

Birgit Heppt1, Denise Löfflad2, Sofie Henschel3, Katrin Gabler4, Ilonca Hardy5, Detmar Meurers2
1Humboldt-Universität zu Berlin, 2Eberhard Karls Universität Tübingen, 3Institut zur Qualitätsentwicklung im Bildungswesen (IQB), 4Freie Universität Berlin, 5Goethe-Universität Frankfurt am Main

Qualitativ hochwertige fachliche Instruktionsprozesse bieten das Potenzial, sowohl die fachliche als auch die sprachliche Lernentwicklung von Schüler:innen zu unterstützen. Von zentraler Bedeutung ist hierbei das realisierte Sprachangebot. So belegen empirische Studien die Relevanz fachsprachlicher Äußerungen der Fach- bzw. Lehrkraft für den fachlichen Lernzuwachs der Schüler:innen (z. B. Studhalter et al., 2021); gleichzeitig trägt ein reichhaltiger sprachlicher Input bedeutsam zur sprachlichen Kompetenzentwicklung bei (z. B. Kane et al., 2023). Inputtechniken, bei denen Lehrkräfte als Sprachvorbilder bewusst auf einen differenzierten, korrekten und anregungsreichen sprachlichen Input achten (z. B. durch handlungsbegleitendes Sprechen), gelten daher als wirkungsvolles Element sprachlicher Bildung (z. B. Gabler et al., 2020). Neben einer Reihe weiterer Sprachfördertechniken (z. B. sprachanregende Fragen, korrektives Feedback) bildeten sie einen wesentlichen Bestandteil einer Professionalisierungsmaßnahme, in der Grundschullehrkräfte zur fachbezogenen Sprachbildung im Sachunterricht der Grundschule fortgebildet wurden (Authors, 2020). Die Professionalisierung trägt nachweislich zum Wissen der fortgebildeten Lehrkräfte im Bereich Sprachbildung bei und schlägt sich in ausgewählten Aspekten des sprachbildenden Unterrichtshandelns nieder (z. B. Authors, 2022a). Offen ist jedoch, ob sich Lehrkräfte der Experimentalgruppe (EG) auch hinsichtlich der Quantität und Qualität des mündlichen Sprachgebrauchs von Lehrkräften der (KG) unterscheiden.

Pädagogisch-psychologische Studien, die die mündliche Sprache von Lehrpersonen untersuchen, basieren in der Regel auf aufwendigen Kodierungen ausgewählter sprachlicher Teilbereiche (z. B. Dokter, Aarts, Kurvers, Ros & Kroon, 2017) oder auf Ratings des sprachlichen Anregungsniveaus (z. B. Classroom Assessment Scoring System [CLASS]; Pianta, La Paro & Hamre, 2008). Computerlinguistische Verfahren ermöglichen es demgegenüber, (transkribierte) Texte hinsichtlich einer Vielzahl sprachlicher Merkmale automatisiert zu analysieren und Unterschiede im Sprachgebrauch somit zeitökonomisch zu bestimmen. Vor diesem Hintergrund wird in dem vorliegenden Beitrag unter Rückgriff auf computerlinguistische Analysen überprüft, ob die mündliche Unterrichtssprache der EG-Lehrkräfte anregungsreicher und anspruchsvoller ist als die der KG-Lehrkräfte.

Im Rahmen des Projekts waren Lehrkräfte beider Gruppen (nEG = 8, nKG = 17) zunächst für die Umsetzung ausgearbeiteter Curricula zu den Themen „Schwimmen und Sinken“ (6 Doppelstunden) und „Verdunstung und Kondensation“ (5 Doppelstunden) fortgebildet worden. EG-Lehrkräfte nahmen zusätzlich an einer Professionalisierung zur fachbezogenen Sprachbildung teil, in der die Grundlagen des Scaffolding-Ansatzes nach Gibbons (2002) exemplarisch anhand des Schwimmen und Sinken-Curriculums erarbeitet wurden. Anschließend unterrichteten EG- und KG-Lehrkräfte beide Themen im regulären Sachunterricht der dritten Jahrgangsstufe. Dabei wurde jeweils die zweite Doppelstunde gefilmt und in wesentlichen Teilen transkribiert. Die insgesamt 50 Transkripte (2 je Lehrkraft und Klasse) wurden anschließend mithilfe der Software Common Text Analysis Platform (CTAP; Chen & Meurers, 2016) computerlinguistisch analysiert, wobei vor allem sprachliche Merkmale berücksichtigt wurden, die in der Fortbildung oder den Curricula fokussiert worden waren (z. B. lexikalische Vielfalt).

Die Analysen weisen darauf hin, dass Lehrkräfte der EG während des ersten Unterrichtsthemas (Schwimmen und Sinken) insgesamt mehr sprachen als Lehrkräfte der KG (Anzahl der Types/Tokens/Sätze: d = 1.34/2.38/1.19). Unter Berücksichtigung der Gesamtmenge an sprachlichem Input war ihr mündlicher Sprachgebrauch jedoch nur vereinzelt durch erhöhte sprachliche Elaboriertheit gekennzeichnet. So verwendeten sie beispielsweise mehr Wörter mit mindestens drei Silben (d = 0.93), einem Indikator für morphologische Komplexität. Beim zweiten Unterrichtsthema (Verdunstung und Kondensation) unterschieden sich EG- und KG-Lehrkräfte nicht in der Menge an mündlicher Unterrichtssprache (Anzahl der Types/Tokens/Sätze: d = 0.25/-0.12/-0.01). Zwar zeichnete sich in der korrigierten Type/Token-Ratio eine größere lexikalische Vielfalt im Sprachgebrauch der EG-Lehrkräfte ab (d = 0.74), diese fand sich jedoch in keinem anderen Merkmal der lexikalischen Vielfalt wieder. Auch in den weiteren sprachlichen Komplexitätsmerkmalen bestanden keine Gruppenunterschiede.

Insgesamt deuten die Befunde somit darauf hin, dass sich die Teilnahme an der Professionalisierungsmaßnahme nur in geringem Maße im mündlichen Sprachgebrauch der Lehrkräfte niederschlägt und dass sich die Effekte in Abhängigkeit vom Unterrichtsthema unterscheiden. Die Befunde werden mit Blick auf Leistungsunterschiede in den teilnehmenden Klassen und adaptive Unterrichtsgestaltung diskutiert.

 

Zum Zusammenspiel von Aufgabenmerkmalen, Sprachkompetenz und sprachlicher Komplexität von Textproduktionen im Englisch-Abitur

Anja Riemenschneider1, Zarah Weiss2, Pauline Schröter1, Detmar Meurers2
1Institut zur Qualitätsentwicklung im Bildungswesen (IQB), 2Eberhard Karls Universität Tübingen

Sprachliche Eigenschaften von Textproduktionen hängen von vielen Faktoren ab, wie dem Thema und der Art des Schreibanlasses, Genrekonventionen und der individuellen Sprachkompetenz (Biber & Gray, 2010; Kuiken & Vedder, 2019). Eine besondere Rolle spielen Merkmale der Aufgaben, die im Fremdsprachenunterricht oft funktional relevante Textproduktionen hervorrufen sollen (Michel et al., 2019). Wenig Aufmerksamkeit wurde bisher dem Zusammenspiel von Aufgabenmerkmalen und der Sprachkompetenz der Lernenden geschenkt, obwohl anzunehmen ist, dass Aufgaben sich in den mit ihnen verbundenen Möglichkeiten zur sprachlichen Entfaltung unterscheiden. Dies ist besonders relevant im Hinblick auf Prüfungen in den Fremdsprachen, die die Sprachkompetenz der Teilnehmenden in ihrer vollen Breite abbilden sollten. Zur Messung sprachlicher Leistungen werden in der Forschung zum Zweitspracherwerb die Aspekte der sprachlichen Komplexität, der Akkuratheit und der Flüssigkeit genutzt. In der schriftsprachlichen Produktion sind besonders die Akkuratheit und die sprachliche Komplexität relevant, die auch für Rückschlüsse auf die Sprachkompetenz genutzt werden (Kuiken & Vedder, 2019).

In der schriftlichen Englisch-Abiturprüfung werden die Anforderungsbereiche I-III abgedeckt, die einen ansteigenden Grad an Selbstständigkeit von den Schüler:innen fordern. Dies bezieht sich laut den Bildungsstandards für die Allgemeine Hochschulreife zum einen auf inhaltliche Aspekte (z. B. Umgang mit Methode und eingebrachte Ideen), zum anderen auf sprachliche Aspekte, wobei die Eigenständigkeit diesbezüglich nicht weiter spezifiziert wird (KMK, 2012). Prüflinge erhalten eine Textvorlage mit drei Aufgaben, die die Anforderungsbereiche wiederspiegeln sollen. Für unsere Studie haben wir die Englisch-Abituraufgaben hinsichtlich ihres Aufgabentyps (Aufgabe 1: Zusammenfassung, Aufgabe 2: Analyse, Aufgabe 3: Argumentation), ihrer geforderten inhaltlichen Selbstständigkeit (Aufgabe 1: gering, Aufgabe 2: hoch, Aufgabe 3: hoch) und ihrer geforderten sprachlichen Selbstständigkeit (Aufgabe 1: gering, Aufgabe 2: gering, Aufgabe 3: hoch) charakterisiert, wobei wir sprachliche Selbstständigkeit als Distanz zur Textvorlage interpretiert haben.

Im vorliegenden Beitrag haben wir Abituraufsätze von 362 Prüflingen computerlinguistisch analysiert und getestet, ob sie sich hinsichtlich ihrer sprachlichen Komplexität im Bezug zu Aufgabenmerkmalen (Aufgabenart und geforderte sprachliche Selbstständigkeit) unterscheiden und ob die Abituraufgaben die Sprachkompetenz der Schüler:innen (gemittelte Semesternoten der Qualifikationsphase im Fach Englisch) unterschiedlich breit abbilden. Da von jedem Prüfling Texte zu drei Aufgaben produziert wurden, eignen sich die Daten sowohl für Between- als auch für Within-Subjects-Vergleiche. Die Komplexitätsanalyse wurde anhand einer umfassenden Operationalisierung unter Einbezug von 54 Komplexitätsmaßen aus verschiedenen linguistischen Domänen mithilfe der Common Text Analysis Platform (Chen & Meurers, 2016) durchgeführt.

Die Ergebnisse unserer Mixed-Effects-Modelle zeigen, dass sich die Komplexität der Textproduktionen hinsichtlich der mit den Aufgaben verbundenen funktionalen Erfordernisse unterscheidet – sowohl quantitativ in der Anzahl der Maße als auch qualitativ in den sprachlichen Eigenschaften, die jeweils im Vergleich zu den anderen Aufgaben stärker ausgeprägt waren. In den Prüflingstexten zu Aufgabe 1 (Zusammenfassung) waren 13 Komplexitätsmaße im Vergleich zu den anderen beiden Aufgaben am höchsten ausgeprägt, die auf eine kompakte, inhaltlich dichte Sprachverwendung hindeuten(z. B. lexikalische Dichte, Wortlänge, Komplexität der Nominalphrasen). In Textproduktionen zu Aufgabe 2 (Analyse) war mit 20 Maßen im Vergleich zu den anderen beiden Aufgaben die höchste Anzahl an Maßen am komplexesten ausgeprägt, unter anderem die lexikalische Variabilität, die Textlänge und die klausale Komplexität. In Prüflingstexten zu Aufgabe 3 (Argumentation) war die geringste Anzahl an Maßen stärker ausgeprägt als in den anderen beiden Aufgaben (u. a. lexikalische Diversität, Modifizierer), diese zeigten eine variable und beschreibende Sprachverwendung an. Für alle Aufgaben wurde ein signifikanter Zusammenhang zwischen der Sprachkompetenz der Schüler:innen und der sprachlichen Komplexität ihrer Textproduktionen gemessen. Dieser Zusammenhang verstärkte sich in Aufgabe 3, vor allem bezogen auf Maße der lexikalischen Komplexität.

Die Ergebnisse deuten darauf hin, dass vor allem Aufgaben, die eine hohe sprachliche Selbstständigkeit erfordern, zur differenzierten Erfassung von Sprachkompetenz geeignet sind. Die Befunde liefern außerdem Einsichten dazu, welche sprachlichen Aspekte durch welche Aufgabentypen verstärkt hervorgerufen werden und können als Ausgangspunkt für geeignete Bewertungskriterien dienen.

 

Prozesse bei der Textüberarbeitung sichtbar machen: Wie arbeiten Schüler:innen in der Sekundarstufe I mit automatisiertem Feedback?

Ronja Schiller1, Johanna Fleckenstein2, Ute Mertens1, Andrea Horbach2, Jennifer Meyer1
1IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und der Mathematik, 2Universität Hildesheim

Automatisiertes Feedback kann positive Effekte auf die Schreibleistung zeigen (Graham et al., 2015; Fleckenstein et al., 2023), doch ein Verständnis zugrundeliegender Mechanismen dieser Feedbackeffekte ist zum jetzigen Zeitpunkt kaum vorhanden (Winstone & Nash, 2023). Eine naheliegende Annahme ist, dass Lernende höheres behaviorales Engagement bei der Textüberarbeitung zeigen – sich also aktiver mit der Überarbeitung eines Textes auseinandersetzen (Fredricks et al., 2004) –, wenn sie Feedback erhalten, wobei das gesteigerte behaviorale Engagement schließlich zu einer Verbesserung der Leistung führen sollte (z. B. De Miliano et al., 2017; Green et al., 2012). Um mit behavioralem Engagement verknüpfte Prozesse valide abbilden zu können, werden behaviorale Maße benötigt, die Schreibprozesse objektiv erfassen (Winstone & Nash, 2023). Diesbezüglich bietet die digitale Umsetzung experimenteller Studien die Möglichkeit, Log- und Prozessdaten mithilfe computer-linguistischer Methoden als Grundlage für objektive Maße von Verhaltensprozessen heranzuziehen (z. B. Leijten & Van Waes, 2013; Liu et al., 2015).

Ziel unserer Arbeit ist es, mit Hilfe solcher Daten ein besseres und feineres Verständnis von Feedbackprozessen beim Schreiben zu gewinnen und vertiefende Erkenntnisse zu liefern, die für die Förderung von Schreibkompetenzen mit automatisieren Feedback in digitalen Lernumgebungen von hoher Relevanz sind. Konkret soll untersucht werden, ob und inwieweit behaviorales Engagement bei der Textüberarbeitung eine mediierende Rolle bei Feedbackeffekten auf die Leistungsverbesserung beim Schreiben einnimmt. Dabei wird angenommen, dass sich (a) die Schreibleistung stärker verbessert, wenn eine Schreibaufgabe mit Hilfe von Feedback überarbeitet wird als ohne Feedback und, dass (b) dieser angenommene positive Effekt von Feedback auf die Schreibleistung von behavioralem Engagement mediiert wird.

Die Umsetzung unseres Experiments erfolgte im Rahmen einer Feldstudie an Schulen unter Verwendung eines digitalen Schreib-Tools. Die teilnehmenden Schüler:innen (N = 211; MAlter = 13.58, SDAlter = 0.94) wurden randomisiert einer Kontrollgruppe (KG) oder einer Feedbackbedingung (EG) zugewiesen und bearbeiteten zunächst eine Schreibaufgabe, bei der eine E-Mail auf Englisch verfasst werden sollte. Die Schreibleistung wurde Algorithmus-basiert hinsichtlich fünf zentraler Kriterien erfasst (1. Inhalt, 2. Betreffzeile, 3. Begrüßung/Abschied, 4. interpersonelle Dimension, 5. Sprachstil; Authors, 2022b; Authors, 2023). Anschließend an die erste Schreibaufgabe wurde die Schüler:innen gebeten, ihren Entwurf zu überarbeiten. Während die KG lediglich zur Überarbeitung aufgefordert wurde, wurde den Schüler:innen der EG zusätzlich automatisiertes elaboriertes Feedback zu ihrem ersten Entwurf angezeigt, das sie zur Textüberarbeitung nutzen konnten. Das Feedback enthielt Rückmeldungen zur Erfüllung der fünf Kriterien sowie Hinweise und Beispiele. Das behaviorale Engagement während der Textüberarbeitung wurde über drei Indikatoren erfasst. Dies waren zum einen die zur Überarbeitung genutzte Zeit – die Revisionszeit – und zum anderen die post-hoc berechnete Levenshtein Distance (Levenshtein, 1965) sowie Greedy String Tiling (GST; Wise, 1993). Während die Levenshtein Distance die Anzahl der Änderungen am Text widerspiegelt, stellt GST basierend auf der längsten gemeinsamen Zeichenkette die Ähnlichkeit von Erstentwurf und Revision dar. Basierend auf den drei Indikatoren wurde eine latente Variable modelliert, die das behaviorale Engagement bei der Textüberarbeitung abbildet.

Anhand einer hierarchischen Regressionsanalyse zeigte sich eine vollständige Mediation des Feedbackeffekts auf die Schreibleistung über behaviorales Engagement. Das heißt, Schüler:innen, die für die Textüberarbeitung Feedback erhielten, zeigten eine deutliche stärkere Verbesserung ihrer Schreibleistung als Schüler:innen der KG, die kein Feedback erhielten. Diese Verbesserung kann zu einem Großteil auf durch das Feedback gesteigerte behaviorale Engagement während der Textüberarbeitung zurückgeführt werden.

Unsere Befunde liefern nicht nur neue Erkenntnisse über Feedbackeffekten zugrundeliegende Mechanismen, die bei der Entwicklung digitaler Lernumgebungen zur Schreibförderung behilflich sein können. Viel mehr konnte darüber hinaus das große Potential von Prozessdaten in Hinblick auf die objektive Messung von Verhaltensprozessen im Schreibkontext gezeigt werden, welches in zukünftigen digital implementierten Studien noch deutlich weiter ausgeschöpft werden sollte.

 
15:20 - 17:003-04: Empirische Forschung zur Wirksamkeit der Lehrkräftebildung – Überblick und Perspektiven
Ort: H02
 
Symposium

Empirische Forschung zur Wirksamkeit der Lehrkräftebildung – Überblick und Perspektiven

Chair(s): Johannes König (Universität zu Köln), Sarah Strauß (Universität zu Köln, Deutschland)

Diskutant*in(nen): Gabriele Kaiser (Universität Hamburg)

Seit Jahrzehnten steht die Lehrer:innenbildung in der Kritik: Zu den wiederholt genannten Problem­stellungen wie mangelnde Wirksamkeit, fehlende Kohärenz curricularer Angebote, Praxisferne der Ausbildung kommen auch aktuelle Herausforde­rungen der inklusiven Bildung, der Digitalisierung oder des Well-Beings. Zentral ist dabei auch die Fachlichkeit schulischen Lernens, die es erforderlich macht, die genannten Problemstellungen aus einer domänenspezifischen bzw. interdisziplinären Perspektive zu betrachten.

In der empirischen Bildungsforschung existiert mittlerweile eine kaum mehr zu überblickende Anzahl empirischer Einzelstudien zur Analyse der Wirksamkeit von Lehrer:innenbildung, wie beispielsweise das Literatur-Review von Cochran-Smith und Villegas (2015) aufzeigt (für einen Überblick im deutschsprachigen Raum vgl. z.B. Hascher, 2014). In den vergangenen Jahren wurden überdies weitere Literatur-Reviews veröffentlicht, die nach thematischen Schwerpunkten ausgewählte Studien zur Prüfung von Wirksamkeit der Lehrer:innenbildung auswerten, etwa zur Digitalisierung (Ma et al., 2023; Perry et al., 2021), zum Well-Being (Shepherd et al., 2016) oder zur Unterrichtsplanungskompetenz (König & Rothland, 2022).

Vor diesem Hintergrund stellen sich zwei Fragen, die den Anlass für das Symposium bilden – und im Sinne des Tagungsthemas der GEBF 2024 dazu beitragen können, die auf Lehrkräfte bezogene „Bildung zu verstehen“: Wie ist erstens der Stand der empirischen Forschung zur Wirksamkeit der Lehrer:innenbildung (empirical research on teacher education effectiveness) insgesamt bzw. im Überblick zusammenzufassen und zu bewerten? Und zweitens welche Perspektiven sollten daraus – zumindest exemplarisch – für die zukünftige Forschung aktuell bezogen und entwickelt werden?

Als Input zur ersten Frage dient Beitrag 1: Berichtet wird über eine aktuell durchgeführte Synthese von 27 internationaler Literatur-Reviews empirischer Studien zur Wirksamkeit der Lehrer:innenbildung, die in den vergangenen 30 Jahren veröffentlicht wurden (König et al., 2023/im Druck). Die Synthese baut auf über 2000 empirischen Studien auf, die in den 27 Reviews insgesamt zum Gegenstand gemacht wurden. Zentrale Ergebnisse der Synthese beziehen sich auf Kernaspekte der Wirksamkeitsforschung (u.a. theoretische Rahmungen, Outcomes, Prozessvariablen) sowie die identifizierten Forschungslücken. Beitrag 1 liefert somit einen Forschungsüberblick, aus dem zentrale Perspektiven für die zukünftige Forschung bezogen werden können. Die daran anschließenden Beiträge vertiefen jeweils exemplarisch ausgewählte Perspektiven und zeigen somit auf, wie zukünftig bestimmte Schwerpunkte gesetzt werden können, um Innovationen in der Forschung zur Wirksamkeit der Lehrer:innenbildung zu forcieren.

Beitrag 2 setzt bei dem Forschungsdesiderat an, Interventionsstudien zur Wirksamkeit bestimmter Innovationen der Lehrer:innenbildung durchzuführen, die forschungsmethodisch anspruchsvolleren Untersuchungsdesigns gerecht werden (vgl. auch Hill et al., 2021). Am Beispiel der Förderung von situationsspezifischen Fähigkeiten im Bereich einer effektiven Klassenführung (Kramer et al., 2020) wird die Frage nach der Wirksamkeit einer neu entwickelten Intervention auf Basis von Unterrichtsvideos bearbeitet, wobei die (perspektivische) Umsetzung eines methodisch anspruchsvollen (experimentellen) Designs, die Testung multipler Facetten der klassenführungsspezifischen Kompetenzen sowie das Ziel einer breiten Implementation der Intervention im Vordergrund stehen.

Beiträge 3 und 4 setzen jeweils den Fokus auf die Messung und Förderung spezifischer Kompetenzfacetten, die als Weiterentwicklung bisheriger fachlicher (Beitrag 3) bzw. affektiv-motivationaler (Beitrag 4) Outcomes der Lehrer:innenbildung anzusehen sind. Beitrag 3 fokussiert die neuartige Herangehensweise, die Fähigkeit zur Auswahl von digitalem Lernmaterial als Ansatz zur Bewertung der digitalen Kompetenz von (angehenden) Mathematiklehrkräften zu konzipieren, zu messen und zu validieren. Beitrag 4 prüft die prognostische Validität der Emotionsregulation von berufstätigen Lehrkräften, um darauf aufbauend evidenzbasierte Interventionen entwickeln zu können. Damit soll perspektivisch dem Desiderat begegnet werden, weitreichende Wirksamkeitsnachweise in Untersuchungsdesigns umzusetzen (vgl. z.B. Kennedy, 2016).

Die Beiträge werden von der Diskutantin Prof.in Dr.in Gabriele Kaiser (Universität Hamburg) eingeordnet und reflektiert. Dabei wird u.a. die Frage adressiert, welche Rolle die Kompetenzforschung (z.B. im TEDS-Forschungsprogramm), aber auch benachbarte theoretische Ansätze (z.B. zum Expertise-Erwerb) eine zentrale Rolle einnehmen und den Ansatz einer Wirksamkeitsforschung in Bezug auf die professionelle Entwicklung von Lehrer:innen bestimmen (vgl. Kaiser et al., 2015; Kaiser & König, 2019).

 

Beiträge des Symposiums

 

Wirksamkeit der Lehrer:innenbildung als Forschungsparadigma: Eine Synthese von 27 Literaturreviews

König Johannes, Heine Sandra, Kramer Charlotte, Weyers Jonas, Becker-Mrotzek Michael, Großschedl Jörg, Hanisch Charlotte, Hanke Petra, Hennemann Thomas, Jost Jörg, Kaspar Kai, Rott Benjamin, Strauß Sarah
Universität zu Köln

Theoretischer Hintergrund

Mit der Forschung zur Wirksamkeit der Lehrer:innenbildung verbindet sich generell die Aufgabe, Hinweise zu erbringen, welche Stärken und Schwächen in einem bestimmten Lehrer:innenbildungsprogramm oder -system bestehen, welche Aus- und Fortbildungselemente gut gelingen, welche modifiziert werden sollten, welche Kritik gerechtfertigt ist und welche möglicherweise unberechtigt geäußert wird (vgl. Hascher, 2014; König & Blömeke, 2020). Über die vergangenen Jahrzehnte haben zahlreiche Literatur-Reviews versucht, empirische Studien zur Wirksamkeit von Lehrer:innenbildung zusammenzufassen (z.B. Cochran-Smith & Villegas, 2015). Zwar leisten solche Reviews einen bedeutsamen Beitrag zu der Frage, was empirische Forschung zur Lehrer:innenbildung aller Phasen umfassen könnte – einschließlich der Frage wie Lehrer:innenbildung erachtet wird, wirksam zu sein angehende Lehrkräfte auszubilden und berufstätige Lehrkräfte fortzubilden. Doch ist der Forschungsstand noch immer begrenzt, wenn es um eine allgemeinere und übergreifende Perspektive auf die empirische Forschung zur Wirksamkeit von Lehrer:innenbildung geht. Ein mögliche Erklärung dafür könnte sein, dass heterogene Forschungsansätze bestehen, die sich nur schwer vergleichen lassen (z.B. Kennedy, 2016). Die hohe Relevanz des Forschungsgegenstandes war der Beweggrund für die Erarbeitung einer Synthese von Literatur-Reviews empirischer Studien zur Wirksamkeit von Lehrer:innenbildung, um den Erkenntnisfortschritt bezüglich eines entsprechenden Überblickswissens voranzubringen.

Fragestellungen

Mit einer Synthese von Literatur-Reviews wurden folgende Kernfragen bearbeitet: (1) Welche größeren theoretischen Rahmungen werden verwendet? (2) Welche Outcome-Maße dienen als Kriterien für Wirksamkeit von Lehrer:innenbildung? (3) Welche Maßnahmen und Charakteristika bilden die Prozesse, welche als effektiv betrachtet werden? (4) Welche zentralen Forschungslücken sollten in zukünftiger empirischer Forschung zur Wirksamkeit von Lehrer:innenbildung adressiert werden?

Methode

Mithilfe einer systematischen Literaturrecherche konnten 27 einschlägige Literatur-Reviews identifiziert werden, die im Zeitraum der letzten drei Jahrzehnte (1993-2023) publiziert wurden (König et al., 2023/im Druck). Dabei wurde „Lehrer:innenbildung“ breit verstanden und auf alle Phasen der Professionalisierung von Lehrkräften bezogen – nämlich Erstausbildung, Induktionsphase bzw. Berufseinstieg (z.B. Vorbereitungsdienst bzw. Referendariat in Deutschland), Fortbildung berufstätiger Lehrkräfte. Zu den vier genannten Fragestellungen wurde in einem Wechselspiel deduktiver und induktiver Herangehensweise ein Kategoriensystem entwickelt, wobei die Analysekategorien (zwischen drei und sechs Kategorien pro Forschungsfrage) als Leitlinie für eine thematische Analyse dienten. Anteilig konnte auch für einzelne Kategorien eine qualitative Inhaltsanalyse angewendet werden. Die entsprechend durchgeführte Synthese von Reviews ist (u.a. angesichts der anzutreffenden Heterogentität der 27 Reviews) als „Scoping-Review“ und nicht als „systematisches Review“ zu bezeichnen (Munn et al., 2018).

Ergebnisse

Als zentrale Ergebnisse können hervorgehoben werden: Bezüglich Forschungsfrage (1) zeigte sich, dass nur wenige Reviews überhaupt auf eine umfassende theoretische Rahmung eingehen; die meisten Reviews wenden Wirksamkeitsforschung an, um spezifische Themenschwerpunkte zu fokussieren und zu analysieren, etwa zu den Bereichen digitaler Bildung (Ma et al., 2023; Perry et al., 2021), Well-Being (Shepherd et al., 2016) oder Unterrichtsplanungskompetenz (König & Rothland, 2022). Hinsichtlich der Forschungsfrage (2) stellte sich heraus, dass Outcome-Messungen sehr oft auf (modellhafte) Vorstellungen von Lehrkomptenz bezogen sind; hier sind insbesondere die erwarteten Kompetenzzuwächse die eigentlichen Outcomes der empirischen Forschung zur Wirksamkeit von Lehrer:innenbildung. Bezüglich der Forschungsfrage (3) wurde deutlich, dass “Kurse” (bzw. Trainings, Seminare) als Kategorie die prozessbezogenen Maßnahmen oder Charakteristika in empirischen Studien dominieren, während z.B. Ausbildungsprogramme oder auch praktische Einheiten von Lerngelegenheiten (z.B. Schulpraktika) weitaus seltener die Kategorien einer Überprüfung darstellen. Letztlich zeigte sich hinsichtlich Forschungsfrage (4), dass Rahmenmodelle der Outcome-Messungen in der Kritik stehen – theoretisch, aber vor allem forschungsmethodisch. Darüber hinaus können weitere zentrale Forschungslücken identifiziert werden.

Diskussion

Auf Basis der gewonnenen Erkenntnisse, vor allem basierend auf grundsätzlichen Unterscheidungen, die in den Reviews getroffen wurden, konnte in einem Folgeschritt eine Klassifikation entwickelt werden, die Prozesse und Kriterien in einer Matrix systematisiert (sog. processes-and-criteria classification (PCC) of basic distinctions in teacher education effectiveness research). Wie die entwickelte Klassifikation eine Orientierung für zukünftige empirische Studien zur Wirksamkeit der Lehrer:innenbildung zu leisten vermag, soll im Vortrag dargelegt und diskutiert werden.

 

Effektiv(e) Klassenführung lernen - Wirksamkeit von Unterrichtsvideos in der universitären Lehramtsausbildung zur Förderung der professionellen Kompetenz

Sarah Strauß, Kramer Charlotte, König Johannes, Arnold Sophie, Darge Kerstin
Universität zu Köln

Theoretischer Hintergrund

Eine zentrale berufliche Anforderung von Lehrkräften ist eine effektive Klassenführung. Sie gilt als Basisdimension qualitätsvollen Unterrichts (Klieme, 2018) und erweist sich in Metaanalysen als ein Merkmal mit großer Vorhersagekraft für die Lernleistung von Schüler:innen (Hattie, 2012; Wang et al., 1993). Es zeigt sich jedoch, dass Lehramtsstudierende und Junglehrkräfte ihr Wissen über Klassenführung als unzureichend einschätzen und sich durch ihre Ausbildung auf diese berufliche Anforderung nicht hinreichend vorbereitet fühlen (Jones, 2006; Poznanski et al., 2018). Die Diskrepanz zwischen der Relevanz von Klassenführung für ein erfolgreiches Unterrichten und der Einschätzung der (angehenden) Lehrkräfte zu ihren Fähigkeiten, rückt das Thema Klassenführung auch in den Fokus der universitären Lehrkräftebildung.

Um den Anforderung der Klassenführung gerecht zu werden, gelten neben Wissen und affektiv-motivationalen Merkmalen auch situationsspezifische Fähigkeiten als zentrale Aspekte der professionellen Kompetenz von Lehrkräften (Kaiser & König, 2019; Sherin et al., 2011). Diese lassen sich in die Wahrnehmung von lehr- und lernrelevanten Aspekten, deren Interpretation und das Treffen von (weiterführenden) Handlungsentscheidungen unterteilen (Blömeke et al., 2015). Unterrichtsvideos können vor allem diese situationsnahen Kompetenzfacetten bei Studierenden erfolgreich fördern (Gold et al., 2016; Kramer et al., 2017). Obwohl sich die Forschung zu den situationsspezifischen Fähigkeiten in den letzten zwei Jahrzehnten stark entwickelt hat (König et al., 2022) und das Thema Klassenführung vermehrt in Interventionsstudien bearbeitet wird (Junker & Holodynski, 2022; Weber et al., 2020), fehlen diesbezüglich empirische Nachweise zur Wirksamkeit der (universitären) Lehrkräftebildung, die u.a. in methodisch anspruchsvolle Designs umgesetzt werden (König et al., 2023/im Druck) und über einzelne punktuelle Interventionen hinaus gehen.

Fragestellung

Im Rahmen des an der Universität zu Köln laufenden Verbundprojekts „Proving the Effectiveness of Teacher Education“ bearbeiten wir die Frage nach der Wirksamkeit einer neu entwickelten videobasierten Intervention zur Förderung der klassenführungsspezifischen Kompetenzen bei Lehramtsstudierenden. Dabei stehen ein methodisch anspruchsvolles Design, standardisierte Testungen der klassenführungsspezifischen Kompetenzen sowie das Ziel einer breiten Implementation der Intervention im Vordergrund.

Methode

Im Wintersemester 2023/24 findet mit der Pilotierung einer Lehrveranstaltung zur Förderung der Klassenführungskompetenz von Lehramtsstudierenden der erste (ca. n=150) von vier Durchläufen einer Interventionsstudie statt. Mittels eines quasi-experimentellen Designs wird untersucht, ob das Wissen, affektiv-motivationale Merkmale und die situationsspezifischen Fähigkeiten im Anforderungsbereich der Klassenführung mit dieser Intervention bei Lehramtsstudierenden im Master gefördert werden können. Im Fokus der Intervention steht die intensive Auseinandersetzung der Studierenden mit konkreten Anforderungen der Klassenführung und die Analyse dieser in authentischen Unterrichtssituationen, spezifiziert über reale Unterrichtsvideos. Zwei Masterseminare („Modellseminare“) erarbeiten das Thema Klassenführung tiefgreifend über das gesamte Semester. In zwei weiteren Seminaren („Anwendungsseminare“) werden in sieben Sitzungen zentrale Inhaltsbereiche von Klassenführung in Form standardisierter Materialien, d.h. wissenschaftlicher Texte und Unterrichtsvideos bearbeitet. Ein weiteres Seminar, das zwar das Thema Klassenführung neben einer Vielzahl anderer Themen betrachtet, aber keine Analysen von Unterrichtsvideos durchführt, stellt die Kontrollgruppe dar. Alle fünf Seminare werden zu Beginn und zum Ende des Semesters mit standardisierten u. a. videobasierten Messinstrumenten getestet. Hierzu gehört ein neu entwickelter erstmalig auf Klassenführung fokussierter Wissenstest (TCM-Wissenstest, König et al., 2024/Pre-Print), ein erprobtes und bereits mehrfach genutztes videobasiertes Instrument zur Erfassung der klassenführungsspezifischen situationsspezifischen Fähigkeiten der Wahrnehmung und Interpretation (CME; König, 2015) und eine Erweiterung dieses Instruments für den Bereich des Entscheidens (CME-Decide; Weyers et al., in Begutachtung). Ab dem darauffolgenden Semester ist stehen engen Qualitätskriterien hinsichtlich der Messung und des Studiendesigns im Fokus, hierzu gehören u.a. Merkmale wie die Randomisierung der Studierenden (vgl. Hill et al., 2021).

Ergebnisse

Im Vortrag werden erste Ergebnisse zur angenommenen Lernwirksamkeit in Klassenführungskompetenzen der Intervention präsentiert und Implementationsziele aufgezeigt und diskutiert. Erwartet werden Zuwächse im Wissen, für die Modell- und Anwendungsseminare im mittleren Bereich und für die situationsspezifischen Fähigkeiten für die Modellseminare im mittleren und für die Anwendungsseminare im kleinen Bereich.

 

Die Auswahl digitaler Lernmaterialien als Ansatz zur Bewertung der digitalen Kompetenz für die Beurteilung der Wirksamkeit von Lehrer:innenbildung

Peter Gonscherowski, Benjamin Rott
Universität zu Köln

Theoretischer Hintergrund

Digitale Kompetenzen sind für (angehende) Lehrer:innen wichtig, um Lernende zur aktiven Teilnahme an den zunehmend digitalen gesellschaftlichen Prozessen zu befähigen und um möglichen Bildungsungleichheiten mit dem Potenzial digitaler Technologien entgegenzuwirken. Aufgrund des großen Angebots an digitalem Lernmaterial (dLM) und digitaler Technologie (dT) hat die Fähigkeit, entsprechende Ressourcen auszuwählen, einen hohen Stellenwert für die Lehrer:innenbildung. Um den Erfolg der Vermittlungsprozesse bezüglich der Auswahlfähigkeit von angehenden Lehrer:innen – als Teil von digitalen Kompetenzen – zu messen, bedarf es objektiver, reliabler und valider Items und Instrumente.

Fragestellung

Wir gehen der Frage nach, wie das Konstrukt der Auswahlfähigkeit gemessen werden kann und geben erste Einblicke hinsichtlich der Validität des Konstrukts. Wir stellen vier offene und geschlossene Items zur Erfassung der Auswahlfähigkeit vor, die als Teil eines digitalen Kompetenzinstrumentes entwickelt wurden. In den Items für die Auswahlfähigkeit werden die Begründungen über den Einsatz oder Nicht-Einsatz von dLM bei der Unterrichtsplanung für eine zu definierende Schulstufe und Förderschwerpunkt (FSP) und Lerninhalt bewertet.

Methode

Theoretische Grundlage der entwickelten Items sind der europäische DigCompEdu (Redecker & Punie, 2017) und das TPACK-Modell (Mishra & Koehler, 2006), ergänzt um die anglo-amerikanischen Kernunterrichtspraktiken nach Grossman (2018) und das allgemeine Lehrerkompetenzmodell von Blömeke et al. (2015). Basierend auf der Konzeptualisierung wurde die Auswahlfähigkeit von dLM als situationsspezifische Entscheidung, die auf der Interpretation und Wahrnehmung von Kontextfaktoren beruht, im Modell nach Blömeke et al. (2015) verortet. Nach dem Modell von Blömeke et al. (2015) erfordert eine fundierte Begründung einer Entscheidung prädiziertes Wissen, insbesondere Wissen über den Lerninhalt, den ein dLM zu vermitteln beabsichtigt, und dessen Verortung in lokalen Lehrplänen (Mishra & Koehler, 2006).

Um das prädizierte Wissen zu bewerten, wird in einigen Items nach dem Verständnis der Lerninhalte, die ein dLM vermitteln soll, nach der Klassenstufe der Lernenden und nach eventuell vorhandenen sonderpädagogischen Bedürfnissen der Lernenden, für die das dLM eingesetzt werden soll, gefragt. Ebenso werden die Gründe, warum ein gegebenes dLM für die zuvor spezifizierte Lerngruppe und den Lerninhalt verwendet werden sollte oder nicht, in einem Item festgehalten. Für die Operationalisierung haben wir unter Berücksichtigung der Ergebnisse von Gonscherowski und Rott (2022) ein dLM für einen mathematischen Inhalt in einen größeren Onlinetest mit den Items eingebettet.

Ergebnisse

Die deskriptiven und inferenzstatischen Auswertungen der Daten des Onlinetests mit angehenden Mathematiklehrer:innen (n = 395) von je einer Universität in Deutschland und in Österreich haben gezeigt, dass die Items eine objektive Messung der Fähigkeit ermöglichen – Interrater-Übereinstimmung bei der Kodierung der offenen Items lag im nahezu perfekten Bereich. Die theoretische und unterrichtspraktische Konzeptualisierung des Ansatzes und der Items trägt zur Validität bei. Einfaktorielle ANOVAs zeigen, dass die Ergebnisse von der Anzahl der Studiensemestern und der angestrebten Schulstufe der angehenden Lehrkräfte statistisch signifikant abhängig waren. Eine Spearman-Korrelation zeigt eine statistische signifikante Abhängigkeit von prädiziertem Wissen und fundierter Argumentation auf. Die Berechnung von Cronbachs-Alpha der entwickelten Items zur Messung der Auswahlfähigkeit von dLM und identisch konzipierter und operationalisierter Items zur Messung der Auswahlfähigkeit von dT ergaben einen akzeptablen Wert und zeigen die Zuverlässigkeit der Messung an.

Diese empirischen Ergebnisse belegen, dass die Items geeignet sind, verschiedene Kompetenzniveaus zu differenzieren, und stimmen mit der weithin akzeptierten Vorstellung überein, dass Fähigkeiten von (prädiziertem) Wissen abhängen (Blömeke et al., 2015).

Zusammenfassend zeigen die Ergebnisse – trotz einiger Limitationen wie z. B., dass die empirischen Ergebnisse nur auf Daten von angehenden Mathematiklehrer:innen von nur zwei Universitäten beruhen, und zur Erfassung der Bewertung der Auswahlfähigkeit wurde nur ein dLM und nur eine Argumentation betrachtet –, dass das Konstrukt, die Fähigkeit zur Auswahl von dLM zu messen, eine neue und valide und reliable Möglichkeit für die Überprüfung der Wirksamkeit von Lehrer:innenbildung darstellt.

 

Die Fähigkeit zu Emotionsregulation sagt Stresserleben bei Lehrkräften an inklusiven Grundschulen in Nordrhein-Westfalen voraus

Hanna Rauterkus1, Thomas Hennemann1, Tobias Hagen1, Johanna Krull1, Jannik Nitz1, Katrin Eiben1, Pawel Kulawiak2, Leonie Verbeck1, Charlotte Hanisch1
1Universität zu Köln, 2Universität Potsdam

Theoretischer Hintergrund

Der Lehrer:innenberuf wird von vielen Lehrkräften als sehr befriedigend empfunden, aber er ist auch ein Beruf, der nach wie vor mit Gesundheitsrisiken verbunden ist. In Deutschland kommen psychische und psychosomatische Erkrankungen bei Lehrkräften häufiger vor als in anderen Berufen, ebenso wie unspezifische Beschwerden wie Erschöpfung, Müdigkeit, Kopfschmerzen und Verspannungen (Scheuch et al., 2015). Die Hauptgründe für Frühpensionierungen in Deutschland sind psychische und psychosomatische Erkrankungen, die zusammen 32-50 % der Fälle ausmachen (Scheuch et al., 2015). Eine aktuelle Übersichtsarbeit bestätigt, dass Stress, Burnout, Ängste und Depressionen bei Lehrkräften auch international ein Problem darstellen (Agyapong et al., 2022).

Neben der sehr hohen Relevanz für den einzelnen Lehrer oder die einzelne Lehrerin unterstreicht der Lehrkräftemangel in Deutschland die Notwendigkeit effektiver Präventionsmaßnahmen, um Lehrer:innen gesund und lange in ihrem Beruf zu halten. Die Teilgruppe mentale Gesundheit und Wellbeing bei Lehrkräften und Schüler:innen der Emerging Group an der Universität zu Köln untersucht Bedingungsfaktoren von psychischer Gesundheit und Wohlbefinden im Setting Schule, um hieraus Präventions- und Interventionsmaßnahmen für Erwachsene und Kinder und Jugendliche abzuleiten (Leidig et al., 2021; Hanisch et al., 2019). Auf Seiten der Lehrkräfte sollen diese langfristig zur Prävention von arbeitsbezogenen Belastungen und Burnout beitragen. Aus- und Weiterbildung von Lehrkräften sollte entsprechend neben kognitiven, auch affektiv-motivationale professionelle Kompetenzen steigern wie beispielsweise im Modell von Kaiser und König (2019) vorgesehen.

Bei Schüler:innen erhöhen psychischen Auffälligkeiten das Risiko für schulischen Misserfolg und weitere Gesundheitseinschränkungen, so dass eine schulische Stärkung von mentaler Gesundheit und Wellbeing für Kinder und Jugendliche sowohl der Gesundheitsförderung als auch der Sicherung von Bildungsteilhabe dienen kann (Nitz et al., 2023). Schüler:innen werden darüber hinaus von der mentalen Gesundheit ihrer Lehrkräfte beeinflusst: Hoher Lehrer:innenstress stellt insofern ein Risiko für Schüler:innen dar, als dass er mit einer geringeren Unterrichtsqualität und einem geringeren Lernerfolg verbunden ist (Klusmann, Richter & Lüdtke, 2016).

Negative emotionale Reaktionen auf externe Stressoren sind entscheidend für die Entwicklung von Lehrer:innenstress (Montgomery & Rupp, 2005). Daher kann emotionale Kompetenz, d.h. die Fähigkeit, eigene und fremde Emotionen wahrzunehmen und eigene Emotionen auszudrücken und zu regulieren, einen bedeutsamen Beitrag zum Erhaltung der psychischen Gesundheit von Lehrer:innen leisten. Eine hohe emotionale Kompetenz wird auch mit einem besseren Klassenklima, positiven Beziehungen und größerer emotional-sozialer Kompetenz bei den Schüler:innen in Verbindung gebracht (Valente et al., 2018, Schonert-Reichl, 2017). Die Förderung von emotionalen Kompetenzen könnte daher Stress bei Lehrkräften verringern und darüber die Unterrichtsqualität, die Beziehungen, das Klassenklima und den Lernfortschritt unterstützen.

Fragestellung

In unserer Untersuchung gehen wir daher auf der Basis des theoretischen Hintergrunds folgenden Fragen nach: Lässt sich aus der emotionalen Kompetenz bei Lehrkräften Belastungserleben vorhersagen? Welche Komponenten emotionaler Kompetenz sind für diesen Zusammenhang besonders relevant und sollten daher im Rahmen von Aus- und Weiterbildung von Lehrkräften besonders gestärkt werden?

Methode

Zu diesem Zweck wurden 265 Lehrkräfte an inklusiven Grundschulen in Nordrhein-Westfalen zu Stresserleben und zu emotionalen Kompetenzen befragt. Eingesetzt wurden die Irritationsskala (Mohr, Rigotti & Müller, 2007) und der Emotionale-Kompetenz-Fragebogen (EKF, Rindermann, 2009), der die oben angesprochenen Facetten emotionaler Kompetenz erfasst.

Die Befragung war Teil einer Interventionsstudie, die die Effekte des mehrstufigen, multimodalen und multiprofessionellen ‚multimo‘ Ansatzes (Hanisch et al., 2019) zur Prävention externalisierenden Problemverhaltens an inklusiven Grundschulen untersuchte.

Ergebnisse

Mehrstufige Regressionsanalysen zeigten, dass der wahrgenommene Stress durch die "Regulation und Kontrolle eigener Emotionen" (- 0,53 (std. B), p< .001), nicht aber durch die "Wahrnehmung eigener" und "fremder Emotionen" oder den "Ausdruck von Emotionen" vorhergesagt wurde. Die Fähigkeit zur Emotionsregulation kann somit als Schutzfaktor für die Gesundheit von Lehrern verstanden werden. Die Ergebnisse werden im Hinblick auf die Lehrer:innen Aus- und -weiterbildung diskutiert.

 
Datum: Dienstag, 19.03.2024
10:30 - 12:104-04: Antecedents and Processes for Well-being in Schools: New Longitudinal Evidence
Ort: H02
 
Symposium

Antecedents and Processes for Well-being in Schools: New Longitudinal Evidence

Chair(s): Yi-Jhen Wu (Center for Research on Education and School Development(IFS), TU Dortmund), Michael Becker (Center for Research on Education and School Development(IFS), TU Dortmund)

Diskutant*in(nen): Florian Schmiedek (Leibniz Institute for Research and Information (DIPF))

Over a decade, well-being has received attention in education. The recent COVID-19 pandemic has made the topic of well-being in schools even more prominent. Schools are key environments to promote not only student well-being, but also teacher well-being. Most recently, the European Commission underscored the importance of a whole-school approach to promoting the well-being of everyone in schools (Cefai et al., 2021). Theoretically, school climate is highly related to teacher well-being, influencing students’ learning and well-being outcomes (Braun et al., 2019; Dicke et al., 2020; Klusmann et al., 2008). However, how teacher well-being is longitudinally related to students’ learning and well-being outcomes is less explored.

Moreover, recent scholars introduced a new framework of social-emotional competences (Chernyshenko et al., 2018; Schoon, 2021). Yet, it is unclear how this new theoretical framework aligns with earlier frameworks to predict students’ well-being systematically. Besides, the recent COVID-19 studies have addressed less how school environments are longitudinally related to student well-being during the pandemic. As a result, current evidence still limits our understanding of salient predictors and potential mechanisms to explain student and teacher well-being from a longitudinal perspective. To address the current research gap, we will adopt a whole-school and longitudinal perspective to advance our knowledge about potential antecedents and processes to explain student and teacher well-being in this symposium.

The first study examines how the quality of teacher-student interactions reported by teachers and students could longitudinally explain relationships between teachers’ emotional exhaustion and job satisfaction and students’ motivation and achievement outcomes in Germany. The second study investigates the longitudinal predictions of social-emotional characteristics (i.e., competences) on school-related and general academic and well-being outcomes from the end of lower secondary school to the first year of upper secondary school in Germany. The third study examines the longitudinal relationship between students’ perceptions of school experiences and affective and cognitive well-being during the COVID-19 pandemic in Luxembourg.

All studies have a longitudinal design and focus on diverse populations and situations and multiple aspects of well-being in the school context. This symposium will provide a multidimensional and comparative view to add theoretical and practical insights into antecedents and processes of well-being in schools. It will inform the EU’s Pathways to School Success Initiative, which aims to promote better educational and well-being outcomes for learners and educators in schools.

 

Beiträge des Symposiums

 

The Association between Teacher Well-Being, Teacher-Student Interaction and Students’ Development: Evidence from a Three-Wave Longitudinal Study

Gyde Wartenberg, Karen Aldrup, Bastian Carstensen, Uta Klusmann
IPN - Leibniz Institute for Science and Mathematics Education

Burnout and job satisfaction represent two important aspects of teachers’ occupational well-being, which is of particular interest with regard to increasing teacher shortage worldwide (OECD, 2005; UNESCO Institute for Statistics, 2016), high attrition rates (den Brok et al., 2017; Lindqvist et al., 2014), and frequent incapacity to work due to mental and physical illness (Seibt et al., 2009; Simone et al., 2016). From a theoretical perspective, teachers’ occupational well-being is thought to affect the quality of teacher-student interactions and students’ cognitive-motivational development (Jennings & Greenberg, 2009). For instance, according to the broaden-and-build theory (Fredrickson, 2001), high levels of occupational well-being (e.g., job satisfaction) likely foster individual resources (e.g., time, energy, empathy, care), which enable teacher to create positive, effective and cognitively activating learning environments, promoting student motivation and successful learning. In turn, teachers experience high levels of emotional exhaustion likely have less emotional, social and cognitive resources available for accomplishing the various tasks of the teaching profession (Bakker & Costa, 2014; Hobfoll, 1989; Maslach & Leiter, 1999). Likewise, teachers’ well-being might directly affect students through emotional contagion (Frenzel et al., 2021; Oberle & Schonert-Reichl, 2016; Tikkanen et al., 2021). Numerous cross-sectional studies documented this association (Arens & Morin, 2016; Gastaldi et al., 2014; Klusmann et al., 2022). However, longitudinal evidence is scarce and focused on individual paths of the hypothesized mediating process (Shen et al., 2015).

Therefore, this study aimed to investigate data of N = 45 teachers and their students (N = 806) from a three-wave longitudinal study to test the mediating role of teacher- and student-reported quality of teacher-student interactions (i.e., emotional support, classroom management and instructional support) for the predictive effect of teachers’ emotional exhaustion and job satisfaction – two key aspects of teachers’ occupational well-being – on students’ motivation and achievement. In doing so, we extend previous research not only by testing the complete meditation model longitudinally, but also by considering multiple dimensions of teachers’ occupational well-being and accounting for a wide variety of interaction- and student outcomes.

Preliminary analyses revealed significant association consistent with our expectations between teachers’ preceding well-being, in terms of job satisfaction and emotional exhaustion, and student-rated quality of classroom management and instructional support at the following measurement point. For teachers’ self-report only, cross-sectional relationships emerged between teachers’ well-being and classroom management. While no significant relationship emerged between teachers’ well-being and students’ outcomes, the preliminary analyses suggested a significant positive link between emotional support and classroom management at the previous measurement point and subsequent student motivation (i.e., utility value and self-concept) for both teachers’ self-report and student ratings. For students’ achievement, significant positive associations were only found for teachers rated emotional support, classroom management and instructional support.

According to the pre-registration (https://osf.io/npk8c), we will conduct full longitudinal mediation models to investigate whether teacher- and student-rated quality of teacher-student interactions (emotional support, classroom management, and instructional support) at the second measurement point mediates the relationship between teachers’ occupational well-being (i.e., emotional exhaustion and job satisfaction) in the beginning of the school year and students’ motivation and achievement at the third measurement point (Little et al., 2009). Because our data has a multi-level structure (i.e., students nested within teachers), we will address this structure in our analyses (Preacher et al., 2010; Raudenbush & Byrk, 2002). In doing so, we will control for prior levels of the quality of teacher-student interactions (at least for teachers’ self-reports) and students’ outcomes.

The findings will be discussed with regard to theoretical and practical implications, study limitations, and avenues for future research.

 

The Longitudinal Predictions of Social-Emotional Characteristics on School-Related and General Academic and Well-being Outcomes among Secondary School Students

Yi-Jhen Wu, Michael Becker
Center for Research on Education and School Development, TU Dortmund

Educationalists, psychologists, and economists have agreed that social-emotional characteristics are essential to students’ successful life outcomes (Duckworth & Yeager, 2015; Heckman & Kaut, 2012). The core domains of social–emotional characteristics can be organized based on three psychological needs in the Self-Determination Theory (SDT): (a) task-orientation (competence), (b) self-orientation (autonomy), and (c) other-orientation (relatedness) (Ryan & Deci, 2000; Schoon, 2021). Based on the contextual aspect of the SDT, social-emotional characteristics might not contribute to different outcomes uniformly as different outcomes are associated with distinct goals and life experiences (Ryan & Deci, 2000). This leads to the question of how social-emotional characteristics are related to two important outcomes — academic and well-being outcomes — for secondary school students. Also, whether the predictions of social-emotional characteristics are similar between general and school-related academic and well-being outcomes.

This conceptualization of social-emotional characteristics can map into main components in the Expectancy-Value Theory (EVT) to explain the predictions of social-emotional characteristics on school-related and general academic outcomes (Eccles et al., 1983). The EVT posits that expectancy beliefs, values, general self-schema and socialization are linked to school-related and general academic outcomes. Expectancy beliefs (self-orientation domain) and value (task-orientation domain) directly influence school-related and general academic outcomes; general self-schema and socialization processes have more distant influences on school-related and general academic outcomes.

Regarding the predictions of social-emotional characteristics on well-being, during the period of secondary school, students are particularly in need of strong competence, autonomy and relatedness to foster their development (Eccles et al., 1993; Erikson, 1968). Moreover, given that establishing a coherent self-identity is an important developmental task for students, social interactions with others play an important role in helping students shape their identities, which leads to better well-being (Eccles et al., 1993; Erikson, 1968). Thus, social-emotional characteristics in the self-orientation and other-orientation domains might strongly predict general and school-related well-being.

So far, no longitudinal study investigated the joint predictions of social-emotional characteristics from multiple domains on school-related and general academic and well-being outcomes (Guo et al., 2023; Soto et al., 2022). Thus, we investigated two main research questions: (1) the longitudinal predictions of social-emotional characteristics from the task-orientation, self-orientation, and other-orientation domains on school-related and general academic outcomes, and (2) the longitudinal predictions of social-emotional characteristics from the task-orientation, self-orientation, and other-orientation domains on school-related and general well-being outcomes.

To answer our research questions, we analyzed 4,744 students who were followed from grade 9 to grade 10. Predictors were social-emotional characteristics in three domains in grade 9: (1) task-orientation domain: learning motivation, (2) self-orientation domain: academic self-concept and self-esteem, and (3) other-orientation domain: empathy and social anxiety interaction. Academic outcomes were academic performance (school-related outcome) and expectations of studying at university (general outcome) in grade 10. Well-being outcomes were school and life satisfaction in grade 10, corresponding to school-related and general well-being. Control variables were immigrant status, family socioeconomic status, gender, school track, prior cognitive ability and well-being. Multivariate linear regression and probability analyses were applied.

The results showed that learning motivation, academic self-concept, and social anxiety interaction positively predicted academic performance. Learning motivation and academic self-concept positively predicted expectations of studying at university. Moreover, self-esteem and empathy significantly positively predicted life satisfaction, but social anxiety interaction negatively predicted life satisfaction. However, only learning motivation positively predicted school satisfaction. In sum, the results supported the EVT that task-orientation and self-orientation domains were strongly related to school-related and general academic outcomes. These findings additionally supported the contextual aspect of the SDT that the predictions of social-emotional characteristics are rather domain-specific.

 
13:10 - 14:505-04: Qualifizierung von Lehrkräften und Schulleitungen an Schulen in herausfordernden Lagen: Bedarfe und Angebote
Ort: H02
 
Symposium

Qualifizierung von Lehrkräften und Schulleitungen an Schulen in herausfordernden Lagen: Bedarfe und Angebote

Chair(s): Karen Aldrup (IPN - Leibniz Institut für die Pädagogik der Naturwissenschaften und Mathematik, Deutschland), Patrick Hawlitschek (Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin)

Diskutant*in(nen): Kai Maaz (DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation)

Die sozio-kulturelle Herkunft von Schüler:innen ist eng verbunden mit dem Erwerb sprachlicher und mathematischer Kompetenzen, vollzogenen Bildungsübergängen und erworbenen Abschlüssen (Maaz & Dumont, 2019; Maaz, Neumann & Baumert, 2014). Die sozialen Disparitäten haben sich in Deutschland in den vergangenen Jahren sogar noch verstärkt (Stanat et al., 2022): Grundschulkinder aus Familien mit einem geringeren sozialen Status sowie Schüler:innen mit Migrationshintergrund verzeichnen stärkere Kompetenzrückgänge als Schüler:innen aus sozial privilegierteren Familien und ohne Zuwanderungshintergrund (Henschel et al., 2022; Sachse et al., 2022). Dies stellt sowohl das Bildungssystem als auch die Bildungsforschung vor besondere Herausforderungen, um Lehrkräfte an Schulen in herausfordernden Lagen gezielt zu unterstützen. Daher beleuchten die vier Beiträge dieses Symposiums die Frage, wie Schulen in herausfordernden Lagen einerseits durch Schul- und Unterrichtsentwicklung und andererseits durch die Professionalisierung der Lehrkräfte, Schulleitungen sowie des weiteren pädagogischen Personals dabei unterstützt werden können, die Bildungschancen ihrer Schüler:innen zu stärken. Dazu werden Daten aus dem Verbundprojekt „Schule macht stark“ (SchuMaS) genutzt, welches deutschlandweit mit rund 200 Schulen in herausfordernden Lagen zusammenarbeitet und ihnen verschiedene forschungsbasierte Fortbildungsformate sowie den Austausch in sog. Schulleitungsnetzwerktreffen anbietet.

Bei der Entwicklung von geeigneten Unterstützungsangeboten stellt die Erfassung der individuellen Bedarfe von Lehrkräften und Schulleitungen ein wichtiges Element dar. Nur so können passgenaue Inhalte gestaltet werden, die von der Zielgruppe als relevant erachtet und langfristig in der Schulpraxis verankert werden (van Ackeren et al., 2021). Daher wird zunächst ein Beitrag vorgestellt, der die Qualifizierungsbedarfe von Lehrkräften an Schulen im „Schule macht stark“-Verbund untersucht. Es wurde erfasst, welche subjektiven Fortbildungsbedarfe Lehrkräfte an diesen Schulen in herausfordernden Lagen für sich selbst wahrnehmen und in welchen Kompetenzbereichen sie sich besonders sicher fühlen. Dabei analysieren sie auch schulformbezogene Unterschiede in der Wahrnehmung von Lehrkräften an Grundschulen und weiterführenden Schulen. Die nachfolgenden zwei Beiträge evaluieren Maßnahmen, die Schulen in herausfordernden Lagen befähigen sollen, Qualifizierungs- und Handlungsbedarfe eigenständig zu identifizieren. Zum einen wurde mit Teilnehmenden von Schulleitungsnetzwerktreffen eine zweiteilige Qualifizierungsmaßnahme zur datengestützten Qualitätsentwicklung ihrer Schulen durchgeführt und mittels eines quasi-experimentellen Prä-Post-Kontrollgruppendesigns evaluiert. Zum anderen wurde den Schulen aus dem SchuMaS-Verbund angeboten, Evidenzteams an ihren Schulen zu etablieren, um gemeinsam die datengestützte Qualitätsentwicklung voranzutreiben. Die Nutzung und Qualität dieses Angebots untersuchten sie mithilfe von Längsschnittdaten. Um einen umfassenden Einblick in die Unterstützungsangebote für Schulen in herausfordernden Lagen zu bieten und neben den fachübergreifenden Angeboten auf schulischer Ebene auch fachbezogene Angebote für individuelle Lehrkräfte vorzustellen, wird abschließend auf das Konzept und erste Evaluationsergebnisse von Modulen zur Unterrichtsentwicklung von Deutschlehrkräften eingegangen. Zudem wird analysiert, wie unterschiedliche Formate (synchron vs. asynchron) sich auf das Nutzungsverhalten auswirken.

Insgesamt können die Beiträge des Symposiums somit nicht nur Erkenntnisse darüber liefern, welche Inhalte Qualifizierungsangebote an Schulen in herausfordernden Lagen adressieren sollten, sondern auch, welche Angebotsformate dabei vielversprechend erscheinen. Die Gesamtschau aller Beiträge zieht erste Schlüsse für die Konzeption und Evaluation von passgenauen Qualifizierungsangeboten an Schulen in herausfordernden Lagen.

 

Beiträge des Symposiums

 

Subjektive Fortbildungsbedarfe von Lehrkräften an Schulen in herausfordernden Lagen: ein Schulartvergleich

Hermannn Dzingel1, Patrick Hawlitschek2, Kira Weber3, Uta Klusmann4, Dirk Richter1
1Universität Potsdam, 2Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin, 3Universität Hamburg, 4IPN - Leibniz Institut für die Pädagogik der Naturwissenschaften und Mathematik, Deutschland

Theoretischer Hintergrund

Die jüngsten Ergebnisse von nationalen Schulleistungsuntersuchungen in der Primarstufe (z. B. IQB-Bildungstrend; Stanat et al (2021) und IGLU 2021; McElveny et al. (2023)) berichten zunehmende Lernschwierigkeiten deutscher Grundschulkinder, besonders bei denen aus sozial benachteiligten Familien. Diese Befunde konnten für die sprachlichen Fächer in der Sekundarstufe I durch den IQB-Bildungstrend 2022 sogar bestätigt werden (Stanat et al., 2023). An Schulen in herausfordernden Lagen, also mit einem hohen Anteil an Schüler:innen aus sozial benachteiligten Familien, befinden sich überzufällig viele Schüler:innen mit ungünstigen Lernvoraussetzungen (z. B. motivationale Probleme, Hoglund et al., 2015) und mit einer schlechteren physischen und psychischen Gesundheit sowie sozial-emotionalen Problemen (für einen Überblick siehe Bradley & Corwyn, 2002). Die Qualität der schulischen Lernumwelt und Unterstützung scheint bei diesen Schüler:innen von besonderer Bedeutung zu sein.

Um Lehrkräfte bei der Bewältigung dieser beruflichen Anforderungen zu unterstützen, ist die Professionalisierung durch regelmäßige Fortbildungen essenziell. Allerdings zeigen Studien, dass nicht alle Lehrkräfte regelmäßig Fortbildungen besuchen (Kuschel et al., 2020), was unter anderem an einer fehlenden Passung zwischen den Inhalten der angebotenen Fortbildungen und den individuellen Bedarfen der Lehrkräfte liegen könnte. Vor dem Hintergrund der besonderen Anforderungen von Lehrkräften an Schulen in herausfordernder Lage untersucht der Beitrag Unterschiede in subjektiven Fortbildungsbedarfen zwischen Grundschulen und weiterführenden Schulen in herausfordernden Lagen. Subjektive Fortbildungsbedarfe verstehen wir als Themenbereiche, in denen sich Lehrkräfte selbst weiterbilden möchten. Darüber hinaus ist aber unklar, inwieweit themenspezifische Einschätzungen einen globalen Fortbildungsbedarf repräsentieren und wie interindividuellen Unterschiede in diesen Bedarfen erklärt werden können.

Fragestellungen

1) Unterscheiden sich Lehrkräfte an Grundschulen und weiterführenden Schulen in herausfordernden Lagen in ihrem globalem und themenspezifischen Fortbildungsbedarf?

2) Inwieweit lassen sich globale und themenspezifische Fortbildungsbedarfe unter Kontrolle der Schulform von individuellen (emotionale Erschöpfung, Kompetenzeinschätzung) und schulischen Merkmalen (Kooperationstätigkeit) erklären?

Methode

Wir analysieren Befragungsdaten von 2,624 Lehrkräften (80% weiblich, 2.6% divers oder fehlend) aus 119 Grundschulen und 68 weiterführenden Schulen in herausfordernden Lagen. Die Befragten gaben ihren subjektiven Fortbildungsbedarf (0 = kein Bedarf bis 6 = großer Bedarf) und ihre Kompetenzeinschätzung (0 = nicht sicher bis 6 = sehr sicher) für ausgewählte Themenbereiche an (10 Items), die wir jeweils faktoranalytisch zu den vier Kompetenzbereichen zusammenfassten (.70 ≥ α ≥ .87). Zudem wurde die emotionale Erschöpfung (α = .85; Enzmann & Kleiber, 1989), die kollegiale Kooperation (α = 78; Hartmann et al., 2021) sowie sozio-demografische Variablen erfasst. Die Daten wurden mittels latenter Strukturgleichungsmodelle in R mit dem Paket lavaan (Roeseel, 2012) und clusterrobusten Standardfehlern ausgewertet. Dafür spezifizierten wir für jeden Kompetenzbereich zuerst ein Modell, in das nur die Schulformvariable einging (0 = weiterführend, 1 = Grundschule). Im zweiten Modell kontrollierten wir für die Berufserfahrung, das Geschlecht, Kompetenzeinschätzung und fügten die emotionale Erschöpfung und kollegiale Kooperation als Prädiktoren hinzu.

Ergebnisse

Die Befunde zeigen, dass Unterschiede in Fortbildungsbedarfen zwischen Grundschullehrkräften und Lehrkräften an weiterführenden Schulen statistisch signifikant, aber durchweg gering ausfallen (|.07| ≤ β ≤ |.23|). Lehrkräfte an Grundschulen zeigen im Vergleich zu Lehrkräften der Sekundarstufe einen höheren Fortbildungsbedarf in den Bereichen „Lernförderung“, „digitaler Medieneinsatz“ und „Umgang mit Belastungen“, während ihr Bedarf im Bereich „Interaktionsqualität“ niedriger ausfällt. Für den Einsatz digitaler Medien zeigen sich die größten Schulformunterschiede. Insgesamt bleiben die Schulformunterschiede in den betrachteten Kompetenzbereichen auch unter Kontrolle der übrigen Variablen stabil.

Diskussion

Unsere Befunde unterstreichen die Bedeutung von zielgruppenspezifischen Fortbildungsangeboten für die Entwicklung von Unterstützungsstrukturen und legen einen themenspezifischen Zugang nahe. Wir diskutieren die Befunde hinsichtlich möglicher Konsequenzen für die Planung und Gestaltung von passgenauen Fortbildungsangeboten.

 

Wirksamkeit einer netzwerkbasierten Intervention für Schulleitungsmitglieder zur datengestützten Qualitätsentwicklung an Schulen in herausfordernden Lagen

Patrick Hawlitschek1, Ulrike Rangel2, Karina Karst3
1Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin, 2IBBW – Institut für Bildungsanalysen Baden-Württemberg, 3Universität Mannheim

Theoretischer Hintergrund

Die datengestützte Qualitätsentwicklung wird als wichtiger Teil des professionellen Handelns von Schulleitungsmitgliedern betrachtet – insbesondere an Schulen in herausfordernden Lagen (Muijs et al., 2004) – und umfasst den systematischen Einbezug von schulischen Datenquellen (z.B. Ergebnisse aus VERA-3/8, externer Evaluation, Schüler:innenfeedback) in die Entscheidungsfindung auf Schulebene. Diese systematische Auseinandersetzung aus Rezeption, Reflexion, Aktion und Evaluation wird anhand theoretischer Rahmenmodelle (z.B. Helmke & Hosenfeld, 2005) als Datennutzungszyklus beschrieben und stellt einen äußerst voraussetzungsvollen Teil des professionellen Handelns von Schulleitungsmitgliedern dar. Zugleich kommt der (erweiterten) Schulleitung eine besondere Rolle für die Etablierung einer produktiven Datennutzungskultur im Kollegium zu (Ikemoto & Marsh, 2007) und sollte daher für die Datennutzung motiviert sein. Angesichts des hohen Potenzials einer datengestützten Qualitätsentwicklung ist es umso wichtiger, dass Schulleitungsmitglieder wirksame Angebote zur Professionalisierung erhalten. Aus internationalen Studien gibt es Evidenz dafür, dass insbesondere Schulen bzw. Klassen mit einem hohen Anteil an Schüler:innen mit niedrigem sozio-ökonomischen Status von einer solcher Qualifizierungsmaßnahme profitieren (Van Geel et al., 2016; Keuning et al., 2017). Jedoch gibt es im deutschsprachigen Raum keine evidenzbasierten Ansätze zur Förderung einer datengestützten Qualitätsentwicklung (Klein & Tulowitzki, 2020). Bisherige Fortbildungsangebote richten sich vornehmlich an (angehende) Lehrkräfte (Vogel et al., 2016; Wurster et al., 2023) oder sind allgemein auf Schulleitungshandeln (Imboden, 2017) und nicht explizit auf die Herausforderungen datengestützter Qualitätsentwicklung (z.B. Motivierung des Kollegiums zur Nutzung von Daten) oder Bedarfe von Schulen in herausfordernden Lagen fokussiert.

Fragestellungen

Um diese Forschungslücken zu schließen, untersucht dieser Beitrag die Wirksamkeit einer forschungsbasiert entwickelten, zweiteiligen Qualifizierungsmaßnahme (jeweils ca. 6 Stunden im Abstand von 2 Monaten) für das datengestützte Schulleitungshandeln, die Datennutzungskultur sowie motivationale Überzeugungen (Interesse, Enthusiasmus) im Rahmen schulischer Netzwerkarbeit von „SchuMaS“. Zudem wird untersucht, inwieweit Schulleitungsmitglieder mit niedrigen und hohen Ausgangswerten differenziell von der Intervention profitieren. Neben fachlichem Input zur datengestützten Qualitätsentwicklung boten die beiden Termine Austausch- und Arbeitsphasen zur anschließenden Erprobung an der eigenen Schule. Inhaltliche Schwerpunkte stellten die Rolle der Schulleitung in diesem Prozess, der Datennutzungszyklus, förderliche Gelingensbedingungen, die Motivierung des Kollegiums für datengestütztes Arbeiten und die Etablierung von Evidenzteams in Anlehnung an Schildkamp (2016) sowie das baden-württembergische Schuldatenblatt dar.

Methode

Zur Überprüfung der Wirksamkeit analysieren wir Befragungsdaten der Experimentalgruppe (NEG = 32; Projektschulen aus SchuMaS) und einer Kontrollgruppe (NKG = 32) in einem Prä-Post-Kontrollgruppendesign. Die Rekrutierung dieser Kontrollgruppe fand als statistische Auswahl von „Schulzwillingen“ (propensity score matching) statt, die anhand relevanter Merkmale (aggregierte VERA-3/8-Ergebnisse, Anteil an Schüler:innen mit Migrationshintergrund, Schulform, u.v.m.) durchgeführt wurde. Der Prätest fand im Sommer 2022 vor der Qualifizierung und der Posttest danach im Frühjahr 2023 statt. Die befragten Schulleitungsmitglieder (39% weiblich, M = 7 Jahre (SD = 6.39) Berufserfahrung als Schulleitung) machten Angaben zu ihrem datengestützten Schulleitungshandeln (7 Items; αt1/t2 = .89/.86), zur Datennutzungskultur an den Schulen (7 Items; αt1/t2 = .83/.80) und zu motivationalen Überzeugungen gegenüber datengestützter Qualitätsentwicklung (Interesse: 3 Items; αt1/t2 = .84/.63, Enthusiasmus: 4 Items; αt1/t2 = .89/.73). Von den 64 Schulleitungsmitgliedern liegen für 37 (57.80%) Daten zu beiden Messzeitpunkten (Prä-/Posttest) vor, die mit dem R-Paket mice (van Buuren & Groothuis-Oudshoorn, 2011) multipel imputiert wurden (m = 30, Iterationen = 10).

Ergebnisse

Zur Beantwortung unserer Forschungsfragen spezifizierten wir mit dem R-Paket lme4 (Bates et al., 2014) linear mixed effects models mit random intercepts, um die genestete Datenstruktur angemessen zu beachten. Die Ergebnisse deuten darauf hin, dass die Intervention signifikant zum datengestützten Schulleitungshandeln (B = .38) wie auch zum Enthusiasmus im Umgang mit Daten (B = .33) beiträgt. Zudem liefern die Analysen Hinweise, dass vor allem Schulleitungsmitglieder mit geringen Ausgangswerten in allen untersuchten Variablen besonders von der Qualifizierung profitieren. Wir diskutieren die Befunde hinsichtlich möglicher Gelingensbedingungen für die Planung und Gestaltung einer netzwerkbasierten Unterstützung von Schulleitungsmitgliedern zur datengestützten Qualitätsentwicklung an Schulen in herausfordernden Lagen.

 

Datengestützte Qualitätsentwicklung an Schulen in herausfordernden Lagen: Welche Schulen etablieren Evidenzteams?

Karina Karst1, Marko Neumannn2, Patrick Hawlitschek3, Alexandra Marx2
1Universität Mannheim, 2DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, 3Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin

Theoretischer Hintergrund

Erfolgreiche Schulen in herausfordernden Lagen sehen eine datengestützte Qualitätssicherung und -entwicklung als einen wesentlichen Bestandteil ihrer Arbeit und beziehen mehrperspektivische Datenbestände gezielt in ihre Entwicklungsarbeit ein (Racherbäumer et al. 2013, Reynolds 2001). Daten werden dabei als alle systematisch erfassten und aufbereiteten Informationen aus Prozessen definiert, die für die Schul- und Unterrichtsqualität relevant sein können. Durch die Nutzung von internen und externen Daten stellen Schulen Soll- und Ist-Zustände einander gegenüber, überprüfen fortlaufend die Wirksamkeit initiierter Maßnahmen und erhöhen so ihre Schulentwicklungskapazität (Holtappels et al., 2021). Eine solche an Daten orientierte pädagogische Praxis kann sich positiv auf die Unterrichtsqualität und die Kompetenzentwicklung von Schüler*innen auswirken und damit einen Beitrag zur Reduzierung von Bildungsungleichheiten leisten (z.B. Klein & Bremm, 2019; Visscher, 2021). Der Prozess einer datengestützten Schul- und Unterrichtsentwicklung ist jedoch keinesfalls voraussetzungsfrei: Wichtig ist eine hohe Professionalität schulischer Akteure sowie eine positiv ausgeprägte Datennutzungskultur in den Schulen (Keuning et al., 2017). Entsprechend wurden international Konzepte entwickelt, damit schulische Akteure darin unterstützt werden, kollaborativ Daten effektiv nutzen zu können (data teams; Schildkamp et al., 2018). Es handelt sich hierbei um einen iterativen und zyklischen Entwicklungskreislauf, bei dem Mitglieder der schulischen data teams durch eine:n externe:n Coach unterstützt werden und so systematisch Kenntnisse zum datengestützten Handeln erwerben. Zwar gibt es bislang Studien dazu, unter welchen Bedingungen solche Teams gut funktionieren (Schildkamp et al., 2019), die Frage danach, welche Faktoren an Schulen in herausfordernden Lagen die grundsätzliche Etablierung solcher Teams begünstigen, ist jedoch im nationalen Bildungswesen bislang unklar.

Im Beitrag wird der Ansatz zur datengestützten Qualitätsentwicklung im Projekt Schule macht stark (SchuMaS) dargestellt, der die Etablierung sog. „Evidenzteams“ vorsieht, die im Sinne von data teams die datengestützte Schul- und Unterrichtsentwicklung an den 195 teilnehmenden Projektschulen voranbringen sollen. Die Grundlage bildeten schulübergreifende Netzwerktreffen (April/ Mai 2022) in dessen Rahmen die Teilnehmer*innen zu Zielen, Aufbau und Arbeitsweisen von Evidenzteams geschult wurden und anschließend darin unterstützt wurden, Evidenzteams an ihren Schulen zu etablieren.

Forschungsfragen

1. An wie vielen der Projektschulen wurden Evidenzteams etabliert?

2. Wie wird die Qualität der Zusammenarbeit innerhalb der Evidenzteams von den Schulleitungen wahrgenommen?

3. Inwieweit hängen schulische Merkmale (Kooperationshäufigkeit, Nutzung von schulischen Datenquellen, Innovationsbereitschaft) mit der Etablierung von Evidenzteams an Schulen in herausfordernden Lagen zusammen?

Methode

Datengrundlage bildet einerseits die SchuMaS-Ausgangserhebung (Herbst/Winter 2021; SchuMaS-Forschungsverbund 2022), an der 195 Schulleitungen (63% weiblich, zwischen 0 und 34 Berufsjahre als Schulleitung tätig) teilgenommen haben. Dieser Datensatz liefert Informationen zur Ausgangslage an den Schulen im SchuMaS-Forschungsverbund, die prädiktiv für die Etablierung von Evidenzteams sein kann. Ausgehend von empirischen Befunden zur Etablierung von Evidenzteams stehen im Fokus: Kooperationshäufigkeit von Lehrkräften (Hartmann et al., 2021; α = .71), Nutzungshäufigkeit von Daten für schulische Entscheidungen (adaptiert nach Demski, 2017; α = .81) und daraus abgeleitete schulische Maßnahmen (adaptiert nach Wurster et al., 2016; α = .84) sowie die Innovationsbereitschaft im Kollegium (Quellenberg, 2009; α = .82). Diese Ausgangsbedingungen werden mit Daten der SchuMaS-Zwischenerhebung (Sommer/Herbst 2023) längsschnittlich verknüpft, bei der die Schulleitungen (N = 128) befragt worden sind, ob es feste Teams (Evidenzteams) zur kooperativen Nutzung von Daten gibt und wie die Zusammenarbeit innerhalb dieser Teams wahrgenommen wird (α = .84; Eigenentwicklung).

Ergebnisse

Erste deskriptive Analysen zeigen, dass 45 Schulen von 128 befragten Schulleitungen solche Evidenzteams eingeführt haben, davon 19 Schulen im Zuge von SchuMaS. Zudem bewerten die Schulleitungen die Qualität der Zusammenarbeit von Evidenzteams auf einer Skala von 1 (Gar nicht) bis 4 (Voll und ganz) als hoch (M=3.10; SD=0.56). Da die längsschnittliche Verknüpfung der Daten noch nicht vollständig aufbereitet ist, können wir zum jetzigen Zeitpunkt noch keine Ergebnisse berichten, inwieweit schulische Merkmale mit der Etablierung von Evidenzteams zusammenhängen. Diese werden bis zum Zeitpunkt der GEBF 2024 aber vorliegen.

 

Gelingensbedingungen erfolgreicher Qualifizierungsmodule für Lehrkräfte im Fach Deutsch im Rahmen der Bund-Länder-Initiative „Schule macht stark“

Simone Jambor-Fahlen, Rebekka Wanka, Till Woerfel
Universität zu Köln

Theoretischer Hintergrund

Im Rahmen der Bund-Länder-Initiative „Schule macht stark – SchuMaS“ zielt das Qualifizierungsangebot im Cluster Unterrichtsentwicklung für das Fach Deutsch darauf ab, Lehrkräfte und Multiplikator:innen darin zu unterstützen, bestmögliche Bildungschancen für sozial benachteiligte Schüler:innen zu ermöglichen. Empirisch hat sich die Förderung der basalen Kompetenzen in den Bereichen der Lese- und Schreibflüssigkeit und der Anwendung geeigneter Strategien im Lesen und Schreiben als besonders wirksam erwiesen (Philipp & Schilcher 2012, Philipp 2012, Sturm 2017). Das Cluster bietet den an SchuMaS beteiligten Schulen in Qualifizierungsmodulen material- und skriptgestützte Maßnahmen zur Förderung dieser basalen Kompetenzen an. Die in den Modulen vorgestellten Förderkonzepte werden im Rahmen von Prozessen der Schul- und Unterrichtsentwicklung gemeinsam mit weiteren Lehrkräften in den Schulen implementiert. Die Implementation der Förderkonzepte erfolgt entlang einer Wirkungskette (Becker-Mrotzek & Roth 2022): Von wissenschaftlicher Seite aus werden die Multiplikator:innen qualifiziert, die in der Folge die Lehrkräfte schulen. Die Module werden in einem Blended-Learning-Konzept (Christensen et al. 2013) umgesetzt, das synchrone virtuelle Treffen und asynchrone Selbstlernphasen umfasst. Das Konzept folgt dabei evidenzbasierten Prinzipien gelingender Lehrkräftefortbildungen (Lipowsky & Rzejak 2012).

Forschungsfragen

Der vorliegende Beitrag skizziert das o. g. Qualifikationskonzept und zeigt auf, wie fachwissenschaftliche und fachdidaktische Inhalte vermittelt und gemeinsam mit den Teilnehmenden ko-konstruktiv weiterentwickelt werden. Das Ziel ist die Förderung basaler (schrift-)sprachlicher Kompetenzen gemäß der Annahme, dass auch Qualifizierungsmaßnahmen für Lehrkräfte sich positiv auf die Lernerfolge ihrer Schüler:innen auswirken können (Yoon et al. 2007). Neben der übergreifenden Forschungsfrage nach den Gelingensbedingungen erfolgreicher Qualifizierungsmaßnahmen für Lehrkräfte, sollen folgende untergeordnete Forschungsfragen in Anlehnung an die Kriterien der Wirksamkeit von Lehrerfortbildungsmaßnahmen nach Rzejak und Lipowsky (2012) im Beitrag beantwortet werden:

• Wie beurteilen Lehrkräfte die Rahmenbedingungen der Qualifizierungsangebote?

• Wie beurteilen Lehrkräfte die fachdidaktischen Inhalte der Qualifizierungsangebote?

• Wie beurteilen Lehrkräfte die Möglichkeit, die fachdidaktischen Inhalte in ihrem Unterricht umzusetzen?

• In welchem Umfang haben die Teilnehmenden die asynchronen Selbstlerneinheiten bearbeitet?

• In welchem Umfang wurden die asynchronen Aufgaben zur Reflexion der Lerninhalte genutzt?

• Haben sich die Lesefähigkeiten der Schülerinnen und Schüler durch den Einsatz des Leseflüssigkeitstraining verbessert?

Methode

Der Kompetenzzuwachs durch das Training zur Förderung der Leseflüssigkeit wurde in dritten und vierten Jahrgangsstufen in einer quasi-experimentellen Studie im Prä-/Post-Design mit einer Interventions- (N = 291) sowie einer Kontrollgruppe (N = 140) untersucht. Die Kontrollgruppe bestand aus Parallelklassen, die zur gleichen Zeit ohne ein vergleichbares Training, d.h. mit den in der Schule üblichen Methoden des Deutschunterrichts beschult wurden. Zudem wurden nach der Durchführung der Qualifikationsmaßnahmen alle teilnehmenden Lehrkräfte (N = 291) zu ihrer Einstellung gegenüber der Maßnahme, der Umsetzung in ihrem Unterricht und zur Nutzung der asynchronen Selbstlerninhalte mittels eines Online-Fragebogens befragt.

Ergebnisse

Erste deskriptive Ergebnisse zeigen, dass die teilnehmenden Lehrkräfte auf einer endpunktbenannten vierstufigen Likert-Skala (1 = stimme überhaupt nicht zu; 4 = stimme voll und ganz zu) die strukturellen Rahmenbedingungen (z.B. Modul 1; N=37; M=3.59) und die fachdidaktischen Inhalte (z.B. Modul 1; N = 37; M = 2.88) mehrheitlich als eher positiv bewerten. Auch die Umsetzbarkeit in der Praxis sowie die Nützlichkeit der Fortbildung wurden eher positiv (z.B. Modul 1; N=37; M=2.68) bewertet. Erste Ergebnisse weisen jedoch darauf hin, dass asynchrone Selbstlerninhalte zu einem großen Teil (28.5 %) nicht bearbeitet wurden und damit relevante Inhalte für die Qualifikation fehlen. Zudem wurde deutlich, dass zwischen verschiedenen Durchläufen (erste und zweite Kohorte) der Qualifikation – bei gleichen Bedingungen – Unterschiede in der Bewertung erfolgten. Hier ist zu diskutieren, wie sich unterschiedliche Merkmale der Teilnehmenden (wie bspw. ihre Erwartungen, Ziele und/oder ihre Haltung gegenüber dem Projekt etc.) auf die Bewertung auswirken. Ergebnisse zur Kompetenzentwicklung der Schüler:innen werden zum Zeitpunkt der Tagung vorliegen und im Rahmen des Beitrags berichtet. Anhand der Ergebnisse ist zu diskutieren, wie Qualifikationsmaßnahmen im Bereich der Lehrkräftefortbildung erfolgreich umgesetzt werden können.

 
15:20 - 17:006-04: Testbearbeitungsmotivation in Schulleistungsuntersuchungen: Diagnostik, Modellierung und Einflussfaktoren
Ort: H02
 
Symposium

Testbearbeitungsmotivation in Schulleistungsuntersuchungen: Diagnostik, Modellierung und Einflussfaktoren

Chair(s): Janine Buchholz (Institut zur Qualitätsentwicklung im Bildungswesen (IQB))

Diskutant*in(nen): Johannes Hartig (DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation)

Die Teilnahme an groß angelegten Bildungsvergleichsstudien stellt ein zentrales Instrument der KMK-Gesamtstrategie zum nationalen Bildungsmonitoring dar (KMK, 2015). In Deutschland finden daher regelmäßig nationale und internationale Schulleistungsuntersuchungen statt. Dies sind die Studie zur Überprüfung des Erreichens der Bildungsstandards („IQB-Bildungstrends“) sowie PISA, PIRLS/IGLU und TIMSS. Diese Studien unterscheiden sich in zahlreichen Merkmalen (z.B. Definition des zu messenden Kompetenzkonstrukts, gemessene Domänen, Stichprobe, Durchführungsintervall, durchführende Organisation), lassen sich aber alle als sog. „low-stakes“ Assessments charakterisieren, da keine persönlichen Konsequenzen (z.B. Noten, Entlohnung) mit dem Ergebnis des Tests verbunden sind. Dadurch kann von einer im Vergleich zu „high-stakes“ Assessments (z.B. Klassenarbeiten) geringer ausgeprägten Testbearbeitungsmotivation ausgegangen werden (z.B. Penk & Richter, 2017; Wolf & Smith, 1995), was sich wiederum in einer geringeren Testleistung niederschlägt (Wise & DeMars, 2005). Dies ist besonders problematisch, wenn bestimmte Gruppen von Schüler:innen (z.B. Jungen, Nicht-Muttersprachler:innen) systematisch von solchen Unterschieden betroffen sind, weil Gruppenunterschiede in der gemessenen Kompetenz dann mit Gruppenunterschieden in der Motivation konfundiert sind. Dieser Umstand stellt somit eine Gefahr für die Interpretation der in den Schulleistungsuntersuchungen gewonnenen Testwerte als Indikatoren für die zu messenden Kompetenzen dar.

Die Problematik geringer Testbearbeitungsmotivation findet zunehmend Aufmerksamkeit. Beispielsweise widmete die OECD dem Thema im Rahmen ihres „PISA Research, Development and Innovation“ Programms ein eigenes Projekt (z.B. Buchholz et al., 2022) und wird im Rahmen der Ergebnisrückmeldung für PISA 2022 verschiedene Indizes für „student engagement“ berichten. Gleichzeitig ist das Thema in vielfältiger Weise Gegenstand der aktuellen Forschung. Die Beiträge dieses Kolloquiums lassen sich dabei den folgenden Themenbereichen zuordnen: (a) Entwicklung von Indikatoren von Test­be­ar­bei­tungs­motivation (Beiträge 1 und 2), (b) Modellierung von Kompetenzen unter Berücksichtigung von Unterschieden in der Testbearbeitungsmotivation (Beitrag 3), und (c) Identifikation von Einflussfaktoren und möglichen Interventionen (Beitrag 4).

(a) Neben Selbstberichtsskalen zur aktuellen Motivation oder Anstrengungsbereitschaft können unterschiedliche Indizes gebildet werden, um Verhalten zu quantifizieren, das auf eine geringe oder nachlassende Testbearbeitungsmotivation schließen lässt, etwa Leistungsabfall oder Auslassungstendenzen. Aus den zunehmend computerbasiert administrierten Schulleistungsstudien stehen zudem Antwortzeiten bereit. Diese können u.a. genutzt werden, um übermäßig schnelle Antworten zu identifizieren, die auf Raten zurückgeführt werden können, das wiederum aufgrund geringer Test­be­ar­bei­tungs­motivation zustande gekommen sein kann. Beitrag 1 untersucht anhand von Eye-Tracking-Daten eine weitere Möglichkeit, zufälliges Raten auf Multiple-Choice-Items zu identifizieren. Beitrag 2 bezieht sich auf das Zusammenspiel verschiedener Indikatoren von Testbearbeitungsmotivation. Anhand von Daten des IQB-Bildungstrends wird der Zusammenhang von Leistungsabfall und selbstberichteter Anstrengungs­bereitschaft untersucht, und ob die Auslassungstendenz einen darüberhinausgehenden Erklärungswert besitzt.

(b) Auf Basis von Indikatoren geringer oder nachlassender Testbearbeitungsmotivation lassen sich betroffene Antworten und/oder Personen identifizieren, wodurch sich die Frage anschließt, wie mit den Daten im Rahmen der Modellierung umgegangen werden soll und welche Konsequenzen für die Interpretation des Kompetenzkonstrukts damit verbundenen sind. Beitrag 3 stellt modellbasierte Behandlungsmethoden von schnellgeratenen Antworten vor und untersucht, inwiefern sich das Länderranking in PISA in Abhängigkeit von der Behandlungsmethode verändern würde.

(c) Um auch in „low-stakes“ Assessments ein angemessenes Niveau der Testbearbeitungsmotivation zu gewährleisten oder ein Abfallen im Testverlauf zu vermeiden, werden u.a. Merkmale von Testadministration und Testdesign untersucht, die einen Einfluss nehmen können. Beitrag 4 untersucht anhand der Umstellung von papier- auf computerbasierte Testung im Rahmen der IGLU-Studie, welchen Einfluss der Testmodus auf das emotionale Erleben während der Testbearbeitung hat und wie dies mit der gemessenen Leseleistung zusammenhängt.

Die vier Beiträge werden im Anschluss diskutiert. Dabei wird ein besonderer Fokus auf der Validität von Interpretationen der in den Schulleistungsuntersuchungen gewonnenen Testwerte liegen. Ein weiterer Schwerpunkt liegt auf den Konsequenzen dieser Befunde für die Sekundärnutzung der Daten aus diesen Studien für die eigene Forschung.

 

Beiträge des Symposiums

 

Der Beitrag von Blickbewegungsdaten zur Fähigkeitsmessung mittels Multiple-Choice-Items

Gabriel Nagy1, Esther Ulitzsch1, Gregory Camilli2, Marlit Annalena Lindner3
1IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, 2Rutgers University, NJ, 3IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik; IWM – Leibniz-Institut für Wissensmedien

Theoretischer Hintergrund

Blickbewegungsdaten liefern wertvolle Informationen über die Bearbeitungsprozesse kognitiver Aufgaben. Dementsprechend werden Eye-Tracking-Verfahren vor allem im Kontext komplexer Aufgaben mit offenen Antwortformaten eingesetzt, bei denen Lösungsprozesse und weniger Lösungsprodukte (falsch vs. richtig) im Vordergrund stehen. Es finden sich kaum Arbeiten, die das Potenzial von Blickbewegungsdaten für die Messung individueller Fähigkeiten mittels Multiple-Choice-Items untersuchen. Bisherige Studien dokumentieren, dass sich Blickbewegungen systematisch zwischen falschen und richtigen Antworten unterscheiden (Lindner et al., 2014; Tsay et al., 2012). Diese Arbeiten geben jedoch keinen direkten Aufschluss darüber, inwiefern sich Blickbewegungsdaten zur Messung von Fähigkeiten eignen und inwiefern diese einen diagnostischen Mehrwert gegenüber klassischen Testscores aufweisen.

Die zentrale Herausforderung bei der Nutzung von Blickbewegungen zur Fähigkeitsmessung besteht darin, die für eine korrekte Antwort relevanten Informationen zu isolieren und zu einem geeigneten Index zu verdichten. Dieser Index hat dann einen diagnostischen Mehrwert gegenüber kategorialen Itemantworten, wenn er quantitative Informationen über die Sicherheit der gegebenen Antworten kodiert. In diesem Fall wäre es möglich, Itemantworten als „sicher richtig“ (z.B. Können/Wissen), „sicher falsch“ (z.B. Fehlvorstellungen) und „unsicher“ (evtl. Raten) zu klassifizieren.

Fragestellungen

Die Studie verfolgt zwei Ziele. Erstens soll die Möglichkeit der Fähigkeitsmessung allein mit Blickbewegungsdaten untersucht werden. Zweitens soll der diagnostische Mehrwert von Blickbewegungsdaten über dichotom kodierte Itemantworten hinaus untersucht werden.

Methode

Die Fragestellungen wurden anhand einer Stichprobe von N = 99 Schülerinnen und Schüler (52% weiblich) der Klassenstufe 6 untersucht, die einen Naturwissenschaftstest mit 18 Items (jeweils vier Antwortkategorien) bearbeiteten. In die Analysen gingen die dichotom kodierten Itemantworten und die Fixationszeiten der vier Antwortkategorien ein. Auf Itemebene wurden die Fixationszeiten zu einem Index zusammengefasst (s.u.). Die Möglichkeit der Fähigkeitsmessung mittels Fixationszeiten wurde auf Item- und Personenebene untersucht (Klassifikationsgenauigkeit der Antwortrichtigkeit und Korrelation der über Items aggregierten Indizes mit individuellen Testwerten). Der inkrementelle diagnostische Wert des vorgeschlagenen fixationszeitbasierten Index wurde mit Hilfe eines latenten Variablenmodells, das sowohl dichotome Itemantworten als auch fixationszeitbasierte Indizes enthält, untersucht.

Ergebnisse

Ein Index, der auf der Verteilung der individuellen Fixationszeiten über die vier Antwortkategorien basiert, erwies sich als vielversprechend. Der vorgeschlagene Index berücksichtigt (1) die Fixationszeiten der richtigen Antwortkategorien, (2) die Abstände zur kürzesten Fixationszeit und (3) die relativen Unterschiede zwischen den Fixationszeiten der verschiedenen Antwortkategorien. Der Index ermöglichte eine relativ genaue Zuordnung von richtigen und falschen Antworten (Trefferquoten: Median = 85%; Min = 70%, Max = 89%). Der auf Personenebene aggregierte Index wies eine zufriedenstellende interne Konsistenz auf ( = .70), die nur geringfügig unter der der klassischen Testwerte lag ( = .76). Der aggregierte Index korrelierte stark mit den Testwerten (r = .79), sodass die attenuationskorrigierte Korrelation perfekt ausfiel. Diese Ergebnisse deuten darauf hin, dass der vorgeschlagene Blickbewegungsindex und die klassischen Testwerte dasselbe Konstrukt mit vergleichbarer Genauigkeit erfassen.

Das im zweiten Schritt verwendete latente Variablenmodell beinhaltete eine globale Fähigkeitsdimension, die von allen Items und den auf Fixationszeiten basierenden Indizes gemeinsam indiziert wurde. Darüber hinaus wurden itemspezifische (genestete) latente Variablen modelliert, die durch die jeweils zugehörigen Itemantworten und Indizes identifiziert wurden. Die genesteten Faktoren erfassen den „Abstand“ der beobachteten richtigen oder falschen Antworten zu den „unsicheren“ Antworten. Die Ergebnisse können wie folgt zusammengefasst werden. Die (globale) Fähigkeitsmessung wurde durch die Hinzunahme der Blickbewegungsdaten kaum beeinflusst (vergleichbare Präzision und nahezu perfekte Übereinstimmung der EAP-Personenparameter). Die EAP-Personenparameter auf den genesteten Faktoren lieferten jedoch Informationen, die für die Interpretation der individuellen Testwerte nützlich sein könnten. Beispielsweise wurden im unteren Fähigkeitsbereich Antwortvektoren identifiziert, die keine als „sicher richtig“ klassifizierbaren Antworten enthielten. Dieser Befund deutet darauf hin, dass die Testwerte dieser Schülerinnen und Schüler ausschließlich auf Raten zurückzuführen sind.

 

Positionseffekte und Leistungsabfall im Verlauf der Bearbeitung umfassender Kompetenztests: Die Rollen von Anstrengungsbereitschaft und Auslassungstendenz

Karoline A. Sachse1, Sebastian Weirich1, Nicole Mahler2, Camilla Rjosk3
1Institut zur Qualitätsentwicklung im Bildungswesen (IQB), 2Institut für Bildungsanalysen Baden-Württemberg (IBBW), 3Universität Potsdam

Theoretischer Hintergrund

Weltweit werden die Ergebnisse groß angelegter nationaler und internationaler Schulleistungsuntersuchungen (Educational Large-Scale Assessments; LSAs) als Informationsgrundlage bei der Gestaltung von Bildungsprozessen herangezogen. LSAs können empirische Informationen darüber liefern, wie Schüler:innen im Vergleich zu Bildungsstandards abschneiden, ob es Unterschiede in den Kompetenzen zwischen verschiedenen Gruppen gibt und wie sich Testergebnisse im Laufe der Zeit verändern. Um ein valides Bild der schulischen Leistungen der Schüler:innen zu liefern und dazu eine breite Abdeckung der zu untersuchenden Fachgebiete sicherzustellen, dauern einige Untersuchungen insgesamt bis zu 90 Minuten (z.B. Mullis & Martin, 2013), zwei Stunden oder sogar länger (z.B. Becker et al., 2019; OECD, 2017).

Bei einer solchen, relativ langen Testdauer ist es wahrscheinlich, dass die Leistungen der Schüler:innen im Verlauf der Testdurchführung schwanken. Sogenannte Aufgaben-Positions-Effekte (Leary & Dorans, 1985) wurden nachgewiesen. Das bedeutet, dass Aufgaben umso schwieriger werden, je später sie im Test präsentiert werden (z.B. Hartig & Buchholz, 2012; Weirich et al., 2014). Diese Zunahme der Schwierigkeit spiegelt einen Leistungsabfall im Verlauf der Testdurchführung wider. Dieser kann aufgrund einer Zunahme von (a) falschen Antworten oder (b) Auslassungen von Antworten auftreten. Beide Gründe können unter anderem als Resultat nachlassender Anstrengungsbereitschaft betrachtet werden.

Fragestellung

In dieser Untersuchung gehen wir der Frage nach, inwiefern der Leistungsabfall im Verlauf eines LSAs durch selbstberichtete Anstrengungsbereitschaft (Effort, Skalen siehe Eklöf, 2010) erklärt werden kann und welchen Erklärungswert darüber hinaus die individuelle Neigung hat, Antworten auszulassen (Auslassungstendenz bzw. Omission Propensity). Auch stellt sich die Frage, inwiefern sich Anstrengungsbereitschaft und Auslassungstendenz im Testverlauf verändern und wie diese Veränderungen gegebenenfalls mit dem Leistungsabfall zusammenhängen.

Methoden

Mit Daten des IQB-Ländervergleichs 2012 wurde für N=24.075 Neuntklässler:innen in der Domäne Mathematik und N=19.107 in den Naturwissenschaften der Leistungsabfall innerhalb eines 120minütigen Tests untersucht. Mithilfe von Latent-Change-Score-Modellen (Klopack & Wickrama, 2020; McArdle & Nesselroade, 2014) wurde die Veränderung in der Testleistung mit der Veränderung in der Anstrengungsbereitschaft und der Veränderung der Auslassungstendenz über den Testverlauf in Beziehung gesetzt.

Ergebnisse und Diskussion

In beiden Domänen wurde ein deutlicher Leistungsabfall von der ersten zur zweiten Testhälfte gefunden sowie ein Abfall der selbstberichteten Anstrengungsbereitschaft und eine Zunahme des Auslassungstendenz über den Testverlauf. Ergebnisse der Latent-Change-Score-Modelle legen nahe, dass Anstrengungsbereitschaft zum ersten Messzeitpunkt in beiden Domänen mit dem Leistungsabfall zusammenhängt. Im Gegensatz zu den Naturwissenschaften wurde im Fach Mathematik jedoch kein statistisch signifikanter Vorhersageeffekt für die Veränderung der Anstrengungsbereitschaft im Testverlauf auf den Leistungsabfall beobachtet. Darüber hinaus schien die Anstrengungsbereitschaft nicht durch die die Auslassungstendenz vermittelt zu sein. Dies ist interessant, da Auslassungen in der Literatur gelegentlich als Indikator für Anstrengungsbereitschaft betrachtet werden, wohingegen unsere Ergebnisse eher für zwei zu trennende Konstrukte sprechen. Diese und weitere Ergebnisse werden im Vortrag präsentiert, diskutiert und hinsichtlich ihrer Relevanz für die Praxis eingeordnet.

 

Über die angemessene Behandlung von schnellem Rateverhalten am Beispiel von PISA 2018

Tobias Deribo1, Frank Goldhammer2, Ulf Kroehne1
1DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, 2DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation; Zentrum für internationale Bildungsvergleichsstudien (ZIB)

Schnelles Rateverhalten (Rapid Guessing) wurde für verschiedene kognitive Merkmalsbereiche (z.B., Silm et al., 2020) beobachtet und kann eine ernstzunehmende Gefahr für die Validität von Schlussfolgerungen auf Basis von Testergebnissen darstellen (Wise, 2019). Einer der geläufigsten Ansätze zum Umgang mit schnellem Rateverhalten ist das Effort Moderated IRT Modell (Wise & DeMars, 2006). Hierbei werden einzelne, schnellgeratene Antworten für die Fähigkeitsschätzung aus den Daten entfernt und dadurch als ignorierbar fehlend (Rubin, 1976) behandelt.

Jedoch konnte vorangegangene Forschung (Deribo et al., 2021) unter Zuhilfenahme des Mislevy-Wu Modelles (Mislevy & Wu, 1996) zeigen, dass die Annahme von entfernten, schnellgeratenen Antworten als ignorierbar fehlend nicht zwangsweise gegeben ist. Das Mislevy-Wu Modell ermöglicht es dabei, verschiedene Behandlungsmethoden von schnellgeratenen Antworten miteinander zu vergleichen und zu prüfen, ob die Behandlung von schnellgeratenen Antworten als ignorierbar fehlend für die Fähigkeitsschätzung haltbar ist. Die vorliegende Studie möchte dieses Verfahren nun auf die Daten der PISA 2018-Studie (OECD, 2018) anwenden. Dies erscheint relevant, da sich die Länder im Mechanismus, der zu schnellgeratenen Antworten führen kann, theoretisch unterscheiden können. Zudem erscheint es auch hilfreich um zu verstehen, wie unterschiedlichen Behandlungsmethoden sich auf die Ländervergleiche in PISA auswirken können. Die durch die unterschiedlichen Behandlungsansätze separat gewonnenen Item- und Personenparameter werden dabei über Haberman-Linking (Haberman, 2009) miteinander verbunden, um die Auswirkungen von verschiedenen Behandlungsmethoden auf hypothetische Ländervergleiche in PISA deutlich zu machen.

Mit Blick auf die Modellgüte (AIC, BIC) scheint das Mislevy-Wu Modell für alle Länder zu bevorzugen. Ebenso zeigte sich, unter Rückgriff auf Differenzen in der Gilula-Haberman-Penalty (Gilula & Haberman, 1995), in 86% aller Fälle eine beachtenswerte Differenz in der Modellgüte zwischen dem Mislevy-Wu Modell und der Behandlung als ignorierbar fehlend. Weiterhin variierten die Ländermittelwerte bei unterschiedlicher Behandlung von schnellem Rateverhalten deutlich. Diese Variation schlägt sich dabei in Unterschieden von ein bis drei Rangpositionen für über 50% der verglichenen Länder nieder.

Die Ergebnisse können zeigen, wie wichtig die reflektierte Auswahl eines Behandlungsansatzes für schnellgeratene Antworten ist. Dabei erscheint es wahrscheinlich, dass in Fällen, in denen das Mislevy-Wu Modell gilt, alternative Behandlungsmethoden zu verzerrten Kennwerten (z.B. Ländermittelwerten) führen können. Dabei werfen die Ergebnisse jedoch auch die Frage auf, inwieweit die Wahl eines bestimmten Behandlungsansatzes die Interpretation der gewonnenen Konstrukte (z.B. kognitiver Fähigkeit) beeinflussen kann und ob dieser Einfluss gewollt ist.

 

Leistungsemotionen im Vergleich zwischen papier- und computerbasierter Testung bei IGLU 2021

Christoph König1, Andreas Frey1, Frank Goldhammer2
1Goethe-Universität Frankfurt, 2DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation; Zentrum für internationale Bildungsvergleichsstudien (ZIB)

Theoretischer Hintergrund

Im Jahr 2021 wurde die Internationale Grundschul-Lese-Untersuchung (IGLU; McElvany et al., 2023) nicht mehr als papierbasiertes Assessment (PBA), sondern als computerbasiertes Assessment (CBA) administriert. Die damit verbundenen Änderungen in der Darbietung der Aufgaben und die unterschiedlichen Interaktionsmöglichkeiten mit dem Testmaterial können sich unter anderem auf das emotionale Testerleben der untersuchten Schülerinnen und Schüler auswirken. Gemäß der Kontroll-Wert-Theorie der Leistungsemotionen (Pekrun, 2006) beeinflussen individuelle Bewertungen von Testsituationen die Ausbildung emotionaler Reaktionen. Konkret postuliert sie als zentrale Annahme, dass Leistungsemotionen aus dem Zusammenwirken der Bewertung von Leistungssituationen im Hinblick auf Kontrolle und Wert zustande kommen. Obgleich zahlreiche Studien Bezug auf die Kontroll-Wert-Theorie nehmen, wurde diese zentrale Annahme bisher erst in vereinzelten Studien geprüft (Bieg et al., 2013; Goetz et al., 2010; Putwain et al., 2018; Shao et al., 2020).

Fragestellungen

Die vorgestellte Studie prüft die zentrale Annahme der Kontroll-Wert-Theorie und untersucht, darauf aufbauend, Effekte des Wechsels von PBA zu CBA bei IGLU 2021. Folgende Fragestellungen werden beantwortet:

1. Finden sich die seitens der Kontroll-Wert-Theorie postulierten Zusammenhänge zwischen kognitiven Bewertungen und Emotionen bei Schülerinnen und Schülern vierter Klassen?

2. Hat der Testmodus (PBA oder CBA) einen Einfluss auf das emotionale Erleben der IGLU-Testsituation im Hinblick auf Freude, Langeweile und Angst?

3. Welchen Einfluss hat das Zusammenwirken von Kontrolle, Wert, Freude, Langeweile und Angst auf die gemessene Leseleistung?

Methode

Die genannten Fragestellungen werden anhand von Daten von Schülerinnen und Schülern am Ende der vierten Klasse aus Deutschland beantwortet, die im Rahmen von IGLU 2021 an der „Brückenstudie“ teilgenommen haben. Dabei erhielten nPBA = 538 PBA und nCBA = 1079 CBA mit randomisierter Gruppenzuweisung. Die Erhebung der Leistungsemotionen Freude (3 Items), Langeweile (2 Items) und Angst (4 Items) erfolgte mit einer adaptierten, domänenspezifischen Kurzversion des AEQ-ES (Lichtenfeld et al., 2012). Kontrolle und Wert wurden jeweils mit einem Item im Selbstbericht gemessen. Zur Beantwortung der ersten Fragestellungen wurde eine Pfadanalyse geschätzt. Die Beantwortung der zweiten Fragestellung basierte auf Mittelwertvergleichen zwischen PBA und CBA. Die dritte Fragestellung wurde wiederum mittels Pfadanalyse mit Plausible Values für Lesen beantwortet. Die Pfadanalysen wurden jeweils mit der Gesamtstichprobe durchgeführt. Bei sämtlichen Analysen wurde die komplexe Stichprobenstruktur von IGLU 2021 durch die Nutzung des R-Pakets BIFIEsurvey (Robitzsch & Oberwimmer, 2022) beachtet.

Ergebnisse

Die Interkorrelationen der drei Emotionsskalen sind größtenteils vereinbar mit den Annahmen der Kontroll-Wert-Theorie. Entsprechend fanden viele aus der Kontroll-Wert-Theorie abgeleitete Hypothesen empirische Unterstützung; einzelne Hypothesen waren jedoch auch zu verwerfen. Hinsichtlich Fragestellung 2 ergab sich eine tendenziell größere Freude (d = 0.146, p = .067) und eine tendenziell größere Angst (d = 0.101, p = .098) bei CBA als bei PBA und kein signifikanter Unterschied bezüglich Langeweile (d = 0.113, p = .135). Im Hinblick auf Fragestellung 3 ergab sich ein signifikant positiver Gesamteffekt von Kontrolle auf Leseleistung (d = 0.315, p = .012), der insbesondere über Angst mediiert wurde.

Diskussion

Die festgestellten Effekte sind relativ klein, womit nicht von substantiellen Verbesserungen des Testerlebens durch die Einführung von CBA auszugehen ist. Zudem finden sich die von der Kontroll-Wert-Theorie postulierten Zusammenhänge nicht zuverlässig, vor allem hinsichtlich Wert und Angst. Dies widerspricht nur bedingt der bestehenden Befundlage, da auch andere Studien von Abweichungen von den postulierten Zusammenhängen berichten. Aus dem signifikanten Effekt der Kontrolle auf die Leseleistung lässt sich schließen, dass Testsituationen und –eigenschaften insbesondere darauf ausgerichtet werden sollten, dass Tests nach Möglichkeit von allen Getesteten als kontrollierbar wahrgenommen werden. Vor dem Hintergrund der Ergebnisse zum Ability-Difficulty-Fit (Asseburg & Frey, 2013) kann dies durch die Vorgabe von Items mit individuell angemessener Schwierigkeit erzielt werden.

 
Datum: Mittwoch, 20.03.2024
9:00 - 10:407-04: Augmented Reality for Learning and Instruction – Theory-based Research Beyond Media Comparisons
Ort: H02
 
Symposium

Augmented Reality for Learning and Instruction – Theory-based Research Beyond Media Comparisons

Chair(s): Jule M. Krüger (Universität Potsdam, Digitale Bildung), Kristin Altmeyer (Universität des Saarlandes, Empirische Bildungsforschung)

Diskutant*in(nen): Josef Buchner (Pädagogische Hochschule St.Gallen, Institut Digitale und Informatische Bildung)

Augmented reality (AR) is a form of information presentation that includes the combination of virtual and physical elements. The integration of these types of representations can be implemented in unique educational experiences to effectively elicit and support learning processes and lead to improved learning outcomes. With a technological focus, Azuma and colleagues (2001) identified three key features of AR technology as 1) the integration of real and virtual elements, 2) real-time interactivity, and 3) 3D registration. For instructional design, AR systems allow for the integration of instructionally relevant virtual data into physical, real-world environments. For example, instructional information can be embedded into corresponding real-world settings, and authentic 3D models can be embedded into instructional settings. From a learner-based perspective, AR thus allows for an integrated perception of virtual and physical elements for a contextualised experience in physical space, including interaction with combined physical-virtual materials (Krüger et al., 2019).

In recent years, research on AR for learning and instruction has increased a lot due to the technological developments in this area, such as devices for mobile AR. In general, positive effects on cognitive, affective, and behavioural learning outcomes have been identified of AR in comparison to other types of learning experiences and material (Chang et al., 2022; Malone et al., 2023). In a recent systematic review, Buchner and Kerres (2023) found that 80% of studies on AR in education published in the top twelve journals on educational technologies until 2020 use a media-comparison approach. However, this technology-centred approach has been widely criticized concerning its narrow view on instructional design, methodologically flawed research designs, and limited gain in scientific insights. Recently, it has been observed that there is a growing tendency to employ an expanding array of novel study designs to examine the underlying mechanisms that determine the effects of AR. A goal of this symposium is to bring together research from different labs that goes beyond the mere comparison of AR with other forms of information presentation. In line with the suggestions by Buchner and Kerres (2023), these alternative research approaches include value-added designs, which compare different versions of an AR-based learning experience, and learner-treatment-interaction designs, which examine the influence of learner characteristics on learning with AR.

Therefore, the general research question for this symposium does not focus on “if” AR can be used to effectively support learning and instruction but considers the “how” and the “when” of this question.

In the first contribution, a value-added study describes the evaluation of different AR application designs with multiple external representations in physics lab work based on the Cognitive Theory of Multimedia Learning and Cognitive Load Theory.

In the second contribution, a value-added study draws on situated learning to examine the influence of contextualising a learning experience in the medical field, without changing the AR application itself.

The third contribution reviews existing literature and defines a research gap concerning the consideration of learner differences as moderators in research on AR in education and thus the lack of learner-treatment-interaction study designs in the literature.

The fourth contribution explores learner characteristics in interaction with a value-added design on AR-based information placement on corresponding local trees in a setting in nature.

The contributions describe different approaches and insights that can bring the research field closer towards better understanding the how and when of learning and instruction in AR. The discussion of the symposium will focus on the opportunities and challenges in current research on AR in education, discussing the future directions of methods and design in and development of a framework for meaningful educational AR research.

 

Beiträge des Symposiums

 

Augmented Reality for Visualizing Scientific Models in Physics Lab Work: The Role of (Multiple) Representations

Kristin Altmeyer1, Peter Edelsbrunner2, Barbara Gränz3, Sarah Hofer4, Christoph Hoyer5, Jochen Kuhn5, Zoya Kozlova4, Stefan Küchemann5, Andreas Lichtenberger3, Sarah Malone1, Roman Schmid3, Ralph Schumacher2, Bermann Steinmacher3, Elsbeth Stern2, Andreas Vaterlaus3, Max Warkentin5, Roland Brünken1
1Universität des Saarlandes, Empirische Bildungsforschung, 2ETH Zürich, Lehr- und Lernforschung, 3ETH Zürich, Physik und Ausbildung, 4LMU München, Lehr- und Lernforschung, 5LMU München, Didaktik der Physik

Theoretical Background

Visual-graphic representations of scientific models can support students by visualizing the invisible foundations of observations during scientific experimentation (Olympiou et al., 2013). However, these models are usually shown spatially and temporally separated from observed phenomena (e.g., on a worksheet handed out after lab work), which hampers conceptual understanding (Schroeder & Cenki, 2018). In accordance with the Cognitive Theory of Multimedia Learning (Mayer, 2014) and the Cognitive Load Theory (Sweller, 1998), Augmented Reality (AR) offers the potential to address this issue by enabling the real-time presentation of virtual models in close proximity and adaptive to corresponding real-world phenomena. This resulting contiguity of information can contribute to a reduction in learning-irrelevant cognitive load and improved learning outcomes (Buchner et al., 2021), particularly in the context of physics lab work (e.g., Altmeyer et al., 2020).

Research Objectives

The objective of the present study was to investigate a newly-developed AR-supported experimental learning set-up in which electromagnetic phenomena are superimposed with virtual representations of vector field models (Donhauser et al., 2020). While extensive research has explored the presentation of (graphical) representations in traditional multimedia learning environments (e.g., Rau et al., 2015), the reasonable selection of AR-based representations in lab work settings requires further investigation. Therefore, the current study compares different virtual (multiple) representations in AR to examine their impact on cognitive load and conceptual knowledge acquisition. Indications for the design of effective AR learning environments will be derived.

Method

N=75 students (47% female, Mage=17.02, SD=1.22) participated in the study. In the first part of the study, all students were presented with a learning video, then they completed a representational competence test (covariate, 31 items adapted from Küchemann et al., 2021; α=.89/ ω=.90), watched a second learning video, and completed a pre-test of conceptual knowledge (14 items adapted from Küchemann et al., 2021; α=.90/ ω=.90). The second part of the study occurred within a two-day interval. Applying a between-subjects design, participants were randomly allocated to seven groups. The students conducted five experiments on the Lorentz force while utilizing AR-smartglasses. Depending on their respective group, they were presented with distinct virtual representations including vector fields, field lines, and a tripod, or with any combination of these representations. Finally, the participants completed a cognitive load questionnaire (Thees et al., 2021; 3 items per dimension, α/ω=.46-.96), a post-test of conceptual knowledge (α=.93/ ω=.94), and a usability questionnaire (Brooke, 1996).

Results

Usability across all AR conditions was rated as "good" (Bangor et al., 2009) with very minor and non-significant differences between groups (F(6, 70)=1.54, p>.05). Qualitative feedback indicates that students derived enjoyment from their AR-supported experiments, yet they highlighted opportunities for enhancing the design of virtual representations and reducing the complexity of AR-interaction. Regarding cognitive load (F(18, 184.33)=1.06, η²=.07) and also conceptual knowledge acquisition (F(7, 78)=1.66, η²g=.13), there were minimal and non-significant differences between the AR groups (p>.05). An exploratory analysis unveiled that groups employing the vector tripod either individually or in conjunction with other virtual representations demonstrated more substantial gains in conceptual knowledge acquisition, as opposed to those without access to the tripod (F(1, 84)=3.66, η²g=.08).

To summarize, the findings suggest that all representational iterations of the newly-developed AR-based experimental learning environment hold promise for supporting the acquisition of conceptual knowledge, with the vector tripod being the most helpful representation. Providing various instead of single virtual representations did not appear to foster or impede conceptual knowledge acquisition. Future research will investigate whether engaging with diverse representations promotes the development of representational competence. Planned subsequent research endeavors will also analyze AR-interactions and eye movements to refine the learning environment and gain further insights into AR-enhanced science education.

 

The Impact of Narrative and Physical Contextualisation on Situated Learning in Augmented Reality

Kevin Palzer1, Jule Krüger2, Daniel Bodemer1
1Universität Duisburg-Essen, Psychologische Forschungsmethoden – Medienbasierte Wissenskonstruktion, 2Universität Potsdam, Digitale Bildung

Theory

Situated learning is recognised as a valuable pedagogical approach for augmented reality (AR) environments (Garzón et al., 2020). Situated cognition, as described by Brown et al. (1989), proposes an inherent connection of learning and its context, distinguishing between school and application context, and Young (1993) suggests situating learning in real-world environments. In combining virtual elements and physical environments, AR can contextualise learning in authentic environments and bring authentic artefacts into instruction (Bower et al., 2014). By embedding learning in a corresponding physical context, AR-based contextuality can support the mental connection and integration of virtual and physical elements (Krüger et al., 2019). This integration can elicit context immersion (Kim, 2013). In order to further support Immersion, a narrative (Nilsson et al., 2016; Reid et al., 2005) and physical artefacts (Reid, 2008) can be used, where narrative and artefacts should be strongly coupled (Georgiou & Kyza, 2021). In the current study, we examine how these factors can induce perceived contextuality in AR and how they might impact learning processes and outcomes. We expect that adding a contextualising physical artefact and application-focused narrative leads to increased perceived contextuality, enjoyment and knowledge. Furthermore, we explore the impact of contextualisation on workload.

Method

A laboratory study was conducted in an experimental 2×2 between-subjects design with narrative (educational vs. application) and physical contextualisation (physical artefact present vs. absent) as factors in a value-added study (see Buchner & Kerres, 2023). N = 40 participants between 18 and 32 years (M = 23.50, SD = 3.52), 24 female and 15 male, were evenly distributed into the four conditions. The topic of the human digestive system was introduced with the narrative describing either an educational (university course) or an application context (medical internship). The AR application on a Microsoft Hololens 2 showed a virtual 3D model of the digestive system, either on its own (physical artefact absent) or projected onto a person (physical artefact present). After the learning phase, participants answered the NASA TLX for workload (Hart, 2006), a scale on intrinsic motivation with a subscale on enjoyment (Wilde et al., 2009) and the ARcis Questionnaire for contextuality (Krüger & Bodemer, 2022). Afterwards, a knowledge test on naming the digestive system components was administered.

Results

The data were analysed with 2×2 ANOVAs. Concerning perceived contextuality, we only found a main effect of physical artefact, with higher contextuality for present artefact, F(1,36) = 14.88, p < .001, ω² = 0.26. Regarding enjoyment, we only found a main effect of narrative, showing increased enjoyment in the application narrative, F(1,36) = 4.60, p = .039, ω² = 0.08. For knowledge, we found a main effect of narrative, F(1,36) = 5.15, p = .029, ω² = 0.09, and an interaction effect, F(1,36) = 4.48, p = .041, ω² = 0.08: highest knowledge in the application narrative with no artefact, and lowest knowledge in the education narrative with no artefact. The explorative analyses of workload (NASA TLX) only showed a main effect of physical contextualisation on frustration, with increased frustration for present artefact, F(1,36) = 4.70, p = .037, ω² = 0.09.

Discussion

We found that a physical artefact in AR facilitated perceived contextuality, in accordance with the ARcis framework (Krüger et al., 2019). Using an application narrative increased enjoyment and knowledge, but the effect on knowledge was diminished by the physical artefact. This might be explained by the increase in learners' frustration, which was unexpected, but may be attributable to the presence of another person as a social stressor leading to increased anxiety and arousal (Kushnir, 1986). More research is necessary, but this study describes first indications of the impact of contextualisation in AR on affective and cognitive variables.

 

AR Glasses in the Classroom with no Human Learner Behind? A Systematic Literature Review

Zoya Kozlova, Sarah Hofer
LMU München, Lehr- und Lernforschung

Theoretical Background

According to Steffen (2019), most of the activities which augmented reality (AR) enables are either impossible to carry out in the physical world due to the physical laws (e.g., seeing the entire solar system while sitting in the classroom) or too dangerous or inconvenient to perform (e.g., asking a novice surgeon to do a training surgery on a real patient). These two key affordances make AR well-suited for use in STEM subjects teaching, e.g., conducting dangerous experiments in chemistry or visualizing normally invisible magnetic fields. At the same time, affordances as a term of ecological psychology are seen more as a concept defining relations between the environment and the organism (Chemero, 2003). Namely, the environment affords behavior to the organism, so affordances are relations between the abilities of organisms and features of the environment. Affordances of AR then can only be fully exploited when being attributed to a certain organism with specific characteristics.

Research Question

This brought us to evaluate to which extent AR affordances consider the learner as the organism in recent studies. In other words, we seek to explore to which extent the research into the use of AR in STEM education considers the learner characteristics and learning outcomes.

Method

In a systematic review, we derived 667 studies from the two databases Scopus and Web of Science. In our search we used the terms “augmented reality”, “augmenting reality”, and “mixed reality”, coupled with “learning”, “education”, “training”, “teaching”, and “instruction” for the period of 2013-2022. In the first selection phase, we excluded studies done in non-STEM subjects (e.g., art). In the second phase, we identified the studies that examine learner characteristics together with the learning outcomes. We categorized the studies based on the knowledge outcome (declarative and procedural knowledge and the associated cognitive processes – reproduce, transfer, produce), individual characteristics, e.g., spatial ability, prior knowledge, and the AR affordances, e.g., delivering learning content in a 3D perspective, visualizing the invisible etc. In the end, only 24 studies satisfying our inclusion criteria were distinguished.

Results

Apart from the small proportion of the studies addressing individual characteristics (less than 5%), another interesting finding suggests that spatial ability and prior knowledge are the most explored individual characteristics in AR research (9 studies for spatial ability and 2 for prior knowledge). In terms of the learning outcomes, only 21% of the studies tackled procedural knowledge outcomes. The main focus was on reproduction and transfer of declarative knowledge (88% for reproduction and 54% for transfer). The most used AR affordance was presenting learning content in a 3D perspective (21 out of 24 studies).

Discussion

At present, AR technology seems to be seen as a universal tool, suitable for all learners, without sufficient consideration of their unique individual differences. The existing research on individual differences in AR sparkles numerous questions that are yet to be fully explored. For instance, it is still questionable, whether or not AR has a compensatory effect for the students with lower spatial ability or whether higher spatial ability serve as an enhancer in AR learning environment. Other important learner characteristics, such as working memory capacity, have hardly been investigated in AR learning. The findings of this review help to define the future research agenda for AR.

 

Augmented reality in nature: an exploratory study on the placement of learning content and the impact of learner characteristics

Jule Krüger
Universität Potsdam, Digitale Bildung

Theory

In augmented reality (AR), virtual and physical elements can be combined and presented integrated into one view, which enables the contextualisation of interactive and spatial virtual representations in authentic physical environments without changing the physical surroundings themselves. For example, a natural environment can be enriched by virtual information designed for the purpose of achieving specific learning objectives. This goal-oriented embedding of virtual information in an associated physical environment leverages the AR-specific property of contextuality (see Krüger et al., 2019). This placement of information within a real-world context can play a role in authentic experience, enjoyment, and learning (Bower et al., 2014; Harley et al., 2016; Kamarainen et al., 2013), influencing immersion, motivation, and learning processes (Georgiou & Kyza, 2021; Sylaiou et al., 2010; Weerasinghe et al., 2022). The current study further explores the role of the exact positioning of virtual information in an AR application in nature on cognitive and affective factors, behaviour, and learning outcomes. Placement of instructional information closer to corresponding physical objects is expected to lead to improved cognitive load, presence, positive emotions, knowledge, and different behaviours. Potential moderations of learner characteristics are explored.

Method

In a two-group design, the study took place outside in nature. N = 18 participants, 18 to 33 years old (M = 22.67, SD = 4.35), 16 female, 3 male, were distributed evenly (near vs. far condition). A prior knowledge test and task expectancy questions (Wigfield & Eccles, 2000) were administered. In the learning phase, participants retrieved marker-based information on plants in the environment with a tablet-based AR application, with markers either anchored to corresponding plants (near) or placed further away (far). Cognitive load was measured with a questionnaire (Klepsch et al., 2017), presence with the AR immersion scale (Georgiou & Kyza, 2017), positive emotions with the short Achievement Emotions Questionnaire (Bieleke et al., 2021), and behaviour with self-designed questions. Afterwards, a knowledge test was administered, and the participants were interviewed on their experience.

Results

A mixed 2×2 ANOVA on prior and resulting tree name knowledge showed a positive main effect of time, F(1,16) = 45.90, p < .001, and an interaction effect, F(1,16) = 6.88, p = .018, with a larger increase for near than far placement. Far compared to near placement led learners to look into the environment less often, t(15.52) = 2.48, p = .025, which is also in accordance with the interview data, describing that participants with near placement compared the tablet-based information and the plants. Concerning other variables, no effects of group but significant moderation effects were detected. Only for low and not high prior knowledge learners germane cognitive load, t(14) = 2.50, p = .025, and pride, t(14) = 2.59, p = .021, increased for near placement. Further, only for low and not high task expectancy learners, germane cognitive load, t(14) = 2.30, p = .037, presence, t(14) = 4.14, p = .001, and pride, t(14) = 2.76, p = .015, increased for near placement.

Discussion

The data suggest that proximity of the plants led to a larger increase in tree-specific knowledge and caused implicit bottom-up or stimulus-driven attentional control (see Egeth & Yantis, 1997) towards the plants. Learning scenarios in which virtual and physical elements are to be integrated into a coherent mental model might profit from this. The effect on other factors were contingent on learners’ characteristics, with more positive effects when prior knowledge and expectancy were low. The results in this study support the necessity to examine specific design decisions and their interaction with learner characteristics in AR. Future studies with bigger samples can build on the results of this exploratory study.

 
11:10 - 12:508-04: Lehren und Lernen in heterogenen Schulklassen
Ort: H02
 
Symposium

Lehren und Lernen in heterogenen Schulklassen

Chair(s): Camilla Rjosk (Universität Potsdam), Georg Lorenz (Universität Potsdam, Universität Leipzig)

Diskutant*in(nen): Axinja Hachfeld (Universität Konstanz)

Theoretischer Hintergrund

Wie mit wachsender Heterogenität der Schüler:innen in Bildungseinrichtungen umzugehen ist, um individuelle Entwicklung und gesellschaftlichen Zusammenhalt zu fördern, ist eine der zentralen Fragen unserer Zeit. Entwicklungen wie der gestiegene Anteil von Schüler:innen mit Zuwanderungshintergrund und die inklusive Beschulung von Heranwachsenden mit sonderpädagogischem Förderbedarf (SPF) haben die Relevanz des Themas in der Bildungspraxis erhöht (Gräsel, Decristan & König, 2017).

Heterogenität beschreibt die Unterschiedlichkeit der Schüler:innen hinsichtlich verschiedener lernrelevanter Merkmale. Zentrale Heterogenitätsdimensionen sind u.a. Leistungsniveau, sozioökonomischer Status, Zuwanderungshintergrund, Mehrsprachigkeit, SPF und Geschlecht (Vock & Gronostaj, 2017).

In der Bildungsforschung existiert eine Reihe von Annahmen dazu, wie sich die Heterogenität im Klassenzimmer auf das Lernen, d.h. Schüler:innenleistung sowie motivationale und psychosoziale Merkmale, auswirken könnte. Diese verweisen teils auf gegensätzliche Effekte und beziehen sich vor allem a) auf Peerprozesse und b) Merkmale und Verhaltensweisen der Lehrpersonen sowie Unterrichtsmerkmale.

Bezüglich der Peerprozesse werden u.a. Vorteile des Lernens in heterogenen Gruppen angenommen, dadurch dass Schüler:innen von Rollenmodelle lernen können (vgl. Bandura, 1971), sich gegenseitig beim Lernen Hilfestellungen geben können (vgl. Kuzmina & Ivanova, 2018) und Schüler:innen mehr Offenheit für den Kontakt mit Personen unterschiedlicher Hintergründe entwickeln (vgl. Allport, 1954). Diesen positiven Effekten könnte jedoch eine Separierung aufgrund von Homophilietendenzen entgegenwirken: Da Personen dazu neigen, Verbindungen mit ihnen ähnlichen Menschen einzugehen (McPherson et al., 2001), könnte Heterogenität in Schulklassen mit geringerem Klassenzusammenhalt, weniger Interaktionen und vermehrten Konflikten einhergehen (Blalock, 1967; Putnam, 2007).

Bezüglich der Merkmale von Lehrkräften und Unterricht wird angenommen, dass Lehrkräfte das Unterrichten als belastend wahrnehmen (z.B. Glock et al., 2019), was ihren Unterricht nachteilig beeinflussen könnte. Das Unterrichten in heterogenen Klassen sei zudem erschwert, da die Anpassung u.a. von Lehrmaterial und Unterrichtsgeschwindigkeit (z.B. Evertson et al., 1981) sowie die emotionale und lernbezogene Unterstützung aller Schüler:innen komplexer ist (Lavy et al., 2011). Gelänge es jedoch durch entsprechende Unterrichtsmethoden wie Differenzierung und Gruppenarbeiten (Lavrijsen et al., 2022; Werning & Avci-Werning, 2015) die angenommenen positiven Peerprozesse für das Lernen nutzbar zu machen, führt das zu Vorhersage positiver Lerneffekte.

Insgesamt ist die Befundlage zur Bedeutung von Heterogenität für das Lehren und Lernen uneinheitlich (vgl. z.B. Rjosk, 2022; Rucinski, 2022). Eine Ursache könnte das unvollständige Wissen über die zugrundliegenden, teilweise gegensätzlichen Prozesse, sein, die bislang nur vereinzelt untersucht wurden (z. B. Unterrichtsgestaltung, siehe Decristan et al., 2017; Lavrijsen et al., 2022).

Ziel des Symposiums

Das vorgeschlagene Symposium trägt aktuelle Erkenntnisse zu den Prozessen von Heterogenitätseffekten auf das Lernen und Lehren in Schulklassen zusammen und berücksichtigt explizit verschiedene Heterogenitätsdimensionen, um den Forschungsstand zu diesem Thema zu erweitern. Die Beiträge fokussieren dabei Peer-Interaktionen, Lehrkraft-Schüler:in-Interaktionen und Unterrichtsmerkmale in unterschiedlich heterogen zusammengesetzten Schulklassen.

Beiträge

Das Symposium besteht aus vier Beiträgen, von denen die ersten beiden stärker Peerprozesse und die letzten beiden stärker die Lehrperson und Unterrichtsmerkmale fokussieren. Der erste Beitrag nimmt durch Inklusion erzeugte Heterogenität in den Blick und untersucht Peer-Interaktionen von Heranwachsenden in inklusiven Klassen. Der zweite Beitrag bezieht sich auf Mehrsprachigkeit als Heterogenitätsdimension und untersucht, inwiefern sich durch Kleingruppenarbeit die Nutzung von unterschiedlichen Familiensprachen als Ressource im Unterricht erhöht. Der dritte Beitrag nimmt multikulturelle Klassenzimmer in den Blick und fokussiert die Beziehungsqualität zwischen Schüler:innen und Lehrkräften in Abhängigkeit des Migrationshintergrunds der Schüler:innen. Der vierte Beitrag berücksichtigt Heterogenität im Klassenzimmer in einem multidimensionalen Ansatz, der Leistung, sozioökonomischen sowie ethnischen Hintergrund umfasst und untersucht, wie diese Heterogenität mit der Belastung von Lehrkräften sowie mit Unterrichtsmerkmalen zusammenhängt.

Die Beiträge nehmen insgesamt somit verschiedene in der Literatur zentral diskutierte Prozesse in heterogenen Klassenzimmern in den Blick. In der abschließenden Gesamtdiskussion werden Bedingungen und Ansätze zur positiven Gestaltung des Lehrens und Lernens in heterogenen Klassen zusammenfassend diskutiert.

 

Beiträge des Symposiums

 

Inklusion auf dem Pausenhof: Eine empirische Untersuchung von Profilen der Peer-Interaktion und ihren Korrelaten

Hannah Decker1, Katja Scharenberg2, Sebastian Röhl3
1Pädagogische Hochschule Freiburg, 2LMU München, 3Eberhard Karls Universität Tübingen

Theoretischer Hintergrund und Fragestellung

In inklusiven Schulklassen begegnen sich Schüler:innen mit unterschiedlichen soziokulturellen und leistungsbezogenen Ausgangsbedingungen sowie Schüler:innen mit und ohne sonderpädagogischem Förderbedarf (SPF). Schulische Inklusion impliziert neben Zugang zu gleichen Bildungseinrichtungen auch die gleichberechtigte soziale Partizipation im Sinne der Wahrnehmung, Akzeptanz und Eingebundenheit aller Schüler:innen (Booth & Ainscow, 2003; Werning, 2014). Damit ist auch die Teilhabe an sozialen Interaktionen mit der Schulklasse bedeutsam für eine gelingende Inklusion (KMK, 2011). Verschiedene Studien wiesen jedoch wiederholt auf soziale Ausgrenzungen von Schüler:innen mit SPF in inklusiven Schulklassen hin (z.B. Frostad & Pijl, 2007; Koster et al., 2010). Entsprechende Forschungsarbeiten fokussierten dabei mehrheitlich Schulklassen als soziale Interaktionskontexte, die die sozialen Interaktionen zwischen Schüler:innen rahmen und aufgrund ihrer hohen Dauerhaftigkeit und gegenseitigen Abhängigkeit beeinflussen (Breidenstein, 2008; Herzog, 2011). Während unterrichtliche Interaktionen zwischen Schüler:innen vielfach durch Lehrkräfte vorstrukturiert sind, bestehen auf dem Pausenhof autonomere Interaktionsmuster und -dynamiken: Im Umgang mit Peers können sich durch eigenverantwortete Normen, Hierarchien und Verhaltensmuster Substrukturen herausbilden oder hierarchische soziale Positionen verfestigen (Bennewitz et al., 2016; Oswald & Krappmann, 2004). Hier setzt unser Beitrag an, indem anhand eines explorativen Verfahrens Profile der außerunterrichtlichen Peerinteraktion identifiziert, charakterisiert und schließlich hinsichtlich verschiedener Korrelate des schulischen Lern- und Entwicklungskontextes untersucht werden.

Unser Beitrag verfolgt folgende Fragestellungen:

1. Welche Profile der Peer-Interaktion lassen sich in inklusiven Schulklassen identifizieren und charakterisieren?

2. Inwiefern unterscheiden sich die Profile hinsichtlich ihrer soziodemografischen Zusammensetzung?

3. Inwiefern unterscheiden sich die Profile hinsichtlich der kognitiven Fähigkeiten, Schulzufriedenheit und des akademischen Selbstkonzepts der Schüler:innen?

4. Inwiefern unterscheiden sich die Profile hinsichtlich der selbstwahrgenommenen sozialen Partizipation der Schüler:innen?

Methode

Datengrundlage ist eine repräsentative Stichprobe mit n=821 Schüler:innen (davon n=111 mit SPF) aus 52 inklusiven Schulklassen (Jahrgangsstufen 5–7) an 22 Gemeinschaftsschulen in Baden-Württemberg.

Die Pausenhofinteraktion wurde über ein Ratingverfahren zur Interaktionshäufigkeit mit den Mitschüler:innen (Frostad & Pijl, 2007) erfasst. Mittels latenter Profilanalysen (R-Paket tidyLPA; Rosenberg et al., 2018) wurden verschiedene Profile der Peer-Interaktion identifiziert. Zu deren Charakterisierung mittels univariater Varianzanalysen wurden die soziale Herkunft (HISEI; Ganzeboom & Treiman, 2003), kognitive Fähigkeit (KFT 4-12+R; Heller & Perleth, 2000), das Geschlecht und der Migrationsstatus (häuslicher Sprachgebrauch) herangezogen. Als weitere Korrelate der Peer-Interaktionen wurden die Schulzufriedenheit (Kelly, 2003), das akademische Selbstkonzept (Marsh, 1990) sowie die selbstwahrgenommene soziale Partizipation (Koster et al., 2009) erfasst. Fehlende Werte wurden unter Berücksichtigung der genesteten Datenstruktur (Grund et al., 2019; van Buuren et al., 2006) imputiert (R-Package mice; van Buuren et al., 2011).

Ergebnisse

Die latenten Profilanalysen ergaben fünf distinkte Interaktionsprofile, die sich hinsichtlich der Bewertungsmuster (positiv, neutral, negativ) der Peer-Interaktionen unterschieden. Die Varianzanalyse belegte für den SPF einen signifikanten Haupteffekt (F(1)=11.35; p=0.001). Der Anteil der Schüler:innen mit SPF im ersten Interaktionsprofil (ungünstigstes Bewertungsmuster) war dabei mit 37 % besonders hoch.

Es bestanden keine signifikanten Unterschiede zwischen den Interaktionsprofilen hinsichtlich des Geschlechts, Migrationshintergrunds und der sozialen Herkunft (jeweils p>.05).

Die Varianzanalyse zeigte jedoch signifikante Haupteffekte für die kognitiven Fähigkeiten (F(1,628379)=5.62, p=0.018) v.a. zuungunsten der Schüler:innen im ungünstigsten Interaktionsprofil (p<.05).

Schüler:innen mit höherer sozialer Präferenz im Klassenverband wiesen zudem eine höhere Schulzufriedenheit auf (F(1,547798)=9.00, p=0.003). Beim akademischen Selbstkonzept zeichneten sich nur tendenzielle Unterschiede ab (F(1,359850)=3.63, p=0.057).

Die Profilcharakterisierung ergab schließlich eine signifikant höhere selbstwahrgenommene Eingebundenheit in die Pausenhofinteraktionen bei einem günstigeren Peer-Interaktionsrating (F(1, 1.104518E+29)=87.59, p<0.001).

Diskussion

Die Befunde reihen sich einerseits in die empirische Befundlage ein, wonach Schüler:innen mit SPF verglichen mit jenen ohne SPF weniger beliebt, im Klassenverband weniger akzeptiert sind und auch in Peer-Ratingverfahren niedrigere Bewertungen erhalten (z.B. Frostad & Pijl, 2007; Schwab, 2016). Zudem bestand eine weitgehende Übereinstimmung der Selbst- und Fremdwahrnehmung der sozialen Partizipation. Andererseits zeigten sich auch schulart- und altersspezifische Besonderheiten, die auf ein Potenzial von Gemeinschaftsschulen hindeuten und die bisherige Forschungslage um schulpraktisch relevante Erkenntnisse erweitern.

 

Worauf kommt es beim Angebot zur Nutzung von Familiensprachen an?

Valentina Reitenbach1, Jasmin Decristan1, Dominique Rauch2, Katharina Maria Schneider3, Victoria Bertram4
1Bergische Universität Wuppertal, 2Pädagogische Hochschule Ludwigsburg, DIPF I Leibniz-Institut für Bildungsforschung und Bildungsinformation, 3Pädagogische Hochschule Ludwigsburg, 4DIPF I Leibniz-Institut für Bildungsforschung und Bildungsinformation, Goethe-Universität Frankfurt

Aus einer kognitiv- bzw. kommunikationsorientierten Perspektive, im Sinne einer Nutzung des gesamtsprachlichen Potenzials für schulisches Lernen (García 2009), ist der Einbezug der Familiensprachen mehrsprachiger Schüler:innen im Unterricht grundlegend. Es nutzen allerdings bei Weitem nicht alle Schüler:innen ihre Familiensprachen als kommunikative Ressource, auch wenn sie ein explizites Angebot dazu erhalten (Meyer & Prediger, 2011). Aus Grosjeans (2020) Theorie zu den Sprachmodi bilingualer Sprecher:innen lassen sich für die (Nicht-)Nutzung des Sprachrepertoires drei übergeordnete Faktoren ableiten: das Individuum selbst (Kompetenzen, Nutzen, Affinität), die Sprachpartner:innen (Kompetenzen, Nutzen, Affinität) und der Unterrichtskontext (z.B. Klassengespräch vs. Kleingruppenarbeit; Deutschunterricht vs. Fremdsprachenunterricht). Diese drei Faktoren zeigen sich empirisch in Selbstberichten von Lernenden (z.B. Binanzer & Jessen, 2020; Reitenbach et al., 2023; Schastak et al., 2017). Insgesamt findet sich hierzu jedoch wenig Evidenz für den Unterrichtskontext. Vor allem die relative Bedeutung der Gründe für die Nutzung von Familiensprachen ist nicht hinreichend empirisch untersucht. Daher wird in diesem Beitrag anhand von Daten aus einer Interventionsstudie untersucht,

(1) welche Gründe die Wahrscheinlichkeit für eine Nutzung von Familiensprachen erhöhen und

(2) inwiefern sich diese in ihrer Vorhersagekraft unterscheiden.

Die Daten stammen aus einer Interventionsstudie zur Leseförderung im Deutschunterricht an Grundschulen. Vor der Intervention besuchten die Lehrkräfte an drei Nachmittagen eine Fortbildung zu den Themen Reziprokes Lehren (Rosenshine & Meister, 1994) in Kleingruppen und Mehrsprachigkeit im Unterricht. Anschließend setzten die Lehrkräfte die Inhalte in ihrem Unterricht um. Mehrsprachige Interaktion wurde mit drei Impulsen stimuliert: 1. Schaffung eines mehrsprachenfreundlichen Klassenklimas (Sprachenporträts; Gogolin & Neumann, 1991); 2. mehrsprachiges Unterrichtsmaterial; 3. Kleingruppenbildung auf Grundlage gemeinsamer Familiensprachen. In den 44 teilnehmenden Grundschulklassen waren 69% der Viertklässler:innen mehrsprachig. In die Analysen gingen 499 Schüler:innen ein. Davon gaben 62% in einer Befragung nach der Intervention an, während der Intervention eine andere Sprache als Deutsch gesprochen zu haben. Es liegen weiterhin Daten zur Sprachkompetenz in der Familiensprache operationalisiert als Wortschatz (BVAT; adaptiert von Muñoz-Sandoval et al., 1998), zum schulischen Nutzen von Mehrsprachigkeit (4-Item-Skala, „Es hilft mir beim Bearbeiten von Aufgaben“, Cronbachs α = .872) zur Einstellung gegenüber Mehrsprachigkeit (4-Item-Skala, „Ich finde es cool, wenn jemand mehr als eine andere Sprache sprechen kann“, Cronbachs α = .694) sowie Angaben zum Kontext: Vorhandensein von mehrsprachigem Material (für 96% der Schüler:innen) und Sprachpartner:innen (für 64% der Schüler:innen) sowie zur Kommunikation in den Familiensprachen in der Klasse vor der Intervention („ja, sehr oft“ = 23.0%, „ja, aber nur manchmal = 56.2%; 3 = „nein, nie“ = 14.2%) vor. Die Analysen erfolgten mittels einer multilevel binär logistischen Regression mit SPSS 28 (Cluster = Kleingruppen), wobei zunächst bivariate Modelle berechnet wurden und in einem zweiten Schritt die signifikanten unabhängigen Variablen in einem gemeinsamen Modell getestet wurden.

Aus den bivariaten Analysen ging hervor, dass Wortschatz und wahrgenommener Nutzen (auf Individual- und Gruppenebene) sowie Material und Sprachpartnerschaften signifikant mit der Nutzung von Familiensprachen zusammenhingen. Die größte Vorhersagekraft hatte das Vorhandensein von Sprachpartner:innen, gefolgt von Nutzen (Individualebene) und Wortschatz (Individualebene). Im gemeinsamen Prädiktionsmodell leisteten Sprachpartner:innen (Koeffizient = .429; p < .001; odd’s ratio = 1.536) und Nutzen auf Individualebene (Koeffizient = .505; p = .005; odd’s ratio = 1.657) weiterhin signifikante Erklärungsbeiträge. Das Modell sagte in 79.1% der Fälle richtig voraus, ob die Familiensprache genutzt wurde oder nicht.

Die Analysen zeigen auf, wo Lehrkräfte niedrigschwellig ansetzen können, um die Nutzung von Familiensprachen in ihren Klassen zu stimulieren. Hierfür ist die Etablierung von Kleingruppenarbeit mit gleichsprachigen Sprachpartner:innen ein wichtiger Schritt. Ebenso bedeutend ist es, dass die Schüler:innen ihre Familiensprachen als nützlich für einen weitestgehend monolingual ausgerichteten schulischen Kontext erleben. Dies können Lehrkräfte im Unterricht aufzeigen, ermöglichen und motivieren, wofür neben Kleingruppenarbeit bereits Ansätze vorliegen (z.B. Oomen-Welke, 2020).

 

Relationship Quality in Student-Teacher-Dyads: Comparing Student and Teacher Determinants in Multicultural Classrooms

Mădălina A. Paizan1, Alison E. F. Benbow2, Peter F. Titzmann2
1Universität Mannheim, 2Leibniz Universität Hannover

Teacher-student-relationship quality is associated with academic success (Roorda et al., 2017), and among minority students, it can protect against discrimination effects (Civitillo et al., 2021). However, most research on teacher-student relationship quality has studied student or teacher reports only and rarely compared minority and majority student-teacher-dyads. For instance, students in 17 schools in Berlin reported 105 countries of origin, which represented 52% of the total student body (Schachner et al., 2021). This educational setting calls for a better understanding of the interactions between teachers and students and a readjustment of teachers’ professional competence in superdiverse schools. This study investigated teacher-student-agreement on relationship quality in minority and majority student-teacher-dyads (i.e., ethnic groups were built based on parents’ country of origin) and tested predictors of relationship quality according to the multicultural education theory (Banks, 2009). Relationship quality was operationalized as higher levels of instrumental help and lower levels of conflict and was measured on a 7-point Likert scale, where a higher score indicates higher levels of relationship quality. The sample comprised 309 minority (Mage = 12.99) and 200 majority students (Mage = 13.50) and their 28 majority teachers (Mage = 45.82). We first established scalar measurement invariance for minority and majority dyads on instrumental help and conflict and tested for group mean differences. The level of agreement between teacher and student reports was tested by strength of the bivariate Pearson correlational associations. Predictors of teacher-student-relationship quality were tested using two-level regression analyses to account for the nested data (Level 1 = students nested in Level 2 = classrooms). To maintain greatest possible parsimony, four individual regressions were conducted for instrumental help as outcome (two per informant per group: minority and majority student-teacher-dyads) and same four regressions for conflict as outcome. All analyses were conducted in Mplus 8 (Muthén & Muthén, 2017). Teachers reported higher levels of instrumental help (Mteachers-majority group = 3.42, SD = 0.36; Mteachers-minority group = 3.14, SD = 0.34) and lower levels of conflict (Mteachers-majority group = 1.81, SD = 0.21; Mteachers-minority group = 2.10, SD = 0.16) than students. Minority students were more likely to ask teachers for help (Mstudents = 2.02, SD = 0.15) and to experience more conflict (Mstudents = 3.22, SD = 0.41) than majority students (Mstudents = 1.94, SD = 0.12 for instrumental help; Mstudents = 2.91, SD = 0.47 for conflict). Correlations between teachers’ and students’ perspectives on relationship quality were similar for both ethnic groups: we found a small agreement in instrumental help and a medium agreement in conflict. Fischer’s Z-tests revealed no significant differences in the strength of associations between minority and majority student-teacher-dyads, Zs ≤ .35, ps ≥ .63. A better school climate, teachers’ awareness of social heterogeneity and culturally responsive teaching predicted relationship quality in student reports, whereas teaching enjoyment predicted relationship quality in teacher reports. In minority dyads, higher student SES and lower levels of discrimination were additional predictors. These findings suggest similarities and differences between teachers and students in how they perceive their relationship quality with each-other. Furthermore, there are additional processes that explain why minority and majority student-teacher-dyads evaluate relationship quality differently. In conclusion, future studies should obtain additional information on the dyadic processes regarding relationship quality not only between teachers and students in general, but also between different student groups. Furthermore, teachers should receive multicultural education training in order to raise awareness about the effects of expectancy stereotypes (e.g., SES) and perceived discrimination on students’ psychosocial outcomes.

 

Lernbedingungen unter der Lupe: Chancen und Herausforderungen beim Unterrichten heterogener Klassen

Svenja Hascher, Camilla Rjosk
Universität Potsdam

Theoretischer Hintergrund

Die Heterogenität der Schülerschaft und ihre Auswirkungen auf das Lernen sind in den Erziehungswissenschaften ein viel diskutiertes Thema. So bestehen beispielsweise zur Frage, wie Heterogenität die unterrichtlichen Lernbedingungen in Schulklassen beeinflusst, unterschiedliche Annahmen. Zum einen werden Herausforderungen für Lehrkräfte und Unterricht diskutiert (z. B. Maestri, 2017). Auf frühere Forschungsergebnisse zum Unterrichten in heterogenen Klassen (Keller-Schneider et al., 2020) und zur Belastung von Lehrkräften (z.B. Glock et al., 2019) aufbauend besteht die Annahme, dass das Unterrichten heterogener Klassen von Lehrkräften als belastend wahrgenommen wird. Da Lehrkräften möglicherweise die erforderlichen Strategien zum Umgang mit heterogenen Klassen fehlen (Martins & Gaitas, 2017, Saloviita, 2018), wird weiterhin angenommen, dass Klassenheterogenität die Unterrichtsqualität beeinflusst. Als wichtige Komponenten der Unterrichtsqualität gelten die kognitive Aktivierung (z.B. Praetorius et al. 2018) und die Klassenführung (Evertson et al., 1981). Forschungsergebnisse verweisen bislang auf negative Auswirkungen von Leistungsheterogenität auf die kognitive Aktivierung (Decristan et al., 2017). Zum anderen wird Heterogenität auch als Chance gesehen, etwa wenn Lehrkräfte in heterogenen Klassen mehr lernförderliche Unterrichtsstrategien wie Differenzierung und abwechslungsreiche Methoden einsetzen (Lavrijsen, 2022).

In bisheriger Forschung zu unterrichtlichen Lernbedingungen wurden ausschließlich durchschnittliche Heterogenitätseffekte, z.B. auf unterschiedliche Unterrichtsmerkmale, untersucht. Informationen darüber, wie unterschiedlich die Lernbedingungen in heterogenen Klassen in der Praxis sind, fehlen.

Fragestellungen

Die vorliegende Studie untersucht, (1) welcher Zusammenhang zwischen Heterogenität im Klassenzimmer und verschiedenen Lernbedingungen (Belastung, Kognitive Aktivierung, Klassenführung, Anzahl und Variabilität von Methoden, Differenzierung) besteht.

Außerdem nimmt die Studie die Vielfalt und das Zusammenspiel verschiedener Lernbedingungen in heterogenen Klassen in den Blick und fragt, (2) ob in besonders heterogenen Klassen bestimmte Muster von Lernbedingungen auftreten.

Dabei erweitern wir das vorherrschende Heterogenitätsverständnis durch die Konzeptionalisierung von Heterogenität als multidimensionales Konstrukt, wie es u.a. in aktuellen erziehungswissenschaftlichen Ansätzen gefordert wird (Tsetsura, 2011, Aguiar & Aguiar 2022).

Methode

Die vorläufigen Analysen vor Datenimputation basieren auf 528 Grundschulklassen und Deutschlehrkräften der 4. Jahrgangsstufe des IQB-Bildungstrend 2016 (Stanat et al., 2019; Schipolowski et al., 2019). Multidimensionale Heterogenität wird pro Schulklasse mit dem Extended Simpson’s Index (Lieberson, 1969) abgebildet. Er bezieht die Heterogenität bezüglich Leistungen, ethnischer sowie sozioökonomischer Hintergründe der Schüler:innen ein. Informationen zu Lernbedingungen stammen aus Lehrkräftefragebögen (Konstrukte: Anzahl angewandter Methoden (0-8), Summenscore zur Methodenvielfalt und Häufigkeit, Skala zur Differenzierung (Nitems=8, =0.69), 7 Einzelitems zur Belastung, Skala zur kognitiven Aktivierung (Nitems=6, = 0.70), Skala zur Klassenführung (Nitems=5, = 0.90)). Die Auswertung erfolgte anhand von Regressionsanalysen (Frage 1) sowie Clusteranalysen in den 50% heterogensten Klassen (Frage 2).

Ergebnisse

(1) In heterogeneren Klassenzimmern fanden sich eine geringfügig gesteigerte Belastung der Lehrkräfte sowie leicht verminderte kognitive Aktivierung und Klassenführung und eine signifikant höhere Vielfalt der angewandten Unterrichtsmethoden. (2) In den besonders heterogenen Klassen zeigten sich drei verschiedene Konstellationen von Lernbedingungen: Im größten Cluster (N= 102) empfanden die Lehrkräfte generell die größte Belastung, einhergehend mit einem niedrigen Wert der Klassenführung, einem durchschnittlichen Wert der kognitiven Aktivierung und überdurchschnittlichen Werten in Bezug auf die Vielfalt und Anzahl angewandter Methoden. Im nächstgrößeren Cluster (N=92) verspürten die Lehrkräfte die größte Belastung durch die Organisation von speziellen Unterrichtsformen, dies zeigte sich auch in der reduzierten Vielfalt und Anzahl angewandter Unterrichtsmethoden und geringer kognitiver Aktivierung. Die Lehrkräfte im dritten Cluster (N=77) fühlten sich am wenigsten belastet. Dies ging einher mit einem hohen Niveau kognitiver Aktivierung und einer hohen Vielfalt und Anzahl angewandter Methoden.

Unsere Studie gibt Hinweise darauf, dass eine erhöhte Belastung der Lehrkräfte in heterogenen Klassen häufig mit verringerter Unterrichtsqualität einhergeht. Hierbei gibt es verschiedene Typen von Belastungen in heterogenen Klassen, die unterschiedliche Auswirkungen auf den Unterricht haben und denen mit verschiedenen Maßnahmen begegnet werden sollte. In weitere Analysen werden wir Hintergrundmerkmale der Lehrkräfte einbeziehen, die möglicherweise das Zustandekommen der verschiedenen Konstellationen erklären könnten.

 

 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: GEBF 2024
Conference Software: ConfTool Pro 2.8.105
© 2001–2025 by Dr. H. Weinreich, Hamburg, Germany