Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nach Track oder Beitragstyp der Sitzung filtern 
Nur Sitzungen am Veranstaltungsort 
 
 
Sitzungsübersicht
Ort: H03
Hörsaal, 400 TN
Datum: Montag, 18.03.2024
10:30 - 12:101-03: Analysen zur International Civic and Citizenship Education Study (ICCS 2022): Effekte politischen Wissens bei 14-Jährigen
Ort: H03
 
Symposium

Analysen zur International Civic and Citizenship Education Study (ICCS 2022): Effekte politischen Wissens bei 14-Jährigen

Chair(s): Katrin Hahn-Laudenberg (Universität Leipzig), Hermann Josef Abs (Universität Duisburg-Essen, Deutschland)

Diskutant*in(nen): Nina Jude (Universität Heidelberg)

Die International Civic and Citizenship Education Study (ICCS) wurde nach 2009 und 2016, 2022 zum dritten Mal als vergleichende Schulleistungsstudie unter Leitung der IEA (vgl. iea.nl) durchgeführt (Schulz et al., 2023; Schulz et al., in Vorbereitung). Während es in 2009 noch keine deutsche Teilnahme gab, nahmen in 2016 zwar Schulen aus Nordrhein-Westfalen (NRW) teil, jedoch erfüllte die Stichproben noch nicht vollständig die Repräsentativitätskriterien (Abs & Hahn-Laudenberg 2017). Mit ICCS 2022 können nun erstmals aus zwei deutschen Bundesländern repräsentative Ergebnisse zu Jahrgangsstufe 8 im Vergleich zu 18 weiteren europäischen Bildungssystemen präsentiert werden. ICCS ist die einzige international vergleichende Studie zur politischen Sozialisation, bei der schulische Kontexte für politische Bildungsprozesse intensiv berücksichtigt und ein Wissenstest implementiert wird. Weil das politische Wissen in der deutschsprachigen Bildungsforschung bislang eher weniger beachtet wurde (vgl. Hahn-Laudenberg, 2017; Alscher, 2022), sind Forschungen in diesem Bereich für die domänenspezifische Forschung in Deutschland von hoher Bedeutung. Ein weiteres Alleinstellungsmerkmal von ICCS besteht darin, dass schulische und gesellschaftliche Kontexte, sowie das in ihnen erworbene Wissen mit weiteren Dimensionen der politischen Bildung und Sozialisation in Verbindung gebracht werden. Es sind dies insbesondere soziale und politische Identifikationen, politischen Einstellungen und Formen der Partizipation in Schule, Zivilgesellschaft und Politik.

Nach der internationalen Freigabe der Ergebnisse zur ICCS ab 28. November 2023, widmet sich das Symposium ersten vertiefenden Analysen, mit denen unterschiedliche Fragestellungen zum politischen Wissen in den Fokus genommen werden. Der erste Beitrag (Hahn-Laudenberg, Goldhammer, Ateş) untersucht die Konstruktion und Validität des Wissenstests, der in ICCS 2022 eingesetzt wurde und stellt zentrale Ergebnisse im internationalen Vergleich vor. Zudem wurde erstmals in der Mehrzahl der Länder computerbasiert getestet. In Teilen des Tests kamen dabei „computer enhanced items“ zum Einsatz, bei denen sich Aspekte einer Aufgabe in Abhängigkeit von vorhergehenden Lösungsschritten entwickeln. Im aktuellen Zyklus lag inhaltlich ein stärkerer Schwerpunkt auf nachhaltlichkeitsbezogenen Fragen.

Der zweite Beitrag (Oberle & Matafora) betrachtet Effekte von politischem Wissen für unterschiedliche EU-bezogene Einstellungen. Mit Daten aus ICCS 2016 wurde schon gezeigt, dass Wissen mit normativen Einstellungen zur EU sowie mit der Bewertung der Ergebnisse ihrer politischen Entscheidungen in Zusammenhang steht (Hahn-Laudenberg & Abs 2020). Auch wurde schon die Bedeutung von Migration für die Identifikation mit Europa herausgearbeitet (Matafora et al. 2023). Die neue Analyse mit Daten von ICCS 2022 führt diese Arbeiten zusammen und zeigt, wie der Effekt von Wissen durch die Identifikation mit Europa mediiert wird.

Der dritte Beitrag (Ziemes) betrachtet Effekte von politischem Wissen auf soziales und institutionelles (politisches) Vertrauen. Auch hier kann auf ausführliche Vorarbeiten mit Daten aus ICCS 2016 zurückgegriffen werden, durch die der Zusammenhang von Wissen und institutionellem Vertrauen in Abhängigkeit von gesellschaftlichen Bedingungen analysiert wurde (Ziemes, 2020). Mit den Daten aus ICCS 2022 ist es nun möglich parallel Analysen für soziales Vertrauen durchzuführen und dadurch die Spezifik der schulischen Sozialisation von Vertrauen besser herauszuarbeiten.

Der vierte Beitrag (Abs & Deimel), widmet sich der Ausbildung von Einstellungen zur politischen Privilegierung der eigenen Religion. Die Autoren haben in einer aktuellen Analyse mit ICCS 2016-Daten bereits die Bedeutung des Wissens herausgearbeitet (Gutzwiller-Helfenfinger et al. 2022). Dabei blieb die Forschungsfrage ungeklärt, inwiefern religionsbezogene Diskriminierung einen Beitrag zu der Überzeugung leistet, dass die eigene Religion in politischen Kontexten privilegiert werden sollte. Aufgrund einer verbesserten Operationalisierung von Diskriminierungserfahrung in ICCS 2022 ist dies Analyse nun möglich.

 

Beiträge des Symposiums

 

Politisches Wissen von 14-Jährigen. Operationalisierung und Ergebnisse der Ergebnisse der International Civic and Citizenship Education Study (ICCS 2022)

Katrin Hahn-Laudenberg1, Frank Goldhammer2, Rukiye Ateş3
1Universität Leipzig, 2DIPF, 3Universität Duisburg-Essen

Theoretischer Hintergrund:

Ein grundlegendes politisches Verständnis ist in einer Demokratie die Voraussetzung dafür, die Rolle als Bürger*in selbstbestimmt ausfüllen zu können (Delli Carpini & Keeter, 1996). Die ständige digitale Verfügbarkeit von Informationen zu politischen Fragen, Institutionen und Prozessen relativiert diese Bedeutung nicht, denn konzeptuelles politisches Wissens bildet gerade die Grundlage, die benötigt wird, um die Relevanz und Vertrauenswürdigkeit von Informationen zu beurteilen (Wolak, 2022). Bürger*innen mit umfassenderem politischem Wissen sind nicht nur in der Lage, ihre politischen Interessen effektiver einzubringen, sie zeigen auch häufiger Bereitschaft etwa zur wahlbezogenen Partizipation oder zum politischem Boykott bestimmter Konsumprodukte (Westle & Anstötz, 2020). Ähnliche Effekte zeigen sich bereits bei Jugendlichen (Deimel, 2023). Systematische Unterschiede im politischen Wissen können so Strukturen von Ungleichheit in Demokratien verfestigen. Da Schule die Institution ist, die in vielen Bildungssystemen alle heranwachsenden Bürger*innen erreicht, ist die Entwicklung konzeptuellen politischen Wissens als zentrales Element der Integrationsfunktion von Schule zu betrachten (Hahn-Laudenberg, 2017). Konzeptionen der Erfassung politischen Wissens werden im deutschsprachigen Raum aktuell nicht nur beschränkt auf die Politikdidaktik (Weißeno, 2022), sondern verstärkt in der empirischen Bildungsforschung (Alscher et al., 2022) und der Politikwissenschaft (Tausendpfund & Westle, i.E.) diskutiert. Die International Civic and Citizenship Education Study (ICCS) ermöglicht als einzige Large-Scale-Assessment-Studie die Analyse politischen Wissens im internationalen Vergleich.

Fragestellung:

Wie gestaltet sich die Konzeption der Erfassung politischen Wissens in ICCS 2022 unter Berücksichtigung von Fragen der Validität, Dimensionalität und Trendbestimmung? Welches Ausmaß an konzeptuellem politischem Wissen zeigen Schüler*innen in NRW und SH im internationalen Vergleich und welche sozialen Disparitäten sind hinsichtlich dieses politischen Wissens erkennbar?

Methode:

Politisches Wissen wird in ICCS 2022 über Items erhoben, die auf das konzeptuelle politische Wissen und auf das Argumentieren und Anwenden dieses Wissens zielen. Inhaltlich umfasst der Wissenstest Fragen zu gesellschaftlichen Institutionen und Systemen, Werten, Identität sowie zu Partizipation in einer Demokratie. Gegenüber vorhergehenden Zyklen wurde der Anteil an Items mit Bezug zu Global Citizenship und Nachhaltigkeit gestärkt. Insgesamt werden 141 Items auf 14 Cluster verteilt und anhand eines rotierten Booklet-Designs mit drei Clustern pro Booklet eingesetzt. Erstmals im Kontext von ICCS enthalten drei Cluster Module mit komplexeren Aufgabenszenarien, in denen Antwortformate jenseits klassischen Multiple-Choice-Formate oder offenen Antwortformate eingesetzt wurden sowie Aufgaben, bei denen Aspekte einer Aufgabe in Abhängigkeit des vorhergehenden Antwortverhaltens gestaltet wurden (computer enhanced items).

Ergebnisse:

Anhand von Beispielitems gibt der Beitrag Einblick in die inhaltliche Konzeption des Wissenstests. Die Analyse des Feldtests liefert erste empirische Argumente für eine mit vorhergehenden Zyklen der Studie vergleichbare Skalierung politischen Wissens über ein eindimensionales IRT-Modell. In ICCS 2016 war NRW eins der Bildungssysteme, in denen Schüler*innen im europäischen Vergleich im Mittel geringeres politisches Wissen zeigten, welches gleichzeitig besonders stark durch den familiären sozioökonomischen Status vorhergesagt werden konnte (Hahn-Laudenberg & Abs, 2017). Der Beitrag diskutiert, inwieweit ein entsprechendes Bild auf Basis von ICCS 2022 für NRW und SH gezeichnet werden kann. Angesichts der Vertraulichkeit der Daten vor dem Veröffentlichungstermin der hierauf bezogenen Studienergebnisse von ICCS 2022 am 28. November kann eine genauere Darstellung der Ergebnisse im Rahmen des Abstracts noch nicht erfolgen.

 

Effekte von politischem Wissen und schulischen Milieus auf Einstellungen zur Europäischen Union und zu den Ergebnissen ihrer politischen Entscheidungen

Monika Oberle1, Beatriz Matafora2
1Universität Göttingen, 2Universität Duisburg-Essen

Theoretischer Hintergrund:

Politik in Deutschland ist heute ohne Berücksichtigung der europäischen Dimension weder angemessen zu begreifen noch zu gestalten. Dem muss eine zeitgemäße politische Bildung Rechnung tragen (Oberle, 2012). In der politischen Europabildung kommt der Europäischen Union (EU) ein zentraler Stellenwert zu – als transnationaler Zusammenschluss mit supranationalen und intergouvernementalen Elementen prägen ihre Entscheidungen zunehmend das Leben ihrer Bürger*innen und sind zugleich auch über europäische Beteiligungsverfahren wie die Europawahlen zu beeinflussen (Knelangen & Oberle, 2021). Die Komplexität der EU erschließt sich jedoch nicht nebenbei. Entsprechend sehen die Curricula der Sekundarstufen allgemeinbildender Schulen in allen Bundesländern die Behandlung der EU im politischen Fachunterricht verbindlich vor. Neben Kenntnissen zur Eingebundenheit Deutschlands in die EU und Wissen um die Bedeutung von deren Entscheidungen für das eigene Leben sollen bei den Lernenden laut Empfehlung der Kultusministerkonferenz (2020) auch ein Bewusstsein europäischer Zusammengehörigkeit bzw. die Auseinandersetzung mit einer europäischen Identität gefördert werden. In Anlehnung an das Modell der Politikkompetenz (Detjen et al., 2012) bestehen Ziele des Politikunterrichts entsprechend u.a. in der Förderung konzeptuellen Wissens zu europäischer Politik in ihren Dimensionen polity, politics und policy sowie in der Förderung EU-bezogener Motivationen (z.B. Interesse, Selbstwirksamkeitsüberzeugung) und Einstellungen (z.B. Institutionenvertrauen). In Anlehnung an David Eastons (1965) Unterscheidung von diffuser und spezifischer politischer Unterstützung lassen sich generelle und performanzbezogene politische Einstellungen unterscheiden und damit ein „harter“ von einem „weichen“ Euroskeptizismus (Knelangen, 2015). Im Gegensatz zu einer „fundamentalen“ EU-Skepsis entspricht eine „konstruktive“ EU-Skepsis durchaus den Zielen der politischen EU-Bildung. Studien zeigen Zusammenhänge von politischem Wissen und Einstellungen zur EU, allerdings mit unterschiedlichen Ausprägungen für generelle und performanzbezogene Einstellungen (Oberle & Forstmann, 2015).

Fragestellung:

Der Beitrag untersucht, wie sich die Ausprägung der EU-bezogenen Orientierungen der Schüler*innen in Nordrhein-Westphalen und Schleswig-Holstein im internationalen Vergleich darstellt. Außerdem wird der Frage nachgegangen, wie das Wissen der Schüler*innen zur Europäischen Union ihre Einstellungen zu deren System und politischen Ergebnissen beeinflusst. Schließlich wird untersucht, inwiefern sich dieser Zusammenhang je nach politische Wissen, soziodemografischem Hintergrund der Schüler*innen und ihrer Schulformzugehörigkeit unterscheidet.

Methode:

Politisches Wissen wird in ICCS 2022 über Items erhoben, die auf das konzeptuelle politische Wissen und auf das Argumentieren und Anwenden dieses Wissens zielen (vgl. Beitrag Hahn-Laudenberg et.al). Einstellungen zur EU wurden mit Hilfe von Likert-skalierten Items erfasst, wobei sich zwei unterschiedliche Dimensionen mit reliablen Skalen modellieren lassen: positive und negative Einstellungen zur EU. Multiple Regressionen und latente Strukturgleichungsmodelle werden in Mplus berechnet.

Ergebnisse:

Der Beitrag gibt erstens anhand von Beispielitems Einblick in die Operationalisierung der untersuchten Orientierungen von Schüler*innen zur Europäischen Union und stellt die Messmodelle vor. Zweitens werden deskriptive Statistiken zu den im Sample der beiden deutschen Bundesländer vorliegenden EU-bezogenen Kenntnissen und Einstellungen vorgestellt, die im europäischen Vergleich laut Feldtest unterdurchschnittlich ausfallen. Auf Grundlage multipler Regressionen und Strukturgleichungen werden Zusammenhänge zwischen den EU-bezogenen Orientierungen der Schüler*innen und ihrem politischen Wissen sowie der Einfluss soziodemografischer Hintergrundvariablen auf deren Ausprägung eruiert. Der Beitrag diskutiert vorliegende differentielle Effekt von politischem Wissen und Migrationshintergrund auf die EU-bezogenen Einstellungen der Schüler*innen in Nordrhein-Westfalen und Schleswig-Holstein. Angesichts der Vertraulichkeit der Daten vor dem Veröffentlichungstermin der hierauf bezogenen Studienergebnisse von ICCS 2022 am 28. November kann eine genauere Darstellung der Ergebnisse noch nicht erfolgen.

 

Wissen als Prädiktor von sozialem und institutionellem Vertrauen – Analysen aus ICCS 2022

Johanna Ziemes
Universität Duisburg-Essen

Theoretischer Hintergrund:

Vertrauen beschreibt die Überzeugung, dass Andere zumindest nicht gegen die eigenen Interessen arbeiten, auch dann, wenn sie nicht beständig kontrolliert werden (Flanagan, 2013). Institutionelles Vertrauen stabilisiert das Regierungssystem (Norris, 2017), wohingegen soziales Vertrauen auch genutzt werden kann, um institutionelle Änderungen einzufordern (Newton, 2006). Wo die Entwicklung eines grundlegenden Vertrauens als Entwicklungsaufgabe der Kindheit gilt (Erikson, 1959/1994), ist die Jugend eine wichtige Phase für die Entwicklung von politischen Einstellungen, wie dem Vertrauen in politische Institutionen (Claes & Hooghe, 2017; Ziemes, 2022). Vertrauen in abstrakte Konstrukte scheint sich erst in der Adoleszenz zu entwickeln. Für die Entwicklung von Vertrauen in Menschen allgemein wird der Beziehung zu den Eltern und zu Gleichaltrigen eine große Rolle zugeschrieben (Flanagan, 2013; Flanagan & Stout, 2010). Es gibt Befunde, welche die Bedeutsamkeit von Sozialbeziehungen auch für das Vertrauen in politische Institutionen unterstreichen (Claes & Hooghe, 2017; Ziemes et al., 2020). Gleichzeitig findet sich zunehmend Evidenz dafür, dass der Zusammenhang von politischem Wissen und Institutionenvertrauen durch die Leistungsfähigkeit der jeweiligen Institutionen moderiert wird: In Ländern mit wenig Korruption vertrauen politisch kompetentere Schüler*innen den Institutionen mehr und in korrupteren Ländern weniger als ihre Mitschüler*innen mit geringerem politischem Wissen (Deimel et al., 2022; Hahn-Laudenberg & Abs, 2020). Der Forschungsstand lässt folgende Fragen bislang offen: Sind politisches Wissen und Sozialbeziehungen für das Vertrauen in Intuitionen und Menschen allgemein jeweils ähnlich relevant? Finden sich internationale Variationen in der Relevanz der Prädiktoren von Vertrauen in Menschen allgemein?

Fragestellung:

Dieser Beitrag vergleicht die differentielle Bedeutsamkeit von schulischen Sozialbeziehungen und politischem Wissen für soziales Vertrauen und Vertrauen in politische Institutionen im internationalen Vergleich. Es wird angenommen, dass Sozialbeziehungen einen engeren Zusammenhang zu Vertrauen in Menschen zeigen und Wissen international variabel mit Vertrauen in politischen Institutionen interagiert. Umgekehrt sollte das politische Wissen für soziales Vertrauen und Sozialbeziehungen für Vertrauen in politische Instituierenden jeweils eine geringere Bedeutung haben.

Methoden:

Für den Vortrag werden die Daten der Hauptstudie von ICCS 2022 genutzt. In diesem Abstract werden Feldtestanalysen vorgestellt, weil die Daten der Hauptstudie noch einer Sperrfirst unterliegen. Die Daten der Hauptstudie umfassen circa 74.000 Schüler*innen aus 24 Bildungssystemen. Die Schüler*innen waren zum Erhebungszeitpunkt idR im achten Jahr der Beschulung. Vertrauen in politische Institutionen wurde erfasst mit einer Skala zum Vertrauen von Schüler*innen in sechs Institutionen (z.B. die Regierung, die Polizei). Für das Vertrauen in Menschen allgemein stand lediglich ein Item zur Verfügung. Politisches Wissen wurde erfasst über einen 45-minütigen Test im rotierendem Booklet-Design. Eine Skala mit drei Items wurde genutzt, um die schulischen Sozialbeziehungen der Schüler*innen zu messen (z.B. „Die meisten Schüler*innen behandeln einander mit Respekt“) (Schulz et al., 2023; Schulz et al., in Vorbereitung).

Ergebnisse:

Die vorläufigen Ergebnisse beziehen sich auf die Bildungssysteme Nordrhein-Westfalen und Schleswig-Holstein; im Vortrag werden Ergebnisse aus 24 Bildungssystemen vorgestellt. In beiden Bundesländern korrelieren die Aspekte des Vertrauens moderat miteinander (rNRW=36; rSH=.31). Für Schüler*innen handelt es sich also um distinkte Konzepte. Separate Regressionsanalysen zeigen, dass die Sozialbeziehungen der Schüler*innen signifikant mit dem institutionellen Vertrauen (βNRW=26; βSH=.28) und dem Vertrauen in Menschen allgemein verbunden sind (βNRW=24; βSH=.26). Es zeigt sich jedoch nur ein geringfügiger Zusammenhang zwischen politischem Wissen und den beiden Aspekten des Vertrauens (jeweils β<.10).

Diskussion:

Die Ergebnisse lassen sich vollständig erst mit den Analysen der Daten der Hauptstudie interpretieren. Diese ersten Analysen weisen bereits darauf hin, dass Sozialbeziehungen für den Aufbau von Vertrauen in Institutionen und in Menschen allgemein ähnlich bedeutsam sind. Diese vorläufigen Analysen zeigen so die Bedeutsamkeit von Sozialbeziehungen für die politische Sozialisation und die politische Bildung auf. Gleichzeitig unterstützen die Ergebnisse nicht die Annahme, dass unterschiedliche Sozialisationsbedingungen für die Entwicklung der differenten Vertrauensaspekte relevant sind.

 

Die Bedeutung Diskriminierungserfahrung und politischem Wissen für Überzeugungen zur Privilegierung von Religion in der Gesellschaft

Hermann Josef Abs, Daniel Deimel
Universität Duisburg-Essen

Theorie:

Die positive Bewertung gesellschaftlicher Meinungs- und Interessenvielfalt wird unter dem Begriff des Pluralismus (Manson, 2023) gefasst und ist eine Voraussetzung für Chancengleichheit in der demokratischen Willensbildung (Wenzel, 2023). Deshalb ist es problematisch, wenn einzelne Gruppen grundsätzlich davon ausgehen, dass ihren Sichtweisen ein Vorrang gegenüber den Sichtweisen anderer in der Demokratie zukommt, oder wenn einzelne Gruppen davon ausgehen (müssen), dass sie geringere Chancen haben, ihre Meinungen und Interessen in gesellschaftliche Diskurse einzubringen. Es gehört zu den Aufgaben von politischer Bildung und schulischer Demokratieerziehung, den Pluralismus der Schüler:innen untereinander zu stärken. Dies beinhaltet, sie dazu zu befähigen, gegen gruppenbezogene Diskriminierung initiativ zu werden und vermeintliche Privilegien aufgrund der Zugehörigkeit zu einer sozialen Gruppe zurückzuweisen.

Fragestellung:

Der Beitrag geht der Frage nach, inwiefern Überzeugungen zur Privilegierung der eigenen Gruppe durch gruppenbezogene Diskriminierung aufgeklärt werden kann und inwieweit politisches Wissen einen Schutz vor der Ausprägung entsprechender Überzeugungen bietet. Dies geschieht am Beispiel der Überzeugung, dass die eigene Religion in der Gesellschaft privilegiert werden sollte und der Diskriminierung wegen Religionszugehörigkeit.

Methode:

Die International Civic and Citizenship Education Study (ICCS) ermöglicht es, den Status quo hinsichtlich der Überzeugungen zur Privilegierung von Religion, Diskriminierungswahrnehmung und -erfahrung bei Schüler:innen der 8. Jahrgangsstufe im schulischen Kontext zu erfassen. Im Fokus steht die Skala zur Privilegierung von Religion mit sechs Items (z.B. „Religiöse Autoritäten sollten mehr Macht in der Gesellschaft haben.“). Weiterhin besteht eine Skala zur Diskriminierungswahrnehmung in der Gesellschaft, die auch die Diskriminierung von religiösen Minderheiten erfasst. Schließlich wurde die individuelle Diskriminierungserfahrung in der Schule erfragt, wobei Religion als Anlass der Diskriminierung angegeben werden konnte. Weil für Ergebnisse zur Haupterhebung von ICCS 2022, die für NRW repräsentativ N = 3.269 Schüler*innen in 145 Schulen umfasst, eine Sperrfrist besteht, bezieht sich das Abstrakt auf eine eigene Vorläuferstudie und Feldtestergebnisse.

Ergebnisse:

Gutzwiller-Helfenfinger et al. (2022) konnte mit Daten aus ICCS 2016 für Nordrhein-Westfahlen gezeigt zeigen, dass Schüler:innen, die sich als einer Religion zugehörig ausweisen und an religiösen Feiern teilnehmen, eher dazu tendieren, einen stärkeren Einfluss von Religion in der Gesellschaft zu wünschen. Dies gilt in unterschiedlichem Ausmaß für alle Religionen im Vergleich zu Schüler:innen, die sich keiner Religion zuordnen. Die Selbstzuordnung zum Islam als Religion weist in diesem Kontext einen deutlich stärkeren Effekt auf als die angegebene Zugehörigkeit zum Christentum. So stimmen dem oben genannten Beispielitem 61% der muslimischen und 18% der christlichen Schüler:innen zu. Weiterhin wird eine Zustimmung zur Privilegierung von Religion dann wahrscheinlicher, wenn eine Zuwanderungsgeschichte (mindestens ein Elternteil im Ausland geboren) vorliegt. Dahingegen erweist sich politisches Wissen (vgl. Wissenstest in ICCS) als protektiver Faktor gegen die antipluralistische Überzeugung.

Mit den Daten aus ICCS 2022 stehen im Vergleich zu ICCS 2016 erweiterte Maße zur Erfassung gesellschaftlicher Diskriminierungswahrnehmung und (als nationale Ergänzung) persönlicher Diskriminierungserfahrung der Schüler:innen zur Verfügung. Nach Feldtestdaten nehmen 77% der Schüler:innen eine Diskriminierung religiöser Minderheiten wahr, wodurch Religion als ein vergleichsweise bedeutender Diskriminierungsanlass erkennbar wird. Daneben werden in Form einer nationalen Ergänzung auch persönliche Diskriminierungserfahrungen im schulischen Kontext erfasst. Hier liegen die Werte insgesamt deutlich niedriger. Die Analyse mit Feldtestdaten zeigt, wie Diskriminierungswahrnehmung und -erfahrung auf unterschiedliche Weise mit Überzeugungen zur Privilegierung von Religion in Zusammenhang stehen. Covid-bedingt ist die Stichprobe im Feldtest jedoch zu klein um eine signifikante Prädiktion der privilegierenden Überzeugungen aus der gesellschaftlichen Diskriminierungswahrnehmung und/oder individuellen Diskriminierungserfahrung zu ermöglichen. Dahingegen ist mit den Daten der Haupterhebung eine vollständige Schätzung des Modells möglich. Hierzu wird ein regressionsanalytisches Verfahren gewählt.

Diskussion:

Die Überzeugung zur Privilegierung der eigenen Gruppe und Diskriminierungserfahrungen sind als Gefährdungen des Pluralismus komplex miteinander verbunden. Die Ergebnisse erlauben eine neue Diskussion der Frage, inwiefern sich die Tendenz zur Privilegierung der eigenen Gruppe aus wahrgenommener bzw. erfahrener gruppenbezogener Diskriminierung speist.

 
13:10 - 14:502-03: Making teaching tangible for student teachers through core practices: Current findings and theoretical developments
Ort: H03
 
Symposium

Making teaching tangible for student teachers through core practices: Current findings and theoretical developments

Chair(s): Matthias Nückles (Universität Freiburg, Deutschland), Marc Kleinknecht (Leuphana Universität Lüneburg)

Diskutant*in(nen): Kathleen Stürmer (Universität Tübingen)

During the last two decades, research on teacher education in Europe and the US has undergone a “competence turn” in which the question of how future teachers can develop competencies that allow them to act flexibly and adaptively in the classroom, has become a focal point of interest. Whereas in German speaking countries empirical educational research has mainly concentrated on the assessment of cognitive and affective-motivational dispositions as prerequisites of teaching performance (e.g., Baumert et al., 2010), and on abilities to notice and interpret classroom situations (e.g., Seidel & Stürmer, 2014; Sherin & van Es, 2009), the practice-based teacher education movement in the US (Grossman et al., 2009, McDonald et al., 2013) has spawned concrete theoretical ideas of how teaching performance can be fostered. Specifically, the notion of core teaching practices has been suggested around which teacher education and professional development may be organized. A major strength of the core practices concept is that the concrete and situated demands of teaching come into focus which is likely a much more fruitful starting point for educating novice teachers than high-level abstractions from educational effectiveness research such as “cognitive activation” or “supportive climate” (e.g., Fauth et al., 2014; Klieme et al., 2009). The latter have recently become popular in teacher training and data-driven development of teaching quality in German speaking countries.

Following Grossman et al. (2009, see also McDonald et al., 2013) core practices can be conceived of as structured sequences of instructional activities which are essential to the teaching profession. Accordingly, core practices typically occur with a high frequency in teaching (e.g., giving explanations, eliciting and responding to students’ ideas) and are relevant for different curricula and subjects. Core practices are not simple teaching behaviors (such as “post-question wait time” see, Brophy & Good, 1986) as they have been investigated in early process-product research on teacher effectiveness (Berliner, 1989). Rather, core practices are holistic activities with a certain level of complexity. Despite their complexity, however, proponents of practice-based teacher education claim that novices can master them at a basic level early in their teacher studies. Following McDonald et al. (2013), core practices should ideally be research-based, that is, educational research can offer evidence-based recommendations of how a specific core practice should be enacted in concrete teaching situations in order to affect student behaviour or student learning positively.

This symposium brings together researchers from four different countries – the US, Switzerland, the Netherlands, and Germany – with backgrounds in teacher education, medical education, empirical educational research and educational psychology. The symposium starts with two theoretical contributions followed two empirical contributions that feature quasi-(experimental) intervention studies. Fraefel and Grossman present a theoretical paper in which they characterize the core practice concept from the perspectives of philosophical pragmatism, sociocultural theory, and activity theory. Van der Schaaf compares the concept of core practices in teacher education with the concept of entrustable professional activities in medical education by discussing commonalities and differences between both concepts. Klaß, Calcagni and Gröschner present a quasi-experimental intervention study in which they contrast a learning environment for student teachers based on video modelling with a learning environment based on a teaching simulation experience. Hipp, Holstein, Kleinknecht and Nückles present an experimental intervention study in which they investigated which phases a core practice training should be composed of to foster teacher students’ acquisition of core practices best. Together, the four contributions shed a multidisciplinary and multifaceted light on the concept of core practices by highlighting both high-stakes empirical research as well as innovative theoretical perspectives on the core practices approach.

 

Beiträge des Symposiums

 

Considerations on the theoretical underpinnings of the core practice approach

Urban Fraefel1, Pam Grossman2
1Pädagogische Hochschule FHNW, 2University of Pennsylvania

The approach of Core Practices, as it has been conceptualized in the USA, is also attracting increasing attention in Europe. However, it has become apparent that the definitions of practice are often far apart, not only in terms of their theoretical framing, but also in terms of their specific manifestation, their function in the teaching profession, and their acquisition. This presentation addresses, on the one hand, the commonalities and differences of the concept of core practices with some theoretical approaches, focusing on theoretical perspectives that are fundamental to the concept of core practices in different national and historical contexts.

Theories of practice, which see practices as the irreducible units of all social and, according to the German sociologist Reckwitz (2002, p. 249), "a routinized type of behavior," differ from theoretical approaches that locate the social, for example, at the level of individual mental and physical activities or interactions. Drawing on Bourdieu (1977) and Schatzki (1996, 2012), among others, practice theories as a basis for analyzing and understanding social practices have also found strong reception in the fields of teaching and teacher education in recent years in the German-speaking world, especially from a structural theory perspective (e.g., Bohnsack, Bonnet & Hericks, 2022).

As insightful as practice-theoretical approaches may be for understanding social practices, they make little contribution to the learning of practices as well as to transforming existing practices into normatively desirable ones. Here, pragmatism (Dewey, 1933, 1938) as well as sociocultural and activity theory (e.g., Vygotsky, 1978; Wertsch, 1979, 1991; Lave, 2019) prove more fruitful especially with regard to learning core teacher practices that are central to teaching and educational impact on students: Inherent in Deweyan pragmatism is problem solving and improving unsatisfactory situations, and the concept of "guided participation" (Rogoff, 1990), based on the foundations of the sociocultural approach, also proves effective in learning practices in teacher education.

In the German-speaking world, the approach of teachers' core practices has to be distinguished from the prevalent conceptualization of competencies on the one hand and from the idea of mere routines on the other. Whereas competencies were discussed around the turn of the millennium as a construct that integrates knowledge, skills, and action even under complex conditions (Weinert, 2001; Oser, 2003), in the reality of German teacher education it has been largely reduced to the cognitive knowledge components (Baumert & Kunter, 2006), and the achievement of professional performance (Blömeke, Gustafsson & Shavelson, 2015) as a learning focus plays a rather subordinate role in teacher education reality. Furthermore, the concept of core practices clearly distinguishes itself from the notion of acquiring decontextualized routines, especially from pure training forms of isolated skills such as the microteaching of the 1970s (Cooper & Allen, 1970); in contrast, core practices aim at adaptive professional action in complex situations (e. g. e.g., Ghousseini, Beasley & Lord, 2015).

The theoretical framework of pragmatism, sociocultural theory, and activity theory explains that the fleshing out, learning, and acquisition of core practices is a collective activity, for which a number of teacher education practices have been developed recently (e.g., Grossman et al., 2009; McDonald, Kazemi & Kavanagh, 2013). In the symposium, reference will be made to some of these practices and their theoretical background, and implications for research and development will be discussed.

 

Comparing core practices and entrustable professional activities in teacher and medical education

Marieke van der Schaaf
University Medical Center Utrecht

In this contribution the focus is on comparing the concepts of Core Practices (CPs) in teacher education and Entrustable Professional Activities (EPAs) in health professions education, with the aim of understanding their development and positioning in curricula. The alignment of educational programs with the development of future professionals' expertise is crucial to facilitate students' growth. We seek to identify both the differences and similarities in how task-units within these programs are structured and utilized.

The development of professional expertise is characterized by the adaptation of individuals to the demands of their respective tasks. This adaptation implies that people “restructure, reorganize, and refine their representation of knowledge and procedures for efficient application to their work-a-day environment” (Feltovich, Prietula & Ericsson, 2006, p. 57). It can be accelerated through a cyclical process of task improvement (cf. Ericsson et al., 1993).

CPs in teacher education and EPAs in medical education both represent units of professional practice. However, there are several differences. CPs emphasize pre- and post-lesson activities, including planning and reporting (Grossman et al., 2009), while EPAs primarily describe activities during medical practice, such as basic medical procedures (Ten Cate & Scheele, 2007). Further, EPAs assess the level of supervision a learner requires in the workplace, determining their autonomy, whereas teacher education students teach as autonomous teachers, with supervisors present only occasionally. Also, healthcare settings involve short encounters between trainees and various supervisors, while teacher education features longer and more uniform interactions with single supervisors, including observations and activities outside the classroom.

Despite these differences, CPs and EPAs share certain commonalities. Both are designed as units of professional practice, serving as building blocks in flexible curricula. Their development involves co-creation with stakeholders from practice rather than a top-down approach. Various methods, including delphi studies, site visits, and meetings with field experts, are used to ensure alignment with the dynamic nature of specific curricula. Both CPs and EPAs offer flexibility for professionals to set their own learning goals and adapt their learning processes, although, the case of EPAs, they remain standardized components that need to be incorporated into the curriculum.

This contribution highlights the need for further research to gain insight into how CPs and EPAs impact students' development as future professionals. Qualitative approaches that explore students' perceptions of these concepts and their influence on development should be pursued. While CPs and EPAs have the potential to contribute to curriculum flexibility, they may not automatically align with how professionals as learners develop in the workplace context.

In summary, this contribution delves into the comparison of Core Practices (CPs) in teacher education and Entrustable Professional Activities (EPAs) in medical education, shedding light on their development and utilization. While both concepts share commonalities in terms of being units of professional practice, there is a lack of understanding of their impact on students' development. We suggest the need for further research in this area. Additionally, it acknowledges the differences in content and context between these two concepts, highlighting the importance of tailoring them to specific curricula and workplace environments.

 

Fostering classroom dialogue as core practice in teacher education: the role of different learning designs during a field experience

Susi Klaß, Elisa Calcagni, Alexander Gröschner
Friedrich-Schiller-Universität Jena

Theoretical background

Core practices occur frequently in teaching, are evidence-based, contribute to student learning and can be analytically decomposed to make them accessible to students in teacher education (Grossman et al., 2009). The question of how core practices can be implemented in preservice teacher education, is increasingly being researched in Germany and has been linked to optimizing students’ practicum experiences (Schellenbach-Zell & Hartmann, 2022).

In this paper, we present ongoing research on core practices conducted in the Learning-to-Teach-Lab: Science (LTL:S), a university classroom equipped with video cameras, a control and observation room and in-ear microphones. The LTL:S is conceived as a learning and research setting emphasizing evidence-based learning opportunities (Gröschner et al., 2022).

Based on the assumption that classroom discourse can be defined as the core of the teachers’ instructional activities, the focus in LTL:S is on modeling productive classroom dialogue (Gröschner et al., in press). In this setting, we developed a practice-based cycle that involves students’ learning, trailing and reflecting on discursive practices during their practicum supported by an accompanying university course (McDonald et al., 2013). In it, a key learning experience consists of representing practices through classroom videos. In this study, we replaced this with a teaching simulation in the LTL:S to bring students closer to practice. Our aim is to compare the two learning designs in terms of students’ relevant knowledge, the intention to implement and perceived relevance of the course.

Research question

How do student teachers assess their understanding and the applicability of productive classroom dialogue depending on the learning condition?

Methods

We conducted a quasi-experimental study to investigate how students perceive and benefit from different learning experiences through a newly developed “approximation” approach involving role-play simulations followed by immediate video analysis compared to external video analysis only. N=159 students participated in two introductory sessions and were randomly assigned to two groups with a 3-hour-long modeling task. Students in the control group (CG, n=58) participated in a seminar where they analyzed an external instructional video on productive classroom dialogue and reflected on it in small groups (Kleinknecht & Gröschner, 2016). Students in the intervention group (IG, n= 101), in contrast, conducted a videotaped simulation in the LTL:S seminar, where they tried out elements of productive classroom talk and reflected on their video. After these sessions, students in both groups were asked to complete a survey about their learning experiences.

Results

Three aspects were assessed: Knowledge about productive classroom dialogue (KPCD, α=.94), Intention to implement ( ItI, α=.88) and Perceived practical relevance (PPR, α=.92). Comparisons using t-test indicated differences in student teachers’ perceptions on all three scales in favor of the intervention group: KPCD: t(157) = 2.554, p =.012, MIG(101) = 4.54; MCG(58) = 4.11; ItI: t(157) = 2.979, p =.003, MIG(101) = 4.56; MCG(58) = 4.06; and PPR: t(157) = 4.455, p =.000, MIG(101) = 4.63; MCG(58) = 3.93.

Discussion and Research outlook

This first feasibility check study showed that the simulation condition yielded higher perceived knowledge, intentions and practical relevance. In an ongoing study, we delve deeper into how this learning situation can be optimized for students. Accordingly, we investigate how guidance and different levels of prompts for productive classroom dialogue promote students’ learning best. We focus on the role of reflection during the debriefing of each modeling session and ask: Are debriefing discussions more focused after a more structured simulation (compared to debriefing sessions without prompts)? Do students learn differently with different levels of prompting during simulations? First results of this study with N=108 students will also be shared and discussed in the symposium.

 

How can the acquisition of core practices be optimally fostered?

Hadmut Hipp1, Anna Holstein2, Marc Kleinknecht2, Matthias Nückles1
1Universität Freiburg, 2Leuphana Universität Lüneburg

Theoretical background and research question

Core practices have been proposed as a solution for the theory-practice gap in teacher education. They can be defined as domain-general, research-based teaching activities that appear in high frequency (McDonald et al., 2013). So far, there is no evidence-based consensus on how to structure teacher trainings to foster the acquisition of core practices best. Our DFG-funded research project ACTion addresses this question by bringing a prominent instructional approach to the teaching of core practices (i.e., the Learning Cycle, McDonald et al., 2013), with a prominent skill acquisition model from cognitive psychology (i.e., ACT-R theory, Anderson, 1982), in a dialogue. From this discussion, we conclude that core practice trainings should at least include the following phases: (1) a theory-based explanation, (2) a modelling, and (3) the opportunity to practice with students.

Our project focuses on “supporting students’ self-regulated reading of scientific texts” as domain of practice, which is instantiated by the evidence-based reading strategy training “Reciprocal Teaching” (Palincsar & Brown, 1984). RT comprises three core practices: “giving explanations”, “cognitive modelling” and “adaptive scaffolding”. In an experimental intervention study, we compared different training sequences. We assumed that RT can be acquired best in a training that includes the phases of (1) studying a theoretical explanation of RT, (2) studying a modelling, and (3) practicing RT with students.

Method

Our sample consists of 128 preservice teachers. We used a four-group between-subjects design with different combinations of instructional phases. The first group studied a theory-based videotaped explanation of RT, followed by a videotaped modelling of RT and then practiced RT with students. Each of the other groups lacked one of the training phases. To keep time on task constant, in those conditions where one of the phases was omitted, one of the realized phases (e.g., theory-based explanation, modelling) was studied twice. In the condition where practicing with students was omitted, pre-service teachers composed a written reflection about the explanation and modelling videos. One week later, we administered (a) a paper-pencil knowledge test, (b) a professional vision test comprising four short staged videos (c) a performance test which was videotaped and subsequently coded. In the performance test, preservice teachers enacted RT with a small group of secondary school students.

Results

The knowledge test showed that the group who studied the theory-based explanation of RT twice and practiced RT with students performed significantly better than the other groups, F(1, 123) = 4.52, p = 0.04, η2 = .04. The professional vision test showed that groups who studied a theory-based explanation and a modelling video of RT performed significantly better than the groups who either studied a theory-based explanation or a modelling video, F(1, 124) = 7.78, p = .006, η2 = .06. Our preliminary performance data analyses (currently 18% of the sample) suggest that the group who underwent all three phases of the core practices training spent significantly more time on explaining, F(1, 18) = 7.63, p = .013, η2 = .30, and modelling RT, F(1, 18) = 15.89, p < .001, η2 = .48, than the other groups.

Discussion

Hence, somewhat qualifying our initial assumption, the results suggest that different compositions of instructional phases have different implications for levels of skill acquisition. Professional vision benefitted most from a combined studying of theory-based explanation and modelling. The ability to perform RT competently benefitted most from the combined studying of theory-based explanation, modelling and practicing with students. Thus, depending on the goal of teacher training (e.g., fostering analytical abilities versus performing a core practice competently), different compositions of training sequences might be promising.

 
15:20 - 17:003-03: Lehrkräftemotivation und Unterrichtsgestaltung: Prozessorientierte Perspektiven
Ort: H03
 
Symposium

Lehrkräftemotivation und Unterrichtsgestaltung: Prozessorientierte Perspektiven

Chair(s): Rebecca Lazarides (Universität Potsdam, Deutschland), Markus Dresel (Universität Augsburg)

Diskutant*in(nen): Tina Seidel (Technische Universität München)

Die Motivation von Lehrkräften gilt als zentrale Voraussetzung für effektives Unterrichten sowie für die motivationale, sozio-emotionale und kognitive Entwicklung von Schüler:innen (Fives & Buehl, 2016). Während die Beziehungen zwischen Unterrichtsmerkmalen und Outcomes auf der Schülerseite bereits intensiv untersucht wurden (Holzberger et al., 2020; Praetorius et al., 2018), ist bisher noch weitreichend ungeklärt, über welche Transmissionsprozesse sich motivationale Merkmale von Lehrkräften auf Unterrichtsprozesse auswirken und welche Bedeutung dabei der konkreten Unterrichtssituation und dem (fachlichen) Kontext zukommt.

Das Symposium greift dieses Desiderat auf und führt verschiedene Beiträge eines informellen Forschungsnetzwerkes zusammen, deren Gemeinsamkeit in dem Ziel besteht, durch Untersuchung zeitlicher Veränderungsdynamiken, situationsspezifischer Interaktionen und prozessbezogener Zusammenhänge ein vertieftes Verständnis der Zusammenhänge zwischen Lehrkräftemotivation, Unterrichtsverhalten und Schüleroutcomes zu ermöglichen.

Der erste Beitrag (Kosubek et al.) untersucht anhand von Längsschnittdaten von Lehrkräften und Schüler:innen der Jahrgangsstufen 5 bis 9 in den Fächern Mathematik und Deutsch die Transmission der Motivation von Lehrkräften (Selbstwirksamkeit, Enthusiasmus) auf die Lernendenmotivation (Selbstkonzept, intrinsischer Wert) über multiple Dimensionen der Unterrichtsqualität (schülerperzipierte Klassenführung, konstruktive Unterstützung, kognitive Aktivierung) im Verlauf eines Schuljahres. Dabei steht besonders die Frage nach fachbezogenen Differenzen in den untersuchten Zusammenhängen im Vordergrund. Die Ergebnisse zeigen Transmissionseffekte der Lehrkraftmotivation auf die Motivation der Lernenden vermittelt über die wahrgenommene Unterrichtsqualität mit ähnlichen Ergebnismustern in Mathematik und Deutsch.

Der zweite Beitrag (Lauermann & ten Hagen) befasst sich im Rahmen einer Videostudie in Deutsch-als-Zweitsprache (DaZ) Klassen der Sekundarstufe mit den Zusammenhängen zwischen den schülerspezifischer Lehrkräftemotivation (z.B. Selbstwirksamkeit für das Unterrichten einzelner Schüler:innen), den akademischen Merkmalen einzelner Schüler:innen (z.B. Motivation) und Zeit, die Lehrkräfte im Gespräch mit einzelnen Schüler:innen verbringen. Die Studie zeigt, dass Lehrkräftemotivation keinen substantiellen Effekt auf die Gesprächszeit der Lehrkräfte mit einzelnen Lernenden hat. Gleichzeitig sprechen Lehrkräfte länger mit Schüler:innen, die sich in den Unterricht einbringen und deren Fähigkeiten in der deutschen Sprache von Lehrkräften als gering eingeschätzt werden.

Der dritte Beitrag (Frenzel et al.) untersucht im Rahmen einer Videostudie im universitären Kontext mittels KI-unterstützter Gesichtserkennung emotionale Transmissionsprozesse im Klassenraum. Hierbei wird dem Phänomen der Übertragung von Freude in der sozialen Interaktion zwischen Dozierenden und Studierenden nachgegangen, operationalisiert über den gemeinsamen mimischen Ausdruck von Freude. Die Befunde zeigen, dass die Übertragung positive Emotionen in Lehr-Lernsituationen ein wechselseitiger Prozess zwischen Lehrkräften und Lernenden ist. Von der Nachahmung positiver emotionaler Gesichtsausdrücke in den Interaktionen zwischen Lehrenden und Lernenden profitieren dabei vor allem die Lehrenden, die mehr Freude empfinden.

Der vierte Beitrag (Lazarides & Göllner) geht anhand von Daten der TALIS-Videostudie der Frage nach, inwiefern verbale (Sprache der Lehrkraft) und nonverbale Prozesse (motivierendes Lehrkräftehandeln) des Unterrichtshandelns mit Lehrkräftemotivation (Selbstwirksamkeit, Enthusiasmus) und Schüleroutcomes in Zusammenhang stehen und welche Potentiale dabei die Nutzung KI-basierter Methoden für die Analyse derartiger Prozesse bietet. Dabei wird konkret aufgezeigt, dass verbales und nonverbales motivierendes Lehrkräfteverhalten mittels KI-basierter Algorithmen und Methoden reliabel in Unterrichtsvideos identifiziert werden kann und Zusammenhänge zu Lehrkräftemotivation und motivierenden Aspekten der Unterrichtsqualität aufweist.

Die Beiträge des Symposiums befassen sich folglich alle mit Fragen der Prozessbezogenheit von Lehrkräftemotivation und Unterrichtshandeln. Die längsschnittlichen und prozessbezogenen Forschungszugänge ermöglichen es, den dynamischen und durch soziale Interaktionen und fachliche Kontexte geprägten Charakter der Zusammenhänge zwischen Lehrkräftemotivation und Lehrkrafthandeln im Unterricht zu berücksichtigen. Die Beiträge im Symposium tragen daher substantiell dazu bei, die Rolle von sozialem, fachbezogenen und situationalem Kontext für die Effekte von Lehrkräftemotivation auf Unterrichtshandeln und Schüleroutcomes im Kontext Schule und Hochschule besser zu verstehen.

 

Beiträge des Symposiums

 

Die Transmission der Lehrkraftmotivation auf die Lernendenmotivation in Mathematik und Deutsch: Eine Untersuchung der Unterrichtsqualität als vermittelnde Variable

Anne Kosubek1, Hanna Gaspard1, Cora Parrisius2, Ann-Kathrin Jaekel3, Richard Göllner3
1Technische Universität Dortmund, 2Pädagogische Hochschule Karlsruhe, 3Universität Tübingen

Theoretischer Hintergrund

Nach der Erwartungs-Wert-Theorie (Wigfield & Eccles, 2000) kann die Motivation von Lehrkräften und Lernenden über die Erfolgserwartung (z.B. Selbstwirksamkeit, Fähigkeitsselbstkonzept) und den zugeschriebenen Wert (z.B. Enthusiasmus, intrinsischer Wert) erklärt werden. Die Lehrkraftmotivation sollte sich auf die Unterrichtsqualität auswirken, welche wiederum mit der Lernendenmotivation verknüpft ist (Lazarides et al., 2023; Lauermann & ten Hagen, 2021). Die Qualität des Unterrichts lässt sich anhand der Basisdimensionen Klassenführung, konstruktive Unterstützung und kognitive Aktivierung bewerten (Praetorius et al., 2018). Bisherige Studien zur Transmission der Motivation von Lehrkräften und Lernenden über die Unterrichtsqualität liefern inkonsistente Befunde und fokussieren vorrangig auf Mathematik oder Naturwissenschaften (z.B. Bardach & Klassen, 2021; Dicke et al., 2021; Fauth et al., 2019; Rubach et al., 2023). Es mangelt an Längsschnittstudien sowie einer Untersuchung der Übertragbarkeit auf weitere Domänen.

Fragestellung

Daher soll in der vorliegenden Studie untersucht werden, a) inwiefern sich die Lehrkräftemotivation vermittelt über die wahrgenommene Unterrichtsqualität auf die Lernendenmotivation auswirkt und b) inwiefern diese Ergebnisse für die Unterrichtsfächer Mathematik und Deutsch generalisierbar sind.

Methode

Die Untersuchung basierte auf Längsschnittdaten von Schulklassen der Jahrgangsstufen 5-9 (T1) unterschiedlicher Schulformen in Baden-Württemberg. In Mathematik wurden 55 Lehrkräfte und 1085 Lernende sowie in Deutsch 45 Lehrkräfte und 846 Lernende zwei Mal im Abstand eines Schuljahres befragt. Die Lehrkräfte schätzten ihre Motivation (T1) anhand ihrer Selbstwirksamkeit (Mathematik α=.84/ Deutsch α=.80) und ihres Unterrichtsenthusiasmus (α=.86/.86) ein. Die fächer- und lehrkraftspezifischen Einschätzungen der Unterrichtsqualität durch die Lernenden (T2) erfolgten anhand der Basisdimensionen Klassenführung (Störungen: α=.85/.83; Regelklarheit: α=.68/.70), konstruktive Unterstützung (Feedback: α=.81/.80; Autonomieunterstützung: α=.71/.72) und kognitive Aktivierung (anspruchsvolle Aufgaben: α=.69/.72; sokratischer Dialog: α=.75/.76). Die Lernenden schätzten ihre fachspezifische Motivation (T1 & T2) in Bezug auf ihr Fähigkeitsselbstkonzept (α=.94/.90) und den intrinsischen Wert (α=.97/.96) ein. Mit Cross-Level-Mediationsanalysen (Pituch & Stapleton, 2012) wurden je 24 Modelle zur Transmission der Lehrkräftemotivation auf die Lernendenmotivation über die Unterrichtsqualitätsskalen in Mathematik und Deutsch unter Kontrolle der Ausgangswerte der Lernendenmotivation geprüft.

Ergebnisse & Diskussion

In Mathematik erwiesen sich 10 der 24 cross-level-indirekten Effekte als signifikant (p<.05) bzw. 11 als marginal signifikant (p<.10). Lernende von enthusiastischeren und selbstwirksameren Lehrkräften nahmen weniger Störungen wahr, welche wiederum mit höherem Fähigkeitsselbstkonzept und intrinsischem Wert zusammenhingen. Lernende von enthusiastischeren Lehrkräften berichteten zudem von stärkerer Regelklarheit, welche eine Zunahme in Fähigkeitsselbstkonzept und intrinsischem Wert der Lernenden erklärte. Zudem berichteten Lernende von enthusiastischeren und selbstwirksameren Lehrkräften häufiger von anspruchsvollen Aufgaben, welche mit einer höheren Motivation der Lernenden (beide Komponenten) zusammenhingen. Schließlich nahmen Lernende von selbstwirksameren Lehrkräften einen stärkeren Sokratischen Dialog wahr, wodurch ein Zuwachs im intrinsischen Wert erklärt werden konnte. Zusätzlich zu den cross-level-indirekten Effekten zeigten sich nur wenige, tendenziell negative indirekte Effekte auf der Klassenebene (p<.10).

In Deutsch zeigten sich 8 cross-level-indirekte Effekte als signifikant (p<.05) bzw. 12 als marginal signifikant (p<.10). Lernende von enthusiastischeren und selbstwirksameren Deutschlehrkräften berichteten von höherer Regelklarheit und infolgedessen von höherer Motivation (beide Komponenten). Lernende von selbstwirksameren Lehrkräften nahmen weniger Störungen im Unterricht wahr, was einen Zuwachs in Fähigkeitsselbstkonzept und intrinsischem Wert erklärte. Darüber hinaus stellten Lernende bei enthusiastischeren und selbstwirksamen Lehrkräften einen stärkeren Sokratischen Dialog fest, der mit höherem intrinsischen Wert zusammenhing. Lernende von enthusiastischeren Lehrkräften berichteten vermittelt über anspruchsvollere Aufgaben von einer höheren Motivation zu T2 (beide Komponenten). Diese Lernenden bemerkten eine stärkere Autonomieförderung und daraus resultierend einen erhöhten intrinsischen Wert. Auch in Deutsch waren nur wenige zusätzliche indirekte Effekte auf der Klassenebene sichtbar (p<.05).

Diese Ergebnisse sprechen für eine Transmission der Lehrkraftmotivation auf die Motivation der Lernenden vermittelt über die wahrgenommene Unterrichtsqualität. Insbesondere die Klassenführung und die kognitive Aktivierung spielen hierbei eine entscheidende Rolle, während die konstruktive Unterstützung trotz ihrer theoretischen Nähe zur Motivation nicht als vermittelnder Prozess fungiert. Bemerkenswerterweise sind sehr ähnliche Ergebnismuster in Mathematik und Deutsch zu erkennen.

 

Within-class associations between teachers’ student-specific motivations, students’ academic characteristics, and teacher talk in language-focused classes

Fani Lauermann1, Inga ten Hagen2
1Universität Bonn, 2Technische Universität Dortmund

Theoretical Background

Teaching requires complex and autonomous decision-making with limited resources such as instructional time (Kunter et al., 2013; Lauermann & Butler, 2021). For instance, teachers must manage their limited classroom time to attend to individual student needs, implement in-the-moment instructional adaptations, and may engage in differential treatment (Babad, 1993). Surprisingly, little is known about the psychological underpinnings of such complex teaching-related decisions.

Based on socio-cognitive theory (Bandura, 1997; Lauermann & Butler, 2021), the present study used multi-source, student-specific data to examine the within-class links between (i) students’ academic characteristics (i.e., ability and motivation, assessed via standardized tests, self-reports, and teacher ratings), (ii) teachers’ student-specific motivational beliefs (i.e., self-efficacy and enthusiasm for teaching individual students), and (iii) teachers’ allocation of student-specific teacher talk in German-as-a-second-language (GSL) classrooms (i.e., observed time the teacher talks to a particular student in videotaped classes). We focused on GSL classrooms because such classes require adaptive teaching (Otto et al., 2016). We focused on teachers’ student-specific talking time because it is an essential descriptor of teachers’ instructional behaviors in language-focused classes (Borg, 2006; Ellis, 2005).

Aims and Research Questions

We examined the interrelations between students’ academic characteristics and teachers’ student-specific motivational beliefs and their predictive effects on teachers’ student-specific talking time (RQ1-RQ2).

Method

Thirty-three GSL teachers and 309 secondary students participated in the [blinded] video study. Validated scales were adapted to refer to individual students (e.g., teachers’ self-efficacy and enthusiasm for teaching individual students). Students’ academic characteristics were assessed via self-reports (intrinsic motivation), teacher ratings (student engagement and language ability), and standardized tests (C-test of language ability). Teachers’ talking time was coded for videotaped classes.

Results and Conclusions

A multi-level path analysis tested the theorized within-class associations. First (RQ1), in a given classroom, students who actively participated in the class (i.e., high behavioral engagement) drew most of the teacher’s verbal attention. Low-achieving students received the most verbal attention when differences in behavioral engagement were controlled for. Second (RQ2), teachers felt most efficacious and enthusiastic about teaching students with high teacher-rated emotional engagement and language proficiency. The more efficacious and enthusiastic teachers felt about teaching a given student, the more time they spent talking to that student relative to other students in the same class. However, teachers’ student-specific self-efficacy and enthusiasm did not have incremental predictive effects on teachers’ talking time, controlling for students’ teacher-rated engagement .

Teachers’ within-class distribution of instructional time followed two key pathways. First, behaviorally engaged students appeared to draw their teacher’s verbal attention, indicating more student-directed teacher talk. Second, controlling for differences in students’ behavioral engagement, teachers spent more time talking to students they perceived as less proficient in German. Failure to account for both pathways may be a contributing factor to the mixed findings in prior research, according to which teachers pay more attention either to high-achieving (e.g., Decristan et al., 2020; Lipowsky et al., 2007) or low-achieving (Denessen et al., 2020; Pohlmann-Rother et al., 2018) students. The results underscore the importance of collecting student-specific and multi-source data to study teachers’ decision-making and classroom behaviors.

 

Joy is reciprocally transmitted between teachers and students: Evidence on facial mimicry in the classroom

Anne Frenzel1, Muhterem Dindar2, Reinhard Pekrun3, Corinna Reck1, Anton K.G. Marx1
1Ludwig-Maximilians-Universität München, 2Tampere University, 3University of Essex, UK, Ludwig-Maximilians-Universität München, Australian Catholic University, Australia

Theoretical Background

Teaching and learning are inherently social and interactive, and they can involve strong emotional experiences among teachers and students alike (Harvey et al., 2012; Pekrun & Linnenbrink-Garcia, 2014; Pekrun et al., 2017). The critical importance of positive emotions for classroom functioning is well established (e.g., Dewaele et al., 2019; Frenzel et al., 2021; Graesser, 2020; Loderer et al., 2020) and teachers and learners’ trait-based joy during class has been shown to covary (e.g., Frenzel et al., 2018; Frenzel et al., 2009). This has been interpreted as evidence of emotional contagion across teachers and learners. However, no research to date seems to have explored in-situ processes of emotional contagion, thus the social dynamic of positive emotion transmission during instruction is poorly understood.

Aims and Research Question

A key proposition of the present contribution is that macro-level covariation between teachers’ and students’ self-reported habitual joy experiences is fueled, in a bottom-up fashion, by micro-level covariation: That is, by repeated instances of joint joy experiences among teachers and students during instruction. We suggest that the face is a particularly important channel through which teachers’ and students’ emotional experiences are communicated to one another. Thus, mimicry of facial joy expressions should be one important mechanism that drives such emotional convergence among teachers and students (Hess, 2021; Hess & Fischer, 2014; Talebzadeh et al., 2020). The present study seeks to provide evidence of facial joy mimicry between teachers and students during real-life instruction, and explore its relations with teachers’ and learners’ subjective session joy.

Method

Participants were 13 university instructors and 69 of their students. They self-reported on their session joy answering single items directly after the session (”In the past 45 minutes, I enjoyed class/teaching” for students/instructors). Their joy expressions were captured through a multi-camera setup and submitted to AI-based automated facial emotion coding, using the iMotions software platform version 7.1 (iMotions, 2019) in combination with the automated facial expression coding module Emotient FACET which is a commercialized version of the CERT software (Littlewort et al., 2011). FACET is based on the Facial Action Coding System (FACS) by Ekman et al. (2002). Facial mimicry within each teacher–student dyad was determined through cross-recurrence quantification analysis (CQA, Coco & Dale, 2014). In CRQA, two time series are linked (here: instructor and student), to quantify both perfect co-occurrence (i.e., both instructor and student expressing joy at the exact same time) as well as lagged cross-recurrence (i.e., the student expressing joy a little later than the instructor or vice versa). We used CRQA to (1) identify a critical time window for above-chance (co-)occurrence of teacher and students joy expressions, and (2) to quantify, for each dyad, their degree of joy mimicry .

Results and Conclusions

Our key results showed that students’ facial expressions of joy cross-recurred substantially above chance level (p < .003) during a time window of about -2s and +3s seconds relative to the instructors’ expressions. This implies that within this critical lag window, there was substantially above-chance mimicry of instructor and student joy expression, with either students being first in expressing joy and followed by their instructors’ joy expression, or vice versa. Further, post-session self-reported joy was significantly positively correlated with the teacher–student dyad mimicry quantity for teachers, but not for students. These findings suggest that joy transmission between teachers and students is reciprocal process, and that teachers seem to emotionally benefit from their students’ joy mimicry.

 

Prozessbezogene Perspektiven auf Motivierung im Unterricht: KI-attestierte Analysestrategien

Rebecca Lazarides1, Richard Göllner2
1Universität Potsdam, 2Universität Tübingen

Theoretischer Hintergrund

Die Motivation von Lehrkräften ist eine zentrale Voraussetzung für qualitätsvolles Unterrichten - allerdings sind die Mechanismen, die dazu führen, dass eine hohe Lehrkräftemotivation zu gutem Unterrichten beiträgt, aktuell ungeklärt (Bardach & Klassen, 2021). Die mangelnde Evidenz ist maßgeblich darin begründet, dass eine prozessnahe Beschreibung der motivationalen Transmission im Klassenzimmer naturgemäß schwer zu erreichen ist. Mit Blick auf die Lehrkraftmotivation ist davon auszugehen, dass sich die Motivation einer Lehrkraft in spezifischen Lehr-Lernsituationen durch verbales und non-verbales Verhalten auf die Motivierung der Lernenden im Unterricht überträgt (Frenzel et al., 2021). Existierende Erfassungsansätze, wie etwa klassische Unterrichtsbeobachtungen, bieten nach wie vor keine hinreichend guten Ansätze zur Erfassung solcher Prozessmerkmale. Vor diesem Hintergrund stellen KI-basierte Verfahren vielversprechende Ansätze dar, um prozessnahe Informationen in effizienter Weise zu verarbeiten und im Rahmen der Unterrichtsprozessforschung zu nutzen

Fragestellung

Im vorliegenden Beitrag werden die Forschungsbereiche der Lehrkräftemotivationsforschung und der Unterrichtsforschung zusammengeführt, um der Frage nachzugehen, inwiefern KI-basierte Erfassungsmethoden effektiv eingesetzt werden können, um die Prozesshaftigkeit von Unterrichtshandeln und den Zusammenhängen dieses Handelns mit Lehrkräftemotivation zu untersuchen. Dabei werden zwei Studien vorgestellt, die KI-basierten Verfahren zur Erfassung non-verbaler als auch verbaler Prozessmerkmale der Unterrichtsmotivation anwenden.

Methode

In Studie 1 wurde ein Algorithmus zur Kodierung motivierenden Unterrichtsverhaltens von Lehrkräften in Unterrichtsvideos entwickelt. Wir fokussieren das Konstrukt der ‚non-verbal immediacy‘ (NVI), das Ähnlichkeiten zum Lehrkräfteenthusiasmus aufweist (Mehrabian, 1968). Analysiert wurden die in Deutschland erhobenen Daten der TALIS-Studie (Teaching and Learning International Survey; OECD, 2020). Zur Entwicklung des Computervision-Algorithmus, der eine Quantifizierung der NVI ermöglicht, wurden Videodaten von 47 Klassen einbezogen. Zur merkmalstreuen Erfassung des Konstrukts wurden Subalgorithmen wie „Gestenintensität“ und „physiologische Distanz“ genutzt. Datengrundlage für die Klassifikatoren dieser Dimensionen bildeten 3500 Einzelframes, die aus den Unterrichtsvideos extrahiert und von drei geschulten Ratern bewertet wurden. Die Analyse des Gesichtsausdrucks wurde mit Hilfe des Toolkits OpenFace durchgeführt, für die Extraktion der Körperhaltung wurde das HRNet Convolutional Neural Network verwendet.

In Studie 2 wurden Unterrichtstranskripte der TALIS Videostudie Deutschland anhand von drei aufeinander folgenden Schritten ausgewertet. Erstens wurde auf der Grundlage der Unterrichtstranskriptionen 1536 semantische Textfeatures mittels des sematischen Embeddings (text-embedding-ada-002) extrahiert. Anschließend wurden die sprachlichen Informationen der Unterrichtssegmente mittels einer k-Means Clusteranalyse gruppiert. Zweitens wurde die Spezifität der semantischen Textfeatures mittels eines Promptings geprüft. Hierzu wurden konkrete Definitionen verschiedener Unterrichtsqualitätsmerkmale vor der Featureextraktion und der daran anschließenden Clusteranalyse verwenden. Betrachtet wurden Unterrichtsqualitätsmerkmale, die für die Motivierung von Lernenden von besonderer Bedeutung sind (emotionales Klima, Diskursqualität, Anregungsgehalt, multiple Lösungswege). Abschließend wurden Clusterunterschiede bezüglich der externen Unterrichtsqualitätsbeurteilungen anhand eines regressionsanalytischen Verfahrens ermittelt.

Ergebnisse und Diskussion

Studie 1. Die Inter-Rater-Reliabilität (ICC(3,3)) der NVI-Ratings betrug über alle Clips hinweg im Durchschnitt .684, was auf konsistente NVI-Bewertungen hinweist. Die Dimension "Gestenintensität" wies mit ICC(3,3) = .948 eine hohe Inter-Rater-Reliabilität auf. Die Dimension "Körperliche Distanz" wies einen ICC(3,3) von .684 auf. Generalisiert auf Lehrkräfte, die nicht Teil der Trainingsdaten waren, erreicht der entwickelte NVI-Algorithmus eine Accuracy von .620. Aktuell werden Zusammenhänge zwischen den NVI-Indizes, Lehrkräftemotivation und Schüleroutcomes berechnet.

Studie 2. Die Clusteranalysen der extrahierten Textfeatures zeigten, dass ein Modell mit vier Clustern bzw. Mustern motivierender Sprache die sprachlichen Unterrichtssegmente am besten beschreiben konnte. Die regressionsanalytischen Ergebnisse zeigten, dass die Cluster 1% bis 8% Prozent der Beurteilungsunterschiede zwischen den Segmenten einer Unterrichtsstunde und 4% bis 17% Beurteilungsunterschiede zwischen den Unterrichtsstunden vorhersagen konnten. Dabei zeigten die einzelnen Cluster eine hohe Spezifität bezüglich der vorherzusagenden Qualitätsmerkmale. Demgegenüber ergab eine geprompteten Featureextraktion zunächst keinen weiteren Vorteil, wobei unterschiedliche Möglichkeiten des Promptings weiterführend geprüft werden.

Die Ergebnisse zeigten zusammenfassend, dass genuine Sprachmodelle und Computervision-Algorithmen durchaus vielversprechend sind, um relevante Motivatoren des Unterrichts zu identifizieren und damit die in theoretischen Modellen zu Lehrkräftemotivation und Unterricht beschriebene Prozessebene zu untersuchen.

 
Datum: Dienstag, 19.03.2024
10:30 - 12:104-03: Studienunabhängige Lehrtätigkeit im Kontext von Lehrkräftemangel – Empirische Befunde aus Deutschland und Österreich
Ort: H03
 
Symposium

Studienunabhängige Lehrtätigkeit im Kontext von Lehrkräftemangel – Empirische Befunde aus Deutschland und Österreich

Chair(s): Nele Kampa (Universität Wien, Österreich)

Diskutant*in(nen): Raphaela Porsch (Otto-von-Guericke-Universität Magdeburg)

Das eingereichte Symposium widmet sich verschiedenen Auswirkungen des Früheinstiegs von Lehramtsstudierenden in den Schuldienst als Maßnahme gegen den akuten Lehrkräftemangel. Der Lehrkräftemangel ist nicht nur ein relevantes Thema für die Bildungsforschung. Auch die Lehramtsausbildung und die Bildungspolitik wird in den kommenden Jahren weiterhin mit dieser Herausforderung konfrontiert sein. Auswirkungen der neuen Maßnahme Früheinstieg gegen den Lehrkräftemangel wurden bisher noch nicht untersucht. Dieser relevanten Forschungslücke widmen sich die drei Beiträge von unterschiedlichen Perspektiven. In Österreich wird der Früheinstig bereits seit einigen Jahren durchgeführt. Daher geben zwei Beiträge einen Einblick in Auswirkungen in Österreich (Kampa sowie Helm & Hagenauer). Diese beiden Beiträge werden als Diskussionsgrundlage für aktuelle Entwicklungen im deutschen Schulsystem herangezogen. Ein zweiter Beitrag gibt wiederum den ersten Einblick zur Situation in einem deutschen Bundesland (Winter et al.), so dass es möglich wird, erste Parallelen bezogen auf die Bedingungen und Auswirkungen zu ziehen.

Im ersten Beitrag werden die Auswirkungen des Früheinstiegs auf die Professionalisierung der angehenden Lehrkräfte in Österreich untersucht. Er macht deutlich, dass der Früheinstieg verschiedenste negative Auswirkungen auf u.a. die Einstellung zur Theorie-Praxis-Verzahnung, die Freude am Studium oder die Einschätzungen der Studierenden bezüglich ihrer Kompetenzen hat. Weitere Analysen fokussieren auf einen Vergleich von Studierenden, die ein Stundendeputat und eine Betreuung gemäß den SWK-Empfehlungen zum Umgang mit dem akuten Lehrkräftemangel (SWK, 2023) haben, im Vergleich zu Studierenden, die diese Unterstützung an ihren Einsatzschulen nicht erhalten. Dieser Vergleich zeigt, dass nur ein geringer Teil der negativen Auswirkungen auf die Professionalisierung durch Einhaltung dieser Empfehlungen abgefangen werden kann. Somit liefert der Beitrag eine explizit bildungspolitische Perspektive für den aktuellen Diskurs.

Der zweite Beitrag widmet sich stärker den Anforderungen und Ressourcen auf Basis des Job Demands-Resources Modells (Bakker & Demerouti, 2014) im Zusammenhang mit der Doppelrolle von Früheinsteiger:innen. Während die Anforderungen Belastungserleben begünstigen, setzen Ressourcen motivationale Prozesse frei. Der Beitrag unterstreicht, dass die Studierenden in ihrer Doppelrolle eine starke Belastung wahrnehmen. Die Studierenden nehmen das Studium allerdings als eine stärkere Belastung war als den frühzeitigen Einsatz im Schuldienst. Positiv wirken sich soziale Ressourcen aus, zu welchen die Unterstützung im Kollegium zählt. Die Ergebnisse decken sich mit bzw. komplementieren damit die Befunde des ersten Beitrags. Zum einen zeigt auch dieser Beitrag, die erhöhte Belastung von Früheinsteiger:innen. Zum anderen begünstigen die Unterstützungsstrukturen im Kollegium (wie z.B. ein Mentoring) die Motivation der Studierenden. Es wird erneut deutlich, dass sich der Früheinstieg negativ auf den Studienerfolg auswirken kann.

Mit dem dritten Beitrag lenkt das Symposium den Blick nach Deutschland. Die hier vorgestellte Studie stellt die erste Untersuchung der Maßnahme Früheinstieg gegen den Lehrkräftemangel in Deutschland dar. Somit ist für ein Bundesland erstmals eine Bestandaufnahme zum Ausmaß des Einsatzes von Früheinsteiger:innen möglich, sodass eine Diskussion der Vergleichbarkeit und somit Relevanz der österreichischen Studien für den deutschen Kontext ermöglicht wird. Die Studie gibt zunächst einen deskriptiven Einblick in das Ausmaß und die Tätigkeiten der Studierenden an Schulen. Der prozentuale Anteil von Studierenden ist hierbei in beiden Ländern (Österreich und Niedersachsen) durchaus vergleichbar. Die Früheinsteiger:innen unterrichten jedoch mit einem geringeren Stundendeputat. Die Studie zeigt, dass die Empfehlungen der SWK (2023) in Niedersachsen derzeit nur bedingt eingehalten werden. So gaben nur ungefähr ein Drittel der studentischen Vertretungslehrkräfte an, bei der Tätigkeit betreut zu werden. Weiterhin unterrichten rund zwei Drittel der Lehramtsstudierenden fachfremd.

Die Beschreibung macht deutlich, dass das Symposium insbesondere von dem Einblick in zwei Länder zu einer Maßnahme gegen den akuten Lehrkräftemangel profitiert. Sie geben Aufschluss auf die vielfältigen Herausforderungen in der Schule, aber eben auch bezogen auf das Studium und die Professionalisierung der zukünftigen Lehrkräfte.

 

Beiträge des Symposiums

 

Auswirkungen des Früheinstiegs auf die Professionalisierung von Lehrkräften

Nele Kampa
Universität Wien, Österreich

Der Lehrkräftemangel ist sowohl eine aktuelle Herausforderung im Bildungswesen (z.B. Der Standard, 2023), als auch ein wiederkehrendes Phänomen (Boecker & Drahmann 2016). Prognosen lassen jedoch vermuten, dass die Bildungspolitik in den kommenden Jahrzehnten mit einer Verschärfung der Situation konfrontiert sein wird (Klemm, 2022). Der Lehrkräftemangel hat zu vielfältigen bildungspolitischen Maßnahmen geführt. Neben dem Quer- und Seiteneinstieg zum sogenannten Früheinstieg: dem vermehrten Einsatz von Lehramtsstudierenden im Bachelor und Master während ihres Studiums an Schulen. Welche (nicht) intendierten Auswirkungen diese Maßnahme hat, ist noch nicht zufriedenstellend untersucht. Lediglich für die Schweiz liegen erste Studien vor (Bäuerlein et al., 2018; Kreis & Güdel, 2023; Scheidig & Holmeier, 2021). Dort arbeitete rund die Hälfte der Studierenden mit durchschnittlich 12 Stunden pro Woche an Schulen, die Hälfte fachfremd. Nur 18 % der Studierenden geben an, bei ihrer studienunabhängigen Tätigkeit in der Schule betreut zu werden. Lag eine Betreuung vor, hatte dies positive Auswirkungen auf deren Informiertheit und den erkundenden Charakter ihrer Tätigkeit (Bäuerlein et al., 2018). Die Studierenden übernehmen neben ihrer Unterrichtstätigkeit Aufgabenfelder wie Betreuung und integrative Förderung (Kreis & Güdel, 2023). Negative Auswirkungen auf die Einschätzungen des Studiums lassen sich nur in einem sehr geringen Ausmaß finden (Scheidig & Holmeier, 2021).

In den Empfehlungen „Zum Umgang mit dem akuten Lehrkräftemangel“ die Ständigen Wissenschaftlichen Kommission der Kultusministerkonferenz (SWK, 2023) in Deutschland wird unter bestimmten Bedingungen der Einsatz von Studierenden zur Unterstützung des Lehrpersonals als eine Maßnahme benannt. Die Bedingungen umfassen u. a. ein Minimum von 10 Unterrichtsstunden sowie die Arbeit zusammen mit einer*einen Mentor*in an der Schule. Wir haben mit unserer Studie die Möglichkeit, diese Bedingungen in Österreich auf deren Auswirkungen auf verschiedenste Qualitätsmerkmale der Professionalisierung hin zu prüfen und untersuchen:

In welchem Umfang werden die Studierenden an den Schulen eingesetzt?

Hat eine Anstellung negative Auswirkungen auf das Stressempfinden und eine qualitätsvolle Professionalisierung?

Führen die beschriebenen Bedingungen der SWK-Empfehlungen zur Abpufferung dieser negativen Auswirkungen?

Im Frühjahr 2023 wurde die Online-Fragebogenstudie „Studium & Schule“ an neun Universitäten und Pädagogischen Hochschulen in Österreich durchgeführt. Dies führte zu Daten von 1643 Lehramts-Studierenden, von denen bereits 618 als Lehrkraft arbeiteten. Die Studierenden beantworteten bereits bestehende (z.B. PALEA) Fragekomplexe zu deren Unterrichtstätigkeit, zur Einschätzung bezüglich ihres Studiums sowie zu deren Einsatz in den Schulen. Bezüglich der möglichen negativen Auswirkungen sowie der Abpufferung durch Einhaltung der SWK-Empfehlungen führten wir für Indikatoren zu den drei Themenkomplexen mit t-Tests (Studierende mit vs. ohne Früheinstieg) und Regressionsanalysen (nur Früheinsteiger*innen) durch. Unabhängige Variablen waren Anzahl der Stunden (weniger vs. mehr als 10) sowie die Bereitstellung einer:eines Mentor:in an der Schule

In Österreich werden die Studierenden mit durchschnittlich 16 Unterrichtsstunden angestellt (SD = 6), was zu einer wöchentlichen Gesamtarbeitszeit von 33 Stunden führt (SD = 16). Die t-Tests zeigten, dass die Früheinsteiger:innen bezüglich aller Indikatoren negativere Angaben machten. Die Regressionsanalysen zeigten jedoch, dass eine Anstellung mit 10 oder weniger Stunden (im Vergleich zu mehr als 10 Stunden) das Stresserleben (β=.15) verringert. Die Bereitstellung einer:eines Mentor:in von Seiten der Schule wirkt sich positiv auf die Selbstwirksamkeit im Beruf der Früheinsteiger*innen (β=.12), die kritisch-konstruktive Auseinandersetzung mit dem Lehrberuf (β=.11) sowie auf die Motivation, im Beruf zu bleiben (β=.09) aus. Kein Abpuffern ergab sich für die Indikatoren Verständnis des Theorie-Praxis-Verhältnisses, Sicherheit der Berufswahl, Freude am Studium, eigene Einschätzung der Kompetenzen im Fach, Interesse an den Bildungswissenschaften sowie Einschätzungen zum eigenen Umgang mit Herausforderungen.

Die Studierenden werden somit in Österreich mit größerem Stundenumfang als von der SWK empfohlen angestellt. Die Tätigkeit wirkt sich wiederum negativ auf die Professionalisierung aus. Diese kann nur teilweise durch die Bedingungen, wie sie von der SWK formuliert wurden, abgepuffert werden. Auf der Tagung werden diese Ergebnisse bezüglich des Einsatzes von Studierenden an Schulen diskutiert.

 

Anforderungen und Belastungen von Lehramtsstudierenden im Schuldienst

Christoph Helm1, Gerda Hagenauer2
1Johannes Kepler Universität Linz, 2Paris Lodron Universität Salzburg

Forschungsfrage

Steigende Pensionierungen, Schüler*innenzahlen und Teilzeitbeschäftigungen führen aktuell auch in Österreich zu einem deutlichen Mangel an Lehrkräften (Huber et al., 2023). Dieser führte dazu, dass bereits jeder zweite Bachelorstudierende an einer Schule unterrichtet. Aufbauend auf das Job Demands-Resources Modle (JD-R) untersucht die Befragungsstudie, jene Anforderungen, Belastungen, Ressourcen und Motivationen die Studierende erleben, wenn sie ihre doppelte Rolle als Studierende und Lehrer*innen ausbalancieren.

Theoretischer Rahmen

Das der Studie zugrunde gelegte JD-R (Bakker & Demerouti, 2014) beschreibt zwei parallel ablaufende Prozesse: Einerseits wird angenommen, dass Anforderungen die Belastung erhöhen und somit durch Erschöpfung zu gesundheitlichen Einbußen führen. Andererseits wird angenommen, dass Ressourcen einen motivationalen Prozess hervorrufen und damit einen positiven Einfluss auf die Gesundheit ausüben (Bakker & Demerouti, 2007). Weiters wird davon ausgegangen, dass Anforderungen und Ressourcen nicht nur einen eigenständigen Einfluss auf das Wohlbefinden und die Zufriedenheit von Personen haben, sondern auch miteinander interagieren, d.h. sich gegenseitig beeinflussen (Bakker & Demerouti, 2014). In der vorliegenden Studie werden die Annahmen des JD-R Modells im Kontext des frühzeitigen Berufseinstiegs von angehenden Lehrkräften empirisch geprüft.

Methode

An der Onlinebefragung nahmen 484 Lehramtsstudierende im Studienverbund Mitte (Oberösterreich/Salzburg) teil. 296 Studierende gaben an, als Lehrkraft in einer Schule tätig zu sein (43% Bachelorstudierende, durchschnittliche Lehrverpflichtung an der Schule: 15,42 Stunden bzw. ~75%-Anstellung). Der Onlinefragebogen enthielt Selbsteinschätzungsskalen zu den wahrgenommenen Anforderungen und Belastungen, den Ressourcen und der Motivation für den Lehrer*innenberuf sowie zum allgemeinen Wohlbefinden. Die Prüfung des JD-R erfolgt mittels Strukturgleichungsmodellierung.

Ergebnisse

Die univariaten Analysen zeigen, dass die Doppelrolle von den Studierenden als sehr belastend wahrgenommen wird, wobei die Anforderungen im Studium als signifikant belastender bewertet werden als jene im Schuldienst. Rund 60% der Befragten fühlen sich durch das Studium ausgebrannt; während sich nur 17% durch den Schuldienst ausgebrannt fühlen. Im Schuldienst selbst wird die fehlende Schülermotivation und -disziplin als stärkste Herausforderung beschrieben. Hinsichtlich der Ressourcen zur Bewältigung dieser Anforderungen werden von den Studierenden soziale Ressourcen (Lehrerkollegium, Familie) hervorgehoben. Aber auch die Wahrnehmung der schulischen Arbeit als sinnstiftend und wertschätzend hilft beim Bewältigen der Anforderungen.

Die multivariaten SEM-Analysen bestätigen die Annahmen des JD-R: Berichtete Anforderungen im Schuldienst und Studium sagen die wahrgenommenen Belastungen in eben diesen beiden Bereichen signifikant vorher (β = .504**/.475**). Gleichzeitig sind die im Schuldienst und Studium erlebten Ressourcen prädiktiv für die berichtete Motivation (β = .838**/.872**). Schließlich sagt die Motivation die Zufriedenheit der Studierenden im Studium und im Schuldienst vorher (β = .754**/.385**), während die Belastung widererwarten nicht im Zusammenhang mit der Zufriedenheit steht. Auch das allgemeine Wohlbefinden der Studierenden wird ausschließlich von den berichteten Anforderungen im Schuldienst und Studium vorhergesagt (β = -.418**/-.568**), nicht aber von den anderen JD-R-Komponenten.

Diskussion

Die Studienergebnisse legen nahe, dass Studierende zwar hoch motiviert ihrer Tätigkeit als Lehrperson nachgehen, sie aber gleichzeitig auch durch die zu erfüllende Doppelrolle überfordert sind. Dies deckt sich mit der TALIS-Studie (Schmich et al., 2020).

Im Einklang mit bestehenden Studien (Hagenauer et al., 2018; Núñez-Regueiro et al., 2023; Scheidig & Holmeier, 2022) zeigt sich, dass Studierende, die bereits im Schuldienst tätig sind, das Studium als sehr belastendes Moment einstufen, während die schulischen Erfahrungen überwiegend als Ressource wahrgenommen werden. So fühlt sich ein hoher Anteil als „kompetent“ im Schuldienst, was sich mit der Studie von Bach & Hagenauer (2022) deckt.

Gezielte Maßnahmen sind notwendig: (1) Das Zeitmanagement beim Berufseinstieg sollte besser vermittelt werden, da Erwartungen und Realität oft stark abweichen. (2) Das Ausmaß der Unterrichtstätigkeit, die berufsbegleitend ermöglicht wird, sollte begrenzt werden. (3) Hochschulen müssen durch digitale Formate und Anerkennung von Praxiserfahrungen flexibler werden. (4) Zudem sollten Hochschulen die Integration von Theorie in die Praxis forcieren. (5) Schließlich ist soziale Unterstützung beim Berufseinstieg entscheidend (Prenzel et al., 2021).

 

Unterrichten neben dem Studium. Eine Bestandsaufnahme hinsichtlich der studienunabhängigen Vertretungslehrkrafttätigkeit von Lehramtsstudierenden in Niedersachsen

Isabelle Winter, Christian Reintjes, Sonja Nonte
Universität Osnabrück

Zur Bewältigung des akuten Lehrkräftemangels empfiehlt die SWK (2023) die Entlastung und Unterstützung der Lehrkräfte durch Studierende sowie weitere formal nicht (vollständig) qualifizierte Personen. Genauer empfiehlt die SWK (2023) die Übernahme bestimmter Aufgaben von Lehrkräften durch Lehramtsstudierende mit ausreichender Qualifizierung und Begleitung, wie beispielsweise die Korrektur von Leistungsüberprüfungen. Zudem soll sich die Einstellung auf die Studierenden, die sich bereits im Master befinden, beschränken und einen Umfang von 10 Unterrichtsstunden pro Woche nicht überschreiten. Weiterhin wird eine Definition klarer Anforderungsprofile für einen konkreten Einsatz sowie die Zuordnung jedes unterrichtenden Lehramtsstudierenden zu einer erfahrenen Lehrkraft zur gemeinsamen Planung des Unterrichts (Mentoring) empfohlen. Lehramtsstudierende, die sich erst im Bachelor befinden, sollen demnach ausschließlich assistierende Funktionen in unmittelbarer Regie einer Lehrkraft ausüben (SWK 2023).

In den Empfehlungen zur Begegnung des akuten Lehrkräftemangels der SWK (2023) wird im gleichen Zuge auch angegeben, dass über Lehramtsstudierende, die bereits als Vertretungslehrkräfte an Schulen tätig sind, bislang kaum etwas bekannt sei. Zudem sei auch über den spezifischen Einsatz sowie die Unterstützung der Vertretungslehrkräfte wenig bekannt. So sei weder klar, wie viele Studierende eigenverantwortlich unterrichten, noch in welchem Ausmaß und in welchen Fächern sie dies tun oder, ob sie dabei betreut werden (vgl. SWK 2023).

Daher hatte die vorliegende explorative Studie zum Ziel, einen erstmaligen und differenzierten Einblick in die aktuelle Beschäftigungssituation von Studierenden an Schulen in Niedersachsen vorzunehmen. In diesem Beitrag folgt nach einer Bestandsaufnahme vorliegender (inter-)nationaler empirischer Befunde eine Darstellung des Studiendesigns sowie ausgewählter Befunde zu der Tätigkeit innerhalb der Schule neben dem Studium. Dabei wurden folgende Forschungsfragen untersucht:

1. Wie viele Studierende arbeiten während des Studiums in welchem Umfang, unter welchen Bedingungen und mit welchen Tätigkeiten in der Schule?

a) Inwieweit unterrichten Studierende fachfremd?

b) Welche Betreuung erhalten Studierende?

c) In welchem Stadium im Hinblick auf den professionsspezifischen Studienfortschritt befinden sich die studentischen Vertretungslehrkräfte im Studium?

2. Wie schätzen Studierende die Wirkung ihrer Unterrichtstätigkeit neben dem Studium auf ihren Professionalisierungsprozess ein?

3. Unterscheiden sich Studierende mit und ohne Tätigkeit in der Schule hinsichtlich der Sicherheit, später als Lehrkraft tätig sein zu wollen?

Die Daten wurden im Wintersemester 2022/2023 an sechs Hochschulen oder Universitäten im Bundesland Niedersachsen erhoben. Es handelte sich um eine freiwillige Online-Befragung, an der insgesamt 943 Studierende teilnahmen. Der Fragebogen enthielt teils bestehende, teils adaptierte, teils neu entwickelte und validierte Skalen und Items zu u. a. den folgenden Aspekten: soziodemografische Angaben der Studierende, Angaben zum Studium, Angaben zur Erwerbstätigkeit (außerhalb und innerhalb der Schule), Informationen zur Tätigkeit innerhalb der Schule, Angaben zur Zukunft.

Die Ergebnisse zeigen, dass von 943 Studierenden 35 Prozent einer Tätigkeit innerhalb der Schule nachgehen. Von den 325 Studierenden mit Schultätigkeit sind 58 Prozent als Vertretungslehrkraft tätig (n = 189, Stunden/Woche im Semester: M = 11.53, SD = 5.58). Dabei gaben 35 Prozent der studentischen Vertretungslehrkräfte an, ausschließlich in ihren Studienfächern zu unterrichten. Folglich unterrichten rund zwei Drittel der studierenden mindestens in einem Fach fachfremd. Darüber hinaus gab ein Drittel an, bei der Tätigkeit als Vertretungslehrkraft betreut zu werden. Die studentischen Vertretungslehrkräfte schätzen den Profit von der Tätigkeit als Lehrkraft für das Studium hoch ein, wobei sie den Profit von ihrem Studium für die Tätigkeit in der Schule moderat einschätzen. Studierende, die als Vertretungslehrkraft tätig sind, und solche, die es nicht sind, unterscheiden sich bei Kontrolle von Alter, Geschlecht und Hochschulsemester signifikant in der Sicherheit, später als Lehrkraft tätig sein zu wollen (M = 1.26, SD = 0.61 vs. M = 1.49 , SD = 0.77; F(1, 910) = 18.82, p < .001, ηp2 = 0.02).

 
13:10 - 14:505-03: How to Promote Adaptive Teaching and Learning with Educational Technology?
Ort: H03
 
Symposium

How to Promote Adaptive Teaching and Learning with Educational Technology?

Chair(s): Leonie Sibley (Universität Tübingen, Deutschland)

Diskutant*in(nen): Frank Fischer (Ludwig-Maximilians-Universität München)

Adaptive teaching and learning have been discussed in educational practice for several decades (Corno, 2008; Tetzlaff et al., 2021). The idea of adaptive teaching is to tailor teaching practices towards students’ pre-requisites to enhance their learning outcomes. Compared to traditional one-size-fits-all approaches, adaptive teaching radically changes the mode of teaching, as it puts students’ needs in the focus (Corno, 2008; Karst et al., 2022; Tetzlaff et al., 2021). Students have different cognitive (e.g., prior knowledge), meta-cognitive (e.g., monitoring one’s own learning process), and motivational (e.g., interest) pre-requisites which require distinct instructional strategies. In the context of adaptive teaching, learning not only comprises the accumulation of knowledge, which is often measured by learning gains, but also enhancements of self-regulation skills that enable students to monitor and regulate their learning strategies.

Adaptive teaching comprises a reciprocal loop (Corno, 2008; Tetzlaff et al., 2021) that contains formative assessments, micro-, and macro adaptions: With initial formative assessments, relevant learning pre-requisites are assessed (e.g., concerning knowledge, self-regulated learning, motivation). Based on the formative assessment, teaching or instruction is adapted on a macro level (e.g., tasks with different levels of difficulty) or on a micro level (e.g., specific moment-to-moment adaptations, such as feedback or additional support).

Providing students with adaptive support during their learning process is a continuing challenge for teachers, as they must iteratively assess students’ current learning progress to provide adaptations on the macro and the micro level. Educational technologies can help to support adaptive teaching and to realize adaptive learning settings. Online quizzes for instance allow a formative diagnosis of students’ current understanding with immediate feedback of correct and wrong answers.

We present a symposium with three contributions that focus on different approaches to explore the effect of technology-based adaptive learning and teaching. Contribution 1 provides an overview by presenting a systematic thematic review of the conceptualizations and operationalizations of adaptive teaching and learning, highlighting educational technology as one key constituent of adaptive teaching and learning. Contribution 2 presents a field study, in which researchers and teachers collaboratively designed and implemented technology-based adaptive teaching units in real classroom scenarios over a duration of three to four weeks. The authors investigated students’ cognitive (learning) and meta-cognitive (monitoring accuracy) outcomes. Contribution 3 demonstrates an adaptive app which was tested in a longitudinal study with secondary school students. The app was adaptive to students’ individual lives and effects on students’ learning outcomes and behavior were investigated.

To summarize, our symposium provides a systematic overview of adaptive conceptualizations, presents good practice examples for how to design technology-based adaptive teaching units, and showcases a specific adaptive tool for students. The symposium will be discussed by an expert of adaptive teaching and learning with educational technologies which will enrich and expand the three contributions.

 

Beiträge des Symposiums

 

Adaptive Learning, Instruction, and Teaching: A Systematic Thematic Review to Pinpoint the Common Core and Distinguishing Features of a Big Educational Idea

Sarah Bichler, Katharina Bach, Sarah Hofer
Ludwig-Maximilians-Universität München

Personalized, individualized, differentiated, and adaptive learning, instruction, and teaching (LIT) are big educational ideas that are an alternative to the prevailing one-size-fits-all educational model of many school systems (Ohanian, 1999). These approaches have grown popular in recent years due to technological innovations and affordances that open up new ways of designing, implementing, and scaling them (Kerr, 2016; Plass & Pawar, 2020). While their meanings seem straightforward, their definitions are actually not clear cut. Consequently, it is also nebulous how these educational approaches relate to and are distinct from each other. Definitions in educational literature range from adaptive as an umbrella term for personalized and individualized instruction (Tetzlaff et al., 2021), to these terms being inseparably connected (e.g., Peng et al., 2019), to defining one term through the other(s) (e.g., Li et al., 2021; Taylor et al. 2021), to those that make no explicit reference to the overlap of these terms and use multiple terms interchangeably (e.g., Gómez at al., 2014; Park et al., 2019; Serra & Gilabert, 2021). As we put high hopes into what these educational approaches can achieve, especially with respect to supporting each student to reach their full potential in increasingly diverse and heterogeneous student populations, we are conducting a multiple phases systematic thematic review to pinpoint the common core and distinguishing features of the four big ideas.

We report on the first phase of the review in which we focus solely on adaptive LIT. We searched the databases ERIC and PsycInfo to identify all peer-reviewed publications about adaptive LIT in primary and secondary education from 2018-2022. We used the software CADIMA (Kohl et al., 2018) to conduct and document the systematic review process. From 605 initial search results, 555 were unique records. Through trained screening of titles and abstracts, we identified 136 relevant publications. We developed and iterated a codebook for full text screening and data extraction to answer our research question if and how adaptive LIT is defined and whether it is explicitly or implicitly separated or linked to the other big ideas. All 136 full papers were coded by two researchers who also annotated text passages that fell under the codes “conceptualization” or “operationalization” using the software Dedoose (2021). Annotated data was extracted, discussed and combined to a final data set of conceptualizations and operationalizations. This data was thematically coded.

Our goal for this work is to find the consensus and discern distinctions among the conceptualizations and operationalizations of adaptive LIT. This analysis approach allows us to present the frequencies as well as rich insights into the core of adaptive LIT as well as its dimensions. We will present the results of our systematic thematic review on adaptive LIT and talk about our next steps to complete the review in its full scope spanning not only adaptive but also personalized, individualized, and differentiated LIT. We argue that this work can encourage researchers to be explicit about the meaning of terms we use to decrease siloing in educational research and increase collaborative knowledge construction. This will allow us to connect research evidence that is generated under various terms and help identify what we already know about adaptive LIT, its common core, and distinct features. Breaking down the big idea into actionable pieces will also support its implementation into practice. When adaptive LIT is discussed as a set of strategies or specific activity structures that are tangible, practitioners will realize the ways in which they already teach adaptively or how they can adopt adaptive practice into their teaching routines. This might ultimately drive change towards a more tailored educational practice.

 

Adaptive Learning, and Teaching in the Wild: How to Design and Implement Educational Technology for Adaptive Teaching

Leonie Sibley1, Christine Plicht2, Armin Fabian1, Thorsten Bohl1, Andreas Lachner1
1Universität Tübingen, 2Universität Tübingen, Hans Küng Gemeinschaftsschule Tübingen

Integrating educational technology in learning environments has become paramount for subject-specific teaching, as it allows to contribute to students’ cognitive (learning) and meta-cognitive (monitoring accuracy) competencies. A crucial potential of educational technology is the design of adaptive and personalized learning environments (Aleven et al., 2016), as it allows to productively handle the increasing heterogeneity among students in the classroom. However, little is still known about how educational technology should be implemented in classrooms to realize adaptive learning environments. Thus, evidence-based practice examples are needed that demonstrate an effective use of educational technology for adaptive teaching.

Against this background, we adopted a co-design approach (Roschelle et al., 2006) in which teachers and researchers equitably contributed to the design of adaptive teaching environments, combining research evidence with the demands and requirements of educational practice. Within the co-design, we developed eight adaptive teaching units (duration: 3-4 weeks) across central topics and subjects of the German curriculum (e.g., German, Mathematics, Ethics). We followed a quasi-experimental control-group pre-post-(four-week)delayed design with a total of 16 classes and N = 395 secondary school students. To examine the generalizability of adaptive teaching effects, we adopted a ManyClasses approach (Fyfe et al., 2021) to investigate whether the technology-based adaptive teaching units resulted in higher learning outcomes and better monitoring accuracy compared to the control classes which were engaged in business-as-usual teaching units (pre-registered via as.predicted).

We used multiple imputations to handle missing data and used cluster-robust estimation of fixed effect models to account for the correlated error terms within a cluster (i.e., students within classes) but independent error terms across clusters (see Cameron & Miller, 2015). Since data collection has just been finished, we report preliminary results in this submission and will present more extensive results at the GEBF conference. Preliminary results revealed a small effect of the technology-based teaching units compared to the control group regarding students’ learning outcome (b = 0.22, p = .005). No differences regarding students’ monitoring accuracy were found (b = - 0.18, p = .220). However, the adaptive teaching units did not result in lasting learning, since there were no differences among teaching units – neither regarding students’ learning outcome (b = 0.06, p = .781) nor regarding their monitoring accuracy (b = 0.09, p = .505). To unpack these findings, we will explore potential boundary conditions which we will be presented at the conference.

The findings provide first evidence that technology-based adaptive teaching lessons may be a fruitful approach to address students’ heterogeneity and to improve their learning. In this context, we regard the co-design as an effective approach to investigate research questions in “the wild” as it combines research evidence with the needs and experiences of educational practice. Our teaching units have increased students’ learning but did not result in lasting learning. Even though students participated in the teaching units for three to four weeks, there were no differences regarding students’ learning outcomes in the technology-based adaptive teaching units or the control groups in the four-weeks delayed posttest. More research is needed on how adaptive teaching can result in lasting learning. All in all, our research will contribute to a better understanding of adaptive teaching processes in authentic contexts and illustrates that co-designs can be a successful approach to productively investigate research questions in classrooms.

 

Personalized Self-Made Plans Help Children Maintain a Regular Study Routine: A Mobile Intervention Study

Lea Nobbe, Jasmin Breitwieser, Daniel Biedermann, Garvin Brod
Leibniz-Institut für Bildungsforschung und Bildungsinformation (DIPF), Frankfurt

Learning in digital environments requires self-regulation. While these environments allow learners to study more flexibly, learners typically receive less instructional support than they would in a classroom. For self-study to be successful, a choice of effective learning activities is crucial (Dunlosky et al., 2013). One such learning activity is the distribution of study over multiple sessions (distributed practice; Cepeda et al., 2006; Dunlosky et al., 2013). However, studies have shown that younger students in particular tend to make little use of this strategy (Dirkx et al., 2019). Therefore, interventions are needed that have long-lasting effects and can be integrated into students’ daily lives.

Mobile technology allows interventions to be integrated into daily life and intervention prompts to be repeated over time for lasting impact. Such interventions could take the form of reminders instructing students to study. However, since failure to start and maintain goal striving is a volitional problem even among adults (Gollwitzer & Sheeran, 2006), it seems reasonable that younger students would struggle in that regard as well. Simple reminders might not be enough to bridge the gap between intention and action. We therefore employed a volitional strategy – implementation intentions (Gollwitzer & Sheeran, 2006) – to help younger students use a vocabulary learning app more regularly.

Implementation intentions are if-then plans that link a situational cue to a goal-directed action (Gollwitzer, 1999). In forming implementation intentions for distributed practice, students need to determine when and where to study. Not all students will share an ideal situation that should cue studying. This means that the plans should be personalized – students should create their own plan based on what works best for them.

In an intensive longitudinal study, we compared the effects of simple reminders and implementation intentions on children’s study behavior. The sample consisted of N = 130 fifth graders (Mage=10.75 years). The students were asked to use both a study app created by us and a vocabulary learning app for 37 days. This allowed us to base our analyses on objective study data. The study app included daily questionnaires as well as the intervention. All students first watched a video explaining the benefits of distributed practice. A full intervention group additionally was asked to create their own implementation intention building on situations regularly occurring in their lives. Over the course of the following 36 days, they were regularly reminded of both the benefits of distributed practice and their implementation intention. The reminder group only watched the video on distributed practice and received the reminder on the benefits of distributed practice but did not form an implementation intention. The plan group created a personalized implementation intention but received no reminders at all.

Children in the full intervention group studied more often than those in the other two groups (𝛘2(2) = 7.78, p = .020). In the groups that received reminders, children were more likely to study on days when they received a reminder (b = 0.87, 𝛘2(1) = 18.50, p < .001). When looking into the development of students’ study behavior over time, we found that the likelihood that students studied decreased faster in the group that did not form an implementation intention than in the other two groups (b = -0.05, 𝛘2(1) = 7.38, p = .007; b = -0.04, 𝛘2(1) = 4.26, p = .039). Forming a personalized implementation intention thus buffered the decrease in likelihood to study.

Overall, all groups seemed to profit from our intervention. However, the personalized implementation intentions based on children’s individual lives had a longer lasting positive effect than the simple distributed practice reminder.

 
15:20 - 17:006-03: Selbsttests, Lernverhalten und Leistung in der Hochschulbildung. Einblicke aus digitalen Verhaltensspurdaten und Selbstberichten
Ort: H03
 
Symposium

Selbsttests, Lernverhalten und Leistung in der Hochschulbildung. Einblicke aus digitalen Verhaltensspurdaten und Selbstberichten

Chair(s): Jakob Schwerter (Technische Universität Dortmund, Deutschland), Luise von Keyserlingk (Universität Tübingen)

Diskutant*in(nen): Dirk Ifenthaler (Universität Mannheim)

Viele Studierende haben zu Beginn ihres Studiums mit hohen Leistungsanforderungen und Durchfallquoten zu kämpfen (Faas et al., 2018). Die Leistungsprobleme werden unter anderem auf Motivationsprobleme und Schwierigkeiten beim Selbstregulierten Lernen von Studierenden zurückgeführt (Benden & Lauermann, 2022; Broadbent & Poon, 2015; Cogliano et al., 2022). Selbstreguliertes Lernen bezieht sich hierbei auf die Fähigkeit, den eigenen Lernprozess zu kontrollieren und zu steuern. Dazu gehören das Setzen von Zielen, das Überwachen von Fortschritten und das Anpassen von Strategien, was letztendlich zu akademischem Erfolg und einem tiefen Verständnis des Lernstoffs führt (Zimmerman, 1989). Eine Möglichkeit, die Leistung und Motivation der Studierenden zu verbessern, besteht somit darin, ihr selbstgesteuertes Lernen während des Studiums zu fördern, indem ihnen erweiterte digitale Lernmöglichkeiten zur Verfügung gestellt werden, die das Lernen durch effektive Lerntechniken wie Selbsttests mit Feedback unterstützen. Dies erleichtert es den Studierenden, ihre Fortschritte zu überprüfen und ihre Lernstrategien anzupassen. Empirische Forschung zeigt, dass die aktive und regelmäßige Nutzung von Lernmaterialien und insbesondere die Verwendung von Selbsttests effektive Lernstrategien darstellen, die mit besseren Kursleistungen und geringeren Misserfolgsquoten im Hochschulkontext einhergehen (Yang et al., 2021). Einige Studien aus authentischen Hochschulkontexten deuten jedoch darauf hin, dass Studierende freiwillige Übungsaufgaben nur in geringem Umfang nutzen und meist erst kurz vor relevanten Deadlines oder Prüfungen anfangen zu lernen (Ifenthaler et al., 2022; Peverly et al., 2003, Schwerter et al., 2022). Ein zentrales Anliegen der empirischen Bildungsforschung ist es daher herauszufinden wie Studierende bei der Nutzung effektiver Lernstrategien im Studium unterstützt werden können. Das Symposium addressiert dieses Anliegen und beleuchted dabei zwei Übergeordnete Fragen: A) Welche Personenmerkmale sagen die Nutzung von Lernmaterialien und Selbsttests in Lernmanagementsystemen aus authentischen Vorlesungskontexten vorher (Beitrag 1 und 2)? Und B) Wie hängt die Nutzung verschiedener Lernmaterialien in den Lernmanagementsystemen mit der Testperformance und Kursleistung zusammen (Beitrag 1, 3, 4)? Damit gehen wir der allgemeinen Frage nach, wie wir Studierende dabei unterstützen können, ihr Lernen selbst in die Hand zu nehmen. Dies ist ein wichtiger erster Schritt auf dem Weg zu mehr personalisiertem Lernen (in der Hochschulbildung).

Alle vier Beiträge nutzen dabei digitale Verhaltensspurdaten aus verschiedenen Lernmanagementsytemen zur objektiven Erfassung des Lernverhaltens von Studierenden in Kombination mit Surveydaten (Beiträge 1 + 2) und Kursnoten (Beiträge 1, 3, 4). Die Studien nutzen Daten von vier unterschiedlichen Hochschulen in Deutschland. Beiträge 1 – 3 beinhalten Studien mit längsschnittlichen korrelativen Designs, während der vierte Beitrag ein Interventionsdesign mit within-person Randomisierung aufweist, das kausale Schlüsse über Zusammenhänge der Nutzung von Selbsttests mit Testleistung zulässt.

Der erste Beitrag untersucht anhand der Daten aus zwei sozialwissenschaftlichen Vorlesungen, wie motivationale Überzeugungen mit der Nutzung von Lernressourcen (i.e., Vorlesungsfolien und Übungsquizze) und Kursleistung zusammenhängen. Der zweite Beitrag nutzt Daten aus einem intelligenten tutoriellen Lernsystem, das Studierende für die Vorbereitung einer Statistikklausur nutzen und untersucht Zusammenhänge von subjektiven Judgments of Learning (JOL) in Lernkapiteln mit der Lernpersistenz und Leistung der Studierenden. Der dritte Beitrag untersucht wie die aktive und passive Nutzung von verschiedenen Lernressourcen (z.B. Instruktionsvideos ansehen vs. Übungsaufgaben bearbeiten) mit dem Leistungserfolg der Studierenden zusammenhängt. Der vierte Beitrag untersucht anhand von Daten von Mathematikvorlesungen für Betriebswirte die Wirksamkeit einer Selbsttest-Intervention mit Within-Person-Randomisierung auf Leistungserfolg in geübten und ungeübten Testaufgaben.

Nach einer kurzen Einführung durch die Vorsitzenden des Symposiums (3-5 Minuten) haben alle Sympsoiumsbeitragenden 15 Minuten Zeit, die jeweilige Studie vorzustellen und 1-2 Minuten für klärende Fragen. Im Anschluss wird der Diskutant als führender Experte auf dem Gebiet der Lernwissenschaften mit besonderen Schwerpunkten in Learning Analytics, Assessment und Feedback, sowie Educational Technology die Beiträge kritisch diskutieren. Das Symposium wird mit einer offenen Diskussion (5-10 Minuten) abgeschlossen.

 

Beiträge des Symposiums

 

Nutzen motivierte Studierende bessere Lernstrategien? Zusammenhänge zwischen Erfolgserwartungen und Wertüberzeugung mit der Nutzung von Lernmaterialien in Moodle

Luise von Keyserlingk1, Jakob Schwerter2, Steffen Wild2, Olga Kunina Habenicht2, Fani Lauermann3
1Universität Tübingen, 2TU Dortmund, 3Universität Bonn

Theoretischer Hintergrund:

Regelmäßige Lernaktivitäten und die Nutzung von Selbsttests beim Lernen sind effektive Strategien für Lern- und Prüfungserfolg von Studierenden. Dennoch zeigen empirische Befunde, dass viele Studierende ungünstige Lernstrategien verwenden und Lernmaterialien oft erst kurz vor Prüfungen nutzen (Broadbent und Poon 2015; Ifenthaler et al. 2022). Die Motivationsforschung zeigt, dass Lernende mit hohen Erfolgserwartungen und subjektiven Wertüberzeugungen (SEVT: Eccles und Wigfield 2020) höhere Lernerfolge erzielen und z.T. auch eine höhere Anstrengungsbereitschaft zeigen, während höhere wahrgenommene Kosten mit geringeren Leistungen eihergehen. Wertüberzeugungen können hierbei in Intrischischen Wert, wahrgenommene Wichtigkeit, Nützlichkeit und Kosten eines Kurses oder Faches unterschieden werden. Kosten können weiterhin in Anstrengungskosten durch den Kurs an sich (task effort cost), konfliktierende Kosten durch andere Verpflichtungen (outside effort cost), und emotionale Kosten unterteilt werden. Eine offene Frage ist, ob und wie diese motivationalen Überzeugungen von Studierenden mit ihren Lernaktivitäten und der Nutzung von zur Verfügung gestellten Lernmaterialien in Lehrveranstaltungen assoziiert sind.

Die Studie untersucht zwei Fragestellungen: A) Sagen Erfolgserwartungen und Wertüberzeugungen die Nutzung von Lernmaterialien vorher? B) Wie sind kurspezifische Motivation (Erfolgserwartungen, Wertüberzeugungen) und die Nutzung von Lernmaterialien mit Kursleistung assoziiert?

Methode

Die Studie nutzt Survey Daten und digitale Verhaltensspurdaten aus dem Lernmanagement System Moodle aus zwei sozialwissenschaftlichen Vorlesungen an einer deutschen Hochschule (N=425 Studierende, Wintersemester 2022/23). Beide Vorlesungen fanden in einem wöchentlichen Rhythmus als Präsenzveranstaltung statt und Moodle wurde genutzt um den Studierenden die Vorlesungsfolien und freiwillige Übungsquizze zur Verfügung zu stellen. Die Motivation von Studierenden wurde zu Beginn des Semesters (T1) und in der Mitte des Semesters (T2) per Fragebögen erhoben. Moodle Daten wurden über das gesamte Semester erhoben. Es wurden zwei Variablen zum Nutzungsverhalten von Lernmaterialien verwendet: Die Anzahl aufgerufener Foliensätze und die Anzahl eingereichter Übungsquizze pro Studierendem. In längschnittlichen Strukturgleichungsmodellen in Mplus wurde berechnet wie T1 Motivation die Nutzung von Lernmaterialien in der ersten Semesterhäflte und T2 Motivation die Nutzung von Lernmaterialien in der zweiten Semesterhälfte sowie die Klausurnote vorhersagte.

Ergebnisse

Studierende nutzten die Vorlesungsfolien über das Semester hinweg, wohingegen Übungsquizze vorwiegend kurz vor der Abschlussklausur genutzt wurden. Studierende mit höherer Erfolgserwartung nutzen mehr Foliensätze und mehr Übungsquizze in der zweiten Semesterhälfte (Folien: β = .23, SE = .08, p < .05; Quizze: β = .15, SE = .07, p < .05), während höhere Wertüberzeugungen (intrinsischer Wert, Nützlichkeit, Wichtigkeit) mit vermehrter Folien- und Quiznutzung in der ersten Semestserhälfte einhergingen (Folien: β = .24, SE = .06, p < .05; Quizze: β = .20, SE = .06, p < .05). Bei den wahrgenommenen Kosten zeigte sich vor allem, dass Studierende die auf Grund anderer wichtiger Verpflichtungen und Aktivitäten angaben nicht genügend Zeit für die Vorlesung zu haben (outside effort cost) weniger Folien und Quizze nutzten (T1 Folien: β = -.22, SE = .06, p < .05; T2 Folien: β = -.16, SE = .06, p < .05; T2 Quizze: β = -.16, SE = .07, p < .05). Anstrengungskosten durch die Vorlesung an sich war ausschließlich mit geringerer Nutzung der Vorlesungsfolien zu T2 assoziiert (Folien: β = -.20, SE = .09, p < .05). Es zeigten sich keine Zusammenhänge zwischen der Motivation und Klausurleistung. Bezüglich der Nutzung von Lernmaterialien zeigte sich das vermehrte Nutzung der Quizze mit besseren (niedrigeren) Klausurnoten einhergingen (β = -.25, SE = .08, p < .05). Diese Ergebnisse zeigen, dass Selbsttests eine effektive Lernstrategie darstellen, die von Studierenden jedoch nur kurz vor Klausuren genutzt werden. Wie erwartet wurden Selbsttests eher von Studierenden mit höheren Erfolgserwartungen und „positiven“ Wertüberzeugungen genutzt. Interessanterweise zeigte sich bei den wahrgenommenen Kosten, dass weniger die Anstrengung oder Stress durch die Vorlesung selbst, sondern vor allem mangelnde Zeit auf Grund anderer Verpflichtungen mit geringerer Nutzung von Selbsttests einherging.

 

Judgments of Learning prädizieren Lernverhalten und Erfolg in intelligenten tutoriellen Lernsystemen

Marc Philipp Janson1, Samuel Wissel1, Franziska Schäfer2, Monika Undorf2
1Universität Mannheim, 2Technische Universität Darmstadt

Theoretischer Hintergrund

Selbstreguliertes Lernen erfordert dass Lernende, ihre eigenen Lernaktivitäten überwachen und kontrollieren (Schunk & Zimmerman, 2023; Zimmerman & Schunk, 2011). Auch bei digital gestützten Lerngelegenheiten sind erfolgreiche Selbstregulationsstrategien von großer Bedeutung für den Lernerfolg (Azevedo et al., 2011; Winters et al., 2008). Metakognitionen, also das Wissen von Menschen über ihr eigenes Wissen, spielen eine zentrale Rolle für selbstreguliertes Lernen und sind ein zentraler Prädiktor für akademischem Erfolg (Soderstrom et al., 2016; Vrugt & Oort, 2008). Um zu erfassen, was Lernende über ihr eigenes Wissen wissen, werden typischerweise Selbsteinschätzungen erfragt. Bei den häufig verwendeten Judgments of Learning (JOLs; Koriat, 1997) beispielsweise werden Lernende gebeten, vorherzusagen, mit welcher Wahrscheinlichkeit sie gelernte Inhalte in einem späteren Test werden erinnern können. Studien zeigen, dass JOLs recht akkurat im Hinblick auf die Vorhersage zukünftiger Lernleistung sind (Rhodes & Tauber, 2011) und Einfluss auf Selbstregulation nehmen (Metcalfe & Finn, 2008). Da sich viele dieser Studien jedoch auf Laborparadigmen beschränken (siehe Rhodes, 2016), ist es eine offene Frage, ob JOLs auch im Feld Lernerfolg und Selbstregulation vorhersagen.

Ziel der vorliegenden Studie ist es, die Effekte von JOLs im Kontext eines intelligenten tutoriellen Lernsystems (Kulik & Fletcher, 2016; Ma et al., 2014) zu untersuchen, das von Studierenden für die selbstgesteuerte Klausurvorbereitung genutzt wird. Das Lernsystem bietet Übungsaufgaben in verschiedenen inhaltlichen Kapiteln zum Zwecke des practice testing (Roediger & Karpicke, 2006b, 2006a). Wir erwarteten, dass höhere JOLs für ein Kapitel mit höherer Leistung bei den Übungsaufgaben des spezifischen Kapitels und mit geringerer Lernzeit je Kapitel assoziiert sind. Hierbei erwarteten wir absolute Effekte hinsichtlich geringerer Lernzeit bei höherer JOLs und relative Effekte von mehr allokierter Lernzeit auf Kapitel mit relativ gesehen geringeren JOLs.

Methode

102 Studierende, die das intelligente tutorielle Lernsystem für die Vorbereitung auf eine Statistikklausur selbstreguliert nutzten (im Schnitt 24,72h reine Lernzeit je Individuum) erhielten jede Woche beim ersten Login in die Software die Aufforderung, ein JOL für jedes der sechs Kapitel abzugeben. Wir analysierten die prädiktive Validität der JOLs für das nachfolgende Lernverhalten. Wir betrachteten jeweils auf Tagesebene aggregierte Lernverlaufsdaten (Investierte Lernzeit und Anteil korrekt gelöster Aufgaben pro Tag und Lernkapitel), was in insgesamt N = 5321 Beobachtungen resultierte.

Mehrebenenanalysen bestätigten unsere Annahmen: JOLs hingen mit Persistenz und Leistung zusammen, wenn für allgemeine Trends steigender Lernaktivitäten und Leistung mit zeitlicher Nähe zur Klausur kontrolliert wurde (Capelle et al., 2022). Die kapitelspezifische JOLs sagten die Lösungswahrscheinlichkeit nachfolgender Übungsaufgaben im Lernsystem vorher, β = 0.14, p < .001. So wurde insgesamt weniger Lernzeit pro Tag für Kapitel investiert, bei denen höhere JOLs abgegeben wurden, β = -0.09, p < .001. Ebenfalls wurde die geringere relative Lernzeit pro Tag, das heißt die prozentuale Verteilung der Lernzeit auf die einzelnen Kapitel, durch die höhere relative Ausprägung der JOLs vorhergesagt, β = -0.09, p < .001.

Ergebnisse

Die Ergebnisse unterstreichen die prädiktive Validität von JOLs unter Nutzung objektiver Verhaltensspurdaten (Baker et al., 2020). JOLs eignen sich zur Vorhersage von zukünftiger Lernleistung und nachfolgendem Lernverhalten in einem intelligentem tutoriellen Lernsystem über den Verlauf mehrerer Wochen und unterstreichen damit die Bedeutung metakognitiver Prozesse bei der Selbstregulation von (digitalen) Lernaktivitäten. Auch wenn die Studie einen wichtigen Beitrag im Hinblick auf die Validierung von JOLs in bildungsbezogenen Lernumgebungen leistet und damit eine bestehende Forschungslücke schließt, ist sie mit einigen Einschränkungen im Design verbunden. Die Abgabe der JOLs im wöchentlichen Turnus sowie die aggregierte Abfrage auf Kapitelebene dürfte zu höherer Ungenauigkeit der Vorhersagen der Lernenden geführt haben. Eine Follow-Up Studie, bei der die JOLs während des Lernens auf Aufgabenebene abgefragt werden, zur Replikation und weiteren Validierung der Ergebnisse auch unter Betrachtung von Klausurerfolg, ist zum gegenwärtigen Zeitpunkt in Erhebung.*

*Auswertung der Daten bis zur GEBF avisiert

 

Fleißig und/oder stetig?: Was macht Bachelor-Studierende erfolgsreich in großen Einführungskursen?

Florian Berens1, Sebastian Hobert2
1Universität Tübingen, 2Technische Hochschule Lübeck

Theoretischer Hintergrund

Seit Jahrzehneten ist aus vielfältigen Laborstudien bekannt, dass verteiltes Lernen erfolgreicher ist als massiertes Lernen (z.B. Bjork & Allen, 1970). Dennoch wird weiterhin daran gearbeitet, ideale Lernverteilungen und Lernrhythmen zu finden (z. B. Murphy et al., 2022). Die deutliche Mehrheit der Studien untersucht Lernen dabei im Labor und über relativ kurze Zeiträume (Cepeda et al., 2006). Die fortschreitende Digitalisierung von Lernen macht es heute aber möglich, Lernen und Lernverhalten nicht-invasiv über digitale Verhaltensspuren zu untersuchen. In Bezug auf verteiltes Lernen ist von diesen Möglichkeiten aber bisher wenig Gebrauch gemacht worden. Yeckehzaare und Kollegen (2022) konnten durch dieses so gennnte Learning Analytics in einem Kurs zeigen, dass die Verteilung von Lernen im Semesterverlauf in Beziehung steht zum Lernerfolg. Analysen, die mehrere Dimensionen von Verteilung des Lernens und verschiedene Lernformate getrennt voneinander analysieren und dann in Beziehung setzen, fehlen jedoch.

Diese Untersuchung thematisiert daher, ob verschiedene Formen und Varianten von verteiltem Lernen alle jeweils positiv mit Lernerfolg verbunden sind. Außerdem sollen die Stärken dieser Beziehungen miteinander und mit der Beziehung zwischen Fleiß und Lernerfolg verglichen werden.

Methode

Untersucht wird ein einführender Statistikkurs des ersten Studienjahres verschiedener sozialwissenschaftlicher Studiengänge. Für n=181 Studierende des Kurses liegen digitale Verhaltensdaten und verknüpfbare Prüfungsdaten vor. Die Verhaltensdaten enthalten dabei Informationen über den Umgang der Studierenden mit den vorlesungsersetzenden Lernvideos, mit den Übungsaufgaben, über die (aktive und passive) Teilnahme am Tutorium und über die Nutzung des Kursglossars. Diese Daten wurden zu folgenden Variablen operationalisiert: als Maß für das rezeptive Lernen die Anzahl der im Laufe des Semesters angesehenen Lehrvideos (1), als Maß für das aktive Lernen die Anzahl der durchgeführten Übungen (2) und die Anzahl der Suchen im Glossar (3). Als viertes Maß für die Quantität des Lernens wurde die Häufigkeit der Teilnahme an Tutorien gezählt (4). Als Maß für die Verteilung des Lernens wurde sowohl für die gesehenen Videos (5) als auch für die bearbeiteten Übungen (6) der Anteil berechnet, der während des Kurses und nicht erst kurz vor der Prüfung stattfand. In Bezug auf die Übungen wurde auch berechnet, welcher Prozentsatz des Lernens sich auf einen bestimmten Wochentag konzentrierte (7) und welcher Prozentsatz des Lernens während des Tages zwischen 9 Uhr und 17 Uhr stattfand (8).

Ergebnisse

Die Korrelationen zwischen den genannten Variablen und dem Prüfungserfolg zeigen für alle Variablen hochsignifikante Korrelationen. Die Anzahl der absolvierten Übungen korreliert mit 0,540 am stärksten, während die Anzahl der angesehenen Videos deutlich geringer korreliert (0,274). Die geringste Korrelation findet sich für die Abfragen im Glossar mit 0,177. Die Teilnahme am Tutorium liegt relativ hoch (0,456). Unter den Variablen des verteilten Lernens korreliert auf Ebene der Verteilung im Kursverlauf der Anteil bei den Videos mit 0,494 deutlich höher als der Anteil der Fragen (0,209). Etwas höher korreliert die Konzentration des Lernens an einem Wochentag mit -0,342. Der Anteil des Lernens während des Arbeitstages korreliert mit 0,197 niedriger.

Bringt man alle genannten Variablen sowie den Abiturdurchschnitt und das Geschlecht in ein Regressionsmodell zur Erklärung des Erfolgs, ergibt sich ein Modell mit R^2=0,540. Neben dem Notendurchschnitt und dem Geschlecht zeigen auch die Gesamtzahl der bearbeiteten Übungen, der Anteil der während des Kurses angesehenen Videos und der Anteil der zwischen 9 und 17 Uhr bearbeiteten Fragen signifikante Effekte. Die anderen Effekte verschwinden aufgrund der Kollinearität der Prädiktoren.

Betrachtet man die Ergebnisse in ihrer Gesamtheit, so zeigt sich, dass die Verteilung des Lernens tatsächlich einen Einfluss auf den Lernerfolg hat. Allerdings sind diese Effekte für das rezeptive Lernen stärker als für das aktive Lernen. Daraus lässt sich schließen, dass in realen Lernumgebungen die Quantität und die Verteilung des Lernens relevant sind und darüber hinaus der Lernform Aufmerksamkeit geschenkt werden muss.

 

Retrieval Practice in der Hochschulbildung: Erforschung der Auswirkungen des Inhaltstransfers in einem Gateway-Mathekurs

Jakob Schwerter1, Thomas Dimpfl2, Fani Lauermann3
1TU Dortmund, 2Universität Hohenheim, 3Universität Bonn

Theoretischer Hintergrund

Der positive Effekt von Selbsttests (retrieval practice, self-testing) auf das Lernen von Lernenden gehört zu den am besten gesicherten Erkenntnissen in der Lernforschung (z.B., Meta-Analysis von Yang et al., 2021). Es gibt jedoch relativ wenige Studien, die sich auf Mathematik in authentischen Kontexten konzentrieren, und unser Wissen über potenzielle Transfereffekte auf nicht getestete, aber konzeptuell verwandte Inhalte ist begrenzt. Obwohl einige Forscher*innen bezweifeln, dass Selbsttests zu einem Inhaltstransfer führen können, weil dieser mit zunehmender Komplexität verschwindet (Anderson et al., 1994; van Gog & Sweller, 2015), gibt es Hinweise darauf, dass ein Transfer auf nicht getestete, aber konzeptionell verwandte Informationen möglich ist (Bjork et al., 2014; Butler, 2010). In der vorliegenden Studie wurde mit Hilfe von Randomisierung innerhalb einer Person (within-person randomization) und einer Instrumentvariablen-Regression das Problem der Selektion in die Übung im Vergleich zu anderen Studien gelöst (Förster et al., 2018; Schwerter et al., 2022), um die Effekte kausal zu interpretieren.

Die Studie untersucht, (a) ob Übungstests die Leistungen von Studierenden in einem Mathematik-Grundkurs beeinflussen und (b) ob Übungstests einen Transfer auf ungeübte Mathematikaufgaben ermöglichen.

Methode

An der Studie nahmen Studierende der Betriebswirtschaftslehre (N = 731, 50% weiblich) teil, die in einem Mathe-Gateway-Kurs eingeschrieben waren. Eine Randomisierung innerhalb der Gruppe stellte sicher, dass alle Studierenden die wöchentlichen Online-Selbsttests erhielten und davon profitieren konnten. Die Studierende bearbeiteten wöchentlich eine Teilmenge aus einem größeren Pool möglicher Matheaufgaben und drei Zwischentests über das Semester hinweg. Hierbei bereiten die wöchentlichen Übungen jeweils auf den nächsten Zwischentest vor.

Wir untersuchten, ob die Studierende nur aufgabenspezifisches Wissen für die spezifischen Matheaufgaben erwarben, die sie bearbeiteten, oder ob sie auch mathematisches Wissen über die geübten Aufgaben hinaus erwarben (d.h. Transfereffekte). Die Studierende gaben zu Beginn der wöchentlichen Online-Übungen an, wie sie am Kurs teilgenommen hatten (Vorlesungen besuchen, Arbeitsblätter bearbeiten, Lösungsvideos ansehen). Die Teilnahme der Studierende und Fixed-Effects für jede Matheaufgabe dienten als Kontrollvariablen. Es gab Anreize für die Teilnahme: Die Studierende konnten sich die Teilnahme an der Abschlussprüfung anrechnen lassen.

Ergebnisse

Mit Hilfe von Instrumentvariablen-Regressionen wurden die Auswirkungen der Behandlung auf die Behandelten geschätzt. Einen zum 1%-Signifikanzniveau signifikanten positiven Übungseffekt um 3.7% und 4.0% in den respektiven Zwischentestaufgaben wurde gefunden, die die Studierende in ähnlicher Form in ihren wöchentlichen Online-Übungen geübt hatten, z. B. die gleiche Aufgabe, aber mit anderen Zahlen (Gruppe 1: β = .037, SE = .014, p < .01; Gruppe 2: β = .0.04, SE = .015, p < .01). Fixed-Effects und Random-Effects Panel-Regressionen bestätigten die Ergebnisse. Die Studierende schnitten am besten bei ähnlichen Matheaufgaben ab, deutlich schlechter bei mittleren Transferproblemen (z.B. unterschiedliche Formulierungen, β = -.038, SE = .016, p < .05) und am schlechtesten bei fernen Transferproblemen (neue Arten von Matheaufgaben; β = .785, SE = .022, p < .001). Die Wechselwirkungen zwischen der Treatmentvariable (welche spezifischen Probleme geübt wurden) und der Transferbedingung (kein Transfer, mittlerer Transfer und ferner Transfer) waren nicht signifikant, was darauf hindeutet, dass die Treatmentresultate unabhängig von der Transferbedingung waren (Gruppe 1 \times mittlerer Transfer: β = -.001, SE = .027; Gruppe 1 \times ferner Transfer: β = -.012, SE = .034; Gruppe 2 \times mittlerer Transfer: β = -.057, SE = .036; Gruppe 2 \times ferner Transfer: nicht genug Variation).

Diese Studie ist eine der ersten, die einen kausalen Nachweis für die Wirksamkeit von Übungstests in einem Mathe-Gateway-Kurs an der Universität liefert. Insbesondere deuten die Analysen darauf hin, dass der Treatmenteffekt auch für Mathematikaufgaben mit mittlerem und hohem Schwierigkeitsgrad gilt, was die Wirksamkeit von Übungstests im (höheren) Mathematikunterricht belegt. Die Studie zeigt somit, wie vielversprechend Übungstests sind, um das Lernen von Studierenden in anspruchsvollen Bildungskontexten zu unterstützen.

 
Datum: Mittwoch, 20.03.2024
9:00 - 10:407-03: Emotionale und motivationale Effekte des computerisierten adaptiven Testens
Ort: H03
 
Symposium

Emotionale und motivationale Effekte des computerisierten adaptiven Testens

Chair(s): Anne Frenzel (Ludwig-Maximilians-Universität München), Andreas Frey (Goethe-Universität Frankfurt am Main)

Diskutant*in(nen): Reinhard Pekrun (University of Essex)

Computerisiertes adaptives Testen (CAT; z.B. Frey, 2020) ist eine spezielle Art der Messung individueller Merkmale, bei der sich die Auswahl der einer Testperson zur Bearbeitung vorgelegten Items an deren Antwortverhalten orientiert. Bei der Messung von Leistungsmerkmalen resultiert dies darin, dass leistungsfähige Testpersonen systematisch schwierigere Items vorgelegt bekommen als weniger leistungsfähige Testpersonen. Die Wahrscheinlichkeit, mit der die adaptiv vorgelegten Items korrekt beantwortet werden können, ist hierbei über Testpersonen hinweg vergleichbar (meistens » 50%). Dieses Vorgehen ist statistisch begründet und führt dazu, dass CAT dem nicht adaptiven Testen (NCAT) im Hinblick auf die Messeffizienz klar überlegen ist. Die empirischen Befunde zu den emotionalen und motivationalen Auswirkungen dieser speziellen Art des Testens sind jedoch deutlich weniger eindeutig. Die bis heute häufig wiederholte Annahme bezüglich positiver Haupteffekte von CAT auf das emotionale und motivationale Testerleben wurde zunehmend durch Studien in Frage gestellt, die entweder keine emotionalen oder motivationalen Unterschiede zwischen CAT und NCAT fanden (z.B. Akhtar et al., 2022) oder sogar negative Auswirkungen der Verwendung CAT feststellen konnten (z.B. Ortner et al., 2014). Die hohe Heterogenität der Befunde weist darauf hin, dass die Annahme einfacher Haupteffekte von CAT auf Emotionen und Motivation zu kurz greift und dass das emotional-motivationale Erleben von Testsituationen vielmehr aus der differenzierten Zusammenwirkung verschiedener Test-, Personen- und Situationsmerkmale hervorgeht.

Dieses Symposium integriert existierende empirische Befunde zu den emotionalen und motivationalen Effekten von CAT und trägt neue Evidenz zu diesen zusammen.

Der erste Beitrag des Symposiums von Frey, Liu, Fink und König präsentiert ein konzeptionelles Framework zum Testerleben und präsentiert Ergebnisse einer Metaanalyse zu den Effekten von CAT im Vergleich zu NCAT hinsichtlich selbstberichteter Motivation, positiven Emotionen und negativen Emotionen. Dabei zeigten sich keine signifikanten Haupteffekte (d ≤ 0.13; p ≥ .119) aber signifikante Moderatoreffekte verschiedener Testmerkmale auf die abhängigen Variablen. Die Relevanz der Befunde für die Testgestaltung wird im Beitrag diskutiert.

Während sich die bisherige Forschung, und damit die in die Metaanalyse eingehenden Ergebnisse, auf die Verwendung von Selbstbericht zur Erfassung von Emotionen während der Testbearbeitung beschränkt, verwendeten Wünsch, Frenzel und Sun zusätzlich Hautleitfähigkeit als Maß der physiologischen Stressreaktion auf CAT. Die Ergebnisse der Laborstudie (N = 87), welche im zweiten Beitrag des Symposiums vorgestellt werden, zeigen ein höheres physiologisches Stresslevel von Testpersonen während der Bearbeitung eines adaptiven, verglichen mit einem nicht-adaptiven Test am Computer (p = .029), jedoch keine signifikanten Unterschiede im Selbstbericht von Aufregung (p = .108) und Stress/Angst (p = .065).

Im dritten Beitrag von Brüggemann, Ludewig, Lorenz und McElvany wurden die Effekte eines CAT zur Erfassung der Lesekompetenz auf Testängstlichkeit und Motivation von Grundschülerinnen und Grundschüler (N = 387) im Vergleich mit papierbasierten und computerbasierten NCATs untersucht. Es ließen sich keine direkten Auswirkungen der Adaptivität auf die Motivation oder Testängstlichkeit feststellen. Motivationsunterschiede wurden zwischen den Testformaten gefunden, ließen sich jedoch nicht auf die Adaptivität zurückführen. Jedoch zeigte sich ein Geschlechtsunterschied beim Verlauf der Testangst über den Testverlauf bei CAT (Anstieg bei den Mädchen, p = .002, Absinken bei den Jungen, p = .007)

Im vierten Beitrag von Schenk, Naumann und Frey wurde das emotionale Erleben in acht unterschiedlich konfigurierten adaptiven und nicht-adaptiven Hochschulprüfungen im Rahmen einer Vignettenstudie (N = 2566) untersucht. Bei den Prüfungsszenarien handelte es sich u.a. um papierbasierte Klausuren, CAT-Klausuren ohne Item-Review sowie CAT mit verschiedenen Item-Review-Verfahren. Es zeigte sich, dass bezogen auf alle untersuchten Leistungsemotionen sowie auf das subjektive Kontrollerleben, ein signifikanter Haupteffekt der Prüfungsszenarien vorlag (p .002). In der Regel gingen CAT-Klausuren (mit oder ohne Item-Review) mit stärkeren positiven Emotionen und schwächeren negativen Emotionen einher als NCAT-Klausuren.

Die Einzelbeiträge des Symposiums werden abschließend von Reinhard Pekrun auch im Hinblick auf die Verwendung von CAT im Bildungsbereich diskutiert.

 

Beiträge des Symposiums

 

Metaanalyse zu den Effekten computerisierten adaptiven Testens auf Motivation und Emotion von Testpersonen

Andreas Frey, Tuo Liu, Aron Fink, Christoph König
Goethe-Universität Frankfurt am Main

Theoretischer Hintergrund

Computerisiertes adaptives Testen (CAT; z. B. Frey, 2023) ist eine dynamische Art zur Messung individueller Merkmale bei der sich die Auswahl der einer Person vorgelegten Items an der Beantwortung zuvor präsentierter Items orientiert. Bei der adaptiven Messung eines Leistungsmerkmals, bekommen leistungsfähige Personen schwierigere Items vorgelegt als weniger leistungsfähige Personen. Die interindividuelle Vergleichbarkeit der so ermittelten Testresultate wird durch die Verwendung eines mit der Item Response Theory (z. B. van der Linden, 2016) kalibrierten Itempools sichergestellt. Auf diese Weise kann die Messung ausgesprochen effizient erfolgen. In der Regel werden beim adaptiven Testen nur circa halb so viele Items benötigt, um die gleiche Messpräzision zu erreichen, wie bei linearer Itemvorgabe, bei der alle Personen die gleichen Items in gleicher Reihenfolge vorgelegt bekommen. Seit Beginn der Forschung zu CAT in den 1970er Jahren wurde wiederholt proklamiert, dass CAT wünschenswerte Effekte auf die Motivation zur Testbearbeitung und auf das emotionale Erleben der Testsituation hat (z. B. Betz & Weiss, 1977). Eine belastbare empirische Grundlage für diese Aussage liegt jedoch bislang nicht vor. Die betreffende Literatur ist heterogen. Dies weist darauf hin, dass die Annahme einfacher Haupteffekte von CAT auf Motivation und auf Emotion wahrscheinlich zu kurz greift und von Moderatoreffekten auszugehen ist.

Fragestellungen

Die vorgestellte Studie beantwortet zwei zentrale Fragestellungen:

1. Welche Effekte hat CAT im Vergleich zum nicht-adaptiven Testen (NCAT) auf die Motivation zur Testbearbeitung, auf negative Emotion und auf positive Emotion?

2. Gibt es Variablen, die diese Effekte moderieren?

Die Moderatoren werden danach unterschieden, ob sie sich auf Merkmale (a) des Tests, (b) der Testperson oder (c) der Testsituation beziehen.

Methode

Zur Beantwortung der Fragestellungen wurde eine Metaanalyse durchgeführt. Berücksichtigt wurden Originalarbeiten, die CAT mit NCAT bezüglich motivationaler und/oder emotionaler Zustände verglichen, mindestens eine Effektgröße mit Standardfehler angaben oder Informationen zu deren Berechnung lieferten und in Englisch, Deutsch oder Chinesisch verfasst waren. Aus dem mehrschrittigen Selektionsprozedere resultierten 27 Studien mit insgesamt 190 Effektstärken. Diese Studien wurden kodiert und anschließend statistisch analysiert. Als metaanalytisches Modell wurden ein Drei-Ebenen-Modell mit Zufallseffekten, CAT vs. NCAT als unabhängige Variable und Motivation, positive Emotion und negative Emotion als abhängige Variablen genutzt. Als gemeinsame Effektstärke kam Cohen’s d zum Einsatz. Ein Cochrane Risk of Bias Assessment wurde durchgeführt und Publikations-Bias mit Funnel Plot und Egger-Test untersucht und insofern notwendig mit PET-PEESE (Stanley & Doucouliagos, 2014) korrigiert.

Ergebnisse

Der mittlere Effekt von CAT wurde für keine der drei AVs signifikant (d ≤ 0.13; p ≥ .119). Die Homogenitätsanalyse zeigte substantielle Heterogenität der Effektstärken für alle drei AVs. Bei der Moderatoranalyse ergaben sich signifikante Moderatoreffekte auf erlebte Motivation von „Test-Speededness“ (p = .046), auf positive Emotion von „sofortigem Antwort-Feedback“ (p = .003), „Möglichkeit zur Antwortkorrektur“ (p = .028) und Test-Speededness“ (p = .029) und auf negative Emotion von „Aufgabenschwierigkeit“ (p = .022).

Diskussion

Die präsentierte Metaanalyse ist die bislang umfassendste Arbeit zu den motivational-emotionalen Effekten von CAT. Sie unterstreicht, dass Aussagen im Sinne einfacher Haupteffekte von CAT zu kurz greifen und dass das motivational-emotionalen Erleben von Testungen aus dem Zusammenspiel verschiedener Test-, Person- und Situationsvariablen resultiert. Im Vortrag werden auf Basis der Befunde Ansatzpunkte diskutiert, um das emotionale Erleben bei adaptiven Testungen zu optimieren.

 

Physiologische und subjektive Stressreaktionen in adaptiven vs. nicht-adaptiven Tests

Miriam Wünsch1, Anne Frenzel1, Luning Sun2
1Ludwig-Maximilians-Universität München, 2University of Cambridge

Theoretischer Hintergrund

Während im klassischen, nicht-adaptiven Testen jede Testperson dieselben Items bearbeiten, welche typischerweise in ansteigender Schwierigkeit präsentiert werden, erfolgt im adaptiven Testen die Präsentation des nächsten Items basierend auf der fortlaufenden Leistung der Testperson (Thompson & Weiss, 2011). Dadurch werden in adaptiven Tests weniger Items benötigt, um eine genauere Einschätzung der tatsächlichen Fähigkeiten einer Person vorzunehmen (Weiss, 2004, 2011). Diese herausragende Effizienz erreicht ein Maximum bei einer Schwierigkeit von 50% (Wise, 2014), was zur Folge hat, dass jede Testperson mit für sie relativ schwierigen Items konfrontiert wird und im gesamten Test (nur) eine 50% Lösungsrate erreichen kann. Zentrale Hypothese des vorliegenden Beitrags ist, dass diese Vorgehensweise möglicherweise negative affektive Konsequenzen für die Testpersonen mit sich bringen. Die bisherige Studienlage ist uneinheitlich, mit sowohl Befunden, die auf vermehrte (z.B. Ling et al., 2017; Martin & Lazendic, 2018) als auch auf verringerte Angst (z.B. Fritts & Marszalek, 2010) während der Bearbeitung adaptiver Tests hindeuten.

Fragestellungen

Die vorliegende Studie leistet einen Beitrag zum besseren Verständnis der emotionalen Auswirkungen von adaptiven Leistungstests, indem neben selbstberichteten Emotionen auch zum ersten Mal das physiologische Stresserleben der Testpersonen betrachtet wird.

Es wurde untersucht, ob Personen während der Bearbeitung eines adaptiven im Vergleich zu einem nicht-adaptiven Test mehr a) Physiologischen Stress, b) Subjektive Aufregung, c) Subjektive/n Angst und Stress erleben.

Methode

In einem within-subject Design bearbeiteten die Testpersonen am Computer einen adaptiven und einen nicht-adaptiven Tests zur Erfassung von Numerischem Denkvermögen, wobei der einen Hälfte der Personen zuerst der adaptive und der anderen Hälfte zuerst der nicht-adaptive Test präsentiert wurde. Aus den 49 von Loe et al. (2018) entwickelten Items wurden zwölf für den nicht-adaptiven Test ausgewählt und mit aufsteigender Schwierigkeit präsentiert, wobei die Hälfte der Items einen Schwierigkeitsparameter unter bzw. über Null hatte. Die übrigen 37 Items bildeten die Basis für den adaptiven Test, der ebenfalls aus zwölf Items bestand.

Zur Erfassung der physiologischen Stressreaktion wurde die Hautleitfähigkeit während der Testbearbeitung mithilfe von Elektroden auf der Handfläche gemessen und über ein BioNomadix Armband und den M160 Empfänger von BIOPAC an die Software iMotions übermittelt (iMotions, 2022). Als Maß für physiologischen Stress der Testperson wurden die Anzahl der Peaks pro Minute (PPM) in der Hautleitfähigkeit pro Test-Art ermittelt.

Zudem füllten die Testpersonen jeweils nach vier Items, d.h. dreimal pro Test, einen Selbstberichts-Fragebogen zu ihrem aktuellen subjektiven Erleben aus, in welchem die allgemeine Aufregung sowie Stress/Angst erfasst wurden. Aus diesen Antworten wurde der Mittelwert über die drei Messzeitpunkte pro Test gebildet.

Die finale Stichprobe für die Analyse der Selbstberichtsdaten bestand aus N=87 Personen (26/58/2/1 männlich/weiblich/divers/keine Angabe), während in die Analyse der Hautleitfähigkeit 68 Personen eingingen.

Ergebnisse

Für die drei abhängigen Variablen PPM, Aufregung und Stress/Angst wurde jeweils ein Mixed Linear Model berechnet, mit Random Intercepts für Person und Reihenfolge, sowie Test-Art (adaptiv vs. nicht-adaptiv) und Zeit (erster vs. zweiter Test) als Prädiktoren. Unabhängig von Test-Art nahm das physiologische Stresserleben (p<.001) sowie subjektive/r Stress/Angst (p=.033) vom ersten auf den zweiten Test signifikant ab. Wie erwartet zeigte sich zudem höherer physiologischer Stress im adaptiven Test, mit im Mittel 0.27 PPM mehr als im nicht-adaptiven Test (p=.029). Die Modelle für wahrgenommene Aufregung (p=.108) und Stress/Angst (p=.065) zeigten hingegen keine signifikanten Unterschiede zwischen den Test-Arten.

Diskussion

Die Ergebnisse zeigen, dass Personen während der Bearbeitung adaptiver Leistungstests höheren physiologischen Stress erleben, während sich dies jedoch nicht eindeutig in ihrer subjektiven Wahrnehmung von Aufregung oder Stress und Angst widerspiegelt. Basierend auf Studien, die einen nur bestenfalls moderaten Zusammenhang zwischen Hautleitfähigkeit und subjektiver Testangst zeigten (Roos et al., 2021), ist es also möglich, dass adaptives Testen differenzielle Effekte auf physiologischen Stress und die subjektive Wahrnehmung dessen hat.

 

Testängstlichkeit und Lesemotivation bei computeradaptiven Tests in der Grundschule

Thomas Brüggemann, Ulrich Ludewig, Ramona Lorenz, Nele McElvany
Institut für Schulentwicklungsforschung, TU Dortmund

Theoretischer Hintergrund

Digitale Medien werden vermehrt im Schulkontext eingesetzt (Lorenz et al., 2022). In der Grundschule können digitale Medien zur Leseförderung und Diagnostik genutzt werden (z.B. Goldhammer et al., 2023). Dabei bieten computeradaptive Tests (CAT) eine Alternative zu computerbasierten (CBT) und papierbasierten Tests (PPT). CBTs unterscheiden sich von PPTs in ihrer Aufgabendarstellung (z.B. Furenes et al., 2021) und CATs unterscheiden sich von CBTs und PPTs in der Aufgabenselektion (z.B. Frey, 2020). Die Unterschiede zwischen diesen drei Testformaten können sich auf das Testerleben in Form von Motivation und Testängstlichkeit auswirken (z.B. Colwell, 2013). Lesemotivation und Testängstlichkeit bestehen aus einer Eigenschaftskomponente (Trait) und einer Zustandskomponente (State; Tremblay et al., 1995; Zohar et al., 1998).

Computer wirken auf Grundschüler*innen oft motivierend (z.B. Picton, 2014), wobei fraglich ist, ob die Motivation langfristig anhält (Neuheitseffekt; Shin et al., 2019). Die potenziell motivierenden Effekte von CATs durch anspruchsvolle Aufgaben (Weiss & Betz, 1973) wurden bisher nur wenig untersucht (Ling et al., 2017). Gleichzeitig sind Effekte der Testformate auf die Testängstlichkeit durch Computerangst (z.B. dos Santos & de Santana, 2018) und Unterschiede in der Itemselektion (Ling et al., 2017) möglich.

Fragestellungen

Bisherige Studien zu den Unterschieden zwischen PPT, CBT und CAT sind meist im Bereich der Mathematik verortet (z.B. Martin & Lazendic, 2018), untersuchen Schüler*innen in der Sekundarstufe (Ling et al., 2017) und vergleichen meist zwei der drei Formate (z.B. Fritts & Marszalek, 2010). Daher wird in dieser Studie untersucht, inwiefern sich PPTs, CBTs und CATs auf die Lesemotivation und Testängstlichkeit von Grundschüler*innen der vierten Klasse in einem Lesekompetenztest auswirken.

Methode

An einer experimentellen Studie nahmen N = 387 Schülerinnen und Schüler der vierten Klasse (48.2 % weiblich) in allgemeinbildenden Grundschulen in Nordrhein-Westfalen an einem Lesekompetenztest (Rel.¬¬¬WLE = .84) teil. Die Schüler*innen wurden zufällig innerhalb ihrer Klassen in drei Gruppen aufgeteilt, die den Lesekompetenztest jeweils papierbasiert, computerbasiert oder computeradaptiv bearbeiteten. Die Schüler*innen wurden vor dem Lesekompetenztest nach ihrer allgemeinen Trait-Lesemotivation (α = .89) und Testängstlichkeit (α = .83) gefragt, sowie nach der Ankündigung des Lesekompetenztests nach ihrer State-Testängstlichkeit (α = .68). In der Mitte (inter) und am Ende (post) des Tests wurde die State-Lesemotivation (αinter = .82; αpost = .90) und State-Testängstlichkeit (αinter = .71; αpost = .82) erfasst. Am Ende des Tests wurde ebenfalls die Testmotivation (α = .87) gemessen. Fehlende Werte wurden mit der Bibliothek missRanger (Mayer, 2019) in R imputiert. Die Daten wurden mithilfe von linear mixed-effect Modellen mit der R-Bibliothek lme4 (Bates et al., 2014) ausgewertet.

Ergebnisse

Die Ergebnisse zur State-Lesemotivation fanden signifikante Haupteffekte von Trait-Lesemotivation und dem Testmedium (Papier versus Bildschirm). Schüler*innen, die gerne lesen, fanden die Testaufgaben spannender. Weiterhin lasen Schüler*innen lieber am Computer als am Papier. Über den Testverlauf sank die Lesemotivation am Bildschirm signifikant ab und war am Ende des Tests auf dem Niveau der Lesemotivation der Kinder am Papier. Es gab keine Unterschiede zwischen den Testformaten in der Post-Test Testmotivation.

Die Trait-Testängstlichkeit war ein signifikant positiver und die Lesekompetenz ein signifikant negativer Prädiktor der State-Testängstlichkeit. Es gab keine Unterschiede zwischen dem PPT, CBT oder CAT in der empfundenen State-Testängstlichkeit. Weitere Analysen nach Geschlechtsunterschieden fanden eine signifikant erhöhten Anstieg der State-Testängstlichkeit für Schülerinnen im CAT und ein Sinken der State-Testängstlichkeit für Schüler im CAT.

Diskussion

Die Befunde zur Lesemotivation deuten einen Neuheitseffekt (Shin et al., 2019) für bildschirmbasierte Tests an. CATs wirkten dabei nicht motivierender als der PPT oder CBT (vgl. Weiss & Betz, 1973). Unterschiede in der Testängstlichkeit zwischen den Testformaten wurden nicht gefunden (vgl. Ling et al., 2017). Die Geschlechtsunterschiede werden vor dem Hintergrund des Testthemas der Lesekompetenz und dem Alter der Schüler*innen mit Blick auf die Testfairness diskutiert.

 

Emotionale Effekte verschiedener Item-Review-Verfahren bei adaptiven Hochschulklausuren

Cosima Schenk, Patrick Naumann, Andreas Frey
Goethe-Universität Frankfurt am Main

Theoretischer Hintergrund

Computerisiertes adaptives Testen (CAT) kennzeichnet sich dadurch, dass sich die Auswahl des als nächstes vorzugebenden Items am vorherigen Antwortverhalten des getesteten Individuums orientiert (z.B. Frey, 2020). Diese hocheffiziente Art des Testens eignet sich in besonderem Maße zur Messung des Kompetenzstandes von Studierenden im Rahmen von Klausuren (Spoden & Frey, 2021). Jedoch kann die Bearbeitung von adaptiven Klausuren für die getesteten Studierenden mit Emotionen mit negativer Valenz einhergehen (Kimura, 2017). Eine Ursache hierfür könnte sein, dass bei adaptiven Klausuren kein Item-Review vorgesehen ist, also keine Möglichkeit besteht, bearbeitete Items im Nachhinein noch einmal durchzugehen und Antworten bei Bedarf zu verändern (Stocking, 1997). Dadurch könnte es zu einem verringerten Kontrollerleben kommen, welches – gemäß der Kontroll-Wert-Theorie von Pekrun und Perry (2014) – zu negativen emotionalen Reaktionen führt. Ein gesteigertes Kontrollerleben könnte hingegen zu positiven emotionalen Reaktionen führen. Dies wäre nicht nur für die getesteten Individuen angenehm, sondern dürfte auch den Abruf der maximalen Leistungsfähigkeit und die Akzeptanz adaptiver Klausuren fördern.

Im Rahmen der präsentierten Studie wurden verschiedene Item-Review-Verfahren für computerbasierte Tests, darunter auch drei neu konzipierte Verfahren, hinsichtlich des emotionalen Erlebens durch Studierende im Vergleich zu papierbasiertem Testen untersucht. Bei den drei neu entwickelten Verfahren handelt es sich um CAT-„Answer Until Correct“ (CAT-AUC), bei dem Studierende eine Aufgabe so lange bearbeiten dürfen bis diese richtig gelöst wurde, CAT-„Final Answer“ (CAT-FA), bei dem Studierende entweder vorläufige oder finale Antworten geben dürfen, und CAT-„Skipping“ (CAT-SK), bei dem Aufgaben übersprungen werden dürfen.

Fragestellungen

Mithilfe der Studie werden die folgenden Fragestellungen untersucht:

Wie ist das emotionale Erleben von Studierenden während einer Klausur in Abhängigkeit des Item-Review-Verfahrens?

Wie ist das subjektive Kontrollerleben von Studierenden während einer Klausur in Abhängigkeit des Item-Review-Verfahrens?

Welche Item-Review-Methode ist für CAT-Klausuren am vorteilhaftesten hinsichtlich des emotionalen Erlebens und des subjektiven Kontrollerlebens?

Methode

Im Rahmen einer Online-Studie mit dem Between-Subjects-Faktor „Prüfungsszenario“ und dem Within-Subjects-Faktor „Messwiederholung“ wurden Studierenden jeweils zwei von acht verschiedenen Prüfungsszenarien als Vignetten vorgelegt. Bei den acht Prüfungsszenarien handelte es sich um papierbasierte Klausuren, computerisierte Klausuren ohne adaptives Testen, CAT-Klausuren ohne Item-Review-Möglichkeit, CAT-Klausuren mit der Möglichkeit, alle Items nachträglich zu verändern (CAT „Full Review“), die drei neu entwickelten Verfahren CAT-AUC, CAT-FA, CAT-SK und um das von Cui et al. (2018) vorgeschlagene Verfahren CAT „Salt“. Als abhängige Variablen wurden das emotionale Erleben (7 Leistungsemotionen) und das subjektive Kontrollempfinden mit Fragebogenskalen erhoben. Die erhobenen Daten (N = 2566) wurden mit generalisierten linearen Mischmodellen mit dem R-Paket lme4 (Bates et al., 2014) analysiert. Fehlende Werte wurden mithilfe multipler Imputation mit dem R-Paket mice (van Buuren & Groothuis-Oudshoorn, 2011) imputiert.

Ergebnisse

Die Analysen zeigen einen signifikanten Effekt des Faktors „Prüfungsszenario“ für alle Leistungsemotionen und das Kontrollempfinden (p ≤ .002). Die Ergebnisse weisen darauf hin, dass ein gesteigertes subjektives Kontrollempfinden insbesondere bei dem Prüfungsszenario CAT-AUC vorliegt, welches auch mit höheren positiven Emotionen und niedrigeren negativen Emotionen einhergeht. In der Regel fallen die emotionalen Reaktionen von Prüfungsszenarien mit CAT (einschließlich solcher mit Item-Review-Verfahren) positiver aus als bei papierbasierten Klausuren und computerisierte Klausuren ohne adaptives Testen.

Diskussion

Die Ergebnisse der vorgestellten Studie weisen auf unterschiedliches emotionales Erleben von verschiedenen Klausurversionen hin. Des Weiteren deuten die Ergebnisse darauf hin, dass die ohnehin schon in der Regel mit wünschenswerteren emotionalen Reaktionen verbundenen adaptiven Klausuren (stärkere positive Emotionen und schwächere negative Emotionen) durch die zielgerichtete Verwendung von Item-Review-Verfahren weiterhin hinsichtlich des Kontrollerlebens und damit distal hinsichtlich des emotionalen Erlebens optimiert werden. Implikationen – insbesondere im Hinblick auf die zukünftige Umsetzung von CAT-Prüfungen – werden diskutiert.

 
11:10 - 12:508-03: Beziehungen zwischen Lehrkräften und Schüler*innen: Dyadische Interaktionen und ihr zeitlicher Verlauf
Ort: H03
 
Symposium

Beziehungen zwischen Lehrkräften und Schüler*innen: Dyadische Interaktionen und ihr zeitlicher Verlauf

Chair(s): Friederike Blume (DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland)

Diskutant*in(nen): Christoph Niepel (Universität Luxembourg)

Theoretische Konzepte und Überlegungen betonen stets die Wichtigkeit von Eigenschaften des Schulkontexts für die Entwicklung und den akademischen Erfolg von Schüler*innen (z.B. Bronfenbrenner & Morris, 2006; McClelland & Cameron, 2011; Thelen & Smith, 1994). Insbesondere den dyadischen Interaktionen zwischen Lehrkräften und einzelnen Schüler*innen im Klassenzimmer wird in diesem Zusammenhang eine wesentliche Rolle zugeschrieben (z.B. Pianta et al., 2003; Spilt et al., 2022). Studien zeigten, dass die Qualität dieser Interaktionen bedeutsamen mit akademischen Ergebnissen von Schüler*innen in Zusammenhang steht, wie beispielsweise dem Lernverhalten, dem Engagement im Unterricht, der Motivation, den Emotionsregulationsfähigkeiten und den exekutiven Funktionen (z.B. Birch & Ladd, 1997; Furrer & Skinner, 2003; Roorda et al., 2017; Sankalaite et al., 2021). Empirische Untersuchungen deuten zudem darauf hin, dass die positive Wirkung von qualitativ hochwertigem Unterricht auf die Leistungen der Schüler*innen nur dann zum Tragen kommt, wenn eine gute Beziehung zwischen Schüler*innen und ihrer Lehrkraft besteht (Nguyen et al., 2020). Darüber hinaus konnte gezeigt werden, dass qualitativ hochwertige Interaktionen im Unterricht insbesondere für Schüler*innen mit einem erhöhten Risiko für schlechte schulische Leistungen von großer Bedeutung sind (McGrath & Van Bergen, 2015). Die Qualität von Lehrkraft-Schüler*in-Interaktionen nimmt somit eine zentrale Rolle für die schulischen Ergebnisse von Schüler*innen ein.

Dyadische Lehrkraft-Schüler*in-Beziehungen spiegeln die Qualität der Interaktionen innerhalb des Mikrosystems zwischen einer Lehrperson und einem*einer einzelnen Schüler*in wider (Pianta et al., 2003). Um die Interaktionen und ihre Wirkungen zu verstehen, werden verschiedene theoretische Ansätze herangezogen, darunter die Interpersonale Theorie (Horowitz & Strack, 2011; Leary, 1957), die Selbstbestimmungstheorie (Ryan & Deci, 2000) und die Bindungstheorie (Bowlby, 1969). Die Qualität der Beziehung zwischen Lehrkraft und Schüler*in wird, unabhängig vom theoretischen Zugang, als Ergebnis eines dynamischen Zusammenspiels von Merkmalen beider Interaktionspartner auf intrapersonaler, interpersonaler und kontextueller Ebene gesehen (Spilt et al., 2022). Die Beziehungsqualität unterliegt somit einer stetigen Entwicklung, und jede einzelne Messung kann lediglich eine Momentaufnahme darstellen. Die bisherige Forschung hat dem dyadischen Charakter der Lehrkraft-Schüler*in-Beziehung allerdings wenig Aufmerksamkeit geschenkt und sich häufig nur auf das Interaktionsverhalten einer der beiden Partner*innen innerhalb der Dyade konzentriert. Zudem analysierten frühere Studien hauptsächlich Daten, in welchen die Qualität der Lehrkraft-Schüler*in-Beziehung nur einmalig und somit unter Vernachlässigung von Schwankungen über die Zeit erhoben wurde.

Die im vorliegenden Symposium vorgestellten Beiträge gehen diese Schwächen an, indem sie den dyadischen Charakter von Interaktionen zwischen Lehrkräften und ihren Schüler*innen berücksichtigen. Darüber hinaus analysieren zwei der Beiträge Daten, die über mehrere Messzeitpunkte hinweg erhoben wurden. Der erste Beitrag stellt den ersten Fragebogen zur Bewertung dyadischer Lehrkraft-Schüler*in-Beziehung aus der Perspektive der Interpersonalen Theorie sowie die Ergebnisse von zwei Validierungsstudien vor. Der zweite Beitrag berichtet die Ergebnisse einer Studie, welche die Auswirkungen der Adaptivität oder Passung der dyadischen Lehrkraft-Schüler*in-Beziehung in Bezug auf die akademischen Kompetenzen jedes*jeder Schüler*in auf die Qualität ihrer Motivation untersucht hat. Der dritte Beitrag stellt die Ergebnisse einer Studie, die die Beziehungen zwischen der täglich von Schüler*innen wahrgenommenen Befriedigung und Frustration ihrer Bedürfnisse nach Autonomie, Eingebundenheit und Kompetenz (d.h. Qualität der Lehrkraft-Schüler*in-Beziehung aus der Sicht der Selbstbestimmungstheorie), gemessen während 15 aufeinanderfolgenden Schultagen, und dem Zuwachs in der Fähigkeit zur Selbstregulation über einen Zeitraum von fünf Monaten untersucht hat, vor. Im vierten Beitrag werden Ergebnisse aus drei Studien präsentiert, die die kreuzverzögerten Zusammenhänge zwischen dem fachlichen Interesse von Schüler*innen der Begeisterung der Lehrkräfte für den Unterricht untersucht haben. Insgesamt stellen die Beiträge dieses Symposiums eine Vielzahl innovativer und bedeutsamer Erkenntnisse vor, die die bisherige Forschung zu Lehrkraft -Schüler*in-Beziehungen sinnvoll ergänzen und erweitern.

 

Beiträge des Symposiums

 

Zusammenhänge zwischen Lehrkraftverhalten, Lehrkraftemotionen, wahrgenommener Beziehungsqualität zum Kind und den Kompetenzen des Kindes. Vorstellung eines neuen Befragungsinstrumente in dyadischen Lehrkraft-Kind-Beziehungen

Madeleine Kreutzmann, Madita Frühauf, Malte Roswag, Karoline Koeppen
Freie Universität Berlin

Das mehrdimensionale Konstrukt "Lehrkraft-Kind-Beziehung" umfasst neben dem Verhalten auch Emotionen und Wahrnehmungen der Beziehungsqualität (Pianta et al., 2003). In unserer Forschung fokussieren wir auf das Interaktionsverhalten der Lehrkraft, das auf das Lernen des Kindes bezogen ist.

Das interpersonale Verhalten einer Lehrkraft kann gemäß der interpersonellen Theorie (Horowitz & Strack, 2011; Leary, 1957) auf den Dimensionen Agency (Lenkung, Kompetenz) und Communion (Wärme) beschrieben werden. Da beide Dimensionen orthogonal zueinander stehen, bilden sie die Grundlage einer Kreisstruktur, dem sog. interpersonalen Zirkumplex. Bisherige Studien zur Bedeutsamkeit interpersonellen Lehrkraftverhaltens betrachten üblicherweise Lehrkraftverhalten gegenüber der Schulklasse (z.B. Wubbels, 2015). Dabei hat sich eine Kombination aus hoher Communion und moderater Agency als besonders günstig für die motivationale Entwicklung von Schüler:innen erwiesen (Aelterman, et al. 2018). Weitgehend unberücksichtigt blieb bisher, dass Lehrkräfte in pädagogischen Interaktionen gegenüber einzelnen Kindern durchaus unterschiedliche Verhaltensweisen zeigen können, da sich Verhaltensweisen der Interaktionspartner:innen in einer Dyade wechselseitig bedingen. Genauer besagt das sog. Komplementaritätsprinzip, dass hoch kommunale Verhaltensweisen des einen Interaktionspartners hoch kommunale Verhaltensweisen des anderen begünstigen, während hoch agentisches Verhalten wenig agentisches Verhalten des anderen begünstigt – und umgekehrt (vgl. Sadler et al., 2011). Mit dem neu entwickelten „Fragebogen zum Lehrkraftverhalten in dyadischen Lehrkraft-Kind-Beziehungen“ wenden wir den interpersonalen Zirkumplex und das Komplementaritätsprinzip erstmals zur Beschreibung dyadischer Lehrkraft-Kind-Beziehungen an. In dem Fragebogen beschreibt die Lehrkraft, wie stark unterschiedliche –im Ausmaß von Agency und Communion variierenden– Verhaltensweisen ihr Verhalten gegenüber einem bestimmten Kind beschreiben. Als Beispiel für hohe Agency gelten Verhaltensweisen, mit denen dem Kind beim Lernen klare Strukturen und Anleitung vorgegeben werden. Hohe Communion wird durch Items erfasst, die Zuwendung und Wertschätzung gegenüber dem Kind ausdrücken.

Dieser Beitrag umfasst zwei Studien, in denen wir den neu entwickelten Fragebogen vorstellen, seine strukturelle Validität prüfen und für die Prüfung seiner Konstruktvalidität Zusammenhänge mit Wahrnehmungen zur Beziehungsqualität, Lehrkraftemotionen und den Kompetenzen des Kindes (Komplementaritätsprinzip) untersuchen.

In Studie 1 beantworteten 88 Grundschullehrkräfte den 20 Items umfassenden Fragebogen für jeweils fünf zufällig ausgewählte Kinder (N = 440) ihrer Klasse und machten Angaben zur Beziehungsqualität (Nähe, Konflikt, Abhängigkeit; vgl. Milatz et al., 2014), ihren Emotionen gegenüber dem Kind (Freude, Ärger, Angst; vgl. Frenzel et al., 2016) und dessen Noten in den Fächern Mathematik und Deutsch. Konfirmatorische Strukturanalysen (vgl. Grassi et al., 2010) zeigten eine gute Modellanpassung und bestätigten die (quasi )zirkuläre Struktur des finalen Messinstruments mit insgesamt acht Skalen (χ2 (17) = 141.44, RMSEA = 0.129, GFI = 0.934, AGFI = 0.868). Structural-Summary-Analysen (vgl. Gurtman, 1992) verwiesen auf systematische Korrelationen zwischen Lehrkraftverhalten und Einschätzungen zur Beziehungsqualität und Lehrkraftemotionen. Das Komplementaritätsprinzip bestätigte sich darin, dass sich die Lehrkraft umso agentischer verhielt, je weniger agentischer das Kind war, gemessen durch seine Noten. Zudem waren Verhaltensweisen mit hoher Communion bei gleichzeitig moderater bis niedriger Agency besonders ausgeprägt, wenn die Lehrkraft die Beziehungsqualität zu einem Kind als nah, wenig konflikthaft oder abhängig einschätzte, in der Interaktion mit dem Kind hohe Freude, wenig Ärger oder Angst erlebte.

In Studie 2 werden die Verhaltensbeschreibungen von acht Lehrkräften mit Schüler:innendaten (N = 149) zusammengeführt. Zusätzlich zu den Mathematik- und Deutschnoten wurde diesmal die Sprachkompetenz der Kinder mit einem standardisierten Leistungstest (C-Test; IQB, 2017) erfasst. In der Structural-Summary-Analyse bestätigte sich das Komplementaritätsprinzip durch eine statistisch bedeutsame Korrelation zwischen Agency der Lehrkraft und der Agency des Kindes, hier gemessen über seine Sprachkompetenz: Je höher die Sprachkompetenz des Kindes war, desto weniger agentisch verhielt sich die Lehrkraft.

Die Ergebnisse beider Studien sprechen für die Gültigkeit des Komplementaritätsprinzips in Lehrkraft-Kind-Dyaden und damit für die Konstruktvalidität unseres Instrumentes. Die Vorteile einer Erfassung von Lehrkraftverhaltensweisen auf Ebene von Dyaden werden vor dem Hintergrund diskutiert, dass eine hohe Komplementarität zwischen Lehrkraftverhalten und den Kompetenzen des einzelnen Kindes einer adaptiven Unterrichtspraxis entspricht.

 

Wie Agency und Communion im Lehrkraftverhalten die Motivation des Kindes vorhersagen. Analyse von Befragungsdaten in Lehrkraft-Kind-Dyaden an der Grundschule

Karoline Koeppen, Malte Roswag, Madita Frühauf, Madeleine Kreutzmann
Freie Universität Berlin

Lehrkraftverhalten gegenüber Schüler:innen lässt sich entsprechend der interpersonellen Theorie (Leary, 1957) als Zirkumplex auf zwei orthogonalen Dimensionen beschreiben: die Communion-Dimension bezieht sich dabei auf Qualitäten, die für den Aufbau und die Aufrechterhaltung sozialer Beziehungen erforderlich sind (z. B. Wärme, Herzlichkeit) und die Agency-Dimension auf Qualitäten, die für das Erreichen von Zielen erforderlich sind (z. B. Führung, Anleitung, Kompetenz). Dabei bedingen die Verhaltensweisen von Lehrkraft und Kind einander wechselseitig: stark kommunales Lehrkraftverhalten macht kommunales Verhalten des Kindes wahrscheinlicher, stark agentisches Lehrkraftverhalten macht hingegen schwach agentisches Verhalten des Kindes wahrscheinlicher (sog. Komplementaritätsprinzip, vgl. Sadler et al., 2011). Starke Communion im Lehrkraftverhalten geht mit stärker selbstbestimmten Formen der Motivation bei Schüler:innen einher (Metaanalyse: Roorda et al. 2017). Weniger eindeutig ist, ob ein bestimmtes Ausmaß an Agency besonders motivationsförderlich ist. Aus Sicht der Selbstbestimmungstheorie sollte geringe Agency besonders günstig sein (vgl. Aelterman & VansteenKiste, 2023)

Wir nehmen im Unterschied dazu an, dass die Qualität der Motivation des Kindes von der Adaptivität oder Passung der Lehrkraft-Agency zur individuellen Kompetenz des Kindes (Komplementarität) abhängt: ein Kind mit noch geringen Kompetenzen sollte von Struktur und Anleitung der Lehrkraft profitieren, ein Kind mit gut entwickelten Kompetenzen hingegen von mehr Freiräumen, d.h. von einem weniger agentischen Lehrkraftverhalten.

Um diese Annahme zu prüfen, untersuchten wir das Lehrkraftverhalten innerhalb von Lehrkraft-Kind-Dyaden. Wir befragten Lehrkräfte und ihre Klassen (Klassenstufe 3-6) an 16 Berliner Grundschulen an Tablets bzw. am PC. Die 74 Lehrkräfte beschrieben dabei ihr Verhalten gegenüber jedem Kind ihrer Klasse anhand von 20 Items, die verschiedene Kombinationen von Communion und Agency beinhalten. Die N = 1151 Kinder beschrieben die Qualität ihrer Motivation im Unterricht bei der jeweiligen Lehrkraft (intrinsische, extrinsische Motivation und Amotivation). Um die Adaptivität der Agency des Lehrkraftverhaltens in Abhängigkeit der individuellen Kompetenz des Kindes messen zu können, erfassten wir die Mathematikkompetenz des Kindes anhand eines standardisierten Leistungstest (BEFKI, Schroeders et al., 2020). Wir nutzten den von Madon et al. (1997) vorgeschlagenen Residualansatz, bei dem zunächst Lehrkraft-Agency durch die Mathematikleistungen der Kinder vorhergesagt wurde. Die aus dieser Regression resultierenden Residuen spiegelten die unerklärte Varianz wider und dienten als Maß für Komplementarität (s.a. Gentrup et al., 2020). Unter Berücksichtigung der hierarchischen Struktur der Daten fanden wir in Random Intercept-Modellen (Fixed Slopes) in Übereinstimmung mit den Befunden früherer Studien (Metaanalyse: Roorda et al., 2017), dass stärker kommunales Lehrkraftverhalten stärker ausgeprägte selbstbestimmte Formen der Motivation beim Kind vorhersagte. Gleichzeitig fanden wir weniger ausgeprägte selbstbestimmte Formen der Motivation in dem Maße, in dem die Agency im Lehrkraftverhalten nicht passend zur Kompetenz des Kindes war. Kinder, die im Verhältnis zum gemessenen Kompetenzniveau zu viel Agency durch die Lehrkraft erhielten, berichteten stärkere Amotivation. Die extrinsische Motivation war höher für Kinder, die wenig passende (zu viel oder zu wenig) Agency erhielten. Für die intrinsische Motivation zeigten sich wider Erwarten keine Effekte der Passung der Agency zur Kompetenz.

Unsere Ergebnisse stehen im Einklang mit den Annahmen der Self-Determination-Theory (SDT; Deci & Ryan, 2000), insofern als starke Communion im Lehrkraftverhalten selbstbestimmte Motivationsformen voraussagte. Die Befunde gehen jedoch über die SDT hinaus, indem sie nahelegen, dass die Lehrkraft jedem Kind in Abhängigkeit seines Kompetenzstandes ein unterschiedliches Maß an Autonomie oder Struktur (mehr oder weniger Agency) bieten sollte. Wir diskutieren die Ergebnisse im Hinblick auf Implikationen für eine adaptive Unterrichtspraxis, in der jedem Kind ein Lehrkraftverhalten zuteil wird, das seine individuelle Lernentwicklung optimal fördert.

 

Unlocking potential!? The power of the quality of day-to-day teacher-child relationships in shaping the development of self-regulation

Friederike Blume1, Jantine Spilt2, Dieter Baeyens2
1DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland, 2KU Leuven

The quality of dyadic teacher-child relationships (TCRs; cf. Spilt et al., 2022) has long been considered key to student development (Bronfenbrenner & Morris, 2006; Thelen & Smith, 1994). Studies evidenced their quality to be linked to students’ academic outcomes, their social skills and learning behaviour, their emotion regulation skills, and their cognitive functioning (Birch & Ladd, 1997; Furrer & Skinner, 2003; Sankalaite et al., 2021). The particular relevance of high-quality TCRs for students at risk for negative developmental and academic outcomes has also been demonstrated (e.g., McGrath & Van Bergen, 2015).

Self-determination theory (SDT) provides one theoretical approach for addressing dyadic TCRs (Ryan & Deci, 2000; Spilt et al., 2022). Research has consistently demonstrated positive associations between the fulfilment of three fundamental psychological needs: autonomy, relatedness, and competence and students’ outcomes (e.g., Skinner & Belmont, 1993; Stroet et al., 2013). Previous research into TCRs has, nonetheless, overlooked the fact that these needs can also be thwarted (e.g., Vansteenkiste & Ryan, 2013). Furthermore, it has not adequately acknowledged that TCRs’ quality may vary from day to day, and longer-term daily evaluations could thus increase the precision of the information provided. Additionally, dyadic TCRs have been insufficiently examined from the students’ point of view (e.g., Spilt et al., 2022). Finally, the significance of TCRs for the development of students’ self-regulation (e.g., McClelland & Cameron, 2011) has yet to be addressed. The present investigation therefore aimed to examine associations between student-perceived need satisfaction and dissatisfaction, as reported by Flemish primary school students over 15 consecutive school days, and the development of students’ parent-reported self-regulation over five months.

Methods

Ninety-six parents (Mage = 9.36 years, SD = 0.83) completed a background questionnaire, providing demographic information and reporting on their child’s self-regulation (SWAN-NL; Greven et al., 2018). They also completed a post-test questionnaire on their child’s self-regulation five months later. Immediately following the background questionnaire, children reported on their daily perceived need satisfaction and dissatisfaction (i.e., the dyadic TCRs) over 15 consecutive school days using items adapted from the Balanced Measure of Psychological Needs Scale (Neubauer & Voss, 2016). To analyse the data, three multiple regression models were estimated. These included students’ age and mean satisfaction and dissatisfaction of a) autonomy, b) relatedness, and c) competence needs over the study period as predictors of change in students’ self-regulation (i.e., difference score post-pre). The predictors were z-standardised.

Results

The satisfactions of the needs for autonomy (β = .18, p > .05), relatedness (β = .14, p > .05), and competence (β = .09, p > .05) were not linked to the growth of students’ self-regulation. The dissatisfactions of the needs for autonomy (β = .27, p < .05), relatedness (β = .26, p < .05), and competence (β = .30, p < .05; curvilinear association) were positively associated with the growth of students’ self-regulation, as was students’ age (all βs > .23, p < .05).

Discussion

The findings were unexpected as they revealed no association between needs satisfaction and the change in students’ self-regulation over five months, but an association with the dissatisfaction of needs. The findings thus suggest that lower, but not higher quality TCRs are linked to more positive development. While this hypothesis is not strongly supported by existing research, the results may indicate that greater dissatisfaction of needs poses a significant challenge to students’ self-regulation, thereby providing a greater prospect for growth. In essence, when students effectively self-regulate despite challenging circumstances, their capacity for self-regulation is more effectively enhanced. Further research is required to investigate this matter, particularly investigations that involve daily associations at the individual level.

 

Wer inspiriert wen? Wechselseitige Beziehungen zwischen dem Enthusiasmus von Lehrpersonen und dem Interesse der Schüler:innen

Alexander Jung1, Tim Fütterer1, Anne Frenzel2, Benjamin Nagengast1, Kou Murayama1
1Universität Tübingen, 2Ludwig-Maximilians-Universität München

Theoretischer Hintergrund. Das fachliche Interesse von Schüler:innen ist eine zentrale Voraussetzung für erfolgreiches Lernen—insbesondere für tiefergehende Verarbeitung von Informationen (für einen Überblick siehe Wigfield & Cambria, 2010). Für die Stimulation des Schüler:innen-Interesses hat sich der Enthusiasmus von Lehrpersonen zu unterrichten als bedeutsame herausgestellt (z.B. Frenzel et al., 2009; Keller et al., 2014; Lazarides et al., 2019; Patrick et al., 2000; für einen Überblick siehe Keller et al., 2016). Allerdings wird der Enthusiasmus von Lehrpersonen bisher meist als zeitlich stabile Eigenschaft (trait) operationalisiert. Lehrpersonen-Enthusiasmus wird dementsprechend häufig nur zu einem Messzeitpunkt erhoben (z.B. Lazarides et al., 2021) und dann der Einfluss von Enthusiasmus auf bspw. das Schüler:innen-Interesse untersucht. Kaum untersucht ist Lehrpersonen-Enthusiasmus jedoch als potentiell variierende Variable (state), weshalb Wechselbeziehungen zwischen dem Lehrpersonen-Enthusiasmus und ihren Schüler:innen bisher nicht im Fokus standen. Seit einigen Jahren wird allerdings verstärkt gefordert, Wechselbeziehungen zwischen Lehrpersonen und Schüler:innen in den Blick zu nehmen (Fauth et al., 2020; Keller et al., 2016; Nurmi & Kiuru, 2015). Es ist naheliegend, dass der Enthusiasmus zu unterrichten auch davon abhängt, wie interessiert die Schüler:innen am Fach sind und mit wie viel Freude sie am Unterricht teilnehmen.

Fragestellungen. In unserer Studie nehmen wir uns den Wechselbeziehungen zwischen dem beim Unterrichten empfundenen Lehrpersonen-Enthusiasmus und dem fachlichen Schüler:innen-Interesse mit zwei Forschungsfragen (FF) an:

(FF1) Beeinflusst der Lehrpersonen-Enthusiasmus zu unterrichten das fachliche Schüler:innen-Interesse?

(FF2) Beeinflusst das durchschnittliche fachliche Interesse einer Klasse den Lehrpersonen-Enthusiasmus zu unterrichten?

Methode. Um Einflüsse von Lehrpersonen auf Schüler:innen und Einflüsse von Schüler:innen auf Lehrpersonen zu entflechten, ist es notwendig, längsschnittliche Daten zu analysieren. Wir nutzen daher cross-lagged panel-Modelle (CLPMs; siehe Usami et al. 2019) um Beziehungen zwischen dem empfundenen (in Abgrenzung zu dargestelltem; Keller, 2016) Enthusiasmus zu unterrichten und dem über Klassen gemittelten Fachinteresse von Schüler:innen in zwei Datensätzen zu untersuchen (1. Datensatz: NLehrpersonen = 164, NSchüler:innen = 3.924, drei Messungen in Klasse 5, Mathematik; 2. Datensatz: NLehrpersonen = 112, NSchüler:innen = 1.578, zwei Messzeitpunkte in aufeinanderfolgenden Schuljahren in Klassen 5 bis 10, Mathematik und Deutsch). Um Scheinzusammenhänge, die durch Methodeneffekte entstehen könnten, auszuschließen, untersuchen wir Zusammenhänge zwischen von Lehrpersonen geratetem Enthusiasmus zu unterrichten und von Schüler:innen geratetem fachlichem Interesse. Das bedeutet, Prädiktoren und Kriterien wurden jeweils von verschiedenen Personen geratet. Wir modellieren die beschriebenen CLPMs als single-level Strukturgleichungsmodelle unter Verwendung manifester Klassenmittelwerte der Schüler:innen-Ratings und nicht als multi-level Modelle, da zweiteres zu unterschätzen Standardfehlern führen würde (Lüdtke et al., 2008).

Ergebnisse. In Datensatz 1 wird sowohl von Lehrpersonen-Enthusiasmus auf das mittlere Schüler:innen-Interesse einer Klasse als auch in umgekehrter Richtung jeweils einer von zwei getesteten Effekten statistisch signifikant: Zwischen Messzeitpunkt 1 und 2 der Effekt von Lehrpersonen auf Schüler:innen (β = ,22, SE = ,06, p < ,001), zwischen Messzeitpunkt 2 und 3 der Effekt in umgekehrter Richtung (β = ,13, SE = ,06, p = ,035). In Datensatz 2 wird lediglich der Effekt von mittlerem Schüler:innen-Interesse auf den Lehrpersonen-Enthusiasmus statistisch signifikant (β = ,13, SE = ,06, p = ,035).

Diskussion. Die gefundenen Effekte sind als groß einzuordnen (Orth et al., 2012). Während ein kausaler Einfluss von Lehrpersonen-Enthusiasmus auf Schüler:innen-Interesse häufig angenommen wird (z.B. Keller et al., 2014), postulieren wir keine kausalen Einflüsse. Denn es wäre denkbar, dass nicht Schüler:innen-Interesse, sondern ein eng mit Schüler:innen-Interesse korreliertes Konstrukt zu der beobachteten Veränderung im Lehrpersonen-Enthusiasmus führt. Allerdings kontrollieren wir implizit für potenzielle, zeitstabile Störfaktoren (Murayama & Gfrörer, 2022), weil die CLPMs Veränderungen vorhersagen. Gegenseitige Beeinflussungen von Schüler:innen und Lehrpersonen wären damit tatsächlich die plausibelste Erklärung. Die Ergebnisse der Analysen eines dritten Datensatzes werden auf der Konferenz präsentiert und Implikationen (z.B. für Lehrpersonenausbildung) sowie Limitationen werden, unter anderem vor dem Hintergrund der Selbstbestimmungstheorie (Ryan & Deci, 2000), diskutiert.

 

 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: GEBF 2024
Conference Software: ConfTool Pro 2.8.105
© 2001–2025 by Dr. H. Weinreich, Hamburg, Germany