11. GEBF-Tagung

BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN -
TRANSFER GESTALTEN
Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024
Universität Potsdam

JavaScript ist deaktiviert
Die JavaScript-Funktionalität Ihres Browsers ist deaktiviert. Um diese ConfTool-Funktion nutzen zu können, müssen Sie JavaScript aktivieren.
Hier finden Sie Informationen zur Aktivierung von JavaScript.
Bei Fragen oder Problemen wenden Sie sich bitte an das Organisationsteam unter gebf2024@uni-potsdam.de.

Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

Nach Track oder Beitragstyp der Sitzung filtern
Nur Sitzungen an einem bestimmten Tag / zu einer bestimmten Zeit

Sitzungsübersicht

Datum: Montag, 18.03.2024
8:30 - 9:30	Anmeldung Ort: Foyer Haus 6
9:30 - 10:00	Eröffnung Ort: H05
10:00 - 10:30	Kaffeepause Ort: Foyer Haus 6
10:30 - 12:10	1-01: Schüler:innenurteile zum Unterricht im Kontext heterogener Lerngruppen Ort: H05
	Symposium Schüler:innenurteile zum Unterricht im Kontext heterogener Lerngruppen Chair(s): Jasmin Decristan (Bergische Universität Wuppertal), Benjamin Fauth (Institut für Bildungsanalysen Baden-Württemberg (IBBW) und Universität Tübingen) Diskutantin(nen): Sebastian Röhl (Universität Tübingen) Die Heterogenität von Schüler:innen in Schulklassen ist ein zentrales Thema sowohl bildungspolitischer und pädagogischer Debatten als auch der empirischen Unterrichtsforschung (vgl. Gräsel, Decristan & König, 2017). Eine hohe Unterrichtsqualität wird dabei als mitentscheidend dafür angesehen, das Lernen und die Motivation der Lernenden zu fördern und trägt zudem zu einem erfolgreichen Umgang mit Heterogenität bei (Klieme, 2019). Unterrichtsqualität wird dabei oft als ein zwischen Klassen oder Lehrkräften variierendes Merkmal angesehen. Damit einher geht, dass interindividuelle Unterschiede in der Wahrnehmung von Unterrichtsqualität oft als (fehlerhafte) Abweichungen von der geteilten Wahrnehmung der in einer Klasse einheitlich realisierten Unterrichtsqualität betrachtet werden. Erst in jüngster Zeit werden Zusammenhänge zwischen Merkmalen der Schüler:innen in einer Klasse und der Unterrichtsqualität verstärkt in den Blick genommen (z.B. Göllner et al., 2018). Dabei können Zusammenhänge sowohl auf der Individualebene (z.B. Atlay et al. 2019) als auch auf der Klassenebene (als Kompositionseffekte; z.B. Fauth et al., 2021) unterschieden werden. Konzeptionell wird Unterricht als interaktives und ko-konstruktives Geschehen zwischen Lehrenden und Lernenden in der Auseinandersetzung mit den Lerninhalten beschrieben (Fend, 1998; Klieme, 2019). Vor diesem Hintergrund lässt sich nur schwerlich von einem einheitlichen, für alle Schüler:innen gleichen, Unterrichtsangebot sprechen. Die Interaktionen einer Lehrenden mit den verschiedenen Lernenden innerhalb einer Klasse unterscheiden sich abhängig von deren Lernvoraussetzungen (differential teacher treatment, Bohlmann & Weinstein, 2013; Decristan, Jansen & Fauth, 2023). Im Zuge der Debatte um Heterogenität gibt es verstärkte Bemühungen, den Unterricht besser an die Lernvoraussetzungen der individuellen Schülerinnen und der Lerngruppe anzupassen und somit adaptiv zu gestalten (Dumont, 2019). Hier geht es also um eine intendierte und gezielte Individualisierung. Hierfür kommt wiederum der Lehrkraft eine entscheidende Bedeutung zu. Die Befunde zur Wirksamkeit dieser Maßnahmen beziehen sich jedoch oft auf Lerngruppen, während die individuelle Passung von Unterricht und Lernvoraussetzungen bislang kaum empirisch beleuchtet wurde. Einen wichtigen Ansatzpunkt hierfür stellt die systematische Berücksichtigung von interindividuellen Unterschieden in der Wahrnehmung des Unterrichts in Abhängigkeit von den jeweiligen Lernvoraussetzungen der Schüler:innen dar. Es kann beispielsweise angenommen werden, dass adaptiver Unterricht, also ein Unterricht, der zu den heterogenen Lernvoraussetzungen passt, mit vergleichsweise geringen Unterschieden in den Wahrnehmungen des Unterrichts durch die Schüler:innen einhergeht. Vor diesem Hintergrund ist das Ziel dieses Symposiums, die Zusammenhänge zwischen heterogenen Lernvoraussetzungen in den Klassen bzw. Maßnahmen zum Umgang mit Heterogenität mit der von Schülerinnen wahrgenommenen Unterrichtsqualität eingehender in den Blick zu nehmen. Beitrag 1 untersucht Zusammenhänge zwischen Klassenkomposition und wahrgenommener Unterrichtsqualität und bezieht hier zugleich Merkmale der unterrichtenden Lehrkraft (Selbstwirksamkeit im Umgang mit heterogenen Lerngruppen) in die Analysen mit ein, um Moderationseffekte zu testen. Beitrag 2 nimmt anschließend in den Blick, inwieweit Lehrkräfte auf Individual- als auch auf Klassenebene das Unterrichtsangebot für unterschiedliche Schüler:innen adaptieren und inwiefern das wiederum mit Unterrichtsoutcomes zusammenhängt. Auch hier bilden die Schüler:innenurteile zur Unterrichtsqualität die Grundlage der empirischen Analysen. Die nächsten beiden Beiträge führen den Strang zum Umgang mit Heterogenität systematisch fort. Beitrag 3 untersucht den Zusammenhang zwischen individuellen Lernvoraussetzungen und der Wahrnehmung des Unterrichts an Grundschulen, die u.a. für einen besonders gelungenen Umgang mit Heterogenität ausgezeichnet wurden. Hieran anknüpfend wird geprüft, inwieweit Maßnahmen der Differenzierung durch die Lehrkraft zu weniger Wahrnehmungsunterschieden im Sinne einer besseren Passung führen. Beitrag 4 exploriert den Zusammenhang von Mehrsprachigkeit und der Wahrnehmung von Klassenführung und Klassenklima durch die Schüler:innen im Kontext einer Intervention, die darauf abzielte, die sprachlichen Ressourcen mehrsprachiger Grundschulkinder besser zu adressieren. Beiträge des Symposiums Zusammenhänge zwischen Klassenkomposition und Unterrichtsqualität in Klassen derselben Lehrkraft: Die Rolle der Selbstwirksamkeit der Lehrkraft im Umgang mit heterogenen Lerngruppen Anne Heinschel¹, Sofie Henschel¹, Camilla Rjosk² ¹Institut zur Qualitätsentwicklung im Bildungswesen, ²Universität Potsdam Da sich die Unterrichtsqualität als prädiktiv für den Lernerfolg von Schüler:innen erwiesen hat (Praetorius et al., 2018), ist es von besonderem Interesse die Komplexität des Unterrichts anhand seiner Bedingungsfaktoren zu erklären und dadurch besser verstehen zu können. Auf Grundlage des Angebots-Nutzungs-Modells des Unterrichts (Vieluf et al., 2020) wird davon ausgegangen, dass sowohl Merkmale der Lehrkraft (insb. professionelle Kompetenzen; Seidel, 2014) als auch der Klasse (mittlere Ausprägungen und Heterogenitätsmaße u.a. in Bezug auf Geschlecht, Zuwanderungshintergrund, Vorwissen, Interesse; Helmke, 2017) die Qualität des Unterrichts beeinflussen. Studien deuten darauf hin, dass neben dem professionellen Wissen (Voss et al., 2022) vor allem motivationale Merkmale der Lehrkraft (Enthusiasmus, Interesse, Selbstwirksamkeit; Baier et al., 2019; Lazarides & Schiefele, 2021a) für die Gestaltung qualitätsvoller Unterrichtsprozesse relevant sind. Bezogen auf Merkmale der Klassenkomposition zeigen Studien ebenfalls, dass neben den typischerweise untersuchten distalen und kognitiven Merkmalen (sozioökonomische Zusammensetzung, Anteil mehrsprachiger Schüler:innen, mittlere bzw. Streuung der kognitiven Fähigkeiten, Decristan et al., 2017; Fauth et al., 2021; Rjosk et al., 2014) auch motivationale Merkmale der Klassenkomposition wie das mittlere Interesse zur Erklärung von Unterschieden in der Unterrichtsqualität beitragen (Fauth et al., 2021; Lazarides et al., 2019). Dies ist auch unabhängig von der unterrichtenden Lehrkraft zu beobachten (Fauth et al., 2020; Heinschel et al., 2023). Aufgrund ihrer Bedeutung für den Lernerfolg sollte Unterrichtsqualität möglichst unabhängig von Klassenmerkmalen ein hohes Niveau erreicht. Insofern ist es von besonderem Interesse herauszufinden, inwiefern eine Lehrkraft dazu beitragen kann, Effekte der Klassenkomposition auf die Unterrichtsqualität abzumildern. Als relevant für den konstruktiven Umgang mit Heterogenität gelten dabei vor allem die Motivation und die Einstellungen der Lehrkraft (Trautmann & Wischer, 2011). Erste Studien deuten an, dass die Lehrkraftmotivation Effekte des Anteils mehrsprachiger Schüler:innen auf die Unterrichtsqualität moderieren kann (Hachfeld & Lazarides, 2021). Es ist aber unklar, inwiefern dies auch für weitere Effekte der Klassenkomposition sowie über mehrere Klassen einer Lehrkraft hinweg gilt. Vor diesem Hintergrund untersuchen wir (1) inwiefern Merkmale der Klasse und die Selbstwirksamkeit der Lehrkraft im Umgang mit heterogenen Lerngruppen je einen spezifischen Beitrag zur Erklärung von Unterschieden in der Unterrichtsqualität zwischen Klassen leisten. Zudem wird untersucht, (2) ob die Selbstwirksamkeit der Lehrkraft Effekte der Klasse auf die Unterrichtsqualität im Sinne einer negativen Moderation abschwächen kann. Wir nutzen Daten aus dem IQB-Bildungstrend 2018 (Stanat et al., 2022), in denen für jede Lehrkraft Angaben von mehreren nichtgymnasialen Klassen zu ihrer Unterrichtsqualität im Mathematikunterricht (kognitive Aktivierung, 12 Items, α = .81; Schülerorientierung, 5 Items, α = .88; Störungen, 3 Items, α = .91) vorliegen (217 Klassen, 105 Lehrkräfte, insgesamt 3550 Schüler:innen). In latent-manifesten Drei-Ebenen-Strukturgleichungsmodellen (Marsh et al., 2009) betrachten wir (1) Effekte der Klassenkomposition (mittleres fachbezogenes Interesse, 4 Items, α = 0.89, sowie deren Streuung; mittlere kognitive Fähigkeiten sowie deren Streuung, Wilhelm et al., 2014; mittlerer sozioökonomischer Hintergrund: HISEI; Anteil Mädchen; Anteil mehrsprachiger Schüler:innen) und der Selbstwirksamkeit der Lehrkraft im Umgang mit heterogenen Lerngruppen (6 Items, α = .87) sowie (2) Interaktionseffekte dieser Merkmale auf die genannten Dimensionen der Unterrichtsqualität. Als Kontrollvariablen werden die genannten Klassenmerkmale auf Individualebene sowie das Geschlecht und die Berufserfahrung der Lehrkräfte berücksichtigt. Vorläufige Analysen deuten darauf hin, dass ein höheres mittleres Interesse mit höherer Schülerorientierung und kognitiver Aktivierung, ein höherer Anteil mehrsprachiger Schüler:innen mit höherer kognitiver Aktivierung und ein höherer Anteil weiblicher Schüler:innen mit einem niedrigeren Niveau an Störungen einhergeht. Heterogenität der Klasse bezogen auf kognitive Fähigkeiten und fachliches Interesse steht nicht in Zusammenhang mit Merkmalen der Unterrichtsqualität. Eine höhere Selbstwirksamkeit der Lehrkraft geht mit höherer Schülerorientierung und kognitiver Aktivierung einher, moderiert jedoch keine Zusammenhänge von Klassenmerkmalen und Unterrichtsqualität. Die Ergebnisse werden mit Blick auf die Frage diskutiert, inwiefern Merkmale der Lehrkraft das Bemühen um qualitätsvollen Unterricht unabhängig von der Klassenkomposition fördern können. Adaptive Unterrichtsqualität: Ermittlung von lehrkraft- und klassenspezifischen Urteilseffekten bei Schülereinschätzungen Ann-Kathrin Jaekel¹, Alexander Jung¹, Richard Göllner² ¹Universität Tübingen, ²Universität Tübingen und Universität Regensburg Theoretischer Hintergrund Merkmale, wie die Klassenführung, die Lernunterstützung oder der kognitive Anregungsgehalt einer gelten als zentrale Aspekte eines qualitätsvollen Unterrichts (Hamre & Pianta, 2010; Klieme et al., 2009; Praetorius et al., 2018). Die dafür notwendigen Kompetenzen erwerben Lehrkräfte im Rahmen ihrer Ausbildung und während ihrer beruflichen Tätigkeit. Allerdings berücksichtigen bisherige Studie kaum, inwieweit Lehrkräfte ihr Unterrichtshandeln im Sinne verschiedener Qualitätsdimensionen an den Erfordernissen einer Klasse ausrichten. Eine Studie von Voss und Kollegen (2022) zeigte beispielsweise, dass die Unterrichtsqualität von ein und derselben Lehrkraft über unterschiedliche Klassen hinweg variierte. Die Autorinnen und Autoren interpretierten diese Ergebnisse dahingehend, dass es nicht allen Lehrkräften in gleicher Weise gelingt in unterschiedlichen Klassen ein gleich hohes Maß an Unterrichtsqualität zu erreichen. Andererseits muss berücksichtigt werden, dass eine Anpassung des konkreten Lehrkraftverhaltens an die Bedürfnisse einer spezifischen Klasse durchaus im Sinne eines adaptiven Unterrichts zu verstehen ist. Während beispielsweise die Schülerinnen und Schüler der einen Klasse ein höheres Monitoring benötigen, ist das für eine andere Klasse nicht notwendigerweise der Fall. Ziel der vorliegenden Studie war es daher, auf der Grundlage von Längsschnittdaten sowohl lehrkraft- als auch klassenspezifische Aspekte der Unterrichtsqualität auf der Grundlage von Schülereinschätzungen zu ermitteln. Methode Daten der UNITAS-Studie wurden in den Jahren 2018 und 2019 in 25 baden-württembergischen Schulen aller Klassenstufen der Sekundarstufe I erhoben. Insgesamt nahmen N = 6.479 Schülerinnen und Schüler aus insgesamt 401 Klassen an der Befragung im Frühjahr/Sommer 2018 teil. Im Mittelpunkt der Befragung stand die Erfassung der Unterrichtsqualität anhand von Schülereinschätzungen in den Fächern Mathematik und Deutsch. Schülerinnen und Schüler wurden nach einem Jahr wiederholt befragt. Erfragt wurden die Unterrichtsqualität entlang der drei Qualitätsdomänen „guten“ Unterrichts. Für die vorliegende Studie wurden die Qualitätsdimensionen Monitoring, Störungen, Lernunterstützung, Feedback, anspruchsvolle Aufgaben und Sokratischer Dialog ausgewählt. Zur Beantwortung der Fragestellung wurde ein Längsschnittmodell verwendet, welches die zeitlichen Stabilitäten, für die durch Schülerinnen und Schüler beurteilten Qualitätsdimensionen, ermittelte (Göllner et al., 2018). Die zeitlichen Stabilitäten wurden für drei Gruppen anhand eines Mehrgruppenmodells getrennt betrachtet: a) gleiche Schülerinnen und Schüler mit unterschiedlicher Lehrkraft (lehrkraftunspezifisch, K = 76 Klassen), b) gleiche Lehrkraft mit unterschiedlichen Schülerinnen und Schülern (lehrkraftspezifisch, K = 163 Klassen) und c) gleiche Lehrkraft mit gleichen Schülerinnen und Schülern (klassen- und lehrkraftspezifisch, K = 118 Klassen). Entsprechend der Forschungsfragen standen die zeitlichen Stabilitäten der Schülerurteile auf der Klasseneben im Mittelpunkt der Analysen. Ergebnisse Die Ergebnisse des Mehrgruppenmodells zeigten entlang der klassischen Modellgütekriterien eine jeweils gute Passung für sechs Einzelmodelle im Hinblick auf die gängigen Modelgütekriterien. Die zeitlichen Stabilitäten variierten über die sechs Qualitätsdimensionen und über die drei Gruppen zwischen r = .25 (Sokratischer Dialog) und r = .56 (Anspruchsvolle Aufgaben). Getrennt nach Gruppen, zeigten sich erwartungsgemäß die höchsten Stabilitäten für die Gruppe mit gleichen Schülerinnen und Schülern sowie gleicher Lehrkraft (.34 ≤ r ≤ .75). Die Stabilitäten der Gruppe mit gleichen Schülerinnen und Schülern aber unterschiedlicher Lehrkraft (.28 ≤ r ≤ .45) und der Gruppe mit gleicher Lehrkraft aber unterschiedlichen Schülerinnen und Schülern (.26 ≤ r ≤ .52) fielen demgegenüber geringer aus. Weiterführende Modelle zur Quantifizierung der Stabilitätsunterschiede zeigten, dass unter Kontrolle der lehrkraftunspezifischen Stabilitäten die klassen- und lehrkraftspezifischen Urteilseffekte mit Ausnahme des Sokratischen Dialogs statistisch signifikant waren (ps‘ < .05). Diese Urteilseffekte konnten für die meisten Qualitätsdimensionen auf lehrkraftspezifische Effekte zurückgeführt werden. Lediglich für das Monitoring einer Lehrkraft und das Ausmaß an Störungen fanden sich darüber hinaus klassenspezifische Effekte, die im Sinne eines gelungenen oder weniger gelungenen adaptiven Lehrkraftverhaltens interpretiert werden können. Adaptiver Unterricht aus Sicht von Schüler:innen: Unterrichtswahrnehmungen in Abhängigkeit individueller Lernvoraussetzungen Katharina Schnitzler¹, Nora Fröhlich², Jasmin Decristan³, Benjamin Fauth⁴, Hanna Dumont¹ ¹Universität Potsdam, ²Institut für Bildungsanalysen Institut für Bildungsanalysen Baden-Württemberg (IBBW), ³Universität Wuppertal, ⁴Institut für Bildungsanalysen Baden-Württemberg (IBBW) und Üniversität Tübingen Aktuelle empirische Befunde zeigen, dass sich Grundschüler:innen innerhalb einer Klasse in der Wahrnehmung ihres Unterrichts in Abhängigkeit ihrer individuellen soziodemographischen, kognitiven und motivationalen Lernvoraussetzungen unterscheiden (Igler et al., 2019; Stang und McElvany, 2021). Dabei bleibt eine offene Frage, inwiefern diese Divergenzen in individuell unterschiedlichen Wahrnehmungen desselben Unterrichts oder in tatsächlichen, wenn auch nicht intendierten Unterschieden im Unterrichtsangebot begründet sind (Igler et al., 2019). Vor diesem Hintergrund werden zunehmend Forderungen laut, den Unterricht adaptiv zu gestalten, also gezielt an die individuellen Lernvoraussetzungen der Schüler:innen anzupassen (Dumont, 2019). Im Hinblick auf die Wahrnehmung der Unterrichtsqualität wäre hier denkbar, dass sich Schüler:innen mit unterschiedlichen Lernvoraussetzungen gleichermaßen herausgefordert und unterstützt fühlen und daher in ihrer Unterrichtswahrnehmung übereinstimmen. Im vorliegenden Beitrag wird der Fokus auf die Unterrichtswahrnehmung von Schüler:innen an Grundschulen gelegt, die mit dem Deutschen Schulpreis unter anderem für ihren produktiven Umgang mit individuellen Lernvoraussetzungen ausgezeichnet worden sind. Daher ist davon auszugehen, dass die Preisträgerschulen gezielt Maßnahmen der Differenzierung—als ein zentrales Merkmal von adaptivem Unterricht— einsetzen. Dabei wird der Frage nachgegangen, inwiefern sich Schüler:innen innerhalb von Klassen in ihrer Unterrichtswahrnehmung in Abhängigkeit individueller Lernvoraussetzungen unterscheiden. Zusätzlich wird untersucht, ob dabei dem Grad der Differenzierung im Unterricht eine moderierende Rolle zukommt. Zur Beantwortung der Fragen wurden Daten von N = 552 Schüler:innen (51.05% weiblich; 25.4% mit Migrationshintergrund) aus 50 Klassen der 3. und 4. Jahrgangsstufe von neun Preisträger-Schulen genutzt. Neben soziodemographischen Lernvoraussetzungen (Geschlecht, SÖS und Migrationshintergrund) wurden kognitive (kognitive Fähigkeiten, Lese- und Mathematikleistung) und motivationale Lernvoraussetzungen (Selbstkonzept in Deutsch und Mathe, Interesse an Deutsch und Mathe, Anstrengungsbereitschaft und Lernfreude) mittels standardisierter Tests beziehungsweise Fragebögen erfasst (α = 0.80 – 0.92; ICC1 = 0.01 – 0.09). Die Unterrichtswahrnehmung der Schüler:innen wurde ebenfalls über Fragebögen zu den drei Basisdimensionen der Unterrichtsqualität (kognitive Aktivierung, konstruktive Unterstützung und Klassenmanagement) erhoben (α = 0.75 – 0.89; ICC1 = 0.11 – 0.20). Die Differenzierung im Unterricht wurde über eine Skala von den Schüler:innen erfragt (α = 0.78; ICC1 = 0.62). Um den Zusammenhang der Unterrichtswahrnehmung mit den Lernvoraussetzungen der Schüler:innen zu prüfen, wurden Mehrebenen-Regressionsanalysen durchgeführt. Auf Individualebene wurden die am Klassenmittelwert zentrierten Lernvoraussetzungen als Prädiktoren aufgenommen. Auf Klassenebene wurden die aggregierten Klassenmittelwerte der Lernvoraussetzungen und die am Gesamtmittelwert zentrierte Unterrichtsdifferenzierung als Prädiktor modelliert. Um den Grad der Unterrichtsdifferenzierung als Moderator zu prüfen, wurden Cross-Level-Interaktionen zwischen den Lernvoraussetzungen und der Unterrichtsdifferenzierung einbezogen. Innerhalb einer Klasse stimmten Schüler:innen mit unterschiedlichen soziodemographischen und kognitiven Lernvoraussetzungen in der Unterrichtswahrnehmung weitestgehend überein. Der SÖS und Migrationshintergrund standen in keinem Zusammenhang mit der Unterrichtswahrnehmung. Gleichwohl zeigten sich vereinzelt auch signifikante Unterschiede in der Unterrichtswahrnehmung. Mädchen nahmen die konstruktive Unterstützung und das Klassenmanagement höher wahr als Jungen. Schüler:innen mit höheren kognitiven Fähigkeiten nahmen die kognitive Aktivierung niedriger wahr, während Schüler:innen mit höheren Testleistungen die konstruktive Unterstützung und die Klassenführung höher wahrnahmen. Die motivationalen Lernvoraussetzungen standen in einem systematischen Zusammenhang mit der Unterrichtswahrnehmung innerhalb der Klassen. Alle erfassten motivationalen Lernvoraussetzungen hingen signifikant positiv mit der Wahrnehmung der drei Basisdimensionen der Unterrichtsqualität zusammen, d.h. motiviertere Schüler:innen nahmen den Unterricht positiver war. Die Cross-Level-Interaktionen waren nicht signifikant und zeigten, dass die Differenzierung im Unterricht die Zusammenhänge nicht moderierte. Obwohl im adaptiven Unterricht alle Schüler:innen gleichermaßen gefördert werden sollten, konnten insbesondere Unterschiede in der Unterrichtswahrnehmung in Abhängigkeit der motivationalen Lernvoraussetzungen festgestellt werden. Auch stimmten die Schüler:innen in einem stärker differenzierten Unterricht nicht mehr in ihrer Wahrnehmung des Unterrichts überein. Die Studie leistet einen ersten Beitrag dazu die Wahrnehmung des Unterrichts in Abhängigkeit von individuellen Lernvoraussetzungen und Differenzierung zu explorieren und hieraus Hinweise zur Adaptivität von Unterricht abzuleiten. Wahrnehmung von Classroom Management und Klassenklima von Schülerinnen im Kontext einer Intervention zum Einbezug von Familiensprachen im Unterricht Jasmin Decristan¹, Victoria Bertram², Valentina Reitenbach¹, Katharina Maria Schneider³, Dominique Rauch³ ¹Universität Wuppertal, ²DIPF ∣ Leibniz-Institut für Bildungsforschung und Bildungsinformation, ³PH Ludwigsburg Die zunehmende Globalisierung und Migration geht mit einer großen Sprachenvielfalt in heutigen Schulklassen in Europa einher. In der Forschung wurden zahlreiche Vorstellungen und Konzepte eingebracht, um die verschiedenen Familiensprachen der Schülerinnen als Ressource im Unterricht aufzugreifen (z.B. Duarte & Günther-Van der Meij, 2018; Lorenz et al., 2021). So bezieht sich der Ansatz des „Translanguaging“ auf eine flexible Verwendung aller Sprachen mehrsprachiger Schülerinnen, um das gesamte sprachliche Repertoire zu nutzen (z.B. Lewis et al., 2012). Empirische Studien im Kontext des Fremdsprachenlernens zeigen die Potenziale von Translanguaging für ein effektives Classroom Management und positives Klassenklima auf. Auf der andren Seite werden in vielen europäischen Ländern die sprachlichen Ressourcen mehrsprachiger Schülerinnen im Unterricht kaum aufgegriffen (z. B. Ellis et al., 2010 in Deutschland und Österreich; Lorenz et al., 2021 in Norwegen). Dieser „monolinguale Habitus“ (Gogolin, 1997) spiegelt sich auch in Bedenken von Lehrkräften zum Einbezug verschiedener Familiensprachen im Unterricht wider (z.B. Bredthauer & Engfer, 2016). Diese Bedenken beziehen sich – in genau umgekehrter Weise – auf ein niedriges Classroom Management durch organisatorische Herausforderungen, Störungen und weniger Lernzeit sowie auf ein schlechteres Klassenklima durch den Ausschluss vor allem monolingualer Schülerinnen, die die Sprachen der anderen Kinder nicht verstehen. Forschungsfragen Der Beitrag untersucht daher den Zusammenhang zwischen dem Einbezug von Familiensprachen im Unterricht und Unterrichtsqualität in heutigen migrationsbedingt mehrsprachigen Grundschulklassen. Dabei wird gefragt: (1.) Welche Bedeutung hat der Einbezug von Familiensprachen für die Wahrnehmung von Classroom Management und Klassenklima von Grundschulkindern? (2.) Inwieweit unterscheiden sich einsprachig-deutsche Schülerinnen in ihrer Wahrnehmung von ihren mehrsprachigen Mitschülerinnen? (3.) Welcher Zusammenhang zeigt sich zwischen der Familiensprachennutzung im Unterricht und der Wahrnehmung von Classroom Management und Klassenklima? Methode Die Daten stammen aus einer Interventionsstudie in Klassen der vierten Jahrgangsstufe in Deutschland. Lehrkräfte der Treatmentgruppe (TG) nahmen an Fortbildungen zu einer Unterrichtsreihe teil und setzten die Inhalte anschließend in ihren Klassen um. Lehrkräfte der Kontrollgruppe (KG) setzten ihren regulären Deutschunterricht fort. Die Unterrichtsreihe (12 Unterrichtsstunden á 45 Minuten) in der TG zielte darauf ab, die Deutsch-Lesekompetenz der Schülerinnen zu verbessern. Dafür wurde die kooperative Lernmethode des Reziproken Lehrens eingesetzt (z.B. Rosenshine & Meister, 1984). Mehrsprachigen Schülerinnen wurden zusätzliche Stimuli zum Translanguaging gegeben, und zwar durch (a) bilinguales Material, (b) nach Familiensprachen zusammengesetzte Kleingruppen und (c) Impulse zur Wertschätzung sprachlicher Vielfalt. Insgesamt nahmen 51 Klassen (32 TG, 19 KG) teil. Die Schülerinnen waren im Mittel 10 Jahre alt. Von 916 Schülerinnen waren 605 (66,0%) mehrsprachig (68,4% TG, 63,5% KG). Vor (t1) und nach (t2) der Intervention fanden Erhebungen in den Klassen statt. Dabei wurden Classroom Management (5 Items; α>.85, ICC1>.17, ICC2>.77) und Klassenklima (4 Items; α>.73, ICC1>.09, ICC2>.61) über Schülerinnenfragenbögen adaptiert nach Fauth et al. (2014) erfasst. Von den mehrsprachigen Schülerinnen in der TG gaben 40.7% an, während der Unterrichtsreihe mehrere Sprachen verwendet zu haben. Ergebnisse und Implikationen Es wurden Mehrebenenanalysen mit MPlus 8.9 (Muthén & Muthén, 2012–2022) berechnet und die Prädiktorvariablen auf individueller und auf Klassenebene aggregiert. In allen Analysen wurden die t1-Werte von Unterrichtsqualität als Kontrollvariablen eingefügt. Die Ergebnisse zeigen, dass (1.) Schülerinnen in der TG ein höheres Classroom Management und positiveres Klassenklima wahrnahmen als Schülerinnen in der KG, dass (2). sich einsprachige und mehrsprachige Schülerinnen nicht in ihrer Wahrnehmung von Unterrichtsqualität unterschieden und dass (3). weder der individuelle Gebrauch mehrerer Sprachen noch der Anteil an Schülerinnen mit multiplem Sprachgebrauch in einer Klasse mit der Wahrnehmung von Unterrichtsqualität in Beziehung stand. Die Ergebnisse liefern empirische Hinweise dazu, dass – entgegen der oftmals geäußerten Befürchtungen – die Nutzung von Herkunftssprachen nicht zu geringerer Unterrichtsqualität führt. Vielmehr wurde im Rahmen der Intervention ein Unterricht realisiert, in dem alle Schüler*innen, egal ob mehrsprachig oder nicht, ein effektives Classroom Management und positives Klassenklima wahrnahmen.
10:30 - 12:10	1-02: Digitale Kompetenzen angehender Lehrkräfte: Wie können wir Lehramtsstudierende für die digitale Lehre vorbereiten? Ort: H04
	Symposium Digitale Kompetenzen angehender Lehrkräfte: Wie können wir Lehramtsstudierende für die digitale Lehre vorbereiten? Chair(s): Steffen Wild (Technische Universität Dortmund, Deutschland), Sonja Hahn (Hochschule Darmstadt) Diskutantin(nen): Rebecca Lazarides (Universität Potsdam) Deutsche Schülerinnen und Schüler in der Klasse 8 weisen in der ICLIS Studie eine zwischen 2013 und 2018 stagnierende und im internationalen Vergleich mittelmäßig ausgeprägte computer- und informationsbezogene Kompetenz auf (Eickelmann et al., 2019). Weiter zeigt sich im internationalen Vergleich, dass an deutschen Schulen noch immer selten digitale Technologien genutzt werden (Schaumburg et al. 2019). Hierbei ist die Vermittlung von Fähigkeiten in der digitalen Lehre bereits bei angehenden Lehrkräften wichtig (Lachmann et al., 2023), da viele Lehramtsstudierende über vergleichsweise geringe digitale Kompetenzen verfügen (Senkbeil et al., 2020) und lediglich Gymnasiallehramtsstudierende höhere Leistungsmerkmale aufweisen (Neugebauer, 2020) . Im wissenschaftlichen Diskurs werden hierfür verschiedene Wirkfaktoren diskutiert: Neben der unzureichenden technischen Ausstattung der Schulen werden das Professionswissen der Lehrkräfte, die Einstellungen der Lehrkräfte zu digitalen Technologien im Unterricht und die Motivation der Lehrkräfte als Einflussfaktoren auf die Nutzung digitaler Technologien angesehen, was die zentrale Rolle der Lehrkräfte in dieser Thematik unterstreicht (Baumert & Kunter, 2006; Backfisch et al., 2020; BMBF, 2022; Bürger et al., 2021; Scherer & Teo, 2019). Hierbei betont das Rahmenmodell zur didaktisch sinnvollen Integration digitaler Medien im Unterricht (als Weiterentwicklung des Angebots-Nutzungsmodells) ebenfalls den wichtigen Stellenwert der Lehrkräfte in diesem Prozess (Helmke & Schrader, 2014; Lachner et al., 2020). Es wird postuliert, dass die Qualität des Unterrichtsprozesses, das Lehr-Lernmaterial (Angebot) sowie die Lernaktivitäten zusammen mit der Lernzeit (Nutzen) entscheidend für den Ertrag sind (Lachner et al., 2020). Empirische Befunde, dass beispielsweise Schulmerkmale vermittelt über Lehrkräftemerkmale zur digitalen Mediennutzung beitragen (Quast et al., 2021), erhärten diese Annahmen und unterstreichen die Relevanz des Themas und die Rolle der Lehrkraft. Das vorliegende Symposium umfasst daher empirische Studien zur Erfassung und Entwicklung digitaler Kompetenzen bei Lehramtsstudierenden und zeigt auf, wo bereits Fortschritte erreicht wurden, und wo weitere Entwicklungsmöglichkeiten und -bedarfe sind. Der erste Beitrag untersucht längsschnittlich die Veränderung digitalisierungsbezogener Kompetenzen im Rahmen eines Masterstudienganges sowohl mit offenen Wissensitems als auch anhand Selbstwirksamkeit und Nützlichkeitsüberzeugungen. Es zeigt sich, dass sowohl die Kompetenzen als auch die Selbstwirksamkeit während des Studiums ansteigt, die Nützlichkeitsüberzeugungen jedoch nicht. Der zweite Beitrag fokussiert motivationale Komponenten im Umgang mit digitalen Medien. Insbesondere praktische Erfahrungen und die Beobachtung von Modellen sind wichtig für die Entwicklung von Selbstwirksamkeit für das Lehren und Lernen mit digitalen Medien. Im letzten Beitrag liegt der Fokus auf dem wahrgenommenen Bedarf bezüglich medienbezogener Lehrkompetenzen bei Lehramtsstudierenden. Hier wird differenziert untersucht, wie Studierendencharakteristika und Studienfortschritt mit dem Bedarf medienbezogener Lehrkompetenzen zusammenhängen. Insgesamt berichten die Studierenden einen sehr hohen Bedarf an medienbezogenen Lehrkompetenzen, der noch einmal genauer nach Studienfortschritt und -Charakteristika aufgeschlüsselt wird. Beiträge des Symposiums „Alles eine Frage der Zeit?“ – Entwicklung von digitalisierungsbezogenem Professionswissens bei angehenden Lehrpersonen Ulrike Franke¹, Iris Backfisch¹, Armin Fabian¹, Leonie Sibley¹, Patrizia Breil², Katharina Scheiter³, Andreas Lachner¹ ¹Eberhard Karls Universität Tübingen, ²Ruhr-Universität Bochum, ³Universität Potsdam Theoretischer Hintergrund Das Unterrichten mit digitalen Technologien wird als ein wichtiges Unterfangen angesehen, um neben fachlichen auch medienbezogene Kompetenzen von Schülerinnen zu fördern. Ein wichtiger Bestandteil beruflicher Professionalisierung von Lehrpersonen ist daher der Erwerb von digitalisierungsbezogenem Professionswissen, das Lehrpersonen dazu befähigt digitale Medien elaboriert im Unterricht einzusetzen. Basierend auf allgemeinen Modellen zum Professionswissen (Baumert & Kunter, 2006) umfasst das digitalisierungsbezogene Professionswissen (angehender) Lehrpersonen u.a. technologisch-pädagogisches Professionswissen (TPK; Mishra & Koehler, 2006) sowie TPK-Selbstwirksamkeitserwartung und Nützlichkeitseinschätzungen gegenüber dem Einsatz digitaler Medien im Unterricht (Backfisch et al., 2020; Scherer & Teo, 2019). Über unterschiedliche Bildungssysteme hinweg gibt es jedoch große Unterschiede in der Art und Weise, wie angehende Lehrpersonen systematisch auf das Unterrichten mit digitalen Medien vorbereitet werden. Diese Diskrepanzen sind möglicherweise darauf zurückzuführen, dass es bislang wenig Forschung gibt, wie sich TPK, TPK-Selbstwirksamkeitserwartungen und die Einschätzung der Nützlichkeit von digitalen Medien im Unterricht während der Ausbildung von angehenden Lehrpersonen entwickeln. Vor diesem Hintergrund wurde ein innovatives Curriculum entwickelt, das die Förderung von digitalisierungsbezogenem Professionswissen angehender Lehrpersonen fokussiert. Mit der vorliegenden Studie wurde untersucht, inwiefern sich das Wissen (d.h., TPK) und die motivationale Orientierung (d.h., TPK-Selbstwirksamkeitserwartung und Einschätzung der Nützlichkeit von digitalen Medien im Unterricht) bei angehenden Lehrpersonen über die Zeit des Lehramtsstudiums im Master of Education hinweg verändert. In Anlehnung an die Aggregationshypothese (Choy et al., 2013, Stürmer, Seidel, & Holzberger, 2016) wird ein linearer Anstieg des (1) technologisch-pädagogischen Professionswissens (TPK) sowie der (2) TPK-Selbstwirksamkeitserwartung und (3) der Nützlichkeitseinschätzung gegenüber dem Einsatz digitaler Medien angenommen. Methode Um die Entwicklungen des digitalisierungsbezogenen Professionswissens zu erfassen, wurden in einem längsschnittlichen Design über zwei Kohorten hinweg Daten von insgesamt N = 77 Lehramtsstudierenden des Masters of Education erhoben (durchschnittliches Alter über beide Kohorten: M = 24.62 Jahre (SD = 3.33)). Die Erhebung umfasste drei Messpunkte je Kohorte über einen Zeitraum von vier Semestern. Der erste Messzeitpunkt fand zu Beginn des Masterstudiums, der zweite Messzeitpunkt zu Beginn des dritten Mastersemesters und der dritte Messzeitpunkt zum Studiumsabschluss am Ende des vierten Semesters statt. Zur Erfassung von TPK wurde ein integratives Testformat mit acht offenen Items entwickelt, um mediendidaktisches und medienkritisches Wissen in Form von textbasierten Unterrichtsvignetten zu erheben (siehe Lachner et al., 2021 für ähnliche Ansätze). Die Antworten der offenen Items wurden inhaltsanalytisch ausgewertet. 20 % der Antworten wurden von drei Raterinnen bewertet. Die Interrater-Übereinstimmung (zweiseitige Zufallseffekte, absolute Übereinstimmung, Einzelmessung) war sehr gut, ICC = .863. Die TPK-Selbstwirksamkeitserwartung wurden mit Messinstrumenten von Schmidt et al. (2009) mittels vierstufiger Ratingskalen erhoben (“1 = trifft gar nicht zu”, “4 = trifft voll zu”). Die Einschätzung der Nützlichkeit von digitalen Medien im Unterricht wurde mit Messinstrumenten von Backfisch et al. (2020) mit einer vierstufigen Skalierung (“1 = trifft gar nicht zu”, “4 = trifft voll zu”) erhoben. Um die Veränderung über die drei Messzeitpunkte hinweg zu modellieren, wurden lineare gemischte Modelle angewendet mit jeweils TPK, TPK-Selbstwirksamkeit und der Nützlichkeitseinschätzung digitaler Medien im Unterricht als abhängige Variable. Ergebnisse und Diskussion Die Ergebnisse zeigen einen signifikant linearen Zuwachs von (1) TPK (Estimate = 0.288, SE = 0.193, p = .00) und (2) TPK-Selbstwirksamkeit (Estimate = 0.220, SE = 0.092, p = .02) über die drei Messzeitpunkte hinweg. Für die (3) Einschätzung der Nützlichkeit digitaler Medien im Unterricht konnte kein signifikant linearer Zuwachs über die drei Messzeitpunkte hinweg festgestellt werden (Estimate = -0.015, SE = 0.089, p = .87). Die Ergebnisse geben Hinweise darauf, dass digitalisierungsbezogenes Professionswissen angehender Lehrpersonen curricular gefördert werden kann. Gleichzeitig bleibt bislang offen, inwiefern im Rahmen des Curriculums unterrichtsbezogene Kontexte stärker eine Rolle spielen sollten, um Nützlichkeitsüberzeugungen zur Integration von digitalen Technologien bei angehenden Lehrkräften zu unterstützen (Backfisch et al., 2020, Grossmann et al., 2009). Antezedenzien digitalisierungsbezogener Selbstwirksamkeitsüberzeugung und motivationaler Orientierung zum Einsatz digitaler Medien im Unterricht bei Lehramtsstudierenden Robert Grassinger, Angelika Dickomeit, Gerda Bernhard Pädagogische Hochschule Weingarten Theoretischer Hintergrund Die Förderung digitalisierungsbezogener Kompetenzen im Rahmen des Lehramtsstudiums wird als ein Desiderat der Lehrerbildung angesehen (McGarr & McDonagh, 2019; Schleicher, 2020). Mit dem DigCompEdu (Ghomi & Redecker, 2019) sind Wissen und Skills für Lehrkräfte beschrieben. Ergänzend dazu argumentieren wir in Anlehnung an das Professionsmodell einer Lehrkraft (Baumert & Kunter, 2006), dass digitalisierungsbezogene Selbstwirksamkeitsüberzeugung und motivationale Orientierung zum Einsatz digitaler Medien im Unterricht weitere bedeutsame Faktoren digitalisierungsbezogener Kompetenzen von Lehrkräften darstellen (vgl. Vogelsang et al., 2019). Wenig untersucht ist, wie digitalisierungsbezogene Selbstwirksamkeitsüberzeugungen und motivationale Orientierung zum Einsatz digitaler Medien im Unterricht positiv im Rahmen eines Lehramtsstudiums beeinflusst werden können. Hypothesen Nach der sozial-kognitiven Lerntheorie von Bandura (1997) begünstigen insbesondere eigene und stellvertretende (Beobachtung anderer) Erfahrungen Selbstwirksamkeitsüberzeugungen. Entsprechend wird angenommen, dass sowohl bisherige eigene Erfahrungen im Einsatz digitaler Medien (z.B. im Unterricht) als auch die Beobachtung von Lehrenden hierbei mit einer digitalisierungsbezogenen Selbstwirksamkeitsüberzeugung von Lehramtsstudierenden positiv assoziiert sind (H1). Die Theorie des geplanten Verhaltens (Ajzen, 1991) verweist mitunter auf die Relevanz positiver Einstellungen gegenüber einem Verhalten sowie einer Selbstwirksamkeitsüberzeugung für eine Verhaltensintention. Orientiert daran nehmen wir an, dass sowohl positive Einstellungen zu digitalen Medien im Unterricht als auch digitalisierungsbezogene Selbstwirksamkeitsüberzeugungen bedeutsam mit der motivationalen Orientierung zum Einsatz digitaler Medien im Unterricht (als Indikator für die Verhaltensintention) in Zusammenhang stehen (H2). Methode Im Rahmen des vom BMBF-geförderten Entwicklungsvorhaben „Teacher Education goes Digital“ (TEgoDi) wurden Lehramtsstudierende (N=53; 23 BA-Studierende, 30 MA-Studierende) befragt. Fehlende Werte wurden auf Itemebene zu maximal 5% beobachtet und multiple imputiert. Zur Prüfung der beiden Hypothesen wurde ein Pfadmodell geschätzt, bei dem zum einen die digitalisierungsbezogene Selbstwirksamkeitsüberzeugung (α= .939) regressiert wurden auf eigene Erfahrungen (Häufigkeit, single Item) und stellvertretende Erfahrungen im Einsatz digitaler Medien im Unterricht (α= .934). Zum anderen wurde die motivationale Orientierung zum Einsatz digitaler Medien im Unterricht (α= .902) regressiert auf positive Einstellung zur Nutzung digitaler Medien (α= .811) und die digitalisierungsbezogene Selbstwirksamkeitsüberzeugung. Ergebnisse Das Pfadmodell zeigte einen guten Modelfit (CFI=.977; TLI=.947;RMSEA =.079).Die Lehramtsstudierenden berichteten hypothesenkonform eine höhere digitalisierungsbezogene Selbstwirksamkeitsüberzeugung, je mehr eigene Erfahrungen sie im Einsatz digitaler Medien in der Lehre (im Rahmen von Hochschulseminaren) sowie im Unterricht (im Rahmen von Praktika) hatten (β = .27, p = .032) und je mehr sie ihre Lehrenden als Rollenmodelle hierbei beobachten konnten (stellvertretende Erfahrungen) (β = .32, p = .001). Die Befunde zur zweiten Hypothese zeigten, dass wie angenommen die motivationale Orientierung zum Einsatz digitaler Medien im Unterricht korrespondierte mit einer positiven Einstellung zu digitalen Medien (β = .26, p = .014) sowie der digitalisierungsbezogenen Selbstwirksamkeitsüberzeugung (β = .54, p < .001). Resümierend geben die Befunde Hinweise zur Relevanz der Ermöglichung eigener Lehr-Lernerfahrungen mit digitalen Medien und der Wahrnehmung von Rollenvorbildern zur Förderung motivationaler digitalisierungsbezogener Kompetenzfacetten – sowohl im Rahmen von Praktika als auch im Rahmen universitärer Lehrveranstaltungen. Studentische Bedarfe an medienbezogenen Lehrkompetenzen im Lehramtsstudium: Differenzielle Effekte studienbezogener Faktoren Jan Henning-Kahmann Pädagogische Hochschule Freiburg Um Schülerinnen und Schüler beim Erwerb erforderlicher Kompetenzen für den Umgang mit digitalen Medien adäquat zu unterstützen und diese lernförderlich im Unterricht einzusetzen, benötigen Lehrkräfte nicht nur eigene Medienkompetenzen, sondern vor allem medienbezogene Lehrkompetenzen, d. h. pädagogisch-didaktische Kompetenzen zur Gestaltung von mediengestütztem Unterricht (FLDCB, 2017). Dementsprechend wird die Vermittlung digitaler Lehrkompetenzen als „Querschnittsaufgabe“ für alle Phasen der Lehrkräftebildung beschrieben und insbesondere als Aufgabe der Curriculumentwicklung an den Hochschulen verortet (Scheiter & Lachner, 2019). Dass der Erwerb solcher Kompetenzen auch von (angehenden) Lehrkräften selbst als relevant erachtet wird, zeigt sich in Befunden, nach denen sie sich eine bessere Vorbereitung auf das Lehren und Lernen mit digitalen Medien wünschen (Lorenz, Endberg & Eickelmann, 2019). Für eine zielgruppenorientierte Gestaltung hochschulischer Maßnahmen zur Förderung medienbezogener Lehrkompetenzen im Studium ist es somit erforderlich, die individuellen Bedarfe auf Seiten der Studierenden konkret zu identifizieren, etwa mittels eines geeigneten Fragebogens (Henning-Kahmann & Hellmann, 2023b). Während für selbsteingeschätzte medienbezogene (Lehr-)Kompetenzen vermehrt Befunde hinsichtlich relevanter Einflussfaktoren wie Studienfortschritt (Weidlich & Kalz, 2023), Schulform (Caruso, Heldt & Drossel, 2022), Fächergruppen (Brändle, Sotiriadou & Zinn, 2023) und Fortbildungsmöglichkeiten (Runge, Lazarides, Rubach & Richter, 2022) vorliegen, ist jedoch unklar, ob sich vergleichbare Zusammenhänge und Unterschiede auch in den individuellen, studentischen Bedarfen widerspiegeln, die aus wahrgenommenen Kompetenzdefiziten i.d.R. hervorgehen. Daher geht dieser Beitrag folgenden Forschungsfragen nach: F1) Unterscheiden sich Lehramtsstudierende der Primar- und Sekundarstufe, verschiedener Fächergruppen sowie mit bzw. ohne inner-/außercurricularen Lerngelegenheiten bezüglich digitaler Medien in ihren Bedarfen an medienbezogenen Lehrkompetenzen? F2) Hängt das Ausmaß der Bedarfe an medienbezogenen Lehrkompetenzen vom Studienfortschritt der Studierenden ab? F3) Zeigen sich differenzielle Effekte des Studienfortschritts auf die Bedarfe an medienbezogenen Lehrkompetenzen hinsichtlich Studiengang, Fächergruppe und inner-/außercurricularen Lerngelegenheiten? Zur Analyse wurden Daten von N = 232 Lehramtsstudierenden einer Onlinebefragung genutzt, die 2021 an der PH Freiburg erhoben wurden. Das Instrument umfasst 19 Items, mit denen die Bedarfe in den fünf Faktoren „Planung“, „Entwicklung“, „Realisierung“, „Evaluation“, und „Sharing“ über eine fünfstufige Likert-Skala erhoben werden (Henning-Kahmann & Hellmann, 2023a). Neben studienbezogenen Angaben (Studienfortschritt, Lehramtsstudiengang, Fächer) wurde auch erfasst, in welchem Umfang die Befragten bereits inner- bzw. außercurriculare Lerngelegenheiten (Lehrveranstaltungen bzw. Fortbildung) zu digitalen Medien sowie medienbezogenen Lehrkompetenzen hatten. Die Daten wurden in latenten Strukturgleichungsmodellen mittels multipler linearer bzw. moderierter Regressionsanalysen ausgewertet. Deskriptive Analysen ergaben für alle medienbezogenen Lehrkompetenzen (sehr) hohe Bedarfe (M = 3.88 bis M = 4.47). Bezüglich der Forschungsfragen zeigten die Analysen, dass sich die Bedarfe an medienbezogenen Lehrkompetenzen unter Kontrolle des Studienfortschritts nicht zwischen Lehramtsstudierenden der Primar- und Sekundarstufe, verschiedener Fächergruppen sowie mit bzw. ohne inner-/außercurriculare Lerngelegenheiten zu digitalen Medien (F1) unterscheiden. Unter Kontrolle der übrigen Variablen weist der Studienfortschritt (F2) jedoch einen signifikanten Effekt auf die Bedarfe in den Bereichen „Realisierung“ (β = 0.16, p = .037) und „Sharing“ (β = 0.17, p = .037) auf. Durch die moderierten Regressionsanalysen (F3) konnte für die Bereiche „Planung“ (β = -0.47, p = .035), „Entwicklung“ (β = -0.53, p = .017) und „Evaluation“ (β = -0.43, p = .047) ein signifikanter Interaktionseffekt zwischen Lehramtsstudiengang und Studienfortschritt nachgewiesen werden, wonach Studierende der Primarstufe einen vermehrten Bedarf in höheren Semestern angeben, während dies bei Studierenden der Sekundarstufe I in niedrigeren Semestern der Fall ist. Zudem zeigten sich konditionale Effekte des Studienfortschritts, wonach Studierende der Primarstufe in allen fünf Bereichen einen vermehrten Bedarf in höheren Semestern aufweisen und Studierende ohne inner-/außercurriculare Lerngelegenheiten bzgl. eigener Medienkompetenzen mit zunehmendem Studienfortschritt einen größeren Bedarf in den Bereichen „Realisierung“ (β = 0.18, p = .041) und „Sharing“ (β = 0.22, p = .013) angeben. Die Ergebnisse liefern erste Hinweise bezüglich relevanter Einflussfaktoren auf studentische Bedarfe an medienbezogenen Lehrkompetenzen im Studium, die es vor dem Hintergrund einer zielgruppenorientierten Gestaltung hochschulischer Fördermaßnahmen zu diskutieren gilt.
10:30 - 12:10	1-03: Analysen zur International Civic and Citizenship Education Study (ICCS 2022): Effekte politischen Wissens bei 14-Jährigen Ort: H03
	Symposium Analysen zur International Civic and Citizenship Education Study (ICCS 2022): Effekte politischen Wissens bei 14-Jährigen Chair(s): Katrin Hahn-Laudenberg (Universität Leipzig), Hermann Josef Abs (Universität Duisburg-Essen, Deutschland) Diskutantin(nen): Nina Jude (Universität Heidelberg) Die International Civic and Citizenship Education Study (ICCS) wurde nach 2009 und 2016, 2022 zum dritten Mal als vergleichende Schulleistungsstudie unter Leitung der IEA (vgl. iea.nl) durchgeführt (Schulz et al., 2023; Schulz et al., in Vorbereitung). Während es in 2009 noch keine deutsche Teilnahme gab, nahmen in 2016 zwar Schulen aus Nordrhein-Westfalen (NRW) teil, jedoch erfüllte die Stichproben noch nicht vollständig die Repräsentativitätskriterien (Abs & Hahn-Laudenberg 2017). Mit ICCS 2022 können nun erstmals aus zwei deutschen Bundesländern repräsentative Ergebnisse zu Jahrgangsstufe 8 im Vergleich zu 18 weiteren europäischen Bildungssystemen präsentiert werden. ICCS ist die einzige international vergleichende Studie zur politischen Sozialisation, bei der schulische Kontexte für politische Bildungsprozesse intensiv berücksichtigt und ein Wissenstest implementiert wird. Weil das politische Wissen in der deutschsprachigen Bildungsforschung bislang eher weniger beachtet wurde (vgl. Hahn-Laudenberg, 2017; Alscher, 2022), sind Forschungen in diesem Bereich für die domänenspezifische Forschung in Deutschland von hoher Bedeutung. Ein weiteres Alleinstellungsmerkmal von ICCS besteht darin, dass schulische und gesellschaftliche Kontexte, sowie das in ihnen erworbene Wissen mit weiteren Dimensionen der politischen Bildung und Sozialisation in Verbindung gebracht werden. Es sind dies insbesondere soziale und politische Identifikationen, politischen Einstellungen und Formen der Partizipation in Schule, Zivilgesellschaft und Politik. Nach der internationalen Freigabe der Ergebnisse zur ICCS ab 28. November 2023, widmet sich das Symposium ersten vertiefenden Analysen, mit denen unterschiedliche Fragestellungen zum politischen Wissen in den Fokus genommen werden. Der erste Beitrag (Hahn-Laudenberg, Goldhammer, Ateş) untersucht die Konstruktion und Validität des Wissenstests, der in ICCS 2022 eingesetzt wurde und stellt zentrale Ergebnisse im internationalen Vergleich vor. Zudem wurde erstmals in der Mehrzahl der Länder computerbasiert getestet. In Teilen des Tests kamen dabei „computer enhanced items“ zum Einsatz, bei denen sich Aspekte einer Aufgabe in Abhängigkeit von vorhergehenden Lösungsschritten entwickeln. Im aktuellen Zyklus lag inhaltlich ein stärkerer Schwerpunkt auf nachhaltlichkeitsbezogenen Fragen. Der zweite Beitrag (Oberle & Matafora) betrachtet Effekte von politischem Wissen für unterschiedliche EU-bezogene Einstellungen. Mit Daten aus ICCS 2016 wurde schon gezeigt, dass Wissen mit normativen Einstellungen zur EU sowie mit der Bewertung der Ergebnisse ihrer politischen Entscheidungen in Zusammenhang steht (Hahn-Laudenberg & Abs 2020). Auch wurde schon die Bedeutung von Migration für die Identifikation mit Europa herausgearbeitet (Matafora et al. 2023). Die neue Analyse mit Daten von ICCS 2022 führt diese Arbeiten zusammen und zeigt, wie der Effekt von Wissen durch die Identifikation mit Europa mediiert wird. Der dritte Beitrag (Ziemes) betrachtet Effekte von politischem Wissen auf soziales und institutionelles (politisches) Vertrauen. Auch hier kann auf ausführliche Vorarbeiten mit Daten aus ICCS 2016 zurückgegriffen werden, durch die der Zusammenhang von Wissen und institutionellem Vertrauen in Abhängigkeit von gesellschaftlichen Bedingungen analysiert wurde (Ziemes, 2020). Mit den Daten aus ICCS 2022 ist es nun möglich parallel Analysen für soziales Vertrauen durchzuführen und dadurch die Spezifik der schulischen Sozialisation von Vertrauen besser herauszuarbeiten. Der vierte Beitrag (Abs & Deimel), widmet sich der Ausbildung von Einstellungen zur politischen Privilegierung der eigenen Religion. Die Autoren haben in einer aktuellen Analyse mit ICCS 2016-Daten bereits die Bedeutung des Wissens herausgearbeitet (Gutzwiller-Helfenfinger et al. 2022). Dabei blieb die Forschungsfrage ungeklärt, inwiefern religionsbezogene Diskriminierung einen Beitrag zu der Überzeugung leistet, dass die eigene Religion in politischen Kontexten privilegiert werden sollte. Aufgrund einer verbesserten Operationalisierung von Diskriminierungserfahrung in ICCS 2022 ist dies Analyse nun möglich. Beiträge des Symposiums Politisches Wissen von 14-Jährigen. Operationalisierung und Ergebnisse der Ergebnisse der International Civic and Citizenship Education Study (ICCS 2022) Katrin Hahn-Laudenberg¹, Frank Goldhammer², Rukiye Ateş³ ¹Universität Leipzig, ²DIPF, ³Universität Duisburg-Essen Theoretischer Hintergrund: Ein grundlegendes politisches Verständnis ist in einer Demokratie die Voraussetzung dafür, die Rolle als Bürgerin selbstbestimmt ausfüllen zu können (Delli Carpini & Keeter, 1996). Die ständige digitale Verfügbarkeit von Informationen zu politischen Fragen, Institutionen und Prozessen relativiert diese Bedeutung nicht, denn konzeptuelles politisches Wissens bildet gerade die Grundlage, die benötigt wird, um die Relevanz und Vertrauenswürdigkeit von Informationen zu beurteilen (Wolak, 2022). Bürgerinnen mit umfassenderem politischem Wissen sind nicht nur in der Lage, ihre politischen Interessen effektiver einzubringen, sie zeigen auch häufiger Bereitschaft etwa zur wahlbezogenen Partizipation oder zum politischem Boykott bestimmter Konsumprodukte (Westle & Anstötz, 2020). Ähnliche Effekte zeigen sich bereits bei Jugendlichen (Deimel, 2023). Systematische Unterschiede im politischen Wissen können so Strukturen von Ungleichheit in Demokratien verfestigen. Da Schule die Institution ist, die in vielen Bildungssystemen alle heranwachsenden Bürgerinnen erreicht, ist die Entwicklung konzeptuellen politischen Wissens als zentrales Element der Integrationsfunktion von Schule zu betrachten (Hahn-Laudenberg, 2017). Konzeptionen der Erfassung politischen Wissens werden im deutschsprachigen Raum aktuell nicht nur beschränkt auf die Politikdidaktik (Weißeno, 2022), sondern verstärkt in der empirischen Bildungsforschung (Alscher et al., 2022) und der Politikwissenschaft (Tausendpfund & Westle, i.E.) diskutiert. Die International Civic and Citizenship Education Study (ICCS) ermöglicht als einzige Large-Scale-Assessment-Studie die Analyse politischen Wissens im internationalen Vergleich. Fragestellung: Wie gestaltet sich die Konzeption der Erfassung politischen Wissens in ICCS 2022 unter Berücksichtigung von Fragen der Validität, Dimensionalität und Trendbestimmung? Welches Ausmaß an konzeptuellem politischem Wissen zeigen Schülerinnen in NRW und SH im internationalen Vergleich und welche sozialen Disparitäten sind hinsichtlich dieses politischen Wissens erkennbar? Methode: Politisches Wissen wird in ICCS 2022 über Items erhoben, die auf das konzeptuelle politische Wissen und auf das Argumentieren und Anwenden dieses Wissens zielen. Inhaltlich umfasst der Wissenstest Fragen zu gesellschaftlichen Institutionen und Systemen, Werten, Identität sowie zu Partizipation in einer Demokratie. Gegenüber vorhergehenden Zyklen wurde der Anteil an Items mit Bezug zu Global Citizenship und Nachhaltigkeit gestärkt. Insgesamt werden 141 Items auf 14 Cluster verteilt und anhand eines rotierten Booklet-Designs mit drei Clustern pro Booklet eingesetzt. Erstmals im Kontext von ICCS enthalten drei Cluster Module mit komplexeren Aufgabenszenarien, in denen Antwortformate jenseits klassischen Multiple-Choice-Formate oder offenen Antwortformate eingesetzt wurden sowie Aufgaben, bei denen Aspekte einer Aufgabe in Abhängigkeit des vorhergehenden Antwortverhaltens gestaltet wurden (computer enhanced items). Ergebnisse: Anhand von Beispielitems gibt der Beitrag Einblick in die inhaltliche Konzeption des Wissenstests. Die Analyse des Feldtests liefert erste empirische Argumente für eine mit vorhergehenden Zyklen der Studie vergleichbare Skalierung politischen Wissens über ein eindimensionales IRT-Modell. In ICCS 2016 war NRW eins der Bildungssysteme, in denen Schülerinnen im europäischen Vergleich im Mittel geringeres politisches Wissen zeigten, welches gleichzeitig besonders stark durch den familiären sozioökonomischen Status vorhergesagt werden konnte (Hahn-Laudenberg & Abs, 2017). Der Beitrag diskutiert, inwieweit ein entsprechendes Bild auf Basis von ICCS 2022 für NRW und SH gezeichnet werden kann. Angesichts der Vertraulichkeit der Daten vor dem Veröffentlichungstermin der hierauf bezogenen Studienergebnisse von ICCS 2022 am 28. November kann eine genauere Darstellung der Ergebnisse im Rahmen des Abstracts noch nicht erfolgen. Effekte von politischem Wissen und schulischen Milieus auf Einstellungen zur Europäischen Union und zu den Ergebnissen ihrer politischen Entscheidungen Monika Oberle¹, Beatriz Matafora² ¹Universität Göttingen, ²Universität Duisburg-Essen Theoretischer Hintergrund: Politik in Deutschland ist heute ohne Berücksichtigung der europäischen Dimension weder angemessen zu begreifen noch zu gestalten. Dem muss eine zeitgemäße politische Bildung Rechnung tragen (Oberle, 2012). In der politischen Europabildung kommt der Europäischen Union (EU) ein zentraler Stellenwert zu – als transnationaler Zusammenschluss mit supranationalen und intergouvernementalen Elementen prägen ihre Entscheidungen zunehmend das Leben ihrer Bürgerinnen und sind zugleich auch über europäische Beteiligungsverfahren wie die Europawahlen zu beeinflussen (Knelangen & Oberle, 2021). Die Komplexität der EU erschließt sich jedoch nicht nebenbei. Entsprechend sehen die Curricula der Sekundarstufen allgemeinbildender Schulen in allen Bundesländern die Behandlung der EU im politischen Fachunterricht verbindlich vor. Neben Kenntnissen zur Eingebundenheit Deutschlands in die EU und Wissen um die Bedeutung von deren Entscheidungen für das eigene Leben sollen bei den Lernenden laut Empfehlung der Kultusministerkonferenz (2020) auch ein Bewusstsein europäischer Zusammengehörigkeit bzw. die Auseinandersetzung mit einer europäischen Identität gefördert werden. In Anlehnung an das Modell der Politikkompetenz (Detjen et al., 2012) bestehen Ziele des Politikunterrichts entsprechend u.a. in der Förderung konzeptuellen Wissens zu europäischer Politik in ihren Dimensionen polity, politics und policy sowie in der Förderung EU-bezogener Motivationen (z.B. Interesse, Selbstwirksamkeitsüberzeugung) und Einstellungen (z.B. Institutionenvertrauen). In Anlehnung an David Eastons (1965) Unterscheidung von diffuser und spezifischer politischer Unterstützung lassen sich generelle und performanzbezogene politische Einstellungen unterscheiden und damit ein „harter“ von einem „weichen“ Euroskeptizismus (Knelangen, 2015). Im Gegensatz zu einer „fundamentalen“ EU-Skepsis entspricht eine „konstruktive“ EU-Skepsis durchaus den Zielen der politischen EU-Bildung. Studien zeigen Zusammenhänge von politischem Wissen und Einstellungen zur EU, allerdings mit unterschiedlichen Ausprägungen für generelle und performanzbezogene Einstellungen (Oberle & Forstmann, 2015). Fragestellung: Der Beitrag untersucht, wie sich die Ausprägung der EU-bezogenen Orientierungen der Schülerinnen in Nordrhein-Westphalen und Schleswig-Holstein im internationalen Vergleich darstellt. Außerdem wird der Frage nachgegangen, wie das Wissen der Schülerinnen zur Europäischen Union ihre Einstellungen zu deren System und politischen Ergebnissen beeinflusst. Schließlich wird untersucht, inwiefern sich dieser Zusammenhang je nach politische Wissen, soziodemografischem Hintergrund der Schülerinnen und ihrer Schulformzugehörigkeit unterscheidet. Methode: Politisches Wissen wird in ICCS 2022 über Items erhoben, die auf das konzeptuelle politische Wissen und auf das Argumentieren und Anwenden dieses Wissens zielen (vgl. Beitrag Hahn-Laudenberg et.al). Einstellungen zur EU wurden mit Hilfe von Likert-skalierten Items erfasst, wobei sich zwei unterschiedliche Dimensionen mit reliablen Skalen modellieren lassen: positive und negative Einstellungen zur EU. Multiple Regressionen und latente Strukturgleichungsmodelle werden in Mplus berechnet. Ergebnisse: Der Beitrag gibt erstens anhand von Beispielitems Einblick in die Operationalisierung der untersuchten Orientierungen von Schülerinnen zur Europäischen Union und stellt die Messmodelle vor. Zweitens werden deskriptive Statistiken zu den im Sample der beiden deutschen Bundesländer vorliegenden EU-bezogenen Kenntnissen und Einstellungen vorgestellt, die im europäischen Vergleich laut Feldtest unterdurchschnittlich ausfallen. Auf Grundlage multipler Regressionen und Strukturgleichungen werden Zusammenhänge zwischen den EU-bezogenen Orientierungen der Schülerinnen und ihrem politischen Wissen sowie der Einfluss soziodemografischer Hintergrundvariablen auf deren Ausprägung eruiert. Der Beitrag diskutiert vorliegende differentielle Effekt von politischem Wissen und Migrationshintergrund auf die EU-bezogenen Einstellungen der Schülerinnen in Nordrhein-Westfalen und Schleswig-Holstein. Angesichts der Vertraulichkeit der Daten vor dem Veröffentlichungstermin der hierauf bezogenen Studienergebnisse von ICCS 2022 am 28. November kann eine genauere Darstellung der Ergebnisse noch nicht erfolgen. Wissen als Prädiktor von sozialem und institutionellem Vertrauen – Analysen aus ICCS 2022 Johanna Ziemes Universität Duisburg-Essen Theoretischer Hintergrund: Vertrauen beschreibt die Überzeugung, dass Andere zumindest nicht gegen die eigenen Interessen arbeiten, auch dann, wenn sie nicht beständig kontrolliert werden (Flanagan, 2013). Institutionelles Vertrauen stabilisiert das Regierungssystem (Norris, 2017), wohingegen soziales Vertrauen auch genutzt werden kann, um institutionelle Änderungen einzufordern (Newton, 2006). Wo die Entwicklung eines grundlegenden Vertrauens als Entwicklungsaufgabe der Kindheit gilt (Erikson, 1959/1994), ist die Jugend eine wichtige Phase für die Entwicklung von politischen Einstellungen, wie dem Vertrauen in politische Institutionen (Claes & Hooghe, 2017; Ziemes, 2022). Vertrauen in abstrakte Konstrukte scheint sich erst in der Adoleszenz zu entwickeln. Für die Entwicklung von Vertrauen in Menschen allgemein wird der Beziehung zu den Eltern und zu Gleichaltrigen eine große Rolle zugeschrieben (Flanagan, 2013; Flanagan & Stout, 2010). Es gibt Befunde, welche die Bedeutsamkeit von Sozialbeziehungen auch für das Vertrauen in politische Institutionen unterstreichen (Claes & Hooghe, 2017; Ziemes et al., 2020). Gleichzeitig findet sich zunehmend Evidenz dafür, dass der Zusammenhang von politischem Wissen und Institutionenvertrauen durch die Leistungsfähigkeit der jeweiligen Institutionen moderiert wird: In Ländern mit wenig Korruption vertrauen politisch kompetentere Schülerinnen den Institutionen mehr und in korrupteren Ländern weniger als ihre Mitschülerinnen mit geringerem politischem Wissen (Deimel et al., 2022; Hahn-Laudenberg & Abs, 2020). Der Forschungsstand lässt folgende Fragen bislang offen: Sind politisches Wissen und Sozialbeziehungen für das Vertrauen in Intuitionen und Menschen allgemein jeweils ähnlich relevant? Finden sich internationale Variationen in der Relevanz der Prädiktoren von Vertrauen in Menschen allgemein? Fragestellung: Dieser Beitrag vergleicht die differentielle Bedeutsamkeit von schulischen Sozialbeziehungen und politischem Wissen für soziales Vertrauen und Vertrauen in politische Institutionen im internationalen Vergleich. Es wird angenommen, dass Sozialbeziehungen einen engeren Zusammenhang zu Vertrauen in Menschen zeigen und Wissen international variabel mit Vertrauen in politischen Institutionen interagiert. Umgekehrt sollte das politische Wissen für soziales Vertrauen und Sozialbeziehungen für Vertrauen in politische Instituierenden jeweils eine geringere Bedeutung haben. Methoden: Für den Vortrag werden die Daten der Hauptstudie von ICCS 2022 genutzt. In diesem Abstract werden Feldtestanalysen vorgestellt, weil die Daten der Hauptstudie noch einer Sperrfirst unterliegen. Die Daten der Hauptstudie umfassen circa 74.000 Schülerinnen aus 24 Bildungssystemen. Die Schülerinnen waren zum Erhebungszeitpunkt idR im achten Jahr der Beschulung. Vertrauen in politische Institutionen wurde erfasst mit einer Skala zum Vertrauen von Schülerinnen in sechs Institutionen (z.B. die Regierung, die Polizei). Für das Vertrauen in Menschen allgemein stand lediglich ein Item zur Verfügung. Politisches Wissen wurde erfasst über einen 45-minütigen Test im rotierendem Booklet-Design. Eine Skala mit drei Items wurde genutzt, um die schulischen Sozialbeziehungen der Schülerinnen zu messen (z.B. „Die meisten Schülerinnen behandeln einander mit Respekt“) (Schulz et al., 2023; Schulz et al., in Vorbereitung). Ergebnisse: Die vorläufigen Ergebnisse beziehen sich auf die Bildungssysteme Nordrhein-Westfalen und Schleswig-Holstein; im Vortrag werden Ergebnisse aus 24 Bildungssystemen vorgestellt. In beiden Bundesländern korrelieren die Aspekte des Vertrauens moderat miteinander (rNRW=36; rSH=.31). Für Schülerinnen handelt es sich also um distinkte Konzepte. Separate Regressionsanalysen zeigen, dass die Sozialbeziehungen der Schülerinnen signifikant mit dem institutionellen Vertrauen (βNRW=26; βSH=.28) und dem Vertrauen in Menschen allgemein verbunden sind (βNRW=24; βSH=.26). Es zeigt sich jedoch nur ein geringfügiger Zusammenhang zwischen politischem Wissen und den beiden Aspekten des Vertrauens (jeweils β<.10). Diskussion: Die Ergebnisse lassen sich vollständig erst mit den Analysen der Daten der Hauptstudie interpretieren. Diese ersten Analysen weisen bereits darauf hin, dass Sozialbeziehungen für den Aufbau von Vertrauen in Institutionen und in Menschen allgemein ähnlich bedeutsam sind. Diese vorläufigen Analysen zeigen so die Bedeutsamkeit von Sozialbeziehungen für die politische Sozialisation und die politische Bildung auf. Gleichzeitig unterstützen die Ergebnisse nicht die Annahme, dass unterschiedliche Sozialisationsbedingungen für die Entwicklung der differenten Vertrauensaspekte relevant sind. Die Bedeutung Diskriminierungserfahrung und politischem Wissen für Überzeugungen zur Privilegierung von Religion in der Gesellschaft Hermann Josef Abs, Daniel Deimel Universität Duisburg-Essen Theorie: Die positive Bewertung gesellschaftlicher Meinungs- und Interessenvielfalt wird unter dem Begriff des Pluralismus (Manson, 2023) gefasst und ist eine Voraussetzung für Chancengleichheit in der demokratischen Willensbildung (Wenzel, 2023). Deshalb ist es problematisch, wenn einzelne Gruppen grundsätzlich davon ausgehen, dass ihren Sichtweisen ein Vorrang gegenüber den Sichtweisen anderer in der Demokratie zukommt, oder wenn einzelne Gruppen davon ausgehen (müssen), dass sie geringere Chancen haben, ihre Meinungen und Interessen in gesellschaftliche Diskurse einzubringen. Es gehört zu den Aufgaben von politischer Bildung und schulischer Demokratieerziehung, den Pluralismus der Schüler:innen untereinander zu stärken. Dies beinhaltet, sie dazu zu befähigen, gegen gruppenbezogene Diskriminierung initiativ zu werden und vermeintliche Privilegien aufgrund der Zugehörigkeit zu einer sozialen Gruppe zurückzuweisen. Fragestellung: Der Beitrag geht der Frage nach, inwiefern Überzeugungen zur Privilegierung der eigenen Gruppe durch gruppenbezogene Diskriminierung aufgeklärt werden kann und inwieweit politisches Wissen einen Schutz vor der Ausprägung entsprechender Überzeugungen bietet. Dies geschieht am Beispiel der Überzeugung, dass die eigene Religion in der Gesellschaft privilegiert werden sollte und der Diskriminierung wegen Religionszugehörigkeit. Methode: Die International Civic and Citizenship Education Study (ICCS) ermöglicht es, den Status quo hinsichtlich der Überzeugungen zur Privilegierung von Religion, Diskriminierungswahrnehmung und -erfahrung bei Schüler:innen der 8. Jahrgangsstufe im schulischen Kontext zu erfassen. Im Fokus steht die Skala zur Privilegierung von Religion mit sechs Items (z.B. „Religiöse Autoritäten sollten mehr Macht in der Gesellschaft haben.“). Weiterhin besteht eine Skala zur Diskriminierungswahrnehmung in der Gesellschaft, die auch die Diskriminierung von religiösen Minderheiten erfasst. Schließlich wurde die individuelle Diskriminierungserfahrung in der Schule erfragt, wobei Religion als Anlass der Diskriminierung angegeben werden konnte. Weil für Ergebnisse zur Haupterhebung von ICCS 2022, die für NRW repräsentativ N = 3.269 Schüler*innen in 145 Schulen umfasst, eine Sperrfrist besteht, bezieht sich das Abstrakt auf eine eigene Vorläuferstudie und Feldtestergebnisse. Ergebnisse: Gutzwiller-Helfenfinger et al. (2022) konnte mit Daten aus ICCS 2016 für Nordrhein-Westfahlen gezeigt zeigen, dass Schüler:innen, die sich als einer Religion zugehörig ausweisen und an religiösen Feiern teilnehmen, eher dazu tendieren, einen stärkeren Einfluss von Religion in der Gesellschaft zu wünschen. Dies gilt in unterschiedlichem Ausmaß für alle Religionen im Vergleich zu Schüler:innen, die sich keiner Religion zuordnen. Die Selbstzuordnung zum Islam als Religion weist in diesem Kontext einen deutlich stärkeren Effekt auf als die angegebene Zugehörigkeit zum Christentum. So stimmen dem oben genannten Beispielitem 61% der muslimischen und 18% der christlichen Schüler:innen zu. Weiterhin wird eine Zustimmung zur Privilegierung von Religion dann wahrscheinlicher, wenn eine Zuwanderungsgeschichte (mindestens ein Elternteil im Ausland geboren) vorliegt. Dahingegen erweist sich politisches Wissen (vgl. Wissenstest in ICCS) als protektiver Faktor gegen die antipluralistische Überzeugung. Mit den Daten aus ICCS 2022 stehen im Vergleich zu ICCS 2016 erweiterte Maße zur Erfassung gesellschaftlicher Diskriminierungswahrnehmung und (als nationale Ergänzung) persönlicher Diskriminierungserfahrung der Schüler:innen zur Verfügung. Nach Feldtestdaten nehmen 77% der Schüler:innen eine Diskriminierung religiöser Minderheiten wahr, wodurch Religion als ein vergleichsweise bedeutender Diskriminierungsanlass erkennbar wird. Daneben werden in Form einer nationalen Ergänzung auch persönliche Diskriminierungserfahrungen im schulischen Kontext erfasst. Hier liegen die Werte insgesamt deutlich niedriger. Die Analyse mit Feldtestdaten zeigt, wie Diskriminierungswahrnehmung und -erfahrung auf unterschiedliche Weise mit Überzeugungen zur Privilegierung von Religion in Zusammenhang stehen. Covid-bedingt ist die Stichprobe im Feldtest jedoch zu klein um eine signifikante Prädiktion der privilegierenden Überzeugungen aus der gesellschaftlichen Diskriminierungswahrnehmung und/oder individuellen Diskriminierungserfahrung zu ermöglichen. Dahingegen ist mit den Daten der Haupterhebung eine vollständige Schätzung des Modells möglich. Hierzu wird ein regressionsanalytisches Verfahren gewählt. Diskussion: Die Überzeugung zur Privilegierung der eigenen Gruppe und Diskriminierungserfahrungen sind als Gefährdungen des Pluralismus komplex miteinander verbunden. Die Ergebnisse erlauben eine neue Diskussion der Frage, inwiefern sich die Tendenz zur Privilegierung der eigenen Gruppe aus wahrgenommener bzw. erfahrener gruppenbezogener Diskriminierung speist.
10:30 - 12:10	1-04: Ungleichheiten im lebenslangen Lernen und ihre Folgen: Längsschnittliche Erkenntnisse auf der Basis des Nationalen Bildungspanels Ort: H02
	Symposium Ungleichheiten im lebenslangen Lernen und ihre Folgen: Längsschnittliche Erkenntnisse auf der Basis des Nationalen Bildungspanels Chair(s): Corinna Kleinert (Leibniz-Institut für Bildungsverläufe (LIfBi) und Universität Bamberg), Steffen Schindler (Universität Bamberg) Diskutantin(nen): Sarah Widany (Deutsches Zentrum für Hochschul- und Wissenschaftsforschung (DZHW)) Heutige Wissensgesellschaften sind durch Prozesse des kontinuierlichen technologischen, ökonomischen und sozialen Wandels gekennzeichnet. Diese erfordern es, dass Menschen ihre Fähigkeiten fortwährend an veränderte Anforderungen anpassen (van Nieuwenhove und Wever 2021; Gorges, 2015). Lernprozessen nach der Schule und Erstausbildung kommt damit eine wachsende Relevanz zu. In der Realität ist das Lernen im Erwachsenenalter allerdings hochgradig sozial stratifiziert. Es partizipieren vor allem diejenigen, die sowieso schon bessere Voraussetzungen mitbringen (Kilpi-Jakonen et al. 2015). Vor diesem Hintergrund stellen sich zwei grundlegende Fragen: Wie universell sind diese sozialen Ungleichheiten im lebenslangen Lernen, das heißt, wie stark variieren sie über die Zeit und über unterschiedliche institutionelle Kontexte (Boeren et al. 2012)? Und welche Konsequenzen haben sie für die weiteren Lebensverläufe, Lebenschancen und Karrieren Erwachsener, aber auch für die Entwicklung gesamtgesellschaftlicher Ungleichheit? Antworten auf beide Fragen sind entscheidend, um die Relevanz sozial ungleicher Lernbeteiligung besser einordnen zu können und um zu verstehen, wo gesellschaftliche Anreize liegen könnten, diese zu verringern. Aufgrund der großen Heterogenität von Bildungsprozessen, Lernformen und Lernkontexten im Erwachsenenalter sind diese Fragen jedoch kaum universell zu beantworten (Kaufmann & Widany, 2013), und die Forschung dazu ist noch immer überschaubar. Dies liegt vermutlich auch daran, dass man zu ihrer empirischen Bearbeitung reichhaltige Längsschnittdaten benötigt. In Deutschland stellt das Nationale Bildungspanel (NEPS) die einzige Datenquelle dar, die es erlaubt, heterogene Bildungsprozesse, -formen und -kontexte im Erwachsenenalter zu identifizieren, diese längerfristig bei den gleichen Personen zu beobachten und Einflüsse veränderter Gelegenheitsstrukturen sowie Erträge von lebenslangem Lernen zu analysieren. Daher versammelt dieses Symposium eine Diskussion und vier Beiträge aus unterschiedlichen disziplinären Perspektiven auf der Basis der Erwachsenenkohorte des NEPS (NEPS-SC6), die genuin längsschnittliche Fragestellungen im Kontext der Beteiligung an und der Erträge von Lernaktivitäten im Erwachsenenalter adressieren. Die ersten zwei Beiträge nehmen die ungleiche Beteiligung an Lernprozessen im Erwachsenenalter in den Blick und untersuchen, welche Auswirkungen sich verändernde Gelegenheitsstrukturen darauf haben, die durch gesamtgesellschaftliche Krisen bedingt sind. Der erste Beitrag befasst sich mit Effekten von Konjunkturzyklen auf die individuelle Weiterbildungsbeteiligung. Dabei werden zwei Mechanismen beleuchtet, die die bisher vorliegenden widersprüchlichen Forschungsergebnisse dazu erklären können, nämlich die Rolle von Risikopräferenzen und Statuserwägungen. Außerdem werden unterschiedlich finanzierte Weiterbildungen unterschieden. Der zweite Beitrag befasst sich den Auswirkungen der COVID-19-Pandemie auf die Entwicklung geschlechts- und familienspezifischer Ungleichheiten in der Teilnahme an berufsbezogener Weiterbildung. Er untersucht, welchen Einfluss Inzidenzraten, staatliche Beschränkungen und Veränderungen der Arbeitssituation auf die Weiterbildungsteilnahme von Frauen und Männern mit und ohne Kindern hatten. Die beiden folgenden Beiträge beleuchten Erträge von Lernprozessen im Erwachsenenalter. Der dritte Beitrag befasst sich mit der Rolle von Weiterbildung für Personen, deren berufliche Karrieren vom technologischen Wandel betroffen sind. Hier wird erstens analysiert, ob berufliche Weiterbildung vor Arbeitsplatzverlust und anschließender Arbeitslosigkeit schützt, und zweitens, ob dabei länderspezifische Unterschiede zu beobachten sind. Konkret werden dazu Deutschland und Großbritannien verglichen, wofür Analysen auf Basis des Haushaltspanels Understanding Society* durchgeführt wurden. Der vierte Beitrag befasst sich grundlegend mit sozialen Reproduktionsprozessen und fragt, inwieweit eine formale Höherqualifizierung dazu beitragen kann, dass sich der enge Zusammenhang von sozialer Herkunft und sozialer Platzierung im Erwachsenenalter im Laufe des Lebens noch verändert. Konkret wird untersucht, ob formale Bildungsaufstiege dazu beitragen, den Zusammenhang zwischen sozialer Herkunft und Einkommen zu verändern. Dazu werden Daten der NEPS-SC6-ADIAB genutzt, in der das NEPS um administrative Daten angereichert wurde. Zum Schluss werden alle vier Beiträge zusammenfassend diskutiert, insbesondere mit Blick auf interdisziplinäre Anschlüsse, künftige Forschungsbedarfe und Implikationen für Interventionen. Beiträge des Symposiums Die Rolle von Risikopräferenzen und Statuserwägungen bei der Vermittlung von Konjunktureffekten auf individuelle Weiterbildungsbeteiligung Dominik Becker, Marion Thiele, Myriam Baum, Sandra Müller, Harald Pfeifer, Nele Tschöpe Bundesinstitut für Berufsbildung (BIBB) Konjunkturzyklen können das betriebliche Angebot an und die individuelle Nachfrage nach Weiterbildung beeinflussen (Dietz & Zwick, 2020). Dem aktuellen Forschungsstand lassen sich Inkonsistenzen konstatieren: Theoretisch könnten einerseits betriebliche Weiterbildungsinvestitionen rezessionsbedingt ansteigen, etwa durch geringere Opportunitätskosten (Brunello, 2009) oder ein geringeres Verlustrisiko von Fachkräften an konkurrierende Betriebe (Felstead & Green, 1996). Zudem könnten Rezessionen die betriebliche Übernahme neuer Technologien bestärken (Caballero & Hammour, 1994), somit betriebliche (Weiterbildungs-)Investitionen zur Deckung des resultierenden Fachkräftebedarfs befördern (Hershbein & Kahn, 2018). Andererseits könnten Rezessionen auch betriebliche Weiterbildungsinvestitionen verringern, etwa durch Einnahmeverluste bei gleichbleibenden Finanzbelastungen (Mason & Bishop, 2015) oder hohe Aus-/Weiterbildungskosten bei unklarer Ertragslage (Becker, 1962). Für Individuen verringern rückläufige betriebliche Weiterbildungsangebote die Weiterbildungschancen. Zudem verringern ggf. erhöhte relative Weiterbildungskosten bei niedrigeren verfügbaren finanziellen Ressourcen die Weiterbildungsteilnahmen. Dagegen könnten Individuen rezessionsbedingt freigesetzte Zeitressourcen – etwa bei Arbeitslosigkeit/Kurzarbeit – in ihre Weiterbildung investieren (Felstead et al., 2013), deren erwarteter Nutzen gleichzeitig zunehmen würde. Der empirische Forschungsstand folgt diesen theoretischen Inkonsistenzen: Während die Studienlage mehrheitlich rezessionsbedingt geringere betriebliche Weiterbildungsinvestitionen nahelegt (Mason & Bishop, 2015; z.B. Popov, 2014), beobachteten andere Studien gegenläufige (Bassanini et al., 2007) oder keine Effekte (Felstead et al., 2012). Auch für die individuelle Weiterbildungsnachfrage wurden sowohl positive (Majumdar, 2007) als auch, häufiger, negative Konjunktureffekte beobachtet (Bassanini & Brunello, 2008; Dietz & Zwick, 2020; Sepulveda, 2004). Wir adressieren zwei mögliche Gründe für diese Inkonsistenzen in bisherigen Studien: 1) heterogene Konjunktur- und Weiterbildungsmaße sowie 2) bislang ungenaue Messungen der den Konjunktureffekten zu Grunde liegenden Mechanismen. Ad 1) schätzen wir Konjunktureffekte für verschiedene Konjunkturmaße (z.B. jährliches BIP vs. monatlich/quartalsweise Arbeitslosenquoten auf regionaler/nationaler Ebene) auf die individuelle betrieblich- vs. individuell-finanzierte Weiterbildungsbeteiligung. Ad 2) untersuchen wir die Rolle individueller Risikopräferenzen (Dohmen et al., 2011) und Statuserwägungen (Breen & Goldthorpe, 1997) als potentielle Mediatoren vs. Moderatoren von Konjunktureffekten auf Weiterbildung. Bewährt ist der Einfluss von Konjunktureffekten auf den Wandel individueller Risikopräferenzen (Guiso et al., 2018), zudem scheinen Risikopräferenzen individuelle Weiterbildungsinvestitionen zu bedingen (Caliendo et al., 2020) – dies spricht für Risikopräferenzen als Mediator von Konjunktureffekten auf Weiterbildung. Zur besseren Trennung investitionsbezogener und statusbezogener Vermittlungseffekte individueller Risikopräferenzen kontrollieren wir zudem individuelle Statuserwägungen. Wir vermuten, dass bei konstanten Statuspräferenzen Rezessionen zu höherer Risikoaversion und damit zu geringeren Weiterbildungsinvestition führen. Zur Herleitung von Moderationseffekten von Risikopräferenzen folgen wir der Idee von psychosozialen Traits als „Linse“, durch die Situationseinflüsse auf individuelles Handeln vermittelt werden (Huinink & Schröder, 2008). Konkret sollten bei konstanten Statuspräferenzen negative Konjunktureffekte auf individuelle Weiterbildungsinvestitionen für risikoaverse Individuen stärker wiegen. Primäre Datenquelle ist die Erwachsenenstartkohorte des Nationalen Bildungspanels (NEPS-SC6; Blossfeld & Roßbach, 2019). Outcomes sind dichotome Indikatoren individuell vs. betrieblich-finanzierter non-formaler Weiterbildung. Da in NEPS-SC6 nur begrenzte Informationen über den jeweiligen Weiterbildungszeitpunkt vorliegen, spielen wir unter Rückgriff auf das Sozioökonomische Panel den für ausgewählte soziodemographische Hintergrundmerkmale geschätzten Weiterbildungsmonat mittels statistical matching (Alpman, 2016) an die jeweiligen „statistischen Zwillinge“ im NEPS. Auf Basis der imputierten Weiterbildungsmonate können extern vorliegende Konjunkturmerkmale monats- bzw. quartalsgenau ans NEPS angespielt werden. Risikopräferenzen wurden mittels subjektiver domänenübergreifender Risikobereitschaft (0=gering – 10=hoch) gemessen. Statuserwägungen liegen in Form von Einschätzungen des Weiterbildungsnutzens für Jobsicherheit/Statuserhalt sowie als subjektive Wichtigkeit von Jobsicherheit/Statuserhalt (jeweils 0=gering – 10=hoch) vor. Aufgrund der angenommenen Exogenität der Konjunkturindikatoren kontrollieren wir nur Bildung und Alter als wichtigste zeitvariante Kovariaten. Zeitinvariante Heterogenität wird mittels Fixed-Effects-Modellen aufgefangen. Erste Ergebnisse zeigen antizyklische Konjunktureffekte auf betrieblich-finanzierte Weiterbildung und tendenziell prozyklische Konjunktureffekte auf individuell-finanzierte Weiterbildung, jedoch keine Befunde für eine mediierende Rolle von Risiko- und Statuspräferenzen. Der positive Zusammenhang zwischen subjektivem Weiterbildungsnutzen für den eigenen Statuserhalt und betrieblich-finanzierter Weiterbildungsteilnahme suggeriert für letztere ein vergleichsweise höheres Gewicht für den individuellen Statuserhalt. Als nächste Schritte werden wir die moderierende Rolle von Risikopräferenzen/Statuserwägungen sowie asymmetrische Konjunktureffekte zur Trennung von Auf- und Abschwungseffekten (Allison, 2019) untersuchen. Geschlechterungleichheiten in der berufsbezogenen Weiterbildung während der Covid-19 Pandemie: längsschnittliche Evidenz aus Deutschland Christina Haas¹, Corinna Kleinert², Gundula Zoch³ ¹Leibniz-Institut für Bildungsverläufe (LIfBi), ²Leibniz-Institut für Bildungsverläufe (LIfBi) und Universität Bamberg, ³Universität Oldenburg und Leibniz-Institut für Bildungsverläufe (LIfBi) Von der COVID-19-Pandemie und ihren wirtschaftlichen und sozialen Folgen waren einige soziale Gruppen überproportional stark betroffen. Vor allem die Schließung von Kinderbetreuungseinrichtungen und Schulen führte zu einer Verstärkung der geschlechtstypischen Aufteilung unbezahlter Arbeit (z.B. Zoch et al. 2021), zu mehr Konflikten zwischen Beruf und Familie sowie zu einer Vergrößerung der geschlechtsspezifischen Unterschiede bei der Priorisierung von Arbeitsaufgaben und der Produktivität (z. B. Hipp & Konrad, 2022; Cui et al., 2021; Rusconi et al., 2020). Veränderungen in der Teilnahme an Bildungsprozessen während der Pandemie wurden jedoch erst selten untersucht (vgl. z.B. Kleinert & Zoch, 2023), und überhaupt nicht mit Blick auf Geschlechterungleichheiten. Aufbauend auf früheren Studien, die eine geringere Weiterbildungsbeteiligung von Frauen im Zuge der Mutterschaft konstatieren (Dämmrich et al. 2015; Zoch 2023), sowie auf den jüngsten Ergebnissen zu den geschlechtsspezifischen Auswirkungen von Covid-19 auf Beschäftigung und Familienleben untersuchen wir, wie sich die Pandemie auf geschlechts- und familienspezifische Unterschiede in der Beteiligung an berufsbezogener Weiterbildung ausgewirkt hat. Wir nutzen dazu einen theoretischen Rahmen, der auf veränderten Gelegenheitsstrukturen, Ansätzen zeitlicher Verfügbarkeit und Überlegungen zu Geschlechterungleichheiten beruht (Becker, 2018; Diekhoff & Steiber, 2011; Massing & Gauly, 2017; Rüter & Martin, 2021). Grundsätzlich dürfte Covid-19 nichts an der intrinsischen Motivation verändert haben, sich weiterzubilden. Deutliche Veränderungen gab es jedoch in den Gelegenheitsstrukturen: Da Frauen häufiger als Männer in systemrelevanten Berufen arbeiten, waren sie während der Pandemie besonders belastet. Die Teilnahme an Weiterbildung dürfte in diesen Arbeitskontexten häufig wenig prioritär gewesen sein. Dies gilt auch für familiäre Kontexte, wo anzunehmen ist, dass Frauen und insbesondere Mütter aufgrund ihrer geringeren Verhandlungsmacht und traditionellen Rollenbildern stärkeren Zeitkonflikten ausgesetzt waren als ihre Partner. Diese Zeitkonflikte dürften in Zeiten und Regionen mit starken Corona-Beschränkungen und hohen Inzidenzen besonders ausgeprägt gewesen sein. Zusammenfassend nehmen wir folglich an, dass Frauen, insbesondere Mütter, anfälliger für staatliche Restriktionen und damit verbundene Konsequenzen waren als Männer, was sie dazu veranlasste, familiären und beruflichen Aufgaben Vorrang vor Weiterbildungsaktivitäten einzuräumen. Dies führte zu einer sinkenden Teilnahme während der COVID-19-Pandemie. Unsere Studie verwendet Paneldaten aus Deutschland (NEPS-SC6, N=9.078), die Informationen über berufsbezogene nonformale Bildung zwei Jahre vor der Pandemie (2018/19) und zwei Jahre nach Ausbruch der Pandemie (2020/21) enthalten. Zusätzlich wurden regionale Daten zu täglichen COVID-19-Inzidenzraten und staatlichen Beschränkungen auf Kreisebene (INFAS 360) einbezogen. Auf der Grundlage zeitlicher und regionaler Variation im Weiterbildungsangebot, in pandemiebedingten Einschränkungen sowie den Inzidenzraten wurden lineare Wahrscheinlichkeitsmodelle mit individuellen fixen Effekten geschätzt, um Veränderungen der Beteiligung an beruflich motivierter Weiterbildung zu erklären. Deskriptive Ergebnisse zeigen einen signifikanten Rückgang der Weiterbildungsbeteiligung bei allen Geschlechtern, mit oder ohne Kinder, im ersten Jahr der Pandemie (2020), wobei der Rückgang bei Männern stärker ausfällt als bei Frauen. Vorläufige Ergebnisse linearer Wahrscheinlichkeitsmodelle mit fixen Effekten bestätigen einen deutlichen negativen Effekt während des ersten Pandemiejahres, insbesondere für Frauen mit und ohne Kinder sowie für kinderlose Männer. Diese Rückgänge lassen sich in erster Linie auf regionale Infektionsraten und Veränderungen der Gelegenheitsstrukturen am Arbeitsplatz zurückführen. Interessanterweise deuten die Ergebnisse auf eine robustere Erholung in der Gruppe der Eltern, insbesondere bei Frauen, im Jahr 2021 hin. Im Vergleich dazu weisen kinderlose Erwachsene auch im zweiten Pandemiejahr eine geringere Weiterbildungsbeteiligung auf als vor der Pandemie. Dies deutet darauf hin, dass Kinder das berufliche Lernen über die regionale COVID-19-Dynamik hinaus nicht wesentlich stärker beeinträchtigt haben als pandemiebedingte Veränderungen der Angebotsseite von Weiterbildungen. Zusammenfassend lässt sich schlussfolgern, dass die bisherigen Ergebnisse zwar signifikante Verschiebungen in der berufsbezogenen Weiterbildungsbeteiligung während der COVID-19-Pandemie aufzeigen, diese jedoch nicht mit einer wesentlich stärkeren Benachteiligung von Frauen oder Eltern einhergehen. Stabilisiert Weiterbildung Karrieren, die vom technologischen Wandel betroffen sind? Ergebnisse aus Deutschland und Großbritannien Martin Ehlert¹, Misun Lim² ¹Wissenschaftszentrum Berlin für Sozialforschung und Freie Universität Berlin, ²Wissenschaftszentrum Berlin für Sozialforschung Die Weiterbildung erwachsener Arbeitnehmer ist eine der wichtigsten Prioritäten der politischen Entscheidungsträger, um den negativen sozialen Folgen des technologischen Wandels entgegenzuwirken (OECD 2019). Um beschäftigungsfähig zu bleiben, müssen Arbeitnehmer durch Weiterbildung neue Kompetenzen erwerben. In dieser Studie wollen wir zwei miteinander verbundene Forschungsfragen beantworten: Erstens: Hilft Weiterbildung Arbeitnehmern, ihren Arbeitsplatz zu behalten oder zu einem neuen Arbeitsplatz zu wechseln, wenn ihr derzeitiger Arbeitsplatz von Automatisierung bedroht ist? Zweitens: Moderieren länderspezifische Institutionen die Auswirkungen von Weiterbildung auf die Arbeitsplatzmobilität gefährdeter Arbeitnehmer? Nach der Humankapitaltheorie (Becker 1975) führen Investitionen in Weiterbildung zu höheren Qualifikationen. Die Teilnahme an Weiterbildungsmaßnahmen sollte es den Arbeitnehmern daher im Allgemeinen ermöglichen, mit den technischen und sozialen Veränderungen am Arbeitsplatz Schritt zu halten oder einfach ihr Wissen auf den neuesten Stand zu bringen. Dies dürfte insbesondere für Beschäftigte in Berufen relevant sein, die durch Automatisierung ersetzt werden könnten. Berücksichtigt man jedoch auch die Personalpolitik der Unternehmen und die Transaktionskosten, so ergeben sich andere Vorhersagen für die Arbeitsplatzmobilität. Die meisten Kurzausbildungen werden von den Unternehmen bezahlt (Cedefop 2015). Die Bereitstellung von Weiterbildungsangeboten stellt somit einen Kostenfaktor für die Unternehmen dar, der gemäß Transaktionskostentheorien ihr Verhalten beeinflusst (Williamson 1985; Wotschack 2020). Folgt man dieser Argumentation, würden Übergänge in neue Beschäftigungsverhältnisse nach der Weiterbildung vor allem innerhalb des Unternehmens stattfinden. Wir gehen davon aus, dass dies für Beschäftigte in schrumpfenden Berufen von größerer Bedeutung ist, da sie wahrscheinlich häufiger Weiterbildungsmaßnahmen nutzen, um neue Qualifikationen für neue Tätigkeiten zu erwerben. Darüber hinaus erwarten wir Unterschiede zwischen Großbritannien und Deutschland. In Deutschland sind die beruflichen Veränderungen im Laufe des Erwerbslebens vergleichsweise geringer als in Großbritannien, was vermutlich auf die starke Fokussierung auf berufliche Fähigkeiten in der Erstausbildung (Allmendinger und Hinz 1998; Manzoni, Härkönen und Mayer 2014) und in den Arbeitsmarktinstitutionen (Dustmann und Pereira 2008; Hall und Soskice 2001) zurückzuführen ist. Zudem erfordern viele Berufe in Deutschland bestimmte formale Bildungsabschlüsse, insbesondere auf der mittleren Qualifikationsebene (Bol und Weeden 2015; Vicari und Unger 2020). Daher ist es unwahrscheinlich, dass kurze Weiterbildungsmaßnahmen, die fast nie zu einem Wechsel des formalen Qualifikationsniveaus führen, in Deutschland zu einem Wechsel zwischen Berufen führen. Im Vereinigten Königreich hingegen werden berufliche Qualifikationen häufiger "on the job" erworben. Außerdem gibt es einen höheren Anteil von Beschäftigten in Berufen, die keine formale Qualifikation erfordern (Bol und Weeden 2015). Zur Beantwortung unserer Forschungsfragen greifen wir auf hochwertige Paneldaten aus Deutschland und Großbritannien zurück - das deutsche Nationale Bildungspanel (NEPS) und Understanding Society - The UK Household Longitudinal Study (UKHLS). Darüber hinaus verwenden wir ein neuartiges Maß für das Automatisierungsrisiko, das auf der Wahrnehmung von Personalfachleuten in Europa basiert. Für die Analysen benutzen wir multivariate Event-History Modelle. Das Hauptergebnis unserer Analyse ist, dass berufliche Weiterbildung Arbeitslosigkeit verhindert (vgl. Dieckhoff, 2007; Ebner & Ehlert, 2018; McMullin & Kilpi-Jakonen, 2014). Dies ist insbesondere bei Arbeitnehmern mit hohem Automatisierungsrisiko der Fall, sowohl in Deutschland als auch im Vereinigten Königreich. Dies steht im Einklang mit unserer auf der Humankapitaltheorie basierenden Vorhersage, dass kurze Weiterbildungsmaßnahmen neue Fähigkeiten vermitteln und dass Arbeitnehmer mit hohem Automatisierungsrisiko am meisten davon profitieren, da sie eine höhere Nachfrage nach Fähigkeiten haben. Infolgedessen sind gefährdete Arbeitnehmer, die nicht an Weiterbildungsmaßnahmen teilnehmen, in beiden Ländern mit einer etwas höheren Beschäftigungsinstabilität konfrontiert. Trotz dieser Ähnlichkeiten haben wir deutliche länderübergreifende Unterschiede im Zusammenhang zwischen Ausbildung und beruflicher Mobilität festgestellt: Während Weiterbildung im Vereinigten Königreich den Arbeitsplatzwechsel zu fördern scheint, insbesondere bei Personen, die einem hohen Automatisierungsrisiko ausgesetzt sind, finden wir in Deutschland einen deutlich schwächeren Zusammenhang. Formale Höherqualifizierung und soziale Ungleichheit auf gesamtgesellschaftlicher Ebene Anja Grauenhorst, Steffen Schindler Universität Bamberg Weiterbildung und lebenslanges Lernen haben in den letzten Jahrzehnten zunehmend an Bedeutung gewonnen. Ihnen kommt zudem eine besondere Relevanz zu, um aktuellen Herausforderungen, wie z.B. veränderten Qualifikationsanforderungen aufgrund des strukturellen und technologischen Wandels oder Fachkräftemangel in bestimmten Branchen, zu begegnen. Andererseits wirft die zunehmende Bedeutung von Weiterbildung auch neue Fragen im Zusammenhang mit sozialer Ungleichheit und Mobilität auf. Da Bildung die zentrale vermittelnde Variable des Zusammenhangs zwischen sozialer Herkunft und sozialer Platzierung ist (Goldthorpe 2014), könnte eine sozial selektive Beteiligung an Weiterbildung diesen Zusammenhang im Lebensverlauf verändern. In diesem Beitrag wird eine bestimmte Form der Weiterbildung untersucht: formale Höherqualifizierung nach dem Eintritt in den Arbeitsmarkt. Die Frage ist, ob und wie sich der Zusammenhang zwischen sozialer Herkunft und Arbeitslohn auf gesamtgesellschaftlicher Ebene durch diese Form der Weiterbildung verändert. Der Beitrag ist eine Replikation der Studie von Virdia und Schindler (2019), die zeigen, dass formale Höherqualifizierung die Stärke des Zusammenhangs zwischen sozialer Herkunft und sozialem Status nicht verändert. In dieser Studie wurde der soziale Status anhand des Internationalen sozioökonomischen Index des beruflichen Status (ISEI) analysiert. Dies hat zur Folge, dass Effekte der Weiterbildung lediglich im Zusammenhang mit Berufswechseln identifiziert werden können. Vor dem Hintergrund, dass das Ausmaß beruflicher Mobilität im Lebensverlauf in Deutschland eher gering ist (Hillmert 2011; Mayer, Grunow, Nitsche 2010), könnte das Ergebnis der Studie durch die Wahl des gewählten Indikators der Arbeitsmarkterträge beeinflusst sein. Daher erscheint als alternativer zu analysierender Arbeitsmarktertrag der Arbeitslohn besonders interessant, da dieser im individuellen Erwerbsverlauf auch innerhalb der gleichen Berufstätigkeit variieren kann. Wir folgen daher dem Vorschlag von Virdia und Schindler (2019) und betrachten den Arbeitslohn anstelle des ISEI. Nach Virdia und Schindler (2019) beeinflussen vor allem drei Faktoren das Niveau sozialer Ungleichheit auf gesamtgesellschaftlicher Ebene. Erstens unterscheiden sich die Wahrscheinlichkeiten verschiedener sozialer Herkunftsgruppen im Erwerbsverlauf, nach dem Eintritt in den Arbeitsmarkt, eine formale Höherqualifizierung zu absolvieren. Dies ist vor allem auf Unterschiede in den Ausgangsqualifikationen und Arbeitsmarktpositionen zurückzuführen. Zweitens unterscheidet sich aufgrund der Unterschiede in den Ausgangspositionen die Qualität der Höherqualifizierung zwischen den unterschiedlichen zu analysierenden Gruppen. Hier ist die überbrückte Distanz zwischen anfänglich und neu erworbenem Bildungsabschluss und die damit verbundene Einkommensprämie von Bedeutung. Drittens sind die absoluten Gruppengrößen der sozialen Herkunftsgruppen von Bedeutung: So kann eine geringe Höherqualifizierungswahrscheinlichkeit einer großen Gruppe einen größeren Einfluss auf die gesamtgesellschaftliche Ungleichheit haben als eine hohe Wahrscheinlichkeit einer kleinen Gruppe. Vom Zusammenspiel dieser drei Faktoren hängt es ab, ob Höherqualifizierung im Lebensverlauf insgesamt zu einer Verringerung oder Verstärkung des Zusammenhangs zwischen sozialer Herkunft und dem Arbeitslohn führt. Für die Analysen nutzen wir die NEPS-SC6-ADIAB-Daten, bestehend aus Befragungsdaten der Startkohorte Erwachsene des Nationalen Bildungspanels und administrativen Daten, aus den Meldungen zur Sozialversicherung, die Teil der Integrierten Erwerbsbiografien (IEB) des Instituts für Arbeitsmarkt- und Berufsforschung (IAB) sind (Bachbauer, Wolf 2022). Wir stellen die Entwicklung des Zusammenhangs zwischen sozialer Herkunft und Arbeitslohn im Erwerbsverlauf anhand von Wachstumskurvenmodellen und Dekompositionsanalysen dar. Der individuelle Arbeitslohn (brutto) ist die zentrale abhängige Variable. Indikator für die soziale Herkunft ist die EGP-Klasse der Eltern (Erikson 1984). Unsere Ergebnisse zeigen, dass eine ungleichheitsverstärkende Wirkung von formaler Höherqualifizierung im Erwerbsverlauf nicht zu erkennen ist. Man kann die Ergebnisse vorsichtig als Hinweis darauf interpretieren, dass, wenn formale Höherqualifizierung nach dem Arbeitsmarkteintritt in den letzten Jahrzehnten überhaupt einen Effekt auf die soziale Ungleichheit auf gesamtgesellschaftlicher Ebene hatte, dann wahrscheinlich bestenfalls einen geringen mildernden Effekt.
10:30 - 12:10	1-05: Lernen und Unterrichten mit Videos: Wirkung auf motivationale und lernbezogene Prozesse Ort: H01
	Symposium Lernen und Unterrichten mit Videos: Wirkung auf motivationale und lernbezogene Prozesse Chair(s): Sören Traulsen (Leibniz Universität Hannover, Germany), Lysann Zander (Leibniz Universität Hannover, Germany) Diskutantin(nen): Till Bruckermann (Leibniz Universität Hannover, Germany) Dieses Symposium versammelt drei Beiträge, in denen der Einsatz von Videos in Lehr-Lern-Prozessen experimentell erforscht wird. Gemeinsames Ziel aller Beitragenden ist es, Aspekte zu untersuchen, die den didaktisch effektiven Einsatz von Videos zur Vermittlung fachspezifischer Inhalte in schulischer und universitärer Lehre determinieren. Aktuelle Forschung betont, dass sowohl Gestaltungselemente innerhalb eines Videos (z.B. die Sichtbarkeit und das Verhalten einer Lehrperson) als auch Merkmale der Lernenden selbst (z.B. ihr Vorwissen oder spezifische Kompetenzen) einen Einfluss darauf haben, wie Videos wahrgenommen werden und Lernerfolge unterstützt werden können. Das vorliegende Symposium trägt zum aktuellen Diskurs um den effektiven Einsatz von Videos in Lehr-Lern-Prozessen bei, indem es Ergebnisse dreier experimenteller Studien zusammenführt, die unterschiedliche Einflussfaktoren bezüglich des Lernens mit und durch Videos in den Blick nehmen. In Beitrag 1* wird experimentell untersucht, ob die Einblendung eines ‚Talking Head‘, also des Gesichts einer Lehrperson im Video, die Wahrnehmung von Studierenden hinsichtlich verschiedener Videomaterialien in einer Lernphase beeinflusst (z.B. Zufriedenheit und soziale Präsenz). Zudem wurde die Sichtbarkeit des ‚Talking Head‘ auch in einer sich anschließenden Testphase systematisch variiert, in der Informationen aus den gesehenen Lernvideos erfragt wurden. Die statistischen Analysen konnten weder Haupteffekte noch Interaktionseffekte des ‚Talking Head‘ in der Lern- und Testphase aufzeigen. Diese Befunde deuten in Übereinstimmung mit früheren Forschungsergebnissen darauf hin, dass mögliche positive Wirkungen der Einblendung einer Lehrperson (z.B. Abrufhinweise) durch negative Wirkungen (z.B. kognitive Überlastung) aufgehoben werden. Beitrag 2 fragt danach, wie sich die Körperhaltungen einer Lehrperson als ‚Social Cue‘ in einem Video auf die Wahrnehmung Studierender und ihren Einstellungen gegenüber der Lehrperson und dem Thema des Videos auswirken. Experimentell wurde die Körperhaltung der Lehrperson systematisch bezüglich der Dimensionen Vertikalität (aufrecht/zusammengesunken) und Horizontalität (offen/geschlossen) in einem Lehrvideo variiert. Die Analysen zeigten, dass beide Dimension die Wahrnehmung der Lehrperson durch Studierende hinsichtlich Enthusiasmus, Agency und Communion sowie empfundener Sympathie gegenüber der Lehrperson signifikant prägten. Der empfundene Respekt gegenüber der Lehrperson wurde hingegen nur durch die horizontale Dimension beeinflusst. Zudem wirkten beiden Dimensionen der Körperhaltung indirekt, mediiert durch den wahrgenommenen Enthusiasmus, auf das Interesse und die Motivation der Lernenden. Weitere Mediationsanalysen ergaben, dass die vertikale und die horizontale Dimension die Sympathie und den Respekt der Studierenden gegenüber der Lehrperson beeinflussten, wiederum indirekt mediiert durch deren Wahrnehmung von Agency und Communion der Lehrperson. Beitrag 3 widmet sich geschichtsbezogenen 360°-Videos, die auf Grund ihrer immersiven Merkmale herausfordernd für Lernende sein können. In einem universitären Schülerlabor wurde untersucht, ob sich durch ein kognitives Strategietraining, experimentell variiert bezüglich der Hinzunahme von Inhalten zu spezifischen Emotionsregulationsstrategien, die kognitive Verarbeitung der Schüler:innen in Bezug auf die vermittelten Inhalte stärken, sowie deren emotionale Verarbeitung abmildern lässt. Zudem wurde die Sozialform einer video-analytischen Arbeitsphase der Schüler:innen (Einzelarbeit vs. Kollaboration) variiert. Die Ergebnisse weisen darauf hin, dass kollaborative Arbeitsgruppen die kognitive und kritisch-reflexive Verarbeitung geschichtsbezogener 360°-Videos begünstigen. Das explizite Emotionsregulationsstrategien-Training führte während der Trainingsphase zu einer verstärkten Berücksichtigung emotionsbezogener Aspekte, hatte aber darüber hinaus keine weiteren Effekte. Zusammengenommen bieten die Beiträge wichtige Hinweise für den effektiven Einsatz von Videos in Lehr-Lern-Prozessen, indem sie differenzierte Befunde bieten, die sowohl die didaktische Gestaltung von Videos adressieren, als auch kontextuelle Merkmale wie z.B. die Förderung spezifischer Kompetenzen zur Rezeption von Videos in den Blick nehmen. Die Studien werden im Hinblick auf ihre Übertragbarkeit in schulische und außerschulische Lehr-Lern-Praxis, ihre Stärken und methodischen Limitationen diskutiert. Ebenso werden Anknüpfungspunkte für zukünftige Forschungsarbeiten herausgearbeitet. Beiträge des Symposiums Ein Talking Head als Abrufhinweis? Sichtbarkeit der Lehrperson in der Lern- und Testphase Christina Sondermann¹, Kim West², Hannes Schröter³, Martin Merkt¹ ¹Deutsches Institut für Erwachsenenbildung, Bonn, Germany, ²FernUniversität Hagen, Germany, ³Deutsches Institut für Erwachsenenbildung, Bonn, Germany & FernUniversität Hagen, Germany Theoretischer Hintergrund Das Einblenden einer Lehrperson in Lernvideos kann sowohl Vor- als auch Nachteile haben. Einerseits können soziale Hinweisreize im Lernmaterial gemäß der Social-Agency-Theory (Mayer, 2014a) soziale Reaktionen, eine vertiefte Verarbeitung und somit besseres Lernen auslösen. Andererseits kann die sichtbare Lehrperson laut des Kohärenz-Prinzips der Cognitive Theory of Multimedia Learning (Mayer, 2014a) zu kognitiver Überlastung führen. Die empirische Evidenz zu Lehrpersonen in Lernvideos ist heterogen (Henderson & Schroeder, 2021). Beispielsweise beobachten einige Studien lernförderliche Effekte (Pi & Hong, 2016), während andere keine (Kizilcec et al., 2014) oder lernhinderliche Effekte (Wilson et al., 2018) berichten. Auch für Maße wie soziale Präsenz oder Zufriedenheit ergibt sich ein heterogenes Befundbild (Sondermann & Merkt, 2023a,b). Eyetracking-Studien zeigen jedoch übereinstimmend, dass sichtbare Lehrpersonen häufig angesehen werden (Kizilcec et al., 2014). Bisherige Forschung konzentriert sich dabei aber vornehmlich auf in der Lernphase sichtbare Lehrpersonen. Offen bleibt, welchen Einfluss es hat, wenn Lehrpersonen (zusätzlich) in der Testphase sichtbar sind. Häufiges Ansehen der Lehrperson könnte dazu führen, dass die vermittelten Lerninhalte eng mit der Lehrperson verknüpft werden (Tulving & Thomson, 1973). So könnte ein Bild der Lehrperson in der Testphase als Hinweisreiz den Abruf von Informationen aus dem Video erleichtern. Bisherige Forschung zeigte bereits, dass dekorative Bilder aus der Lernphase den Abruf von Informationen in der Testphase verbessern konnten (Schneider et al., 2020). Fragestellung Unser Onlineexperiment untersucht die Effekte einer sichtbaren Lehrperson in Form eines Talking Heads (TH) in der Lernphase (in einem Lernvideo) und/oder in der Testphase (im anschließenden Wissenstest). Basierend auf bisheriger Forschung haben wir für Lernen (Abruf) eine Interaktion erwartet, indem der sichtbare TH nur dann lernförderliche Effekte hat, wenn er sowohl in der Lern- als auch in der Testphase sichtbar war, weil er so als Abrufhinweis den Abruf erleichtern kann. Explorative Analysen sollten außerdem potenzielle Effekte des TH in der Lernphase auf verschiedene Bewertungsmaße (z.B. soziale Präsenz, Zufriedenheit) untersuchen. Hypothesen, explorative Forschungsfragen sowie die Prozedur wurden präregistriert (https://aspredicted.org/FN7_3C2). Methode Im Rahmen eines 2x2-Between-Designs (Lernphase: TH vs. kein TH; Testphase: TH vs. kein TH) wurden die Teilnehmenden randomisiert einer der vier Bedingungen zugewiesen. Insgesamt sahen 161 Studierende (109 weiblich, 50 männlich, 1 divers, 1 keine Angabe, MAlter=33.32, SDAlter=11.84) vier Lernvideos zu verschiedenen Themen (z.B. Burkina Faso), die jeweils aus verschiedenen Folien bestanden. Dabei sahen die Lernenden entweder alle Videos mit TH, der die Inhalte vortrug, oder alle Videos ohne TH. Die Tonspur und die visuellen Lerninhalte in den Lernvideos waren jeweils komplett identisch. Als zweiter Faktor wurde variiert, ob beim Wissenstest neben dem jeweiligen Wissensitem ein Bild des TH zu sehen war oder nicht. Nach einer anfänglichen Selbstauskunft zu Vorwissen und Interesse bzgl. der vier Videothemen sahen die Lernenden die vier Lernvideos. Anschließen wurden verschiedene Bewertungsmaße (u.a. soziale Präsenz, Zufriedenheit) erfragt. Darauf folgte der Wissenstest, der aus 24 offenen Fragen (6 pro Thema) bestand und Fakten aus den Videos abfragte. Abschließend folgten Kontrollfragen und demografische Angaben. Ergebnisse und Diskussion Vorläufige Analysen zeigten keine vorab bestehenden Bedingungsunterschiede bzgl. Vorwissen und Interesse. Eine zweifaktorielle ANOVA zeigte außerdem weder Haupteffekte der Sichtbarkeit des TH während der Lern- und Testphase noch eine Interaktion hinsichtlich der Lernergebnisse, alle F<2.17. Auch auf Bewertungsmaße (z.B. soziale Präsenz, Zufriedenheit) hatte der in der Lernphase sichtbare TH keinen Einfluss, alle F<1. Folglich liefern unsere vorläufigen Ergebnisse keine Hinweise darauf, dass ein zusätzliches Einblenden der Lehrperson in der Testphase den Abruf von Informationen erleichtern kann. Die ausbleibenden Effekte auf Lernen und verschiedene Bewertungsmaße konnten die Ergebnisse einer früheren Studie mit ähnlichen Materialien (Sondermann & Merkt, 2023b) replizieren. Eine potenzielle Erklärung für die ausbleibenden Effekte könnte darin liegen, dass sich potenzielle positive Effekte der Lehrperson (sozialer Hinweisreiz, Abrufhinweis) und negative Effekte (kognitive Überlastung) gegenseitig aufgehoben haben. Straighten your back, open your arms! Wirkung der Körperhaltung einer Lehrperson auf Lernende Sören Traulsen, Lysann Zander Leibniz Universität Hannover, Germany Theoretischer Hintergrund Aktuelle Forschung zur Sichtbarkeit von Lehrpersonen in Erklärvideos betont die Wirkung von ‚Social Cues‘ (Mayer, 2014b) auf Lernende (Alemdag, 2022). So zeigen Studien, dass Lernleistungen durch Blickkontakt (Fiorella et al. 2019), Körperorientierung (Beege et al. 2017) und Gestik der Lehrperson (Dargue et al., 2019) beeinflusst werden können. Die Wirkung der Köperhaltung in Erklärvideos wurde unseres Wissens bisher nicht systematisch untersucht, obschon sie eine zentrale Komponente nonverbaler Kommunikation darstellt (Collier, 2021). Bisherige Forschung demonstriert positive Einflüsse von ‚High-Power-Posen‘ versus ‚Low-Power-Posen‘ auf die Wahrnehmung agentischer Merkmale wie Kompetenz und Dominanz (Abele & Yzerbyt, 2021; Rennung et al., 2016) und Sympathie (Waldron, 1975); sowie negative Einflüsse auf Mitleid (Rennung et al., 2016) und kommunale Eigenschaften (Abele & Yzerbyt, 2021). Körner und Schütz (2020) verweisen darauf, dass frühere Forschung zur Wirkung von Körperhaltungen durch uneinheitliche Differenzierungen geprägt ist. Dies berücksichtigend haben wir die Körperhaltung einer Lehrperson in einem Videotutorial bezüglich der Dimensionen Vertikalität (aufrecht/zusammengesunken) und Horizontalität (offen/geschlossen) variiert, um zu untersuchen, wie sich unterschiedliche Ausprägungen auf Lernende auswirken. Den Variationen entsprechend gab es eine ‚High-Power‘-Bedingung (aufrecht/offen), eine ‚Low-Power‘-Bedingung (zusammengesunken/geschlossen) sowie zwei unbestimmte Bedingungen (aufrecht/geschlossen; zusammengesunken/offen). Hypothesen Wir haben angenommen, dass eine aufrechte und offene Körperhaltung (versus einer zusammengesunkenen und geschlossenen) einen positiven Einfluss auf das Interesse (H1) und die Motivation (H2) von Studierenden hat. Wir haben erwartet, dass diese Effekte durch wahrgenommenen Enthusiasmus der Lehrperson mediiert werden (H1.1 und H2.1). Weiterhin haben wir angenommen, dass eine aufrechte (versus einer zusammengesunkenen) Körperhaltung einen ausgeprägteren Respekt der Studierenden erwirkt (H3) und dieser Effekt durch wahrgenommene Agency der Lehrperson mediiert wird (H3.1). Außerdem haben wir angenommen, dass eine offene (versus einer geschlossen) Körperhaltung zu einer ausgeprägteren Sympathie der Studierenden führt (H4) und dieser Effekt durch wahrgenommene Communion der Lehrperson mediiert wird (H4.1). Methode Nach einer randomisierten Zuordnung Studierender in eine der vier Experimentalbedingungen, in der sie eine Variation des Videotutorials sahen, wurden die Teilnehmenden gebeten, ihre Einschätzung hinsichtlich Themen-Interesse (Pawek, 2009), Themen-Motivation (Velayutham et al., 2011), Respekt und Sympathie gegenüber der Lehrperson (Wojciszke et al., 2009) sowie die Wahrnehmung der Lehrperson bezüglich Enthusiasmus (Kunter et al., 2008), Agency und Communion (Abele & Yzerbyt 2021) anzugeben. Die Stichprobe bestand aus 434 Studierenden unterschiedlicher Fachrichtungen (47.7% männlich, 51.2% weiblich, 1.2% divers; MAlter=24.5, SDAlter=4.21), die über www.prolific.com rekrutiert wurden. Das Experiment wurde präregistriert (Author & Author, 2023). Ergebnisse Zweifaktoriellen ANOVAs zeigten keine direkten Einflüsse der Dimensionen Vertikalität und Horizontalität auf Interesse und Motivation (H1 und H2). Respekt gegenüber der Lehrperson wurde durch Horizontalität beeinflusst, F(1, 430)=4.51, p=.028, η2=.011, nicht aber durch Vertikalität oder eine Interaktion beider Dimensionen (H3). Sympathie gegenüber der Lehrperson wurde durch Vertikalität, F(1, 430)=6,132, p=.014, η2=.014, Horizontalität, F(1, 430)=21.741, p<.001, η2=.048, und eine Interaktion beider Dimensionen, F(1, 430)=10.060, p=.002, η2=.023, beeinflusst (H4). Die Mediator-Variable wahrgenommener Enthusiasmus wurde durch Vertikalität, F(1, 430)=7.105, p=.008, η2=.016, Horziontalität, F(1, 430)=34.033, p < .001, η2 = .073, und eine Interaktion beider Dimensionen, F(1, 430) = 25.418, p<.001, η2=.056, beeinflusst. Gleiches galt für wahrgenomme Agency (Vertikalität: F(1, 430)=18.385, p<.001, η2=.041; Horizontalität: F(1, 430)=7.289, p=.007, η2=.017; Interaktion: F(1, 430)=4.927, p=.027, η2=.011) und Communion (Vertikalität: F(1, 430)=9.087, p=.003, η2=.021; Horizontalität: F(1, 430)=63.046, p<.001, η2=.128; Interaktion: F(1, 430)=16.161, p<.001, η2=.036). Kontrast-Analysen bezüglich aller Effekte zeigten, dass die ‚Low-Power‘-Bedingung jeweils zu den geringsten Bewertungen führte, während Gruppenunterschiede zwischen den anderen Bedingungen uneindeutiger waren. Analysen bestätigten alle Mediations-Hypothesen, gleichwohl direkte Effekt teilweise ausblieben (H1, H2 und H3). Diskussion Die Ergebnisse betonen die Wirkungen von Körhaltungen als ‚Social Cues‘ in Erklärvideos. Insbesondere die Abwesenheit einer ‚Low-Power-Pose‘ scheint zu positiven Effekten zu führen (Elkjær et al., 2022). Wir diskutieren die Ergebnisse bezüglich möglicher Geschlechter-Effekte (Hoogerheide et al., 2018) und Suppressor-Effekten bei den Mediations-Analysen (Rucker et al., 2011). Auswirkungen von Emotionsregulation und Kollaboration auf den Umgang mit geschichtsbezogenen 360°-Videos Valentina Nachtigall, Selina Yek, Nikol Rummel Ruhr-Universität Bochum, Germany Geschichtsbezogene Virtual Reality (VR) Medien, wie 360°-Videos, werden zunehmend entwickelt (Bunnenberg, 2020). Die ZDF History 360° Reihe verspricht beispielsweise “eine virtuelle Reise zu historischen Orten” (https://history360.zdf.de/). Das virtuelle Time&History Museum möchte mit VR-Dokumentationen, wie dem Führerbunker, Anwendern ermöglichen, “Geschichte hautnah erleben” zu können (https://nordxr.de/fuehrerbunker-vr-de/). Auch auf YouTube sind zahlreiche geschichtsbezogene 360°-Videos frei verfügbar. Obwohl solche VR-Medien von Bildungspolitikern als innovative Ansätze für den Geschichtsunterricht angepriesen werden (Schulministerium NRW, 2021), können geschichtsbezogene VR-Medien aufgrund ihrer immersiven Merkmale und emotionalisierenden Darstellung der Inhalte herausfordernd für Lernende sein (Bunnenberg, 2018). So besteht die Gefahr, dass Lernende die Inhalte eher emotional als kognitiv verarbeiten (Parong und Mayer, 2021). Um einer emotionalen Überwältigung (Brauer, 2019) zu begegnen, zeigten sich in einer Vorstudie der Autor:innen erste positive, jedoch weiter ausbaubare Effekte eines Strategietrainings auf die Nutzung kognitiver Strategien (z.B. Inhalt zusammenfassen) bei der Verarbeitung geschichtsbezogener 360°-Videos. Die vorliegende Studie untersucht, ob sich eine stärker kognitive und weniger emotionale Verarbeitung der Videos noch besser unterstützen lässt, wenn Schüler:innen ein Strategietraining erhalten, welches sowohl kognitive Strategien als auch Emotionsregulationsstrategien (z.B. Aufmerksamkeitsstrategien zur Fokussierung auf nicht emotionale Aspekte; McRae & Gross, 2020) vermittelt. Da Emotionsregulation sowohl die Regulation eigener Emotionen als auch die anderer umfassen kann (McRae & Gross, 2020), könnte eine gemeinsame Verarbeitung geschichtsbezogener 360°-Videos womöglich besonders förderlich sein. Bisherige Befunde zu Effekten des Co-Viewings (Zillich, 2014, Tal-Or, 2016) und zur Wirksamkeit kollaborativen Lernens (Nokes-Malach, 2015) sind jedoch inkonsistent. Daher soll zudem exploriert werden, wie sich eine kollaborative Videoanalyse auf die Verarbeitung auswirkt. Methode: 157 Schüler:innen aus zehn Schulklassen der Jahrgangsstufen 11 und 12 nahmen an einer experimentellen Studie im 2x2 Design mit Gruppen-Randomisierung auf Klassenebene in einem universitären Schülerlabor teil. Variiert wurden die Trainingsart (kognitive Strategien & Emotionsregulationsstrategien vs. nur kognitive Strategien) und die Sozialform (kooperativ vs. individuell). Am Tag des Experiments analysierten Schüler:innen zunächst ein geschichtsbezogenes 360°-Video in Kleingruppen oder Einzelarbeit. Darauf folgte das Strategietraining mit einer Instruktions- und Übungsphase. Die Instruktion vermittelte die Funktion von nur kognitiven Strategien oder zusätzlich Emotionsregulationsstrategien für das Analysieren geschichtsbezogener 360°-Videos. Während der Übung wendeten die Schüler:innen in Kleingruppen- oder Einzelarbeit die Strategien mithilfe einer Checkliste für die Korrektur ihrer eingangs erstellten Videoanalysen an. Nach dem Training analysierten die Schüler:innen ein zweites 360°-Video in Einzelarbeit. Die vor, während und nach dem Training angefertigten schriftlichen Videoanalysen der Schüler:innen wurden mit Blick auf inhalts- und medienbezogene (z.B. Medium charakterisieren), aufgabenbezogene (z.B. Schlussfolgerungen ziehen), reflexive-evaluative (z.B. distanzierte Beschreibung des Eintauchens) sowie emotionsbezogene Aspekte (z.B. Emotionen beschreiben) analysiert. Zwei Rater kodierten 100% der Daten und erreichten vor der Diskussion ihrer Unstimmigkeiten eine zufriedenstellende Übereinstimmung für alle Codes (κ = 0.72 - 1.0). Ergebnisse und Diskussion: Vor dem Training wiesen die Analysen von Kleingruppen mehr aufgabenbezogene (BF10 = 1,11) sowie reflexive-evaluative (BF10 = 1,64) Elemente auf als die in Einzelarbeit angefertigten Analysen. Unter den instruktionalen Bedingungen der Übung führte Kollaboration zu einer verstärkten Berücksichtigung von inhalts- und medienbezogenen (BFincl = 2,54) sowie aufgabenbezogenen (BFincl = 2,11) Aspekten. Zusammengenommen sprechen diese Ergebnisse (von Bayesian ANOVAs) für zwar kleine, aber positive Effekte von Kollaboration auf die kognitive und vor allem auch kritisch-reflektierte Verarbeitung geschichtsbezogener 360°-Videos. Nach dem Training zeigte sich ein Effekt von vorheriger Kollaboration auf einen erhöhten Einbezug emotionsbezogener Elemente (BF10 = 1,32). Dies könnte auf eine zuvor erfahrene soziale Akzeptanz emotionaler Reaktionen zurückzuführen sein. Das Training mit Emotionsregulationsstrategien führte lediglich unter instruktionalen Bedingungen zu einer verstärkten Berücksichtigung emotionsbezogener Elemente (BFincl = 8,74). Demnach führte das Training mit Emotionsregulation zu einer erhöhten Aufmerksamkeit auf emotionale Aspekte des Videos und dessen Wirkung (und dies nur während des Trainings), jedoch nicht zu einer stärkeren (im Vergleich zum Training mit nur kognitiven Strategien) Umlenkung dieser Aufmerksamkeit auf nicht-emotionale Aspekte.
10:30 - 12:10	1-06: Inklusion von Kindern im Autismus-Spektrum in den Unterricht Ort: H08
	Symposium Inklusion von Kindern im Autismus-Spektrum in den Unterricht Chair(s): Charlotte Dignath (TU Dortmund, Deutschland), Gerrit Hasche (DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation) Diskutantin(nen): Nadine Spörer (Universität Potsdam) Die Forschung und der Diskurs um Autismus haben sich in den letzten Jahren stark gewandelt. Unter anderem der Verständniswandel von Autismus als einem recht eng gefassten Störungsbild hin zu einem weit gefassten Spektrum an neurologischer Variation führte zu einer stark ansteigenden Anzahl an Kindern, die in dieses Spektrum fallen (Gómez-Marí et al., 2022). Für Deutschland liegen zwar keine aktuellen Zahlen vor, es ist jedoch davon auszugehen, dass die Prävalenz von 1% (Theunissen & Sagrauske 2019) mittlerweile überholt und somit weit über 800.000 Personen in Deutschland im Autismus-Spektrum zu verorten sein dürften. Mehrere Untersuchungen legen dementsprechend nahe, dass auch die Zahl an Kindern im Autismus-Spektrum steigt, die von ihrem Recht Gebrauch machen, eine Regelschule zu besuchen. Ihre persönliche und schulische Entwicklung gestaltet sich dabei jedoch nicht so gut, wie man vermuten würde (Wittwer, 2022). Der in der ICD-10 und der aktuellen DSM-5 noch immer verwendete „Störungs“-Begriff lässt oftmals den Fehler dafür bei dem autistischen Kind vermuten. Doch sind es weniger die akademischen Anforderungen, die zu den schlechteren Leistungen führen, als vielmehr Herausforderungen bei der Bewältigung, bspw. durch Probleme bei der Arbeitsorganisation oder der sozialen Interaktion und Kommunikation mit Mitschülerinnen und der Lehrkraft (Knorr, 2014). So können Wahrnehmungsbesonderheiten dazu führen, dass autistische Kinder abgelenkt werden und der Lehrkraft nicht in der gleichen Weise folgen können wie Kinder ohne diese Barrieren. Das führt dazu, dass autistische Kinder etwa nur die Hälfte der Zeit im Unterricht kognitiv aktiviert sind (van der Steen et al., 2020). Es gibt viele verschiedene Ansätze, die untersuchen, wie eine „autismusfreundliche Schule“ gestaltet werden kann. Es geht dabei vor allem um die Frage, wie die individuellen Barrieren der autistischen Kinder reduziert werden können und sie somit keinen Bildungsnachteil erfahren, sowie um die Professionalisierung von Lehrkräften (vgl. Berdelmann et al., 2021). In diesem Symposium sollen aktuelle Projekte vorgestellt und besprochen werden, die aktiv an diesen Zielen arbeiten. Hierzu bietet das Symposium eine Sammlung von Papern, in denen sowohl die Barrieren für autistische Lernende untersucht werden, als auch die professionelle Kompetenz von Lehrkräften untersucht und gefördert werden sollen. Im ersten Beitrag werden mögliche Barrieren der Inklusion autistischer Kinder im Unterricht psychometrisch identifiziert. Im zweiten Beitrag werden solche Barrieren im Schulalltag mithilfe der Experience Sampling Methode gemessen. Der dritte Beitrag untersucht die Rolle der Lehrkraft bei der Bewältigung dieser Barrieren, indem erfasst wird, welche professionellen Kompetenzen Lehrkräfte zu diesem Thema mitbringen. Der vierte Beitrag stellt abschließend eine Intervention dar, um die Stereotype von angehenden Lehrkräften ggb. Kindern mit Autismus zu reduzieren. Beiträge des Symposiums Die psychometrische Erfassung von Barrieren in der Inklusion autistischer Schüler:innen Sabine Schwager¹, Michel Knigge¹, Stephanie Fuhrmann², Lukas Gerhards³, Jochen Kleres¹, Vera Moser³, Mark Benecke² ¹Humbold-Universität zu Berlin, ²White Unicorn e.V., Berlin, ³Goethe-Universität Frankfurt Theoretischer Hintergrund Für eine förderliche Gestaltung des schulischen Alltags ist es hilfreich, die Voraussetzungen aller Schüler:innen zu kennen und zu berücksichtigen. Für ein inklusives Arbeiten ist die Kenntnis individueller Barrieren hier entscheidend (vgl. Boban & Hinz, 2009). Sensorische Barrieren, die insbesondere bei autistischen Schüler:innen Lernen und Teilhabe beeinträchtigen oder sogar zu Zusammenbrüchen führen können, sind nicht ohne weiteres erkennbar und werden oft erst durch Eskalationen deutlich (z.B. Theunissen & Sagrauske, 2019). Fragestellung Ziel des vorgestellten Projekts ist es, ein leicht nutzbares Tool zu entwickeln, mit dessen Hilfe Lehrkräfte potenzielle sensorische Barrieren identifizieren und ihnen entgegenwirken können. Methode In mehreren Schritten (drei Vorstudien, n gesamt = 1500, qualitativ und quantitativ) wurde ein psychometrischer Fragebogen aus 50 Items entwickelt, in dem Schüler:innen angeben, wie sehr sie bestimmte Situationen beeinträchtigen würden. Der Bogen wurde in drei Bundesländern in 1., 5. und 7. Klassen eingesetzt (n = 1092), um seine Validität und psychometrischen Eigenschaften zu untersuchen sowie in den beteiligten Schulen Prozesse der Barrierenreduktion zu initiieren. Parallel dazu wird eine Handreichung erarbeitet, die Lösungsansätze aus der Literatur, der autistischen Community und von pädagogischen Fachkräften bündelt. Ergebnisse Die quantitativen Ergebnisse zeigen, dass das mittlere Risiko, Situationen als stark beeinträchtigend zu erleben, für autistische Teilnehmer:innen signifikant größer ist als für nicht-autistische Teilnehmer:innen. Weiterhin zeigen autistische wie nicht-autistische Kinder ein ähnliches Profil in den Bewertungen. Faktorenanalytisch lassen sich die ursprünglich qualitativ identifizierten 25 Barrieren bei sehr guter Reliabilität acht Bereichen zuordnen, in denen es zu Überlastung kommen kann. Die Workshops mit den Lehrkräften der beteiligten Schulen machten einerseits ein generell großes Interesse an der Thematik und andererseits stark variierende Grade an Reflexion und Offenheit für die Reduktion sensorischer und sozialer Lernbarrieren deutlich. Diskussion und Implikationen für Theorie und Praxis Potenzielle sensorische und soziale Barrieren lassen sich mit dem vorliegenden Instrument hinreichend reliabel und valide erfassen, um Lehrkräfte beim Kennenlernen ihrer Schüler:innenschaft und der Individualisierung ihres Vorgehens zu unterstützen. Unabhängig von klinischen Diagnosen oder Symptomen (vgl. SchAUT, 2021) ist es mit Hilfe des Barrierenbogens möglich, Schlussfolgerungen für eine inklusive Alltags- und Umfeldgestaltung abzuleiten. Das Instrument in Verbindung mit der Handreichung ist geeignet, zu Fortbildungen und Schulentwicklungsprozessen beizutragen, die ein inklusiveres Lernumfeld anstreben. Insbesondere autistische Schüler:innen, aber auch alle anderen können von der Berücksichtigung und Reduktion sensorischer und sozialer Barrieren im Schulalltag profitieren. Welche Barrieren erleben autistische Kinder in der Schule? Die Entwicklung einer App zur Identifizierung individueller Barrieren Theresa Serratore, Kathrin Berdelmann, Florian Schmiedek DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Frankfurt Theoretischer Hintergrund Während die Prävalenz von Autismus in den letzten Jahren gestiegen ist (Bachmann et al., 2018), ist das Wissen darüber in Deutschland noch wenig entwickelt. Dies ist insbesondere im Hinblick auf das deutsche Schulsystem der Fall. Lehrkräften fehlt es an Wissen und Ressourcen für eine autismussensible Beschulung (Lindmeier, 2018; Theunissen & Sagrauske, 2019). Autistische Kinder erleben eine Reihe an autismusspezifischen Barrieren in Regelschulen. Dazu gehören Überempfindlichkeiten in verschiedenen sensorischen Bereichen oder Ereignisse, die von der üblichen Routine abweichen (Bailey & Baker, 2020). Eine zentrale Herausforderung für die Inklusion autistischer Kinder ist daher die Identifizierung und der Abbau autismusspezifischer Barrieren in der Schule. Barrieren wurden in der existierenden Forschung hauptsächlich aus der Perspektive von pädagogischen Fachkräften (z.B. Stephenson et al., 2012) und Eltern untersucht (z.B. Falkmer et al., 2015). Nur wenige Studien haben bisher die Perspektive der Kinder selbst einbezogen. Diese zeigen allerdings, dass die von Eltern und pädagogischen Fachkräften berichteten Probleme nicht unbedingt mit denen der Kinder berichteten übereinstimmen (z.B. Saggers et al., 2015). Da Barrieren, wie sensorische Besonderheiten, individuell und kontextabhängig sind (Fernández-Andrés et al., 2015; Theunissen & Sagrauske, 2019), ist davon auszugehen, dass es für Lehrkräfte schwierig ist, diese zuverlässig zu identifizieren. Ziele der Studie In diesem Beitrag wird eine Pilotstudie präsentiert, deren Ziel es war, individuelle Barrieren, die im Schulkontext auftreten, mittels der Experience-Sampling-Methodik zu erfassen. Es sollten erste Erkenntnisse darüber erlangt werden, wie häufig bestimmte Barrieren in der Regelschule bei autistischen und nicht-autistischen Kindern auftreten und wie sich Kinder in der Häufigkeit und der Bandbreite berichteter Barrieren voneinander unterscheiden. Weiterhin stellte sich die Frage, inwiefern Lehrkräfte aufgetretene Barrieren als solche identifizieren können. Außerdem wurde die technische und praktische Umsetzbarkeit überprüft. Methode Es nahmen insgesamt 48 autistische und nicht-autistische Kinder (6 autistisch, 15 Mädchen) an der Pilotstudie teil. Die Kinder besuchten die vierte bis sechste Klasse und waren zwischen 9 und 13 Jahren alt (MW=10.52, SD=0.87). Zusätzlich nahmen noch die jeweiligen Lehrkräfte teil (N=4). Die Studie bestand aus einer Einführungsveranstaltung in der Schule, einer zweiwöchigen Phase mit einer täglichen Befragung über Studien-Smartphones für Kinder und Lehrkräfte sowie einem Feedback-Fragebogen. Die Barrieren umfassten die Kategorien auditive, visuelle und taktile Wahrnehmung, Geruch und Geschmack, Unvorhersehbarkeit von Ereignissen sowie Sonstiges (White Unicorn e.V., 2018). Ergebnisse Die deskriptive Auswertung der Daten zeigte, dass an 39.1% der Tage Barrieren auftraten. Barrieren, die der Kategorie Sonstiges zugeordnet wurden, traten am häufigsten auf, gefolgt von Barrieren aus dem auditiven Bereich, Barrieren, die Geruch und Geschmack betreffen und Barrieren aus dem taktilen Bereich. Barrieren aus dem visuellen Bereich traten im Gegensatz zu den anderen Barrierebereichen am seltensten auf. Die Kinder unterschieden sich darin, wie viele und welche Barrieren sie angaben und wie stark sie diese als störend empfunden. Die Ergebnisse deuten darauf hin, dass das Erfassen individueller Barrieren im Schulalltag mit Hilfe von smartphone-basierten Befragungen, einen vielversprechenden Ansatz darstellt. Darauf aufbauend sollen empirische Erkenntnisse über Zusammenhänge mit subjektivem Wohlbefinden und Unterschiede in der Stärke dieser Zusammenhänge gewonnen werden. Ziel ist die Entwicklung eines Prototyps einer App, welcher von Lehrkräften und ihren Kindern genutzt werden kann, um die Identifizierung von Barrieren zu unterstützen. Entwicklung eines Self-Assessment-Tools für pädagogisches Personal Nick Gerrit Hasche¹, Charlotte Dignath², Mareike Kunter¹ ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Frankfurt, ²TU Dortmund Theoretischer Hintergrund Für die individuelle Entwicklung und den schulischen Erfolg von autistischen Kindern ist nach Jordan (2019) vor allem ihr sozio-emotionales Wohlbefinden von Bedeutung. Um zum Wohlbefinden beizutragen, ist ein autismussensibles Verhalten der Lehrkraft notwendig. Eckert und Sempert (2013) fassen in Ihrem Rahmenmodell der schulischen Förderung von Kindern im Autismus-Spektrum acht verschiedene Kernbereiche aus der aktuellen Debatte zusammen, die einen zentralen Beitrag leisten sollen, um den Unterricht entsprechend zu gestalten. Die Anforderungen, die darin an die Lehrkraft gestellt werden, lassen sich gut in die Kompetenzbereiche Wissen, Motivation und Überzeugungen zusammenfassen, die nach dem COACTIV-Modell von Kunter et al. (2011) wesentliche Aspekte professioneller pädagogischer Kompetenz von Lehrkräften darstellen. Fragestellung/ Projektvorhaben Im Teilprojekt 3 von INCLASS – Inklusion von Kindern im Autismus-Spektrum in der Schule adaptieren wir das COACTIV-Modell für den Bereich der autismussensiblen Beschulung und entwickeln ein Self-Assessment Tool, das Lehrkräften und pädagogischem Personal bei der Einschätzung der eigenen Kompetenzen in diesem Bereich helfen soll. Ziel ist es, dass die Nutzenden des Assessments individuelles Feedback zu ihrer professionellen Kompetenz bzgl. der inklusiven Beschulung von autistischen Kindern erhalten. Dieses Feedback sollen Lehrkräfte nutzen können, um eigenständig zu entscheiden, in welchen Bereichen sie noch Fortbildungsbedarf haben. Methoden Bei der breit angelegten Recherche haben wir systematisch nach bereits validierten Tests bzw. Fragebögen gesucht, die einen oder mehrere der Kompetenzbereiche Wissen, Einstellung und Motivation erfassen. Nach einem ersten Selektionsprozess blieben von den anfänglich über 10.000 Ergebnissen 91 übrig, die genauer untersucht wurden. Für unser Assessment haben wir schließlich 6 Instrumente ausgesucht, die bereits in der Wissenschaft verwendet und validiert wurden, haben sie übersetzt und für den deutschen Kontext angepasst. In einigen Fällen wurden zusätzliche Items von uns konstruiert. Für den Bereich des Wissens über autismussensible Unterrichtsstrategien konnte kein bestehendes Instrument gefunden werden, so dass wir an dieser Stelle einen eigenen Test konstruiert haben. Das komplette Instrument mit über 180 Items wurde zunächst einer inhaltlichen Validierung (N = 15 Lehrkräfte mit viel Erfahrung im Unterrichten von autistischen Kindern) unterzogen und nach einer ersten Überarbeitung mit N = 129 Lehramtsstudierenden pilotiert. Ein Teil dieser Lehramtsstudierenden (N = 78) hat nach dem ersten Ausfüllen des Self-Assessments ein digitales Modul zum Thema Autismus bearbeitet. Nach einer Woche wurde das Self-Assessment mit beiden Gruppen wiederholt (Kontrollgruppe: N = 51). Mit den Daten aus dieser Piloterhebung wird geprüft, ob das Assessmentinstrument die theoretisch angenommenen Kompetenzaspekte valide und reliabel erfassen kann. Zudem wird untersucht, ob das Assessmentinstrument veränderungssensitiv ist, indem es Veränderungen des Wissens, der Einstellung oder der Motivation der Lehramtsstudierenden nach der Bearbeitung des digitalen Moduls zum Thema Autismus abbilden kann. Ergebnisse Erste Analysen zeigen, dass das Assessmentinstrument eine zufriedenstellende Reliabilität und Validität aufweist. So spricht eine erste Testung mit der Methode der bekannten Gruppen für die Kriteriumsvalidität des Instruments. Danach verfügen Lehramtsstudierende aus dem Bereich des Förderschullehramts und Lehramtsstudierende, die sich privat mit dem Thema Autismus befasst haben, über mehr Wissen und eine höhere Motivation als die anderen Lehramtsstudierenden. Eine Untersuchung der Veränderungssensitivitäten weist zudem darauf hin, dass ein Wissenszuwachs bei den Studierenden, die das digitale Modul bearbeitet haben, gemessen werden kann. Diese und weitere psychometrische Kennwerte bzgl. Validität und Reliabilität des Instruments aus der ersten Pilotierung liegen bis zum Zeitpunkt der Konferenz vor und sollen bei diesem Vortrag vorgestellt und diskutiert werden. „Viele autistische Menschen haben eine Inselbegabung!“ – Können solche Fehlvorstellungen bei Lehramtsstudent:innen durch Refutationstexte reduziert werden? Jörg Wittwer, Elisabeth Reichle, Thamar Voss, Lena Wimmer Universität Freiburg Theoretischer Hintergrund Dass viele autistische Menschen eine Inselbegabung haben, ist ein Beispiel für eine häufig vorkommende Fehlvorstellung über Autismus. Solche Fehlvorstellungen können zur Stigmatisierung autistischer Personen beitragen. Besonders im Schulkontext können sie Lehrer:innen daran hindern, autistische Schüler:innen im Unterricht erfolgreich zu inkludieren. Deshalb ist es wichtig, Fehlvorstellungen über Autismus zu reduzieren. Bislang gibt es jedoch kaum Studien zu Interventionen, die speziell Fehlvorstellungen über Autismus adressieren. Eine zum Abbau von Fehlvorstellungen grundsätzlich geeignete Interventionsart ist die Verwendung von Refutationstexten. Refutationstexte benennen explizit eine Fehlvorstellung zu einem Sachverhalt und kontrastieren sie mit wissenschaftlich richtigen Informationen über diesen Sachverhalt. Die Wirksamkeit von Refutationstexten wird theoretisch damit erklärt, dass durch die Kontrastierung der Fehlvorstellung mit wissenschaftlich richtigen Informationen ein kognitiver Konflikt ausgelöst wird, der zum Abbau der Fehlvorstellung führt. Dabei wird angenommen, dass Fehlvorstellungen nicht einfach durch wissenschaftlich richtige Informationen ersetzt werden, sondern Fehlvorstellungen im Gedächtnis als Inhalte erhalten bleiben, deren Aktivierung aber unwahrscheinlicher wird. Inwieweit Refutationstexte dazu beitragen können, speziell Fehlvorstellungen über Autismus zu reduzieren, wurde in der Forschung bislang nicht geprüft. Fragestellung Wir untersuchten, ob Refutationstexte Lehramtsstudent:innen darin unterstützten, (1) ihre Fehlvorstellungen über Autismus abzubauen, (2) die Sicherheit, mit der sie richtige Vorstellungen über Autismus hatten, zu erhöhen und (3) Autismus positiver wahrzunehmen. Methode An unserer Studie nahmen N = 31 Lehramtsstudent:innen teil. Die Ausprägung ihrer möglichen Fehlvorstellungen über Autismus wurde in den Bereichen (1) Kognitive Fähigkeiten, (2) Lernstil und (3) Soziale Kompetenzen mit jeweils fünf Aussagen auf einer fünfstufigen Skala von 1 (stimme vollkommen zu) bis 5 (stimme gar nicht zu) vor und nach dem Lesen eines Refutationstexts erhoben. Wurde den Aussagen mit einem Wert von höchstens 3 zugestimmt, wurde dies als Vorhandensein einer Fehlvorstellung betrachtet. Es wurde auf einer fünfstufigen Skala von 1 (nicht sicher) bis 5 (sicher) auch erfasst, wie sicher sich die Lehramtsstudent:innen in ihren Antworten waren. Der Refutationstext stellte zu jedem der drei Bereiche Fehlvorstellungen (= Irrglauben) zusammen mit einer Begründung für ihr Vorhandensein (= Trugschluss) dar und kontrastierte sie mit wissenschaftlich richtigen Informationen (= Fakt). Nach dem Lesen des Refutationstexts wurde zudem die im Nachhinein eingeschätzte Änderung in der Wahrnehmung von Autismus auf einer fünfstufigen Skala von 1 (negativer) bis 5 (positiver) erfasst. Ergebnisse Häufigkeitsanalysen zeigten, dass die Lehramtsstudent:innen vor dem Lesen des Refutationstexts bei der Mehrheit der Aussagen in allen drei Bereichen eine Fehlvorstellung aufwiesen. Die t-Tests für abhängige Stichproben deckten auf, dass die Fehlvorstellungen in allen drei Bereichen nach dem Lesen des Refutationstexts signifikant geringer als vor dem Lesen des Refutationstexts ausgeprägt waren. Die gefundenen Effekte waren je nach Bereich mittel bis stark. Auch stieg die Sicherheit, mit der die Lehramtsstudent:innen den Aussagen zustimmten, nach dem Lesen des Refutationstexts signifikant an. Wie ein t-Test für Einstichproben bestätigte, schätzten Lehramtsstudent:innen ihre Wahrnehmung von Autismus durch das Lesen des Refutationstexts im rückblickenden Vergleich signifikant positiver ein. Diskussion Die Ergebnisse der Studie zeigen, dass Refutationstexte erfolgreich dazu beitragen, Fehlvorstellungen über Autismus bei Lehramtsstudent:innen zu reduzieren. Gleichzeitig kann durch Refutationstexte das eigene Vertrauen in die Richtigkeit der Vorstellungen über Autismus erhöht werden. Auch wird die Wahrnehmung von Autismus im rückblickenden Vergleich positiver eingeschätzt. Trotz der nachgewiesenen Wirksamkeit von Refutationstexten zur Reduktion von Fehlvorstellungen über Autismus lehnten Lehramtsstudent:innen manche Aussagen, die Fehlvorstellungen darstellten, auch nach dem Lesen des Refutationstexts nicht vollständig ab. Deshalb erscheint es notwendig, Refutationstexte hinsichtlich ihrer Wirksamkeit zu optimieren und auch andere Arten von Interventionen zum Abbau von Fehlvorstellungen zu verwenden. Die Ergebnisse der Studie sollen mit einer größeren Stichprobe, mit optimierten Refutationstexten und mit Fehlvorstellungen zu weiteren Themenbereichen repliziert werden.
10:30 - 12:10	1-07: "Ach, das bist du!" - Perspektiven auf gelingende Transferprozesse zwischen Wissenschaft und Praxis im Kontext der Digitalisierung Ort: S18
	Offenes Beitragsformat "Ach, das bist du!" - Perspektiven auf gelingende Transferprozesse zwischen Wissenschaft und Praxis im Kontext der Digitalisierung Lara Halbrock¹, Anne Woltmann², Lisa Sellge², Vanessa Pieper³, Torben Bennink¹, Christian Jäntsch¹, Julia Jennek¹ ¹Universität Potsdam, Deutschland; ²Forum Bildung Digitalisierung; ³Bergische Universität Wuppertal Die digitale Transformation von Schule und Unterricht hält zahlreiche Herausforderungen für Lehrkräfte (Scheiter, 2021) und Entscheidungsträgerinnen im Bildungssystem (McCarthy et al., 2023) bereit und nimmt auch die Bildungsforschung in die Pflicht, Erkenntnisse über digitalisierungsbezogene Lehr-Lernprozesse für den Transfer in Bildungspraxis bereitzustellen. Transfer kann (aus bildungswissenschaftlicher Perspektive) als „Verbreitung wissenschaftlich fundierter Innovationen im Bildungswesen“ (Gräsel, 2010, S. 7) verstanden werden. Holtappels (2019) betont ergänzend, dass Transfer aber auch ein interaktiver* Prozess ist, bei dem die Übertragung bestimmter innovativer Ansätze „in kommunikativer Weise“ (S. 276) erfolgt. Transferprozesse betreffen diverse beteiligte Akteurinnen in unterschiedlichem Maße und unterschiedlicher Art und Weise – auch und speziell im komplexen Prozess des digitalen Wandels (Endberg et al., 2022). Neuere Ansätze gehen davon aus, dass die partizipative Begleitung und Weiterentwicklung von Innovationsprozessen über einen ko-konstruktiven Aushandlungsprozess erreicht werden kann, in dessen Rahmen „Akteure unterschiedlicher Bezugssysteme gleichermaßen an der Lösung eines Bildungsanliegens […] zusammenarbeiten“ (Kerres et al., 2022, S. 1). Der Kompetenzverbund lernen:digital* unterstützt eine solche Weiterentwicklung in der digitalen Schulentwicklung und digitalisierungsbezogenen Lehrkräftebildung. In vier Kompetenzzentren werden dazu Erkenntnisse aus rund 180 Forschungs- und Entwicklungsprojekten zu je spezifischen Themenfeldern gewonnen und gebündelt. Eine Transferstelle unterstützt über einen systematischen Dialog zwischen Stakeholdern im Mehrebenensystem des Bildungswesens die nachhaltige Implementierung in das System Schule. Ziel des vorliegenden Beitrages ist es zum einen, verschiedene Akteurinnen, welche die digitale Transformation adressieren bzw. durch diese adressiert sind, zu identifizieren und in Beziehung zueinander zu setzen. Dazu soll zum anderen erreicht werden, mögliche Perspektiven auf deren Handlungslogiken sicht- und erlebbar zu machen („Ach, das* bist du!“), um ein akteurinnentheoretisch begründetes Verständnis über Kommunikations- und Kooperationsprozesse im Kontext der digitalen Transformation des Bildungswesens aufzubauen. Schließlich sollen Logiken und Erfahrungen der Dialoggestaltung im Kompetenzverbund lernen:digital* abgebildet werden. Aus governance-theoretischer Perspektive (Altrichter & Maag Merki, 2016) unterliegen die verschiedenen Bezugssysteme spezifischen Eigenlogiken, die eine schlichte Übertragung von Erkenntnissen von einem in den anderen Kontext unmöglich machen (Cooper et al., 2019, Rolff, 2016). Missverständnisse über die eingenommenen Rollen sowie damit zusammenhängende Möglichkeiten und Grenzen können Transferprozesse zwischen diesen Akteurinnen entscheidend behindern (Farrell et al., 2019). Insbesondere die Verantwortlichkeit gegenüber der Innovation von Bildungsprozessen ist als kritisches Spannungsfeld zwischen den unterschiedlichen Perspektiven Praktizierender und Forschender sowie Vertreterinnen der Bildungsadministration anzusehen (Cooper et al., 2019). Dies lässt eine bewusste Perspektivübernahme gewinnbringend erscheinen, in deren Rahmen die beteiligten Akteurinnen die Verantwortlichkeiten und Erwartungen reflektieren und diskutieren können. Damit können „die Differenz der Sichten, Interessen und Handlungslogiken der Akteure von Bildungsforschung und -praxis in den Vordergrund“ (Kerres et al., 2022, S. 12) gestellt, gleichzeitig aber auch produktiv bearbeitet werden. Die Perspektivübernahme kann nachweislich die Kreativität in heterogenen Arbeitsgruppen erhöhen, indem sie eine ausführlichere Erläuterung von Ideen und das gegenseitige Verständnis begünstigt (Hoever et al., 2012). Es erscheint sinnvoll, in einem derlei komplexen Beziehungsgefüge zwischen verschiedenen Stakeholdern von bildungsbezogenen Innovationen zu vermitteln. Mit dem Knowledge Brokering ist eine ebensolche Vermittlungsarbeit umschrieben (Cooper et al., 2019). Über die bloße Weitergabe von (Forschungs-) Wissen hinaus besteht die Rolle von so genannten Knowledge Brokerinnen zuvorderst darin, Beziehungen zwischen den verschiedenen Stakeholdern aufzubauen sowie Netzwerke und sonstige Kollaborationen zu unterstützen. Das erfordert ein solides Verständnis von Forschung, ein Bewusstsein für die Bedürfnisse und Befindlichkeiten der beteiligten Akteurinnen sowie einen profunden Blick für systemische Zusammenhänge. Mithin bezeichnen Cooper et al. (2019) die Aufgaben von Brokerinnen als „incredibly demanding work“ (S. 95). All die genannten Aspekte werden im offenen Beitragsformat aufgegriffen. In einem ersten Schritt wird eine Stakeholderanalyse vorgestellt: Um die Akteurskonstellationen in den verschiedenen Bezugssystemen sowie die in ihnen aufscheinenden „unterschiedlichen Beteiligungs- und Einflusschancen“ (Altrichter & Maag Merki, 2016, S. 9) beschreiben und analysieren zu können, haben wir in einem ersten Schritt eine systematische Stakeholderrecherche anhand öffentlich zugänglicher Dokumente in den einzelnen Bundesländern durchgeführt. Deren Zwischenergebnisse möchten wir im Sinne von „Informationslandschaften“ (Krempel 2005, S. 196; zitiert nach Kolleck, 2014, S. 174) als Ausgangspunkt der weiteren Schritte visualisieren. Auf der Grundlage der Mehrebenenstruktur des Bildungswesens im Kontext der Digitalisierung (Breiter et al., 2021, S. 4f.) unterscheiden wir dabei in einer ersten Heuristik in administrative Ebene (Land), administrative Ebene (Kommune), wissenschaftliche Ebene (Land) und zivilgesellschaftliche Ebene (Land oder länderübergreifend). Aufbauend auf den Ergebnissen der Stakeholderrecherche sollen in einem zweiten Schritt spezifische Handlungslogiken erarbeitet werden: Um ein kohärentes Verständnis für die jeweiligen Handlungslogiken aufzubauen, sollen in einer gemeinsamen Erarbeitungsphase Prozesse der Perspektivübernahme angeregt werden. In Anlehnung an Elemente der Design Thinking-Methodik (Chon & Sin, 2019) geht es insbesondere darum, unterschiedliche Perspektiven relevanter Akteurinnen sichtbar zu machen und deren Wünsche und Bedürfnisse zu beleuchten. Ziel ist es hierbei, Momente für (neue) Ideen zu schaffen und nutzerinnenorientierte Formate, Produkte und Forschungssynthesen ggf. noch einmal aus einer ganz anderen Perspektive zu betrachten. In einem moderierten und interaktiven Prozess sollen in Anlehnung an die Thinking-Hats-Methode verschiedene Rollen eingenommen werden. Aus diesen heraus sollen Leitfragen diskutiert werden, um diese Rollen und Bereiche, die für eine zukunftsweisende digitale Transformation wichtig sind, zu verstehen und gemeinsam zu definieren. Auf diese Weise werden gemeinsame Erkenntnisse generiert sowie neue Anregungen dazu entwickelt, wie der Transfers zwischen Wissenschaft, Zivilgesellschaft und Bildungspraxis in einem ko-konstruktiven Austausch gestaltet werden kann. In der Zusammenschau des Austauschs sollen die erarbeiteten Erkenntnisse durch Vertreterinnen aus den jeweiligen Bezugssystemen authentisch kommentiert werden. Hierfür werden Vertreterinnen ausgewählter Stakeholder (Schulleitungen, Lehrkräfte, Landesinstitute) eingeladen, um Ihre Perspektiven und Ihre Erwartungen an gelungenen Transfer gleichsam in Reaktion auf die Ergebnisse der Erarbeitungsphase darzustellen. Im Anschluss an die gemeinsame Erarbeitung der jeweiligen Handlungslogiken sollen in einem dritten Schritt anhand der Rolle von Brokerinnen im Kompetenzverbund lernen:digital Möglichkeiten der Dialoggestaltung nachgezeichnet werden: Es wird kurz auf den Kompetenzverbund lernen:digital* im Allgemeinen sowie auf die Rolle von Brokerinnen im Besonderen eingegangen. Es kann davon ausgegangen werden, dass im Rahmen eines groß angelegten Transferprojektes eine derartige Integration einer solchen Rolle erstmalig explizit vorgesehen ist. Um ein Verständnis auch von dieser Rolle zu entwickeln, wird in Anknüpfung an Cooper et al. (2019) die Funktion von Brokerinnen vorgestellt und auf Grundlage der bisherigen Aktivitäten im Projektkontext diskutiert. Den Beitrag abschließend wird ein Ausblick darüber gegeben, wie die transferbezogenen Maßnahmen in lernen:digital die Perspektiven der beteiligten Stakeholder berücksichtigen und somit ein role model für zukünftige Transferaktivitäten darstellen können.
10:30 - 12:10	1-08: Zum Einfluss von Kohärenzbildungshilfen auf das fachliche Verständnis und motivational-emotionale Merkmale von Lernenden Ort: H06
	Symposium Zum Einfluss von Kohärenzbildungshilfen auf das fachliche Verständnis und motivational-emotionale Merkmale von Lernenden Chair(s): Poldi Kuhl (Leuphana Universität Lüneburg, Deutschland), Lina Wirth (euphana Universität Lüneburg, Deutschland) Diskutantin(nen): Petra Stanat (IQB Berlin, Deutschland) Zentrales Element von Lehr-Lern-Prozessen ist die Fähigkeit der Lehrkräfte, Lerngegenstände durchdacht, logisch-sachlich strukturiert, fachdidaktisch aufbereitet und sprachlich kohärent zu vermitteln (Aebli, 2006). Die sprachliche Kohärenz bezieht sich dabei auf lokaler Ebene auf den Zusammenhang zwischen aufeinanderfolgenden Sätzen und auf globaler Ebene auf den Zusammenhang zwischen größeren Sinnabschnitten (Schnotz, 1994). Durch diese Zusammenhänge sollen die zu lernenden Fachinhalte in eine geordnete, logische Begriffsstruktur gebracht werden, damit Lernende die dem Lerngegenstand innewohnende fachliche Struktur erfassen, verstehen und im Gedächtnis speichern können. Als potenziell bedeutsame sprachliche Merkmale für die kohärente Gestaltung von Lerngegenständen konnten Kohärenzbildungshilfen identifiziert werden. Kohärenzbildungshilfen erfüllen die Funktion, inhaltliche Relationen von Sachverhalten zu verdeutlichen und Lernenden während des Verstehens eine Orientierung anzubieten. Klassische Kohärenzbildungshilfen sind u. a. die Wiederholung von Begriffen, Verbindung von Sätzen, Zwischenüberschriften, Explikation von Fachbegriffen und fachlichen Relationen (Schnotz, 1994). In (inter-)nationalen Schulleistungsstudien sowie Untersuchungen zum Einfluss sprachlicher Merkmale auf das fachliche Verständnis zeigen sich wiederholt hohe korrelative Zusammenhänge zwischen fachlichen und sprachlichen Kompetenzen der Lernenden (Johnson-Laird, 1983; Kintsch & van Dijk, 1978; Leutner et al., 2004; Schnotz & Dutke, 2004), die als ein möglicher Beleg für die Bedeutung sprachlicher Gestaltung der Lerngegenstände im Unterricht angesehen werden können. Eine systematische Betrachtung des kausalen Zusammenhangs zwischen sprachlicher Gestaltung von Lerngegenständen und dem Erwerb fachlichen Verständnisses steht jedoch, insbesondere im Kontext mündlicher Erklärungen, aus. Neben dem fachlichen Verständnis von Erklärungen ist anzunehmen, dass Unterschiede in der Kohärenz von Erklärungen auch mit motivational-emotionalen Merkmalen der Lernenden zusammenhängen. Allerdings gibt es nur wenige Studien, die sich mit entsprechenden Zusammenhängen auseinandersetzen (Wirth et al., 2022). Dabei stellen Ness-Maddox et al. (2022) die Bedeutung der Emotionen Lernender für Kohärenzbildungsprozesse in Leseverstehensaufgaben heraus. In Bezug auf motivationale Merkmale zeigt sich, dass weniger kohärente Texte zu einem stärkeren thematischen Interessenverlust führen als kohärente Texte (Soemer & Schiefele, 2019) und dass negative Zusammenhänge zwischen Textverständnis und Interesse am gelesenen Text bestehen (Wade et al., 1999). Den genannten Forschungsbedarfen widmet sich dieses Symposium. Anhand von vier Beiträgen wird aus verschiedenen disziplinären Perspektiven untersucht, wie sich die systematische Variation von Kohärenzbildungshilfen in mündlichen Erklärungen und Textaufgaben auf das fachliche Verständnis Lernender sowie auf motivationale und emotionale Merkmale auswirkt. Der erste Beitrag ist im Mathematikunterricht der Primarstufe verortet und untersucht den Einfluss von Prosodie, Konnektoren und nominaler Rekurrenz als Kohärenzmerkmale mündlicher Erklärungen. Beitrag 2 befasst sich mit Sport- und bewegungsbezogenen Erklärungen von Lehrkräften. Es wird der Einfluss von Kohärenzbildungshilfen in mündlichen Erklärungen auf das Bewegungsverständnis von Kindern und Jugendlichen der Sekundarstufe I untersucht. Der dritte Beitrag geht der Relevanz von Konnektoren, Explikation und nominaler Rekurrenz als Kohärenzbildungshilfen in mündlichen Erklärungen im Fach Geschichte der Sekundarstufe I nach. Der vierte Beitrag schließlich untersucht, wie die Motivation und Emotionen von Sekundarstufenschüler:innen situational mit dem Einsatzes von Konnektoren in mathematischen Textaufgaben zusammenhängen. Die Befunde der vier Beiträge werden abschließend hinsichtlich der verständnis- sowie emotions- und motivationsförderlichen sprachlichen Gestaltung von Lerngegenständen diskutiert werden. Beiträge des Symposiums Der Ton macht die Musik!? – Bedeutsamkeit der Prosodie im Mathematikunterricht der Grundschule Almut Roeßler, Alexandra Merkert, Gerlinde Lenske, Domimik Leiß Leuphana Universität Lüneburg, Deutschland Zahlreiche empirische Befunde belegen den Zusammenhang sprachlicher und mathematischer Leistungen, insbesondere auch im Primarbereich (u. a. Bochnik & Ufer, 2016; Greisen et al., 2021; Kempert et al., 2011; Kempert et al., 2019; Merkert & Lenske, 2023; Paetsch et al., 2016; Ufer & Bochnik, 2020). Die Komplexität der im Mathematikunterricht verwendeten Sprache bzw. sprachbedingte Hürden (siehe dazu u. a. Brown, 2005; Daroczy et al., 2015; Dröse & Prediger, 2020; Franke & Ruwisch, 2010; Weis, 2013) betreffen dabei sowohl erst- als auch zweitsprachig aufwachsende Lernende (Prediger, 2013; Prediger et al., 2019). Diese sprachbedingten Hürden können auf rezeptiver Ebene bspw. im Kontext mündlicher Erklärsituationen im Mathematikunterricht zu Schwierigkeiten im Verstehensprozess von Lernenden führen. Neben der sprachlichen Komplexität auf lexikalischer und syntaktischer Ebene (Weis, 2013; Brown, 2005) wird die Informationsverarbeitung bei der Rezeption mündlicher Erklärungen allerdings auch durch die Prosodie beeinflusst, wie aus der psycholinguistischen Forschung abzuleiten ist (siehe Cutler, 1996; Cutler et al., 1997; Steinhauer et al., 1999). Zur Prosodie zählen bspw. Intonation, Akzentuierung und Sprechrhythmus (u. a. Bockmann et al., 2020; Steinhauer et al. 1999). Sie kann damit potenziell sowohl die Segmentierung des Lautstroms als auch die Identifikation wesentlicher durch den Satz transportierter Informationen erleichtern (z. B. durch die Hervorhebung von Schlüsselwörtern). Im Sinne der Cognitive Load Theorie (van Merrienboër & Sweller, 2005) sollte ein gezielter Einsatz prosodischer Merkmale selbst bei gleicher sprachlicher Gestaltung zur Reduzierung der kognitiven Belastung beitragen und somit den Lernprozess unterstützen sowie in der Folge die Verstehensleistung steigern. Anzunehmen sind außerdem Einflüsse auf motivationale Faktoren, die ihrerseits wiederum im Zusammenhang mit der Verstehensleistung stehen (Lau, 2017; Pichora-Fuller et al., 2016; Wade et al., 1999). Deshalb beschäftigt sich der vorliegende Beitrag mit der Frage, welchen Einfluss die Prosodie auf Motivation und Leistung im Mathematikunterricht der Grundschule hat. In einem experimentellen Design wurde eine Erklärung zur Einführung der japanischen Multiplikation bezüglich der Prosodie (insbesondere Intonation, Sprechgeschwindigkeit und Sprechpausen) variiert, während alle anderen sprachlichen Parameter (z. B. Begriffe, Konnektoren, Stimme bzw. sprechende Person, etc.) unverändert blieben. Um die Erklärung in den untersuchten Klassen hinsichtlich der sprachlichen Parameter zu standardisieren sowie bezüglich der Prosodie systematisch zu variieren, wurde die Erklärung in den beiden Varianten zuvor auf Video aufgezeichnet. Die zugrundeliegende Stichprobe unserer Pilotstudie umfasst 38 Schüler:innen der vierten Klasse (18 weiblich, 20 männlich). Eine Klasse lernte anhand der prosodisch günstig gestalteten Variante, während die Parallelklasse eine prosodisch ungünstig gestaltete Variante der Erklärung erhielt. Bevor die japanische Multiplikation erklärt wurde, wurde die fachliche Motivation (Skala zur Lernmotivation in Mathe, IGLU, 3 Items, alpha = .62) sowie die mathematische Leistung in Bezug auf die Multiplikation erfasst (Eigenentwicklung). Die beiden Klassen unterscheiden sich in diesen Variablen nicht signifikant (und auch deskriptiv nur marginal). Die aktuelle Motivation wurde mit einem Fragebogen zum situationalen Interesse erfasst (IMI, adaptiert, 7 Items, alpha = .73), die Mathematikleistung in Bezug auf die japanische Multiplikation mittels Papier-Bleistift-Test (Eigenentwicklung) und die. subjektiv empfundene Verständlichkeit der Erklärung ebenfalls per Fragebogen (Eigenentwicklung, 2 Items). Zur Analyse wurden Mittelwertsunterschiede berechnet. Es zeigt sich mittels Mann-Whitney-U-Test ein signifikanter Unterschied in Bezug auf das situationale Interesse (U = .012) sowie bei der subjektiven Einschätzung hinsichtlich der Verständlichkeit für sich selbst und andere (U = .010) zugunsten der prosodisch besseren Variante. Hinsichtlich der Leistung in Bezug auf die japanische Multiplikation zeigte sich kein signifikanter Effekt zwischen den beiden Bedingungen. Die Pilotstudie unterliegt verschiedenen Limitationen (z.B. Stichprobengröße). Dennoch verdeutlichen die Ergebnisse die Bedeutsamkeit der Prosodie, insbesondere in Bezug auf die aktuelle Motivation von Schüler:innen sowie die subjektiv empfundene Verständlichkeit. In Folgeuntersuchungen sollen differenzielle Effekte sowie Mediations- und Moderationseffekte untersucht werden. Kohärenzbildungshilfen in Erklärungen von Sportlehrkräften Tim Heemsoth¹, Rieke Frerichs¹, Claus Krieger², Anke Schmitz³, Sebastian Wallot⁴, Hendrik Härtig⁵, Dominik Leiß⁴ ¹Europa-Universität Flensburg, Deutschland, ²Universität Hamburg, Deutschland, ³PH Fachhochschule Nordwestschweiz, Schweiz, ⁴Leuphana Universität Lüneburg, Deutschland, ⁵Universität Duisburg-Essen, Deutschland Theoretischer Hintergrund Empirische Studien weisen darauf hin, dass es einen bedeutsamen Zusammenhang zwischen sprachlichen und fachlichen Kompetenzen von Schülerinnen im Fach Sport gibt (Krieger et al., 2019). Geht man davon aus, dass sprachliche Verstehensprozesse mit entsprechendem Lernerfolg einhergehen, so verweisen diese Befunde auch auf die Bedeutung verständlicher mündlicher Lehrkrafterklärungen im Sportunterricht (Krüger & Wahl, 2018). Eine kausale Betrachtung zwischen Merkmalen einer mündlichen Erklärung und dem fachlichen Verständnis von Schülerinnen, z. B. ihrem Spielverständnis, hat hier jedoch bis dato nicht stattgefunden. Dabei kann angenommen werden, dass die Verständlichkeit einer Erklärung insbesondere von Kohärenzbildungshilfen abhängt. So erscheint eine sprachliche Segmentierung (z. B. durch temporale Relationen, Averintseva-Klisch, 2008) insbesondere für die Erklärung sportlicher Handlungsfolgen bedeutsam, die durch eine zeitliche Struktur gekennzeichnet sind. Eine Segmentierung könnte die lerngegenstandsunabhängige kognitive Beanspruchung einer Erklärung hier verringern und so die Verstehensprozesse erleichtern (Schmitz, 2016; Sweller et al., 1998). Zudem scheinen abschließende Zusammenfassungen, in denen wesentliche Informationen einer Erklärung nochmals kondensiert formuliert werden, als Kohärenzbildungshilfe geeignet (Averintseva-Klisch, 2008). Dies erscheint insbesondere für Fach Sport bedeutsam, in dem das Reflektieren über (zusammenfassende) Situationsbeispiele eine zentrale Rolle spielt (z. B. Harvey & Jarrett, 2014). Unklar ist jedoch, welche Qualität diese zusammenfassenden Situationsbeispiele – etwa mit eher regelkonformen oder regelwidrigen Spielhandlungen – haben sollten. Auch könnten Erklärungen mit geringer sprachlicher Segmentierung stärker von Zusammenfassungen mit gelungenen Situationsbeispielen profitieren als Erklärungen mit höherer sprachlicher Segmentierung. Vor diesem Hintergrund stellen sich für den Beitrag folgende Forschungsfragen: (1) Inwieweit bedingt die sprachliche Segmentierung oder die Qualität der zusammenfassenden Situationsbeispiele das Spielverständnis von Schülerinnen? (2) Inwieweit moderiert die sprachliche Segmentierung den Einfluss der Qualität der zusammenfassenden Situationsbeispiele das Spielverständnis? Methode Es wurde eine experimentelle Studie mit N = 356 Schülerinnen der Klassenstufen 7 bis 9 und mit einem 2 × 2-Design durchgeführt. Dabei wurden die Kohärenzbildungshilfen sprachliche Segmentierung (hoch vs. gering) und Qualität der zusammenfassenden Situationsbeispiele (regelkonform vs. regelwidrig) systematisch im Rahmen einer Erklärung des Sportspiels Kinball variiert. Die Schülerinnen wurden randomisiert einer der vier verschiedenen Experimentalgruppen zugeordnet, die jeweils eine videographierte, ca. vierminütige mündliche Spielerklärung, betrachteten: EG1 = hohe Segmentierung + regelkonforme Situationsbeispiele; EG2 = geringe Segmentierung + regelkonforme Situationsbeispiele; EG3 = hohe Segmentierung + regelwidrige Situationsbeispiele; EG4 = geringe Segmentierung + regelwidrige Situationsbeispiele. Im Anschluss wurde erstens das Regelwissen über sieben MCQ-Items erhoben. Hier wurden jeweils nach einer kurzen Kontextualisierung vier Distraktoren präsentiert, die danach zu bewerten waren, ob regelkonforme oder regelwidrige Spielhandlungen beschrieben werden ( = .60). Zweitens wurde das Regelanwenden gemessen, indem die Schüler*innen nacheinander vier kurze videographierte Spielsituationen des Spiels Kinball betrachteten und im Anschluss beurteilten, ob und welcher Regelverstoß hier vorliegt. Die offenen Antworten wurden durch zwei unabhängige Rater codiert (Cohens Kappa im Bereich von .91 bis .99). Die Reliabilität beim Regelanwenden liegt bei  = .61. Zur Analyse wurden Haupt- und Interaktionseffekte der Faktoren sprachliche Segmentierung und Qualität der zusammenfassenden Situationsbeispiele auf das Regelwissen und das Regelanwenden im Rahmen von Varianzanalysen betrachtet. Ergebnisse und Diskussion Die Befunde zeigen, dass das Regelwissen unterstützt wird, wenn die Erklärung mit regelwidrigen statt mit regelkonformen Spielsituationen zusammengefasst wird (F(1,354) = 4.59, p = .033, r = .11). Das Regelanwenden profitiert zudem von einer Kombination aus hoher sprachlicher Segmentierung und regelkonformen Situationsbeispielen, wie die Betrachtung des Interaktionseffekts zeigt (F(1,354) = 5.23, p = .022, r = .12). Der Grad der sprachlichen Segmentierung hat weder einen Haupteffekt auf das Regelwissen (F(1,354) = .04, p = .836) noch auf das Regelanwenden (F(1,354) = 0.45, p = .501). Insgesamt kann die Studie zu einem besseren Verstehen vermeintlich bedeutsamer sprachlicher Kohärenzbildungshilfen in mündlichen Erklärungen im Fach Sport beitragen. Ein Ausblick sowie Limitationen der Studie werden im Vortrag angeboten. Konnektoren, Explikation und nominale Rekurrenz als Kohärenzbildungshilfe in mündlichen Erklärungen im Fach Geschichte Nicola Brauch¹, Lena Heine¹, Knut Schwippert² ¹Ruhr-Universität Bochum, Deutschland, ²Universität Hamburg, Deutschland Obwohl der Geschichtsunterricht sich wesentlich durch mündliche Erklärungen (Ruck & Memminger, 2019) vollzieht, sind bislang v.a. schriftliche Schulbuchtexte dahingehend untersucht worden, wie zentrale Konzepte des Geschichtsunterrichts, v.a. ein fachadäquates Verständnis von Zeit und Zeitlichkeit, am besten an Schülerinnen und Schüler vermittelt werden kann. In historischen Erklärungen ist eine Auffassung von Zeit bedeutsam, die Kausalitäten in historischen Bedingungsgefügen und die Relativität von Erkenntnissicherheit als zentrale fachliche Konzepte beinhaltet. Bisherige Forschung konnte zeigen, dass für ein schülerseitiges Verstehen solcher fachlicher Bezüge die Art der Versprachlichung in Erklärungen bedeutsam ist (Schrader, 2013; Schmellentin, 2020). Hierbei haben sich u.a. Aspekte der Textkohärenz wie Konnektivität, aber auch der Grad der Explizitheit und nominale Rekurrenz als wichtige Dimensionen erwiesen. Für mündliche Erklärungen in unterrichtlichen Settings, die durch ihre Flüchtigkeit geprägt sind, liegen allerdings noch kaum Hinweise darauf vor, welche Art und welcher Grad an sprachlich ausgedrückter Verdeutlichung für welche Schüler_innen am optimalsten sind. In diesem Beitrag stellen wir erste Ergebnisse aus einem Pilotprojekt vor, das derzeit durchgeführt wird, zu dem aber zum Zeitpunkt der Präsentation Resultate vorliegen werden. Eine unterrichtstypische mündliche Erklärung zu einem für ein curricular nicht verankertes Themengebiet („Römische Stadtgründungen in Europa“) wird dazu systematisch in vier verschiedenen Versionen erstellt: A): eine Basisversion mit sehr sparsamer Verwendung von Kohärenzbildungsmarkern, B1): eine Version, in der gezielt Konnektoren eingesetzt werden, B2): eine Version, die nominal auf wichtige Elemente rekurriert, wo die anderen Versionen z.B. nur Proformen einsetzen und B3): eine Version, die fachlich bedeutsame Vorwissenskonzepte nicht, wie die anderen Versionen, voraussetzt, sondern sie erläutert. Schlussendlich soll untersucht werden, ob und wie stark die jeweiligen Kohärenzbildungsmarker sich auf ein geschichtsadäquates Verständnis der fachlichen Zusammenhänge auswirken. In der hier berichteten Pilotstudie soll explorativ untersucht werden, inwiefern der Einsatz kohärenzbildender Elemente auch tatsächlich auf Verständlichkeit von mündlich dargebotenen geschichtlichen Erklärungen wirkt; die bisherigen Erkenntnisse beziehen sich nämlich alle auf schriftliche Texte. Studierende unterschiedlicher Fächer hören verschiedene Versionen derselben mündlichen Erklärung und werden um ihre subjektive Einschätzung der Zugänglichkeit der jeweiligen Version gebeten. Sollte sich zeigen, dass die Erklärversionen mit Kohärenzbildungshilfen als einfacher verständlich wahrgenommen werden als die Basisversion ohne diese Hilfen, so lässt dies vermuten, dass sie sich in der Hauptuntersuchung auch auf die dort gemessene Verstehensleistung auswirken werden. In der Pilotierung werden dazu immer jeweils die Basisversion A und eine der anderen Textversionen (B1, B2 oder B3) in gesprochener Form Studierenden verschiedener Fächer in randomisierter Reihenfolge vorgespielt. Sie werden sodann in einem Fragebogen mit geschlossenen und halboffenen Frageformaten gebeten, intuitiv einzuschätzen, welche der beiden Versionen für sie besser verständlich erschienen. Zusätzlich wird erfragt, ob sie die Unterschiede zwischen den beiden gehörten Textversionen benennen können. Außerdem werden Hintergrundvariablen erhoben. Pro Bedingung und Reihenfolge der Texte werden jeweils ca. 30 Studierende befragt. Wir vermuten, dass die drei Versionen B1, B2 und B3 von den Teilnehmenden als besser zugänglich eingestuft werden als die Basisversion A. Außerdem haben wir die Annahme, dass B3, die fachliche Explizierung, von den Studierenden als am höchsten in der Zugänglichkeit gerankt wird. Der situationale Einfluss von Textkohärenz auf die Emotionen und Motivation von Schüler:innen während des Lösens mathematischer Textaufgaben Lina Wirth¹, Timo Ehmke¹, Jan Retelsdorf², Poldi Kuhl¹ ¹Leuphana Universität Lüneburg, Deutschland, ²Universität Hamburg, Deutschland Theoretischer Hintergrund Das Verstehen von Texten basiert maßgeblich auf Kohärenzbildung (Kintsch, 2009). Kommt es zu Fehlern in der Kohärenzbildung kann dies zu Fehlern in der weiteren Arbeit mit den Texten, bspw. bei der Bearbeitung mathematischer Textaufgaben, führen (Reusser, 1989). Eine Möglichkeit, die Kohärenzbildung zu unterstützen, ist die Verwendung von Kohärenzbildungshilfen, die inhaltliche Relationen von Sachverhalten verdeutlichen, fachliche Konzepte, Begriffe und Relationen explizieren oder wiederholen, und Texte strukturieren (Averintseva-Klisch, 2008; Linderholm et al., 2000; Neuber, 2002; Schmitz, 2016). Beispiel für Kohärenzbildungshilfen sind Konnektoren, mit denen sich (Teil-)Sätze und Abschnitte durch Konjunktionen (z.B. weil, obwohl) oder Adverbien (z.B. kaum, folgendermaßen) inhaltlich sinnvoll miteinander verbinden lassen. Während Forschungsbefunde zur Textverständlichkeit, die die Bedeutung solcher sprachlichen Merkmale betonen, vorliegen (z.B. Göpferich, 1998; Schmitz, 2016), ist bislang unzureichend untersucht, inwieweit Unterschiede in der Textkohärenz auch mit emotionalen und motivationalen Merkmalen der Lernenden zusammenhängen (Wirth et al., 2022). Auf Grundlage der Kontroll-Wert-Theorie (Pekrun, 2006) und der (situationalen) Erwartungs-Wert-Theorie (Eccles, 1983; Eccles & Wigfield, 2020) ist ein solcher Zusammenhang zwischen dem Einsatz von Kohärenzhilfen mit der emotionalen und motivationalen Befindlichkeit der Lernenden anzunehmen. Durch die verständnisfördernde Funktion ist beispielsweise von höherer subjektiver Kontrolle über Textaufgaben auszugehen, die mit positiven Emotionen, wie Freude oder Hoffnung, einhergeht. Auch ist ein höheres und motivationsförderliches Kompetenzerleben erwartbar und damit einhergehende höhere Erwartungen, Textaufgaben erfolgreich bewältigen zu können. Erfolgserwartungen wiederum gelten u.a. als Prädiktor einer höheren Anstrengungsbereitschaft. Bei Lernenden, für die schulische Erfolge von hoher Bedeutung sind, kann auf diese Weise die Konstruktion von Nützlichkeits- und Wichtigkeitswerten gefördert werden. Zudem ist anzunehmen, dass die Arbeit mit kohärenten Texten mit geringeren Anstrengungskosten und einer geringeren Beanspruchung kognitiver Ressourcen einhergeht, die als negative Aufgabenwerte eher motivationshinderlich sind. Fragestellungen Basierend auf dem theoretischen Hintergrund untersucht diese Studie, (1) wie sich – zunächst grundlegend – die Emotionen und die Motivation von Schüler:innen situational während des Lösens mathematischer Textaufgaben entwickeln, und, (2) inwieweit sich differentielle Verläufe in den Emotionen und der Motivation in Abhängigkeit des Einsatzes von Konnektoren in mathematischen Textaufgaben identifizieren lassen. Da nachweislich insbesondere für sprachschwache Schüler:innen einen höheren Nutzen aus Kohärenzmitteln ziehen (Prediger et al., 2012) wird außerdem untersucht, (3) inwieweit die sprachlichen Kompetenzen der Schüler:innen in diesem Zusammenhang eine Rolle spielen. Methode Die dieser Studie zugrundliegenden Daten wurden durch eine Online-Befragung mit N = 83 Schüler:innen der Klassen 7 bis 10 einer niedersächsischen Gesamtschule erhoben. Im Rahmen eines experimentellen Untersuchungsdesigns wurden sechs mathematische Textaufgaben zu verschiedenen Themen sprachlich so manipuliert, dass sie jeweils einmal mit Konnektoren und einmal ohne Konnektoren vorlagen. Die Schüler:innen bearbeiteten vier dieser Textaufgaben in zwei Blöcken (2x2 Aufgaben), die ihnen pro Block zufallsbasiert entweder mit oder ohne Verwendung von Konnektoren vorgelegt wurden. Die sprachliche Kompetenz der Schüler:innen wurde durch einen verkürzten C-Test erfasst. Emotionen und Motivation wurden zu drei Zeitpunkten – vor, zwischen und nach den Aufgabenblöcken – erfasst. Ergebnisse Bezüglich (1) zeigt sich keine signifikante Veränderung in der Entwicklung der Emotionen und Motivation für die Gesamtstichprobe während des Lösens der mathematischen Textaufgaben. Auch die systematische Variation des Einsatzes von Konnektoren hat (2) keine differentiellen Entwicklungsverläufe gezeigt. Es gibt jedoch Hinweise darauf, dass die sprachlichen Kompetenzen der Schüler:innen relevant dafür sind, inwieweit der Einsatz von Konnektoren die emotionalen und motivationalen Merkmale begünstigt. Die Ergebnisse werden vor dem Hintergrund der Relevanz sprachlicher Gestaltung von Lernaktivtäten im Unterricht für Leistungen sowie das emotionale Wohlbefinden und die Motivation von Schüler:innen diskutiert.
10:30 - 12:10	1-09: Empirische Evidenz zur Wirksamkeit von Klimabildung Ort: S17
	Symposium Empirische Evidenz zur Wirksamkeit von Klimabildung Chair(s): Martin Schwichow (PH Freiburg, Deutschland), Werner Rieß (PH Freiburg, Deutschland) Diskutantin(nen): Alexander Renkl (Albert-Ludwigs-Universität Freiburg, Deutschland) Zahlreiche wissenschaftliche Belege weisen darauf hin, dass menschliche Aktivitäten und Handlungen wesentlich zum Klimawandel beitragen und sich dieser negative auf natürliche und gesellschaftliche Systeme auswirkt (IPCC 2018; Cook et al. 2013). Um die individuellen und gesellschaftlichen Folgen des Klimawandels abzuschwächen bzw. sich an diese anzupassen, kommt der Bildung als einem social tipping Element eine entscheidende Rolle zu (Otto, et al., 2020). Konzepte aus der Klimabildung (englisch Climate Change Education, CCE) und der Bildung für eine nachhaltige Entwicklung (BNE) vermitteln den Lernenden Wissen zu den Ursachen und Folgen des Klimawandels und fördern Einstellungen und Handlungskompetenzen, die zur Bewältigung und Abschwächung seiner Folgen notwendig sind (UNFCCC 2016). Während das theoretische Potential von Bildungsmaßnahmen im Kontext des Klimawandels unstrittig ist, gibt es bislang nur wenige empirische Befunde zu ihrer tatsächlichen Wirkung. Die existierenden Studien haben zudem eine deutlich begrenzte Gültigkeit, da sie oft nur Teilaspekte der Wirkung von Klimabildung untersuchen. Bislang fehlt eine integrative Perspektive, welche im Sinne eines Angebots-Nutzungs-Modelles (Seidel, 2014) empirische Befunde zur Wirksamkeit von Lernangeboten, deren Nutzung durch die Lernenden sowie deren Wirkung auf die Lernenden in realen Unterrichtssetting zusammenführt. Ziel des Symposiums ist es vier aktuelle empirische Studien zur Klimabildung, welche die Elemente Wirkung, Unterrichtsangebot, und Kontextbedingungen des Angebot-Nutzen-Modells adressieren, zusammenzuführen. Die übergeordnete Fragestellung des Symposiums lautet: Wie wirksam ist die Klimabildung? Der erste und zweite Beitrag des Symposiums beschreiben Studien, zu medialen Angeboten in der Klimabildung. Aufgrund der Komplexität der systemischen Zusammenhänge im Kontext des Klimawandels und seiner Folgen, werden interaktive und motivierende mediale Darstellungsformen in der Klimabildung als besonders lernförderlich angesehen. Der erste Beitrag beschreibt eine experimentelle Studie zur Wirkung motivational designter Lernvideos (Emotional Design) zum Kohlenstoffkreislauf und deren Verbindung mit abrufbasiertem Lernen (Retrieval Practice) Die Ergebnisse bestätigten, dass eine motivationale Gestaltung der Lernvideos nicht nur das Lernern erleichtert, sondern auch die Motivation für anschließende Festigungsaufgaben (Retrieval Practice). Der zweite Beitrag des Symposiums beschreibt eine quasi-experimentelle Studie mit Grundschulkindern, welche die Wirksamkeit eines dynamischen computerbasierten Systemmodells zum Klimawandel mit für den (Sach-)Unterricht in der Grundschule häufig empfohlenen statischen Systemmodellen (Vernetzungskreise) vergleicht. Es zeigt sich, dass ein dynamisches Systemmodell zu größeren Zuwächsen im Fachwissen und im systemischen Denken führt als ein statisches. Der dritte Beitrag des Symposiums befasst sich mit der Wirkung von Klimabildungsmaßnahmen auf Wissen, Einstellung und Verhalten von Schülerinnen im Kontext des Klimawandels. Er stellt die Befunde einer Meta-Analyse vor, die die Ergebnisse von 53 Interventionsstudien zur Klimabildung zusammenfasst. Es zeigt sich, dass Maßnahmen zur Klimabildung einen großen Effekt auf das Wissen der Lernenden bezüglich der Ursachen und Folgen des Klimawandels (g = 0.77) hat, jedoch nur kleine Effekte auf Einstellungen (g = 0.39) und Verhalten (g = 0.36). Allerdings ist gleichzeitig eine hohe Heterogenität in den in die Metaanalyse einbezogenen Studien und ein Bedarf an qualitativ höherwertigen Wirksamkeitsstudien im Feld der Klimabildung festzustellen. Der vierte Beitrag des Symposiums erweitert die Perspektive, indem er den Einfluss von schulischen Kontextbedingungen auf die Wirkung von Klimabildung beleuchtet. Er stellt eine Mehrebenenanalyse von Daten des Projekts „BNE im Unterricht – Gelingensbedingungen für die Entwicklung von Nachhaltigkeitskompetenz“ (BUGEN) vor. Ziel der Analysen ist es den Einfluss von Schulformen und weiterer Kontextbedingungen auf die Entwicklung von kognitiven (Nachhaltigkeitswissen), affektiven (nachhaltigkeitsbezogene Einstellungen) und verhaltensbezogenen (selbstberichtetes nachhaltigkeitsbezogenes Verhalten) Aspekte der Nachhaltigkeitskompetenz zu untersuchen. Es zeigt sich, dass nicht alle Schüler*innen gleichermaßen von Angeboten zur Klimabildung profitieren, da schulformspezifische Schereneffekte zugunsten der Gymnasien sowie zu Ungunsten der Gemeinschaftsschulen vorliegen. Der Beitrag diskutiert mögliche Ursachen und Folgen dieser Scherreneffekte. Die Vortragenden sind Mitglied des “Consortium for Climate Change Education and Education for Sustainable Development (ICCE)” und kooperieren in der empirischen Beforschung der Klimabildung und BNE. Die Beiträge werden von einem externen Diskutanten kritisch reflektiert. Beiträge des Symposiums Lernerfolg und Metakognition in der Bildung für nachhaltige Entwicklung durch kognitive und motivationale Lernmechanismen fördern - Emotional Design und Retrieval Practice in der BNE Tino Endres, Charlotte Vössing, Alexander Renkl Albert-Ludwigs-Universität Freiburg, Deutschland Theoretischer Hintergrund: In der Bildung für nachhaltige Entwicklung (BNE) sind komplexe systematische Zusammenhänge eine erhebliche Herausforderung für die Lernenden. Um diese komplexen Inhalte zu verstehen, brauchen die Lernenden häufig lange Lernzeiten und müssen sich anschließend in Übungs- und Festigungsaufgaben anstrengen. Um diesen motivationalen Herausforderungen zu begegnen können Lehrende effektive Lernangebote anbieten, die sowohl längere Lernzeiten als auch hohes Engagement in nachfolgenden Festigungsaufgaben wahrscheinlicher machen. In der vorliegenden Studie beabsichtigen wir, zwei bewährte didaktische Methoden einzusetzen, um diesen Anforderungen gerecht zu werden. Erstens vergleichen wir emotional gestaltete Lernvideos mit neutralen Lernvideos. Vorangegangene Untersuchungen zeigen, dass emotional gestaltete Videos das situative Interesse der Lernenden steigern können (Endres et al., 2020). Dieses gesteigerte Interesse erleichtert es den Lernenden, sich länger mit komplexen Inhalten auseinanderzusetzen, fördert eine anhaltende Motivation für das Thema und den Lernerfolg über die Dauer des Videos. Zweitens untersuchen wir, ob die Kombination von Emotional Design Lernvideos mit Retrieval Practice (abrufbasiertem Lernen, Roelle et al. 2022) zu einer verbesserten und nachhaltigeren Lerneffektivität führt. Retrieval Practice ist besonders effektiv, wenn die Lernenden sich anstrengen, so viel wie möglich abzurufen (Carpenter, 2009). Diese wünschenswerte Schwierigkeit (desirable difficulty) wird jedoch oft nicht optimal genutzt (Rivers, 2021). Durch die gesteigerte Motivation nach den Emotional Design Videos könnte auch diese Festigungsaufgabe einen noch größeren Lernerfolg erzielen. Eine gezielte Kombination der beiden Methoden könnte somit den Lernerfolg nachhaltig verbessern. Hypothesen: Wir erwarten eine Interaktion der beiden didaktischen Methoden Emotional Design Videos und Retrieval Practice, die Kombination sollte zum besten Lernerfolg führen. Wir erwarteten das die Emotional Design Videos das situative Interesse der Lernenden erhöht und das diese Erhöhung die Anstrengung in den Festigungsaufgaben verbessert, was schlussendlich zu einem besseren ausdauernden Lernerfolg nach zwei Wochen führt (Mediationshypothese). Methode: In einem 2x2x2-Design lernten 120 Gymnasiasten aus einem Lernvideo, das entweder emotional oder neutral gestaltet war (Zwischensubjekt Faktor). Den zweiten Faktor stellen die Festigungsaufgaben dar. Lernende festigten ihr Wissen entweder durch Retrieval Practice oder durch erneutes Lernen (Zwischensubjekt Faktor). Den dritten Faktor stellte eine Messwiederholung des Lernerfolgs dar (Lernleistung im ersten Abschnitt vs. Lernleistung im zweiten Abschnitt). Nach dem Erheben relevanter demographischer Daten sahen Lernende entweder ein Lernvideos das emotional oder neutral gestaltet war. Anschließend wurden das situationale Interesses sowie der investierte mentale Aufwand, sowie metakognitives Monitoring erhoben. Abschließend festigten die Lernenden ihr Wissen entweder über Retrieval Practice oder über erneutes Lernen des Lernmaterials. Erneut wurden das situationale Interesses sowie der investierte mentale Aufwand, sowie metakognitives Monitoring erhoben. Nach zwei Wochen wurde der erzielte Lernerfolg mit offenen Lernaufgaben gemessen für beide abschnitte gemessen. Ergebnisse: Die Lernenden in der kombinierten Bedingung erzielten den höchsten Lernerfolg (p < .05). Die Mediationsanalysen bestätigten ein erhöhtes situatives Interesse in der Bedingung der Emotional Design Videos, welches zu einer erhöhten mentalen Anstrengung in den Festigungsaufgaben und letztendlich zu einer erhöhten Lernleistung führte (Indirekter Effekt, Mediationshypothese). Die Lernenden in der Festigungsaufgaben Bedingung zeigten einen verbesserte metakognitive Akkuratheit. Eine Überprüfung, ob die Daten eine Multilevel-Struktur aufweisen, steht noch aus. Diskussion: Motivational gestaltetes Material kann das Lernen von komplexen Inhalten wie die Systemischen zusammenhänge in der BNE verbessern. Insbesondere zeigt sich eine positive Wechselwirkung zwischen Emotional Design und Retrieval Practice. Die Verbindung dieser beiden Methoden konnte komplexes , systematisches Wissen am besten fördern. Zusätzlich zu diesem Lernerfolg ist die erhöhte metakognitive Bewusstheit der Abrufübung zu betone. Lernende die genauer wissen was sie noch nicht wissen können ihre Wissenslücken besser schließen und dadurch in folgenden Lernaufgaben noch besser profitieren. Dieser Vorteil ist besonders relevant, wenn weiterführende Konzepte auf dieses Wissen aufbauen. Zukünftige Forschung könnte nun untersuchen ob diese motivationale Steigerung auch über längere Zeit besteht und die Einstellung zur BNE nachhaltig verändert. Systemisches Denken lernen mit Systemmodellen zum Klima(wandel) in der Grundschule Sven Frey¹, Nadine Tramowsky¹, Maik Beege¹, Alexander Renkl², Werner Rieß¹ ¹PH Freiburg, Deutschland, ²Albert-Ludwigs-Universität Freiburg, Deutschland 1. Theoretischer Hintergrund Der anthropogene Klimawandel und seine Folgen zählen zu den größten Herausforderungen für uns und die nachfolgenden Generationen. Um diesen gerecht zu werden, bedarf es systemischen Denkens – der „Fähigkeit komplexe Wirklichkeitsbereiche als Systeme erkennen, beschreiben und modellieren zu können“ (Mischo & Rieß, 2008, S. 348–349). Möglichkeiten einer Erfassung und Förderung systemischen Denkens zur Lösung komplexer Probleme in Nachhaltigkeitskontexten wurden bislang vor allem bei SchülerInnen der Sekundarstufen und bei Studierenden untersucht (Brockmüller, 2019; Fanta et al., 2020). Es wurde jedoch nachgewiesen, dass sich systemisches Denken bereits in der Grundschule grundsätzlich fördern lässt (Sommer, 2005; Assaraf & Orion, 2009). Die in diesen Studien getesteten Interventionen fokussierten sich auf vergleichsweise einfache Systeme mit einer überschaubaren Anzahl von Systemelementen und Wechselwirkungen (Sommer, 2005). Es stellt sich die Frage, ob sich systemisches Denken in der Grundschule auch in einem komplexen sowie im aktuellen Diskurs hoch relevanten System, wie dem Klimasystem, fördern lässt. Ein Argument hierfür ist, dass angesichts der globalen Auswirkungen auch schon Kinder für den Klimawandel sensibilisiert und in ihren Kompetenzen gestärkt werden sollten, damit sie sich grundlegend mit dem Klimawandel auseinandersetzen und in ihren noch eingeschränkten Verantwortungsbereichen zur Zielerreichung der Klimaneutralität beitragen können (Bassen et al., 2021). Für das Verständnis der komplexen Dynamiken des Klimawandels, bietet der Einsatz digitaler Systemmodelle besondere Vorteile, da diese einen aktiven Umgang mit dem Klimasystem ermöglichen. In der hier vorgestellten Studie geht es darum, die Wirksamkeit eines computerbasierten, einfachen Systemmodells zum Klimawandel im Vergleich zu in der Primarstufe häufig verwendeten Systemmodellen (z.B. Vernetzungskreis, Wirkungs- und Zeitdiagramme) zur Förderung systemischen Denkens bei GrundschülerInnen zu untersuchen. Durch den Einsatz verschiedener Systemmodelle sollen gewichtige Erkenntnisse für das unterrichtliche Handeln gewonnen werden. 2. Fragestellung Welche Wirkungen gehen vom Einsatz alternativer (digitaler) Systemmodelle mit variierender Veranschaulichung zeitlicher Entwicklungen auf die Förderung verschiedener Facetten systemischen Denkens bei Schülerinnen und Schüler der Grundschule aus? 3. Methode Zur Beantwortung der Forschungsfrage wurde ein Quasi-Experiment mit 293 ViertklässlerInnen an Grundschulen durchgeführt. Mit einem Prä-Posttest-Design ermittelten wir sowohl das themenspezifische Wissen zum Klimawandel als auch die Fähigkeit systemischen Denkens und das lernbezogene Interesse. Die digital gestützte Intervention umfasste insgesamt fünf Unterrichtsstunden. In den letzten beiden Stunden wurden in vier Experimentalgruppen variierte Systemmodelle eingesetzt: Ein Vernetzungskreis ohne Zeitdiagramm, ein Vernetzungskreis mit Zeitdiagramm, ein Simulationsmodell mit Zeitdiagramm und eine Kontrollgruppe ohne Intervention. 4. Ergebnisse Die digitale Lernumgebung hat sich insgesamt als wirksam erwiesen. Alle drei Experimentalgruppen verbesserten sich über die Zeit signifikant im Vergleich zur Kontrollgruppe, sowohl im Fachwissen, F(3, 289) = 25.39, p <.001, ηp2 = .21, als auch im systemischen Denken, F(3, 289) = 20.35, p <.001, ηp2 = .17. Im Posttest unterschieden sich die Gruppen im Fachwissen: F(3, 289) = 10.23, p <.001, ηp2 = .10; und systemischen Denken, F(3, 289) = 10.07, p <.001, ηp2 = .10. Post-hoc-Tests zeigen, dass der Einsatz des Systemmodells „Vernetzungskreis mit Zeitdiagramm“ im Fachwissen deskriptiv zu höheren Lernzuwächsen als in den anderen beiden Experimentalgruppen führt, jedoch nicht signifikant. Auch im systemischen Denken zeigen sich Vorteile des Einsatzes dieses Systemmodells. So konnten die SchülerInnen, die damit arbeiteten, einen signifikant höheren Kompetenzzuwachs erzielen als die Kontrollgruppe (p < .001) und die Experimentalgruppe „Vernetzungskreis ohne Zeitdiagramm“ (p = .003). Auch gegenüber der Experimentalgruppe „Simulationsmodell mit Zeitdiagramm“ zeigten sich marginale Unterschiede zugunsten des Systemmodells „Vernetzungskreis mit Zeitdiagramm“ (p = .321). In Bezug auf das heuristische Kompetenzmodell (Rieß et al., 2015) zeigen sich die Vorteile dieses Systemmodells besonders in der Systemmodellierungsfähigkeit und im Lösen komplexer Probleme mit Hilfe von Systemmodellen. Eine potenzielle Erklärung liegt im themenspezifischen Interesse, welches durch das Systemmodell „Vernetzungskreis mit Zeitdiagramm“ gesteigert werden konnte, während es sich in den übrigen Experimentalgruppen über die Zeit tendenziell verringert, F(3, 273) = 3.70, p = .01, ηp2 = .04. Evidenzakkumulierung zur Bestimmung einer wirksamen Klimabildung: Eine Meta-Analyse Vanessa Aeschbach, Martin Schwichow, Werner Rieß PH Freiburg, Deutschland Hintergrund: Der Klimawandel ist eines der dringlichsten Themen unserer Zeit. Zahlreiche wissenschaftliche Belege weisen darauf hin, dass menschliche Aktivitäten und Handlungen wesentlich zum Klimawandel beitragen und mit Folgen für viele natürliche und gesellschaftliche Systeme einhergehen (IPCC 2018; Cook et al. 2013). Schätzungen legen nahe, dass uns weniger als zwölf Jahre verbleiben, um der sich anbahnenden Klimakatastrophe entgegenzuwirken (IPCC 2018; UNFCCC 2016). In diesem Zusammenhang spielt insbesondere die Bildung für eine nachhaltige Entwicklung (BNE) sowie die Klimabildung (englisch Climate Change Education, CCE) eine wichtige Rolle (z.B. UNFCCC 2016). Die Klimabildung soll bei den Lernenden ein Bewusstsein für den Klimawandel, dessen Ursachen und Folgen entwickeln, sowie entsprechende Handlungskompetenzen fördern. In der Literatur finden sich zahlreiche Studien, die unterschiedliche methodische als auch inhaltliche Ansätze untersuchen, um solche Ziele zu fördern (z.B., Cartwright et al., 2021; Deisenrieder et al., 2020; Karpudewan & Mohd Ali Khan, 2017; Reinfried et al., 2012) sowie mehrere Reviews, welche diese Studien inhaltlich beschreiben und zusammenfassen (z.B., Bhattacharya et al., 2021; Kranz et al., 2022). Bislang existieren jedoch noch keine Meta-Analyse, welche die Wirksamkeit von Interventionen im Bereich der Klimabildung quantifizieren. Fragestellung: Das Ziel der vorliegenden Meta-Analyse war es, die Wirksamkeit von Klimabildungsinterventionen auf unterschiedliche Personenmerkmale wie Wissen, Einstellung und Verhalten zu untersuchen. Dabei wurde einerseits der Frage nach der mittleren Wirksamkeit über alle Interventionsstudien hinweg nachgegangen und andererseits der Frage nach Moderatorvariablen, welche Unterschiede in der Wirksamkeit der Studien erklären können. Methode: Das methodische Vorgehen richtete sich nach den typischen Schritten einer Meta-Analyse (PRISMA). Eine systematische Literatursuche wurde durchgeführt in den Datenbanken ERIC, PsycInfo und Web of Science. Zusätzlich wurden Studien auf früheren Reviews miteinbezogen. Die Studien mussten die folgenden Einschlusskriterien erfüllen: (1) eine Bildungsintervention mit einem expliziten Fokus auf das Thema Klimawandel untersuchen, (2) eine Population von Grund- oder Sekundarschülern untersuchen, (3) ein Prä-Post-Design, ein quasi-experimentelles oder ein randomisiertes kontrolliertes Design anwenden, (4) in einer preer-reviewten Zeitschrift veröffentlicht worden sein, (5) in englischer Sprache verfasst sein, sowie (6) ausreichend Daten zur Berechnung von Effektstärken enthalten. Die Daten wurden mittels eines Mehrebenen Ansatzes für Meta-Analysen untersucht. Konkret wurde ein Random-Effects-Modell mit vier Ebenen berechnet, welches Varianz zwischen den einzelnen Effektstärken (Level 1), Varianz innerhalb der einzelnen Subgruppen einer Studie (Level 2), Varianz innerhalb der einzelnen Studien (Level 3), sowie Varianz zwischen den Studien (Level 4) berücksichtigt. Zusätzlich wurden Moderatoranalysen durchgeführt um potentielle Faktoren identifizieren zu können, welche Unterschiede zwischen den einzelnen Effektstärken erklären können. Untersuchte Moderatorvariablen beinhalteten unter anderem die Dauer der Intervention, von wem die Intervention durchgeführt wurde, die Inhalte der Intervention, sowie das Studiendesign. Ergebnisse: Die Datenbankrecherche ergab insgesamt 6 159 Treffer, von denen 53 Studien in die Meta-Analyse eingeschlossen werden konnten. Die Ergebnisse weisen auf einen signifikanten, großen Effekt auf kognitive Variablen hin (42 Studien mit 131 Effektstärken, standardisierte mittlere Differenz [SMD] = 0.77, 95% CI = 0.58, 0.96), einen kleinen, signifikanten Effekt auf einstellungsbezogene Variablen (17 Studien mit 46 Effektstärken, SMD = 0.39, 95% CI = 0.17, 0.62), sowie verhaltensbezogene Variablen (11 Studien mit 30 Effektstärken, SMD = 0.36, 95% CI = 0.12, 0.61). Innerhalb der Moderatoranalysen gab es marginal signifikante Effekte für die Art des Studiendesigns (i.e., Prä-Post Designs erzeugten höhere Effektstärken als andere Designs), die Lehrperson, welche konkreten Inhalte behandelt wurden (i.e., Interventionen, welche die Grundlagen von Klimabildung behandelten, scheinen den Wissenszuwachs besonders effektiv zu fördern), sowie einen singifikanten Effekt für die Dauer der Intervention für einstellungsbezogene Variablen (i.e., 90-minütige oder kürzere Interventionen scheinen effektiver zu sein als längere). Bildung für nachhaltige Entwicklung im gegliederten Schulsystem: Differenzielle Entwicklungsverläufe in der Nachhaltigkeitskompetenz von Schüler:innen? Katja Scharenberg¹, Eva-Maria Waltner², Werner Rieß², Christoph Mischo² ¹LMU München, ²PH Freiburg, Deutschland Theoretischer Hintergrund Die Idee der nachhaltigen Entwicklung erfährt aktuell, mit Blick auf sich verschärfende globale Herausforderungen, neuen „Rückenwind“ und breite gesellschaftliche Akzeptanz. Beim Praxistransfer spielen Bildungsinstitutionen und das Programm einer Bildung für nachhaltige Entwicklung (BNE) an (Hoch)Schulen eine entscheidende Rolle (Rieß et al., 2022). Eine wirksam verankerte BNE vermittelt nachwachsenden Generationen Fähigkeiten, die sie benötigen, um die Herausforderungen der Gegenwart und die Transition in eine zukunftsfähige Gesellschaft zu bewältigen. Auch im Sinne intergenerationaler Gerechtigkeit sollten daher intensive Anstrengungen unternommen werden, die Entwicklung von Nachhaltigkeitskompetenz in einem ganzheitlichen Bildungskonzept zu unterstützen (Waltner et al., 2021). In Baden-Württemberg wurde die Leitperspektive BNE mit dem neuen Bildungsplan für die Sekundarstufe I zum Schuljahr 2016/2017 eingeführt (MWK, 2016). Bislang ist jedoch noch nichts darüber bekannt, inwiefern die Einführung dieser Leitperspektive zur Entwicklung von Nachhaltigkeitskompetenz bei Schüler:innen beiträgt und inwiefern schulstrukturelle Rahmenbedingungen hierbei eine Rolle spielen. Charakteristisch für das deutsche Schulsystem in der Sekundarstufe ist die externe Differenzierung in Bildungsgänge mit unterschiedlichen Anforderungsniveaus. Zwar entwickeln sich die Bundesländer zunehmend hin zur Zweigliedrigkeit, in einigen Bundesländern wie z.B. in Baden-Württemberg gibt es allerdings nach wie vor neben dem Gymnasium eine Reihe weiterer nicht-gymnasialer Schulformen (Neumann et al., 2017; Nikolai, 2022). Eine solche externe Differenzierung kann einerseits zu sozialer Stratifizierung bzw. Segregation (Baumert et al., 2003, 2006) führen. Andererseits eröffnen differenzielle Lern- und Entwicklungsmilieus den Schüler:innen je nach besuchter Schulform unterschiedliche Entwicklungschancen, die dazu führen, dass ihre individuelle Entwicklung ungleich verläuft, erschwert oder sogar verhindert wird (Baumert et al., 2006). Schulformspezifische Schereneffekte im Verlauf der Sekundarstufe wurden wiederholt für die Kompetenzentwicklung von Schüler:innen in verschiedenen Domänen nachgewiesen (z.B. Baumert et al., 2006, 2009, 2010; Becker et al., 2006, 2012; Dumont et al., 2013; Gröhlich et al., 2010a, 2010b; Neumann et al., 2007; Scharenberg et al., 2014). Inwiefern solche Schereneffekte auch für die Entwicklung von Nachhaltigkeitskompetenz existieren, ist bisher jedoch nicht bekannt. Fragestellung Der Beitrag geht daher der Frage nach, inwiefern sich Effekte differenzieller Lern- und Entwicklungsmilieus für die Entwicklung der Nachhaltigkeitskompetenz von Schüler:innen in der Sekundarstufe I nachweisen lassen. Daten und Methode Datengrundlage ist eine Sekundäranalyse basierend auf der Studie „BNE im Unterricht – Gelingensbedingungen für die Entwicklung von Nachhaltigkeitskompetenz“ (BUGEN). Dabei wurden zu Beginn und Ende des Schuljahres 2018/2019 kognitive (Nachhaltigkeitswissen), affektive (nachhaltigkeitsbezogene Einstellungen), verhaltensbezogene (selbstberichtetes nachhaltigkeitsbezogenes Verhalten) Aspekte der Nachhaltigkeitskompetenz erfasst. Die Analysestichprobe umfasste n=1.178 Schüler:innen (Jahrgangsstufen 5–8) aus 63 Schulklassen aus zehn zufällig ausgewählten Schulen in Baden-Württemberg. Methodisch wurde ein Mehrebenenmodell (Mplus 8.7.1; Muthén & Muthén, 2022) mit zwei Analyseebenen spezifiziert. Abhängige Variable war die Nachhaltigkeitskompetenz am Schuljahresende. Prädiktoren auf Individualebene waren das Geschlecht, die Sprache im Haushalt und die Nachhaltigkeitskompetenz zu Schuljahresbeginn. Auf Klassenebene wurde für über Aggregation gebildete Kompositionsmerkmale und die Schulformzugehörigkeit kontrolliert. Ergebnisse Die Varianzzerlegung ergab signifikante Unterschiede zwischen Schulklassen für das Wissen (ICC=0.376), die Einstellungen (ICC=0.114) und das Verhalten (ICC=0.112, jeweils p<.001), die auf die Bedeutsamkeit der Schulklassenzugehörigkeit hinweisen. Mehrebenenanalysen zeigten für alle drei Facetten der Nachhaltigkeitskompetenz, dass das jeweilige Ausgangsniveau zu Schuljahresbeginn unter Kontrolle des Geschlechts und der Sprache im Haushalt der stärkste Prädiktor ist (Wissen: β=0.558; Einstellungen: β=0.521; Verhalten: β=0.511, jeweils p<.001). Auf Aggregatebene ließen sich für alle drei Kompetenzfacetten günstigere Entwicklungen bei höherem durchschnittlichen Ausgangsniveau zu Schuljahresbeginn (Wissen: β=0.448, p<.001; Einstellungen: β=0.406, p<.05; Verhalten: β=0.247, p<.10) nachweisen. Schulformspezifische Schereneffekte bestanden zugunsten der Gymnasien (Wissen: β=0.431, p<.05) sowie zuungunsten der Gemeinschaftsschulen (Einstellungen: β=-0.679, Verhalten: β=-0.637, jeweils p<.001). Diskussion Die vorliegende Studie belegt erstmals differenzielle Entwicklungsverläufe für verschiedene Facetten der Nachhaltigkeitskompetenz bei Schüler:innen in Abhängigkeit der besuchten Schulform. Die Befunde sind insofern problematisch, als es Schulen offenbar in unterschiedlichem Ausmaß gelingt, nachwachsende Generationen auf aktuelle, gesamtgesellschaftlich bedeutsame Herausforderungen vorzubereiten. Abschließend soll diskutiert werden, welche Rolle hierbei die Lehrkräfte spielen.
10:30 - 12:10	1-10: Die Erfassung epistemischer Überzeugungen – Herausforderungen und neue Wege Ort: S26
	Symposium Die Erfassung epistemischer Überzeugungen – Herausforderungen und neue Wege Chair(s): Belinda Berweger (Friedrich-Schiller-Universität Jena), Eric Klopp (Universität des Saarlandes, Deutschland) Diskutant*in(nen): Tom Rosmann (Leibniz-Instituts für Psychologie) Epistemische Überzeugungen sind die Annahmen einer Person über Wissen und den Prozess des Wissenserwerbs (Gruber & Stamouli, 2009). Sie beeinflussen, wie eine Person mit Wissen umgeht – ob sie einer Aussage traut, sie in Frage stellt, überdenkt oder ablehnt (Oschatz, 2011). Zudem stehen epistemische Überzeugungen in Zusammenhang mit verschiedenen bedeutenden Lernergebnissen, wie bspw. Studienerfolg oder Konzeptwandel (vgl. Greene, Cardiff & Duke, 2018, Stathopoulou & Vosniadou 2007). Daher sind Instrumente zur Erfassung epistemischer Überzeugungen mit entsprechend guten psychometrischen Eigenschaften erforderlich. Allerdings weisen diese jedoch häufig schlechte psychometrische Eigenschaften auf (vgl. Greene & Yu, 2014) bzw. zeigen nicht oder nur schlecht replizierbare Faktorenstrukturen (vgl. DeBacker et al., 2008; Klopp & Stark, 2017; Moschner & Gruber, 2017). Zum einen werfen Befunde wie mangelnde Replizierbarkeit der Faktorenstruktur Fragen nach deren Ursachen auf, zum anderen sind solche Befunde problematisch hinsichtlich der Interpretation der Skalen(werte) sowie der Interpretation der Zusammenhänge von epistemischen Überzeugungen mit Lernergebnissen. In diesem Symposium werden drei Beiträge vereint, die sich mit der psychometrischen Modellierung epistemischer Überzeugungen sowie den damit verbundenen Problemen befassen und diese sowohl aus empirischer als auch aus theoretischer Perspektive betrachten. Alle Beiträge verwenden Faktorenanalysen und unterstreichen die Abhängigkeit der Struktur der epistemischen Überzeugungen von der jeweiligen Domäne bzw. Thema (vgl. Muis, Bendixen & Hearle, 2006). Der erste Beitrag bietet eine umfassende Validierung eines domänenspezifischen Instruments zu pädagogischem Wissen. Untersucht wird einerseits die Faktorenstruktur der drei Faktoren Absolutismus, Multiplizismus und Evaluativismus sowie andererseits die Zusammenhänge dieser Faktoren mit Lernstrategien und mit Skalen aus anderen Instrumenten zur Messung epistemischer Überzeugungen. Die Ergebnisse weisen auf eine unklare Faktorenstruktur hin, deuten andererseits aber auf diskriminante und konvergente Validität der in der Studie ermittelten Faktoren hin. Der zweite Beitrag kombiniert Instrumente, die epistemische Überzeugungen auf verschiedenen Ebenen (allgemein, themen- und situationsspezifisch) erfassen, und damit feinere Facetten jenseits der üblichen Dimensionen identifiziert. Es wird weiterhin vorgeschlagen, dass bei der Konstruktion von Skalen zur Erfassung epistemischer Überzeugungen die jeweilige Domäne bzw. das Thema sowie das jeweilige Vorwissen berücksichtigt werden müssen. Zudem wird angesprochen, welche weiteren Perspektiven sich hinsichtlich der psychometrischen Modellierung epistemischer Überzeugungen bieten, z.B. als Kombination der üblichen variablen-zentrierten Ansätzen (z.B. faktorenanalytische Verfahren) mit personen-zentrierten Ansätzen (z.B. Profilanalysen). Im Gegensatz dazu betont der dritte Beitrag, dass die zeitliche Perspektive sowie die Domänenabhängigkeit epistemischer Überzeugungen berücksichtigt werden sollte. Dabei wird argumentiert, dass die übliche Konzeptualisierung epistemischer Überzeugungen im Sinne interinterindividueller Differenzen die zeitliche Dynamik der Veränderung epistemischer Überzeugungen nicht adäquat berücksichtigt. Der Beitrag zeigt auf, dass die aus Querschnittsdaten gewonnen Dimensionen interindividueller Unterschiede nicht mit der Struktur der aus Längsschnittdaten gewonnen Dimensionen intraindividueller Überzeugungen übereinstimmt. Zudem werden in dem Beitrag die zeitlichen Abhängigkeiten aktueller von früheren epistemischen Überzeugungen sowie deren Domänenabhängigkeit thematisiert und aufgezeigt, dass somit die Grundlage zur validen Erfassung interindividueller Unterschiede auf Basis von Querschnittsdaten fehlt. Es zeigt sich, dass der im Beitrag gezeigte Ansatz neue Erkenntnisse für die Theorieentwicklung bietet. Insgesamt zeigen die drei Beiträge, dass die Zusammenführung verschiedener Ansätze und Perspektiven über die übliche Modellierung epistemischer Überzeugungen mittels (explorativen oder konfirmatorischen) Faktorenanalysen hinaus möglich und erkenntniserweiternd, wenn auch aus methodischer Sicht anspruchsvoll, ist. Die Beiträge werden abschließend zusammengeführt und von einem Experten auf dem Gebiet epistemischer Überzeugungen kritisch diskutiert und eingeordnet. Beiträge des Symposiums Wie denken Studierende über wissenschaftliche Erkenntnisse zu Bildung? Validierung eines Instruments zur Messung epistemischer Überzeugungen Belinda Berweger, Florentine Diersch, Bärbel Kracke, Julia Dietrich Friedrich-Schiller-Universität Jena Theoretischer Hintergrund Der Erwerb pädagogisch-psychologischen Fachwissens ist für die professionelle Kompetenz von Studierenden der Erziehungswissenschaft und des Lehramts essenziell (Kunina-Habenicht & Terhart, 2020). Bildungswissenschaftliches Wissen besteht jedoch häufig aus widersprüchlichen Befunden, ist stark kontextabhängig und durch persönliche Bildungserfahrungen von Lernenden geprägt (Bromme et al., 2014). Im (reflektierten) Umgang mit Wissen spielen epistemische Überzeugungen von Studierenden eine zentrale Rolle (Rosman et al., 2017). Sie werden als „Vorstellungen eines Individuums zu Wissen und seiner Genese“ (Oschatz, 2011, S. 25) definiert. Epistemische Überzeugungen sind assoziiert mit dem selbstregulierten Lernen (Muis et al., 2006), dem Umgang mit widersprüchlichen Informationen (Rosman et al., 2017) und mit der Qualität des pädagogischen Handelns (Dubberke et al., 2008). Basierend auf dem Fragebogen zur Erfassung des Entwicklungsniveaus epistemologischer Überzeugungen (FREE; Krettenauer, 2005) entwickelten Merk et al. (2017) eine domänenspezifisch adaptierte Version des FREE zu pädagogischem Wissen. Dieser erfasst anhand szenariobasierter Aussagen zu unterschiedlichen Bildungsthemen (z.B.: „Immer wieder wird diskutiert, ob ‚Sitzenbleiben‘ tatsächlich sinnvoll ist oder abgeschafft werden sollte.“) den individuellen Entwicklungsstand epistemischer Überzeugungen (Absolutismus, Multiplizismus und Evaluativismus) von Studierenden. Laut Kuhn (1991) wird die Art über Wissen zu denken zunehmend sophistizierter, sodass sich Individuen von absoluten Ansichten wie „Wissen ist eindeutig wahr oder falsch“ zu multiplizistischen Ansichten wie „Wissen ist willkürlich und basiert auf subjektiven Meinungen“ und schließlich zunehmend hin zu evaluativistischen Ansichten wie „Wissen ist durch die Bewertung und Gewichtung von Beweisen mehr (oder weniger) sicher“ entwickeln. Im FREE wird der individuelle Entwicklungsstand einer Person anhand eines D-Index quantifiziert. Bisher wurde jedoch nicht untersucht, ob die im D-Index enthaltenen Items tatsächlich die Faktoren Absolutismus, Multiplizismus und Evaluativismus messen. Methoden Im vorliegenden Beitrag wurde der FREE mittels konfirmatorischer Faktorenanalyse (CFA) und Exploratory Structrual Equation Modeling (ESEM) an einer Stichprobe von N = 468 Lehramtsstudierenden und N = 149 Studierenden der Erziehungswissenschaften validiert. Es wurden unterschiedliche Modelle (u.a. Correlated Trait-Correlated Uniqueness Model) gerechnet, um der verschachtelten Struktur des Fragebogens Rechnung zu tragen (d.h., drei Einzelitems beziehen sich jeweils auf einen gemeinsamen Stimulus). Wir prüften außerdem auf konvergente und diskriminante Validität anhand zusätzlicher Instrumente zur Messung von epistemischen Überzeugungen (EBI-AM; Peter et al., 2017, FEE; Moschner & Gruber, 2017) und ein Instrument zur Erfassung von Lernstrategien im Studium (LIST-K; Klingsieck, 2019). Ergebnisse und Diskussion Die Ergebnisse zeigen eine schlechte Passung der Messmodelle zu den Daten und damit keine interne faktorielle Validität des Instruments FREE. Dies ist im Einklang mit früheren Befunden, die ebenfalls eine schlechte psychometrische Qualität von Instrumenten zur Erfassung epistemischer Überzeugungen feststellten (Greene & Yu, 2014). Die konvergente Validität konnte für die Skalen Absolutismus und Multiplizismus bestätigt werden, die positiv mit den äquivalenten Skalen des FREE korrelierten. Entgegen den Erwartungen zeigten sich allerdings keine Zusammenhänge zwischen der FEE-Skala „Reflexive Natur des Wissens“ und der Evaluativismus-Skala des FREE. Im Einklang mit früheren Befunden (z.B. Dahl et al., 2005) waren tiefenorientierte Lernstrategien (Elaboration, kritisches Denken, Regulation) mit multiplizistischen und evaluativistischen Überzeugungen assoziiert. Im Widerspruch zu vorherigen Befunden korrelierte die oberflächliche Lernstrategie Rehearsal nicht mit Absolutismus. Die Befunde der vorliegenden Studie sowie frühere Ergebnisse (z.B. Barzilai & Weinstock, 2015) werfen die Frage auf, ob faktorenanalytische Messmodelle überhaupt in der Lage sind, die komplexe Struktur szenariobasierter Instrumente zur Erfassung epistemischer Überzeugungen adäquat abzubilden. Ein Konstrukt mit variabler Struktur? Überlegungen zur Messung epistemischer Überzeugungen Martin Greisel, Ingo Kollar Universität Augsburg Theoretischer Hintergrund Epistemische Überzeugungen über die Natur des Wissens und den Wissenserwerb stellen eine mögliche Brille dar, durch die Lernende betrachten, was und wie sie lernen (Bernholt et al., 2017; Hofer & Pintrich, 1997; Kuhn, 1991). Theoretisch sollten sie daher Lernprozesse vorhersagen können. Dazu ist aber Klarheit nötig, welche Überzeugungen genau existieren. Die faktorielle Struktur von epistemischen Überzeugungen variiert jedoch über Messinstrumente und -situationen hinweg, so dass diesbezüglich nach drei Jahrzehnten noch immer keine Einigkeit besteht (Barzilai & Weinstock, 2015; Klopp & Stark, 2017; Moschner & Gruber, 2017). Wir schlagen daher ein neues Vorgehen auf Basis einer veränderten Grundannahme vor: Epistemische Überzeugungen sind je nach a) Thema und b) Vorwissen der Befragten zu diesem Thema nicht nur unterschiedlich ausgeprägt (Barzilai & Weinstock, 2015), sondern auch unterschiedlich strukturiert. Für die Konstruktion entsprechender Messinstrumente ergibt sich dadurch, dass (1) zu allen bisher nur implizit in verschiedenen Instrumenten aufscheinenden Subfacetten epistemischer Dimensionen eigenständige Kurzskalen konstruiert werden müssen. (2) Für eine Studie sollten dann aus diesem Pool von Facetten nur genau jene ausgewählt werden, die für das vorliegende Thema und diesbezüglich vorhandenes Vorwissen auch relevant sind. (3) Mittels personenzentrierter Verfahren wird untersucht, ob sich aus diesen Facetten übergreifende Perspektiven (= Typen/Cluster) zusammensetzen – gültig nur für die spezifische Kombination aus Thema und Vorwissen. Um diese Grundannahme zu stützen, analysieren wir die Faktorstruktur verschiedener populärer Instrumente in zwei Stichproben und leiten daraus erste Vorschläge für die zukünftige Messung epistemischen Überzeugungen ab. Methode In zwei explorativen Studien beantworteten N=285 und N=254 Lehramtsstudierende (75%/78% weiblich; M=21.67/22.56 [SD=2.51/4.30] Jahre; im M=4.47/4.61 [SD=1.25/1.20] Semester) verschiedene Fragebögen. In Studie 1 wurden die epistemischen Überzeugungen auf drei verschiedenen Ebenen gemessen: allgemein, themenspezifisch und situationsspezifisch. Für allgemeine epistemische Überzeugungen verwendeten wir vier Skalen aus dem Fragebogen zur Erfassung epistemischer Überzeugungen (FEE; Moschner & Gruber, 2017): Gewissheit des Wissens („wissenschaftliches Wissen ist objektiv und stabil“), Autorität („Vertrauen in Autorität/Experten“), reflexive Natur des Wissens („Wissen entwickelt sich durch Reflexion und neue Erkenntnisse“) und soziale Komponente des Wissens („Wissen ist nur real, wenn es öffentlich ist“). Mit dem Topic-Specific Epistemic Beliefs Questionnaire (TSEBQ; Bråten et al., 2009) wurden die Dimensionen Gewissheit („Wissen ist instabil“), Quelle („Vertrauen in die Quelle“), Einfachheit („Wissen ist einfach“) und Rechtfertigung („Wissen muss selbst bewertet werden“) gemessen. Zuletzt wurden mit dem Epistemic Thinking Assessment (ETA; Barzilai & Weinstock, 2015) die epistemischen Perspektiven Absolutismus, Multiplizismus und Evaluativismus in Studie 1 in Bezug auf ein spezifisches, in einem Video gezeigtes Lernproblem (Beispiel-Itemstamm „Gibt es eine Antwort darauf, was das Problem bei der Gruppenarbeit im Video ist?“) und in Studie 2 bezogen auf das Thema „problematische Unterrichtssituationen“ gemessen (Beispiel-Itemstamm „Gibt es eine Antwort darauf, wie man eine problematische Unterrichtssituation lösen kann?“). Ergebnisse Konfirmatorische Faktoranalysen wiesen für keines der Instrumente einen adäquaten Fit der jeweils theoretisch angenommenen Faktorstruktur aus, CFI<.74, TLI<.70, RMSEA>.065, SRMR>.085. In explorativen Faktorenanalysen (oblique Rotation) luden die Items zur sozialen Komponente des Wissens (FEE) und zur Einfachheit des Wissens (TSEBQ) nicht auf je einem gemeinsamen Faktor und wurden daher ganz von der weiteren Analyse ausgeschlossen. Bezogen auf zukünftig zu berücksichtigende Facetten hier exemplarisch die Befunde zur Dimension „Gewissheit”: Der FEE enthielt Gewissheits-Items, die auf zwei Facetten „Objektivität“ und „Stabilität“ luden, wohingegen der TSEBQ die Facetten „Vorläufigkeit des Wissens“ und „Mehrdeutigkeit des Wissens“ unterschied. Das ETA enthielt absolutistische, multiplizistische und evaluativistische Varianten von Gewissheit. Diskussion Angenommene Faktorstrukturen konnten für die vorliegenden Kombinationen aus Probandenvorwissen und Thema nicht repliziert werden. Zukünftige Fragebogenentwicklung sollte mindestens für die Varianten der Gewissheit von Wissen eigenständige Kurzskalen bereitstellen, die dann je nach Thema und Vorwissen zur Erfassung epistemischer Überzeugungen herangezogen werden können. Analog sind auch für die anderen Dimensionen Differenzierungen vorzunehmen. R- und P-epistemische Überzeugungen – Über die inter- und intraindividuelle Struktur epistemischer Überzeugun Eric Klopp, Robin Stark Universität des Saarlandes Theoretischer Hintergrund Im dimensionalen Ansatz werden epistemische Überzeugungen (eÜ) als Dimensionen interindividueller Unterschiede konzeptualisiert und ihre dimensionale Struktur aus Querschnittsdaten abgeleitet. Dieser Datentyp stellt R-Daten im Sinne Cattels (1952) dar. Im Folgenden werden die aus R-Daten abgeleiteten eÜ daher als R-eÜ bezeichnet. Ein Beispiel sind die beiden domänenspezifischen Dimensionen Textur und Variabilität des Wissens, die aus dem CAEB-Fragebogen abgeleitet wurden (Stahl & Bromme, 2007). Die übliche Annahme ist, dass die dimensionale Struktur interindividueller Unterschiede der dimensionalen Struktur intraindividueller Unterschiede entspricht. Letztere wird aus Längsschnittdaten abgeleitet, die nach Cattel (1952) als P-Daten bezeichnet werden. Daher wird im Folgenden die Struktur intraindividueller eÜ als P-eÜ bezeichnet. Allerdings stellt sich die Frage, ob diese Annahme zutreffend ist (Molenaar & Campbell, 2009). Z.B. kann dies für die Big Five verneint werden (Borkenau & Ostendorf, 1998). Da es sich bei den P-Daten um wiederholte Messungen handelt, können außerdem vorhergehende P-eÜ die aktuellen P-eÜ beeinflussen. Zudem sind eÜ domänenabhängig (Muis et al., 2006), d. h. die derzeit in der Wahrnehmung einer Person saliente Domäne kann die aktuellen eÜ einer Person beeinflussen, was wegen der Variabilität der salienten Domäne wiederum auf die Variabilität der eÜ innerhalb einer Person hindeutet. Fragestellung In der vorliegenden, explorativen Pilotstudie soll mittels Längsschnittdaten die dimensionale Struktur von P-eÜ mittels des CAEB untersucht werden. Darüber hinaus soll untersucht werden, ob frühere P-eÜ bzw. die saliente Domäne die aktuellen P-eÜ beeinflussen. Methoden Die Stichprobe besteht aus zwei Studierenden, die an N=80 aufeinanderfolgenden Tagen nach der täglichen Lernaktivität den CAEB in Bezug auf die saliente Domäne (Stahl & Bromme, 2007) bearbeiteten. Zusätzlich wurde die saliente Domäne erfasst und mit einer Dummy-Kodierung versehen. Eine P-Technik EFA (Molenaar & Nesselroade, 2009) mit Geomin-Rotation wurde zur Bestimmung der P-eÜ benutzt. Die Anzahl der P-Faktoren wurde anhand von Informationskriterien bestimmt. Anschließend wurden die Faktorenscores in einem vektorautoregressiven (VAR) Modell verwendet, um die zeitliche Abhängigkeit der aktuellen P-eÜ von früheren sowie die Abhängigkeit von der salienten Domäne zu untersuchen. Ergebnisse Der erste Teilnehmer lernte in den Domänen Interkulturelle Kommunikation, Wirtschaft und Deutschdidaktik. Es ergaben sich drei P-Faktoren: Genaues/absolutes Wissen (EAK), Dynamisches Wissen (DK) und Offenes/relatives Wissen (ORK). Das VAR-Modell ergab, dass für EAK und ORK die P-eÜ des Vortages signifikante Prädiktoren für die aktuellen P-eÜ waren (βEAK=.25, βOK=.25). Zusätzlich war für EAK der Deutschdidaktik-Dummy signifikant (βDeutschd=-.67). Der zweite Teilnehmer lernte in den Domänen Französische Sprachwissenschaft, Theologie und Bildungswissenschaften. Es ergaben sich vier P-Faktoren: Objektives Wissen (OK), Genaues/präzises Wissen (EPK), Dynamisches/offenes Wissen (DOK) und Sortiertes/strukturiertes Wissen (SSK). Das VAR-Modell zeigte, dass für alle Faktoren die Vortage signifikante Prädiktoren waren (βOK=.67, βEPK=.37, βDOK=.49, βSSK=.78). Für DOK war zusätzlich der Faktor OK des Vortages ein signifikanter Prädiktor (βDOK,OK=.28). Für ENK waren die Dummyvariablen für Theologie und Bildungswissenschaften signifikante Prädiktoren (βTheol=-.69, βBiwi=-.79). Diskussion Die Ergebnisse zeigen, dass R-eÜ und P-eÜ strukturell nicht übereinstimmen. Die Struktur der R-eÜ kann also nicht auf einzelne Personen übertragen werden. Darüber hinaus zeichneten sich Abhängigkeiten der aktuellen P-eÜ von vorhergehenden P-eÜ sowie von der aktuell salienten Domäne ab. Insgesamt deutet dies auf eine Aktualgenese der P-eÜ in Abhängigkeit von der salienten Domäne sowie den zeitlich vorhergehenden P-eÜ hin. Dies kann zu potenziellen Problemen bei der Messung von R-eÜ führen, da die querschnittlichen R-Daten bedingt durch die jeweilige Aktualgenense keine gemeinsame Grundlage aufweisen (Borsboom et al., 2009). Ein häufiger Befund sind nicht replizierbare R-Faktorenstrukturen (DeBacker et al., 2008), eine mögliche Erklärung dafür kann in der Zeit- und Domänenabhängigkeit der P-eÜ in Kombination mit der Inkongruenz von R-und P-eÜ liegen. Allerdings weist die Pilotstudie auch Limitationen auf. So sind mehr Probanden mit längeren Bobachtungsreihen und eine weiterführende statistische Modellierung, z.B. mit dynamischen Faktormodellen, und mit anderen, domänenspezifischen und domänenübergreifenden, Messinstrumenten nötig.
10:30 - 12:10	1-11: Wie kann der Transfer sprachbildender Maßnahmen und Konzepte gelingen? Ort: S27
	Symposium Wie kann der Transfer sprachbildender Maßnahmen und Konzepte gelingen? Chair(s): Kathrin Hippmann (Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache, Universität zu Köln) Diskutant*in(nen): Natalie Förster (Bergische Universität Wuppertal) In einer Vielzahl wissenschaftlicher Untersuchungen wurde die Wirksamkeit von Maßnahmen und Konzepten zur Förderung (schrift-)sprachlicher Fähigkeiten belegt (z. B. Schneider, 2019). Die Übertragung und Umsetzung evidenzbasierter Innovationen in die schulische Praxis erweist sich jedoch häufig als problematisch und geht meist mit verringerten messbaren Effekten auf die angesprochenen Kompetenzen der Schüler:innen einher (ebd.; Dignath & Büttner, 2008). Wie der Transfer von wissenschaftlich evaluierten Maßnahmen und Konzepten so gelingt, dass ihre Wirksamkeit auch im schulischen Alltag erhalten bleibt, und wie Lehrkräfte darin unterstützt werden können, diese langfristig in der Praxis zu implementieren, bedarf weiterer Forschung (Souvignier & Philipp, 2016). Hier setzt das Forschungsnetzwerk BiSS-Transfer an, um Erkenntnisse darüber zu gewinnen, wie wissenschaftlich evaluierte sprachbildende Maßnahmen und Konzepte unter Anwendung eines Multiplikationsansatzes effektiv und erfolgreich in die Praxis transferiert werden können. Die Vorhaben des Forschungsnetzwerks fokussieren verschiedene (schrift-)sprachfördernde Maßnahmen und Konzepte sowohl für die Primar- als auch die Sekundarstufe. Dabei wird die gesamte Wirkungskette von der Qualifizierung von Multiplikator:innen über die Fortbildung von Lehrkräften und die Umsetzung der Maßnahmen im Unterricht bis hin zur Erfassung der Wirksamkeit auf die angezielten Kompetenzen der Schüler:innen untersucht. Die Fortbildung von Lehrkräften bietet das Potenzial, wissenschaftlich erprobte Konzepte für eine nachhaltige Schul- und Unterrichtsentwicklung zu nutzen (Gräsel, 2010). Durch Fortbildungen sollen den Lehrkräften das grundlegende Wissen sowie eine positive Einstellung zur Umsetzung der Innovation vermittelt und dadurch Veränderungen im professionellen Handeln erzielt werden. Allerdings sind eine Vielzahl von Faktoren zu beachten, die sich auf den Fortbildungs- bzw. auf den Transfererfolg auswirken können. Zur systematischen Untersuchung des Erfolgs von Lehrkräftefortbildungen und den Faktoren, die diesen beeinflussen, kann das Angebots-Nutzungs-Modell von Lipowsky (2011) herangezogen werden. Der Transfererfolg wird in diesem Modell auf verschiedenen Ebenen betrachtet. Auf der ersten Ebene wird die direkte Reaktion der Lehrkräfte auf die Fortbildung betrachtet (z. B. die Zufriedenheit), aber auch transferrelevante Einstellungen. Die nächste Ebene bezieht sich auf das erworbene Wissen sowie auf Veränderungen von Überzeugungen und Einstellungen. Daran schließen sich Veränderungen des professionellen Handelns bzw. eine verbesserte Unterrichtsqualität an. Schließlich werden auf der letzten Ebene messbare Veränderungen wie bspw. Kompetenzsteigerungen bei den Schüler:innen erfasst. Die im Symposium vorgestellten Beiträge aus den Vorhaben des Forschungsnetzwerks BiSS-Transfer beleuchten den fortbildungsbasierten Transfererfolg auf unterschiedlichen Ebenen und widmen sich der Frage, wodurch dieser gehemmt oder gestützt wird. Als transferrelevante Einstellungen betrachten alle Beiträge unter anderem die Akzeptanz als grundlegende Zufriedenheit mit der Innovation sowie die Machbarkeit als wahrgenommene Umsetzbarkeit einer Innovation in Schule und Unterricht (Meudt et al., 2020). Der erste Beitrag untersucht Rahmenbedingungen, sowie Merkmale von Multiplikator:innen und Qualifizierungen auf ihre Relevanz für die transferrelevanten Variablen Akzeptanz und Machbarkeit. Der zweite Beitrag untersucht Effekte einer Fortbildung zur datenbasierten Unterrichtsentwicklung im Kompetenzbereich Lesen auf die Zufriedenheit sowie transferrelevante Einstellungen der fortgebildeten Lehrkräfte und vergleicht zwei Bedingungen: a) Fortbildung durch Expert:innen und b) durch Multiplikator:innen. Der dritte Beitrag betrachtet die Umsetzung einer systematischen Schreibförderung und untersucht die Veränderung von Variablen, die potenziell Einfluss auf einen gelungenen Transfer nehmen. Hierbei werden das schreibbezogene Unterrichtshandeln und die schreibbezogenen Überzeugungen von Lehrkräften vor und nach der Implementation analysiert. Der vierte Beitrag fokussiert die Entwicklung der Veränderungen implementationsrelevanter Variablen im Verlauf des Transferprozesses auf der Lehrkräfteebene während der Implementation einer Leseintervention und leitet daraus Empfehlungen für die Unterstützung von Lehrkräften bei der nachhaltigen Verankerung von Innovationen in die Praxis ab. Der fünfte Beitrag untersucht die Kompetenzentwicklung von Lehrkräften durch eine Fortbildung zum sprachbildenden Mathematikunterricht sowie den Einfluss systemischer Faktoren und der wahrgenommenen Eignung des Förderkonzepts für die Praxis auf dessen Akzeptanz und eingeschätzte Machbarkeit. Die Beiträge des Symposiums liefern Erkenntnisse zu Gelingensbedingungen des erfolgreichen Transfers von Maßnahmen und Konzepten zur Sprachbildung. Sie werden abschließend mit Blick auf forschungs- und praxisrelevante Aspekte diskutiert. Beiträge des Symposiums Prädiktoren für den Transfererfolg von Qualifizierungen für Multiplikator:innen in der sprachlichen Bildung Antonia Schmidt, Sonja Sieger, Cedric Lawida, Hans-Joachim Roth Universität zu Köln In BiSS-Transfer werden Multiplikator:innen in einem Blended Learning-Format zu Maßnahmen und Konzepten der sprachlichen Bildung qualifiziert, um anschließend die entsprechenden Inhalte in Lehrkräftefortbildungen zu vermitteln. Dieser Multiplikationsansatz gilt als effektiv und ressourcenschonend um Fortbildungsinhalte aus der Wissenschaft an Lehrkräfte weiterzugeben (Behr, Leidig, Krull, Spilles & Hennemann, 2021). Allerdings gelten Erkenntnisse über die Merkmale von Fortbildner:innen bzw. Multiplikator:innen im Rahmen von Fortbildungen für Lehrkräfte als Forschungsdesiderate (Lipowsky, 2019). Für die Einschätzung zum Erfolg von Fortbildungen, im Hinblick auf den Transfer von Innovationen in Schulen, sind Akzeptanz und Machbarkeit transferrelevante Konstrukte (Meudt, Zeuch, Neuber & Souvignier, 2020). Der Beitrag fokussiert daher, ob Rahmenbedingungen, Merkmale der Multiplikator:innen und ihre Evaluation der Qualifizierung die Akzeptanz und antizipierte Machbarkeit der Maßnahmen vorhersagen können. An den relevanten Erhebungen haben 49 Multiplikator:innen teilgenommen, die überwiegend weiblich (84%) waren und ein Durchschnittsalter von 45.43 Jahren hatten (SD=8.01). Als Merkmale der Multiplikator:innen wurden die beruflichen Qualifikationen dieser Gruppe einbezogen (Lipowsky, 2019). Hierzu wurde betrachtet, ob die Multiplikator:innen zum Zeitpunkt der Qualifizierung als Lehrkräfte tätig waren und wieviel Erfahrungen sie in Bereichen der Fort- und Weiterbildung von Erwachsenen hatten (Methodik und Didaktik, Begleitung/Coaching, Blended-Learning) (3 Items, α=.798). Unter Rahmenbedingungen wurde erfasst, ob sie noch weitere Fortbildungen parallel gaben, ob sie eigeninitiativ teilgenommen haben und wie viel Selbstgestaltungsspielraum sie bei der Bearbeitung der Qualifizierungsinhalte empfunden haben. Die Evaluation wurden mit zwei Skalen erfasst: (1) Zusammenfassenden Bewertung der Qualifizierung (3 Items, α=.787). Die Multiplikator:innen schätzten hier ein, ob ihre Erwartungen an die Qualifizierung erfüllt wurden, ob sie erneut teilnehmen und sie weiterempfehlen würden. (2) Wahrgenommener Praxisbezug (2 Items, α=.748), der die Praxisrelevanz der Inhalte und der Didaktik in der Qualifizierung abfragte. Die abhängigen Variablen wurden durch die Skalen Akzeptanz (10 Items, α=.892) und Machbarkeit (7 Items, α=.844) erhoben (Meudt et al., 2020). Multiple Regressionsanalysen zeigen, dass ein Modell, in das die drei oben genannten Variablen zu den Rahmenbedingungen als Prädiktoren eingeflossen sind 27,9% der Varianz in der Machbarkeit aufklären kann (p=.009). Als unabhängiger Prädiktor stellte sich die Durchführung paralleler Fortbildungen heraus (β=-.64, p=.012). Merkmale der Multiplikator:innen und Evaluationen der Qualifizierung haben keine signifikanten Modelle mit Machbarkeit ergeben. Ein Modell, in das die zwei Skalen zur Evaluation als Prädikatoren eingeflossen sind, zeigt, dass dieses 26,6% der Streuung in den Akzeptanz-Bewertungen erklären kann (p=.004). Als unabhängiger Prädikator konnte die zusammenfassende Bewertung die Akzeptanz am besten vorhersagen (ß=.41, p=.008). Hier haben Rahmenbedingungen und Merkmale der Multiplikator:innen keine signifikante Vorhersagekraft. Merkmale der Multiplikator:innen können in Regressionsmodellen weder Machbarkeit noch Akzeptanz signifikant vorhersagen. Es wird also deutlich, dass besonders veränderbare Faktoren eine Rolle für die transferrelvanten Einstellungen der Multiplikator:innen spielen, während fixe Merkmale hier keine Effekte zeigen. Hinsichtlich der Machbarkeit sollte bei der Planung von Qualifizierungsmaßnahmen und der Akquise von Multiplikator:innen darauf geachtet werden, dass diese eigeninitiativ teilnehmen, genug Selbstgestaltungsfreiraum bekommen und vor allem nicht zu sehr durch parallele Tätigkeiten ausgelastet sind. Für die Akzeptanz der Maßnahme hingegen ist es wichtig, dass die Qualifizierung einen Praxisbezug herstellt und besonders, dass die Multiplikator:innen diese zusammenfassend positiv bewerten, dies äußert sich darin, dass ihre Erwartungen erfüllt sind, sie erneut teilnehmen und die Qualifizierung weiterempfehlen würden. Hingegen scheint es in dieser Stichprobe für die transferrelevanten Einstellungen keine Rolle zu spielen, ob Multiplikator:innen selbst Lehrkräfte sind oder Vorerfahrungen in verschiedenen Bereichen der Fort- und Weiterbildungen haben. Es zeigt sich, dass es trotz der Betonung der Wichtigkeit von Merkmalen der Multiplikator:innen (Lipowsky, 2019), schwierig ist, relevante Merkmale herauszukristallisieren. Dieses Problem besteht auch weiter, wenn Merkmale der Multiplikator:innen in ihrer Wirkung auf Lehrkräfteeinstellungen untersucht werden (Hagena, Bruns & Gasteiger, 2022; Rzejak & Lipowsky, 2019). Dies soll im weiteren Projektverlauf betrachtet werden. Effekte unterschiedlicher Transferbedingungen auf den Erfolg von Lehrkräftefortbildungen Carola Schnitzler¹, Daria Frencik-Lehmkuhl², Charlotte Stehr², Sofie Henschel¹, Jörg Jost² ¹Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin, ²Institut für Deutsche Sprache und Literatur II an der Universität zu Köln Lehrkräftefortbildungen bilden ein wesentliches Element zur Verbreitung von Innovationen im Bildungssystem und haben damit ein hohes Potenzial für die Weiterentwicklung der Schul- und Unterrichtsqualität (Gräsel, 2010). Lipowsky und Rzejak (2012) betrachten Lehrkräftefortbildungen als multifaktoriell bedingten Prozess und ihren Erfolg als eine Wirkungskette, die mehrere Ebenen umfasst. Die Konzeption und Durchführung qualitativ hochwertiger Fortbildungen, in denen Lehrkräfte das erforderliche Wissen und notwendige Handlungskompetenzen erwerben, um Fortbildungsinhalte im schulischen Alltag gut umsetzen zu können, sind mit vielfältigen Anforderungen und Aufgaben seitens der Fortbildner:innen verbunden (vgl. Rzejak, Lipowsky & Bleck, 2020; Prediger, 2019). Die Verbreitung von Innovationen im Bildungssystem kann allein durch Expert:innen (z. B. Fachdidaktiker:innen) nur in einem begrenzten Ausmaß erfolgen. Insofern bietet es sich an, die Verbreitung durch Fortbildner:innen zu ergänzen, die vorab entsprechend qualifiziert wurden. Diese setzen als sog. Multiplikator:innen von Expert:innen konzipierte Fortbildungen um, z. B. im Blended-Learning-Format (vgl. Mörs & Wendland, 2022). Somit lassen sich zwei unterschiedliche Transferbedingungen unterscheiden: 1) von Expert:innen konzipierte und durchgeführte Fortbildungen (naher Transfer) und 2) von Expert:innen konzipierte und von entsprechend qualifizierten Multiplikator:innen durchgeführte Fortbildungen (ferner Transfer). Die hier vorgestellte Studie fokussiert die erste Ebene des Fortbildungserfolgs (Lipowsky & Rzejak, 2012). Auf dieser Ebene bilden sich als Merkmale des Fortbildungserfolgs die Zufriedenheit mit der Fortbildung und transferrelevante Einstellungen wie die Akzeptanz und die wahrgenommene Machbarkeit der Fortbildungsinhalte heraus (ebd.; Meudt, Zeuch, Neuber & Souvignier, 2020). Es wird analysiert, wie sich zwei unterschiedliche Transferbedingungen auf den Fortbildungserfolg auswirken, wenn gleichzeitig relevante Aspekte im Bereich der persönlichen Voraussetzungen der Teilnehmenden und des schulischen Kontexts kontrolliert werden. Außerdem werden Effekte der Transferbedingung auf die Ausprägung dieser Merkmale untersucht. 66 Lehrkräfte (83,3 % weiblich; MAlter=40.65 Jahre, SD=9.09) aus 22 Schulen nahmen an einer Fortbildung (Dauer: ca. 3 Monate) im Blended-Learning-Format zur datenbasierten Weiterentwicklung des Deutschunterrichts mit den Ergebnissen aus den Vergleichsarbeiten (VERA-8) im Kompetenzbereich Lesen teil. Die Fortbildung bestand aus zehn E-Learning-Einheiten, die in drei Bausteinen strukturiert sind (VERA-Grundlagen, Lesekompetenz, VERA-Nutzung), sowie vier Veranstaltungen. 37 Lehrkräfte wurden von Multiplikator:innen fortgebildet, 29 Lehrkräfte von Expert:innen. Persönliche Merkmale und schulische Kontextbedingungen wurden zu Beginn der Fortbildung erhoben (T1, Januar 2023), Merkmale des Fortbildungserfolgs (Zufriedenheit: 5 Items, α=.94; Akzeptanz: 7 Items, α=.93; und Machbarkeit: 6 Items, α=.85) unmittelbar danach (T2, April/Mai 2023). Zur Untersuchung des Einflusses der Transferbedingung auf den Fortbildungserfolg wurden lineare Regressionsanalysen durchgeführt. Unterschiede zwischen den beiden Transferbedingungen hinsichtlich des Fortbildungserfolgs wurden mittels t-Tests analysiert. In die Regressionsanalysen gingen neben der Transferbedingung die Einstellung (10 Items, α=.94) und das durch die teilnehmenden Lehrkräfte selbsteingeschätzte Vorwissen zur datenbasierten Unterrichtsentwicklung mit VERA (6 Items, α=.89) zu Beginn der Fortbildung sowie die von ihnen wahrgenommene Unterstützung durch die Schulleitung (8 Items, α=.90) als Prädiktoren ein. Mithilfe der Modelle konnten die Zufriedenheit, Akzeptanz und Machbarkeit zu mindestens 26 % vorhergesagt werden. In allen drei Modellen stach die Transferbedingung als bedeutendster (.62<β<.93) und unabhängiger Prädiktor hervor (.001<p<.005). Beim Vergleich der Transferbedingungen hinsichtlich des Fortbildungserfolgs ist der nahe Transfer dem fernen Transfer signifikant überlegen. Am deutlichsten ausgeprägt ist der Effekt der Transferbedingung auf die Zufriedenheit (d=0.99). Aber auch für die Akzeptanz lässt sich noch ein großer Effekt verzeichnen, während der für die Machbarkeit nur mittelhoch ausfällt. Für die in dieser Studie betrachteten Transferbedingungen lassen sich signifikante Effekte auf der ersten Ebene des Fortbildungserfolgs beobachten, die nahelegen, dass durch die Multiplikation ein gewisser „Reibungsverlust“ im Fortbildungsprozess entsteht. Dabei mag auch eine Rolle spielen, dass die hier untersuchte Fortbildung einen relativ hohen Komplexitätsgrad aufweist. Die vorliegenden Ergebnisse weisen darauf hin, dass Multiplikator:innensysteme im Bereich der Lehrkräftefortbildung ein Optimierungspotenzial aufweisen. Einschätzung von Lehrkräften zu einer systematischen Schreibförderung sowie Entwicklung ihres unterrichtlichen Handelns und ihrer Überzeugungen beim Transfer Ruth Görgen-Rein, Ina Kaplan, Michaela Mörs, Michael Becker-Mrotzk Universität zu Köln Für den erfolgreichen Transfer einer Fördermaßnahme in die Schule ist es wichtig, dass diese von den Lehrkräften wie intendiert umgesetzt wird und sich außerdem gut und sinnvoll in den schulischen Alltag einbinden lässt. Hierfür ist die Einschätzung der Lehrkräfte im Hinblick auf die Bereiche Akzeptanz, Machbarkeit und Lernerfolg sowie die Wiedergabetreue zentral (Meudt et al. 2020). Ferner spielen die professionellen Überzeugungen von Lehrkräften eine wesentliche Rolle, da diese ebenfalls die Unterrichtsgestaltung und den Lernerfolg von Schüler:innen beeinflussen (Graham et al. 2002; Schmidt & Schindler, 2020). Bei professionellen Überzeugungen handelt es sich um subjektive Bewertungen, also etwa um Überzeugungen über die eigenen Fähigkeiten (Keller, 2016; Kunter & Pohlmann, 2015). Angesichts des großen Einflusses der schreibbezogenen Überzeugungen von Lehrkräften gilt es, diese im Rahmen der Aus- und Fortbildung von Lehrkräften zu stärken bzw. nachhaltig zu modifizieren (Graham et al. 2002; Lipowsky, 2014). Im Rahmen des Projektes werden Grundschullehrkräfte im Bereich der Schreibförderung fortgebildet und setzen anschließend eine systematische Schreibförderung um. Diese umfasst ein Training der Schreibflüssigkeit und ein darauf aufbauendes Training zur Anwendung von Schreibstrategien. Zur Vorbereitung nehmen die Lehrkräfte an einem Blended-Learning-Kurs teil und werden darüber hinaus während der Implementation durchgehend von Multiplikator:innen begleitet. Die Begleitstudie fokussiert die Einschätzung der Lehrkräfte hinsichtlich der Umsetzung des Schreibförderprogramms sowie der Entwicklung ihrer schreibbezogenen Überzeugungen und des unterrichtlichen Handelns. Die Datenerhebung erfolgt mithilfe von Fragebögen (Likert 1-5), wobei die Items aus erprobten Fragebögen übernommen und teilweise für den hier im Fokus stehenden Bereich ‚Schreiben‘ angepasst wurden (Cutler & Graham 2008, Graham et al. 2001, 2002, Meudt et al. 2020). Die Lehrkräfte nehmen an insgesamt fünf Befragungen teil: (t1) vor der Teilnahme an der Fortbildung, (t2) nach der Fortbildung, (t3) nach erfolgter Implementation des Schreibflüssigkeitstrainings, (t4) nach erfolgter Implementation des Schreibstrategietrainings und (t5) als Follow-up. Die Wartekontrollgruppe wird zu drei Zeitpunkten befragt. An der Fortbildung nahmen in der Experimentalgruppe 66 Lehrkräfte (93,5% weiblich; M_Alter=45.84 Jahre, SD=9.14; M_Berufserfahrung=13.26 Jahre, SD=9.94) aus verschiedenen Bundesländern teil. In die Analysen wurden Lehrkräfte eingeschlossen, deren Datensätze pro Messzeitpunkt vollständig sind. Die Datenerhebung ist zum jetzigen Zeitpunkt noch nicht abgeschlossen. Deskriptive Analysen zum Transfererfolg der Schreibtrainings zeigen, dass die Akzeptanz und die angegebene Wiedergabetreue für das Schreibflüssigkeitstraining auf einem hohen Niveau liegen (Akzeptanz: 10 Items, α=.82, M=4.31, SD=0.59; Wiedergabetreue: 4 Items, α=.59, M=4.52, SD=.61), während die Machbarkeit und der wahrgenommene Lernerfolg von den Lehrkräften als mittelmäßig eingeschätzt werden (Machbarkeit: 7 Items, α=.89, M=3.74, SD=0.89; Lernerfolg: 4 Items, α=.77, M=3.91, SD=0.67). Für das Schreibstrategietraining liegen die eingeschätzte Akzeptanz sowie der Lernerfolg auf einem mittleren Niveau (Akzeptanz: 10 Items, α=.93, M=3.32, SD=1.00; Lernerfolg: 4 Items, α=.88, M=3.32, SD=0.85) und die angegebene Machbarkeit und Wiedergabetreue auf einem geringeren Niveau (Machbarkeit: 7 Items, α=.94, M=2.58, SD=1.08; Wiedergabetreue: 4 Items, α=.71, M=2.92, SD=0.97). Hinsichtlich des schreibbezogenen Unterrichtshandelns fokussieren die Lehrkräfte vor der Fortbildung die hierarchieniedrigen Schreibfertigkeiten (10 Items, α=.67, M=3.21, SD=0.61) in stärkerem Maße als die hierarchiehohen Schreibfertigkeiten (11 Items, α=.89, M=2.90, SD=0.71). Das adaptive und motivierende unterrichtliche Handeln der Lehrkräfte zeigt sich vor der Fortbildung als solide, aber ausbaufähig (Adaptivität: 3 Items, α=.80, M=3.95, SD=.81; Motivation: 5 Items, α=.79, M=3.30, SD=0.76). Im mittleren Bereich verorteten die Lehrkräfte auch ihre Selbstwirksamkeit (2 Items, α=.73, M=3.72, SD=0.93) und ihr Wissen (6 Items, α=.88, M=3.28, SD=0.81). Das selbsteingeschätzte Wissen wurde bereits zu t2 erneut erfasst (M=4.27, SD=0.5). Eine ANOVA mit Messwiederholung zeigt hier einen statistisch signifikanten Haupteffekt (F(1,27)=38.26, p<.001). Die ersten Ergebnisse deuten darauf hin, dass die Lehrkräfte von der Fortbildung profitieren, während sich die durchgeführten Schreibtrainings noch nicht optimal in den schulischen Alltag einbinden lassen. Beeinflussende bzw. hemmende Faktoren werden im Vortrag diskutiert. Zusätzlich werden die Entwicklungen zum letzten Erhebungszeitpunkt präsentiert, auch im Vergleich zur Wartekontrollgruppe. Längsschnittliche Veränderungen in Einstellungen und im Unterrichtshandeln von Lehrkräften bei der Implementation einer Leseintervention Mareike Ehlert, Elmar Souvignier Universität Münster Wenn Lehrkräfte evidenzbasierte Interventionen in ihren Unterricht implementieren, erfordert das in der Regel eine Veränderung ihrer professionellen Kompetenzen (Guskey, 1988; Rogers, 2003). Zu diesen professionellen Kompetenzen gehören Einstellungen wie die Akzeptanz und die wahrgenommene Machbarkeit der Intervention sowie die Selbstwirksamkeit der Lehrkräfte in Bezug auf die Intervention (Bandura, 1997). Auf der Ebene des Unterrichtshandelns ist insbesondere das Ausmaß relevant, in dem Lehrkräfte eine Intervention wie vorgesehen umsetzen (‚Wiedergabetreue‘; O'Donnell, 2008). Diese Kompetenzen gehen mit einer verstärkten Nutzung von Interventionen (Hebbecker et al., 2020) und verbesserten Schüler:innenleistungen (Henninger, 2010) einher. Gleichzeitig wird in theoretischen Modellen jedoch auch angenommen, dass die Einstellungen von Lehrkräften zeitlichen und situativen Veränderungen unterliegen (Clarke & Hollingsworth, 2002; Opfer & Pedder, 2011). So stellten Timperley et al. (2003) fest, dass die Bereitschaft zur Implementation einer Maßnahme nach der Teilnahme an einer Fortbildung zunächst zunahm, jedoch wieder abnahm, als die Lehrkräfte erste Veränderungen im Unterricht vornehmen mussten. Da bisher nur wenige empirische Untersuchungen zu den Veränderungen von Lehrkraft-Kompetenzen in Implementationsprozessen vorliegen, ist Ziel dieser Studie, längsschnittliche Veränderungen in implementationsrelevanten Variablen zu untersuchen. Die Forschungsfrage lautet: Wie verändern sich Kompetenzen (Akzeptanz, Machbarkeit, Selbstwirksamkeit) und Unterrichtshandeln (Wiedergabetreue) von Lehrkräften im Laufe des Implementationsprozesses? In Anlehnung an Timperley et al. (2003) wird von signifikanten Veränderungen bei den genannten Variablen ausgegangen. Die Richtungen dieser Veränderungen werden explorativ untersucht. 66 Grundschullehrkräfte aus 27 Schulen nahmen an einem Fortbildungsprogramm zu einer evidenzbasierten Intervention für den Leseunterricht teil. Die Lehrkräfte waren größtenteils weiblich (83%), im Durchschnitt 38,56 Jahre alt (SD=9.14) und arbeiteten seit M=9,89 Jahren (SD=8.81) als Lehrkräfte. Den Implementationsgegenstand bildete eine differenzierte Leseintervention, die sich auf evidenzbasierte Methoden zur Förderung dreier zentraler Facetten der Lesekompetenz stützt (Lesegenauigkeit, Lesegeschwindigkeit, Leseverständnis). Es wurden vorbereitete Unterrichtsmaterialien und Schüler:innenhefte mit unterschiedlichen Schwierigkeitsgraden bereitgestellt. Die Blended-Learning-Fortbildung zur Intervention dauerte ein halbes Schuljahr und umfasste E-Learning-Einheiten im Selbststudium sowie drei ganztägige Präsenzveranstaltungen. Akzeptanz, Machbarkeit und Wiedergabetreue der Leseintervention sowie die Selbstwirksamkeit wurden mit standardisierten Instrumenten (Meudt et al., 2020; Schmitz & Schwarzer, 2000) an drei Messzeitpunkten erhoben: (t1) nach der Teilnahme der Lehrkräfte an der Fortbildung, als sie die Intervention noch nicht umgesetzt hatten, (t2) während der ersten zwei Monate der Implementation und (t3) nach erfolgter Implementation am Ende des Schuljahres. Deskriptive Analysen zeigen, dass die Akzeptanz der Lehrkräfte gegenüber der Leseintervention über alle drei Messzeitpunkte auf einem hohen Niveau lag (Likert 1-5) (α=.76; t1: M=4.58, SD=0.29, t2: M=4.54, SD=0.49; t3: M=4.46, SD=0.56). Die wahrgenommene Machbarkeit war nach der Fortbildung vergleichsweise geringer ausgeprägt (t1: M=3.86, SD=0.78), stieg aber mit praktischer Unterrichtserfahrung (α=.89; t2: M=4.02, SD=0.83, t3: M=4.01, SD=0.75). Auch die Selbstwirksamkeit startete auf einem mittleren Niveau (α=.75; t1: M=3.88, SD=0.56, t2: M=3.94, SD=0.53), steigerte sich aber zum Ende des Schuljahres (t3: M=4.21, SD=0.51). Die intendierte Wiedergabetreue wurde bereits nach der ersten Fortbildung als hoch eingeschätzt (α=.72; t1: M=4.52, SD=0.57), sank dann aber im Zuge der Umsetzung (t2: M=4.30, SD=0.75; t3: M=4.32, SD=0.81). Eine ANOVA mit Messwiederholung zeigte, dass der Unterschied zwischen den Mittelwerten für die Akzeptanz (F(2,62)=1,30, p=0,28) und die Machbarkeit (F(2,62)=2,57, p=0,09) nicht signifikant ist. Für die Wiedergabetreue (F(2,56)=3,50, p=0,04) und die Selbstwirksamkeit (F(2,58)=6,08, p=0,004) ist der Unterschied zwischen den Mittelwerten statistisch signifikant. Die Ergebnisse machen deutlich, dass die Kompetenzen von Lehrkräften im Laufe des Implementationsprozesses Veränderungen unterliegen. Nicht zuletzt die Steigerung der Selbstwirksamkeit kann als Resultat eines erfolgreichen Implementationsprozesses angesehen werden. Die je nach Merkmal unterschiedlichen Veränderungen legen nahe, dass die Unterstützung, die Lehrkräfte im Implementationsprozess erhalten, auf die von ihnen erlebten Veränderungen abgestimmt sein sollte, z. B. durch Probehandlungen in Fortbildungen oder persönliche Reflexionsgespräche während des Implementationsprozesses (Timperley et al., 2003). Prädiktoren transferrelevanter Einstellungen von Lehrkräften nach Teilnahme an einer Fortbildung zum sprachbildenden Mathematikunterricht Dilan Şahin-Gür¹, Rebekka Stahnke², Susanne Prediger³ ¹Technische Universität Dortmund, ²IPN - Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Berlin, ³IPN - Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Berlin; Technische Universität Dortmund Auch im Mathematikunterricht kann Sprachbildung das inhaltliche Lernen fördern, wie erste Interventionsstudien zeigen konnten (de Araujo et al., 2018; Prediger & Neugebauer, 2023). Der Transfer und die nachhaltige Implementation dieser neuen, evidenzbasierten Konzepte können durch die Fortbildung von Lehrkräften und die begleitende Bereitstellung adaptierbarer Unterrichtsmaterialien unterstützt werden. Systemische Faktoren an den jeweiligen Schulen, wie die Unterstützung durch die Schulleitung, ein positives Transferklima oder die Kooperation im Kollegium beeinflussen den Transferprozess (Desimone, 2009; Grossman & Sales, 2011; Rösken-Winter et al., 2021). Neben der Entwicklung fachlicher und fachdidaktischer Kompetenz sind insbesondere positive Einstellungen gegenüber dem Unterrichtskonzept seitens der Lehrkräfte wie die Akzeptanz und die wahrgenommene Machbarkeit entscheidend für die erfolgreiche Nutzung neuer Konzepte (Clarke & Hollingsworth, 2002; Hebbecker et al., 2020). Der Beitrag untersucht zunächst, ob die Lehrkräftefortbildung im Rahmen der Projekts Fach-BiSS zu einer positiven Entwicklung von Aspekten der Lehrkräftekompetenz (selbsteingeschätzte Wissen, lernförderliche Überzeugungen und Selbstwirksamkeit) führt. Weiterhin wird geprüft, welche Bedeutung systemische Faktoren sowie die wahrgenommene Eignung des Konzepts für die Praxis auf die individuelle Akzeptanz und wahrgenommene Machbarkeit des Konzepts haben. In einem Prä-Post-Wartekontrollgruppen-Design wurden Daten von 20 Lehrkräften in der Interventionsgruppe und 19 Lehrkräften in einer Wartekontrollgruppe erhoben. Die Lehrkräfte waren überwiegend weiblich (59%), durchschnittlich 39 Jahre alt und unterrichteten Mathematik in der Sekundarstufe I. Die Teilnehmenden der Interventionsgruppe erhielten eine 15-monatige Fortbildung (inkl. Unterrichtsmaterial), die Input-, Erprobungs-, und Reflexionsphasen kombinierte. Vor Fortbildungsbeginn wurden alle Lehrkräfte zu ihrer Wahrnehmung systemischer Faktoren befragt. Jeweils vor und nach der Fortbildung wurden die Selbstwirksamkeit sowie Einstellungen zum sprachbildenden Mathematikunterricht erhoben. Nach Abschluss der Fortbildung wurde der wahrgenommene Wissenszuwachs, die wahrgenommene Praxiseignung des Materials sowie Akzeptanz und Machbarkeit der Fortbildungsinhalte erfasst (Skalen: Eigenentwicklung, sowie Meudt et al., 2020). Bis auf zwei neu entwickelte Skalen zu Einstellungen zum sprachbildenden Mathematikunterricht (α=.44/.55) wiesen die eingesetzten Skalen mindestens ausreichende bis zufriedenstellende Reliabilitäten auf (α=.69 bis α=.91). Zur Überprüfung der Forschungsfragen wurden lineare Regressionen genutzt. Die jeweiligen Eingangswerte der abhängigen Variablen wurden als Kontrollvariablen eingeführt. Hinsichtlich der ersten Forschungsfrage zeigt sich die Zugehörigkeit zur Fortbildungsgruppe im Vergleich zur Wartekontrollgruppe als ein positiver Prädiktor für das selbsteingeschätzte Wissen nach Fortbildungsende (β=.55; p=<.001; R²=.30) sowie für die Entwicklung von lernförderlichen Einstellungen (Sprachbildung als Lerngegenstand des Mathematikunterrichts: β=.23; p=.03; R²=.62; Sprachbildung als Förderung des mathematischen Diskurses: β=.31; p=.01; R²=.57). Für die Entwicklung der Selbstwirksamkeitserwartung zeigen sich keine Effekte der Fortbildung. Bezüglich der zweiten Forschungsfrage zeigen sich in der Interventionsgruppe weder für wahrgenommene systemische Faktoren noch für die wahrgenommene Eignung des Konzepts für die Praxis signifikante Effekte auf die Akzeptanz des Konzepts des sprachbildenden Mathematikunterrichts. Für die Machbarkeitseinschätzung hingegen sind beide Aspekte von Bedeutung: Hier erwies sich die Kooperation im Kollegium (β=.56; p=.03; R²=.47) sowie die wahrgenommene Praxisnähe der Fortbildung und die eingeschätzte Adaptierbarkeit des Unterrichtsmaterials (β=.60; p<.001 bzw. β=.41; p=.03; R²=.50) als signifikante Prädiktoren der Machbarkeitseinschätzung. Die Ergebnisse zur ersten Forschungsfrage deuten darauf hin, dass durch die Fortbildung eine positive Entwicklung von Aspekten der Lehrkräftekompetenz initiiert wurde. Ob eine solche Entwicklung auch hinsichtlich der Diagnose und Förderung von Lernenden als zentrale Aufgaben des sprachbildenden Mathematikunterrichts zu beobachten ist, werden zukünftige Auswertungen eines vignettenbasierten Instruments prüfen. Hinsichtlich der transferrelevanten Einstellungen zeigen sich keine Effekte für die Akzeptanz des Konzepts. Diese fiel jedoch insgesamt sehr hoch aus, sodass hier Deckeneffekte möglich sind. Für die Machbarkeitseinschätzungen spielt die Kooperation im Kollegium eine bedeutsame Rolle. Daneben zeigen sich die Wahrnehmung der Praxisnähe und der Adaptierbarkeit als relevant für die eingeschätzte Machbarkeit. Die individuellen Einschätzungen von Lehrkräften, ob eine Fortbildung Bezug zu ihrer eigenen Praxis hat und inwiefern die angebotenen Materialien für ihren Kontext adaptierbar sind, erscheinen somit für den Aufbau transferrelevanter Einstellungen von großer Bedeutung zu sein.
10:30 - 12:10	1-12: Belastungserleben und Studienerfolg in einer heterogenen Studierendenschaft: Die Rolle von Studienanforderungen, persönlichen und institutionellen Ressourcen Ort: S19
	Symposium Belastungserleben und Studienerfolg in einer heterogenen Studierendenschaft: Die Rolle von Studienanforderungen, persönlichen und institutionellen Ressourcen Chair(s): Julia Zimmermann (FernUniversität in Hagen, Deutschland), Dina Kuhlee (Otto-von-Guericke-Universität Magdeburg) Diskutantin(nen): Kathrin Jonkmann (FernUniversität in Hagen) Die Themen Stress bzw. Belastungserleben haben im öffentlichen Diskurs der vergangenen Jahre zunehmend an Bedeutung gewonnen (Hahn et al., 2021). Universitätsstudierende sind zahlreichen Stressfaktoren ausgesetzt (Gusy et al., 2016; Ribeiro et al., 2018) und das junge Erwachsenenalter stellt einen Höhepunkt des Risikos für das Auftreten psychischer Störungen dar (Auerbach et al., 2016). Zugleich ist der erfolgreiche Abschluss eines Studiums von hoher individueller und gesellschaftlicher Bedeutung (Neugebauer, 2019). Vor diesem Hintergrund kommt der Untersuchung der Bedingungsfaktoren des Belastungserlebens von Studierenden und dessen Zusammenhang mit Kriterien des Studienerfolgs große Bedeutung für das Verstehen von Bildungsprozessen und -ergebnissen zu. Zu diesem Zweck wurde das in der arbeitspsychologischen Forschung entwickelte und etablierte Job-Demands-Resources-Modell (Demerouti et al., 2001; Bakker et al., 2023) in den vergangenen Jahren adaptiert, um die Gesundheit und den akademischen Erfolg von Studierenden im Hochschulkontext durch Studienanforderungen, institutionelle und persönliche Ressourcen zu erklären (Gusy et al., 2016; Lesener et al., 2020; Niewöhner et al., 2021). Jedoch stellt die heutige Studierendenschaft keine homogene Gruppe dar, sondern ist von sozialer und kultureller Heterogenität gekennzeichnet (Kroher et al., 2023), die mit Unterschieden in der Wahrnehmung von studienbezogenen Herausforderungen und Stesserleben in Verbindung steht (Sedatzki & Rathmann, 2021; Zimmermann et al., 2021). Seitens der Institutionen prägen studiengangsspezifische Anforderungsprofile das Belastungserleben der Studierenden, dabei konfrontieren beispielsweise die strukturellen Besonderheiten der Lehrerinnenbildung als Querschnittsaufgabe deutscher Universitäten diese Studierendengruppe mit besonderen Herausforderungen (Blömeke, 2009). Hier setzt das vorgeschlagene interdisziplinäre Symposium an, in dem in drei Beiträgen aus der Perspektive von Soziologie, Wirtschaftspädagogik und Psychologie die Bedingungsfaktoren von studentischer Erschöpfung (Beitrag 1) sowie Studienabbruchintentionen von Lehramtsstudierenden (Beitrag 2) und internationalen Studierenden (Beitrag 3) unter Bezugnahme auf das Job-Demands-Resources Modell (Demerouti et al., 2001; Bakker et al., 2023) untersucht werden. Das gemeinsame Ziel dieser quantitativ-empirischen Forschungsarbeiten ist es, zum besseren Verständnis der Herausforderungen und Ressourcen unterschiedlicher Studierendengruppen an deutschen Hochschulen beizutragen und somit Grundlagen für deren Partizipation an einem erfolgreichen Bildungsprozess zu schaffen. Der erste Beitrag adressiert aus einer soziologischen Perspektive soziale Ungleichheit in Bezug auf studentische Erschöpfung und untersucht anhand einer für die Studierendenschaft an Hochschulen in Deutschland repräsentativen Stichprobe, ob die Integration von private Anforderungen (Kinderbetreuungspflichten und Arbeitszeiten) und privaten Ressourcen (finanzielle, soziale und psychologische Ressourcen) in den Analyserahmen des Job-Demands-Resources Modells zur Erklärung von Unterschieden in studentischer Erschöpfung zwischen verschiedenen Studierendengruppen beiträgt. Der zweite Beitrag eruiert wie die Studienanforderungen, die institutionellen Ressourcen und die Resilienz von Studierenden über das Belastungserleben und das Studienengagement auf die Studienabbruchintention bei Lehramtsstudierenden wirken. Ein Schwerpunkt liegt dabei auf der Wirkung von Resilienz als individueller Ressource sowie deren Zusammenspiel mit den weiteren Wirkfaktoren des Job-Demands-Resources Modells. Der dritte Beitrag legt den Fokus auf die Analyse der Bedingungsfaktoren von Belastungserleben und Studienabbruchintentionen internationaler Studierender an deutschen Hochschulen. Der Beitrag untersucht die Gültigkeit der zentralen Postulate des Job-Demands-Resources Modell für diese Studierendengruppe und weist auf Unterschiede im Unterstützungspotential institutioneller Ressourcen für internationale Studierende im Vergleich zur einheimischen Studierendenschaft hin. Die Befunde werden abschließend von der benannten Diskutantin im Hinblick auf ihren Beitrag zum theoretischen Verständnis der Bedingungsfaktoren von Belastungserleben und Studienerfolg der heterogenen Studierendenschaft an deutschen Hochschulen sowie mit Blick auf ihre Bedeutung für die Gestaltung und Nutzung von institutionellen und individuellen Ressourcen der Studierenden diskutiert. Beiträge des Symposiums Social inequalities in student exhaustion: The study-demands-resources model revisited Mareike Rußmann¹, Karsten Becker¹, Nicolai Netz¹, Marie-Christin Ehrhardt² ¹German Centre for Higher Education Research and Science Studies (DZHW), ²Medizinische Hochschule Hannover (MHH) Student exhaustion can cause considerable negative effects, such as dropout (Grützmacher et al., 2018; Marôco et al., 2020; Turhan et al., 2023) and health problems (Grützmacher et al., 2018; Niemeyer, 2020; Tomaszek & Muchacka-Cymerman, 2022). Critically, 42% of all students in Germany considered themselves to be exhausted by their studies in 2021 (Kroher et al., 2023). A first step to mitigate this potential student health crisis is to develop an understanding of the drivers of student exhaustion. To do so, the job demands-resources model (Bakker & Demerouti, 2007; Demerouti et al., 2001), which is well-established in occupational psychology, has been adapted to explain students’ health and performance in the higher education context (Gusy et al., 2016; Lesener et al., 2020). Importantly, the resulting study demands-resources model has primarily been applied uniformly to the student body as a whole. This is questionable considering the large social stratification literature highlighting that present-day student bodies are not homogenous groups, but rather characterised by substantial social disparities. For instance, recent research highlights that female students feel more exhausted than males (Grützmacher et al., 2018; Kroher et al., 2023) and that students with lower subjective social status report higher stress levels than students with higher subjective social status (Sendatzki & Rathmann, 2022). With this in mind, we propose to theoretically extend the study demands-resources model by integrating ascriptive characteristics as markers of social inequality into the model. We achieve this extension by drawing on the social stratification literature underscoring that social groups differ systematically regarding the demands they face and the resources they have at their disposal to cope with these demands (Grusky, 2019). This claim is backed by recent studies emphasising the importance of considering not only students’ conditions within their higher education institution but also their private demands and resources (see, e.g., Bean & Metzner, 1985; Müller & Klein, 2023; Rovai, 2003, for the case of student dropout). Consequently, we argue that both private demands (including childcare responsibilities and working hours) and private resources (including financial, social, and psychological assets) should be integrated into the study demands-resources model – and that they may explain the observed social inequalities in student exhaustion. To test the proposed theoretical model, we use data from “The Student Survey in Germany”, which provides nationally representative information on students enrolled in German higher education institutions in the year 2021 (Beuße et al., 2022). Applying structural equation modelling (SEM), we investigate the role of both private and institutional demands and resources for student exhaustion within and across different student groups. We discuss the implications of our findings for the psychological student exhaustion literature and social stratification research. Moreover, we illustrate the potential of our extended study demands-resources model to produce effective policy recommendations. Studienerfolg von Lehramtsstudierenden: Belastungserleben und Studierendenengagement auf dem Prüfstand Edgar Hahn, Dina Kuhlee Otto-von-Guericke-Universität Magdeburg Der Beitrag eruiert unter Rückgriff auf das Job Demands-Resources-Modell (Bakker et al., 2023¸ Demerouti et al., 2001) wie die Studienanforderungen, die institutionellen Ressourcen und die Resilienz von Studierenden über das Belastungserleben und das Studienengagement auf die Studienabbruchintention bei Lehramtsstudierenden wirken. Eine Übertragbarkeit des Job Demands-Resources-Modell auf das Studium konnten Gusy et al. (2016), Lesener et al. (2020), Niewöhner et al. (2021) und Kuhlee et al. (im Erscheinen) zeigen. Mit Blick auf den bestehenden Forschungsstand hierzu können die folgenden zwei zentralen Prozesse bestätigt werden. (1) Der gesundheitsbeeinträchtigende Prozess, bei dem die Studienanforderungen positiv auf das Belastungserleben wirken sowie (2) der motivationale Prozess, bei dem die institutionellen Ressourcen positiv auf das Studierendenengagement wirken. Des Weiteren wird angenommen, dass die institutionellen Ressourcen negativ auf das Belastungserleben, und die Studienanforderungen negativ auf das Studierendenengagement wirken. Derzeit zeigt sich jedoch im Kontext des Studiums noch ein uneinheitliches Bild hinsichtlich dieser beiden letzten Annahmen. Neben der Betrachtung institutioneller Ressourcen können zudem personelle Ressourcen (z. B. die Resilienz) in die Überlegungen integriert werden (vgl. Bakker et al., 2023; Kuhlee et al., im Erscheinen; Xanthopoulou et al., 2007). Mit Blick auf die studien- und gesundheitsbezogenen Outcomes (z. B. Studienabbruchintention oder Lebenszufriedenheit) wird letztlich angenommen, dass diese wiederum negativ durch das Belastungserleben und positiv durch das Studierendenengagement beeinflusst werden; sie fungieren demnach als vermittelnde Variablen hinsichtlich der studien- und gesundheitsbezogenen Outcomes. Anhand einer Teilstichprobe von nt2LA = 456 allgemein- und berufsbildenden Lehramtsstudierenden (Projekt LeBeS; Erhebungszeitraum 01/02/2023; Nt3 = 2152) wird mittels Strukturgleichungsmodellen untersucht, inwiefern die Studienanforderungen, die institutionellen Ressourcen und die Resilienz der Studierenden über das Belastungserleben und das Studienengagement auf die Studienabbruchintention wirken. Die Erhebung der beschriebenen Konstrukte erfolgt unter Rückgriff auf bereits bestehende Messinstrumente (vgl. u. a. Fliege et al, 2004; Sarubin et al. 2015; Schaufeli & Bakker, 2003). Mit Blick auf die Ergebnisse lässt sich die positive Wirkung der Studienanforderungen auf das Belastungserleben (gesundheitsbeeinträchtigender Prozess) bestätigen. Die negative (mindernde) Wirkung der institutionellen Ressourcen auf das Belastungserleben konnte nicht bestätigt werden. Bezugnehmend auf das Engagement der Studierenden konnte der motivationale Prozess (positive Wirkung der institutionellen Ressourcen auf das Engagement der Studierenden) sowie die negative Wirkung der Studienanforderungen auf das Engagement der Studierenden bestätigt werden. Für den untersuchten Einfluss der Resilienz ist zu erkennen, dass die Resilienz negativ auf das Belastungserleben und positiv auf das Engagement wirkt. Der Beitrag diskutiert die generierten Befunde und ordnet sie vor dem Hintergrund des bestehenden Forschungsstandes ein. Im Weiteren werden diese Befunde aus der postpandemischen Phase (Projekt LeBeS; Erhebungszeitraum 01/02 2023; N = 2152, nt3LA = 456) mit Befunden einer vorangegangenen Erhebung unter pandemischen Bedingungen (Projekt LeBeS; Erhebungszeitraum 01/02 2021; Nt2 = 983; nt2LA = 510) verglichen und analysiert. Unter Rückgriff auf die Ergebnisse werden schließlich Ableitungen zur Förderung des Studienerfolgs von Lehramtsstudierenden vorgenommen und diskutiert. Studienabbruchintentionen internationaler Studierender in Deutschland: (Wie) wirken Studienanforderungen, institutionelle und individuelle Ressourcen? Julia Zimmermann, Juan Serrano-Sánchez FernUniversität in Hagen Mit einem Anteil von 12% sind internationale Studierende eine bedeutende, jedoch wenig beforschte Gruppe an deutschen Hochschulen (DAAD & DZHW, 2023). Über 50% der internationalen Studierenden studieren in MINT-Fächern und könnten somit dazu beitragen, den in Deutschland bestehenden Fachkräftemangel zu reduzieren (Hoffmeyer-Zlotnik & Grote, 2019). Jedoch brechen viele internationale Studierende ihr Studium ab (Bachelor: 41% versus 28% der deutschen Studierenden, Master: 28% versus 21% der deutschen Studierenden; Heublein et al., 2022). Ein Studienabbruch verursacht nicht nur persönliche, sondern auch gesellschaftliche und ökonomische Kosten (Neugebauer, 2019). Vor diesem Hintergrund kommt der Untersuchung der Bedingungsfaktoren von Studienabbruchintentionen internationaler Studierender in Deutschland eine besondere Bedeutung zu. Der aktuelle Beitrag untersucht vor dem Hintergrund des Job Demands-Resources-Modell (Bakker & Demerouti, 2007; Bakker et al., 2023) die Bedeutung von Studienanforderungen, institutionellen Ressourcen (Handlungsspielraum, Unterstützung durch Lehrende, Unterstützung durch Mitstudierende), individuellen Ressourcen (Resilienz), Studienengagement und Belastungserleben für die Studienabbruchintention in dieser Studierendengruppe. Entsprechend der zentralen Postulate des Modells (Bakker et al., 2023) wurde ein indirekter positiver Effekt von Studienanforderungen über Belastungserleben auf Studienabbruchintentionen (gesundheitsbeeinträchtigender Prozess) erwartet. Ebenso erwartet wurden negative Effekte von institutionellen und individuellen Ressourcen auf die Studienabbruchintention, vermittelt über das Studienengagement (motivationaler Prozess) sowie kreuzweise negative Zusammenhängen zwischen Anforderungen und Engagement bzw. Ressourcen und Belastung. Die Datengrundlage bildete eine Teilstichprobe von n = 673 internationalen Studierenden an mehr als 20 deutschen Hochschulen, die im Rahmen des Projekts LeBeS (Erhebungszeitraum Januar/Februar 2023; Nt3 = 2,152) anhand von Online-Fragebögen in deutscher und englischer Sprache befragt wurden. Analysen mittels latenter Strukturgleichungsmodelle bestätigten, dass höhere Studienanforderungen mit einer gesteigerten Studienabbruchintention, vermittelt über ein erhöhtes Belastungserleben, einherging (gesundheitsbeeinträchtigender Prozess). Wenngleich institutionelle und individuelle Ressourcen das Studienengagement erwartungskonform positiv vorhersagten, konnte kein Zusammenhang zwischen Studienengagement und Abbruchintentionen identifiziert werden, die indirekten Effekte von institutionellen und individuellen Ressourcen über Engagement auf die Abbruchintention (motivationaler Prozess) konnte folglich nicht bestätigt werden. Mit Blick auf die kreuzweisen Zusammenhänge zeigte sich erwartungskonform ein negativer Zusammenhang zwischen Studienanforderungen und Engagement sowie zwischen Resilienz als individueller Ressource und Belastungserleben. Entgegen den Erwartungen waren institutionelle Ressourcen jedoch positiv mit dem Belastungserleben internationaler Studierender assoziiert. Ergänzende Analysen auf Ebene der einzelnen Facetten institutioneller Ressourcen zeigten, dass besonders ein hohes Ausmaß an individuellem Handlungsspielraum bei der Studiengestaltung sowie häufige (unterstützenden) Peer-Interaktionen das Belastungserleben der internationalen Studierenden – entgegen der Modellannahmen – verstärkten. Mögliche Erklärungsansätze für diese Ergebnisse sowie Implikationen der Befunde – sowohl für das theoretische Verständnis der Bedingungsfaktoren von Studienerfolg und Studienabbruch internationaler Studierender als auch für die Gestaltung institutioneller Unterstützungsangebote für diese Studierendengruppe – werden abschließend diskutiert.
10:30 - 12:10	1-13: Interaktionsqualität in frühen domänenspezifischen Bildungsangeboten Ort: S28
	Symposium Interaktionsqualität in frühen domänenspezifischen Bildungsangeboten Chair(s): Elisa Oppermann (Otto-Friedrich-Universität Bamberg) Diskutant*in(nen): Henrik Saalbach (Universität Leipzig) Die Qualität pädagogischer Interaktionen in Kindertageseinrichtungen gilt als ausschlaggebend für die kindliche Entwicklung (Hamre et al., 2014). Interaktionsqualität kann dabei global sowie domänenspezifisch betrachtet werden: Globale Aspekte umfassen u.a. ein warmes emotionales Klima sowie sensitive und feinfühlige Interaktionen während domänenspezifische Interaktionsqualität vor allem die Qualität kognitiver Anregung z.B. im Bereich Sprache oder Mathematik, beschreibt. Die Bedeutsamkeit globaler Interaktionsqualität im Kita-Alltag ist gut dokumentiert (Ulferts et al., 2019; von Suchodoletz et al., 2023). Bisher existieren jedoch nur wenige empirische Studien zur Interaktionsqualität in frühen domänenspezifischen Bildungsangeboten. Frühe domänenspezifische Bildungsangebote erfolgen dabei eher im Rahmen geplanter und strukturierter Settings in Kleingruppen z.B. als Projekt im Bereich der Naturwissenschaften. Die Qualität solcher Bildungsangebote ist bislang kaum erforscht. Aus theoretischer Perspektive wird angenommen, dass Kinder dann von solchen Bildungsangeboten besonders profitieren, wenn sie durch kognitiv anregende verbale Interaktionen (auch „verbale Lernunterstützung“) zum Lernen angeregt werden (Pianta & Hamre, 2009; Siraj-Blatchford et al., 2002). Kinder nehmen dabei eine aktive Rolle ein, indem sie z.B. Fragen stellen, ihre Beobachtungen und Ideen teilen, reflektieren und rekonstruieren (Siraj-Blatchford et al., 2015). Solche anregenden verbalen Interaktionen werden unter unterschiedlichen Bezeichnungen mit zum Teil etwas anderen Gewichtungen beschrieben, z.B. im Konzept des „Sustained Shared Thinking“ (Siraj-Blatchford et al., 2015) oder des „Scaffolding“ (van de Pol et al., 2010). Ausgehend von der theoretisch angenommenen Bedeutsamkeit solcher kognitiv anregenden verbalen Interaktionen sowie vor dem Hintergrund der nachgewiesenen Bedeutsamkeit früher domänenspezifischer Förderung für den späteren Schulerfolg (Melhuish et al., 2008; Sylva et al., 2013), besteht ein Bedarf an empirischen Erkenntnissen zur Interaktionsqualität früher domänenspezifischer Bildungsangebote. Das geplante Symposium adressiert diesen Bedarf und trägt vier Studien aus vier verschiedenen Domänen (Sprache, Mathematik, Naturwissenschaften und Technik) zusammen, in denen die Qualität (und Häufigkeit) verbaler Interaktionen in frühen domänenspezifischen Bildungsangeboten empirisch untersucht wird. Der erste Beitrag fokussiert die sprachliche Interaktionsqualität in einem strukturierten Bildungsangebot im Zusammenhang mit der Häufigkeit und Qualität alltagsintegrierter sprachlicher Bildungsaktivitäten im Kita-Alltag. Der zweite Beitrag untersucht den mathematischen Sprachinput („MathTalk“) frühpädagogischer Fachkräfte in einer halbstandardisierten Spielsituationen mit Krippenkindern sowie Zusammenhänge mit numerischen Kompetenzen der Kinder. Im Fokus des dritten Beitrags steht die Interaktionsqualität und -häufigkeit in einem naturwissenschaftlichen Bildungsangebot im Zusammenhang mit den naturwissenschaftlichen Kompetenzen der Kinder. Der vierte Beitrag untersucht die verbale Lernunterstützung beim Bauspiel (Technik) als zentralen Aspekt der kognitiven Interaktionsqualität im Zusammenhang mit dem kindlichem Stabilitätswissen, mathematischem Wissen und der räumlichen Sprache. Insgesamt tragen die Beiträge des geplanten Symposiums zu einem besseren Verständnis der Interaktionsqualität in frühen domänenspezifischen Bildungsangeboten bei. Dabei geben die Beiträge Aufschluss über die Qualität der Ausgestaltung früher Bildungsangebote in vier verschiedenen Domänen sowie deren Bedeutsamkeit für das kindliche Lernen. Die Beiträge sowie deren Implikationen für Forschung und Praxis werden von Prof. Dr. Henrik Saalbach diskutiert. Beiträge des Symposiums Sprachliche Lernunterstützung im Kita-Alltag: Fachkraft-Kind-Interaktionen und sprachliche Bildungsaktivitäten in der Selbst- und Fremdeinschätzung Claudia Wirts Universität Leipzig/Staatsinstitut für Frühpädagogik und Medienkompetenz, München Theoretischer Hintergrund Obwohl es zahlreiche Belege für positive Auswirkungen hoher Interaktionsqualität im Bereich der Sprachunterstützung (u.a. Mashburn et al., 2008) und sprachlicher Bildungsaktivitäten (u.a. What Works Clearinghouse, 2007, Shanahan & Lonigan, 2010, Küspert et al., 2007) in der Kita gibt, wird nur ein sehr geringer Teil des Kita-Alltags mit sprachlichen Bildungsaktivitäten verbracht und die Interaktionsqualität im Bereich der Sprachunterstützung liegt in deutschen Kitas durchschnittlich nur im niedrigen bis mittleren Qualitätsbereich (u.a. Wirts et al., 2019, Suchodoletz et al., 2014). Early et al. (2005) fanden in 5% der Kita-Zeit Vorleseaktivitäten und in 4% Aktivitäten zur phonologischen Bewusstheit, in deutschen Kitas werden Bücher durchschnittlich einmal pro Vormittag mit den Kindern genutzt, Aktivitäten zu phonologischer Bewusstheit und Schrift finden im Kindergartenbereich ca. einmal pro Woche statt (Wirts et al., 2019). Auch sprachunterstützende Strategien, wie z.B. offene Fragen oder Erweiterungen kindlicher Äußerungen sind im Kita-Alltag selten beobachtbar (vgl. Siraj-Blatchford & Manni, 2008, König, 2009, Kappauf & Wirts, 2019). Fragestellung Im Rahmen des Symposiumsbeitrags sollen Ergebnisse zu folgenden Fragestellungen vorgestellt und diskutiert werden: • Wie häufig werden sprachliche Bildungsaktivitäten im Kita-Alltag umgesetzt? • Wie sprachanregend werden verschiedene Bildungsaktivitäten gestaltet? • Wie gut gelingt Fachkräften die Selbsteinschätzung von Häufigkeit und Qualität sprachlicher Bildungsaktivitäten? Methode Im Rahmen der Evaluationsstudien BiSS-E1 und BiSS-E2 (vgl. Wirts et al., 2019), wurden u.a. Daten zur Interaktionsqualität und zu sprachlichen Bildungsaktivitäten im Kita-Alltag in verschiedenen Bundesländern erhoben. Die vorgestellten Daten stammen aus dem Prätests vor den BiSS-Qualifizierungen (39 pädagogische Fachkräften aus dem Krippenbereich und 63 Fachkräfte aus dem Kindergartenbereich). Die Fachkräfte machten im Durchschnitt zu 11 bis 12 Tagen Angaben mithilfe des Tablet-Fragebogens „SpraBi“ zur Dokumentation sprachlicher Bildungsaktivitäten (Wirts & Reber, 2015/2019). Außerdem wurden Bilderbuchbetrachtungen von 10 Fachkräften anhand von Videoaufnahmen genauer analysiert und mit den Selbsteinschätzungen der Fachkräfte zu diesen Situationen verglichen. Ergebnisse Auswertungen zu den Bildungsaktivitäten zeigen, dass Aktivitäten zur phonologischen Bewusstheit und zum Umgang mit Schrift im Vergleich zu Bilderbuchaktivitäten nicht nur seltener im Kita-Alltag stattfinden, sondern auch seltener bewusst sprachanregend gestaltet werden. Die befragten Fachkräfte gaben an, dass sie bei Bilderbuchaktivitäten signifikant mehr Sprachförderstrategien einsetzen als bei Aktivitäten zu phonologischer Bewusstheit und Schrift (p<.05). Ebenfalls achten die Fachkräfte bei ersteren Aktivitäten signifikant häufiger (p<.05) bewusst auf eine gute non- und paraverbale Gestaltung. Bezüglich der Häufigkeitseinschätzungen von sprachlichen Bildungsaktivitäten im Alltag kann, aufgrund der hohen Übereinstimmung von externen Einschätzungen mit denen der Fachkräfte (ICC=.580 (PB/Schrift) bzw. .813 (BiBu)), davon ausgegangen werden, dass eine Selbsteinschätzung adäquat gelingt. Vergleichende Analysen von Fachkraft-Kind-Interaktionen am Video und die Angaben aus den Selbsteinschätzungen per Fragebogen zeigen hingegen, dass viele Fachkräfte die Häufigkeit des Einsatzes sprachanregender Strategien, insbesondere offener Fragen und Erweiterungen kindlicher Äußerungen, deutlich überschätzen. Es handelt sich bei der Teilstudie zum Vergleich der Selbst- und Fremdeinschätzung sprachanregender Strategien um eine explorative Datenauswertung, weitere Forschung ist notwendig, um die Ergebnisse an größeren Stichproben zu prüfen. Insgesamt deuten die vorliegenden Befunde aber darauf hin, dass eine adäquate Selbsteinschätzung des eigenen Interaktionsverhaltens Fachkräften ohne video- oder audiogestützte Reflexion nur eingeschränkt möglich ist, während eine Beurteilung der Häufigkeiten sprachlicher Bildungsaktivitäten reliabel über Selbsteinschätzung per Fragebogen erhoben werden kann. Längsschnittliche Zusammenhänge zwischen dem mathematischen Sprachinput von frühpädagogischen Fachkräften (MathTalk) und den numerischen Kompetenzen von Kindern im Krippenalter Nadine Besser¹, Dorothea Dornheim¹, Anja Linberg², Johanna Klemm¹, Hans-Günther Roßbach¹, Sabine Weinert¹, Simone Lehrl³ ¹Otto-Friedrich-Universität Bamberg, ²Deutsches Jugendinstitut, ³Pädagogische Hochschule Weingarten Dass mathematische Interaktionen, wie mathematischer Sprachinput (MathTalk) von pädagogischen Fachkräften, positiv mit den mathematischen Kompetenzen von Kindern zusammenhängen, wurde für das Kindergartenalter bereits gezeigt (z.B. Boonen et al., 2011; Klibanoff et al., 2006; Ramani et al., 2015). Wenige Untersuchungen beziehen sich auf die Entwicklung dieser Kompetenzen im Krippenalter und deren Förderung in der Krippe (für einen Überblick siehe Turan & De Smedt, 2022). Die Untersuchung langfristiger Faktoren, die die mathematische Entwicklung von Kindern beeinflussen, ist jedoch von besonderer Bedeutung, da Unterschiede in den mathematischen Kompetenzen bereits im Alter von drei Jahren beobachtet werden können (z.B. Klibanoff et al., 2006; Sarama & Clements, 2009). Diese legen den Grundstein für spätere mathematische Kompetenzen (z.B. LeFevre et al., 2010; Lehrl et al., 2020). Der vorliegende Beitrag geht daher der Frage nach, wie der MathTalk frühpädagogischer Fachkräfte längsschnittlich mit den numerischen Kompetenzen von Kindern im Krippenalter zusammenhängt. Methode: Grundlage sind Daten des ersten und zweiten Messzeitpunkts (Abstand: 4 Monate) einer Interventionsstudie mit einem Prä-, Post-, Follow-Up Design, in der Faktoren, welche die mathematische Entwicklung von zwei- bis vierjährigen Kindern beeinflussen, untersucht werden. Die Stichprobe umfasst N = 191 Kinder im Alter von durchschnittlich 32 Monaten (range = 23 - 41 Monate) zum ersten Messzeitpunkt (53 % männlich), sowie N = 45 frühpädagogische Fachkräfte, welche überwiegend Deutsch sprechen (81 %), und vorwiegend eine Ausbildung zum/zur Erzieher/in (55 %) als Berufsabschluss hatten. In halbstandardisierten Spielsituationen wurden die Interaktionen von frühpädagogischen Fachkräften mit bis zu drei Kindern gefilmt. Der MathTalk der Fachkräfte wurde anschließend aufbauend auf vorhandenen Kodiersystemen (Boonen et al., 2011; Klibanoff et al., 2006; Ramani et al., 2015) transkribiert und kodiert. Die Kodierung erfolgte ausgehend von einem breiten Mathematikverständnis, das neben numerischen Begriffen (z.B. Zahlwörter) auch räumliches, (z.B. „unter“, „auf“) zeitliches (z.B. „vorher“, „nachher“) und quantitatives Vokabular (z.B. „mehr“, „weniger“) umfasst (Ramani et al., 2015). In den Analysen werden die Prätest-Kategorien „Zählen“, „Kardinalität“, „Rechnen“, „Numerische Äquivalenz“, „Nicht-Numerische Nicht-Äquivalenz“, „Räumliches Ordnen“, „Nicht-numerisches explizites Ordnen“ und „Zeit“ berücksichtigt. Zusätzlich wurden die Zählfertigkeiten der Kinder spielerisch mit den Aufgaben Verbales Zählen sowie Objekte Abzählen erfasst und die Entwicklung des Zahlenkonzepts mit den Aufgaben Point-to-X (Wynn, 1992) und Give-a-Number (Sarnecka & Carey, 2008; Wynn, 1990). Die Maße wurden zu einem gemittelten Gesamtwert integriert (Erster Messzeitpunkt: M = 3,62; SD = 1,44; Zweiter Messzeitpunkt: M = 5,01; SD = 1,76). Um der Frage nachzugehen, ob der MathTalk der frühpädagogischen Fachkräfte längsschnittlich mit den späteren numerischen Kompetenzen der Kinder zusammenhängt, werden unter Berücksichtigung der numerischen Kompetenzen zum ersten Messzeitpunkt sowie des Alters und des Sprachstandes (TROG-D; Fox-Boyer et al., 2020) der Kinder, der Gruppengröße in der Krippe sowie der Muttersprache und dem Bildungsabschluss der Fachkraft multiple Regressionen berechnet. Ergebnisse: Analysen zeigen negative Zusammenhänge zwischen der Häufigkeit der Verbalisierung numerischer Äquivalenzen (z.B. „Jedes Kind bekommt einen Keks.“) (β = -0.11; p < .050) sowie nicht-numerischer nicht-Äquivalenzen (z.B. „A hat mehr als B.“) (β = -0.20; p < .050) und nicht-numerischem explizitem Ordnen (z.B. „Wir legen die Bausteine nach der Größe nebeneinander.“) (β = -0.07; p < .010) zum ersten Messzeitpunkt und den numerischen Kompetenzen der Kinder zum zweiten Messzeitpunkt. Zusammenhänge zwischen den weiteren Kategorien des MathTalk und den numerischen Kompetenzen sind nicht signifikant. Diskussion: Wie bei Boonen et al. (2011) scheinen die negativen Zusammenhänge zwischen den MathTalk Kategorien und den numerischen Kompetenzen darauf hinzudeuten, dass Aktivitäten, die höhere mentale Verarbeitungsprozesse beinhalten, bei zwei- bis dreijährigen Kindern eher hinderlich für die mathematische Entwicklung sein können. Andererseits können die positiven Zusammenhänge, die bei Boonen et al. (2011) berichtet werden, mit unserer jüngeren Stichrobe nicht nachgewiesen werden. Zudem sind die gefundenen Effekte klein und die Befunde sollten mit einer größeren Stichprobe überprüft werden. Interaktionsqualität und -häufigkeit in frühen naturwissenschaftlichen Bildungsangeboten im Zusammenhang mit den kindlichen naturwissenschaftlichen Kompetenzen Elisa Oppermann¹, Julia Barenthien², Henning Dominke², Lars Burghardt¹, Mirjam Steffensky², Yvonne Anders¹ ¹Otto-Friedrich-Universität Bamberg, ²Universität Hamburg Theoretischer Hintergrund Kinder erwerben bereits lange vor der Einschulung Wissen sowie motivationale Überzeugungen im Bereich der Naturwissenschaften (Oppermann et al., 2018; Steffensky et al., 2018). Frühe naturwissenschaftliche Bildungsangebote können daher die Entwicklung von Vorläuferfähigkeiten im Wissen sowie von Lernmotivation in den Naturwissenschaften unterstützen. Es ist anzunehmen, dass der Erfolg solcher Bildungsangebote vor allem von der Häufigkeit sowie der Qualität der pädagogischen Interaktionen abhängt (Bürgermeister et al., 2019; Ulferts et al., 2019). Die Interaktionsqualität und -häufigkeit wird in der Forschungsliteratur meist bezogen auf die Kindergruppe beschrieben. Neuere Arbeiten gehen aber davon aus, dass sich die Fachkraft-Kind-Interaktionen innerhalb einer Gruppe unterscheiden (Downer et al., 2010; Schmidt et al., 2018). Bisher ist die Bedeutsamkeit der Interaktionsqualität und -häufigkeit in frühen naturwissenschaftlichen Bildungsangeboten auf Gruppenebene im Vergleich zur Zielkindebene für die kindlichen Kompetenzen nicht untersucht. Fragestellung Wie hängt die Interaktionsqualität und -häufigkeit auf Gruppen- sowie Zielkindebene in frühen naturwissenschaftlichen Bildungsangeboten mit der kindlichen Lernmotivation und dem Wissen in den Naturwissenschaften zusammen? Methode Für die Studie wurden 60 Bildungsangebote frühpädagogischer Fachkräfte (MAlter = 38.6 Jahre, 90% weiblich) zum Thema „Wasser“ (Umfang ca. 20-30 min) mit je einer Gruppe von 3-7 Kindern (Gesamt N = 240, MAlter = 5.7 Jahre, 53% weiblich, 21.3% mit nicht deutscher Familiensprache) videografiert. Die Interaktionsqualität auf Gruppenebene in den Bildungsangeboten wurde mit der CLASS Pre-K (Classroom Assessment Scoring System; Pianta et al., 2008) von insgesamt 6 Ratern eingeschätzt, die Häufigkeit der Fachkraft-Kind-Interaktionen wurde von 2 Ratern auf Zielkindebene kodiert sowie auf Gruppenebene aggregiert. Die naturwissenschaftliche Motivation der Kinder wurde mit der Y-CSM Skala (Oppermann et al., 2017) in 20-minütigen Einzelinterviews erhoben. Die Skala besteht aus den Subskalen naturwissenschaftliche Selbstwirksamkeitserwartung (16 Items, α=0.87) und Lernfreude (14 Items; α=0.92). Das naturwissenschaftliche Wissen der Kinder zum Thema „Wasser“ wurde in 20-minütigen Gruppenbefragungen erhoben (15 Items, α=0.75). Die Berechnung der Zusammenhänge zwischen der Interaktionsqualität bzw. -häufigkeit und den kindlichen Outcomes erfolgte mithilfe von Pfadmodellen in Mplus (Version 8.3, Muthén & Muthén, 1998–2017). Hintergrundmerkmale der Kinder und Fachkräfte sowie Rahmenbedingungen der Bildungsangebote (z.B. Dauer, Anzahl der teilnehmenden Kinder) wurden in den Analysen kontrolliert. Die Mehrebenenstruktur wurde in allen Analysen mit „TYPE = COMPLEX“ berücksichtigt und fehlende Werte wurden mit „full information maximum likelihood“ geschätzt. Ergebnisse Die Ergebnisse der Pfadmodelle zeigten keine Zusammenhänge der Interaktionsqualität (gemessen mit der CLASS Pre-K) auf Gruppenebene mit der kindlichen Lernmotivation (Selbstwirksamkeit: ß = -.07, p = .306; Lernfreude: ß = -.07, p = .363) oder dem Wissen (ß = .07, p = .260). Mit Blick auf die Häufigkeit der Fachkraft-Kind-Interaktionen zeigten sich keine signifikanten Zusammenhänge auf Gruppenebene (Selbstwirksamkeit: ß = -.01, p = .857; Lernfreude: ß = .06, p = .372; Wissen: ß = -.05, p = .476), aber auf Zielkindebene: Die Häufigkeit der Interaktionen eines einzelnem Kindes mit der Fachkraft während des naturwissenschaftlichen Bildungsangebotes stand in einem positiven Zusammenhang mit der naturwissenschaftlichen Selbstwirksamkeitserwartung des Kindes (ß = .20, p = .008). Für die naturwissenschaftlichen Lernfreude zeigte sich hier eine nicht signifikante Tendenz (ß = .12, p = .097), für das Wissen zeigten sich keine signifikanten Zusammenhänge (ß = -.07, p = .279). Die Ergebnisse des vorliegenden Beitrags deuten darauf hin, dass für die individuelle Lernmotivation von Kindern vor allem die Fachkraft-Kind-Interaktionen relevant sind, die ein einzelnes Kind in frühen naturwissenschaftlichen Bildungsangeboten erfährt. Die Interaktionsqualität und -häufigkeit auf Gruppenebene stand in keinem Zusammenhang mit der Lernmotivation oder dem Wissen. Einschränkend ist anzumerken, dass die Richtung der Zusammenhänge aufgrund des querschnittlichen Studiendesigns nicht klar bestimmt werden kann. Im Beitrag werden mögliche Ursachen für die nicht vorhanden Zusammenhänge auf Gruppenebene (u.a. längerfristige Entwicklung von Motivation und Wissen, Passung der Instrumente zu den Inhalten des Bildungsangebotes) sowie Perspektiven für die weitere Forschung unter Berücksichtigung der Zielkindebene diskutiert. Zusammenhänge zwischen verbaler Lernunterstützung (Scaffolding) mit bereichsspezifischem kindlichem Wissen im Bauspiel Lukas Schmitt¹, Anke Weber², Dominik Weber³, Miriam Leuchter¹ ¹RPTU Kaiserslautern-Landau, ²Universität Luxembourg, ³Universität des Saarlandes Theorie Verbale Lernunterstützung gilt als Schlüsselmerkmal instruktionaler Qualität im frühpädagogischen Setting und sollte bereichsspezifisch erfasst werden (e.g., Senden et al., 2022). Zur Untersuchung dieses Zusammenhangs sollte außerdem alltagsnahe Tätigkeit herangezogen werden (Leuchter & Naber, 2019). Das Bauspiel bietet pädagogischen Fachkräften (PFK) die Möglichkeit, kindliches Wissen in den Bereichen Bereich Stabilität, Mathematik und räumliches Denken durch die Verwendung adäquater sprachlicher Anregungen zu fördern. Für den Bereich Stabilität konnten Weber et al. (2020) zeigen, dass fünf- bis sechsjährige Kinder in der Lage sind, die Stabilität asymmetrischer Bauklotzanordnungen richtig einzuschätzen., wenn sie zuvor verbale Lernunterstützung (Scaffolding) von der Versuchsleitung erhielten. Weiterhin hat die Forschung gezeigt, dass die Verwendung von Sprache mit räumlichem bzw. mathematischem Bezug (spatial/ math language) bei Kindern positiv mit räumlichen Fertigkeiten (Casey et al., 2008) und numerischem Wissen (Purpura et al., 2021) assoziiert ist. Obwohl instruktionale Qualität stark zwischen pädagogischen Fachkräften (PFK) variiert (Burchinal et al., 2008), bleiben Studien, die den Einfluss instruktionaler Qualität auf kindliches Wissen untersuchen, rar. Weiterhin zeichnen Studien ein unklares Bild über die Stärke des Zusammenhangs zwischen instruktionaler Qualität und kindlichem Lernen (Pohle et al., 2022; Weiland et al., 2013). Ein methodisches und ethisches Problem bei der Untersuchung des Zusammenhangs stellt die experimentelle Manipulation instruktionaler Qualität dar. Die vorliegende Studie gibt erste Einblicke in die Zusammenhänge zwischen instruktionaler Qualität von PFK mit kindlichem Wissen im Bauspiel. Fragestellung (1) Zeigen sich Zusammenhänge zwischen verbaler Lernunterstützung durch die PFK und kindlichem bereichsspezifischem Wissen (Stabilität, Mathematik, räumliche Sprache)? Methode Es wurden 73 Interaktionen freien Bauspiels zwischen PFK und einer Kleingruppe von maximal fünf Kindern (M = 71.31 Monate, SD = 7.67, Min = 52, Max = 92) videografiert. Für der Auswertung wurden die Videos in zehnsekündige Analyseeinheiten segmentiert. In jeder Analyseeinheit wurde kodiert, ob die PFK Scaffolding, räumliche oder mathematische Sprache verwendeten (0/1). Die Werte wurden anschließend zu Summenscores aggregiert. Eine Übersicht über das Kategoriensystem gibt Tabelle 1. Drei RaterInnen bewerteten 20 der 73 Videos unabhängig voneinander. Die Übereinstimmung lag in einem guten Bereich (αKrippendorff = .80; vgl. Krippendorff, 2004). Kindliches Stabilitätswissen wurde über den „Center-of-Mass-Test“ (Weber & Leuchter, 2020) erfasst, bei dem die Stabilität von 16 Bauklotzanordnungen bewertet werden muss (αstabil = .65, αinstabil = .60). Mathematisches Wissen wurde über vier Subskalen des „Würzburger Vorschultests“ erfasst (Endlich et al., 2015; α = .91). Räumliche Sprache wurde über ein auf der Basis des Kategoriensystems von Cannon et al. (2007) selbstentwickeltes Testinstrument erfasst (α = .80). Ergebnisse Deskriptiv zeigte sich eine große Varianz im Einsatz verbaler Lernunterstützung zwischen PFK. Zunächst wurde untersucht, ob ein kategorienübergreifender Zusammenhang zwischen sprachlichem Input und kindlichem Wissen besteht. Dazu wurden die Werte der Dimensionen Scaffolding, räumliche und mathematische Sprache zu einem Summenscore aggregiert. Es zeigte sich eine signifikant positive Korrelation des generischen Scores mit kindlichem Stabilitätswissen (r = .18). Bei einzelner Betrachtung der sprachlichen Inputvariablen zeigte sich, dass Scaffolding (r = .16), räumliche Sprache (r = .13) und mathematische Sprache (r = .16) signifikant positiv mit dem Stabilitätsverständnis assoziiert waren. Eine multiple Regression zeigte jedoch, dass nur Scaffolding inkrementelle Validität bei der Vorhersage von Stabilitätswissen besaß (β = .13, t (352) = 2.28, p = .023); insgesamt konnten 3% der Varianz im Kriterium aufgeklärt werden (F (3, 352) = 3.89, p = .009). Mathematische Sprache war negativ mit dem Mathematikwissen der Kinder korreliert (r = -.15). Diskussion Die Ergebnisse zeigen, dass der Einsatz verbaler Lernunterstützung mit kindlichem Wissen assoziiert ist, die Effekte scheinen aber eher klein zu sein. Das korrelative Design der Studie lässt allerdings keine kausalen Inferenzen über den Zusammenhang zu. Die negative Korrelation zwischen mathematischer Sprache und Mathematikwissen muss als Artefakt diskutiert werden.
10:30 - 12:10	1-14: Förderung diagnostischer Kompetenzen von Lehkräften Ort: H07
	Paper Session Förderung von Diagnosekompetenz in der Politikdidaktik. Entwicklung und Qualitätsüberprüfung einer Matrix zur Analyse von politischen Schülerinnenurteilen Martin Kenner¹, Florian Weber-Stein² ¹Universität Stuttgart; ²PH Ludwigsburg, Deutschland Theoretischer Hintergrund Diagnostische Kompetenz spielte in der Lehramtsausbildung lange Zeit eine untergeordnete Rolle, auch weil fälschlicher Weise ein automatischer Zusammenhang zwischen Diagnosekompetenz und langjähriger Berufserfahrung angenommen wurde (kritisch bereits Weinert & Schrader, 1986). Demgegenüber ist davon auszugehen, dass nicht Praxis per se, sondern gezielte Interventionen und eine theoriegeleitete Praxisreflexion im Rahmen der Lehrkräfteausbildung pädagogische Diagnosekompetenz schulen (Klug et al., 2013; Radkowitsch et al., 2023). In diesem Zusammenhang gewinnen Diagnoseinstrumente an Bedeutung, die die systematische Anbahnung diagnostischer Kompetenzen unterstützen. Bislang existieren in der Politikdidaktik erst vereinzelte Ansätze zur Entwicklung domänenspezifischer Diagnoseinstrumente (Füchter, 2010, 2011; Mosch, 2013; Weber-Stein, 2018). Insbesondere im Bereich der Förderung politischer Urteilsfähigkeit – unbestritten ein zentraler Lernbereich in der Politikdidaktik (Klee, 2008; May, 2017) – ist die Diskrepanz zwischen der zugeschriebenen Bedeutung und der empirischen Evidenz zu wirksamen Diagnosen und Fördermechanismen frappierend (Weißeno & Weißeno, 2021). Wir gehen davon aus, dass die gezielte Förderung politischer Urteilsfähigkeit eine adäquate fachdidaktische Diagnose voraussetzt. Die differenzierte Einordnung eines Schülerinnenurteils erscheint für die Begründung fachdidaktischer Entscheidungen notwendig. Fragestellung Zur systematischen Analyse von politischen Urteilen haben wir in Anlehnung an den politikdidaktischen Forschungsstand zur politischen Urteilsfähigkeit (Massing, 2003; Manzel & Weißeno, 2017; May et al., 2020) eine 3x3-Felder-Matrix entwickelt. Sie erlaubt eine qualitative Einordnung von Schülerinnen-Urteilen auf drei Niveaustufen (basal, ansatzweise differenziert, elaboriert) hinsichtlich drei inhaltlich unterschiedlicher Dimensionen (Argumentationsstärke, Fachkonzepte, Perspektivendifferenzierung). Damit die Analysematrix die ihr zugeschriebene Funktion erfüllt, zum Aufbau diagnostischer Kompetenzen beizutragen, muss sie gängigen wissenschaftlichen Gütekriterien (Inhalts-/ökologische Validität, Reliabilität) genügen. Unser Schwerpunkt im Vortrag wird dabei auf der Reliabilität liegen, d.h. der Frage, inwiefern die Matrix zu zuverlässigen Zuordnungen führt. Konkret wird untersucht, inwiefern Zuordnungen innerhalb der 3x3-Felder-Matrix personenübergreifend (Interrater-Reliabilität) und personenbezogen (Intrarater-Reliabilität) vergleichbar ausfallen. Methode Die Untersuchung der Zuverlässigkeit des Instruments ist Teil einer Interventionsstudie zur Anbahnung diagnostischer Kompetenzen von Lehramtsstudierenden im Masterstudiengang Politikwissenschaft (N=50). Die Studie ist als Zeitreihenexperiment mit drei Messzeitpunkten (t_o, t₁, t₂) konzipiert und für die Reliabilitätsanalyse liegen über 1.000 Kodierbeispiele vor. Im Rahmen eines moodle-basierten Lern-Moduls, das gemäß einem moderat konstruktivistischen Lernmodell (Van Merriënboer 2020) gezielte Instruktionen mit Übungsphasen verbindet, werden die Studierenden mit der Analysematrix vertraut gemacht. Im Anschluss raten sie in zwei iterativen Zyklen im Abstand von 4 Wochen (t₁, t₂) Schülerinnenurteile auf Grundlage der Matrix. Diese Phase wird durch Kollaborationen gestützt, in denen die Studierenden ausgewählte Diagnoseurteile vergleichen und sich argumentativ über Standards der Diagnostik austauschen. Für die Interrater-Reliabilität werden Querschnittsdaten der Messzeitpunkte t₁ und t₂ herangezogen, während die Intrarater-Reliabilität längsschnittlich mit den personenbezogenen Zuordnungen von t₁ und t₂ untersucht wird. Ergebnisse Die Inhaltsvalidität des Instruments nehmen wir durch die deduktive Entwicklung aus dem politikdidaktischen Diskussionsstand zur Urteilsbildung als gegeben an. Beispielsweise ist die Dimension „Fachkonzepte“ Teil des bestehenden Bildungsplans. Um die ökologische Validität der Matrix zu gewährleisten, wurde das Diagnoseinstrument mit fünf Expertinnen aus der Unterrichtspraxis (gymnasiales Lehramt) kommunikativ validiert. Im Ergebnis wurde die vorliegende 3x3-Felder Matrix für unterrichtende Lehrerinnen als adäquat betrachtet. Eine diesbezügliche, vertiefende Interview-Studie mit Lehrerinnen aus allen Schulformen ist derzeit in Vorbereitung. Unsere bisherigen Daten lassen bezüglich der Reliabilität der Matrix zufriedenstellende bis gute Ergebnisse erkennen. Die Konvergenz der Diagnosen (Interrater-Reliabilität* t_1,t₂) ist nahezu durchgängig zufriedenstellend ausgeprägt: 8 von 10 Gruppen erreichen akzeptable Konkordanzwerte (Kendalls W > .6). Die personeninterne Konsistenz der Ratings (Intrarater-Reliabilität t₁-t₂) ist über alle Dimensionen hinweg erkennbar ausgeprägt (Cohens κ > .7). Die Daten führen aus unserer Sicht zu der Einschätzung, dass die Analysen mit der Matrix unter den vorgestellten Interventionsbedingungen zu zuverlässigen Zuordnungen führen. Die Matrix kann deshalb zur Entwicklung diagnostischer Kompetenz beitragen. Damit ist jedoch nicht geklärt, wie nachhaltig die Verankerung in den subjektiven Diagnosekonzepten ausfällt. Paper Session Förderung der professionellen Unterrichtswahrnehmung durch geskriptete Unterrichtsvideos - Evaluation des Einflusses von beispielhaften Videoannotationen auf Unterrichtsreflexionen Jana-Kristin von Wachter, Stephanie Moser, Doris Lewalter Technische Universität München, Deutschland Theoretischer Hintergrund Das Konzept der professionellen Unterrichtswahrnehmung reicht in mehreren Facetten von noticing, über knowledge-based reasoning und interpreting, bis hin zum decision-making (König et al., 2022; Jahn et al., 2014, Kaiser et al., 2017). Zur Schulung der professionellen Unterrichtswahrnehmung kann die Beschäftigung mit Unterrichtsvideos einen wesentlichen Beitrag leisten, insbesondere wenn das Gesehene reflektiert wird. Oftmals werden bei einer Videoanalyse bedeutungstragenden Sequenzen in den gezeigten Videos nicht erkannt und die anschließenden Unterrichtsreflexionen bleiben eher auf einem oberflächlichen Niveau (noticing). Daher profitieren vor allem angehende Lehrende von instruktionaler Unterstützung beim Umgang mit Unterrichtsvideos (Nagro et al., 2016). Insbesondere der Übergang vom noticing zum reasoning und schließlich zum Treffen instruktionaler Entscheidungen ist ohne Hilfestellung schwierig zu bewältigen (Calandra, Gurvitch & Lund, 2008). Um die aktiv-produktive Auseinandersetzung mit Unterrichtsvideos instruktional zu unterstützen, können Videoannotationen als Reflexions- und Diskussionsanker dienen, die zur intensiveren Auseinandersetzung mit den Unterrichtsvideos anregen und deren Bearbeitung erleichtern sollen (Krüger et al, 2012). Das Ziel dieser empirischen Vergleichsstudie ist es, die Effektivität von beispielhaften Annotationen als instruktionalem Unterstützungsansatz zur Qualitätsförderung der Unterrichtsreflexion am Beispiel des thematischen Schwerpunkts motivationale Aktivierung zu ermitteln. Alle Proband:innen können zu allen gezeigten Videos grundsätzlich selbstständig Videoannotationen erstellen. Die Treatmentgruppe (TG) erhielt im Vergleich zur Kontrollgruppe (KG) zusätzlich Lernhilfen in Form von vorgefertigten Beispielannotationen in den Videos. In der Studie wird untersucht, inwieweit (1) sich die Anzahl der selbst erstellten Annotationen in der Treatment- und Kontrollgruppe unterscheiden, (2) sich die Anzahl der selbst erstellten Annotationen auf die Qualität der Unterrichtsreflexionen auswirkt, (3) sich die Qualität der Unterrichtsreflexionen der beiden Vergleichsgruppen, gemessen an den Facetten der professionellen Unterrichtswahrnehmung, unterscheidet. Methode Teilnehmende Lehramts- und Psychologiestudierenden (N = 52, 1. - 7. Semester, gleichverteilt über beide Gruppen) betrachten drei Unterrichtsvideos aus der Lernplattform Toolbox Lehrerbildung. Der TG wird instruktionale Unterstützung in Form von Beispielannotationen als Lernhilfen in unterschiedlicher Anzahl (fading out) in Szene 1 und Szene 2 geboten. Die KG erhält keine Lernhilfen. Nach dem zweiten und dritten Video verfassen sie jeweils eine schriftliche Reflexion mit Hilfe aller Annotationen. Insgesamt sind 93 Reflexionen gesammelt worden (Szene 2: 28 in TG, 17 in KG; Szene 3: 31 in TG, 19 in KG). Diese wurden mittels einer qualitativen Inhaltsanalyse entsprechend den Facetten der professionellen Unterrichtswahrnehmung kodiert und ausgewertet. Abgerundet wurde das Studiendesign durch einen Pretest, in welchem persönliche Eigenschaften wie Vorwissen zu motivationaler Aktivierung, die eigene Motivation und eine Selbsteinschätzung zum Umgang mit Unterrichtsvideos erfasst wurden. Im Posttest wurde die Selbsteinschätzung erneut abgefragt, um gegebenenfalls eine Änderung festzustellen. Ergebnisse und ihre Bedeutung Bezüglich der Anzahl der Annotationen konnte zwischen den beiden Vergleichsgruppen kein Unterschied festgestellt werden. Die Anzahl der erstellten Annotationen korreliert jedoch mit zwei der vier Facetten der professionellen Unterrichtswahrnehmung in den Reflexionen positiv (noticing: r(13) = 0.88, p < .001; reasoning: r(13)= 0.69, p = .009). Daraus lässt sich schließen, dass das Erstellen von Annotationen den Lernenden hilft, auch in den Unterrichtsreflexionen das Beobachtete und den Schritt zur Verknüpfung mit ihrem Theoriewissen auszuführen. In den Reflexionen für Szene 2 findet sich in der KG signifikant mehr noticing (t(43) = 2.01; p = 0,026, d = 5.44). In dieser Szene hatte die TG die vorgefertigten Beispielannotationen, woraus sich vermuten lässt, dass sich die Proband:innen weniger mit der Facette des noticing beschäftigten, da dies bereits in den Beispielannotationen aufgeführt war. In Szene 3, die für beide Gruppen gleich gestaltet war, hat die TG signifikant mehr interpreting (t(46) = 2.53; p = 0,007, d = 0.68) durchgeführt. Die Lernhilfen unterstützen damit in Szene 3 das Fokussieren auf den zukünftigen Lernprozess der Lernenden, eine der schwierigeren Facetten der professionellen Unterrichtswahrnehmung, und sorgen für eine umfassendere Unterrichtsreflexion. Im Vortrag werden die Befunde vorgestellt und im Hinblick auf ihre Bedeutung für die Förderung der professionellen Unterrichtswahrnehmung durch Unterrichtsvideos diskutiert. Paper Session Simulationen mit adaptivem Feedback mittels künstlicher neuronaler Netze: Ein Feldexperiment zur Förderung von Diagnosekompetenzen in der Lehrerbildung Elisabeth Bauer¹, Michael Sailer², Frank Niklas³, Samuel Greiff⁴, Sven Sarbu-Rothsching⁵, Jan Zottmann⁵, Jan Kiesewetter⁵, Matthias Stadler⁵, Martin R. Fischer⁵, Tina Seidel¹, Detlef Urhahne⁶, Maximilian Sailer⁶, Frank Fischer³ ¹Technische Universität München; ²Universität Augsburg; ³Ludwig-Maximilians-Universität München; ⁴Université du Luxembourg; ⁵Klinikum der Universität München, LMU München; ⁶Universität Passau Simulationen bieten die Möglichkeit, bereits während des Lehramtsstudiums Diagnosekompetenzen praxisorientiert zu fördern (Chernikova et al., 2020). Studierende benötigen beim Lernen mit Simulationen adaptives und elaboriertes Feedback (z.B. Narciss et al., 2014), was hohe Anforderungen an Lehrende stellt. Fortschritte in der künstlichen Intelligenz ermöglichen jedoch eine automatisierte Auswertung komplexer Daten wie Texteingaben als Basis für adaptives elaboriertes Feedback: Eine Laborstudie verglich bereits automatisiert-adaptives Feedback auf Basis von künstlichen neuronalen Netzen mit statischem Feedback in Form einer Expertenlösung (Sailer et al., 2023). Die Intervention mit sechs simulierten Fällen zu Lern- und Verhaltensauffälligkeiten bei Schüler:innen hatte keinen signifikanten Effekt auf die Genauigkeit diagnostischer Urteile; jedoch hatte das adaptive Feedback einen positiven Effekt auf die Qualität der diagnostischen Begründungen. Durch gezielte Hinweise zu den Argumentationsprozessen der Lernenden erhöhte das adaptive Feedback die Salienz relevanter Feedbackinformationen (Machts et al., 2023). Für die Förderung der Diagnosegenauigkeit könnte eine Einbettung in den Lehrbetrieb vorteilhaft sein, da Studierende in entsprechenden Lehrveranstaltungen mehr relevantes Vorwissen mitbringen. Daher untersuchte die vorliegende Studie die Effekte automatisiert-adaptiven Feedbacks im Vergleich zu statischem Feedback beim simulationsbasierten Lernen unter Feldbedingungen. In dem Feldexperiment bearbeiteten N = 230 (nach Ausschluss Teilnehmender mit mehreren unvollständigen Antworten) Lehramtsstudierende fünf deutscher Universitäten in Online-Lehrveranstaltungen drei simulierte Fälle zu Lernauffälligkeiten bei Schüler:innen und erhielten adaptives (n = 118) oder statisches (n = 112) Feedback. Die Lehramtsstudierenden gaben zu jedem simulierten Fall ein Urteil in Form einer Diagnosestellung an (Einfachauswahlfrage) und schrieben eine diagnostische Begründung (Freitextfrage). In einem Posttest bearbeiteten sie einen weiteren simulierten Fall ohne Feedback. Der Effekt des adaptiven vs. statischen Feedbacks auf die Diagnosegenauigkeit (Übereinstimmung mit wahrscheinlichster Diagnose entsprechend des Falldesigns) und die Qualität der diagnostischen Begründung (Berücksichtigung der sechs relevantesten Fallinformationen) in der Lernphase und im Posttest wurde mit zwei multivariaten Kovarianzanalysen berechnet; als Kontrollvariable wurde die Leistung im ersten Lernfall berücksichtigt, da die erste Feedback-Intervention erst nach Absenden der Antwort erfolgte. Es zeigte sich ein signifikanter positiver Effekt des adaptiven Feedbacks auf die Qualität der diagnostischen Begründung in der Lernphase, F(1,227) = 4.01, p = .047, η_p² = 0.017, und im Posttest, F(1,227) = 6.78, p = .010, η_p² = 0.029, mit jeweils kleiner Effektstärke. Die Diagnosegenauigkeit war sowohl in der Lernphase, F(1,228) = 1.42, p = .234, η_p² = 0.006 , als auch im Posttest, F(1,228) = 1.12, p = .290, η_p² = 0.005, nicht signifikant unterschiedlich zwischen den Feedback-Gruppen. Die Ergebnisse stützen das Befundmuster der vorangegangenen Laborstudie: Lernende scheinen durch das adaptive Feedback zunächst im diagnostischen Begründen gefördert zu werden. Die erhöhte Salienz relevanter Feedbackinformationen im adaptiven Feedback gibt möglicherweise kognitive und meta-kognitive Ressourcen für den Lernprozess frei. Um einen positiven Effekt des adaptiven Feedbacks auf die Diagnosegenauigkeit zu erzielen, könnten weitere Simulationslerneinheiten förderlich sein und relevantes professionelles Wissen vertiefen. Die Studie zeigt, dass auch unter Feldbedingungen in Online-Seminaren der Einsatz von automatisiert-adaptivem Feedback auf Basis von Sprachverarbeitung mittels künstlicher neuronaler Netze vorteilhaft sein kann. Paper Session Isoliert oder integriert? – Instruktionsformate für Videoanalysen zur Förderung der professionellen Unterrichtswahrnehmung von Unterrichtsqualität Jasmin Lilian Bauersfeld¹, Patricia Calies², Heike Hahn², Bernadette Gold¹ ¹TU Dortmund, Deutschland; ²Universität Erfurt Theoretischer Hintergrund Unterrichtsqualität umfasst die Basisdimensionen Klassenführung, kognitive Aktivierung und emotionale Unterstützung (Pianta & Hamre, 2009; Praetorius et al., 2018), die in Unterrichtssituationen sowohl miteinander verwoben als auch isoliert fokussiert werden können (Hörter et al., 2020). Um qualitätsvollen Unterricht umzusetzen benötigen Lehrkräfte professionelle Unterrichtswahrnehmung (PUW) (Blömeke et al., 2015; Blömeke et al., 2022). Die PUW besteht aus dem Beschreiben und Interpretieren von relevanten Unterrichtssituationen, um Handlungsalternativen zu generieren (Sherin & van Es, 2009). Dadurch, dass Expertenlehrkräfte nicht nur kompetent Unterrichtssituationen beschreiben, interpretieren und Handlungsalternativen generieren können, sondern dabei auch die drei Basisdimensionen der Unterrichtsqualität integrieren können (Berliner, 2001), umfasst die PUW ebenfalls die Integration der Basisdimensionen. Diese Prozesse der PUW können durch Videoanalysen erfolgreich gefördert werden (Gold et al., 2021). Jedoch müssen die Unterrichtsvideos sinnvoll instruktional eingebettet werden (Blomberg et al., 2013; Santagata et al., 2021). Studien der Instruktionsforschung haben gezeigt, dass eine integrierte Vermittlung von Lerninhalten Lernprozesse fördern kann (Harr et al., 2014), indem Lerninhalte gleichzeitig fokussiert und dadurch das Abrufen und Aktivieren verschiedener Lerninhalte gefördert werden kann (spreading activation; Anderson, 1983). Dementsprechend könnte eine integrierte Vermittlung, bei welcher alle Basisdimensionen gleichzeitig in Videoanalysen fokussiert werden, deren Anwendbarkeit (Renkl et al., 1996) und Abrufbarkeit (Anderson, 1983) begünstigen und somit auch die PUW fördern. Allerdings sind Lehramtsstudierende aufgrund geringer Unterrichtserfahrungen und geringem Wissen (Putnam & Borko, 2000) bei Videoanalysen stark kognitiv belastet (Syring et al., 2015). Somit könnte eine isolierte Vermittlung der Basisdimensionen in Videoanalysen die PUW möglicherweise besser fördern, da hierbei jede Basisdimension in einzelne Unteraufgaben dekonstruiert wird und dies die kognitive Belastung reduziert (van Merriënboer et al., 2002). Fragestellung Die Studie überprüft dementsprechend die konkurrierenden Annahmen, ob eine integrierte oder isolierte Vermittlung der Basisdimensionen bei Videoanalysen die PUW besser fördert. Methode In der quasi-experimentellen Studie nahmen N=144 Lehramtsstudierende (M_Alter=22.76, SD_Alter=2.27, 79.9% weiblich) an einem 3-wöchigen videobasierten Seminar teil. Eine Interventionsgruppe fokussierte in den Videoanalysen von Grundschulmathematikunterricht jeweils eine Basisdimension pro Sitzung isoliert, während eine zweite Interventionsgruppe die Basisdimensionen in jeder Sitzung integriert analysierte. Ein mathematikdidaktisches Seminar fungierte als Kontrollgruppe. Prä-Post-Tests erfassten die PUW in schriftlichen Videoanalysen, in welchen die Anzahl der beschriebenen Ereignisse (Beschreibung), die mittlere Qualität der Interpretationen sowie die mittlere Qualität der genannten Handlungsalternativen (κ=.83; Gippert et al., 2022) anhand eines Masterratings kodiert wurden. In diesen schriftlichen Analysen wurde ebenfalls die Integration der Basisdimensionen für die Beschreibungen, Interpretationen und Handlungsalternativen ausgewertet (0-2) (κ=.77). Ergebnisse Die vorläufigen Ergebnisse von ANOVAs mit Messwiederholung zeigen keine Unterschiede zwischen den Gruppen im Beschreiben, Interpretieren und Generieren von Handlungsalternativen, sowie in der Integration der Basisdimensionen beim Beschreiben. Hingegen fanden wir bezüglich der Integration der Basisdimensionen signifikante Unterschiede zwischen den Gruppen im Interpretieren, F(1,137)=8.06, p<.001, η_p²=.105. Die Bayessche ANOVA mit Messwiederholung wies auf einen starken Interaktionseffekt (Zeit × Gruppe) BF₁₀=26588.60. Geplante Kontraste zeigten Vorteile für die integrierte Gruppe gegenüber der isolierten Gruppe, t(1,95)=3.35, p=.001, und der Kontrollgruppe, t(1,90)=2.31, p=.022. Es gab keine signifikanten Unterschiede zwischen den Gruppen in der Integration der Basisdimensionen beim Handlungsalternativen Generieren, F(1,137)=2.48, p=.088, η_p²=.035, und anekdotische Evidenz für die Alternativhypothese, BF₁₀=1.07. Geplante Kontrastanalysen wiesen signifikante Vorteile für die isolierte Gruppe gegenüber der integrierten Gruppe, F(1,95)=2.43, p=.016, sowie der Kontrollgruppe, F(1,90)=2.42, p=.017, auf. Diskussion Die vorläufigen Ergebnisse zeigen keine Unterschiede zwischen den verschiedenen Instruktionsarten oder zwischen den beiden Videoanalysebedingungen und der Kontrollgruppe bezüglich der Förderung des Beschreibens, Interpretierens und Handlungsalternativen Generierens. Allerdings konnte im Gegensatz zur Kontrollgruppe durch Videoanalysen eine stärkere Integration der Basisdimensionen bewirkt werden (siehe auch Santagata & Guarino, 2011). Die integrierte Vermittlung der Basisdimensionen führte zu einer stärkeren Integration der Basisdimensionen beim Interpretieren, während die isolierte Vermittlung eine stärkere Integration beim Handlungsalternativen Generieren erwirkte. Mögliche Erklärungen und Limitationen werden diskutiert.
10:30 - 12:10	1-15: Instruktionale Unterstützung Ort: S14
	Paper Session Unlocking Math Potential in Low-SES Students - Instructional Scaffolds as Road Map to Improved Performance for Students with Unfavorable Prerequisites Katharina M. Bach¹, Frank Reinhold², Sarah I. Hofer¹ ¹Ludwig-Maximilians-Universität München; ²Pädagogische Hochschule Freiburg Socioeconomic status (SES) accounts for up to one-third of inequality in education (Martins & Veiga, 2010); the influence is particularly strong in Germany (Baumert & Schümer, 2001; Müller & Ehmke, 2015). Coming from a family with low SES is considered a risk for educational achievement (Sirin, 2005) because SES is strongly associated with various cognitive (e.g., attention, Hoyer et al., 2023) and non-cognitive variables (e.g., self-concept, Gujare & Tiwari, 2016) related to school success. These variables need to be considered to understand and address the issue of educational achievement as a function of SES by providing students with tailored instructional support. Therefore, we examined prototypical profiles of low-SES students to investigate their different prerequisites. Next, we investigated which instructional scaffolds help them best in the context of mathematics since the performance gap between low- and high-SES students is especially pronounced in this subject (Ditton & Maaz, 2011; Hentges et al., 2019; Lubienski, 2002). 321 German 6th-grade students (academic track school: n = 190, non-academic track school: n = 131) participated in our intervention study. They were assigned to an intervention or control condition and worked through an e-textbook with four blocks of increasingly complex content in fractions. As intervention, they received different instructional scaffolds: adaptive task difficulty, process feedback, or animations. Everyone had to complete a pre- and post-knowledge test and work on test instruments to assess individual cognitive and affective variables. We employed latent profile analyses (LPA) to identify distinct profiles based on nine cognitive and affective indicators and determine whether there are profiles that are systematically more likely to occur in low-SES students. Three profiles were identified: inattentive unfavorable, attentive unfavorable, and favorable. Low-SES students are more likely to be associated with the two unfavorable profiles, characterized by lower scores in attention, visuo-spatial abilities, general reasoning skills, math knowledge (pretest), interest, cognitive and behavioral engagement, self-concept, and higher scores in math anxiety and excessive demand. Both profiles are similar except for the attention scores. Secondly, we fitted a linear mixed model with profile affiliation, condition, and school type as fixed effects and class as random effect. Results indicated that students in the two unfavorable profiles answered the post-test less accurately than their peers. A significant interaction effect revealed that students in the inattentive unfavorable profile benefitted significantly from the adaptive task difficulty. Moreover, the school type played a relevant role: Students at the non-academic track schools performed worse than their peers at academic track schools and benefited notably from adaptive task difficulty. The LPA shows the complex relationships between SES and cognitive and affective variables without presenting low-SES students through a deficit-based lens (Gorski, 2011; McKay & Devlin, 2016). Instead, results build a basis for deriving support measures. Low SES may be at the root of many educational difficulties (Tomul & Savasci, 2012), but understanding the interrelationships allows for intervention: Appropriate instructional support might mitigate or even compensate for the adverse effect of specific aptitudes and characteristics (Dietrichson et al., 2017). The finding that students in the two unfavorable profiles and students from non-academic track schools benefit from adaptive task difficulty is essential for designing math instruction that meets students where they are and shifts away from the "one fits all" model (Ohanian, 1999). Furthermore, the results point to the strong influence of school types. This raises, once more, the question of whether tracking after elementary school acts as a catalyst for educational inequity. Summarized, the study highlights the need for a technology-supported adaptive approach for low-SES students, addressing their aptitudes (e.g., Arroyo et al., 2014; Stebler & Reusser, 2017) and promoting educational participation through appropriate instructional scaffolds. Paper Session Gestufte Lernhilfen als adaptive Scaffolds: Die Rolle des Fähigkeitsselbstkonzepts bei der Wahl und Nutzung Julia Arnold, Andrea Lüscher, Maurer Michaela Zentrum Naturwissenschafts- und Technikdidaktik (ZNTD) - Pädagogische Hochschule FHNW, Schweiz Theoretischer Hintergrund: Beim forschenden Lernen handelt sich um einen selbstregulierten, offenen Lernansatz. Dies kann für unerfahrene Lernende kognitiv überwältigend sein (Kirschner, Sweller, & Clark, 2006). Daher sollten die Lernenden unterstützt werden (Furtak, 2006; Hmelo-Silver et al., 2007). Eine Meta-Analyse zeigt, dass Lernunterstützung eine wichtige Rolle beim forschenden Lernen spielt (Lazonder & Harmsen, 2016). Wie diese Unterstützung optimal aussehen sollte, ist Gegenstand aktueller Forschung (Rönnebeck et al., 2016). Eine Möglichkeit der individuellen Unterstützung sind gestufte Lernhilfen (Hänze, Schmidt-Weigand, & Stäudel, 2010). Sie bestehen aus mehreren Teilen und unterstützen die Lernenden auf unterschiedlichen Ebenen. In einer Studie zeigte sich, dass sie den Kompetenzerwerb beim Forschenden Lernen fördern und den Cognitive Load reduzieren können (Arnold, Kremer & Mayer, 2017). Jedoch hat sich auch gezeigt, dass sich der objektive Bedarf nicht mit der Hilfenwahl und -Nutzung deckt (Arnold, 2015). Dies kann darin begründet liegen, dass sich der objektive Bedarf nicht mit der subjektiven Einschätzung der Lernenden deckt. Forschungsfrage: Daher wird in diesem Beitrag die Rolle des Fähigkeitsselbstkonzepts (FSK) bei der Wahl und Nutzung von gestuften Lernhilfen untersucht. Das FSK ist die subjektive Einschätzung der eigenen Fähigkeit (Stiensmeier-Pelster & Schöne, 2008). Es liegt anderen motivationalen Faktoren (z.B. Zielorientierungen und Kausalattributionen; Köller & Schiefele, 1998) zugrunde. Entsprechend beeinflusst das FSK das Hilfen-Nutzungs-Verhalten im selbstregulierten Lernen (Stiensmeier-Pelster & Schwinger, 2007). Methode: Die gestuften Lernhilfen lagen in einem digitalen Lerntool zur Förderung der Experimentierkompetenzen vor. Den Lernenden standen unterstützend Hinweise, Beispiellösungen (instrumentelle Hilfen) und Lösungen (exekutive Hilfen) zur Verfügung. Vor und nach der Bearbeitung der Lernaufgaben bearbeiteten die Lernenden zwei Kompetenztests (Arnold, Kremer & Mayer, 2017; Arnold et al., 2018). Ausserdem wurden das FSK (Schöne et al., 2012), das Geschlecht, sowie die Anzahl und Art der genutzten Lernhilfen und die jeweilige Verweildauer (Log-Daten) erfasst. Die Lernenden wurden nach Gründen der Hilfenwahl, der Verständlichkeit und der Nützlichkeit der Hilfen befragt. Die Daten beziehen sich auf N = 422 (n_weiblich = 256, n_männlich = 161, n_divers = 5) Teilnehmende. Ergebnisse: Das Fähigkeitsselbstkonzept in Bezug auf das Planen von Experimenten M = 1.85 (SD = 0.81) liegt unterhalb des Mittelwerts der Skala (M = 2.5). Männliche Probanden, berichten ein signifikant höheres FSK (M = 2.07, SD = 0.77) als weibliche (M = 1.70, SD = 0.80), t(395) = -4.618, p < .000; r = -.48. In Bezug auf den Zusammenhang zwischen FSK und Kompetenz fällt auf, dass sowohl im Pretest (r = .219, p < .000) als auch im Posttest (r = .306, p < .000) im mittleren Bereich liegt. Ferner zeigt sich, dass Lernende mit höherem FSK auch einen höheren Lernzuwachs haben (r = .154, p = .002). Bei der Analyse der Hilfennutzung fällt auf, dass Lernende mit höherem FSK weniger Hilfen in Anspruch nehmen (r = -.113, p = .023) und insgesamt weniger Zeit bei den Hilfen verweilen (r = -.137, p < .006). Schaut man sich die Verweildauer pro Hilfe an, gibt es keinen Zusammenhang mehr zum FSK. Bei der Hilfenwahl fällt auf, dass das FSK keinen Zusammenhang mit der Nutzung von Beispielen oder Hinweisen hat. Jedoch nutzen Lernende mit höherem FSK weniger Lösungen (r = -.149, p < .003). Dieser Effekt ist zwar eher klein, lässt sich aber dadurch erklären, dass Lernende mit höherem FSK eher zu instrumentellen Hilfen tendieren. Betrachtet man die tatsächliche Passung der Hilfen zu dem angegebenen Grund der Hilfenwahl, ist ebenfalls kein Zusammenhang zum FSK zu erkennen. Während Lernende mit höherem FSK die Hilfen als verständlicher einschätzen (r = .201, p < .000, N = 359), finden sie sie in ihrer Wahl nicht passender oder nützlicher als Lernende mit geringerem FSK. Derzeit arbeiten wir an einem Strukturgleichunsgmodell zur Darstellung der Rolle des FSK. Paper Session Unterstützungsmöglichkeiten beim Lösen Bayesianischer Aufgaben und deren Auswirkung auf die kognitive Belastung Julia Sirock¹, Tina Seufert², Markus Vogel¹ ¹Pädagogische Hochschule Heidelberg, Deutschland; ²Universität Ulm, Deutschland Bayesianische Problemstellungen und deren Lösungen zeigen diverse Herausforderungen: Relevante numerische Informationen müssen gefunden, klassifiziert, in mathematische Formeln transformiert und mentale Darstellungen ausgebildet werden. Eine Erleichterung durch die Angabe numerischer Informationen im Häufigkeitsformat ist gut belegt (Brase, 2021). Viele Studien bestätigen eine Unterstützung durch gegebene Visualisierungen. Besonders effektive Abbildungen stellen die Einflussgröße der genesteten Struktur dar, beispielsweise die Vierfeldertafel oder das Einheitsquadrat (Eichler et al., 2020). Die Vierfeldertafel zeigt durch Strukturierung der Daten eine elegante, unterstützende Möglichkeit (Binder et al., 2015). Das Einheitsquadrat bietet zusätzliche bildhafte Komponenten durch zu den Zahlen proportionale Flächen und hilft der Visualisierung bei der Transformation von Bedingungen in mathematische Formeln (Vogel et al., 2019). Dynamisches Verschieben von Flächenverhältnissen fördert intuitives Denken und kognitive Barrieren, welche das Lösen Bayesianischer Probleme erschweren, werden abgebaut (Böcherer-Linder et al., 2018; Eichler & Vogel, 2013). Visualisierungen bieten eine Unterstützungsmöglichkeit, für die neben mentaler Verknüpfung der Aufbau kohärenter mentaler Repräsentation erforderlich ist (Kohärenzbildung, Seufert, 2003). Diese ist vielschichtig mit verschiedenen Ansätzen hierzu (vgl. Seufert & Brünken, 2006). Studien zeigen positive Effekte durch das Finden zusammenhängender Elemente (Schnaubert & Bodemer, 2017), beispielsweise unterstützend durch Farbgebung einzelner Elemente oder explizites Erklären der Beziehungen zwischen Repräsentationen (Vogt et al., 2020; Seufert, 2003). Die Kombination von Hervorhebung und Hilfe auf tieferer Ebene ist besonders hilfreich für den Lernerfolg und die Verringerung kognitiver Belastung (Seufert & Brünken, 2006). Der vorliegende Beitrag untersucht die Unterstützung beim Lösen Bayesianischer Aufgaben anhand drei unterschiedlicher Visualisierungen Formel (von Bayes), Vierfeldertafel und Einheitsquadrat, sowie die notwendigen kognitiven Prozesse. Ziel der Studie ist die Untersuchung der Auswirkungen unterstützender Ansätze für die Performanz und die erlebte passive und aktive kognitive Belastung (Klepsch & Seufert, 2021). Durch oben genannte Eigenschaften der Visualisierungen ergibt sich für die Performanz die Vermutung für folgende Reihenfolge der verwendeten Visualisierungen: Formel < Vierfeldertafel < Einheitsquadrat (Hypothese 1). Die räumliche Struktur der Vierfeldertafel und eine daraus resultierende bessere Übereinstimmung der äußeren und inneren Darstellung impliziert eine geringere passive kognitive Belastung im Vergleich zur Formel. Durch die bildliche Komponente im Einheitsquadrat ist eine weitere Verringerung der kognitiven Belastung anzunehmen: Einheitsquadrat < Vierfeldertafel < Formel (Hypothese 2). Demnach ergibt sich für die aktive kognitive Belastung das entgegengesetzte Muster: Formel < Vierfeldertafel < Einheitsquadrat (Hypothese 3). Es wurden insgesamt N = 30 Studierende der Psychologie befragt. Das Durchschnittsalter beträgt M = 22.17 (SD = 1.53, 83,3% weiblich). Die Befragungen erfolgten über die online-Plattform „Zoom“. Nach kurzer Einführung wurde das Vorwissen in Form einer bayesianischen Aufgabe ohne Hilfsmittel erfasst. Darauffolgend wurden die Teilnehmenden mittels standardisierter Prompts angeleitet, eigenständig eine Vierfeldertafel und ein Einheitsquadrat zu erstellen. Ein Erklärvideo rundete den instruktiven Teil ab. Sechs Bayesianische Textaufgaben mit jeweils einer der drei Visualisierungen und Abfrage über die aktive und passive Belastung folgten. Erste Ergebnisse zeigen deutliche Unterschiede bezüglich der drei Visualisierungen (𝑀_Formel=.733, 𝑆𝐷_Formel=.365; 𝑀_{Vierfeldertafel}=.917, 𝑆𝐷_{Vierfeldertafel}=.201; 𝑀_{Einheitsquadrat}=.967, 𝑆𝐷_{Einheitsquadrat}=.086). Eine ANOVA zeigte signifikante Unterschiede (𝐹(2,58)=7.756, 𝑝<.001, 𝜂_𝑝²= .221). Kontrastanalysen zeigten deutlich einen signifikanten Unterschied sowohl zwischen Einheitsquadrat und Formel (𝐹(1,29)=11.866, 𝑝<.002, 𝜂_𝑝²=.290) als auch Vierfeldertafel und Formel (𝐹(1,29)=5.858, 𝑝=.022, 𝜂_𝑝²=.168). Konträr zu zuvor getroffenen Annahmen war die passive kognitive Belastung beim Einheitsquadrat (𝑀=2,70, 𝑆𝐷=0,906) etwas höher als bei der Vierfeldertafel (𝑀=2.58, 𝑆𝐷=.891). Eine ANOVA zeigte signifikante Unterschiede (𝐹(2,58)=30,491, 𝑝<.001, 𝜂_𝑝²=0,513). In den Kontrastanalysen zeigten sich signifikante Effekte für den linearen Trend (𝐹(1,29)=38.872, 𝑝<.001, 𝜂_𝑝²=.573) und eine Bonferroni-korrigierte post-hoc Analyse ergab eine höhere passive Belastung bei der Formel von Bayes als bei der Vierfeldertafel (p<.001; M_Diff=1.167, 95% - 𝐶𝐼[. 726, 1.607]) und beim Einheitsquadrat (p<.001; M_Diff=1.050, 95% - 𝐶𝐼[. 622, 1.478]). Die aktive kognitive Belastung war durchgängig sehr hoch, wies jedoch keine signifikanten Unterschiede bezüglich der drei Visualisierungen auf. Paper Session Förderung des kollaborativen Problemlösens mit Lösungsbeispielen: Wie stark sollte die Selbsterklärung angeleitet sein? Dave Rexhäuser¹, Anika Radkowitsch², Constanze Richters³, Inga Glogger-Frey⁴, Stephan Abele¹ ¹Technische Universität Dresden; ²IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Kiel; ³Ludwig-Maximilians-Universität München; ⁴Universität Erfurt Kollaboratives Problemlösen ist in Bildung und Beruf bedeutsam (z.B. Zehner et al., 2017). Im Bereich der Kfz-Mechatronik erhöhen die zunehmende technische Komplexität und eine häufig dezentrale Informationsverteilung die Anforderungen und die Relevanz kollaborativer diagnostischer Problemlösung. Kollaboratives diagnostisches Problemlösen beschreibt die gemeinsame Anstrengung von mindestens zwei Personen, den aktuellen Zustand eines Systems (z. B. eines Kraftfahrzeugs) zu analysieren und die Ursache einer vorliegenden Störung zu identifizieren (Radkowitsch et al., 2022). Die Verbindung kollaborativer, d.h. interaktiver, und diagnostischer (inhaltlicher) Aktivitäten stellt dabei für Diagnostiker/innen eine doppelte kognitive Belastung dar (Kirschner et al., 2018). Aktuelle Forschungsergebnisse zeigen, dass Kfz-Mechatroniker/innen am Ende ihrer Ausbildung u.a. Schwierigkeiten haben für die Kollaboration relevante Inhalte zu identifizieren (Radkowitsch et al., eingereicht). Lösungsbeispiele können helfen Lern- und Problemlöseprozesse zu strukturieren und kognitive Belastung zu reduzieren (Renkl, 2014). Als weitgehend gesichert gilt, dass Selbsterklärungsaufgaben die Wirksamkeit von Lösungsbeispielen erhöht (Renkl & Eitel, 2019). Unklar ist, ob positive Effekte von Lösungsbeispielen bei kombinierter Förderung diagnostischer und kollaborativer Aktivitäten auftreten und wie stark Selbstklärungsaufgaben angeleitet sein müssen, um Lösungsbeispiele effektiv zu unterstützen. Im Beitrag untersuchen wir in einer Interventionsstudie die Auswirkungen des Einsatzes von Lösungsbeispielen mit unterschiedlich stark angeleiteten Selbstklärungsaufgaben auf den Austausch relevanter Inhalte, auf die Verteilung diagnostischer und kollaborativer Aktivitäten, auf den Diagnoseerfolg (diagnostische Genauigkeit) und auf die kognitive Belastung. Wir untersuchten 77 Dyaden von Auszubildenden der Kfz-Mechatronik in einem Prä-Post-Kontrollgruppendesign mit Messwiederholung. Die Intervention beinhaltete eine für alle Teilnehmenden identische Strategieinstruktion und eine gruppenspezifische Trainingsphase. Die Strategieinstruktion umfasste die Erläuterung erfolgsversprechender Verhaltensweisen während der kollaborativen Störungsdiagnose. In der Trainingsphase erprobten die zwei Experimentalgruppen die gelernten Verhaltensweisen an zwei Lösungsbeispielen, die eine Chatkommunikation zu kollaborativen Kfz-Störungsdiagnosefällen darstellten. Die beiden Experimentalgruppen erhielten unterschiedlich stark angeleitete Selbsterklärungsaufgaben, die entweder zur Erklärung spezifischer Aktivitäten in den Lösungsbeispielen (27 Dyaden) oder zu einer wenig spezifischen Erklärung zum Gelingen oder Nichtgelingen der Kommunikation im Lösungsbeispiel aufforderten (24 Dyaden). Nach Bearbeitung erhielten beide Gruppen eine Musterlösung. Die Kontrollgruppe (26 Dyaden) erprobte die Strategie an zwei Kfz-Störungsdiagnosefällen in einer Kfz-Computersimulation (Gschwendtner et al., 2009), ohne Lösungsbeispiele oder Selbsterklärungsaufgaben. In der Kfz-Computersimulation, die auch für Prä- und Posttest verwendet wurde, übernahmen die Dyaden unterschiedliche Rollen (Werkstatt; Servicehotline) und tauschten sich über Textchats aus. Wir codierten ausgetauschte Textchats der Dyaden hinsichtlich des Auftretens relevanter Inhalte, diagnostischer und kollaborativer Aktivitäten. Die diagnostische Genauigkeit bewerteten wir anhand der Dyaden-Antworten auf einer Skala von „0“ (Inkorrekte Diagnose) bis „4“ (Vollständig korrekte Diagnose). Zur Erfassung der kognitiven Belastung setzten wir eine kontextangepasste Selbsteinschätzungsskala ein (Klepsch & Seufert, 2020). Die Analysen umfassten Varianzanalysen bzw. nicht-parametrische Alternativverfahren. Alle Gruppen tauschten im Posttest signifikant mehr relevante Inhalte in den Dyaden aus als im Prätest (F(1,74) = 21,27, p =<.001, η²= .22). Der Effekt war signifikant größer, wenn Lösungsbeispiele verwendet wurden (F(2,74) = 3,82, p = .026, η²= .09), dabei machte es keinen Unterschied, ob stark oder schwach angeleitete Selbstklärungsaufgaben bearbeitet wurden (p = .732). Die Aktivitäten entwickelten sich in den Gruppen vergleichbar und blieben nah am Ausgangsniveau. Bezüglich der diagnostischen Genauigkeit zeigten sich keine signifikanten Veränderungen (V = 278, p = .190, r = .15) und keine signifikanten Gruppenunterschiede (p = .142). Teilnehmende der Kontrollgruppe berichteten eine signifikant höhere kognitive Belastung als Teilnehmende der Experimentalgruppen (F(2,151) = 4,05, p = .019, η²= .05). Zusammenfassend zeigt sich, dass Lösungsbeispiele und Selbsterklärungsaufgaben den Lernprozess zum kollaborativen diagnostischen Problemlösen unterstützen können. Insbesondere scheinen sie den korrekten Austausch relevanter Inhalte in den Dyaden zu fördern, was eine besondere Herausforderung für Auszubildende darstellt und erfolgsrelevant zu sein scheint (Radkowitsch et al., eingereicht). Wir vermuten, dass ein gesteigerter Fokus auf relevante Inhalte, langfristige Auswirkungen auf die Aktivitäten und die diagnostische Genauigkeit der Auszubildenden haben kann, hierfür jedoch weitere Übungsmöglichkeiten erforderlich sind.
10:30 - 12:10	1-16: Selbstregulation von Studierenden Ort: S15
	Paper Session Nicht leicht vom Weg abzubekommen: Motivationsverläufe von Lernenden, die einen non-formalen Online-Kurs absolvieren Maria Klose¹, Philipp Handschuh¹, Diana Steger¹, Cordula Artelt^1,2 ¹Leibniz-Institut für Bildungsverläufe (LIfBi), Bamberg, Deutschland; ²Lehrstuhl für Bildungsforschung im Längsschnitt, Otto-Friedrich-Universität Bamberg, Deutschland Non-formales Lernen gewinnt im alltäglichen Leben immer mehr an Bedeutung (Autorengruppe Bildungsberichterstattung, 2020). Dennoch sind die Abschlussquoten dieser Kurse eher gering (im Durchschnitt weniger als 10%; Jordan, 2014), obwohl die Lernenden anfangs hoch motiviert sind (de Barba et al., 2016). Daher stellt sich die Frage, wie sich die Motivation der Teilnehmenden über den Verlauf des Kurses verändert. Jedoch wird Motivation im non-formalen Kontext meist nicht längsschnittlich erhoben (z.B. Maya-Jariego et al., 2020; Romero-Frías et al., 2023) und dementsprechend ist über Motivationsverläufe in non-formalen Kursen nur wenig bekannt. Ziel der Studie ist es herauszufinden, zu welchem Ausmaß sich non-formal Lernende hinsichtlich ihres anfänglichen Motivationsniveaus und ihrer Motivationsverläufe über den Zeitraum der Kursbearbeitung hinweg unterscheiden. Ausgangspunkt für die Datenerhebung waren 51 frei zugängliche Online-Kurse der OPEN vhb (Virtuelle Hochschule Bayern, 2023). Die bis zu drei Messzeitpunkte wurden jeweils zu Beginn, nach 50% der Lektionen, sowie am Ende der Online-Kurse platziert. Die Teilnahme an den Onlinebefragungen war freiwillig. Insgesamt wurden 466 Teilnehmende (Alter in Jahren: M = 36, SD = 14.04, Range [16; 77]; davon 70.4% weiblich) in die Analysen mit einbezogen. Voraussetzung hierfür war, dass die erste Befragung ausgefüllt und eine Teilnahmebestätigung für den Kurs erreicht wurde. In allen drei Messzeitpunkten wurde situative Motivation (Subskalen intrinsische Motivation, identifizierte Regulation, introjizierte Regulation, externale Regulation und Amotivation von SIMS; Gillet et al., 2013; Guay et al., 2000) und situatives Interesse (SIS; Linnenbrink-Garcia et al., 2010) erfasst. In einer latenten Klassenanalyse der fünf Subtypen situativer Motivation zu jeweils drei Messzeitpunkten hatte ein Modell mit vier Klassen den besten Fit. Innerhalb jeder Klasse zeigten sich die Ausprägungen der Subtypen situativer Motivation stabil über die Zeit, unterschieden sich aber in der Höhe der Ausprägung situativer Motivation. Die meisten Lernenden (N = 196) wurden dem Profil „autonomer Typ“ zugewiesen, das durch hohe Werte auf intrinsischer Motivation und identifizierter Regulation und gleichzeitig niedrigen Werten auf den anderen Subtypen gekennzeichnet ist. Darüber hinaus gab es den „kontrollierten Typ“ (N = 27) mit den höchsten mittleren Ausprägungen auf externaler Regulation und Amotivation, den „moderaten Typ“ (N = 126) mit überwiegend moderaten Ausprägungen auf allen Subtypen, und den „introjizierten Typ“ (N = 101) mit den höchsten mittleren Ausprägungen auf introjizierter Regulation. In bivariaten Latent Change Score-Modellen wurde der Zusammenhang zwischen situativem Interesse und intrinsischer Motivation (N = 466; χ² = 446.036; df = 189; p <.001; CFI = .943; RMSEA = .055; SRMR = .053) und zwischen situativem Interesse und externaler Regulation (N = 466; χ² = 439.810; df = 189; p <.001; CFI = .950; RMSEA = .054; SRMR = .073) dargestellt. Es gab eine statistisch signifikante mittlere Veränderung der intrinsischen Motivation (σ² = .841, p <.001) und der externalen Regulation (σ² = .907, p = .003) von Messzeitpunkt 1 auf Messzeitpunkt 2 in Form eines Kompensationseffekts (d.h. Wachstum in intrinsischer Motivation bzw. externaler Regulation war für die Lernenden größer, die anfänglich niedrigere Werte hatten). Von Messzeitpunkt 2 auf Messzeitpunkt 3 gab es in beiden Modellen keine signifikante Veränderung. Alles in allem zeigte situative Motivation eine bemerkenswerte Stabilität über den Zeitraum der Bearbeitung eines non-formalen Online-Kurses, wobei sich individuelle Unterschiede in der Höhe der Ausprägung der motivationalen Subtypen zeigen. Allerdings können keine Aussagen über Kursabbrechende getroffen werden. Daher diskutieren wir unsere Ergebnisse im Hinblick auf die hohen Dropoutraten in non-formalen Online-Kursen. Paper Session Jetzt besorgt, später hoffnungsvoll? Dynamische Netzwerkmodellierung der Zusammenhänge zwischen Emotionen und Emotionsregulation innerhalb und zwischen Studierenden während der Prüfungsvorbereitung Martin Daumiller¹, David W. Putwain², Ulrike Nett¹ ¹Universität Augsburg, Deutschland; ²School of Education, Liverpool John Moores University, Liverpool, UK In Lern- und Leistungskontexten wie der Prüfungsvorbereitungsphase erleben Studierende eine Vielzahl positiver und negativer Leistungsemotionen, deren Regulierung entscheidend ist für akademischen Erfolg und Wohlbefinden (Forsblom et al., 2022; MacIntyre & Vincze, 2017; Pekrun et al., 2017; Pekrun et al., 2023). Trotz ihrer Relevanz sind Zusammenspiel und Dynamiken von Emotionen und Emotionsregulation allerdings noch wenig beforscht, zumal frühere Forschungsarbeiten primär auf between-person Ansätzen basieren (Jacobs & Gross, 2014). Zudem mangelt es an in situ Untersuchungen in anspruchsvollen Kontexten wie der Prüfungsvorbereitung (Rottweiler & Nett, 2021; Rottweiler et al., 2023) So haben Studien Emotionsregulationsstrategien und deren Zusammenhang mit Stimmung, Affekt und diskreten Emotionen untersucht (Brans et al., 2013; Gross & John, 2003; Heiy & Cheavens, 2014). Im Rahmen meist querschnittlicher Untersuchungen wurde dabei etwa untersucht, ob eine Person, die trauriger ist als andere, auch vermehrte bestimmte Emotionsregulationsstrategien einsetzt. Es ist allerdings von entscheidender Bedeutung, die Dynamiken dieser Konstrukte im Laufe der Zeit zu verstehen, einschließlich ihrer Anpassungen in verschiedenen Situationen und ihres gegenseitigen Einflusses (Aldao et al., 2015). Aktuellen Emotionsregulationmodellen folgend (Gross, 1998; Gross, 2014; Gross, 2015; Harley et al., 2019) beeinflussen sich Leistungsemotionen und Emotionsregulation gegenseitig, wobei Emotionen verschiedene Regulationsstrategien auslösen und auch die Anwendung verschiedener Strategien die nachfolgenden Emotionen beeinflussen kann. In dieser Studie verwendeten wir eine Experience-Sampling-Methode um Emotion und Emotionsregulation in situ zu erfassen und werteten die Daten mittels eines neuartigen statistischen Ansatzes aus, nämlich dynamischer Netzwerkmodellierung. Dieser erlaubt die simultane und multivariate Untersuchung von Zusammenhängen und Dynamiken zwischen Personen, zeitgleichen Zusammenhängen innerhalb dieser (z. B. wie kovariieren Veränderungen im emotionalen Erleben mit Veränderungen in der Nutzung von Emotionsregulationsstrategien) sowie zeitlich verzögerten Zusammenhängen (z. B. wenn eine Person mehr Ärger erlebt, welche Emotionsregulationsstrategien nutzt sie daraufhin, und umgekehrt, wie verändern sich Emotionen nach der Nutzung verschiedener Regulationsstrategien). Damit untersuchten wir die Zusammenhänge zwischen und innerhalb von Emotionen und Emotionsregulationsstrategien sowie deren zeitliche Stabilität. Wir interessierten uns insbesondere für Unterschiede in der Struktur der drei Netzwerke, da Effekte auf der Zwischenpersonenebene von den Innersubjekt-Effekten in einer spezifischen Lernsituation abweichen können. In Anlehnung an Rottweiler und Nett (2021) untersuchten wir zusätzlich Unterschiede in Abhängigkeit vom Abstand zur Prüfung (fünf Wochen vs. eine Woche vor der Prüfung) und erwarteten umso dichtere Netzwerke je näher die Prüfung. Wir erhoben insgesamt 6,915 Experience-Sampling Angaben von 201 Studierenden zu sechs Emotionen (Freude, Stolz, Hoffnung, Zufriedenheit, Angst, Wut und Langeweile) und acht Emotionsregulationsstrategien (Unterdrücken, Ausdrücken, soziale Unterstützung, positives Neuorientieren, Aktivierung, Grübeln, Neubewerten, Handeln) während der Prüfungsvorbereitung in zwei Erhebungswellen (fünf Wochen und eine Woche vor wichtigen Prüfungen). Wir verwendeten dazu Kurzformen bewährter Skalen (Abler & Kessler, 2009; Bieg et al., 2014; Carver, 1997; Carver et al., 1989; Garnefski & Kraaij, 2007; Goetz et al., 2013; Gross & John, 2003). Für beide Erhebungszeiträume separat berechneten wir Dynamische Netzwerkanalysen, eine multivariate Form des graphical Vector Autoregressive Modeling (gVAR; Epskamp et al., 2018; Wild et al., 2010); Auswertungsskript: https://osf.io/b9x4s/?view_only=da40670d2139453598643a2ea1d31a9f. Die Ergebnisse erbrachten unterschiedliche Cluster von Emotionen und Emotionsregulationsstrategien, wobei Handlungsaufnahme und Reappraisal eine besonders zentrale Stellung zur Erklärung der Zusammenhänge zwischen Emotionen und Emotionsregulationsstrategien einnahmen. Es fanden sich Hinweise für Auswirkungen von Emotionen auf die Anwendung von Emotionsregulationsstrategien und umgekehrt auch von Emotionsregulationsstrategien auf Emotionen, einschließlich selbstverstärkender Schleifen und Übertragungseffekte. Wir beobachteten zudem Unterschiede in der Stabilität der Konstrukte über die Zeit und zwischen den beiden Erhebungsphasen, was die Berücksichtigung nicht nur personen- und situationsspezifischer Komponenten, sondern auch des jeweiligen Kontextes unterstreicht. Emotionsregulation umfasst eine Vielzahl an Strategien, die mit individuellen und kontextbezogenen Merkmalen interagieren, was es zu einem anspruchsvollen, aber entscheidenden Forschungsbereich macht, um ein umfassendes Verständnis der Emotionsregulationsdynamik zu erlangen. Methodisch bekräftigen unsere Ergebnisse hierzu das Potenzial von dynamischen Netzwerkanalysen für Forschungsarbeiten zu diesem Thema. Paper Session Detecting distributed practice in logfile data: A comparison of different operationalizations and their predictive value for lasting learning Lea Nobbe, Jasmin Breitwieser, Garvin Brod DIPF \| Leibniz Institute for Research and Information in Education, Deutschland The distributed practice effect describes the positive effect of distributing learning over multiple sessions for long-term retention (Carpenter et al., 2012; Cepeda et al., 2006; Dunlosky et al., 2013). This effect has been studied extensively. Most investigations of distributed practice are conducted either as experiments (e.g., Cepeda et al., 2006; Moulton et al., 2006) or field studies in which self-report is used to capture distributed practice (e.g., Jost et al., 2021; Rodriguez et al., 2018). Both approaches have strengths and shortcomings. While (lab) experiments do not capture realistic study behavior, self-reports can suffer from participants’ unwillingness to share or inability to recall exactly how they studied. With learning platforms and apps becoming more and more ubiquitous, a lot of students’ study behavior is represented in their trace data. This allows for new ways of looking at distributed practice but also new questions. Since the data are now very fine-grained, there are fewer limits to the operationalization of distributed practice. However, not all operationalizations might be equally related to relevant study outcomes such as performance. To bring light to the question of appropriate operationalizations of distributed practice in trace data, we examined the link between various measures of distributed practice and the final grade achieved in a high-stakes exam in 339 medical students studying on a digital learning platform. Students prepared for the exam over the course of several months, mostly by answering practice questions. Usage of the learning platform allowed us to base our analyses on log files capturing the timing and nature of the learning activities performed by the students. We first operationalized distributed practice via the number of days students answered practice questions on the platform. We could additionally take into account how many questions they answered in total. Both the number of questions answered in total and the number of study days served as predictors of students’ exam scores. Stepwise linear regression models revealed that the number of days on which students answered practice questions predicted exam grades even when controlling for the number of practice questions answered in total (β_questions = 0.07, p = .289; β_days = 0.13, p = .040). Students who studied on more days and, thus, distributed their learning more scored higher on the exam. We are currently conducting further analyses, leveraging the fine-grained resolution of our data and taking into account the variability in the amount of practice questions answered over the course of exam preparation. This allows us to place emphasis on operationalizations of distributed practice in logfile data that vary in the degree of distributed practice. By this we mean whether students may have divided their learning over several days, but may have learned different amounts on those days. In this case, their learning would be divided but unevenly distributed. However, students could also learn exactly the same amount each day. In this case, their learning would be absolutely evenly distributed. To capture varying degrees of distributed practice, we will use growth models, time series clustering, and entropy scores. In a second step, the results of the different analyses will be used as predictors in a regression model with exam performance as the dependent variable. Results will be ready in time for the presentation. We will discuss the different approaches’ differences in granularity and predictive power as well as implications for theory and (research) practice. Paper Session Selbstreguliertes Lernens in der Studieneingangsphase: Evaluation eines Online-Kurses zur Förderung der Motivationsregulation Lukas Trammer¹, Laura-Vanessa Kohl¹, Melanie Trypke¹, Laura Dörrenbächer-Ulrich², Henrik Bellhäuser³, Yves Karlen⁴, Joachim Wirth⁵, Ferdinand Stebner¹ ¹Universität Osnabrück, Deutschland; ²Universität des Saarlandes, Deutschland; ³Johannes Gutenberg-Universität Mainz, Deutschland; ⁴Universität Zürich, Schweiz; ⁵Ruhr-Universität Bochum, Deutschland Theoretischer Hintergrund Die Fähigkeit, die eigene Motivation bewusst zu steuern, ist veränderbar (Xie et al., 2022) und spielt beim selbstregulierten Lernen (SRL) eine entscheidende Rolle (Miele et al., 2018). Studien zeigen dabei, dass die Regulation der Motivation bei Studierenden anlassspezifisch unterschiedlich gelingt (Engelschalk et al., 2015). Individuen neigen im Sinne der Erwartung-mal-Wert-Theorie (Atkinson, 1957) dazu, Handlungen zu unternehmen, bei denen sie davon ausgehen, dass ihre (Leistungs)Erwartungen erfüllt werden. Empirisch zeigt sich, dass bisher entwickelte Interventionen in der Lage sind, Selbstregulationsprozesse beim Lernen zu fördern und akademische Leistungen zu steigern (Bellhäuser et al., 2022). Dabei sollten Strategien nach Andersons Skill Acquisition Theorie (1982) auf Stufe 1 (deklaratives Wissen) erst explizit vermittelt und danach auf Stufe 2 (Prozeduralisierung) in ihrer Anwendung eingeübt werden. Fragestellung Im Rahmen dieser Studie wurde ein digitales Lernangebot erstellt, das die Motivationsregulation junger Studierender der ersten Hochschulsemester fokussiert und zukünftig nach erfolgreicher Evaluation über ORCA.nrw kostenlos für Studierende bereitgestellt werden soll. Es stellt sich aus Forschungsperspektive die Frage, ob die Motivationsregulation durch dieses digitale Lernangebot, das in SRL-Basiseinheiten und SRL-Auffrischungssitzungen zweigeteilt ist, gefördert werden kann. Studierende sollten in den Basiseinheiten zuerst lernen, ihre Motivationsprobleme zu diagnostizieren, bevor sie lernen, die richtigen Strategien auszuwählen und anzuwenden (konditionales Strategiewissen; z. B. Eckerlein, 2020). Es stellt sich spezifischer die Frage, ob zusätzliche Auffrischungseinheiten nach den Basiseinheiten den angenommenen Effekt der Basiseinheiten verstärken. Methode und Lernumgebung In dieser experimentellen 2x2+1-Studie in einem Prä-Post-Design wurden insgesamt 111 Studierende (M = 22.05, SD = 3.87, 73.9% weiblich) von Hochschulen aus dem deutschsprachigen Raum randomisiert auf fünf Versuchsbedingungen aufgeteilt: Sie erhielten über fünf Wochen hinweg entweder ein Online-Training zum selbstregulierten Lernen – bestehend aus SRL-Basiseinheiten und SRL-Auffrischungssitzungen – mit dem Schwerpunkt der Motivationsregulation (EG1), nur die oben genannten SRL-Basiseinheiten ohne SRL-Auffrischungssitzungen (EG3), alternative Basiseinheiten zum Thema Gestaltung wissenschaftlicher Arbeiten inkl. SRL-Auffrischungssitzungen (EG2), nur das alternative Angebot zur Gestaltung wiss. Arbeiten (EG4) oder gar kein Online-Training (KG). Die SRL-Basiseinheiten und SRL-Auffrischungssitzungen greifen auf selbstproduzierte OER-Materialien wie kurzweilige Videos und interaktive Aufgaben zurück, die der Vermittlung von deklarativem und prozeduralem SRL-Strategiewissen dienen. Inhaltlich setzen sich die Studierenden mit drei typischen Motivationsproblemen auseinander: zu viel Lernmasse (Erwartungsproblem 1), mangelndes Vertrauen in die eigenen Fähigkeiten (Erwartungsproblem 2) sowie fehlende Sinnhaftigkeit (Wertproblem). Neben demographischen Daten wurde vor (T1), nach den Basiseinheiten (T2) und nach den Auffrischungssitzungen (T3) das konditionale Strategiewissen erhoben, indem die Studierenden in einem Dropdown-Menü die passende Lernstrategie zum vorgegebenen Motivationsproblem auswählen sollten. Zusätzlich wurde zu T1 und T3 das subjektiv eingeschätzte Feeling of Knowing (FOK) mit drei Items eingeschätzt. Zu T3 wurde noch ein Instrument zum Lernzuwachs (Judgement of Learning; JOL), bestehend aus fünf Items, eingesetzt. FOK und JOL konnten jeweils anhand einer 7-Punkt-Likert-Skala beantwortet werden. Ergebnisse Die Ergebnisse zeigen einheitlich, dass die Studierenden, die die SRL-Basiseinheiten zur Motivationsregulation absolviert haben, sowohl bei dem Erwartungsproblem 1, F(8,212) = 2.36, p < .05, eta_p² = .08, als auch bei Erwartungsproblem 2, F(8,212) = 7.87, p < .001, eta_p² = .23, und dem Wertproblem, F(8,212) = 2.36, p < .001, eta_p² = .15, signifikant mehr konditionales Strategiewissen erwerben als die übrigen Experimentalgruppen und die Kontrollgruppe. Die SRL-Auffrischungssitzungen haben keinen zusätzlichen Lerneffekt. Bei den Instrumenten zu FOK und JOL unterscheiden sich EG 1 und EG 3 nach der Intervention nicht von der EG 2, die nur die SRL-Auffrischungssitzungen erhielt. Jedoch korrelieren FOK (.19 ≤ r ≤ .27; ps <.05) und JOL (.27 ≤ r ≤ .35; ps <.05) schwach bis mittelstark und signifikant mit dem konditionalen Strategiewissen zu T3. Weitere, differenziertere Ergebnisse sowie pädagogische Implikationen werden auf der Tagung vorgestellt und diskutiert.
10:30 - 12:10	1-17: Motivation im Unterricht Ort: S16
	Paper Session Wirkungen des Unterrichts mit offenen Aufgaben auf Wertüberzeugungen, Kosten, Kompetenz- und Autonomieerleben Stanislaw Schukajlow¹, Janina Krawitz², Alexander Westhölter¹, Katharina Wiehe¹, Katrin Rakoczy³ ¹Universität Münster; ²Universität Paderborn; ³Universität Gießen Motivationstheorien schreiben Wertüberzeugungen und Kosten eine wichtige Rolle für Motivation und Handeln zu (Eccles & Wigfield, 2020). Die Selbstbestimmungstheorie der Motivation betont zudem die Bedeutung von Autonomie- und Kompetenzerleben (Ryan & Deci, 2020). Bisher wurde nur selten untersucht, ob Autonomie- und Kompetenzerleben im Unterricht die Effekte des anspruchsvollen Fachunterrichts auf Wertüberzeugungen und Kosten vermitteln können. Zudem wurden nur selten Wirkungen von Aufgabenmerkmalen auf Motivation im Unterricht analysiert (Schukajlow, Rakoczy, et al., 2023).. Als Untersuchungsgegenstand wurden für diese Studie offene (nicht wohl-definierte) Aufgaben ausgewählt. Darunter werden realitätsbezogene Aufgaben (Modellierungsaufgaben) verstanden, in denen einige lösungsrelevante Informationen fehlen und während der Bearbeitung recherchiert oder geschätzt werden müssen (Jonassen, 2000; Schukajlow, Krawitz, et al., 2023; Yeo, 2017). Bei geschlossenen Aufgaben sind alle nötigen Informationen gegeben. Die Analyse der Effekte des Unterrichts mit offenen Aufgaben auf Motivation und die Untersuchung der Wirkmechanismen dieser Effekte ist eine wichtige Aufgabe der Unterrichtsforschung. Hypothesen Aufgrund der größeren Nähe offener Aufgaben zur Realität und multipler Lösungsmöglichkeiten (Niss & Blum, 2020), erwarten wir positive Effekte des Unterrichts mit offenen Aufgaben auf Wertüberzeugungen, das Autonomie- und Kompetenzerleben sowie negative Effekte auf Kosten. Auf der Grundlage der Erwartungs-Wert-Theorie (Eccles & Wigfield, 2020) und der Selbstbestimmungstheorie (Ryan & Deci, 2020) erwarten wir, dass Autonomie- und Kompetenzerleben den positiven Effekt des Unterrichts mit offenen Aufgaben auf Wertüberzeugungen und Kosten vermitteln. Methode 259 Neuntklässler:innen (103 weiblich, M=14.5 Jahre) aus Realschulen und einem Gymnasium wurden innerhalb jeder Klasse randomisiert einer Experimentalgruppe (EG) oder einer Kontrollgruppe (KG) zugewiesen. In der EG wurden offene und in der KG geschlossene Aufgaben mit gleichen Unterrichtsmethoden behandelt. Der Unterricht wurde von geschulten Masterstudierenden gemäß standardisierten Instruktionsmanualen durchgeführt, wobei jeder/e Instruktionsleiter/in dieselbe Anzahl von KG- und EG-Gruppen unterrichtet hat. Ein Treatmentcheck mit Hilfe von standardisierten Beobachtungsbögen und die Analyse von Unterrichtsmaterialien bestätigten die adäquate Umsetzung. Vor und nach dem Unterricht haben Lernende an einer Befragung zu Wertüberzeugungen (attainment, intrisic und utility value (AV, IV, UV), je 3 Items) und Kosten (3 Items) teilgenommen. Während des Unterrichts (5 Schulstunden) wurden Lernende zu Autonomie- und Kompetenzerleben befragt. Für die Befragungen wurden erprobte Skalen genutzt (1=stimmt gar nicht, 5=stimmt genau). Die interne Konsistenz aller Skalen war mindestens .78. Die Überprüfung der Hypothesen erfolgte mit Hilfe von Pfadmodellen mit den unabhängigen Variablen „Unterricht mit offenen vs. geschlossenen Aufgaben“, „Wertüberzeugungen“ und „Kosten“ im Pretest, den vermittelnden Variablen „Autonomie- und Kompetenzerleben“ und den abhängigen Variablen „AV“, „IV“, „UV“ und „Kosten“ im Posttest. Die Anzahl der Probanden und die Anzahl der Freiheitsgrade waren ausreichend, um die angenommenen Hypothesen mit den aufgestellten saturierten Pfadmodellen zu testen. Aufgrund substanzieller Korrelationen wurden die Pfadmodelle einzeln für die drei Valuekomponenten und Kosten analysiert, wobei die Mediatoren – ebenfalls aufgrund der Korrelationen – einzeln in die Modelle aufgenommen wurden. Die jeweiligen Pretestvariablen wurden kontrolliert. Die Analysen wurden mit Mplus3.9 (MLR-Schätzer) durchgeführt. Fehlende Werte wurden mit FIML geschätzt und STDY-Werte berichtet. Ergebnisse und Diskussion Es zeigten sich positive Effekte des Unterrichts mit offenen Aufgaben auf AV (β=0.08, p<.05), UV (β=0.084, p<.05) und Kompetenzerleben (β=0.012, p<.01), positive Tendenzen bei Autonomieerleben (β=0.094, p=.07) und negative Effekte bei Kosten (β=-0.117, p <.05). Keine Effekte wurden bei IV beobachtet. Kompetenzerleben (aber nicht Autonomieerleben) vermittelte zwischen dem Unterricht mit offenen Aufgaben und AV (β=0.028, p<.05), IV (β=0.031, p<.05) und UV (β=0.02, p<.05) (aber nicht Kosten). Die Ergebnisse zeigen, dass Aufgabenmerkmale wie Offenheit motivationale Variablen beeinflussen können. Im Einklang mit der Selbstbestimmungstheorie und Erwartungs-Wert-Theorie, erwies sich Kompetenzerleben als wichtige vermittelnde Variable. Eine fehlende vermittelnde Wirkung von Autonomieerleben könnte aus den begrenzten Autonomiegelegenheit resultieren, die sich nur auf die Lösungsvielfalt bezog. Eine praktische Implikation ist, Motivation im Unterricht durch die Aufgabenwahl zu steigern. Offene Modellierungsaufgaben bieten sich dafür an. Paper Session Effekte der Integration von Kunst in den Unterricht auf motivationale Schülermerkmale - Befunde aus dem Sparkling Science Projekt „Zirkus des Wissens“ Julia Lauss, Christoph Helm Johannes Kepler Universität Linz, Österreich Problemstellung Um den wachsenden Bedarf an Fachkräften im MINT-Bereich auszugleichen und den sich wandelnden Anforderungen der Arbeitswelt gerecht zu werden, müssen sich Unterrichtsformen anpassen. Ein neuer Ansatz, um MINT-Fächer für Schülerinnen zugänglicher zu machen, stellt die Kunstintegration in Unterrichtsfächer dar, die üblicherweise von Schülerinnen als abstrakt und schwierig wahrgenommenen werden (Merzyn, 2008). Im längsschnittlich angelegten Sparkling Science Projekt „Zirkus des Wissens“ finden an fünf Schulen im Rahmen des Regelunterrichts mehrwöchige Kunst-Workshops mit Künstlerinnen statt. Ziel des Projektes ist es die Motivation und Selbstwirksamkeit der Schülerinnen für und in MINT-Fächer zu erhöhen. Der Beitrag analysiert, inwiefern dies im Projekt gelungen ist, und geht auf Chancen und Herausforderungen der Kunstintegration im Unterricht ein. Theorie Durch die Integration von Kunst in die MINT-Fächer fällt es Schülerinnen leichter, die Fachinhalte und Prinzipien in Alltagssituationen anzuwenden, diese Verknüpfung führt zum besseren Verständnis in beiden Bereichen (Robinson et al., 2009). Das Aufzeigen der Verbindung zwischen Lerninhalt und Alltag steigert die Relevanz der Lerninhalte für die Schülerinnen und damit auch die intrinsische Motivation (McClelland, 1987). Diese ist in Kombination mit Persönlichkeitsmerkmalen, Begabung und Wissen die Quelle von Kreativität (Holm-Hadulla & Stewart, 2018). Als treibende Kraft der Neugier, ist die Kreativität essenziell für naturwissenschaftliche Erkundungen. Der enge Zusammenhang zwischen Kreativität und (natur-)wissenschaftlicher Motivation, belegt die Bedeutsamkeit der Integration von Kunst in die MINT-Fächer (Baldwin, 1985). Darüber hinaus bietet Kunst im Unterricht den Schülerinnen auch ein erhöhtes Maß an Mitgestaltung und Mitbestimmung. Laut Ryan und Deci (2000) fördert diese Autonomie das Schülerinteresse am Thema. Zusätzlich sind die variablen Lernbedingungen und die kreativen, offenen Lösungswege der Kunst förderlich für eine positive Entwicklung der Selbstwirksamkeitserwartung (Schwarzer und Jerusalem, 2002). Methode* Das im dreijährigen Längsschnitt angelegte Projekt umfasst 9 Projektklassen (210 Schülerinnen) und 2 Kontrollklasse (44 Schülerinnen) aus fünf Mittelschulen und Gymnasien. Die Ausgangsmessung im März 2023 sowie die erste Wiederholungsmessung im Juni 2023 erfolgten durch eine Onlinebefragung, wobei etablierte Skalen zu den Konstrukten Fachinteresse (acatech & VDI, 2009), motivationale Regulation (Ryan & Connell, 1989) und Selbstwirksamkeitserwartungen (Glynn, 2011) in den MINT-Fächern, Beharrlichkeit (Fleckenstein et al., 2014), Präsentationsangst (selbsterstellt) sowie Schülererfahrungen im Kunst- und MINT-Bereich (selbsterstellt) eingesetzt wurden. Darüber hinaus wurden als Kontrollvariablen der sozioökonomische Hintergrund (Torsheim et al., 2015) und die Erstsprache der Schülerinnen erfasst. Die Analyse des Einflusses der Integration von Kunst im Unterricht auf die Entwicklung der motivationalen Schülermerkmale im MINT-Bereich erfolgte mittels Single Indicator Latent Change Score Modellen (Kievit et al., 2018), wobei die Kunstintervention sowohl als dummy-kodierter Prädiktor als auch als Index der von den Schülerinnen wahrgenommenen Qualität der Kunstworkshops modelliert wurde. Darüber hinaus wurde der Einfluss des sozioökonomischen Hintergrunds und der Erstsprache auf die Veränderung in den genannten Konstrukten untersucht. Ergebnisse Wiedererwarten konnte im ersten Projektjahr für keine der untersuchten motivationalen Variablen eine statistisch signifikante Veränderung in der Stichprobe beobachten werden. Auch die Einflüsse der Kunstworkshops, des sozioökonomischen Hintergrunds und der Erstsprache waren nicht signifikant. Eine Erklärung für die fehlenden signifikanten Effekte der Integration von Kunst in den MINT-Unterricht liefert Meyer (2011): Auch kunstintegrierter Unterricht ist kein Selbstläufer. Womöglich müssen Schülerinnen sich erst ausreichend Methodenkompetenz aneignen, damit Kunst im Unterricht seine positive Wirkung entfalten kann. Eine andere Erklärung könnte darin liegen, dass sich die verwendeten Interessens- und Motivationsskalen auf das Unterrichtsfach allgemein bezogen und nicht spezifisch auf die Themen der Workshops. In Kombination mit der kurzen Dauer und geringen Intensität der Workshops in Relation zum restlichen Unterricht, könnte dies zu den Nullergebnisse geführt haben. Darüber hinaus spricht Kunst und Projektunterricht nicht alle Kinder gleichermaßen an. Für künftige Erhebungszyklen lassen aber Befunde aus Lehrerinnen-Interviews, die auf wahrgenommene positive Veränderungen in der Lernbereitschaft und Motivation der Schülerinnen hindeuten, signifikante Effekte der Integration von Kunst in den Unterricht erwarten. Paper Session Effekte von Nutzungshäufigkeit, situationsspezifischer Passung und Anwendungsqualität von Motivationsregulationsstrategien auf das Wohlbefinden von Studierenden Sophie von der Mülbe, Raven Rinas, Markus Dresel, Kristina Stockinger Universität Augsburg, Deutschland Viele Studien identifizieren Motivationsregulation als wichtigen Prädiktor für Studienmotivation und Studienerfolg (Steuer et al., 2019; Kryshko et al., 2020; Schwinger et al., 2009; Wolters, 1998, 1999). Der potenzielle Einfluss von Motivationsregulation auf das emotionale Erleben und Wohlbefinden von Studierenden wurde bisher aber kaum empirisch untersucht, obwohl hierzu durchaus theoretische Vorstellungen existieren (z.B. Zimmerman & Schunk, 2008). Da Motivation und Emotion integrale Bestandteile von Lernen und Leistung sind, die eng miteinander verwoben sind und u.a. ähnliche Antezedenzien haben (Meyer & Turner, 2006; Eccles & Wigfield, 2020; Pekrun, 2023), liegt es nahe, dass Motivationsregulation nicht nur Motivation, sondern auch Emotionen und Wohlbefinden von Studierenden beeinflussen kann. Erste Studien mit Belegen für diese Zusammenhänge (z.B. Grunschel et al., 2016, Kryshko et al., 2022) haben ausschließlich die Häufigkeit des Einsatzes von Motivationsregulationsstrategien berücksichtigt. Aktuelle Forschung zeigt jedoch, dass neben der Nutzungshäufigkeit auch die situationsspezifische Passung zwischen verwendeten Regulationsstrategien und den motivationalen Problemen, auf die diese zielen, sowie die Qualität der Strategieanwendung für die Effektivität der Motivationsregulation und nachfolgendes Lernverhalten wichtig sind (z.B. Engelschalk et al., 2017; Steuer et al., 2019). Vermutlich leistet jede Motivationsregulationskomponente einen spezifischen Beitrag zur erfolgreichen Bewältigung von motivationalen Herausforderungen, ist dafür aber nicht alleine hinreichend. Da theoretisch anzunehmen ist, dass die drei Motivationsregulationskomponenten auch für emotionales Erleben und Wohlbefinden von Studierenden wichtig sind, sollen im vorliegenden Beitrag die Zusammenhänge zwischen Nutzungshäufigkeit, situationsspezifischer Passung und Qualität des Strategieeinsatzes einerseits sowie emotionalen und kognitiven Aspekten von Wohlbefinden andererseits untersucht werden. Im Einklang mit früherer Forschung (z.B. Bäulke et al., 2018) wird zudem untersucht, ob die wahrgenommene Effektivität der Motivationsregulation diese Zusammenhänge mediiert. Um die angenommenen Zusammenhänge zu überprüfen, wurden Daten aus zwei empirischen Studien mit Studierenden genutzt. In Anlehnung an multidimensionale Konzeptualisierungen von Wohlbefinden (Diener et al. 2003; Marsh et al. 2020) wurden affektive Komponenten in Form von positiven und negativen (Leistungs-)Emotionen (Angst, Langeweile, Hoffnung, Freude) und kognitive Komponenten in Form von Studienzufriedenheit und allgemeiner Lebenszufriedenheit gemessen. Die Hypothesen wurden mittels Strukturgleichungsmodellen in R (lavaan) getestet, wobei alle Konstrukte außer Lebenszufriedenheit latent erfasst wurden. In Studie 1 wurden 234 MINT-Studierende einer deutschen Universität (28.8% weiblich, M_Alter=21,0; SD=3,04) online zu ihrer Motivationsregulation und ihrem Wohlbefinden befragt. Studie 2 stützte sich auf eine größere, repräsentative Stichprobe mit 890 Studierenden (56.0% weiblich, M_Alter=23,6; SD=4,40) mehrerer deutscher Universitäten., um die in Studie 1 beobachteten Muster mit denselben validierten Messinstrumenten zu überprüfen. Diese standortübergreifende Stichprobe ist Daten des Statistischen Bundesamtes zufolge repräsentativ nach Hochschultyp, Semester, Geschlecht und Studienfach geschichtet. Das Strukturgleichungsmodell zeigte in beiden Studien eine gute Passung (Studie 1: χ²=167.3; df=126; p<.01; RMSEA=. 038; CFI=.990; TLI=.986; SRMR=.062; Studie 2: χ²=560.7; df=126; p<.001; RMSEA=.062; CFI=.961; TLI=.948; SRMR=.060). Übereinstimmend mit den Hypothesen hingen in beiden Studien Nutzungshäufigkeit, situationsspezifische Passung und Qualität des Einsatzes von Motivationsregulationsstrategien positiv mit der Effektivität der Motivationsregulation zusammen, die wiederum positiv mit Hoffnung, Freude, Studienzufriedenheit und Lebenszufriedenheit und negativ mit Angst und Langeweile zusammenhing (ps<.05). Die positiven indirekten Effekte von Nutzungshäufigkeit, situationsspezifischen Passung und Qualität auf Hoffnung, Freude, Studienzufriedenheit und Lebenszufriedenheit und die negativen indirekten Effekte auf Angst und Langeweile wurden durch die Effektivität der Motivationsregulation mediiert (ps<.05). Insgesamt konvergieren Größe und Richtung der Effekte in beiden Stichproben. Die Ergebnisse unterstützen die Annahmen von Zimmerman und Schunk (2008) zum Zusammenhang zwischen Motivationsregulation und Wohlbefinden und unterstreichen die Bedeutung von Regulationskompetenzen in Bezug auf Nutzungshäufigkeit, situationsspezifische Passung und Qualität bei Studierenden. Die Ergebnisse erweitern das theoretische Wissen zur Bedeutung der verschiedenen Motivationsregulationskomponenten, die in engem Zusammenhang mit der Effektivität der Motivationsregulation stehen, und stimmen mit aktuellen Forschungsergebnissen zu möglichen Überschneidungen zwischen motivationaler und emotionaler Selbstregulierung überein (Stockinger et al., 2023). Sie haben Implikationen für integrative Theoriebildung und die Entwicklung wirksamer Fördermaßnahmen für Wohlbefinden von Studierenden. Paper Session Zur Bedeutung von Resilienz für die wahrgenommene Fehlerkultur und die Lern- und Leistungsemotionen von Schüler:innen Mareike Nowak¹, Lisa Pösse¹, Ramona Obermeier², Michaela Gläser-Zikuda¹ ¹Universität Erlangen-Nürnberg, Deutschland; ²Johannes Kepler Universität Linz Abstract* Neben Merkmalen von Unterrichtsqualität, wie einer konstruktiven Fehlerkultur, spielen Emotionen eine bedeutsame Rolle für den Lernprozess von Schüler:innen (Hagenauer & Hascher, 2018). Die vorliegende Studie geht der Frage nach, wie der Umgang mit Fehlern (Oser & Spychiger, 2005) Lern- und Leistungsemotionen beeinflusst und welche Rolle die Resilienz (Twum-Antwi et al., 2020) von Schüler:innen dabei spielt. Mixed-Effects Modelle zeigen einen moderierenden Effekt von Resilienz auf Lern- und Leistungsemotionen. Eine konstruktive Fehlerkultur im Unterricht geht insbesondere für resilientere Schüler:innen mit höherer Lernfreude sowie geringerer Langeweile und Angst einher. Daraus ergeben sich Implikationen für die stärkere Berücksichtigung der Resilienz von Lernenden und die Förderung konstruktiver Fehlerkultur im Unterricht. Theoretischer Hintergrund Schulen sind Bildungs- bzw. Lernort und zugleich ein Kontext mit weitreichender Bedeutung für das emotionale Erleben von Schüler:innen. Neben Merkmalen von Unterrichtsqualität, wie einer konstruktiven Fehlerkultur, spielen Emotionen eine bedeutsame Rolle für den Lernprozess von Schüler:innen (Hagenauer & Hascher, 2018). Die Berücksichtigung von Emotionen lässt sich unter anderem durch die Gestaltung guten Unterrichts sicherstellen. Fragestellung Bezugnehmend auf die Control-Value Theory (Pekrun et al., 2007) geht die vorliegende Studie der Frage nach, wie ein offener und konstruktiver Umgang mit Fehlern als kontextuelles Merkmal von Unterricht (Helmke, 2015) in Zusammenhang mit Lern- und Leistungsemotionen (Freude, Angst und Langeweile) steht und welche Rolle dabei die Resilienz als individuelles Merkmal (Twum-Antwi et al., 2020) von Schüler:innen spielt. Methode Insgesamt N = 3045 Schülerinnen (5. – 9. Klassenstufe; Alter: M = 13.04, SD = 2.98; 46.5% weiblich) aus N = 38 Sekundarschulen eines deutschen Bundeslandes wurden mit Hilfe standardisierter Skalen zu Resilienz, Lern- und Leistungsemotionen sowie wahrgenommener Fehlerkultur im Unterricht befragt. Zur Berücksichtigung hierarchischer Strukturen wurden gemischte Modelle im Programm R berechnet. Ergebnisse* Die Analysen zeigen sowohl direkte Effekte einer konstruktiven Fehlerkultur im Unterricht auf die wahrgenommene Lernfreude (β = 0.30, SE = 0.02, p<.01), Angst (β = -0.14, SE = 0.02, p<.01) und Langeweile (β = -0.25, SE = 0.02, p<.01) der Schüler:innen, als auch einen moderierenden Effekt von Resilienz auf Lern- und Leistungsemotionen (Freude/Angst/Langeweile: β = 0.06/-0.05/-0.07, SE = 0.02/0.02/0.02, p<.01/ p<.01/ p<.01). Ein konstruktiver Umgang mit Fehlern im Unterricht geht mit höherer Lernfreude sowie geringerer Langeweile und Angst einher. Insbesondere resilientere Schüler:innen profitieren von einer offenen Fehlerkultur, was die Rolle von Resilienz als Moderator dieser Zusammenhänge bestätigt und gleichzeitig die Diskussion über die Wirkungsweise von Resilienz in diesem Zusammenhang eröffnet. Diskussion Erst das Zusammenspiel von kontextuellen Unterrichtsmerkmalen, wie der Fehlerkultur, und Resilienz als individuellem Faktor kann zu einer erfolgreichen Bewältigung der Situation führen und auf diese Weise mitentscheidend dafür sein, ob die Fehlerkultur als herausfordernd oder – bei gering ausgeprägter Resilienz – gegebenenfalls als emotional belastend wahrgenommen wird. Implikationen für die stärkere Berücksichtigung der Resilienz von Lernenden und die Förderung einer konstruktiven Fehlerkultur im Unterricht mit Blick auf ein positives emotionales Erleben werden im Beitrag diskutiert.
10:30 - 12:10	1-18: Sprachliche und kulturelle Diversität Ort: S22
	Paper Session Bedingungen kompetenter Bilingualität von Grundschulkindern in Deutschland Lisa Tinkl^1,2, Aileen Edele^1,2, Birgit Heppt¹ ¹Humboldt-Universität zu Berlin, Deutschland; ²Berliner Institut für empirische Integrations-und Migrationsforschung (BIM) Kinder, die in ihren Familien Türkisch oder Russisch sprechen, gehören zu den größten sprachlichen Minderheitsgruppen in Deutschland (Olczyk et al., 2016). Sie wachsen häufig zweisprachig auf, sind der Majoritätssprache (MaL: Deutsch) und der Minoritätssprache (MiL: Türkisch/Russisch) allerdings in verschiedenen Kontexten und in unterschiedlichem Maße ausgesetzt (Peña et al., 2022). Bedingungen und Prozesse für die Entwicklung der Sprachkompetenz mehrsprachiger Kinder lassen sich durch das ökosystemische Modell von Bronfenbrenner (1979) und das Modell äußerer Bedingungsfaktoren der Sprachentwicklung von Montrul (2016) beschreiben. Beide Modelle verfolgen einen personenzentrierten Ansatz und betonen das komplexe Zusammenspiel individueller Voraussetzungen und unterschiedlicher Kontexteinflüsse für die Entstehung und Erklärung interindividueller Unterschiede. Bisherige Forschung konnte Zusammenhänge zwischen der bilingualen Sprachkompetenz und einer Reihe von Merkmalen auf unterschiedlichen Ebenen (individuell, familiär oder institutionell) finden, wie z. B. den kognitiven Grundfähigkeiten (z.B. Winsler et al., 2014), der Häufigkeit des familiären Sprachgebrauchs (z.B. Place & Hoff, 2016) oder dem institutionellen Sprachgebrauch (z.B. Montrul, 2016). Allerdings wurde bislang entweder nur eine begrenzte Anzahl an Merkmalen oder eine Ebene berücksichtigt. Auch wurden die Sprachkompetenzen bilingualer Kinder selten auf Grundlage objektiver Tests analysiert oder nach Kompetenzniveau in den jeweiligen Sprachen differenziert betrachtet. Aufbauend auf dem bisherigen Forschungsstand ist das Ziel dieser präregistrierten Studie, (1) unterschiedliche bilinguale Profile bei bilingualen Grundschulkindern in Deutschland zu identifizieren und (2) die Bedingungen auf individueller, familiärer und institutioneller Ebene zu ermitteln, die die identifizierten bilingualen Profile charakterisieren. Ein besonderer Fokus liegt dabei auf der Identifikation von Bedingungen, unter denen zweisprachig aufwachsende Kinder kompetent bilingual werden, d. h. hohe Kompetenzniveaus in beiden Sprachen erreichen (Grosjean, 2020). Die Analysen basieren auf den Daten des Nationalen Bildungspanels (NEPS) der Startkohorte 2 (SC2) (Blossfeld & Roßbach, 2019). Der Beitrag konzentriert sich auf Kinder in Regelschulen, die den MiL-Sprachtest in Russisch (RUS) oder Türkisch (TUR) und den MaL-Sprachtest in Deutsch in Welle 4 (Klasse 2) absolviert haben (N_RUS=200 Kinder, N_TUR=135 Kinder). Mittels latenter Profilanalyse (LPA) werden unterschiedliche bilinguale Profile identifiziert. Als Indikatorvariablen werden die Testwerte in MiL (Weighted Likelihood Estimates; WLE) und MaL (Summenscores) verwendet. Die identifizierten Profile werden anschließend mit multiplen logistischen Regressionsanalysen analysiert. Die Prädiktorvariablen stammen aus den Eltern- und Lehrkräftefragebögen (z.B. Spracherwerbsalter MaL/MiL, familiärer/institutioneller Sprachgebrauch) sowie aus Kompetenztests der Schüler:innen (kognitive Grundfähigkeiten). Erste Ergebnisse der LPA ergeben, dass sich sprachübergreifend mehrere Profile in den Daten identifizieren lassen. In Modellvergleichen (AIC, BIC, SABIC) zwischen einem und vier Profilen je Sprache zeigen sich die besten Modellfits für Zwei- bzw. Drei-Profil-Modelle. Nach theoretischen Überlegungen fiel die Wahl auf die Drei-Profil-Modelle (z.B. SABIC_{RUS_2P}=1640.6; SABIC_{RUS_3P}=1648.4 bzw. SABIC_{TUR_2P}=1007.2; SABIC_{TUR_3P}=1009.8). Werden für beide Sprachkombinationen je drei Profile modelliert, können diese folgendermaßen charakterisiert werden (zur Einordnung der Profilmittelwerte die Gesamtstichprobe: Gesamtmittelwert_MaL=7.25; Gesamtmittelwert_RUS=0.02; Gesamtmittelwert_TUR=0.00): Profil 1: vergleichsweise geringe Kompetenz in MiL (M_RUS=-0.05; M_TUR=-0.06) und in MaL (M_RUS=6.24; M_TUR=4.33); Profil 2: geringe bis mittlere Kompetenz in MiL (M_RUS=-0.17; M_TUR=0.11) und in MaL (M_RUS=7.49; M_TUR=9.05); Profil 3: vergleichsweise hohe Kompetenz in MiL (M_RUS=1.63; M_TUR=0.89) und in MaL (M_RUS=13.12; M_TUR=16.38). In weiteren Modellierungen werden wir skalierte Kompetenzscores berücksichtigen, die eine Einordnung der MaL-Kompetenz an der Gesamtstichprobe erlauben. Für die zweite Fragestellung werden die Profile als abhängige Variablen und die Prädiktorvariablen als unabhängige Variablen in multiplen logistischen Regressionsmodellen analysiert. So kann die Wahrscheinlichkeit der Zugehörigkeit eines Individuums zu einem bestimmten Profil auf Basis der Prädiktoren geschätzt und der relative Beitrag jeder Prädiktorvariablen bestimmt werden (Eid et al., 2017). Die ersten Ergebnisse zeigen, dass sich v.a. Profile von Schüler:innen identifizieren lassen, die in ihren beiden Sprachen ein ähnliches Kompetenzniveau aufweisen. Weitere Ergebnisse werden es ermöglichen, Bedingungen zu identifizieren, die die Entwicklung verschiedener Ausprägungen von Bilingualität begünstigen. Dies bildet eine wichtige Grundlage für die Ableitung gezielter Unterstützungs- und Fördermaßnahmen. Paper Session Entwicklungsverläufe des deutschen Wortschatzes bei Kindern mit Migrationshintergrund im Alter von drei bis sieben Jahren Christian Lohmann¹, Birgit Becker² ¹Leibniz-Institut für Bildungsverläufe (LIfBi); ²Goethe Universität Frankfurt Einleitung und Fragestellung Viele Studien haben ergeben, dass Kinder mit Migrationshintergrund im deutschen Bildungssystem schlechter abschneiden als Kinder ohne Migrationshintergrund (für einen Überblick, vgl. Diehl et al., 2016; OECD, 2017), wobei die deutschen Sprachkenntnisse häufig als ein wichtiger Erklärungsfaktor für dieses Ergebnis angesehen werden (Kempert et al., 2016). Tatsächlich beginnen viele Kinder mit Migrationshintergrund die Schule mit geringeren Deutschkenntnissen (Ebert et al., 2013; Linberg & Wenz, 2017; Relikowski et al., 2015), was sie von Anfang an einem Risiko für ungünstige Bildungsverläufe auszusetzen scheint (Durham et al., 2007). Allerdings sind Kinder mit Migrationshintergrund in dieser Hinsicht sehr heterogen, was oft vernachlässigt wird, wenn nur Durchschnittswerte betrachtet werden. In diesem Beitrag gehen wir auf diese Heterogenität ein und analysieren die folgenden Forschungsfragen: Welche Muster der Wortschatzentwicklung im Alter von drei bis sieben Jahren lassen sich bei Kindern mit Migrationshintergrund identifizieren? Wie lassen sich diese Muster/Profile in Bezug auf kindliche und familiäre Merkmale beschreiben, d. h. welche Kinder sind in diesen Profilen jeweils zu finden? Theoretischer Hintergrund Für unseren theoretischen Rahmen stützen wir uns auf Chiswicks Modell des Spracherwerbs im Kontext von Migration (Chiswick & Miller, 1998, 2001). Dieses Modell beinhaltet Exposure zur Sprache sowie die Effizienz des Lernenden als Hauptfaktoren für die individuelle Sprachentwicklung. Je nach der Kombination dieser beiden erklärenden Variablen können theoretisch unterschiedliche Profile der Sprachentwicklung erwartet werden. Daten und Methode Für die empirischen Analysen verwenden wir Daten aus der Neugeborenenkohorte des Nationalen Bildungspanels (NEPS, vgl. Blossfeld & Roßbach, 2019), die drei Messungen des deutschen Wortschatzes im Alter von drei bis sieben Jahren umfassen (NEPS-Netzwerk, 2023). Wir wenden Growth Mixture Models an, um unterschiedliche Muster/Profile der Wortschatzentwicklung a) in der Gesamtstichprobe (n=2406) und b) in der Teilstichprobe der Kinder mit Migrationshintergrund (n=944) zu identifizieren. Eine Lösung mit zwei Profilen erweist sich als am besten geeignet und zeigt in beiden Stichproben ähnliche Ergebnisse. Daher werden daher nur die Ergebnisse aus der Gesamtstichprobe weiter betrachtet. Ergebnisse Die beiden Profile zeigen ein paralleles Wachstum des Wortschatzes der Kinder, wobei die Ausgangsunterschiede vom dritten bis zum siebten Lebensjahr stabil bleiben. Das Profil mit den höheren Wortschatzwerten umfasst die große Mehrheit der Kinder (86 % der Kinder ohne Migrationshintergrund und 66 % der Kinder mit Migrationshintergrund). Im Gegensatz dazu umfasst das Profil mit den niedrigeren Werten einen viel kleineren Anteil der Stichprobe (14 % der Kinder ohne Migrationshintergrund, 34 % der Kinder mit Migrationshintergrund). Im letzten Schritt beschreiben wir, wie sich die Kinder (mit und ohne Migrationshintergrund) in den beiden Profilen hinsichtlich der Kinder- und Familienmerkmale unterscheiden, die nach dem Chiswick-Modell als relevant angenommen werden. Im Vergleich der beiden Profile finden wir im Profil mit den höheren Wortschatzwerten höhere Werte bei leistungsbezogenen Variablen (Sensomotorik, Arbeitsgedächtnis) sowie bei Exposure-bezogenen Variablen (Alter bei Eintritt in eine frühkindliche Bildungseinrichtung, Häufigkeit des Vorlesens durch die Eltern) und beim sozioökonomischen Status der Eltern. Betrachtet man nur die Stichprobe der Kinder mit Migrationshintergrund, so zeigen sich die erwarteten Unterschiede zwischen den beiden Profilen hinsichtlich der Faktoren, die auf Exposure zur deutschen Sprache in der Familie hinweisen. Insgesamt stimmen die beobachteten Unterschiede zwischen den Profilen mit den theoretischen Erwartungen überein. Es ist jedoch bemerkenswert, dass kein "Aufholprofil" identifiziert werden konnte. Diejenigen Kinder mit Migrationshintergrund, die bereits im Alter von drei Jahren über einen großen deutschen Wortschatz verfügen, weisen eine sehr ähnliche Wortschatzentwicklung auf wie die Mehrheit der Kinder ohne Migrationshintergrund. Dies gilt für zwei Drittel der Stichprobe von Kindern mit Migrationshintergrund. Im Gegensatz dazu zeigen die Kinder mit Migrationshintergrund im unteren Profil eine Häufung von Faktoren, die negativ mit der Sprachentwicklung korreliert sind. Die Implikationen dieser Ergebnisse werden diskutiert. Paper Session Deutsche Wortschatzkompetenzen von geflüchteten Kindern und Jugendlichen aus dem Mittleren Osten - Eine Bestandsaufnahme des Sprachstands und des Lernfortschritts in der frühen Phase der Bildungslaufbahn in Deutschland Julian Seuring¹, Gisela Will¹, Anike Schild², Jutta von Maurice¹ ¹Leibniz-Institut für Bildungsverläufe (LIfBi), Deutschland; ²Bamberg Graduate School of Social Sciences (BAGSS), Otto-Friedrich-Universität Bamberg Die Bildungsteilhabe von Kindern und Jugendlichen mit Fluchterfahrung hat in den letzten Jahren zunehmend an Relevanz gewonnen. Viele junge Geflüchtete haben aufgrund der Flucht teilweise längere Unterbrechungen in ihren Bildungsbiografien erfahren. Die jüngeren Kinder haben in ihrem Heimatland oft noch gar keine Bildungseinrichtung besucht. Im Aufnahmekontext müssen die Kinder und Jugendlichen ihre Bildungslaufbahn in einem für sie komplett neuen Umfeld beginnen oder fortsetzen. Dies ist mit besonderen Herausforderungen sowohl für die jungen Geflüchteten als auch für die Bildungseinrichtungen und Lehrkräfte verbunden. Die Kompetenzen in der Unterrichtssprache sind dabei von zentraler Bedeutung für die Teilhabe an Bildung und eine zielgerichtete Förderung der Fähigkeiten und Bedürfnisse der geflüchteten Kinder und Jugendlichen. Der Beitrag bietet eine deskriptive Bestandsaufnahme der deutschen Wortschatzkompetenzen und des Lernfortschritts von jungen Geflüchteten in den ersten Jahren ihrer Bildungslaufbahn in Deutschland. Hierzu werden Daten der Panelstudie „ReGES – Refugees in the German Educational System“ ausgewertet, welche seit 2018 die Bildungsverläufe von geflüchteten Kindern und Jugendlichen aus dem Mittleren Osten begleitet (Will et al., 2021). Die Stichprobe umfasst zwei Alterskohorten: Kinder ab vier Jahren, die zum Zeitpunkt der Ziehung noch nicht eingeschult waren, und Jugendliche ab 12 Jahren, die eine allgemeinbildende Schule der Sekundarstufe I besuchten. Zum ersten Erhebungszeitpunkt (t1) lebten die meisten Kinder und Jugendlichen seit zwei bis drei Jahren in Deutschland. Die Wortschatzkompetenzen wurden anhand der deutschen Version des „Peabody Picture Vocabulary Test“ (PPVT-4; Lehnhard et al., 2015) erhoben. Zwei Jahre nach der Ausgangsmessung wurde eine Wiederholungsmessung durchgeführt. Die Daten bieten somit die Möglichkeit, den Wortschatz junger Geflüchteter in einem relativ frühen Stadium ihrer Bildungslaufbahn in Deutschland zu bestimmen und zusätzlich den Lernfortschritt im Zeitverlauf zu verfolgen. Für die Analysen wurde die Stichprobe auf N=463 Kinder (4-6 Jahre zu t1) und N=490 Jugendliche (14-17 Jahre zu t1) mit gültigen Testergebnissen zu beiden Messzeitpunkten beschränkt. Für den PPVT liegen altersabhängige Normbereiche vor, die dazu verwendet wurden, den Sprachstand der geflüchteten Kinder und Jugendlichen mit dem der einheimischen Vergleichsgruppe in Beziehung zu setzen und quantitativ einzuordnen. Um ein aussagekräftiges Bild zu erhalten, wurde dieser Vergleich nicht nur basierend auf dem Alter, sondern auch unter Berücksichtigung der Aufenthaltsdauer – als Indikator für die bisherige Lernzeit – vorgenommen. Die Ergebnisse zeigen, dass zum ersten Messzeitpunkt die Wortschatzkompetenzen der jungen Geflüchteten deutlich unter den Normbereichen ihrer Altersgruppen lagen. Im Schnitt erzielten die Kinder 53,7 Punkte und die Jugendlichen 89,6 Punkte im PPVT, bei einem maximalen Punktwert von 228. Dies entspricht dem altersäquivalenten Normniveau von dreijährigen bzw. vier- bis fünfjährigen Kindern. Dieser Befund sollte allerdings vor dem Hintergrund bewertet werden, dass die meisten jungen Geflüchteten zu diesem Zeitpunkt erst seit zweieinhalb Jahren Deutsch lernen. Bis zum zweiten Messzeitpunkt konnten die Wortschatzkompetenzen der Kinder und Jugendlichen auf 88,4 bzw. 105,5 Punkte weiter verbessert werden. Der Lernzuwachs über die zwei Jahre entspricht dem in der Norm bei vergleichbaren Ausgangskompetenzen. Dabei verringert sich der Abstand zu den altersentsprechenden Normbereichen tendenziell zwar, bleibt aber auf hohem Niveau. Die Befunde weisen darauf hin, dass junge Geflüchtete im Zeitverlauf substantielle Fortschritte im Erwerb des deutschen Wortschatzes erzielen. Trotzdem liegen die Wortschatzkompetenzen vieler geflüchteter Kinder und Jugendlicher am Anfang der Grundschulzeit bzw. beim Übergang zur Sekundarstufe II oder ins Ausbildungssystem noch unter den Normbereichen für ihr Alter. Um diese Lücke zu schließen, bedarf es zusätzlicher Zeit und Unterstützung. Diese Hinweise können bei der Gestaltung von Bildungsprogrammen und Maßnahmen zur Förderung der Bildungsteilhabe von Geflüchteten wichtig werden. Paper Session Kulturelle Diversität in den fächerübergreifenden Curricula auf dem Prüfstand multikultureller Bildung – Ergebnisse einer qualitativen Inhaltsanalyse Sharleen Pevec-Zimmer¹, Linda Juang¹, Maja Schachner², Miriam Schwarzenthal³ ¹Universität Potsdam, Deutschland; ²Martin-Luther-Universität Halle-Wittenberg; ³Bergische Universität Wuppertal Theoretischer Hintergrund. Als Einwanderungsland müssen wir uns in Deutschland damit auseinandersetzen, wie die kulturelle Vielfalt adressiert und unterschiedliche Lebensrealitäten in die Schule einbezogen werden. Dies betrifft auch die curricularen Vorgaben, die „Standards für eine individuelle Gestaltung der Unterrichthalte“ festlegen und „eine wichtige Grundlage für die Qualitätsentwicklung der Schulen“ darstellen (SenBJF, o. J.). Das Kultusministerium versteht kulturelle Vielfalt als Norm und Ressource und hat in seinen Richtlinien zur interkulturellen Bildung und Erziehung für alle Bundesländer eine stärkere Orientierung an der multikulturellen Realität benannt (KMK, 2013). Es finden sich bereits fachspezifische Untersuchungen dazu, wie die Themen Migration, Integration und kulturelle Vielfalt in den Curricula adressiert werden (z.B. Ahlrichs, 2015; Baumann, 2015; MIDEM, 2021; Neumann & Reuter, 2004; Rühle, 2015). Das Kultusministerium fordert jedoch auch das überfachliche Aufgreifen und hebt kulturelle Vielfalt als ein zentrales Thema für alle Lehrkräfte hervor. Dies stellt die Grundlage für unsere qualitative Analyse dar. Das Konzept der multikulturellen Bildung (Banks, 2015), dem auch das kultursensible Unterrichten untergeordnet ist (Gay, 2018), erkennt die unterschiedlichen Identitäten und Zugehörigkeiten im Klassenraum an und zielt darauf, bessere Bildungschancen für alle Schülerinnen zu schaffen. Zentral für unsere Analyse sind die fünf Stufen multikultureller Bildung, die Gorski (2009) für Kurse zur Weiterbildung von Lehrkräften abgeleitet hat. Die Stufen erlauben Bezüge zur Migrationspädagogik (Mecheril, 2010) und werden für die Analyse curricularer Vorgaben adaptiert. Fragestellung und Methode.* Ausgerichtet an der multikulturellen Bildung untersuchen wir, auf welche Weise kulturelle Vielfalt in den überfachlichen Curricula aller deutschen Bundesländer einbezogen und adressiert wird. Hierfür werden die staatlichen fächerübergreifenden curricularen Richtlinien für Lehrkräfte aller 16 Bundesländer einbezogen und mittels einer inhaltlich strukturierenden qualitativen Inhaltsanalyse (Kuckartz & Rädiker, 2022), unter der Verwendung theoretischer und thematischer Kategorien analysiert. Das Kategoriesystem enthält Haupt- und Subkategorien und wird im deduktiv-induktiven Verfahren entwickelt. Die Hauptkategorien orientieren sich an den fünf Stufen multikultureller Bildung (Gorski, 2009) und ermöglichen die Klassifizierung der Informationen als 0-Multikultureller Bildung widersprechend, 1-Unterrichten mit Norm und Andersartigkeit, 2-Unterrichten mit kultureller Sensibilität und Toleranz, 3-Unterrichten mit interkultureller Kompetenz, 4-Unterrichten in soziopolitischen Kontexten, 5-Unterrichten als Widerstand und Machtkritik. Sättigung und Reliabilität der Hauptkategorien werden durch zufriedenstellende Intercoder-Übereinstimmungen von zwei Kodiererinnen sowie des finalen Kategoriensystems mit Subkategorien durch zufriedenstellende Intracoder-Übereinstimmungen (mehrfache Kodierungen derselben Kodiererin) angestrebt. Kodierungen und Kategoriesystem werden hinsichtlich der Beziehungen und Ausprägungen zwischen den Hauptkategorien sowie innerhalb der einzelnen Hauptkategorien anhand der Subkategorien ausgewertet und interpretiert. Als Sekundärverfahren wird eine anschließende Typenbildung der Bundesländer vorgenommen. Ergebnisse. Die Ergebnisse aus dem finalen Kodierprozess mit Subkategorien und finalisiertem Kategoriensystem sind in Arbeit. Reliabilitätskoeffizienten und Quantifizierungen der kodierten Haupt- und Subkategorien werden berichtet. Vorläufige Ergebnisse nach dem ersten Kodierprozess veranschaulichen ausgeprägte Differenzen zwischen den Bundesländern hinsichtlich der Quantität an Informationen und deren Auswertungen. Nur vereinzelt finden sich Vorgaben, die multikultureller Bildung widersprechen, indem kulturelle Vielfalt ignoriert oder abgewertet wird. Stattdessen fokussieren die curricularen Vorgaben einen wertschätzenden Umfang und kultureller Vielfalt mit Toleranz zu begegnen. Auch interkulturelle Kompetenz findet vermehrt Einzug in die Richtlinien. Auffällig ist, dass im Umgang mit kultureller Vielfalt eine vermeintliche Andersartigkeit betont und als Gegensatz zu einer bestehenden Norm dargestellt wird. Zudem zielen nur wenige Vorgaben darauf ab, in Schule und Unterricht ein kritisches Bewusstsein zu schaffen oder benennen gar die Relevanz der Schule zum Beitrag zu sozialer Gerechtigkeit und beim Hinterfragen aktueller Machtverhältnisse. Die vorläufigen Erkenntnisse verdeutlichen, dass die Relevanz von kultureller Vielfalt in den Curricula weitestgehend abgebildet und das Thema in den Curricula aufgegriffen wird. Für Deutschland als Einwanderungsland ergibt sich im Sinne der Migrationspädagogik weiterhin die drängende Aufgabe, in Schule und Unterricht kulturelle Vielfalt aktiver einzubeziehen, tatsächlich als Realität und Teil der Zugehörigkeit zu Deutschland zu beschreiben sowie bestehende Ungerechtigkeitsverhältnisse zu benennen und die Schlüsselrolle der Schule anzuerkennen.
10:30 - 12:10	1-19: Methodische Entwicklungen in der Unterrichts- und Lehrkräfteforschung Ort: S23
	Paper Session A Constitutional AI Approach for Educational Helpfulness of Large Language Models Steffen Brandt opencampus.sh Theoretical Background Large Language Models (LLMs) are assumed to play a core role in future education with serving as learning assistant or tutor being one of the potential roles (cf. Dwivedi et al., 2023; Kasneci et al., 2023). In educational research such applications are called intelligent tutoring systems (ITS). However, to the author’s knowledge there is currently no theoretical framing of LLMs in terms of ITS that are commonly considered using Wenger’s architecture framework (Wenger, 2014). Considering LLMs serving as chatbot assistants their optimization is focused on a training towards the three “H”: helpfulness, harmlessness, and honesty (Bai, Jones, et al., 2022).. To the author’s knowledge there is currently no LLM specifically trained on educational helpfulness, that is on answering in a Socratic style common for ITS (Chi, De Leeuw, Chiu, & LaVancher, 1994; Paladines & Ramirez, 2020)). LLM based applications are often integrated in a multi-step process, for example, including retrieval augmented generation (Lewis et al., 2020) and one or more custom prompts that enhance the user input. The final output of an LLM-based ITS will therefore typically depend on further elements beyond the LLM. Research Questions RQ1: How do LLM-based tutors align to Wenger’s architecture for ITS? RQ2: Is it possible to use Anthropic’s Constitutional AI approach (Bai, Kadavath, et al., 2022) to train an LLM serving as ITS? Method The Zephyr-7B-α model (Hugging Face, 2023) is fine-tuned via training data generated according to the Constitutional AI approach. Hereby, the model is requested to critique its generated answers and generate improved answers. The new data is then used for further fine-tuning. A set of 1000 questions on physics and history with difficulty levels ranging from Kindergarten to 12^th grade is generated using GPT-4 (OpenAI, 2023b). On each of these, fifteen different critique and revision prompt pairs like the following are applied: [Critique] Point out instances where the assistant's last response directly provided the answer or did not guide the student through a learning process in a Socratic manner. [Revision] Please rewrite the assistant's response to follow a Socratic style of questioning, aimed at guiding the student to think for themselves. For a baseline comparison answers of OpenAI’s GPT-3.5 and GPT-4 default models are used with custom prompts soliciting an educational helpful, Socratic style answer as proposed by OpenAI (OpenAI, 2023a, 2023b). To evaluate the answer quality, GPT-4 is prompted to rank the answers of the different models for a given question according to the rules defined by the prompt to generate the training data. Additionally, a qualitative review is conducted by educational experts to provide further insights. Results RQ1: The following mapping to Wenger’s four modules of ITS is proposed: Communication module: Training data of base model including basic subject and proficient language knowledge. Tutorial module: Training data of fine-tuned model including educationally helpful chats. Student module: Custom prompt including a student description. Expert module: Vector database including expert knowledge. More explanations are given in the presentation. RQ2: The model training and evaluation will be conducted in the coming month and will be presented at the conference. Discussion The mapping proposed in (1) of LLM-based chat applications is hoped to help in comparing previous work on ITS with LLM-based approaches. Further, the results will show to what extent current open-source models in combination with the Constitutional AI approach provide a possible basis for application in educational settings and further testing of their effectiveness. Future directions for improving LLMs as ITS might be the integration of student characteristics in custom prompts and of further expert knowledge via vector databases that additionally help preventing hallucination. Paper Session Eine längsschnittliche Mehrebenen-Erweiterung des linear-logistischen Testmodells (LLTM) zur Vorhersage der Instruktionssensitivität von Testitems Alexander Naumann^1,2, Jan Hochweber³ ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ²Institut für Schulentwicklungsforschung, TU Dortmund; ³Pädagogische Hochschule St. Gallen (PHSG) Theoretischer Hintergrund Schulische Leistungsmessungen dienen regelmäßig als ein zentrales Kriterium für die Beurteilung der Wirkungen und der Wirksamkeit von Unterricht (z.B. Klieme, 2018; Kultusministerkonferenz, 2006). Üblicherweise werden Unterrichtsprozesse dann als wirksam angesehen, wenn sie mit höheren Testwerten der Schülerinnen und Schüler einhergehen, und entsprechend als unwirksam, wenn nicht. Allerdings setzt eine solche Vorgehensweise voraus, dass die eingesetzten Tests und Items prinzipiell dazu in der Lage sind, mögliche Effekte des Unterrichts zu erfassen, also instruktionssensitiv sind (z.B. Naumann, Musow, Aichele, Hochweber & Hartig, 2019; Popham, 2007). Entsprechend kann die empirische Untersuchung der Instruktionssensitivität von Tests und Items notwendige Belege für eine valide Nutzung und Interpretation der Testwerte liefern (AERA, APA, NCME, 2014). Zur empirischen Untersuchung der Instruktionssensitivität von Tests und Items sind im Laufe der letzten Jahre verlässliche und kohärente Verfahren vorgeschlagen worden (z.B. Naumann, Hartig & Hochweber, 2017; Naumann, Rieser, Musow, Hochweber & Hartig, 2019). In der Regel werden Sensitivitätsmaße jedoch (wenn überhaupt) erst dann erhoben, nachdem die Itemkonstruktion abgeschlossen und ein Test angewendet wurde. Entsprechend gibt es nach wie vor nur wenig systematisches Wissen darüber, wie neue, instruktionssensitive Items zielgerichtet konstruiert werden können. Im Idealfall wäre jedoch das Wissen über solche Merkmale von Items, die deren Instruktionssensitivität beeinflussen, bereits während der Itemkonstruktion vorhanden, um Items gezielt so zu konstruieren, dass sie das erforderliche Maß an Instruktionssensitivität erreichen. Fragestellung und Methode Unsere Arbeit zielt auf diese Forschungslücke. Wir schlagen ein Modell zur Vorhersage der globalen und differentiellen Instruktionssensitivität anhand von Itemmerkmalen vor, das auf dem von Naumann und Kollegen (2017) vorgeschlagenen psychometrischen Rahmen zur Messung von Instruktionssensitivität basiert. Dazu formulieren wir das längsschnittliche Mehrebenen-IRT (LMLIRT)-Modell zur Messung der Instruktionssensitivität von Items im Sinne eines erklärenden IRT-Modells mit Itemprädiktoren um (Wilson & De Boeck, 2004). Das heißt, wir modifizieren das LMLIRT-Modell so in Anlehnung an das linear logistische Testmodell (LLTM; Fischer, 1973), um Regressionskoeffizienten zu schätzen, die den Beitrag der einzelnen Itemmerkmale zur klassenspezifischen Veränderung der Itemschwierigkeit über Messzeitpunkte zu quantifizieren. Zusätzlich fügen wir dem resultierenden längsschnittlichen Mehrebenen-LLTM-Modell einen Fehlerterm hinzu, der es ermöglicht, die vergleichsweise strenge Annahme zu lockern, dass die Itemmerkmale die Itemschwierigkeit vollständig erklären können (Janssen, Schepers, & Peres, 2004). Zur Veranschaulichung wenden wir das Modell auf Daten aus der DESI-Studie (DESI-Konsortium, 2008) an. In DESI wurde die Sprachbewusstheit von Schüler:innen (N = 10.965 Schüler:innen in 427 Klassen) zu Beginn und am Ende der neunten Jahrgangsstufe anhand von 34 Items gemessen, die den grammatikalisch angemessenen Sprachgebrauch erfassen sollen. In der DESI-Studie wurden Itemmerkmale definiert, die sich auf theoretische Modelle der Sprachbewusstheit beziehen, und von Expert:innen eingeschätzt. Zehn Merkmale der Items des Sprachbewusstheitstests wurden für die Analysen ausgewählt. Ergebnisse und Diskussion Die Ergebnisse legten nahe, dass neun der zehn Itemmerkmale statistisch bedeutsam zur Vorhersage der mittleren Veränderung der Itemschwierigkeiten im Laufe der neunten Jahrgangsstufe beitrugen (globale Sensitivität). Ein Vergleich mit dem konventionellen LMLIRT-Modell zeigte, dass 49% der Variation in der globalen Sensitivität erklärt wurde (64%, wenn ein Ausreißer eliminiert wurde). Ein Vergleich mit dem LMLIRT-Modell zeigte, dass 63% der Varianz in der differentiellen Sensitivität durch die Itemmerkmale erklärt werden konnten. Zusammenfassend funktionierte das Modell gut in der Anwendung auf empirische Daten. Die Möglichkeit, gezielt instruktionssensitive Items zu konstruieren, wird dazu beitragen, die Instruktionssensitivität von Tests und Items zu gewährleisten, ohne umfangreiche Pretests oder Pilotierungen durchzuführen oder sich auf bestehende Instrumente stützen zu müssen, was ökonomisch vorteilhafter ist. Darüber hinaus liefert derartiges Wissen über die Konstruktion von instruktionssensitiven Items einen wichtigen Beitrag zur validen Nutzung von Testverfahren, wenn es um gültige Rückschlüsse über die Wirksamkeit von Unterricht anhand von Testwerten aus schulischen Leistungsmessungen geht. Paper Session Ich sehe was, was du nicht siehst – eine Laborstudie zur Untersuchung von Expertiseunterschieden in der professionellen Wahrnehmung von Unterrichtsstörungen mittels mobilem Eye-Tracking Mandy Klatt, Christin Lotz, Gregor Kachel, Anne Deiglmayr Universität Leipzig, Deutschland Theoretischer Hintergrund: Der Umgang mit Störungen im Klassenzimmer ist ein wesentlicher Aspekt effektiver Klassenführung (Evertson & Weinstein, 2006; Kounin, 2006). Dementsprechend müssen Lehrkräfte in der Lage sein, wichtige Ereignisse im Klassenzimmer schnell zu erkennen und angemessen darauf zu reagieren. Diese Fähigkeit wird als professionelle Wahrnehmung bezeichnet (Goodwin, 1994; Seidel & Stürmer, 2014). Forschungen zur Lehrer:inexpertise haben gezeigt, dass sich erfahrene und unerfahrene Lehrkräfte in ihrer Fähigkeit, Ereignisse im Klassenzimmer wahrzunehmen, unterscheiden. Bisher haben sich jedoch nur wenige Studien auf den basalen Prozess des Bemerkens, d.h. das Erkennen möglicher störender Situationen, konzentriert (Grub et al., 2020). Mobile Eye-Tracking-Parameter (wie z.B. Fixationsanzahl und -dauer sowie die Zeit bis zur ersten Fixation auf lernrelevante Bereiche) können diese Forschungslücke schließen, indem sie neue Erkenntnisse darüber liefern, wie sich Expertiseunterschiede in der professionellen Wahrnehmung von Lehrkräften manifestieren (Lachner et al., 2016; Wolff et al., 2016). Bisherige Studien zeigten, dass erfahrene Lehrpersonen im Vergleich zu unerfahren mehr Fixationen mit kürzerer Fixationsdauer aufweisen (Huang, 2018), wohingegen es bei der Zeit bis zur ersten Fixation auf lernrelevante Bereiche noch weiterer Forschung bedarf (Grub et al., 2022b). Forschungsfragen: In dieser Studie wurde untersucht, wie die Berufserfahrung von (angehenden) Lehrpersonen (a) die Fixationsanzahl und (b) die Fixationsdauer in lernrelevanten Bereichen (einerseits generell alle Schüler:innen, andererseits speziell die Person, die stört) sowie (c) die Zeit bis zur ersten Fixation auf die störende Person beeinflusst, wobei mobile Eye-Tracking-Daten in einer kontrollierten Micro-Teaching-Unit verwendet wurden. Basierend auf der bestehenden Literatur erwarteten wir, dass erfahrene Lehrkräfte (H1) mehr Fixationen auf relevante Bereiche mit (H2) kürzeren Fixationsdauern zeigen (Huang, 2018), wobei wir (H3) die Zeit bis zur ersten Fixation auf die störende Person explorativ untersuchten. Methode: Die Stichprobe bestand aus n = 40 erfahrenen Lehrpersonen (Lehramtsstudium abgeschlossen, im Lehrberuf tätig) und n = 40 unerfahrenen Lehrpersonen (Lehramtsstudierende, erstes Praktikum absolviert). Die Erhebung der kompletten Stichprobe ist abgeschlossen; Daten von n = 16 erfahrenen und n = 25 unerfahrenen Lehrpersonen sind bereits kodiert. Auf der Konferenz werden die Ergebnisse der kompletten Stichprobe vorgestellt. Im Erhebungssetting dieser Studie unterrichteten die Teilnehmenden eine 15-minütige, selbst vorbereitete Unterrichtseinheit in einer Laborumgebung vor einer "Klasse" von drei Schauspielenden, die neun typische Unterrichtsstörungen (z. B. mit dem Nachbarn plaudern) simulierten. Während der Lektion trug die Versuchsperson eine mobile Eye-Tracking-Brille von Tobii Pro Glasses 2, welche visuelle Daten über das Blickverhalten der Lehrperson auf relevante Bereiche sammelte. Als lernrelevante Bereiche wurden zum einen generell alle Schüler:innen definiert, zum anderen speziell die Person, die die Störung ausführte. Die Analyse der Eye-Tracking-Daten erfolgte in der Tobii Pro Lab Analyzer Software, um die entsprechenden Eye-Tracking-Parameter auszuwählen (Fixationsanzahl, Fixationsdauer und Zeit bis zur ersten Fixation auf die störende Person). Weitere statistische Analysen wurden in RStudio (RStudio Team, 2020) durchgeführt. Aufgrund der zu geringen Stichprobe wurde bisher nur die Effektstärke d berechnet, um eine Tendenz der Ergebnisse zu indizieren. Mit der finalen Stichprobe werden Mittelwertunterschiede zwischen den Expertisegruppen mittels t-Tests für unabhängige Stichproben für alle drei Hypothesen untersucht. Ergebnisse: Vorläufige Ergebnisse aus der aktuellen Stichprobe zeigten, dass erfahrene Lehrpersonen mehr Fixationen auf alle Schüler:innen (d_{Schüler:innen} = 0.32) aufwiesen, wohingegen Lehramtsstudierende häufiger die störende Person fixierten (d_Störperson = -0.38). Außerdem hatten Lehrpersonen in beiden Bereichen kürzere Fixationsdauern (d_{Schüler:innen} = -0.41; d_Störperson = -0.51) und zeigten schnellere Zeiten bis zur ersten Fixation auf die Person, die die Störung ausführte (d_Störperson = -0.20). Diskussion: Die vorläufigen Ergebnisse erweitern den Forschungsstand bisheriger Studien, die die professionelle Wahrnehmung von Lehrpersonen mit Hilfe von mobilem Eye-Tracking untersucht haben (Grub et al., 2020; Grub et al., 2022b). Die gefundenen Unterschiede können einen Beitrag leisten, die professionelle Wahrnehmung besser zu verstehen und wichtige Informationen für die Ausbildung sowie Förderung einer professionellen Wahrnehmung für angehende Lehrpersonen liefern. Paper Session Computerbasierte Qualitätsbewertung schriftlicher Fremdreflexionen Lukas Mientus¹, Anna Nowak¹, Peter Wulff², Andreas Borowski¹ ¹Universität Potsdam; ²Pädagogische Hochschule Heidelberg Hintergrund und Forschungsanliegen Reflexion gilt in der Lehrkräftebildung als eine Schlüsselkategorie der professionellen Entwicklung (Korthagen & Kessels, 1999; Wyss & Mahler 2021). So werden Reflexionsprodukte häufig unter Verwendung von Stufenmodellen für beispielsweise deskriptives, analytisches oder reflexives Argumentieren (z.B. Hatton & Smith, 1995; Larrivee, 2008) herangezogen oder einzelne Facetten aus Prozessmodellen (z.B. Aeppli & Lötscher, 2016; Nowak et al., 2019), wie die Breite adressierter Themen oder die Tiefe der Argumentation bewertet. Eine wesentliche Herausforderung hierbei besteht darin, dass die Qualität einer Reflexion auf mehreren Dimensionen bewertet werden kann, ohne quantifizierbare, absolute Aussagen treffen zu können. Studien im Bereich der Reflective Writing Analytics (z.B. Buckingham Shum et al., 2017; Ullman, 2019; Wulff et al., 2022) könnten bei dieser Herausforderung Abhilfe schaffen, auch da sie (im Prinzip) nicht durch menschliche Schwächen wie begrenztes Kurzzeitgedächtnis, Tagesform oder unterschiedliches Sprachgefühl und Vorwissen eingeschränkt sind. Unklar bleibt jedoch, inwieweit aus diesen ML-basierten Bewertungen quantifizierbare und belastbare Rückschlüsse auf die Qualität schriftlicher Reflexionen möglich sind. Methode Aus diesem Grund, wurde unter Verwendung von bereits validierten Machine-Learning-Algorithmen (nach Wulff et al., 2022 und Mientus et al., 2023) ein quantifizierbares Qualitätsmaß für schriftliche Fremdreflexionen zu einer videografierten Unterrichtssituation entwickelt, welches unabhängig menschlicher Ressourcen die Qualität eines Argumentationsprozesses abschätzen kann. Im Rahmen der Studie verfassten N = 134 (angehende) Physiklehrkräfteschriftliche Fremdreflexionen zu einer Unterrichtsvideographie. Expertinnen erstellten theoriegeleitet Qualitätsbewertungen zur Breite, Tiefe, Kohärenz und Spezifität (k > .67) eines jeden Reflexionstextes, um auf ein bekanntes kategoriales Qualitätsmaß zurückgreifen zu können. Unter Verwendung von ML-Algorithmen aus den vorangegangenen Studien wurden für jeden Reflexionstext Informationen zur Argumentationsstruktur aus den Texten extrahiert. Hierzu gehören beispielsweise relative und absolute Häufigkeiten von Beschreibungen, Bewertungen, formulierten Alternativen und abgeleiteten Konsequenzen. Mittels einer explorativen Faktorenanalyse konnten unter Verwendung von 80% der Daten die Faktoren Qualität, Quantität* und Deskriptivität interpretiert werden (Inkludierte Variablen mit Kaiser-Meyer-Olkin-Faktor ≥ .45). Ergebnisse und Schlussfolgerungen Da alle kategorialen Qualitätsbewertungen durch den Faktor Qualität repräsentiert wurden und quadratische Zusammenhänge zu den extrahierten Informationen der ML-Algorithmen identifiziert werden konnten, konnte ein maximales Qualitätskorrelat kalkuliert werden. Die quadratischen Regressionen aller Gegenüberstellungen stellten sich hierbei mit p < .001 als signifikant geeigneter dar, als lineare Regressionen. Zum identifizierten maximalen Qualitätskorrelat kann dank der vorliegenden Studie für jeden neuen Reflexionstext im Kontext des gesehenen Unterrichtsausschnitts automatisiert eine Distanz bestimmt werden. Diese Distanz zum maximalen Qualitätskorrelat konnte mit den übrigen 20% der Reflexionstextdaten validiert werden (k = .64^***) und kann die Qualität der schriftlichen Reflexionen fortan unabhängig von menschlichen Ressourcen quantifizieren. Methodisch verdeutlicht diese Arbeit im Kontext der fachdidaktischen Reflexionsforschung die Möglichkeit, aussagekräftige Quantifizierungen auch in der Analyse komplexer Konstrukte, wie der Qualität von Reflexionsprozessen,vornehmen zu können.
10:30 - 12:10	1-20: Hochbegabung Ort: S24
	Paper Session Intellektuelle Hochbegabung: Mehr als nur akademische Exzellenz? Eine Propensity Score Matching Untersuchung von schulbezogenen psychologischen Variablen Steffani Saß¹, Olaf Köller², Friederike Zimmermann¹ ¹IPL, Deutschland; ²IPN, Deutschland Intellektuelle Hochbegabung zeichnet sich durch herausragende kognitive Fähigkeiten aus, einschließlich schneller und effizienter Informationsverarbeitung und ausgezeichneter Problemlösefähigkeit (Cattell, 1987). Diese Fähigkeiten sind wichtig für das Lernen in der Schule, folglich ist Intelligenz entscheidend für die schulische Leistung (Rhode & Thompson, 2007; Roth et al., 2015). In der Tat zeigen intellektuell hochbegabte Schüler:innen sowohl höhere Leistungen als auch ein höheres schulbezogenes Selbstkonzept (Bergold et al., 2020). Ob sich hochbegabte Schüler:innen in der Schule auch in weiteren psychologischen Merkmalen unterscheiden ist Bestandteil umfangreicher Forschung und folgt zwei widersprüchliche Hypothesen. Nach der Disharmoniehypothese sind intellektuell hochbegabte Schüler:innen besonders anfällig für Schwierigkeiten bezüglich ihrer sozio-emotionalen Kompetenzen (z. B., Neihart, 1999). Die Harmoniehypothese hingegen besagt, dass Hochbegabung vor Fehlanpassung schützt, indem sie ein optimales Gleichgewicht zwischen intellektuellen Fähigkeiten und sozio-emotionalen Funktionen fördert (z. B. Persson, 1998). Obwohl Forschungsergebnisse größtenteils für die Harmoniehypothese sprechen, liefern umfassende Review und Meta-Analysen immer noch keine schlüssigen Ergebnisse hinsichtlich der Unterschiede im sozio-emotionalen Verhalten zwischen intellektuell hochbegabten und durchschnittlich begabten Schüler:innen (Francis et al., 2016; Martin et al., 2010; Tasca et al., 2022). Darüber hinaus weisen die Studien häufig methodische Probleme auf (d. h. kleine oder selektive Stichproben, verzerrte Vergleichsgruppen, Konfundierung durch Kovariaten). Die genannten methodischen Probleme sowie die Relevanz des Themas im schulischen Kontext unterstreichen die Notwendigkeit weiterer, gut konzipierter Studien. Unsere Forschung zielt darauf ab, diese Lücke zu schließen und Klarheit über ein breites Spektrum schulbezogener psychologischer Variablen zu erhalten. Konkret untersuchen wir, ob sich intellektuell hochbegabte Schüler:innen von durchschnittlich begabten Schüler:innenn hinsichtlich folgender Merkmale unterscheiden: akademische Kompetenzen (d. h. Leistung, Motivation), emotional-verhaltensbezogene Kompetenzen (d. h. internalisierendes und externalisierendes Verhalten, Selbstwertgefühl) und soziale Kompetenzen (d. h. prosoziales und antisoziales Verhalten, Zugehörigkeitsgefühl). Wir haben die Daten des 1. Messezeitpunktes einer umfangreichen Längsschnittstudie genutzt (N = 3 918), in der Schüler:innen der 5., 7. und 9. Klasse (Querschnitt) in einem Fragebogen eine Vielzahl von Skalen beantworteten. Weiterhin wurden die schulischen Leistungen sowie die Intelligenz der Kinder mit standardisierten Verfahren erhoben. Zusätzlich schätzten Eltern und Lehrkräfte emotionale-verhaltensbezogene Auffälligkeiten der Kinder ein. Aus diesem Datensatz wurden n = 100 begabte Schüler:innen ausgewählt, die in einem Intelligenztest einen Wert von IQ>129 erzielten. Die ausgewählten Schüler:innen wurden mittels Propensity Score Matching (PSM) mit n = 100 durchschnittlich begabten Schüler:innen hinsichtlich Alter, Sozio-ökonomischer Hintergrund, Migrationshintergrund, Bildungsgang und Geschlecht gematcht. Die Ergebnisse der multiplen Regression (kontrolliert für die im PSM genutzten Kovariaten sowie nach Benjamini-Hochberg adjustierten p-Werten) zeigen, dass intellektuell hochbegabte Schüler:innen erwartungsgemäß höhere akademische Leistungen in Mathematik und Deutsch (standardisierte Testergebnisse und Noten) sowie ein höheres Selbstkonzept in Mathematik im Vergleich zu durchschnittlich begabten Schüler:innen erzielten. Weiterhin gaben Lehrkräfte an, dass intellektuell hochbegabte Schüler:innen weniger externalisierendes Verhalten zeigten als durchschnittlich begabte Schüler:innen. Alle anderen Vergleiche in Bezug auf die sozialen und emotionalen Kompetenzen, wie es von Eltern (externalisierendes Verhalten), Lehrern (internalisierendes Verhalten, prosoziales Verhalten) oder Mitschüler:innen (anti- und prosoziales Verhalten) sowie den Schüler:innen selbst (Selbstwert, Interesse, Schulzugehörigkeitsgefühl) bewertet wurde, ergaben keine Unterschiede zwischen den beiden Gruppen. Zusammenfassend legen unsere Ergebnisse nahe, dass intellektuelle Hochbegabung mit überdurchschnittlichen akademischen Leistungen und einem positiveren Selbstkonzept (zumindest in Mathe) zusammenhängt, ohne dass deutliche soziale oder emotionale Defizite erkennbar sind. Diese Befunde unterstützen die Harmoniehypothese und betonen die Bedeutung einer differenzierten Betrachtung von Hochbegabung im schulischen Kontext. Für Pädagogen und Bildungseinrichtungen unterstreicht dies die Notwendigkeit, hochbegabte Schüler:innen angemessen zu fördern und dabei ein ganzheitliches Verständnis ihrer Entwicklung zu haben. Paper Session Stabilität von Schulleistung: Eine Metaanalyse Vsevolod Scherrer, Moritz Breit, Franzis Preckel Universität Trier, Deutschland Schulische Leistungen beeinflussen den Lebensweg einer Person maßgeblich, etwa in Bezug auf Studium und Berufswahl (Hübner et al., 2022; Rimfeld et al., 2018). Sie werden meistens mittels standardisierter Tests oder durch Schulnoten gemessen, wobei sich beide Methoden in Objektivität und Reliabilität unterscheiden (Willingham et al., 2002). Groß angelegte Studien wie PIRLS, PISA und TIMSS werden weltweit durchgeführt, um den Bildungserfolg von Schülerinnen und Schülern zu messen und Empfehlungen für Bildungssysteme aus den Daten abzuleiten (Mullis et al., 2009; Schleicher, 2019). Ein wichtiger Aspekt, der hierbei beachtet werden muss, ist die Stabilität der Schulleistungen, welche durch Test-Retest-Korrelationen erfasst werden kann. Eine hohe Stabilität wird oft vorausgesetzt, wenn Entscheidungen basierend auf Schulleistungsmessungen getroffen werden, etwa bei Fördermaßnahmen oder Platzierungen in unterschiedlichen Schulformen. Eine niedrige Stabilität würde die Validität solcher langfristig wirksamen Entscheidungen einschränken. Bei extrem hoher Stabilität bereits in frühen Schuljahren bestünde hingegen das Risiko, dass leistungsschwache Schülerinnen und Schüler trotz Fördermaßnahmen auf ihrem niedrigen Leistungsniveau verharren. Die Stabilität schulischer Leistungen wird in vielen Längsschnittstudien berichtet, Jedoch gab es bisher keine Metanalyse über diese Befunde, die belastbare Aussagen zur Stabilität von Schulleistungen und möglichen Moderatoren erlaubt. Fragestellungen 1. Wie hoch ist – bei Kontrolle des Test-Retest-Intervalls und der Klassenstufe – die durchschnittliche Rangordnungsstabilität von Schulleistungen erfasst mittels standardisierter Schulleistungstests und Schulnoten? 2. Moderiert die Art des Indikators (standardisierte Tests vs. Schulnoten) die Rangordnungsstabilität von Schulleistungen? 3. Wie hängen Rangordnungsstabilität und Test-Retest-Intervall zusammen? Erwartet wird eine abnehmende Rangordnungsstabilität mit zunehmendem Test-Retest-Intervall. 4. Wie hängen Rangordnungsstabilität und Klassenstufe zusammen? Erwartet wird eine höhere Rangordnungsstabilität mit zunehmender Klassenstufe. 5. Unterscheidet sich die Stabilität von Schulleistungen in unterschiedlichen Ländern? Methode Durch systematische Suchstrategien wurden 8045 Artikel identifiziert und auf Eignung geprüft. Von diesen wurden 363 Artikel mit insgesamt 2021 Effektgrößen für weitere Analysen kodiert. Effektgrößen. Die Autokorrelation r der schulischen Leistungen der Schülerinnen und Schüler über die Zeit wurde als Effektgröße für die Rangordnungsstabilität verwendet. Wenn eine Studie mehr als zwei Messzeitpunkte berichtete, wurden alle möglichen Kombinationen von r kodiert. Moderatoren. Für jede Effektgröße wurde das Test-Retest-Intervall zwischen den beiden Messzeitpunkten als kontinuierliche Variable in Jahren kodiert. Die Klassenstufe der Schülerinnen und Schüler beim ersten Messzeitpunkt wurde als kontinuierliche Variable in Jahren kodiert. Effektgrößen wurden nach Schulnoten und standardisierten Schulleistungstests gruppiert und als Dummyvariablen kodiert. Über dichotome Dummyvariablen wurden die Länder, in denen die Datenerhebungen stattfanden, kodiert. Analysen. Die Fragestellungen und Hypothesen wurden durch Random-Effect-Metaregressionen mit dem Gesamtdatensatz und separaten Datensätzen für Schulleistungstests und Schulnoten getestet. Bei kategorialen Moderatoren wurde jede Kategorie, abgesehen von der Referenzkategorie, als dichotomer Dummy-Prädiktor einbezogen und gegen die Referenzkategorie geprüft. Um für die genestete Struktur der Daten (mehrere Effektstärken pro Studie) zu kontrollieren, wurde die Robust Variance Estimation Methode verwendet (Tipton, 2015). Ergebnisse Nach Kontrolle des Test-Retest-Intervalls und der Klassenstufe konnte eine durchschnittliche Rangordnungsstabilität von r=.70, r=.72 und r=.67 für den Gesamtdatensatz, standardisierte Schulleistungstests und Schulnoten errechnet werden. Die Werte beziehen sich auf ein angenommenes Test-Retest-Intervall von zwei Jahren und die Klassensufe 5. Die Stabilität in standardisierten Schulleistungstests war signifikant höher als in den Schulnoten (β=.07, p<.001). Moderatoranalysen zeigten, dass die Stabilität mit zunehmendem Test-Retest-Intervall sinkt (Gesamtdatensatz: β=-.06, p<.001; standardisierte Schulleistungstests: β=-.04, p<.001; Schulnoten: β=-.12, p<.001). Die Klassenstufe war hingegen kein signifikanter Moderator der Stabilität (p>.05). Weiterhin waren standardisierte Schulleitungstests in Australien (β=-.27, p=.007), Kanada (β=-.33, p=.004), China (β=-.21, p=.003), Finnland (β=-.22, p=.005), Deutschland (β=-.15, p=.023) und Qatar (β=-.23, p=.003) weniger stabil als in der Referenzkategorie USA. Dagegen waren die Schulnoten in China stabiler als in den USA (β=.25, p=.034). Die Ergebnisse weisen insgesamt auf eine hohe Stabilität von Schulleistungen hin, sie werden im Hinblick auf den Bildungsauftrag von Schule diskutiert. Paper Session Der Einfluss von impliziten Theorien über Intelligenz und Sozialkompetenz auf die Stereotypisierung von Hochbegabten Vanessa Clauss, Steffani Saß, Friederike Zimmermann Christian-Albrechts-Universität zu Kiel, Deutschland Theoretischer Hintergrund Hochbegabte unterliegen verschiedenen Vermutungen bezüglich ihrer sozio-emotionalen Kompetenz (z.B. Baudson & Preckel, 2013). Es wird zwischen zwei Hauptannahmen unterschieden: die Harmoniehypothese besagt, dass intellektuelle Hochbegabung mit größeren sozio-emotionalen Kompetenzen einhergeht, während die Disharmoniehypothese Hochbegabten Defizite in ihrer Sozialkompetenz und höhere Auftretenswahrscheinlichkeit für psychische Auffälligkeiten unterstellt (Preckel & Vock, 2012). Obwohl Forschungsergebnisse eher für die Harmoniehypothese sprechen (Rost, 1993; Shechtman & Silektor, 2012; Galucci, 1988), neigen Lehramtsstudierende und Lehrkräfte dazu, die Disharmoniehypothese anzunehmen (z.B. Matheis et al., 2017; Baudson & Preckel, 2016). Diese Stereotype können einen adäquaten Umgang mit hochbegabten Kindern und Jugendlichen in der Schule verhindern und deren Entwicklung beeinträchtigen. Somit sind sowohl Interventionen als auch mehr Verständnis für die Wirkmechanismen hinter diesen Stereotypen wichtig, um diesen entgegenzuwirken. Die vorliegende Studie untersucht die Verringerung der Stereotypisierung über einen Refutationstext. Da implizite Theorien einen Einfluss darauf zu haben scheinen, wie Stereotype geformt und aufrechterhalten werden (Dweck, 1999), könnten sie wichtige Faktoren bezüglich der Wirksamkeit des Refutationstextes darstellen. Fragestellung Beeinflussen implizite Theorien über die Veränderbarkeit von Intelligenz und Sozialkompetenz a) die Stereotypisierung gegenüber hochbegabten Kindern und Jugendlichen im Sinne der (Dis-)harmonie-Hypothese und b) die Wirksamkeit eines Refutationstextes in der Verringerung des Disharmonie-Stereotyps gegenüber Hochbegabten? Methode An dieser Studie nahmen 183 Lehramtsstudierende teil (76% weiblich; M_Alter = 22.47 Jahre (SD = 3.3); M_Fs = 4 Fachsemester; 81% Gymnasiallehramt), die randomisiert einer Interventions- oder Kontrollgruppe zugewiesen wurden. Zehn Monate später konnten 95 Proband:innen erneut zu ihren Stereotypen befragt werden. Instrumente Stereotype Um Stereotype gegenüber hochbegabten Schüler:innen zu erfassen, wurden zwei Operationalisierungen genutzt: a) eine adaptierte Skala zur Erfassung der Wahrnehmung von hochbegabten im Vergleich zu normalbegabten Kindern und Jugendlichen hinsichtlich sozialer Inkompetenz (Heyder et al., 2018), b) das Ausmaß der Stereotypisierung im Sinne der Harmonie-Hypothese mithilfe der an Hochbegabte angepassten Skala Sozialverhalten der Lehrereinschätzliste für Sozial- und Lernverhalten (Petermann & Petermann, 2013). Im Folgenden werden die Skalen mit WSI (wahrgenommene soziale Inkompetenz) und WSEK (wahrgenommene soziale und emotionale Kompetenz) abgekürzt. Refutationstext Der für diese Studie konzipierte Refutationstext folgte der von Tippett (2010) zusammengefassten Struktur. Er bestand aus sechs Sätzen. Nach der Annahme der Disharmonie-Hypothese, dass hochbegabte SchülerInnen in ihrer sozio-emotionalen Entwicklung zurückbleiben, folgte die Entkräftung, dass diese Hypothese nach aktuellem Forschungsstand nicht bestätigt werden kann. Diese wurde mit verschiedenen Studienergebnissen belegt. Implizite Theorien über die Veränderbarkeit von Intelligenz und Sozialkompetenz Für die Erfassung der Impliziten Theorien über die Veränderbarkeit von Intelligenz und Sozialkompetenz wurde die Subskala Veränderbarkeit von Intelligenz des SE-SÜBELLKO-ST von Spinath & Schöne (2003) verwendet und zudem für das Konstrukt Sozialkompetenz adaptiert. Ergebnisse Die Einschätzung der Veränderbarkeit von Sozialkompetenz hatte signifikanten Einfluss auf die Stereotypisierung gegenüber Hochbegabten (Erster Messzeitpunkt: WSI: β = -.18, p < .05; WSEK: β = .14, p < .05; zweiter Messzeitpunkt: WSI: β = -.27, p < .05; WSEK: β = .22, p < .05). Die Einschätzung der Veränderbarkeit von Intelligenz hatte hingehen keinen signifikanten Einfluss auf die WSI: β = .05, p > .05, aber auf die WSEK, β = -.18, p < .05; zum zweiten Messzeitpunkt gab es keinen signifikanten Effekt. Der Refutationstext wirkte: Das Lesen des Refutationstextes verringerte die WSI (β = -.28, p < .05) und erhöhte die WSEK (β = .38, p < .05), dieser Effekt blieb auch noch zehn Monate später bestehen (WSI: β = -.44, p < .05; WSEK: β = .27, p < .05). Der vermutete Moderationseffekt der untersuchten impliziten Theorien auf die Wirkung des Refutationstextes zeigte sich bei beiden Operationalisierungen der Stereotypisierung nicht. Alle Analysen erfolgten unter Kontrolle von Kovariaten. Implikationen Diese Studie unterstreicht die Relevanz der Aufklärung von (angehenden) Lehrkräften bezüglich Hochbegabung. Implizite Theorien scheinen die Stereotypisierung signifikant zu beeinflussen und sollten vermehrt thematisiert werden.
12:10 - 13:10	Mittagspause
13:10 - 14:50	2-01: Sinkende Bereitschaft schulischer Akteurinnen und Akteure zur Teilnahme an Datenerhebungen - Ursachen und Handlungsansätze Ort: H05
	GEBF-Panel Sinkende Bereitschaft schulischer Akteurinnen und Akteure zur Teilnahme an Datenerhebungen - Ursachen und Handlungsansätze Steffen Schindler¹, Jasmin Decristan², Christof Wecker³, Jutta von Maurice⁴, Karina Karst⁵ ¹Universität Bamberg; ²Bergische Universität Wuppertal; ³Universität Hildesheim; ⁴Leibniz-Institut für Bildungsverläufe Bamberg; ⁵Universität Mannheim Daten aus Erhebungen an Schulen sind eine wesentliche Grundlage der Empirischen Bildungsforschung. In den letzten Jahren scheint die Teilnahmebereitschaft von schulischen Akteurinnen und Akteuren stetig zu sinken. Vor diesem Hintergrund wurde auf Initiative des GEBF-Vorstands im Frühjahr 2023 eine Arbeitsgruppe eingerichtet, die es sich zur Aufgabe gemacht hat, dieses Thema eingehender zu beleuchten und herauszuarbeiten, welche Handlungsoptionen für die Empirische Bildungsforschung bestehen und auf welchem Selbstverständnis das eigene Handeln beruht. Die Ergebnisse dieser Arbeitsgruppe fließen in ein Positionspapier der Gesellschaft für Empirische Bildungsforschung ein, das Forschenden als Grundlage für das eigene Handeln dienen sowie den Austausch verschiedener Fachverbände zu diesem Themenkreis initiieren kann. Die Ursachen für eine gesunkene Teilnahmebereitschaft schulischer Akteurinnen und Akteure scheinen vielfältiger Natur zu sein. Grundsätzlich lässt sich anführen, dass empirische Forschung und schulische Praxis unterschiedlichen Eigenlogiken folgen und unterschiedliche Anreizsysteme bieten, die nicht zwingend miteinander kompatibel sind. Das Kerngeschäft der Schulen ist die Bildung und Erziehung von Schülerinnen und Schülern, und die aktuellen Anforderungen im Zuge einer zunehmenden Heterogenität der Lernenden im Kontext des gegenwärtigen Fachkräftemangels an Schulen stellen die Schulen vor massive Herausforderungen, deren Bewältigung verständlicherweise priorisiert wird. Bereitschaft und Ressourcen schulischer Akteurinnen und Akteure für eine Teilnahme an Forschungsprojekten sind entsprechend deutlich reduziert. Gleichermaßen sind diese an zeitnahen Rückmeldungen mit möglichst für sie passenden und konkreten Handlungsempfehlungen mit einer auch ohne vertiefte Statistikkenntnisse verständlichen Ergebnisaufbereitung interessiert. Andererseits ist eine forschungsmethodisch angemessene Aufbereitung, Analyse und Interpretation der erhobenen Daten in der Regel zeitaufwändig, und mögliche Implikationen sind mit Vorsicht und unter Berücksichtigung der Komplexität schulischer Bildungsprozesse zu formulieren. Es lässt sich vermuten, dass Sinnhaftigkeit, Mehrwert und Nützlichkeit von Erhebungen für schulische Akteurinnen und Akteure oft zu wenig ersichtlich sind. Im Rahmen der Bewertung der Teilnahmebereitschaft schulischer Akteurinnen und Akteure ist anzuerkennen, dass in den letzten 25 Jahren im Zuge der empirischen Wende zahlreiche Schulen an verschiedensten umfangreichen Erhebungen und Vergleichsstudien teilgenommen haben, von internationalen Vergleichsstudien mit umfangreichen Stichproben über Studien des nationalen Bildungsmonitorings auf Basis der KMK-Bildungsstandards sowie Lernstandserhebungen und Vergleichsarbeiten zur Qualitätssicherung auf Schulebene bis hin zu unzähligen kleineren wie größeren Forschungsprojekten und Qualifikationsarbeiten empirischer Bildungsforscherinnen und -forscher. In der Zusammenarbeit mit schulischen Akteurinnen und Akteuren erschwert die Fluktuation von wissenschaftlichen Mitarbeiterinnen und Mitarbeitern den längerfristigen kontinuierlichen Aufbau von Kooperationsbeziehungen. Zugleich wird die Vorbereitung und Begleitung der Genehmigungsverfahren der für Erhebungen in Schulen zuständigen Behörden in den Bundesländern oftmals als Hindernis wahrgenommen. Die Verfahren erscheinen hierbei oftmals vergleichsweise aufwändig und erfordern eine umfangreiche Expertise, nicht zuletzt im Umgang mit datenschutzrechtlichen Bestimmungen und landesspezifischen schulrechtlichen Auflagen sowie im Datenmanagement. Auf der Jahreskonferenz 2024 der GEBF soll ein offenes Beitragsformat als Anlass genutzt werden, einleitend die bisherigen Ergebnisse der Arbeitsgruppe in ihren Grundzügen zu skizzieren und anschließend im Rahmen einer Podiumsdiskussion und einem weiteren gemeinsamen Austausch zur Diskussion zu stellen. Die Zusammensetzung des Podiums umfasst Vertreterinnen und Vertreter verschiedener Stakeholdergruppen (Schulpraxis, Ministerium) sowie verschiedener Forschungszugänge der Empirischen Bildungsforschung. Die moderierte Podiumsdiskussion startet mit kurzen Statements der Podiumsteilnehmenden, in denen dazu Stellung genommen wird, welche Faktoren aus der jeweiligen Perspektive maßgeblich mit der Teilnahmebereitschaft für Erhebungen an Schulen verbunden sind und welche Maßnahmen zukünftig wichtig wären. Anschließend soll anhand verschiedener Leitfragen die Diskussion auf dem Podium eröffnet werden. Darüber hinaus werden alle Teilnehmenden der Tagung eingeladen, sich aktiv in die Diskussion einzubringen, um die verschiedenen Perspektiven und Handlungsfelder in ihrer Breite angemessen abzudecken und diese in der Folge in dem Positionspapier angemessen berücksichtigen zu können. Teilnehmende der Podiumsdiskussion: Svenja Bundt (IEA, International Association for the Evaluation of Educational Achievement) Prof. Dr. Uta Hauck-Thum (LMU München) Prof. Dr. Tina Seidel (TU München) Prof. Dr. Petra Stanat (SWK; IQB; Humboldt-Universität Berlin) Ulf Weltzin (Schulleiter, Schule am Kirschgarten, Bernau) Jens Fischer-Kottenstede ( Hessisches Ministerium für Kultus, Bildung und Chancen, Wiesbaden) Dr. Jonas Ringler (DIPF, Abteilung „Struktur und Steuerung des Bildungswesens“, Frankfurt a.M.) Moderation Prof. Dr. Steffen Schindler (Vize-Präsident der GEBF, Universität Bamberg)
13:10 - 14:50	2-02: Virtual Reality in der Lehrkräftebildung: Einblicke, Ergebnisse und Entwicklungspotenziale Ort: H04
	Symposium Virtual Reality in der Lehrkräftebildung: Einblicke, Ergebnisse und Entwicklungspotenziale Chair(s): Poldi Kuhl (Leuphana Universität Lüneburg, Deutschland) Diskutantin(nen): Andreas Lachner (Universität Tübingen, Deutschland) In der universitären Hochschullehre soll Studierenden eine breite und vernetzte Wissensbasis vermittelt werden, um sie bestmöglich auf ihre spätere berufliche Karriere vorzubereiten. Neben der bloßen Vermittlung deklarativen Fachwissens geht es dabei vor allem auch um den Aufbau von prozeduralem Wissen und Handlungskompetenzen, die es den Studierenden erlauben, flexibel und angemessen auf eine Vielzahl komplexer Situationen zu reagieren. Dieses prozedurale Wissen und die Handlungskompetenzen lassen sich nur bedingt rein theoretisch vermitteln. Vielmehr sind dafür alternative didaktisch-methodische Tools notwendig, die den Studierenden ein „learning by doing“ mit anschließender Reflexion des eigenen Verhaltens ermöglichen (Scott 2015). Für ein stärker erfahrungsbasiertes, praxisnäheres Lernen gibt es zahlreiche Ansätze, z. B. die Nutzung von Rollenspielen, Simulationen oder situativen Fallstudien (Kadel et al., 2023). All diese Formate können für den Kompetenzaufbau förderlich sein, sind jedoch im Hinblick auf gewisse Dimensionen wiederum selbst auch limitiert. Dies zeigt sich beispielsweise darin, dass echte Situationen nur unzureichend abgebildet werden, etwa durch fehlenden Realismus oder zu geringe Komplexität. Als Resultat haben Studierende auch nach ihrer universitären Ausbildung häufig noch Schwierigkeiten, komplexe Situationen zu analysieren, geeignete Handlungsalternativen überlegt auszuwählen, Handlungsentscheidungen zu treffen sowie das Verhalten und die Situation abschließend zu bewerten und zu reflektieren. Um Studierende in der universitären Hochschullehre möglichst effektiv beim Aufbau von relevanten Handlungskompetenzen zu unterstützen und sie bestmöglich auf herausfordernde berufliche Situationen vorzubereiten, entstehen durch technologische Innovationen neue Möglichkeiten (Saavedra & Opfer, 2012). Aktuell wird vor allem der Einsatz von Virtual Reality (VR)-Anwendungen diskutiert, um Studierende mit hoher Kontrollierbarkeit und Standardisierung mit möglichst realen Situationen zu konfrontieren (Huang et al., 2023). Studierende können so in realitätsnahen und geschützten Umgebungen Entscheidungen treffen, Handlungen erproben und deren Konsequenzen reflektieren und somit Handlungskompetenzen für ihre weitere Karriere aufbauen. Insofern wird VR zu einer aussichtsreichen Technologie für die Hochschulbildung (Billingsley et al., 2019), was in diesem Symposium anhand von Beispielen aus der Lehrkräftebildung verschiedener Standorte illustriert und empirisch belegt werden soll: Beitrag 1 nutzt das VR-Klassenzimmer als Umgebung für Entwicklung von Wissen zum Klassenmanagement und zeigt diesbezüglich positive Entwicklungen auf. Zudem liefern die Auswertungen der qualitativen Daten Hinweise zu den wahrgenommenen Chancen und Herausforderungen der Nutzung von VR-Umgebung sowohl für die Lehrkräftebildung als auch für die Gestaltung des eigenen Unterrichts. Ebenfalls auf Grundlage des VR-Klassenzimmers geht Beitrag 2 der Frage nach, inwiefern die Art des Feedbacks (adaptiv, statisch, keins) mit der Verbesserung der Fähigkeiten Lehramtsstudierender im Bereich des Noticing einhergeht. Hierzu wurde in einer randomisiert-kontrollierten Studie in einem standardisierten VR-Klassenzimmer Eye und Motion-Tracking eingesetzt und deutlich, dass adaptives Feedback zum einen mit besserem Noticing verbunden war, zum anderen von den Studierenden selbst auch positiver eingeschätzt wurde als die Varianten statisches oder kein Feedback. Beitrag 3 berichtet Ergebnisse eines VR-Trainings für Elterngespräche und deutet auf Grundlage der Pilotierungsdaten aus einer Pre-Post-Studie auf positive Entwicklungen selbsteingeschätzten Beratungskompetenzen, Selbstwirksamkeit und Angst vor Elterngesprächen unter den Studierenden hin und zeigt Potentiale für die Weiterentwicklung hinsichtlich der Implementation von VR in die Lehrkräftebildung auf. In Beitrag 4 schließlich wird der Vergleich zwischen 3D- und VR-Technologien thematisiert sowie der Zusammenhang zu Selbstwirksamkeitserwartungen der Studierenden hinsichtlich des Einsatzes der Technologien im künftigen eigenen Unterricht betrachtet. VR wird dabei hinsichtlich der Immersion und Authentizität der Erfahrungen positiver eingeschätzt als 3D, hinsichtlich des Zusammenhangs mit der Selbstwirksamkeit der Studierenden im Kontext des eigenen Technikeinsatzes sich aber jedoch differentiellen Befunde zwischen beiden Modi. Das Ziel dieses Symposium ist es damit insgesamt, Umsetzungsmöglichkeiten an mehreren Beispielen des Einsatzes von VR aufzuzeigen und verschiedene Potenziale von VR in der universitären Hochschulbildung zu diskutieren. Abschließend werden weitere Forschungsbedarfe beschrieben und nächste Entwicklungsschritte exploriert. Beiträge des Symposiums Wie lernen Studierende Klassenmanagement in der Uni? Wissensvermittlung und Nützlichkeitsaspekte beim Einsatz einer Virtual Reality Lernumgebung Florentine Hickethier, Alexander Gröschner Universität Jena, Deutschland Theoretischer Hintergrund Virtual Reality (VR) als Ansatz des simulationsbasierten Lernens kann die Motivation von Lernenden steigern (Pan et al., 2006) und zu einem Lernzuwachs beitragen (Gutierrez et al., 2007). Auch in der Lehrerbildung kommen bereits VR-basierte Lernumgebungen zum Einsatz, die verschiedene Unterrichtsszenarien nachstellen (Huang et al., 2023). Erste Ergebnisse zeigen positive Effekte hinsichtlich Interesse und Selbstwirksamkeit im Lernen zum Thema Klassenmanagement durch den Einsatz einer VR-Umgebung im Vergleich zu einem Unterrichtsvideo (Huang et al., 2022). Auch werden VR-Umgebungen als relevant für den späteren Beruf und das Lernen von Schülerinnen erachtet (Hickethier et al., in Vorb.). Diese Erkenntnisse lassen die Frage aufkommen, inwiefern sich die Nutzung von VR in der universitären Lehre noch stärker einbinden lässt, damit Lehramtsstudierende von diesen praxisnahen und immersiven Erfahrungen profitieren können und sich zugleich positive Einstellungen zum Einsatz neuartiger Technologien im Schulkontext ausprägen. Fragestellung In der aktuellen Studie untersuchen wir die Wirkung einer VR-Umgebung für die Lehrkräftebildung in Bezug auf die Entwicklung von Wissen zum Klassenmanagement. Zudem sollen Erkenntnisse über den wahrgenommenen Nutzen einer derartigen VR-Umgebung für die Lehrkräftebildung und generell von VR-Technologie für den Unterricht gewonnen werden. Methode Im Wintersemester 2022/23 und im Sommersemester 2023 wurde die VR-Umgebung „Virtuelles Klassenzimmer“ im Rahmen eines Seminars mit Studierenden des Lehramts erprobt. Ein Großteil der Studierenden bekam erstmalig die Möglichkeit, eine selbst geplante Unterrichtssequenz von ca. zehn Minuten instruktional durchzuführen. Im Anschluss erhielt jeder Studierender sowohl von Kommilitoninnen als auch zwei Dozierenden ein Feedback zur Umsetzung der Simulation in der VR-Umgebung. Die Realisierung erfolgte in separaten Kleingruppensitzungen mit etwa zwei bis vier Studierenden, die nacheinander ihre Unterrichtseinheit mit der virtuellen Klasse durchführten. Zwei Dozierende beobachteten dabei das Verhalten und steuerten parallel die virtuellen Schülerinnen in der Klasse, wobei unterschiedliche Unterrichtsstörungen angewählt werden konnten (u.a. Lärm, Fremdbeschäftigung von Schülerinnen, Falschmeldungen etc.). Die Kommilitoninnen waren ebenfalls dazu angehalten, ihre Beobachtungen zum Verhalten der jeweiligen Studierenden mit Fokus auf das Klassenmanagement zu machen. Um die Forschungsfragen zu beantworten, wurde eine Prä- und Postbefragung der Studierenden durchgeführt. Erhoben wurden Skalen zum Wissen über Klassenmanagement adaptiert nach Thiel et al. (2013) und Piwowar et al. (2013), zur Perceived Usefulness (Teo, 2009) sowie zur Intention to Use (Teo, 2009). Speziell die Skala zum Klassenmanagement mit 24 Items auf einer achtstufigen Likert-Skala (1 = „stimme gar nicht zu“ bis 8 = „stimme genau zu“) bezieht sich auf Wissen zu verschiedenen Fähigkeiten und Fertigkeiten zur optimalen Anleitung einer Klasse. Zum Abschluss des Seminars bestand die Aufgabe der Studierenden darin, die gesammelte Erfahrung mit der VR im Hinblick auf die Bedeutung für die Lehrkräftebildung sowie für den Einsatz im Unterricht im Rahmen eines kurzen Berichts (2-3 Din A4-Seiten) zu reflektieren. Insgesamt nahmen N = 37 Studierende des Lehramts für die Sekundarstufe I und II (Alter: M = 20.78 Jahre, SD = 1.94 Jahre; Geschlecht: 45.9% weiblich, 51.4% männlich, 2.7% ohne Angabe) mit unterschiedlichen Fächerkombinationen an der Studie teil. 67.6 % der Teilnehmenden hatten zuvor noch nie eine VR-Umgebung ausprobiert. Ergebnisse und Diskussion Hinsichtlich der quantitativen Befunde wurde ein Wilcoxon-Vorzeichen-Rang-Test berechnet, um die Wirkung des VR-Trainings auf das Wissen über Klassenmanagement zu überprüfen. Es zeigte sich eine statistisch signifikante positive Veränderung der Wissenswerte (Mdn = .77) vom Prätest (Mdn = 4.71), zum Posttest (Mdn = 5.46), z = 4.43, p < .001, r = .78. Qualitative Auszüge aus den Reflexionsberichten werden im Vortrag illustrierend herangezogen, um Facetten des Lernens der Studierenden im Bereich des Klassenmanagements darzustellen. In der Diskussion wird anhand der quantitativ sowie qualitativ gewonnenen Ergebnisse den Fragen nachgegangen, welche Potenziale und Grenzen Studierende in der Nutzung VR-basierter Lernumgebungen in der Lehrerinnenbildung sehen. Zudem wird der Beitrag von VR im Kontext der Anforderung praxisbezogener Lerngelegenheiten in der Lehrerinnenbildung beleuchtet (Gröschner et al., 2022). Effectiveness of adaptive versus static feedback on improving teacher noticing: A randomized controlled virtual reality study Yizhen Huang¹, Eric Richter¹, Mira Hansen², Thilo Kleickmann², Katharina Scheiter¹, Dirk Richter¹ ¹Universität Potsdam, Deutschland, ²Universität Kiel, Deutschland Theoretical Background Preservice teachers often struggle with noticing student disruptions and “teachable moments” (König et al., 2022). Numerous professional learning environments have been designed to facilitate the acquisition of this crucial noticing skill, most of which are video- (e.g., Seidel et al., 2011) and animation-based (e.g., Bastian et al., 2022). Lately, virtual reality (VR) classrooms that enable authentic teaching simulation with experimental controllability and multimodal process-data collection has also gained great traction as a learning environment for teachers (Authors, 2023). Despite the fact that aforementioned learning environments are usually organically coupled with performance feedback for teachers (e.g., Kleinknecht & Gröschner, 2016), the influence of feedback, particularly adaptive feedback, on the development of teachers’ noticing abilities is rarely investigated. Adaptive feedback is “generated in response to learners’ actions” and “personalized based on key variables” to support their individual needs (Plass & Pawar, 2020, p. 288), as contrast to static feedback which provides all learners with the same generic information (Sailer et al., 2022). Particularly, real-time process data is often necessary to achieve high level of adaptivity (Merk et al., 2023). Research Question To investigate the potential benefits of adaptive feedback driven by real-time process data for enhancing the noticing skill of preservice teachers, the present study utilized a standardized VR classroom with eye and motion tracking to compare noticing performances among participants receiving adaptive, static, or no feedback. Method A hundred preservice teachers were recruited from a public German university (Mage = 24.4 years, 65.7% cisgender female, 93.5% bachelor program) who were randomly assigned to three feedback conditions (Nadaptive = 35, Nstatic = 33, Ncontrol = 30). Participants were immersed in a VR classroom with standardized student agents (see Figure 1) through the HTC Vive Pro Eye system. Each participant would offer a 10-minute lesson on note-taking for two times (see Figure 2) with either adaptive, static or no feedback in between (see Table 1). Both feedback conditions provided the same recommendations on factors influencing noticing performance, but adaptive feedback made use of the process data (see Figure 3) collected through eye and motion tracking in VR to aid participants in making connections between the recommendations and their own experiences. During the VR sessions, participants’ eye movements were collected continuously and later used to evaluate their noticing performance: number and speed of fixations on student disruptions. After the second VR session, participants rated their perceptions of received feedbacks (if applicable) with the Feedback Perceptions Questionnaire rated from 0 (does not apply at all ) to 10 (fully applies) (Strijbos et al., 2021) (see Table 2). Results First, we used linear mixed (-effects) modeling (LMM) to evaluate the effect of feedback conditions on change of noticing performance from pre to posttest. The adaptive feedback condition yielded significantly higher change in increased number of fixations (Figure 4; Madaptive = 1.58, Mstatic = 1.07, Mcontrol = 1.04) and reduced time to first fixation (Figure 5; Madaptive = 7.01, Mstatic = 9.34, Mcontrol = 10.96) than static and no feedback groups. The differences between static and no feedback were not statistically significant. Second, participants perceived adaptive feedback more positively than static ones with significant differences in fairness (F(36.63) = 6.07, p = .02), usefulness (F(29.65) = 4.37, p = .05), and acceptance (F(35.64) = 6.31, p = .01). Both groups had high positive affects (Madaptive = 7.42, Mstatic = 7.91) and low negative affects (Madaptive = 1.74, Mstatic = 1.60). The present study revealed that the utilization of data-driven adaptive feedback significantly enhances preservice teachers' noticing performances, offering valuable implications for the design of teacher education programs, and learning environments. Wirkungen des Einsatzes eines VR-Trainings zur Kompetenzentwicklung und Reflexion im Kontext von Elterngesprächen Friederike Knabbe, Yannik Escher, Hannes Petrowsky, David Loschelder, Poldi Kuhl euphana Universität Lüneburg, Deutschland Theoretischer Hintergrund Die Aufgaben zukünftiger Lehrkräfte beinhalten zahlreiche Herausforderungen, von denen die Kommunikation mit Eltern ein wichtiger Teilaspekt ist. Das Führen von Elterngesprächen erfordert von Lehrpersonen spezifische Beratungskompetenz, die Gerich (2016) in die vier Kompetenzdimensionen Kommunikation, Diagnostik, Problemlösen und Bewältigung unterteilt. Zudem beeinflussen auf Seiten der Lehrkräfte auch Faktoren wie die Angst, die Selbstwirksamkeitserwartung und die Motivation das Gelingen solcher Gespräche. Obwohl Beratung im Rahmen von Elterngesprächen zu den zentralen Aufgaben im Berufsalltag von Lehrkräften gehört (KMK-Standards Bildungswissenschaften, 2004; Hertel, 2009), gelingt es im universitären Kontext kaum, Lehramtsstudierende über die theoretische Auseinandersetzung hinaus hierauf vorzubereiten. Neuere technologische Entwicklungen, insbesondere Virtual Reality (VR), bieten hier eine innovative Möglichkeit, Lehramtsstudierenden eine realitätsnahe, aktive Übungsplattform für das Führen von Elterngesprächen zu bieten, sind aber bislang kaum im Hinblick auf ihre Wirkung evaluiert worden. Hier setzt die vorliegende Studie an und überprüft in einem Pre-Post-Design die selbst eingeschätzten Wirkungen eines neu entwickelten VR-Trainings für Elterngespräche auf die selbsteingeschätzte Beratungskompetenz, die Angst vor Elterngesprächen, die Selbstwirksamkeitserwartung bezüglich Beratungsgesprächen im schulischen Kontext, die Motivation und auch die Affinität der Studierenden zur eingesetzten Technologie. Methode Im Sommersemester 2023 erfolgte eine erste Pilotierung mit N= 15 Lehramtsstudierenden. (Alter: M= 25.4 Jahre, SD = 3.40 Jahre; Geschlecht: 86.7% weiblich, 13.3% männlich; Studiengänge: 13.3% Lehren und Lernen (B.A.), 13.3% Sozialpädagogik (B.A.), 6.7% Lehramt an Haupt- und Realschulen (M.Ed.), 66.7% Lehramt an Grundschulen (M.Ed.) mit verschiedenen Fächerkombinationen. 60% der Probandinnen hatten zuvor keine Vorerfahrung bezüglich VR und lediglich 13.3% bereits Erfahrungen mit Elterngesprächen. Vorbereitend bekamen die Studierenden eine Fallvignette mit Informationen über das zu führende Elterngespräch. Sie tauchten dann mittels einer VR-Brille in ein 3D-180°-virtuelles Klassenzimmer ein, um ein problemorientiertes Beratungsgespräch mit einer virtuellen Elternfigur zu führen. Die Durchführung fand videobasiert statt und die virtuelle Elternfigur, die durch eine professionelle Schauspielerin dargestellt wurde, wurde mittels Auswahl des geeigneten Videos durch die Versuchsleitung gesteuert. Zur Beantwortung der Forschungsfrage nach den Wirkungen des VR-Trainings wurde eine Pre- und Postbefragung der Studierenden durchgeführt. In beiden Fragebögen wurde die Selbsteinschätzung erhoben, u.a. zur Beratungskompetenz (Kücholl et al., 2018), Angst (McCarthy und Goffin, 2004), Selbstwirksamkeitserwartung (Kücholl et al., 2018), Motivation und zur Affinität zu Technologie (Franke et. al, 2019). Ergebnisse und Diskussion Zur Überprüfung der Veränderungen durch das VR-Training im Pre-Post-Vergleich wurden Wilcoxon- Tests durchgeführt, um die Wirkung des Trainings auf die Beratungskompetenz, die Angst, die Selbstwirksamkeitserwartung, die Motivation und Affinität zu Technik der Probandinnen zu überprüfen. Die Beratungskompetenz insgesamt stieg über die Messzeitpunkte bedeutsam an (Mdn1 = 4.64, Mdn2 = 4.81, z = -2.21, p = .027), was auf die signifikanten Veränderungen bezogen auf die Problemlöse- und Bewältigungskompetenzen zurückgeht, sich aber nicht in gleicher Weise für die Subskalen Kommunikations- und Diagnostikkompetenzen zeigte. Im Vergleich der Messzeitpunkte vor und nach dem VR-Training ging die Angst bezogen auf Elterngespräche bedeutsam zurück (Mdn1 = 3.00, Mdn2 = 2.14, z = -2.59, p = .009). Auch bezüglich der Selbstwirksamkeitserwartung in Bezug auf Elterngespräche zeigten sich zum zweiten Messzeitpunkt bedeutsame Zuwächse (Mdn1 = 4.33, Mdn2 = 5.00, z = - 2.06 , p = 0.039). Die Studierenden zeigten eine sehr hohe Motivation (Mdn1 = 5.75, Mdn2 = 5.75), die sich über das Training hinweg nicht bedeutsam veränderte. Ein tendenzieller Zuwachs hingegen war für die Affinität zu Technologie durch das VR-Training zu verzeichnen (Mdn1 = 2.80, Mdn2 = 3.60, z = - 1.85 , p = 0.063). Im Vortrag werden die Ergebnisse der Pilotierung vorgestellt und die Auswirkungen des VR-Trainings auf die Beratungskompetenz und Wahrnehmungen im Hinblick auf die Beratung im Kontext von Elterngesprächen diskutiert und die potentielle Bedeutung von VR für die Lehrkräftebildung reflektiert. Zusammenhänge zwischen Immersions- und Authentizitätserleben, Emotionen und Selbstwirksamkeitsüberzeugungen hinsichtlich der Integration von VR-Anwendungen bzw. 3D-Modellen im Unterricht Anne Schlosser¹, Jennifer Paetsch², Theresia Witt¹, Ilona Maidanjuk¹, Karl-Heinz Gerholz¹, Tino Lindner¹ ¹Universität Bamberg, Deutschland, ²Universität Potsdam, Deutschland Theoretischer Hintergrund und Fragestellung Durch ihren immersiven Charakter und die Möglichkeit der Interaktion bieten virtuelle Realitäten (VR) vielfältige Anwendungsmöglichkeiten in Lehr- und Lernumgebungen (z. B. Huang et al., 2021). Empirische Ergebnisse zeigen die Wirksamkeit VR-basierter Trainingseinheiten auf den Lerngewinn (z. B. Lei et al., 2021) und auf die Selbstwirksamkeit von Studierenden (z. B. Wiepke 2022). Ein Ziel der Lehrkräftebildung ist zudem, (angehende) Lehrkräfte zum Umgang und Einsatz der VR Technologie zu befähigen, damit solche Lehr-Lernarrangements im Unterricht von ihnen angewendet werden können (z. B. Doll & Meyer, 2021; Huang et al., 2021). Ziel des vorliegenden Forschungsvorhabens ist es, im Kontext von VR- (Erkundung mit der VR-Brille) und 3D-basierten Lernumgebungen (Erkundung über die Bildschirmansicht, z. B. PC), die Veränderung der Selbstwirksamkeit hinsichtlich der Technologie-Integration in den eigenen Unterricht bei angehenden Lehrkräften zu untersuchen. Die Umgebungen stellen Use-Cases für den Religionsunterricht und den beruflichen Fachunterricht dar und wurden in regulären Lehrveranstaltungen eingesetzt. Basierend auf dem Selbstwirksamkeitsmodell nach Bandura (1997) kann davon ausgegangen werden, dass Lernende von authentischen Erfahrungen profitieren und auch emotionales Erleben eine Quelle der Entwicklung von Selbstwirksamkeit darstellt. Mithilfe neuer Technologien können authentische Erfahrungen oder zumindest die Annäherung an authentische Erfahrungen in universitären Lehrveranstaltungen unterstützt werden. Diesbezüglich spielt das Präsenzerleben eine entscheidende Rolle, welches u.a. durch Immersionserleben beeinflusst wird (z. B. Huang et al., 2021; Tcha-Tokey et al., 2016). Demzufolge stellt sich die Frage, inwieweit VR-Anwendungen und 3D-Modelle die Chance bieten, authentische Erfahrungen in die Hochschullehre zu integrieren und somit die Selbstwirksamkeit zur Integration von VR-Anwendungen und 3D-Modellen in den eigenen Unterricht fördern. Folgende Hypothesen werden untersucht: Hypothese 1: (a) Immersionserleben und (b) Authentizitätserleben sind in der VR-Erkundung ausgeprägter als in der 3D-Erkundung (Posttest). Hypothese 2: Selbstwirksamkeitserwartungen zur unterrichtlichen Integration sind in der VR-Erkundung höher als in der 3D-Erkundung (Posttest). Hypothese 3: Immersion, Authentizitätserleben, Emotionen und Selbstwirksamkeit korrelieren signifikant miteinander (Posttest). Hypothese 4: (a) Authentizitätserleben und (b) Emotionen erweisen sich als signifikante Prädiktoren der Veränderung der unterrichtsbezogenen Selbstwirksamkeit, unter Kontrolle der unterrichtsbezogenen Selbstwirksamkeit im Prätest sowie der selbsteingeschätzten digitalen Kompetenzen. Methode Im Sommersemester 2023 nahmen insgesamt 37 Lehramtsstudierende (Theologie oder Wirtschaftspädagogik) an den Lehrveranstaltungen (Intervention) teil, wobei 24 sowohl am Prä- als auch am Posttest teilnahmen. Insgesamt sind 18 Teilnehmende der VR-Bedingung (48,6%) und 19 Teilnehmende der 3D-Bedingung (51,4%) zuzuordnen (Selbstselektion in die Seminare). Die Studierenden sind im Mittel 25,6 Jahre alt (SD=7.4) und befinden sich im 5. Semester (M=4.5, SD=1.8). Zur Überprüfung der Hypothesen wurden folgende Instrumente verwendet: Selbstwirksamkeit im Hinblick auf die unterrichtliche Integration digitaler Technologie (αpre=.85; αpost=.86; adaptiert Doll & Meyer, 2021); Immersion (αpost=.82; selbstentwickelte Items, vgl. Gerwens, 2018); Authentizitätserleben (αpost=.82; adaptiert nach Gulikers, 2006), Emotionsgitter (1-Item-Skala; Russel et al., 1989); selbsteingeschätzte digitale Kompetenzen (Subskala Unterrichten und Implementieren αpre=.51, αpost=.57; Subskala Analysieren und Reflektieren αpre=.62, αpost=.57; Subskala Problemlösen und Handeln αpre=.74, αpost=.71; Subskala Produzieren und Präsentieren αpre=.92, αpost=.92; Subskala Kommunizieren und Kollaborieren αpre=.62, αpost=.85; Rubach & Lazarides, 2019). Vorläufige Ergebnisse Die Ergebnisse zeigen, dass sowohl Immersionserleben (Mann-Whitney-U-Test: U=9.5, Z=-4.1, p<.001) als auch Authentizitätserleben (Mann-Whitney-U-Test: U=31.5, Z=-3.1, p=.002) in der VR-Umgebung (MImmersion=6.0, SD=.67; MAuthentizität=3.83, SD=1.06) ausgeprägter ist als in der 3D-Umgebung (MImmersion=4.6, SD=.77; MAuthentizität=3.25, SD=1.4). Hinsichtlich der Selbstwirksamkeitserwartung zeigen sich vergleichbare Werte im Posttest (MVR=3.6, SD=.88; M3D=3.44, SD=.79). Korrelationsanalysen zeigen, dass zum einen Immersion signifikant mit Authentizitätserleben (r=.65, p<.001) und emotionaler Valenz (r=.64, p<.001) korreliert, zum anderen korreliert Authentizitätserleben mit emotionaler Valenz (r=.60, p<.001) und emotionalem Arousal (r=.63, p<.001) signifikant. Es zeigen sich keine signifikanten Zusammenhänge der Konstrukte Emotion, Immersion und Authentizität mit Selbstwirksamkeit (p=1). Weitere Analysen stehen noch aus. Die Ergebnisse werden vor dem Hintergrund der Selbstwirksamkeitstheorie (Bandura, 1997) sowie einschlägiger Theorien zu Virtual Reality (z. B. Huang et al., 2021; Tcha-Tokey et al., 2016) diskutiert.
13:10 - 14:50	2-03: Making teaching tangible for student teachers through core practices: Current findings and theoretical developments Ort: H03
	Symposium Making teaching tangible for student teachers through core practices: Current findings and theoretical developments Chair(s): Matthias Nückles (Universität Freiburg, Deutschland), Marc Kleinknecht (Leuphana Universität Lüneburg) Diskutantin(nen): Kathleen Stürmer (Universität Tübingen) During the last two decades, research on teacher education in Europe and the US has undergone a “competence turn” in which the question of how future teachers can develop competencies that allow them to act flexibly and adaptively in the classroom, has become a focal point of interest. Whereas in German speaking countries empirical educational research has mainly concentrated on the assessment of cognitive and affective-motivational dispositions as prerequisites of teaching performance (e.g., Baumert et al., 2010), and on abilities to notice and interpret classroom situations (e.g., Seidel & Stürmer, 2014; Sherin & van Es, 2009), the practice-based teacher education movement in the US (Grossman et al., 2009, McDonald et al., 2013) has spawned concrete theoretical ideas of how teaching performance can be fostered. Specifically, the notion of core teaching practices has been suggested around which teacher education and professional development may be organized. A major strength of the core practices concept is that the concrete and situated demands of teaching come into focus which is likely a much more fruitful starting point for educating novice teachers than high-level abstractions from educational effectiveness research such as “cognitive activation” or “supportive climate” (e.g., Fauth et al., 2014; Klieme et al., 2009). The latter have recently become popular in teacher training and data-driven development of teaching quality in German speaking countries. Following Grossman et al. (2009, see also McDonald et al., 2013) core practices can be conceived of as structured sequences of instructional activities which are essential to the teaching profession. Accordingly, core practices typically occur with a high frequency in teaching (e.g., giving explanations, eliciting and responding to students’ ideas) and are relevant for different curricula and subjects. Core practices are not* simple teaching behaviors (such as “post-question wait time” see, Brophy & Good, 1986) as they have been investigated in early process-product research on teacher effectiveness (Berliner, 1989). Rather, core practices are holistic activities with a certain level of complexity. Despite their complexity, however, proponents of practice-based teacher education claim that novices can master them at a basic level early in their teacher studies. Following McDonald et al. (2013), core practices should ideally be research-based, that is, educational research can offer evidence-based recommendations of how a specific core practice should be enacted in concrete teaching situations in order to affect student behaviour or student learning positively. This symposium brings together researchers from four different countries – the US, Switzerland, the Netherlands, and Germany – with backgrounds in teacher education, medical education, empirical educational research and educational psychology. The symposium starts with two theoretical contributions followed two empirical contributions that feature quasi-(experimental) intervention studies. Fraefel and Grossman present a theoretical paper in which they characterize the core practice concept from the perspectives of philosophical pragmatism, sociocultural theory, and activity theory. Van der Schaaf compares the concept of core practices in teacher education with the concept of entrustable professional activities in medical education by discussing commonalities and differences between both concepts. Klaß, Calcagni and Gröschner present a quasi-experimental intervention study in which they contrast a learning environment for student teachers based on video modelling with a learning environment based on a teaching simulation experience. Hipp, Holstein, Kleinknecht and Nückles present an experimental intervention study in which they investigated which phases a core practice training should be composed of to foster teacher students’ acquisition of core practices best. Together, the four contributions shed a multidisciplinary and multifaceted light on the concept of core practices by highlighting both high-stakes empirical research as well as innovative theoretical perspectives on the core practices approach. Beiträge des Symposiums Considerations on the theoretical underpinnings of the core practice approach Urban Fraefel¹, Pam Grossman² ¹Pädagogische Hochschule FHNW, ²University of Pennsylvania The approach of Core Practices, as it has been conceptualized in the USA, is also attracting increasing attention in Europe. However, it has become apparent that the definitions of practice are often far apart, not only in terms of their theoretical framing, but also in terms of their specific manifestation, their function in the teaching profession, and their acquisition. This presentation addresses, on the one hand, the commonalities and differences of the concept of core practices with some theoretical approaches, focusing on theoretical perspectives that are fundamental to the concept of core practices in different national and historical contexts. Theories of practice, which see practices as the irreducible units of all social and, according to the German sociologist Reckwitz (2002, p. 249), "a routinized type of behavior," differ from theoretical approaches that locate the social, for example, at the level of individual mental and physical activities or interactions. Drawing on Bourdieu (1977) and Schatzki (1996, 2012), among others, practice theories as a basis for analyzing and understanding social practices have also found strong reception in the fields of teaching and teacher education in recent years in the German-speaking world, especially from a structural theory perspective (e.g., Bohnsack, Bonnet & Hericks, 2022). As insightful as practice-theoretical approaches may be for understanding social practices, they make little contribution to the learning of practices as well as to transforming existing practices into normatively desirable ones. Here, pragmatism (Dewey, 1933, 1938) as well as sociocultural and activity theory (e.g., Vygotsky, 1978; Wertsch, 1979, 1991; Lave, 2019) prove more fruitful especially with regard to learning core teacher practices that are central to teaching and educational impact on students: Inherent in Deweyan pragmatism is problem solving and improving unsatisfactory situations, and the concept of "guided participation" (Rogoff, 1990), based on the foundations of the sociocultural approach, also proves effective in learning practices in teacher education. In the German-speaking world, the approach of teachers' core practices has to be distinguished from the prevalent conceptualization of competencies on the one hand and from the idea of mere routines on the other. Whereas competencies were discussed around the turn of the millennium as a construct that integrates knowledge, skills, and action even under complex conditions (Weinert, 2001; Oser, 2003), in the reality of German teacher education it has been largely reduced to the cognitive knowledge components (Baumert & Kunter, 2006), and the achievement of professional performance (Blömeke, Gustafsson & Shavelson, 2015) as a learning focus plays a rather subordinate role in teacher education reality. Furthermore, the concept of core practices clearly distinguishes itself from the notion of acquiring decontextualized routines, especially from pure training forms of isolated skills such as the microteaching of the 1970s (Cooper & Allen, 1970); in contrast, core practices aim at adaptive professional action in complex situations (e. g. e.g., Ghousseini, Beasley & Lord, 2015). The theoretical framework of pragmatism, sociocultural theory, and activity theory explains that the fleshing out, learning, and acquisition of core practices is a collective activity, for which a number of teacher education practices have been developed recently (e.g., Grossman et al., 2009; McDonald, Kazemi & Kavanagh, 2013). In the symposium, reference will be made to some of these practices and their theoretical background, and implications for research and development will be discussed. Comparing core practices and entrustable professional activities in teacher and medical education Marieke van der Schaaf University Medical Center Utrecht In this contribution the focus is on comparing the concepts of Core Practices (CPs) in teacher education and Entrustable Professional Activities (EPAs) in health professions education, with the aim of understanding their development and positioning in curricula. The alignment of educational programs with the development of future professionals' expertise is crucial to facilitate students' growth. We seek to identify both the differences and similarities in how task-units within these programs are structured and utilized. The development of professional expertise is characterized by the adaptation of individuals to the demands of their respective tasks. This adaptation implies that people “restructure, reorganize, and refine their representation of knowledge and procedures for efficient application to their work-a-day environment” (Feltovich, Prietula & Ericsson, 2006, p. 57). It can be accelerated through a cyclical process of task improvement (cf. Ericsson et al., 1993). CPs in teacher education and EPAs in medical education both represent units of professional practice. However, there are several differences. CPs emphasize pre- and post-lesson activities, including planning and reporting (Grossman et al., 2009), while EPAs primarily describe activities during medical practice, such as basic medical procedures (Ten Cate & Scheele, 2007). Further, EPAs assess the level of supervision a learner requires in the workplace, determining their autonomy, whereas teacher education students teach as autonomous teachers, with supervisors present only occasionally. Also, healthcare settings involve short encounters between trainees and various supervisors, while teacher education features longer and more uniform interactions with single supervisors, including observations and activities outside the classroom. Despite these differences, CPs and EPAs share certain commonalities. Both are designed as units of professional practice, serving as building blocks in flexible curricula. Their development involves co-creation with stakeholders from practice rather than a top-down approach. Various methods, including delphi studies, site visits, and meetings with field experts, are used to ensure alignment with the dynamic nature of specific curricula. Both CPs and EPAs offer flexibility for professionals to set their own learning goals and adapt their learning processes, although, the case of EPAs, they remain standardized components that need to be incorporated into the curriculum. This contribution highlights the need for further research to gain insight into how CPs and EPAs impact students' development as future professionals. Qualitative approaches that explore students' perceptions of these concepts and their influence on development should be pursued. While CPs and EPAs have the potential to contribute to curriculum flexibility, they may not automatically align with how professionals as learners develop in the workplace context. In summary, this contribution delves into the comparison of Core Practices (CPs) in teacher education and Entrustable Professional Activities (EPAs) in medical education, shedding light on their development and utilization. While both concepts share commonalities in terms of being units of professional practice, there is a lack of understanding of their impact on students' development. We suggest the need for further research in this area. Additionally, it acknowledges the differences in content and context between these two concepts, highlighting the importance of tailoring them to specific curricula and workplace environments. Fostering classroom dialogue as core practice in teacher education: the role of different learning designs during a field experience Susi Klaß, Elisa Calcagni, Alexander Gröschner Friedrich-Schiller-Universität Jena Theoretical background Core practices occur frequently in teaching, are evidence-based, contribute to student learning and can be analytically decomposed to make them accessible to students in teacher education (Grossman et al., 2009). The question of how core practices can be implemented in preservice teacher education, is increasingly being researched in Germany and has been linked to optimizing students’ practicum experiences (Schellenbach-Zell & Hartmann, 2022). In this paper, we present ongoing research on core practices conducted in the Learning-to-Teach-Lab: Science (LTL:S), a university classroom equipped with video cameras, a control and observation room and in-ear microphones. The LTL:S is conceived as a learning and research setting emphasizing evidence-based learning opportunities (Gröschner et al., 2022). Based on the assumption that classroom discourse can be defined as the core of the teachers’ instructional activities, the focus in LTL:S is on modeling productive classroom dialogue (Gröschner et al., in press). In this setting, we developed a practice-based cycle that involves students’ learning, trailing and reflecting on discursive practices during their practicum supported by an accompanying university course (McDonald et al., 2013). In it, a key learning experience consists of representing practices through classroom videos. In this study, we replaced this with a teaching simulation in the LTL:S to bring students closer to practice. Our aim is to compare the two learning designs in terms of students’ relevant knowledge, the intention to implement and perceived relevance of the course. Research question How do student teachers assess their understanding and the applicability of productive classroom dialogue depending on the learning condition? Methods We conducted a quasi-experimental study to investigate how students perceive and benefit from different learning experiences through a newly developed “approximation” approach involving role-play simulations followed by immediate video analysis compared to external video analysis only. N=159 students participated in two introductory sessions and were randomly assigned to two groups with a 3-hour-long modeling task. Students in the control group (CG, n=58) participated in a seminar where they analyzed an external instructional video on productive classroom dialogue and reflected on it in small groups (Kleinknecht & Gröschner, 2016). Students in the intervention group (IG, n= 101), in contrast, conducted a videotaped simulation in the LTL:S seminar, where they tried out elements of productive classroom talk and reflected on their video. After these sessions, students in both groups were asked to complete a survey about their learning experiences. Results Three aspects were assessed: Knowledge about productive classroom dialogue (KPCD, α=.94), Intention to implement ( ItI, α=.88) and Perceived practical relevance (PPR, α=.92). Comparisons using t-test indicated differences in student teachers’ perceptions on all three scales in favor of the intervention group: KPCD: t(157) = 2.554, p =.012, MIG(101) = 4.54; MCG(58) = 4.11; ItI: t(157) = 2.979, p =.003, MIG(101) = 4.56; MCG(58) = 4.06; and PPR: t(157) = 4.455, p =.000, MIG(101) = 4.63; MCG(58) = 3.93. Discussion and Research outlook This first feasibility check study showed that the simulation condition yielded higher perceived knowledge, intentions and practical relevance. In an ongoing study, we delve deeper into how this learning situation can be optimized for students. Accordingly, we investigate how guidance and different levels of prompts for productive classroom dialogue promote students’ learning best. We focus on the role of reflection during the debriefing of each modeling session and ask: Are debriefing discussions more focused after a more structured simulation (compared to debriefing sessions without prompts)? Do students learn differently with different levels of prompting during simulations? First results of this study with N=108 students will also be shared and discussed in the symposium. How can the acquisition of core practices be optimally fostered? Hadmut Hipp¹, Anna Holstein², Marc Kleinknecht², Matthias Nückles¹ ¹Universität Freiburg, ²Leuphana Universität Lüneburg Theoretical background and research question Core practices have been proposed as a solution for the theory-practice gap in teacher education. They can be defined as domain-general, research-based teaching activities that appear in high frequency (McDonald et al., 2013). So far, there is no evidence-based consensus on how to structure teacher trainings to foster the acquisition of core practices best. Our DFG-funded research project ACTion addresses this question by bringing a prominent instructional approach to the teaching of core practices (i.e., the Learning Cycle, McDonald et al., 2013), with a prominent skill acquisition model from cognitive psychology (i.e., ACT-R theory, Anderson, 1982), in a dialogue. From this discussion, we conclude that core practice trainings should at least include the following phases: (1) a theory-based explanation, (2) a modelling, and (3) the opportunity to practice with students. Our project focuses on “supporting students’ self-regulated reading of scientific texts” as domain of practice, which is instantiated by the evidence-based reading strategy training “Reciprocal Teaching” (Palincsar & Brown, 1984). RT comprises three core practices: “giving explanations”, “cognitive modelling” and “adaptive scaffolding”. In an experimental intervention study, we compared different training sequences. We assumed that RT can be acquired best in a training that includes the phases of (1) studying a theoretical explanation of RT, (2) studying a modelling, and (3) practicing RT with students. Method Our sample consists of 128 preservice teachers. We used a four-group between-subjects design with different combinations of instructional phases. The first group studied a theory-based videotaped explanation of RT, followed by a videotaped modelling of RT and then practiced RT with students. Each of the other groups lacked one of the training phases. To keep time on task constant, in those conditions where one of the phases was omitted, one of the realized phases (e.g., theory-based explanation, modelling) was studied twice. In the condition where practicing with students was omitted, pre-service teachers composed a written reflection about the explanation and modelling videos. One week later, we administered (a) a paper-pencil knowledge test, (b) a professional vision test comprising four short staged videos (c) a performance test which was videotaped and subsequently coded. In the performance test, preservice teachers enacted RT with a small group of secondary school students. Results The knowledge test showed that the group who studied the theory-based explanation of RT twice and practiced RT with students performed significantly better than the other groups, F(1, 123) = 4.52, p = 0.04, η2 = .04. The professional vision test showed that groups who studied a theory-based explanation and a modelling video of RT performed significantly better than the groups who either studied a theory-based explanation or a modelling video, F(1, 124) = 7.78, p = .006, η2 = .06. Our preliminary performance data analyses (currently 18% of the sample) suggest that the group who underwent all three phases of the core practices training spent significantly more time on explaining, F(1, 18) = 7.63, p = .013, η2 = .30, and modelling RT, F(1, 18) = 15.89, p < .001, η2 = .48, than the other groups. Discussion Hence, somewhat qualifying our initial assumption, the results suggest that different compositions of instructional phases have different implications for levels of skill acquisition. Professional vision benefitted most from a combined studying of theory-based explanation and modelling. The ability to perform RT competently benefitted most from the combined studying of theory-based explanation, modelling and practicing with students. Thus, depending on the goal of teacher training (e.g., fostering analytical abilities versus performing a core practice competently), different compositions of training sequences might be promising.
13:10 - 14:50	2-04: Aktuelle Entwicklungen im Bereich des automatisierten Assessments: Zur computergestützten Analyse und Überarbeitung von schriftlichen und mündlichen Texten Ort: H02
	Symposium Aktuelle Entwicklungen im Bereich des automatisierten Assessments: Zur computergestützten Analyse und Überarbeitung von schriftlichen und mündlichen Texten Chair(s): Birgit Heppt (Humboldt-Universität zu Berlin, Deutschland), Jennifer Meyer (IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und der Mathematik) Diskutant*in(nen): Katrin Böhme (Universität Potsdam) Sprache ist in den Bildungsinstitutionen sowohl Lernmedium als auch Lerngegenstand und -ergebnis (vgl. Heppt & Schröter, 2023). So werden Lerninhalte sprachlich vermittelt, etwa durch sprachliche Aushandlungsprozesse im Unterrichtsgespräch oder anhand anspruchsvoller Sachtexte. Gleichzeitig besteht ein zentrales Lernziel von Schule und Unterricht darin, dass Schüler:innen nicht nur in der Unterrichtssprache Deutsch, sondern auch in mindestens einer Fremdsprache solide kommunikative Kompetenzen erwerben. Bis zum Ende der Sekundarstufe I sollen sie beispielsweise in der Lage sein, orthografisch und grammatisch korrekte englischsprachige Texte zu verfassen, die sowohl adressat:innengerecht gestaltet als auch logisch-kohärent aufgebaut sind (KMK, 2023). Die differenzierte Analyse schriftlicher und mündlicher Texte ist somit sowohl für Beschreibung sprachlicher Lerngelegenheiten als auch für die Bewertung und Beurteilung von Lernprodukten von Bedeutung. Herkömmliche Verfahren zur Textanalyse und -bewertung, wie Kodierungen sprachlicher Merkmale oder analytische Bewertungsverfahren, gehen jedoch mit einem erheblichen Ressourcenaufwand einher (z. B. Meyer et al., 2023). Computerlinguistische Methoden erlauben es demgegenüber, Textproduktionen automatisiert und differenziert zu analysieren und ihre Qualität zu bewerten. Überdies ermöglichen sie die Erfassung prozessbezogener Merkmale, die zu einem besseren Verständnis der Bearbeitung von Texten beitragen können. Ziel des Symposiums ist es, aktuelle Forschungsbefunde im Bereich des automatisierten Assessments komplexer Sprachproduktionen zusammenzutragen und im Hinblick auf zukünftige Potentiale zur Analyse und Förderung sprachlicher Kompetenzen zu diskutieren. Dabei verbindet das interdisziplinär ausgerichtete Symposium Expertise aus der Pädagogischen Psychologie, der Erziehungswissenschaft, der Computerlinguistik und der Sprachwissenschaft. Die drei empirischen Beiträge betrachten Sprachproduktionen entweder in ihrer Bedeutung als Lernmedium (Beitrag 1) oder als Lernergebnis (Beiträge 2 und 3) und setzen unterschiedliche computerlinguistische Maße ein: Während die Beiträge 1 und 2 auf die linguistische Komplexität von Sprachproduktionen fokussieren und diese als Zielvariable berücksichtigen, nimmt Beitrag 3 mithilfe computerlinguistischer Auswertungen den Überarbeitungsprozess schriftlicher Textproduktionen in den Blick. Als Ansatzpunkte zur Förderung (produktiver) sprachlicher Kompetenzen werden sowohl die Rolle der Lehrkraft (Beitrag 1) als auch die Effektivität automatisierten Feedbacks mithilfe computerlinguistischer Merkmale (Beitrag 3) adressiert. In Studie 1 dienen ausgewählte Merkmale der linguistischen Komplexität (z. B. lexikalische Vielfalt) als differenzierte Zielvariable, um die Effektivität einer Lehrkraftprofessionalisierung im Bereich Sprachbildung bei Grundschullehrkräften zu überprüfen. Dabei wurde anhand von 50 Unterrichtstranskripten computerlinguistisch analysiert, inwiefern die mündliche Unterrichtssprache von Lehrkräften der Experimentalgruppe (EG) nach der Teilnahme an einer Fortbildung im Vergleich zu einer Kontrollgruppe (KG) eine höhere sprachliche Komplexität aufwies. Zwar sprachen Lehrkräfte der EG zunächst insgesamt mehr als Lehrkräfte der KG; unter Berücksichtigung der Textmenge bestanden jedoch nur vereinzelt Gruppenunterschiede in der sprachlichen Komplexität. Auch in Beitrag 2 wird die linguistische Komplexität zur Messung der sprachlichen Qualität von Textproduktionen eingesetzt. Ziel ist es, die linguistische Komplexität schriftlicher Abiturleistungen im Fach Englisch in Abhängigkeit von den inhaltlichen und sprachlichen Anforderungen der Aufgaben zu analysieren. Die computerlinguistische Analyse der Englischaufsätze von 362 Abiturient:innen zeigt, dass die sprachliche Komplexität der Texte in Abhängigkeit von den Aufgabenmerkmalen variiert und dass bei Textformen mit höheren Anforderungen an die sprachliche Selbstständigkeit besonders starke Zusammenhänge zwischen der sprachlichen Komplexität und den Schulnoten im Fach Englisch bestehen . In Beitrag 3 schließlich werden, ähnlich wie in Beitrag 1, linguistische Merkmale als Indikatoren für die Wirksamkeit einer Intervention analysiert. Im Falle von Beitrag 3 handelt es sich bei der Intervention um automatisiertes Feedback, welches Schüler:innen der Sekundarstufe I dabei unterstützen sollte, ihre englischsprachigen Texte zu überarbeiten. Die experimentelle Studie zeigt, dass anhand der computerlinguistischen Indikatoren das Ausmaß der Veränderungen am Text operationalisiert und damit die Leistungsverbesserung in der Textüberarbeitung erklärt werden kann. In der abschließenden Diskussion der drei Beiträge durch eine Expertin in den Bereichen Sprachdiagnostik und Sprachförderung sowie Digitalisierung werden zukünftige Potentiale und Herausforderungen im Bereich des automatisierten Assessments sprachproduktiver Leistungen aufgezeigt. Beiträge des Symposiums Sprachlicher Input im naturwissenschaftlichen Sachunterricht der Grundschule: Bedeutung einer Professionalisierungsmaßnahme für die mündliche Unterrichtssprache von Lehrkräften Birgit Heppt¹, Denise Löfflad², Sofie Henschel³, Katrin Gabler⁴, Ilonca Hardy⁵, Detmar Meurers² ¹Humboldt-Universität zu Berlin, ²Eberhard Karls Universität Tübingen, ³Institut zur Qualitätsentwicklung im Bildungswesen (IQB), ⁴Freie Universität Berlin, ⁵Goethe-Universität Frankfurt am Main Qualitativ hochwertige fachliche Instruktionsprozesse bieten das Potenzial, sowohl die fachliche als auch die sprachliche Lernentwicklung von Schüler:innen zu unterstützen. Von zentraler Bedeutung ist hierbei das realisierte Sprachangebot. So belegen empirische Studien die Relevanz fachsprachlicher Äußerungen der Fach- bzw. Lehrkraft für den fachlichen Lernzuwachs der Schüler:innen (z. B. Studhalter et al., 2021); gleichzeitig trägt ein reichhaltiger sprachlicher Input bedeutsam zur sprachlichen Kompetenzentwicklung bei (z. B. Kane et al., 2023). Inputtechniken, bei denen Lehrkräfte als Sprachvorbilder bewusst auf einen differenzierten, korrekten und anregungsreichen sprachlichen Input achten (z. B. durch handlungsbegleitendes Sprechen), gelten daher als wirkungsvolles Element sprachlicher Bildung (z. B. Gabler et al., 2020). Neben einer Reihe weiterer Sprachfördertechniken (z. B. sprachanregende Fragen, korrektives Feedback) bildeten sie einen wesentlichen Bestandteil einer Professionalisierungsmaßnahme, in der Grundschullehrkräfte zur fachbezogenen Sprachbildung im Sachunterricht der Grundschule fortgebildet wurden (Authors, 2020). Die Professionalisierung trägt nachweislich zum Wissen der fortgebildeten Lehrkräfte im Bereich Sprachbildung bei und schlägt sich in ausgewählten Aspekten des sprachbildenden Unterrichtshandelns nieder (z. B. Authors, 2022a). Offen ist jedoch, ob sich Lehrkräfte der Experimentalgruppe (EG) auch hinsichtlich der Quantität und Qualität des mündlichen Sprachgebrauchs von Lehrkräften der (KG) unterscheiden. Pädagogisch-psychologische Studien, die die mündliche Sprache von Lehrpersonen untersuchen, basieren in der Regel auf aufwendigen Kodierungen ausgewählter sprachlicher Teilbereiche (z. B. Dokter, Aarts, Kurvers, Ros & Kroon, 2017) oder auf Ratings des sprachlichen Anregungsniveaus (z. B. Classroom Assessment Scoring System [CLASS]; Pianta, La Paro & Hamre, 2008). Computerlinguistische Verfahren ermöglichen es demgegenüber, (transkribierte) Texte hinsichtlich einer Vielzahl sprachlicher Merkmale automatisiert zu analysieren und Unterschiede im Sprachgebrauch somit zeitökonomisch zu bestimmen. Vor diesem Hintergrund wird in dem vorliegenden Beitrag unter Rückgriff auf computerlinguistische Analysen überprüft, ob die mündliche Unterrichtssprache der EG-Lehrkräfte anregungsreicher und anspruchsvoller ist als die der KG-Lehrkräfte. Im Rahmen des Projekts waren Lehrkräfte beider Gruppen (nEG = 8, nKG = 17) zunächst für die Umsetzung ausgearbeiteter Curricula zu den Themen „Schwimmen und Sinken“ (6 Doppelstunden) und „Verdunstung und Kondensation“ (5 Doppelstunden) fortgebildet worden. EG-Lehrkräfte nahmen zusätzlich an einer Professionalisierung zur fachbezogenen Sprachbildung teil, in der die Grundlagen des Scaffolding-Ansatzes nach Gibbons (2002) exemplarisch anhand des Schwimmen und Sinken-Curriculums erarbeitet wurden. Anschließend unterrichteten EG- und KG-Lehrkräfte beide Themen im regulären Sachunterricht der dritten Jahrgangsstufe. Dabei wurde jeweils die zweite Doppelstunde gefilmt und in wesentlichen Teilen transkribiert. Die insgesamt 50 Transkripte (2 je Lehrkraft und Klasse) wurden anschließend mithilfe der Software Common Text Analysis Platform (CTAP; Chen & Meurers, 2016) computerlinguistisch analysiert, wobei vor allem sprachliche Merkmale berücksichtigt wurden, die in der Fortbildung oder den Curricula fokussiert worden waren (z. B. lexikalische Vielfalt). Die Analysen weisen darauf hin, dass Lehrkräfte der EG während des ersten Unterrichtsthemas (Schwimmen und Sinken) insgesamt mehr sprachen als Lehrkräfte der KG (Anzahl der Types/Tokens/Sätze: d = 1.34/2.38/1.19). Unter Berücksichtigung der Gesamtmenge an sprachlichem Input war ihr mündlicher Sprachgebrauch jedoch nur vereinzelt durch erhöhte sprachliche Elaboriertheit gekennzeichnet. So verwendeten sie beispielsweise mehr Wörter mit mindestens drei Silben (d = 0.93), einem Indikator für morphologische Komplexität. Beim zweiten Unterrichtsthema (Verdunstung und Kondensation) unterschieden sich EG- und KG-Lehrkräfte nicht in der Menge an mündlicher Unterrichtssprache (Anzahl der Types/Tokens/Sätze: d = 0.25/-0.12/-0.01). Zwar zeichnete sich in der korrigierten Type/Token-Ratio eine größere lexikalische Vielfalt im Sprachgebrauch der EG-Lehrkräfte ab (d = 0.74), diese fand sich jedoch in keinem anderen Merkmal der lexikalischen Vielfalt wieder. Auch in den weiteren sprachlichen Komplexitätsmerkmalen bestanden keine Gruppenunterschiede. Insgesamt deuten die Befunde somit darauf hin, dass sich die Teilnahme an der Professionalisierungsmaßnahme nur in geringem Maße im mündlichen Sprachgebrauch der Lehrkräfte niederschlägt und dass sich die Effekte in Abhängigkeit vom Unterrichtsthema unterscheiden. Die Befunde werden mit Blick auf Leistungsunterschiede in den teilnehmenden Klassen und adaptive Unterrichtsgestaltung diskutiert. Zum Zusammenspiel von Aufgabenmerkmalen, Sprachkompetenz und sprachlicher Komplexität von Textproduktionen im Englisch-Abitur Anja Riemenschneider¹, Zarah Weiss², Pauline Schröter¹, Detmar Meurers² ¹Institut zur Qualitätsentwicklung im Bildungswesen (IQB), ²Eberhard Karls Universität Tübingen Sprachliche Eigenschaften von Textproduktionen hängen von vielen Faktoren ab, wie dem Thema und der Art des Schreibanlasses, Genrekonventionen und der individuellen Sprachkompetenz (Biber & Gray, 2010; Kuiken & Vedder, 2019). Eine besondere Rolle spielen Merkmale der Aufgaben, die im Fremdsprachenunterricht oft funktional relevante Textproduktionen hervorrufen sollen (Michel et al., 2019). Wenig Aufmerksamkeit wurde bisher dem Zusammenspiel von Aufgabenmerkmalen und der Sprachkompetenz der Lernenden geschenkt, obwohl anzunehmen ist, dass Aufgaben sich in den mit ihnen verbundenen Möglichkeiten zur sprachlichen Entfaltung unterscheiden. Dies ist besonders relevant im Hinblick auf Prüfungen in den Fremdsprachen, die die Sprachkompetenz der Teilnehmenden in ihrer vollen Breite abbilden sollten. Zur Messung sprachlicher Leistungen werden in der Forschung zum Zweitspracherwerb die Aspekte der sprachlichen Komplexität, der Akkuratheit und der Flüssigkeit genutzt. In der schriftsprachlichen Produktion sind besonders die Akkuratheit und die sprachliche Komplexität relevant, die auch für Rückschlüsse auf die Sprachkompetenz genutzt werden (Kuiken & Vedder, 2019). In der schriftlichen Englisch-Abiturprüfung werden die Anforderungsbereiche I-III abgedeckt, die einen ansteigenden Grad an Selbstständigkeit von den Schüler:innen fordern. Dies bezieht sich laut den Bildungsstandards für die Allgemeine Hochschulreife zum einen auf inhaltliche Aspekte (z. B. Umgang mit Methode und eingebrachte Ideen), zum anderen auf sprachliche Aspekte, wobei die Eigenständigkeit diesbezüglich nicht weiter spezifiziert wird (KMK, 2012). Prüflinge erhalten eine Textvorlage mit drei Aufgaben, die die Anforderungsbereiche wiederspiegeln sollen. Für unsere Studie haben wir die Englisch-Abituraufgaben hinsichtlich ihres Aufgabentyps (Aufgabe 1: Zusammenfassung, Aufgabe 2: Analyse, Aufgabe 3: Argumentation), ihrer geforderten inhaltlichen Selbstständigkeit (Aufgabe 1: gering, Aufgabe 2: hoch, Aufgabe 3: hoch) und ihrer geforderten sprachlichen Selbstständigkeit (Aufgabe 1: gering, Aufgabe 2: gering, Aufgabe 3: hoch) charakterisiert, wobei wir sprachliche Selbstständigkeit als Distanz zur Textvorlage interpretiert haben. Im vorliegenden Beitrag haben wir Abituraufsätze von 362 Prüflingen computerlinguistisch analysiert und getestet, ob sie sich hinsichtlich ihrer sprachlichen Komplexität im Bezug zu Aufgabenmerkmalen (Aufgabenart und geforderte sprachliche Selbstständigkeit) unterscheiden und ob die Abituraufgaben die Sprachkompetenz der Schüler:innen (gemittelte Semesternoten der Qualifikationsphase im Fach Englisch) unterschiedlich breit abbilden. Da von jedem Prüfling Texte zu drei Aufgaben produziert wurden, eignen sich die Daten sowohl für Between- als auch für Within-Subjects-Vergleiche. Die Komplexitätsanalyse wurde anhand einer umfassenden Operationalisierung unter Einbezug von 54 Komplexitätsmaßen aus verschiedenen linguistischen Domänen mithilfe der Common Text Analysis Platform (Chen & Meurers, 2016) durchgeführt. Die Ergebnisse unserer Mixed-Effects-Modelle zeigen, dass sich die Komplexität der Textproduktionen hinsichtlich der mit den Aufgaben verbundenen funktionalen Erfordernisse unterscheidet – sowohl quantitativ in der Anzahl der Maße als auch qualitativ in den sprachlichen Eigenschaften, die jeweils im Vergleich zu den anderen Aufgaben stärker ausgeprägt waren. In den Prüflingstexten zu Aufgabe 1 (Zusammenfassung) waren 13 Komplexitätsmaße im Vergleich zu den anderen beiden Aufgaben am höchsten ausgeprägt, die auf eine kompakte, inhaltlich dichte Sprachverwendung hindeuten(z. B. lexikalische Dichte, Wortlänge, Komplexität der Nominalphrasen). In Textproduktionen zu Aufgabe 2 (Analyse) war mit 20 Maßen im Vergleich zu den anderen beiden Aufgaben die höchste Anzahl an Maßen am komplexesten ausgeprägt, unter anderem die lexikalische Variabilität, die Textlänge und die klausale Komplexität. In Prüflingstexten zu Aufgabe 3 (Argumentation) war die geringste Anzahl an Maßen stärker ausgeprägt als in den anderen beiden Aufgaben (u. a. lexikalische Diversität, Modifizierer), diese zeigten eine variable und beschreibende Sprachverwendung an. Für alle Aufgaben wurde ein signifikanter Zusammenhang zwischen der Sprachkompetenz der Schüler:innen und der sprachlichen Komplexität ihrer Textproduktionen gemessen. Dieser Zusammenhang verstärkte sich in Aufgabe 3, vor allem bezogen auf Maße der lexikalischen Komplexität. Die Ergebnisse deuten darauf hin, dass vor allem Aufgaben, die eine hohe sprachliche Selbstständigkeit erfordern, zur differenzierten Erfassung von Sprachkompetenz geeignet sind. Die Befunde liefern außerdem Einsichten dazu, welche sprachlichen Aspekte durch welche Aufgabentypen verstärkt hervorgerufen werden und können als Ausgangspunkt für geeignete Bewertungskriterien dienen. Prozesse bei der Textüberarbeitung sichtbar machen: Wie arbeiten Schüler:innen in der Sekundarstufe I mit automatisiertem Feedback? Ronja Schiller¹, Johanna Fleckenstein², Ute Mertens¹, Andrea Horbach², Jennifer Meyer¹ ¹IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und der Mathematik, ²Universität Hildesheim Automatisiertes Feedback kann positive Effekte auf die Schreibleistung zeigen (Graham et al., 2015; Fleckenstein et al., 2023), doch ein Verständnis zugrundeliegender Mechanismen dieser Feedbackeffekte ist zum jetzigen Zeitpunkt kaum vorhanden (Winstone & Nash, 2023). Eine naheliegende Annahme ist, dass Lernende höheres behaviorales Engagement bei der Textüberarbeitung zeigen – sich also aktiver mit der Überarbeitung eines Textes auseinandersetzen (Fredricks et al., 2004) –, wenn sie Feedback erhalten, wobei das gesteigerte behaviorale Engagement schließlich zu einer Verbesserung der Leistung führen sollte (z. B. De Miliano et al., 2017; Green et al., 2012). Um mit behavioralem Engagement verknüpfte Prozesse valide abbilden zu können, werden behaviorale Maße benötigt, die Schreibprozesse objektiv erfassen (Winstone & Nash, 2023). Diesbezüglich bietet die digitale Umsetzung experimenteller Studien die Möglichkeit, Log- und Prozessdaten mithilfe computer-linguistischer Methoden als Grundlage für objektive Maße von Verhaltensprozessen heranzuziehen (z. B. Leijten & Van Waes, 2013; Liu et al., 2015). Ziel unserer Arbeit ist es, mit Hilfe solcher Daten ein besseres und feineres Verständnis von Feedbackprozessen beim Schreiben zu gewinnen und vertiefende Erkenntnisse zu liefern, die für die Förderung von Schreibkompetenzen mit automatisieren Feedback in digitalen Lernumgebungen von hoher Relevanz sind. Konkret soll untersucht werden, ob und inwieweit behaviorales Engagement bei der Textüberarbeitung eine mediierende Rolle bei Feedbackeffekten auf die Leistungsverbesserung beim Schreiben einnimmt. Dabei wird angenommen, dass sich (a) die Schreibleistung stärker verbessert, wenn eine Schreibaufgabe mit Hilfe von Feedback überarbeitet wird als ohne Feedback und, dass (b) dieser angenommene positive Effekt von Feedback auf die Schreibleistung von behavioralem Engagement mediiert wird. Die Umsetzung unseres Experiments erfolgte im Rahmen einer Feldstudie an Schulen unter Verwendung eines digitalen Schreib-Tools. Die teilnehmenden Schüler:innen (N = 211; MAlter = 13.58, SDAlter = 0.94) wurden randomisiert einer Kontrollgruppe (KG) oder einer Feedbackbedingung (EG) zugewiesen und bearbeiteten zunächst eine Schreibaufgabe, bei der eine E-Mail auf Englisch verfasst werden sollte. Die Schreibleistung wurde Algorithmus-basiert hinsichtlich fünf zentraler Kriterien erfasst (1. Inhalt, 2. Betreffzeile, 3. Begrüßung/Abschied, 4. interpersonelle Dimension, 5. Sprachstil; Authors, 2022b; Authors, 2023). Anschließend an die erste Schreibaufgabe wurde die Schüler:innen gebeten, ihren Entwurf zu überarbeiten. Während die KG lediglich zur Überarbeitung aufgefordert wurde, wurde den Schüler:innen der EG zusätzlich automatisiertes elaboriertes Feedback zu ihrem ersten Entwurf angezeigt, das sie zur Textüberarbeitung nutzen konnten. Das Feedback enthielt Rückmeldungen zur Erfüllung der fünf Kriterien sowie Hinweise und Beispiele. Das behaviorale Engagement während der Textüberarbeitung wurde über drei Indikatoren erfasst. Dies waren zum einen die zur Überarbeitung genutzte Zeit – die Revisionszeit – und zum anderen die post-hoc berechnete Levenshtein Distance (Levenshtein, 1965) sowie Greedy String Tiling (GST; Wise, 1993). Während die Levenshtein Distance die Anzahl der Änderungen am Text widerspiegelt, stellt GST basierend auf der längsten gemeinsamen Zeichenkette die Ähnlichkeit von Erstentwurf und Revision dar. Basierend auf den drei Indikatoren wurde eine latente Variable modelliert, die das behaviorale Engagement bei der Textüberarbeitung abbildet. Anhand einer hierarchischen Regressionsanalyse zeigte sich eine vollständige Mediation des Feedbackeffekts auf die Schreibleistung über behaviorales Engagement. Das heißt, Schüler:innen, die für die Textüberarbeitung Feedback erhielten, zeigten eine deutliche stärkere Verbesserung ihrer Schreibleistung als Schüler:innen der KG, die kein Feedback erhielten. Diese Verbesserung kann zu einem Großteil auf durch das Feedback gesteigerte behaviorale Engagement während der Textüberarbeitung zurückgeführt werden. Unsere Befunde liefern nicht nur neue Erkenntnisse über Feedbackeffekten zugrundeliegende Mechanismen, die bei der Entwicklung digitaler Lernumgebungen zur Schreibförderung behilflich sein können. Viel mehr konnte darüber hinaus das große Potential von Prozessdaten in Hinblick auf die objektive Messung von Verhaltensprozessen im Schreibkontext gezeigt werden, welches in zukünftigen digital implementierten Studien noch deutlich weiter ausgeschöpft werden sollte.
13:10 - 14:50	2-05: Handlungsnahe Kompetenzmessung mit Simulationen in der Lehrkräftebildung: Potentiale und Herausforderungen Ort: H01
	Symposium Handlungsnahe Kompetenzmessung mit Simulationen in der Lehrkräftebildung: Potentiale und Herausforderungen Chair(s): Stephanie Kron (Lehrstuhl für Didaktik der Mathematik, Ludwig-Maximilians-Universität München), Stefan Ufer (Lehrstuhl für Didaktik der Mathematik, Ludwig-Maximilians-Universität München) Die Lehrkräftebildung hat zum Ziel, insbesondere die professionellen Kompetenzen (angehender) Lehrkräfte zu fördern (Kultusministerkonferenz, 2022). Weinert (2001) definiert den Begriff Kompetenzen als die verfügbaren bzw. erlernbaren kognitiven Fähigkeiten und Fertigkeiten, sowie die damit verbundenen motivationalen, volitionalen und sozialen Fähigkeiten eines Individuums, um bestimmte Probleme in variablen Situationen erfolgreich zu lösen. Bereits seit längerer Zeit wird in diesem Zusammenhang kritisiert, dass klassische Verfahren wie Wissenstests für die Kompetenzmessung nicht geeignet sind, da keine authentische Anwendung des Wissens in konkreten beruflichen Anforderungssituationen stattfindet (Shavelson, 2010; Ufer & Neumann, 2018). Blömeke et al. (2015) verstehen unter Kompetenz ein Kontinuum zwischen kognitiven und affektiv-motivationalen Dispositionen, die bestimmten situationsspezifischen Fähigkeiten unterliegen, und der beobachtbaren Leistung in einer professionellen Anforderungssituation. Alternativ wird diskutiert, die Prozesse, die einer solchen Leistung vorangegangen sind, direkt zu messen um Rückschlüsse über die Zusammenhänge zwischen individuellen Voraussetzungen, erfolgversprechenden Problemlöseprozessen und der letztendlichen Leistung treffen zu können (Hammer & Ufer, 2023; Heitzmann et al., 2019; Herppich et al., 2018). Um professionelle Kompetenzen umfassend zu messen und die angenommenen Zusammenhänge zwischen Dispositionen, Prozessen und Leistung zu prüfen, sind standardisierte Erhebungsformate notwendig, in denen professionelle Anforderungssituationen authentisch nachgebildet werden, Kompetenzen in vergleichbaren und wiederholbaren Situationen gezeigt werden müssen, und somit eine objektive, handlungsnahe Messung beobachtbaren Verhaltens möglich ist (Albu & Lindmeier, 2023; Blömeke et al., 2011; Fischer et al., 2022; McClelland, 1973; Messick, 1995; Shavelson, 2012; Ufer & Neumann, 2018; White, 1959). Dazu können Simulationen dienen, die beispielsweise rollenspiel- oder videobasiert konkrete berufliche Anforderungen möglichst authentisch abbilden und es durch die Kontrolle von Störfaktoren erlauben, die kognitive Belastung der Lernenden zu kontrollieren (Codreanu et al., 2020; Grossman et al., 2009). Dieses Symposium geht anhand von drei Fächern (Biologie, Englisch, Mathematik) der Frage nach, wie Zusammenhänge zwischen Dispositionen, Prozessen und Leistungen für einzelne Kompetenzbereiche modelliert, in Simulationen erfassbar gemacht und empirisch geprüft werden können. Neben den konkreten Modellen und Ergebnissen sollen auch Herausforderungen bei der Kompetenzmessung in Simulationen diskutiert werden. Aufgrund der langen Tradition simulationsbasierten Lernens in der Medizinausbildung (z.B. Lane & Rollnick, 2007) wurde hierfür ein Diskutant aus der Medizindidaktik angefragt. Der erste Beitrag stellt die Entwicklung und Validierung einer rollenspielbasierten Simulation vor, die zur Messung der Feedbackkompetenz angehender Englischlehrkräfte genutzt werden kann und in diesem Zusammenhang als alternatives Prüfungsformat diskutiert wird. Der zweite Beitrag fokussiert die Diagnosekompetenz als Teil professioneller Handlungskompetenz (Baumert & Kunter, 2006). Mit der Klassenraumsimulation SKR^Bio wurde eine digitale Lernumgebung entwickelt, mit der die Diagnosekompetenz von Biologie-Lehramtsstudierenden gemessen und prospektiv gefördert werden soll. Der dritte Beitrag bezieht sich ebenfalls auf die Messung von Diagnosekompetenz, allerdings in Bezug auf die Lehramtsausbildung Mathematik. Vorgestellt wird eine Operationalisierung diagnostischer Kompetenz anhand einzelner Indikatoren und deren handlungsnahe Messung in rollenspielbasierten Simulationen. Ziel ist es durch eine systematische Erfassung einzelner Indikatoren die Beziehungen dieser Indikatoren genauer zu verstehen. Die Erkenntnisse aus dem Fach Englisch in Bezug auf Feedbackkompetenz in Gegenüberstellung zu den Erkenntnissen aus den Fächern Biologie und Mathematik in Bezug auf Diagnosekompetenz soll es ermöglichen, Vorgehensweisen und Ergebnisse über verschiedene Kompetenzbereiche hinweg zu diskutieren. Der Vergleich zwischen den Fächern Biologie und Mathematik in Bezug auf die Messung von Diagnosekompetenz soll die Diskussion von Ergebnissen zwischen verschiedenen Domänen ermöglichen. Beiträge des Symposiums Entwicklung und Validierung einer rollenspielbasierten Simulation als Prüfungsverfahren für das Lehramtsstudium im Fach Englisch Christoph Vogelsang, Thomas Janzen, Philipp Wotschel, Lea Grotegut PLAZ-Professional School of Education, Universität Paderborn Hintergrund Angehenden Lehrkräften gelingt es häufig nicht, ihr im Studium erworbenes Wissen in typischen beruflichen Anforderungssituationen adäquat anzuwenden (Zeichner, 2010). Daher wird wie bspw. im Core Practices Approach (Grossman, 2021) vorgeschlagen, auch in der ersten Phase der Lehramtsausbildung handlungsnähere Anteile professioneller Kompetenz (Blömeke et al., 2015) vermehrt in den Fokus zu rücken. Diese Anteile sind bisher aber typischerweise nicht Gegenstand von Prüfungen. Prüfungsverfahren der ersten Phase (z.B. Klausuren, mündliche Prüfungen) fokussieren meist die (deklarative und prozedurale) Ebene des Wissens (vgl. Miller, 1990). Handlungsnahe Kompetenzen werden häufig erst in der zweiten Phase in unterrichtspraktischen Prüfungen (vgl. Ebene Action, Miller, 1990) adressiert. Es zeichnet sich also eine Lücke zwischen weniger handlungsnahen Prüfungen im Lehramtsstudium und Prüfungen unter kaum standardisierbaren Bedingungen des realen Berufsfeldes im Vorbereitungsdienst ab. In Anlehnung an andere professionsorientierte Studiengänge wie der Medizin könnte der Einsatz rollenspielbasierter Simulationen einen Beitrag dazu leisten, diese Lücke zu verkleinern (Dotger et al., 2010). Hierbei werden typische Standardanforderungen des Berufs unter möglichst authentischen, aber komplexitätsreduzierten Bedingungen standardisiert in rollenspielähnlichen Szenarien simuliert (Pierre & Breuer, 2013). Derartige Simulationsprüfungen haben zudem das Potenzial, schon den Kompetenzerwerb Studierender stärker an beruflichen Handlungsanforderungen zu orientieren (Sopka et al., 2013), finden z.B. in der Fremdsprachenlehrkräftebildung aber kaum Berücksichtigung (Abendroth-Timmer, 2011). Ziele & Fragestellung Ziele dieses Beitrags sind daher die Entwicklung und Validierung eines Prototyps für eine rollenspielbasierte Simulationsprüfung zur Erfassung der Feedbackkompetenz angehender Englischlehrkräfte im Kompetenzbereich Schreiben (Pang 2018; Hattie & Timperley 2007). So soll der Frage nachgegangen werden, inwiefern sich eine rollenspielbasierte Simulation als mögliches handlungsnäheres Prüfungsformat für das Lehramtsstudium am Beispiel des Unterrichtsfachs Englisch eignet. Methode In der entwickelten Simulation führen Studierende ein Gespräch, in welchem sie standardisierten Lernenden (Schauspieler:innen) adaptives Feedback zu einem schriftlichen Lernprodukt geben müssen (Nassaji, 2017). Als Grundlage dient ein literaturbasiert entwickeltes Rahmenmodell der Feedbackkompetenz im Bereich Schreiben, das als Raster zur Bewertung der videografierten Leistung der Studierenden operationalisiert wurde (vgl. Hyland, 2019; Lotz et al., 2015; Ferris, 2013). Die Schauspieler:innen wurden in einem achtwöchigen Trainingszeitraum unter anderem im Umgang mit so genannten verbal triggers zur gezielten Adressierung von Kompetenzfacetten geschult, um eine Standardisierung der Prüfungssituation zu gewährleisten (Dotger et al., 2010). Um sicherzustellen, dass ein solches (für die Lehramtsausbildung) neues Prüfungsformat in der Hochschullehre zielgerecht eingesetzt werden kann, wurden in der Entwicklung dem argument-based approach of validation (Kane, 2013) folgend mehrere Validierungsschritte vorgenommen. In einer Pilotuntersuchung (N1=10 Studierende) nahmen die Teilnehmenden im Anschluss an die Simulation an stimulated-recall-Interviews zur Validierung der verbal triggers teil, die strukturierend-inhaltsanalytisch ausgewertet wurden (Kuckartz & Rädiker, 2022). In der Hauptuntersuchung (N2=51 Studierende) wurden u.a. fachdidaktisches Wissen (Kirchhoff, 2017), Sprachkompetenz (Lemhöfer & Broersma, 2012) und Feedbackwissen (Schütze et al., 2017) der Teilnehmenden erhoben sowie strukturierte Leitfadeninterviews zur Akzeptanz der Simulation geführt. Ergebnisse & Diskussion In den stimulated-recall-Interviews zeichnet sich ab, dass die verbal triggers angestrebte Handlungsweisen evozieren können und von den Teilnehmenden überwiegend im Rahmen der intendierten Kompetenzfacetten wahrgenommen werden. Sie empfinden die Simulationen als authentisch, akzeptieren das Simulationsgespräch grundsätzlich als mögliches Prüfungsformat und beschreiben es im Vergleich zu schriftlichen und mündlichen Prüfungen als praxisrelevanter. Der aktuelle Stand der quantitativen Auswertungen (n=10, je n=5 B.Ed./M.Ed.b) zeigt, dass Masterstudierende nach dem Praxissemester signifikant höhere Testscores in der Simulationsprüfung erreichen als Bachelorstudierende (t(8)=3.045, d= 1.926, p=.016), was als Indikator für die Validität der Simulation betrachtet werden kann. Es ergeben sich in den vorläufigen Ergebnissen aber keine signifikanten Korrelationen zwischen Testscore und fachdidaktischem Wissen (r=.181, p=.617), Sprachkompetenz (r=-.114, p=.754) und Feedbackwissen (r=.523, p=.112). Die Validierung des Bewertungsrasters durch Expertenbefragungen wird derzeit durchgeführt. Insgesamt scheint die entwickelte Simulation grundsätzlich als Prüfungsformat geeignet zu sein. Der Ansatz lässt sich außerdem auf andere Kompetenzbereiche der Lehramtsausbildung übertragen (z.B. Beratungskompetenz, Gerich, 2016). Messung der Diagnosekompetenz zum Experimentieren mit der Klassenraumsimulation SKRBio Johannes Poser¹, Daniela Fiedler¹, Daniel Schönle², Christoph Reich², Ute Harms¹ ¹Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, IPN Kiel, ²Hochschule Furtwangen Hintergrund Diagnosekompetenz ist ein elementarer Bestandteil professioneller Handlungskompetenz von Lehrkräften und wesentlich für die Leistungsbeurteilung der Schülerinnen und Schüler (Baumert & Kunter, 2006; Leuders et al., 2022). Während der beruflichen Einstiegsphase stehen Lehrkräfte im Klassenraum zunächst einer Vielzahl neuer Herausforderungen gegenüber (z. B. praktische Umsetzung ihrer Unterrichtsplanung), wodurch diagnostisches Handeln im Unterricht oft vernachlässigt wird (Levin et al., 2009). Digitale Lernumgebungen wie Klassenraumsimulationen bieten die Möglichkeit, bereits im Studium realitätsnahe Lernsituationen zu schaffen, in denen handlungsbezogene Kompetenzen in einer sicheren Umgebung angewendet werden können (Bradley & Kendall, 2014). Die Komplexität realer Unterrichtssituationen kann hier gezielt reduziert und so können spezifische Kompetenzen fokussiert eingeübt werden (Grossmann et al., 2009; Hillmayr et al., 2020). Mit der Klassenraumsimulation SKRBio (Fischer et al., 2022) zum Experimentieren (Facette: Planung eines Experiments) wurde eine Lernumgebung entwickelt, mit der die Diagnosekompetenz von Lehramtsstudierenden gemessen und gefördert werden soll. Die Diagnosekompetenz wird im SKRBio als Urteilsgenauigkeit in Hinblick auf die korrekte Niveauzuordnung von Schülerantworten basierend auf einem Kompetenzmodell nach Wellnitz & Mayer (2013) operationalisiert. Studierende führen im SKRBio eine simulierte Unterrichtssequenz nach einem Frage-Antwort-Schema durch, wobei die virtuellen Schülerinnen und Schüler in ihren Antworten die Planung eines Experiments beschreiben. Während der Unterrichtssequenz müssen die Studierenden jede dieser Antworten bewerten, indem zuerst Aspekte des Experimentierens (z. B. Messung der abhängigen Variable, Konstanthaltung von Störgrößen) in einer Antwort identifiziert und die Antwort darauf basierend einer Niveaustufe zugeordnet wird. Für die Zuordnung der Niveaustufe IV müssen beispielsweise die Aspekte „Variation der unabhängigen Variable“, „Messung der abhängigen Variable“ sowie „Konstanthaltung von Störgrößen“ in einer Antwort enthalten sein. Am Ende soll die Gesamtleistung der einzelnen Lernenden bewertet werden. Um den Diagnoseprozess zu unterstützen, wurde ein Chatbot als Prototyp eines adaptiven Feedbackgebers in die Klassenraumsimulation integriert. Fragestellung 1. Wie genau diagnostizieren Biologie-Lehramtsstudierende die Antworten und welche Schwierigkeiten lassen sich bei der Diagnose feststellen? 2. Welche Personenmerkmale der Studierenden zeigen einen Einfluss auf die Diagnosekompetenz? 3. Inwiefern wird der Chatbot als Unterstützungstool verwendet? Methode In einer explorativen online durchgeführten Interventionsstudie mit dem SKRBio einschließlich Pre- und Posttest-Befragung wurde die Diagnosekompetenz von 86 Biologie-Lehramtsstudierenden (77 % weiblich, 52 % im Masterstudium) gemessen. Zudem wurden Kontrollvariablen (z. B. Fachwissen, Motivation, Lernstrategien) in den Pre- und Posttest-Fragebögen erhoben. Ergebnisse & Diskussion Die Studierenden konnten 48 % der Antworten (N = 2519) der korrekten Niveaustufe zuordnen, allerdings identifizierten sie in nur 28 % der Antworten alle Aspekte des Experimentierens korrekt. Dabei zeigte sich eine signifikante Beziehung zwischen der Diagnose und der zugrundeliegenden Niveaustufe: X2 (4, n = 2519) = 195.91, p < .001. Bei der Identifikation der Aspekte des Experimentierens scheint besonders die korrekte Verwendung der abhängigen und unabhängigen Variable Schwierigkeiten zu bereiten. Hinsichtlich der Niveaustufen wurden die zweite und dritte Niveaustufe seltener korrekt diagnostiziert als die übrigen Niveaustufen. Korrelationsanalysen zeigten, dass das Fachwissen (rs = .328, p < .005), die persönlichen Lernstrategien (rs = .253, p < .019), sowie das Selbstkonzept (rs = .214, p < .048) leicht positiv mit der Diagnosekompetenz korrelierten. Der integrierte Chatbot wurde von 55 Teilnehmenden für mindestens eine Anfrage genutzt. Die meisten Fragen bezogen sich auf die abhängige (47 Anfragen) oder unabhängige (36 Anfragen) Variable sowie auf das Kompetenzmodell (57 Anfragen). Die Nutzung des Chatbots stützt die Vermutung, dass die Identifikation der abhängigen und unabhängigen Variable in den Schülerantworten eine Herausforderung für Biologie-Lehramtsstudierende darstellt. Obgleich die Fokussierung auf die Diagnose einzelner Antworten eine Limitation gegenüber einem komplexen Unterrichtsgespräch darstellt, bietet der SKRBio dennoch die Möglichkeit, diagnostisches Handeln in einer simulierten Unterrichtssequenz anzuwenden und zu messen. Insbesondere die Zweiteilung der Diagnosen im SKRBio in Aspekte und Niveaustufen erweist sich dabei als gewinnbringend in Hinblick auf eine differenzierte Messung der Diagnosekompetenz von Studierenden. Messung von und Beziehungen zwischen einzelnen Indikatoren der diagnostischen Kompetenz angehender Mathematiklehrkräfte Stephanie Kron¹, Daniel Sommerhoff², Kathleen Stürmer³, Stefan Ufer¹ ¹Lehrstuhl für Didaktik der Mathematik, Ludwig-Maximilians-Universität München, ²Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, IPN Kiel, ³Hector Institut für Empirische Bildungsforschung, Universität Tübingen Hintergrund Adaptive unterrichtliche Entscheidungen können nur dann erfolgen, wenn Lehrkräfte die Bedarfe ihrer Schüler:innen akkurat einschätzen können (van de Pol et al., 2010). Der Erwerb diagnostischer Kompetenz ist daher bereits Ziel der hochschulischen Lehrkräfteausbildung (Kultusministerkonferenz, 2022). Heitzmann et al. (2019) verstehen unter dem Begriff Diagnostizieren das zielgerichtete Sammeln und Integrieren von Informationen zum Treffen professioneller Entscheidungen. Modelle diagnostischer Kompetenz nehmen an, dass professionelles Wissen diagnostischer Kompetenz als wesentliche kognitive Ressource zugrunde liegt, dessen Wirkung durch motivationale Ressourcen moderiert werden kann (Herppich et al., 2018). In der bisherigen Forschung wurde die diagnostische Akkuratheit als handlungsnahes Leistungsmaß für Diagnosekompetenz verwendet (Behrmann & Souvignier, 2013; Südkamp et al., 2012). Herppich et al. (2018) schlagen vor, auch Indikatoren des diagnostischen Prozesses, der zu dieser Leistung geführt hat, zu berücksichtigen und Beziehungen zwischen individuellen Ressourcen, diagnostischen Prozessen und diagnostischer Akkuratheit zu untersuchen. Als Teil der Evidenzgenerierung im diagnostischen Prozess stellt sich die Frage, inwiefern angehende Lehrkräfte Aufgaben wählen, die das Potential haben, diagnostische Informationen zu liefern (van den Kieboom et al., 2014). Fragestellung 1. Welche Zusammenhänge zeigt das professionelle Wissen angehender Mathematiklehrkräfte zu handlungsnahen Indikatoren des diagnostischen Prozesses und der diagnostischen Leistung? 2. Inwiefern moderiert individuelles Interesse die Zusammenhänge zwischen Wissen und den genannten handlungsnahen Indikatoren? Methode Um Indikatoren diagnostischer Kompetenz handlungsnah zu erfassen, wurde eine Rollenspielsimulation diagnostischer Einzelinterviews entwickelt, in der Mathematiklehramtsstudierende als Lehrkraft den Lernstand eine:r Schüler:in (gespielt von eine:r geschulten Mitarbeiter:in) in der Dezimalbruchrechnung diagnostizieren. Die Studierenden wählen dazu Aufgaben aus einem vorgegebenen Aufgabenset und beobachten die Aufgabenbearbeitung. Nach circa 30 Minuten Interview bewerten sie den Lernstand in neun Einzelfacetten der Dezimalbruchrechnung („sicher beherrscht“, „nicht sicher beherrscht“, „keine Diagnose möglich“). Als Indikatoren für den diagnostischen Prozess wurde der Anteil der Aufgaben berechnet, die hohes diagnostisches Potential haben bzw. neue Informationen über vorher beobachtete Antworten hinaus liefern. Aus der diagnostischen Leistung wurde die Akkuratheit der Diagnose als Indikator der diagnostischen Kompetenz untersucht. Weiterhin wurde das fachliche und fachdidaktische Wissen mit Paper-Pencil-Tests gemessen. Als motivationale Ressourcen wurden das Interesse an Diagnostik und an Mathematikdidaktik mit etablierten Skalen (Rotgans & Schmidt, 2011) erhoben. An der Studie nahmen N = 63 Mathematiklehramtsstudierende teil, die nacheinander zwei von vier randomisiert zugeteilten Schülerprofilen diagnostizierten. Die statistische Auswertung erfolgte aufgrund der genesteten Struktur der Daten mit linearen Mischmodellen. Ergebnisse Für die Auswahl der Aufgaben zeigte sich, dass im zweiten Interview signifikant mehr Aufgaben mit hohem diagnostischem Potential ausgewählt wurden (M=7.86) als im ersten Interview (M=6.35, F(1;59.25)=15.00; p<.001). Eine signifikante Anpassung der Aufgabenauswahl auf Basis vorheriger Antworten im Laufe eines Interviews konnte nicht beobachtet werden. Im Mittel erreichten die Teilnehmenden eine Akkuratheit von 0.67 (SD=0.15; min=0.22; max=1.00); signifikante Unterschiede zwischen den beiden Interviews wurden nicht beobachtet. Es zeigten sich signifikante Zusammenhänge zwischen dem Fachwissen und Aufgabenauswahl (B=0.030; F(1;59.46)=5.13; p=.027) und Akkuratheit (B=0.031; F(1;59.10)=5.30; p=.025), jedoch nicht für das fachdidaktische Wissen oder das Interesse. Signifikante Interaktionseffekte zwischen Fachwissen bzw. fachdidaktischem Wissen und Interesse zeigten sich sowohl für die Aufgabenauswahl als auch für die Akkuratheit. Diskussion Die positiven Zusammenhänge weisen darauf hin, dass sich diagnostische Kompetenz sowohl in Ressourcen, Prozessmaßen wie auch Leistungsmaßen zeigt. Sie erweitern Resultate von van den Kieboom et al. (2014) um die Betrachtung diagnostischer Prozesse. Die Rolle fachdidaktischen Wissens über Fachwissen hinaus sollte in zukünftigen Studien mit größerer statistischer Power ebenso weiter untersucht werden wie die Wirkkette von Ressourcen über Prozessmaße hin zu Leistungsmaßen. Die beobachteten Interaktionseffekte weisen darauf hin, dass Wissen vor allem dann für eine handlungsnahe Anwendung aktiviert wird, wenn günstige motivationale Voraussetzungen vorliegen (Herppich et al., 2018). Von Interesse wäre weiterhin eine breitere Erhebung von Prozess- und Leistungsmaßen, z.B. in Bezug auf die Nutzung professionellen Wissens während des Interviews in Notizen und schriftlichen Diagnoseberichten.
13:10 - 14:50	2-06: Neue Perspektiven in der Bildungsforschung: Einbezug multipler Datenquellen in lern- und leistungsbezogener Motivations- und Emotionsforschung Ort: H08
	Symposium Neue Perspektiven in der Bildungsforschung: Einbezug multipler Datenquellen in lern- und leistungsbezogener Motivations- und Emotionsforschung Chair(s): Anja Henke (Universität Potsdam), Olivia Metzner (Universität Potsdam), Rebecca Lazarides (Universität Potsdam; Exzellenzcluster "Science of Intelligence") Diskutant*in(nen): Luise von Keyserlingk (Universität Tübingen; Hector-Institut für Empirische Bildungsforschung) Zahlreiche Studien der Lern- und Unterrichtsforschung nutzen zur Erfassung kognitiver sowie motivational-affektiver Lernmerkmale und sozialer Interaktionsmerkmale im Lernkontext Daten, die auf Selbstberichten aus Fragebogenuntersuchungen basieren (Sharma & Giannakos, 2020). Auch wenn Selbstberichtsdaten zur nuancierten Erfassung emotionaler und kognitiver Zustände als unabdingbar angesehen werden können (Pekrun, 2020), mehrt sich Kritik an der ausschließlichen Verwendung von Selbstberichtsdaten in der aktuellen Lehr-Lernforschung (Connors et al., 2016). So sind Selbstberichte besonders anfällig für soziale Erwünschtheitseffekte, Fehlinterpretationen der Fragestellung und Verzerrungen durch individuelle Referenzrahmen (Howard, 1980; Rosenman et al., 2011). Weiterhin zeigen Studien, dass die Ergänzung von Selbstberichtsdaten durch andere Methoden, wie beispielsweise Beobachtungsdaten (Ellis et al., 2017) oder Daten aus Eyetracking-Experimenten (Catrysse et al., 2017) einen umfassenderen Blick auf lern- und unterrichtsbezogene Merkmale und auf die damit einhergehenden Prozesse ermöglichen (Sharma et al., 2019). Besonders für die Motivations- und Emotionsforschung könnten umfassendere methodische Betrachtungen situationsbezogener und längsschnittlicher Veränderungen gewinnbringend sein (Fulmer & Frijters, 2009; Gonçalves et al., 2017). Da technologiegestützte Lernkontexte die Erhebung und Untersuchung solcher Prozessdaten vereinfachen (z.B., Hutt et al., 2019; Dindar et al, 2020), ermöglicht der zunehmende Fokus auf technologiegestützte Lernszenarien besonders gute Bedingungen für multimodales Assessment in der Bildungsforschung. Vor diesem Hintergrund hat dieses Symposium zum Ziel, Forschungsergebnisse zusammenzubringen, die lernprozessbezogene Fragestellungen mit multimodalem Assessment verbinden. Im Rahmen dieses Symposiums wird der Einbezug multipler Datenquellen als Möglichkeit der Weiterentwicklung von lern- und leistungsbezogener Motivations- und Emotionsforschung diskutiert. Dabei untersuchen die Beiträge des Symposiums Fragestellungen, die sich mit Veränderungen motivational-affektiver und kognitiver Merkmale in Lernkontexten befassen und nutzen zur Untersuchung dieser technologiegestützten Lernszenarien (Beiträge 2, 3 und 4) oder künstliche Intelligenz als Möglichkeit der Datenverarbeitung (Beitrag 1). Die Beiträge beziehen sich auf unterschiedliche Bildungskontexte wie Schule (Beitrag 1 und 4) und Hochschule (Beiträge, 2 und 3) und nutzen multimodale Daten, um umfassendere und differenziertere Betrachtungen von Lehr-Lern-Prozessen zu erhalten. Das Symposium gibt dabei Einblicke in die prozessbezogene Erforschung (meta-)kognitiver, affektiver und physiologischer Lernmerkmale in Bildungskontexten. Der erste Beitrag untersucht basierend auf Audiotranskripten und Selbstberichten Zusammenhänge zwischen motivierender Unterrichtssprache (Selbstbestimmungstheorie der Motivation), Unterrichtshandeln und motivationalen Merkmalen Lehramtsstudierender. Die Ergebnisse deuten darauf hin, dass Lehramtsstudierende in ihrer Unterrichtssprache nur partiell grundlegende motivationale Bedürfnisse der Lernenden ansprechen. Besonders das Kompetenzerleben wird in der Instruktion effektiv adressiert. Der zweite Beitrag untersucht mittels Eyetracking- und Selbstberichtsdaten, wie sich das nonverbale Sozialverhalten von Lehrkräften in einem Instruktionsvideo auf Lernfreude, Motivation, Aufmerksamkeit und Lernergebnisse von Studierenden auswirkt. Die Ergebnisse zeigen, dass nonverbales Sozialverhalten einer Lehrkraft in einem Instruktionsvideo im Zusammenhang mit affektiv-motivationalen jedoch nicht kognitivem Lernen steht und gleichzeitig die Aufmerksamkeit der Lernenden lenkt. Der dritte Beitrag untersucht anhand von biophysiologischen Markern (elektrodermale Aktivität) und Selbstberichtsdaten den Zusammenhang von Vorwissen und der affektiven Verarbeitung von computerbasiertem Feedback Studierender. Die Ergebnisse verweisen darauf, dass Lernende mit hohem Vorwissen Feedback anders aufnehmen als Lernende mit geringerem Vorwissen und dadurch eine höhere emotionale Erregung aufweisen, sich jedoch keine signifikanten Zusammenhänge mit den Lernergebnissen ergeben. Der vierte Beitrag untersucht durch Kombination multipler Datenquellen, zu denen Logdaten, Fragebogenselbstberichte sowie einem Test zur Messung der kognitiven Flexibilität zählen, inwiefern kognitive Belastbarkeit, Vorwissen, Lernfreude, Konzentration und wahrgenommenes soziales Interaktionsverhalten mit Lernfortschritt in einem intelligenten tutoriellen System (ITS) mit Roboterkomponente zusammenhängen. Die Ergebnisse zeigen, dass die Wahrnehmung der Interaktion mit dem Roboter und die kognitive Belastung eine zentrale Rolle für das emotionale Erleben und den Lernfortschritt in der Arbeit mit ITS einnehmen. Beiträge des Symposiums Motivierende Sprache von Lehrkräften. Wie setzen Lehramtsstudierende in ihrer Unterrichtssprache die Förderung von Kompetenz-, Autonomieerleben und der sozialen Eingebundenheit ein? Olivia Metzner¹, Rebecca Lazarides² ¹Universität Potsdam, ²Universität Potsdam; Exzellenzcluster "Science of Intelligence" Theoretischer Hintergrund Das Erleben von Kompetenz, Autonomie und sozialer Eingebundenheit hat eine maßgebliche Bedeutung für die Lernmotivation (Ryan & Deci, 2017). Empirische Studien, die sich auf die theoretischen Annahmen der Selbstbestimmungstheorie der Motivation (SDT; Deci & Ryan, 2004) beziehen, zeigen, dass Lernende in Lernkontexten, die zur Erfüllung ihrer grundlegenden psychologischen Bedürfnisse beitragen, für Lernaufgaben intrinsisch motivierter sind (Bureau et al., 2022). Gleichzeitig zeigen Studien, dass instruktionale Settings, welche das Erleben von Kompetenz, Autonomie und sozialer Eingebundenheit nicht erfüllen, negative Auswirkungen auf die Lernmotivation haben (z.B. Bartholomew et al., 2018). Eine Möglichkeit, Lernenden Autonomie, Kompetenzerleben und soziale Eingebundenheit zu vermitteln, ist die Instruktionssprache im Unterricht. Allerdings fokussieren aktuelle Forschungsarbeiten, die sich mit der Unterrichtssprache von Lehrkräften befassen, häufig auf den Einsatz von motivierender Sprache in Test- und Leistungssituationen (z.B. Santana-Monagas et al., 2021; Putwain et al., 2017). Dabei werden Ansätze genutzt, die die Verwendung motivierender Sprache in Verknüpfung mit gewinnbringenden oder verlustbringenden Appellen setzen (z.B. gain- und loss-framed Ansatz; z.B. Falcon et al., 2023; Putwain et al. 2019). Derartige Ansätze eignen sich gut für die Untersuchung des verbalen Lehrverhaltens von Lehrkräften, die sich auf die Lernmotivation für Tests fokussieren. Weniger geeignet ist dieser theoretische Ansatz jedoch für die Untersuchung, inwiefern Lehrkräfte motivierende Sprache einsetzen, um Lernende in ihren grundlegenden psychologischen Bedürfnissen zu unterstützen. Eine aktuelle Arbeit von Ahmadi et al. (2023) kategorisiert basierend auf der SDT hingegen das Lehrverhalten von Lehrkräften und geht auch auf sprachliches Verhalten ein. Dieser Ansatz wird in der vorliegenden Studie für die Kodierung motivierender Lehrsprache verwendet. Fragestellung Anknüpfend an dem Kategorisierungsschema von Ahmadi et al. (2023) untersucht der vorliegende Beitrag die motivierenden verbalen Sprachgehalte von Lehramtsstudierenden in authentischen Unterrichtssituationen. Die Studie untersucht, inwiefern Bachelor-Lehramtsstudierende motivierende Sprache in ihrem Unterricht einsetzen und welche Zusammenhänge die motivierende Unterrichtssprache zu weiteren motivationalen und unterrichtsbezogenen Merkmalen der Studierenden aufweisen. Methode In der Studie wurden anhand von N=56 Lehramtsstudierenden im Bachelorstudium (50% weiblich; MAlter=23.31, SD=3.53) längsschnittliche Fragebogendaten und Sprachtranskripte aus dem Unterricht ausgewertet. Die Selbstwirksamkeit der Studierenden wurde zu Beginn des Semesters sowie zu fünf weiteren Messzeitpunkten mit einer Skala von Pfitzner-Eden et al. (2014) erhoben. In der Mitte des Semesters unterrichteten und videographierten die Lehramtsstudierenden eine Unterrichtsstunde. Die KI-Transkriptionssoftware DaVinci Resolve Studio wurde zur Transkription der Audioaufnahmen der Videos genutzt. Anschließend wurden die Sprachtranskripte von zwei unabhängigen Rater:innen mit MAXQDA in Hinblick auf die motivierende Sprache klassifiziert. Die Klassifizierung der Transkripte erfolgte basierend auf dem Schema Teacher Motivational Behavior (TMBs) von Ahmadi et al., (2023). In dem Schema sind das unterstützende und hemmende Lehrverhalten auf Ebene des Kompetenz- und Autonomieerlebens als auch der sozialen Eingebundenheit klassifiziert. Ergebnisse Erste Ergebnisse zeigen, dass Studierende in ihrer Unterrichtssprache besonders ausgeprägt die Ebene des unterstützenden Kompetenzerlebens (z.B. Verständnisfragen, Feedback) einsetzen. In den Transkripten lassen sich zudem Sprachgehalte finden, die sich als Autonomie hemmend kodieren lassen (z.B. bedrängende Sprache, Lob als bedingte Belohnung). Auf der Ebene der sozialen Eingebundenheit sind in einem geringen Maße unterstützende sowie hemmende verbale Verhaltensweisen zu beobachten. Die geringere Nutzung der sozialen Eingebundenheit über die Sprache könnte dahingegen erklärt werden, dass die Studierenden über wenig Unterrichtserfahrung verfügten und ihnen die Lerngruppe nur wenig bekannt war. Für weitere Auswertungen werden quantitative Fragebogendaten herangezogen, um mögliche Zusammenhänge zwischen dem Einsatz von motivierender Sprache und weiteren Unterrichts- und Motivationsmerkmalen, wie der Selbstwirksamkeit der Lehramtsstudierenden, längsschnittlich zu untersuchen. Zudem sind für zukünftige Analysen die Auswertung der Transkripte anhand eines Sprachmodells geplant. Gestaltung von Lehrvideos: nonverbales Sozialverhalten von Lehrkräften und seine Auswirkungen auf die kognitiven, affektiven und motivationalen Lernprozesse Jonas Frenkel¹, Anke Cajar², Ralf Engbert², Rebecca Lazarides¹ ¹Universität Potsdam; Exzellenzcluster "Science of Intelligence", ²Universität Potsdam In den letzten Jahren haben digitale Bildungsformate nicht zuletzt aufgrund von technologischem Fortschritt und der steigenden Nachfrage nach flexiblen Lernumgebungen stark an Bedeutung gewonnen. Unter den verschiedenen Formaten, die in der digitalen Lehre Anwendung finden, sind insbesondere Lehrvideos zunehmend beliebter geworden. Eine zentrale Frage bei der Gestaltung von Lehrvideos betrifft dabei die Rolle der Lehrenden, insbesondere die Rolle ihres nonverbalen Verhaltens in den Videos (Fiorella & Mayer, 2016). Während die Bedeutung des nonverbalen Sozialverhaltens von Lehrenden - wie etwa Mimik, Gestik und Blickbewegungen - im Präsenzunterricht gut erforscht ist, sind die Auswirkungen in Lehrvideos noch nicht vollständig geklärt (Meier et al., 2023). Bestehende Forschung im Bereich multimedialer Lernformate konzentriert sich häufig auf kognitive Lernaspekte und betont die Wichtigkeit der Menge und Art an Informationen, die von den Lernenden während des Unterrichts verarbeitet werden (Mayer et al., 2020). Die Cognitive Load Theory of Multimedia Learning (CLTM) liefert ein konzeptionelles Modell, das die Bedeutung der Reduzierung unnötiger kognitiver Belastung zur Förderung des Lernens betont (Mayer, 2005). Demnach könnten zusätzliche visuelle Reize, wie etwa das nonverbale Sozialverhalten der Lehrenden, die Lernenden von der Verarbeitung der relevanten Lehrinhalte ablenken (Zhang et al., 2018). CLTM kann jedoch nicht erklären, wie bestimmte Formen vermeintlich irrelevanter nonverbaler Zeichen, wie beispielsweise Gesten, Lernergebnisse teilweise stattdessen verbessern (Skulmowski & Xu, 2022). Andere Forschungsansätze zum effektiven Lernen und Lehren in Online-Lernumgebungen heben dagegen die Rolle von affektiv-motivationalen Prozessen und sozialen Faktoren hervor (Schnotz et al., 2009). Die Social-Agency-Theorie legt nahe, dass nonverbale Zeichen in Lehrvideos das Gefühl sozialer Präsenz bei den Lernenden stärken und positive sozio-emotionale Reaktionen hervorrufen können (Mayer et al., 2003), wodurch ihre Motivation und eine tiefere kognitive Verarbeitung gefördert werden kann (Wang & Antonenko, 2017). Forschungsinteresse Die vorliegende Studie untersucht die Rolle der nonverbal immediacy (NVI, Mehrabian, 1968) von Lehrenden in Lehrvideos, ein Konstrukt, das multimodale nonverbale Verhaltensweisen erfasst, welche die psychologische Distanz zwischen Personen verringern (Witt et al., 2004). Insbesondere werden Zusammenhänge zwischen der NVI der Lehrenden und kognitivem, affektivem und motivationalem Lernerfolg der Lernenden betrachtet. Methode Im Rahmen eines Mixed-Method-Ansatzes wurde die Auswertung von Fragebogendaten und Eye-Tracking-Daten kombiniert. Die Studie umfasste 87 Teilnehmende, die sich eine Reihe von Lehrvideos ansahen, in denen der Grad an NVI durch einen Lehrenden systematisch variiert wurde. Die wahrgenommene NVI, der kognitive Lernerfolg, die Motivation und die Lernfreude wurden nach jedem Video per Fragebogen gemessen. Zur Analyse der Aufmerksamkeitsverteilung zwischen dem Lehrenden und den zusätzlichen Lernmaterialien wurden die Blickbewegungen der Teilnehmenden aufgezeichnet. Ergebnisse und Implikationen Die Ergebnisse der Mehrebenen-Pfadanalysen deuten auf einen signifikanten Zusammenhang zwischen wahrgenommener NVI und der Motivation sowie der Lernfreude der Lernenden hin. Ein Zusammenhang mit dem kognitiven Lernerfolg wurde nicht nachgewiesen. Zusätzlich zeigten die Auswertungen der Augenbewegungen der Lernenden, dass sich die Aufmerksamkeitsverteilung je nach NVI-Grad des Lehrenden unterschied. Höhere NVI-Ausprägungen gingen mit einer stärkeren Fixierung auf den Lehrenden einher, was auf einen Einfluss des nonverbalen Sozialverhaltens auf die Aufmerksamkeitslenkung hinweist. Diese Ergebnisse haben wichtige Implikationen für die Gestaltung von Lehrvideos. Die Einbeziehung nonverbaler Verhaltensweisen, die die NVI verstärken, kann positive affektive und motivationale Reaktionen der Lernenden fördern, was das Engagement steigern und tiefere kognitive Verarbeitung begünstigen kann. Jedoch ist ein Gleichgewicht zwischen nonverbalem Sozialverhalten und Lehrinhalten wichtig, um mögliche Ablenkungen zu vermeiden. Diese Studie trägt zum Verständnis der Rolle nonverbalen Sozialverhaltens in der Online-Lehre bei, insbesondere bei Videovorlesungen. Indem sie den Einfluss der NVI auf das Lernen und die Aufmerksamkeitsverteilung untersucht, beleuchtet sie die Bedeutung affektiv-motivationaler Prozesse und sozialer Faktoren in Online-Lernumgebungen. Diese Ergebnisse können Lehrende, Pädagog:innen und Online-Lernplattformen bei der Erstellung effektiver und ansprechender Online-Lehrvideos zur Optimierung der Lernerfahrung unterstützen. Macht Vorwissen einen Unterschied? Effekte von Vorwissen auf die affektive Verarbeitung von computerbasiertem Feedback Salome Wagner¹, Leonie Sibley², Sara Becker³, Vincent Hoogerheide⁴, Andreas Lachner¹ ¹Universität Tübingen; Tübingen Center for Digital Education, ²Universität Tübingen, ³Tübingen Center for Digital Education, ⁴Universität Utrecht Theoretischer Hintergrund Die Berücksichtigung der heterogenen Voraussetzungen von Lernenden ist eine zentrale Gelingensbedingung bei der Gestaltung von Unterricht. So zeigen sich beispielsweise auch moderierende Effekte von Vorwissen bei der Implementation von Feedback, da insbesondere Lernende mit niedrigem Vorwissen aber nicht mit hohem Vorwissen von (computerbasiertem) Feedback profitieren (Fyfe & Rittle-Johnson, 2016; Wagner et al., under rev.; Wischgoll, 2017). Neben kognitiven Faktoren, werden insbesondere affektive Faktoren als Erklärfaktoren diskutiert: Höheres Vorwissen kann im Vergleich zu niedrigem Vorwissen zu höheren Kompetenzeinschätzungen führen, was ein höheres physiologisches Erregungsniveau während der Feedbackverarbeitung und niedrigere Lernleistungen zur Folge haben kann. Bislang wurde der Einfluss von Vorwissen auf emotional-affektive Faktoren bei der Verarbeitung von computerbasiertem Feedback jedoch kaum untersucht. Fragestellung Diese Studie wurde als Laborexperiment realisiert, in der das Vorwissen experimentell induziert wurde, sowie affektive Prozesse mit physiologischen Messungen fein-granular erfasst wurden, um affektive Verarbeitungsprozesse nachzuzeichnen. Ziel der vorliegenden Studie war es, den potenziellen Einfluss von Vorwissensinduktion auf die affektive Verarbeitung von computerbasiertem Feedback und auf die Lernleistung zu untersuchen. Hierfür wurde die elektrodermale Aktivität (EDA; siehe Braithwaite et al., 2013; Dawson et al., 2016; Horvers et al., 2021 für Validitätsstudien) der Studierenden anhand von EDA-Armbändern erhoben. Wir vermuteten, dass sich die Erregung der Lernenden, die Vorwissensinduktion erhielten, während der Feedbackverarbeitung erhöhte im Vergleich zu Lernenden, keine vorherige Wissensinduktion erhielten. Methode Die Studie (präregistriert unter: https://aspredicted.org/2W5_8D2) wurde als 2-Gruppen-Design mit N = 47 Studierenden durchgeführt, von denen 42 Teilnehmende in den Analysen berücksichtigt werden konnten (hohes Vorwissen: n = 21, niedriges Vorwissen: n = 21). In einer multimedialen Lernumgebung (Thema: Ohm’sches Gesetz) machten die Studierenden zunächst Angaben zu ihren demografischen Daten und einem Prätest (t1: EDA-Baseline). In der Lernphase (t2) erhielten sie entweder eine Vorwissensinduktion (in Form direkter Instruktion) oder eine themenfremde Kontrollinstruktion, die bereits in einer Vorgängerstudie validiert wurde. In der Übungsphase (t3) berechneten die Studierenden anhand mehrerer Übungsaufgaben die Stromstärke in verschiedenen Stromkreisen und erhielten automatisch computerbasiertes Feedback auf ihre Antworten. Zuletzt berechneten die Studierenden die elektrische Stromstärke in Posttestaufgaben (t4). Vor der Lernphase und jeweils nach der Lern- und Übungsphase schätzten die Lernenden ihre affektive Erregung selbst ein. Während der ganzen Untersuchung trugen die Lernenden das EDA-Armband (E4 Empatica), worüber ihre physiologischen EDA-Daten anhand von vier Messungen pro Sekunde erhoben wurden. Ergebnisse Zunächst berechneten wir einen mittleren EDA-Wert pro Phase (Baseline, Lernphase, Übungsphase, Posttestphase) pro Person (Carroll et al., 2019; Hoogerheide et al., 2019; Khan et al., 2019). Anhand einer ANCOVA mit Messwiederholung analysierten wir mögliche Unterschiede zwischen den Gruppen hinsichtlich der EDA-Daten über die Zeit hinweg (t2-t4) unter Kontrolle der Baseline-Erregung. Die Ergebnisse zeigten, dass sich die Gruppen signifikant in ihrer EDA unterschieden, F(3, 38) = 3.789, p = .042, η_p^2 = .09. Die Erregung der Kontrollgruppe sank über die Zeit hinweg linear; das Erregungslevel der Gruppe mit vorheriger Instruktion blieb konstant. Eine ANOVA zeigte jedoch, dass sich die beiden Gruppen nicht in ihrer Posttestleistung unterschieden, F(1, 40) = 0.125, p = .725, η_p^2 = .00. Die Valenz des Feedbacks (positiv oder negativ) hatte keinen moderierenden Effekt, F(3, 38) = 0.370, p = .633, η_p^2 = .03. Bedeutung der Ergebnisse Analog zu unserer postulierten Hypothese zeigte sich, dass bei Studierenden mit niedrigem Vorwissen, die physiologische Erregung sank, im Vergleich zu Studierenden mit hohem Vorwissen. Die Lernleistung unterschied sich jedoch nicht. Diese Ergebnisse können dahingehend erklärt werden, dass die Zugabe von Feedback bei Lernenden mit hohem Vorwissen zu Interferenzeffekten führen kann. Aktuell werden die Daten fein-granular auf Sekundenebene und insbesondere bzgl. der Valenz des Feedbacks (positives versus negatives Feedback) ausgewertet, um feine Schwankungen in der emotionalen Erregung bei der Feedbackverarbeitung zu identifizieren. Diese Befunde werden auf der GEBF-Konferenz ebenfalls vorgestellt. Lernen mit sozialen Robotern und intelligenten tutoriellen Systemen: Welche Rolle spielen wahrgenommenes soziales Interaktionsverhalten des Roboters, Lernfreude und kognitive Belastung für den Lernfortschritt? Anja Henke¹, Johann Chevalère², Hae Seon Yun³, Niels Pinkwart⁴, Verena Hafner³, Rebecca Lazarides⁵ ¹Universität Potsdam, ²Centre national de la recherche scientifique (CNRS); Université Clermont-Auvergne, Clermont-Ferrand, ³Humboldt-Universität zu Berlin; Exzellenzcluster "Science of Intelligence", ⁴Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI); Humboldt-Universität zu Berlin; Exzellenzcluster "Science of Intelligence", ⁵Universität Potsdam; Exzellenzcluster "Science of Intelligence" Theoretischer Hintergrund Forschungsarbeiten zu Mensch-Roboter-Interaktion in sozialen Lernprozessen zeigen, dass physische Roboter in Lernsettings zu höherer Lernfreude (Kennedy et al., 2015) und höherem Lernergebnissen beitragen können (Belpaeme et al., 2018). Dennoch gibt es Hinweise darauf, dass Roboter Lernende ablenken und den Lernprozess stören können (Chou et al., 2023). Inwiefern der schulische Einsatz von Robotern lernförderlich oder -hinderlich sein kann als auch die zugrundeliegenden Mechanismen erfolgreichen Lernens mit sozialen Robotern sind bisher weitgehend unbekannt und wenig untersucht (Woo et al., 2021). Die Kontroll-Wert Theorie (Pekrun et al., 2007) postuliert, dass der Lernkontext, die emotionale Erfahrung beim Lernen und die Zuweisung kognitiver Ressourcen miteinander im Zusammenhang stehen und gleichzeitig die Grundlage für Lernerfolg bilden. Fragestellung Basierend auf den Annahmen der Kontroll-Wert Theorie (Pekrun, 2007) und der Theorie der kognitiven Belastung (Sweller, 2011) untersucht die vorliegende Studie inwiefern die kognitive Belastung, Vorwissen, wahrgenommene soziales Interaktionsverhalten eines Roboters (Pepper) als auch Lernfreude und Konzentration im Zusammenhang mit dem Lernfortschritt in einem emotional-adaptiven intelligenten tutoriellen System (ITS) mit Roboter-Komponente stehen. Methode Wir verwendeten Daten von N=56 Lernenden (30.36% weiblich; 69.64% männlich; Mage=17.75, SD=2.63) aus vier Klassen in Deutschland. Die Lernenden arbeiteten 60 Minuten lang mit einem ITS mit Roboter-Komponente – die Lernenden wurden von einem physischen oder virtuellen Roboter (Pepper) unterstützt wobei a-priori Analysen keine Hinweise auf Effekte der Art der Einbindung des Roboters zeigen. Mittels Experience Sampling erfassten wir Lernfreude und Konzentration mit einer adaptierten Skala von Pekrun et al. (2017) während der Arbeit mit dem ITS. Um Artefakte des Novelty-Effekts (Metcalf et al., 2019) zu vermeiden, schlossen wir Experience-Sampling-Daten der ersten 30 Minuten aus. Das wahrgenommene soziale Interaktionsverhalten Peppers wurde am Ende der Studie mit einer Skala von Spatola et al. (2021) erhoben. Soziodemographische Daten und Vorwissen (selbst entwickelter Test) wurden zu Beginn der Studie erhoben. Der Lernfortschritt wurde anhand der Leistung im ITS aus Logfiledaten ermittelt. Die kognitive Belastung wurde mit einem angepassten Test zur Messung der kognitiven Flexibilität (voluntary task switching; Arrington & Logan, 2004) vor und nach der Studie gemessen. Unter Kontrolle der Einbindungsart des Roboters (physisch oder virtuell) und Gender spezifizierten wir ein Pfadmodell in Mplus 8.7. Ergebnisse Unsere Ergebnisse zeigen, dass ein als störender wahrgenommenes soziales Interaktionsverhalten von Pepper und höhere kognitive Belastung vor der Arbeit mit dem ITS negativ mit Lernfreude und Konzentration assoziiert waren. Lernfreude während der Arbeit mit dem ITS war negativ und Konzentration positiv mit kognitiver Belastung im Post-Test assoziiert. Vorwissen war mit geringerer kognitiver Belastung im Posttest und mit höherem Lernfortschritt assoziiert. Höhere kognitive Belastung im Post-Test wiederum stand im Zusammenhang mit geringerem Lernfortschritt. Jungen wiesen generell einen höheren Lernfortschritt auf als Mädchen, wobei dieser Zusammenhang nicht durch die wahrgenommene Interaktion mit dem Roboter, Lernfreude oder Konzentration mediiert war. Unsere Ergebnisse weisen auf die hohe Bedeutung kognitiver Belastung für den Lernfortschritt in einem technologiegestützten Lernsetting, konkret im Kontext eines ITS mit Roboter-Komponente, hin. Lernfreude und Konzentration spielten eine zentrale Rolle für die kognitive Belastung nach der Arbeit mit dem ITS. Dabei war das wahrgenommene soziale Interaktionsverhalten von Pepper assoziiert mit Lernfreude und Konzentration. Die Studie trägt zu einem besseren Verständnis motivational-affektiver und kognitiver Prozesse während der Arbeit in technologiegestützten Lernsettings bei.
13:10 - 14:50	2-07: Diagnostische Kompetenzen von Lehrkräften im Bereich des selbstregulierten Lernens Ort: H06
	Symposium Diagnostische Kompetenzen von Lehrkräften im Bereich des selbstregulierten Lernens Chair(s): Yves Karlen (Universität Zürich, Schweiz) Diskutant*in(nen): Jens Möller (tian-Albrechts-Universität zu Kiel) Selbstreguliertes Lernen (SRL) hat sich als entscheidende Fähigkeit für schulischen Erfolg und lebenslanges Lernen herausgestellt. Vielen Schüler:innen fällt es jedoch schwer, ihr Lernen erfolgreich selbst zu regulieren, da dies ein komplexer und anstrengender Prozess ist (Wirth et al., 2020). Damit Schüler:innen Fähigkeiten im SRL entwickeln können, ist es bedeutsam, dass die Lehrkräfte das SRL angemessen im Klassenzimmer fördern (Dignath & Veenman, 2021). Hierfür müssen Lehrkräfte einschätzen, welche Schüler:innen SRL beherrschen und welche Schüler:innen mehr Mühe im SRL haben, um einen adaptiven Unterricht zu gestalten, der auf das SRL-Fähigkeitsniveau aller Lernenden zugeschnitten ist (Corno, 2008). Ob Lehrkräfte Lernumgebungen bereitstellen, die das SRL der Schüler:innen anregen und fördern, hängt somit von ihren professionellen Kompetenzen ab, insbesondere von ihren diagnostischen Kompetenzen in Bezug auf das SRL (Karlen et al., 2020). Allerdings gibt es bisher nur wenige Untersuchungen zu den diagnostischen Kompetenzen von Lehrkräften zum SRL und damit zur Urteilsgenauigkeit von Lehrkräften zum SRL. Hier setzt das Symposium an und geht der übergeordneten Frage nach, inwieweit es Lehrkräften gelingt, die SRL-Kompetenzen von Schüler:innen einzuschätzen. Es wird überprüft, welche lehrpersonenbezogenen (z. B. Wissen; Überzeugungen) und aufgabenbezogenen (z. B. nicht-diagnostische Informationen) Merkmale die Urteilsleistung der Lehrkräfte beeinflussen. In der ersten Studie des Symposiums wurden (angehende) Lehrpersonen aus drei Ländern einer der drei verschiedenen experimentellen Bedingungen für die Präsentation von diagnostischen Hinweisen zugeteilt: a) nur diagnostische Hinweise, b) sowohl diagnostische als auch nicht-diagnostische Hinweise oder c) diagnostische und nicht-diagnostische Hinweise mit Informationen darüber, welche Hinweise nicht-diagnostisch sind. In jeder Bedingung musste jede Lehrkraft die SRL-Kompetenzen (verschiedene Strategien) von vier fiktiven Schülerinnen bewerten. Es wurden unterschiedliche fiktive Lernproben der Schülerinnen präsentiert, u. a. Lerntagebucheinträge, handschriftliche Abschriften aus dem Unterricht und soziale Schulberichte. Zudem wird untersucht, inwiefern Lehrpersonenmerkmale (u. a. Vorwissen, Selbstwirksamkeit) die Urteilsgenauigkeit beeinflussen. In der zweiten Studie wird geprüft, wie akkurat Lehrkräfte den Einsatz von SRL-Strategien bei Schüler:innen beurteilen können und inwiefern diese Einschätzungen durch verschiedene professionelle Kompetenzen der Lehrkräfte (u. a. Wissen, Überzeugungen, Selbstwirksamkeit) beeinflusst werden. Zur Messung der Urteilsgenauigkeit bezüglich SRL wurde ein Instrument genutzt, das im Sinne des Verfahrens des Simulierten Klassenzimmers der Lehrkraft Lernproben (Strategieinterview) einer fiktiven Schülerin darbietet. Die dritte Studie untersucht in einem längsschnittlichen Design, inwieweit es Lehrkräften gelingt, verschiedene SRL-Kompetenzen ihrer eigenen Schüler:innen einzuschätzen und inwiefern sich die Urteilsgenauigkeit der Lehrkräfte über die Zeit verändert. Die Lehrkräfte mussten hierbei sowohl Selbstberichte (Mindsets, Beharrlichkeit) als auch Wissenscores, die mit einem Online-Diagnosetool erhoben wurden, ihrer Schüler:innen einschätzen. Insgesamt zeichnet sich das Symposium durch unterschiedliche Untersuchungsdesigns (Querschnitts-, Längsschnitt- und experimentelle Studien) und durch die Berücksichtigung verschiedener Aspekte des SRL (u. a. Strategien, metakognitives Wissen) aus, die in unterschiedlichen Formen (Lerntagebucheinträge, Lerninterviews, Wissenstests) und mit Bezug auf fiktive und reale Schüler:innen präsentiert wurden. Alle Beiträge betonen, dass für gewisse Lehrkräfte die akkurate Einschätzung des SRL von Schüler:innen herausfordernd ist. Gleichzeitig wird deutlich, dass weiterer Forschungsbedarf besteht, um das Zusammenspiel verschiedener Kompetenzaspekte von Lehrkräften und aufgabenbezogenen Merkmalen und deren Bedeutung für die Urteilsgenauigkeit besser zu verstehen und daraus Implikationen für die professionelle Entwicklung von Lehrkräften im Bereich SRL abzuleiten. Beiträge des Symposiums Nicht-diagnostische Hinweise bei der Diagnose selbstregulierten Lernens durch Lehrkräfte Swantje Tannert¹, Yves Karlen², Engin Ader³, Inga Glogger-Frey¹, Silke Hertel⁴ ¹Universität Erfurt, ²Universität Zürich, ³Boğaziçi Universität, ⁴Universität Heidelberg Die Fähigkeit zum selbstregulierten Lernen (SRL) ist entscheidend für Lernende, da eng mit akademischem Erfolg verbunden (Dent & Koenka, 2016). Leider bleibt die Fähigkeit zum SRL trotz ihrer Bedeutsamkeit oft unterentwickelt (Karlen, 2016) und wird in Schulen nicht konsequent vermittelt (Dignath & Veenman, 2021). Lehrkräfte stehen vor der Herausforderung, sowohl ihre eigenen professionellen SRL-Kompetenzen zu entwickeln als auch die entsprechenden Kompetenzen bei ihren Lernenden gezielt zu fördern (Karlen et al., 2020). Ein Teilaspekt dieser professionellen Kompetenzen umfasst die Diagnose der SRL-Fähigkeiten von Lernenden. Studien zu den allgemeinen diagnostischen Kompetenzen haben gezeigt, dass Lehrpersonen Mühe mit der Einschätzung nicht kognitiver Merkmale haben (Oudman et al., 2018; Van de Pol 2021; Furnari et al., 2017; Paleczek et al., 2017) und gelegentlich auf falsche Hinweise zurückgreifen, insbesondere wenn Fehlkonzepte und Wissenslücken zur einzuschätzenden Fähigkeit vorhanden sind (Glogger-Frey et al., 2018; Oudman et al., 2018). Diese Studie hat zum Ziel die diagnostischen Kompetenzen (angehender) Lehrpersonen im Hinblick auf das SRL zu untersuchen. Es wird angenommen, dass die Lehrpersonen nicht-diagnostische Hinweise verwenden, wenn diese verfügbar sind, was zu ungenauen diagnostischen Einschätzungen führt. Darüber hinaus wird erwartetet, dass Informationen über die Nicht-Diagnostizität dieser nicht-diagnostischen Hinweise die Urteilsgenauigkeit der Lehrkräfte verbessern würden. Insgesamt nahmen 262 (angehende) Lehrpersonen aus drei Ländern an dieser Studie teil und wurden zufällig einer der folgenden drei Bedingungen für die Präsentation von Hinweisen zugeteilt: a) nur diagnostische Hinweise, b) sowohl diagnostische als auch nicht-diagnostische Hinweise oder c) diagnostische und nicht-diagnostische Hinweise mit Informationen darüber, welche Hinweise nicht-diagnostisch sind. Jede Versuchsperson bewertete die SRL-Fähigkeiten von vier fiktiven Schülerinnen einmal global auf einer siebenstufigen Skala und einmal getrennt nach den einzelnen SRL-Aspekten (Wiederholung, Organisation, Vertiefung, metakognitive Planung, Überwachung und Evaluation). Diagnostische Hinweise waren sorgfältig erstellte Lerntagebucheinträge, während nicht-diagnostische Hinweise handschriftliche Abschriften aus dem Unterricht und soziale Schulberichte waren, die z.B. die Teilnahme der Lernenden am Unterricht bewerteten. Die Analyse ergab signifikante Unterschiede in der Genauigkeit der globalen Bewertungen (F(2, 260) = 10,91, p < .001) und der Bewertungen einzelner Aspekte (F(2, 260) = 8,51, p < .001) der SRL-Fähigkeiten in den experimentellen Bedingungen. Die Bedingung mit ausschließlich diagnostischen Hinweisen erzielte die höchste Genauigkeit, mit einer durchschnittlichen globalen Genauigkeit von mglobal = 0.79 und einer durchschnittlichen Genauigkeit für Einzelaspekte von meinzel = 0.49. Im Gegensatz dazu führte die nicht-informierte Bedingung, die sowohl diagnostische als auch nicht-diagnostische Hinweise enthielt, zu der niedrigsten Diagnosegenauigkeit, mit mglobal = 0.71 und meinzel = 0.39. Darüber hinaus wurde ein signifikanter Unterschied in den globalen Bewertungen zwischen der informierten und nicht-informierten Bedingung festgestellt (T(178) = 1,68, p < .05, einseitig). Interessanterweise zeigten die Versuchpersonen bessere Urteilsfähigkeit bei der Bewertung metakognitiver Aspekte im Vergleich zu kognitiven Aspekten des SRL (T(262) = 3,68, p < .01). Unter den einzelnen Kategorien erhielten Wiederholung und Planung die genauesten Bewertungen, während die geringste Genauigkeit bei der Bewertung der Fähigkeit der Lernenden zur Organisation ihres Wissens festgestellt wurde (F(5, 1566) = 10,64, p < .001). Bemerkenswerterweise beeinflussten weder Selbstwirksamkeit noch Einstellungen zur Bedeutung des SRL die Urteilsleistung oder die Gruppenunterschiede. Wichtig ist, dass es keine signifikante Korrelation zwischen Vorwissen und Urteilsgenauigkeit gab, weder in den globalen noch in den Einzelaspekten. Die Ergebnisse sind konsistent zu früheren Befunden zur Nutzung nicht-diagnostischer Hinweise (Oudman et al., 2018; Van de Pol 2021; Furnari et al., 2017; Paleczek et al., 2017). Die Abwesenheit einer Korrelation zwischen Urteilsgenauigkeit und Vorwissen jedoch steht im Widerspruch zu früheren Befunden (Kramer et al., 2021; Renkl et al., 2009). Als mögliche Erklärungen werden der sehr niedrige Mittelwert und die fehlende Varianz diskutiert. Darüber hinaus wird die Möglichkeit besprochen, dass eher das Vorwissen über Diagnoseprozesse, welches nicht erfasst wurde, die Diagnosegenauigkeit beeinflusst (Pickal et al., 2023). Was macht einen guten Diagnostiker aus? Zum Zusammenhang der SRL-Kompetenz von Lehrkräften mit ihrer Urteilsgenauigkeit beim Erkennen von SRL-Strategien Charlotte Dignath, Antonia Fischer TU Dortmund Selbstregulation beim Lernen (SRL) wirkt sich positiv auf Lernerfolg und Lernmotivation aus und ihre Förderung stellt einen wesentlichen Bildungsauftrag von Lehrkräften dar. Hierzu brauchen diese eine konkrete Vorstellung davon, wie selbstreguliert ihre Schüler bereits lernen (Dignath & Karlen, 2023). Nur sehr wenig Forschung hat sich bislang mit der Diagnose von SRL durch Lehrkräfte beschäftigt und womit diese zusammenhängt (Van de Pol et al., 2019). Ziel der Studie war daher zu untersuchen, welche Aspekte professioneller SRL-Kompetenz die Urteilsgenauigkeit von Lehrkräften bzgl. SRL vorhersagen. Die folgenden Forschungsfragen wurden untersucht: (1) Wie akkurat können Lehrkräfte den Einsatz von SRL-Strategien beurteilen? (2) Wird diese SRL-Urteilsgenauigkeit durch professionelle SRL-Kompetenzen der Lehrkraft vorhergesagt? Messung der SRL-Urteilsgenauigkeit. Zur Messung der Urteilsgenauigkeit wurde ein Instrument genutzt, das der Lehrkraft im Sinne des Verfahrens des Simulierten Klassenzimmers Lernproben einer fiktiven Schülerin darbietet, die bzgl. des Einsatzes von SRL-Strategien beurteilt werden soll (Dignath & Van de Pol, in Begutachtung). Die hier eingesetzte Lernprobe bestand aus einem Strategieinterview, in dem die Schülerin zu ihrem Lernverhalten befragt wurde, und wurde als Audiodatei und Transkript dargeboten. Für alle 14 Aussagen der Schülerin muss die Lehrkraft entscheiden, ob diese ein Indikator für ein strategisches Vorgehen ist. Messung der professionellen SRL-Kompetenz. Zur Erfassung des SRL-Wissens beantworteten die Lehrkräfte in einem offenen Antwortformat die Frage, was Sie unter Selbstregulation beim Lernen verstehen. Die Antworten wurden mit einem systematischen Kodierschema ausgewertet (Dignath & Sprenger, 2020), κ = .77, 95% CI [.70, .84]. Die Überzeugungen bzgl. SRL (Beliefs about Teaching and Learning (BALT) Questionnaire [Darmawan et al., 2020], Ω = .89) sowie die Selbstwirksamkeit der Lehrkraft, SRL effektiv fördern zu können (Teacher Self-Efficacy Scale to Implement SRL [TSES-SRL, De Smul et al., 2018], Ω = .94) wurden mithilfe von Fragebögen erfasst. Auch die eigene Selbstregulation der Lehrkraft beim Arbeiten (Dörrenbächer & Perels, 2016, Ω = .82) sowie die selbstberichtete Förderung von SRL im Unterricht (Self-Regulated Learning Inventory for Teachers [SRLIT; Lombaerts et al., 2007], für direkte Förderung: Ω = .83, für indirekte Förderung: Ω = .88) wurden mittels Fragebögen erhoben. Stichprobe. Insgesamt nahmen 206 Lehrkräfte an der Online-Datenerhebung teil (MAlter = 37.46 Jahre, SDAlter = 10.02, 82% weiblich, Unterrichtserfahrung: M = 10.62 Jahre, SD = 8.96). Ergebnisse. Mit Blick auf die SRL-Kompetenz erzielten die Lehrkräfte relativ niedrige Werte beim Wissen über SRL (M = 2.31, SD = 2.22 auf einer Skala von 1-10). Wie erwartet hatten sie im Durchschnitt mehr mit SRL-Theorie konsistente Überzeugungen (M = 4.98, SD = 0.49 auf einer 6-stufigen Skala) als inkonsistente Überzeugungen (M = 2.22, SD = 0.52). Die Selbstwirksamkeitsüberzeugungen waren überdurchschnittlich hoch (M = 3.52, SD = 0.55 auf einer 5-stufigen Skala), wie auch ihre Einschätzung ihrer eigenen Selbstregulation (M = 3.13, SD = 0.47 auf einer 4-stufigen Skala). Für die Förderung von SRL im Unterricht gaben die Lehrkräfte im Durchschnitt eine mittlere Einschätzung ab (für direkte Förderung: M = 3.28, SD = 0.55; für indirekte Förderung: M = 3.26, SD = 0.49 auf einer 5-stufigen Skala). Die Daten zur SRL-Urteilsgenauigkeit werden derzeit ausgewertet. Bis zur Konferenz werden die Ergebnisse der Regressionsanalysen zur Vorhersage der SRL-Urteilsgenauigkeit vorliegen. Wie schätzen Lehrkräfte die Kompetenzen im selbstregulierten Lernen ihrer Lernenden ein? Yves Karlen¹, Sabrina Brunner¹, Martina Conti¹, Ferdinand Stebner², Kerstin Bäuerlein¹ ¹Universität Zürich, ²Universität Osnabrück Selbstreguliertes Lernen (SRL) ist entscheidend für erfolgreiches lebenslanges Lernen und ein wichtiges Bildungsziel (OECD, 2019). Selbstregulierte Schüler:innen setzen sich angemessene Ziele und regulieren ihren Lernprozess durch den Einsatz verschiedener kognitiver, metakogniti-ver, motivationaler und ressourcenbezogener Strategien (Pintrich, 2000). Erfolgreiche selbstregulierte Lernende sind motiviert, ihren Lernprozess zu überwachen und zu regulieren und ihr metakognitives Wissen zu aktivieren, um Strategien zielgerichtet einzusetzen (Pressley et al., 1989). Darüber hinaus haben sie ein "growth Mindset", d.h. sie sind davon überzeugt, dass ihre SRL-Kompetenzen durch Übung und Anstrengung verbessert werden können (Hertel & Karlen, 2021). Viele Schüler:innen bekunden jedoch Mühe bei der Selbstregulation ihres Lernens und benötigen eine angemessene Unterstützung durch ihre Lehrkräfte. Dies setzt voraus, dass die Lehrkräfte die SRL-Kompetenzen ihrer Schüler:innen genau einschätzen können. Es gibt nur wenige Untersuchungen zur diagnostischen Kompetenz von Lehrkräften im Bereich des SRL. Diese deuten darauf hin, dass diese Aufgabe für die Lehrkräfte anspruchsvoll ist und dass sie Schwierigkeiten haben, ein genaues Urteil zu fällen (Karlen et al., 2023; Stang & Urhahne, 2016; van de Pol & Oudman, 2023). Ziel dieser Studie ist es zu untersuchen, 1) wie genau Lehrkräfte verschiedene SRL-Kompetenzen ihrer Schüler:innen einschätzen und 2) inwiefern sich die Ur-teilsgenauigkeit der Lehrkräfte über die Zeit verändert. An dieser Längsschnittstudie nahmen N = 40 Lehrkräfte (60.00% weiblich) der Sekundarstufe I (M = 13.51 Jahre Berufserfahrung, SD = 10.85) mit ihren Klassen teil. Die Lehrpersonen schätz-ten verschiedene SRL-Kompetenzen der ersten vier Schüler:innen auf ihrer Klassenliste ein. Von diesen Schüler:innen nahmen N = 155 (42.58% weiblich) mit einem Alter von M = 14.15 Jahren (SD = 0.86) an der Studie teil. Die Schüler:innen füllten einen Online-Fragebogen (u.a. zu demographischen Angaben) aus und bearbeiteten in einem Online-Diagnosetool Selbstberichtaufgaben (Mindsets und Beharrlichkeit) und metakognitive Wissenstests zu verschiedenen SRL-Kompetenzbereichen (kognitive Strategien, Motivationsregulation, Zeitplanung, Nachdenken über das Lernen und Lernumgebung). Um den Grad der Übereinstimmung zwischen den Ein-schätzungen der Lehrkräfte und den tatsächlichen Merkmalen der Schüler:innen zu bestimmen, wurden Differenzwerte und Korrelationen berechnet. Die Mehrebenenstruktur der Daten wurde berücksichtigt, indem Analysen mit in Klassen geclusterten Schüler:innen berechnet wurden. Die Ergebnisse weisen darauf hin, dass die Einschätzungen der Lehrkräfte mit den Selbstberichten und den Wissensscores der Schüler:innen nur in geringem Umfang überein-stimmen (t1 r = .11. bis r = .34; t2 r = .03. bis r = .36). Die berechneten Differenzwerte zwischen den Einschätzungen der Lehrpersonen und den tatsächlichen Merkmalen der Schüler:innen un-terscheiden sich zwischen t1 und t2 nur beim Kompetenzbereich Motivationsregulation. Hier zeigt sich eine signifikant schlechtere Urteilsgenauigkeit zum zweiten Messzeitpunkt (Mdiff = -0.29, p < .05). Hinsichtlich der Entwicklung der Urteilsgenauigkeit kann unterschieden werden zwischen Lehrkräften mit zu t1 hoher versus niedriger Urteilsgenauigkeit in einem Kompetenzbereich (Median-Split). So zeigt sich bei tiefer Urteilsgenauigkeit zu t1 in den meisten SRL-Kompetenzbereichen (ausser bei Mindsets) eine Verbesserung der Urteilsgenauigkeit zu t2. Bei den Lehrpersonen mit zu t1 höherer Urteilsgenauigkeit gab es keine Veränderung über die Zeit. Es könnte demnach sein, dass die Nutzung des Online-Tools insbesondere für Lehrkräften mit geringer Urteilsgenauigkeit hilfreich ist. Insgesamt machen diese Ergebnisse deutlich, dass Lehrkräfte bei der Entwicklung ihrer diagnostischen Kompetenz im Bereich des SRL mehr Unterstützung benötigen.
13:10 - 14:50	2-08: Unterrichtsstörungen als Interaktionsereignis: Empirische Untersuchungen zu Abweichungen, Herstellung und Wahrnehmung von Interaktionsordnungen im Unterricht Ort: S18
	Symposium Unterrichtsstörungen als Interaktionsereignis: Empirische Untersuchungen zu Abweichungen, Herstellung und Wahrnehmung von Interaktionsordnungen im Unterricht Chair(s): Nina C. Jansen (Bergische Universität Wuppertal, Deutschland), Matthias Herrle (Bergische Universität Wuppertal, Deutschland), Claudia Schuchart (Bergische Universität Wuppertal, Deutschland) Diskutantin(nen): Markus Neuenschwander (Pädagogische Hochschule Fachhochschule Nordwestschweiz) Grundlegend für die im Symposium versammelten Forschungsansätze ist ein Verständnis von Unterricht als komplexem, durch multimodale Interaktionen zwischen Lehrkräften und Schülerinnen ko-konstruiertem Prozess (Proske, Rabenstein & Meseth, 2022; Vieluf, Praetorius, Rakoczy, Kleinknecht & Pietsch, 2020). Im Zusammenhang dieses interaktiven Prozesses werden soziale Ordnungen und damit verbundene Verhaltenserwartungen im Zusammenspiel schülerinnen und lehrkraftseitiger Interaktionspraktiken produziert (Hester & Francis, 2000). Während sowohl Schülerinnen als auch Lehrkräfte an der kontextbezogenen Herstellung unterrichtlicher Interaktionsordnungen beteiligt sind, wird insbesondere von Lehrkräften die Übernahme von Verantwortung zur Steuerung und Gestaltung des Interaktionsgeschehen als lehr-lernbezogenes Geschehen erwartet (Ophardt & Thiel, 2013). Verbunden damit sind Anforderungen der Etablierung, Aufrechterhaltung und Wiederherstellung von Interaktionsordnungen (Decristan, Jansen & Fauth, 2023; Thiel, 2016). Das der Lehrkraft obliegende Wiederherstellen einer erwarteten sozialen Ordnung (Doyle, 2006, 2013) wird relevant, wenn von korrespondierenden Verhaltenserwartungen abweichendes, überwiegend schülerinnenseitiges Verhalten (Scherzinger, Wettstein & Wyler, 2018) zu Störungen der Interaktionen zwischen Lehrkräften und Schülerinnen im Unterricht führt (Lohmann, 2018; Thiel, 2016; Wettstein & Scherzinger, 2019). Dementsprechende Unterrichtsstörungen, die das Lehren und Lernen „behindern“ (Nolting, 2017, S. 13), „unterbrechen oder unmöglich machen“ (Lohmann, 2018, S. 13), stellen ein alltägliches Phänomen in der unterrichtlichen Praxis dar (Eckstein, Grob & Reusser, 2016; Krause, 2004; OECD, 2014) und lassen Unterricht als „störanfällige Interaktionsordnung“ (Proske et al., 2022) gelten. Um Unterrichtsstörungen als Störungen der unterrichtlichen Interaktionsordnung zu untersuchen, wird in diesem Symposium eine multiperspektivische Betrachtung des Phänomens vorgenommen, was in der empirischen Bildungsforschung bislang noch eher selten vorzufinden ist (Helsper & Klieme, 2013). Mit Hilfe quantitativer und qualitativer Ansätze wird in den Beiträgen zum Symposium untersucht, a) wie Lehrkräften im Unterricht mit schülerinnenseitigen Störungen der Interaktionsordnung umgehen, b) wie Interaktionsordnungen durch Praktiken der Interaktionssteuerung (lehrkraftseitig) überhaupt hergestellt werden und c) wie bestehende Ordnungen schülerinnenseitig wahrgenommen werden und ob dies mit bestimmten Verhaltensweisen der Schülerinnen im Unterricht assoziiert ist. Beitrag A führt mit der quantitativen Methode der Verhaltensbeobachtung in das Symposium ein und systematisiert welche Formen von Schülerinnenverhalten sich in klassenöffenlichen Unterrichtssettings als Störungen der unterrichtlichen Interaktionsordnung beobachten lassen. Dabei unterscheidet der Beitrag zwischen aktiven Störungen der Unterrichtsinteraktion und passiven Störungen und untersucht auf Basis dessen, welchen interaktionalen Umgang mit den jeweiligen Störungsformen Lehrkräfte zur Wiederherstellung von Interaktionsordnungen im Unterricht einsetzen. Diesbezüglich zeigt der Beitrag auf, dass aktive Störungen zwar seltener stattfinden, sich aber ein signifikanter Zusammenhang mit einem regulierend-reaktiven, lehrkraftseitigen Umgang - in Form von Ermahnungen - beobachten lässt. Passive Störungen treten dagegen häufiger auf, stehen jedoch mit keiner untersuchten Form des lehrkraftseitigen Umgangs mit Störungen der Interaktionsordnung in systematischem Zusammenhang. Vor dem Hintergrund dieser differenziellen Befunde zum lehrkraftseitigen Umgang mit Störungen der unterrichtlichen Interaktionsordnung stellt Beitrag B die Frage, wie geltende Interaktionsordnungen und Verhaltenserwartungen im Unterricht durch Lehrkräfte überhaupt kommuniziert werden. Dazu analysiert der Autor lehrkraftseitige Praktiken der Interaktionssteuerung im Rahmen einer qualitativ-rekonstruktiven Analyse von mehrperspektivischen Unterrichtsvideos. Herausgearbeitet werden Differenzen zwischen verbal-expliziten und nonverbal-impliziten Praktiken der Interaktionssteuerung, kontextbezogene Besonderheiten ihres Auftretens in Settings, in denen starke oder abgeflachte Rollenasymmetrien zwischen Lernenden und Lehrkräften vorherrschen sowie Anforderungen, Chancen und Risiken, die mit dem Einsatz nonverbal-impliziter Praktiken der Interaktionssteuerung für die Entstehung von Störungen einhergehen können. An diese zentralen Befunde unterschiedlicher lehrkraftseitiger Praktiken der Vermittlung geltender Interaktionsordnungen und ihrer Implikationen für den Unterrichtsprozess schließt Beitrag C mit einem Fokus auf die Schülerinnenperspektive an und untersucht im Rahmen eines Mixed-Methods-Ansatzes die schülerinnenseitige Wahrnehmung sozialer Ordnungen und deren Einfluss auf das Schülerinnenverhalten. Die Befunde der Untersuchung deuten auf komplexes Wissen der Schülerinnen zu verschiedenen Aspekten unterrichtlicher Interaktionsordnungen hin, welches allerdings in keinem signifikanten Zusammenhang mit gezeigtem Unterrichtsverhalten steht. Beiträge des Symposiums Störungen der unterrichtlichen Interaktionsordnung durch Schülerinnen und der lehrkraftseitige Umgang Nina C. Jansen, Jasmin Decristan Bergische Universität Wuppertal, Deutschland Unterrichtsstörungen manifestierten sich als Ausprägung dysfunktionaler unterrichtlicher Interaktionen zwischen Schülerinnen und Lehrkräften (Nolting, 2017; Winkel, 2011). Dadurch werden geltende Interaktionsordnungen von Unterrichtssettings gestört (Thiel, 2016; Wettstein & Scherzinger, 2019), was sich negativ auf den Unterrichtverlauf auswirken kann (Scherzinger et al., 2018; Winkel, 2011), die zur Verfügung stehende aktive Lernzeit reduziert (Angus et al., 2010; Scherzinger & Wettstein, 2019) und auf diese Weise die Lernprozesse einzelner Schülerinnen oder ganzer Lerngruppen negativ beeinträchtigt (Helmke & Weinert, 1997; Wettstein & Scherzinger, 2019). Die Ausprägungsformen dieser Störungen lassen sich grundsätzlich in aktive (nach außen gerichtete) und passive (innerliche) Verhaltensweisen unterscheiden (Nolting, 2017). Aktive Störungen können durch ihre expressiven Ausprägungen (z.B. motorische Unruhe oder unpassende Lautäußerungen) die Interaktionsordnung einer gesamten Lerngruppe und somit deren Lehren und Lernen stören (Lohmann, 2018; Nolting, 2017). Passive Störungen (z.B. in Form von Tagträumerei oder Ablenkung) beeinträchtigen vor allem die Lernprozesse betroffener Schülerinnen selbst (Nolting, 2017). Beide Formen verletzen Verhaltenserwartungen im Kontext geltender Interaktionsordnungen (Hester & Francis, 2000) und stören somit die Interaktion zwischen Lehrkräften und Schülerinnen. Infolge dieser unterschiedlichen Implikationen kann erwartet werden, dass Lehrkräfte differenziell mit den beschriebenen Störungsformen umgehen (Plax, Kearney, McCroskey & Richmond, 1986; Thiel, 2016), um gestörte unterrichtliche Interaktionsordnungen wiederherzustellen (Doyle, 2006, 2013). So kann angenommen werden, dass Lehrkräfte mit dem Ziel einer schnellen Unterbindung disruptiver, aktiver Störungen, einen regulierenden Umgang, durch verbale Interventionen wie Ermahnungen, wählen (z.B. Keller, 2014; Nolting, 2017). Im Umgang mit dem weniger disruptiven Störungspotential passiver Störungen kann dagegen ein aktivierender Umgang, z.B. über Aufruf zur (Wieder-)Einbindung ins Unterrichtsgespräch, angenommen werden (Keller, 2014), denn diese können einerseits eine Refokussierung der Aufmerksamkeit betroffener Schülerinnen fördern und andererseits implizit an geltende Verhaltenserwartungen erinnern (z.B. aktive Partizipation statt Tagträumen im Unterrichtsgespräch). Die empirische Untersuchung entsprechender Zusammenhänge lehrkraftseitiger Verhaltensweisen im Umgang mit aktiven bzw. passiven Ausprägungsformen von Störungen der unterrichtlichen Interaktionsordnung stellt jedoch bisher ein Desiderat der Unterrichtsforschung dar. Daher untersucht diese Studie: Welche Ausprägungsformen schülerinnenseitiger Störungen der unterrichtlichen Interaktionsordnung lassen sich im klassenöffentlichen Unterrichtsgespräch beobachten? Welche lehrkraftseitigen Umgangsformen steht mit den Ausprägungsformen schülerinnenseitiger Störungen der unterrichtlichen Interaktionsordnung in Zusammenhang? Dazu wurden 10-minütige Videosequenzen des klassenöffentlichen Unterrichtsgesprächs aus 35 Lerngruppen (681 Schülerinnen) der dritten Jahrgangsstufen an Grundschulen in Deutschland selektiert und aktive sowie passive, schülerinnenseitge Störungen der Interaktionsordnung anhand eines niedrig-inferenten Kategoriensystems erfasst. Geschulte Beobachterinnen kodierten das Auftreten (1) bzw. Nicht-Auftreten (0) typischer Verhaltensindikatoren der beiden Kategorien (in Anlehnung an die definitorische Grundlage von Nolting, 2017) in 30-sekündigen Intervallen für jeden teilnehmenden Schülerin (aktive Störungen – substanzielle IRR, Fleiss κ = .67; passiver Störungen – moderate IRR, Fleiss κ = .57, Landis & Koch, 1977). Die lehrkraftseitigen Verhaltensweisen im Umgang mit diesen Störungen wurde im Rahmen eines ergänzenden Kodiersystems erfasst und in Form von Ermahnungen (regulierender Umgang) und Aufrufen ohne Meldung (aktivierender Umgang) einbezogen. Die Ergebnisse dieses Beitrags zeigen im klassenöffentlichen Unterrichtsgespräch ein häufigeres Auftreten passiver Störungen, die mit 42% aller Kodierungen in knapp der Hälfte aller Beobachtungssequenzen dokumentiert wurden, gegenüber aktiven Störungen, die in nur 14% der ausgewerteten Sequenzen kodiert wurden. Beide Störungsformen korrelierten nicht signifikant miteinander. Mehrebenen-Regressionsanalysen zeigen bei der Analyse des Interaktionsgeschehens innerhalb von Lerngruppen (within class), dass aktive Störungsformen mit einem regulierenden Umgang der Lehrkräfte durch Ermahnungen assoziiert waren. Für passive Störungen finden sich dagegen keine signifikanten Zusammenhänge mit dem untersuchten regulierenden oder aktivierenden, lehrkraftseitigen Umgang mit diesen Störungsereignissen. Die Befunde zum Umgang mit aktivem Störverhalten bei Schülerinnen untermauern bisherige Annahmen anhand empirischer Daten. Das Fehlen eines Zusammenhangs von passiven, schülerinnenseitigen Störungen mit den untersuchten Formen des lehrkraftseitigen Umgangs mit Störungen (Ermahnungen bzw. Aufrufe ohne Meldung), soll im Rahmen des Symposiums hinsichtlich möglicher Ursachen (z.B. ein weniger konsistenter Umgang oder ein allgemein selteneres, lehrkraftseitiges Adressieren von weniger disruptiven Störungsformen) diskutiert werden. Störungsfreiheit als ganz normale Unwahrscheinlichkeit?! Empirische Untersuchungen zu Praktiken und Kontexten der Herstellung von Interaktionsordnungen klassenöffentlichen Unterrichts Matthias Herrle Bergische Universität Wuppertal, Deutschland Anschließend an ethnomethodologische Ansätze der Unterrichtsinteraktionsforschung im anglo-amerikanischen Raum (Cazden, 1986; Hester & Francis, 2000; O’Connor & Snow, 2018) kann Unterricht als in-situ-Geschehen betrachtet werden, das aus der Verkettung multimodaler Interaktionsereignisse emergiert. Interaktionsordnungen werden im Unterricht konstruiert, indem selektiv Interaktionsbeiträge von Lehrkräften und Schüler:innen aneinander anschließen bzw. deren Nicht-Anschließen als Erwartungsabweichung kommuniziert wird (Proske et al., 2022). Je nach Kontext werden dabei bestimmte Verhaltensweisen als (in)adäquat interpretiert: „each context makes different interactional demands on the memberts of the class“ (Shultz & Florio, 1979, S. 169). Aus dieser Perspektive kann Unterricht „als störanfällige Interaktionsordnung“ (Proske et al. 2022, S. 916) betrachtet werden, für dessen Herstellung und Aufrechterhaltung von den Beteiligten praktisch-operative Lösungen gefunden werden müssen. Aufgrund der asymmetrisch angelegten Rollenverteilung in (Schul-)Unterrichtssettings fungiert die Lehrkraft als primär verantwortlich für die Herstellung sozialer Ordnungen (Paoletti & Fele, 2004), indem sie Handlungsprogramme situativ in primäre Handlungsvektoren übersetzt, auf die sie „die Schülerinnen und Schüler verpflichtet“ (Ophardt & Thiel, 2013, S. 53). Aus dieser Perspektive erscheinen Unterrichtsstörungen als Abweichungen von Ordnungserwartungen, die durch Aktivitäten in Relation zum Kontext ihrer Hervorbringung bzw. in Relation zu dem von der Lehrkraft situativ-enaktierten Handlungsprogramm produziert werden: „misbehavior is any behavior by one or more students that is perceived by the teacher to initiate a vector of action that competes with or threatens the primary vector of action at a particular moment in a classroom activity” (Doyle, 2006, 2013, S. 112). Vor diesem theoretischen Hintergrund wird im Projekt „Pädagogische Interaktion als Koordinationsproblem“ die Frage verfolgt, welche multimodalen Praktiken Schüler:innen und insb. Lehrkräfte im Unterricht realisieren, um Interaktionsordnungen herzustellen und deren Reproduktion zu ermöglichen. Im hier projektierten Beitrag sollen Befunde einer Teilstudie dargestellt werden, in der die Fragestellung untersucht wird, wie Lehrkräfte Ordnungserwartungen im klassenöffentlichen Unterricht kommunizieren: Welche Interaktionspraktiken realisieren Lehrkräfte im Umgang mit Anforderungen der Interaktionssteuerung in Settings klassenöffentlichen Unterrichts? Gezielt wird bei dieser qualitativ-rekonstruktiv angelegten Studie darauf, ein breites Spektrum an Varianten der Interaktionssteuerung zu identifizieren und Hypothesen zu kontextbezogen Besonderheiten zu generieren. Als Grundlage dafür fungieren zwei Datenkorpora an mehrperspektivischen Videoaufzeichnungen des prozessförmigen Geschehens in Veranstaltungen der Erwachsenen-/Weiterbildung (n= 128) sowie des Haupt-, Real- und Gymnasialunterrichts der sechsten Klasse (n= 24). Zum Einbezug relevanter Fälle wird sich an Strategien des Theoretical Sampling orientiert (Glaser & Strauss, 2005), um anhand minimaler und maximaler Kontrastierungen das empirische Spektrum an Varianten lehrkraftseitiger Interaktionssteuerung auszuloten. Die Analyse der videographischen Daten orientiert sich an Ansätzen mikroethnographischer und konversationsanalytischer Interaktionsforschung (Erickson, 2006; Herrle, 2020; Mondana, 2016). Mit Hilfe segmentierungsanalytischer und sequenzanalytischer Verfahren werden Ablaufordnungen von Unterrichtsinteraktionen analysiert und kontextbezogen Formen und Funktionen von Interaktionspraktiken identifiziert, die Lehrkräfte im Umgang mit Herausforderungen der Interaktionssteuerung in Phasen klassenöffentlichen Unterrichts zum Einsatz bringen. Erste Befunde, die im Vortrag am Datenmaterial illustriert werden sollen, zeigen, dass (1) die Form von Praktiken der Interaktionssteuerung insbesondere hinsichtlich ihres Explizitheitsgrades bzw. der zu ihrer Darstellung genutzten Äußerungsressourcen differiert; (2) dass die selektive Realisierung von Praktiken der Interaktionssteuerung an das Ausmaß der im jeweiligen Kontext vorherrschenden Rollenasymmetrie zwischen Lehrkraft und Lernenden gebunden scheint – besondere Kontraste ergeben sich hier zwischen schulischen und volkshochschulischen Settings; (3) dass eine beiläufige Realisierung minimaler Übergänge zwischen Phasen im klassenöffentlichen Unterricht mit besonderen Anforderungen an die lehrkraftseitige Darstellung von Kontextualisierungshinweisen und deren Wahrnehmung und Interpretation durch die Schüler:innen gebunden ist, um eine störungsfreie Reproduktion der jeweiligen lehr-lernbezogenen Interaktionsordnung zu ermöglichen. Vor diesem Hintergrund erscheint weniger die Störungen als vielmehr die Ordnung von Unterricht als komplexes und erklärungsbedürftiges Phänomen (Vanderstraeten, 2001), zu dessen Aufklärung Untersuchungen zur Funktionsweise von Interaktionskontexten und zu Praktiken ihrer koordinierten Herstellung wichtige Beiträge liefern können (Herrle & Dinkelaker, 2018). „Nicht kippeln, nicht reinrufen und keinen Blödsinn machen.“ – Die Wahrnehmung schulischer Ordnung und ihr Einfluss auf das Unterrichtsverhalten von Grundschülerinnen Leon Dittmann, Benjamin Schimke, Doris Bühler-Niederberger, Claudia Schuchart Bergische Universität Wuppertal, Deutschland Regeln besagen, welches Verhalten im Rahmen der sozialen Ordnung der Schule als legitim gilt. Sowohl das theoretische als auch das didaktische Verständnis von Regeln impliziert, dass das Wissen über bestehende schulische Ordnungsstrukturen als Indikator für die Produktion legitimen und regelkonformen Verhaltens seitens der Schülerinnen betrachtet werden kann (Alter & Haydon, 2017). Ausgehend von einem interaktionistischen Verständnis schulischer Ordnung, welches deren Produktion nicht ausschließlich als eine Leistung der Lehrkräfte versteht, lässt sich schulische Ordnung als situativ und komplex beschreiben, da Regeln und Verhaltenserwartungen häufig unscharf, mehrdeutig oder widersprüchlich sind (Jäger, 2019; MacLure, Jones, Holmes & MacRae, 2012; Mehan, 2014; Schuchart & Bühler-Niederberger, 2022). Entgegen der lehrerinnenzentrierten Betrachtung schulischer Ordnung wird in diesem Beitrag die Perspektive der Kinder fokussiert, deren Beitrag bei der Aufrechterhaltung dieser Ordnung als zentral verstanden werden muss. Während es bereits Arbeiten gibt, die die subjektive Sicht von Schülerinnen auf Regeln und Sanktionierung retrospektiv mit Hilfe von Fragebögen untersuchen (z.B. Payne, 2015), verfolgen wir einen innovativen Ansatz, bei dem Experteninterviews mit Kindern mit deren objektiv beobachtetem Unterrichtsverhalten verknüpft werden können. Damit bearbeiten wir ein auch für Lehrkräfte relevantes Forschungsdefizit. So zeigt eine Studie von Kumschick, Piwowar und Thiel (2018), dass es Lehrkräften besser gelingt, adäquat auf Störungen zu reagieren, wenn sie die Perspektive der Schülerinnen kennen und berücksichtigen. In unserer explorativ angelegten Studie betrachten wir die folgenden Fragen: Wie wird schulische Ordnung aus der Perspektive von Grundschülerinnen wahrgenommen? Welchen Einfluss hat die individuelle Wahrnehmung von schulischer Ordnung auf das Verhalten der Grundschülerinnen im Unterricht? Wir verwenden einen Mixed-Methods-Ansatz, der sich aus Verhaltensbeobachtungen und qualitativen Interviews zusammensetzt. Die Beobachtungen wurden in 22 ersten Klassen in 209 Unterrichtsstunden von jeweils 2 geschulten Beobachterinnen zu 2 bis 5 Zeitpunkten durchgeführt. In Anlehnung an validierte Messinstrumente (Gadow, Sprafkin & Nolan, 1996; Muris, Meesters & van den Berg, 2003; Shapiro, 2011) wurden motorische, verbale, aggressive und passive Unterrichtsstörungen individuell erfasst. Im Anschluss an die Beobachtungen wurden einzelne Kinder in qualitativen Interviews gefragt, welche Empfehlung sie anderen Kindern geben würden, um in der Schule „gut zurechtzukommen und wenig Ärger zu bekommen“. Die insgesamt 149 geführten Interviews, bei denen 107 Kinder teilweise wiederholt befragt werden konnten, wurden dann mittels qualitativer Inhaltsanalyse (Mayring & Fenzl, 2019) ausgewertet. Zur Prüfung der Zusammenhänge zwischen der individuellen Regelkenntnis (ja/nein) und dem Störverhalten (Häufigkeit) wurden bivariate lineare Regressionen durchgeführt. Die inhaltsanalytischen Interviewauswertungen zeigen, dass die Erstklässler*innen vor allem über Wissen zu verbalen Verhaltensregeln (76,5%) und zur Beteiligung am Unterricht (62,4%) verfügen, während sie motorisches Handeln (31,5%) deutlich seltener als Teil schulischer Ordnung betrachten. Eine häufig genannte Kategorie stellt dabei auch das Wissen über die Bestrafung abweichenden und die Belohnung legitimen Verhaltens (49,7%) dar. Daneben kannten die Kinder auch allgemeine Regeln der sozialen Interaktion. So äußerten sich mehr als die Hälfte aller befragten Kinder über Regeln des sozialen Miteinanders (54,4%) und etwa ein Drittel über die Vermeidung von physischer Gewaltanwendung (34,2%). Als weitere Kategorie ließen sich zudem auch Äußerungen über das Befolgen von Anweisungen und Vorgaben von Autoritäten (17,4%) sowie unspezifische Äußerungen über erwartetes oder unerwünschtes Verhalten (34,2%) kodieren. Die regressionsanalytische Auswertung zeigt, dass in allen Kategorien Regelkenntnis nur tendenziell, jedoch nicht signifikant im Zusammenhang mit der Häufigkeit des jeweiligen Störverhaltens der Kinder steht. Die Vielzahl von Verhaltensregeln, die die Kinder nennen konnten, spiegelt die komplexen Anforderungen an das Verständnis der Kinder wider, die mit Schuleintritt an sie gerichtet sind. Dass die Regelkenntnis keinen Niederschlag im Verhalten findet, kann mehrere Gründe haben. So müssen Kinder lernen, dass Regeln nicht in jeder Situation gelten (Doyle, 2006, 2013; Jäger, 2019), und nur 40% der Verstöße werden unseren Daten zufolge durch die Lehrkraft geahndet. Im nächsten Schritt sollen diese Zusammenhänge im Längsschnitt genauer untersucht werden.
13:10 - 14:50	2-09: Universitätsschulen - Impulse für die empirische Bildungsforschung? Ort: S17
	Offenes Beitragsformat Universitätsschulen - Impulse für die empirische Bildungsforschung? Nadine Spörer¹, Matthias Martens², Anke Langner³, Annette Textor⁴, Nicola Großebrahm⁵ ¹Universität Potsdam; ²Universität zu Köln; ³Technische Universität Dresden; ⁴Universität Bielefeld; ⁵Universität Duisburg-Essen Zielstellung Ob die empirische Bildungsforschung nachhaltige Erkenntnisse für die Entwicklung von Lernenden generieren kann, hängt auch davon ab, ob es Schulen als Praxispartnerinnen ermöglicht wird, innovative Lehr-Lern-Konzepte in den Bildungsalltag zu implementieren, zu adaptieren und zu evaluieren (Holtappels, 2019, Palowski et al., 2019). Universitätsschulen unterstützen diesen bidirektionalen Wissenstransfer zwischen Bildungswissenschaft und Schulpraxis durch ihre Verbundenheit mit einer lehrkräftebildenden Hochschule in besonderer Weise. Sie zeichnen sich durch eine ausgeprägte Offenheit gegenüber Innovationen aus und ermöglichen auf vielfältige Art bildungswissenschaftliche Forschung im Schulalltag (Coriand, 2003). Wenngleich Formen von Universitätsschulen auch in Deutschland seit längerem bestehen, so wurden in jüngster Zeit an mehreren Hochschulstandorten in Deutschland neue Universitätsschulen gegründet bzw. sind in Planung. In der Session sollen anhand von fünf ausgewählten Standorten sowohl die Konzepte der Schulen als auch die Formen der Kooperation zwischen Universität und Schule präsentiert werden. Im Vordergrund steht somit eine vergleichende Vorstellung der Schwerpunkte der ausgewählten Universitätsschulen und die Diskussion der Impulse, die sich daraus für eine interdisziplinäre empirische Bildungsforschung ergeben können. Inhalt Im ersten Impulsbeitrag wird der Ansatz der Laborschule Bielefeld vorgestellt. Das wissenschaftliche Bielefelder Profil ist im Paradigma der Praxisforschung zu verorten (Zenke et al., 2019). Das Hauptmerkmal dieses partizipativen Forschungsansatzes ist die Generierung von Fragestellungen, die Durchführung von Forschungsvorhaben und die Dissemination der Resultate durch Praktiker:innen mit dem Ziel, sowohl eine Professionalisierung von Lehrer:innen (Altrichter & Posch 2007; James & Augustin, 2018; McLaughlin, 2011) als auch einen Wandel von Schule, in Verbindung mit Kenntnissen über einen solchen, zu erreichen (Klewin et al., 2016). Dabei kann die Laborschule Bielefeld auf langjährige Erfahrung in der Zusammenarbeit von universitären Forscher:innen (als Angehörige der Wissenschaftlichen Einrichtung Laborschule) und forschenden, mit einem gesonderten Stundenpool ausgestatteten Lehrer:innen (als Angehörige der Versuchsschule Laborschule) zurückblicken. Im Impulsbeitrag soll am Beispiel der Forschungs- und Entwicklungsprojekte „LabSchoolsEurope“ sowie der „Absolvent*innenstudie“ ausgelotet werden, wie die Kollaboration von Lehrer:innen, pädagogischen Mitarbeiter:innen sowie universitären Wissenschaftler:innen in der Praxis verläuft und welche Chancen und Herausforderungen sich dabei ergeben. Im Fokus des zweiten Impulsbeitrags steht die Universitätsschule Dresden, die zum Schuljahr 2019/2020 als Schulversuch des Landes Sachsen gestartet ist. Die Anforderungen an Schule und den damit verbundenen Bildungsprozessen steigen stetig an: Schule soll kompetent für das künftige Leben machen; im Angesicht von Globalisierung, Individualisierung, Digitalisierung und Teamfähigkeit ist dies eine Herausforderung für jeden Einzelnen und für die Gestaltung von Schule. Zur Klärung dieser Fragen wurde ein „Real-Labor“ (Schäpke et al., 2018) durch die Technische Universität Dresden geschaffen, in dem vor allem auch dazu geforscht werden soll, wie Metakompetenzen für den Einsatz von digitalen Werkzeugen im Bildungsprozess etabliert werden können. Insgesamt ist die Universitätsschule darauf ausgerichtet, innovative und vor allem längsschnittliche Forschung im Bereich der Institution Schule zu ermöglichen. Im Rahmen des Beitrages wird das Design zur Forschung an der Universitätsschule vorgestellt und diskutiert, welche Möglichkeiten sich durch ein Real-Labor für die empirische Bildungsforschung ergeben. Der dritte Impulsbeitrag widmet sich der Heliosschulen – Inklusive Universitätsschule Köln. Die Entstehung der Kölner Universitätsschule(n) ist eng verbunden mit der Initiative von Studierenden an der Universität, die sich im Jahr 2008 in der Lehrkräftebildung nicht ein schlichtes Mehr, sondern eine andere Form pädagogischer Praxis gewünscht und dies mit hoher Durchsetzungskraft politisch überzeugend artikuliert haben (Hensel et al., 2020). Sie forderten eine Verbesserung des Theorie-Praxis-Verhältnisses während des Lehramtsstudiums. Im Vortrag werden das Ausbildungs- und Forschungskonzept der Universitätsschule vorgestellt. Beide Konzepte sind in hohem Maße auf Integration unterschiedlicher Forschungs- und Ausbildungskulturen und -paradigmen an den vier lehrkräftebildenden Fakultäten orientiert (Reich, 2019). Zum anderen soll das Konzept mit Blick auf die pädagogische Architektur und Raumgestaltung präsentiert werden (Kricke et al., 2018). Entlang dieser Schwerpunkte werden Chancen und Herausforderungen für die empirische Bildungsforschung skizziert. Im vierten Impulsbeitrag wird das Konzept der Universitätsschule Potsdam vorgestellt. Im Fokus einer zeitgemäßen schulischen Bildung im Kontext gegenwärtiger Veränderungsprozesse stehen dabei die drei Schwerpunktthemen a) Weiterentwicklung schulischer Inklusion b) die alters- und entwicklungsangemessene Verschränkung analoger und digitaler Lehr-Lern-Settings sowie c) die Einbindung der Schule in das Quartier. Die Forschungsaktivitäten an der Universitätsschule sollen einerseits Erkenntnisse liefern, die der Absicherung und Weiterentwicklung der Universitätsschule dienen. Entsprechend steht die Schule in ihrer Gesamtheit im Fokus dieser Art von Forschung. Andererseits dient die Forschung an der Schule der Überprüfung spezifischer schulbezogener Forschungsfragen, die über eine direkte Nutzbarkeit durch die Schule hinausweisen und somit einen Mehrwert für andere Kontexte generiert (Spörer & Völkner, 2021). Da die Potsdamer Bildungsforschung sich vorwiegend quantitativ orientiert, soll im Impulsvortrag spezifischer ausgelotet werden, welche Art von Forschungsdesigns im Rahmen der Forschung an der Universitätsschule zur Anwendung kommen sollen. Zudem wird das Konzept der Transferwerkstatt zur Koordination der Forschungsaktivitäten vorgestellt. Schließlich wird im fünften Impulsbeitrag der aktuelle Entwicklungsstand der Universitätsschule Essen vorgestellt. Für die Neugründung der dreizügigen Grundschule in unmittelbarer Nähe zum Campus Essen haben sich Stadt Essen, Schulaufsicht und Universität Duisburg-Essen (UDE) vernetzt, um gemeinsam den Schulaufbau und perspektivisch die Schulentwicklung zu begleiten und mitzugestalten. Bisher konnten im Rahmen dieser Zusammenarbeit das Raumprogramm für die Ausschreibung des Architekturwettbewerbs entwickelt werden, welches auf den konzeptionellen Ideen für die Universitätsschule aufbaut. Die Verhältnissetzung von Pädagogik, Didaktik und Raum stellt somit eine erste Forschungsperspektive dar. Darauf aufbauend wird derzeit ein Forschungskonzept entwickelt. Es wird sich dem Standort der Schule folgend auf die forschende Begleitung der Schul- und Unterrichtsentwicklung in herausfordernden Kontexten und die Förderung von Bildungsgerechtigkeit zentrieren. Inwiefern vor dem Hintergrund einer sich im Aufbau befindlichen Universitätsschule deren Akteure (Schulleitung, Lehrer:innen, Kinder, Eltern & Wissenschaftler:innen) partizipativ beteiligt werden können, ist eine offene Frage, die im Beitrag diskutiert wird. Ablauf Im ersten Teil (ca. 50 Minuten) wird sich zunächst jeder Standort in jeweils 8 bis 10 Minuten kurz präsentieren. Insgesamt soll verdeutlicht werden, dass sich jede Universitätsschule durch eine individuelle Schwerpunktsetzung auszeichnet. Während einige Standorte den Fokus auf die Ausbildung von Studierenden legen, steht an anderen Standorten die Implementation bestimmter Lehr-Lern-Konzepte oder Forschungsansätze im Fokus. Der zweite Teil der Session besteht sodann aus einer moderierten Diskussion mit dem Plenum. Im Fokus der Diskussion steht, auf welchen Ebenen Universitätsschulen Impulse für die empirische Bildungsforschung geben können.
13:10 - 14:50	2-10: Die Vielfalt der Weiterbildung(sdaten) – Potentiale und Herausforderungen bei Sekundäranalysen zur Weiterbildungsbeteiligung Ort: S26
	Symposium Die Vielfalt der Weiterbildung(sdaten) – Potentiale und Herausforderungen bei Sekundäranalysen zur Weiterbildungsbeteiligung Chair(s): Judith Offerhaus (Bundesinstitut für Berufsbildung, Deutschland), Julia Gorges (Universität Marburg) Diskutantin(nen): Harm Kuper (Freie Universität Berlin), Judith Offerhaus (Bundesinstitut für Berufsbildung) Weiterbildungsbeteiligung findet in unterschiedlichen Lernkontexten, bei unterschiedlichen Anbietern und in unterschiedlichen Zielgruppen von Weiterbildung statt. Weiterbildungsbeteiligung ist daher im Vergleich zu Bildungsentscheidungen und Bildungsbeteiligung im primären, sekundären und tertiären Bildungssektor heterogener und durch Faktoren beeinflusst, die zuvor noch keine Rolle spielten. Für Sekundäranalysen heißt das, ihre Ergebnisse zur Weiterbildungsbeteiligung hängen mitunter sehr stark von der Verfügbarkeit von Variablen, ihrer Operationalisierung und Messung ab. Zwar existiert ein allgemeines Grundverständnis, was Weiterbildung ist – und welchen Nutzen diese haben soll (bspw. Anpassung an sich verändernde Arbeitsbedingungen, Fachkräftesicherung), jedoch müssen sich Forschende im Bereich von Weiterbildung immer zuerst über die zugrundeliegende Definition (z.B. hinsichtlich der Berücksichtigung formaler, non-formaler und/oder informeller Weiterbildung) verständigen und sind in ihren Analysemöglichkeiten oftmals durch die verfügbare Datenbasis eingeschränkt. Das vorgeschlagene Symposium bringt Forschende aus verschiedenen Disziplinen (Pädagogik, Psychologie, Soziologie, Ökonomie) zusammen, die anhand unterschiedlicher Datensätze den Zugang zu bzw. die Teilnahme an Weiterbildung untersuchen. Die Beiträge berücksichtigen individuelle, sozio-demographische, betriebliche und strukturell-institutionelle Faktoren (in verschiedenen Kombinationen) zur Erklärung von Unterschieden im Weiterbildungsverhalten. Trotz der unterschiedlichen theoretischen Fundierungen (bspw. Rational Choice Ansätze, Wert-Erwartungstheorie, segmentationstheoretische Annahmen, Transaktionskostentheorie), methodischen Herangehensweisen und verwendeten Datenquellen zeigt sich in den fünf Beiträgen ein* konsistentes Ergebnis, das auch dem bekannten Forschungsstand entspricht (BMBF, 2022): Weiterbildung ist ungleich verteilt und vor allem Personengruppen, die bereits hinsichtlich Bildung und Erwerbstätigkeit privilegiert sind, haben leichteren Zugang zu Weiterbildung. Der erste Beitrag untersucht sog. Weiterbildungsketten, d.h. nehmen Personen, die früher bereits eine Weiterbildung absolviert haben, häufiger an weiteren Weiterbildungen teil? Dies zeigen die Autor:innen anhand der Daten des Nationalen Bildungspanels. Der Vorteil einer früheren Weiterbildung ist bei geringer qualifizierten Personen (ohne berufliche Ausbildung) jedoch niedriger ausgeprägt, was auf eine Kumulation der Benachteiligung für Gering(er)qualifizierte hinweist. Betrachtet man informelles Lernen am Arbeitsplatz als spezielle Form von Weiterbildung, wie im zweiten Beitrag auf Basis der Daten des Programme for the International Assessment of Adult Competencies, zeigen sich ähnliche qualifikationsspezifische Unterschiede: höher gebildete Personen sowie Beschäftigte in Berufen mit höherer Qualifikationsanforderung berichten häufiger von informellen Lernaktivitäten im Beruf. Zusätzlich trägt eine höhere Lernmotivation zu informellem Lernen bei. Unter besonderer Berücksichtigung ost-west-spezifischer Arbeitsmarktstrukturen zeigt sich der Vorteil von hoher Initialbildung für eine Teilnahme an selbstinitiierter beruflicher Weiterbildung auch anhand der Daten des Berichtssystems Weiterbildung und Adult Education Survey in Beitrag 3. Es wird darüber hinaus deutlich, dass regionale und strukturelle Unterschiede sowie Merkmale des Erwerbskontexts Weiterbildungsverhalten unterschiedlich stark beeinflussen. Der Frage nach der Rolle von Betrieben und der jeweiligen Arbeitsorganisation und Personalentwicklungsstrategien widmet sich der vierte Beitrag. Mit den Daten des Betriebspanels zur Qualifizierung und Kompetenzentwicklung wird gezeigt, dass Weiterbildungsungleich zwischen Beschäftigungsgruppen mit unterschiedlich hohem Tätigkeitsniveau unter bestimmten betrieblichen Bedingungen reduziert werden kann. Der fünfte und letzte Beitrag untersucht – basierend auf den Daten des mit den administrativen Konjunkturindikatoren angereicherten Mikrozensus – einen möglichen Einfluss von externen Schocks (bspw. Finanzkrise, COVID-19 Pandemie) auf individuelles, berufsbezogenes Weiterbildungsverhalten. Es zeigen sich differentielle Effekte konjunktureller Schwankungen auf Weiterbildungsteilnahme; diesbezügliche Unterschiede nach Bildungsniveau sind theoretisch ebenfalls möglich. Die Datensätze werden durch die Autor:innen mit Blick auf ihre Potentiale und Herausforderungen für die Weiterbildungsforschung reflektiert. Dabei wird deutlich, dass die unterschiedlichen Datenquellen ihre Vor- und Nachteile bei der Analyse der Determinanten von Weiterbildungsverhalten haben, die Verschränkung der Perspektiven der Disziplinen sowie die Verwendung unterschiedlicher Datenquellen und Analyseebenen (Individuum, Organisation/Betrieb, Gesellschaft) jedoch zu einem ganzheitlichen Bild von Weiterbildungsteilnahme beiträgt. Das Symposium zeigt auf, dass Maßnahmen zur Erhöhung von Weiterbildungsteilnahme – besonders bei den sonst eher benachteiligten Personengruppen – auf unterschiedlichen Ebenen ansetzen müssen. In der Diskussion werden die Erträge der empirischen Beiträge aus Sicht der Forschung und der Praxis erörtert. Beiträge des Symposiums Weiterbildungsketten im Lebensverlauf: Zum Einfluss von kumulativen Vorteilen auf die Weiterbildungsbeteiligung in Deutschland Sascha dos Santos¹, Martina Dieckhoff², Martin Ehlert³, Antje Mertens⁴ ¹Wissenschaftszentrum Berlin, ²Universität Rostock, ³Wissenschaftszentrum Berlin; Freie Universität Berlin, ⁴Hochschule für Wirtschaft und Recht Berlin In Zeiten technologischer Innovationen ist eine ständige Anpassung an sich verändernde Qualifikationsanforderungen am Arbeitsplatz erforderlich. Einige Studien haben jedoch gezeigt, dass die Weiterbildungsbeteiligung aufgrund individueller und arbeitsplatzbezogener Merkmale ungleich verteilt ist. Darüber hinaus kann auch frühere Weiterbildung eine Rolle spielen, da sie die weitere Teilnahme erleichtert und motiviert. In diesem Beitrag wird der Frage nachgegangen, ob die Teilnahme an Weiterbildung in einem Jahr weitere Teilnahmen in der Zukunft hervorruft und ob sich diese Prozesse zwischen Bildungsgruppen unterscheiden. Ketten der Weiterbildungsbeteiligung im Laufe der Zeit können durch zwei Arten von Mechanismen verursacht werden: Erstens können sie die Folge von individuellen und berufsspezifischen, stabilen Risiko-/Erfolgsfaktoren sein, die auch mit der Weiterbildungsbeteiligung in einem bestimmten Jahr zusammenhängen. Zweitens können sie durch eine frühere Ausbildungsteilnahme verursacht wer-den. Die „theory of skill formation“ von Cunha und Heckman (2007) sagt voraus, dass frühere Bildungsinvestitionen nachfolgende Bildungsinvestitionen fördern sollten. Dies liegt daran, dass die in einer Phase erworbenen Fähigkeiten den späteren Erwerb von Fähigkeiten fördern und damit die Produktivität von Investitionen in Fähigkeiten erhöhen. Daher kann die weitere Teilnahme an einer Ausbildung in einer Phase zu einem kumulativen Vorteil führen, da die weitere Teilnahme durch die vorherige Teilnahme verursacht wird ("true state dependence"). Die Expectancy-Value-Theorie von Eccles (2005) besagt, dass (1) die Determinanten von Bildungsentscheidungen hauptsächlich auf den individuellen Erfolgserwartungen und dem Wert beruhen, den Individuen den verschiedenen verfügbaren Optionen beimessen, und dass (2) Erwartungen und Werte einen Einfluss auf Bildungsentscheidungen haben und Bildungsentscheidungen Auswirkungen auf Erwartungen und Werte in Bezug auf zukünftige Entscheidungen haben. Wenn die Teilnahme an einer Weiterbildung zum Zeitpunkt t-1 die Erfolgserwartung und den Wert beeinflusst, die einer Weiterbildung zum Zeitpunkt t zugewiesen werden, dann könnte diese Dynamik erklären, warum eine frühere Weiterbildung zu einer weiteren Teilnahme führen und dadurch kumulative Vorteile auslösen könnte (Gorges & Kandler, 2012). Wir testen diese Vorhersagen anhand von Daten der Startkohorte 6 des Nationalen Bildungspanels (NEPS). Wir verwenden „dynamic random effects probit models“ (Rabe-Hesketh & Skrondal, 2013), die es uns ermöglichen, den kausalen Effekt der früheren Ausbildungsteilnahme auf die aktuelle Ausbildungsteilnahme zu bewerten, indem wir für unbeobachtete Heterogenität kontrollieren. Dies geschieht durch die Kontrolle für den Ausgangszustand der abhängigen Variable sowie für die Ausgangsbedingungen und individuellen Zeitmittelwerte der zeitvariablen Störfaktoren. Wir beschränken unsere Stichprobe auf Arbeitnehmende im Haupterwerbsalter (25 bis 55 Jahre) und kontrollieren für Geschlecht, Bildung, Zusammenleben und Familienstand, Anzahl der Kinder, Teilzeitarbeit, Berufswechsel, Unternehmensgröße und Berufe. In Deutschland erhöht eine frühere Weiterbildungsteilnahme (t-1) die Wahrscheinlichkeit einer Weiterbildung im folgenden Jahr (t) um 7 Prozentpunkte. Obwohl wir einen beträchtlichen und statistisch signifikanten Effekt der früheren Weiterbildungsteilnahme auf die spätere Weiterbildungsteilnahme zeigen können, bleibt die unbeobachtete Heterogenität (erfasst durch die anfängliche Ausbildungsbedingung) der Hauptfaktor für die Persistenz. Zudem finden wir, dass frühere Weiterbildungen einen kleineren Effekt bei Personen ohne berufliche Ausbildung haben Informelles Lernen im Beruf: Zusammenhänge mit Lernmotivation und Lernstrategien Erwachsener Luca Farina Hollricher Universität Marburg Erwachsene entwickeln ihre beruflichen Kompetenzen – neben formalen und non-formalen Lernaktivitäten – vor allem über informelles Lernen an ihrem Arbeitsplatz weiter. Der vorliegende Beitrag beschäftigt sich mit der Frage nach den Bedingungen dieser Lernprozesse. Ausgehend von theoretischen Modellen sowie empirischen Forschungsarbeiten zum informellen Lernen am Arbeitsplatz wurden hierfür Faktoren auf individueller (Lernmotivation, Lernstrategien, Skill Mismatch), kontextueller (Autonomie und Komplexität am Arbeitsplatz) und struktureller (Betriebsgröße, Art des Arbeitsvertrag, Qualifikationsanforderungen der Arbeitsstelle) Ebene identifiziert, die theoretisch mit informellen Lernaktivitäten am Arbeitsplatz in Verbindung stehen, und ihre prädiktive Validität mittels multipler linearer Regression überprüft. Als Grundlage für die Analyse dienten Querschnittsdaten des Programme for the International Assessment of Adult Competencies (PIAAC) von 2012. Die PIAAC Studie wurde 2008 von den OECD-Mitgliedsstaaten initiiert und wird analog zur PISA-Studie in regelmäßigen Zyklen von 10 Jahren international durchgeführt (Rammstedt, 2013). PIAAC misst die Basiskompetenzen von Erwachsenen (16-65 Jahre) in den Bereichen Lesen, Schreiben, Rechnen und Problemlösung in technologie-intensiven Umgebungen (PSTRE). Die in PIAAC gemessenen Kompetenzen bilden dabei keine wah-ren Kompetenzwerte einzelner Personen ab, sondern vielmehr einen probabilistischen Wert, der mittels eines Item Response Theory (IRT) Modells geschätzt wird. Im PIAAC Datensatz sind zehn solcher Plausible Values (PVs) enthalten. Die erste Erhebungsrunde der PIAAC Studie fand zwischen 2008 und 2013 in 24 Ländern statt, darunter auch Deutschland. Neben der Messung der Basiskompetenzen wurden in der ersten Erhebungswelle umfangreiche Hintergrunddaten der befragten Personen erfasst, wie beispielsweise Daten zum Lernverhalten am Arbeitsplatz, zur Bildungsbiographie sowie zu den im Alltag und am Arbeitsplatz genutzten Kompetenzen. Die Erhebung wurde mit einer Wahrscheinlichkeitsstichprobe durchgeführt, die repräsentativ für die erwachsene Zielbe-völkerung ist (Deutschland: N = 5.465). Die Stichprobe wurde für die Analyse auf Erwerbstätige reduziert, die weder selbständig beschäftigt oder noch in Ausbildung sind und vollständige Angaben bei den relevanten Variablen haben (Analysestichprobe: N = 3.108, 1.558 weiblich; Alter: M = 41,18; SD = 11,71). Informelles Lernen sowie Lernmotivation, Lernstrategien und Autonomie am Arbeitsplatz wurden durch Zustimmungswerten zu zwei bis vier Items auf einer Likert-Type Skala operationalisiert. Skill Mismatch wurde definiert als extreme Abweichung der Skills zum durchschnittlichen Kompetenzniveau innerhalb einer Berufsgruppe (elementary / semi-skilled blue collar / semi-skilled white collar / skilled occupations), während die Komplexität der Arbeit dichotom darüber erfasst wurde, ob zur beruflichen Tätigkeit Aufgaben gehören, die ein längeres Nachdenken erfordern. Die weiteren Variablen wurden direkt erfragt. Die Analysen wurden mit Hilfe des IEA IDB Analyzer und SPSS durchgeführt. Der IEA IDB Analyzer ist eine Anwendung, die Syntaxdateien für die Programme R, SPSS und SAS erstellt, mit denen sich Daten aus sogenannten Large-Scale-Assessments wie PISA und PIAAC unter Berücksichtigung der methodischen Spezifikationen (bspw. sampling weights, replicate weights und PVs) analysieren lassen. Die Ergebnisse der Regressionsanalysen zeigten zunächst, dass mit zunehmendem Alter die Teilnahme am informellen Lernen sinkt. Zudem scheint die Teilnahme an informellem Lernen umso höher, je höher die Qualifikationsanforderungen des Berufes sind, sowie analog dazu je höher das eigene Bildungsniveau ist. Zudem scheint informelles Lernen vor allem in hoch komplexen Berufen eine Rolle zu spielen. Auch Personen mit höherer Lernmotivation und Nutzung elaborierter Lern-strategien scheinen unter Berücksichtigung der genannten Faktoren häufiger in informeller Form zu lernen. Die Ergebnisse bestätigen größtenteils ältere Befunde zur „doppelten Privilegierung“ höher Gebildeter im Weiterbildungskontext auch für das informelle Lernen am Arbeitsplatz. Längsschnittliche Daten könnten im Anschluss daran jedoch konkretere Einsichten in die Wirkungsrichtung der einzelnen Faktoren liefern. Betriebliche Weiterbildungsungleichheit: Wie strukturelle und relationale Bedingungskontexte in Betrieben den Zugang zu non-formaler Weiterbildung beeinflussen Mortimer Schlieker Bundesinsitut für Berufsbildung Die bisher bedeutsamste und umfangreichste Studie zum individuellen Weiterbildungsverhalten in Ost- und Westdeutschland stellt das Berichtssystem Weiterbildung (BSW) und dessen Nachfolger Adult Education Survey (AES) dar. Auffallend ist hier der Befund, dass ein Großteil der beruflichen Weiterbildungsaktivitäten ostdeutscher Beschäftigter bis Mitte der 2000er Jahre durch den Arbeitgeber veranlasst wurde, während sich im Vergleich dazu ein höherer Anteil westdeutscher Beschäftigter selbstinitiiert beruflich weiterbildete (Kuwan et al. 2003). Inwieweit sich diese ost-west-spezifischen Unterschiede auch auf Basis aktueller AES-Daten zeigen, wurde bisher nicht unter-sucht. Studien weisen darauf hin, dass sich der ostdeutsche Arbeitsmarkt auf Grund historischer und arbeitsmarktpolitischer Entwicklungen bis dato vom westdeutschen Arbeitsmarkt unterscheidet. Im Bereich der Weiterbildungsforschung existieren allerdings kaum Studien, die (individuelle) Teilnahmeentscheidungen für Weiterbildung mit sich wandelnden Arbeitsmarktstrukturen ins Verhältnis setzen (vgl. Becker 2019). Vor dem Hintergrund ost-west-spezifischer Entwicklungen der Berufs- und Arbeitsmarktstrukturen geht der Beitrag der Frage nach, inwieweit diese spezifischen Strukturdifferenzen Dynamiken selbstinitiierter Weiterbildungsbeteiligung beeinflussen. Rekurrierend auf bildungsökonomische und segmentationstheoretische Annahmen lassen sich hier ost-west-spezifische Teilnahmemuster vermuten. Datenbasis der Analysen bilden die Erhebungen des Berichtssystems Weiterbildung 1991-2007 und des Adult Education Survey 2010-2018. Die einzelnen Erhebungen wurden im Rahmen einer Harmonisierung aufbereitet und in einen Trenddatensatz integriert. Um die selbstinitiierte Weiterbildungsteilnahme im Trend zu untersuchen, wird das im BSW und AES kontinuierlich erhobene Kontextmerkmal „Anlass der Weiterbildung“ genutzt. Die Analyse betrachtet ausschließlich erwerbstätige Personen im Alter von 19-64 Jahren. Um den Einfluss ost-west-spezifischer Arbeitsmarktstrukturen zu prüfen, liegt der Fokus auf der Analyse betriebs- und beschäftigungsbezogener Prädiktoren. Regionale und soziodemographische Merkmale werden als Kontrollvariablen berücksichtigt. Die Untersuchung erfolgt mithilfe binär logistischer Regressionen. Die Befunde zeigen insgesamt, dass die Teilnahmeselektivität im Zeitverlauf schwankt und eng mit segmentspezifischen Beschäftigungs- und Förderstrukturen verbunden ist. Eine erhöhte Teilnahme an selbstinitiierter beruflicher Weiterbildung zeigt sich sowohl für ost- als auch westdeutsche Beschäftigte in kleineren Betrieben der Privatwirtschaft im Vergleich zu größeren Betrieben. Die er-höhte Teilnahme für Beschäftigte im öffentlichen Dienst lässt darauf schließen, dass institutionali-sierte Strukturen im öffentlichen Sektor die Teilnahme an Weiterbildung insgesamt fördern. Beschäftigungsbezogene Merkmale (Befristung, Arbeitslosigkeit) nehmen, konform zu bildungsökonomischen Annahmen, einen stärkeren Einfluss auf die Teilnahmeselektivität ostdeutscher Beschäftigter im Vergleich zu westdeutschen Beschäftigten. Die Teilnahme an selbstinitiierter beruflicher Weiterbildung ist insgesamt stark durch Merkmale des Erwerbskontexts geprägt. Ferner lässt sich unter Kontrolle beschäftigungsbezogener Prädiktoren jedoch ein Effekt des Alters und des Bildungsniveaus auf die Teilnahme beobachten. Allerdings zeigen sich auch hier Unterschiede zwischen Ost und West. Der Beitrag identifiziert wesentliche Einflussfaktoren selbstinitiierter Teilnahme an beruflicher Weiterbildung vor dem Hintergrund sich verändernder Arbeitsmarktkontexte in Ost und West. Angesichts des zunehmenden Strukturwandels und Fachkräftemangels verspricht die Einbeziehung weiterer branchen- und regionalspezifischer Merkmale (siehe IAB-Betriebspanel) ein hohes Analysepotential vor allem mit Blick auf die Frage des Einflusses (fehlender) betrieblicher Unterstützungsstrukturen. Die beiden Berichtskonzepte BSW und AES stellen auf Grund ihrer konsistenten Erfassung der Weiterbildungsbeteiligung in Ost- und Westdeutschland eine valide Datenbasis dar, um Entwicklungen der Teilnahmestrukturen anhand ausgewählter Kontextmerkmale differenziert im Zeitverlauf abzubilden. Um eine differenzierte Trendberichterstattung auf Basis der BSW- und AES-Zeitreihen fortzuführen, bedarf es jedoch weiterführender Analysen, die die Qualität der Datenlage und der Erhebungsinstrumente beider Berichtskonzepte eruieren. Weiterbildung in der Krise? Der Zusammenhang von Konjunkturzyklen und Weiterbildungsteil-nahmen Marion Thiele, Myriam Baum, Dominik Becker, Harald Pfeifer, Nele Tschöpe Bundesinstitut für Berufsbildung Geringqualifizierte Beschäftigte mit einfachen Tätigkeiten sind beim Zugang zu betrieblicher Weiterbildung in Deutschland persistent benachteiligt (Mohr, Troltsch & Gerhards, 2016). Dies hat negative Folgen sowohl für die Beschäftigten als auch für die Betriebe, die wichtige Potenziale zur Kompetenzentwicklung in ihren Belegschaften ungenutzt lassen. Obwohl der Großteil der non-formalen Weiterbildung in Betrieben stattfindet, wird die betriebliche Perspektive in bisherigen Studien zu Weiterbildungsungleichheiten aufgrund fehlender quantitativer Datenlage meist vernachlässigt. Bisherige Analysen konzentrieren sich vor allem auf individuelle und institutionelle Faktoren und nutzen oft nur Branche oder Betriebsgröße als Kontrollvariablen für betriebliche Heterogenität bei der Erklärung von Chancenungleichheit in Weiterbildung. Inwiefern sich Betriebe in ihrem Weiterbildungsverhalten strukturell unterscheiden und welche Aushandlungsbedingungen einzelne Beschäftigtengruppen beim Zugang zu Weiterbildung haben, ist somit in der bisherigen quantitativen Forschung zu Weiterbildungsungleichheit ein Randthema. Dieser Beitrag geht daher der Frage nach, wie strukturelle und relationale Bedingungen in Betrieben die Chancenungleichheit beim Zugang zu non-formaler betrieblicher Weiterbildung beeinflussen. Mit dem BIBB-Betriebspanel zur Qualifizierung und Kompetenzentwicklung (Gerhards, Mohr & Troltsch, 2012) kann hierfür auf einen repräsentativen Betriebsdatensatz zurückgegriffen werden, der seit 2011 jährlich detaillierte Einblicke in das Weiterbildungsverhalten von aktuell rund 4.000 Betrieben ermöglicht. Neben tätigkeitsspezifischen Teilnahmequoten der Beschäftigten an non-formaler betrieblicher Weiterbildung stellt das Panel tiefgehende Informationen über die Organisationsstruktur, die Arbeitsorganisation sowie die Personalentwicklung der Betriebe bereit. Darüber hinaus kann das soziale Gefüge u.a. anhand von Informationen zur betrieblichen Mitbestimmung oder in Form von Indikatoren zur sozialstrukturellen Zusammensetzung der Belegschaft untersucht werden. Auf dieser empirischen Grundlage wird als zentrale zu erklärende Variable des Beitrags die betriebliche Weiterbildungsungleichheit (WBU) als Differenz in den Teilnahmequoten zwischen den Beschäftigtengruppen mit (hoch)qualifiziertem und mit einfachem Tätigkeitsniveau operationalisiert. Hinsichtlich der betrieblichen Einflussfaktoren auf dieses Ungleichheitsmaß werden zwei Aspekte konzeptionell verknüpft: strukturell der Grad systematischer Personalentwicklung im Betrieb und relational die unterschiedliche Aushandlungsmacht von Beschäftigtengruppen. Hinsichtlich des ersten Einflussfaktors lässt sich aus der Transaktionskostentheorie (Williamson, 1985) ableiten, dass Beschäftigte mit einfachen Tätigkeiten bei der Weiterbildungsteilnahme zu ihren (hoch)qualifizierten Kolleg*innen aufschließen können und somit die WBU in Betrieben sinkt, wenn der Grad systematischer Personalentwicklung steigt (H1). Denn je mehr Personalentwicklungsressourcen auf betrieblicher Seite zur Verfügung stehen und je sichtbarer die Weiterbildungsrendite für die Beschäftigten ist, desto geringer sind die Transaktionskosten auf beiden Seiten und desto höher ist die zu erwartende Weiterbildungsteilnahme (vgl. Wotschack & Solga, 2014, S. 369). Im Hinblick auf die Aushandlungsmacht von Beschäftigtengruppen greift der Beitrag auf die Theorie Relationaler Ungleichheiten (Tomaskovic-Devey & Avent-Holt, 2019) zurück und geht davon aus, dass sowohl die Existenz eines Betriebsrats als auch eine steigende relative Gruppengröße von Beschäftigten mit einfachen Tätigkeiten den H1-Effekt verstärken (H2 und H3). Denn Betriebsräte können als institutionalisiertes Gremium die Interessen aller Beschäftigten vertreten und somit den Zugang zu Weiterbildungsmaßnahmen für Beschäftigte mit einfachen Tätigkeiten erleichtern. Zu-dem kann eine steigende relative Gruppengröße der Beschäftigten mit einfachen Tätigkeiten zu einer Stärkung der Aushandlungsposition dieser Gruppe führen. Vorläufige Ergebnisse auf Basis hierarchisch genesteter Regressionsmodelle zeigen, dass unter Kontrolle von organisationsstrukturellen Einflüssen (u.a. Betriebsgröße, Digitalisierungsgrad und Branche) ein zunehmender Grad systematischer Personalentwicklung mit einer signifikanten Reduktion von WBU in Betrieben einhergeht. Erwartungsgemäß wird dieser Zusammenhang durch eine zu-nehmende relative Gruppengröße der Beschäftigten mit einfachen Tätigkeiten verstärkt, während der Einfluss der betrieblichen Mitbestimmung zunächst uneindeutig erscheint. Durch die Interaktion struktureller und relationaler Einflüsse trägt die Untersuchung sowohl theoretisch als auch empirisch zu einem vertieften Verständnis der (Re-)Produktion betrieblicher WBU bei. Das BIBB-Betriebspanel zur Qualifizierung und Kompetenzentwicklung liefert hierzu neue Einsichten in die zugrundeliegenden Mechanismen und zeigt konkrete Ansatzpunkte für betriebliche Maßnahmen auf, die den Weiterbildungszugang für geringqualifizierte Beschäftigte verbessern können.
13:10 - 14:50	2-11: Schüler:innen mit einem Förderbedarf emotional-soziale Entwicklung im inklusiven Unterricht Ort: S27
	Symposium Schüler:innen mit einem Förderbedarf emotional-soziale Entwicklung im inklusiven Unterricht Chair(s): Anne Hartmann (Universität Potsdam) Diskutantin(nen): Ariana Garrote (Fachhochschule Nordwestschweiz FHNW) Im Zuge der Umsetzung der UN-Behindertenrechtskonvention (UN General Assembly, 2007) hat sich die deutsche Bildungslandschaft stark verändert. Mit dem Begriff des inklusiven Lernens verbindet sich die Idee, dass alle Schüler:innen unabhängig von ihren Lernvoraussetzungen gemeinsam in einer Klasse unterrichtet werden, sich durch ihre Lehrkräfte sowie Peers angenommen fühlen und akzeptiert werden (Prengel, 2013). Schüler:innen mit einem sonderpädagogischen Förderbedarf emotional-soziale Entwicklung (SPF ESE) machen mit etwa 18 % den zweitgrößten Anteil an inklusiv unterrichteten Schüler:innen in Deutschland aus (nach SPF Lernen; KMK, 2022). Jedoch stellt diese Schüler:innengruppe aufgrund ihres oftmals stark externalisierenden Verhaltens eine große Herausforderung für das inklusive Lernen dar. Dies betrifft sowohl die individuelle Entwicklung der Schüler:innen mit SPF ESE in Bezug auf soziale, motivationale und fachliche Kompetenzen als auch die ihrer Mitschüler:innen, da sich Verhaltensauffälligkeiten wie Regelverstöße oder Unterrichtsstörungen auf die gesamte Klasse auswirken können (Blumenthal et al., 2020; Ellinger & Stein, 2012; Kuhl et al., 2022). Ellinger und Stein (2012) berichten, dass Schüler:innen mit SPF ESE unter bestimmten Umständen in Bezug auf Leistungsaspekte, ihrem Sozialverhalten sowie Selbstkonzept von inklusiven Schulsettings profitieren. Dem entgegen stehen jedoch nachteilige Erkenntnisse hinsichtlich der sozialen Akzeptanz sowie negative Auswirkungen auf Mitschüler:innen (Blumenthal et al., 2020; Crede et al., 2019; Kuhl et al., 2022). Diese können wiederum zur Folge haben, dass Mitschüler:innen negativere Einstellungen gegenüber Schüler:innen mit SPF ESE entwickeln (Bosse et al., 2018). Somit scheinen Schüler:innen mit SPF ESE zusätzlich ein besonderes Unterstützungsangebot zu benötigen, um den Anforderungen im inklusiven Unterricht gerecht zu werden (Ellinger & Stein, 2012). Mit dem vorliegenden Symposium sollen neue Impulse für das Forschungsfeld und die Schulpraxis präsentiert werden. Die vier empirischen Beiträge zu Schüler:innen mit SPF ESE in inklusiven Schulen bedienen sich hierbei eines breiten Spektrums forschungsmethodischer Ansätze und Auswertungen. Der erste Beitrag untersucht mithilfe eines meta-analytischen Reviews die Auswirkungen inklusiver versus separierender Beschulung auf kognitive und psychosoziale Merkmale von Schüler:innen mit SPF ESE sowie deren Mitschüler:innen ohne SPF ESE. Schüler:innen mit SPF ESE scheinen hinsichtlich der kognitiven Merkmale tendenziell von inklusiver Beschulung zu profitieren. Während sich für Schüler:innen ohne SPF ESE nur vereinzelt Unterschiede zwischen den Beschulungsformen finden lassen. Im zweiten Beitrag wird mithilfe von Matching-Verfahren geprüft, ob Grundschulkinder mit diagnostiziertem SPF ESE und Lernen weniger sozial akzeptiert werden als vergleichbare Kinder ohne SPF. Ergebnisse der Äquivalenztests zeigen, dass Kinder mit SPF-Diagnose in gleichem Maß sozial akzeptiert werden wie ihre statistischen Zwillinge ohne SPF. Der dritte Beitrag untersucht, basierend auf Daten eines computergestützten Quasiexperiments, inwieweit das Ausmaß sozialer Akzeptanz von Grundschüler:innen (mit externalisierendem und internalisierenden Verhaltensauffälligkeiten) die Offenheit für Peereinfluss erhöht bzw. minimiert. Die Ergebnisse erster Analysen deuten darauf hin, dass Schüler:innen umso offener für Peereinfluss sind, je weniger sie von ihren Mitschüler:innen sozial akzeptiert werden. Jener Wirkmechanismus scheint jedoch nicht für alle Schüler:innen-Gruppen gleichermaßen zu bestehen. Der vierte Beitrag vergleicht Grundschüler:innen, die parallel zum regulären Unterricht temporär eine ESE-förderspezifische Lerngruppe besuchen, mit ihren Mitschüler:innen aus den Bezugsklassen hinsichtlich Peer- und Selbsteinschätzungen sozialer Partizipation. Schüler:innen der ESE-Lerngruppen werden von ihren Mitschüler:innen signifikant weniger sozial akzeptiert und schätzen ebenfalls das Klassenklima geringer ein als ihre Mitschüler:innen. Im Symposium wird unter anderem kritischen Fragen nach möglichen Selektions- und Etikettierungseffekten nachgegangen: Werden Schüler:innen mit besonders hohem Förderbedarf in ihrer emotional-sozialen Entwicklung eher in Förderschulen unterrichtet, während Schüler:innen mit geringerem Förderbedarf eher inklusiv unterrichtet werden? Ist ein SPF ESE lediglich ein Aggregat sozialer und kognitiver Risikofaktoren? Kann somit eine gering ausgeprägte soziale Partizipation von Kindern mit SPF ESE eher auf allgemeine soziale und kognitive Merkmale attribuiert werden? Darüber hinaus sollen die Beiträge im Hinblick auf Potenziale und Herausforderungen, die im inklusiven Unterricht mit Schüler:innen mit SPF ESE bestehen, diskutiert werden. Beiträge des Symposiums Inklusive vs. separierende Beschulung von Schüler:innen mit sonderpädagogischem Förderbedarf in der emotionalen und sozialen Entwicklung: Ein meta-analytisches Review Sonja Krämer, Julia Jensen, Friederike Zimmermann Christian-Albrechts-Universität zu Kiel Theoretischer Hintergrund Die Verabschiedung der UN-Behindertenrechtskonvention hat in vielen Ländern dazu beigetragen, dass Schüler:innen mit und ohne sonderpädagogische Förderbedarfe (SPF) zunehmend gemeinsam unterrichtet werden – was die Frage nach den Auswirkungen inklusiver versus separierender Beschulung aufwirft. Frühere Meta-Analysen zeigten positive bis neutrale Effekte in Bezug auf kognitive (z.B. schulische Leistungen) sowie psychosoziale Outcomes (z.B. soziale Partizipation) für Schüler:innen mit SPF sowie deren Mitschüler:innen (Carlberg & Kavale, 1980; Szumski et al., 2017). Zwar wurden in bisherigen Studien Schüler:innen mit verschiedenen Arten von SPF überwiegend gemeinsam untersucht, es kann jedoch vermutet werden, dass sich die Auswirkungen inklusiver Beschulung je nach Art des SPFs unterscheiden. So zeigten Schüler:innen mit SPF Lernen in inklusiven Settings bessere kognitive Leistungen als in Förderschulklassen (Krämer et al., 2021), während einige Studien darauf hindeuten, dass Schüler:innen mit SPF Emotionale und Soziale Entwicklung (ESE) schlechtere Leistungen erbringen (Zweers et al., 2020). Diese Unterschiede könnten darauf zurückzuführen sein, dass Schüler:innen mit SPF ESE Schwierigkeiten bei der Emotionsregulation und in sozialen Interaktionen haben (Abrams, 2005) und dadurch andere und möglicherweise umfassendere Unterstützung benötigen als Schüler:innen mit anderen SPF. Weiter können negative Auswirkungen auf kognitive und psychosoziale Outcomes der Mitschüler:innen vermutet werden (Kuhl et al., 2022), da sich Verhaltensauffälligkeiten (z.B. in Form von Regelverstößen und Unterrichtsstörungen) auf die gesamte Klasse auswirken können. In diesem meta-analytischen Review untersuchen wir daher die Auswirkungen inklusiver versus separierender Beschulung auf die kognitiven und psychosozialen Outcomes von Schüler:innen mit SPF ESE sowie deren Mitschüler:innen ohne SPF ESE. Methode Zur Literaturrecherche haben wir einschlägige Datenbanken (z.B. PsyInfo) verwendet sowie eine rückwärts-/vorwärtsgerichtete Suche in bisherigen Artikeln durchgeführt (k = 44.607 Studien). Es wurden Studien eingeschlossen, in denen Schüler:innen mit/ohne SPF ESE in inklusiven und Schüler:innen mit/ohne SPF ESE in separierenden Settings (Förder- bzw. Regelschulen) als Vergleichsgruppe gegenübergestellt wurden. Schüler:innen mit einer Autismus-Spektrum-Störung (ASS) werden häufig einem SPF ESE zugeordnet, weshalb wir diese Schüler:innen einbezogen haben. Da in vielen Studien die Vergleichsgruppe fehlte sowie Schüler:innen mit verschiedenen Arten von SPF zusammen betrachtet wurden, konnten insgesamt nur k = 22 Primärstudien eingeschlossen werden: 17 Studien zu Schüler:innen mit SPF ESE/ASS und 5 Studien zu Mitschüler:innen ohne SPF ESE/ASS. Aufgrund der geringen Datenbasis wurden nur die Daten für die Schüler:innen mit SPF ESE/ASS meta-analytisch ausgewertet – für die Mitschüler:innen ohne SPF ESE/ASS wurden die Ergebnisse deskriptiv zusammengefasst. Die vorhandenen Primärdaten der Schüler:innen mit SPF ESE/ASS wurden in Cohen’s d transformiert, wobei positive Werte für eine Überlegenheit der Schüler:innen in eher inklusiven Settings im Vergleich zu Förderschulsettings sprechen. Die statistischen Analysen erfolgten mit dem Statistikprogramm R (Paket metafor). Es wurde ein Drei-Ebenen-Ansatz gewählt (Cheung, 2015), um für Abhängigkeiten in den Daten zu kontrollieren (Effekte verschiedener Outcomes innerhalb von Stichproben, Stichproben innerhalb von Studien). Ergebnisse und Diskussion Hinsichtlich kognitiver Outcomes der Schüler:innen mit SPF ESE zeigte sich kein signifikanter Effekt (Tendenz zugunsten der inklusiven Beschulung, d=.24, SE=.20, 95%CI[-0.18, 0.65], p=.25); bezüglich psychosozialer Outcomes zeigte sich kein Unterschied zwischen den Beschulungsarten (d=.10, SE=.13, 95%CI[-0.15, 0.35], p=.41). Es existierten keine Studien zu den kognitiven Outcomes von Schüler:innen mit ASS; in den psychosozialen Outcomes fanden sich keine Unterschiede in Abhängigkeit von der Beschulungsart (d=.16, SE=.09, 95%CI[-0.02, 0.34], p=.07). Für die Mitschüler:innen ohne SPF ESE zeigten sich hinsichtlich kognitiver sowie psychosozialer Outcomes nur vereinzelt Unterschiede. Die Mitschüler:innen ohne ASS schienen in Bezug auf psychosoziale Aspekte von einer inklusiven gegenüber einer Regelbeschulung zu profitieren, jedoch basiert dieses Ergebnis nur auf einer Primärstudie. Insgesamt weisen die Ergebnisse darauf hin, dass es überwiegend keine Unterschiede zwischen den Beschulungsarten gibt. Es wird unter anderem ein Selektionseffekt diskutiert, dass Schüler:innen mit SPF ESE mit schwereren Symptomen eher an Förderschulen unterrichtet werden, während Schüler:innen mit SPF ESE mit leichten bis mittelschweren Symptomen eher inklusiv unterrichtet werden. Ist ein sonderpädagogisches Etikett in den Förderschwerpunkten Lernen sowie Emotionale und soziale Entwicklung ein Risikofaktor für die soziale Akzeptanz? Markus Spilles, Philipp Nicolay, Simone Weber, Christian Huber Bergische Universität Wuppertal Theoretischer Hintergrund In der Vergangenheit wurde immer wieder repliziert, dass Schülerinnen mit den sonderpädagogischen Förderbedarfen (SFB) Lernen (LE) und Emotionale-soziale Entwicklung (ESE) in inklusiven Klassen weniger sozial akzeptiert werden als ihre Mitschülerinnen (Schürer, 2020). Nicht ganz klar ist allerdings, ob der SFB im Sinne eines stigmatisierenden Etiketts zu diesem Ergebnis führt. Auf Basis einer vorliegenden deutschen Studie (Henke et al., 2017) gehen wir davon aus, dass keine Unterschiede zwischen Kindern mit und ohne SFB in ihrer sozialen Akzeptanz (SA) bestehen, wenn sich diese in ihren dimensional gemessenen Förderbedarfen sehr ähnlich sind. Fragestellungen Im Beitrag wird eine Fragestellung fokussiert: Werden Grundschulkinder mit einem amtlich diagnostizierten SFB in den Bereichen LE bzw. ESE nicht weniger sozial akzeptiert als vergleichbare Kinder ohne SFB? Wir gehen auf Basis der Studienergebnisse von Henke et al. (2017) davon aus, dass die SA von Schülerinnen mit einem amtlich diagnostizierten SFB signifikant gleich zu der SA von vergleichbaren Schülerinnen ohne SFB ist. Methode Die Stichprobe umfasst n = 2.830 Schülerinnen der Jahrgangsstufen 1 bis 4 aus Nordrhein-Westfalen. N = 182 Kinder wiesen einen amtlichen SFB LE und/oder ESE auf. Diesen Kindern wurden auf Basis dimensionaler Förderbedarfseinschätzungen der Klassenleitungen in den Bereichen Lernen und Verhalten sowie der Klassenstufenzugehörigkeit statistische Zwillinge zugewiesen. Die SA wurde wie in den meisten vergangenen Untersuchungen in Deutschland (Schürer, 2020) via Soziometrie (Moreno, 1974) operationalisiert. Die Bildung statistischer Zwillinge erfolgte anhand des „nearest neighbor“ Matchings sowie des „optimal“ Matchings (Ho et al., 2011). Anschließend wurden beide Gruppen im Hinblick auf die SA durch einen Äquivalenztest (TOST; two-sided-test; Lakens et al., 2018) verglichen. Ergebnisse Die Analyse der Teilstichprobe (n = 364) mit Hilfe des Äquivalenztests führte zur Ablehnung der Nullhypothese, dass Schülerinnen mit SFB mindestens schwach weniger sozial akzeptiert werden als ihre statistischen Zwillinge. Für die sonderpädagogische Forschung in Deutschland könnte dies bedeuten, dass zukünftig nicht mehr (ausschließlich) der SFB, sondern schwerpunktmäßig bspw. Verhaltensweisen aller Schülerinnen oder ihrer Lehrkräfte zur Erklärung der SA in den Blick genommen werden sollten. Offenheit für Peereinflussprozesse bei Grundschüler:innen (mit Förderbedarf in der emotionalen und sozialen Entwicklung) – Welche Bedeutung hat die soziale Akzeptanz? Marie-Luise Gehrmann¹, Christian Huber², Satyam Antonio Schramm¹ ¹Universität Potsdam, ²Bergische Universität Wuppertal Theoretischer Hintergrund Das Streben nach positiven, bedeutsamen und andauernden Beziehungen zu anderen Menschen ist (fast) jedem Individuum immanent (Selbstbestimmungstheorie, Deci und Ryan 1993) und kann durch eine (An-)Passung an andere Individuen oder Gruppen realisiert werden (Laursen und Veenstra 2021). Eine weitgehend unbewusste dynamische wechselseitige Beeinflussung des Denkens oder Handelns unter Gleichaltrigen kann als Peereinfluss bezeichnet werden. Ob soziale Ereignisse zwischen Peers bedeutsam für ihre emotionale und soziale Entwicklung werden, ist u.a. davon abhängig, wie offen jemand für äußere Einflüsse ist (Brown et al. 2008). Bedeutsame Merkmale der Beeinflussbarkeit von Kindern und Jugendlichen im Bereich dissozialen Verhaltens sind nach einer Studienübersicht von Müller und Minger (2013) Merkmale wie Alter, dissoziale Verhaltensdispositionen und soziale Kompetenz. Für den sozial-kontextuellen Faktor Sozialstatus unter den Peers konstatieren sie eine unklare Befundlage. Inwieweit die soziale Akzeptanz/ Ablehnung von Schüler:innen ihre Offenheit für negativen Peereinfluss begründet, kann bislang demnach nicht klar beantwortet werden. Das Ausgrenzungsrisiko innerhalb der Klassengemeinschaft ist für Schüler:innen mit externalisierenden wie internalisierenden Verhaltensauffälligkeiten erhöht (SuSext , SuSint ,z.B. Blumenthal und Blumenthal 2021). Schüler:innen mit dissozialen Verhaltensdispositionen erscheinen zudem besonders offen für negative Peerbeeinflussung (z.B. Müller 2008). Vergleichsweise unerforscht sind Peereinflussprozessen bei SuSint. Dabei könnten vertiefende Erkenntnisse zu den peereinflussaktivierenden Faktoren dazu beitragen, notwendige Gelingensbedingungen peergestützter Förderung der emotionalen und sozialen Entwicklung von Kindern und Jugendlichen für das schulische Setting zu identifizieren (z.B. Förderung sozialer Akzeptanz neben bzw. im Rahmen von Kompetenztrainings). Fragestellung Basierend auf den Daten eines computergestützten Quasiexperiments mit 458 Dritt- und Viertklässlern wird der Frage nachgegangen, inwieweit das Ausmaß sozialer Akzeptanz von Grundschüler:innen die Beeinflussbarkeit durch ihre Mitschüler:innen erhöht/ minimiert (hypothesentestend) und ob mögliche Wirkungszusammenhänge vergleichbar für die Teilgruppen SuSext und SuSint bestehen (explorativ). Vor dem Hintergrund eines grundsätzlichen Bedürfnisses nach sozialer Eingebundenheit als Handlungsmotiv wird angenommen, dass eine steigende soziale Akzeptanz von Schüler:innen mit einer reduzierten Offenheit für Peereinfluss einhergeht. Soziale Akzeptanz wird hier als Beliebtheit innerhalb der Klassengemeinschaft (soziometrische Befragung) und Offenheit für Peereinfluss als eine Veränderung der Verhaltensdisposition in Richtung eines Modells operationalisiert. Methode Zum ersten Messzeitpunkt (t1) erhielten die Proband:innen der Kontroll- und der Experimentalgruppe (nKG= 138, nEG= 320) soziale Konfliktsituationen mit einem konfliktminimierenden Situationsausgang und positionierten sich dazu (Ausgangswert Verhaltensdisposition Prosozialität). Während das Vorgehend zum zweiten Messzeitpunkt (t2) für die KG wiederholt wurde, erhielt die EG zusätzlich eine Information dazu, wie Mitschüler:innen diese Situationen bewertet haben könnten. Die Situationsbewertungen jenes potenziellen Modells wurden dabei an den eigenen Ausgangswert gekoppelt (t1-Wert Proband:innen +/- drei Skalenpunkte). Mit Blick auf eine schiefe Verteilung in den Verhaltensdispositionen wurden überwiegend potenzielle Modelle präsentiert, welche weniger prosozial erschienen als die Proband:innen selbst. Ergebnisse Vorläufige Analysen zur experimentellen Anlage mittels t-Tests deuten darauf hin, dass sich die EG und die KG zu t1 nicht bedeutsam in ihren Situationsbewertungen unterscheiden, während zu t2 die EG stärker als die KG von ihren Ausgangswerten abweicht (mittlerer Effekt). Vorläufige Regressionsanalysen deuten bei Kontrolle der (vornehmlichen) Manipulationsrichtung darauf hin, dass das Risiko für eine durch Peers beeinflusste Abnahme der Prosozialität umso höher ist, je unbeliebter die Schüler:innen bei ihren Mitschüler:innen sind. Jener Wirkzusammenhang scheint sich weniger für Schüler:innen mit externalisierenden und deutlicher für Schüler:innen mit internalisierenden Verhaltensauffälligkeiten zu zeigen. Ggf. bestehen Unterschiede in ihrer Beurteilung bzw. ihrem Bedürfnis nach sozialer Eingebundenheit und/ oder ihren (An-)Passungsleistungen an potenzielle Modelle. Ergebnisse vertiefender Analysen werden präsentiert und hinsichtlich ihrer Implikationen für einen inklusiven Unterricht diskutiert. Differenzierte Förderung von Schüler:innen mit Förderbedarf emotional-soziale Entwicklung und Zusammenhänge zur sozialen Partizipation Anne Hartmann, Jenny Lenkeit, Michel Knigge, Antje Ehlert, Nadine Spörer Universität Potsdam Theoretischer Hintegrund Soziale Partizipation von Heranwachsenden mit sonderpädagogischem Förderbedarf (SPF) ist ein zentrales Ziel inklusiver Beschulung (Schürer, 2020). Die Einbindung in Peerbeziehungen ist im Schulkontext von besonderer Bedeutung und erfüllt zahlreiche Entwicklungsaufgaben (Hannover & Zander, 2016). Jedoch ermittelten Studien mehrfach, dass die peer- und selbst-eingeschätzte soziale Partizipation von Schüler:innen mit einem SPF, insbesondere im Bereich emotional-soziale Entwicklung (ESE), im Vergleich zu ihren Mitschüler:innen ohne SPF geringer ausfällt. Diese Unterschiede treten vor allem bei stark externalisierenden Verhaltensproblemen der Schüler:innen auf (Blumenthal & Blumenthal, 2021; Crede et al., 2019; Schürer, 2020). Vor diesem Hintergrund gibt es verschiedene Ansätze, Schüler:innen mit einem SPF ESE in inklusiven Lehr-Lern-Settings differenziert zu fördern. Eine Möglichkeit stellen dabei temporäre Lerngruppen dar, in denen die Förderung fach- und fachübergreifender Kompetenzen parallel zum Regelunterricht in der Bezugsklasse stattfindet. Das Lernen in diesen typischerweise jahrgangsübergreifenden Gruppen ist durch intensive sonder- und sozialpädagogische Betreuung gekennzeichnet. Die Umsetzung und Wirksamkeit dieses Förderkonzepts für Schüler:innen mit SPF ESE in inklusiven Schulen wurde bislang nicht systematisch untersucht. In Hinblick auf das langfristige Ziel, die soziale Partizipation von Schüler:innen mit SPF ESE zu fördern, ist derzeit offen, ob positive Effekte einer intensiven separierten Förderung mögliche negative Effekte der Ausgrenzung ausgleichen können. In einem ersten Evaluationsschritt sollen daher die folgenden Forschungsfragen adressiert werden: Werden Schüler:innen der Lerngruppen weniger sozial akzeptiert als ihre Mitschüler:innen? Schätzen Schüler:innen der Lerngruppen das Klassenklima geringer ein als ihre Mitschüler:innen? Schätzen Schüler:innen der Lerngruppen das soziale Klima in der Lerngruppe höher ein als in ihrer Bezugsklasse? Methode Die Daten stammen aus einem längsschnittlichen Evaluationsprojekt zur Einführung temporärer Lerngruppen in inklusiven Grundschulen. Der erste Messzeitpunkt fand im Frühjahr 2023 im Klassen- bzw. Lerngruppenkontext statt. Die Stichprobe umfasste 34 Klassen der Jahrgangsstufen zwei bis fünf mit insgesamt 728 Schüler:innen. Davon lernten 41 Schüler:innen mit SPF ESE in zehn Unterrichtsstunden pro Woche in Lerngruppen. Die übrige Zeit nahmen sie am Unterricht ihrer Bezugsklasse teil. Innerhalb der Bezugsklassen konnten zudem 59 Schüler:innen identifiziert werden, die zwar einen SPF ESE hatten, aber nicht in den Lerngruppen gefördert wurden. Das Klassen- sowie Lerngruppenklima wurde mit je drei Items auf einer vierstufigen Likertskala (0–3) über Adaptionen der FEESS-Skala erfasst (α = .77 bzw. α = .64; Rauer & Schuck, 2003). Die soziale Akzeptanz wurde über ein soziometrisches Forced-Choice-Verfahren erfasst (angelehnt an Frederickson & Furnham, 2001). Zur Bildung der Akzeptanzvariable wurden erhaltene Freundschaftsnennungen durch mögliche Nennungen geteilt (Range 0-1). Ergebnisse Erste Analysen der Peereinschätzungen ergaben, dass Schüler:innen der Lerngruppen (LG) signifikant weniger sozial akzeptiert wurden als ihre Mitschüler:innen der Bezugsklassen (MLG = 0.27, SD = 0.19 vs. MKlasse = 0.38, SD = 0.17; t(703) = 4.225, p < .001, d = 0.69). Auch im Vergleich zu Mitschüler:innen mit SPF ESE, die nicht die Lerngruppen besuchten, wurden Lerngruppen-Schüler:innen weniger akzeptiert (Mdif = 0.08, SD = 0.04; t(69) = 2.277, p = .025, d = 0.47). Analysen der Selbsteinschätzungen zeigten, dass Schüler:innen der Lerngruppen das Klassenklima signifikant geringer einschätzten als ihre Mitschüler:innen (MLG = 1.68, SD = 0.91 vs. MKlasse = 1.89, SD = 0.74; t(659) = 1.757, p = .040, d = 0.29). Weiter nahmen Schüler:innen das Klima in der Lerngruppe positiver wahr als in ihrer Bezugsklasse (M = 2.16, SD = 0.71 vs. M = 1.67, SD = 0.88; t(33) = -3.072, p = .002, d = 0.53). Die Lerngruppe scheint somit ein Lernen in einer positiven Atmosphäre zu ermöglichen. In weiterführenden Analysen werden Schüler:innen der Lerngruppen basierend auf Hintergrundvariablen (z.B. Geschlecht, Arbeits- und Sozialverhalten) statistische Zwillinge der Bezugsklassen zugeordnet, um zu ermitteln, ob das Ausmaß der sozialen Partizipation eher auf individuelle Merkmale oder den Lerngruppenbesuch zurückführbar ist. Die vorläufigen Befunde weisen auf bedeutsame Unterschiede zwischen den untersuchten Gruppen hin. Inwiefern diese durch eine Förderung in temporären Lerngruppen verringert werden können, wird im Rahmen der längerfristig angelegten Evaluation zu klären sein.
13:10 - 14:50	2-12: Benefits of generative learning activities for creating lasting knowledge Ort: S19
	Symposium Benefits of generative learning activities for creating lasting knowledge Chair(s): Veit Kubik (University of Würzburg), Mirjam Ebersbach (University of Kassel), Tobias Richter (University of Würzburg) Diskutantin(nen): Lennart Schalk (Schwyz University of Teacher Education) A major goal of education is to create and foster lasting knowledge. To this end, the field of learning and instruction investigates conditions and interventions that enable learners to acquire knowledge they can access over a long time and use flexibly when needed. However, empirical research in psychology and education has focused almost exclusively on relatively short periods of time and often on memory performance as the preferred learning outcome, leaving a research gap on how to obtain durable and general benefits of learning and instructional techniques. Prior research, specifically on instructional design, has highlighted the usefulness of generative activities that serve both knowledge elaboration and consolidation (Fiorella & Mayer, 2016) and in turn long-term and transfer-oriented learning. In particular, when combined with retrieval practice, generative learning tasks provide the instructional support that students often need to elaborate and consolidate the learned contents. For example, typical generative learning tasks prompt students to self-explain, write learning protocols (Nückles et al., 2020), explain the learned contents to fictitious others (i.e., Fiorella & Mayer, 2013), or create external visual representations such as drawings (Ainsworth & Scheiter, 2021). These generative learning tasks can help to build up coherent mental representations of new knowledge and to integrate it with learners’ prior knowledge (Roelle et al., 2023). Against this background, the symposium will examine how generative learning (e.g., writing learning protocols, self-explanations, or generating a drawing) can be effectively implemented and also combined with practice in learning and instruction at both school and university levels to enhance long-lasting learning. Contribution 1* examines whether learning protocols are an effective instructional measure in the context of a follow-up course activity within a digital lecture among teacher university students. Specifically, the authors investigated the potential benefits of cognitive and metacognitive prompts, compared to a general prompt, as instructional support after 1 week in this unsupervised learning environment on both learning strategy use and comprehension performance. Contribution 2 examines the effectiveness of generating drawings as a generative learning strategy after 8 weeks in secondary school classrooms. Applying a pre-post-test experimental design, the authors compared explaining (to a fictitious peer) to restudy and examined the additive benefits of generating a drawing (explaining+drawing) or having access to an additional visualization (explaining+picture) for inquiry learning of physics contents. Contribution 3 investigates the effectiveness of combining self-explanation as a generative learning activity and retrieval practice as a desirable difficulty in the classroom of secondary education; the degree of retrieval practice was manipulated by implementing the retrieval task in a closed-book (vs. open-book) format. In two studies, the authors examined whether and how constructive retrieval (combined retrieval practice and self-explanation) benefits comprehension, retention, and future learning of complex physics content after 1 week and 12 weeks, compared to providing the two learning activities alone. All contributions are based on sound experimental designs, measures of learning outcome at longer delays, and target partly different generative learning activities in different student populations, in part with integrating or measuring retrieval-practice activities. Taken together, these studies provide complementary perspectives on how to create lasting and flexible knowledge in school and university contexts. The three contributions will be discussed by an expert in the field of teaching methods, learning materials, and instructional design in learning. The expert’s views on the presented research will contribute to draw theoretical and practical conclusions on how to combine and integrate generative learning principles and desirable difficulties to enhance long-term learning and transfer of knowledge to the (high-)school context and more complex learning materials. These educationally relevant findings will provide an important basis for evidence-based decisions in educational practice and policy (Kultusministerkonferenz, 2015; Slavin, 2002). Beiträge des Symposiums Learning protocols in a digital lecture: Cognitive, but not metacognitive prompts enhance comprehension and transfer Veit Kubik¹, Markus H. Hefter², Matthias Nückles³, Kirsten Berthold² ¹University of Würzburg, ²Bielefeld University, ³Matthias Nückles, University of Freiburg Background Writing learning protocols can foster generative learning (Roelle et al., 2023). One prominent way to enhance the effectiveness of learning protocols is to provide explicit prompts for students to apply cognitive and metacognitive strategies (Nückles et al., 2020). However, prior studies were typically conducted in a traditional, lab-based setting that provides strict experimental control (Berthold et al., 2007; Nückles et al., 2009). In recent years, COVID-19 policy measures required lecturers to provide prerecorded lectures in a digital format and students to learn the lecture’s contents in a self-regulated fashion largely at home. Prompted learning protocols may not be as instructionally supportive in this unsupervised digital environment. For example, given the increased risks of interruptions and students’ lower engagement, the learning protocol quality may decrease and with it the learning outcome. The aim of this study was to investigate how effective cognitive and metacognitive prompts are when provided in learning protocols as unsupervised follow-up course work within a digital lecture. Hypotheses (1) Cognitive prompts foster the application of organization and elaboration strategies, and metacognitive prompts foster the application of metacognitive strategies. (2) We tested the following hypotheses on the learning outcome. - Cognitive prompts lead to higher learning outcomes than a general prompt, and this cognitive prompt benefit is mediated by students’ use of organization and elaboration learning strategies. - Metacognitive prompts lead to higher learning outcomes than a general prompt. This predicted benefit of metacognitive prompts will be mediated by students’ use of metacognitive strategies. Methods We conducted an experimental field study during an online lecture. After a self-paced pretest, N = 97 student teachers watched a video lecture about Piaget and his Theory of Cognitive Development. In the second phase, they were instructed to write a learning protocol (30 min) and were randomly assigned to three experimental groups in which they received additional prompt(s) as instructional support: metacognitive prompts, cognitive prompts, versus a general prompt. In the third phase, student teachers provided with the lecture’s transcript to revise their learning protocols (30 min). In the final phase, they took a posttest after 1 week. Preliminary Results As compared to a general prompt, cognitive prompts specifically enhanced the students’ application of elaboration and organization strategies, while metacognitive prompts elicited the use of metacognitive strategies (ps < 0.05). Importantly, a one-factorial ANOVA on the overall posttest score revealed a significant main effect, F(2, 91) = 7.08, p < .001, ƞp2 = .135. A-priori contrast analyses showed that cognitive prompts, t = 3.57, p < .001, but not metacognitive prompts, t = 0.80, p = .425, lead to a higher learning outcome as compared to a general prompt. In addition, cognitive prompts resulted in a significant higher posttest performance than metacognitive prompts, t = 2.73, p = .008. This results pattern was existent for both comprehension and transfer performance, but there was no significant difference between experimental groups on retention, ps > .360. The benefit of cognitive prompts, compared to a general prompt, was fully mediated by the frequency of students’ use of elaboration strategies (β = .200, 95% CI [0.049, 3.746]). Discussion The results supported our hypothesis that cognitive and metacognitive prompts fostered the application of the learning strategies. Cognitive prompts resulted in higher comprehension and transfer but not higher retention performance. These findings suggest that prompts help to enhance the representations’ quality and elaboration rather than its consolidation (Nückles et al., 2020). The beneficial effects of cognitive prompts were related to students’ use of elaboration strategies. Similar to the results by Berthold et al. (2007), metacognitive prompts were not effective, despite the opportunity to revise the learning protocol–a finding that may be attributed to students’ low engagement in metacognitive strategies. Fostering lasting learning from inquiry with non-interactive generative activities: Explaining and drawing matter Heike Russ¹, Leonie Sibley¹, Salome Flegr², Jochen Kuhn³, Vincent Hoogerheide⁴, Katharina Scheiter⁵, Andreas Lachner¹ ¹Eberhard Karls University of Tübingen, ²Eberhard Karls University of Tübingen, Ludwig-Maximilians-University of Munich, ³Ludwig-Maximilians-University of Munich, ⁴University of Utrecht, ⁵University of Potsdam Constructing elaborated and lasting knowledge is a crucial endeavor in inquiry-based learning in school (Pedaste et al., 2015). However, school performance studies such as PISA or TIMSS attested to German students’ comparatively low achievements, especially in terms of scientific literacy or science achievements. To foster these achievements and associated lasting learning, effective instructional strategies are required. In this regard, empirical research indicated that pure learning from inquiry often puts high cognitive demands on school students, which precludes the envisioned benefits regarding lasting knowledge acquisition. Therefore, students need support with the elaborating and consolidation processes involved, to which generative activities are regarded to contribute (Fiorella & Mayer, 2016). Generative learning comprises different activities, such as creating verbal representations when explaining the learned contents to fictitious others (i.e., Fiorella & Mayer, 2013) or creating external visual representations like drawings (Ainsworth & Scheiter, 2021). How combinations of these multiple representations should be orchestrated to foster inquiry and lasting learning in school, is still an open question. In this study, we aimed to close this research gap and combined non-interactive explaining with drawing in an authentic classroom setting with secondary school students (7th and 8th grade, N = 590), focusing inquiry learning about the topic of converging lenses (physics, geometrical optics). We applied a pre-posttest experimental design, including an immediate and an eight-week delayed posttest, and four conditions: students either explained the learned contents to a fictitious peer (explaining), explained with having access to an additional visualization of the contents (explaining+picture), or explained with generating a drawing (explaining+drawing). A control group restudied the materials. We stated the following hypotheses: First, explaining (i.e., explaining, explaining+picture, explaining+drawing) should be more beneficial than restudy. Second, the combined visualization conditions (i.e., explaining+picture, explaining+drawing) should be more effective than the explaining condition. Third, explaining and actively generating a drawing (i.e., explaining+drawing) would be more beneficial than explaining with a provided picture. We assumed that the effects of our interventions would be more pronounced in the delayed posttest than in the immediate posttest. To answer our research questions, we performed planned contrast analyses. Results revealed that students who explained outperformed students in the control condition regarding their immediate learning outcome (d = .06, p = .006). Regarding monitoring accuracy, the control group judged their knowledge more accurately than the explaining conditions (d = -.06, p = .011). There were no significant differences in the immediate learning outcome (d = -.06, p = .068) and monitoring accuracy (d = -.05, p = .128) between the combined visualization conditions and the explaining condition. As expected, students who explained and generated a drawing outperformed students who explained with a provided picture regarding their immediate learning outcome (d = .12, p = .032). However, there were no differences in immediate monitoring accuracy (d = -.03, p = .566). Overall, there were no differences in delayed learning outcomes and monitoring accuracy. The findings highlight the crucial role of combining explaining with drawing tasks to enhance students’ mental representations during inquiry learning. However, the activities did not result in lasting learning. Further research is needed to explore how generative activities can be combined with consolidation activities, for instance, by inducing desirable difficulties (Richter et al., 2022), to fully enable lasting learning. Constructive retrieval with complex learning contents – Does the combination of self-explanation and closed-book improve lasting learning and preparation for future learning? Alexander Renkl¹, Tino Endres¹, Johanna Bohm¹, Andreas Vorholzer², Alexander Eitel³, Claudia von Aufschnaiter³ ¹University of Freiburg, ²Technical University of Munich, ³Justus-Liebig-University Giessen Theoretical Background and Research Question Learning in school involves two key instructional goals: (1) Comprehension: Students need to comprehend the learning content to be able to apply their knowledge to new and more complex contexts (Roelle et al., 2022). One way to promote comprehension, is to prompt generative learning activities such as (principle-based) self-explanations that lead to more elaborate processing (Renkl & Eitel, 2019). (2) Consolidation and future learning: In school, learning content often builds on each other (cumulative curriculum). Students therefore have to retrieve previously acquired knowledge after longer delays to expand their knowledge based on it. One way to support knowledge consolidation are desirable difficulties such as retrieval practice. Retrieval practice tasks require students to retrieve previously learned information from memory, thereby consolidating the respective content (Pan & Rickard, 2018). To investigate retrieval practice effects in the classroom, open-book tasks (students can look up information) and closed-book task (students have to retrieve / cannot look up information) can be used. Because students have to retrieve task-relevant information, closed-book tasks increase retrieval demands and thus improve learning (Rummer, 2019). These studies investigate if and how combining retrieval practice and generative learning activities (e.g., self-explanations) – also known as constructive retrieval (Hinze et al., 2013) – promotes comprehension and consolidation of complex learning contents in physics, resulting in lasting learning. Study 1 Method: As part of their regular physics lessons, students (11th grade; N = 120) learned about the topic of mechanics (linear movements) in a multimedia learning environment. All learning tasks within the learning environment were presented in closed-book format, creating high retrieval demands. Students were randomly assigned to one of two conditions (self-explanation vs. description prompts) and participated in three sessions: (1) Demographic data, pre-test (comprehension) and working on the learning environment; (2) one-week delayed posttest (retention, comprehension); (3) twelve-weeks delayed posttest (comprehension) and assessment of students’ preparation for future learning. To measure future learning and transfer, students worked on a multimedia instruction on circular motion that thematically builds upon the first learning environment. As a crucial influence on the success of constructive retrieval, task performance within the first learning environment is coded in terms of self-explanatory quality and retrieval success (Roelle et al., 2023). Results: The analysis of the pre-test and post-test considers item response theory. Regarding comprehension, an ANOVA with 3 repeated measures reveals that additionally to an overall learning gain for all students, the learning gain in the self-explanation prompt condition after one week was higher than in the description prompt condition, F(1,101) = 4.276, p < .05, ƞp2 = .04. As compared to the pre-test, there is a tendency towards the latter effect even after 12 weeks, F(1,101) = 3.774, p = .055, ƞp2 = .04. Discussion: The first study’s results show that constructive retrieval enhances long-term learning in complex physics content. In the subsequent study, we aim to explore how varying retrieval demands impact those benefits. Study 2 In addition to the learning activity (self-explanation vs. description prompts), we vary retrieval demands (closed-book vs. open-book). Otherwise, the procedure is identical to Study 1. We will test the effects of constructive retrieval using a 2 x 2 analysis comparing lasting learning and preparation for future learning. A mediation analysis will examine mental effort and self-explanation quality as mediators. Data collection will be completed in January 2024. Thus, we will present first results and discuss implications in March. General Discussion Both studies will illuminate whether constructive retrieval is useful with complex knowledge structures as in physics. By investigating constructive retrieval in an authentic classroom setting, we can assess the pivotal role of construction and retrieval within cumulative curricula.
13:10 - 14:50	2-13: Angst im Schulkontext - Operationalisierung, Einflussfaktoren und Auswirkungen in der Grundschule und der Zeit des Schulübergangs Ort: S28
	Symposium Angst im Schulkontext - Operationalisierung, Einflussfaktoren und Auswirkungen in der Grundschule und der Zeit des Schulübergangs Chair(s): Christin Beese (Universität Hamburg), Luise Scholz (Universität Hamburg) Diskutantin(nen): Frances Hoferichter (Universität Greifswald) Angst ist eine der am häufigsten berichteten Leistungsemotionen (Pekrun et al., 2007). Dies scheint insofern alarmierend, als dass Studienergebnisse auf Zusammenhänge mit erbrachten Leistungen, Wohlbefinden oder einem vorzeitigen Schulabgang hinweisen (Duchesne et al., 2008; Namkung et al., 2019; Robson et al., 2023; van Armeringen et al., 2003). Ängste im Schulkontext können damit von maßgeblicher Bedeutung für die Bildungslaufbahn eines Kindes sein. Ausgehend vom Sozial-kognitiven Modell der Entstehung von Lern- und Leistungsemotionen (Penkrun et al., 2007) kann angenommen werden, dass sich schulbezogene Emotionen durch verschiedene Umweltfaktoren, wie der elterlichen Kontrolle und Autonomieförderung, Aspekten der Unterrichtsqualität sowie verschiedenen Lern- und Leistungskognitionen (sog. Appraisals*, z. B. Einstellung, Selbstkonzept) herausbilden und in ihrer situativen Ausprägung beeinflusst werden. Zudem ist anzunehmen, dass dass diese sich auf das Lernen und die Leistung von Schüler:innen auswirken. Während die Forschungslandschaft sich durch eine Vielzahl an Studien zu Leistungsemotionen im fortgeschrittenen sekundären und tertiären Bildungsbereich auszeichnet (z.B. Bouffard & Labranche, 2022; Hoferichter & Raufelder, 2015; Song et al., 2015) ist hingegen wenig über die Entstehensbedingungen und Auswirkungen schulbezogener Ängste bei jüngeren Kindern, insbesondere in der Grundschule und in der Zeit des Übergangs in die Sekundarstufe, bekannt. Dabei ist auffällig, dass die vorhandenen Messinstrumente sich vorrangig auf Lernende der Sekundarstufe und spezifische Emotionsbereiche (z. B. Domänen, Prüfungen) beziehen. Das Ziel des Symposiums ist es daher, einen umfassenden Überblick zur Messung, zu den verschiedenen Einflussfaktoren und den Auswirkungen von Ängsten im Schulkontext in der Grundschule und der Zeit des Schulübergangs zu geben. Der erste Beitrag untersucht die psychometrische Güte eines neu entwickelten Erhebungsinstruments zur Erfassung der domänenspezifischen Angst in Bezug auf die Hauptunterrichtssprache. Dabei wird der Fragestellung nachgegangen, welche Faktorenstruktur sich für das Messinstrument ergibt, da dies Auskunft darüber gibt, ob sich bereits im mittleren Grundschulalter eine Generalisierung empfundener Symptome als Angst herausgebildet hat. Der zweite Beitrag betrachtet aus einer fachspezifischen Perspektive verschiedene Aspekte der wahrgenommenen Unterrichtsqualität und der Einstellung und des Selbstkonzepts von Schüler:innen als Einflussfaktoren auf Prüfungsangst im Sachunterricht. Zusätzlich werden die Auswirkungen der fachbezogenen Prüfungsangst auf die Schulleistungen in die Analysen einbezogen. Der dritte Beitrag untersucht dabei ausgehend von der Coping Motivational Theory (Skinner & Wellborn, 1997; Zimmer-Gembeck & Skinner, 2016) längsschnittliche Auswirkungen sozialer Integration und elterlicher Disziplinierungsmaßnahmen auf die Prüfungsangst in der Zeit des Schulübergangs. Abschließend werden die drei Beiträge von Dr. Frances Hoferichter diskutiert, kritisch betrachtet und weitere Perspektiven in Bezug auf zukünftige wissenschaftliche Forschung aufgezeigt. Beiträge des Symposiums Psychometrische Güte eines bildgestützten Fragebogens für die Grundschule zur Erfassung der Angstausprägung in Bezug auf die Hauptunterrichtssprache Linda Kuhr¹, Jürgen Wilbert² ¹Universität Potsdam, Freie Universität Berlin, ²Universität Potsdam Im Alltag des Menschen sind viele Kommunikationssituationen, häufig in einer Amtssprache des jeweiligen Landes, zu bewältigen. Die Grundschule vermittelt daher „eine grundlegende sprachliche Bildung“, um die Kinder „in gegenwärtigen und zukünftigen Lebenssituationen handlungsfähig“ (Kultusministerkonferenz, 2005, S.24) zu machen. In den meisten Ländern wird daher mindestens eine der Amtssprachen als eigenes Fach unterrichtet und als Hauptunterrichtssprache verwendet. Diese Fachkompetenz ist somit zur gesellschaftlichen Teilhabe von besonderer Bedeutung und wird von leistungsbezogenen Emotionen beeinflusst (Pekrun et al., 2002). Eine Emotion, die als starker Einflussfaktor auf die Leistung berichtet wird, ist Angst. Bisher existieren jedoch weder im, noch außerhalb des deutschsprachigen Raums Untersuchungen, die sich ausschließlich auf diese domänenspezifische Angst richten (Piccolo et al., 2017; Raccanello et al., 2019). Daher wird im vorliegenden Beitrag ein Instrument zur Erfassung eben dieser domänenspezifischen Angst in Bezug auf die Hauptunterrichtssprache für den deutschsprachigen Raum für das Grundschulalter entwickelt und auf seine Güte hin überprüft. Die Konstruktion orientiert sich an entsprechenden Forschungsbefunden zu anderen domänenspezifischen Ängsten, insbesondere der Mathematikangst. Es wurden sechs Kriterien entwickelt, die das Instrument erfüllen soll. Die zentralen Anforderungen sind: (1) Das Instrument soll die differentialpsychologische Erfassung des Konstrukts berücksichtigen, es wird somit das gesamte Emotionskontinuum von Angst erfasst, dessen maximale Ausprägung in den Bereich einer spezifischen Phobie hineinreicht (Schnabel, 1998). (2) Bei der Instrumentenentwicklung wird berücksichtigt, dass Angst einen gegenwarts- und zukunftsgerichteten Charakter aufweist (Spielberger, 1972) und (3) situationsspezifische angstauslösende Reize existieren (z. B. LeDoux & Pine, 2016), wenn gleich davon ausgegangen wird, dass die kognitive Einordnung dieser Reize erst zur eigentlichen Einordnung des Erlebens als Angst führt (Pekrun et al., 2007). Zudem soll das Instrument (4) Pekrun et al.s (2007) Verständnis von Angst als Verbund psychologischer Prozesse mit verschiedenen Dimensionen aufgreifen. Darüber hinaus wird (5) das Begriffsverständnis der Domäne der Hauptunterrichtssprache am Beispiel Deutsch in Anlehnung an domänenvergleichende Untersuchungen (wie z. B. Goetz et al., 2012; Sparfeldt et al., 2016) verfolgt. Die teilhaberelevanten Kernkompetenzen Zuhören, Sprechen, Lesen, Schreiben und Rechtschreiben stehen dabei im Fokus (Kultusministerkonferenz, 2005). Zudem soll das Instrument den Gegenstandsbereich (6) kindgerecht erfassen. Das Ergebnis dieses Entwicklungsprozesses ist ein neuer Fragebogen, dessen Reliabilität und diskriminante (Leseleistung) sowie konvergente Validität (Allgemeine Schulangst, Mathematikangst) überprüft wird. Auch die theoretisch hergeleitete Struktur wird item- und faktoranalytisch überprüft. Dabei sind auf Basis der Arbeiten von LeDoux und Pine (2016) zwei verschiedene Faktorenstrukturen des Fragebogens denkbar: Zum einen eine Struktur mit einem Faktor zweiter Ordnung (Angst in der Hauptunterrichtssprache), zum anderen eine Struktur ohne diesen Faktor. Dies begründet sich dadurch, dass sich die Wahrnehmung der Komponenten mit zunehmendem Lebensalter verändert und damit die Kategorisierung der Prozesse in einer Situation im Sinne der psychologisch definierten Emotion Angst durch das Individuum erst mit zunehmendem Alter erfolgt. Eine klare empirische Absicherung, ab wann das Alter erreicht ist, in dem sich diese subjektive Wahrnehmung der psychologischen Definition Angst angleicht, ist bisher nicht bestimmt, weswegen unklar ist, ob sich in der anvisierten Zielgruppe dieser Faktor zweiter Ordnung bereits abbilden lässt. Es werden Forschungsdaten von 253 Kindern der 3. Klassen aus Berlin und Brandenburg ausgewertet. In den Itemanalysen zeigt sich, dass die Symptomskalen affektive, kognitive und physiologische Symptome zufriedenstellende interne Konsistenzen aufweisen (α= .79 - .84, ω = .79 - .85). Ihre Trennschärfen liegen im hohen Bereich (.50 - .52), jedoch sind die Skalen sehr homogen und die Itemschwierigkeiten gering. Die Skala behaviorale Symptome bildet eine Ausnahme, sie weist mit α und ω =.69 eine zu geringe interne Konsistenz auf, wobei ihre Homogenität und Trennschärfe im akzeptablen Bereich liegt. Die konfirmatorischen Faktorenanalysen weisen darauf hin, dass beide Faktorenstrukturen nicht optimal sind, jedoch eine leichte Präferenz für das Modell ohne Faktor zweiter Ordnung vorliegt. Im Vortrag werden Implikationen zur Weiterentwicklung des Fragebogens und ergänzende Forschungsdesiderata diskutiert. Unterrichtsbezogene Einflussfaktoren von Prüfungsangst im Sachunterricht bei Viertklässler:innen – Eine Untersuchung auf der Datengrundlage von TIMSS 2019 Luise Scholz, Christin Beese, Knut Schwippert Universität Hamburg Die Leistungsemotion Prüfungsangst wurde bereits in vielen Untersuchungen als erklärende oder zu erklärende Variable eingebunden (z. B. Jonberg et al., 2021; Kunter et al. 2011; Rosenfeld & Valtin 1997; Weinert & Helmke 1997). Trotzdem fehlen bisher Studien, die die Zusammenhänge von Prüfungsangst und den drei Basisdimensionen der Unterrichtsqualität sowie der Leistung in den Naturwissenschaften untersuchen. Dies scheint besonders erstaunlich, da einerseits zahlreiche Untersuchungen zum Zusammenhang von Unterrichtsqualität und Schulleistung sowie weiteren Determinanten in den Naturwissenschaften bzw. im Sachunterricht vorliegen (z. B. Fauth et al., 2014; Baumert et al., 2010; Borowski et al., 2010) und andererseits bereits für das Fach Mathematik entsprechende Befunde existieren, die eine Überprüfung für andere Fächer anzeigen (Kunter et al., 2011). Somit zeigt sich im Bereich der Grundschulforschung diesbezüglich ein Forschungsdesiderat. Die Betrachtung der angenommenen Zusammenhänge in der Grundschule ist angezeigt, da Prüfungsangst zunächst in einer situationsbezogenen, also zeitlich begrenzten Form auftritt, sich aber über die Zeit manifestieren und zu einer stabilen Persönlichkeitseigenschaft werden kann (Kucian, 2018). Um der Entwicklung einer dauerhaften Prüfungsangst entgegenwirken zu können, sollten präventive Ansätze bereits in der frühen Schulzeit Anwendung finden. Dieser Beitrag widmet sich daher zwei Fragestellungen: Erstens, inwieweit Merkmale der Unterrichtsqualität vermittelt über die Einstellung und das Selbstkonzept der Schüler:innen als Einfluss- und Bedingungsfaktoren der Prüfungsangst im Sachunterricht in der Grundschule fungieren und zweitens, ob ein Zusammenhang zwischen der Prüfungsangst im Sachunterricht und den naturwissenschaftlichen Kompetenzen von Grundschüler:innen in Deutschland besteht. Damit orientiert sich die Untersuchung an dem sozial-kognitiven Modell zur Entstehung von Lern- und Leistungsemotionen, das auf dem Appraisal-Ansatz beruht (Götz et al., 2004). Diesem zufolge entstehen Lern- und Leistungsemotionen über Lern- und Leistungskognitionen („Appraisals“), die wiederum durch Einflüsse aus der Sozialumwelt zustande kommen. Die Unterrichtsqualitätsmerkmale lassen sich dabei dem Bereich Sozialumwelt zuordnen, weshalb ein indirekter Zusammenhang mit der Prüfungsangst angenommen werden kann. Vermittelt wird dieser Zusammenhang dem Modell nach über Lern- und Leistungskognitionen, zu denen unter anderem die Valenz- und die Kontrollkognitionen gehören. Um diesen indirekten Zusammenhang adäquat abbilden zu können, werden daher die Einstellung zum Fach Sachunterricht als Valenzkognition und das fachspezifische Selbstkonzept als Kontrollkognition mit in die Untersuchung aufgenommen. Mit den Datensätzen der TIMS-Studie liegen umfangreiche Daten vor, die eine Untersuchung dieser Zusammenhänge für die Grundschule anhand einer für Deutschland repräsentativen Stichprobe (n = 4 942 Schüler:innen) ermöglichen. Die Grundlage für die Analysen dieses Beitrags bilden die Daten der Schülerbefragung sowie der standardisierten Leistungstests von TIMSS 2019. Mithilfe von Mehrebenenstrukturgleichungsmodellen (MSEM) in Mplus werden die komplexen Zusammenhänge der drei Basisdimensionen der von den Schüler:innen wahrgenommenen Unterrichtsqualität (Klassenführung, konstruktive Unterstützung, kognitive Aktivierung) vermittelt über die fachbezogene Einstellung und das fachbezogene Selbstkonzept im Sachunterricht auf die Prüfungsangst analysiert. Zusätzlich wird die Auswirkung der Prüfungsangst auf die naturwissenschaftliche Kompetenz von Viertklässler:innen unter Berücksichtigung der geschachtelten Datenstruktur abgebildet (Ditton, 1998). Die Kompetenzen der Schüler:innen in der Domäne Naturwissenschaften werden anhand von fünf Leistungsschätzern (plausible values) operationalisiert. Das theoretisch hergeleitete Mehrebenenmodell zeigt sehr gute Modell-Fit-Werte. Die Ergebnisse der Analysen zeigen einen signifikanten mittleren negativen Effekt des Selbstkonzepts und einen signifikanten geringen gegensätzlichen Effekt der Einstellung auf die Prüfungsangst. Bezogen auf die Unterrichtsqualitätsmerkmale zeigt sich primär die konstruktive Unterstützung als signifikanter Einflussfaktor auf das Selbstkonzept sowie auf die Einstellung von Grundschüler:innen. Somit lassen sich mit der konstruktiven Unterstützung und dem Selbstkonzept erste Hinweise auf relevante Ansatzpunkte für die Prävention von Prüfungsangst im Bereich des Sachunterrichts aufzeigen. Zudem hat die Prüfungsangst einen mittleren negativen Effekt auf die naturwissenschaftlichen Kompetenzen der Schüler:innen, was die Notwendigkeit von präventiven Maßnahmen noch einmal betont. Die Ergebnisse der Untersuchung liefern somit einen wichtigen Beitrag zur Untersuchung von Prüfungsangst in der Grundschule in Deutschland. Wahrgenommene soziale Integration, elterliche Kontrolle und Autonomieunterstützung: Differentielle Effekte auf die Prüfungsangst von Jungen und Mädchen in der Zeit des Schulübergangs. Paulina Feige, Rainer Watermann Freie Universität Berlin Aufgrund von Befunden, die darauf hindeuten, dass Testsituationen mit hohen Anforderungen die Wahrscheinlichkeit von Prüfungsangst erhöhen (Robson et al., 2023; Valtin & Wagner, 2004; von der Embse et al., 2018) und dass Stress im Allgemeinen mit der Entstehung von Ängsten in Zusammenhang steht (Williams et al., 2005), kann angenommen werden, dass der Übergang in die Sekundarstufe eine kritische Phase in der Entwicklung von Prüfungsangst ist. So markiert die Zeit des Übergangs einen bedeutenden Wendepunkt, der mit einer hohen Leistungsbetonung und drastischen Veränderungen im akademischen und sozialen Leben der Schüler und Schülerinnen einhergeht und somit ein hohes Maß an verhaltensbezogener und psychologischer Anpassung erfordert (Sirsch, 2003; Wigfield et al., 1991). Auf Grundlage der Coping Motivational Theory (Skinner & Wellborn, 1997; Zimmer-Gembeck & Skinner, 2016) kann davon ausgegangen werden, dass soziale Faktoren, wie die Akzeptanz der neuen Klassenkameraden und elterliche Disziplinierungsmaßnahmen diesen Anpassungsprozess beeinflussen. Die Forschung zu sozialen Einflüssen auf die Prüfungsangst konzentrierte sich jedoch bisher auf Jugendliche und junge Erwachsene im fortgeschrittenen sekundären (ab der 7. Klasse) oder tertiären Bildungsbereich (z.B. Putwain et al., 2010; Ringeisen & Raufelder, 2015; Song et al., 2015). Hingegen ist wenig über jüngere Kinder, insbesondere in der Zeit des Schulübergangs, bekannt. Die vorliegende Studie untersucht daher die längsschnittliche Rolle der wahrgenommenen Integration in den neuen Klassenkontext (Beispielitem: Ich habe viele Freunde in meiner Klasse), der wahrgenommenen elterlichen Kontrolle (Beispielitem: Drohen meine Eltern mir Strafen an) und der wahrgenommenen elterlichen Autonomieunterstützung (Beispielitem: Sagen mir meine Eltern nicht gleich, was ich tun soll, sondern hören sich in Ruhe an, wie ich selbst mit der Situation umgehen will), für die Prüfungsangst von Mädchen und Jungen in der Zeit des Übergangs in die Sekundarstufe. Dazu wurden die Daten von 1770 Schülerinnen und Schülern (51,02 % weiblich) aus der Trends in International Mathematics and Science Study (TIMSS) Übergangsstudie (Becker et al., 2010) vor (4. Klasse) und nach dem Übergang (Klassen 5-7) in einem Mehrgruppen-Strukturgleichungsmodell (Mädchen vs. Jungen) ausgewertet. Unsere Ergebnisse deuten darauf hin, dass Jungen und Mädchen im letzten Jahr der Grundschule die höchste Prüfungsangst empfinden. Dementsprechend könnte die letzte Periode der Grundschulzeit eine kritische Phase in der Entwicklung von Prüfungsangst sein. Darüber hinaus schien die soziale Integration in den neuen Klassenkontext nur für die Veränderung der Prüfungsangst bei Mädchen relevant zu sein. Die wahrgenommene elterliche Kontrolle sagte die Veränderung der Prüfungsangst nach dem Übergang für Jungen und Mädchen positiv vorher. Demgegenüber wurde kein signifikanter Zusammenhang zwischen der berichteten Prüfungsangst und elterlicher Autonomieunterstützung gefunden. Die Studie bietet neue praktische Einblicke in die (differenziellen) Erfolgsbedingungen für Schulübergänge für Jungen und Mädchen. Dementsprechend werden Interventionsprogramme benötigt, die sowohl die soziale Einbindung in den neuen Klassenkontext, als auch die Wahrnehmung elterlicher Disziplinierungsmaßnahmen berücksichtigen.
13:10 - 14:50	2-14: Von Vielfalt profitieren – Eine ganzheitliche Förderung von Schülerinnen und Schülern durch multiprofessionelle Kooperation gestalten Ort: H07
	Symposium Von Vielfalt profitieren – Eine ganzheitliche Förderung von Schülerinnen und Schülern durch multiprofessionelle Kooperation gestalten Chair(s): Monique Ratermann-Busse (Institut Arbeit und Qualifikation an der Universität Duisburg-Essen), Susanne Enssen (Institut Arbeit und Qualifikation an der Universität Duisburg-Essen), Philipp Hackstein (Institut Arbeit und Qualifikation an der Universität Duisburg-Essen) Diskutantin(nen): Nina Bremm (Friedrich-Alexander-Universität (FAU) Erlangen-Nürnberg) Schulen in sozial deprivierter Lage liegen oft in Gebieten, die von „sozioökonomischen Polarisierungs- und Entmischungsprozessen“ (Bremm et al., 2016, 325) geprägt sind. Die Schulen kennzeichnen sich durch eine heterogene und sozial benachteiligte Schüler:innenschaft aus, deren Familien zumeist einen geringen sozioökonomischen Status haben. Gründe hierfür können bspw. ein niedriger Bildungsabschluss, Arbeitslosigkeit und der Empfang von Sozialhilfeleistungen sowie ein Migrationshintergrund und daraus resultierende Sprachbarrieren sein (Bremm et al., 2016; Enssen et al., i. V.). Studien verweisen auf multiprofessionelle Kooperation, die sowohl innerschulisch als auch durch die Kooperation mit außerschulischen Partnern geprägt sein kann, als wichtige Gelingensbedingung für Schulen in herausfordernden Lagen zur Unterstützung von Schüler:innen mit heterogenen Bedarfen (Serke, 2022; van Ackeren et al., 2021; Fussangel & Richter, 2017). Dabei erfolgen Kooperationen mit außerschulischen Partnern sehr zweckorientiert und sind beispielsweise bei der Gestaltung von Ganztagsangeboten häufig interinstitutionell (Kielblock & Rinck, 2021, 2022) oder insbesondere bei der beruflichen Orientierung zusätzlich durch die Zusammenarbeit mit betrieblichen Akteuren geprägt (Bigos, 2020; Ratermann-Busse et al., 2022). Gleichzeitig sind Qualität und Wirkung von multiprofessioneller Kooperation ein Forschungsdesiderat (Hochfeld & Rothland, 2022). Im Schulalltag zeigt sich, dass multiprofessionelle Kooperation eine Herausforderung darstellt, ihr Gelingen nicht garantiert ist (Gräsel et al., 2006; Speck et al., 2011) und von multiplen Einfluss- und Bedingungsfaktoren abhängt (Hochfeld & Rothland, 2022). Im Rahmen der Bund-Länder-Initiative „Schule macht stark“, an der bundesweit 200 Schulen in sozial deprivierter Lage teilnehmen, sollen Schul- und Unterrichtsentwicklungsprozesse gefördert und Bildungschancen von sozial benachteiligten Schüler:innen verbessert werden. Im Fokus steht dabei auch die Identifikation und Nutzbarkeit von Potenzialen des Sozialraums für multiprofessionelle Kooperationen im Rahmen einer kontextsensiblen Schulentwicklung. Wissenschafter:innen greifen hier zum einen auf bestehendes Wissen aus vorausgegangen Studien zurück und arbeiten zum anderen in einem ko-konstruktiven Prozess mit Schulen zusammen, um diese anhand ihrer individuellen Bedarfslagen zu unterstützen und gleichzeitig transferierbares Praxiswissen zu generieren. Vorliegende Erkenntnisse, die auf einer engen Zusammenarbeit mit Schulen in verschiedenen Werkstattformaten beruhen, zeigen, dass eine gelingende multiprofessionelle Kooperation eine ganzheitliche Perspektive auf die bedarfsorientierte Förderung von Schüler:innen im Übergangsprozess ermöglicht. Dabei führen transparente Strukturen und Prozesse sowie Zuständigkeiten zu einer effektiven Gestaltung des Schulalltags, wobei personelle und zeitliche Ressourcen sinnvoll eingesetzt werden können. Im Symposium werden vier Beiträge (á 15 Minuten) vorgestellt, die gemeinsam die folgende übergeordnete Frage beantworten: Wie kann eine multiprofessionelle Kooperation gelingen, damit sie einen Mehrwert für eine bedarfsorientierte und kontextsensible Schulentwicklung mit dem Ziel der ganzheitlichen Förderung von Schüler:innen hat? Beitrag 1* setzt sich mehrebenenanalytisch mit dem Zusammenhang von multiprofessioneller Kooperation, Angebotsqualität und benachteiligten Schüler:innen auseinander und fragt, welchen Einfluss diese auf das schulische Wohlbefinden hat. Daran anknüpfend befasst sich Beitrag 2 mit multiprofessioneller Kooperation in Familienzentren im Primarbereich und der Frage, welche Strategien Grundschulen zur Gestaltung multiprofessioneller Kooperation nutzen, um ganzheitlich und ressourcenorientiert mit Familien zusammenzuarbeiten. Das Bindeglied zwischen der Primar- und Sekundarstufe stellt Beitrag 3 dar, welcher den Blick auf Bedarfe, Chancen und Herausforderungen in der Kooperation zwischen Schule und außerschulischen Partnern richtet. Abschließend behandelt Beitrag 4 die reflexiv und partizipative Gestaltung einer multiprofessionellen Kooperation für die Begleitung von Schüler:innen im Übergangsprozess von der Schule ins Erwachsenwerden, eine berufliche Ausbildung oder ein Studium. Auf Basis qualitativer und quantitativer Forschung in den Projekten „StEG - Studie zur Entwicklung von Ganztagsschulen“, „Familienzentren im Primarbereich“ und „Schule macht stark“ soll entlang der Bildungskette eine multiperspektivische Betrachtung auf die Förderung von Schüler:innen durch multiprofessionelle Kooperation erfolgen und der Transfer von Erkenntnissen zur bedarfsorientierter und kontextsensibler Schulentwicklung in den Blick genommen werden. Im Anschluss an die Beiträge folgt eine themenübergreifende Diskussion (ca. 30-40 Minuten) mit Beteiligung von Prof. Dr. Nina Bremm (FAU Erlangen-Nürnberg) als Diskutantin. Dabei werden die Ergebnisse mit Blick auf die übergreifende Frage reflektiert und ihre Transferpotenziale diskutiert. Beiträge des Symposiums Multiprofessionelle Kooperation, Angebotsqualität und das Wohlbefinden in der Schule. Mehrebenenanalysen zum Beitrag von multiprofessionellen Kooperationsstrukturen für Kinder in der Ganztagsschule Amina Kielblock, Stephan Kielblock DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation Die Ergebnisse der PISA-Studie vor etwa zwei Jahrzehnten und deren Diskussion ebneten politisch den Weg, Ganztagsschulen flächendeckend in Deutschland einzuführen (Tillmann & Kuhn, 2015). Es wird angenommen Ganztagsschulen haben ein besonderes Potenzial, Schüler:innen – auch an Schulen in herausfordernden Lagen – individuell zu unterstützen (van Ackeren et al., 2021). Um dies umzusetzen, werden vielfältige multiprofessionelle und interinstitutionelle Kooperationen eingegangen (Kielblock, 2022). Auch mit Blick auf den ab 2026 gesetzlichen Anspruch auf ganztägige Förderung von Grundschulkindern ist die Qualität in der Grundschule wichtig (KMK, 2023). In diesem Beitrag wird der Blick auf die pädagogische Kooperation an Ganztagsgrundschulen gelenkt. Es wird untersucht, inwiefern diese mit der Angebotsqualität und mit dem Wohlbefinden der Schüler:innen zusammenhängt. Das Wohlbefinden ist für ein positives Aufwachsen wichtig und ist zentrale Aufgabe der Schule (UNESCO, 2022), auch der Ganztagsschule (KMK, 2023). Forschungsbefunde zu Sekundarstufenschüler:innen I zeigen, dass eine hohe Angebotsqualität das Wohlbefinden stärkt (Fischer, Brümmer & Kuhn, 2011; Fischer & Theis, 2014). Eine Rolle bei der Angebotsqualität spielt u.a. die von den Schüler:innen eingeschätzte Beziehungsqualität. Hier ist bekannt, dass die Beziehungsqualität sich positiv auf das Sozialverhalten (Fischer, Kuhn & Züchner, 2011) sowie auf Schulerfolg-relevante Merkmale (Dohrmann, Brisson & Kielblock, 2021; Fischer, Brümmer & Kuhn, 2011; Kuhn & Fischer, 2011a) auswirkt. Dass die Qualität sich auf Schüler:innenmerkmale auswirkt, findet sich im Modell zur Schulwirksamkeit von Ganztagsschule (Holtappels, 2009). Diesem zufolge ist die Qualität der Ganztagsangebote von Merkmalen der Schulgestaltung abhängig, zu denen auch die multiprofessionelle Kooperation zählt. Von der Kooperation wird gemeinhin angenommen, dass sie vielfältige positive Effekte für die pädagogische Praxis bringen könnte (WHO, 2010). Diese Annahme ist theoretisch begründet, aber es fehlt an empirischer Evidenz (Hochfeld & Rothland, 2022; Kielblock & Rinck, 2021, 2022). Deshalb wird im Vortrag untersucht, inwiefern die Angebotsqualität mit dem Wohlbefinden der Schüler:innen zusammenhängt (Frage 1a) und ob sich der Zusammenhang nach Schüler:innen- und Schul-Ebene unterscheidet (Frage 1b). Auf Schulebene wird der Zusammenhang der Kooperation mit der Angebotsqualität (Frage 2a) und dem Wohlbefinden (Frage 2b) analysiert. Ferner wird der Zusammenhang mit der zu Hause gesprochenen Sprache (als ein Teil-Indikator für soziale Benachteiligung, vgl. Schräpler & Forell, 2023) und dem Wohlbefinden untersucht (Frage 3a) und ob es Unterschiede zwischen der Schüler:innen- und Schul-Ebene gibt (Frage 3b). Dafür eine Sekundäranalyse der Studie zur Entwicklung von Ganztagsschulen (StEG; 2005–2011) vorgenommen. Ausgewertet wird der Primarschüler:innendatensatz von 2009 (3. Klasse, Substichprobe: Schüler:innen, mit Ganztagsteilnahme, n=1107) sowie der dazugehörige Schulleitungsdatensatz (n=75). Das Wohlbefinden wird mittels Schulzufriedenheit (5 Items) operationalisiert, die Angebotsqualität durch die Skala „Positive Wahrnehmung von Betreuerverhalten und Ganztagsangeboten“ (5 Items). Für die Einschätzung der multiprofessionellen Kooperation, werden die Antworten der Schulleitung herangezogen. Berechnet wird ein Mehrebenenpfadmodell, das auf Schüler:innenebene (Level 1) die Qualität und die zu Hause gesprochene Sprache auf das Wohlbefinden modelliert. Auf Schulebene (Level 2) wird zudem die Kooperation auf die Qualität sowie auf das schulische Wohlbefinden modelliert. Die Mehrebenenanalysen ergeben ein kohärentes Bild: Zu Frage 1 zeigt die Analyse, dass die Qualität mit dem Wohlbefinden positiv zusammenhängt (Level 1: beta=.22*, Level 2: beta=.68). Hinsichtlich Frage 2 zeigt sich: auf Schulebene hängt die Kooperation stärker mit der Qualität zusammen (beta=.34) als mit dem Wohlbefinden (beta=.21). Die zu Hause gesprochene Sprache hat auf Individualebene keinerlei Effekt, aber auf Schulebene: Schulen mit einem hohen Anteil an Schüler:innen, die zu Hause nicht Deutsch sprechen, haben gleichzeitig einen hohen Anteil von Schüler:innen, die sich nicht in der Schule wohlfühlen (beta=-.47, Frage 3). Die vorliegenden Analysen erweitern das Wissen um die multiprofessionelle Kooperation in Ganztagsgrundschulen: hier wurde die Kooperation erstmals u.a. mit der Qualität und den Schüler:innenoutcomes in Verbindung gebracht. Weitere Analysen sind geplant (bspw. den Einbezug weiterer Benachteiligungsmerkmale). Multiprofessionelle Kooperation in Familienzentren im Primarbereich: Zusammenarbeit zwischen Grundschule und Familien ganzheitlich gestalten Philipp Hackstein Institut Arbeit und Qualifikation an der Universität Duisburg-Essen Die Anforderungen an Grundschulen gehen weit über die Gestaltung des Unterrichts hinaus und umfassen Schulentwicklungsaufgaben zur Schaffung eines ganzheitlichen Lern- und Lebensorts für Kinder. Dazu gehören bspw. die Gestaltung eines adäquaten Ganztagsangebotes, die Öffnung zum Sozialraum, die Implementierung digitaler Bildungsinfrastruktur oder die Umsetzung von Inklusion (Brinkmann et al., 2021, S. 3). Diese komplexen Aufgaben sind insbesondere für Schulen in herausfordernden Lagen, die durch einen hohen Anteil an sozial benachteiligten Schüler:innen gekennzeichnet sind (van Ackeren et al., 2021, S. 20), anspruchsvoll. Zur Unterstützung dieser Schulen und zur Gestaltung eines ganzheitlichen Blicks auf die Entwicklung von Kindern sind neben Lehrkräften vermehrt weitere pädagogische und nicht-pädagogische (Fach)Kräfte in Schule vorzufinden. Mit einer steigenden Anzahl an beteiligten Professionen und der zunehmenden Ausdifferenzierung der Personalstruktur an Schulen (Hochfeld & Rothland, 2022, S. 455) werden Kompetenzen zur Kooperation wichtiger, da multiprofessionelle Strukturen eine zentrale Gelingensbedingung für einen ganzheitlichen Blick auf die Lern- und Entwicklungsprozesse von Kindern darstellen (Brinkmann et al., 2021, S.3). Für die Gestaltung von Grundschulen als Lern- und Lebensort ist auch eine ressourcenorientierte Zusammenarbeit mit Familien von Bedeutung. Die Kooperation zwischen Schule und Familien verbessert Vertrauen und Wertschätzung innerhalb der Schulgemeinde, wirkt sich positiv auf Schule und Lehrkräfte aus und verbessert die Sozialkompetenz und Lernmotivation von Schüler:innen, was langfristig auch auf die Leistungsentwicklung begünstigen kann (Sacher, 2022, S. 21). Ein Konzept für die Zusammenarbeit von Grundschule und Familien ist das „Familienzentrum im Primarbereich“ (FaPri), das insbesondere in Nordrhein-Westfalen gefördert wird (bspw. MSB, 2023). Ziel der FaPri ist die Verbesserung von Bildungschancen von Kindern und der Abbau von Herkunftseffekten durch die Stärkung der Bildungs- und Erziehungspartnerschaft (Born et al., 2019; Boudon, 1974). FaPri zeichnen sich durch Familien-, Sozialraum- und Kooperationsorientierung aus (Hackstein et al., 2023a, S. 106). Eine zentrale Gelingensbedingung für die Implementierung des Konzepts ist die Verknüpfung der schulischen Teilsysteme und die Etablierung multiprofessioneller Strukturen, um professionsübergreifend und „aus einer Hand“ mit Familien zusammenzuarbeiten (Hackstein et al., 2023b). Im Rahmen des Beitrags wird deshalb folgende Fragestellung beantwortet: Welche Strategien zur Gestaltung multiprofessioneller Kooperation nutzen Grundschulen, um ganzheitlich und ressourcenorientiert mit Familien zusammenzuarbeiten? Als Datengrundlage für den Beitrag dienen Fallstudien an elf FaPri in Nordrhein-Westfalen, die im Rahmen von zwei Projekten (ein regionales Fallstudienprojekt und „Schule macht stark“) durchgeführt wurden. Dabei werden zum einen leitfadengestützte Expert:inneninterviews (n=90) mit Schulleitungen (n=11), FaPri-Koordinator:innen (n=9), Schulsozialarbeiter:innen (n=9), Ganztagsleitungen (n=10), Ganztags-(Fach)Kräften (n=24) und Lehrkräften (n=27) auswertet. Zum anderen wurden an drei der elf Grundschulen ko-konstruktive Werkstätten durchgeführt. Hier haben Wissenschaft und Grundschulpraxis gemeinsam Strategien zur Gestaltung von multiprofessioneller Kooperation als Basis für die Zusammenarbeit mit Familien entwickelt, die in Form von transferierbaren Gestaltungsinstrumenten festgehalten wurden. Im Symposiumsbeitrag werden Ergebnisse aus den Fallstudien sowie die ko-konstruktiv entwickelten Instrumente vorgestellt. Dabei werden Gelingensbedingungen und Herausforderungen identifiziert, die im Folgenden beispielhaft angeführt werden (siehe auch Hackstein, 2023b). Zur Etablierung von multiprofessioneller Kooperation ist die Gestaltung eines ganzheitlichen schulischen Selbstverständnisses und die Definition von Leitorientierungen (bspw. der „Blick auf’s Kind“ als gemeinsame Klammer) wichtig. Der Schulleitungsrolle kommt für diese Aufgabe als auch für die Initiierung und Steuerung von multiprofessionellen Teamstrukturen eine zentrale Bedeutung zu. Deutlich wird, dass Schulleitungen hier zum Teil im Kompetenzaufbau unterstützt werden müssen. Außerdem zeigt sich, dass der professionsübergreifende Austausch im schulischen Alltag gestaltet werden muss. Insbesondere bei additiven Ganztagskonzepten und vielen teilzeitbeschäftigten (Fach-)Kräften ist eine Institutionalisierung notwendig. Des weiteren sind eine Rollenklärung und -abgrenzung zwischen den (Fach)Kräften von Bedeutung, um bspw. niedrigschwellige Angebote und Zugänge für Familien gestalten zu können. Bedarfe, Chancen und Herausforderungen außerschulischer Kooperationen bei Schulen in sozial deprivierten Lagen Holger Bargel, Birgit Reißig Deutsches Jugendinstitut Die Kooperation von Schule mit außerschulischen Akteur:innen soll über ein breites Bildungsangebot dazu beitragen, Bildungs- und Lernprozesse zu verbessern. Dies trägt zugleich einem erweiterten Bildungsverständnis Rechnung, bei dem ein Zusammenwirken formaler, non-formaler und informeller Bildungsprozesse ermöglicht wird (StEG-Konsortium, 2019). Aus Forschungszusammenhängen gibt es Hinweise, dass Schüler:innen von Kooperationen profitieren, z.B. über eine bessere individuelle Förderung. Schulen können ihre Ressourcen effektiver nutzen und pädagogische Innovationen werden befördert (Jutzi, 2018). Gerade in benachteiligten Sozialräumen scheinen Kooperationen zwischen Schule und außerschulischen Partner:innen besonders relevant. Sozial herausfordernde Lagen stehen schon seit langem im Blickfeld von Forschung (u.a. Shaw & McKay, 1942; Häußermann & Siebel, 2004). Spätestens mit Beginn der PISA-Erhebungen ist der Zusammenhang von sozialer Ungleichheit und (schulischer) Bildung in das öffentliche Bewusstsein gerückt worden (Baumert, Stanat & Watermann, 2006; Prenzel et al., 2004). Als entscheidende Aspekte bei der Beschreibung herausfordernder Bedingungen werden ein niedriger ökonomischer Status, die ethnische Heterogenität sowie Mobilität identifiziert (Kunadt, 2010). Die betroffenen Schulen stehen vor dem Hintergrund der genannten Rahmenbedingungen vor großen Herausforderungen, denn sie müssen Kompensationsleistungen für Lerndefizite und fehlende außerschulische Unterstützungsleistungen ihrer Schüler:innen erbringen (Webs et al., 2018, S. 146). Wir wollen im Beitrag der Frage nachgehen, welche Kooperationen bestehen und wie diese durch die Beteiligten an den Schulen eingeschätzt werden? Wo werden weitergehende Bedarfe bei der Ausgestaltung außerschulischer Kooperationen gesehen? Dabei sollen die Spezifika der Schulen aus sozial benachteiligten Gebieten herausgearbeitet werden. Mit welchen besonderen Bedarfen und Herausforderungen sind diese Schulen konfrontiert? Die Daten dazu stammen aus einer Erhebung der 2021 gestarteten Bund-Länder-Initiative „Schule macht stark“. Zu Beginn des Projekts wurde an 200 beteiligten Schulen aus sozial deprivierten Lagen eine standardisierte Online-Ausgangserhebung durchgeführt, bei der die Schulleitungen, die Lehrkräfte und das weitere pädagogisch tätige Personal mit jeweils unterschiedlichen Fragebögen befragt wurde. An den Befragungen beteiligten sich 195 Schulleitungen, 2.923 Lehrkräfte und 787 Personen, die an den Schulen anderweitig pädagogisch tätig sind. Die aus den Befragungen generierten Daten wurden unter Nutzung der Methoden quantitativer Forschung ausgewertet. Darüber hinaus wurden an fünf Schulen Fallstudien erstellt. Dazu wurden standardisierte Interviews mit Schulleitungen sowie mit Lehrkräften und weiterem pädagogischen Personal geführt. Diese wurden anhand qualitativer Methoden untersucht. Diese Ergebnisse der Erhebungen werden in Bezug zu Erkenntnissen der bisherigen Forschung gesetzt. Bestehende Forschungsergebnisse aus der Fachliteratur zeigen, dass die Kooperation von Schule mit außerschulischen Partner:innen fester Bestandteil an allen Schulformen ist. Rund drei Viertel kooperieren regelmäßig oder häufig mit Einrichtungen der Kinder- und Jugendhilfe, Sportvereinen und anderen Grundschulen (Wendt et al., 2017). Bei der Befragung der „SchuMaS-Schulen“ werden die Schulsozialarbeit, das Jugendamt/die Jugendpflege sowie die Polizei am häufigsten genannt. Die Verortung der Schulen in sozial schwierigen Lagen, wirkt sich offensichtlich auf die Wahl der Kooperationspartner:innen aus. Bei der Kooperation mit Jugendamt/Jugendpflege fällt auf, dass besonders viele Schulleitungen die Zusammenarbeit als nicht bedarfsgerecht beschreiben und eine Weiterentwicklung für nötig halten. Aus den Interviews mit den Fallstudien wird zudem ersichtlich, mit welchen besonderen Herausforderungen Schulen in sozial benachteiligten Gebieten zu kämpfen haben. Die Schulen haben alle einen sehr hohen Anteil an Kindern und Jugendlichen mit Migrationshintergrund. Die Schulen leisten eine immense Integrationsarbeit und sind dabei auf Kooperationen angewiesen: von Migrant:innenvereinen über Sprachschulen bis zum Jugendamt (bspw. bei unbegleiteten, minderjährigen Flüchtlingen). Schulen in sozial deprivierten Lagen haben zudem häufig mit einem schlechten Image zu kämpfen und beschreiben ihre Schüler:innen als „schwierig zu nehmen“. Dies erschwert die Suche nach geeigneten Kooperationspartner:innen. Für Sekundarschulen stellt sich in der Phase der Berufsorientierung beispielsweise das Problem, Praktikumsplätze für die Schüler:innen zu finden. Die Ergebnisse verweisen einmal auf die Herausforderungen, mit denen Schulen zu kämpfen haben, zeigen aber auch Ansatzpunkte für den zielgerichteten Aufbau außerschulischer Kooperationen. Multiprofessionelle Kooperation für die Übergangsbegleitung von Schülerinnen und Schülern partizipativ und reflexiv gestalten – Wie geht das? Monique Ratermann-Busse, Susanne Enssen Institut Arbeit und Qualifikation an der Universität Duisburg-Essen Die Heterogenität der Schülerschaft insbesondere an Schulen in sozial schwierigen Lagen hat in den letzten Jahren deutlich zugenommen. Schulen mit Sekundarstufe I etablieren vielfältige Angebote und Maßnahmen für Schüler:innen mit heterogenen Bildungsvoraussetzungen, um ihnen die Partizipation an gesellschaftlicher und beruflicher Teilhabe zu ermöglichen. Der Übergang von der Schule in eine Ausbildung ist aufgrund sich stetig wandelnder Kompetenzanforderungen in der Arbeitswelt mit zunehmenden Unsicherheiten verbunden (Mittermüller, 2020, S. 157f.). Die Übergangsbegleitung im Rahmen der Berufsorientierung wird damit zu einem Kernthema, wie auch verschiedene Programme von Bund und Ländern (z. B. BMBF et al., 2021) aufzeigen. Um dem damit verbundenen wachsenden Aufgabenspektrum im schulischen Alltag gerecht zu werden, setzen Schulen vermehrt auf die multiprofessionelle Zusammenarbeit von schulischen und außerschulischen Akteur:innen. Aktuelle Studien verdeutlichen, dass Schulleitungen ihre Schulen als „lokale Akteurin“ (Fichtner et al., 2022, S. 84) verstehen, wobei multiprofessionelle Kompetenzteams neue Ideen einbringen und durch ein geteiltes Bildungsverständnis eine an heterogenen Bedarfen orientierte Schulentwicklung mitgestalten. Mit Blick auf die Berufs- und Studienorientierung als definierte Querschnittsaufgabe von Schulen wird die Entwicklung und Etablierung multiprofessioneller Kompetenzteams zur umfassenden Koordinationsaufgabe, wobei Handlungspotenziale und Kompetenzen aller beteiligten schulischen und außerschulischen Akteur:innen mit unterschiedlichen Professionen zusammengeführt, zeitliche und materielle Ressourcen bereitgestellt, Strukturen für Abstimmungsprozesse geschaffen sowie Aufgaben und Funktionen der Beteiligten festgelegt werden müssen (Enssen & Ratermann-Busse, in Bearbeitung). Fragen multiprofessioneller Kooperation werden aktuell in der Bund-Länder-Initiative „Schule macht stark“ behandelt. Im Projektkontext wurde ein Werkstattkonzept entwickelt, welches im ko-konstruktiven Austausch zwischen Wissenschaft und Bildungspraxis folgende Teilforschungsfragen in den Blick nimmt: - Wie lassen sich auf der institutionellen Ebene Koordinations- und Kooperationsstrukturen für die multiprofessionelle Zusammenarbeit von schulischen und außerschulischen Akteur:innen im Rahmen der Übergangsbegleitung mit Schwerpunkt auf die Berufs- und Studienorientierung nachhaltig etablieren? - Wie kann auf der interpersonellen Ebene eine multiprofessionell ausgerichtete Partizipations-, Feedback- und Kooperationskultur im Kollegium zur Stärkung der Berufs- und Studienorientierung von Schüler:innen mit heterogenen Bedarfen im Übergangsprozess als Querschnittsaufgabe gestärkt werden? - Wie können mit Blick auf die individuelle Ebene schulische und außerschulische Akteur:innen Ihre eigene Rolle bei der Übergangsbegleitung identifizieren, transparent machen und reflektieren? Zur Beantwortung der Fragen wurden in einem ersten Schritt unterschiedliche Perspektiven zu förderlichen sowie hinderlichen Strukturen und Prozessen für eine kooperative Übergangsbegleitung erfasst. In einem zweiten Schritt dienten die analysierten Ergebnisse dazu, im ko-konstruktiven Theorie-Praxis-Austausch bedarfs- und transferorientierte Instrumente und Arbeitshilfen für die Stärkung einer partizipativ und reflexiv angelegten multiprofessionellen Kooperation als Gelingensbedingung bei der Übergangsbegleitung zu entwickeln und diese im Rahmen von Workshops zu erproben. Die Datengrundlage bilden leitfadengestützte Interviews an einer Oberschule und einer kooperativen Gesamtschule in Niedersachsen mit schulischen (n = 11) und außerschulischen Akteur:innen (n = 8) sowie teilnehmenden Beobachtungen an Berufs- und Studienorientierungsangeboten (n = 5) und ergänzende Schüler:innenbefragungen (n = 150). Im Fallvergleich zeigt sich, dass schulische und außerschulische Akteur:innen als Promotor:innen auftreten (können), indem sie die Schüler:innen z. B. durch ihr Fachwissen oder ihre Netzwerkarbeit im Sozialraum im Übergangsprozess unterstützen (Niermann &Palmas, 2017). Allerdings benötigen die Schulen konzeptionelle Impulse für die Klärung von Aufgaben und Zuständigkeiten multiprofessioneller Akteur:innen, um Prozesse voranzutreiben und für das gesamte Kollegium transparent zu machen. Gleichzeitig zeigen sich konkrete Unterstützungsbedarfe der Schulen bei der Verankerung der Berufs- und Studienorientierung als Querschnittsaufgabe und dem damit verbundenen hohen Koordinationsaufwand, der nur durch eine optimale Ressourcenverteilung in multiprofessionellen Kompetenzteams bewältigt werden kann. Der Beitrag beschäftigt sich damit, wie die gewonnenen Erkenntnisse mit der ko-konstruktiven Entwicklung von forschungsbasierten Gestaltungsmaterialien für die multiprofessionelle Kooperation im Kontext der Übergangsbegleitung sowie ihrer Implementation im Schulalltag verknüpft wurden. Darüber hinaus wird ein Lehrkonzept dargestellt, welches in Anlehnung an die Werkstatt entstanden ist, um den Wissenstransfer in die Lehre zu sichern und Lehramtsstudierende für die Relevanz einer kooperativen Übergangsbegleitung an Schulen in sozial deprivierter Lage zu sensibilisieren.
13:10 - 14:50	2-15: Empirische Perspektiven auf den Sportunterricht Ort: S14
	Paper Session Wirksamkeit eines kognitiv aktivierenden Sportunterrichts: empirische Befunde eines systematischen Reviews mit Metaanalyse Clemens Töpfer¹, Sophie Engelhardt^2,3, Johannes Carl⁴, Julia Hapke³ ¹Friedrich-Schiller-Universität Jena; ²Eberhard Karls Universität Tübingen; ³Universität Koblenz; ⁴Deakin University, Melbourne Einleitung Seit einiger Zeit wird im Fach Sport der Frage nachgegangen, wie die Unterrichtsqualitätsdimension der kognitiven Aktivierung im Fach Sport ausgedeutet werden kann (u. a. Herrmann & Gerlach, 2020). Engelhardt et al. (2023) plädieren diesbezüglich für eine konstruktäquivalente Übertragung aus der empirischen Bildungsforschung in das Fach Sport, wonach die vertiefte mentale Auseinandersetzung mit dem Lerngegenstand im Vordergrund steht (Lipowsky, 2020). In einem Scoping Review konnten Engelhardt et al. (2023) aus empirischen Studien insgesamt fünf Zielkategorien kognitiver Aktivierung im Sportunterricht herausstellen: (gesundheitsbezogenes) Wissen, motorische Fertigkeiten, Spielverständnis und -fähigkeit, Reflexionsfähigkeit und Motivation. Bislang ist allerdings wenig über die Wirksamkeit eines kognitiv aktivierenden Sportunterrichts bekannt. Vor diesem Hintergrund folgt der vorliegende Beitrag der Frage, wie wirksam Interventionen zu einem kognitiv aktivierenden Sportunterricht hinsichtlich der Zielkategorien sind. Methode Um die aktuelle Forschungslage im deutsch- sowie englischsprachigen Raum zu erfassen, wurde ein systematischer Review durchgeführt (Page et al., 2021). Recherchiert wurde in nationalen sowie internationalen Datenbanken (BISp-Surf (SPOLIT), SPORTDiscus, FIS-Bildung, ERIC, Web of Science, Scopus) im Zeitraum von 2000-2022. Dabei kam ein breites Spektrum an deutsch- und englischsprachigen Suchbegriffen zum Einsatz, das die Idee der kognitiven Aktivierung abbilden sollte (z. B. Aufgabenkultur, Reflexion, instructional support, cognitive engagement). Titel-, Abstract- und Volltext-Screening (anhand definierter Ein- und Ausschlusskriterien: u. a. Prä-Post-Design) sowie die Datenextraktion und das Risk-of-Bias Assessment (Higgins et al., 2011) erfolgten durch zwei unabhängige Gutachtende. Zur Bewertung der studienübergreifenden Wirksamkeit wurde mit allen Studien im Kontrollgruppendesign eine Metaanalyse (Review Manager 5.4) durchgeführt. Ergebnisse Die Datenbanksuche lieferte 5639 Treffer. Nach Entfernen der Duplikate wurden insgesamt 3173 Treffer in den weiteren Reviewprozess einbezogen (Cohens Kappa: 0.74–0.93). 32 Interventionsstudien konnten nach Abschluss des Screening-Prozesses eingeschlossen werden. Die überwiegende Mehrheit der Studien stammte aus den USA und aus Spanien; zwei Studien wurden in Deutschland durchgeführt. Insgesamt zeigt sich ein heterogenes Bild hinsichtlich der Studiendesigns und der eingesetzten Erhebungsverfahren (z.B. in Bezug auf Inhalt und Testgüte). Lediglich die Hälfte der Studien (n=14) folgt einem Kontrollgruppendesign. Die Interventionsprogramme orientieren sich mehrheitlich an methodischen Ansätzen wie dem „Teaching Games for Understanding“ zur Förderung von Spielverständnis und Spielfähigkeit oder dem 5-E-Learning-Cycle zum Erwerb gesundheitsbezogenen Wissens. In den Studien lassen sich empirische Nachweise zu Lerngewinnen in vier der fünf Zielkategorien identifizieren: (gesundheitsbezogenes) Wissen (g=0.54), motorische Fertigkeiten (g=0.56), Spielverständnis und -fähigkeit (g=0.48) sowie Motivation (g=0.39). Die Zielkategorie Reflexionsfähigkeit wurde in keiner der Interventionsstudien empirisch erfasst. Diskussion Der deutschsprachige Diskurs um kognitive Aktivierung kann über internationale Befunde zur Wirksamkeit äquivalenter Ansätze bereichert und fundiert werden. In Ergänzung zu den Annahmen von Richartz und Kohake (2021) zeigt sich ein kognitiv aktivierender Sportunterricht dabei nicht nur wirksam im Bereich des verständnis- und bewertungsbezogenen Lernens, sondern auch hinsichtlich motorischer sowie spieltaktischer Zielkategorien. Dass Reflexionsfähigkeit als Zielkategorie bislang in Interventionsstudien nicht als Outcome untersucht wird, markiert jedoch ein relevantes Desiderat, insbesondere vor dem Hintergrund des sportunterrichtlichen Bildungsauftrags einer Handlungsfähigkeit im Sport. Hierzu bedarf es künftig der Entwicklung geeigneter Testinstrumente. Im Vergleich zu anderen systematischen Reviews (u. a. Carl et al., 2022) zeigen sich zudem Limitationen hinsichtlich des Umfangs der Datenlage. Vor dem Hintergrund eines noch jungen empirischen Diskurses um einen kognitiv aktivierenden Sportunterricht und der geringen Anzahl an Studien mit Kontrollgruppendesign, bedarf es weiterer Studien, um die Robustheit der metaanalytischen Befunde zu stärken. Paper Session Einstellungen von Sportlehrkräften zu digitalen Medien im Sportunterricht – ein systematisches Review Jessica Schmeling, Esther Pürgstaller, Kilian Koal, Lorena Barkemeyer, Maurice Ullmann Universität Potsdam, Deutschland Theoretischer Hintergrund Medienbildung wird als fächerübergreifender Bildungsauftrag verstanden (KMK, 2017) und betrifft demnach alle Unterrichtsfächer – auch den Sportunterricht. Hier spielt Medienbildung oftmals (noch) eine untergeordnete Rolle. Aktuelle Studien zeigen, dass insbesondere intraindividuelle Faktoren den Einsatz digitaler Medien im Sportunterricht beeinflussen. So wird Einstellungen von Sportlehrkräften zu digitalen Medien eine relevante Rolle zugeschrieben (Gibbone, Rukavina & Silverman, 2009). Die internationale Forschungslage zur Frage, welche Einstellungen Sportlehrkräfte und Sportlehramtsstudierende zu digitalen Medien haben, ist schwer zu überblicken und wurde bislang nicht systematisch aufgearbeitet. Dies erschwert es, Bedarfe für weitere Forschung in diesem Bereich zu identifizieren und Evidenz zu generieren, auf deren Grundlage Maßnahmen für die Lehramtsausbildung oder auch mögliche Fortbildungsangebote für Sportlehrkräfte abgeleitet werden können. Fragestellung Im Rahmen des Vortrags wird diesem Desiderat nachgegangen, indem folgende Fragestellungen thematisiert werden: Auf welche Stichproben und Untersuchungsdesigns wird in Studien zu Einstellungen von Sportlehrkräften und Sportlehramtsstudierenden zurückgegriffen, die nach 2006 durchgeführt wurden? Welche thematischen Forschungsschwerpunkte lassen sich in den Studien zu Einstellungen von Sportlehrkräften und Sportlehramtsstudierenden zu digitalen Medien identifizieren? Zu welchen Ergebnissen kommen die Studien in Bezug auf die Einstellungen von Sportlehrkräften und Sportlehramtsstudierenden? Methode Das methodische Vorgehen orientiert sich am PRISMA-Flow-Diagramm (Page et al., 2021). Um bisherige Studien zu Einstellungen von Sportlehrkräften zu digitalen Medien im Sportunterricht systematisch zu analysieren, wurde zunächst eine systematische Literaturanalyse deutsch- und englischsprachiger Studien der letzten 17 Jahre erstellt. Der Beginn des Zeitraums wurde auf 2006 datiert, da eine manuelle Recherche ergeben hat, dass in diesem Jahr erste für dieses Gebiet relevante Studien veröffentlicht wurden. Die Literaturrecherche wurde von 07/2023 bis 08/2023 in den Datenbanken Web of Science, ERIC, Sportdiskus, FIS-bildung, PsycInfo und SURF (BISP) durchgeführt. Zusätzlich wurden die Literaturlisten der eingeschlossenen Arbeiten gesichtet und Calls im sportwissenschaftlichen Kontext sowie manuelle Recherchen in relevanten Journals durchgeführt, um weitere Studien zu identifizieren. Eine Stichprobengröße von N = 11.499 Studien wurde zu Beginn des Kodierungsprozesses in die Analyse aufgenommen. Exkludiert wurden Studien u. a. aufgrund eines unpassenden Fokus (z. B. Konzeptionen von Lehrarrangements), Dokumententyps (z. B. Meta-Analysen, Praxisbeiträge) oder unpassenden Methode (z. B. Case Studies). Zwei Gutachterinnen beurteilten jeweils unabhängig voneinander, ob die Einschlusskriterien erfüllt wurden. Unstimmigkeiten wurden durch Diskussion oder durch Verweis auf dritte Gutachterinnen gelöst. Die Gesamtzahl aufgenommener Studien ergab N = 57, die anhand ihres vollständigen Textes mittels eines standardisierten, vorab erprobten Formulars hinsichtlich inhaltlicher Kriterien sowie ihrer wissenschaftlichen Qualität kategorisiert und bewertet wurden. Ergebnisse (1) Die Auswertung der Studien zeigt, dass in empirischen Erhebungen zu Einstellungen von Sportlehrkräften und Sportlehramtsstudierenden zu digitalen Medien vielfältige Methoden genutzt werden, wenngleich (quantitative) Fragebogenerhebungen dominieren, gefolgt von mixed methods Studien und schließlich (qualitativen) Interviewstudien. Zumeist werden Sportlehrkräfte der Sekundarstufe oder verschiedener Schulstufen befragt; selten hingegen Primarstufen-Lehrkräfte. Einen weiteren großen Anteil nehmen Studien ein, die Sport-Lehramtsstudierende fokussieren. (2) Im Mittelpunkt der Studien stehen Fragen nach medialer Ausstattung bzw. Besitz, Nutzen bzw. Einsatz, Kompetenzen, Mehrwert und Hindernissen sowie allgemeinen Erfahrungen mit digitalen Medien. Konkrete Auswirkungen der Einstellungen (z. B. auf die Motivation der Schülerinnen), Fortbildungsbedarfe oder auch ableitbare praktische Implikationen sind bisher selten primärer Betrachtungsgegenstand. Es überwiegen Studien, die Informations- und Kommunikationstechnologien im Kontext von Sportunterricht an Schulen fokussieren, gefolgt von E-Learning Plattformen; selten werden Soziale Medien thematisiert. (3) Die Mehrheit der Studien berichtet von eher positiven Einstellungen von Sportlehrkräften und Sportlehramtsstudierenden gegenüber digitalen Medien. Dabei konnten einzelne Studien Unterschiede in den Einstellungen in Abhängigkeit des Geschlechts, Alters und der Unterrichtserfahrung feststellen. Die analysierten Studien weisen eine große Heterogenität auf in Bezug auf Zielgruppe, theoretischen Hintergrund, Untersuchungsdesign und -methode, untersuchte digitale Medien, Anwendungsgebiet, Ergebnisse und Studienqualität. Die systematische Literaturanalyse liefert dennoch Hinweise auf Forschungslücken, die zu füllen bedeutende Voraussetzung ist, damit Medienbildung im Sportunterricht eine relevante Rolle zugesprochen wird. Paper Session Einstellungen von Schüler:innen gegenüber videobasierten digitalen Medien im Sportunterricht Maik Beege, Anne-Christin Roth PH Freiburg, Deutschland Während die Bedeutung der Einstellungen von Lehrkräften zum Medieneinsatz in Schule und Unterricht als Facette professioneller Kompetenzentwicklung zunehmend Beachtung findet (Knezek & Christensen, 2016; Prasse, 2012), dominieren für die Einstellungen von Schüler:innen gegenüber der Nutzung digitaler Medien in Schule und Unterricht oft noch verkürzte Vorstellungen (Schulmeister, 2009) – ihnen wird aufgrund der hohen und in den letzten zwei Jahrzehnten massiv gestiegenen Mediennutzungsdauer (Shell, 2019; mpfs, 2018; bitkom, 2019) unterstellt, dass sie Medien auch per se gerne zum Lernen nutzen würden. Für die Mediennutzung innerhalb und außerhalb schulischer Verwendungszusammenhänge sind die medienbezogenen Einstellungen von Schüler:innen jedoch ein relevantes Kriterium und daher sind sie auch Zielperspektive mediendidaktischer Bemühungen. In Anknüpfung an das Tagungsthema sind sie somit auch für die Partizipation aller Kinder und Jugendliche an mediengestützten Lernprozessen in Schule und Unterricht von Bedeutung. Außerdem sind sie für die Beurteilung potenzieller Wirkzusammenhänge beim Lernen mit digitalen Medien in Schule und Unterricht ein bisher kaum betrachtetes Kriterium. Daher wird das sozialpsychologische Konstrukt der Einstellung in seiner Multidimensionalität (kognitive, affektive und behaviorale Komponente) möglichst umfassend betrachtet (Zimbardo & Gerrig, 1996). Die zentralen Fragestellungen lauten hierbei, wie die Einstellungen von Schüler:innen zum Medieneinsatz im Sportunterricht ausgeprägt sind, welche Beziehungen zwischen Einstellungskomponenten postuliert werden können und anhand welcher externer Variablen positive Einstellungen gefördert werden können. Eine fachspezifische Besonderheit hinsichtlich der medienbezogenen Einstellung von Lehrkräften, liegt im Bewegungsprimat – der Überzeugung, dass Sportunterricht primär der Bewegung dienen soll (Roth, 2022) – und der Besorgnis, dass Medien für den Sportunterricht nicht lernförderlich gestaltet sind (Sweller et al., 2019). Auf Basis des Technology Acceptance Models (Park, 2009) wurde ein Fragebogen zur Erfassung der Einstellung erstellt und anhand einer Erhebung an Achtklässler:innen (N = 202) validiert. Als Subskalen wurden dabei externe Variablen (schulische Sportaktivität, private Sportaktivität, Medienerfahrung, Selbst-Effektivität, Mediennorm, Nutzung im Sportunterricht), kognitive Einstellungsdimension (Nützlichkeit, Bedienbarkeit, Gestaltung der Medien, Bewegungsprimat), affektive Dimension (positive Evaluation, negative Evaluation) und behaviorale Dimension (Nutzungsintention) betrachtet. Die Skalen wurden mittels Reliabilitätsanalysen und konfirmatorischen Faktorenanalysen optimiert und validiert. Anhand der validierten Skalen und erhobenen Daten wurde ein kovarianzbasiertes Strukturgleichungsmodell berechnet, welches Effekte zwischen externen Variablen und Einstellungsdimensionen abbildet. Das prototypische Modell ist in Abbildung 1 dargestellt. https://1drv.ms/i/s!AnDbKEWZCByFgtIk9kVZEOcPR5HOFg?e=VfmAWm Abbildung 1. Theoretisches Modell zur Berechnung des Strukturgleichungsmodells Das postulierte Modell hatte eine zufriedenstellende Modellgüte (RMSEA = .06; χ²/df ratio = 1.72; CFI = 0.90). Das Modell ist in Abbildung 2 dargestellt. Hierbei sind lediglich signifikante (p<.05) oder marginale (p<.10) Trends dargestellt, um die Lesbarkeit zu gewährleisten. Die relevanten Pfade werden hier noch einmal zusammengefasst. Es wird ersichtlich, dass die Nutzung der Medien im Sportunterricht und die damit verbundene Selbst-Effektivität im Lernen mit Medien sich positiv auf die kognitive Komponente der Einstellung auswirkt. So werden wahrgenommene Nützlichkeit und Usability erhöht, als auch potentielle Fehlvorstellungen bezüglich des Designs und Bewegungsprimats reduziert. Die kognitive Komponente der Einstellung hatte hierbei allerdings keinen direkten Einfluss auf die Nutzungsintention der Medien im Sportunterricht. Positive Effekte der kognitiven Komponente auf die Nutzungsintention werden vollständig durch die positive Evaluation des Medieneinsatzes mediiert. Erst durch eine positive affektive Bewertung, wird die Nutzungsintention von Medien im Sportunterricht gesteigert. https://1drv.ms/i/s!AnDbKEWZCByFgtIlQ-e-JJnzQ-tbaw?e=Dli8Tn Abbildung 2. Strukturgleichungsmodell. p<.05; ⁽⁾p<.10 Eine negative Einstellung bezüglich Medien im Sportunterricht kann unter anderem auf den fehlenden Zugang und damit einer zu geringen Selbst-Effektivität im Umgang zurückzuführen sein. Interventionen auf Schüler:innen- und Lehrer:innenebene sollten somit gezielt darauf abzielen, die Vorteile des mediengestützten Sportunterrichts didaktisch adäquat einzuführen, um Selbst-Effektivität zu steigern und negative Einstellungen zu reduzieren. Dasselbe Modell wird in Folgestudien auch auf Lehrer:innenebene validiert, um externe Variablen zu identifizieren, welche im Fokus gezielter Interventionen stehen können. Paper Session Agentic Engagement und Opposition im Sportunterricht der Primarschule: Längsschnittliche Einflüsse auf das Verhalten von Lehrpersonen und Schüler:innen. Clemens Berthold PH St. Gallen, Schweiz Einleitung* Agentic engagement beschreibt jene proaktiven Handlungen von Schüler:innen mit denen sie versuchen ihre Lernbedingungen zu verbessern, indem sie ihre Lehrerperson im Unterricht beeinflussen (Reeve, 2013). Diese können im Einklang mit den Zielen der Lehrperson stehen, aber auch Ausdruck von Widerstand und Opposition sein. (Mameli et al. 2023). Wenn Lehrpersonen wechselseitig auf diese Handlungen reagieren und ihren Unterricht entsprechend anpassen, dann "bewegen sich Schüler:innen und Lehrpersonen gemeinsam in Richtung einer konstruktiven Synergie" (Jang et al. 2023, S. 30) und verbessern die Unterrichtsqualität. (vgl. Reeve & Tsang, 2011). Dies zeigte sich in einer verstärkt autonomie-unterstützenden Lehrweise, welche wiederum ein höheres Agentic Engagement zur Folge hat. (z.B. Matos et al. 2018; Jang et al. 2023). Werden die Initiativen der Schüler:innen jedoch als störend für den Unterricht wahrgenommen, kann dies zu Fehlanpassungen führen und die Lehrpersonen zeigen ein erhöhtes Maß an Kontrolle und fordern Disziplin (z.B. Rajala et al. 2016, Patall et al. 2022). Obwohl der Unterricht im Klassenzimmer weithin als gemeinsame Aktivität von Schülern und Lehrern angesehen wird (z.B. Vieluf et al. 2020), gibt es nur wenig Forschung über den gegenseitigen Einfluss, den Schüler:innen auf ihre Lehrpersonen ausüben. (vgl. Nurmi et al., 2015; Nurmi, 2012). Diese Studie nimmt die Agency der Schüler:innen und ihre Initiativen in den Fokus, und untersucht die Wechselwirkungen mit dem Lehrpersonenverhalten im Rahmen einer längsschnittlichen Analyse im Sportunterricht an der Primarschule. Methode Angehende Lehrpersonen (n = 34) und ihre Schüler:innen (n = 498) wurden in der ersten und vierten Woche eines Vollzeit-Praktikums, im letzten Semester der Ausbildung an der Pädagogischen Hochschule, mittels Fragebogens befragt. Dabei wurden Schüler:innen-Selbsteinschätzungen ihres agentic engagement (α = .70/.76) (Agentic Engagment Scale (AES); Reeve, 2013), ihres intrinsisch motivierte oppositionellen Verhaltens (α = .81/.84) (Eigenentwicklung in Anlehnung an Aelterman et al. (2016), sowie ihre Einschätzung der Unterstützung ihrer psychologischen Grundbedürfnisse im Sportunterricht erhoben (Autonomie: α = .56/.76; Kompetenz: α = .70/.71; Eingebundenheit: α = .64/.70) (Students’ motivation in Physical Education (SMoPE), Kohake & Heemsooth, 2021). Längsschnittliche reziproke Wechselwirkungen wurden über manifeste Cross-Lagged-Panel Modelle überprüft. Ergebnisse Die beiden Arten der Schüler:inneninitiativen, Agentic Engagement und intrinsisch motivierte Opposition, lassen sich als trennbare Konstrukte modellieren und zeigen keine siginifikanten Zusammenhänge. Hinweise auf den reziproken Einfluss von Agentic Engagement der Schüler:innen auf die Autonomieunterstützung der Lehrpersonen konnte gefunden werden (β = .114, SE = .059, p = .056). Positive reziproke Einflüsse zeigen sich jedoch auch auf die Kompetenzunterstützung (β = .118, SE = .047, p = .012), und die Unterstützung der Eingebundenheit (β = .099, SE = .037, p = .007). Eine (Fehl-)Anpassung des Lehrpersonenverhaltens als Reaktion auf oppositionelles Verhalten der Schüler:innen konnte andererseits nicht nachgewiesen werden.
13:10 - 14:50	2-16: Geschlechterrollen und gendersensible Sprache Ort: S15
	Paper Session Berufliche und Familiäre Langzeiteffekte von Einstellungen zu Geschlechterrollen Ricarda Ullrich^1,3, Michael Becker^2,3, Jan Scharf³ ¹IPN, Kiel; ²IFS, Dortmund; ³DIPF, Frankfurt Obwohl die Beteiligung von Frauen am Arbeitsmarkt vor allem seit den 1970er Jahren deutlich zugenommen hat und Frauen in ihrer schulischen Laufbahn erfolgreicher sind, bestehen nach wie vor Ungleichheiten bei der Aufteilung der Erwerbsarbeit sowie familiären und häuslichen Pflichten (Buchmann & DiPrete, 2006; García-Mainar, Molina & Montuenga, 2011). Geschlechterrollen bilden hierbei eine mögliche Erklärungsperspektive und können als normative Erwartungen der Macht- und Arbeitsverteilung zwischen Männern und Frauen verstanden werden, die sich auf einen kulturell-historischen Kontext beziehen (Eagly & Wood, 2012). Kinder und Jugendliche entwickeln entsprechende Einstellungen zu Geschlechterrollen (Ruble & Martin, 2006). Diese Einstellungen gewinnen insbesondere am Ende der Adoleszenz und im beginnenden Erwachsenenalter an Relevanz, wenn junge Erwachsene die ersten Grundsteine für ihre künftige berufliche Laufbahn legen. Diese Einstellungen stehen im Zusammenhang mit dem Nutzen oder der sozialen Erwünschtheit von Studiums- oder Berufsoptionen, welche für den späteren beruflichen Erfolg einen kumulierenden Effekt haben können (Corrigall & Konrad, 2007; Dicke, Safavian & Eccles, 2019). Bisherige Forschung zeigte bereits Zusammenhänge zwischen Einstellungen zu Geschlechterrollen und beruflichen Erfolgsfaktoren (Christie-Mizell, 2006; Judge & Livingston, 2008) sowie familiären und häuslichen Pflichten (Duvander, 2014; Evertsson, 2014). Die wenigen Untersuchungen, die sich mit den langfristigen Zusammenhängen von frühen Einstellungen zu Geschlechterrollen und dem beruflichen Erfolg widmeten, heben eine besondere Bedeutung für Frauen hervor (Corrigall & Konrad, 2007; Dicke et al., 2019). Eine langfristige Perspektive auf die Übernahme häuslicher und familiärer Tätigkeiten blieb bisher offen. Daher stellt sich die Frage, ob sich Einstellungen zu Geschlechterrollen bereits im jungen Erwachsenenalter soweit manifestiert haben, dass sie langfristig mit dem beruflichen Erfolg (gemessen über die Wochenarbeitszeit, das Berufsprestige, das Einkommen und den Berufssektor) sowie familiären und häuslichen Tätigkeiten (gemessen über die Elternzeit und die Haushaltstätigkeiten) 9 und 18 Jahre später im Zusammenhang stehen. Dazu wurden drei Wellen des BIJU-Datensatzes verwendet (N = 4816). Die egalitären Geschlechterrolleneinstellungen wurden im jungen Erwachsenenalter (2000/2001; mittleres Alter = 22) erhoben, während die beruflichen Erfolgsindikatoren sowie familiäre und häusliche Tätigkeiten 9 (2009/2010; mittleres Alter = 31) sowie 18 (2018; mittleres Alter = 40) Jahre später erhoben wurden. Zur Analyse wurden lineare (Einkommen, Prestige, Haushaltstätigkeiten) und logistische Mehrgruppenregressionsmodelle (Arbeitsstunden, Elternzeit) sowie multinomiale Regressionen getrennt nach Geschlecht (Berufssektor) in Mplus gerechnet. Die Ergebnisse zeigten, dass egalitärere Geschlechterrolleneinstellungen bei jungen Frauen 9 Jahre später mit höherem Berufsprestige und 18 Jahre später mit höherem Einkommen assoziiert waren, während egalitärere Einstellungen bei jungen Männern 9 Jahre später mit weniger Einkommen und 9 und 18 Jahre später mit höherem Prestige assoziiert waren. Zudem wählten junge Männer mit egalitäreren Einstellungen eher einen Beruf im sozialen und kulturellen Sektor verglichen mit neutralen Sektoren – während die Wahl eines Berufssektors bei Frauen nicht mit ihren Geschlechterrolleneinstellungen variierte. Letztlich zeigte sich, dass Männer mit 40 Jahren mehr Haushaltstätigkeiten übernahmen, wenn sie als junge Männer egalitärere Einstellungen aufwiesen. Die Ergebnisse betonen die Bedeutung von Einstellungen zu Geschlechterrollen junger Erwachsener für ihren langfristigen beruflichen Erfolg über einen Zeitraum von fast 20 Jahren – diese Zusammenhänge zeigten sich teilweise sogar unter Berücksichtigung der wichtigsten Prädiktoren für den beruflichen Erfolg, wie den kognitiven Fähigkeiten, dem sozioökonomischen Hintergrund und dem Schul- und Hochschulabschluss. Die Ergebnisse reihen sich in bisherige Untersuchungen ein, die positive Zusammenhänge egalitärerer Geschlechterrolleneinstellungen für den beruflichen Erfolg von Frauen verdeutlichten. Gleichzeitig werfen die Ergebnisse einen Blick auf die weniger stark untersuchte Perspektive von Männern. Dabei wird die ambivalente Bedeutung von egalitäreren Geschlechterrolleneinstellungen für den beruflichen Erfolg von Männern hervorgehoben, unterstreichen allerdings ebenso die Relevanz egalitärer Geschlechterrolleneinstellungen bei Männern für eine egalitäre Aufteilung der Haushaltsaufgaben. Paper Session Wie reagieren angehende Erzieherinnen auf geschlechts(un)typische Kinder: Eine experimentelle Vignettenstudie Hannah Streck, Ursula Kessels Freie Universität Berlin, Deutschland Geschlechterstereotype sind kognitive Strukturen, die beeinflussen können, wie Menschen aufgrund ihres Geschlechtes bewertet werden (Ellemers, 2018). Bisherige Forschungsergebnisse zeigen, dass Verstöße gegen Geschlechterstereotype von Erwachsenen, Jugendlichen und Kindern negativ bewertet werden (Braun & Davidson, 2017; Kwan et al., 2020; Rudman, Moss-Racusin, Phelan & Nauts, 2012). Bisher gibt es kaum Erkenntnisse darüber, wie solche Verstöße generationenübergreifend wahrgenommen werden. Kinder zeigen neben geschlechtstypischem (konformem) Verhalten auch oft geschlechtsuntypisches (nonkonformes) Verhalten (Sandberg, Meyer-Bahlburg, Ehrhardt & Yager, 1993); die vorliegende Studie geht der Frage nach, wie erwachsene pädagogische Fachkräfte dies wahrnehmen. In vorliegenden, aus den USA stammenden Studien hatten Erwachsene negativere Einstellungen gegenüber Kindern, die als geschlechtsnonkonform beschrieben wurden, als gegenüber geschlechtskonformen Kindern (Sullivan, Moss-Racusin, Lopez & Williams, 2018; Thomas & Blakemore, 2013). Die stärksten negativen Reaktionen zeigten sich gegenüber Jungen, die weiblich stereotypisiertes Verhalten zeigten. Diese Studien wurden mit Erwachsenen durchgeführt, die nicht aus dem Kreis pädagogischer Fachkräfte stammten. Es liegt kaum Forschung zu Einstellungen von Erwachsenen, die beruflich mit Kindern arbeiten, vor (Bochicchio et al., 2019). So fehlt es an Studien zu den Einstellungen von angehenden Erzieherinnen in Deutschland gegenüber geschlechtskonformem und -nonkonformem Verhalten von Kindern. Dies ist eine bedeutsame Forschungslücke, da Erzieherinnen zu den zentralen Sozialisationsfiguren von Kindern gehören. Zudem ist die geschlechtergerechte Erziehung für viele Eltern ein zentrales Thema, das sie auch in externen Einrichtungen umgesetzt sehen möchten (Wößmann, Lergetporer, Grewenig, Kersten & Werner, 2018). In einer Vorstudie mit Studierenden (N=350) wurden Geschlechterstereotype über Kinder in der deutschen Gesellschaft erfasst und analog zum Vorgehen vorliegenden Studien (Koenig, 2018, Sullivan, Ciociolo & Moss-Racusin, 2022) analysiert, um Stimulusmaterialien für diese Studie zu entwickeln. In unserer experimentellen Vignettenstudie manipulierten wir in einem schriftlichen Dialog zwischen zwei Erzieherinnen das Geschlecht (männlich, weiblich) und das Verhalten (maskulin, feminin) fiktiver dreijähriger Kinder (2x2 between-subjects Design). N = 448 angehende Erzieherinnen aus 6 Berufsschulen bewerteten je eine der vier Vignetten (maskuliner Junge, maskulines Mädchen, femininer Junge, feminines Mädchen) hinsichtlich empfundener Sympathie, wahrgenommener Kompetenz, Kreativität und Selbstwert und füllten für das fiktive Kind den Strength and Difficulties Questionnaire (SDQ-Deu) aus (Koglin, Barquero, Mayer, Scheithauer & Petermann, 2007), welcher internalisierende und externalisierende Tendenzen erfasst. Es wurde die Hypothese geprüft, dass geschlechtskonforme Kinder positiver bewertet werden als Kinder, die geschlechtsnonkonformes Verhalten zeigen, und dass negative Bewertungen bei femininen Jungen am deutlichsten ausgeprägt sein werden. Die Daten wurden mittels 2x2 ANOVAs mit Bonferroni Korrekturen analysiert. Erste Ergebnisse deuten darauf hin, dass es keine signifikanten Unterschiede zwischen geschlechtskonformen und nonkonformen Kindern in Bezug auf die ihnen gegenüber empfundene Sympathie gab. Es zeigten sich jedoch signifikante Interaktionen zwischen dem Geschlecht und dem geschlechtstypischen Verhalten in Bezug auf wahrgenommene Kompetenz, Kreativität und Selbstwert des Kindes. Hier erhielten maskuline Mädchen die positivsten Bewertungen. Interessanterweise zeigten sich aber keine ausgeprägten negativen Effekte für feminine Jungen. Allerdings wurden feminine Mädchen negativer in Bezug auf Kompetenz, Kreativität und Selbstwert bewertet. Bezüglich des SDQ-Deu zeigte sich, dass maskulines Verhalten mit externalisierenden Problemen und feminines Verhalten mit internalisierenden Problemen in Zusammenhang gebracht wurde, aber sich kein Effekt der Geschlechtskonformität des jeweiligen Verhaltens fand. Dies entspricht bereits publizierten Studien, die hervorheben, dass die Richtung des geschlechtstypischen Verhaltens für die Zuschreibung von externalisierendem und internalisierendem Verhalten wichtiger sein kann als die Übereinstimmung des Verhaltens mit der eigenen Geschlechtszugehörigkeit (Thomas & Blakemore, 2013). Wir diskutieren die von vorliegenden Studien abweichenden Befunde, z.B. dass in unserer Studie maskuline Mädchen positiver wahrgenommen wurden als feminine Mädchen und dass feminine Jungen weniger negativ bewertet wurden. Hier könnten länderspezifische Aspekte und ein Wandel der Einstellungen eine Rolle spielen. Die besonders skeptischen Einstellungen gegenüber femininen Mädchen bei pädagogischem Personal weisen auf eine Höherbewertung maskuliner Eigenschaften hin, welche gleichzeitig kritisch zu sehen ist. Paper Session Gendersensible Sprache in der Grundschule: Beeinflussen Erfahrungsberichte von Kindern die Einstellung von Grundschullehrkräfte? Tina Glaser, Johanna Lux PH Karlsruhe Theoretischer Hintergrund: Die Verwendung gendersensibler Sprache ist im deutschen Sprachraum ein äußerst umstrittenes und polarisierendes Thema. Aktuelle Umfragen zeigen, dass die Mehrheit der deutschen Bevölkerung gendersensibler Sprache ablehnend gegenübersteht (z.B. Infratest dimap, 2021). Gleichzeitig belegen wissenschaftliche Studien, dass das generische Maskulinum nicht zu einem ausgeglichenen gedanklichen Einbezug von Frauen führt, wohingegen gendergerechte Sprache den kognitiven Einbezug von Frauen fördert (z.B. Braun et al., 1998; Gyax et al., 2008; Heise, 2000). Die meisten Studien in diesem Bereich wurden allerdings mit Erwachsenen durchgeführt und es gibt wenige Studien zur Rolle gendersensibler Sprache bei Kindern. Eine Ausnahme bildet die Studienreihe von Vervecken und Hannover (2013, 3015), die zeigen konnte, dass eine Beidnennung bei Berufsbezeichnungen u.a. dazu führte, dass Grundschulkinder sich Frauen eher in stereotyp männlichen Berufen vorstellen konnten und sich eher vorstellen konnten, einen solchen Beruf auch zu ergreifen. Diese ersten Erkenntnisse deuten darauf hin, dass eine gendersensible Sprache auch in der Grundschule schon von Bedeutung ist und positive Effekte haben kann. Daher ist es wichtig zu untersuchen, wie Akzeptanz und Nutzung gendersensibler Sprache unter Lehrkräften gefördert werden kann. Fragestellung: Das Ziel dieser Studie war es zum einen festzustellen, welche Einstellungen Grundschullehrkräfte zu gendersensibler Sprache haben. Zum anderen untersuchte die Studie, ob die Meinung von Kindern zu gendersensibler Sprache auch die Einstellung von Grundschullehrkräften zur Nutzung gendersensibler Sprache beeinflussen kann. Methode: Dazu wurden N = 363 Grundschullehrkräfte per Onlinestudie befragt. In einem einfaktoriellen between-subjects Design wurden die Lehrkräfte zufällig einer von drei Bedingungen zugeteilt (positive kindliche Erfahrungsberichte vs. negative kindliche Erfahrungsberichte vs. keine Erfahrungsberichte). Als abhängige Variable wurden Einstellungen zu gendersensibler Sprache allgemein, aber auch Angaben zur eigenen Nutzung gendersensibler Sprache in Schule und Unterricht erfasst. Des Weiteren wurde explorativ untersucht, ob Alter oder politische Orientierung der Versuchspersonen einen Einfluss haben. Ergebnisse: Etwa die Hälfte der Lehrkräfte gab an, dass an ihrer Schule gendersensible Sprache nicht genutzt wird. Es zeigten sich interessante Einflüsse der experimentellen Bedingung: Lehrkräfte in der positiven Bedingung fanden die Verwendung gendersensibler Sprache sinnvoller als Lehrkräfte in der negativen Bedingung, t(241) = 3.12, p = .002, d = 0.40. Ähnliche Effekte zeigten sich für Items zur Materialauswahl und zur Verständlichkeit gendersensibler Sprache. Auch allgemeine Einstellungen zum gendern waren in der positiven Bedingung signifikant positiver als in der negativen Bedingung, t(241) = 4.18, p <.001, d = 0.54. In der negativen (vs. positiven) Bedingung gaben signifikant mehr Lehrkräfte an, nicht zu gendern, weil sie es für unnötig hielten, wohingegen in der positiven (vs. negativen) Bedingung mehr Lehrkräfte angaben, gendern für notwendig zu halten, χ² = 10.17, p = .038. Es zeigten sich keine Zusammenhänge mit dem Alter der Lehrkräfte, wohl aber mit ihrer politischen Orientierung. Diskussion: Bei der Entwicklung hin zu einer gleichberechtigten Gesellschaft muss Sprache Berücksichtigung finden. Kinder sollten möglichst früh lernen, alle Menschen sprachlich zu inkludieren. Hierbei spielen Grundschullehrkräfte als Rollenvorbilder und Vermittlerinnen von Bildung eine zentrale Rolle. Diese Studie konnte zeigen, dass kurze positive Rückmeldungen von Kindern zu gendersensibler Sprache dazu führen können, dass Lehrkräfte nicht nur selber über positivere Einstellungen zu diesem Thema verfügen, sondern auch angeben, im Unterricht stärker auf gendersensible Sprache achten zu wollen. Daraus ergibt sich, dass Genderkompetenz allgemein und gendersensible Sprache im Speziellen in der Aus- und Weiterbildung von Lehrkräften eine wichtige Rolle spielen sollte. Gleichzeitig regen diese Daten auch zum Nachdenken darüber an, ob Erwachsene vielleicht gerade in dieser häufig hitzig geführten Diskussion zu gendergerechter Sprache von der Unvoreingenommenheit von Kindern profitieren können. Paper Session Sternchen, Doppelpunkt, Unterstrich: Verwirrt das unsere Kinder nicht? – Zum Effekt gender-gerechter Sprachalternativen bei Schüler:innen unterschiedlicher Klassenstufen Christin Lotz, Anne Deiglmayr Universität Leipzig, Deutschland Theoretischer HIntergrund: Die Verwendung gender-gerechter Sprache wird im deutschen Sprachraum intensiv diskutiert. Der dabei häufig vorherrschenden populär-wissenschaftlichen Debatte um die positiven und negativen Effekte gender-gerechter Sprache steht allerdings nur eine geringe Anzahl an methodisch belastbaren empirischen Studien gegenüber. Diese zeigten jedoch ermutigende Ergebnisse (z.B. Horvath et al., 2016; Sczesny et al., 2016). So führte bei Erwachsenen und Studierenden beispielsweise die Verwendung gender-gerechter Sprachalternativen zu einer höheren kognitiven Repräsentation von Frauen (z.B. Braun et al., 2005; Keith et al. 2022). Im aktuellen Diskurs um das Gendern an Schulen ist allerdings noch gänzlich ungeklärt, ob sich die positiven Effekte gender-gerechter Sprache auf die kognitive Repräsentation von Frauen auch bei Schüler:innen nachweisen lassen. Unabhängig von der Frage, ob an Schulen gegendert werden sollte, stellt sich weiterhin auch die Frage, wie gegendert werden sollte. Insbesondere die Verwendung von Genderzeichen (Gender-Sternchen, Gender-Doppelpunkt) steht in der Kritik, schwerer verständlich zu sein. Empirische Studien, die die positiven oder negativen Effekte unterschiedlicher gender-gerechter Sprachalternativen im Vergleich zum generischen Maskulinum und untereinander an Schüler:innen unterschiedlicher Klassenstufen untersuchen, sind daher notwendig. Fragestellung: Die folgende Studie untersuchte daher an Schüler:innen der Klassenstufen 5, 7, 9 und 11 den Einfluss von vier gängigen gender-gerechten Sprachalternativen (a) im Vergleich zum generischen Maskulinum und (b) im Vergleich zueinander. Dabei interessierte, erstens, der Effekt auf den kognitiven Einbezug von Frauen. Als weitere abhängige Variable betrachteten wir, zweitens, die Bearbeitungszeit als Indikator für Verständlichkeit, wobei längere Bearbeitungszeiten als ein Hinwies auf eine schwierigere Verständlichkeit der gender-gerechten Sprachalternativen interpretiert werden. Methode: Insgesamt N = 826 Schüler:innen (Klassenstufen 5/7/9/11 n = 167/234/252/173) wurden sechs Oberkategorien (Politiker, Sänger, Influencer…) präsentiert, zu denen sie je drei Personen nennen sollten (vgl. Braun et al., 2005). Experimentell variiert wurde die Sprachform der Bezeichnung dieser Oberkategorien. Im between-subject design wurden die Schüler:innen zufällig einer der fünf Sprachformen-Bedingungen zugewiesen (Generisches Maskulinum: Politiker; Beidnennung, männlich zuerst: Politiker und Politikerinnen; Beidnennung, weiblich zuerst: Politikerinnen und Politiker; Gender-Sternchen: Politikerinnen; Gender-Doppelpunkt: Politiker:innen*). Basierend auf einer männlich-weiblich-Kodierung berechneten wir als AV die relative Häufigkeit weiblicher Personen-Nennungen an der Gesamtzahl genannter Personen (Wertebereich: 0 = keine weibliche Person genannt, 1 = nur weibliche Personen genannt). Anschließend berechneten wir eine 5 (Sprachform) × 2 (Geschlecht) ANOVA für jede Klassenstufe. Selbiges führten wir für die AV Bearbeitungszeit der Personennennungs-Aufgabe durch. Ergebnisse: Bezogen auf Fragestellung 1 (kognitiver Einbezug von Frauen) ergaben die ANOVAs für alle Klassenstufen dasselbe Ergebnis: ein signifikanter Haupteffekt für das Geschlecht der Teilnehmenden, aber weder einen signifikanten Haupteffekt für die Sprachform, noch einen signifikanten Interaktionseffekt. Der Haupteffekt Geschlecht zeigte an, dass in allen Klassenstufen Schülerinnen deutlich mehr weibliche Personen nannten als Schüler (1.99 ≤ d ≤ 2.86). Bezüglich Fragestellung 2 (Bearbeitungszeiten) resultierten über alle Klassenstufen hinweg ausschließlich nicht signifikante Haupt- und Interaktionseffekte. Diskussion: Die Verwendung gender-gerechter Sprachalternativen zum generischen Maskulinum hatte über alle Klassenstufen hinweg keinen Effekt auf den kognitiven Einbezug von Frauen. Ebenso führte die Verwendung alternativer Sprachformen zu keiner Erhöhung oder Verringerung der Bearbeitungszeit. Aus empirischer Sicht lässt sich daher keine explizite Empfehlung für oder gegen die Verwendung einer bestimmten alternativen Sprachform zum generischen Maskulinum aussprechen. Ein Verbot der Nutzung gender-gerechter Sprache an Schulen (wie beispielweise in Sachsen oder Sachsen-Anhalt) erscheint empirisch ebenso unbegründet wie ein expliziter Zwang zum Gendern. Es erscheint daher sinnvoll, dass die vorliegenden Ergebnisse mit zukünftigen Studien zur Akzeptanz, Verständlichkeit und Praktikabilität der gender-gerechten Sprachalternativen komplementiert werden, um eindeutige praktische Empfehlungen für oder ggf. gegen eine gender-gerechte Sprachalternative im Schulkontext aussprechen zu können.
13:10 - 14:50	2-17: Ökonomische Bildung Ort: S16
	Paper Session Ein evidenzbasiertes Kompetenzstruktur- und niveaumodell für die ökonomische Bildung von Schülerinnen der Sekundarstufe I – Das Beispiel ECON 2022 in Nordrhein-Westfalen Fabio Fortunati, Esther Winther Universität Duisburg-Essen, Deutschland Das alltägliche Leben von Menschen ist von Situationen geprägt, in denen ökonomisches Handeln erforderlich ist. Während basale wirtschaftliche Kompetenzen sind im angloamerikanischen Sprachraum als auch international seit langem Teil des Bildungskanons (Soper und Walstad 1987; OECD 2020), fehlt es in Deutschland an einer breiten schulischen Verankerung ökonomischer Lerngelegenheiten. In den MINT-Fächern (Leutner et al. 2017) als auch der kaufmännischen Bildung die empirische Messung wie Modellierung von Kompetenzen weit gedungen sind (Beck et al. 2016), ist ein Mangel an ausreichend fundierten Kompetenzmodellen in der ökonomischen Allgemeinbildung festzustellen (Ackermann 2019). Bisherige Assessments im Bereich der ÖB fokussieren insbesondere auf Schülerinnen der Sekundarstufe II und inhaltlich auf eine zumeist gesellschaftlich-volkswirtschaftliche Perspektive (Ackermann 2019; Eberle et al. 2016; Seeber et al. 2022). Insbesondere für die Sekundarstufe I liegt nur wenig empirische Evidenz für die Ausprägung und Strukturierung ökonomischer Kompetenz vor (Seeber et al. 2015). Ziel dieses Beitrages ist es auf Grundlage einer repräsentativen Erhebung der ökonomischen Kompetenz von Schülerinnen der Jahrgangsstufe 8 in Nordrhein-Westfalen im Jahr 2022 (1) die Dimensionalität ökonomischer Kompetenz und… (2) die Graduierung ökonomischer Kompetenz zu untersuchen. Die Entwicklung des Testinstruments erfolgt auf Grundlage des Logic-Assessment-Models (Klotz 2015). Dabei sind die Items in eine narrative Struktur eingebettet, die wirtschaftliche Lebenssituationen in einem möglichst authentischen Setting nachbilden. Hinsichtlich der Dimensionalität ökonomischer Kompetenz konnte Winther (2010) eine Differenzierung in eine Economic Literacy- und eine Economic Numeracy-Facette feststellen, die auch in Studien im allgemeinbildenden Schulwesen bestätigt werden konnte (Macha 2015). In Anlehnung an das Konzept der Lernprogression von Wilson (2009), das eine spezifische Ausprägung des erworbenen Wissens postuliert, wird bei der Itemkonstruktion über die schwierigkeitsgenerierenden Merkmale der kognitiven Verarbeitungsprozesse* und Spezifität eine Construct-Map entwickelt. Diese inhaltsbezogenen Merkmale haben sich der kaufmännisch-beruflichen Forschung als empirisch bedeutsam erwiesen (Winther und Achtenhagen 2009; Winther 2010; Klotz et al. 2015). Das Merkmal der kognitiven Verarbeitungsprozesse orientiert sich an der Taxonomie von Marzano und Kendall (2007) und differenziert dreistufig in die Wissensreproduktion, das Verstehen und Analysieren sowie die Wissensanwendung in Handlungssituationen. Das Merkmal der Spezifität orientiert sich am Konzept einer zunehmenden Domänenspezifität von Wissen (Gelman und Greeno 1989) und differenziert dreistufig in domänenverbundenes und zunehmend domänenspezifisches Wissen. Es wird angenommen, dass eine zunehmende Wissensbasis sich nicht nur inhaltlich erweitert, sondern sich auch in ihrer Komplexität und Querverbindungen in Form von Entwicklungsstufen vertiefend manifestiert. Die Datenerhebung wurde computergestützt durchgeführt. Es handelt sich um eine zweistufig stratifizierte Klumpenstichprobe (N=3020). Für die Analyse der Dimensionalität der Daten wurde ein polytomes 1PL-IRT-Modell-MCMLM (Adams et al. 1997) gewählt und mit dem Programm ACER-ConQuest (Adams et al. 2018) skaliert. Zur Bestimmung der Kompetenzniveaustufen wurde die Items anhand der schwierigkeitsgenerierenden Merkmale in drei Stufen geratet. Die prädiktive Bedeutung der schwierigkeitsgenerierenden Merkmale wird mithilfe einer Regressionsanalyse bestimmt (Hartig und Frey 2012; Hartig 2007). Da die unabhängigen Variablen nicht intervallskaliert sind, werden Dummyvariablen erstellt und mit der Ausprägung 0 und 1 codiert. Die abhängige Variable stellt den Personenfähigkeitsparameter dar. Zum jetzigen Zeitpunkt liegen die Ergebnisse der Datenanalyse der Hauptstudie noch nicht in Gänze vor. Die Feldteststudie mit N=816 Teilnehmerinnen zeigte jedoch bereits vielversprechende Ergebnisse bzgl. einer zweidimensionalen Kompetenzstruktur und der prädiktiven Bedeutung der Merkmale kognitiven Verarbeitungsprozesse und der inhaltlichen Spezifität auf die ökonomische Kompetenz der Schülerinnen. Für die Befunde der Hauptstudie erwarten wir ähnliche Ergebnisse, da eine Revision des Testinstruments aufgrund der zufriedenstellenden Feldtestdaten nur im geringen Maße erforderlich war. Die Befunde sind insbesondere in der Ermangelung von Evidenz in der Domäne von hoher Bedeutung, da diese ebenfalls anschlussfähig an die kaufmännisch-berufliche Forschung sind und so auch ökonomische Bildung unter der Perspektive der Berufspropädeutik an Relevanz gewinnen kann. Darüber stellen die Ergebnisse ein Ausgangspunkt hinsichtlich einer evidenzbasierten Fort- und Weiterentwicklung von Lehrplänen sowie die Formulierung kompetenzorientierter Bildungsstandards dar. Paper Session Der Geschlechterunterschied in der Wirtschafts- und Finanzkompetenz – Eine systematische Literaturanalyse Lucy Haag, Taiga Brahm Eberhard Karls Universität Tübingen Theoretischer Hintergrund Ausgeprägte Wirtschafts- und Finanzkompetenzen sind essenziell, um im komplexen und globalisierten Wirtschaftsgeschehen Entscheidungen zu treffen. Die Forschung zeigt, dass diese Kompetenzen mit Finanzverhalten zusammenhängen und individuelle Entscheidungen beeinflussen (Lusardi & Mitchell, 2017; van Rooij et al., 2011). Zusätzlich zeigen Studien einen signifikanten Einfluss von Finanzkompetenz auf das Sparverhalten, den Vermögensaufbau und die Rentenvorsorge (Bucher-Koenen et al., 2021; van Rooij et al., 2011). Der demographische Wandel sowie komplexe Finanzprodukte verstärken die Bedeutung einer ausgeprägten Wirtschafts- und Finanzkompetenz (Klapper & Lusardi, 2020). Trotz dieser praktischen Relevanz zeigt eine Vielzahl von Studien die geringe Wirtschafts- und Finanzkompetenz in der generellen Bevölkerung auf. Dieses Problem ist für bestimmte Subgruppen, wie Frauen, ältere Personen und solche mit einem geringen Bildungsniveau zusätzlich verstärkt (Bucher-Koenen & Lusardi, 2011; Lusardi et al., 2014; Walstad & Rebeck, 2002). Im Hinblick auf die Geschlechterungleichheit und die praktischen Konsequenzen von Wirtschafts- und Finanzwissen sind diese Ergebnisse besorgniserregend. Fragestellung und Methode Angelehnt an diese Erkenntnisse bietet der vorliegende Artikel zwei Beiträge. Erstens untersucht die systematische Literaturanalyse internationale Literatur bezüglich des Geschlechterunterschieds in der Wirtschafts- und Finanzkompetenz und unterscheidet hierbei zwischen verschiedenen Weltregionen und Altersgruppen. Zweitens werden mögliche Erklärungsfaktoren für den Geschlechterunterschied untersucht. Die systematische Analyse folgt den PRISMA Richtlinien 2020 (Page et al., 2021) und umfasst 97 Artikel mit 185 Studien über den Zeitraum von 2002 bis 2022. Es werden eine bibliometrische sowie eine qualitative Inhaltsanalyse durchgeführt. Ergebnisse In der Mehrheit der Studien (75,14 %) wird ein signifikanter Geschlechterunterschied zugunsten von Männern festgestellt. Dieser Unterschied ist über verschiedene Regionen und Altersgruppen hinweg beobachtbar. Besonders ausgeprägt scheint der Geschlechterunterschied in Industrienationen, insbesondere in Nordamerika und Europa, während in anderen Regionen (z.B. Osteuropa, Südamerika und Asien) häufiger kein signifikanter Unterschied zwischen den Geschlechtern gefunden wird. Es können verschiedene Erklärungsfaktoren für den Geschlechterunterschied identifiziert werden. Selbstvertrauen wurde am häufigsten untersucht, meist quantifiziert durch „Ich weiß es nicht“-Antworten oder eine Selbsteinschätzung der eigenen Wirtschafts- und Finanzfähigkeiten. Ein weiterer oftmals untersuchter Faktor ist Sozialisation. Diese umfasst z.B. das soziale und kulturelle Umfeld, die Sozialisation durch die Eltern und stereotypisches Denken (Agnew & Cameron-Agnew, 2015; Bucher-Koenen et al., 2017; Furrebøe & Nyhus, 2022; Jappelli, 2010). Weitere relevante Merkmale sind Bildung und Beschäftigung (Davoli & Rodríguez-Planas, 2020; Kim et al., 2022), demographische Variablen (Aguiar-Diaz & Zagalaz-Jimenez, 2022; Preston & Wright, 2022) sowie mathematische Fähigkeiten (Jappelli & Padula, 2013; Razen et al., 2021). Aufgrund verschiedener Erhebungsinstrumente, Auswertungsmethoden und Studienergebnisse ist jedoch unklar, zu welchem Teil diese Faktoren jeweils den Geschlechterunterschied erklären können. Ein wiederkehrendes Ergebnis der Studien ist, dass nur ein kleiner Teil des Unterschieds durch die erhobenen Variablen erklärt werden kann und ein wesentlicher Teil unerklärt bleibt (Kim et al., 2022; Preston & Wright, 2022; Robson & Peetz, 2020; Yao et al., 2022). Insgesamt ermöglicht die Literaturanalyse ein tieferes Verständnis für den Geschlechterunterschied in der Wirtschafts- und Finanzkompetenz sowie der komplexen Faktoren, die diesem zugrunde liegen. Die Thematik ist relevant, um die Geschlechtergleichheit zu fördern und das finanzielle Wohlergehen in der Bevölkerung zu stärken. Paper Session Determinanten der ökonomischen Diagrammkompetenz von südafrikanischen Studierenden Malte Ring¹, Taiga Brahm¹, Volker Schöer² ¹Universität Tübingen, Deutschland; ²University of the Witwatersrand, Südafrika Einleitung und theoretischer Hintergrund Diagramme sind ein zentraler Bestandteil des Wirtschaftsstudiums und sollen Lernenden helfen, komplexe Zusammenhänge besser zu verstehen. Bisherige Forschung zeigt, dass Studierende Diagrammaufgaben herausfordernd finden und oft nicht nachvollziehen können, welche Rolle Diagramme bei Analyse und Darstellung komplexer Zusammenhänge haben (Cohn et al., 2004). Dies gilt umso mehr für bestimmte Gruppen: Weibliche Lernende und Lernende mit geringen Mathematik-Kenntnissen fallen die Aufgaben besonders schwer (Cohn et al., 2004; Hill & Stegner, 2003; Marire, 2017; Ramos Salazar & Hayward, 2022; Schuhmann et al., 2005). Obwohl Diagrammkompetenz eine wichtige Voraussetzung für das Wirtschaftsstudium ist, gibt es bisher wenige Studien, die die Kompetenz und deren Voraussetzungen genauer analysieren. Insbesondere werden die Fähigkeiten selten mit komplexeren Instrumenten erfasst und gemeinsam untersucht. Das ist notwendig, um besser zu verstehen, wie die entsprechenden Gruppen beim Einstieg in das Wirtschaftsstudium unterstützt werden können. Der vorliegende Beitrag verfolgt daher das Ziel, den Zusammenhang zwischen ökonomischer Diagrammkompetenz und Geschlecht, Sprache sowie mathematischen Fähigkeiten in der Studieneingangsphase zu analysieren. Der Fokus liegt auf der Frage, ob sich Unterschiede zwischen den Geschlechtern durch mathematische und sprachliche Fähigkeiten von Wirtschaftsstudierenden erklären lassen. Methoden Die Stichprobe besteht aus 1351 Studierenden, die in wirtschaftswissenschaftlichen Studiengängen an einer Universität in Südafrika eingeschrieben sind. Von den befragten Studierenden sind 55,51% weiblich. Insgesamt haben 48,45 % in der Sekundarstufe „Englisch als Muttersprache“ als Fach gewählt (die verbliebenen „Englisch als Fremdsprache“). Die Studierenden in der Stichprobe sprechen insgesamt 24 unterschiedliche Muttersprachen, wobei Englisch in Südafrika als Bildungssprache an Hochschulen Standard ist und mit 23% die größte Gruppe darstellt. Die Diagrammkompetenz der Studierenden wurde mit einem englischen Testinstrument erfasst, das 15 Multiple-Choice-Aufgaben und eine offene Aufgabe für drei typische ökonomische Graphen (Angebot und Nachfrage, Kostenfunktion und Indifferenzkurve) umfasst. Der Test wurde im deutschen Kontext schon erfolgreich eingesetzt. Zur Bewertung der wirtschaftsbezogenen mathematischen Fähigkeiten der Studierenden wurden Aufgaben aus dem Mathematics for Economics Skill Assessment (MESA) verwendet (McKee et al., 2023). In beiden Tests wurde der Anteil der erreichten Punkte an der Gesamtpunktzahl (Prozentwert) für den gesamten Test als Variable verwendet, fehlende Aufgaben wurden als falsch gewertet. Die Studierenden stimmten der Verknüpfung der Ergebnisse mit administrativen Daten zu. Von dort wurden Geschlecht, Muttersprache und Noten aus der Sekundarstufe entnommen. Ergebnisse Im Durchschnitt erreichten die Lernenden 51,19% im Diagrammkompetenztest (SD = 11,25%). Im Mathetest erreichten die Studierenden durchschnittlich 57,05% (SD = 15,05%). Männliche Studierende erreichen im Diagrammkompetenztest im Durchschnitt etwa 3,5 Prozentpunkte mehr als weibliche Studierende. Um zu identifizieren, ob sich die Unterschiede zwischen männlichen und weiblichen Probanden durch Unterschiede in sprachlichen oder mathematischen Fähigkeiten erklären lassen, wurde eine hierarchische Regressionsanalyse mit Diagrammkompetenz als abhängiger Variable durchgeführt. Als unabhängige Variablen wurden neben dem Geschlecht schrittweise Muttersprache, Englischnote, Mathenote und die Ergebnisse des Wirtschaftsmathe-Tests eingesetzt. In jedem Modell wurde für die Anzahl der fehlenden Aufgaben aus dem Diagrammkompetenztest kontrolliert. Alle im Modell aufgenommenen Variablen korrelieren positiv mit Diagrammkompetenz. Während sich der Anteil von erklärter Varianz erhöht, bleibt der Gruppenunterschied zwischen männlichen und weiblichen Studierenden von etwa 3,4%, über alle Modelle konstant. Die Geschlechterdifferenz lässt sich damit nicht mithilfe von sprachlichen oder mathematischen Fähigkeiten erklären. Diskussion und Ausblick Als Prädiktoren für die Diagrammkompetenz von Studierenden zu Beginn des Wirtschaftsstudiums erweisen sich in Übereinstimmung mit früheren Untersuchungen (z.B. Cohn et al., 2004) Geschlecht, sprachliche und mathematische Kenntnisse als relevant. Unsere Ergebnisse bestätigen, dass Graphen zu Beginn des Studiums nicht intuitiv verstanden werden. Besonders bemerkenswert ist der beträchtliche Unterschied von einem Drittel Standardabweichung zwischen männlichen und weiblichen Lernenden, deren Erklärung Ziel zukünftiger Forschung sein sollte. Nachdem mathematische und sprachliche Fähigkeiten in dieser Studie erstmals gemeinsam in einer umfangreichen Stichprobe untersucht werden konnten, könnten geschlechtsspezifische Einstellungen, Erfahrungen und Sozialisation potenzielle Erklärfaktoren sein. Paper Session Verantwortungsbewusstes Handeln vor dem Hintergrund von Nutzenmaximierung – eine Interviewstudie zur Wirtschaftsethik Victoria Vochatzer, Taiga Brahm, Malte Ring Lehrstuhl für Ökonomische Bildung und Wirtschaftsdidaktik, Eberhard Karls Universität Tübingen, Deutschland Einführung und theoretischer Hintergrund In der Ökonomischen Bildung ist es zentral, die Fähigkeit der Lernenden zu stärken, wirtschaftliche Entscheidungen zu treffen und gleichzeitig ethische Aspekte zu berücksichtigen. Die Wirtschaftsethik verbindet in diesem Sinne Ökonomik und Ethik bzw. Wirtschaft und Moral, um gesellschaftliche Probleme, die durch wirtschaftliche Aktivitäten verursacht werden, zu erkennen, anzugehen und zu vermeiden (Loerwald, 2010). Der Theorie der Integrativen Wirtschaftsethik zufolge setzt eine wirtschaftsethische Analyse auf verschiedenen sozialen Ebenen an: die Ordnungsethik auf der Makro-, die Unternehmensethik auf der Meso- sowie die Individualethik auf der Mikroebene (Enderle, 1991; Retzmann & Grammes, 2014). Der schulische Ökonomieunterricht kann dabei einen Beitrag zur Entwicklung „gesellschaftlich geteilter Wertvorstellungen und moralischer Urteilskompetenzen“ (Loerwald, 2010, S. 82) leisten. Dabei ist es zentral, im Unterricht als wesentliche Lehr-Lern-Voraussetzung die subjektiven Erklärungssysteme der Lernenden zu wirtschaftsethischen Fragestellungen zu berücksichtigen. Allerdings fokussieren bisherige Forschungsarbeiten in Bezug auf Schüler:innenvorstellungen in der ökonomischen Bildung zumeist rein ökonomische Themengebiete (Aprea, 2014; Birke & Seeber, 2011a, 2011b; Davies & Lundholm, 2012; Friebel et al., 2014, 2016; Kaiser et al., 2016; Marton & Pong, 2005). Daher strebt die vorliegende Studie an, einen Beitrag zur Schließung der Forschungslücke zu wirtschaftsethischen Haltungen von Schüler:innen zu leisten, wofür sich die fachdidaktische Vorstellungsforschung als methodische Herangehensweise anbietet (Kirchner, 2015). Aus diesem Grund untersucht die vorliegende qualitative Studie die wirtschaftsethischen Vorstellungen und Einstellungen von Schülerinnen und Schülern. Hierfür wurden 33 halbstrukturierte Einzelinterviews mit Lernenden der achten Klasse an allgemeinbildenden Gymnasien in Südwestdeutschland geführt. Dabei wurden folgende Forschungsfragen fokussiert: Welche Einstellungen und Vorstellungen in Bezug auf wirtschaftsethische Fragestellungen haben Schüler:innen der 8. Klasse? Wie elaboriert sind diese und auf welcher wirtschaftsethischen Ebene argumentieren die Schüler:innen? Methodische Vorgehensweise Die Interviews konzentrierten sich speziell auf das Thema Verantwortung in Bezug auf Verbraucher:innen, Unternehmen sowie dem Staat im Kontext der Gestaltung wirtschaftlicher Rahmenbedingungen und wurden in die vier Fragekategorien Konsum und Verzicht, Wirtschaftskreislauf, Marktformen und Machtverhältnisse gegliedert. Diese Inhaltsbereiche orientieren sich am Bildungsplan Baden-Württemberg für Klasse acht sowie an der Theorie der Integrativen Wirtschaftsethik (Ministerium für Kultus, Jugend und Sport Baden-Württemberg, 2016; Retzmann & Grammes, 2014). Die Auswertung findet derzeit mithilfe eines doppelten Verfahrens statt. Dieses besteht aus einer deduktiven Codierung zur Einschätzung der Elaboriertheit und der wirtschaftsethischen Ebene anhand eines Erwartungshorizonts – ähnlich wie Aprea (2014) – sowie einer typenbildenden Inhaltsanalyse nach Kuckartz und Rädiker (2022) statt. Erste Ergebnisse Die Sichtung erster Transkripte ergibt sehr heterogene Antworten mit unterschiedlichen Begründungsmustern, die zum Teil sehr elaboriert sind („Also ich finde, eher die Firmen, die hier in Deutschland sind, weil die produzieren und verkaufen das ja auch und deswegen sollten die halt auch darauf achten, wie ihre Produkte überhaupt hergestellt werden und nicht quasi die Schuld auf die Länder schieben, die das herstellen, sondern die sind für ihr Produkt eigentlich verantwortlich und wie das hergestellt wird.“), teilweise aber auch sehr nah an der Lebenswelt der Schüler:innen („Aber ich glaube im Gegenteil, dass das nicht richtig ist, dass der Staat da irgendwas steuert. Uns da irgendwie beeinflusst.“). Bis zur Tagung werden die Transkripte der Interviews vollständig ausgewertet sein, sodass die Präsentation an der Tagung möglich ist. Insgesamt zielt die Untersuchung darauf ab, Einblicke in die bestehenden wirtschaftsethischen Weltsichten der Lernenden zu gewinnen, um die Erkenntnisse in der fachdidaktischen Praxis zur „Planung, Durchführung und Reflexion von Unterricht“ (Kirchner, 2015, S. 57) nutzen zu können.
13:10 - 14:50	2-18: Mathematische Bildung I Ort: S22
	Paper Session Situationales Interesse beim Lösen selbstentwickelter Mathematikaufgaben – die Bedeutung von Aufgaben- und Personenmerkmalen Janina Krawitz¹, Stanislaw Schukajlow² ¹Universität Paderborn, Deutschland; ²Universität Münster, Deutschland Unter Interesse versteht man eine gegenstandsbezogene Motivation (Krapp, 2002). Empirische Studien deuten darauf hin, dass Interesse das Lernen positiv beeinflusst und sich vom zeitlich instabilen situationalen Interesse zum stabilen individuellen Interesse entwickelt (Hidi & Renninger, 2006). Es wird angenommen, dass Aufgaben- und Personenmerkmale für die Entwicklung des situationalen Interesses entscheidend sind. Diese Annahme wird hier für die Aufgabenmerkmale Modellierungspotential und Komplexität und für die Personenmerkmale Erfahrungen mit selbstentwickelten Aufgaben und mathematische Leistung erforscht. Das Entwickeln eigener anspruchsvoller Aufgaben zu realitätsbezogenen Situationen (Modellierungsaufgaben) wird als eine Möglichkeit gesehen, Interesse zu steigern (Cai & Leikin, 2020). Insbesondere das Modellierungspotential der selbstentwickelten Aufgaben (Authentizität und Offenheit) kann durch die Nähe zur Realität situationales Interesse auslösen. Appraisal-Theorien (Silvia, 2005) zufolge ist dabei entscheidend, dass die Aufgaben als herausfordernd (hohe Komplexität) und bewältigbar wahrgenommen werden. Die Erfahrung mit dem Entwickeln eigener Aufgaben (Personenmerkmal) kann das Interesse der Aufgabenbearbeitung über das Modellierungspotential und die Komplexität selbstentwickelter Aufgaben (Aufgabenmerkmale) positiv beeinflussen. Die Zusammenhänge zwischen der Erfahrung mit dem Entwickeln eigener Aufgaben und dem Interesse können für Personen mit verschiedenen mathematischen Leistungen (Personenmerkmal) variieren. Hypothesen Wir erwarten einen positiven Zusammenhang zwischen dem Modellierungspotential und der Komplexität mit dem Interesse, der von der mathematischen Leistung moderiert wird, da die Nähe zur Realität (Niss & Blum, 2020) und Herausforderungen, die von den Lernenden als bewältigbar beurteilt werden (Silvia, 2005), zentral für Interessensentwicklung sind. Auf der Basis von Appraisal- und Interessenstheorien (Hidi & Renninger, 2006; Silvia, 2008) und der Theorie zum Entwickeln eigener Aufgaben (Leikin et al., 2023) erwarten wir, dass die Erfahrung mit dem Entwickeln von Aufgaben positiv mit dem Interesse zusammenhängt, wobei der Zusammenhang über Aufgabenmerkmale vermittelt wird. Methode 105 Neuntklässler:innen (53% weiblich, M = 15 Jahre) wurden gebeten, zu sechs realitätsbezogenen Situationen je eine mathematische Aufgabe zu entwickelt. Nach der Entwicklung jeder Aufgabe wurde Interesse an der Bearbeitung jeder selbstentwickelten Aufgabe abgefragt. Anschließend haben Lernende ihre Erfahrung mit der Entwicklung von Aufgaben und die letzte Schulnote in Mathematik (mathematische Leistung) berichtet. Für die Befragungen wurden eine 5-stufige Ratingskala eingesetzt (1=stimmt gar nicht; 5=stimmt voll zu). Interesse wurde mit dem Item: „Es wäre interessant, die Fragestellung zu bearbeiten“ abgefragt und über 6 verschiedene Aufgaben zu einem Mittelwertscore aggregiert (Cronbachs α=.859). Die Erfahrungen wurden mit drei Items gemessen, z.B.: „Im Mathematikunterricht bearbeiten wir selbstausgedachte Fragen zu Textaufgaben“ (Cronbachs α=.714). Modellierungspotential wurde anhand der Authentizität und der Offenheit der selbstentwickelten Aufgaben dreistufig kodiert (von 0=niedrige Authentizität und geschlossene Aufgabe bis 2=hohe Authentizität und offene Aufgabe; Intercoderreliabilität .86; Cronbachs α=.676). Mathematische Komplexität wurde zweistufig kodiert (0=einstufige arithmetische Verfahren, 1=komplexe mehrstufige Verfahren; Intercoderreliabilität .573; Cronbachs α=.563). Die Ergebnisse wurden mit Pfadmodellen mit Hilfe von MPlus3.9 (MLR-Schätzer, CFI>0.923, SRMR<.031) berechnet. Fehlende Werte wurden mit FIML geschätzt. Ergebnisse und Diskussion Es zeigten sich keine Zusammenhänge zwischen Aufgabenmerkmalen und Interesse (p>.10). Wie erwartet moderierte die mathematische Leistung den Zusammenhang zwischen Modellierungspotential der Aufgaben und Interesse (β=−1.136, p=.009). Das Modellierungspotential hing positiv mit dem Interesse bei leistungsschwächeren Lernenden (β=0.885, p=.037) und negativ bei leistungsstärkeren Lernenden (β=−1.240, p=.039) zusammen. Keine Moderationseffekte wurden für den Zusammenhang zwischen Aufgabenkomplexität und Interesse festgestellt (p>.10). Erfahrung mit selbstentwickelten Aufgaben hingen positiv mit Interesse zusammen (β=0.239, p=.002). Diese Effekte wurden aber nicht über die Aufgabenmerkmale vermittelt (p>.10). Die Ergebnisse bestätigen eine hohe Bedeutsamkeit von Aufgaben- und Personenmerkmalen für das situationale Interesse, wie in Motivationstheorien angenommen wurde. Das Modellierungspotenzial von selbstentwickelten Aufgaben ist insbesondere bei leistungsschwächeren Lernenden interessensförderlich. Eine Erklärung dafür kann sein, dass leistungsschwächere Lernende Realitätsbezüge besonders schätzen. Eine praktische Implikation der Studie ist, dass durch das Entwickeln eigener Aufgaben im Mathematikunterricht, Lernende wichtige Erfahrungen sammeln, die wiederum Interesse steigern können. Paper Session Adaptiver Umgang mit Fehlvorstellungen im Bereich Brüche - eine empirische Studie im Mixed-Methods Design Sara Becker¹, Andreas Obersteiner², Anika Dreher³ ¹Universität Tübingen, Deutschland; ²Technische Universität München, Deutschland; ³Pädagogische Hochschule Freiburg, Deutschland Theoretischer Hintergrund Adaptiv mit Fehlvorstellungen von Lernenden umzugehen, welche sich zum Beispiel in fehlerhaft bearbeiteten Aufgaben widerspiegeln können, ist von grundlegender Bedeutung für die individuelle Förderung von Lernenden (Gallagher et al., 2020). Adaptive Lernimpulse von Lehrkräften sollten einerseits individuelle Bedürfnisse der Lernenden (Lernendenfokus) berücksichtigen und andererseits zum Aufbau tragfähiger Grundvorstellungen im jeweiligen Inhaltsbereich (Zielfokus) beitragen (Prediger et al., 2022). Dieser Kompetenz von Lehrkräften, adaptiv mit Fehlvorstellungen umzugehen, liegen die Prozesse des Wahrnehmens von relevanten Informationen sowie die adäquate Interpretation der wahrgenommenen Informationen unter Rückgriff auf vorhandenes professionelles Wissen zugrunde (van Es & Sherin, 2021). Für die Interpretation ist insbesondere Fachwissen über den jeweiligen Inhaltsbereich und fachdidaktisches Wissen über mögliche Fehlvorstellungen von großer Bedeutung (Gallagher et al., 2020). Empirische Studien haben gezeigt, dass adaptiver Unterricht insbesondere für angehende Mathematiklehrkräfte eine große Herausforderung darstellt, die Gründe für diese Herausforderung sind jedoch kaum untersucht (Hardy et al., 2019). Qualitative Ergebnisse weisen darauf hin, dass angehende Lehrkräfte rein motivationalen Aspekten einer Situation oft eine wichtigere Rolle zuschreiben als fachdidaktisch relevanten Aspekten, was ihre Entscheidung beim adaptiven Unterrichten beeinflussen könnte (z. B. Wirth et al., 2022). Bislang fehlen jedoch Studien, die experimentell untersuchten, inwieweit angehende Mathematiklehrkräfte adaptive Impulse zu vorliegenden Lösungen von Lernenden geben können, welche Informationen sie dabei wahrnehmen und auf welche kognitiven Ressourcen (z. B. welches Wissen) sie zurückgreifen. Fragestellung Die Studie untersucht, inwieweit angehende Mathematiklehrkräfte adaptive Lernimpulse für vorgegebene fehlerhafte Lösungen von Lernenden auswählen. Zur Analyse der zugrunde liegenden Prozesse des Wahrnehmens und Interpretierens werden zusätzlich die verbalen Begründungen der Teilnehmenden für ihre Auswahl in Hinblick auf a) die berücksichtigten Informationen und b) die genutzten kognitive Ressourcen analysiert. Methode Anhand von zehn textbasierten Vignetten wurden die Auswahl und Begründungen von N = 48angehenden Mathematiklehrkräften (Alter: M = 24,76 Jahre, SD = 1,80 Jahre; 70,2 % weiblich, 29,8 % männlich) untersucht. Die Vignetten umfassten jeweils fehlerhafte Lösungen von Lernenden im Inhaltsbereich Brüche, welche auf eine Fehlvorstellung hindeuteten, und drei mögliche Lernimpulse. Jeder Impuls bestand aus einer verbalen Erklärung und einer Visualisierung. Von den drei zur Wahl stehenden Lernimpulsen war jeweils einer am adaptivsten und beinhaltete gleichzeitig einen hohen Lernendenfokus und einen hohen Zielfokus (vgl. Prediger et al., 2022). Die beiden anderen Lernimpulse enthielten unvorteilhafte Erklärungen oder Visualisierungen, die das Potenzial hatten, die jeweilige Fehlvorstellung zu verstärken. Die Auswahl der Lernimpulse wurde quantitativ ausgewertet, die verbalen Begründungen wurden qualitativ und quantitativ analysiert. Ergebnisse Die Ergebnisse zeigen, dass angehende Mathematiklehrkräfte nur in etwa der Hälfte der Vignetten (53 %) den adaptivsten Lernimpuls für die gegebene Lösung auswählten. Bei ihrer Auswahl berücksichtigten die Teilnehmenden am häufigsten Aspekte der Visualisierung (in 89 % der Begründungen) und rein motivationale Aspekte (in 73 %). Aspekte, die auf das Denken der Lernenden und mögliche Fehlvorstellungen hinweisen, wurden kaum berücksichtigt (in 18 % der Begründungen). Bei der Begründung der Auswahl nutzten die Teilnehmenden insbesondere ihr fachdidaktisches Wissen (64 %) und motivationale Orientierungen (24 %). Auf relevantes Fachwissen bezogen sie sich hingegen nur in 2 % der Begründungen. Interessanterweise zeigten sich hohe interindividuelle Unterschiede bei der Auswahl und den kognitiven Prozessen. Zum Beispiel zeigte sich, dass 68 % der Teilnehmenden, die fachdidaktisches Wissen nutzten, in mindestens der Hälfte der Vignetten auf dieses zurückgriffen. Die Nutzung variierte jedoch zwischen zwei und neun Vignetten. Aktuell analysieren wir mögliche Gründe für diese Unterschiede und inwieweit wahrgenommene Informationen und genutzte Ressourcen mit der Auswahl des Impulses zusammenhängen. Ergebnisse liegen bis zur Konferenz vor. Die Ergebnisse der Studie bieten u. a. konkrete Ansatzpunkte, um die Wahrnehmung relevanter Informationen vorliegender Lösungen, die notwendigen Wissensaspekte sowie den adaptiven Umgang mit Fehlvorstellungen in der Ausbildung angehender Lehrkräfte gezielt zu fördern. Paper Session Zusammenhang zwischen der Nutzung intelligenter tutorieller Systeme (ITS) und dem Lernzuwachs in Mathematik in der Mittelstufe Julius Schaaf¹, Tobias Rolfes¹, Gabriel Nagy², Aiso Heinze² ¹Goethe Universität, Deutschland; ²Leibniz-Institut für die Pädagogik der Naturwissenschaften Theoretischer Hintergrund Im Mathematikunterricht werden digitale Medien in Form digitaler Mathematikwerkzeuge (z.B. grafikfähige Taschenrechner, dynamische Geometriesoftware) seit langem eingesetzt und sind auch fester Bestandteil der Bildungsstandards (KMK, 2022). Insbesondere durch die Corona-Pandemie sind in den letzten Jahren computerbasierte Mathematiklernsystem in Form von intelligenten tutoriellen Systemen (ITS) stärker in den Fokus gerückt. Diese Systeme zeichnen sich oft durch eine breite Basis an bereitstehenden Inhalten, Adaptivität und direktes Feedback aus. Die Studienlage zur Lernwirksamkeit von ITS ist uneindeutig (Steenbergen-Hu & Cooper, 2013, Kulik & Fletcher, 2016). Daher soll im Rahmen dieser Studie der Einfluss der Nutzung eines ITS (Bettermarks) auf den Lernzuwachs in Mathematik von Schülerinnen und Schülern untersucht werden. Fragestellung Inwiefern existiert ein Zusammenhang zwischen (1) der mittleren Nutzungshäufigkeit des ITS auf Klassenebene (2) der individuellen Nutzungshäufigkeit des ITS relativ zum Klassenmittelwert und dem Lernzuwachs von Schülerinnen und Schülern in Mathematik? Methode Im Längsschnitt liegen die Daten von 942 Testpersonen (489 weiblich, 445 männlich, 8 ohne Angabe) aus 57 Klassen der Klassenstufe 7 und 8 aus Schleswig-Holstein vor. Von den Testpersonen besuchten 771 ein Gymnasium und 165 eine Gemeinschaftsschule. Das mittlere Alter betrug 12,8 Jahre (SD = 0.7). An zwei Messzeitpunkten (Prätest: September bis November 2021, Posttest: Juni bis Juli 2022) wurde ein computerbasierter Fragebogen administriert. Die Zeitabstände zwischen Prä- und Posttest zwischen den Klassen betrugen im Mittel 253 Tage (Median). Zu beiden Messzeitpunkten wurden die Mathematikleistungen und weitere Schülermerkmale gemessen. Darüber hinaus wurde während des Schuljahres die Aktivität der einzelnen Schülerinnen und Schüler im ITS erfasst. Die Schülerinnen und Schüler bearbeiteten in dem ITS sogenannte Worksheets (Arbeitsblätter). Bei jeder Bearbeitung eines Worksheets wurde erfasst, aus wie vielen Aufgaben es besteht, wie viele Aufgaben davon korrekt gelöst wurden und wann die Bearbeitung erfolgte. Über Umfang, behandelte Inhalte und Zeitpunkt der Nutzung entschieden Lehrkräfte sowie Schülerinnen und Schüler selbstständig. Bei den administrierten Items handelte es sich größtenteils um Items aus der internationalen Trends in Mathematics and Science Study (TIMSS) für die Jahrgangsstufe 8. Die Items deckten Unterrichtsinhalte der Jahrgangsstufen 7 und 8 mit den vier Leitideen „Zahl und Operation“, „Raum und Form“, „Größen und Messen“ und „Strukturen und funktionaler Zusammenhang“ entsprechend der Bildungsstandards (KMK, 2022) ab. Neben den Mathematikleistungen wurden noch weitere Schülermerkmale (z.B. End- und Halbjahresnoten in Mathematik, kulturelles Kapital des Elternhauses, Selbstkonzept in Mathematik) erfasst. Die Testergebnisse wurden mit Hilfe eines Rasch-Modells skaliert und in einem Mehrebenenmodell analysiert. Ergebnisse Die Itemanalyse zeigte, dass die eingesetzten Items eine gute Passung aufwiesen (INFIT zwischen 0.87 und 1.15, Trennschärfe über 0.24). Die WLE-Reliabilität betrug 0.76. Der durchschnittliche Lernzuwachs der Stichprobe im Messzeitraum betrug 0.35 Standardabweichungen. Um den Zusammenhang zwischen der Nutzungshäufigkeit des ITS und dem Lernzuwachs der Schülerinnen und Schüler zu ermitteln, wurde die ITS-Nutzungshäufigkeit operationalisiert als die Anzahl der von einer Testperson zwischen den beiden Messzeitpunkten bearbeiteten unterschiedlichen Worksheets. Darauf aufbauend wurde in einem Mehrebenenmodell der Einfluss der ITS-Nutzungshäufigkeit unter Kontrolle verschiedener Kovariaten (Schulform, Klassenstufe, Mathematik-Note, Selbstkonzept Mathematik) auf die Mathematikleistung im Posttest untersucht. Die Intraklassenkorrelation der Mathematikleistung betrug 0.39. Auf Individualebene wurde 30.8%, auf Klassenebene 80.5% der Varianz aufgeklärt. Auf Klassenebene hatte die ITS-Nutzung keinen Effekt, β = -0,01 (p = .77), während die Effektstärke der standardisierten, am Klassendurchschnitt gemittelten ITS-Nutzung auf Individualebene signifikante 0.06 (p= .009) betrug. Somit hatten Schülerinnen und Schüler, die das ITS häufiger als ihre Klassenkameraden nutzten, durchschnittlich einen größeren Lernzuwachs. Allerdings wiesen Klassen, die das Programm häufig nutzten, durchschnittlich keinen höheren Lernzuwachs auf. Dies lässt vermuten, dass nicht das Medium ITS ursächlich für den Lernzuwachs war, sondern der höhere Lernzuwachs von Schülerinnen und Schüler bei intensiverer ITS-Nutzung durch die größere Übungszeit verursacht wurde. Ein ähnlicher Übungszeiteffekt lässt sich möglicherweise auch mit klassischen Medien (z.B. Schulbuchaufgaben) erzeugen. Paper Session Wenn das Wörtchen „wenn“ nicht wär… Die Relevanz sprachlicher Merkmale bei bedingten Wahrscheinlichkeiten Theresa Büchter, Andreas Eichler, Johanna Merkes, Madeleine Domenech Universität Kassel, Deutschland Theoretischer Hintergrund: Das Verständnis bedingter Wahrscheinlichkeiten ist häufig mit Missverständnissen verbunden, wie ein mittlerweile gesperrter Twitter-Post von Donald Trump mit fehlverstandenen Informationen zu Covid-Infektionen beim Tragen einer Maske exemplarisch illustrierte. Solche Missverständnisse zeigen ein vermindertes Bayesianisches Denken, das die Fähigkeit umfasst, bedingten Wahrscheinlichkeiten auf Basis von neuen Informationen einzuschätzen (Reani et al., 2018). Trotz bekannter hilfreicher Strategien (McDowell & Jacobs., 2017; Cui et al., 2023) bleiben auch bei Nutzung dieser Strategien Missverständnisse bestehen, wie die Verwechslung von bedingter mit konjugierter Wahrscheinlichkeit oder zweier bedingter Wahrscheinlichkeiten (Eichler et al., 2020). Bestimmte sprachliche Beschreibungen könnten das Verständnis Bayesianischer Situationen erschweren (Post & Prediger, 2022) und mit Visualisierungen beim Bayesianischen Denken interagieren (Böcherer-Linder, et al., 2018). Bisher untersuchen nur wenige Studien, welche Formulierungen Transparenz über die Bedeutung bedingter Wahrscheinlichkeiten herstellen. Außerhalb dieses mathematischen Gebiets ist der Einfluss sprachlicher Merkmale auf (Mathematik)leistung intensiver untersucht worden und legt beispielsweise nahe, dass Nominalphrasen schwerer nachzuvollziehen sind als andere Phrasenstrukturen (Heine et al., 2018). Fragestellung: Die Rezeption von (bedingten) Wahrscheinlichkeiten wird 1) auf rein sprachlicher Ebene (ohne numerische und/oder visuelle Informationen) und 2) mit numerischen und visuellen Informationen untersucht. Zu 1) analysieren wir, welche Formulierungen Missverständnisse (auf sprachlicher Ebene) bedingen. Zu 2) fragen wir, inwiefern Bayesianisches Denken von der Formulierung der Frage abhängt und unterscheiden Formulierungen mit Wenn-Satz und Bedingung am Satzanfang (Experimentalgruppe 1), Wenn-Satz und Bedingung am Satzende (Experimentalgruppe 2) und Nominalphrase (Experimentalgruppe 3). Methode: An unserer präregistrierten Studie nahmen N=124 Schülerinnen eines Oberstufengymnasiums teil. Alle Schülerinnen sollten sieben Formulierungen von Wahrscheinlichkeiten in Gruppen äquivalenter Formulierungen einsortieren (Gruppenanzahl wurde selbst gewählt). Diese Formulierungen umfassen drei äquivalente Formulierungen des positiven Vorhersagewerts (2x Wenn-Satz; 1x Nominalphrase), eine Formulierung der Sensitivität als Wenn-Satz und drei äquivalente Formulierungen einer konjugierten Wahrscheinlichkeit (2x „und“-Formulierung; 1x „sowohl-als-auch“-Formulierung). Zusätzlich beantworteten sie acht Fragen (Formulierung entsprechend ihrer Experimentalgruppe) zum Bayesianischen Denken mit einem Netzdiagramm (Binder et al., 2020). Ergebnisse: Für beide Fragestellungen wurde je ein gemischtes generalisiertes lineares Modell (GLMM) mit Maximum-Likelihood-Methode geschätzt. Für GLMM1 wurden Paare von jeweils zwei aus den sieben Formulierungen betrachtet und damit insgesamt 21 Paare pro Person. Sind beide Formulierungen eines Paares äquivalent, sollte das Paar in der gleichen Gruppe sein (ansonsten in getrennten). Ob ein Paar korrekt (in eine (un)gleiche Gruppe) einsortiert wurde, ist die abhängige Variable in GLMM-1 (Kodierung mit 1, falls korrekt, sonst 0). In das Modell wurden als Prädiktoren aufgenommen, ob im Paar (i) die Formulierungen (nicht) äquivalent sind und (ii) eine Formulierung entsprechend einer Experimentalgruppe enthalten ist (und wenn ja welche) sowie deren Interkationen. In der Referenzgruppe (äquivalente Paare ohne Experimentalgruppen-Formulierung, also mit konjugierten Wahrscheinlichkeiten) werden 52% korrekterweise gleich eingruppiert. In äquivalenten Paaren (bedingter Wahrscheinlichkeiten) ausschließlich mit Wenn-Satz-Formulierungen gibt es mit 51% keinen signifikanten Unterschied zur Referenzgruppe (b₁=–0,06, p=0,78). Äquivalente Paare mit einer Nominalphrase werden aber mit 33% korrekten Zuordnungen signifikant seltener korrekt eingruppiert (b₂=–0,88, p<0,001). 77% der nicht-äquivalenten Paare werden korrekterweise ungleich eingruppiert und damit signifikant häufiger als die Referenzgruppe (b₃=1,42,p<0,001). Nicht-äquivalente Paare mit Nominalphrase werden noch häufiger getrennt gruppiert (b₄=0,57, p=0,01). Die abhängige Variable in GLMM-2 ist die Lösung einer Bayesianischen Aufgabe (Kodierung mit 1, falls korrekt, sonst 0). In GLMM-2 wurde Experimentalgruppe 2 als Referenzgruppe verwendet und Experimentalgruppen 1 und 3 als dummy-kodierte Prädiktoren einbezogen. Der Anteil korrekter Lösungen variiert zwischen Experimentalgruppe 1 (51%), 2 (35%) und 3 (51%) und die Regressionsgewichte sind für Experimentalgruppen 1 (b₁=1,03,p=0,023) und 3 (b₂=1,01,p=0,019) signifikant. Bayesianisches Denken mit Netzdiagramm ist also bei Formulierungen mit Nominalphrase und Wenn-Satz am Anfang signifikant besser als bei Formulierung mit Wenn-Satz am Ende. Zusammengenommen zeigt sich auf rein sprachlicher Ebene ein Nachteil von Nominalphrasen für das Verständnis bedingter Wahrscheinlichkeiten. Dieser kann anscheinend durch die Visualisierung der Bayesianischen Situation ausgeglichen werden.
13:10 - 14:50	2-19: Neue Befunde zur Stratifizierung des Bildungssystems Ort: S23
	Paper Session De-Tracking Reforms in Germany: Using a Difference-in-Difference Approach to Estimate Effects on Students' Educational Aspirations and their Association with Students' Socioeconomic Backgrounds Marlen Holtmann^1,3, Camilla Rjosk^2,3, Malte Jansen^3,4,5, Oliver Lüdtke^4,5 ¹International Association for the Evaluation of Educational Achievement (IEA), Hamburg; ²Universität Potsdam; ³Institut zur Qualitätsentwicklung im Bildungswesen (IQB), Humboldt-Universität zu Berlin; ⁴Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN); ⁵Zentrum für internationale Bildungsvergleichsstudien (ZIB) Theoretischer Hintergrund: On the way to acquiring high educational qualifications required by the labor market (OECD, 2021), the corresponding educational aspirations are an important determinant (e.g., Beal & Crockett, 2010). Socioeconomic disparities in students' educational aspirations contribute to lower opportunities for students from socioeconomically disadvantaged backgrounds to achieve high qualifications at the same achievement level (e.g., Bodovski, 2014). Tracking practices are associated with socioeconomic disparities in students’ educational aspirations and discussed as contributing to socioeconomic disparities in educational attainment (cf. Boudon, 1974, Buchmann & Dalton, 2002, Buchmann & Park, 2009). Some German federal states recently reformed their tracking practices by reducing the number of secondary school track options from up to four to a two-path structure, in which students can continue their school career until they acquire the general university entrance qualification in both tracks (academic and comprehensive). These de-tracking reforms aimed to reduce disparities in students' educational aspirations and success across different school types, especially those related to students' socioeconomic backgrounds (cf. Baumert et al., 2017). The Berlin study, which scientifically accompanied the de-tracking reforms in Berlin,found an increase in the educational aspirations of non-academic track students toobtain the general university entrance qualification (Neumann et al., 2017). However, they also showed a stable, strong relationship between students’ socioeconomic backgrounds and their educational aspirations, despite the general increase in aspirations (Maaz et al., 2017). The trends of students’ educational aspirations in the other states with de-tracking reforms, as well as the association with students’ socioeconomic background, have not been studied yet. Fragestellung: We examine whether these de-tracking reforms were, as intended, associated with a change in students' educational aspirations and whether they reduced socioeconomic disparities in students' educational aspirations. Methode: We analyze representative data of around 65,000 ninth graders from states with and without de-tracking reforms from the pre- and post-reform periods between 2012 to 2018, using data from the IQB National Assessment Study 2012, the IQB Trends in Student Achievement Study 2015 and 2018 (Pant et al., 2015; Stanat et al., 2018; Stanat et al., 2022). With a Difference-in-Differences approach, we estimate the effect of de-tracking reforms on students’ educational aspirations. To examine the change of socioeconomic disparities in students’ educational aspirations, we estimate Difference-in-Differences models for different socioeconomic groups. Moreover, we analyze secondary effects of students’ socioeconomic backgrounds on their educational aspirations by regressing students’ educational aspiration on their socioeconomic backgrounds under control of student achievement. Additionally, in further analyses, we expand our results by comparing students’ educational aspirations in Germany to countries with different tracking practices using data from the International Computer and Information Literacy Study (IEA-ICILS 2018), i.e., after the de-tracking reforms in Germany. Ergebnisse: Our results suggest that students' educational aspirations have increased in the course of the de-tracking reforms, but that socioeconomic disparities in students' educational aspirations, i.e., the relationship between students' educational aspirations and their socioeconomic backgrounds, have increased rather than weakened. One reason for this could be the cost-benefit calculations (Breen & Goldthorpe, 1997) respective the subjective value (Wigfield & Eccles, 2000) regarding the school-leaving qualification, which might lead to different evaluations of the opportunities and benefits that reformed comprehensive schools might offer, depending on students’ socioeconomic backgrounds. In this context, Bittmann and Schindler (2021) observed risk-averse, downward adjustments of educational aspirations among non-academic track students from socioeconomically disadvantaged backgrounds. The study contributes to the ongoing discussion on how structural features of the educational system such as tracking practices affect socioeconomic disparities in educational outcomes (cf. Maaz et al., 2008; Terrin & Triventi, 2023). Paper Session Die Rolle schulkompositioneller Merkmale für die Entwicklung beruflicher Aspirationen am Gymnasium Victoria Zeddies¹, Annabell Daniel^2,1 ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation; ²Ludwig-Maximilians-Universität München Berufliche Aspirationen gelten als zentraler Prädiktor für den späteren Bildungs- und Berufserfolg und regulieren zu einem bedeutsamen Teil die Berufswahl sowie das Übergangsverhalten von der Schule in den Beruf (Ashby & Schoon, 2010). Übereinstimmend mit etablierten Berufswahltheorien (Gottfredson, 1981; Super, 1980) verweisen empirische Befunde auf altersabhängige Veränderungen und individuelle Unterschiede in der Entwicklung der beruflichen Aspirationen im Jugendalter, welche insbesondere auf individuelle Merkmale wie das Geschlecht oder die soziale Herkunft zurückgeführt werden (z.B. Gao & Eccles, 2020; Miyamoto & Wicht, 2020). Jüngste Untersuchungen unterstreichen jedoch theoriekonform auch die Relevanz des schulischen Kontextes: Dabei zeigt sich, dass Schüler:innen am Gymnasium ihre Aspirationen über die Zeit häufiger nach unten korrigieren als Schüler:innen nicht-gymnasialer Schulformen (Basler & Kriesi, 2019; Zeddies et al., submitted). Über diese vorerst deskriptive Befundlage hinausgehend bleibt aber bisher unklar, weshalb sich die Aspirationen in einem Entwicklungskontext, der einen Schulabschluss verleiht, mit dem den Schüler:innen theoretisch alle beruflichen Möglichkeiten offen stehen, ungünstiger entwickeln. Neben den (nach-)schulischen Opportunitäten gelten die unterschiedlichen Schulformen des gegliederten deutschen Sekundarschulsystems auch aufgrund der leistungsbezogenen und sozialen Segregation als differenzielle Entwicklungsmilieus (Baumert et al., 2006). Das Gymnasium wird aufgrund seiner Zusammensetzung dabei häufig als besonders homogene und unterstützende Umgebung hervorgehoben (Maaz & Dumont, 2019). Entsprechend der prominenten Befunde zum Big-Fish-Little-Pond-Effekt (Marsh, 1987) zeigt sich jedoch, dass sich ein positiv selektiertes Umfeld wie am Gymnasium aufgrund sozialer Aufwärtsvergleiche ungünstig auf die individuelle Entwicklung auswirken kann. Dies wurde insbesondere für motivationale Merkmale vielfach nachgewiesen, welche sich in leistungsstarken Kontexten vermehrt negativ entwickeln. Auch erste Untersuchungen zum Einfluss des Kontextes auf Berufsaspirationen zeigten, dass der Besuch des Gymnasiums positiv mit der Formation der Berufsaspiration zusammenhängt und die Schüler:innen im Mittel überdurchschnittliche bzw. statushöhere Berufswünsche aufwiesen (z.B. Berger, 2020), während eine leistungsstarke Komposition negativ mit der individuellen Berufsaspiration assoziiert ist (z.B. Nagengast & Marsh, 2012). Auswirkungen der Komposition auf die längsschnittliche Entwicklung der Aspirationen blieben bisher jedoch unberücksichtigt. Ziel der vorliegenden Studie ist es daher, anhand von Längsschnittdaten zu untersuchen, ob und inwieweit sich eine negative Entwicklung der Berufsaspiration am Gymnasium über die leistungsbezogene und soziale Komposition erklären lässt. Basierend auf bisherigen Erkenntnissen wird angenommen, dass sich neben individuellen auch kompositionelle Effekte der leistungsstarken und sozial privilegierten Zusammensetzung am Gymnasium auf die Entwicklung von Berufsaspirationen zeigen, wonach Schüler:innen durch soziale Vergleichsprozesse ihre anfänglich hohen Aspirationen nach unten korrigieren. Als Datengrundlage dient die Startkohorte 3 des Nationalen Bildungspanels (NEPS; Blossfeld & Roßbach, 2019). Die Längsschnittstichprobe umfasst N = 1.840 Sekundarschüler:innen von Klassenstufe 8 bis 10 an 98 Gymnasien. Zur Analyse bzw. Vorhersage des Absinkens der Berufsaspirationen werden logistische Mehrebenenmodelle in Mplus geschätzt. Als Prädiktoren werden die Leistungen, der sozioökonomische Status sowie die Berufsaspirationen auf Individual- und auf Schulebene berücksichtigt und sukzessive in das Modell aufgenommen. Erste Ergebnisse zeigen, dass etwa 41% der Schüler:innen ihre Aspirationen im Laufe der Sekundarschulzeit nach unten korrigieren. Insbesondere Jungen tendieren eher dazu, von ihren anfänglich hohen Aspirationen wieder abzukommen, während Schüler:innen aus sozial privilegierteren Familien und mit höheren Leistungen eine geringere Wahrscheinlichkeit für einen Abwärtstrend aufweisen. Darüber hinaus deutet sich an, dass auch unter Kontrolle der Individualmerkmale die soziale und leistungsbezogene Komposition ein Absinken der Aspirationen zu begünstigen scheint, während die mittlere Aspiration die Wahrscheinlichkeit des Absinkens reduziert. Es zeigen sich demnach Hinweise darauf, dass kompositionelle Merkmale an Gymnasien sowohl über Assimilations- als auch Kontrasteffekte mit der Entwicklung der Aspirationen im Zusammenhang stehen. Vertiefende Implikationen werden im Vortrag diskutiert. Paper Session Vertikale und horizontale Bildungsunterschiede in der politischen Partizipation: Eine empirische Analyse unter Berücksichtigung heterogener Differenzierungsprozesse Julia Mayr Leibniz-Institut für Bildungsverläufe, Deutschland Das Thema der politischen Ungleichheit ist in den letzten Jahren zunehmend in den Fokus gerückt. Hierbei wird vornehmlich auf die ungleichmäßige Verteilung politischer Partizipation sowie Repräsentation verwiesen. So deuten aktuelle Befunde auf das Bestehen systematischer Differenzen in der politischen Teilhabe in Deutschland (WESSELS 2021). Dabei erscheint das gemeinsame Aushandeln der politischen Realität wichtiger denn je. Zumal die moderne Demokratie auf eine interessierte, aufgeklärte Zivilgesellschaft angewiesen ist, deren breite Beteiligung fundamental zur Stabilisierung des demokratischen Systems beiträgt (VAN DETH & ELFF 2004; HADJAR & BECKER 2006). Die bestehenden Disparitäten können unter anderem damit in Verbindung gebracht werden, dass politische Partizipation voraussetzungsvoll und – gemäß dem civic voluntarism model – von Ressourcen, wie beispielsweise (Partizipations-)Kompetenzen, abhängig ist (VERBA ET AL. 1995). Dahingehend erscheint Bildung von zentraler Bedeutung (NIE ET AL. 1996). So kann laut der Humankapitaltheorie während des Bildungsweges Humankapital in Form von Wissen bzw. Fähigkeiten angehäuft werden (BECKER 1993; MINCER 1974; SCHULTZ 1961). Dem ability-motivation-opportunity triad model entsprechend ist die Grundvoraussetzung politischer Wissensvermittlung im Zusammenspiel aus Fähigkeiten, einer motivationalen Grundlage sowie einer sich ergebenden (Lern-)Gelegenheit zu sehen (DELLI CARPINI & KEETER 1996). Im weiteren Lebensverlauf können sich jene akkumulierten Ressourcen wiederum als nützlich erweisen (BECKER 1993; MINCER 1974; SCHULTZ 1961; KEELEY 2007). So wird der formalen Bildung nicht nur eine positive Einflussnahme auf das Einkommen (als monetäre Bildungsrendite) sondern auch auf weitere Aspekte wie Gesundheit oder Lebenszufriedenheit (als nicht-monetäre Bildungsrenditen) bescheinigt (GROSS ET AL. 2011; HECKMAN ET AL. 2018). Daher untersucht dieser Beitrag, ob sich jene Bildungseffekte auch hinsichtlich politischer Partizipation beobachten lassen. Im Zentrum der Studie steht sonach die Frage, welcher Zusammenhang zwischen Bildung und verschiedenen politischen Partizipationsformen in der adulten Lebensverlaufsphase besteht und wie sich dieser erklären lässt. Ziel ist es, ein tiefergehendes Verständnis des bildungsinduzierten Einflusses auf (a) Wahlbeteiligung, (b) elitengesteuerte und (c) elitenherausfordernde Partizipationsformen zu gewinnen. Im Sinne des soziostrukturellen Ansatzes wird überdies ein Augenmerk auf formale Bildungsabschlüsse – spezifisch auf die vertikale sowie horizontale Bildungsdifferenzierung – gerichtet (KOGAN 2008; HELSPER ET AL. 2019). Um die Forschung dahingehend zu ergänzen, wurde der Einfluss des Bildungslevels sowie des Bildungstypus’ analysiert und bezüglich der (curriculumsbedingt) variierenden Intensität politischer Bildung diskutiert. Aufgrund der geringen Anzahl an Literatur, die sich insgesamt sowie für den deutschen Untersuchungsraum differenziert mit politischer Partizipation befasst sowie ambivalenter, wegen des kulturellen und institutionellen Kontextes kaum übertragbarer internationaler Befunde, ergeben sich insbesondere für Deutschland große Forschungsdesiderate (BÖMMEL & HEINECK 2020). Da die aufgeworfene Fragestellung allerdings auch im globalen Kontext noch nicht hinreichend beantwortet wurde, wird dahingehend ebenfalls ein signifikanter internationaler Forschungsbeitrag erwartet. Basierend auf Längsschnittdaten der Erwachsenenkohorte des Nationalen Bildungspanels (NEPS) wurden detaillierte Analysen des kumulierten Querschnitts umgesetzt. Dazu wurden multiple logistische Regressionsmodelle berechnet. Um beim stufenweisen Modellaufbau Verzerrungen aufgrund unkorrelierter unbeobachteter Heterogenität zu vermeiden, wurden zusätzlich AMEs geschätzt (WOLF & BEST 2010). Eine bestmögliche Approximation des kausalen Effekts erfolgte – der Logik der modernen Kausalanalyse folgend – mittels Identifikation sowie statistischer Berücksichtigung von Selektionseffekten. Die Ergebnisse zeigen, dass der Bildungseffekt zum einen je nach Partizipationsform differiert und zum anderen, dass neben dem Bildungslevel auch der Bildungstypus entscheidenden Einfluss nimmt. So sind die Effekte des Bildungslevels auf die Wahlbeteiligung statistisch signifikant und stärker als auf andere Partizipationsformen. Bei der elitengesteuerten Partizipation ließen sich mitunter statistisch insignifikante, negative Bildungseffekte beobachten. Hinsichtlich des Bildungstypus’ zeigt sich, dass die allgemeine – im Vergleich zur beruflichen – Bildung durchweg einen positiven, statistisch signifikanten Einfluss auf das Partizipationsniveau hat. Somit ließ sich die Mannigfaltigkeit politischer Beteiligung unter zeitgleicher Berücksichtigung der Bildungsheterogenität eindrucksvoll aufzeigen. Dies hebt erneut die Bedeutsamkeit solch einer differenzierten Betrachtung hervor, deren Resultate als inhaltliche Grundlage einen Beitrag zur gezielten Verabschiedung von Maßnahmen zur Förderung der politischen Gleichstellung leisten können.
13:10 - 14:50	2-20: Digitale Kompetenzen I Ort: S24
	Paper Session Entwicklung eines Tests der digitalen und datenbezogenen Kompetenzen der deutschen Bevölkerung – Rahmenkonzeption und erste Daten zu psychometrischen Eigenschaften der Items Cornelia Schoor, Kathrin Lockl, Jutta von Maurice, Ilka Wolter, Cordula Artelt Leibniz-Institut für Bildungsverläufe, Deutschland Vor dem Hintergrund der digitalen Transformation sowie der Datafizierung unserer Gesellschaft wird die Fähigkeit eines Menschen, mit digitalen Daten und Informationen sachgerecht umzugehen („Data Literacy“), immer wichtiger. Gleichzeitig liegt kein standardisierter Test zur Erfassung dieser Fähigkeit vor, der für die allgemeine Bevölkerung geeignet ist. Die Entwicklung eines solchen Tests ist ein Teilziel unseres BMBF-geförderten Projekts. Im vorliegenden Beitrag sollen die Rahmenkonzeption sowie erste Daten zu psychometrischen Eigenschaften des entwickelten Itempools vorgestellt werden. Data Literacy wird in der Literatur unterschiedlich konzeptualisiert (Schüller & Busch, 2019). Auch die Abgrenzung zu anderen Konstrukten wie beispielsweise Information Literacy (z.B. Eickelmann et al., 2019), Statistical Literacy (z.B. Ridgway et al., 2018) oder Digital Literacy (z.B. Carretero et al., 2017) ist oft nicht eindeutig. Im DigComp Framework (z.B. Carretero et al., 2017) beispielsweise wird Data Literacy als Teilkompetenz digitaler Kompetenzen verstanden und mit Information Literacy kombiniert. Dementsprechend geht es hierbei u.a. um das Auffinden, Evaluieren und Managen von Informationen, Daten und digitalem Inhalt. Schüller et al. (2019) identifizierten sechs Kompetenzfelder, die aus dem Prozess der Datenwertschöpfung abgeleitet sind: Datenkultur etablieren, Daten bereitstellen, Daten auswerten, Ergebnisse interpretieren, Daten interpretieren, Handeln ableiten. Das Framework von Schüller et al. (2019) ist für die Hochschulbildung gedacht; dementsprechend fokussiert es auf Kompetenzen, die Studierende im Rahmen ihres Studiums erwerben sollten, und damit auf Kompetenzen, die teilweise als Spezialwissen und nicht notwendig für die gesamte Bevölkerung zu bezeichnen sind (z.B. konkrete Analysemethoden). Ziel unserer Rahmenkonzeption ist es, digitale und datenbezogene Kompetenzen zu erfassen, die für den Alltag und die Teilhabe an der Gesellschaft nötig sind. Spezial- oder Expert:innenwissen ist daher nicht Teil der Rahmenkonzeption. Analog zu Schüller et al. (2019) orientieren wir uns am Lebenszyklus von Daten. Nach unserem Verständnis umfasst Data Literacy a) Datenentstehung (mit den Teilbereichen Anwendbarkeit von Daten und Hypothesengenerierung, [wissenschaftliche] Datengenerierung, Datenschutz und -sicherheit, Algorithmen als Informationsfilter), b) Datenverarbeitung und -auswertung (Datenaufbereitung, Datenauswertung), c) Datenvisualisierung und -verbalisierung (Visualisierung von Daten, Verbalisierung von Daten) und d) Dateninterpretation und -kommunikation (Interpretation von Daten und Datenanalysen, Kommunikation von Daten und Datenanalysen). Basierend auf dieser Konzeption wurden 157 Items mit geschlossenem Antwortformat (Single-Choice, Verifikationsaufgaben, Drag & Drop) entwickelt und im Rahmen einer Pilotstudie einer Ad-hoc-Stichprobe von 208 Personen im Alter von 16-69 Jahren vorgelegt. Die Teilnehmenden (40,4% männlich, 55,8% weiblich, 1,9% divers) waren im Mittel 33,2 Jahre alt (SD=14,89). Es handelte sich um eine vergleichsweise gut ausgebildete Stichprobe: Der überwiegende Teil dieser Stichprobe besaß die Allgemeine Hochschulreife (74,0%). Knapp die Hälfte der Teilnehmenden befand sich im Studium (49,5%), 30,3% waren erwerbstätig oder nebenerwerbstätig. Die Teilnehmenden bearbeiteten in einem Balanced Incomplete Block Design vier von acht Itemblöcken à etwa 20 Items. Zusätzlich wurde die Reihenfolge der Items innerhalb eines Blocks (vorwärts/rückwärts) ausbalanciert. Die Items wurden computerbasiert vorgegeben; für die Bearbeitung jedes Itemblocks hatten die Teilnehmenden 20 Minuten Zeit. Neben soziodemografischen Variablen wurden weitere Begleitskalen erfasst, die für die vorliegende Analyse nicht relevant sind (z.B. Einstellungen). Insgesamt dauerte die Erhebung für die Teilnehmenden etwa 2 Stunden. Die entwickelten Items waren für die Stichprobe vergleichsweise leicht. Im Mittel erreichten die Teilnehmenden 82% der möglichen Punktzahl (Range: 25%-100%). Die Items wurden zunächst einer Rasch-Skalierung unterzogen. (Teil-)Items mit 100% Lösungswahrscheinlichkeit, Items mit einer punktbiserialen Korrelation (mit dem Gesamtscore) von < .15, Items mit Distraktorkorrelationen von > .05 sowie Items, deren Infit- oder Outfit-Werte gängige Schwellenwerte über- bzw. unterschritten, wurden ausgeschlossen. Die resultierenden 136 Items wurden einer Partial-Credit-Skalierung unterzogen. Diese Itemauswahl hat eine WLE-Reliabilität von .91 und deckt weiterhin die zugrundeliegende Rahmenkonzeption ab. Erste Dimensionsanalysen mit allen Items (vor Ausschluss von Items) deuten auf Mehrdimensionalität entsprechend der Bereiche der Rahmenkonzeption hin. Im Beitrag werden zudem Dimensionsanalysen des ausgewählten Itempools sowie Analysen zum Differential Item Functioning (Geschlecht, Studierende/Nicht-Studierende) vorgestellt. Paper Session Digital natives = digitale Experten? Entwicklung eines neuen Instruments zur Messung der digitalen Kompetenz von NEPS SC8 Sekundarschülern Sümeyra Tural, Mariann Schwaß, Kathrin Lockl Leibniz Institut für Bildungsverläufe, Deutschland Mit der Digitalisierung der modernen Gesellschaft hat die Kompetenz im Umgang mit Informations- und Kommunikationstechnologien (ICT) zunehmend an Bedeutung gewonnen. Jüngere Generationen, die von klein auf in einer immer stärker digitalisierten Welt aufwachsen und sich fast zwangsläufig mit den Technologien und Geräten dieser neuen Umgebung vertraut machen, werden als "Digital Natives" (Prensky, 2001), "Generation Internet" oder "whiz-kids" (Lee & Chae, 2007) bezeichnet. Oft werden diese Begriffe verwendet, um ein gewisses Maß an Kompetenz im Umgang mit dem Internet und den Online-Medien zu implizieren, von dem man annimmt, dass es durch häufige Nutzung automatisch erworben wird. Andererseits weisen viele anekdotische und wissenschaftliche Belege darauf hin, dass die vielfältigen Informationen der modernen Medien und des Internets für heranwachsende Kinder und Jugendliche durchaus eine Herausforderung darstellen können. "They are not only called ‘whiz-kids’ […] but also ‘risk-kids’", konstatieren Valcke et al. (2010) und betonen, wie wichtig es ist, Kindern einen kritischen und reflektierten Umgang zu vermitteln. Um den Aspekt der kritischen Reflexion und sozialen Kommunikation im Internet zu erfassen, wurde für die Startkohorte 8 des Nationalen Bildungspanels (NEPS) ein neuer Test zur Messung der "digitalen Kompetenz" entwickelt. Der Test zielt darauf ab, das Wissen und die Fähigkeiten abzubilden, die notwendig sind, um mit den Möglichkeiten, aber auch den Risiken und Folgen der allgegenwärtigen Zugänglichkeit des Internets verantwortungsvoll umzugehen und nicht nur die Inhalte digitaler Medien zu reflektieren, sondern auch deren Wirkungsweisen zu erkennen. Damit ergänzt der neu entwickelte Test den im NEPS bereits etablierten Aspekt des Umgangs mit Technologien und Programmen, der durch die Kompetenzdomäne "ICT" repräsentiert wird. Bislang konzentrieren sich die meisten Konzepte, die Aspekte der digitalen Kompetenz beinhalten, auf das späte Jugend- und Erwachsenenalter (z. B. Digital Competence Assessment, 2009; Digital Competency Wheel, 2016; DigiComp 2.1, 2017). Wenn Schülerinnen und Schüler untersucht werden, beginnt dies in der Regel in Klasse 8 (ICILS, 2018). Während einige Aspekte dieser Rahmenkonzepte angewendet werden können, wurden andere Anforderungen als ungeeignet für die Zielgruppe der Sechstklässler erachtet. In einer Synthese und Erweiterung früherer Forschungen wurden vier Hauptfacetten mit mehreren Subfacetten für den digitalen Kompetenztest des NEPS definiert: (1) Bewertung von Informationen, die sich aus Quellenbewertung und Informationsfiltern zusammensetzt; (2) Erkennung von Absichten und Strategien mit den Teilbereichen Identifikation kommerzieller Absichten sowie Meinungsbildung in sozialen Medien; (3) Kommunikation und Interaktion, die durch das Bewusstsein für die sozialen Folgen der Interaktion und Kommunikation im Internet beschrieben wird; und schließlich (4) Datensouveränität, die sich in den Umgang mit eigenen Daten und den Umgang mit fremden Daten und geistigem Eigentum unterteilt. Die auf Basis dieser Rahmenkonzeption entwickelten Items zur Messung der digitalen Kompetenz wurden zunächst in einer Pilotstudie eingesetzt (Feldzeit November 2022 bis Februar 2023), um sie für die Erhebungen im Rahmen der Startkohorte 8 des NEPS zu erproben. Die Daten wurden in 20 Regelschulen und zwei Schulen für Kinder mit Lernschwierigkeiten in den Klassen 6 (N = 705) bzw. 8 (N = 468) erhoben. In der Pilotstudie wurde ein Pool von 60 Items mit vier verschiedenen Aufgabenformaten und realistischen Szenarien für die Altersgruppen getestet. Diese 60 Items wurden in drei Blöcke mit jeweils 20 Items unterteilt und in einem Rotationsdesign eingesetzt, sodass sowohl die Blöcke als auch die einzelnen Items innerhalb eines Blockes rotiert wurden. Ziel dieser Präsentation ist es, die Rahmenkonzeption für diesen neuen Testbereich vorzustellen und einen Einblick in die Qualität und Dimensionalität des Tests zu geben. Die Datenauswertung erfolgte mithilfe der Item-Response-Theorie. Erste Ergebnisse der Pilotstudie zeigen, dass die Items für die Schülerinnen und Schüler insgesamt eher einfach waren (mittlere Schwierigkeit = -0,49). Weiterhin stellte sich heraus, dass NEPS-Digitale Kompetenz reliabel erfasst werden kann (EAP-Reliabilität = 0,88) und sich als ein eindimensionales Konstrukt modellieren lässt. Paper Session Was wissen Studierende über Künstliche Intelligenz? Entwicklung und Validierung eines Tests zur Messung von AI Literacy Marie Hornberger, Arne Bewersdorff, Claudia Nerdel Technische Universität München Neue KI-Tools wie ChatGPT zeigen die disruptive Kraft von Künstlicher Intelligenz (KI) in vielen Bereichen unseres Lebens, unter anderem auch im Bildungssystem (Kasneci et al., 2023). Um mit den mit KI verbundenen Chancen und Herausforderungen umzugehen, benötigen Studierende ein grundlegendes Verständnis von KI und die Fähigkeit, KI-Tools zu nutzen und kritisch zu bewerten (Ng et al., 2021; Southworth et al., 2023). Diese Fähigkeiten werden häufig als AI Literacy bezeichnet (Long & Magerko, 2020; Ng et al., 2021). Um effektive Studienprogramme zu entwickeln, die AI Literacy bei Studierenden fördern, ist es notwendig, den aktuellen Stand der AI Literacy von Studierenden zu ermitteln. Zwar gibt es bereits einige AI Literacy Tests (z.B. Laupichler et al., 2023; Kong et al., 2022; Wang et al., 2022), aber viele Instrumente konzentrieren sich auf spezifische KI-Kurse, beruhen hauptsächlich auf Selbsteinschätzung oder liefern keine detaillierten psychometrischen Informationen. Das Ziel dieser Studie war es, einen AI Literacy Test zu entwickeln und zu validieren und erste Erkenntnisse über das Vorwissen von Studierenden unterschiedlicher Fächer in Deutschland zu gewinnen. In einem mehrstufigen Prozess wurden Multiple-Choice-Items zu den Kompetenzen von Long und Magerko (2020) generiert (z.B. „Distinguish between technological artefacts that use and do not use AI.”). Nach einer fachlichen Prüfung durch drei Expert:innen und einer Überprüfung der Verständlichkeit durch qualitative Interviews mit fünf Studierenden wurde eine Pilotstudie mit 24 Teilnehmer:innen durchgeführt. Die Items wurden nach jedem Schritt neu überarbeitet. Die finale Testversion wurde mithilfe einer deskripivstatistischen Itemanalyse (Itemschwierigkeit und -trennschärfe) aus der Pilotstudie zusammengestellt. Das finale Testinstrument für die Haupterhebung umfasste 30 Multiple-Choice-Aufgaben und eine Sortieraufgabe. Für die Haupterhebung wurde eine Stichprobe von N = 1286 Studierenden (58.32% männlich, 38.65% weiblich, Alter: M = 23.62, SD = 4.47) an sechs Hochschulen in Süddeutschland rekrutiert, um die Reliabilität und Validität des Tests zu überprüfen und Aussagen über den Stand der AI Literacy treffen zu können. Die Daten wurden nach der Item-Response-Theorie ausgewertet. Nach einem Vergleich von drei IRT-Modellen wurde ein 3PL-Modell als das beste Modell identifiziert. Nach Ausschluss eines Items mit geringer Trennschärfe wurden auf dieser Grundlage Personenfähigkeiten geschätzt. Die EAP-Reliabilität beträgt r = .85 (vgl. Interne Konsistenz: α = .82). Zur Überprüfung der Validität wurde gezeigt, dass AI Literacy mit theoretisch verwandten Konstrukten wie z.B. Selbstwirksamkeit, Interesse an KI und Einstellung zu KI korreliert. Außerdem wurde gezeigt, dass der Test in der Lage ist, zwischen Studierenden mit wenig und viel Erfahrung im Bereich KI (z.B. im Studium) zu differenzieren. Die Ergebnisse zeigen, dass die AI Literacy von Studierenden stark variiert, wobei die meisten Studierenden ein basales Verständnis von KI aufweisen. Die AI Literacy ist bei Studierenden mit einem technischen Studienhintergrund oder Vorerfahrungen mit KI höher. Die Ergebnisse deuten darauf hin, dass ein Bedarf an effektiven KI-Kursen für ein breiteres Publikum von Studierenden besteht. Der Test eignet sich für die Nutzung im Hochschulkontext, z.B. für Screening-Surveys, zur Überprüfung von Zugangsvoraussetzungen, oder zur Evaluation von Lehrveranstaltungen. Paper Session Förderung von digitalen Kompetenzen im Berufsschulunterricht – Eine motivationspsychologische Perspektive Tim Komorowski, Meike Weiland, Daniel Dr. König, Lilli Heimes, Thomai Svenja Gruber, Michael Prof. Dr. Heister Bundesinstitut für Berufsbildung (BIBB) *Einleitung* Digitale Technologien sind aus der Lebenswirklichkeit vieler Menschen nicht mehr wegzudenken (KMK, 2021b). Die Förderung digitaler Kompetenzen ist daher ein wichtiger Schlüssel, um den Anforderungen einer digitalisierten und vernetzten Arbeits- und Lebenswelt gerecht zu werden (vgl. Helmrich et al., 2016) und gesellschaftliche sowie berufliche Teilhabe zu ermöglichen. Insbesondere in der Berufsschule gewinnt die Förderung digitaler Kompetenzen an Bedeutung. Die Berufsschule ist neben dem Ausbildungsbetrieb in der dualen Berufsausbildung der zentrale Ort für die Förderung digitaler Kompetenzen (KMK, 2021a). Eine Voraussetzung für den Erwerb von digitalen Kompetenzen ist die Motivation von Schülerinnen und Schülern, sich mit digitalen Technologien (z.B. Learning Management Systemen, Lernanwendungen, etc.) zu beschäftigen. In diesem Beitrag untersuchen wir daher unterschiedliche Motivationsformen von Schülerinnen und Schülern im Zusammenhang mit der Nutzung von digitalen Technologien am Lernort Berufsschule. *Theorie* Als theoretischen Rahmen verwenden wir die Selbstbestimmungstheorie (Self-Determination-Theory, SDT; Deci & Ryan, 2008). Bei der SDT handelt es sich um eine Theorie menschlichen Verhaltens und persönlicher Entwicklung (Ryan & Deci, 2017). In der SDT werden verschiedene Formen der Motivation unterschieden. Dabei werden autonom regulierte Motivationsformen („autonomous motivation“) wie die intrinsische Motivation von extrinsisch regulierten Motivationsformen („controlled motivation“) abgegrenzt und entlang eines Autonomiekontinuums („relative autonomy continuum“) angeordnet (Deci & Ryan, 2008; Ryan, 2023). Ein großer Teil der empirischen Forschung, die auf der SDT basiert, konzentriert sich auf die Untersuchung von Faktoren, die das Erleben von Freiwilligkeit und Eigeninitiative unterstützen oder erschweren (Ryan & Deci, 2017). Die SDT wurde in Studien in verschiedenen Lebensbereichen eingesetzt, z. B. in der Schule (vgl. Metaanalyse von Bureau et al., 2022), in der Erwerbsarbeit (Güntert, 2015) und bei der Gestaltung digitaler Technologien (Chiu, 2021). SDT-basierte Studien legen nahe, dass Schülerinnen und Schüler, die autonom-reguliert handeln bzw. selbstbestimmt motiviert sind, über ein höheres Wohlbefinden berichten, über mehr Ausdauer verfügen und schulisch erfolgreicher sind (Bureau et al., 2022). *Fragestellung* Unter Rückgriff auf die SDT stellen wir für diesen Beitrag folgende Forschungsfrage: Was motiviert Schülerinnen und Schüler beim Einsatz von digitalen Technologien in der Berufsschule? *Methode* Zur Erhebung von qualitativen und quantitativen Befragungsdaten führen wir sowohl (1) Gruppendiskussionen mit Berufsschullehrkräften als auch (2) eine Befragung von Berufsschülerinnen und -schülern in dualen Berufsausbildungen mit einem Online-Fragebogen durch. Gruppendiskussionen. Die Gruppendiskussionen (Przyborski & Wohlrab-Sahr, 2021) wurden im zweiten Quartal 2023 mit Hamburger Berufsschullehrkräften in Präsenz durchgeführt und per Tonaufnahme dokumentiert. Die Auswertung der Transkripte folgt der inhaltlich-strukturierenden qualitativen Inhaltsanalyse in Anlehnung an Kuckartz und Rädiker (2022). Online-Befragung. Mit dem Online-Fragebogen befragen wir etwa 6.000 Schülerinnen und Schüler an Berufsschulen in Hamburg, die eine duale Berufsausbildung absolvieren. Die Feldphase ist für den Winter 2023/2024 geplant. Der Online-Fragebogen umfasst standardisierte Skalen zur Erfassung der selbsteingeschätzten digitalen Kompetenzen der Befragten und ihrer Motivationen. Zur Erfassung der selbsteingeschätzten digitalen Kompetenzen werden Items der ICT Self-Concept Scale (ICT-SC25; Schauffel et al., 2021) verwendet. Die Motivationen für die Nutzung digitaler Technologien in der Berufsschule werden mit dem Autonomy and Competence in Technology Adoption Questionnaire (ACTA) (Peters et al., 2018) erhoben. *Ergebnisse* Die Gruppendiskussionen mit den Berufsschullehrkräften lassen erwarten, dass die in der SDT adressierten psychologischen Grundbedürfnisse nach Autonomie- und Kompetenzerleben sowie sozialer Eingebundenheit (Ryan & Deci, 2020) auch im Berufsschulunterricht zur Entwicklung digitaler Kompetenzen gefördert werden. Inwieweit die Einschätzungen der ausgewählten Berufsschullehrkräfte mit den Erfahrungen der Berufsschülerinnen und -schüler übereinstimmt, werden erste Auswertungen der Online-Befragung voraussichtlich im ersten Quartal 2024 zeigen. Diese Untersuchung ist Teil des Projektes „Kompetenzen für die digitale Arbeitswelt (KoDiA) – Ertüchtigung zur Digitalisierung“ (Laufzeit 2021-2024) (Kodia, 2023). Das Vorhaben wird durch dtec.bw – Zentrum für Digitalisierungs- und Technologieforschung der Bundeswehr gefördert. dtec.bw wird von der Europäischen Union – NextGenerationEU finanziert.
14:50 - 15:20	Kaffeepause Ort: Foyer Haus 6
15:20 - 17:00	3-01: Trendanalysen sprachlicher Kompetenzen auf Systemebene: Ergebnisse des IQB-Bildungstrends 2022 und weiterführende Analysen Ort: H05
	Eingeladenes Symposium Trendanalysen sprachlicher Kompetenzen auf Systemebene: Ergebnisse des IQB-Bildungstrends 2022 und weiterführende Analysen Chair(s): Stefan Schipolowski (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin), Rebecca Schneider (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin), Karoline A. Sachse (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin), Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin) Diskutant*in(nen): Miriam Vock (Universität Potsdam) Das Institut zur Qualitätsentwicklung im Bildungswesen (IQB) führt als wissenschaftliche Einrichtung der Länder regelmäßig Studien durch, um das Erreichen der in den Bildungsstandards der Kultusministerkonferenz (KMK) definierten Kompetenzziele zu überprüfen. Im IQB-Bildungstrend 2022 (Stanat et al., 2023) wurden die sprachlichen Kompetenzen von Neuntklässler:innen in den Fächern Deutsch und Englisch in der Sekundarstufe I nach den Jahren 2009 und 2015 im Jahr 2022 zum dritten Mal erfasst. Damit ist es erstmals möglich, für die genannten Fächer in der Sekundarstufe I Entwicklungstrends über drei Messzeitpunkte zu beschreiben. Im Rahmen des Symposiums werden zentrale Ergebnisse des IQB-Bildungstrends 2022 vorgestellt und durch vertiefende Analysen zu den erreichten Kompetenzen und motivationalen Merkmalen der Schüler:innen in der Sekundarstufe I ergänzt. Im ersten Beitrag wird der IQB-Bildungstrend 2022 als Teil des nationalen Bildungsmonitorings vorgestellt. Es werden die wichtigsten Ergebnisse der Studie zum Erreichen der Bildungsstandards und zu geschlechtsbezogenen, sozialen und zuwanderungsbezogenen Disparitäten im Jahr 2022 und im Trend präsentiert. Der zweite Beitrag richtet den Blick auf das Fach Englisch, in dem sich – anders als im Fach Deutsch – die von den Schüler:innen erreichten Kompetenzen positiv entwickelt haben. Vor diesem Hintergrund geht der Beitrag der Frage nach, welche Rolle die Englischnutzung der Schüler:innen in der Freizeit sowie ein früher Beginn des Englischunterrichts in der Grundschule für das im Jahr 2022 erreichte Kompetenzniveau im Lese- und Hörverstehen spielen. Neben den kognitiven Kompetenzen der Schüler:innen bilden motivationale Merkmale wichtige Aspekte des Bildungserfolgs. Im dritten Beitrag werden Analysen zu den fachbezogenen Selbstkonzepten und Interessen der Jugendlichen im Fach Deutsch dargestellt, wobei Unterschiede zwischen verschiedenen Teilpopulationen im Jahr 2022 und im Trend im Vordergrund stehen. Zudem wird der Frage nachgegangen, inwieweit die Trends in den motivationalen Merkmalen zwischen den Jahren 2015 und 2022 mit den erreichten Kompetenzen der Schüler:innen und der Zusammensetzung der Schüler:innenschaft zusammenhängen. Im vierten Beitrag werden Analysen zu Geschlechterunterschieden im Selbstkonzept und Interesse in den Fächern Deutsch und Mathematik im Jahr 2022 präsentiert. Im Fokus steht dabei die Frage, inwieweit das Design der Befragungsinstrumente (Reihenfolge der Fragen zu Geschlecht, Geschlechterstereotypen und motivationalen Merkmalen) die Angaben zum Selbstkonzept und zum Interesse beeinflusst. Beiträge des Symposiums Überblick zu den Hauptbefunden des IQB-Bildungstrends 2022 Petra Stanat, Stefan Schipolowski Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin Keywords: IQB-Bildungstrend, sprachliche Kompetenzen, Deutsch, Englisch, Disparitäten Die Bildungsstandards der Kultusministerkonferenz (KMK) für die sprachlichen Fächer Deutsch und Englisch in der Sekundarstufe I definieren, welche Kompetenzen Schüler:innen entwickelt haben sollen, wenn sie den Ersten Schulabschluss (ESA; KMK, 2005a, 2005b) beziehungsweise den Mittleren Schulabschluss (MSA; KMK, 2004a, 2004b) erwerben. Für die Fächer Deutsch und Englisch in der Sekundarstufe I fand die erste Studie zur Überprüfung des Erreichens der Bildungsstandards im Jahr 2009 statt (IQB-Ländervergleich 2009; Köller et al., 2010). Im IQB-Bildungstrend 2015 (Stanat et al., 2016) und im IQB-Bildungstrend 2022 (Stanat et al., 2023) wurden die Kompetenzen von Neuntklässler:innen in diesen Fächern zum zweiten bzw. dritten Mal untersucht. Neben den Kompetenztests umfassten die Erhebungen Befragungen der teilnehmenden Schüler:innen, ihrer Eltern, Lehrkräfte und Schulleitungen, um schulische und außerschulische Lernbedingungen zu erfassen. In diesem Beitrag wird zunächst dargestellt, wie die von Schüler:innen am Ende der Sekundarstufe I erreichten Kompetenzen im Jahr 2022 in den Fächern Deutsch (Lesen, Zuhören und Orthografie) und Englisch (Leseverstehen und Hörverstehen) ausgeprägt sind und wie sie sich zwischen den Jahren 2009, 2015 und 2022 verändert haben. Anschließend wird der Frage nachgegangen, inwieweit im Jahr 2022 geschlechtsbezogene, soziale und zuwanderungsbezogene Disparitäten bestehen und inwieweit Veränderungen in diesen Disparitäten festgestellt werden konnten. Die Ergebnisse des IQB-Bildungstrends 2022 zeigen nahezu spiegelbildliche Entwicklungen für die betrachteten Fächer: Während im Fach Deutsch in allen untersuchten Kompetenzbereichen in Deutschland insgesamt und in fast allen Ländern zwischen den Jahren 2015 und 2022 signifikante Kompetenzrückgänge zu verzeichnen sind, zeigen sich im Fach Englisch – wie bereits im Zeitraum 2009 bis 2015 – bundesweit positive Trends. Im Fach Deutsch sind die Anteile der Schüler:innen, die im Jahr 2022 die Mindeststandards verfehlen, besonders hoch. Den Mindeststandard für den MSA verfehlen rund 33 Prozent aller Neuntklässler:innen im Lesen, etwa 34 Prozent im Zuhören und rund 22 Prozent in der Orthografie. Im Fach Englisch fallen die Ergebnisse insgesamt günstiger aus. Hier verfehlen im Jahr 2022 im Leseverstehen knapp 24 Prozent und im Hörverstehen rund 14 Prozent aller Neuntklässler:innen den Mindeststandard für den MSA. Zudem erreicht im Fach Englisch ein relativ großer Anteil der Jugendlichen ein besonders hohes Kompetenzniveau (Optimalstandards), insbesondere an den Gymnasien. Auch im IQB-Bildungstrend 2022 zeigen sich wieder geschlechtsbezogene, soziale und zuwanderungsbezogene Disparitäten (Kompetenzvorteile für Mädchen, für Schüler:innen aus Haushalten mit höherem kulturellen Kapital und für Jugendliche ohne Zuwanderungshintergrund). Während die sozialen und zuwanderungsbezogenen Disparitäten in früheren Studien weitgehend stabil geblieben waren, haben sie sich zwischen den Jahren 2015 und 2022 bundesweit in fast allen untersuchten Kompetenzbereichen signifikant verstärkt. In der Gesamtschau weisen die Befunde erneut darauf hin, dass im Fach Deutsch der Fokus stärker auf die Sicherung der Mindeststandards gelegt werden sollte. Wichtig ist ferner, die sprachliche Förderung von Schüler:innen auf den Prüfstand zu stellen, die mit geringen Deutschkenntnissen ins deutsche Bildungssystem kommen, und zu fragen, wie diese weiter verbessert werden kann. Auch die Förderung des Interesses von Jugendlichen am Fach Deutsch, das sehr schwach ausgeprägt war und sich weiter reduziert hat, sollte in der Forschung und Praxis verstärkt in den Fokus genommen werden. Positive Trends im Fach Englisch: Welche Rolle spielen die Englischnutzung in der Freizeit und der Englischunterricht in der Grundschule? Stefan Schipolowski, Karoline A. Sachse Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin Keywords: Englisch als Fremdsprache, Leseverstehen, Hörverstehen, Freizeitverhalten Die Ergebnisse des nationalen Bildungsmonitorings zeigen, dass die Neuntklässler:innen in Deutschland seit Beginn der Messungen im Mittel immer höhere Kompetenzniveaus im englischsprachigen Lese- und Hörverstehen erreichen. So ist der Anteil der Jugendlichen, die den Mittleren Schulabschluss anstreben und im Hörverstehen im Fach Englisch den Optimalstandard für den MSA erreichen (GER-Niveau B2.2 oder höher) zwischen den Jahren 2009 und 2022 um 15 Prozentpunkte und im Leseverstehen sogar um fast 21 Prozentpunkte gestiegen (Niemietz et al., 2023). Als mögliche Erklärungen für diese positiven Entwicklungen, die in fast allen Ländern zu beobachten sind, nennen Stanat et al. (2023) zum einen eine intensivere Nutzung der englischen Sprache durch Kinder und Jugendliche in der Freizeit, vor allem im Zusammenhang mit der zunehmenden Verbreitung digitaler Medien, und zum anderen Weiterentwicklungen des Englischunterrichts, darunter die Etablierung frühen Englischunterrichts in der Grundschule (Porsch et al., 2023). Im IQB-Bildungstrend 2022 bearbeiteten mehr als 31.000 Neuntklässler:innen aus allen 16 Bundesländern Testaufgaben zu den Bildungsstandards im Lese- und Hörverstehen im Fach Englisch. Zudem wurden die Schüler:innen gefragt, in welchen Jahrgangsstufen sie in der Schule Englischunterricht erhalten haben und wie häufig sie die englische Sprache in der Freizeit nutzen. Dabei wurde sowohl die Verwendung von Englisch im Zusammenhang mit digitalen Medien (z. B. Filme und Serien auf Englisch schauen, englischsprachige Webseiten besuchen) als auch bei anderen Aktivitäten (z. B. Bücher auf Englisch lesen, außerhalb des Unterrichts mit anderen Englisch sprechen) berücksichtigt. Regressionsanalysen unter Berücksichtigung der komplexen Stichprobenstruktur zeigen für die Daten zum Jahr 2022 enge Zusammenhänge zwischen einem Gesamtwert, der die Häufigkeit der Nutzung der englischen Sprache in der Freizeit abbildet, und den Kompetenzschätzern (Plausible Values) zum englischsprachigen Leseverstehen (r = .50) und Hörverstehen (r = .54). Die Zusammenhänge bleiben auch bei statistischer Kontrolle der Schulart (Gymnasium versus andere Schulart) und wesentlicher soziodemografischer Hintergrundmerkmale (Geschlecht, Buchbesitz und sozioökonomischer Status der Familie, Häufigkeit der Nutzung der deutschen Sprache in der Familie) substanziell (r = .44 bzw. r = .50). Neben häufigerer Nutzung von Englisch in der Freizeit ist auch ein früher Beginn des Englischunterrichts in der Grundschule mit Kompetenzvorteilen in der 9. Jahrgangsstufe assoziiert. In einem Regressionsmodell mit drei Ebenen (Länder, Schulen, Schüler:innen) zeigt sich unter Kontrolle soziodemografischer Hintergrundmerkmale auf der Individualebene ein signifikanter Kompetenzvorsprung für Jugendliche, die bereits vor Klasse 3 in der Schule Englischunterricht erhalten haben (+26 bzw. +24 Punkte auf der Berichtsmetrik im Lese- bzw. Hörverstehen gegenüber Jugendlichen, die erst ab Klasse 4 oder später Englischunterricht erhalten haben). Insgesamt legen die Befunde nahe, dass sowohl die Englischnutzung in der Freizeit als auch die Etablierung frühen Englischunterrichts in der Grundschule für die langjährigen positiven Trends im Fach Englisch von Bedeutung sind. Die Effekte sind dabei auch dann substantiell, wenn beide Faktoren (Freizeitnutzung der englischen Sprache und früher Beginn des Englischunterrichts) gemeinsam sowie unter Berücksichtigung soziodemografischer Hintergrundmerkmale modelliert werden. Diese und weitere Ergebnisse werden im Vortrag präsentiert, diskutiert und hinsichtlich ihrer Relevanz für die Praxis eingeordnet. Kohortentrends in schulischer Motivation im Fach Deutsch: Zusammenhänge mit Veränderungen in den Leistungen und der Zusammensetzung der Schüler:innenschaft Rebecca Schneider, Sebastian Weirich Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin Keywords: Motivation, Selbstkonzept, Interesse, Schülermerkmale, schulische Leistung Motivationale Merkmale bilden neben kognitiven Fähigkeiten wichtige Aspekte des Bildungserfolgs und werden deshalb regelmäßig in Schulleistungsstudien untersucht. Für das Fach Deutsch weisen empirische Befunde des IQB-Bildungstrends 2022 in der Sekundarstufe I auf einen leichten Rückgang im Selbstkonzept und Interesse in Deutschland in den untersuchten Kohorten hin, also auf ungünstige Veränderungen in motivationalen Merkmalen im Zeitverlauf auf Populationsebene (-.29 ≤ d ≤ -.22; Schneider et al., 2023). Da fachbezogene Leistungen substantiell mit korrespondierenden Selbstkonzepten und Interessen zusammenhängen (z. B. Möller et al., 2020; Valentine et al., 2004) und auch für Leistungen im Fach Deutsch ungünstige Kohortenunterschiede für Neuntklässler:innen beobachtet wurden (Boemmel & Schneider, 2023), stellt sich die Frage, inwieweit sich die Veränderungen in den motivationalen Merkmalen auf die Veränderungen in den Leistungen zurückführen lassen. Ergebnisse für Mathematik und die naturwissenschaftlichen Fächer deuten jedoch darauf hin, dass sich Trends in der Motivation nicht bedeutsam auf Testleistungs- und Notenunterschiede zwischen Kohorten zurückführen lassen (Schneider, Gentrup et al., 2022). Daher soll in diesem Beitrag zusätzlich untersucht werden, inwieweit Veränderungen in der Zusammensetzung der Schüler:innenschaft mit Kohortentrends in der Motivation in Zusammenhang stehen. So berichten beispielsweise Schüler:innen mit Zuwanderungshintergrund in Deutschland teilweise geringere Selbstkonzepte im Fach Deutsch als Schüler:innen ohne Zuwanderungshintergrund (z. B. Shajek et al., 2006; siehe aber auch Schöber et al., 2015). Da sich in den betrachteten Zeiträumen der Anteil von Schüler:innen mit Zuwanderungshintergrund in der Gesamtpopulation erhöht hat (Henschel et al., 2023), könnte sich dies auch auf die Trends für die motivationalen Merkmale im Fach Deutsch ausgewirkt haben. In diesem Beitrag sollen deshalb zum einen Motivationstrends in verschiedenen Subpopulationen von Schüler:innen (z. B. nach Zuwanderungshintergrund) analysiert sowie zum anderen untersucht werden, ob die gefundenen Kohortentrends im Selbstkonzept und im Interesse im Fach Deutsch in der Gesamtpopulation auf Unterschiede in schulischen Leistungen zwischen Kohorten und/oder auf Veränderungen in der Zusammensetzung der Schüler:innenschaft zwischen den Erhebungszeitpunkten zurückgeführt werden können. Die Analysen basieren auf Daten der IQB-Bildungstrends 2015 und 2022 für jeweils über 30.000 Neuntklässler:innen. Das Selbstkonzept und Interesse der Schüler:innen im Fach Deutsch wurde zu den beiden Erhebungszeitpunkten mit den gleichen Items erhoben. Als Leistungsindikatoren wurden die Testleistungen der Schüler:innen in den Kompetenzbereichen Lesen, Zuhören und Orthografie sowie die Schulnote im Fach Deutsch herangezogen. Zudem wurden vier Merkmale der Schüler:innenschaft in die Analysen einbezogen, die nicht dem Einfluss des Schulsystems unterliegen: der Zuwanderungshintergrund der Schüler:innen, die zu Hause gesprochene Sprache, der Highest International Socio-Economic Index of Occupational Status (HISEI) als Indikator des sozioökonomischen Status sowie die Anzahl der Bücher zu Hause als Indikator für das kulturelle Kapital der Fami¬lie. Neben den Trendergebnissen für die anhand dieser Hintergrundmerkmale gebildeten Subgruppen von Schüler:innen werden die Ergebnisse adjustierter Trends berichtet. Diese schätzen, wie die Veränderungen in den beiden motivationalen Konstrukten im Fach Deutsch ausfallen würden, wenn die mittlere Ausprägung der Leistungen und der Merkmale der Schüler:innenschaft zwischen den Erhebungs¬zeitpunkten konstant geblieben wäre (vgl. z. B. Mayer et al., 2016). Die Analysen zeigen, dass sich die adjustierten Mittelwerte im Selbstkonzept und im Interesse unter Berücksichtigung sowohl der Leistungen als auch der untersuchten Populationsmerkmale zu den einzelnen Messzeitpunkten nur geringfügig von den nicht-adjustierten Mittelwerten unterscheiden. Entsprechend sind die Trends zwischen 2015 und 2022 in den beiden motivationalen Merkmalen auch nach der Adjustierung weiterhin signifikant negativ und fallen ähnlich groß aus wie die Trends ohne Adjustierung. Abschließend sollen u. a. Implikationen der Befunde für das Bildungssystem diskutiert werden. Auswirkungen von Priming des Geschlechts auf das berichtete fachspezifische Selbstkonzept und Interesse von Schüler:innen in geschlechterkonnotierten Schulfächern Annika Liebelt, Sarah Gentrup, Rebecca Schneider, Sofie Henschel Institut zur Qualitätsentwicklung im Bildungswesen (IQB) Keywords: Selbstkonzept, Interesse, Sekundarstufe, Priming, Geschlechterstereotype Mädchen und Jungen unterscheiden sich teilweise deutlich bezüglich ihrer fachspezifischen Selbstkonzepte und Interessen. So weisen Mädchen im Mittel ein positiveres Selbstkonzept und höheres Interesse in den Bereichen Lesen und Schreiben im Fach Deutsch auf als Jungen (z. B. Böhme et al., 2016; Diedrich et al., 2019; Schneider et al., 2022), wohingegen Jungen ein positiveres Selbstkonzept und höheres Interesse in Mathematik berichten (z. B. Else-Quest et al., 2010; Jansen et al., 2019; Schneider et al., 2022). Diese motivationalen Geschlechterdisparitäten spiegeln sich fachspezifisch in der Leistung der Schüler:innen wider, wobei der mathematische Leistungsvorsprung von Jungen deutlich kleiner ausfällt (z. B. Else-Quest et al., 2010; Schipolowski et al., 2019) als der sprachliche Vorsprung der Mädchen (z. B. Gentrup et al., 2022; Reilly et al., 2019). Als eine mögliche Erklärung für derartige Geschlechterdisparitäten werden Geschlechterstereotype und deren Auswirkungen diskutiert (Kessels & Heyder, 2010). Chalabaev et al. (2013) argumentieren, dass Stereotype auf verschiedenen Wegen einen Einfluss auf Personen ausüben können  zum einen durch die Verinnerlichung von Stereotypen, zum anderen durch deren situative Auswirkungen. Zu den situativen Konsequenzen von Stereotypen gehört das Phänomen des Stereotype Threat: Ist ein Stereotyp über eine Gruppe in der Gesellschaft verbreitet und werden Personen der entsprechenden Gruppe in einer Situation mit diesem konfrontiert, verhalten sie sich häufig dem Stereotyp entsprechend (Steele & Aronson, 1995). Die Forschung zu Stereotype Threat konzentriert sich im schulischen Kontext vor allem auf Leistungen von Schüler:innen. Es wurde gezeigt, dass sich durch Priming der weiblichen Identität oder vorherrschender Geschlechterstereotype die Leistung von Mädchen bzw. Frauen in Mathematiktests verschlechterte (z. B. Ambady et al., 2001; Franceschini et al., 2014). Ungeklärt ist, ob Stereotype situativ auch das fachspezifische Selbstkonzept und Interesse von Schüler:innen beeinflussen können. Auch im Schulkontext können Situationen wiederkehrend auftreten, in denen Geschlechterstereotype oder die Zugehörigkeit zu einem Geschlecht aktiviert werden. Dadurch könnte die Motivation der geschlechterstereotypisierten Gruppe beeinträchtigt werden, was wiederum negative Konsequenzen für die weitere Lernentwicklung haben kann. Im Beitrag wird deshalb anhand von Daten des IQB-Bildungstrends 2022 in der 9. Jahrgangsstufe untersucht, ob das Selbstkonzept und Interesse von Mädchen und Jungen in Deutsch und Mathematik in Abhängigkeit vom Priming der Geschlechterkategorie variiert. Um zu untersuchen, ob das Priming der Geschlechterkategorie einen Einfluss auf die Ausprägung der motivationalen Konstrukte hat, wurde in einem Teilsample von 2.489 Schüler:innen aus 142 Schulen in sechs Bundesländern ein Rotationsdesign realisiert. Die Schüler:innen wurden schulweise zufällig einer von drei Gruppen zugeordnet, in denen die Reihenfolge der gestellten Fragen zu Geschlecht, Geschlechterstereotypen, fachspezifischem Selbstkonzept und Interesse rotiert war. Dadurch ergibt sich eine Variation der Stärke des Primings. Während Schüler:innen der Rotation 1 ihr fachspezifisches Selbstkonzept und Interesse ohne vorheriges Priming einschätzten, wurde in Rotation 2 durch vorherige Abfrage ihres Geschlechts die Geschlechterkategorie aktiviert. In Rotation 3 wurden vor Beantwortung der motivationalen Items neben der Geschlechterkategorie zusätzlich auch Geschlechterstereotype bewusst gemacht. Alle Analysen werden fachspezifisch und unter Berücksichtigung der komplexen Datenstruktur durchgeführt. Zur Fragestellung nach den Primingeffekten sind noch keine Analysen erfolgt, da die Studie zunächst präregistriert werden soll. Zur Präsentation auf der GEBF werden die Ergebnisse vorliegen. Die im IQB-Bildungstrend 2022 gefundenen stabilen bzw. leicht ansteigenden Geschlechterdisparitäten verdeutlichen, dass weiterhin gezielte Anstrengungen zur Reduktion geschlechtsspezifischer Unterschiede im schulischen Kontext notwendig sind. Die Priming-Studie wird hierzu neue Erkenntnisse zum Einfluss von Geschlechterstereotypen in spezifischen Situationen liefern.
15:20 - 17:00	3-02: Studienabbruch im Lehramt: Was sind die Gründe und welche lehramtsspezifischen und studiengangsübergreifenden Maßnahmen zur Erhöhung des Studienerfolgs bieten sich an? Ort: H04
	Symposium Studienabbruch im Lehramt: Was sind die Gründe und welche lehramtsspezifischen und studiengangsübergreifenden Maßnahmen zur Erhöhung des Studienerfolgs bieten sich an? Chair(s): Andrea Westphal (Universität Greifswald, Deutschland) Diskutantin(nen): Eric Richter (Universität Potsdam) Der Bedarf an qualifizierten Lehrkräften in Deutschland ist derzeit auf einem Höchststand (Seeliger & Håkansson Lindqvist, 2023). Einige Hochschulstandorte haben bereits neue Lehramtsstudiengänge implementiert, um langfristig mehr Lehramtskandidatinnen ausbilden zu können (Informationsdienst Wissenschaft, 2020, 2023). Auch die Ständige Wissenschaftliche Kommission der Kultusministerkonferenz geht in ihren Empfehlungen zum Umgang mit dem akuten Lehrkräftemangel auf die Verbesserung der Studienerfolgsquoten ein (Köller et al., 2023). Denn Lehramtsstudierende, die ihr Studium abbrechen oder in einen anderen Studiengang wechseln, stellen angesichts des akuten Lehrkräftebedarfs einen großen gesellschaftlichen Verlust dar. Gleichzeitig ist beabsichtigt, dass Lehramtsstudierende im Verlauf ihres Studiums, insbesondere in den schulischen Praxisphasen, ihre Eignung für den Lehrberuf überprüfen (Porsch, 2019). Auf individueller Ebene kann der Abbruch des Lehramtsstudiums somit auch eine Chance für die Studierenden darstellen, sich für einen Beruf zu entscheiden, der besser zu ihnen passt. Die Gründe, aus denen Lehramtsstudierende ihr Studium abbrechen oder über einen Studienabbruch nachdenken, sowie die Karriereverläufe ehemaliger Lehramtsstudierender sollen im Rahmen des Symposiums beleuchtet werden. Auch die besonderen Herausforderungen internationaler Studierender und studiengangsübergreifende Hilfestellungen und Maßnahmen zu deren Betreuung werden im Symposium berücksichtigt. Denn die Internationalisierung der Studierendenschaft (Pineda & Rech, 2020) spiegelt sich auch in einer beachtlichen Anzahl internationaler Lehramtsstudierender an deutschen Hochschulen wider (Petzold, 2022). Mehr als 60 % der internationalen Studierenden planen, nach Abschluss ihres Studiums in Deutschland zu bleiben (Petzold, 2022), so dass auch aus dieser Gruppe qualifizierte Lehrkräfte für den Schuldienst in Deutschland gewonnen werden könnten. Das Symposium bündelt drei Beiträge, die unterschiedliche Perspektiven – die der Studierenden und die der Lehrenden – einnehmen und unterschiedliche Datengrundlagen und methodische Zugänge nutzen. Der erste Beitrag befasst sich mit den Karriereverläufen ehemaliger Lehramtsstudierender und geht der Frage nach, inwieweit diese Verläufe durch Unterschiede in den Wertüberzeugungen, den Erfolgserwartungen sowie der sozialen und akademischen Integration erklärt werden können. Es wird eine discrete time survival-Analyse basierend auf Daten zu Karriereverläufen von N = 5500 Lehramtsstudierenden aus dem Nationalen Bildungspanel durchgeführt, von denen 350 ihr Lehramtsstudium abgebrochen oder keinen Master of Education begonnen haben. Der zweite Beitrag beschäftigt sich mit der Frage, aus welchen Gründen Lehramtsstudierende einen Studienabbruch erwägen und untersucht, inwiefern sich Abbruchabsichten und Gründe für einen möglichen Studienabbruch zwischen Studierenden mit unterschiedlichen Kompetenzprofilen unterscheiden. Grundlage sind quantitative Daten zu professionellen Kompetenzen von N = 265 Lehramtsstudierenden an zwei Universitätsstandorten, die mittels latenter Profilanalysen ausgewertet wurden. Darüber hinaus wurden quantitative Daten zu Studienabbruchsintentionen und offene Antworten zu den Gründen eines möglichen Studienabbruchs mittels qualitativer Inhaltsanalyse deduktiv und induktiv kodiert und mit den Kompetenzprofilen der Lehramtsstudierenden in Zusammenhang gebracht. Der dritte Beitrag untersucht den Umgang von Lehrenden mit den spezifischen Problemlagen und Bedürfnissen internationaler Studierender. Dazu wurde auf Basis einer quantitativen Vorstudie eine Gruppendiskussion mit fünf Lehrenden durchgeführt und inhaltsanalytisch ausgewertet, um Hilfestellungen und Maßnahmen herauszuarbeiten, mit denen internationale Studierende studiengangsübergreifend optimal unterstützt werden können. Die Implikationen dieser Beiträge für die Gestaltung des Lehramtsstudiums und die Unterstützungsmaßnahmen für Studierende werden abschließend vor dem Hintergrund des akuten Bedarfs an qualifizierten Lehrkräften diskutiert. Beiträge des Symposiums Karriereverläufe nach Beenden des Lehramtsstudiums ohne Abschluss Steffen Schindler, Sebastian Franz Universität Bamberg Einleitung und Hintergrund Nicht alle Studierende beenden ihr Studium mit einem Abschluss. Insbesondere der Nicht-Abschluss eines Lehramtsstudiums stellt ein bildungspolitisches Problem dar, da Deutschland derzeit mit einem massiven Lehrkräftemangel konfrontiert ist (Porsch & Reintjes, 2023). Ein Problemlösungsansatz unter vielen ist die Anzahl der Lehramtsabschlüsse durch eine Reduzierung der Studienabbrüche im Lehramt zu erhöhen. Vor diesem Hintergrund ist es von entscheidender Bedeutung zu verstehen, warum Studierende ihr Lehramtsstudium ohne Abschluss beenden, obwohl sie einen klar definierten Berufsweg mit ausgezeichneten Aussichten auf dem Arbeitsmarkt haben. Im Allgemeinen lassen sich zwei Hauptgründe für das Verlassen eines Studiums ohne Abschluss unterscheiden: Zum einen können die Studierenden die akademischen Anforderungen der Studiengänge nicht erfüllen. Zum anderen entscheiden sich die Studierenden möglicherweise für einen anderen Karriereweg, der ihnen attraktiver erscheint als das Lehramt (Chambers et al., 2010; Hobson et al., 2009). In diesem Beitrag stehen jene Karrierewege von ehemaligen Lehramtsstudierenden im Mittelpunkt, die Alternativen zur ursprünglichen Entscheidung für den Lehrkraftberuf darstellen. Solche Alternativen können darin bestehen, zu einem anderen Studiengang zu wechseln oder die Hochschulbildung ganz zu verlassen. Eine Besonderheit des Lehramtsstudiums besteht darin, dass die Studierenden ihr Hauptfach beibehalten, aber einen anderen Studiengang wählen können, der zu einer anderen Laufbahn als dem Lehrkraftberuf führt. Fragestellung und theoretischer Rahmen Ziel dieses Beitrags ist es, typische Muster des Studienabbruchs in Lehramtsstudiengängen zu ermitteln. Dabei muss berücksichtigt werden, dass es aus individueller Sicht rational sein kann, ein Lehramtsstudium nicht abzuschließen, weil Alternativen attraktiver erscheinen. Daher sollen die Faktoren untersucht werden, die für solche Verschiebungen in der Wahrnehmung der Attraktivität von Studiengängen verantwortlich sind. In Anlehnung an soziologische Entscheidungsmodelle für Bildungs- und Berufsentscheidungen aus der Familie der Rational-Choice-Theorie (Breen & Goldthorpe, 1997) wird angenommen, dass die gewählte Alternative das Nutzen-Kosten-Kalkül des Lehramtsstudiums übertreffen und eine höhere Erfolgschance bieten. Prädiktoren für die unterschiedlichen Karrierewege nach dem Lehramtsstudium werden dem Integrationsmodell von Tinto (1975) sowie dem Erwartungs-Wert-Modell von Wigfield und Eccles (2000) entlehnt. Daten und Methoden Die Datenbasis der vorliegenden Untersuchung ist eine Stichprobe von Lehramtsstudierenden aus der Startkohorte 5 des Nationalen Bildungspanels (NEPS; Blossfeld & Roßbach, 2019), die sich über alle in Deutschland angebotenen Lehramtstypen und Fächergruppen erstreckt. Das Sample enthält Karriereverläufe von 5500 Lehramtsstudierenden, wovon 350 ihr Lehramtsstudium nachweislich abgebrochen oder nach erfolgreichem Bachelor of Education keinen Master of Education begonnen haben. In einem ersten Schritt werden die monatsgenauen Karriereverläufe von ehemaligen Lehramtsstudierenden mittels deskriptiver Darstellungen und Sequenzmusteranalysen ermittelt. Im zweiten Schritt wird eine discrete time survival analysis geschätzt, um den Zusammenhang der ausgewählten Prädiktoren mit den unterschiedlichen Karrierewegen zu analysieren. Bei den untersuchten Prädiktoren handelt es sich um im NEPS eingesetzte Skalen zur Messung der sozialen und akademischen Integration, die jährlich mittels Onlinefragebogen erhoben wurden, sowie einzelne neu entwickelte Items, die den Wert, die Erfolgserwartung und die Kosten des Studiums erfassen (Dahm et al., 2016). Ergebnisse Erste Befunde aus den deskriptiven Analysen zeigen, dass ca. 60 % der Befragten einen Monat nach Austritt aus dem Lehramtsstudium noch immer an einer Hochschule studierten und folglich den Studiengang wechselten. Lediglich 8 % begannen eine Ausbildung und 16 % gingen einer regulären Erwerbstätigkeit nach. Ungefähr 12 % befanden sich in einem Praktikum, Elternzeit oder Wehrdienst bzw. freiwilligen Dienst. Nur ein sehr geringer Anteil war mit 4 % erwerbslos. In der geplanten Präsentation werden neben den Verlaufsmustern nach Beenden des Lehramtsstudiums, die Ergebnisse der discrete time survival analysis berichtet und hinsichtlich ihrer Implikationen diskutiert. Der Fokus der Diskussion liegt dabei auf der Erklärung, unter welchen Voraussetzungen sich Lehramtsstudierende für einen Wechsel des Studiengangs entscheiden oder die Hochschulbildung verlassen. Auf diese Weise wollen wir Erkenntnisse gewinnen, die als Grundlage für politische Maßnahmen zur Steigerung der Attraktivität von Lehramtsstudiengängen dienen können. Wer denkt an Studienabbruch und warum? Studienabbruchsintentionen von Lehramtsstudierenden mit unterschiedlichen Kompetenzprofilen Andrea Westphal¹, Annelie Schulze¹, Juliane Schlesier², Hendrik Lohse-Bossenz¹ ¹Universität Greifswald, ²Universität Vechta Theoretischer Hintergrund Angesichts des Lehrkräftemangels ist die Ausbildung von Lehrkräften eine dringliche Herausforderung (Seeliger & Håkansson Lindqvist, 2023). Studienabbrüche von Lehramtsstudierenden behindern zusätzlich die Bemühungen, den Lehrkräftebedarf durch qualifizierte Lehrkräfte zu decken (Heublein et al., 2022). Während viel darüber bekannt ist, aus welchen Gründen erfahrene Lehrkräfte ihren Beruf aufgeben (z.B. Metaanalysen von Borman & Dowling, 2008; Li & Yao, 2022), liegen wenige Studien zu den Studienabbruchsmotiven von Lehramtsstudierenden vor. Befragungen haben gezeigt, dass sowohl negativ konnotierte "Push"-Faktoren (z. B. hohe Arbeitsbelastung als Lehrkraft) als auch positiv besetzte "Pull"-Faktoren (z. B. der Wunsch andere Berufe kennenzulernen) für Karriereentscheidungen von erfahrenen Lehrkräften relevant sein können (Amitai & van Houtte, 2022). Ferner ziehen Lehrkräfte, die über höhere Kompetenzen verfügen, offenbar andere Faktoren für ihre Karriereentscheidungen heran als weniger kompetente Lehrkräfte (Rice, 2010). Um Studienabbruchsintentionen von Lehramtsstudierenden zu ergründen, verbindet der vorliegende Beitrag qualitative Ansätze zu den Push- und Pull-Faktoren, die ausschlaggebend für Karriereentscheidungen sein können (z. B. Amitai & van Houtte, 2022), mit quantitativen Forschungsansätzen zu Kompetenzprofilen von Lehramtsstudierenden (Holzberger et al., 2021). Fragestellungen Wir untersuchen, welche Push- und Pull-Faktoren Lehramtsstudierende als Gründe für einen möglichen Studienabbruch berichten. Ein weiteres Anliegen ist es Kompetenzprofile der Lehramtsstudierenden zu identifizieren und zu prüfen, inwiefern die Studienabbruchsintention und die Push- und Pull-Faktoren sich zwischen den Kompetenzprofilen unterscheiden. Methode Unserer Untersuchung lagen N = 265 Lehramtsstudierende zugrunde (80% weiblich; M = 21.34 Jahre alt; erstes bis fünftes Fachsemester), die an zwei deutschen Universitäten eingeschrieben waren und im Wintersemester 2021/22 bzw. 2022/23 befragt wurden. Das pädagogische Wissen wurde mit 15 Items zum Unterrichten der Kurzversion des BilWiss-2.0-Tests erhoben (Leutner et al., 2020). Einstellungen zur Inklusion wurden mit der Skala von Lüke und Grosche (2017) gemessen (14 Items, McDonalds Omega = .87). Erfasst wurden unterrichtsbezogene Selbstwirksamkeit im Klassenmanagement (4 Items, McDonalds Omega = .81), Selbstwirksamkeit für Instruktionsstrategien (4 Items, McDonalds Omega = .79) und Selbstwirksamkeit für Schüler*innen-Engagement (4 Items, McDonalds Omega = .76; Pfitzner-Eden et al., 2014). Emotionale Stabilität wurde mit dem BFI-10 erhoben (2 Items, Rammstedt & John, 2007). Die Studienabbruchsintention wurde mit der Skala von Dresel und Grassinger (2013) (5 Items, McDonalds Omega = .78) und Gründe für einen möglichen Studienabbruch mit offenem Antwortformat erfasst. Latente Profilanalysen wurden mit dem R-Paket tidyLPA (Rosenberg et al., 2018) und MplusAutomation (Hallquist & Wiley, 2018) berechnet. Unterschiede in der Studienabbruchsintention zwischen den Profilen wurden mittels Hilfsvariablen geprüft (3-Step Approach). Die Gründe für einen möglichen Studienabbruch wurden deduktiv in Push- und Pull-Faktoren kodiert (Cohens κ = .88). Push-Faktoren wurden zusätzlich induktiv kodiert (Cohens κ ≥ .84). Ergebnisse Lehramtsstudierende berichteten überwiegend Push-Faktoren als Gründe für einen möglichen Studienabbruch. In diesen Push-Faktoren fanden sich vier wiederkehrende Themen: hohe Studienanforderungen, Frustration mit einem ihrer Fächer (z.B. Mathematik), die Wahrnehmung der universitären Veranstaltungen als zu wenig praxisrelevant und schließlich Unzufriedenheit mit organisatorischen Rahmenbedingungen (v.a. Seminarzeiten, Prüfungsformate). Latente Profilanalysen ergaben drei distinkte Kompetenzprofile, die durch unterschiedliche Kombinationen des bildungswissenschaftlichen Wissens, der Einstellungen zur Inklusion, der unterrichtsbezogenen Selbstwirksamkeit und der emotionalen Stabilität charakterisiert waren. Unterscheiden ließ sich ein Profil „Hohes Engagement“ mit hoher Ausprägung aller Variablen außer dem bildungswissenschaftlichen Wissen (n = 71) von einem „Homogenen Kompetenzprofil“ mit mittlerer Ausprägung aller Variablen (n = 141) und einem Profil „Geringes Engagement“ mit geringerer unterrichtsbezogener Selbstwirksamkeit und mittlerer Ausprägung aller anderen Variablen (n = 51). Die latenten Kompetenzprofile unterschieden sich signifikant in ihrer Studienabbruchsintention, χ(2) = 23.574, p < 0.001. Studierende im Profil „Hohes Engagement“ wiesen signifikant geringere Studienabbruchsintentionen auf als Studierende im „Homogenen Kompetenzprofil“ (p < 0.001) und im Profil „Geringes Engagement“ (p < 0.01). Unterschiede in den Push- und Pull-Faktoren zwischen Lehramtsstudierenden unterschiedlicher Kompetenzprofile ließen sich inferenzstatistisch nicht absichern. Wir diskutieren Implikationen für die Beratung von Studierenden. Zwischen Unterstützung und Unverständnis: Umgangsweisen von Lehrenden mit studienspezifischen Problemlagen internationaler Studierender an der TU Dresden Colin Kaggl, Franziska Schulze-Stocker Technische Universität Dresden Theoretischer Hintergrund Studienerfolg und Studienabbrüche sind auf multiple Motivlagen zurückzuführen, die unterschiedlich gewichtet werden, „sich aber gegenseitig verstärken“ können (Heublein & Wolter 2011, S. 223; siehe auch Blüthmann et al., 2008; Heinze, 2018; Pelz et al., 2020). Hierbei fällt Hochschullehrenden als „institutional agents“ eine besondere Rolle bei Problemlagen von Studierenden zu (u.a. Stanton-Salazar, 2011; Preuschoff & Wiemer, 2016). Die Öffnung der Hochschulen für neue Zielgruppen und der globalisierte Wettbewerb führen zu einer zunehmenden Internationalisierung der Studierendenschaft in Deutschland (Pineda & Rech, 2020), die sich auch in einer zunehmenden Anzahl internationaler Lehramtsstudierenden an deutschen Hochschulen ausdrückt (Petzold, 2022). In der Diskussion um Studienerfolg gerät die Situation internationaler Studierender zunehmend in den Blick von Interventions- und Präventionsbemühungen (siehe für einen Überblick Pineda & Rech, 2020), denn im Vergleich zu Studierenden mit deutscher Hochschulzugangsberechtigung liegen deren Abbruchquoten höher (Heublein et al., 2020; Bachelor: 27,0 % versus 48,5 %; Master: 17,0 % versus 29,0 %). Studien zeigen zudem, dass internationale Studierende vergleichsweise mit besonderen Herausforderungen im Studienkontext konfrontiert sind (z. B. Sprachbarrieren, soziale Integration, Vertrautheit mit der akademischen Kultur und Studienorganisation); gleichzeitig werden hochschulische Unterstützungsangebote von ihnen kaum wahrgenommen (Friedland & Oehmichen, 2020; SVR, 2017). Auch hier sind Lehrende oftmals die ersten und wichtigsten Ansprechpersonen bei Schwierigkeiten im Studium (siehe u.a. Kaggl & Schulze-Stocker, eingereicht). Fragestellung Vor diesem Hintergrund stellt sich die Frage nach dem Umgang von Lehrenden mit den spezifischen Problemlagen und Bedürfnissen internationaler Studierender. Methode Zur Beantwortung dieser Frage wird der Vortrag auf Ergebnisse des Projekts Erfolgreich – Digital – Integriert: Studium an der TU Dresden (EDI:TUD; Schulze-Stocker et al., 2022) zurückgreifen, welches Herausforderungen internationaler Studierender und ihre spezifischen Bedarfe mit dem Ziel erfasst, den Studienerfolg dieser Studierendengruppe zu erhöhen. Dafür werden neben Auswertungen einer Online-Befragung von Lehrenden an der TU Dresden (Kaggl et al., 2022; Kaggl & Schulze-Stocker, eingereicht) auch die Ergebnisse einer tiefergehenden Gruppendiskussion mit fünf Lehrenden des Instituts für Leichtbau und Kunststofftechnik der TU Dresden einfließen, welche mithilfe einer zusammenfassenden qualitativen Inhaltsanalyse (Schreier, 2012) erschlossen wurden. Die Generalisierung soll mittels einer darauf aufbauenden empirisch begründeten Typenbildung erfolgen (Lang & Ruesch Schweizer, 2020). Ergebnisse Erste Ergebnisse zeigen, dass sich verschiedene disziplinunabhängige Umgangstypen oder -strategien der Betreuung internationaler Studierender identifizieren lassen. Dabei konnten drei Profile von Lehrenden differenziert werden: Während sich einzelne Lehrende ausgesprochen engagiert zeigen und den Umgang mit internationalen Studierenden als kulturelle und persönliche Bereicherung ansehen, empfinden andere ihren Betreuungsauftrag als zunehmend überfordernd und sehen die Universität stärker in der Interventionspflicht. Die dritte Gruppe hingegen betrachtet Studienerfolg als (alleinige) Bringschuld der internationalen Studierenden selbst, während sie deren Betreuung in erster Linie als persönliche und institutionelle Belastung wahrnimmt. Im Anschluss daran wird der Vortrag diese Befunde durch Kontrastierung der beiden Erhebungsmethoden weiter validieren, spezifizieren und generalisieren. Dadurch wird ein analytisches Licht auf konkrete Umgangsweisen und Problemzuschreibungen von Lehrenden mit internationalen Studierenden geworfen. Zudem können Hilfestellungen für die Sensibilisierung Lehrender im Umgang mit ihnen angeboten sowie passgenauere Maßnahmenvorschläge für Universitäten zur Verbesserung von Beratung, Betreuung und Studienerfolg dieser Gruppe abgeleitet werden.
15:20 - 17:00	3-03: Lehrkräftemotivation und Unterrichtsgestaltung: Prozessorientierte Perspektiven Ort: H03
	Symposium Lehrkräftemotivation und Unterrichtsgestaltung: Prozessorientierte Perspektiven Chair(s): Rebecca Lazarides (Universität Potsdam, Deutschland), Markus Dresel (Universität Augsburg) Diskutant*in(nen): Tina Seidel (Technische Universität München) Die Motivation von Lehrkräften gilt als zentrale Voraussetzung für effektives Unterrichten sowie für die motivationale, sozio-emotionale und kognitive Entwicklung von Schüler:innen (Fives & Buehl, 2016). Während die Beziehungen zwischen Unterrichtsmerkmalen und Outcomes auf der Schülerseite bereits intensiv untersucht wurden (Holzberger et al., 2020; Praetorius et al., 2018), ist bisher noch weitreichend ungeklärt, über welche Transmissionsprozesse sich motivationale Merkmale von Lehrkräften auf Unterrichtsprozesse auswirken und welche Bedeutung dabei der konkreten Unterrichtssituation und dem (fachlichen) Kontext zukommt. Das Symposium greift dieses Desiderat auf und führt verschiedene Beiträge eines informellen Forschungsnetzwerkes zusammen, deren Gemeinsamkeit in dem Ziel besteht, durch Untersuchung zeitlicher Veränderungsdynamiken, situationsspezifischer Interaktionen und prozessbezogener Zusammenhänge ein vertieftes Verständnis der Zusammenhänge zwischen Lehrkräftemotivation, Unterrichtsverhalten und Schüleroutcomes zu ermöglichen. Der erste Beitrag (Kosubek et al.) untersucht anhand von Längsschnittdaten von Lehrkräften und Schüler:innen der Jahrgangsstufen 5 bis 9 in den Fächern Mathematik und Deutsch die Transmission der Motivation von Lehrkräften (Selbstwirksamkeit, Enthusiasmus) auf die Lernendenmotivation (Selbstkonzept, intrinsischer Wert) über multiple Dimensionen der Unterrichtsqualität (schülerperzipierte Klassenführung, konstruktive Unterstützung, kognitive Aktivierung) im Verlauf eines Schuljahres. Dabei steht besonders die Frage nach fachbezogenen Differenzen in den untersuchten Zusammenhängen im Vordergrund. Die Ergebnisse zeigen Transmissionseffekte der Lehrkraftmotivation auf die Motivation der Lernenden vermittelt über die wahrgenommene Unterrichtsqualität mit ähnlichen Ergebnismustern in Mathematik und Deutsch. Der zweite Beitrag (Lauermann & ten Hagen) befasst sich im Rahmen einer Videostudie in Deutsch-als-Zweitsprache (DaZ) Klassen der Sekundarstufe mit den Zusammenhängen zwischen den schülerspezifischer Lehrkräftemotivation (z.B. Selbstwirksamkeit für das Unterrichten einzelner Schüler:innen), den akademischen Merkmalen einzelner Schüler:innen (z.B. Motivation) und Zeit, die Lehrkräfte im Gespräch mit einzelnen Schüler:innen verbringen. Die Studie zeigt, dass Lehrkräftemotivation keinen substantiellen Effekt auf die Gesprächszeit der Lehrkräfte mit einzelnen Lernenden hat. Gleichzeitig sprechen Lehrkräfte länger mit Schüler:innen, die sich in den Unterricht einbringen und deren Fähigkeiten in der deutschen Sprache von Lehrkräften als gering eingeschätzt werden. Der dritte Beitrag (Frenzel et al.) untersucht im Rahmen einer Videostudie im universitären Kontext mittels KI-unterstützter Gesichtserkennung emotionale Transmissionsprozesse im Klassenraum. Hierbei wird dem Phänomen der Übertragung von Freude in der sozialen Interaktion zwischen Dozierenden und Studierenden nachgegangen, operationalisiert über den gemeinsamen mimischen Ausdruck von Freude. Die Befunde zeigen, dass die Übertragung positive Emotionen in Lehr-Lernsituationen ein wechselseitiger Prozess zwischen Lehrkräften und Lernenden ist. Von der Nachahmung positiver emotionaler Gesichtsausdrücke in den Interaktionen zwischen Lehrenden und Lernenden profitieren dabei vor allem die Lehrenden, die mehr Freude empfinden. Der vierte Beitrag (Lazarides & Göllner) geht anhand von Daten der TALIS-Videostudie der Frage nach, inwiefern verbale (Sprache der Lehrkraft) und nonverbale Prozesse (motivierendes Lehrkräftehandeln) des Unterrichtshandelns mit Lehrkräftemotivation (Selbstwirksamkeit, Enthusiasmus) und Schüleroutcomes in Zusammenhang stehen und welche Potentiale dabei die Nutzung KI-basierter Methoden für die Analyse derartiger Prozesse bietet. Dabei wird konkret aufgezeigt, dass verbales und nonverbales motivierendes Lehrkräfteverhalten mittels KI-basierter Algorithmen und Methoden reliabel in Unterrichtsvideos identifiziert werden kann und Zusammenhänge zu Lehrkräftemotivation und motivierenden Aspekten der Unterrichtsqualität aufweist. Die Beiträge des Symposiums befassen sich folglich alle mit Fragen der Prozessbezogenheit von Lehrkräftemotivation und Unterrichtshandeln. Die längsschnittlichen und prozessbezogenen Forschungszugänge ermöglichen es, den dynamischen und durch soziale Interaktionen und fachliche Kontexte geprägten Charakter der Zusammenhänge zwischen Lehrkräftemotivation und Lehrkrafthandeln im Unterricht zu berücksichtigen. Die Beiträge im Symposium tragen daher substantiell dazu bei, die Rolle von sozialem, fachbezogenen und situationalem Kontext für die Effekte von Lehrkräftemotivation auf Unterrichtshandeln und Schüleroutcomes im Kontext Schule und Hochschule besser zu verstehen. Beiträge des Symposiums Die Transmission der Lehrkraftmotivation auf die Lernendenmotivation in Mathematik und Deutsch: Eine Untersuchung der Unterrichtsqualität als vermittelnde Variable Anne Kosubek¹, Hanna Gaspard¹, Cora Parrisius², Ann-Kathrin Jaekel³, Richard Göllner³ ¹Technische Universität Dortmund, ²Pädagogische Hochschule Karlsruhe, ³Universität Tübingen Theoretischer Hintergrund Nach der Erwartungs-Wert-Theorie (Wigfield & Eccles, 2000) kann die Motivation von Lehrkräften und Lernenden über die Erfolgserwartung (z.B. Selbstwirksamkeit, Fähigkeitsselbstkonzept) und den zugeschriebenen Wert (z.B. Enthusiasmus, intrinsischer Wert) erklärt werden. Die Lehrkraftmotivation sollte sich auf die Unterrichtsqualität auswirken, welche wiederum mit der Lernendenmotivation verknüpft ist (Lazarides et al., 2023; Lauermann & ten Hagen, 2021). Die Qualität des Unterrichts lässt sich anhand der Basisdimensionen Klassenführung, konstruktive Unterstützung und kognitive Aktivierung bewerten (Praetorius et al., 2018). Bisherige Studien zur Transmission der Motivation von Lehrkräften und Lernenden über die Unterrichtsqualität liefern inkonsistente Befunde und fokussieren vorrangig auf Mathematik oder Naturwissenschaften (z.B. Bardach & Klassen, 2021; Dicke et al., 2021; Fauth et al., 2019; Rubach et al., 2023). Es mangelt an Längsschnittstudien sowie einer Untersuchung der Übertragbarkeit auf weitere Domänen. Fragestellung Daher soll in der vorliegenden Studie untersucht werden, a) inwiefern sich die Lehrkräftemotivation vermittelt über die wahrgenommene Unterrichtsqualität auf die Lernendenmotivation auswirkt und b) inwiefern diese Ergebnisse für die Unterrichtsfächer Mathematik und Deutsch generalisierbar sind. Methode Die Untersuchung basierte auf Längsschnittdaten von Schulklassen der Jahrgangsstufen 5-9 (T1) unterschiedlicher Schulformen in Baden-Württemberg. In Mathematik wurden 55 Lehrkräfte und 1085 Lernende sowie in Deutsch 45 Lehrkräfte und 846 Lernende zwei Mal im Abstand eines Schuljahres befragt. Die Lehrkräfte schätzten ihre Motivation (T1) anhand ihrer Selbstwirksamkeit (Mathematik α=.84/ Deutsch α=.80) und ihres Unterrichtsenthusiasmus (α=.86/.86) ein. Die fächer- und lehrkraftspezifischen Einschätzungen der Unterrichtsqualität durch die Lernenden (T2) erfolgten anhand der Basisdimensionen Klassenführung (Störungen: α=.85/.83; Regelklarheit: α=.68/.70), konstruktive Unterstützung (Feedback: α=.81/.80; Autonomieunterstützung: α=.71/.72) und kognitive Aktivierung (anspruchsvolle Aufgaben: α=.69/.72; sokratischer Dialog: α=.75/.76). Die Lernenden schätzten ihre fachspezifische Motivation (T1 & T2) in Bezug auf ihr Fähigkeitsselbstkonzept (α=.94/.90) und den intrinsischen Wert (α=.97/.96) ein. Mit Cross-Level-Mediationsanalysen (Pituch & Stapleton, 2012) wurden je 24 Modelle zur Transmission der Lehrkräftemotivation auf die Lernendenmotivation über die Unterrichtsqualitätsskalen in Mathematik und Deutsch unter Kontrolle der Ausgangswerte der Lernendenmotivation geprüft. Ergebnisse & Diskussion In Mathematik erwiesen sich 10 der 24 cross-level-indirekten Effekte als signifikant (p<.05) bzw. 11 als marginal signifikant (p<.10). Lernende von enthusiastischeren und selbstwirksameren Lehrkräften nahmen weniger Störungen wahr, welche wiederum mit höherem Fähigkeitsselbstkonzept und intrinsischem Wert zusammenhingen. Lernende von enthusiastischeren Lehrkräften berichteten zudem von stärkerer Regelklarheit, welche eine Zunahme in Fähigkeitsselbstkonzept und intrinsischem Wert der Lernenden erklärte. Zudem berichteten Lernende von enthusiastischeren und selbstwirksameren Lehrkräften häufiger von anspruchsvollen Aufgaben, welche mit einer höheren Motivation der Lernenden (beide Komponenten) zusammenhingen. Schließlich nahmen Lernende von selbstwirksameren Lehrkräften einen stärkeren Sokratischen Dialog wahr, wodurch ein Zuwachs im intrinsischen Wert erklärt werden konnte. Zusätzlich zu den cross-level-indirekten Effekten zeigten sich nur wenige, tendenziell negative indirekte Effekte auf der Klassenebene (p<.10). In Deutsch zeigten sich 8 cross-level-indirekte Effekte als signifikant (p<.05) bzw. 12 als marginal signifikant (p<.10). Lernende von enthusiastischeren und selbstwirksameren Deutschlehrkräften berichteten von höherer Regelklarheit und infolgedessen von höherer Motivation (beide Komponenten). Lernende von selbstwirksameren Lehrkräften nahmen weniger Störungen im Unterricht wahr, was einen Zuwachs in Fähigkeitsselbstkonzept und intrinsischem Wert erklärte. Darüber hinaus stellten Lernende bei enthusiastischeren und selbstwirksamen Lehrkräften einen stärkeren Sokratischen Dialog fest, der mit höherem intrinsischen Wert zusammenhing. Lernende von enthusiastischeren Lehrkräften berichteten vermittelt über anspruchsvollere Aufgaben von einer höheren Motivation zu T2 (beide Komponenten). Diese Lernenden bemerkten eine stärkere Autonomieförderung und daraus resultierend einen erhöhten intrinsischen Wert. Auch in Deutsch waren nur wenige zusätzliche indirekte Effekte auf der Klassenebene sichtbar (p<.05). Diese Ergebnisse sprechen für eine Transmission der Lehrkraftmotivation auf die Motivation der Lernenden vermittelt über die wahrgenommene Unterrichtsqualität. Insbesondere die Klassenführung und die kognitive Aktivierung spielen hierbei eine entscheidende Rolle, während die konstruktive Unterstützung trotz ihrer theoretischen Nähe zur Motivation nicht als vermittelnder Prozess fungiert. Bemerkenswerterweise sind sehr ähnliche Ergebnismuster in Mathematik und Deutsch zu erkennen. Within-class associations between teachers’ student-specific motivations, students’ academic characteristics, and teacher talk in language-focused classes Fani Lauermann¹, Inga ten Hagen² ¹Universität Bonn, ²Technische Universität Dortmund Theoretical Background Teaching requires complex and autonomous decision-making with limited resources such as instructional time (Kunter et al., 2013; Lauermann & Butler, 2021). For instance, teachers must manage their limited classroom time to attend to individual student needs, implement in-the-moment instructional adaptations, and may engage in differential treatment (Babad, 1993). Surprisingly, little is known about the psychological underpinnings of such complex teaching-related decisions. Based on socio-cognitive theory (Bandura, 1997; Lauermann & Butler, 2021), the present study used multi-source, student-specific data to examine the within-class links between (i) students’ academic characteristics (i.e., ability and motivation, assessed via standardized tests, self-reports, and teacher ratings), (ii) teachers’ student-specific motivational beliefs (i.e., self-efficacy and enthusiasm for teaching individual students), and (iii) teachers’ allocation of student-specific teacher talk in German-as-a-second-language (GSL) classrooms (i.e., observed time the teacher talks to a particular student in videotaped classes). We focused on GSL classrooms because such classes require adaptive teaching (Otto et al., 2016). We focused on teachers’ student-specific talking time because it is an essential descriptor of teachers’ instructional behaviors in language-focused classes (Borg, 2006; Ellis, 2005). Aims and Research Questions We examined the interrelations between students’ academic characteristics and teachers’ student-specific motivational beliefs and their predictive effects on teachers’ student-specific talking time (RQ1-RQ2). Method Thirty-three GSL teachers and 309 secondary students participated in the [blinded] video study. Validated scales were adapted to refer to individual students (e.g., teachers’ self-efficacy and enthusiasm for teaching individual students). Students’ academic characteristics were assessed via self-reports (intrinsic motivation), teacher ratings (student engagement and language ability), and standardized tests (C-test of language ability). Teachers’ talking time was coded for videotaped classes. Results and Conclusions A multi-level path analysis tested the theorized within-class associations. First (RQ1), in a given classroom, students who actively participated in the class (i.e., high behavioral engagement) drew most of the teacher’s verbal attention. Low-achieving students received the most verbal attention when differences in behavioral engagement were controlled for. Second (RQ2), teachers felt most efficacious and enthusiastic about teaching students with high teacher-rated emotional engagement and language proficiency. The more efficacious and enthusiastic teachers felt about teaching a given student, the more time they spent talking to that student relative to other students in the same class. However, teachers’ student-specific self-efficacy and enthusiasm did not have incremental predictive effects on teachers’ talking time, controlling for students’ teacher-rated engagement . Teachers’ within-class distribution of instructional time followed two key pathways. First, behaviorally engaged students appeared to draw their teacher’s verbal attention, indicating more student-directed teacher talk. Second, controlling for differences in students’ behavioral engagement, teachers spent more time talking to students they perceived as less proficient in German. Failure to account for both pathways may be a contributing factor to the mixed findings in prior research, according to which teachers pay more attention either to high-achieving (e.g., Decristan et al., 2020; Lipowsky et al., 2007) or low-achieving (Denessen et al., 2020; Pohlmann-Rother et al., 2018) students. The results underscore the importance of collecting student-specific and multi-source data to study teachers’ decision-making and classroom behaviors. Joy is reciprocally transmitted between teachers and students: Evidence on facial mimicry in the classroom Anne Frenzel¹, Muhterem Dindar², Reinhard Pekrun³, Corinna Reck¹, Anton K.G. Marx¹ ¹Ludwig-Maximilians-Universität München, ²Tampere University, ³University of Essex, UK, Ludwig-Maximilians-Universität München, Australian Catholic University, Australia Theoretical Background Teaching and learning are inherently social and interactive, and they can involve strong emotional experiences among teachers and students alike (Harvey et al., 2012; Pekrun & Linnenbrink-Garcia, 2014; Pekrun et al., 2017). The critical importance of positive emotions for classroom functioning is well established (e.g., Dewaele et al., 2019; Frenzel et al., 2021; Graesser, 2020; Loderer et al., 2020) and teachers and learners’ trait-based joy during class has been shown to covary (e.g., Frenzel et al., 2018; Frenzel et al., 2009). This has been interpreted as evidence of emotional contagion across teachers and learners. However, no research to date seems to have explored in-situ processes of emotional contagion, thus the social dynamic of positive emotion transmission during instruction is poorly understood. Aims and Research Question A key proposition of the present contribution is that macro-level covariation between teachers’ and students’ self-reported habitual joy experiences is fueled, in a bottom-up fashion, by micro-level covariation: That is, by repeated instances of joint joy experiences among teachers and students during instruction. We suggest that the face is a particularly important channel through which teachers’ and students’ emotional experiences are communicated to one another. Thus, mimicry of facial joy expressions should be one important mechanism that drives such emotional convergence among teachers and students (Hess, 2021; Hess & Fischer, 2014; Talebzadeh et al., 2020). The present study seeks to provide evidence of facial joy mimicry between teachers and students during real-life instruction, and explore its relations with teachers’ and learners’ subjective session joy. Method Participants were 13 university instructors and 69 of their students. They self-reported on their session joy answering single items directly after the session (”In the past 45 minutes, I enjoyed class/teaching” for students/instructors). Their joy expressions were captured through a multi-camera setup and submitted to AI-based automated facial emotion coding, using the iMotions software platform version 7.1 (iMotions, 2019) in combination with the automated facial expression coding module Emotient FACET which is a commercialized version of the CERT software (Littlewort et al., 2011). FACET is based on the Facial Action Coding System (FACS) by Ekman et al. (2002). Facial mimicry within each teacher–student dyad was determined through cross-recurrence quantification analysis (CQA, Coco & Dale, 2014). In CRQA, two time series are linked (here: instructor and student), to quantify both perfect co-occurrence (i.e., both instructor and student expressing joy at the exact same time) as well as lagged cross-recurrence (i.e., the student expressing joy a little later than the instructor or vice versa). We used CRQA to (1) identify a critical time window for above-chance (co-)occurrence of teacher and students joy expressions, and (2) to quantify, for each dyad, their degree of joy mimicry . Results and Conclusions Our key results showed that students’ facial expressions of joy cross-recurred substantially above chance level (p < .003) during a time window of about -2s and +3s seconds relative to the instructors’ expressions. This implies that within this critical lag window, there was substantially above-chance mimicry of instructor and student joy expression, with either students being first in expressing joy and followed by their instructors’ joy expression, or vice versa. Further, post-session self-reported joy was significantly positively correlated with the teacher–student dyad mimicry quantity for teachers, but not for students. These findings suggest that joy transmission between teachers and students is reciprocal process, and that teachers seem to emotionally benefit from their students’ joy mimicry. Prozessbezogene Perspektiven auf Motivierung im Unterricht: KI-attestierte Analysestrategien Rebecca Lazarides¹, Richard Göllner² ¹Universität Potsdam, ²Universität Tübingen Theoretischer Hintergrund Die Motivation von Lehrkräften ist eine zentrale Voraussetzung für qualitätsvolles Unterrichten - allerdings sind die Mechanismen, die dazu führen, dass eine hohe Lehrkräftemotivation zu gutem Unterrichten beiträgt, aktuell ungeklärt (Bardach & Klassen, 2021). Die mangelnde Evidenz ist maßgeblich darin begründet, dass eine prozessnahe Beschreibung der motivationalen Transmission im Klassenzimmer naturgemäß schwer zu erreichen ist. Mit Blick auf die Lehrkraftmotivation ist davon auszugehen, dass sich die Motivation einer Lehrkraft in spezifischen Lehr-Lernsituationen durch verbales und non-verbales Verhalten auf die Motivierung der Lernenden im Unterricht überträgt (Frenzel et al., 2021). Existierende Erfassungsansätze, wie etwa klassische Unterrichtsbeobachtungen, bieten nach wie vor keine hinreichend guten Ansätze zur Erfassung solcher Prozessmerkmale. Vor diesem Hintergrund stellen KI-basierte Verfahren vielversprechende Ansätze dar, um prozessnahe Informationen in effizienter Weise zu verarbeiten und im Rahmen der Unterrichtsprozessforschung zu nutzen Fragestellung Im vorliegenden Beitrag werden die Forschungsbereiche der Lehrkräftemotivationsforschung und der Unterrichtsforschung zusammengeführt, um der Frage nachzugehen, inwiefern KI-basierte Erfassungsmethoden effektiv eingesetzt werden können, um die Prozesshaftigkeit von Unterrichtshandeln und den Zusammenhängen dieses Handelns mit Lehrkräftemotivation zu untersuchen. Dabei werden zwei Studien vorgestellt, die KI-basierten Verfahren zur Erfassung non-verbaler als auch verbaler Prozessmerkmale der Unterrichtsmotivation anwenden. Methode In Studie 1 wurde ein Algorithmus zur Kodierung motivierenden Unterrichtsverhaltens von Lehrkräften in Unterrichtsvideos entwickelt. Wir fokussieren das Konstrukt der ‚non-verbal immediacy‘ (NVI), das Ähnlichkeiten zum Lehrkräfteenthusiasmus aufweist (Mehrabian, 1968). Analysiert wurden die in Deutschland erhobenen Daten der TALIS-Studie (Teaching and Learning International Survey; OECD, 2020). Zur Entwicklung des Computervision-Algorithmus, der eine Quantifizierung der NVI ermöglicht, wurden Videodaten von 47 Klassen einbezogen. Zur merkmalstreuen Erfassung des Konstrukts wurden Subalgorithmen wie „Gestenintensität“ und „physiologische Distanz“ genutzt. Datengrundlage für die Klassifikatoren dieser Dimensionen bildeten 3500 Einzelframes, die aus den Unterrichtsvideos extrahiert und von drei geschulten Ratern bewertet wurden. Die Analyse des Gesichtsausdrucks wurde mit Hilfe des Toolkits OpenFace durchgeführt, für die Extraktion der Körperhaltung wurde das HRNet Convolutional Neural Network verwendet. In Studie 2 wurden Unterrichtstranskripte der TALIS Videostudie Deutschland anhand von drei aufeinander folgenden Schritten ausgewertet. Erstens wurde auf der Grundlage der Unterrichtstranskriptionen 1536 semantische Textfeatures mittels des sematischen Embeddings (text-embedding-ada-002) extrahiert. Anschließend wurden die sprachlichen Informationen der Unterrichtssegmente mittels einer k-Means Clusteranalyse gruppiert. Zweitens wurde die Spezifität der semantischen Textfeatures mittels eines Promptings geprüft. Hierzu wurden konkrete Definitionen verschiedener Unterrichtsqualitätsmerkmale vor der Featureextraktion und der daran anschließenden Clusteranalyse verwenden. Betrachtet wurden Unterrichtsqualitätsmerkmale, die für die Motivierung von Lernenden von besonderer Bedeutung sind (emotionales Klima, Diskursqualität, Anregungsgehalt, multiple Lösungswege). Abschließend wurden Clusterunterschiede bezüglich der externen Unterrichtsqualitätsbeurteilungen anhand eines regressionsanalytischen Verfahrens ermittelt. Ergebnisse und Diskussion Studie 1. Die Inter-Rater-Reliabilität (ICC(3,3)) der NVI-Ratings betrug über alle Clips hinweg im Durchschnitt .684, was auf konsistente NVI-Bewertungen hinweist. Die Dimension "Gestenintensität" wies mit ICC(3,3) = .948 eine hohe Inter-Rater-Reliabilität auf. Die Dimension "Körperliche Distanz" wies einen ICC(3,3) von .684 auf. Generalisiert auf Lehrkräfte, die nicht Teil der Trainingsdaten waren, erreicht der entwickelte NVI-Algorithmus eine Accuracy von .620. Aktuell werden Zusammenhänge zwischen den NVI-Indizes, Lehrkräftemotivation und Schüleroutcomes berechnet. Studie 2. Die Clusteranalysen der extrahierten Textfeatures zeigten, dass ein Modell mit vier Clustern bzw. Mustern motivierender Sprache die sprachlichen Unterrichtssegmente am besten beschreiben konnte. Die regressionsanalytischen Ergebnisse zeigten, dass die Cluster 1% bis 8% Prozent der Beurteilungsunterschiede zwischen den Segmenten einer Unterrichtsstunde und 4% bis 17% Beurteilungsunterschiede zwischen den Unterrichtsstunden vorhersagen konnten. Dabei zeigten die einzelnen Cluster eine hohe Spezifität bezüglich der vorherzusagenden Qualitätsmerkmale. Demgegenüber ergab eine geprompteten Featureextraktion zunächst keinen weiteren Vorteil, wobei unterschiedliche Möglichkeiten des Promptings weiterführend geprüft werden. Die Ergebnisse zeigten zusammenfassend, dass genuine Sprachmodelle und Computervision-Algorithmen durchaus vielversprechend sind, um relevante Motivatoren des Unterrichts zu identifizieren und damit die in theoretischen Modellen zu Lehrkräftemotivation und Unterricht beschriebene Prozessebene zu untersuchen.
15:20 - 17:00	3-04: Empirische Forschung zur Wirksamkeit der Lehrkräftebildung – Überblick und Perspektiven Ort: H02
	Symposium Empirische Forschung zur Wirksamkeit der Lehrkräftebildung – Überblick und Perspektiven Chair(s): Johannes König (Universität zu Köln), Sarah Strauß (Universität zu Köln, Deutschland) Diskutant*in(nen): Gabriele Kaiser (Universität Hamburg) Seit Jahrzehnten steht die Lehrer:innenbildung in der Kritik: Zu den wiederholt genannten Problemstellungen wie mangelnde Wirksamkeit, fehlende Kohärenz curricularer Angebote, Praxisferne der Ausbildung kommen auch aktuelle Herausforderungen der inklusiven Bildung, der Digitalisierung oder des Well-Beings. Zentral ist dabei auch die Fachlichkeit schulischen Lernens, die es erforderlich macht, die genannten Problemstellungen aus einer domänenspezifischen bzw. interdisziplinären Perspektive zu betrachten. In der empirischen Bildungsforschung existiert mittlerweile eine kaum mehr zu überblickende Anzahl empirischer Einzelstudien zur Analyse der Wirksamkeit von Lehrer:innenbildung, wie beispielsweise das Literatur-Review von Cochran-Smith und Villegas (2015) aufzeigt (für einen Überblick im deutschsprachigen Raum vgl. z.B. Hascher, 2014). In den vergangenen Jahren wurden überdies weitere Literatur-Reviews veröffentlicht, die nach thematischen Schwerpunkten ausgewählte Studien zur Prüfung von Wirksamkeit der Lehrer:innenbildung auswerten, etwa zur Digitalisierung (Ma et al., 2023; Perry et al., 2021), zum Well-Being (Shepherd et al., 2016) oder zur Unterrichtsplanungskompetenz (König & Rothland, 2022). Vor diesem Hintergrund stellen sich zwei Fragen, die den Anlass für das Symposium bilden – und im Sinne des Tagungsthemas der GEBF 2024 dazu beitragen können, die auf Lehrkräfte bezogene „Bildung zu verstehen“: Wie ist erstens der Stand der empirischen Forschung zur Wirksamkeit der Lehrer:innenbildung (empirical research on teacher education effectiveness) insgesamt bzw. im Überblick zusammenzufassen und zu bewerten? Und zweitens welche Perspektiven sollten daraus – zumindest exemplarisch – für die zukünftige Forschung aktuell bezogen und entwickelt werden? Als Input zur ersten Frage dient Beitrag 1: Berichtet wird über eine aktuell durchgeführte Synthese von 27 internationaler Literatur-Reviews empirischer Studien zur Wirksamkeit der Lehrer:innenbildung, die in den vergangenen 30 Jahren veröffentlicht wurden (König et al., 2023/im Druck). Die Synthese baut auf über 2000 empirischen Studien auf, die in den 27 Reviews insgesamt zum Gegenstand gemacht wurden. Zentrale Ergebnisse der Synthese beziehen sich auf Kernaspekte der Wirksamkeitsforschung (u.a. theoretische Rahmungen, Outcomes, Prozessvariablen) sowie die identifizierten Forschungslücken. Beitrag 1 liefert somit einen Forschungsüberblick, aus dem zentrale Perspektiven für die zukünftige Forschung bezogen werden können. Die daran anschließenden Beiträge vertiefen jeweils exemplarisch ausgewählte Perspektiven und zeigen somit auf, wie zukünftig bestimmte Schwerpunkte gesetzt werden können, um Innovationen in der Forschung zur Wirksamkeit der Lehrer:innenbildung zu forcieren. Beitrag 2 setzt bei dem Forschungsdesiderat an, Interventionsstudien zur Wirksamkeit bestimmter Innovationen der Lehrer:innenbildung durchzuführen, die forschungsmethodisch anspruchsvolleren Untersuchungsdesigns gerecht werden (vgl. auch Hill et al., 2021). Am Beispiel der Förderung von situationsspezifischen Fähigkeiten im Bereich einer effektiven Klassenführung (Kramer et al., 2020) wird die Frage nach der Wirksamkeit einer neu entwickelten Intervention auf Basis von Unterrichtsvideos bearbeitet, wobei die (perspektivische) Umsetzung eines methodisch anspruchsvollen (experimentellen) Designs, die Testung multipler Facetten der klassenführungsspezifischen Kompetenzen sowie das Ziel einer breiten Implementation der Intervention im Vordergrund stehen. Beiträge 3 und 4 setzen jeweils den Fokus auf die Messung und Förderung spezifischer Kompetenzfacetten, die als Weiterentwicklung bisheriger fachlicher (Beitrag 3) bzw. affektiv-motivationaler (Beitrag 4) Outcomes der Lehrer:innenbildung anzusehen sind. Beitrag 3 fokussiert die neuartige Herangehensweise, die Fähigkeit zur Auswahl von digitalem Lernmaterial als Ansatz zur Bewertung der digitalen Kompetenz von (angehenden) Mathematiklehrkräften zu konzipieren, zu messen und zu validieren. Beitrag 4 prüft die prognostische Validität der Emotionsregulation von berufstätigen Lehrkräften, um darauf aufbauend evidenzbasierte Interventionen entwickeln zu können. Damit soll perspektivisch dem Desiderat begegnet werden, weitreichende Wirksamkeitsnachweise in Untersuchungsdesigns umzusetzen (vgl. z.B. Kennedy, 2016). Die Beiträge werden von der Diskutantin Prof.in Dr.in Gabriele Kaiser (Universität Hamburg) eingeordnet und reflektiert. Dabei wird u.a. die Frage adressiert, welche Rolle die Kompetenzforschung (z.B. im TEDS-Forschungsprogramm), aber auch benachbarte theoretische Ansätze (z.B. zum Expertise-Erwerb) eine zentrale Rolle einnehmen und den Ansatz einer Wirksamkeitsforschung in Bezug auf die professionelle Entwicklung von Lehrer:innen bestimmen (vgl. Kaiser et al., 2015; Kaiser & König, 2019). Beiträge des Symposiums Wirksamkeit der Lehrer:innenbildung als Forschungsparadigma: Eine Synthese von 27 Literaturreviews König Johannes, Heine Sandra, Kramer Charlotte, Weyers Jonas, Becker-Mrotzek Michael, Großschedl Jörg, Hanisch Charlotte, Hanke Petra, Hennemann Thomas, Jost Jörg, Kaspar Kai, Rott Benjamin, Strauß Sarah Universität zu Köln Theoretischer Hintergrund Mit der Forschung zur Wirksamkeit der Lehrer:innenbildung verbindet sich generell die Aufgabe, Hinweise zu erbringen, welche Stärken und Schwächen in einem bestimmten Lehrer:innenbildungsprogramm oder -system bestehen, welche Aus- und Fortbildungselemente gut gelingen, welche modifiziert werden sollten, welche Kritik gerechtfertigt ist und welche möglicherweise unberechtigt geäußert wird (vgl. Hascher, 2014; König & Blömeke, 2020). Über die vergangenen Jahrzehnte haben zahlreiche Literatur-Reviews versucht, empirische Studien zur Wirksamkeit von Lehrer:innenbildung zusammenzufassen (z.B. Cochran-Smith & Villegas, 2015). Zwar leisten solche Reviews einen bedeutsamen Beitrag zu der Frage, was empirische Forschung zur Lehrer:innenbildung aller Phasen umfassen könnte – einschließlich der Frage wie Lehrer:innenbildung erachtet wird, wirksam zu sein angehende Lehrkräfte auszubilden und berufstätige Lehrkräfte fortzubilden. Doch ist der Forschungsstand noch immer begrenzt, wenn es um eine allgemeinere und übergreifende Perspektive auf die empirische Forschung zur Wirksamkeit von Lehrer:innenbildung geht. Ein mögliche Erklärung dafür könnte sein, dass heterogene Forschungsansätze bestehen, die sich nur schwer vergleichen lassen (z.B. Kennedy, 2016). Die hohe Relevanz des Forschungsgegenstandes war der Beweggrund für die Erarbeitung einer Synthese von Literatur-Reviews empirischer Studien zur Wirksamkeit von Lehrer:innenbildung, um den Erkenntnisfortschritt bezüglich eines entsprechenden Überblickswissens voranzubringen. Fragestellungen Mit einer Synthese von Literatur-Reviews wurden folgende Kernfragen bearbeitet: (1) Welche größeren theoretischen Rahmungen werden verwendet? (2) Welche Outcome-Maße dienen als Kriterien für Wirksamkeit von Lehrer:innenbildung? (3) Welche Maßnahmen und Charakteristika bilden die Prozesse, welche als effektiv betrachtet werden? (4) Welche zentralen Forschungslücken sollten in zukünftiger empirischer Forschung zur Wirksamkeit von Lehrer:innenbildung adressiert werden? Methode Mithilfe einer systematischen Literaturrecherche konnten 27 einschlägige Literatur-Reviews identifiziert werden, die im Zeitraum der letzten drei Jahrzehnte (1993-2023) publiziert wurden (König et al., 2023/im Druck). Dabei wurde „Lehrer:innenbildung“ breit verstanden und auf alle Phasen der Professionalisierung von Lehrkräften bezogen – nämlich Erstausbildung, Induktionsphase bzw. Berufseinstieg (z.B. Vorbereitungsdienst bzw. Referendariat in Deutschland), Fortbildung berufstätiger Lehrkräfte. Zu den vier genannten Fragestellungen wurde in einem Wechselspiel deduktiver und induktiver Herangehensweise ein Kategoriensystem entwickelt, wobei die Analysekategorien (zwischen drei und sechs Kategorien pro Forschungsfrage) als Leitlinie für eine thematische Analyse dienten. Anteilig konnte auch für einzelne Kategorien eine qualitative Inhaltsanalyse angewendet werden. Die entsprechend durchgeführte Synthese von Reviews ist (u.a. angesichts der anzutreffenden Heterogentität der 27 Reviews) als „Scoping-Review“ und nicht als „systematisches Review“ zu bezeichnen (Munn et al., 2018). Ergebnisse Als zentrale Ergebnisse können hervorgehoben werden: Bezüglich Forschungsfrage (1) zeigte sich, dass nur wenige Reviews überhaupt auf eine umfassende theoretische Rahmung eingehen; die meisten Reviews wenden Wirksamkeitsforschung an, um spezifische Themenschwerpunkte zu fokussieren und zu analysieren, etwa zu den Bereichen digitaler Bildung (Ma et al., 2023; Perry et al., 2021), Well-Being (Shepherd et al., 2016) oder Unterrichtsplanungskompetenz (König & Rothland, 2022). Hinsichtlich der Forschungsfrage (2) stellte sich heraus, dass Outcome-Messungen sehr oft auf (modellhafte) Vorstellungen von Lehrkomptenz bezogen sind; hier sind insbesondere die erwarteten Kompetenzzuwächse die eigentlichen Outcomes der empirischen Forschung zur Wirksamkeit von Lehrer:innenbildung. Bezüglich der Forschungsfrage (3) wurde deutlich, dass “Kurse” (bzw. Trainings, Seminare) als Kategorie die prozessbezogenen Maßnahmen oder Charakteristika in empirischen Studien dominieren, während z.B. Ausbildungsprogramme oder auch praktische Einheiten von Lerngelegenheiten (z.B. Schulpraktika) weitaus seltener die Kategorien einer Überprüfung darstellen. Letztlich zeigte sich hinsichtlich Forschungsfrage (4), dass Rahmenmodelle der Outcome-Messungen in der Kritik stehen – theoretisch, aber vor allem forschungsmethodisch. Darüber hinaus können weitere zentrale Forschungslücken identifiziert werden. Diskussion Auf Basis der gewonnenen Erkenntnisse, vor allem basierend auf grundsätzlichen Unterscheidungen, die in den Reviews getroffen wurden, konnte in einem Folgeschritt eine Klassifikation entwickelt werden, die Prozesse und Kriterien in einer Matrix systematisiert (sog. processes-and-criteria classification (PCC) of basic distinctions in teacher education effectiveness research). Wie die entwickelte Klassifikation eine Orientierung für zukünftige empirische Studien zur Wirksamkeit der Lehrer:innenbildung zu leisten vermag, soll im Vortrag dargelegt und diskutiert werden. Effektiv(e) Klassenführung lernen - Wirksamkeit von Unterrichtsvideos in der universitären Lehramtsausbildung zur Förderung der professionellen Kompetenz Sarah Strauß, Kramer Charlotte, König Johannes, Arnold Sophie, Darge Kerstin Universität zu Köln Theoretischer Hintergrund Eine zentrale berufliche Anforderung von Lehrkräften ist eine effektive Klassenführung. Sie gilt als Basisdimension qualitätsvollen Unterrichts (Klieme, 2018) und erweist sich in Metaanalysen als ein Merkmal mit großer Vorhersagekraft für die Lernleistung von Schüler:innen (Hattie, 2012; Wang et al., 1993). Es zeigt sich jedoch, dass Lehramtsstudierende und Junglehrkräfte ihr Wissen über Klassenführung als unzureichend einschätzen und sich durch ihre Ausbildung auf diese berufliche Anforderung nicht hinreichend vorbereitet fühlen (Jones, 2006; Poznanski et al., 2018). Die Diskrepanz zwischen der Relevanz von Klassenführung für ein erfolgreiches Unterrichten und der Einschätzung der (angehenden) Lehrkräfte zu ihren Fähigkeiten, rückt das Thema Klassenführung auch in den Fokus der universitären Lehrkräftebildung. Um den Anforderung der Klassenführung gerecht zu werden, gelten neben Wissen und affektiv-motivationalen Merkmalen auch situationsspezifische Fähigkeiten als zentrale Aspekte der professionellen Kompetenz von Lehrkräften (Kaiser & König, 2019; Sherin et al., 2011). Diese lassen sich in die Wahrnehmung von lehr- und lernrelevanten Aspekten, deren Interpretation und das Treffen von (weiterführenden) Handlungsentscheidungen unterteilen (Blömeke et al., 2015). Unterrichtsvideos können vor allem diese situationsnahen Kompetenzfacetten bei Studierenden erfolgreich fördern (Gold et al., 2016; Kramer et al., 2017). Obwohl sich die Forschung zu den situationsspezifischen Fähigkeiten in den letzten zwei Jahrzehnten stark entwickelt hat (König et al., 2022) und das Thema Klassenführung vermehrt in Interventionsstudien bearbeitet wird (Junker & Holodynski, 2022; Weber et al., 2020), fehlen diesbezüglich empirische Nachweise zur Wirksamkeit der (universitären) Lehrkräftebildung, die u.a. in methodisch anspruchsvolle Designs umgesetzt werden (König et al., 2023/im Druck) und über einzelne punktuelle Interventionen hinaus gehen. Fragestellung Im Rahmen des an der Universität zu Köln laufenden Verbundprojekts „Proving the Effectiveness of Teacher Education“ bearbeiten wir die Frage nach der Wirksamkeit einer neu entwickelten videobasierten Intervention zur Förderung der klassenführungsspezifischen Kompetenzen bei Lehramtsstudierenden. Dabei stehen ein methodisch anspruchsvolles Design, standardisierte Testungen der klassenführungsspezifischen Kompetenzen sowie das Ziel einer breiten Implementation der Intervention im Vordergrund. Methode Im Wintersemester 2023/24 findet mit der Pilotierung einer Lehrveranstaltung zur Förderung der Klassenführungskompetenz von Lehramtsstudierenden der erste (ca. n=150) von vier Durchläufen einer Interventionsstudie statt. Mittels eines quasi-experimentellen Designs wird untersucht, ob das Wissen, affektiv-motivationale Merkmale und die situationsspezifischen Fähigkeiten im Anforderungsbereich der Klassenführung mit dieser Intervention bei Lehramtsstudierenden im Master gefördert werden können. Im Fokus der Intervention steht die intensive Auseinandersetzung der Studierenden mit konkreten Anforderungen der Klassenführung und die Analyse dieser in authentischen Unterrichtssituationen, spezifiziert über reale Unterrichtsvideos. Zwei Masterseminare („Modellseminare“) erarbeiten das Thema Klassenführung tiefgreifend über das gesamte Semester. In zwei weiteren Seminaren („Anwendungsseminare“) werden in sieben Sitzungen zentrale Inhaltsbereiche von Klassenführung in Form standardisierter Materialien, d.h. wissenschaftlicher Texte und Unterrichtsvideos bearbeitet. Ein weiteres Seminar, das zwar das Thema Klassenführung neben einer Vielzahl anderer Themen betrachtet, aber keine Analysen von Unterrichtsvideos durchführt, stellt die Kontrollgruppe dar. Alle fünf Seminare werden zu Beginn und zum Ende des Semesters mit standardisierten u. a. videobasierten Messinstrumenten getestet. Hierzu gehört ein neu entwickelter erstmalig auf Klassenführung fokussierter Wissenstest (TCM-Wissenstest, König et al., 2024/Pre-Print), ein erprobtes und bereits mehrfach genutztes videobasiertes Instrument zur Erfassung der klassenführungsspezifischen situationsspezifischen Fähigkeiten der Wahrnehmung und Interpretation (CME; König, 2015) und eine Erweiterung dieses Instruments für den Bereich des Entscheidens (CME-Decide; Weyers et al., in Begutachtung). Ab dem darauffolgenden Semester ist stehen engen Qualitätskriterien hinsichtlich der Messung und des Studiendesigns im Fokus, hierzu gehören u.a. Merkmale wie die Randomisierung der Studierenden (vgl. Hill et al., 2021). Ergebnisse Im Vortrag werden erste Ergebnisse zur angenommenen Lernwirksamkeit in Klassenführungskompetenzen der Intervention präsentiert und Implementationsziele aufgezeigt und diskutiert. Erwartet werden Zuwächse im Wissen, für die Modell- und Anwendungsseminare im mittleren Bereich und für die situationsspezifischen Fähigkeiten für die Modellseminare im mittleren und für die Anwendungsseminare im kleinen Bereich. Die Auswahl digitaler Lernmaterialien als Ansatz zur Bewertung der digitalen Kompetenz für die Beurteilung der Wirksamkeit von Lehrer:innenbildung Peter Gonscherowski, Benjamin Rott Universität zu Köln Theoretischer Hintergrund Digitale Kompetenzen sind für (angehende) Lehrer:innen wichtig, um Lernende zur aktiven Teilnahme an den zunehmend digitalen gesellschaftlichen Prozessen zu befähigen und um möglichen Bildungsungleichheiten mit dem Potenzial digitaler Technologien entgegenzuwirken. Aufgrund des großen Angebots an digitalem Lernmaterial (dLM) und digitaler Technologie (dT) hat die Fähigkeit, entsprechende Ressourcen auszuwählen, einen hohen Stellenwert für die Lehrer:innenbildung. Um den Erfolg der Vermittlungsprozesse bezüglich der Auswahlfähigkeit von angehenden Lehrer:innen – als Teil von digitalen Kompetenzen – zu messen, bedarf es objektiver, reliabler und valider Items und Instrumente. Fragestellung Wir gehen der Frage nach, wie das Konstrukt der Auswahlfähigkeit gemessen werden kann und geben erste Einblicke hinsichtlich der Validität des Konstrukts. Wir stellen vier offene und geschlossene Items zur Erfassung der Auswahlfähigkeit vor, die als Teil eines digitalen Kompetenzinstrumentes entwickelt wurden. In den Items für die Auswahlfähigkeit werden die Begründungen über den Einsatz oder Nicht-Einsatz von dLM bei der Unterrichtsplanung für eine zu definierende Schulstufe und Förderschwerpunkt (FSP) und Lerninhalt bewertet. Methode Theoretische Grundlage der entwickelten Items sind der europäische DigCompEdu (Redecker & Punie, 2017) und das TPACK-Modell (Mishra & Koehler, 2006), ergänzt um die anglo-amerikanischen Kernunterrichtspraktiken nach Grossman (2018) und das allgemeine Lehrerkompetenzmodell von Blömeke et al. (2015). Basierend auf der Konzeptualisierung wurde die Auswahlfähigkeit von dLM als situationsspezifische Entscheidung, die auf der Interpretation und Wahrnehmung von Kontextfaktoren beruht, im Modell nach Blömeke et al. (2015) verortet. Nach dem Modell von Blömeke et al. (2015) erfordert eine fundierte Begründung einer Entscheidung prädiziertes Wissen, insbesondere Wissen über den Lerninhalt, den ein dLM zu vermitteln beabsichtigt, und dessen Verortung in lokalen Lehrplänen (Mishra & Koehler, 2006). Um das prädizierte Wissen zu bewerten, wird in einigen Items nach dem Verständnis der Lerninhalte, die ein dLM vermitteln soll, nach der Klassenstufe der Lernenden und nach eventuell vorhandenen sonderpädagogischen Bedürfnissen der Lernenden, für die das dLM eingesetzt werden soll, gefragt. Ebenso werden die Gründe, warum ein gegebenes dLM für die zuvor spezifizierte Lerngruppe und den Lerninhalt verwendet werden sollte oder nicht, in einem Item festgehalten. Für die Operationalisierung haben wir unter Berücksichtigung der Ergebnisse von Gonscherowski und Rott (2022) ein dLM für einen mathematischen Inhalt in einen größeren Onlinetest mit den Items eingebettet. Ergebnisse Die deskriptiven und inferenzstatischen Auswertungen der Daten des Onlinetests mit angehenden Mathematiklehrer:innen (n = 395) von je einer Universität in Deutschland und in Österreich haben gezeigt, dass die Items eine objektive Messung der Fähigkeit ermöglichen – Interrater-Übereinstimmung bei der Kodierung der offenen Items lag im nahezu perfekten Bereich. Die theoretische und unterrichtspraktische Konzeptualisierung des Ansatzes und der Items trägt zur Validität bei. Einfaktorielle ANOVAs zeigen, dass die Ergebnisse von der Anzahl der Studiensemestern und der angestrebten Schulstufe der angehenden Lehrkräfte statistisch signifikant abhängig waren. Eine Spearman-Korrelation zeigt eine statistische signifikante Abhängigkeit von prädiziertem Wissen und fundierter Argumentation auf. Die Berechnung von Cronbachs-Alpha der entwickelten Items zur Messung der Auswahlfähigkeit von dLM und identisch konzipierter und operationalisierter Items zur Messung der Auswahlfähigkeit von dT ergaben einen akzeptablen Wert und zeigen die Zuverlässigkeit der Messung an. Diese empirischen Ergebnisse belegen, dass die Items geeignet sind, verschiedene Kompetenzniveaus zu differenzieren, und stimmen mit der weithin akzeptierten Vorstellung überein, dass Fähigkeiten von (prädiziertem) Wissen abhängen (Blömeke et al., 2015). Zusammenfassend zeigen die Ergebnisse – trotz einiger Limitationen wie z. B., dass die empirischen Ergebnisse nur auf Daten von angehenden Mathematiklehrer:innen von nur zwei Universitäten beruhen, und zur Erfassung der Bewertung der Auswahlfähigkeit wurde nur ein dLM und nur eine Argumentation betrachtet –, dass das Konstrukt, die Fähigkeit zur Auswahl von dLM zu messen, eine neue und valide und reliable Möglichkeit für die Überprüfung der Wirksamkeit von Lehrer:innenbildung darstellt. Die Fähigkeit zu Emotionsregulation sagt Stresserleben bei Lehrkräften an inklusiven Grundschulen in Nordrhein-Westfalen voraus Hanna Rauterkus¹, Thomas Hennemann¹, Tobias Hagen¹, Johanna Krull¹, Jannik Nitz¹, Katrin Eiben¹, Pawel Kulawiak², Leonie Verbeck¹, Charlotte Hanisch¹ ¹Universität zu Köln, ²Universität Potsdam Theoretischer Hintergrund Der Lehrer:innenberuf wird von vielen Lehrkräften als sehr befriedigend empfunden, aber er ist auch ein Beruf, der nach wie vor mit Gesundheitsrisiken verbunden ist. In Deutschland kommen psychische und psychosomatische Erkrankungen bei Lehrkräften häufiger vor als in anderen Berufen, ebenso wie unspezifische Beschwerden wie Erschöpfung, Müdigkeit, Kopfschmerzen und Verspannungen (Scheuch et al., 2015). Die Hauptgründe für Frühpensionierungen in Deutschland sind psychische und psychosomatische Erkrankungen, die zusammen 32-50 % der Fälle ausmachen (Scheuch et al., 2015). Eine aktuelle Übersichtsarbeit bestätigt, dass Stress, Burnout, Ängste und Depressionen bei Lehrkräften auch international ein Problem darstellen (Agyapong et al., 2022). Neben der sehr hohen Relevanz für den einzelnen Lehrer oder die einzelne Lehrerin unterstreicht der Lehrkräftemangel in Deutschland die Notwendigkeit effektiver Präventionsmaßnahmen, um Lehrer:innen gesund und lange in ihrem Beruf zu halten. Die Teilgruppe mentale Gesundheit und Wellbeing bei Lehrkräften und Schüler:innen der Emerging Group an der Universität zu Köln untersucht Bedingungsfaktoren von psychischer Gesundheit und Wohlbefinden im Setting Schule, um hieraus Präventions- und Interventionsmaßnahmen für Erwachsene und Kinder und Jugendliche abzuleiten (Leidig et al., 2021; Hanisch et al., 2019). Auf Seiten der Lehrkräfte sollen diese langfristig zur Prävention von arbeitsbezogenen Belastungen und Burnout beitragen. Aus- und Weiterbildung von Lehrkräften sollte entsprechend neben kognitiven, auch affektiv-motivationale professionelle Kompetenzen steigern wie beispielsweise im Modell von Kaiser und König (2019) vorgesehen. Bei Schüler:innen erhöhen psychischen Auffälligkeiten das Risiko für schulischen Misserfolg und weitere Gesundheitseinschränkungen, so dass eine schulische Stärkung von mentaler Gesundheit und Wellbeing für Kinder und Jugendliche sowohl der Gesundheitsförderung als auch der Sicherung von Bildungsteilhabe dienen kann (Nitz et al., 2023). Schüler:innen werden darüber hinaus von der mentalen Gesundheit ihrer Lehrkräfte beeinflusst: Hoher Lehrer:innenstress stellt insofern ein Risiko für Schüler:innen dar, als dass er mit einer geringeren Unterrichtsqualität und einem geringeren Lernerfolg verbunden ist (Klusmann, Richter & Lüdtke, 2016). Negative emotionale Reaktionen auf externe Stressoren sind entscheidend für die Entwicklung von Lehrer:innenstress (Montgomery & Rupp, 2005). Daher kann emotionale Kompetenz, d.h. die Fähigkeit, eigene und fremde Emotionen wahrzunehmen und eigene Emotionen auszudrücken und zu regulieren, einen bedeutsamen Beitrag zum Erhaltung der psychischen Gesundheit von Lehrer:innen leisten. Eine hohe emotionale Kompetenz wird auch mit einem besseren Klassenklima, positiven Beziehungen und größerer emotional-sozialer Kompetenz bei den Schüler:innen in Verbindung gebracht (Valente et al., 2018, Schonert-Reichl, 2017). Die Förderung von emotionalen Kompetenzen könnte daher Stress bei Lehrkräften verringern und darüber die Unterrichtsqualität, die Beziehungen, das Klassenklima und den Lernfortschritt unterstützen. Fragestellung In unserer Untersuchung gehen wir daher auf der Basis des theoretischen Hintergrunds folgenden Fragen nach: Lässt sich aus der emotionalen Kompetenz bei Lehrkräften Belastungserleben vorhersagen? Welche Komponenten emotionaler Kompetenz sind für diesen Zusammenhang besonders relevant und sollten daher im Rahmen von Aus- und Weiterbildung von Lehrkräften besonders gestärkt werden? Methode Zu diesem Zweck wurden 265 Lehrkräfte an inklusiven Grundschulen in Nordrhein-Westfalen zu Stresserleben und zu emotionalen Kompetenzen befragt. Eingesetzt wurden die Irritationsskala (Mohr, Rigotti & Müller, 2007) und der Emotionale-Kompetenz-Fragebogen (EKF, Rindermann, 2009), der die oben angesprochenen Facetten emotionaler Kompetenz erfasst. Die Befragung war Teil einer Interventionsstudie, die die Effekte des mehrstufigen, multimodalen und multiprofessionellen ‚multimo‘ Ansatzes (Hanisch et al., 2019) zur Prävention externalisierenden Problemverhaltens an inklusiven Grundschulen untersuchte. Ergebnisse Mehrstufige Regressionsanalysen zeigten, dass der wahrgenommene Stress durch die "Regulation und Kontrolle eigener Emotionen" (- 0,53 (std. B), p< .001), nicht aber durch die "Wahrnehmung eigener" und "fremder Emotionen" oder den "Ausdruck von Emotionen" vorhergesagt wurde. Die Fähigkeit zur Emotionsregulation kann somit als Schutzfaktor für die Gesundheit von Lehrern verstanden werden. Die Ergebnisse werden im Hinblick auf die Lehrer:innen Aus- und -weiterbildung diskutiert.
15:20 - 17:00	3-05: Messung und Förderung schriftsprachlicher Fähigkeiten Ort: H01
	Symposium Messung und Förderung schriftsprachlicher Fähigkeiten Chair(s): Johannes Hartig (DIPF Frankfurt) Diskutantin(nen): Nina Jude (Universität Heidelberg) Schriftsprachliche Fähigkeiten sind von zentraler Bedeutung für den Bildungserfolg und spielen eine Schlüsselrolle in zahlreichen gesellschaftlichen Bereichen. Die Entwicklung dieser Fähigkeiten sowie ihre Messung sind hoch relevante Forschungsfelder der empirischen Bildungsforschung, das von verschiedenen Fachgebieten in fruchtbarem Austausch intensiv untersucht wird. Angesichts der Vielfalt der Anwendungsbereiche von Sprache, unterschiedlicher Textformen, der komplexen Natur sowohl rezeptiver als auch produktiver Fähigkeiten und der Berücksichtigung verschiedener Sprachen (Muttersprachen, Fremdsprachen und Unterrichtssprachen) bleibt dieses Forschungsfeld trotz langjähriger Untersuchungen dynamisch und aktiv. Das Symposium präsentiert aktuelle Forschungsergebnisse zur Messung und Förderung schriftsprachlicher Fähigkeiten aus verschiedenen am Feld beteiligten Fächern (Sprachdidaktik, Erziehungswissenschaften, Psychologie und Computerlinguistik). Es werden schriftsprachliche Fähigkeiten in Deutsch als Unterrichtssprache, Englisch als Fremdsprache und in nicht-deutschen Herkunftssprachen untersucht. Die Fragestellungen reichen von der grundsätzlichen Konzeptualisierung der Kompetenzkonstrukten über verschiedene Messmethoden bis zur Förderung der sprachlichen Entwicklung. Der erste Beitrag primär konzeptionelle Beitrag befasst sich mit der grundsätzlichen Definition (schrift-) sprachlicher Fähigkeiten und ihrer Messung am Beispiel der 2022 weiterentwickelte KMK-Bildungsstandards im Fach Deutsch. Ein Schwerpunkt liegt hier auf Möglichkeiten und Grenzen des computerbasierten Assessments. Im zweiten Beitrag wird anhand eines computerbasierten Assessments für Englisch als Fremdsprache untersucht, welche diagnostischen Informationen aus den beim Schreiben aufgezeichneten Logdaten gewonnen werden können. Auch der dritte Beitrag behandelt die computerbasierte Erfassung von schriftsprachlichen Fähigkeiten in Englisch als Fremdsprache. Hier wird untersucht, wie eine visualisierte Annotation von Textqualität in argumentativen Essays hergestellt werden kann und wie diese diagnostisch, aber auch für Feedback zu Trainingszwecken genutzt werden kann. Der vierte Beitrag befasst sich schließlich mit mehrsprachigen Schreibfähigkeiten in Deutsch als Unterrichtssprache, nicht-deutschen Herkunftssprachen und Englisch als Fremdsprache. Es wird untersucht, inwieweit verschiedene sozio-kontextuelle Einflussfaktoren die Entwicklung dieser Fähigkeiten unterschiedlich beeinflussen. Die Ergebnisse der in den Beiträgen vorgestellten Forschung tragen zu einem besseren Verständnis der Konstrukte bei, mit denen interindividuelle Unterschiede in schriftsprachlichen Fähigkeiten beschrieben werden können. Dieses tiefere Verständnis erlaubt eine bezogen auf die Konstrukte validere Messung und eine gezieltere Förderung schriftsprachlicher Fähigkeiten. Ein abschließender Diskussionsbeitrag adressiert unter anderem Limitationen und künftigen Forschungsbedarf sowie die Entwicklungsperspektiven einer immer stärker technologiebasierten Messung sprachlicher Fähigkeiten. Beiträge des Symposiums Der Kompetenzbereich „Schreiben" in den neuen Bildungsstandards der KMK - Folgen für die Testung von Schreibfertigkeiten und Schreibkompetenzen Michael Krelle¹, Philipp Franikowski², Jörg Jost³, Pauline Kohhrt² ¹Technische Universität Chemnitz, ²Institut zur Qualitätsentwicklung im Bildungswesen (IQB), ³Universität zu Köln Theoretischer Hintergrund Im Mittelpunkt dieses Beitrags stehen konzeptionelle Überlegungen zum technologiebasierten Assessment (TBA) von Schreibfertigkeiten und Schreibkompetenzen. Ausgehend von den 2022 weiterentwickelten KMK-Bildungsstandards im Fach Deutsch werden in dem Beitrag Modelle (testbarer) Schreibfertigkeiten und -kompetenzen diskutiert. Dabei spielen fachdidaktische Erwägungen u. a. zur Bildung in der digitalen Welt eine zentrale Rolle. Während nämlich handschriftlich Zeichen graphomotorisch auf physische Oberflächen (z. B. auf Papier) formiert und die Oberflächen verändert werden, werden beim digitalen Schreiben vorgeformte Zeichen (von einer Tastatur, einem Display etc.) ausgewählt, ohne dass es zu physischen Veränderungen kommt. Daraus resultieren unterschiedliche Modi des Schreibens, die sich gleichermaßen auf das „Wie“ (Schreibfertigkeiten, Schreibflüssigkeit, Schreibstrategien etc.) und auf das „Was“ (Textsorten, Kommunikationsformen etc.) beziehen. In der Forschung werden vor diesem Hintergrund Effekte berichtet, die sich auf die jeweiligen Varianten „technologiebasiert“ (TBA) und „papierbasisert“ (PBA) beziehen. Berichtet werden u. a. Moduseffekte sowie formatspezifische Leistungsunterschiede (u. a. Wagner et al. 2021). Teils lassen sich die Unterschiede sogar bis auf einzelne Lupenstellen bzw. Fehlerschwerpunkte beziehen, z. B. auf die Groß-Kleinschreibung, aber auch die Vokalkürze (u. a. Frahm 2012). Jung et al. (2021) berichten zudem über eine Zunahme des Korrekturverhaltens im Rahmen der digitalen Testungen. Vor diesem Hintergrund werden in dem konzeptionellen Beitrag Konsequenzen für die Testentwicklung im Fach Deutsch in der Primar- und der Sekundarstufe aufgezeigt und es wird aus der aktuellen Aufgabenentwicklung des IQB berichtet. Fragestellungen Welche konzeptionellen Veränderungen müssen bei der Umsetzung von Testaufgaben zur Orthografie in das TBA-Format bedacht werden? Methode Es wird anhand von Beispielen aus der aktuellen Entwicklung von Aufgaben zu den weiterentwickelten Bildungsstandards berichtet (k = 300 Aufgaben je Jahrgangsstufe), die 2026 (Primarstufe) bzw. 2027 (Sekundarstufe) normiert werden sollen. Dazu werden konzeptionelle Überlegungen zu Testaufgaben präsentiert. Die Aufgaben werden aktuell mit Lehrkräften, Fachdidaktikerinnen und Bildungsforscherinnen entwickelt. Ergebnisse und ihre Bedeutung Bereits in der Entwicklung ist absehbar, dass bestimmte Aufgabentypen (Korrekturaufgaben, Richtig-Falsch-Aufgaben, Sortieraufgaben, Begründungsaufgaben) ohne Einschränkungen in das TBA-Format überführt werden können. Gleichwohl stellen insbesondere die Korrekturaufgaben besondere Anforderungen an die digitale Umsetzung vorzunehmender Korrekturen orthografisch falscher Schreibungen. Beim Aufgabenformat der Lückensatzdiktate schließen sich weitere Studien zum Vergleich der TBA- und PBA-Formate an (N = ca. 1000 in 2024). Ergänzend soll eine Videostudie (N = 50) in 2024 hier Hinweise dazu geben, wie Schülerinnen mit der neuen Variante der Testung umgehen, in der manche Aufgabenformate im TBA-Format, Lückensatzdiktate aber auf Papier angeboten werden. Eine solche „Tablet-Papier-Hybridvariante“ scheint aus fachwissenschaftlicher und fachdidaktischer Sicht für den Gegenstand „orthografisches Schreiben“ besonders angemessen zu sein. Wie Schülerinnen aber mit dem Wechsel zwischen Handschrift und digitaler Bearbeitung umgehen, wird erst Teil dieser Studie sein. Eine Sequenzanalyse von Prozessen und Strategien bei der Bearbeitung integrierter Schreibaufgaben im English for Academic Purposes Ximena Delgado-Osorio¹, Johannes Hartig¹, Claudia Harsch², Valeriia Koval² ¹DIPF Frankfurt, ²Universität Bremen Theoretischer Hintergrund Integrierte Schreibaufgaben, insbesondere im Kontext von English for Academic Purposes (Hirvela, 2016), werden immer beliebter, um die Kombination von Verstehen (Lesen) und produktiven Fähigkeiten (Schreiben) zu bewerten (Chan, 2013). Da solche Aufgaben den koordinierten Einsatz von Fähigkeiten und Handlungen in einem begrenzten Zeitrahmen erfordern, wenden die Lernenden verschiedene Strategien an, um die Aufgabe erfolgreich zu bewältigen (Cho & Lee, 2016; Payant et al., 2019). Die Forschung zur strategischen Verarbeitung konzentriert sich hauptsächlich auf die Vielfalt der eingesetzten Strategien und Prozesse, weniger jedoch auf die Frage, wann und wo diese Strategien am effektivsten sind (Dinsmore et al., 2020). Für das integrierten Schreibens wurde diese Forschung größtenteils durch selbstberichtete Messungen und Think-Aloud-Protokolle durchgeführt. Beispielsweise zeigen die Studien von Plakans (2008, 2009a, 2009b), dass Schreibende mit höherer Kompetenz stärker mit dem Ausgangstext interagieren und mehr globale Lesestrategien anwenden, während weniger erfahrene Schreibende vermehrt lokale Lesestrategien nutzen. Mit der zunehmenden Verbreitung computerbasierter Testverfahren hat die Forschung begonnen, Prozesse und Strategien bei der Verarbeitung von Aufgaben mithilfe von Log-Daten zu untersuchen. In der Schreibforschung hat beispielsweise die Verwendung von keystrokes zur Untersuchung von Schreibprozessen und -strategien zugenommen (z. B. Larios et al., 2001; Talebinamvar & Zarrabi, 2022; Révész et al., 2022). Fragestellung Aufbauend auf bestehender Forschung zum integrierten Schreiben und den Schreibprozessen besteht das Ziel dieser Studie darin, Prozesse und Strategien des integrierten Schreibens sequenzanalytisch zu untersuchen. Insbesondere interessieren uns dabei folgende Fragen: 1) Ist es möglich, bestimmte Muster bei der Verarbeitung (Prozesse und Strategien) integrierter Schreibaufgaben zu identifizieren? 2) Wie ist die Verteilung dieser Muster in den verschiedenen integrierte Schreibaufgabentypen? 3) Wie stabil sind diese Muster innerhalb von Personen, d.h. bei der Verarbeitung von zwei Aufgaben durch denselben Teilnehmer: in? 4) Besteht ein Zusammenhang zwischen den Verhaltensmustern bei der Bearbeitung integrierter Schreibaufgaben und der Textqualität der resultierenden integrierten Schreibprodukte? Methode Insgesamt wurden vier integrierte Schreibaufgaben entwickelt, die auf wissenschaftlichen Einführungstexten aus den Bereichen Sozial- und Naturwissenschaften basieren. Zwei dieser Aufgaben erforderten von den Teilnehmenden die Erstellung einer Zusammenfassung, während es sich bei den anderen beiden um Stellungnahmen handelte. Die Ausgangstexte hatten jeweils etwa 1000 Wörter, und die erwartete Länge des schriftlichen Produkts lag zwischen 300 und 350 Wörtern. Die Untersuchung umfasste eine Stichprobe von 379 Abiturient: innen und Studierenden in englischsprachigen Studiengängen. Jede/r Teilnehmende bearbeitete online eine oder zwei der integrierten Schreibaufgaben, die zufällig zugeteilt wurden. Die 601 verfassten Textprodukte wurden anschließend von sechs geschulten Bewertenden anhand einer fünfstufigen Bewertungsskala anhand von neun Analysekriterien bewertet (z.B. Verwendung des Ausgangtextes, Diskurssynthese, sprachlichen Qualität). Um die Sequenzen von Prozessen und Strategien zu analysieren, extrahierten wir die Log-Daten der Aufgabenverarbeitung. Diese Log-Daten wurden als Zustände definiert, die als relevante/r Prozess oder Strategie betrachtet werden (z.B. Ausgangstext scrollen, Hervorheben, Notizen machen, flüssiges Schreiben, Bearbeiten des Geschriebenes, Pause). Anschließend führten wir die Sequenzanalysen mit dem R-Paket TraMineR (Gabadinho et al., 2011) durch, identifizierten Cluster und führten deskriptive sowie Varianzanalysen durch. Ergebnisse und ihre Bedeutung Die Analysen ergaben vier Muster bei der Verarbeitung von integrierten Schreibaufgaben: das „schnelle“ Muster, das „strategische“, das „Notizen-“ und das „geringe Interaktionsmuster“. Das „schnelle“ Muster erwies sich als am häufigsten angewendet, während das „Notizenmuster“ weniger häufig vorkam. Hinsichtlich der Stabilität der Muster in zwei integrierten Schreibaufgaben, die von demselben Teilnehmer durchgeführt wurden, fanden wir eine relativ hohe Assoziation zwischen den Mustern der ersten und der zweiten Aufgabe. Es gab jedoch eine Tendenz zum Wechsel auf das „schnelle“ Muster in der zweiten Aufgabe. Schließlich wiesen Aufgaben, die ein „strategisches“ Muster aufwiesen, signifikant höhere Textqualität auf im Vergleich zu Aufgaben, die ein „geringes Interaktionsmuster“ zeigten. Die Ergebnisse werden im Hinblick auf eine mögliche diagnostische Nutzung und auf Implikationen für die Anwendung in der Lehre diskutiert. Automatisierte Annotation von Textmerkmalen zu Beurteilungs- und Trainingszwecken Stefan Keller, Flavio Lötscher Pädagogische Hochschule Zürich Theoretischer Hintergrund Schreiben in der Fremdsprache Englisch gehört zu den zentralen Bildungszielen der gymnasialen Oberstufe und ist relevant für Studierfähigkeit und employability in einer zunehmend globalisierten Welt. Insbesondere das argumentative Schreiben nimmt dabei einen hohen Stellenwert ein. Es kann als Fähigkeit verstanden werden, die eigene Meinung zu einem Thema adressatenspezifisch zu strukturieren und mittels grammatischer und lexikalischer Mittel differenziert darzustellen, sodass Leserinnen wichtige Punkte erkennen und erinnern können (CEFR, 2001). In der Forschungsgruppe des Erstautors wurde in den letzten Jahren eine umfassende Analyse eines authentischen Korpus von english argumentative essays von Schülerinnen aus dem 11. Schuljahr zu zwei Schreibprompts aus dem TOEFL-Test vorgenommen („independent writing“). In der vorliegenden Studie wurden aus demselben Sample eine Gruppe von Texten vertieft analysiert. Die Annotationen von menschlichen Ratern zu zentralen Aspekten der Textqualität werden mit Hilfe von Algorithmen des natural language processing (Deane, 2013) vorhergesagt und hieraus Visualsierungen von Textqualitäten in den Schülertexten erstellt. Entsprechend „visualisierte“ Texte können in der Unterrichtspraxis wie auch der Forschung zu verschiedenen Zwecken verwendet werden. Eine erste Anwendungsmöglichkeit ist automatisiertes Feedback: Durch die automatisierte Annotation erhalten die Lernenden „live“ Rückmeldungen zu den Qualitäten ihrer Texte und können diese bei der Texterstellung nutzen. Eine zweite Anwendungsmöglichkeit ist das Training von diagnostischen Kompetenzen von Lehrpersonen (Coldarci, 1986). Die Visualisierungen können Lehrpersonen helfen, bestimmte Aspekte von Textqualität einfacher und genauer zu beurteilen. Auf diese Anwendung fokussiert der vorliegende Vortrag. Fragestellung Wie lassen authentische Schülertexte aus dem 11. Schuljahr (english argumentative essays), bei denen bestimmte Textmerkmale automatisch visualisiert sind, für das Training der diagnostischen Kompetenzen von Lehrpersonen nutzen? Methode Diese Studie basiert auf einem Korpus von N = 2289 Texten von Schülerinnen und Schülern aus dem 11. Schuljahr zu zwei Schreibprompts aus dem TOEFL Test („independent writing“; Rupp et al., 2019). Aus diesem Korpus wurden 100 Texte randomisiert ausgewählt und von Human Ratern vertieft analysiert. Im Beitrag werden zwei Textaspekte vorgestellt, nämlich „spelling“ und „argumentation quality“. Bei „spelling“ werden die Rechtschreibefehler in einem Text direkt von einer Software annotiert und danach im Text visualisiert. Durch menschliche Rater erfolgte danach ein „debugging“, wobei der Bereich der Rechtschreibung abgetrennt wurde von den Ebene Grammatik und Wortschatzqualität. Im Bereich „arumentation quality“ erfolgte ein Rating der Texte an Hand zentaler Elemente der Argumentation durch menschliche Beurteiler (claim, counterclaim, rebuttal, etc.). Die Inter-Rater Übereinstimmung war gut (Kappa = .8). Diese human ratings wurden händisch in Texten visualisiert. Ebenso laufen im Moment Versuche, diese human ratings durch Natural Language Processing (Deane, 2023) automatisch vorherzusagen. Ein einer Studie zur Diagnosekompetenz werden die visualisierten Texte (angehenden) Lehrpersonen zur Beurteilung auf analytischen Beurteilungsrastern vorgelegt. Es wird untersucht, ob die Visualisierungen den Probandinnen helfen, die visualisierten Texte gegenüber einem Benchmark Rating genauer zu beurteilen. Dabei wird also der Einfluss von Textvisualisierungen auf teacher judgment accuracy (Coladarci, 1986) untersucht. Als Versuchsgruppe dient eine Gruppe von Probandinnen und Probanden, welche die Texte ohne Visualisierungen beurteilen. Ergebnisse und ihre Bedeutung Datenerhebungen zur Studie „Visualisierung der Rechtschreibung“ beginnen im Oktober 2023, sodass in dem Beitrag erste Ergebnisse vorgestellt werden können (N = 100 Teilnehmer*innen). Wir erwarten, dass die Visualisierung von Aspekten der Rechtschreibung Lehrpersonen hilft, sprachliche Aspekte der Texte einfacher und genauer zu beurteilen. Gleichzeitig wird geprüft, ob diese Visualisierungen zu Halo-Effekten führen. Dies könnte z.B. bedeuten, dass bei vielen Rechtschreibefehlern auch negativere Bewertungen der Argumentation oder dem Inhalt der Texte entstehen. Die hier vorgestellten empirischen Studien können einen Einblick geben, wie moderne Techniken der (automatisierten) Textannotation Lehrpersonen bei ihrer Arbeit unterstützen können, z.B. durch Training ihrer diagnostischen Fähigkeiten. Sie können aber auch auf problematische Aspekte aufmerksam machen, z.B. Verzerrungen durch zu starke Aufmerksamkeit auf ein Merkmal. Diese Aspekte werden in dem Beitrag kritisch beleuchtet. Sozio-kontextuelle Einflussfaktoren auf mehrsprachige Schreibfähigkeiten und -praktiken Birger Schnoor, Irina Usanova Universität Hamburg Theoretischer Hintergrund Unsere Studie untersucht die Auswirkungen sozio-kontextueller Einflussfaktoren auf die Entwicklung mehrsprachiger Schreibfähigkeiten und -praktiken bei Sekundarschülern in Deutschland. Einem humankapitaltheoretischen Ansatz folgend, verstehen wir Effekte der sozialen Herkunft auf das Erlernen und die Praxis des Schreibens in mehreren Sprachen als Zusammenspiel von elterlichen Investitionen in das Humankapital ihrer Kinder sowie der Investitionen der Jugendlichen in ihr eigenes Humankapital. Der handlungstheoretische Investitionsmechanismus besteht dabei aus drei Elementen: der Motivation für Bildungsinvestitionen, dem Zugang zu Bildungsressourcen in Lernkontexten und der Effizienz des Lernprozesses (z. B. Chiswick & Miller, 1995; Esser, 2006; Schnoor, 2019). Die wachsende Anzahl von Forschungsarbeiten zur Entwicklung mehrsprachigen Schreibens bei Jugendlichen liefert Hinweise auf die vernetzte Natur von mehrsprachigen Schreibfähigkeiten innerhalb mehrsprachiger Repertoires (z.B., Schnoor & Usanova, 2023; Schoonen et al., 2011; Riehl, 2021). Allerdings ist wenig über den Einfluss sozio-kontextueller Faktoren auf die Entwicklung komplexer mehrsprachiger Schreibrepertoires bekannt, insbesondere bei Migrantenjugendlichen der zweiten Generation, die ihre Bildungskarrieren in Deutschland verbracht haben (Böhmer, 2015; Usanova, 2019). Methode Forschungsmethodisch muss man, um die Komplexität sozio-kontextuelle Einflüsse auf mehrsprachige Schreibfähigkeiten und -praktiken abbilden zu können, das gesamte mehrsprachige Schreibrepertoire der Jugendlichen berücksichtigen. Wir nutzen hierzu Daten der Längsschnittstudie "Mehrsprachigkeitsentwicklung im Zeitverlauf (MEZ)" (Gogolin et al., 2017), die die Entwicklung von Mehrsprachigkeit und deren Einflussfaktoren bei Sekundarschüler:innen mit und ohne Migrationshintergrund in Deutschland untersucht hat. Für unsere Analyse nutzen wir ein longitudinales Sample von lebensweltlich mehrsprachigen Jugendlichen mit deutsch-russichem (n = 996 Beobachtungen) oder deutsch-türkischem (n = 1832 Beobachtungen) Sprachhintergrund. Wir nutzen Testdaten zur Schreibfähigkeit in Deutsch (Mehrheitssprache), Russisch oder Türkisch (Herkunftssprache) und Englisch (erste Fremdsprache) sowie Fragebogendaten zu Schreibraktiken und Merkmalen der sozialen Herkunft. Zur statistischen Modellierung des oben genannten Investitionsmechanismus schätzen wir ein Fixed-Effects-Panelpfadmodell in Mplus. Die gewählte Art der Modellierung hat zwei zentrale Vorteile: Einerseits, erlaubt der pfadanalytische Ansatz, Effekte mehrerer unabhängigen Variablen (soziale Herkunft) auf mehrere abhängige Variablen (Schreibfähigkeiten, Schreibpraxen in Deutsch Herkunftssprache und Englisch) simultan zu schätzen. Andererseits ermöglicht die Panelstruktur der Daten die Bereinigung der geschätzten Pfadkoeffizienten um unbeobachtete Heterogenität, was, bei der Mannigfaltigkeit möglicher Einflussfaktoren auf mehrsprachige Schreibfähigkeit und -praktiken, die Interpretation der Ergebnisse erheblich erleichtert. Ergebnisse und ihre Bedeutung Unsere Ergebnisse zeigen, dass im Vergleich zum Deutschen die Schreibfähigkeiten und -praktiken in der Herkunftssprache und Englisch stärker von sozialen Kontextfaktoren beeinflusst werden. Darüber hinaus spielen die einzelnen sozialen Kontextfaktoren sehr unterschiedlich Rollen, je nachdem, ob man auf ihre Wirkung auf Schreibfähigkeiten oder -praxen betrachtet.
15:20 - 17:00	3-06: Lehrkraft- und Lernendenmerkmale als Prädiktoren sozialer Partizipation Ort: H08
	Symposium Lehrkraft- und Lernendenmerkmale als Prädiktoren sozialer Partizipation Chair(s): Sina Schürer (Universität Münster), Stefanie van Ophuysen (Universität Münster) Diskutantin(nen): Lysann Zander (Universität Hannover) In überdauernde, positive soziale Beziehungen eingebunden zu sein, ist eines der grundlegendsten menschlichen Bedürfnisse (Baumeister & Leary, 1995). Empirische Befunde belegen, dass mit der Nicht-Befriedigung dieses Grundbedürfnisses nach Zugehörigkeit gravierende negative Konsequenzen einher gehen (Ladd et al., 2017), während gelingende soziale Partizipation mit Wohlbefinden, schulischen Leistungen und Gesundheit assoziiert ist (z. B. Conesa et al., 2022; Stadtfeld et al., 2019). Dabei ist das Konstrukt der sozialen Partizipation komplex und facettenreich. Nach Koster et al. (2009) sind das Vorhandensein von positiven Interaktionen, die Akzeptanz durch die Peers, das Eingebundensein in reziproke Beziehungen sowie die Selbstwahrnehmung von sozialer Integration indikativ für soziale Partizipation. Befunde zur Ausprägung sozialer Partizipation in Schulklassen fallen je nach verwendeter Operationalisierung unterschiedlich aus. Zudem ist die Befundlage zu individuellen und klassenbezogenen Prädiktoren vielfältig. Es konnte wiederholt gezeigt werden, dass Kinder mit schwachen Schulleistungen, mit emotional-sozial auffälligem Verhalten und mit Migrationshintergrund unabhängig von der jeweiligen Operationalisierung sozialer Partizipation seltener sozial integriert und häufiger abgelehnt wurden (siehe zusammenfassend Böttinger, 2021; Schürer, 2020). Gleichzeitig zeigen sich deutliche Variationen zwischen den Klassen (z.B. Huber & Wilbert, 2012). In der Vergangenheit ergaben sich aus verschiedenen Studien erste Hinweise darauf, dass neben Merkmalen des Kindes auch Eigenschaften und Verhaltensweisen der Lehrkraft ein Faktor für die Entwicklung sozialer Partizipationsprozesse in der Schule sein könnten (siehe zusammenfassend Huber, 2019). Die genaue Rolle der Lehrkraft ist bislang jedoch noch unzureichend erforscht. So spricht Farmer (2011) von der Bedeutung der Lehrkraft als „invisible hand“ und Decristan et al. (2022) weisen darauf hin, dass geprüfte Erkenntnis fehlt, welches konkrete Lehrkraftverhalten bzw. welche Lehrkraftmerkmale prädiktiv für die soziale Partizipation sind. Dieses Forschungsdesiderat greifen die Beiträge des Symposiums auf und beleuchtet in vier Beiträgen die soziale Partizipation von Grundschulkindern. Im Zentrum steht dabei immer die Frage nach Zusammenhängen zwischen sozialer Partizipation und Lehrkraftmerkmalen bei gleichzeitiger Berücksichtigung weiterer Lernendenvariablen. In Beitrag 1 präsentieren die Autorinnen erste Ergebnisse aus dem vom BMBF-geförderten Projekt Komm Schreib!. Die Autorinnen analysieren mittels hierarchischer Regressionsmodelle den Zusammenhang der selbstwahrgenommenen sozialen Partizipation von Dritt- und Viertklässlerinnen mit der inklusiven Haltung der Lehrkraft als eine Variable auf Klassenebene bei gleichzeitiger Berücksichtigung von individuellen Variablen (Leistungsstand, emotional-soziale Kompetenz, Migrationshintergrund, sozioökonomischer Hintergrund). Im zweiten Beitrag werden Informationen zum verhaltens- und leistungsbezogenen Lehrkraftfeedback aus videografierten Mathematikstunden in Jahrgang 1 genutzt. Die Autorinnen analysieren zum einen die Frage nach verschiedenen Typen von Lehrkräften bezogen auf das Feedbackverhalten und zum anderen den Zusammenhang zwischen diesen Verhaltenstypen und der sozialen Ablehnung der Lernenden unter Berücksichtigung der Merkmale Sozialkompetenz und Leistung. In Beitrag 3 wird ein personenzentrierter Ansatz genutzt. Die Analysen zielen auf die Identifizierung von Lernendengruppen in der Jahrgangsstufe 1 anhand des erhaltenen Lehrkraftfeedbacks zu Sozialverhalten und Leistung (Beobachtungsdaten) sowie der Sozialkompetenzen und der sozialen Ablehnung der Lernenden (Fremdeinschätzung durch Peers). Die Gruppierung der Lernenden erfolgt durch latente Profilanalysen. Im letzten Beitrag wechseln die Autorinnen die Perspektive und legen den Fokus auf einzelne Dyaden. Die Autorinnen gehen der Frage nach, wie soziale Unsicherheit den Zusammenhang zwischen Lehrkraftfeedback und der Präferenz eines anderen Kindes als Sitznachbar moderiert. Mit psycho- und soziometrischen Daten von Dritt- und Viertklässlerinnen wird diese Fragestellung mehrebenenanalytisch unter Berücksichtigung der kreuzklassifizierten Datenstruktur überprüft. Die Beiträge werden abschließend zusammenfassend diskutiert. Allen Beiträgen gemeinsam ist der Fokus auf die soziale Partizipation von Grundschulkindern, wobei verschiedene Indikatoren sozialer Partizipation genutzt werden. Weiterhin nehmen alle Beiträge simultan Lernenden- und Lehrkraftmerkmale in ihrem Zusammenhang mit der sozialen Partizipation in den Blick. Dabei unterscheiden sie sich in Bezug auf das betrachtete Konstrukt (Inklusive Haltung, Lehrkraftfeedback) und den gewählten methodischen Zugang. Beiträge des Symposiums Soziale Partizipation in Grundschulklassen: Welchen Unterschied macht die inklusive Haltung der Lehrkraft? Yvonne Erhardt, Josephine Gatzweiler, Sina Schürer, Stefanie van Ophuysen Universität Münster Theoretischer Hintergrund Gelingende soziale Partizipation wird als eines der Hauptziele inklusiver Bildung verstanden (z.B. Grosche, 2015). Forschungsbefunde zeigen jedoch, dass die Einbindung aller Kinder gleichermaßen nicht durch inklusive Beschulung allein gesichert werden kann. So hat sich in empirischen Studien wiederholt gezeigt, dass individuelle Faktoren wie Migrationshintergrund, schwache schulische Leistungen und geringe emotional-soziale Kompetenz mit niedrigeren Werten für soziale Partizipation einhergehen. Dabei zeigen sich jedoch insbesondere für die selbstwahrgenommene soziale Partizipation widersprüchliche Befunde (Böttinger, 2021; Schürer, 2020). Farmer (2011) sieht daneben die Lehrkraft als entscheidende Kraft an, die als „invisible hand“ durch ihre Beziehungsgestaltung und ihr Verhalten Einfluss auf die Qualität der Peer-Beziehungen und damit die soziale Partizipation der Kinder nehmen kann (Endedijk et al., 2022). Lehrkräfte mit einer inklusiven Haltung – verstanden als die Wertschätzung von Individualität, Vielfalt und Gemeinschaft als Leitlinien ihres professionellen Handelns – sollten ihr Verhalten auf die Erreichung dieses Ziels ausrichten. Unterschiede in sozialer Partizipation zwischen Schulklassen (z. B. Huber & Wilbert, 2012) könnten somit – so unsere Annahme – auf Unterschiede in der inklusiven Haltung der Lehrkräfte zurückzuführen sein. Inwiefern eine stark ausgeprägte inklusive Haltung der Lehrkraft darüber hinaus dazu beiträgt, dass die Effekte von Merkmalen des individuellen Kindes abgeschwächt werden, so dass soziale Partizipation für alle Kinder gleichermaßen gelingt, ist unseres Wissens bislang nicht untersucht. Fragestellungen In unserem Beitrag gehen wir daher folgenden Fragen nach: 1) Nehmen Migrationshintergrund, schulische Leistungen und sozial-emotionale Kompetenzen Einfluss auf die soziale Partizipation? 2) Steht die inklusive Haltung der Lehrkraft in positivem Zusammenhang mit der individuellen sozialen Partizipation der Lernenden? 3) Variiert der Einfluss der Individualmerkmale auf die soziale Partizipation je nach Ausprägung der inklusiven Haltung der Lehrkraft? Methode In einer standardisierten Befragung wurden Daten von rund 1.500 Lernenden der Jahrgänge 3 und 4 aus 63 Klassen aus Nordrhein-Westfalen erhoben. Die selbstwahrgenommene soziale Partizipation wurde über einen psychometrischen Fragebogen (in Anlehnung an Rauer & Schuck, 2004) erfasst. Der Migrationshintergrund wurde über die Familiensprache erfasst. Für jedes Kind liegen weiterhin Lehrkraftangaben zu den schulischen Leistungen und den sozial-emotionalen Kompetenzen vor. Die inklusive Haltung wurde über ein selbstentwickeltes Instrument mit den drei Subskalen Vielfalt, Individuum und Gemeinschaft erhoben. Zur Beantwortung der Forschungsfragen werden Zwei-Ebenen-Modelle angepasst, und neben den Effekten auf Klassen- und Lernenden-Ebene werden Cross-Level-Interaktionen überprüft. Ergebnisse Da die Daten erst im August/September 2023 erhoben wurden, können an dieser Stelle erst vorläufige Befunde ohne die Berücksichtigung der hierarchischen Datenstruktur berichtet werden. Erste Analysen mit einer Teilstichprobe zeigen leichte Zusammenhänge zwischen der subjektiv wahrgenommenen sozialen Partizipation und den emotional-sozialen Kompetenzen der Lernenden (r=.206, p<.001, N=565), der Leistung (r=.138, p=.001, N=549) sowie dem Migrationshintergrund (M Mig: 3.0, M Dt: 3.11, t(644)= -2.304; p=.011, d=-.183, N=646). Die Ergebnisse werden mit Blick auf Implikationen für die schulische Praxis und weitere Forschungsfragen (im Rahmen des Forschungsprojektes) diskutiert. Der Zusammenhang zwischen Lehrkraftfeedback, Sozialverhalten und Ablehnung in standardisierten Mathematikstunden: Ergebnisse einer Videostudie Elisabeth Moser Opitz¹, Marion Diener¹, Brigitte Hepberger², Susanne Kuratli Geeler³, Ariana Garrote⁴ ¹Universität Zürich, ²Hochschule für Heilpädagogik, Zürich Zürich, ³Pädagogische Hochschule St. Gallen, ⁴Fachhochschule Nordwestschweiz Theoretischer Hintergrund Ablehnung durch die Peers kann sich negativ auf die Entwicklung von Lernenden auswirken (Ladd et al., 2017). Untersuchungen ergaben, dass das Sozialverhalten (García Bacete et al., 2017), Sprachkompetenzen (Grünigen et al., 2012) und Leistungen (Huber & Wilbert, 2012) Prädiktoren von sozialer Ablehnung sind. Zudem zeigte sich sowohl in experimentellen Studien (Huber al., 2018) als auch in Untersuchungen in natürlichen Unterrichtssituationen ein Zusammenhang zwischen dem Feedbackverhalten der Lehrkraft und der sozialen Ablehnung (Hendrickx et al., 2017; Huber et al., 2018). Beobachtungsstudien ergaben, dass Lehrkräfte insbesondere negatives Feedback zu Sozialverhalten und positives Feedback zu Leistungen erteilen. Diese Feedbackformen wirken sich auf die soziale Akzeptanz auf Klassenebene aus (Wullschleger et al., 2020). Bekannt ist, dass sich Lehrkräfte in ihrem Feedbackverhalten unterscheiden (Rubie-Davies, 2007). Bisher nicht untersucht wurde, ob es Verhaltensmuster in Bezug auf Lehrkräftefeedback (z.B. viel negatives, wenig positives Feedback) gibt und wie solche Muster mit der sozialen Ablehnung von Lernenden und deren Prädiktoren zusammenhängen. Fragestellungen Lassen sich Verhaltenstypen in Bezug auf positives und negatives Feedbackverhalten von Lehrkräften identifizieren? Wie hängen diese Verhaltenstypen mit der sozialen Ablehnung Ende des Schuljahres und deren Prädiktoren, Sozialverhalten, Sprachkompetenzen und Leistungsniveau zusammen? Methode Durchgeführt wurde eine Studie mit 36 inklusiven Primarklassen (N = 709 Lernende, 24 erste Klassen, 12 altersgemischte Klassen) (t1 = Anfang Schuljahr; t2 = Ende Schuljahr). Alle Lehrkräfte setzten 21 standardisierte Fördereinheiten zur Ablösung vom zählenden Rechnen während 8 Monaten ein. In allen Klassen wurde die Umsetzung derselben Fördereinheit videografiert. Erhoben wurden folgende Daten: Sozialverhalten Lernende (t1): 6 Items der Subskalen Prosoziales und Kooperatives Verhalten durch jeweils vier Peers eingeschätzt (SOCOMP; Perren et al., 2012; 6 Items, Cronbach’s alpha = .93). Soziale Ablehnung (t2): Rating mit Smileys “Wie gerne spielst du mit A” (1 =  = gar nicht gerne” bis 5 =  = “sehr gerne”). Leistungsniveau (t1): Mathematikleistung Arithmetik (Eigenentwicklung) Feedbackverhalten: Codierung des öffentlichen Feedbacks an einzelne Lernende (Übereinstimmung Codierung Cohen’s Kappa ƙ = .81). Für die Analysen wurde die relative Häufigkeit positiver und negativer Feedbacks zum Sozialverhalten und zur Leistung pro Klasse berechnet. Analysen: Multigroup Strukturgleichungsmodelle Ergebnisse Positives Feedback zum Sozialverhalten (M = 0.002) sowie negatives Leistungsfeedback (M = 0.08) kamen nahezu nicht vor. Ausgehend vom Feedbackverhalten der Lehrkräfte wurden zwei Extremgruppen sowie eine Gruppe mit «durchschnittlichem» Feedbackverhalten gebildet: Lehrkräfte (SOZNEG), die viel (25. Perzentile) negatives Feedback zum Sozialverhalten gaben (11 bis 30% aller Feedbacks) und entsprechend weniger positive Leistungsfeedbacks erteilten (M = 74% aller Feedbacks); Lehrkräfte (LEISTPOS), die vor allem (25. Perzentile) positives Feedback (94-100% aller Feedbacks) und kaum negatives Feedback erteilten (M = 2% aller Feedbacks) und Lehrkräfte (AVG), die im Vergleich zu den anderen Gruppen durchschnittlich viele positive Leistungsfeedbacks (> 25. Perzentile; M = 84%) und negative Feedbacks zum Sozialverhalten (> 25. Perzentile, M = 5%) erteilten. Die Gruppen unterschieden sich nicht signifikant bezüglich Sozialverhalten und Leistungsniveau. In allen Gruppen war das Sozialverhalten ein signifikanter Prädiktor der sozialen Ablehnung. Nur in Klassen der Gruppe LEISTPOS war das Leistungsniveau ein signifikanter Prädiktor der sozialen Ablehnung. Das heißt, dass in Klassen, in denen das Lehrkräftefeedback 94 bis 100% positives Leistungsfeedback und durchschnittlich 2% negatives Feedback zu Sozialverhalten war, die Leistungen die soziale Ablehnung von Lernenden voraussagte. Sprachkompetenz war kein signifikanter Prädiktor. Die Ergebnisse weisen erstens darauf hin, dass es bestimmte Verhaltenstypen in Bezug auf Lehrkräftefeedback zu geben scheint. Es gibt Lehrkräfte, die mit den Kindern fast ausschließlich über Lerninhalt sprechen und kaum störendes Verhalten kommentieren. Zweitens scheint positives Leistungsfeedback im Vergleich zu negativem Feedback zu Sozialverhalten hinsichtlich der sozialen Ablehnung eine wichtige Rolle zu spielen. Im Symposium werden die Ergebnisse und Folgerungen für weitere Untersuchungen sowie die praktische Bedeutung der Erkenntnisse diskutiert. Lehrkraftfeedback, soziale Kompetenzen und soziale Ablehnung: Ein personenzentrierter Ansatz zur Identifizierung gefährdeter Lernender Ariana Garrote¹, Celina Nesme², Elisbeth Moser Opitz² ¹Fachhochschule Nordwestschweiz, ²Universität Zürich Theoretischer Hintergrund Positive Interaktionen in der Klasse sind von entscheidender Bedeutung für die sozio-emotionale Entwicklung von Kindern (Davis & Allen, 2023). Erfahren Lernende häufig negative Interaktionen oder Ablehnung in der Peergruppe, kann dies negative Auswirkungen haben (Ladd et al., 2017). Sowohl individuelle Faktoren, wie mangelnde soziale Kompetenzen, geringe Sprachkompetenzen (Grünigen et al., 2012) als auch Interaktionen mit den Lehrkräften können zu sozialer Ablehnung führen. Lernende, die oft negatives Feedback von ihrer Lehrkraft erhalten, erfahren mehr Ablehnung durch ihre Peers (Hendrickx et al., 2017; Spilles et al., 2023). Manche Kinder erhalten signifikant mehr negatives Feedback von ihren Lehrkräften als andere (Babad, 2009; Tenenbaum & Ruck, 2007). Das heißt, nicht alle Lernende sind im gleichen Ausmaß von negativen Interaktionen mit Lehrkräften und Peers betroffen. Um negative Entwicklungsverläufe zu verhindern ist es wichtig, Risikogruppen zu identifizieren. Im Gegensatz zu variablenzentrierten Ansätzen, die Zusammenhänge zwischen Variablen aufzeigen, ermöglichen personenzentrierte Ansätze Gruppen basierend auf Ähnlichkeiten in Bezug auf mehrere Variablen zu identifizieren. Fragestellungen Mit Daten aus teilstandardisierten Klassendiskussionen, in denen das Lehrkräftefeedback gegenüber einzelnen Lernenden erfasst wurde, wird folgende Forschungsfrageuntersucht: Welche Gruppen von Lernenden lassen sich anhand der Indikatoren Lehrkraftfeedback zu Sozialverhalten und Leistung, soziale Kompetenzen und soziale Ablehnung, identifizieren? Methode Die Daten wurden in 18 inklusiven Primarklassen (N = 358, 48 % Mädchen, 9 erste Klassen, 9 altersgemischte Klassen) am Anfang des Schuljahres erhoben. Die Lehrkräfte führten im Rahmen einer Intervention ein bis zwei Mal pro Woche ca. 15 Minuten eine Klassendiskussion zu regelmäßig stattfindenden Kooperationsaktivitäten durch. Der Ablauf der Diskussion und die Fragen waren vorgegeben (z.B. „Was habt ihr in der Kooperationsaktivität besonders an eurem Partner/eurer Partnerin geschätzt?“). In allen Klassen wurde eine Klassendiskussion videografiert. Die Lehrkräfte reagierten einerseits auf die Beiträge der Kinder, andererseits auf deren Sozialverhalten während der Diskussion. Erhoben wurden folgende Daten: Soziale Kompetenzen: Peerrating des prosozialen und kooperativen Verhaltens mit der Skala Self-and Other-Oriented Social Competences (Perren et al., 2012; α = .95 ). Sprachkompetenzen: Einschätzung der Lehrkräfte mit zwei Items («X versteht die deutsche Sprache im Schulalltag gut» und «X kann sich im Schulalltag in der deutschen Sprache gut ausdrücken») auf einer vierstufigen Likert-Skala (r =.85). Soziale Ablehnung: Peerrating mit Smileys “Wie gerne spielst du mit X?” (1 = „gar nicht gerne” bis 5 = „sehr gerne”). Lehrkraftfeedback: Codierung aller öffentlichen Feedbacks an einzelne Lernende (ƙ = .91) während der Klassendiskussion. Positives Feedback zum Sozialverhalten sowie negatives Leistungsfeedback kamen nahezu nicht vor. Für die Analysen wurde jeweils die relative Häufigkeit negativer Feedbacks zum Sozialverhalten und positiver Feedbacks zur Leistung pro Kind bezogen auf alle öffentlichen Feedbacks der Klasse berechnet. Analyse: Typenbildung erfolgte durch latente Profilanalyse mit den Indikatoren Lehrkraftfeedback zu Leistung und zu Sozialverhalten, soziale Kompetenzen sowie soziale Ablehnung. Multinomiale logistische Regressionsanalyse wurden eingesetzt, um Unterschiede zwischen den Gruppen in Bezug auf Gender und Sprachkompetenzen zu überprüfen. Ergebnisse Es wurden drei Gruppen von Lernenden identifiziert. In Gruppe 1 waren Lernende (15 %) mit den geringsten sozialen Kompetenzen. Sie erhielten am häufigsten negatives Feedback zu ihrem Sozialverhalten aber wenig positives Feedback, und wiesen einen hohen Ablehnungsstatus auf. Männliche Lernende mit geringen Sprachkompetenzen waren übervertreten. In den Gruppen 2 und 3 waren die Lernenden sozial kompetenter. Lernende in Gruppe 2 (23 %) wurden von den Peers signifikant weniger abgelehnt als in den anderen Gruppen und erhielten am häufigsten positives Feedback zu ihren Diskussionsbeiträgen. Die Lernenden der Gruppe 3 (62 %) wiesen durchschnittliche Ablehnungswerte auf und erhielten wenig positives oder negatives Feedback von der Lehrkraft. Zusammenfassend wurde eine Risikogruppe identifiziert mit niedrigen sozialen Kompetenzen, die überwiegend negative soziale Interaktionen mit Lehrkräften und Peers erlebt. Die Analysen zeigen auch, dass es vor allem Jungen mit geringen Sprachkompetenzen betrifft. Zu Bedeutung sozialer Ängste für den Zusammenhang von Lehrkraftfeedback und der Wahl sozialer Interaktionspartnerinnen im Grundschulalter Philipp Nicolay¹, Markus Spilles¹, Johanna Krull², Corinna Hank¹, Christian Huber¹ ¹Bergische Universität Wuppertal, ²Universität zu Köln Theoretischer Hintergrund Ausgehend von der sozialen Referenzierungstheorie zeigen vergangene Experimental- und Feldstudien (Nicolay & Huber, 2021; Spilles, Huber, Nicolay, König & Hennemann, 2023), dass das Feedback von Lehrkräften die soziale Akzeptanz, die Schülerinnen durch ihre Mitschülerinnen erfahren, beeinflusst. Unklar ist bisher, entlang welcher Merkmale sich Schülerinnen darin unterscheiden, wie stark sie durch das Feedback von Lehrkräften beeinflusst werden. Konzeptionell lassen sich soziale Referenzierungsprozesse als funktional vergleichbar mit anderen sozialen Lern- und Beeinflussungsprozessen verstehen (Walle, Reschke & Knothe, 2017). In diesen Forschungskontexten konnte bereits gezeigt werden, dass soziale Ängste einen Einflussfaktor für Konformität und die Beeinflussbarkeit durch Peers darstellen (Bică, 2022; Cohen & Prinstein, 2006; Feng, Cao, Li, Wu & Mobbs, 2018). Fragestellungen Ausgehend vom Forschungsstand zur Peereinfluss- und Konformitätsforschung sowie den mit sozialen Ängsten assoziierten kognitiven Verzerrungen lassen sich zwei konkurrierende Hypothesen formulieren, wie soziale Unsicherheit den Zusammenhang zwischen Lehrkraftfeedback und sozialer Akzeptanz moderieren könnte: Erstens lässt sich aufgrund der bisherigen Forschungslage zu Peereinflussprozessen (Cohen & Prinstein, 2006; Feng et al, 2018) bzw. der Forschung zu Konformität (Bică, 2022) annehmen, dass sozial unsichere Schülerinnen generell stärker durch Lehrkraftfeedback beeinflusst werden, da ihre Furcht vor der Bewertung durch andere stärker ausgeprägt ist (Konformitätshypothese). Zweitens lässt sich vor dem Hintergrund der Befunde zu mit sozialen Ängsten verbundenen kognitiven Verzerrungen (Glazier & Alden, 2019; Kuckertz & Amir, 2014; Taylor, Bomyea & Amir, 2010) annehmen, dass sozial unsichere Schülerinnen stärker von positivem Lehrkraftfeedback und schwächer von negativem Lehrkraftfeedback beeinflusst werden, da sie negative Informationen stärker und positive Informationen schwächer und als weniger bedeutsam wahrnehmen (Biashypothese). Methode Die Stichprobe bestand aus 826 Dritt- und Viertklässlerinnen, die im Rahmen einer Querschnittsuntersuchung befragt wurden. Die soziale Akzeptanz wurde über das soziometrische Ratingsverfahren mit dem Kriterium Sitznachbarin erfasst (Cillessen, 2009) und im Anschluss dichotomisiert. An diese angelehnt, wurde die Menge an erhaltenem positivem und negativem Lehrkraftfeedback durch die Schülerinnen für jeweils jedes Kind der Klasse eingeschätzt. Soziale Ängste wurden mit der SASC-R-D (Melfsen, 1998) erfasst. Die Überprüfung der Hypothesen erfolgte mit generalisierten Mehrebenenmodellen. Die abhängige Variable soziale Akzeptanz liegt auf der untersten Ebene der Dyaden (Kind-Kind), die sowohl in den beurteilenden als auch den beurteilten Kindern genestet ist (gekreuzte zufällige Effekte). Diese wurde durch die unabhängigen Variablen wahrgenommenes positives und negatives Feedback (Dyaden-Ebene), soziale Ängste (Individual-Ebene) und die entsprechenden Cross-Level Interaktionen vorhergesagt. Ergebnisse Die Ergebnisse der Mehrebenenmodelle zeigen sowohl einen generellen Zusammenhang zwischen dem Feedback, das Schülerinnen gegenüber ihren Mitschülerinnen wahrnehmen und der sozialen Akzeptanz, die sie ihnen entgegenbringen (OR = 1.94, p < .001 bzw. OR = 0.81, p < .001) als auch Interaktionseffekte zwischen der Wahrnehmung von positivem und negativem Feedback und sozialen Ängsten. Eine höhere Ausprägung von sozialen Ängsten war hierbei mit einem geringeren Zusammenhang zwischen positivem Lehrkraftfeedback und sozialer Akzeptanz (OR = 0.88, p = .017) und einem höheren Zusammenhang (OR = 0.87, p = .005) zwischen negativem Lehrkraftfeedback und sozialer Akzeptanz assoziiert. Diskussion Die Ergebnisse sprechen dafür, dass Schülerinnen mit zunehmender sozialer Unsicherheit bei der Wahl von Sozialkontakten negatives Lehrkraftfeedback stärker und positives Lehrkraftfeedback schwächer gewichten. In Bezug auf die zwei aufgestellten und aus empirischen Befunden der Peer- und Konformitätsforschung bzw. der Forschung zu sozialen Ängsten abgeleiteten konkurrierenden Hypothesen, sprechen die Ergebnisse gegen die Konformitäts- und für die Bias-Hypothese. Für Lehrkräfte ergibt sich hieraus die besondere Problematik, die im Rahmen des Vortrags diskutiert werden soll, dass eine Schülerinnengruppe, die von ihnen häufig nur schwer zu identifizieren ist (Melfsen, 1998), in besonderem Maße in der Wahl ihrer Sozialkontakte von negativem Lehrkraftfeedback beeinflusst wird. Dies wiegt umso schwerer, da diese Gruppe selbst eine geringere soziale Akzeptanz durch Mitschülerinnen erfährt (Weber, Nicolay & Huber, 2021).
15:20 - 17:00	3-07: Transfercafé - Transferformate gemeinsam mit Wissenschaft und Schulpraxis gestalten Ort: S18
	Offenes Beitragsformat Transfercafé - Transferformate gemeinsam mit Wissenschaft und Schulpraxis gestalten Dorothea Körner¹, Alexandra Dehmel², Julius Erdmann¹, Sandra Fischer-Schöneborn³, Winnie-Karen Giera¹, Simone Mattstedt⁴, Salome Wagner⁵, Eike Wille⁵, Michael Wiedmann⁶ ¹Universität Potsdam; ²Institut für Bildungsanalysen Baden-Württemberg; ³Leuphana Universität Lüneburg; ⁴Universität Münster; ⁵Universität Tübingen; ⁶Pädagogische Hochschule Freiburg Zahlreiche Transferformate bringen Wissenschaft und Schulpraxis in Deutschland in den Austausch, wie zum Beispiel Hochschul-Schulnetzwerke, Fortbildungen für Lehrkräfte und die gemeinsame Entwicklung von Unterrichtsmaterialien. Das Transfernetzwerk Bildung bringt seit 2021 insbesondere Akteure aus Hochschulen und Landesinstituten zusammen (z. B. Mitarbeitende in Professional Schools of Education, Schulnetzwerk-Koordinator:innen, Mitarbeitende in Transferprojekten), die sich über Rahmen- und Gelingensbedingungen der von ihnen gestalteten Transferformate untereinander und mit externen Experten austauschen. Die Vielfalt solcher Transferformate ergibt sich aus den im Rahmen der “Third Mission” der Hochschulen entwickelten Transferstrategien und wurde unter anderem durch Projekte innerhalb der Qualitätsoffensive Lehrerbildung unterstützt. Die konkrete und praktische Umsetzung von Transferformaten ist dabei mit einer Vielzahl von Hürden verbunden (Farley-Ripple et al., 2018; Roessler et al., 2020; Schrader et al. 2020; Taszarek, 2022). Hochschulen können jedoch institutionell Wissenschaftler:innen durch geeignete Strukturen bei der Organisation und Durchführung von Transferaktivitäten sowie bei der Dissemination von Transferprodukten unterstützen. Ziel dieser Session ist, Transferformate exemplarisch vorzustellen und zu diskutieren, inwiefern sie als institutionelle Struktur gestaltet werden können, damit sie Forschende optimal unterstützen. Ein einführender Beitrag stellt das Transfernetzwerk Bildung vor und situiert es vor dem Hintergrund professioneller Lerngemeinschaften und anderer Netzwerke für Transfer. Anschließend werden Transferformate von Mitglieder:innen des Netzwerks in einem Transfercafé präsentiert. Gemeinsam werden entlang der individuellen Projektkonzeptionen Fragen wie die folgenden diskutiert: Wie gestalten wir Schul-Hochschulkooperationen gewinnbringend? Wie können Transferformate aus Hochschulsicht attraktiver gestaltet werden? Welche Fallstricke müssen im Spannungsfeld der Interessen und Bedarfe zwischen Schulpraxis und Wissenschaft bei der Gestaltung von Transferformaten bedacht werden? Abschließend werden wir gemeinsam den Blick auf die Frage richten, was Schul-Hochschulkooperationen hinsichtlich Transfers leisten können und wie wir diesen Prozess fördern und empirisch untersuchen können. Im Transfercafé werden die folgenden Transferformate von Netzwerkmitgliedern präsentiert: Die Arbeit in Entwicklungsteams an der Leuphana Universität Lüneburg: Was uns die Empirie lehrt Dr. Sandra Fischer-Schöneborn (Dekanat Fakultät Bildung & Zukunftszentrum Lehrkräftebildung, Leuphana Universität Lüneburg) Leitidee des QLB-Projekts „Zukunftszentrum Lehrkräftebildung-Netzwerk“ (ZZL-Netzwerk) der Leuphana Universität Lüneburg ist es, durch institutionenübergreifende Vernetzung mit Vertreter:innen aus Universität, Schule, Studienseminar und weiteren Bildungsinstitutionen der Region in ko-konstruktiver Zusammenarbeit innovative Formate für Unterricht, Lehrkräfteaus- und -fortbildung zu entwickeln und zu erproben. Um dieses Ziel zu erreichen, arbeiten die am Projekt beteiligten Forscher:innen mit Lehrkräften, Studierenden und weiteren Schul- und Bildungsvertreter:innen (insgesamt über acht Jahre n>230 Akteur:innen) seit 2016 in neun so genannten Entwicklungsteams zusammen (Fischer-Schöneborn & Straub, 2022). Diese multiprofessionelle Zusammenarbeit sowie ihre Erträge werden im Projekt konstant beforscht und evaluiert (bspw. Fischer-Schöneborn & Ehmke, 2023). Im Beitrag werden Einblicke in die empirischen Ergebnisse zu Erfolgsfaktoren, Herausforderungen sowie der Zusammenarbeit „auf Augenhöhe“ gegeben. Transfer gemeinsam fördern! Möglichkeiten der Zusammenarbeit von Hochschulen und Landesinstituten im Bereich Transfer Dr. Michael Wiedmann (Pädagogische Hochschule Freiburg), Dr. Alexandra Dehmel (Institut für Bildungsanalysen Baden-Württemberg) Wie können Hochschulen und Bildungsadministration - spezifisch: Landesinstitute - zusammenarbeiten, um Transfer zu fördern? Die Landesinstitute sind als intermediäre Akteure wichtige Player im Bereich Transfer und haben aufgrund ihrer Stellung im System besondere Potenziale, Transfer zu fördern (Dehmel, 2019). Transfergegenstand können Produkte, Theorien aber auch evidenzerzeugende Verfahren sein (Leuders et al., 2023). Die Pädagogische Hochschule Freiburg und das Institut für Bildungsanalysen Baden-Württemberg (IBBW) stellen verschiedene Transferaktivitäten vor, bei denen Landesinstitute und Hochschulen zusammenarbeiten. Die PH Freiburg präsentiert Formate der Kooperation mit der Regionalstelle des Zentrums für Schulqualität und Lehrerbildung in Freiburg, die insbesondere Fortbildende als Multiplikator:innen adressieren, um in die Fläche zu wirken. Die Landesinstitute sind zur Konzeption dieser Formate ideale Partner für die PH Freiburg. Das IBBW stellt verschiedene Transferaktivitäten vor, unter anderem die Veranstaltungsreihe „IBBW-Wissenschaft im Dialog“ und Publikationsreihen zum Transfer bildungswissenschaftlicher Erkenntnisse in die Praxis. Ziel dieses Beitrags im World Café ist es, Möglichkeiten der Zusammenarbeit Hochschulen - Landesinstitute beim Transfer aufzuzeigen und auch Ideen für neue Formate zu generieren. Wissenschaft begeistert! Dr. Eike Wille, Tübingen School of Education, Universität Tübingen Wie können Schülerinnen und Schüler für spannende Forschungsthemen begeistert werden? Wie kann es Wissenschaft gelingen, mit der heranwachsenden Generation in Austausch zu kommen? In der Veranstaltungsreihe ‚Wissenschaft begeistert‘ der Tübingen School of Education (Uni Tübingen) diskutieren Schülerinnen und Schüler gemeinsam mit Wissenschaftlerinnen und Wissenschaftlern aktuelle, spannende Themen aus unterschiedlichen Fachgebieten. Neben einer schülerorientierten Aufbereitung eines Forschungsthemas steht die gemeinsame Diskussion der Inhalte im Zentrum der 90-minütigen Veranstaltungen. Schülerinnen und Schüler erhalten so einen Einblick in aktuelle wissenschaftliche Fragestellungen, Denk- und Arbeitsweisen, während Wissenschaftlerinnen und Wissenschaftler eine neue Sichtweise auf ihr Forschungsthema bekommen und neue Ideen für weitere Forschungsprojekte generieren können. Wie gelangen wissenschaftliche Erkenntnisse in die Schulpraxis? Salome Wagner, Tübingen Center for Digital Education (TüCeDE) Wie können Lehrkräfte und Lehrkräftebildende digitale Medien forschungsbasiert in der Praxis nutzen? Am TüCeDE gibt es verschiedene Ansätze, um bidirektionalen Transfer und den Austausch von Wissenschaft und Praxis zu fördern. Ein Ansatz stellt die Clearinghouse-Plattform TüDi-BASE dar, auf der wissenschaftliche Erkenntnisse zum Unterrichten mit und über digitale Medien anhand von Forschungssynthesen für (angehende) Lehrkräfte und Lehrpersonenbildende aufbereitet werden. Ein weiterer Ansatz stellt das Projekt DiA:Net dar, in dem Lehrkräfte und Wissenschaftler:innen ko-konstruktiv Unterrichtseinheiten erstellen, die in der Schule, begleitet durch empirische Erhebungen, eingesetzt und dann als OER zur Verfügung gestellt werden. Durch solche Transferformate können sowohl Lehrkräfte als auch Wissenschaftler:innen viel voneinander lernen. Gelingensbedingungen für praxisorientierte Forschung und Forschungstransfer in Hochschul-Schul-Netzwerken am Beispiel des Campusschulennetzwerk am Zentrum für Lehrerbildung und Bildungsforschung (ZeLB) der Universität Potsdam Dorothea Körner (ZeLB, Universität Potsdam), Prof. Dr. Winnie-Karen Giera (Deutschdidaktik im inklusiven Kontext, Universität Potsdam), Dr. Julius Erdmann (ZeLB, Universität Potsdam) Eine gewinnbringende und als wertvoll erachtete Zusammenarbeit zwischen den Institutionen Hochschule und Schule stellt einen Grundpfeiler für gelingenden Transfer im Bildungsbereich dar. Das Projekt Campusschulen bietet als Konzept niedrigschwelliger Netzwerkarbeit die Möglichkeit, gemeinsam an selbstgesetzten Zielen der der Schul- und Unterrichtsentwicklung zu arbeiten. Kennzeichnend ist dabei ein Dreiklang der Akteursgruppen Lehrkräfte, Lehramtsstudierende sowie Wissenschaftler:innen der Universität Potsdam (Kleemann et al., 2019). Auf Basis dieses Netzwerkkonstrukts werden Erfahrungen und Learnings für eine gelingende Gestaltung von Zusammenarbeit berichtet. Der Beitrag verbindet einen wissenschaftlichen Blick auf Gelingensbedingungen der Netzwerkarbeit, bestehend aus Daten der Projektevaluation und einem theoretischen Framing, sowie die praktische Perspektive eines beteiligten Netzwerks. Dieses fokussiert auf die Förderung sprachlicher und kommunikativer Fähigkeiten in verschiedenen kulturellen/politischen/berufsorientierten Schulprojekten (Giera, i.V.).
15:20 - 17:00	3-08: Lehrkrafteinstellungen zu LGBTIQ Schüler:innen Ort: H06
	Symposium Lehrkrafteinstellungen zu LGBTIQ Schüler:innen Chair(s): Christoph Niepel (Universität Luxemburg, Luxemburg), Andreas Gegenfurtner (Universität Augsburg) Diskutantin(nen): Hannah Kleen (DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation) Lesbische, schwule, bisexuelle, trans, inter* und queere (verbreitetes englischsprachiges Akronym: LGBTIQ) Schüler:innen erleben aufgrund ihrer sexuellen und/oder geschlechtlichen Identität nach wie vor Marginalisierung und Diskriminierung in der Schule (Gegenfurtner & Gebhardt, 2017). Forschungsergebnisse zeigen, dass Lehrkräfte eine wesentliche Rolle bei der Prävention und Unterbindung von (subtilen oder offenen) Formen homo- und transphobem Verhaltens spielen können (Klocke et al., 2019). Dabei scheinen die individuellen Einstellungen einer Lehrkraft gegenüber LGBTIQ Schüler:innen von zentraler Bedeutung zu sein (Hall & Rodgers, 2019; Glock & Kleen, 2020; Gegenfurtner et al., 2023). Lehrkräfte mit positiven Einstellungen gegenüber LGBTIQ Schüler:innen neigen eher dazu, sich verschiedenen Formen der Diskriminierung von LGBTIQ Schüler:innen entgegenzustellen; so können sie maßgeblich helfen, Schule zu einem sicheren Ort des Lernens und der Persönlichkeitsentfaltung für LGBTIQ Schüler:innen zu gestalten (Page, 2017; Zotti et al., 2019). Unser Symposium vereint drei Beiträge, die Lehrkrafteinstellungen zu LGBTIQ Schüler:innen untersuchen. Im ersten Beitrag wurden angehende Lehrkräfte im luxemburgischen Bildungskontext befragt und deren Einstellungen zu lesbischen, schwulen und bisexuellen Schüler:innen untersucht. Dabei fokussiert der Beitrag auf der Frage, welche Rolle soziale Kontakte der angehenden Lehrkräfte mit lesbischen, schwulen und bisexuellen Personen spielen und welchen Einfluss deren politische Orientierung, Religiosität sowie deren Vorstellungen von Geschlechterrollen haben. Der zweite Beitrag nutzt ein Multi-Method-Design, um implizite und explizite Einstellungen von Lehramtsstudierenden gegenüber lesbischen und schwulen Schüler:innen zu untersuchen. Dabei wurde analysiert, inwiefern implizite (gemessen mittels eines impliziten Assoziationstests) und explizite Einstellungen zusammenhängen und ob Vorurteile, soziale Kontakte, die eigene sexuelle Orientierung, Geschlecht, politische Haltung und Religiosität implizite Einstellungen statistisch vorhersagen. Weiterhin wurde untersucht, ob sich während der Bearbeitung des impliziten Assoziationstests Fixationsdauer und Pupillendurchmesser beim Lesen konsistenter und inkonsistenter Kategorie/Attribut-Paare als Indikator für automatische Assoziationen unterscheiden. Der dritte Beitrag vereint zwei Studien, in denen jeweils Lehrkräfte und pädagogische Fachkräfte im deutschen Bildungskontext befragt wurden. Der Beitrag geht dabei der Frage nach, welche Faktoren Lehrkräfte und pädagogische Fachkräfte darin unterstützen, gegen Diskriminierung queerer Schüler:innen vorzugehen und sexuelle und geschlechtliche Vielfalt zu berücksichtigen. Dieses Symposium umfasst drei Beiträge, die sich mit den Einstellungen von Lehrkräften gegenüber LGBTIQ Schüler:innen beschäftigen und geht den Fragen nach, wie positiv deren Einstellungen insgesamt sind und welche Faktoren einen Einfluss auf diese Einstellungen haben. Dabei nutzen die Beiträge komplementäre Forschungsansätze und sind in verschiedenen Bildungssystemen verortet. Auf diese Weise trägt das Symposium dazu bei, wichtige neue Erkenntnisse in einem wenig beforschten Feld zu gewinnen, verbunden mit dem Anspruch, die Forschung auf diesem Gebiet insgesamt voranzutreiben. Beiträge des Symposiums Einstellungen gegenüber lesbischen, schwulen und bisexuellen Schüler:innen: Eine prä-registrierte Fragebogenstudie mit luxemburgischen Lehramtsstudierenden Axel Grund, Dario Galano, Valentin Emslander Universität Luxemburg Theoretischer Hintergrund: Lesbische, schwule und bisexuelle (englisch: lesbian, gay, and bisexual, im Folgenden daher LGB) Schüler:innen sind in verschiedenen Kontexten mit Viktimisierung konfrontiert, auch im Bildungskontext. Inwieweit Lehrer:innen hier eine wichtige Ressource darstellen können, scheint mit ihren Einstellungen gegenüber sexuellen Minderheiten zusammenzuhängen. Dies äußert sich beispielsweise darin, dass Lehrer:innen mit ungünstigen Einstellungen seltener eingreifen, wenn sie mit homophoben Verhaltensweisen in der Schule konfrontiert werden (Zotti et al., 2019). Dementsprechend ist es wichtig, mehr über die Einstellungen von Lehrer:innen und deren Korrelate herauszufinden, da dies Ansatzpunkte für sensibilisierende Interventionen in der Lehrerbildung liefern kann, die die Situation von LGB Schüler:innen im schulischen Umfeld weiter verbessern könnten. Fragestellung: In enger Anlehnung an eine Studie von Gegenfurtner et al. (2021) mit deutschen Lehramtsstudierenden gingen wir u.a. der Frage nach, welche Rolle vorheriger sozialer Kontakt mit LGB Personen sowie die eigene politische Orientierung und Religiosität für Einstellungen gegenüber LGB Schüler:innen spielen. Dabei berücksichtigten wir methodische Mängel, die von Gegenfurtner et al. (2021) identifiziert wurden, nahmen Hypergendering-Tendenzen (d. h. die Tendenz, traditionelle Vorstellungen von Geschlechterrollen zu befolgen) als möglichen weiteren Prädiktor in den Blick und platzierten die Untersuchung in den luxemburgischen Bildungskontext. Methode: Details zu Forschungsfragen und -hypothesen sowie zum Studiendesign können der Prä-Registrierung zur Studie entnommen werden (https://osf.io/24ajg). In unsere Analysen gingen die Antworten von 138 angehenden Lehrer:innen ein, die im Wintersemester 2022 an der Universität Luxemburg in einem der Lehramtsstudiengänge eingeschrieben waren (52.2% waren zwischen 21 und 23 Jahre alt) und eine Einladung zur Teilnahme an einer Onlinebefragung über SoScisurvey zugestimmt hatten. Einstellungen gegenüber LGB Schüler:innen wurden jeweils sowohl als Einzelitem per „Gefühlsthermometer“ (Gegenfurtner et al., 2021) als auch umfassender erfragt (z.B. “Attitudes Toward Lesbians and Gay Men Scale, Revised 5-Item Version”, Herek & McLemore, 2011) . Außerdem wurden Hypergendering, frühere soziale Kontakte mit LGB Personen (innerhalb von Familien- und Freundesnetzwerken), Alter, Geschlecht, sexuelle Orientierung, Religiosität und Rechtskonservatismus per Selbstbericht erfasst. Ergebnisse: Die Ergebnisse deuten darauf hin, dass auch die angehenden luxemburgischen Lehrer:innen überwiegend positive Einstellungen gegenüber LGB Schüler:innen aufweisen. Dennoch konnten wir anhand von Korrelations- und multiplen Regressionsanalysen die Häufigkeit der Kontakte mit LGB Personen in Familien- oder Freundeskreisen, Hypergendering-Tendenzen sowie die eigene sexuelle Orientierung und Religiosität als zuverlässige Prädiktoren für die Einstellung gegenüber LGB Schüler:innen identifizieren. Alter, Geschlecht und Rechtskonservatismus sagten die Einstellungen der angehenden Lehrer:innen nicht zuverlässig vorher. Diskussion: Unsere Ergebnisse deuten darauf hin, dass die zukünftigen luxemburgischen Lehrer:inner dieselben (positiven) expliziten Einstellungen gegenüber Schüler:innen mit einer der drei untersuchten sexuellen Orientierungen aufweisen, also kaum zwischen den verschiedenen sexuellen Minderheiten unterscheiden. Weiterhin deuten unsere Befunde auf eine Bestätigung der Theorie des Intergruppenkontakts (z.B. Pettigrew & Tropp, 2006) hin und identifizieren Hypergendering-Tendenzen als weitere mögliche Ausgangsbedingung für Einstellungen gegenüber LGB Schüler:innen. Dabei deutete sich an, dass die Erfassung von Einstellungen per umfassender Skala der Erfassung per Gefühlsthermometer überlegen ist. Zukünftige Forschung sollte dennoch darüber hinaus auch verstärkt implizite Einstellungsmaße nutzen, um den Einfluss der sozialen Erwünschtheit zu reduzieren. Für die Lehrerbildung deuten unsere Befunde an, dass es sinnvoll sein könnte, Kontakt zwischen angehenden Lehrer:innen und der LGBTQIA+-Gemeinschaft zu fördern sowie Maßnahmen in die Ausbildung einzubinden, die helfen Geschlechtsstereotype zu hinterfragen. Implizite und explizite Einstellungen von Lehramtsstudierenden gegenüber homosexuellen Schülerinnen Aldin Alijagic, Andreas Gegenfurtner Universität Augsburg Theoretischer Hintergrund In der Ausübung von gutem Unterricht sind positive Einstellungen von Lehrkräften von hoher Bedeutung. Im Moment sind Einstellungen zu homosexuellen Schülerinnen jedoch noch wenig untersucht (Gegenfurtner et al., 2023; Hall & Rodgers, 2019; Klocke, in press). Auf Basis der Einstellungstheorie (Eagly & Chaiken, 2007), der Intergruppenkontakttheorie (Pettigrew & Tropp, 2006) und der Selbstkategorisierungstheorie (Turner et al., 1987) untersucht die vorliegende Arbeit in einem Multi-Method-Design das Ausmaß und die Prädiktoren impliziter und expliziter Einstellungen von Lehramtsstudierenden gegenüber homosexuellen Schülerinnen. Fragestellung Drei Fragestellungen wurden adressiert. Konkret wurde untersucht, inwiefern implizite und explizite Einstellungen korrelieren (Forschungsfrage 1), ob Vorurteile, sozialer Kontakt, eigene sexuelle Orientierung, Geschlecht, politische Haltung und Religiosität implizite Einstellung prädizieren (Forschungsfrage 2) und ob sich Fixationsdauer und Pupillendurchmesser beim Lesen konsistenter und inkonsistenter Kategorie/Attribut-Paare während der Bearbeitung des impliziten Assoziationstests als Indikator für automatische Assoziationen unterscheiden (Forschungsfrage 3). Methode Teilnehmende waren 78 Lehramtsstudierende (52 weiblich) mit einem Durchschnittsalter von 21.3 Jahren (SDAlter = 3.8). Von den Teilnehmenden stuften sich 53 als heterosexuell und 24 als nicht-heterosexuell ein. Eine Person gab keine Auskunft und wurde daher von den weiteren Analysen exkludiert. Implizite Einstellungen gegenüber homo- und heterosexuellen Schülerinnen wurden mit einem impliziten Assoziationstest gemessen (Greenwald et al., 1998). Für die Zielkategorie „sexuelle Orientierung“ wurden fünf Begriffe mit je einer homosexuell (z.B. lesbisch) beziehungsweise heterosexuell (z.B. heterosexuell) bezeichnenden Orientierung verwendet. Für die Attributkategorie wurden angenehme (z.B. moralisch) bzw. unangenehme (z.B. böse) Adjektive gewählt. Explizite Einstellungen gegenüber homosexuellen und heterosexuellen Schülerinnen wurden mit je einem modifizierten 101-punktskalierten Gefühlsthermometer erhoben (Norton & Herek, 2013), das von 0 bis 100 skaliert war. Vorurteile (α = .92) wurden mit adaptierten Items von Hachfeld et al. (2012) auf einer 7-stufigen Likert-Skala erhoben. Politische Orientierung wurde mit einem dichotomen Item erhoben und die Antworten wurden als 0 = “Links der Mitte“ und 1 = „Rechts der Mitte“ kodiert (Gegenfurtner et al., 2023). Subjektive Religiosität wurde mit der Frage „Wie religiös sind Sie?“ mit den Ausprägungen 1 = „sehr unreligiös“ bis 7 = „sehr religiös“ erhoben (Gegenfurtner et al., 2023). Sozialer Kontakt wurde mit drei siebenstufigen Likert-Items zur Häufigkeit des Kontakts zu homosexuellen Personen in der Familie, im Freundeskreis und im weiteren Bekanntenkreis gemessen (Gegenfurtner et al., 2023). Die Augenbewegungen der Teilnehmenden wurden während der Bearbeitung des impliziten Assoziationstests mit einem Tobii Eye Tracker aufgezeichnet und als Fixationsdauer und Pupillendurchmesser während der Betrachtung konsistent und nicht-konsistent wahrgenommener Textstimuli analysiert. Ergebnisse Die erste Forschungsfrage fokussierte den Zusammenhang zwischen impliziten und expliziten Einstellungsmessungen. Die Korrelationen der impliziten und expliziten Einstellungen waren weder für homosexuelle Schülerinnen, ρ = .02, p = .85 noch für heterosexuelle Schülerinnen statistisch signifikant, ρ = -.12, p = .30. Die zweite Forschungsfrage fokussierte die Prädiktoren der impliziten Einstellungen. Das gesamte Modell ist statistisch signifikant, F (8, 56) = 2.34, p < .05, allerdings war keine der Prädiktorvariablen signifikant, möglicherweise aufgrund der geringen Stichprobengröße. Die dritte Fragestellung adressierte Unterschiede in Fixationsdauer und Pupillendurchmesser beim Lesen konsistenter und inkonsistenter Kategorie/Attribut-Paare im impliziten Assoziationstest. Die Ergebnisse zeigen einen statistisch signifikanten Unterschied bei der Variable Pupillendurchmesser, F (1, 56) = 5.28, p = .03, η2 = .086, mit einer größeren Pupillendilation beim Lesen inkonsistenter Paare. Diskussion Eine geringe Korrelation impliziter und expliziter Einstellungen deckt sich mit Befunden zu anderen Heterogenitätsdimensionen (Kleen, 2021; Pit-ten Cate & Glock, 2019). Die Studie trägt zum noch geringen Forschungsstand über Lehrkrafteinstellungen zu nicht-heterosexueller Orientierung bei (Gegenfurtner et al., 2023; Hall & Rodgers, 2019; Klocke, in press). Limitationen der Studie liegen in der geringen Stichprobengröße und in der Fokussierung auf Homosexualität—Analysen zu den Einstellungen gegenüber bisexuellen oder trans’ Schülerinnen würden die Ergebnisse weiter vertiefen. Interessant wäre zudem der Vergleich der Lehramtsstudierenden mit erfahrenen Lehrkräften. Oft beschimpft, aber selten sichtbar: Was bewegt pädagogische Fachkräfte an Schulen dazu, sich für queere Jugendliche einzusetzen? Ulrich Klocke¹, Ska Salden², Meike Watzlawik² ¹Humboldt-Universität zu Berlin, ²Sigmund Freud PrivatUniversität Berlin Queere Jugendliche, hier verstanden als Jugendliche, die Geschlechternormen nicht erfüllen, haben ein deutlich höheres Suizidrisiko, auch weil sie in der Schule oft Ablehnung erwarten oder erleben. Pädagogische Fachkräfte (PF), insbesondere Lehrkräfte haben daher ihnen gegenüber eine besondere Verantwortung. Doch was bewegt PF dazu, gegen Diskriminierung queerer Personen vorzugehen und sexuelle und geschlechtliche Vielfalt (SGV) zu berücksichtigen? Angelehnt an die die Theorie geplanten Verhaltens (Ajzen, 1991) haben wir vor allem spezifische verhaltensrelevante Überzeugungen und Bewertungen als mögliche Einflussfaktoren untersucht: PF sollten sich demnach umso mehr für queere Jugendliche einsetzen, je mehr sie dadurch Konsequenzen erwarten, die sie positiv bewerten (z.B. Akzeptanzsteigerung), je weniger sie negativ bewertete Konsequenzen erwarten (z.B. Konflikte), je überzeugter sie sind, dass andere Personen (z.B. Schülerinnen) ihr Verhalten wertschätzen und je mehr verhaltenserleichternde Bedingungen (z.B. Verfügbarkeit passender Lehrmaterialien) sie wahrnehmen. Zudem haben wir Faktoren berücksichtigt, die in existierender, oftmals qualitativer Forschung oder in eigenen Vorstudien (s.u.) identifiziert wurden, beispielsweise die Überzeugung, dass queere Jugendliche durch ihr Auftreten Diskriminierung provozieren (Preston, 2016) oder die Existenz von Unisextoiletten an der Schule. Für Studie 1 haben wir mit Hilfe von Verbänden, Kultusministerien und Schulleitungen deutschlandweit online Lehrkräfte befragt (Klocke, Latz & Scharmacher, 2019). Analysiert werden konnten 1,102 Lehrkräfte aller Jahrgangsstufen, die hinsichtlich Geschlecht und Alter repräsentativ für Lehrkräfte in Deutschland waren. Kriteriumsvariablen waren die Thematisierung von SGV gegenüber den Schülerinnen und die Intervention gegen Diskriminierung queerer Personen. Prädiktoren waren spezifische Überzeugungen und Bewertungen, vor allem aus der Theorie geplanten Verhaltens und situative Variablen (Teilnahme an Fortbildungen, Schulleitbild, unterrichtete Fächer und Jahrgänge und Kontakt zu queeren Personen). Für Studie 2 haben wir eine nach Bezirk und Schulart geschichtete Zufallsstichprobe von 43 Schulen (Rücklaufquote 42%) aus allen Berliner Schulen gezogen, in denen ein Online-Fragebogen an sämtliche PF weitergeleitet wurde (Klocke, Salden & Watzlawik, 2020). Analysiert wurden Antworten von 534 PF (Rücklaufquote 20%), darunter 82% Lehrkräfte. Hinsichtlich Geschlecht war die Stichprobe repräsentativ für Berliner Lehrkräfte, unter 40-Jährige waren allerdings überrepräsentiert. Kriteriums- und Prädiktorvariablen aus Studie 1 wurden anhand qualitativer Vorstudien (vier Fokusgruppen mit 30 Expertinnen und elf problemzentrierte Interviews mit PF) ergänzt. Die deskriptiven Ergebnisse zeigen, dass queere, insbesondere trans und inter* Personen an Schulen nach wie vor wenig sichtbar sind: Nur eine Minderheit der PF wusste von offen lebenden queeren Schülerinnen. Die meisten PF identifizierten die aktuellen Definitionen von Trans- und Intergeschlechtlichkeit nicht korrekt und wussten nicht, dass die Mehrheit queerer Personen bis zum Alter von 15 Jahren ihr inneres Coming Out haben. Fast alle PF hatten erlebt, dass queer-bezogene Begriffe (z.B. „Schwuchtel“) von Schülerinnen als Schimpfwörter verwendet wurden. Etwa die Hälfte gab an, daraufhin jedes Mal ihre Missbilligung deutlich gemacht zu haben. Allerdings verwendete nur eine Minderheit Materialien oder erwähnte Beispiele, in denen auch queere Personen vorkommen. Wünschten Schülerinnen mit Vornamen oder Pronomen angesprochen zu werden, die nicht dem Geschlecht in ihrer Geburtsurkunde entsprachen, gaben acht von zehn PF an, diese zu verwenden. Die regressionsanalytischen Ergebnisse (Studie 1) bzw. Mehrebenenanalysen (Studie 2) zeigen, dass PF sich vor allem für queere Schülerinnen einsetzen, wenn sie an entsprechenden Qualifizierungsmaßnahmen teilgenommen haben und (daher) annehmen, dass sie bei Diskriminierung kompetent intervenieren können und mit ihrem Verhalten etwas bewirken können. Auch der Zugang zu passenden Lehrmaterialien, das Unterrichten von Biologie, gesellschaftswissenschaftlichen Fächern oder Sprachen, persönlicher Kontakt zu queeren Personen und die Annahme, dass die eigene Schule ein queer-inklusives Antidiskriminierungsleitbild hat, erhöhten die Wahrscheinlichkeit, sich zu engagieren. Keine Effekte zeigten sich u.a. für die Wahrnehmung von Diskriminierung sowie das Wissen um erhöhte Suizidalität und Alter des inneren Coming-outs queerer Jugendlicher. Insgesamt legen die Ergebnisse nahe, dass queer-inklusive Rahmenbedingungen und die Steigerung der Selbstwirksamkeit von PF wirkungsvoller sind als die Sensibilisierung für die schwierige Situation queerer Jugendlicher.
15:20 - 17:00	3-09: Erfassung selbstregulierten Lernens: Innovative Möglichkeiten im Rahmen multimethodaler Ansätze (DFG-Netzwerk SeReNe) Ort: S17
	Symposium Erfassung selbstregulierten Lernens: Innovative Möglichkeiten im Rahmen multimethodaler Ansätze (DFG-Netzwerk SeReNe) Chair(s): Laura Dörrenbächer-Ulrich (Universität des Saarlandes, Deutschland) Diskutantin(nen): Yves Karlen (Universität Zürich) Selbstreguliertes Lernen (SRL) und seine Komponenten (Kognition, Motivation und insbesondere Metakognition) zeigen sich als wichtige Prädiktoren für akademischem Erfolg (Dent & Koenka, 2016) und werden als trainierbar angesehen (Dignath et al., 2008). Um entsprechende Fördermaßnahmen einleiten und evaluieren zu können, sind reliable und valide Erfassungsmethoden zur Diagnostik von SRL unabdingbar (Cleary & Callan, 2018). Bisherige Studien sprechen für maximal moderate Zusammenhänge zwischen verschiedenen Instrumenten zur Erfassung von SRL (z.B. Dörrenbächer-Ulrich et al., 2021), weshalb die Kombination verschiedener Messinstrumente vielversprechend zu sein scheint, um das Konstrukt umfassend abzubilden (Rovers et al., 2019). Das Symposium beinhaltet vier Beiträge, die auf die (multimethodale) Erfassung von SRL sowie metakognitive Überwachung fokussieren sowie innovative Erfassungsmöglichkeiten vorstellen. Im Rahmen einer Meta-Analyse untersucht der erste Beitrag den aktuellen Forschungsstand zur multimethodalen Erfassung des selbstregulierten Lernens in Primar-, Sekundar- und Hochschulbildung. Basierend auf vorher definierten Inklusions- (Erfassung von SRL mit mindestens zwei Instrumenten, Messung von mindestens zwei der drei SRL-Komponenten, Einbezug von Leistungsvariablen) und Exklusionskriterien (keine Populationen mit Lernschwierigkeiten) wurden elf Studien ausgewählt, die im Hinblick auf die Zusammenhänge der Instrumente untereinander, der Zusammenhänge zu Leistung sowie Alter als mögliche Moderatorvariable analysiert werden. Der zweite Beitrag stellt eine Testbatterie zur aufgabenspezifischen Erfassung des Lernstrategiewissens und –gebrauchs beim Lesen für Fünft- und Sechstklässlerinnen vor. Das Set umfasst einen Vignettetest, einen Fragbogen, die Auswertung im Text genutzter Organisationsstrategien sowie die Messung des Lernerfolgs. Die bereits in früheren Studien gefundene Fünf-Faktoren-Struktur des Fragebogens konnte bestätigt werden, die Interraterreliabilität für den Vignettentest und den Strategiegebrauch erwiesen sich als sehr gut und es zeigten sich Hinweise für die konvergente sowie diskriminante Validität. Weder Intelligenz noch Lesekompetenz zeigten einen Einfluss auf den Zusammenhang der Lernstrategien mit tatsächlichem Lernerfolg. Lerntagebücher haben neben einer diagnostischen Funktion auch eine Interventionswirkung, da sie sich mittels Reaktivitätseffekten positiv auf das selbstregulierte Lernen (z.B. Motivation) auswirken können. Dies kann verstärkt werden, indem Feedback sowie Strategieempfehlungen integriert werden. In diesem Kontext stellt der dritte Beitrag die Entwicklung eines Lerntagebuchs vor, das für Schülerinnen der Klassenstufen 5 bis 9 genutzt werden kann. Es werden die Ergebnisse einer Validierungsstudie hinsichtlich Reliabilität, konvergenter und diskriminanter Validität und Verlaufsdaten berichtet. Basierend auf den Ergebnissen der Studie soll automatisch generiertes Feedback in das Lerntagebuch integriert werden. Der vierte Beitrag untersucht die Bedeutung der metakognitiven Komponente von SRL für die Adaptivität beim Rechnen von Grundschulkindern. Dazu wurde die metakognitive Urteilsfähigkeit, der Einsatz metakognitiver Strategien bei verschiedenen Rechenmethoden sowie kognitive Rechenstrategien mittels Laut-Denk-Protokollen erfasst. Die Ergebnisse zeigen, dass die adaptive Nutzung von Rechenstrategien mit besserer metakognitiver Urteilsfähigkeit und stärkerer Nutzung von metakognitiven Strategien zusammenhängt. Darüber hinaus scheint es im Hinblick auf die gemessenen metakognitiven Variablen einen Unterschied zu machen, ob die Schülerinnen die Rechenmethode frei wählen dürfen oder vorgegeben bekommen. Beiträge des Symposiums Multimethodale Erfassung von SRL in Primar-, Sekundar- und Hochschulbildung - Eine Metaanalyse Julia Ruhl, Laura Dörrenbächer-Ulrich, Franziska Perels Universität des Saarlandes Selbstreguliertes Lernen (SRL) wird definiert als "self-generated thoughts, feelings, and actions for attaining academic goals" (Zimmerman, 1998). Auch wenn verschiedene Konzeptualisierungen von SRL existieren, wird im Allgemeinen angenommen, dass das Konstrukt aus drei verschiedenen Komponenten besteht: Kognition, Metakognition und Motivation (Perels et al., 2020). Da die Wichtigkeit von SRL für den gesamten Bildungsweg von Grundschule bis hin zum Studium (Kitsantas et al., 2008; Throndsen, 2011; Perels et al., 2009) unbestreitbar ist, ist es wichtig SRL möglichst umfassend zu erfassen, um Interventionen o.ä. planen zu können. Es existieren unterschiedliche Methoden zur Erfassung von SRL. Diese lassen sich grob unterteilen in "Online-" und "Offline-" Instrumente (Wirth & Leutner, 2008). Während Offline-Instrumente SRL als ein eher allgemeines Konstrukt und retrospektiv erfassen, beziehen sich Online-Instrumente auf eine bestimmte Aufgabe und erfassen den SRL Prozess in Echtzeit (ibid.). Häufig genutzte Offline-Instrumente sind Fragebögen, während Verfahren wie die Mikroanalyse oder Laut-Denk-Protokolle zu den Online-Instrumenten zählen. Offline-Instrumente sind nach aktuellem Stand die am häufigsten genutzten Instrumente, auch wenn ihre Nutzung viel Kritik mit sich bringt (Dinsmore et al., 2013; Endedijk et al., 2016). Der Hauptkritikpunkt besteht darin, dass sie sich nicht dafür eignen, "tatsächliches" SRL zu erfassen und dass nicht klar ist, auf welche Situationen Lernende sich beziehen, wenn sie z.B. einen Fragebogen ausfüllen. Andererseits sind sie gut geeignet, um einen allgemeinen Überblick über die generelle SRL-Nutzung/Präferenzen einer Person zu geben (Dinsmore et al., 2013). Online-Instrumente hingegen können die konkrete SRL-Nutzung in Echtzeit während einer spezifischen Aufgabe wiedergeben, eignen sich aber nicht dazu, Aussagen zu dem allgemeinen SRL-Verhalten einer Person zu machen (ibid.). Es gibt Bestrebungen, SRL multimethodal zu erfassen, entweder durch mehrere Instrumente einer Messkategorie oder durch eine Kombination von sowohl Online- als auch Offline-Instrumenten (e.g., Callan & Cleary, 2018; Dörrenbächer-Ulrich et al., 2021). Durch eine Kombination von Instrumenten soll die Reliabilität der Messung gesteigert (Perry & Rahim, 2011; Veenman, 2011) und die Vor- und Nachteile der verschiedenen Instrumente ausgeglichen werden. Erste Studien zeigen Zusammenhänge zwischen SRL-Komponenten, die mit unterschiedlichen Instrumenten einer Messkategorie erhoben wurden (Cleary et al., 2015; Dörrenbächer-Ulrich et al., 2021), allerdings nur wenig Zusammenhänge zwischen online und offline Maßen (ibid.). Ziel der vorliegenden Metaanalyse ist es, Studien, die eine multimethodale Herangehensweise zur Erfassung von SRL nutzen, genauer zu beleuchten und zu untersuchen, wie die unterschiedlichen Instrumente miteinander zusammenhängen. Sowie, ob es Unterschiede zwischen den Instrumenten gibt, wenn es um die Erfassung konkreter Komponenten geht. Des Weiteren soll das Alter als Moderator des Zusammenhangs untersucht werden, da sich die Art der eingesetzten Instrumente v.a. für jüngere Altersgruppen unterscheidet (Perels et al., 2022). Zudem wird betrachtet, ob sich verschiedene Instrumente besser dafür eignen Performanz (z.B. Noten) vorherzusagen. Als Basis für die Literaturrecherche werden genaue Inklusions- und Exklusionskriterien definiert. So werden nur Studien in Betracht gezogen, die zwischen 2003 und 2023 publiziert wurden. In den Studien muss SRL mit mindestens zwei unterschiedlichen Instrumenten erhoben worden sein, sowie auf mindestens zwei der drei Komponenten Bezug genommen werden. Als Zielstichproben werden Schülerinnen der Primar- oder Sekundarstufe sowie Studierende angenommen. Des Weiteren werden Studien ausgeschlossen, die sich exklusiv auf Stichproben mit Lernbeeinträchtigungen oder Hochbegabungen beziehen. Als weiteres Kriterium muss eine Performanzvariable vorliegen, also z.B. Noten oder Leistung in einem Wissenstest. Basierend auf diesen Kriterien konnten elf Artikel identifiziert werden, die in die Analyse aufgenommen werden. Derzeit wird die Vorauswahl auf Volltextebene nochmal von einer zweiten Person gescannt, sodass die Reliabilität der Auswahl sichergestellt werden kann. Die Ergebnisse liegen zum Tagungszeitpunkt vor. Die Meta-Analyse soll Anhaltspunkte liefern, wie SRL am besten erfasst wird (auch im Hinblick auf Performanzvariablen), ob unterschiedliche Instrumente sich besser zur Erfassung unterschiedlicher Komponenten eignen, und ob es Unterschiede zwischen verschiedenen Altersstufen gibt. Multimethodale Diagnostik von Lernstrategien beim Lesen. Eine Validierungsstudie Isabel Unkel¹, Joachim Wirth², Christian Fischer³ ¹TU Dortmund, ²Ruhr-Universität Bochum, ³Universität Münster Die Fähigkeit zum selbstregulierten Lernen (SRL) wirkt sich positiv auf die Schulleistungen von Schülerinnen und Schülern aus (Dent & Koenka, 2016; Dignath & Büttner, 2008, 2018; Donker et al., 2014). Um sie entsprechend ihres individuellen Entwicklungsstandes in Bezug auf SRL effektiv zu unterstützen, ist es von hoher Bedeutsamkeit, eine differenzierte Diagnostik durchzuführen (Dignath & Sprenger, 2020; Van de Pol et al., 2010). Es existieren zwar mehrere Methoden zur Messung von SRL, doch mangelt es ihnen häufig an Validität und Reliabilität (Veenman & van Cleef, 2019). Die Kombination verschiedener diagnostischer Ansätze und die Berücksichtigung aufgaben- und situationsspezifischer Faktoren scheint vielversprechend zu sein, um Zusammenhänge zwischen SRL und akademischem Erfolg aufzudecken (Cleary & Callan, 2018; Fan et al., 2023; Rovers et al., 2019; Spörer & Brunstein, 2006; Zepeda & Nokes-Malach, 2023). Zu diesem Zweck wurde eine Testbatterie für fünfte und sechste Jahrgangstufen, das „Münsteraner Analyseset zur aufgabenspezifischen Erfassung von Lernstrategien beim Lesen“ (MALS; Unkel, 2023) 2023), weiterführend validiert. Die Testbatterie umfasst für jede Klassenstufe zwei parallele Testformen, die jeweils einen Sachtext und sechs Multiple-Choice (MC)-Aufgaben, einen Vignettentest zur Erfassung des Lernstrategiewissens und einen Fragebogen zur Erfassung des aufgabenspezifischen Einsatzes von Lernstrategien bei der Bearbeitung des Sachtextes enthalten. Der tatsächliche Einsatz von Lernstrategien wird durch sichtbare Organisationsstrategien im Testheft (z. B. Textmarkierungen und Notizen) gemessen. Die Validierung des MALS (Untersuchung der Faktorenstruktur des Fragebogens, der Interrater-Reliabilitäten für die Bewertung des Lernstrategiewissens und des Organisationsstrategiegebrauchs sowie die Überprüfung der Konstruktvalidität) erfolgte anhand einer Stichprobe von N = 184 Schülerinnen und Schüler der Jahrgangsstufen fünf und sechs. Darüber hinaus diente die Studie der mehrebenenanalytischen Untersuchung der Fragestellung, ob die Faktoren Intelligenz und Lesekompetenz die Zusammenhänge zwischen Lernstrategiewissen sowie Lernstrategiegebrauch und dem MC-Testergebnis als abhängiger Variable moderieren. Die MC-Aufgaben fragen Informationen über den Textinhalt ab und liefern ein Maß für den Lernerfolg bei der Leseaufgabe. Die in früheren Studien für den Fragebogenteil gefundene Fünf-Faktoren-Struktur (Unkel, 2023) konnte bestätigt werden (χ² = 213, df = 116, p < .003, CFI = .97, TLI = .97, SRMR = .06, RMSEA = .04). Die Interrater-Reliabilitäten für die Bewertung des Lernstrategiewissens und des Organisationsstrategiegebrauchs erwiesen sich als gut bis sehr gut (Lernstrategiewissen: κ = .64 bis .1; Organisationsstrategieeinsatz: κ = .70 bis .1). Die Überprüfung der Konstruktvalidität ergab überwiegend erwartungskonforme Ergebnisse in Bezug auf die konvergente und diskriminante Validität. Weder in Bezug auf die Intelligenzleistung noch auf die Lesekompetenz ließen sich signifikante Interaktionseffekte mit den hier untersuchten Lernstrategiefacetten (Lernstrategiewissen, tatsächlicher Organisationsstrategiegebrauch, selbst berichteter Lernstrategiegebrauch) zur Vorhersage des Lernerfolgs (MC-Testergebnis) nachweisen. Signifikante Haupteffekte ergaben sich für die Prädiktoren Intelligenz und Lesekompetenz. Darüber hinaus trug insbesondere das Leseselbstkonzept zur Varianzaufklärung in Bezug auf das MC-Testergebnis als Kriterium bei. Hinsichtlich der Lernstrategien wurden lediglich geringe signifikante Effekte für das Lernstrategiewissen und die Gesamtsumme Textmarkierung (nicht aber für die Textmarkierungsqualität) gefunden. Die geringen Effekte in Bezug auf die untersuchten Lernstrategien stehen jedoch im Einklang mit früheren Befunden, die belegen, dass der Zusammenhang zwischen Lernstrategieeinsatz und Lernerfolg erst mit zunehmendem Alter konsistenter wird (Leopold & Leutner, 2002). Zudem gilt es zu bedenken, dass es sich mit dem MALS zwar um ein valides und reliables Testinstrument handelt, das jedoch vor allem kognitive Lernstrategien (insbesondere Organisationsstrategien) in den Blick nimmt. In einem Ausblick werden zukünftige Forschungsideen vorgestellt, die einen stärkeren Fokus auf metakognitive Lernstrategien unter Verwendung innovativer Messmethoden (z.B. mit retrospektiven Protokollen und der Erfassung von Logdaten) richten. Erfassung von selbstregulatorischen Variablen beim Rechnen von Grundschulkindern Annalena Sander, Charlotte Dignath TU Dortmund Die Fähigkeit zum selbstregulierten Lernen (SRL) ist von zentraler Bedeutung für akademischen Erfolg an Schulen (Dent & Koenka, 2016; Dignath et al., 2008). Um SRL weiter erforschen zu können, werden daher Messinstrumente benötigt, die dieses facettenreiche Konstrukt erfassen können. Obwohl die meisten SRL-Modelle das Lernen als Prozess auffassen (Schmitz & Wiese, 2006; Winne & Hadwin, 1998; Zimmerman, 2008), dominieren querschnittliche Fragebögen deutlich die Forschungsliteratur (Roth et al., 2016). Lerntagebücher hingegen bieten die Möglichkeit, alltägliches Lernverhalten in situo im Lernkontext zu erfassen und dieses Lernhalten in seinem Verlauf zu dokumentieren (Perels et al., 2007). Dadurch können auch zentrale theoretische Annahmen von SRL-Modellen empirisch überprüft werden, wie z.B. dass sich die Outcomes eines Lerntages auf die Motivation des Folgetags auswirkt (Bellhäuser et al., 2021) und dass sich daraus sowohl positive als auch negative intraindividuelle Feedback-Loops entwickeln können (virtuous and vicious circles; Theobald et al., 2023). Im Gegensatz zu SRL-Fragebögen haben sich allerdings bisher keine SRL-Lerntagebücher als Standard-Messinstrumente etablieren können (Roth et al., 2016), was die Vergleichbarkeit von Studien erschwert. Ziel des vorliegenden Beitrags ist daher die Entwicklung eines Lerntagebuchs, das bei unterschiedlichen Zielgruppen und unterschiedlichen Rahmenbedingungen von Schülerinnen einsetzbar ist und auch von anderen Forschungsgruppen adaptiert werden kann. Lerntagebücher erfüllen zwei Funktionen: Neben dem oben beschriebenen Einsatz zur Datenerhebung, können sie auch als Intervention eingesetzt werden (Panadero et al., 2015). Dabei führt die tägliche Konfrontation mit standardisierten Fragen (z.B. „Welche Ziele setzt du dir für den heutigen Tag?“) zu einer veränderten Aufmerksamkeit, die wiederum eine Verhaltensänderung nach sich zieht, was als Reaktivitätseffekt bezeichnet wird (Zimmerman, 2002). Wie Dignath und Kolleginnen (2023) zeigen konnten, haben Lerntagebücher und ähnliche Self-Monitoring-Tools kleine positive Effekte auf SRL und Motivation und moderate positive Effekte auf akademische Leistungen. Eine Weiterentwicklung von Lerntagebüchern als Intervention besteht darin den Versuchspersonen auf ihre Lernprozessdaten ein automatisch generiertes Feedback anzubieten. Dabei werden die individuellen Daten von einem digitalen Lerntagebuch erfasst, algorithmisch verarbeitet und unmittelbar im Lerntagebuch in Form von visuellem oder textuellem Feedback angezeigt. So präsentierten Wäschle und Kolleginnen (2014) in einem wöchentlichen Tagebuch eine dynamische Grafik, in der individuelle Verlauf der Prokrastination der Probandinnen angezeigt wurde. Das Feldexperiment konnte zeigen, dass durch die Präsentation dieses Verlaufs die Prokrastinationsneigung der Probandinnen gesenkt werden konnte. Theobald und Bellhäuser (2022) sowie Bellhäuser und Kolleginnen (2023) setzten hingegen textuelles Feedback ein: Dabei wurden die individuellen täglichen Daten der Probandinnen verglichen mit Normwerten einer größeren Stichprobe. Basierend auf Cut-off-Werten wurden dann vorformulierte Textbausteine ausgewählt und präsentiert. Es zeigte sich insgesamt ein positiver Effekt dieses Feedbacks auf viele SRL-Facetten, insbesondere wenn sowohl metakognitive als auch motivationale Aspekte im Feedback berücksichtigt wurden und wenn das Feedback auch eine Feed-Forward-Komponente, also konkrete Strategieempfehlungen, enthielt. In der vorliegenden Studie wird ein neues Lerntagebuch für Schülerinnen der Klassenstufen 5 bis 9 erprobt. Ziel ist es, ein reliables und valides Messinstrument zu entwickeln, das an den Schulalltag (zunächst an Gymnasien) angepasst ist und in möglichst kurzer Zeit ein möglichst umfassendes Bild des täglichen SRL-Verhaltens erfasst. Die erhobenen Daten der vorliegenden Studie dienen der Normierung, um in zukünftigen Studien automatisch generiertes Feedback anbieten zu können. Wir konnten N=461 Schülerinnen der Klassenstufen 5 bis 9 an Gymnasien in Rheinland-Pfalz rekrutieren (MGesamt=12,0 Jahre, SD=1,5 Jahre; n=179 weiblich, n=259 männlich, n=13 non-binär oder keine Angabe; 5. Klasse: n=100, 6.Klasse: n=104, 7. Klasse: n=22, 8. Klasse: n=199, 9. Klasse: n= 26). Nach einer querschnittlichen T1-Fragebogen-Erhebung füllten die Schüler*innen über einen Zeitraum von vier Wochen täglich morgens im Schulunterricht das Lerntagebuch aus (Gesamtrücklauf: K=5.327 Tagebuch-Einträge), gefolgt von einer weiteren querschnittlichen T2-Fragebogen-Erhebung (N=454). Im Vortrag präsentieren wir Daten zu Reliabilität, konvergenter und divergenter Validität sowie Verlaufsdaten für die unterschiedlichen Altersgruppen.
15:20 - 17:00	3-10: Leading (Digital) Change? Die Rolle der Schulleitung bei der digitalen Transformation von Schulen in Deutschland und der Schweiz Ort: S26
	Symposium Leading (Digital) Change? Die Rolle der Schulleitung bei der digitalen Transformation von Schulen in Deutschland und der Schweiz Chair(s): Maria-Luisa Schmitz (Universität Zürich), Andreas Harder (Universität Konstanz, Deutschland) Diskutantin(nen): Dirk Ifenthaler (Universität Mannheim) Theoretischer Rahmen* Sowohl in Deutschland als auch in der Schweiz ist die digitale Transformation von Schulen bereits seit vielen Jahren ein breit diskutiertes Thema. Durch die COVID19-Pandemie und die damit verbundenen Herausforderungen ist sie in der jüngsten Vergangenheit nochmals verstärkt in den Fokus gerückt (u.a. Feldhoff et al., 2022; Huber et al., 2020). Wie vielschichtig die digitale Transformation im schulischen Kontext ist, verdeutlichen verschiedene Modelle (u.a. Ifenthaler & Egloffstein, 2020; Ilomäki & Lakkala, 2018). In diesem Zusammenhang wird der Schulleitung bei der Initiierung und Begleitung digitalisierungsbezogener Entwicklungsprozesse eine besondere Bedeutung zugesprochen (Dexter, 2018; Gerick & Eickelmann, 2019; Tulowitzki et al., 2021). Dabei hat das Schulleitungs- bzw. Führungshandeln sowohl Effekte auf die Gestaltung schulischer Rahmenbedingungen als auch auf die Integration von ICT im Unterricht (Petko et al., 2018). Übergeordnete Fragestellung Das Symposium setzt sich mit der übergeordneten Fragestellung auseinander, welche Rolle die Schulleitung im Kontext digitaler Schulentwicklungsprozesse einnimmt. Hierbei wird untersucht, inwieweit verschiedene Formen des Schulleitungshandelns auf die digitalisierungsbezogenen Rahmenbedingungen der Schule sowie auf entsprechende Lehr- und Lernprozesse auf Unterrichtsebene wirken. Darauf aufbauend wird betrachtet, wie Schulleitungen ihr Handeln bzgl. der digitalen Transformation begründen. Beiträge des Symposiums Der erste Beitrag geht der Frage nach, wie Führungshandeln im Sinne des digital instructional leadership von Schulleitungen und Lehrpersonen wahrgenommen wird. Darauf aufbauend werden Zusammenhänge zwischen dem digital instructional leadership und lehrpersonenbezogenen Faktoren sowie Lernprozessen auf Seiten der Schülerinnen untersucht. Als Datenbasis dient der zweite Zyklus der ICIL Studie (Eickelmann et al., 2019); die Stichprobe umfasst n = 2.328 Lehrpersonen und n = 3.655 Schülerinnen, auf die die Daten der Schulleitungen gewichtet werden. Die Fragen, wie die digitale Transformation an schweizerischen Schulen der Sekundarstufe II gesehen wird und welche Begründungen Schulleitungen für die Digitalisierungsstrategien ihrer Schulen nennen, stehen im Fokus des zweiten Beitrags. Auf Basis eines soziologischen Ansatzes wird dargestellt, wie Schulleitungen die strategische Vorgehensweise bei der digitalen Transformation in ihrer Schule legitimieren bzw. rechtfertigen. Hierfür wurden in einem ersten Schritt n = 9 „digitale Vorreiterschulen“ identifiziert und im Anschluss halbstandardisierte Interviews mit den Schulleitungen dieser Schulen durchgeführt. Der abschließende dritte Beitrag untersucht die Effekte innovativen Schulleitungshandelns sowohl auf die digitalisierungsbezogenen Rahmenbedingungen der Schule als auch die Integration von ICT im Unterricht. Unter innovativem Schulleitungshandeln wird dabei die Förderung aktiver Entwicklungsarbeit bei den Lehrpersonen sowie die Schaffung kooperativer Rahmenbedingungen verstanden. Zu diesem Zweck wurden n = 306 Schulleitungsmitglieder beruflicher Schulen in der Schweiz befragt. Das Symposium vereint somit eine allgemein- und berufsbildende Perspektive in einem internationalen Kontext mit Beitragenden aus insgesamt fünf Institutionen. Das Schulleitungshandeln wird aus verschiedenen Blickwinkeln betrachtet, wodurch die weitreichende Bedeutung der Schulleitung für digitalisierungsbezogene Entwicklungsprozesse untermalt wird. Dabei kommen sowohl quantitative als auch qualitative Analyseverfahren zum Einsatz. Beiträge des Symposiums Digital instructional leadership aus Schulleitungs- und Lehrpersonensicht Julia Gerick¹, Claudia Menge¹, Pierre Tulowitzki², Christiane Annemann¹ ¹TU Braunschweig, ²Fachhochschule Nordwestschweiz Theoretische Fundierung Das Leitungshandeln von Schulleitungen ist hoch bedeutsam für die Kompetenzen, die Motivation und die Arbeitsbedingungen von Lehrpersonen, was sich wiederum auf den Unterricht und die Leistungen von Schülerinnen auswirkt (Leithwood et al., 2017; Grissom et al., 2021). Schulleitungen werden auch als "Change Agents" bezeichnet, da sie eine wichtige Rolle als Treiber von Innovationen in Schulen spielen können (Fullan, 1993; Hall & Hord, 2019). Zu diesen Innovationen gehört die Integration digitaler Medien in Schule und Unterricht (u.a. De Florio-Hansen, 2018). Es hat sich gezeigt, dass Schulleitungen das Wissen über und die Nutzung von digitalen Medien der Lehrkräfte beeinflussen können (Dexter, 2018). Dies wurde unter anderem mit ihrem Führungshandeln in Verbindung gebracht (z. B. Navaridas-Nalda et al., 2020). Es wird angenommen, dass es für Lehrkräfte sowie Schülerinnen förderlich ist, wenn die Schulleitung in ihrem Führungshandeln digitalisierungsbezogene Aspekte explizit berücksichtigt. Dem Konzept des instructional leadership (oder auch unterrichtsbezogene Führung) wird eine besondere Wirkung zugeschrieben (Robinson et al., 2009; Pietsch & Tulowitzki, 2020) und erscheint daher für den Kontext der Digitalisierung von Schule und Unterricht interessant. Fragestellung Bisher existieren jedoch kaum Forschungsergebnisse zu digital instructional leadership. Vorhandene Beiträge richten sich häufig an Praktikerinnen (Sorenson et al., 2016) oder stützen sich ausschließlich auf Selbstberichte der Schulleitung (z. B. Nurabadi et al., 2022) und sind zudem zumeist auf die Kompetenzen oder Einstellungen der Schulleitung fokussiert. Es fehlt u. a. an Beiträgen, die den (möglichen) Einfluss von digital instructional leadership auf die Unterrichtspraktiken oder das Lernen der Schülerinnen analysieren, sowie an Studien zum Leitungshandeln, die mehrere Perspektiven berücksichtigen (z. B. Daten von Schulleitungen und Lehrkräften) und auf großen, repräsentativen Datensätzen basieren. Diese Desiderata werden noch deutlicher, wenn es sich um Beiträge handelt, die große, internationale Datensätze nutzen. Mit diesem Beitrag sollen einige dieser Desiderata bearbeitet werden. Die Fragestellungen dieses Beitrags lauten daher: 1. Wie wird digital instructional leadership von Schulleitungen und Lehrpersonen in Deutschland wahrgenommen und inwieweit unterscheiden sich diese Wahrnehmungen? 2. In welchem Zusammenhang steht das (wahrgenommene) digital instructional leadership mit verschiedenen lehrpersonenbezogene Faktoren sowie dem Lernen der Schülerinnen? Methode Die Analysen basieren auf Daten des zweiten Zyklus der International Computer and Information Literacy Study (ICILS 2018; Eickelmann et al., 2019). Im Fokus steht digital instructional leadership, das sowohl im Schulleitungs- als auch im Lehrkräftefragebogen anhand von fünf Items (modifizierte und auf den Digitalisierungskontext bezogene Items aus PISA 2006; Vennemann et al., 2021) erfasst wurde. Zur Beantwortung der Forschungsfragen wurden Sekundäranalysen mittels deskriptiver Statistik (Forschungsfrage 1) sowie Korrelationsanalysen und Strukturgleichungsmodellierung (Forschungsfrage 2) durchgeführt. Der komplexen Datenstruktur wird durch den Einsatz des IEA IDB Analyzers (u.a. Mikheeva & Meyer, 2020) sowie der Software Mplus Rechnung getragen. Die Analysestichprobe für diesen Beitrag umfasst durchschnittlich n = 2.328 Lehrpersonen und n = 3.655 Schülerinnen, auf die die Daten der Schulleitungen gewichtet werden. Ergebnisse und ihre Bedeutung Zusammenfassend zeigen die Ergebnisse zu Forschungsfrage 1, dass Schulleitungen ihr digital instructional leadership ausgeprägter einschätzen als die Lehrkräfte dies wahrnehmen. Dies gilt insbesondere für die Wahrnehmung der Unterstützung von Lehrkräften, die Schwierigkeiten mit dem Einsatz von digitalen Medien im Unterricht haben. Das für Forschungsfrage 2 geschätzte Strukturgleichungsmodell (Modellfit: CFI=.96, TLI=.94, RMSEA=.02, SRMR=.04) zeigt u. a. einen positiven Zusammenhang des wahrgenommenen digital instructional leadership durch die Lehrpersonen mit der nachdrücklichen Förderung computer- und informationsbezogener Kompetenzen bei den Schülerinnen. Mit den computer- und informationsbezogenen Kompetenzen der Schülerinnen konnte kein signifikanter Zusammenhang festgestellt werden. Es ist möglich, dass die hohe Autonomie der Lehrkräfte als "Puffer" für einen möglichen Einfluss der Schulleitung fungiert. Die Befunde werden vor dem Hintergrund aktueller Entwicklungen und Perspektiven der Schulleitungsforschung in einer digitalen Welt diskutiert (u.a. Tulowitzki et al., 2022). Digitalisierungsstrategien an digitalen Vorreiterschulen aus Schulleitungsperspektive Maria-Luisa Schmitz, Philipp Gonon Universität Zürich Theoretische Fundierung Obwohl die bedeutsame Rolle von Schulleitungen hinsichtlich digitaler Transformation an Schulen bekannt ist, gibt es wenig Evidenzen dafür, wie Schulleitende ihre Digitalisierungsstrategien rechtfertigen. Einen guten Orientierungspunkt bietet die Rechtfertigungssoziologie, die bezüglich des gesellschaftlichen Wandels und Reformen in der Arbeitswelt und im Bildungswesen bei verschiedenen Akteurinnen unterschiedliche Legitimationsmuster unterscheidet (Hägi, 2019; Saner, 2019). So bezieht sich eine (staats-)bürgerliche Rechtfertigung auf gesellschaftliche Teilhabe, Solidarität und soziale Integration, während eine industrielle Legitimation Effizienz und Fachkompetenzerwerb adressiert. Eine marktwirtschaftliche Legitimation wiederum fokussiert auf Wettbewerb und Kosten. Pädagogische Werte und Vertrauen werden der sogenannten häuslichen Konvention zugeordnet (Leemann & Imdorf, 2019). Diese vier (von – gemäß Rechtfertigungssoziologie – insgesamt sieben) zentralen Rechtfertigungen prägen den Bildungsbereich und sollen in diesem Beitrag auf Digitalisierungsstrategien und -umsetzungen in Schulen der Sekundarstufe II in der Schweiz bezogen werden. Fragestellung Der Beitrag geht vor diesem Hintergrund folgenden Fragestellungen nach: 1. Wie wird die digitale Transformation an schweizerischen Schulen der Sekundarstufe II (Berufsschulen, Gymnasien, Fachmittelschulen) gerechtfertigt? 2. Werden hierbei von Seiten der Schulleitungen für alle Beteiligten hinsichtlich Digitalisierungsstrategien tragfähige Begründungen gefunden? Methode Im Rahmen eines Projektes zum Stand der Digitalisierung in schweizerischen Schulen der Sekundarstufe II wurden neben einer umfangreichen quantitativen Studie auch qualitative Daten erhoben. Neun besonders innovative, digitale Schulen (6 Berufsfachschulen und 3 Gymnasien) wurden für halbstandardisierte Interviews mit Schulleitungen identifiziert. Die Basis dafür beruhte auf Nominationen durch 117 Schulleitende, die in einer Umfrage digitale Vorreiterschulen beschreiben sollten. Als weitere Kriterien dienten die Daten der quantitativen Studie des Projektes selbst: Häufigkeitsangaben des Technologieeinsatzes von 2247 Lehrpersonen für kognitiv aktivierende Lernaktivitäten (Antonietti et al., 2023) und Einschätzungen von 225 Schulleitenden zum pädagogischen Innovationspotenzial ihrer Schule (Johnson et al., 2007). Die Interviewdaten wurden gemäß der qualitativen Inhaltsanalyse ausgewertet (vgl. Kuckartz, 2018). Es wurden sowohl deduktive Kategorien gemäß der Rechtfertigungssoziologie gebildet als auch induktive Kategorien auf Basis der Daten abgeleitet. Ergebnisse und ihre Bedeutung Erste inhaltsanalytische Auswertungen zeigen, dass alle erfassten Legitimationsansätze der Rechtfertigungssoziologie von Schulleitungen in digital innovativen Schulen verwendet werden. Dabei ist die Dimension der häuslichen Konvention besonders dominant, da Schulleitende sich immer wieder auf den pädagogischen Mehrwert digitaler Medien berufen. Dies stimmt mit vorherigen Befunden überein, dass an digital innovativen Schulen der Fokus vor allem auf der Pädagogik liegt (Venezky & Davis, 2002). Auch die industrielle Rechtfertigung ist prominent vertreten, da Schulleitende den Erwerb von digitalen Kompetenzen und die Entlastung bei administrativen Arbeiten durch digitale Medien betonen. Eine wirtschaftliche Legitimation wird lediglich an Berufsfachschulen genannt und steht nicht im Fokus der Überlegungen von Schulleitungen an Gymnasien. Ebenso konnten induktiv weitere Rechtfertigungen identifiziert werden: Unter anderem beschreiben Schulleitende die COVID19-Pandemie als einen starken Anschub für Digitalisierungsbemühungen und weitere Vernetzungen an ihrer Schule. Ebenso berichten manche, sich verpflichtet zu fühlen, gesellschaftliche Trends nachzuvollziehen. Diese Rechtfertigungen entsprechen gemäß Leemann und Imdorf (2019) der Projektkonvention, bei der es darum geht, auf Veränderungen von außen zu reagieren. Insgesamt liefert die Studie erste Befunde dazu, wie Schulleitende ihre Digitalisierungsstrategien rechtfertigen und gibt Einblicke, welche Prioritäten an digital innovativen Schulen gesetzt werden. Schulen, die einen vorbildlichen Umgang mit der digitalen Transformation anstreben, sollten die Pädagogik in das Zentrum ihrer Überlegungen stellen. Effekte innovativen Schulleitungshandelns auf die Integration von ICT in Lehr- und Lernprozesse Andreas Harder¹, Stephan Schumann¹, Serge Imboden² ¹Universität Konstanz, ²HES-SO Valais-Wallis Theoretische Fundierung Verschiedene Modelle betonen im Hinblick auf die Integration von Informations- und Kommunikationstechnologien (ICT) in Lehr- und Lernprozesse die Relevanz organisationaler sowie intrapersoneller Rahmenbedingungen (u.a. Ifenthaler & Egloffstein, 2020; Ilomäki & Lakkala, 2018). Petko et al. (2018) verwenden in diesem Zusammenhang die Begriffe der Teacher Readiness und School Readiness: Während unter Teacher Readiness die digitalen Kompetenzen sowie die Einstellungen der Lehrpersonen gegenüber ICT fallen, umfasst das Konstrukt der School Readiness neben der technischen Infrastruktur, der formellen und informellen Kollaboration und der Bedeutung sowie der Zielklarheit von ICT auch die Unterstützung der Schulleitung. Der Schulleitung wird dabei eine besondere Bedeutung für die Initiierung und Umsetzung von Innovationen und Veränderungsprozessen zugeschrieben (u.a. Bonsen, 2003; Gräsel et al., 2020); sie wird auch als „Treiber der Schulentwicklung“ (Bonsen, 2016, S. 319) bezeichnet. Dies lässt sich auf Entwicklungsprozesse im Kontext der digitalen Transformation übertragen (u.a. Dexter, 2018; Gerick & Eickelmann, 2019; Tulowitzki & Gerick, 2018; Tulowitzki et al., 2021). Vor dem Hintergrund dieser „Schlüsselrolle“ (Gerick et al., 2019, S. 175) der Schulleitung bei der Planung, Initiierung und Begleitung von (digitalisierungsbezogenen) Schulentwicklungsprozessen, stellt sich die Frage, ob das Schulleitungshandeln als integrativer Teil der organisatorischen Rahmenbedingungen verstanden werden kann (vgl. Petko et al., 2018) oder ob es viel-mehr als vorgelagerte Instanz wirkt. Fragestellung Auf Basis dieser theoretischen Überlegungen geht der Beitrag der übergeordneten Fragestellung nach, welche Effekte innovatives Schulleitungshandeln, also die Förderung aktiver Entwicklungsarbeit sowie die Schaffung kooperativer Bedingungen, auf die Integration von ICT im Unterricht hat. Hierbei wird analysiert, ob die digitalisierungsbezogenen Rahmenbedingungen – das heißt, sowohl organisatorische als auch intrapersonelle Faktoren – als Mediator fungieren; das Schulleitungshandeln wird dabei als vorgelagerter Faktor modelliert. Methode Die für die Beantwortung der Fragestellung verwendeten Daten entstammen einer Online-Befragung von Schulleitungsmitgliedern beruflicher Schulen in der Schweiz aus dem Februar 2023. An der Studie haben n = 306 Personen teilgenommen. Mithilfe eines Fragebogens wurde unter anderem das innovative Schulleitungshandeln (inhaltlich losgelöst von der digitalen Transformation) mit sieben Items gemessen (Diel & Steffens, 2010; ω = .90). In Anlehnung an Petko et al. (2018) wurden als digitalisierungsbezogene Rahmenbedingungen (Faktor 2. Ordnung) zudem die Teacher Readiness (Kompetenzen, Einstellungen) und die School Readiness (Infrastruktur, (in)formelle Kollaboration, Bedeutung, Zielklarheit) erfasst. Zur Ermittlung der Nutzung von ICT im Unterricht dienten zwei adaptierte Skalen von Quast et al. (2021). Um die Wirkungsbeziehungen zwischen den Merkmalen untersuchen zu können, wurden Strukturgleichungsmodelle mit Mplus Version 8.7 (Muthén & Muthén, 2017) geschätzt. Das finale Modell weist dabei einen guten bis sehr guten Fit aus (CFI = .971; TLI = .966; RMSEA = .044; SRMR = .043). Ergebnisse und ihre Bedeutung Die Ergebnisse zeigen einen starken signifikanten Effekt des innovativen Schulleitungshandelns auf die digitalisierungsbezogenen Rahmenbedingungen der Schule (β = .746; p < .001). Darüber hinaus wird ersichtlich, dass die digitalisierungsbezogenen Rahmenbedingungen signifikant positiv auf die Integration von ICT in Lehr- und Lernprozesse wirken (β = .868; p < .001), während das Schulleitungshandeln gleichzeitig keinen direkten Effekt hierauf ausweist (β = -.073; p < .466). Die Modellierung der indirekten Wirkungsbeziehung verdeutlicht allerdings, dass das innovative Schulleitungshandeln durchaus auf die Unterrichtsebene wirkt – allerdings wird dieser Effekt vollständig durch die digitalisierungsbezogenen Rahmenbedingungen mediiert (β = .648; p < .001). Die Befunde unterstreichen zum einen die (indirekte) Bedeutung der Schulleitung für die Integration von ICT in Lehr- und Lernprozesse und zum anderen die initiative Rolle der Schulleitung für die Gestaltung förderlicher digitalisierungsbezogener Rahmenbedingungen auf Schulebene. Mit Blick auf zukünftige Forschung wäre es erstrebenswert, (1) das aufgestellte Modell in anderen Kontexten zu validieren (u.a. allgemeinbildende Schulformen, andere Länder) und (2) einen multi-perspektivischen Ansatz zu wählen, der die verschiedenen Betrachtungsweisen der unterschiedlichen schulischen Akteurinnen berücksichtigt.
15:20 - 17:00	3-11: Leveraging Advanced Statistical Methods in Empirical Educational Research: Handling Missing Data and Harnessing Machine Learning Methods Ort: S27
	Symposium Leveraging Advanced Statistical Methods in Empirical Educational Research: Handling Missing Data and Harnessing Machine Learning Methods Chair(s): Jakob Schwerter (Technische Universität Dortmund, Deutschland) Diskutant*in(nen): Sven Hilbert (Universität Regensburg) Empirical educational research is an evolving field that relies heavily on the careful application of statistical methods to validate educational theories. Given the diverse nature of educational data, the choice of appropriate methods becomes critical. Novel data types often entail that new methods must be used or even developed. Especially, empirical research has to treat missing values (van Buuren, 2018). When should which method be used to evaluate data with missing values without biasing the results? For missing data treatment and beyond, machine learning (ML) methods are becoming more important and offer possibilities that did not exist before. For example, ML methods can help process a large number of variables, ideally in an interpretable way. For example, selecting only the important variables to make regressions more robust or to highlight the relative importance of variables compared to other variables (Schwerter et al., 2022; van Lissa et al., 2023). This symposium will highlight cutting-edge ML methods and how they are advancing our ability to process diverse data efficiently and interpretably. Our session will begin with two presentations focusing on the handling of data with missing information. The first presentation will focus on challenges and solutions related to smaller datasets where multiple imputation cannot be applied. The second presentation will explore the performance of tree-based imputation methods compared to multiple imputation by chained equations with predictive mean matching (MICE PMM) applied to larger datasets. In doing so, the two papers highlight recent methodological advances in dealing with data containing missing information, thus assisting the researcher in analyzing the data. The third paper focuses on Prediction Rule Ensembles (Fokkema & Strobl, 2020), a tree-based interpretable machine learning technique that provides researchers with prediction rules, i.e., nonlinear interactions of variables. The presentation shows how it can be implemented and emphasizes its effectiveness for missing data. Our final paper focuses on presenting the use of transformer models to categorize open-ended responses in educational assessments and highlighting the ethical implications involved. Thus, the second part of the symposium focuses on two different use cases where ML methods assist the researcher in analyzing the data. After a short introduction by the symposium chairs (3-5 minutes), all symposium participants will have 15 minutes to present their study and 1-2 minutes for clarifying questions. This will be followed by a critical discussion of the papers by the discussant, who is an expert in educational data science, ML, and statistics. The symposium will conclude with an open discussion (5-10 minutes). The symposium will highlight some of the intricacies of current quantitative methods and their growing potential in empirical educational research. Beiträge des Symposiums Using tree-based imputation methods in comparison to MICE for longitudinal and multilevel data Jakob Schwerter, Ketevan Gurtskaia, Andres Romero, Birgit Zeyer-Gliozzo, Philipp Doebler, Markus Pauly TU Dortmund University Theoretical Background Missing information is common in research and can have a significant impact on the statistical. Therefore, dealing with missing data is critical to drawing reliable conclusions. Simply ignoring missing data often leads to biased results and incorrect conclusions (Collins et al., 2001, van Buuren, 2018). To provide robust and reliable results, multiple imputation (MI) is one of the most commonly used methods for dealing with missing data. It adequately accounts for the uncertainty caused by missing values (Rubin 1987, van Buuren, 2018). MI creates multiple plausible imputation sets and performs the analysis on each of these sets, allowing for a realistic capture of uncertainty. MI takes data structures into account in the imputation process. However, there is a risk of using the wrong imputation model. This is particularly problematic for multilevel data structures, where individual data are organized at different levels or hierarchies, and for panel data, also known as longitudinal data, where data are collected repeatedly over time for the same observation units. Both types of data are common in empirical research, such as educational research, social sciences, epidemiology, economics, and environmental research. They require special statistical models and analysis techniques to adequately account for relationships between levels and temporal changes in the data. The current standard in the empirical literature is the MICE imputation method with predictive mean matching (PMM, van Buuren & Groothuis-Oudshoorn, 2011). However, as data sets become more complex, the traditional MICE approach reaches its limits and researchers seek tree-based imputation methods. In addition, recent studies have also used tree-based imputation methods, although the performance and validity are not clear for all, especially compared to the standard MICE PMM. Research question In this study, we use two simulation studies to investigate how different imputation methods affect coefficient estimation and Type I and Type II errors, in order to gain insights that can help empirical researchers deal with missing values more effectively. Therefore, we use MICE and predictive mean matching (PMM) with different tree-based methods, such as MICE with random forest (RF) and chained random forests with and without PMM (missRanger, Mayer, 2019). Method We used two student simulations to address our research question. The first uses a data structure motivated by the longitudinal data from the 6th cohort of the National Educational Panel Study (NEPS; see Blossfeld, Rossbach, and Von Maurice, 2011) with 5 waves, while the second includes synthetic cross-sectional data with a two-level structure. In both cases, we simulate the dataset, impute the missing data using the mentioned imputation methods, and then run OLS and fixed effects regressions in Study 1, while we run OLS, random intercept, and random slope regressions for Study 2. We examine both bias and power over 1000 replications in order to generalize our results. Results For Study 1, our results show that Random Forest-based imputations, especially MICE Random Forest and missRanger with PMM, consistently perform better in most scenarios. The standard MICE with PMM has partially increased bias and (overly) conservative test decisions (with non-true zero coefficients). Thus, our results show the advantages of tree-based imputation methods. For study 2, our results show that considering multilevel structure in missRanger reduces Type I errors and improves the decision making at level 1 most of the times. While missRanger compared or even outperforms MICE at level 1. MICE is still superior for level 2 variables. In general, our results show the potential of tree-based methods. Furthermore, in our presentation we will quickly show how one can easily use tree-based methods to impute missing data. Resampling-Based Approaches for Nonparametric MANOVA in the Presence of Missing Data Lubna Amro, Markus Pauly TU Dortmund University Theoretical background Repeated measure designs and split plot plans are widely employed in scientific and medical research. The analysis of such designs is typically based on MANOVA models, requiring complete data, and certain assumptions on the underlying parametric distribution, such as normality or homogeneity of covariance matrices among groups. While various nonparametric multivariate methods have been proposed to address the distributional assumptions, the issue of missing data remains. To tackle this issue, a simple approach is to perform single or multiple imputations of missing values and subsequently conduct statistical tests as if there were no missing values at all. However, it's important to note that these approaches may result in an inflated type-I error rate or remarkably low statistical power if the dataset is small (Van Buuren, 2018; Ramosaj et al., 2020). Therefore, we do not follow this approach here. Research question In this study, we address the challenge of missing data in MANOVA analyses. We present our recently developed asymptotically correct procedures, which are capable of effectively handling data with missing values without requiring imputation or the exclusion of observations. Importantly, these procedures do not require the assumptions of multivariate normality and allow for covariance matrices that are heterogeneous between groups. Method To achieve this, we propose applying an appropriate resampling method in combination with quadratic form-type test statistics (specifically, the Wald-type statistic, ANOVA-type statistic, and modified ANOVA-type statistic). This approach allows us to overcome the limitations posed by missing data and relaxes the distributional assumptions that are typically required in MANOVA. In addition to proving the asymptotic validity of our methods, we analyze the finite sample behavior of the asymptotic quadratic tests and their wild bootstrap counterparts in an extensive simulation study. As an evaluation criteria, all procedures were examined for type-I error rate control at significance level α = 5% and assessed for their power in detecting deviations from the null hypothesis. We consider various scenarios involving different number of groups and time points underlying symmetric and skewed distributions. Additionally, we explore three distinct covariance structures: an autoregressive structure, a compound symmetry pattern, and a linear Toeplitz covariance structure. Missingness was generated within both Missing Completely At Random (MCAR) and Missing At Random (MAR) frameworks. Each setting was based on 10,000 simulation runs, with B = 1,000 bootstrap runs. Results Our study's intermediary results show that our proposed bootstrap methods, based upon quadratic form tests, tend to result in quite accurate type-I error rate control for most settings, whether the data distribution is symmetric or skewed, and regardless of whether it follows MCAR or MAR mechanisms. In contrast, the asymptotic Wald test shows an extremely liberal behavior in all tested scenarios and under all investigated missing data mechanisms. As a result, the combination of simulation results and theoretical validity makes the new bootstrap procedures recommendable in practice. In particular, we recommend using the wild bootstrap ANOVA-type statistic, as it offers the best overall type-I error control and demonstrates great power performance. Prediction Rule Ensembles: Introduction and Application with Mutliple Imputation Philipp Doebler¹, Marjolein Fokkema², Vincent Schroeder¹, Jakob Schwerter¹ ¹TU Dortmund University, ²Leiden University Theoretical Background Statistical prediction is a cornerstone of disciplines such as empirical educational research, psychology, and others. It involves building statistical models to predict the value of a target variable using variables. Examples of applications range from predicting dropout rates (Niessen et al., 2016) to personality and personality disorders (Kosinski et al., 2016). However, with the increasing availability of data, there has been a paradigm shift towards machine learning techniques that focus on optimizing predictive accuracy on unseen data. This is in contrast to traditional statistical explanatory approaches, which aim to understand the process of data generation. These traditional methods are often based on assumptions, such as normally distributed residuals, that do not always match actual data sets. They also reach their limits when the number of predictor variables becomes too large. Given these challenges, prediction rule ensembles (PREs; Fokkema, 2020; Fokkema & Strobl, 2020) have emerged as a promising approach to interpretable machine learning. Unlike other ensemble models, such as random forests, PREs strike a balance between predictive accuracy and model interpretability. Derived from decision tree ensembles, PREs condense to a model that contains only a selected subset of tree nodes. These nodes are manifested as simple rules, making PREs less complex than full tree ensembles without compromising their predictive power. Given this complexity, PREs function as models in the interpretable machine learning domain. Their strength lies in achieving predictive accuracy comparable to other ensemble models while maintaining model transparency. In the final version of the PRE, only a limited number of rules are used through variable selection, so that the predictions are understandable. The purpose of this presentation is to show how and to what extent the handling of missing data affects the performance and structure of PREs. Unlike linear regression, it is not possible to simply run the statistical analysis on all imputed datasets and then pool the results. One promising approach is to "stack" the data, combining all imputed records into one large dataset (Du et al., 2022; Gunn et al., 2022). Methods In a simulation study, we compared the performance of PREs on a complete dataset, a dataset with missing values, and a dataset with multiple imputations to show whether multiple imputation is suitable for use with PREs in the field of interpretable machine learning in practice. Therefore, we used a full factorial design with 64 different simulation conditions, each replicated 1000 times. The sample size (N = 400, N = 1000), the number of variables (p = 10, p = 20), the proportion of influential variables and their interactions with non-zero coefficients (sparcity; 1%, 10%), the number of multiple imputed records (D = 5, D = 20), the proportion of rows with missing values (missing; 5%, 40%), and the mechanism for generating missing values (MCAR, MAR) are varied. Results MI showed improved prediction accuracy compared to listwise deletion (LD), especially in scenarios with smaller sample sizes and higher proportions of missing data. Models trained with MI contained more selected rules than those trained with LD, but fewer than models based on complete data sets. Overall, MI appears to improve prediction quality without significantly changing the structure of the model, making it suitable for interpretable machine learning applications. Between now and the conference, the methodology will be further developed to add a measure of stability and guidelines for the use of PREs. A Pilot Study on the Use of Transformer Models to Evaluate Open-Ended Response Formats in Educational Assessments Rudolf Debelak¹, Benjamin Wolf² ¹Department of Psychology, University of Zurich, ²Institute of Education, University of Zurich Theoretical background In recent years, numerous software tools have been made available in programming languages such as R and Python that allow the application of deep learning models to evaluate text, images, and numeric variables. Because of their flexibility, such models can be used to assist human raters in evaluating open-ended response formats. One challenge of these applications is the necessity to investigate the validity of the models, since deep learning models are black-box models. Research question This study investigates the feasibility of using transformer models for the automated evaluation of open-ended responses in the educational domain. In addition to the practical application, we discuss the use of tools from the field of interpretable machine learning to investigate the validity of the model. Method Our data set consists of 125 texts collected as part of the educational assessment "Check your knowledge" in Switzerland and rated by a human rater. 100 texts were used as training data set, and 25 texts as test data set. The rating of these texts was done by combining a deep learning model (Bidirectional Encoder Representations from Transformers or BERT; Devlin et al., 2018) with regularized linear regression. Results As a preliminary result, we found a correlation of 0.93 between the predicted and the observed value in the training dataset and a corresponding correlation of 0.71 in the test dataset. We also illustrate the use of interpretable machine learning methods to investigate the validity of the estimated model.
15:20 - 17:00	3-12: Fehlkonzepte und wie man diese überwindet: Konzeptueller Wandel als Herausforderung für das (natur-) wissenschaftliche Lernen Ort: S19
	Symposium Fehlkonzepte und wie man diese überwindet: Konzeptueller Wandel als Herausforderung für das (natur-) wissenschaftliche Lernen Chair(s): Maria Theobald (DIPF \| Leibniz Institut für Bildungsforschung und Bildungsinformation, Deutschland) Diskutant*in(nen): Ilonca Hardy (Goethe Universität Frankfurt) Naive Theorien liefern oft plausible Erklärungen für Alltagsphänomene. Sie können aber auch formales Lernen erschweren und die Grundlage für robuste Fehlkonzepte bilden (Carey, 2000). Fehlkonzepte über (natur-)wissenschaftliche Phänomene sind weit verbreitet und stellen eine Herausforderung für das schulische Lernen dar, da der konzeptuelle Wandel von einer naiven Theorie zu einem wissenschaftlich akzeptierten Konzept eine Herausforderung darstellt (Vosniadou & Ioannides, 1998). Oft reicht es nicht aus, Belege zu präsentieren, die der naiven Theorie widersprechen (Limón, 2001), und falsche Konzepte können sogar neben dem richtigen Konzept existieren (Shtulman & Valcarcel, 2012). Ein besseres Verständnis darüber, welche Faktoren konzeptuellen Wandel begünstigen und wie konzeptueller Wandel im Unterricht gefördert werden kann, ist daher von zentralem Interesse. Das Symposium beleuchtet daher zwei Fragestellungen aus erziehungswissenschaftlicher, fachdidaktischer und psychologischer Perspektive: (1) Welche individuellen (z.B. Personenmerkmale) und situativen (z.B. Lernumgebung) Faktoren begünstigen konzeptuellen Wandel? (2) Welche Interventionen können konzeptuellen Wandel fördern? Die Beiträge des Symposiums nutzten verschiedene methodische Ansätze (z.B. Bayesianische Diffusionsmodelle, Experimente), um die kurz- und langfristige Überwindung von Fehlkonzepten in verschiedenen Domänen (z.B. Physik, Mathematik) zu beschreiben, vorherzusagen oder durch Interventionen zu verändern. Der erste Beitrag zeigt mit Hilfe eines Bayesianischen hierarchischen Diffusionsmodells, dass die Fähigkeit, eine automatische Antwort zu unterdrücken, die zentrale inhibitorische Kompetenz ist, die Lernenden hilft, intuitive Konzepte zu hemmen. Der zweite Beitrag zeigt, dass Fehlvorstellungen über die Funktionsweise von Zahnrädern bei Vorschulkindern in einem angeleiteten Spiel durch implizite sprachliche Hilfen reduziert werden können. Explizite sprachliche und gestische Erklärungen zeigten dagegen keinen Effekt auf das konzeptuelle Lernen. Der dritte Beitrag zeigt anhand des Konzepts der Wasserverdrängung, dass Reflexionsprompts bei Grundschulkindern die Konflikterkennung und damit das Lernen aus falschen Vorhersagen verbessern können. Die positiven Effekte der Prompts waren jedoch nur von kurzer Dauer. Im vierten Beitrag wird getestet, ob der Konzeptwechsel von natürlichen zu rationalen Zahlen durch den Lernkontext beeinflusst wird. Es wird untersucht, ob die Aufforderung zur Nutzung digitaler Hilfsmittel (ja vs. nein) und empirisches Feedback (ja vs. nein) den Strategiegebrauch und den konzeptuellen Wandel beeinflussen. Die Beiträge untersuchen somit individuelle Faktoren, die konzeptuellen Wandel begünstigen, wie individuelle Unterschiede in Inhibition (Beitrag 1), Konflikterkennung (Beitrag 3) und Strategiegebrauch (Studie 4), sowie situative Kontextfaktoren, wie die Gestaltung der Lernumgebung (Beiträge 2 & 4). Um zu verstehen, wie Fehlkonzepte erkannt, unterdrückt und überwunden werden, verwenden die Beitragenden eine Vielfalt von Messverfahren, wie z.B. Selbstberichte, Reaktionszeitmessungen und physiologische Daten und werfen dadurch Licht auf die Prozesse, die konzeptuellen Wandel begünstigen. Darüber hinaus werden verschiedene digitale und analoge Interventionen zur Förderung konzeptuellen Wandels untersucht, wie z.B. implizite und explizite Instruktionen und Prompts sowie Feedback (Beiträge 2, 3 und 4). Das Symposium untersucht Lernende unterschiedlichen Alters, von 5-jährigen Vorschulkindern (Beitrag 2) über Grundschulkinder (Beitrag 3), Kinder in der Sekundarstufe (Beitrag 4) bis hin zu erwachsenen Studierenden (Beitrag 1). Zusammenfassend trägt das Symposium somit zu einem besseren Verständnis der Faktoren bei, die konzeptuellen Wandel begünstigen, und zeigt instruktionspsychologische Ansätze auf, wie konzeptueller Wandel in verschiedenen Altersgruppen und Kontexten gefördert werden kann. Durch die methodische Vielfalt und die Berücksichtigung der Prozessebene tragen die Studien zu einem besseren Verständnis der Erfolgsfaktoren, aber auch der Herausforderungen des konzeptuellen Wandels bei. Aus den Ergebnissen lassen sich somit praktische Implikationen für die Gestaltung des Unterrichts und die Förderung des konzeptuellen Wandels ableiten. Die Beiträge werden abschließend synthetisiert und im Hinblick auf Herausforderungen des konzeptuellen Wandels sowie mögliche Interventionsansätze diskutiert. Beiträge des Symposiums Welche Inhibitionsprozesse tragen zur Unterdrückung überlernter Konzepte bei? Ein Bayesianisches hierarchisches Diffusionsmodell Peter Edelsbrunner¹, Gidon Frischkorn² ¹ETH Zürich, ²Universität Zürich Theoretischer Hintergrund In einem einflussreichen Experiment fanden Shtulman und Valcarcel (2012), dass im Unterricht überlernte, intuitive Konzepte weiterhin erhalten bleiben und unter Zeitdruck wieder aktiviert werden können. Dies zeigt sich in erhöhten Reaktionszeiten und Fehlerraten bei der Bewertung von Aussagen, bei denen typische intuitive Konzepte dem wissenschaftlichen Konzept widersprechen (z.B. „ein Mantel erzeugt Wärme“ – intuitiv korrekt, wissenschaftlich falsch) im Vergleich zu Aussagen, bei denen beide kongruent sind (z.B. „ein Feuer erzeugt Wärme“). Die theoretische Erklärung für dieses Phänomen ist, dass intuitive und wissenschaftliche Konzept ko-aktiviert werden, wodurch bei inkongruenten Aussagen Interferenz entstehet, die gelöst werden muss. Dies hat weitreichende theoretische und pädagogische Implikationen und bringt die Frage auf, wie Lernende mit der Ko-Existenz sowie der Interferenz zwischen intuitiven und wissenschaftlichen Konzepten umgehen können (und sollen). Der angenommene Prozess, der zur Auflösung der entstehenden Interferenz benötigt wird, ist Inhibition (Shtulman & Valcarel, 2012; Stricker et al., 2021). Studien, welche die Rolle von Inhibition bei der Auflösung der Interferenz untersuchten, fanden jedoch inkonsistente Ergebnisse (z.B. Stricker et al., 2021). Dies könnte mit der großen Heterogenität von Inhibitionsprozessen (z.B. Miyake & Friedman, 2004), der Unklarheit in Bezug auf analytische Entscheidungen (z.B. Modellierung von Reaktionszeit vs. Entscheidung, intra- vs. interindividuelle Modellierung, Domänenabhängigkeit des Effektes) sowie mit der geringen internen Konsistenz gängiger Inhibitionsmaße (z.B. Rey-Mermet et al., 2018) erklärbar sein. Fragestellung In der vorliegenden Studie wurde deshalb unter Vorlage mehrere Inhibitionsmaße untersucht, welche Art der Inhibition bei der Auflösung konzeptueller Interferenz eine Rolle spielt und ob sich unter Anwendung eines multivariaten kognitiven Modells, welches Messfehler und individuelle Unterschiede miteinbezieht, Effekte von Inhibitionsmaßen zeigen, die sich in typischen Regressionsanalytischen Ansätzen nicht zeigen. Methode Um diese Fragen zu untersuchen, wurden N = 178 (Alter: M = 22.52, SD = 2.78) Universitätsstudierenden unterschiedlicher Fächer zusätzlich zur Interferenztask von Shtulman und Valcarcel (2012; Omega RT/Decision = .35/.45) drei Inhibitionsmaße (Picture-Word; Omega RT/Decision = .45/.74; Anti-Sakkade; Omega = .74; Flanker; Omega = .35) vorgegeben, welche heterogene Inhibitionsprozesse nach Friedman und Miyake (2004) abdecken. Die Reaktionszeiten und Antworten aus der Interferenztask wurden anhand des Bayesianischen hierarchischen Wiener Diffusionsmodells (Vandekerckhove et al., 2011) mit schwach informativen Student t-Prioren für fokale Parameter modelliert, um für Messfehler, individuelle Unterschiede und Unterschiede zwischen Konzepten aus unterschiedlichen Domänen zu korrigieren. Das Modell schätzt vier Parameter: Nicht-Entscheidungszeit (Sprachverarbeitung und motorische Prozesse), Drift Rate (Informationsakkumulation; der zentrale Parameter des Entscheidungsprozesses, siehe Vandekerckhove et al., 2011), Distanz der Entscheidungsgrenzen (Vorsichtigkeit/Speed-Accuracy Trade-Off) und Bias (verstärkte Tendenz zu korrekt oder falsch-Entscheidung). In das Modell wurden Reliabilitäts-korrigierte Interferenzscores aus den drei Inhibitionsmassen sowie Leistung auf einer Arbeitsgedächtnisaufgabe (Binding; Kontrollvariable, Omega = .76) als Prädiktoren aufgenommen. Ergebnisse Das Diffusionsmodell zeigte anhand Trace Plots, Posterior Plots und Rhat-Maßen Konvergenz, sowie guten Modellfit für einzelne Personen und über diese hinweg. Die Regressionsparameter aus dem Modell zeigten, dass einzig die Anti Sakkade-Task prädiktiven Wert für Effekte auf der Interferenztask hatte (b = -0.05, 90% credible interval [-0.13, -0.01]); Individuen mit sehr hoher Anti Sakkade-Interferenz (+2SD) zeigten im Vergleich zu Personen mit sehr niedriger Anti-Sakkade Interferenz (-2SD) etwa 20% stärkere Effekte auf dem Drift Rate-Parameter (Informationsakkumulation) des Interferenz-Tasks. Diese Ergebnisse sprechen dafür, dass Interferenz zwischen intuitiven und schulisch erworbenen Konzepten durch einen Inhibitionsprozess gelöst wird, welcher der Unterdrückung einer automatischen Antwort wie auf der Anti Sakkade-Task entspricht. Allgemeinere Arbeitsgedächtnisprozesse (Kapazitäts-abhängiges Binding), sowie auch die anderen erhobenen Arten von Inhibition (Aufmerksamkeitsreduktion auf ko-aktivierte Information [Flanker], Unterdrückung semantisch verwandter ko-aktivierter Konzepte [Picture-Word]), scheinen keine Rolle zu spielen. Es wird diskutiert, wie in experimentellen Folgestudien im Rahmen naturwissenschaftlichen Unterrichts der Umgang mit intuitiven Konzepten expliziert trainiert werden kann, welche Vorteile und Limitationen der analytische Ansatz für die empirische Bildungsforschung bietet und wie mit den moderaten Reliabilitäten der Inhibitionsmaße umgegangen werden kann. Veränderung der Vorstellung zur Drehrichtung von Zahnrädern im Vorschulalter Timo Reuter, Jonas Schäfer, Miriam Leuchter RPTU Kaiserslautern-Landau Theorie Ein Ziel früher naturwissenschaftlicher Bildung ist es, bei Kindern einen Wandel von naiven zu wissenschaftlich anschlussfähigeren Konzepten über naturwissenschaftliche Phänomene anzubahnen (Leuchter, 2017). Zahnräder decken eine Reihe von physikalischen Eigenschaften ab (z.B. Bewegung, Kraft, Drehmoment), deren Verknüpfung als Konzeptwissen verstanden werden kann. Ein Aspekt des Konzepts ist die Drehrichtung (DR) von Zahnrädern, bei der Vorschulkinder naive Vorstellungen haben (Metz, 1991). Ein Konzeptwandel könnte in der Altersentwicklung auftreten und zusätzlich durch angeleitetes Spiel im Vorschulalter angeregt werden. Beim angeleiteten Spiel unterstützt ein Erwachsener verbal die Aktivitäten der Kinder in einer strukturierten Spielumgebung (Weisberg et al., 2015). Verbale Unterstützung kann sowohl implizite Hinweise (Hmelo-Silver et al., 2007) als auch explizite Erklärungen (Sylva et al., 2007) umfassen. Zudem kann verbale Unterstützung mit Gestik verknüpft werden. Zahlreiche Forschungsergebnisse zeigen, dass sprachbegleitende Gesten einen Konzeptwandel befördern können (vgl. Goldin-Meadow & Alibali, 2013). Wir sind in drei Studien den Fragen nachgegangen, (1) welche Vorstellungen 5- bis 6-Jährige zur DR im Vergleich zu älteren Altersgruppen haben und ob wir die Vorstellungen mit (2) impliziten verbalen Hinweisen in einer angeleiteten Spielintervention bzw. mit (3) expliziten verbalen, gestischen oder verbal-gestischen Erklärungen fördern können? Studie 1 untersuchte querschnittlich einen Konzeptwandel in der Altersentwicklung. Bei n=146 Vorschulkindern (M Alter=5,30 Jahre, SD=.557), n=61 Erstklässlern (M Alter=6,95 Jahre, SD=.664), n=153 Viertklässlern (M Alter=9,54 Jahre, SD=.650) und n=94 Erwachsene (M Alter=22,11 Jahre, SD=1,505) wurden die Vorstellungen zur DR mit einem standardisierten Test erhoben. Die Probanden mussten die DR von Zahnrädern in Getrieben mit bis zu vier verbundenen Zahnrädern vorhersagen. Richtige Vorhersagen gaben einen Punkt, wobei für den gebildeten Summenscore nur Vorhersagen für Zahnräder mit zum Antriebszahnrad entgegengesetzter Drehrichtung berücksichtigt wurden (Autoren, 2020). Studie 2 untersuchte in einem experimentellen Prä-Post-Follow-Up-Test-Design einen Konzeptwandel bei Vorschulkindern (M Alter=69,50 Monate, SD=4.43) durch angeleitetes Spiel. In einer 45-minütigen Intervention erhielten eine angeleitete Spielgruppe (n=57) und eine Freispielgruppe (n=47) Zahnräder und entsprechende Bauelemente. Die angeleitete Spielgruppe konnte zusätzlich aus Aufgabenkarten unterschiedlichen Schwierigkeitsgrades wählen und bekam implizite verbale Hilfestellungen (z.B. „Schau dir dieses Zahnrad genau an: In welche Richtung dreht es sich?"). Der Test aus Studie 1 wurde in gekürzter Version durchgeführt (Autoren, 2022a). Studie 3 untersuchte bei Vorschulkindern (M Alter=74,85 Monate, SD=5,64) in einem experimentellen Prä-Post-Follow-Up-Test-Design einen Konzeptwandel durch explizite Instruktion. Ein Versuchsleiter erklärte die Drehrichtung von Zahnrädern sprachlich (EG1, n=81), gestisch (EG2, n=76) oder sprachlich-gestisch (EG3, n=77). Danach sollten die Kinder ein Antriebs- und ein Zielzahnrad so verbinden, dass sie in die gleiche Richtung drehen (Autoren, 2022b). Eine Kontrollgruppe (KG, n=69) erhielt keine Intervention. Der Test aus Studie 2 wurde durchgeführt. Ergebnisse Studie 1: ANOVAs zeigten, dass sich die Anzahl der richtigen Vorhersagen für die Altersgruppen signifikant unterschieden, Welch-F(3, 168.294)=186.762, p<.001. Je älter die Probanden waren, desto höher waren die Lösungsraten, wobei der stärkste Effekt (Hedges-G=1.118) für Erstklässler im Vergleich zu Vorschulkindern gefunden wurde, was auf einen Entwicklungssprung in dieser Altersspanne hinweist. Studie 2: Ein Mehrebenen-Wachstumsmodell mit der angeleiteten Spielgruppe als Referenz zeigte einen signifikanten Anstieg der Lösungsrate, γ=0.07, p<0.01, SE=0.02, t=3.03, wobei sich der Zuwachs in der Freispielgruppe signifikant vom Zuwachs in der angeleiteten Spielgruppe unterschied, γ=-0.09, p<0.05, SE=0.03, t =-2.58. Diese Ergebnisse deuten darauf hin, dass eine 45-minütige Intervention mit angeleitetem Spiel und impliziten verbalen Hinweisen einen Effekt auf das Konzept der DR hatte. Studie 3: Friedman-ANOVAs (aufgrund nicht normalverteilter Daten) in den EG und der KG zeigten keine signifikante Veränderung über die Messzeitpunkte. Die Ergebnisse deuten darauf hin, dass die Erklärung durch den Versuchsleiter weder in verbaler, gestischer noch verbal-gestischer Form wirksam war. Die Ergebnisse der Studien 1, 2 und 3 werden einander gegenübergestellt und diskutiert. Fördern Reflexionsprompts das Erkennen von Konflikten und die Veränderung von Fehlvorstellungen bei Grundschulkindern? Elfriede Diestel¹, Maria Theobald¹, Joseph Colantonio², Igor Bascandziev², Elizabeth Bonawitz², Garvin Brod³ ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, ²Harvard Graduate School of Education, ³DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Goethe Universität Frankfurt Der konzeptuelle Wandel von einer Fehlvorstellung zu einer wissenschaftlich anerkannten Theorie ist schwierig (Carey, 2000), selbst wenn Evidenz präsentiert wird, die im Konflikt mit der Fehlvorstellung steht (Limón, 2001). Ein wichtiger Schritt zur Überwindung von Fehlvorstellungen ist, dass Lernende Widersprüche zwischen ihrer ursprünglichen Überzeugung und der präsentierten Gegenevidenz überhaupt als Konflikt erkennen (Limón & Carretero, 1997). Das Erkennen von Konflikten ist jedoch insbesondere für jüngere Kinder herausfordernd (Finn & Metcalfe, 2014). Ziel der Studie ist es daher zu untersuchen, ob Reflexionsprompts, die Lernende dazu auffordern, ihr Wissen zu verknüpfen, das Erkennen von Konflikten und damit die Überwindung von Fehlvorstellungen erleichtern können. Obwohl Reflexion als ein wichtiges Element für den Erwerb wissenschaftlicher Konzepte gilt (Gunstone, & Mitchell, 2005), ist weitgehend unklar, ob Reflexionsprompts Prozesse der Konflikterkennung fördern, die zur Überwindung von Fehlvorstellungen beitragen. Basierend auf bisheriger Forschung erwarten wir, dass Reflexionsprompts das Erkennen von Konflikten zwischen der ursprünglichen Überzeugung und der richtigen Theorie verbessern (H1) und die Überwindung von Fehlvorstellungen erleichtern (H2). Zur Überprüfung der Hypothesen wurden 97 Kinder im Alter von 6 bis 9 Jahren untersucht (M = 7.20; 56% weiblich). Die Kinder lernten das Konzept der Wasserverdrängung, da häufig die Fehlvorstellung vorherrscht, dass das Gewicht eines Objekts (und nicht seine Größe) das Ausmaß der Wasserverdrängung bestimmt. Zunächst wurden im Prätest Fehlvorstellungen zur Wasserverdrängung erfasst. In der anschließenden computerbasierten Lernphase (27 Aufgaben) sollten die Kinder immer vorhersagen, welches von zwei Objekten mehr Wasser verdrängt und erhielten anschließend Feedback zur richtigen Lösung. Dann gaben die Kinder an, ob sie das Ergebnis erwartet hatten (Erwartungsrating; ja/nein). Während der Lernphase wurden die Reaktionszeiten und die Pupillengröße mit Hilfe eines Eyetrackers aufgezeichnet. Als experimentelle Manipulation erhielt die Hälfte der Kinder während der Lernphase zusätzlich den Reflexionsprompt, darüber nachzudenken, wie ihre Vorhersagen zu dem passen, was sie bereits gelernt haben. Die Kontrollgruppe erhielt keinen Reflexionsprompt. Nach der Lernphase wurde in einem Posttest und einem Transfertest überprüft, ob die Kinder die Fehlvorstellung zur Wasserverdrängung abgelegt hatten. Zunächst wurde untersucht, ob Kinder, die Reflexionsprompts erhielten, Konflikte während der Lernphase besser erkannten. Dazu verwendeten wir ein explizites Maß (das Erwartungsrating) und zwei implizite Maße der Konflikterkennung (Reaktionszeit für das Erwartungsrating und Pupillenerweiterung nach falsch vorhergesagten Ergebnissen). Kinder in der Reflexionsprompt-Gruppe zeigten längere Reaktionszeiten für das Erwartungsrating (b = .24, SE = 1.16, p=.033) sowie eine stärkere Pupillenerweiterung (b = .16, SE = .76, p=.032) nach falschen Vorhersagen im Vergleich zu Kindern in der Kontrollgruppe. Die explizite Klassifikation einer falschen Vorhersage als unerwartet war für alle Kinder gleichermaßen schwierig (b = -.27, SE = .30, p=.091); dennoch zeigte sich innerhalb der Reflexionsprompt-Gruppe, dass Kinder, die eine falsche Vorhersage als unerwartet klassifizierten in der Folgeaufgabe eher zum korrekten Konzept wechselten (b = .74, SE = .82, p=.004). Insgesamt sprechen die Ergebnisse für eine bessere Konflikterkennung in der Reflexionsprompt-Gruppe im Vergleich zur Kontrollgruppe. Bezüglich der zweiten Hypothese zeigten die Daten aus der Lernphase, dass die Vorhersagen der Kinder in der Reflexionsprompt-Gruppe näher an den Vorhersagen eines optimalen Bayesianischen Lerners lagen (χ2(2618) = 17.66, p<.001) und sich ihre Leistungen über die Lernphase stärker verbesserten als die der Kinder ohne Reflexionsprompts (b = .17, SE = .02, p=.015). Diese Bedingungsunterschiede hielten jedoch nicht bis zum Post- und Transfertest an. Hier zeigten beide Gruppen vergleichbare Leistungen (Veränderung Prä-Post: F(1, 95) = 1.79, p=.185; Unterschied Transfertest: t(95) = 1.35, p=.180). Zusammenfassend deuten die Ergebnisse darauf hin, dass Reflexionsprompts das Lernen aus falschen Vorhersagen verbessern können, indem sie die Konflikterkennung verbessern. Allerdings scheinen die Effekte von Reflexionsprompts zu kurzweilig zu sein, um eine nachhaltige Überarbeitung von Fehlvorstellungen zu fördern. Förderung eines Konzeptwechsels durch digital gestütztes Experimentieren beim Übergang von natürlichen zu rationalen Zahlen Rowena Merkel, Katharina Loibl, Frank Reinhold, Timo Leuders Pädagogische Hochschule Freiburg Theoretischer Hintergrund: Schülerinnen und Schüler haben große Schwierigkeiten beim Übergang von natürlichen zu rationalen Zahlen, da ihre bisherigen Konzepte natürlicher Zahlen im erweiterten Kontext der rationalen Zahlen nicht mehr tragfähig sind (z.B. Hasemann, 1981; Ni & Zhou, 2005). Der Übergang zu den rationalen Zahlen verlangt eine radikale Veränderung des bestehenden Zahlenverständnisses im Sinne eines Konzeptwechsels. Hierzu müssen die Lernenden zunächst die Einschränkung des Gültigkeitsbereiches der bisherigen Konzepte akzeptieren und gleichzeitig neue tragfähige Konzepte, die in einem erweiterten Kontext gültig sind, aufbauen (Chi, 2013; Prediger, 2004; Reinhold, 2019). Um einen Konzeptwechsel herbeizuführen, eignen sich Aufgabenstellungen, die die Lernenden mit ihrem bisherigen Wissen noch nicht lösen können und so neues Wissen aktiv konstruieren müssen. Im Kontext von SDDS (Scientific Discovery as Dual Search, Klahr & Dunbar, 1988) werden Schülerinnen und Schüler im Lösungsprozess aufgefordert, erste intuitive Hypothesen aufzustellen, diese im Experimentierraum zu überprüfen und daraufhin ihre eigen generierten Hypothesen zu revidieren, bevor sie ein Feedback erhalten. Durch den systematischen Aufbau von Aufgabenstellungen, stoßen die Lernenden ständig an ihre eigenen Grenzen, so dass Wissenslücken sichtbar werden (Loibl et al., 2017) und ein kognitiver Konflikt ausgelöst wird, der zur Ausbildung neuer Konzepte führt. Forschungsfrage: Die Studie untersucht, ob a) die zusätzliche Aufforderung zur Verwendung digitaler Tools zur stetigen Modifizierung des eigenen Konzepts führt - operationalisiert durch die verwendeten Strategien - , b) ob das empirische Feedback zu adäquaten Veränderungen der verwendeten Strategien im Sinne eines Konzeptwechsels führt und c) ob verschiedene Kontexte die Modifizierung des Zahlkonzepts unterschiedlich beeinflussen. Studiendesign und Methode: Zur Untersuchung der Forschungsfragen und zur Initiierung des notwendigen Konzeptwechsels (z.B. Spada, 1994; Vosniadou, 1994) wurde eine digitale Lernumgebung entwickelt, in der die Lernenden in einer ersten Problemlösephase, durch eigenständiges Experimentieren ein erstes konzeptuelles Bruchverständnis aufbauen. Die Aufgaben (Anteilsvergleich in grafischen Bruchdarstellungen in Kontexten) wurden so konzipiert, dass die Lernenden diese mit ihrem bisherigen Vorwissen zu natürlichen Zahlen nicht lösen können: Im Lösungsprozess werden sie entsprechend von SDDS zunächst zur Formulierung einer ersten intuitiven Hypothese zum Größenvergleich zweier Brüche aufgefordert, bevor sie diese im Experimentierraum durch die eigenständige Erstellung eines Situationsbildes mit dynamischen Bruchstreifen überprüfen können. Im Anschluss daran besteht die Möglichkeit der Revidierung der formulierten Hypothese, bevor eine Begründung als wichtige Form der Wissensorganisation (Prediger, 2013) gefordert wird. Anschließend erhalten die Lernenden ein empirisches Feedback im Experimentierraum und können ihre Hypothesen überprüfen. Es handelt sich dabei um fünf aufeinanderfolgende Bruchvergleichsaufgaben, die sich nur bezüglich des verwendeten Zahlenmaterials unterscheiden und dadurch unterschiedliche Strategien des Größenvergleichs von Brüchen triggern. Dadurch werden Wissenslücken sichtbar, da die Lernenden stetig an ihre eigenen Grenzen stoßen. Die digitale Lernumgebung liegt in zwei Kontexten vor (A: Farbmischkontext, B: Wurfballkontext) und variiert dahingehend, ob Lernende digitale Tools zur Manipulation der Bruchstreifen (z. B. Vervielfachen, Unterteilen) verwenden müssen oder nicht. Zudem wurde für jeden Kontext eine Kontrollgruppe etabliert, die kein empirisches Feedback zu den eigen formulierten Hypothesen erhält. Zur Überprüfung der Fragestellung werden die verbalen Begründungen aller Gruppen in der Lernumgebung entsprechend einem hierarchischen Stufenmodell der Strategien (Merkel et al., in Vorbereitung) kodiert, welches den Fortschritt des Konzeptwechsels (von natural number bias, Ni & Zhou, 2005 bis vollständiges Bruchkonzept) widerspiegelt. Dies ermöglicht Rückschlüsse auf die zugrundeliegenden kognitiven Lernprozesse. Zudem werden die Ergebnisse der unterschiedlichen Gruppen in einem anschließenden Posttest verglichen. Ergebnisse: Es wurden Daten von 230 Lernenden erhoben. Die Auswertungen laufen noch. Ergebnisse aus Vorstudien zeigen, dass Lernende in den optionalen Bedingungen die digitalen Tools nicht nutzen und damit wenig Konzeptwechselprozesse angestoßen werden. Ebenso können ohne empirisches Feedback nur wenig Konzeptwechselprozesse beobachtet werden. Zudem legen unterschiedliche Kontexte die Verwendung verschiedener Strategien nahe, was sich auf Unterschiede in der Vorwissensaktivierung zurückführen lässt.
15:20 - 17:00	3-13: Covid-19 Pandemie Ort: S28
	Paper Session Zum Zusammenhang von Lehr- und Lernbedingungen während der COVID-19-Pandemie mit den Lernergebnissen Jugendlicher: Eine kulturübergreifende Analyse anhand von PISA-Daten. Giang Hong Pham, Franziska Maria Locher, Dimitra Kolovou, Eliane Arnold Pädagogische Hochschule St.Gallen, Deutschland Theoretischer Hintergrund Die Lehr- und Lernbedingungen während der COVID-19-Pandemie waren beispiellos – Schulschließungen und digitaler Unterricht wurden den Bildungssystemen nahezu überall aufgezwungen (OECD, 2021). Die Meta-Analyse von Betthäuser et al. (2023) zeigt, dass sich der Lernfortschritt während der COVID-19-Pandemie erheblich verlangsamt hat. Zudem werfen die Bedingungen im Bildungsbereich während der COVID-19-Pandemie die Frage auf, ob diese Veränderungen zu noch größeren herkunftsbedingten Leistungsdisparitäten führen (Yun, 2023; Betthäuser et al., 2023; Donnelly & Patrinos, 2022; Goudeau et al., 2021), die sich seit den 1990er Jahren in vielen Ländern kontinuierlich vergrößert haben (s. Meta-Analyse von Liu et al., 2022). Darüber hinaus bleiben viele Fragen offen, z.B. inwieweit spezifische Lehr- und Lernbedingungen während der Zeit des pandemiebedingten irregulären Unterrichtens der negativen Leistungsentwicklung, insbesondere bei Schüler:innen mit niedrigem sozioökonomischem Status (SES), entgegenwirken können. Forschungsfrage Im Beitrag sollen Zusammenhänge der Lehr- und Lernbedingungen während der Zeit des irregulären Unterrichtens durch COVID-19 mit der Leistung der Schüler:innen bei PISA 2022 innerhalb und über Länder hinweg untersucht werden. Insbesondere sollen differentielle Effekte für Schüler:innen mit unterschiedlichem SES untersucht werden. Die Forschungshypothesen lauten: H1: Zwischen PISA 2022 und früheren PISA-Zyklen zeigt sich ein Rückgang der Leistungen in allen Fächern (Lesen, Mathematik, Naturwissenschaften). H2: Zwischen PISA 2022 und früheren PISA-Zyklen, zeigt sich bei Schüler:innen mit niedrigerem SES in allen Fächern ein stärkerer Rückgang der schulischen Leistungen als bei Schüler:innen mit höherem SES. H3: Unterschiede in den Lehr- und Lernbedingungen während der COVID-19-Pandemie (z.B. Dauer der Schulschliessungen, Erreichbarkeit der Lehrpersonen, individuelle Nutzung digitaler Geräte), sagen nach Kontrolle des SES, die Leistungen und die Entwicklung der Leistung der Schüler:innen vorher. Methode Es werden Test- und Fragebogendaten aus PISA 2022 (einschließlich Global Crisis Module; Bertling et al., 2020) und früheren PISA-Zyklen (PISA 2018, PISA 2015, PISA 2012) zusammen mit verfügbaren internationalen Datensätzen zu den Bedingungen während der COVID-19-Pandemie (s. OECD, 2021) verwendet. Die internationalen Daten von PISA 2022 werden Ende 2023 veröffentlicht (vgl. https://nces.ed.gov/surveys/pisa/schedule.asp). Zur Beantwortung aller Hypothesen werden multivariate Regressionsanalysen durchgeführt. Dabei werden der SES und die früheren Leistungen als Kovariaten mitberücksichtigt. Zur Beantwortung von H3 werden zusätzlich latente Profilanalysen durchgeführt, um Unterschiede in Lehr- und Lernbedingungen systematisch zu analysieren. Für die Ergebnisinterpretation werden neben den deutschsprachigen Ländern und deren Nachbarländern auf einige ausgewählte (z.B. aufgrund Schulschliessungsdauer, Einkommen, bisherige Leistungen) Länder betrachtet. Folgende Länder werden betrachtet: Schweiz, Deutschland, Österreich, Frankreich, Italien, Estland, Neuseeland, Mexiko, Vietnam. Alle Analysen werden in R durchgeführt, Stichprobengewichte werden dabei berücksichtigt. Ergebnisse und Diskussion Seit dem Jahr 2000 sind die OECD und rund 90 Länder auf der ganzen Welt beteiligt und arbeiten zusammen, um herauszufinden, ob die Schulen jungen Menschen die Kompetenzen vermitteln, die in der Welt von morgen wichtig sind (OECD, 2023). Damit ist PISA die größte Bildungsstudie der Welt. Nach drei herausfordernden Pandemie-geprägten Jahren für die Bildungssysteme weltweit, scheint die Frage nach dem Bildungsstand von Jugendlichen und der Vergleich mit anderen Ländern wichtiger denn je. Insbesondere mit dem Global Crisis Module bietet PISA 2022 eine einzigartige Datenbasis mit enormem Potenzial. Sie ermöglicht Zusammenhangsanalysen zwischen den Lehr- und Lernbedingungen während der COVID-19-Pandemie und den Leistungen der Jugendlichen weltweit. Darüber hinaus ermöglicht die Vergleichbarkeit der Leistungsergebnisse zwischen den PISA-Zyklen Analysen über die Entwicklung der Leistungen vor und nach der Pandemie. Auf der Grundlage früherer empirischer Erkenntnisse im internationalen Kontext gehen wir davon aus, dass die Ergebnisse die aufgestellten Forschungshypothesen bestätigen und dass sich Trends und Zusammenhänge innerhalb der Mehrheit der untersuchten PISA-Länder und über alle untersuchten PISA-Länder hinweg zeigen. Fachspezifische Ergebnisse sowie das Potenzial unterschiedlicher Lehr- und Lernbedingungen als mögliche Resilienzfaktoren werden diskutiert. Paper Session Corona ist doch längst vorbei?! Effekte der Covid-19 Pandemie auf die Mathematikleistung von Zweitklässlern über acht Schuljahre hinweg Ophelia Urbach¹, Boris Forthmann¹, Natalie Förster², Elmar Souvignier¹ ¹Universität Münster; ²Bergische Universität Wuppertal Theoretischer Hintergrund Durch die Maßnahmen zur Eindämmung der Covid-19 Pandemie wurde das Bildungssystem stark eingeschränkt. Als unmittelbare Auswirkungen zeigten sich dabei vor allem in Mathematik Leistungseinbußen (z.B. Betthäuser et al., 2022), die sich auch in der 2021 festgestellten Verschlechterung in der Erreichung der Mindeststandards im Primarbereich (Schumann & Sachse, 2022) widerspiegeln. Bislang liegen vornehmlich Schätzungen kurzfristiger Leistungseinbußen aufgrund der Schulschließungen vor. Grundsätzlich sollten jedoch auch befürchtete längerfristigen Konsequenzen der pandemiebedingten Schulschließungen (Kaffenberger, 2021) empirisch untersucht werden. Zudem ist bislang wenig darüber bekannt, ob sich auch Auswirkungen auf mathematische Vorläuferkompetenzen oder die Rechenfähigkeit bei Kindern zeigen, die von Schließungen im Kindergarten betroffen waren. Fragestellung Wie haben sich die durchschnittliche Mathematikleistung sowie interindividuelle Unterschiede in der Mathematikleistung in der zweiten Klasse in Folge der Corona-Pandemie verändert? In den Kohorten seit Beginn der Corona-Pandemie wird eine Verringerung der mittleren Leistungen und eine Erhöhung der Leistungsvariation im Vergleich zu den Prä-Pandemie-Kohorten erwartet. Methode Um die Fragestellung zu beantworten werden Daten der web-basierten Lernverlaufsdiagnostik quop (Souvignier et al., 2021) herangezogen. Mit acht Messzeitpunkten pro Schuljahr erlauben diese Daten nicht nur einen Vergleich über Schuljahre hinweg, sondern auch eine differenzierte Auswertung von Leistungsentwicklungen innerhalb der Schuljahre. In der zweiten Klasse werden in der M2-Testreihe die Teilkompetenzen Vorläuferfähigkeiten und Rechenfähigkeit (Salaschek & Souvignier, 2014) durch Paralleltests erfasst. Verglichen werden die mathematischen Leistungen von vier Prä-Pandemie Kohorten (N = 6.294) aus den Schuljahren 2015/16-2018/19 mit den folgenden Kohorten der Jahrgänge 2019/20-2022/23, die zu unterschiedlichen Zeitpunkten von Schulschließungen, Wechselunterricht oder Kindergartenschließungen betroffen waren (N jeweils > 2.300). Zur Untersuchung der Unterschiede zwischen den Kohorten werden nach Prüfung der Messinvarianz über die Kohorten und die Zeit latente Mittelwerts- und Varianzunterschiede geschätzt. Ein zweidimensionales Messmodell mit den Faktoren mathematische Vorläuferfähigkeit und Rechenfähigkeit und den entsprechenden Subfacetten als Indikatoren zeigte bei Analysen der ersten Teilstichproben einen guten Modellfit (robust CFI = 0.966, robust RMSEA= 0.017) nach Hu und Bentler (1999). Ergebnisse Aktuell sind die Daten der ersten sechs Kohorten ausgewertet. Analysen dieser Teilstichproben (Prä-Pandemie und die ersten beiden Pandemie-Kohorten) zeigten ein differenziertes Ergebnismuster in der durchschnittlichen Mathematikleistung beider Pandemiekohorten für die einzelnen Fähigkeitsbereiche. Die durchschnittliche Leistung der Vorläuferfähigkeiten fiel zu fast allen Messzeitpunkten signifikant niedriger aus als in den Prä-Pandemie Kohorten. Dies war allerdings im SJ 2019/20 auch bereits vor Pandemiebeginn der Fall, wohingegen die Unterschiede während des ersten Lockdowns geringer ausfielen. In den arithmetischen Fähigkeiten fielen die durchschnittlichen Leistungen im Vergleich zu den Prä-Pandemie-Kohorten sogar teilweise signifikant höher aus. Im Verlauf des Schuljahres nahmen diese Unterschiede aber wieder ab. Bei den interindividuellen Unterschieden in den Vorläuferfähigkeiten zeigte sich eine Zunahme in beiden Pandemiekohorten, auch bereits in den Messzeitpunkten vor Pandemiebeginn. Die Leistungsheterogenität der arithmetischen Fähigkeiten in der ersten Pandemiekohorte fiel vor Pandemiebeginn signifikant höher aus und nahm wider Erwarten während des ersten Lockdowns ab. In der zweiten Pandemiekohorte zeigte sich die erwartete Zunahme der Leistungsheterogenität. Diskussion Die ersten Befunde der Teilstichproben weisen nicht auf einen allgemeinen negativen Effekt der Pandemie auf die mittlere Mathematikleistung bei Zweitklässlern hin. Die Zunahme der Leistungsheterogenität in beiden mathematischen Fähigkeitsbereichen stellt vermutlich zumindest teilweise pandemiebedingte negative Konsequenz dar, welche im Verlauf der folgenden Schuljahre weiter analysiert werden soll. Relativierend ist allerdings festzuhalten, dass dieser Effekt sich in der ersten Pandemiekohorte bereits vor Einsetzen der Pandemie zeigte. Die Unterschiede zwischen beiden Teilkompetenzen und zu den in Metaanalysen gefunden negativen Effekten auf die mittlere Mathematikleistung (Betthäuser et al., 2022) verdeutlichen die Notwendigkeit einer differenzierten Betrachtung von Kompetenzen, Altersgruppen und Kohorten zur Einschätzung der pandemiebedingten Folgen. Die Auswertung der Daten aus den beiden letzten Schuljahren kann möglicherweise das Ergebnismuster aufschlussreich ergänzen. Paper Session Zum Einfluss von Unterrichtsmerkmalen auf das schulische Wohlbefinden im Kontext der COVID-19-Pandemie Isabell Martin, Michaela Gläser-Zikuda Friedrich-Alexander-Universität Erlangen-Nürnberg, Deutschland Theoretischer Hintergrund: Wohlbefinden gilt im schulischen Kontext als Qualitätsmerkmal (Hascher, 2004; OECD, 2019). Neben dem positiven Einfluss auf die Gesundheit trägt Wohlbefinden zu einer positiven Wahrnehmung von Schule und Unterricht bei und kann dadurch den Lernprozess und die Leistungen der Schülerinnen beeinflussen. Wohlbefinden zeichnet sich zum einen durch das Vorherrschen positiver, und zum anderen durch die Abwesenheit negativer Aspekte sowie einer Kombination von emotionalen und kognitiven Faktoren aus. Dem Sechs-Komponenten-Modell von Hascher (2004) zufolge setzt sich schulisches Wohlbefinden aus den positiven Einstellungen zur Schule (PE), dem schulischen Selbstwert (SSW), der Abwesenheit körperlicher Beschwerden im Zusammenhang mit der Schule (AKB), der Abwesenheit sozialer Probleme (ASP), keiner Sorgen wegen der Schule (AS) sowie Freude und Anerkennung in der Schule (FA) zusammen (vgl. Hascher & Hagenauer, 2011). Schulisches Wohlbefinden wird durch schulische Rahmenbedingungen, unterrichtsbezogene Aspekte – wie die Unterrichtsqualität - außerschulische Faktoren und individuelle Aspekte (Gläser-Zikuda & Fuß, 2004; Gysin, 2017; Hascher, 2004; Obermeier et al., 2021) beeinflusst. Während der COVID-19 Pandemie kam es in zahlreichen Ländern, so auch in Deutschland ab März 2020, zu einem Lockdown, der auch Schulschließungen umfasste (Goldan et al., 2021; Voss & Wittwer, 2020). An Schulen wurden oft Mischformen aus Präsenz- und Distanzunterricht umgesetzt. Dies traf sowohl Schülerinnen (und ihre Familien), als auch Lehrkräfte und Schulleitungen unvorbereitet. Diese Situation stellte eine besondere psychosoziale Herausforderung vor allem für die Schülerinnen dar, wodurch sich weitreichende Auswirkungen - auch in Bezug auf deren Wohlbefinden – ergaben (Hansen & Hanewinkel, 2022; Obermeier et al., 2022). Diese Studie widmet sich daher der Bedeutung von Unterrichtsqualität für das schulische Wohlbefinden von Schülerinnen im Kontext der COVID-19 Pandemie. Fragestellung: Folgende Fragstellungen wurden fokussiert: F1: Welche Unterrichtsmerkmale lassen sich als Prädiktoren für die verschiedenen Dimensionen des schulischen Wohlbefindens identifizieren? F2: Welcher Anteil an erklärter Varianz lässt sich auf die Klassenebene zurückführen? Methode: Insgesamt nahmen N = 1113 Schülerinnen (48.8 % weiblich; 19.3 % Migrationshintergrund; Alter: M = 12.61 (SD = 1.71)) der Jahrgangsstufen fünf bis neun an zehn Sekundarschulen eines deutschen Bundeslandes an einer paper-pencil Befragung teil. Die Schulen wurden für die Befragung auf Grundlage ihrer im Bundesvergleich relativ hohen Quoten an Schulabbrecherinnen (> 10%) ausgewählt. Das schulische Wohlbefinden wurde anhand der Skala „Schulisches Wohlbefinden“ mit allen sechs Subskalen nach Hascher (2004) erfasst. Folgende weitere standardisierte Instrumente kamen zum Einsatz: Unterrichtsqualität mit den Skalen: „Selbstbestimmung“ (Röder & Kleine, 2007), „Klassenführung“ (Helmke et al., 2013), „Kognitiv aktivierende Aufgabenstellungen“ (adaptiert nach Baumert et al., 2019), Fairness anhand der Skala „Bevorzugung und Benachteiligung“ (Saldern & Littig, 1987) und „Leistungsdruck“ (Saldern & Littig, 1987). Dabei wurden zunächst Analysen durchgeführt, ob es laut Intraklassenkoeffizient (ICC) und Designeffekt (D_eff) eine Mehrebenenstruktur zu beachten galt (Zitzmann, 2021). Anschließend wurden entsprechend Mehrebenenanalysen und einfache multiple Regressionsanalysen durchgeführt. Ergebnisse: Für die PE und den SSW wurden aufgrund des ICC und D_eff Mehrebenenregressionen durchgeführt. Dabei konnten für die PE 12% und für den SSW 5% der Gesamtvarianz über die Klassenebene erklärt werden. Die Klassenführung erwies sich für die AKB (β=.21), ASP (β=.22), AS (β=.17), PE (β=.28) und SSW (β=.21) als stärkster positiver Prädiktor. Für die FA zeigte die kognitive Aktivierung im Unterricht den größten positiven Effekt (β=.22). Als stärkster negativer Prädiktor für die vier Subskalen des schulischen Wohlbefindens AS (β=-.21), PE (β=-.23), SSW (β=-.15) und FA (β=-.05) konnte der Leistungsdruck identifiziert werden. Die Fairness der Lehrkraft hat den stärksten negativen Effekt auf die Subskalen ASP (β=-.19) und AKB (β=-.19). Die Modelle konnten für die einzelnen Dimensionen des schulischen Wohlbefindens 13% bis 20% der Varianz aufklären. Zentrale Ergebnisse werden im Vortrag präsentiert und mit Blick auf Limitationen sowie Implikationen für die schulische Praxis diskutiert. Paper Session Aufholen nach Corona - Evaluation des baden-württembergischen Programms „Lernen mit Rückenwind“ Kerstin Norwig, Cordula Petsch, Julia Blank, Stephan Blank, Johanna Marder, Frank Pfänder, Maren Specker, Benjamin Fauth Institut für Bildungsanalysen Baden-Württemberg, Deutschland In den Corona-Schuljahren 2019/2020 und 2020/2021 waren Schulen an vielen Unterrichtstagen vollständig geschlossen bzw. öffneten nur teilweise für einen Wechsel- oder Hybridunterricht (OECD, 2021). Zahlreiche Unterrichtsstunden sind ausgefallen; das digitalisierte Lernen im Distanzunterricht nahm zwar schnell an Qualität zu, konnte das Lernen im Präsenzunterricht aber nicht vollständig ersetzen (Helbig et al., 2022, S. 11). Pandemiebedingte Lernrückstände waren die Folge und bei vielen Schüler/-innen, besonders solchen aus sozial benachteiligten Familien, zeigten sich vermehrt fachliche Lernrückstände sowie sozial-emotionale Auffälligkeiten (Böttger & Zierer, 2021; Helbig et al., 2022; Schult et al., 2022a; 2022b; Stanat et al., 2022; Ravens-Sieberer et al., 2022) Zur Milderung solch negativer Effekte vereinbarten Bund und Länder das Aktionsprogramm „Aufholen nach Corona für Kinder und Jugendliche“ (Bundesregierung, 2021). Entsprechend der Zielvereinbarungen (BMBF, 2021) lagen die Schwerpunkte der baden-württembergischen Programmvariante „Lernen mit Rückenwind“ auf dem Abbau pandemiebedingter Lernrückstände und auf der Stärkung sozial-emotionaler Kompetenzen (MKJS BW, o. J.). Innerhalb der Programmlaufzeit (Schuljahre 2021/2022 und 2022/2023) konnten sich alle Schulen Baden-Württembergs registrieren und Fördermittel bzw. Unterstützungskräfte für zusätzliche Förderkurse beantragen (MKJS BW, o. J.). Das Institut für Bildungsanalysen Baden-Württemberg (IBBW) hat das Programm „Lernen mit Rückenwind“ in den Schuljahren 2021/2022 (Pilotierungsstudie) und 2022/2023 (Haupt- und Erweiterungsstudie) evaluiert. Schwerpunkte dabei waren Fragen zur Implementation des Programms in die Praxis sowie zur Entwicklung der am Programm beteiligten Schüler/-innen. Zur Untersuchung dieser Fragen wurde ein längsschnittliches Design gewählt und verschiedene Akteure von zufällig gezogenen allgemeinbildenden Schulen zu mehreren Messzeitpunkten befragt. Es liegen Daten vor von (1) Schulleitungen (n_Hauptstudie = 31, n_{Erweiterungsstudie} = 1.426; ein Messzeitpunkt am Ende des Schuljahres), (2) Unterstützungskräften der Förderkurse (n_Hauptstudie = 33; je ein Messzeitpunkt am Ende der Schulhalbjahre) sowie (3) Schüler/-innen der vierten und fünften Klassenstufen (n_Hauptstudie = 1.531; drei Messzeitpunkte sowie bis zu 10 Messungen zur Leistungsentwicklung). Im ersten Fragenkomplex interessierte v. a. wie das Programm (dessen Vorbereitung, Organisation, Umsetzung usw.) von den verschiedenen Akteuren wahrgenommen wurde und welche förderlichen bzw. hinderlichen Implementationsfaktoren daraus abgeleitet werden können. Mittels standardisierter Online-Fragebögen wurden hierzu Konstrukte erfasst, die sich in früheren Studien als relevant für eine erfolgreiche Implementation von Programmen erwiesen haben (vgl. z. B. Proctor et al. 2011, Humphrey et al. 2016), wie u. a. die Teilnahmemotivation, der wahrgenommene Förderbedarf, die Akzeptanz der Maßnahme, deren wahrgenommene schulische Umsetzbarkeit sowie Erwartungen zur Programmwirksamkeit. Zudem wurden aus der Unterrichtsforschung bekannte Qualitätsmerkmale der angebotenen Förderkurse (konstruktive Unterstützung, lernförderliches Feedback, individuelle Förderung, vgl. Fauth, 2021) in der Wahrnehmung der beteiligten Schüler/-innen sowie personenbezogene bzw. institutionelle Einflussfaktoren (soziodemografische Daten, personenbezogene Einstellungen, Rahmenbedingungen der Schule usw.) erfasst. Im Rahmen des zweiten Fragenkomplexes interessierten sowohl die psycho-soziale Entwicklung als auch die Leistungsentwicklung der am Programm beteiligten Schüler/-innen. Die Viert- und Fünftklässler/-innen wurden hierzu mit dem Kidscreen (The Kidscreen Group Europe, 2006) befragt. Zur Abschätzung der fachlichen Entwicklung in den Bereichen Lesen und Mathematik wurden zudem kontinuierlich während des Schuljahres Leistungsdaten mittels der Lernverlaufsdiagnostik quop (Förster & Souvignier, 2014) erfasst. Da die Datenerfassung der Haupt- und Erweiterungsstudie erst kürzlich abgeschlossen wurde, liegen die finalen Ergebnisse noch nicht vor. Die Daten der Pilotierungsstudie belegen allerdings die psychometrische Güte der eingesetzten Skalen und deuten eine durchaus positivere Wahrnehmung des Programms „Lernen mit Rückenwind“ seitens der Schulleitungen an als dies in zurückliegenden (bundesweiten) Umfragen (VBE BW, 2021, Robert-Bosch-Stiftung, 2022) der Fall war. Vorgestellt werden längsschnittliche Analysen und Subgruppenvergleiche, die v. a. den ersten Fragekomplex zur Implementation des Programms adressieren. Aus dem zweiten Fragekomplex wird die längsschnittliche Entwicklung der sozio-emotionalen Verfasstheit der Kinder und Jugendlichen im Schuljahr 2022/2023 in den Blick genommen. Interessant ist hierbei nicht nur die Entwicklung der am Programm beteiligten Schüler/-innen, sondern auch der Vergleich mit Schüler/-innen, die keine schulischen Förderkurse besucht haben. Paper Session Die Sommerschule: Eine unbegleitete Unterrichtstätigkeit - Unterschiede in den Wahrnehmungen zwischen Studierenden und Schülerinnen Sonja Lenz¹, Alexandra Postlbauer¹, Christoph Helm¹, Manuela Gamsjäger² ¹Johannes Kepler Universität Linz, Österreich; ²Pädagogische Hochschule Oberösterreich Als Reaktion auf die negativen Auswirkungen der Covid-19-Pandemie wurden in Österreich Sommerschulen eingeführt, die wie deutsche Sommercamps (vgl. Kowoll, Strietholt & Bos, 2013) das Ziel verfolgen, benachteiligte Kinder zu fördern und schulische Defizite auszugleichen. Lehramtsstudierende übernahmen dabei erstmals eigenverantwortlich die Leitung heterogener Lerngruppen und standen vor beruflichen Herausforderungen, die üblicherweise Berufseinsteiger:innen erfahren (Lenz et al., 2023). Dies ist insbesondere vor dem Hintergrund des aktuellen Lehrerinnenmangels im deutschsprachigen Raum von Bedeutung, da vermehrt Personen ohne facheinschlägigen Lehramtsstudium unterrichten (Himmelsbach et al., 2023). Eine dieser Herausforderungen stellt die Klassenführung dar, welche als zentrale Entwicklungsaufgabe für Berufsanfänger:innen gilt (Keller-Schneider, 2021). Klassenführung ist ein Schlüsselkonzept effektiven Unterrichts (Lenske & Mayr, 2015), der immer auch aus der Perspektive der Schüler:innen zu denken, planen und durchzuführen ist. Obwohl Schüler:innen eine bedeutende Beurteilungsinstanz darstellen, fehlen bisher Studien darüber, inwieweit Aktivitäten von Lehramtsstudierenden im Rahmen von remedialen Maßnahmen einen Einfluss auf das Lernen der Schüler:innen haben. Der aktuelle Beitrag adressiert diese Lücke, indem er die Selbstwahrnehmung 39 oberösterreichischer Lehramtsstudierender der Fremdwahrnehmung von 363 Schüler:innen, erfasst mithilfe des Linzer Diagnosebogens zur Klassenführung (Mayr, 2011), gegenübergestellt. Dabei wird aufgezeigt, inwiefern die Lehramtsstudierenden während ihres ersten eigenverantwortlichen Praktikums in der Sommerschule effektive Klassenführung aufweisen und analysiert, inwieweit die Selbst- und Fremdwahrnehmung der Unterrichtsqualität übereinstimmen. Die Ergebnisse liefern wertvolle Einblicke in die Dimensionen Unterrichtsgestaltung, Beziehungsförderung und Kontrolle im Rahmen der Sommerschulen als remediale Maßnahme und zeigen ebenso auf, inwieweit die Studierenden während ihres ersten unbegleiteten Praktikums das individuelle Lernerlebnis der Schüler:innen fördern können. Methode Die Daten wurden mittels Linzer Diagnosebogen zur Klassenführung (Mayr, 2011) erhoben. Insgesamt nahmen 39 Lehramtstudierende (82 % weiblich, 86% Bachelorstudierende) und 363 Schüler:innen (48 % weiblich, 39 % mit nicht-deutscher Umgangssprache) an der Befragung teil, was eine Vollerhebung für den Sommerschulstandort Oberösterreich darstellt. Die Daten sind hierarchisch geschachtelt, Schüler:in genestet innerhalb von Studierenden. Verwendet wurde der Analyseansatz von Kim et al. (2018), die ein Cross-Level-Group-Measurement-Invarianz-Modell vorschlagen, um auf gleiche Messungen auf Lehrenden- und Lernendenebene zu testen. Das Modell ermöglicht die Schätzung der latenten Korrelation und der latenten Mittelwertdifferenzen zwischen der Lehrenden- und der Lernendenbewertung. Ergebnisse Die Ergebnisse zeigen, dass die latenten Mittelwertsdifferenzen zwischen den Qualitätsbewertungen der Studierenden und der Schüler:innen hinsichtlich der beiden Dimensionen Beziehungsförderung und Unterrichtsgestaltung zwar effektbedeutsam, aber statistisch nicht signifikant sind (std. Est.: .20/-.32, p > .05). Die unterschiedlichen Vorzeichen legen nahe, dass Studierende die Dimension Beziehungsförderung tendenziell positiver und die Dimension Unterrichtsgestaltung tendenziell negativer bewerten als Schüler:innen. Die Differenz in der Dimension Kontrolle ist weder effektbedeutsam noch statistisch signifikant (std. Est.: -.05, p > .05). Betrachtet man die latenten Korrelationen, zeigt sich für die beiden Dimensionen Kontrolle und Unterrichtsgestaltung, dass eine positive Bewertung der Studierenden mit einer positiven Bewertung durch die von ihnen betreuten Schüler:innen einhergeht (std. Est.: .77/.46, p < .05). Dagegen ist der entsprechende Zusammenhang für die Dimension Beziehungsförderung zwar effektbedeutsam, aber statistisch nicht signifikant (std. Est.: .32, p > .05). Diskussion Dass Studierende im Vergleich zu Schüler:innen Unterrichtsmerkmale positiver einschätzen, deckt sich mit Studien zur Unterrichtsqualität (Kunter & Baumert, 2006; Fauth, Decristan, Rieser, Klieme, & Büttner, 2014). Überraschend ist die tendenziell geringere Beurteilung der Unterrichtsgestaltung. Dies könnte auf den fachdidaktischen Gehalt der Items dieser Dimension (z.B. Bedeutsamkeit der Ziele und Fachkompetenz der Lehrkraft) zurückzuführen sein, der von Schüler:innen (aufgrund ihrer fehlenden Expertise) schwer valide eingeschätzt werden kann. Die hohen Korrelationen weisen auf eine relativ gesehen valide Selbsteinschätzung der Studierenden hin. Die Befunde können für die Weiterentwicklung der Professionalität von Studierenden nutzbar gemacht werden, indem sie als Referenz zur Reflexion des eigenen Handelns im ersten unbegleiteten Praktikum herangezogen werden. Zudem können die Befunde bei der Beforschung, Evaluation und Weiterentwicklung des Konzepts der unbegleiteten Praktika als Evidenzbasis helfen, da sie zeigen, wie valide unterschiedliche Informantengruppen sind.
15:20 - 17:00	3-14: Empirische Untersuchungen im Kontext der Wissenschaftskommunikation Ort: H07
	Paper Session “Das sieht für mich nach Wissenschaft aus!” - Über subjektive Wissenschaftlichkeitswahrnehmungen von Lai:innen beim Lesen psychologischer Kurzzusammenfassungen und deren Einfluss auf Vertrauen Mark Jonas, Tom Rosman Leibniz-Institut für Psychologie (ZPID), Deutschland Theoretischer Hintergrund: Bisherige Forschung (Bromme et al., 2015; Thomm & Bromme, 2012) liefert Evidenz für den “Scientificness-Effekt”: Leser:innen schätzen wissenschaftlich geschriebene Texte im Vergleich zu Sachtexten als vertrauenswürdiger ein und stimmen deren Aussagen eher zu. Wissenschaftlichkeit wurde hierbei meist über Referenzen, detaillierte Methodenbeschreibungen und einen sprachlich neutralen Ton variiert. Der Effekt konnte wiederholt repliziert werden (Jonas et al., 2023; Zaboski & Therriault, 2020). Allerdings wurde bisher meist der direkte Zusammenhang zwischen Wissenschaftlichkeit und Vertrauen betrachtet, ohne gleichzeitig den Einfluss der subjektiven Wissenschaftlichkeitswahrnehmung von Leser:innen zu prüfen. Gerade dieser Aspekt könnte jedoch eine zentrale Größe für den Scientificness-Effekt und für ein übergeordnetes theoretisches Rahmenmodell darstellen. Zudem ist unklar, ob Merkmale von Wissenschaftlichkeit auf Autor:innenebene ebenfalls dazu beitragen, dass Leser:innen einen Text als wissenschaftlicher und vertrauenswürdiger wahrnehmen. Fragestellung: Wird der Zusammenhang zwischen Merkmalen von Wissenschaftlichkeit auf Autor:innen- bzw. Textebene und Vertrauen durch wahrgenommene Wissenschaftlichkeit mediiert? Methode: Auf Basis einer Präregistrierung wurden online eine Pilot- (N = 109, M_Alter= 47,13, SD_Alter= 15,76, range = 18 - 76 , w = 50,45%) und eine Hauptstudie (N = 838, M_Alter= 47,97, SD_Alter= 15,66, range = 18 - 77 , w = 50,12%) mit Proband:innen aus der deutschsprachigen Allgemeinbevölkerung durchgeführt. In einem 22 Design wurden zwei psychologische Kurzzusammenfassungen systematisch mit Blick auf die Wissenschaftlichkeit des Textes und der Autor:in variiert (hoch vs. niedrig). Auf Textebene wurde bei hoher Wissenschaftlichkeit per Referenzen der Bezug zu weiterer Forschung hergestellt, die Untersuchungsmethoden (verwendete Fragebögen, Messzeitpunkte, etc.) wurden geschildert und ein sprachlich neutraler Ton gewählt. Bei niedriger Textwissenschaftlichkeit wurden Referenzen und Methodenbeschreibungen ausgelassen, und es wurde ein umgangssprachlicher, wertender Ton genutzt. Autor:innenwissenschaftlichkeit wurde über die Expertise, Affiliation und Einschlägigkeit der Autor:in variiert. Bei hoher Wissenschaftlichkeit wurde die Autor:in als erfahrene Forscher:in an einer öffentlichen Einrichtung mit vielen veröffentlichten Publikationen in angesehenen Zeitschriften und einer sehr genauen Arbeitsweise dargestellt. Bei niedriger Wissenschaftlichkeit wurde hingegen auf einen Hintergrund als Bachelor-Student:in mit einer Tätigkeit in der privaten Wirtschaft, geringe Forschungserfahrung, wenig Publikationen in unbekannteren Zeitschriften und eine im Detail ungenaue Arbeitsweise verwiesen. Im Rahmen der Pilotstudie fand ein Manipulation Check und eine Überarbeitung der Texte statt. Die Proband:innen bewerteten sowohl die Wissenschaftlichkeit der Autor:in bzw. des Textes und ihr Vertrauen in die Autor:in bzw. den Text. Wahrgenommene Wissenschaftlichkeit wurde per Likert-Item erfasst (1 = „sehr unwissenschaftlich”, 8= „sehr wissenschaftlich”), Vertrauen in die Autor:in über das Muenster Epistemic Trustworthiness Inventory (METI, Hendriks et al., 2015), und Vertrauen in den Text ebenfalls per Likert-Item (1 = „sehr unglaubwürdig”, 8 = „sehr glaubwürdig”). Die Auswertung der Mediationsmodelle erfolgte durch mixed models mit dem package mediation (Tingley et al., 2019) in R. Ergebnisse:* Autor:innenwissenschaflichkeit und Textwissenschaftlichkeit als unabhängige Variablen sagten Vertrauen in die Autor:in bzw. den Text signifikant positiv vorher (ꞵs = .142 -.312, SEs = .036 -.044, ps < .001, R² = .005 - .024). Ebenso sagte Wissenschaftlichkeit die Mediatoren wahrgenommene Wissenschaftlichkeit der Autor:in bzw. des Texts signifikant positiv vorher (ꞵs = .325 - .421 , SEs = .044 -.046, ps < .001, R² = .026 - .044). Die Mediatoren sagten Vertrauen ferner auch dann noch signifikant positiv vorher, wenn gleichzeitig die unabhängigen Variablen und weitere Kontrollvariablen berücksichtigt wurden (ꞵs = .381 - 615, SEs = .017, ps < .001, R² = .175 - .418). Der durchschnittliche kausale Mediationseffekt (ACME) erreichte für alle Modelle Signifikanz (ꞵs = .119 - .287, 95%CI[.084-.236\|.150 - .340], ps < .001). Daher scheint subjektiv wahrgenommene Wissenschaftlichkeit eine zentrale, vermittelnde Einflussgröße für den Scientificness-Effekt darzustellen, was für die zukünftige Theoriebildung essentiell ist. Weitere Implikationen, z.B. mit Blick auf individuelle Merkmale, die die Wissenschaftlichkeitswahrnehmung beeinflussen könnten (epistemische Überzeugungen), werden diskutiert. Auch werden Implikationen für die Wissenschaftskommunikation gegenüber der Allgemeinbevölkerung aufgegriffen. Paper Session Wer sagt was? Der Effekt von Rollenzuschreibung und Message Framing auf die Wahrnehmung von Informationen Hadjar Mohajerzad, Josephine Hennch, Martin Merkt Deutsches Institut für Erwachsenenbildung Leibniz-Zentrum für Lebenslanges Lernen e. V., Deutschland Hintergrund und Fragestellung In den letzten Jahren haben sich Videos zu einem attraktiven Format für die Wissenschaftskommunikation entwickelt (León & Bourk, 2018). In Videos kann mithilfe von narrativen Elementen die Kommunikation über Wissenschaft vereinfacht werden (Finkler & León-Anguiano, 2019). Die Forschung zeigt, dass die Einbindung von Narrativen in die Kommunikation zu einem besseren Verständnis und größerem Interesse an einem Thema führen kann (Graesser et al., 2002; Green, 2004, 2006), wobei insbesondere jene Informationen besser erinnert werden, die in einer engen Verbindung zur Narration stehen (Dahlstrom & Ho, 2012). Zusätzlich steigert eine narrative Einbettung die Akzeptanz und wahrgenommene Relevanz von Informationen (Bucher et al., 2022). In unserem Experiment untersuchen wir, ob die Art der narrativen Einbettung (Praxisrelevanz vs. Wissenschaftsfokus) in Videos, die wissenschaftlich fundierte Informationen über digitale Lernwerkzeuge bereitstellen, die Bewertung der bereitgestellten Informationen durch die Rezipient/innen beeinflusst und inwiefern sich dies in der Erinnerung an die Inhalte widerspiegelt. Zudem können Rollenzuschreibungen Rollenerwartungen hervorrufen, die die Wahrnehmung von Informationen beeinflussen (Feuer, 2006). So können Rollenzuschreibungen unter anderem die wahrgenommene Glaubwürdigkeit und Relevanz der vermittelten Informationen beeinflussen (Bucher et al., 2022). Daher wird im vorliegenden Beitrag der mutmaßliche Beruf der vermittelnden Person (Bildungsforscherin vs. Workshopleiterin) systematisch variiert. Methode Insgesamt liegen vollständige Datensätze von 352 Teilnehmenden (141 weiblich, 209 männlich, 2 divers; M_Alter = 32,30; SD_Alter=10,77) vor, die über die Seite Prolific für unsere Online-Studie rekrutiert wurden. Dabei wurden die Teilnehmenden zufällig einer von vier Bedingungen zugewiesen, die sich aus einer vollständigen Kreuzung der beiden Faktoren Profession (Bildungsforscherin vs. Workshopleiterin) sowie narrative Einbettung (Alltagsbeispiel vs. Wissenschaftsfokus) ergaben. In dem ca. 5-minütigen Video stellte sich dieselbe weibliche Person (Mitte 20, weiß) entweder als Bildungsforscherin oder als Workshopleiterin vor, bevor sie das Thema entweder mit einem Fokus auf Praxisrelevanz oder mit dem Fokus auf Wissenschaft einleitete. Die folgenden Informationen über die digitalen Tools (z.B. Kahoot!) und wissenschaftlichen Befunde zur Wirksamkeit dieser Tools (Testing Effect und Gamification) waren in allen vier Bedingungen exakt identisch. Nachdem die Teilnehmenden die Videos sahen, bewerteten sie unter anderem die wahrgenommene Relevanz der Inhalte, die Vertrauenswürdigkeit der vermittelnden Person, die Wissenschaftlichkeit der Videos und das selbst eingeschätzte Wissen, bevor sie in einem Wissenstest Fragen zu den Inhalten des Videos beantworteten. Ergebnisse und ihre Bedeutung Während sich für die wahrgenommene Relevanz der Inhalte keine Haupteffekte oder Interaktionen der beiden Faktoren Narrative Einbettung und Profession zeigten, alle p > .091, ergaben sich für die abhängigen Variablen Vertrauenswürdigkeit der vermittelnden Person, wahrgenommene Wissenschaftlichkeit der Inhalte, wahrgenommenes Lernen und Lernergebnisse jeweils Haupteffekte des Faktors narrative Einbettung, alle p < .014, die allesamt auf eine Überlegenheit einer praxisnahen Einbettung des Videos hindeuten. Jedoch weisen Interaktionen für sämtliche genannte Variablen darauf hin, dass die praxisrelevante Einbettung nur dann positiv wirkt, wenn sich die Person als Wissenschaftlerin vorstellte, alle p < . 048. Der Haupteffekt für den Faktor Profession wurde nur für die Variable Wissenschaftlichkeit signifikant, bei der die Wissenschaftlerin als wissenschaftlicher wahrgenommen wurde als die Praktikerin, p = .039. Damit deuten unsere Ergebnisse darauf hin, dass die praxisnahe Einbettung wissenschaftlicher und praxisnaher Informationen im Zusammenspiel mit der mutmaßlichen Profession der vermittelnden Person einen Einfluss auf die Wahrnehmung und die Erinnerung an diese Informationen haben kann, selbst wenn die vermittelten Informationen und die vermittelnde Person selbst exakt identisch sind. So lässt sich aus den vorliegenden Ergebnissen ableiten, dass insbesondere Wissenschaftler/innen bei der Vermittlung wissenschaftlicher und praxisnaher Informationen die Relevanz der Informationen für die Praxis betonen sollten, um Wissen effektiv und glaubwürdig zu kommunizieren. Jedoch ist weitere Forschung erforderlich, um die Generalisierbarkeit der Befunde auf andere Zielgruppen und andere Wissensvermittelnde (Geschlecht, Alter, Ethnizität) zu überprüfen. Paper Session Vertrauensbildende und vertrauenshemmende Faktoren bei der Bewertung von Forschenden durch Laien: Eine exploratorische Untersuchung Tom Rosman, Nina Hackmann Leibniz-Institut für Psychologie (ZPID), Deutschland Theoretischer Hintergrund Der Transfer wissenschaftlicher Evidenz in die Bildungspraxis setzt eine positive Bewertung wissenschaftlicher Befunde voraus. Wissenschaftliche Laien bewerten die Evidenz dabei oftmals nicht direkt, sondern beurteilen die Vertrauenswürdigkeit der jeweiligen Quelle, also beispielsweise der Wissenschaftlerin, die über ihre Forschungsergebnisse berichtet (Bromme et al., 2010). Maßgeblich für solche Bewertungen „zweiter Hand“ sind die wahrgenommene Expertise, Integrität und Benevolenz von Wissenschaftler:innen (Hendriks et al., 2015). Zudem spielen konkretere forschungsbezogene Faktoren wie das Funding einer Studie, die Nutzung von Open Science-Praktiken, oder das Anwenden fragwürdiger Forschungspraktiken eine Rolle (Rosman et al., 2022; Song et al., 2022). Wenig bekannt hingegen ist über die relative Einflussstärke dieser Faktoren, da unseres Wissens keine Studien existieren, die unterschiedliche Faktoren in eine Datenerhebung integrieren und gegeneinander abwägen. Zudem können keine Schlüsse auf den tatsächlichen Einfluss der genannten Faktoren gezogen werden, da gegenwärtige Studien nicht zwischen den potenziellen und tatsächlichen Auswirkungen unterscheiden. Dies ist problematisch, da auch Faktoren mit einem potenziell großen Einfluss nur eine geringe Wirkung haben können, wenn Personen davon ausgehen, dass solche Praktiken wenig verbreitet sind. Fragestellung Der vorliegende Beitrag untersucht die potenzielle Einflussstärke der genannten Faktoren auf das Vertrauen in Forschende (Fragestellung 1). Zudem werden Einschätzungen zur potenziellen Einflussstärke mit Einschätzungen zur Verbreitung der jeweiligen Faktoren kombiniert, um eine genauere Übersicht über die tatsächlichen Determinanten von Vertrauen in Forschende in der Allgemeinbevölkerung zu gewinnen (Fragestellung 2). Methode Zur Untersuchung der Forschungsfragen wurde ein zweigestufter szenariobasierter Fragebogen entwickelt. In einem ersten Schritt wird die potenzielle Einflussstärke erfasst. Dazu beurteilen die Versuchspersonen insgesamt 14 Handlungen und Eigenschaften einer fiktiven Wissenschaftlerin dahingehend, ob sie eher vertrauenshemmend oder vertrauensfördernd sind (Beispielitem Benevolenz: „Dr. Schulze möchte mit ihrer Forschung anderen Menschen helfen“; siebenstufige Antwortskala von „sehr stark vertrauenshemmend“ über „weder/noch“ bis „sehr stark vertrauensfördernd“). Anschließend geben die Versuchspersonen eine Einschätzung zur Verbreitung der 14 Faktoren ab (Beispielitem Benevolenz: „Wissenschaftler/-innen möchten mit ihrer Forschung anderen Menschen helfen; siebenstufige Antwortskala von „sehr wenig verbreitet“ über „mittlere Verbreitung“ bis „sehr stark verbreitet“; Kodierung 1-7). Vor der Datenanalyse werden die Variablen zur potenziellen Einflussstärke auf Werte zwischen -3 und +3 rekodiert; somit indizieren negative Werte einen vertrauenshemmenden und positive Werte einen vertrauensfördernden Einfluss. Die Forschungsdaten wurden an zwei separaten Stichproben im Altersrange zwischen 18 und 66 Jahren erhoben (Studie 1: N=504; Studie 2: N=588). Alters- und Geschlechtsverteilungen beider Stichproben entsprachen der deutschen Allgemeinbevölkerung. Die erste Fragestellung wurde im Rahmen einer deskriptivstatistischen Analyse der Daten zur potenziellen Einflussstärke geprüft; zur Untersuchung der zweiten Fragestellung wurde die potenzielle Einflussstärke mit der Verbreitung multipliziert, was den absoluten Wert der resultierenden Variable (tatsächlicher Einfluss) mit steigender Verbreitung ansteigen lässt. Ergebnisse Mit Blick auf potenziell vertrauensbildende Einflussfaktoren zeigten sich in Studie 1 bezüglich Expertise und Integrität die höchsten Mittelwerte (Expertise: „Dr. Schulze ist eine ausgewiesene Expertin auf ihrem Fachgebiet“, M=1.54, SD=1.16; Integrität: „Dr. Schulze befolgt wissenschaftliche Regeln und Standards sehr genau“, M=1.69, SD=1.24), während die Faktoren Externer Druck („Externe Personen [z. B. Politiker] setzen Dr. Schulze unter Druck, um Einfluss auf ihre Forschungsergebnisse zu nehmen“, M=-2.21, SD=1.46) sowie Datenfälschen („Dr. Schulze fälscht Daten und erfindet Forschungsergebnisse“, M=-1.63, SD=1.47) als am stärksten vertrauenshemmend einschätzt wurden. Bezüglich des tatsächlichen Einflusses (kombinierte Variable aus Verbreitung und Einflussstärke) bestätigte sich dieses Muster (Expertise: M=8.27, SD=6.76; Integrität: M=9.04, SD=7.07; Externer Druck: M=-5.99, SD=5.93; Datenfälschen: M=-5.10, SD=6.07). Vergleicht man die potenziellen Einflüsse mit den tatsächlichen Einflüssen, fällt auf, dass vertrauenshemmende Einflussfaktoren wie externer Druck auf Forschende zwar ein starkes Potenzial zur Vertrauensverringerung haben, deren tatsächlicher Einfluss aber aufgrund ihrer geringeren wahrgenommenen Verbreitung (im Vergleich zu vertrauensbildenden Einflussfaktoren) abgemildert wird. Alle Ergebnisse wurden in Studie 2 repliziert. Eine detailliertere Darstellung und Einordnung dieser Ergebnisse erfolgt während der Präsentation. Paper Session Das kann man gar nicht untersuchen! Abwertung der Fähigkeit und Zuständigkeit von Bildungswissenschaft in der Öffentlichkeit Holger Futterleib, Eva Thomm, Johannes Bauer Universität Erfurt, Deutschland Um informierte Entscheidungen treffen zu können, müssen sich Bürger:innen zunehmend mit wissenschaftlicher Evidenz auseinandersetzen. Dies gilt auch für Bildungsfragen, die täglich Gegenstand medialer Berichterstattung sind und auf großes öffentliches Interesse stoßen. Bildungswissenschaftliche Evidenz kann dabei jedoch persönlichen Vorüberzeugungen widersprechen. Die Forschung zeigt, dass Personen in solchen Fällen häufig die vorliegende Evidenz ignorieren oder abwerten, anstatt ihre Vorannahmen zu korrigieren (z.B. Chinn & Brewer, 1998; Rothmund et al., 2017). Mögliche Reaktionen beinhalten sogar, dass Personen grundsätzlich die Fähigkeit von Wissenschaft anzweifeln, ein Bildungsthema untersuchen zu können („scientific impotence excuse“, SIE; Munro, 2010). Erste Studien konnten diese Abwertungsstrategie bereits bei Lehramtsstudierenden aufzeigen (z.B. Thomm et al., 2021). Unklar bleibt bisher, ob die SIE auch in einer Stichprobe der Allgemeinbevölkerung repliziert werden kann; und ob die wahrgenommene Zuständigkeit von Wissenschaft gleichermaßen abgewertet wird (Futterleib et al., 2022). Da Wissen zu Bildungsthemen häufig als subjektiv wahrgenommen wird (Pieschl & Glumann, 2022), mag es für Nicht-Expert:innen nicht zwingend ersichtlich sein, warum es überhaupt bildungswissenschaftlicher Evidenz bedarf. Sie stellen möglicherweise nicht die Fähigkeit, sondern gänzlich die Zuständigkeit von Wissenschaft für solche Themen in Frage. Ziel der vorliegenden Studien war es, zu überprüfen, ob Personen aus der Allgemeinbevölkerung die Fähigkeit (Studie 1) bzw. die Zuständigkeit (Studie 2) von Wissenschaft anzweifeln, wenn wissenschaftliche Evidenz zu einem Bildungsthema ihren eigenen Vorüberzeugungen widerspricht. Zudem wurde untersucht, ob sie diese Abwertungstendenzen auf die Untersuchung weiterer Bildungsthemen sowie auf ihre Präferenz für wissenschaftliche Informationsquellen übertragen. Beide Studien sind als Replikationen angelegt, welche die vermuteten Effekte anhand des Untersuchungsparadigmas und -materials früherer Studien auf die Zielgruppe der deutschen Allgemeinbevölkerung anwendeten. An beiden Experimenten nahmen Personen einer quotenrepräsentativen Stichprobe eines Online Access-Panels aus der deutschen Allgemeinbevölkerung teil (n₁ = 317; n₂ = 309). Die präsentierte Evidenz behandelte das Thema „Wirksamkeit von Klassenwiederholung“. Die Proband:innen schätzten vor und nach dem Lesen der Evidenz ihre Annahmen über die Wirksamkeit einer Klassenwiederholung ein. Als Evidenz dienten fünf kurze Zusammenfassungen von Studien, die entweder die Wirksamkeit belegten („pro“) oder widerlegten („contra“; Zwischensubjektfaktor). Nach dem Lesen der Evidenz schätzten die Proband:innen ein, inwiefern sich das Thema mit wissenschaftlichen Methoden untersuchen lässt (Fähigkeit der Wissenschaft; Studie 1) bzw. inwieweit die Wissenschaft überhaupt für die Untersuchung des Thema zuständig ist (Zuständigkeit der Wissenschaft; Studie 2). Die Proband:innen nahmen die gleiche Einschätzung für weitere Bildungsthemen vor (Generalisierung der Abwertung) und schätzten ein, welche wissenschaftlichen und nicht-wissenschaftlichen Quellen sie für eine weitere Auseinandersetzung mit dem Thema zu Rate ziehen würden (indirektes Maß der Abwertung). Regressionsanalysen konnten in beiden Studien den erwarteten signifikanten Interaktionseffekt zwischen Vorüberzeugung und Evidenzbedingung nachweisen: Lasen Proband:innen vorüberzeugungskonträre wissenschaftliche Evidenz zeigten sie eine stärkere Abwertung der zugeschriebenen Fähigkeit (Studie 1) und Zuständigkeit (Studie 2) von Wissenschaft. Die systematische Abwertung entlang des Interaktionseffekts blieb in beiden Studien jedoch auf die themenspezifische Beurteilung begrenzt: Es zeigte sich keine Generalisierung der Abwertung auf weitere Bildungsthemen. Auch eine geringere Präferenz für wissenschaftlichen Quellen konnte nicht bestätigt werden. Die Studien deuten darauf hin, dass sich frühere Ergebnisse zur Abwertung von wissenschaftlichen Befunden der Bildungsforschung nach Evidenz-Überzeugungskonflikten auch in einer breiteren Öffentlichkeit replizieren lassen. Dabei zeigt sich, dass Wissenschaft nicht nur hinsichtlich ihrer wahrgenommenen Fähigkeit im Sinne der SIE, sondern auch hinsichtlich ihrer wahrgenommenen Zuständigkeit abgewertet werden kann. Letzteres stellt potenziell eine noch drastischere Abwertung von Wissenschaft dar. Die untersuchten Abwertungstendenzen scheinen sich jedoch nicht ohne Weiteres auf andere Themen zu übertragen. Unberührt davon bleibt jedoch die Frage, wie sich wiederholte Widersprüche zwischen Vorüberzeugungen und Evidenz langfristig auf die Einstellungen gegenüber Wissenschaft sowie auf die Rezeption von wissenschaftlicher Evidenz auswirken können. Neben der Bedeutung für ein besseres Verständnis von Problemen der Wissenschaftsrezeption, hat dieser Befund auch Konsequenzen für die Wissenschaftskommunikation und öffentliche Diskussion von Bildungsthemen.
15:20 - 17:00	3-15: Feedback Ort: S14
	Paper Session Wie kann Peer-Feedback instruktional unterstützt werden? – Ergebnisse einer Meta-Analyse. Julia Hornstein, Melanie Keller, Martin Greisel, Markus Dresel, Ingo Kollar Universität Augsburg, Deutschland Peer-Feedback hat sich in empirischen Studien als effektive Lernmethode erwiesen (z.B. Baker, 2016; Huisman et al., 2019). Die Vorteile von Peer-Feedback bestehen dabei darin, dass die Studierende sich aktiv am Lernprozess beteiligen und somit ihren eigenen Wissens- und Kompetenzerwerb steigern können (Double et al., 2020; Li et al., 2020). Der Peer-Feedback-Prozess besteht aus vier Schritten (Kollar & Fischer, 2010): Ausarbeitung, Feedbackgabe, Feedbackrezeption und Revision. Der Forschungsstand zeigt jedoch, dass Peer-Feedback instruktional unterstützt werden muss, damit die Potenziale dieses Ansatzes tatsächlich zum Tragen kommen (Carless & Boud, 2018; Lui & Andrade, 2022). Instruktionale Unterstützungsmaßnahmen können zum einen dahingehend unterschieden werden, ob sie bestimmte Peer-Feedback-Prozesse während des konkreten Lernprozesses prompten (z.B. in Form von Rubrics zur Bewertung erhaltenen Peer-Feedbacks) oder ob sie bereits vor dem Peer-Feedback-Prozess im Sinne eines Trainings präsentiert werden. Zudem kann unterschieden werden, ob instruktionale Maßnahmen mit oder ohne Hilfe von Online-Technologien realisiert werden, wobei Online-Technologien Potenziale insbesondere hinsichtlich einer asynchronen Nutzung und der Möglichkeit, die Aufgaben ohne Zeitdruck zu bearbeiten, zugeschrieben werden. Diese instruktionalen Unterstützungsmaßnahmen können positive Effekte auf die Feedbackqualität sowie auf die Leistung haben (z.B. Sluijsmans et al., 2002; Zheng et al., 2020). Es ist jedoch noch unklar, welche Art von instruktionaler Unterstützung (Scaffolding) für welche Phase des Peer-Feedback-Prozesses am effektivsten ist, um entsprechende Effekte zu erzielen. Vor diesem Hintergrund untersucht der vorliegende Beitrag mittels metaanalytischer Verfahren, inwiefern sich (a) die Effekte unterschiedlicher instruktionaler Unterstützungsmaßnahmen (Scaffolds) auf die Feedbackqualität, die Leistung und weitere für das Lernen bedeutsame Outcomes voneinander unterscheiden, inwiefern sich (b) die Effekte von Online-Technologien im Gegensatz zu Offline-Fördermaßnahmen unterscheiden, und inwiefern sich (c) ähnliche oder unterschiedliche Effekte einzelner Maßnahmen in Abhängigkeit von der jeweiligen Peer-Feedback-Phase zeigen, in der sie eingesetzt werden. Dabei stellen die Feedbackgabe und die Feedbackrezeption die Kernprozesse dar, weswegen der Fokus auf der Förderung dieser beiden Phasen gelegt wird. Um passende Studien zur Beantwortung der Fragestellung zu finden, wurde eine systematische Literaturrecherche in mehreren Suchmaschinen (Web of Science, Psyndex, Pubmed, ERIC, PsycArticles, Mendeley, PubPsych) durchgeführt. Nach dem Ausschluss von Duplikaten, nicht-experimentellen Studien sowie Arbeiten, die nicht auf Englisch publiziert wurden, gingen N=54 Studien mit insgesamt N=5925 Lernenden in die Analysen ein. Diese Studien wurden mit Hilfe eines eigens für unsere Untersuchung konzipierten Analyseschemas daraufhin kodiert, welche Arten von instruktionaler Unterstützung in ihnen genutzt und in welcher Phase des Peer-Feedback-Prozesses sie eingesetzt wurden. Mit Blick auf die Arten instruktionaler Unterstützung wurde einerseits zwischen Prompts und Trainings unterschieden und zum anderen differenziert, ob die Maßnahmen mithilfe von Online-Technologien umgesetzt wurden oder nicht. In Anlehnung an Kollar und Fischer (2010) wurde zudem kodiert, welche Phasen des Peer-Feedback-Prozesses jeweils berücksichtigt wurden. 10% aller Studien wurden von zwei unabhängigen Kodiererinnen mit guter bis sehr guter Reliabilität beurteilt (Gwet‘s AC1 = 0.62 bis 1.00). Erste deskriptive Ergebnisse zeigen, dass sich die Präsentation instruktionaler Unterstützung in 90,74% (n=49) der eingeschlossenen Studien auf den Prozess der Feedbackgabe bezog, aber nur in 51,85% (n=28) auf die Feedbackrezeption. Sowohl die Feedbackgabe (40,82%, n=20) als auch die Feedbackrezeption wurden hauptsächlich mithilfe von Online-Tools (71,43%, n=20) unterstützt. Für den Vergleich von Prompts und Trainings zeigt sich, dass die instruktionale Unterstützung in 42,86% (n=21) der Studien aus Prompts und in 22,45% (n=11) der Studien aus Trainingsmaßnahmen bestand. Außerdem zeigen erste explorative Analysen überwiegend positive Effekte der eingesetzten instruktionalen Maßnahmen auf die untersuchten abhängigen Variablen; allerdings ist hierbei eine recht hohe Varianz zwischenden Studien, den unterschiedlichen Arten instruktionaler Unterstützung und zwischen den durch die Maßnahmen angezielten Peer-Feedback-Phasen zu beobachten. Tiefergehende Analysen werden auf der Konferenz vorgestellt. Paper Session Vergleich zweier Darstellungsarten digitalen Feedbacks in einer Simulation - anfrage- und trigger-basiertes Feedback - Pia Schäfer¹, Felix Walker², Leo van Waveren¹ ¹RPTU Kaiserslautern-Landau, Deutschland; ²Universität Hamburg, Deutschland Die Bedeutung von Feedback für Lernprozesse von Schüler:innen konnte in zahlreichen Studien gezeigt werden (Hattie, 2009; Hattie & Timperley, 2007). Der Grad der Wirksamkeit hängt jedoch von der konkreten Ausgestaltung, wie z.B. der Darstellungsform und den Inhalten, ab (Marschner, 2011; Narciss, 2006, 2018). Die Einbindung von Feedback in digitalen Lernumgebungen wird seit zwei Jahrzehnten vermehrt untersucht, dennoch liegen zu dessen Gestaltung nur wenige Befunde vor (Maier & Klotz, 2022). Bisher konnte gezeigt werden, dass unmittelbares Feedback Lernprozesse besser unterstützt als verzögertes Feedback, jedoch zugleich den Lernprozess stört (Vasilyeva et al., 2007). Ob jedoch eine interne Evaluation, also von den Lernenden ausgehend (Nelson, Ehren & Godfrey, 2015), oder ein externes Feedback, z.B. also von externen Feedback-Quellen ausgehend (Hellrung & Hartig, 2013), wirksamer für den Lernprozess ist, bleibt offen. Simulationen bieten im Rahmen von Lernprozessen die Möglichkeit, digitales Feedback zu integrieren. Sie werden zum Beispiel zur Analyse und Förderung von Fehlersuchprozessen in technischen Systemen eingesetzt (Abele, Behrendt, Weber & Nickolaus, 2016; Schaper, Hochholdinger & Sonntag, 2003; Walker et al., 2016). Mithilfe einer Simulation einer Automatisierungsanlage konnten Walker et al. (2016) zeigen, dass ein Drittel der Elektroniker:innen für Automatisierungstechnik im 3. Ausbildungsjahr, trotz vorhandenem Fachwissen, Schwierigkeiten beim analytischen Problemlösen (aPL) haben. Schaper et al. (2003) haben erfolgreich ein Konzept für die Förderung des Problemlösens von Auszubildenden, basierend auf dem Cognitive Apprenticeship Ansatz (Brown, Collins & Duguid, 1989) getestet, wobei ebenfalls eine Simulation eingesetzt wurde. Basierend auf den Befunden der Feedback-Forschung ergibt sich die Frage, ob ein aktiv angefordertes Feedback, also basierend auf der Eigenwahrnemung von Unterstützungsbedarf das aPL stärker unterstützt als ein Feedback, dass von extern bestimmten Sollwerten ausgelöst wird. Zu diesem Zweck wurde die bei Walker et al. (2016) zugrunde liegende Simulation SINA im Rahmen des Projekts TechKom (Prof. Dr. Felix Walker, UHH) u.a. um zwei Feedback-Varianten erweitert. Das anfrage-basierte Feedback (in Form von gestuften Lernhilfen) muss durch die Nutzer:innen eigenständg aufgerufen werden und ist demnach von internen Soll-Werten abhängig, während das trigger-basierte Feedback (in Form eines Chats) von ihren Aktionen, also von externen Soll-Werten, abhängig angezeigt wird. Im Rahmen des Projektes DEFINE wird der Einfluss der beiden Feedback-Modalitäten auf die Wirksamkeit von digitalem Feedback in Simulationen im Rahmen eines Diagnosetrainings für Auszubildende untersucht. Zur Testung der Hypothese „Auszubildende, die anfrage-basiertes Feedback erhalten, erlangen höhere aPL-Kompetenzen als Auszubildende mit trigger-basiertem Feedback“ wurde ein Experimental-Kontrollgruppen-Pre-Post-Testdesign eingesetzt. Im Pre- und Posttest, sowie der Intervention erfolgte die Bearbeitung von jeweils drei Fehlerfällen von denen die Ursache je einmal im Programm, der Elektrik und der Mechanik lag. Feedback wurde lediglich in der Intervention bereitgestellt. Im Rahmen dieses Beitrags wird eine Teilstichprobe von n = 74 Auszubildenden aus 4 Schulen betrachtet, die, randomisiert zwischen beiden Feedbackarten, an einem zweitägigen Training teilgenommen haben. Die Erhebung hat zwischen März und Juli 2023 stattgefunden, wobei das Training aus zwei Terminen je Schulklasse bestand, die innerhalb von zwei Wochen stattgefunden haben. Erwartungskonform fiel der Gruppenvergleich im Eingangstest nicht signifikant aus (t (71) = 1.315, p > .05). Unabhängig von der Art des erhaltenen Feedbacks, zeigt sich eine Wirksamkeit des Diagnosetrainings (t (72) = 6.58, p < .001, d = .77). Doch die ersten Analysen zeigen, dass entgegen der angenommenen Hypothese „Auszubildende, die anfrage-basiertes Feedback erhalten, erlangen eine höhere aPLK als Auszubildende mit trigger-basiertem Feedback“ im Posttest kein Unterschied zwischen den Gruppen in der aPLK vorliegt (t (71) = 0.56, p = .29, d = .13). Vertiefende Analysen, z.B. getrennt nach Fehler-Art, stehen noch aus. Aufgrund der starken Indizien für die Wirksamkeit des Trainings, das die grundsätzliche Zuschreibung der Wirksamkeit von Feedback repliziert, bieten sich weitere Untersuchungen zu den Feedbackmodalitäten an. Paper Session Zur Rolle des Cognitive Load beim feedbackgestützten forschenden Lernen Svenja Boegel, Mathias Ropohl Universität Duisburg Essen, Deutschland Theoretischer Hintergrund Schüler:innen zeigen in Experimentiersituationen, insbesondere bei der Anwendung der Variablenkontrollstrategie (VKS), Lernschwierigkeiten, welche angepasste Lernprozesse erfordern (Schwichow et al., 2016). Das Geben von schriftlichem Feedback hat sich in diesem Kontext als effektive Lernunterstützung erwiesen. Wollenschläger et al. (2011) konnten herausstellen, dass Feedback, welches die Kompetenzen der Schüler:innen anhand von Kriterien adressiert, wirksam ist. Hild et al. (2020) konnten belegen, dass Schüler:innen von Feedback zum aktuellen Leistungsstand profitieren. Ropohl und Scheuermann (2018) konnten zeigen, dass Feedback, welches Informationen zum Lernziel, zum Lernstand und zu den nächsten Schritten enthält zu einem Lernzuwachs bei den Schüler:innen führt. Dies zeigt, dass Feedback differentiell wirkt und keine Feedbackversion einer anderen grundlegend überlegen ist. Des Weiteren klingt an, dass kognitive Konstrukte, wie der Cognitive Load, beim Lernen mit Feedback eine wichtige Rolle für den Lernerfolg spielen (Sweller, 1988). Basierend auf dieser Annahme bietet die Cognitive Theory of Multimedia Learning (CTML; (Mayer, 2001) für die Entwicklung von Feedback im Sinne von Lernunterstützungsmaterial ein weiteres theoretisches Fundament. Laut der CTML steht ein Kanal für visuell/non-verbal (z.B. Bilder) und einer für auditiv/verbal (z.B. Text) präsentierte Informationen zu Verfügung. Durch die Verknüpfung von Text- und Bildpräsentationen wird die Kapazität des Arbeitsspeichers sensitiv behandelt, was sich positiv auf den Cognitive Load auswirkt. Fragestellung FF1: Welchen Effekt haben Nur-Text (NT), Nur-Bild (NB) und Text-Bild (TB) Feedback auf den wahrgenommenen Cognitive Load beim Planen von Experimenten unter Anwendung der VKS? FF2: Inwiefern wird der Effekt von Feedback auf die Qualität der Experimentplanung unter Anwendung der VKS über den wahrgenommenen Cognitive Load mediiert? Methode Um die Forschungsfragen zu beantworten, wurde im Sommer 2023 eine Querschnittserhebung durchgeführt. Es haben N = 290 Schüler:innen aus 9. Klassen nordrhein-westfälischer Gymnasien teilgenommen. Nachdem die Schüler:innen eine fehlerhafte vorgeschriebene Experimentplanung gelesen haben sollte diese mit Hilfe von simuliertem Feedback neu geschrieben werden. Das Feedback wurde randomisiert zugeteilt. Danach wurde der Cognitive Load (Kalyuga et al., 1999; Paas, 1992) sowie diverse Kontrollvariablen erhoben. Ergebnisse Die ANOVA zeigt einen signifikanten Unterschied zwischen der eingesetzten Feedbackversion und dem wahrgenommenen Cognitive Load der Schüler:innen, F(3,286) = 10.774, p < .001, partielles η² = .102. Die Schüler:innen, die mit dem Nur-Bild- und Text-Bild-Feedback gearbeitet haben, nehmen einen signifikant niedrigeren Cognitive Load wahr verglichen mit den Schüler:innen, die mit dem Nur-Text oder Kontroll-Feedback gearbeitet haben. Im Rahmen der Mediationsanalyse wurde für die multikategoriale X-Variable eine Dummy-Kodierung (D1, D2, D3) vorgenommen. Die Ergebnisse zeigen, dass die Arbeit mit dem Nur-Bild (D2) und Text-Bild (D3) Feedback zu einem niedrigeren Cognitive Load im Vergleich mit dem Feedback der Kontrollgruppe führt (a₂ = -.68, p < .001; a₃ = -.73, p < .001). Der Cognitive Load der Schüler:innen, die mit dem Nur-Text (D1) Feedback gearbeitet haben unterscheidet sich nicht signifikant von der, der Kontrollgruppe (a₁ = -.22, p = .132). Außerdem liegt ein signifikanter direkter Effekt von Cognitive Load auf die Qualität der Experimentplanung vor (b = -.86, p < .001). Je geringer der Cognitive Load bei der Arbeit mit dem Feedback ist, desto höher ist die Qualität der Experimentplanung. Das Bootstrapping ergibt, dass der Effekt des Feedbacks in der Nur-Bild und Text-Bild Gruppe aber nicht in der Nur-Text Gruppe im Vergleich zum Feedback der Kontrollgruppe auf die Qualität der Experimentplanung partiell über den Cognitive Load vermittelt wird (D₁: a₁b = .19, p = .166, 95% KI [-.06, .48]; D₂: a₂b = .58, p = .002, 95% KI [.24, 1.02]; D₃: a₃b = .63, p = .001, 95% KI [.31, 1.00]) (Hayes, 2018). Die Ergebnisse dieser Untersuchung zeigen, dass schriftliches Feedback aus einer Kombination von textlichen und bildlichen Informationen bestehen sollte, da seitens der Feedbackempfänger ein niedrigerer Cognitive Load wahrgenommen wird, welcher zudem eine mediierende Funktion ausübt. Paper Session Wahrnehmung und Nutzung von Peer-Feedback: Bedeutung der Motivation von Studierenden vor dem Hintergrund einer Intervention Melanie V. Keller, Martin Daumiller, Markus Dresel Universität Augsburg, Deutschland Theoretischer Hintergrund (Peer-)Feedback kann ein wertvoller Faktor für erfolgreiches Lernen und Leisten sein (Hattie & Timperley, 2007; Double et al., 2020), jedoch nur dann, wenn das Feedback effektiv aufgegriffen wird (Van der Kleij & Lipnevich, 2020). Nicht nur Charakteristika des Feedbacks sind dabei bedeutsam, sondern auch individuelle Unterschiede zwischen den Lernenden, die Feedback erhalten. Wie diese Unterschiede mit der Wahrnehmung und Nutzung von Feedback zusammenhängen, ist im Vergleich zu günstigen Charakteristika von Feedback noch wenig untersucht (Winstone et al., 2017). Insbesondere die Analyse von Unterschieden in der Lernmotivation ist ein vielversprechender Ansatz zur Erklärung, wie Lernenden erhaltenes Feedback wahrnehmen und nutzen (Fong & Schallert, 2023; Handley et al., 2011). Zielorientierungstheorien (z.B. Urdan & Kaplan, 2020) sowie Erwartung-Wert-Theorien (z.B. Wigfield & Eccles, 2000) bieten vielversprechende Erklärungsansätze dafür, wie Lernende mit erhaltenem Peer-Feedback umgehen. Für die positive Wahrnehmung und effektive Nutzung von Feedback sind demnach Masterzielorientierungen (starke Lern- und Aufgabenziele) sowie hohe Wertzuschreibungen zur Aufgabe günstig. Lernende mit einer solchen günstigen Motivationsstruktur sollten mehr Freude in der Revision erleben (Huang, 2011), das Feedback als nützlicher erachten (Rakoczy et al., 2013) sowie adaptiver mit Fehlern umgehen, da sie ihre Fehler eher als Lernchancen betrachten statt als Bedrohung (Grassinger & Dresel, 2017). Zudem ist anzunehmen, dass Lernende mit starker Masterzielorientierung sowie hoher Wertzuschreibung sich bei der Umsetzung des Feedbacks mehr anstrengen (Wigfield et al., 2017). Da Peer-Feedback qualitativ stark variieren kann (Bürgermeister et al., 2021), implementierten wir eine Intervention, in der ein Fokus auf die Erstellung von motivational günstigem Feedback gelegt wurde. Fragestellung Demnach untersuchten wir, welche Rolle individuelle, wertbezogene Charakteristika der Motivation (Lern- und Aufgabenziele, Wertzuschreibungen) für die Wahrnehmung und Nutzung von Peer-Feedback mit oder ohne Intervention für motivational günstiges Peer-Feedback spielen. Dabei untersuchen wir die Frage, welchen Einfluss die Motivation der Lernenden in der Feedbackrezeption jenseits der Intervention auf das Erleben und Verhalten beim Erhalt von Peer-Feedback hat. Methode Für diese Studie bearbeiteten 366 Studierende (294 weiblich, M_Alter= 20.2; SD_Alter= 2.55) in einem Feldexperiment schriftliche Aufgaben in einem Hochschulkurs und überarbeiteten diese mithilfe von Peer-Feedback. Nach einer Baseline-Befragung, in der Lern- und Aufgabenziele sowie Wertzuschreibungen für die wöchentlichen Aufgaben erfasst wurde, teilten wir die Studierenden randomisiert in zwei Gruppen ein (jeweils mit oder ohne Intervention mit Fokus auf motivationale Qualität im Peer-Feedback). Nachdem sie das Peer-Feedback erhalten und ihre Aufgabe überarbeitet hatten, gaben die Studierenden an, für wie nützlich sie das Feedback halten und inwiefern sie bei der Revision Freude empfanden (Feedbackwahrnehmung). Außerdem berichteten sie ihren adaptiven Umgang mit Fehlern und ihre Anstrengung in der Revision (Feedbacknutzung). Zudem erfassten wir das Ausmaß der Revisionen quantitativ mithilfe computerbasierter Vergleiche. Ergebnisse Strukturgleichungsmodelle zeigten, dass der motivationale Fokus des Feedbacks (d.h. die Zuordnung zur Experimental-/Kontrollgruppe) keinen Einfluss auf Feedbackwahrnehmung oder -nutzung hatte. Stattdessen zeigten Lern- und Aufgabenziele sowie intrinsischer, aufgabenbezogener und instrumenteller Wert der Aufgabe wie erwartet positive, statistisch signifikante Effekte auf die wahrgenommene Nützlichkeit des Feedbacks, die Freude während der Revision, den adaptiven Umgang mit Fehlern, die Anstrengung sowie das Ausmaß in der Revision. Die Ergebnisse weisen darauf hin, dass im Einsatz von Peer-Feedback nicht (nur) die Qualität des Feedbacks gefördert werden sollte (Ansatz bei den Feedbackgebenden), sondern dass insbesondere individuelle Aspekte der Motivation der Studierenden, die das Feedback erhalten, in den Blick genommen und gefördert werden sollten, da sowohl das positive Erleben in der Revision als auch lernbezogene Aspekte (z.B. Umgang mit Fehlern) sowie die objektive Leistung (Revisionsumfang) von diesen beeinflusst werden. Dabei erscheint es hilfreich, Lern- und Aufgabenziele zu fördern, beispielsweise über ein Priming direkt vor dem Feedbackerhalt (Urdan, 2010). Insbesondere scheint es demnach empfehlenswert, für Studierende den Wert von Peer-Feedback und Überarbeitung für Lernen und Leisten hervorzuheben.
15:20 - 17:00	3-16: Sozio-emotionaler Lernkontext Ort: S15
	Paper Session Effekte der Klassengemeinschaft auf die Entwicklung von Lernzielorientierung und Passungswahrnehmung beim Übergang in die Sekundarstufe I Lukas Ramseier, Markus P. Neuenschwander Pädagogische Hochschule FHNW, Schweiz Theoretischer Hintergrund Lernzielorientierung beschreibt die wahrgenommene Wichtigkeit, im Unterricht Neues zu lernen und Kompetenzen zu erweitern (Spinath, 2011). Sie ist eine Voraussetzung für schulische Leistungen und adaptive Lernstrategien und stellt daher eine wichtige motivationale Überzeugung dar (Linnebrink-Garcia, Tyson & Patall, 2008). Verschiedene Studien zeigen allerdings, dass die Lernzielorientierung beim Übertritt von der Primarstufe in die Sekundarstufe I abnimmt (Lazarides & Raufelder, 2017). Gemäss der Stage-Environment-Fit-Theorie (Eccles et al., 1993) liegt dies daran, dass die Lernumwelt nach dem Übertritt weniger den Bedürfnissen der Schüler:innen entspricht. Darunter leidet die wahrgenommene Person-Umwelt-Passung (im Folgenden: Passungswahrnehmung), die mit motivationalen Überzeugungen wie Lernzielorientierungen einhergeht. Sowohl die Passungswahrnehmung als auch die Lernzielorientierung von Schüler:innen sinken diesen Annahmen zufolge beim Übertritt in die Sekundarstufe I parallel ab. Es kann allerdings vermutet werden, dass das Kultivieren eines positiven Klassenklimas, das von einem starken Gemeinschaftssinn geprägt ist, in der Primarstufe zu einer positiven Haltung der Schüler:innen gegenüber der Schule führt, was die Entwicklung von Lernzielorientierung und Passungswahrnehmung begünstigt (Raufelder et al., 2016; Ryan, 1995). Im vorliegenden Beitrag wird der Frage nachgegangen, ob a) die Entwicklung der Lernzielorientierung während des Übertritts in die Sekundarstufe I signifikant mit der Entwicklung der Passungswahrnehmung zusammenhängt und ob b) die wahrgenommene Klassengemeinschaft in der Primarstufe diese beiden Entwicklungen vorhersagt. Bisherige Studien haben bereits Zusammenhänge zwischen der Passungswahrnehmung und motivationalen Überzeugungen festgestellt (z.B. Zimmer-Gembeck et al., 2006), im vorliegenden Beitrag wird jedoch erstmals empirisch überprüft, ob die Entwicklungsverläufe der beiden Konzepte zusammenhängen und wie diese Entwicklungsverläufe vorhergesagt werden können. Methode Die verwendeten Stichproben stammen aus den ersten drei Erhebungswellen des Schweizer Forschungsprojekts [Name der Studie]. Zur Überprüfung der Fragestellung wurden alle Schüler:innen ausgewählt, die zwischen dem 6. und 7. Schuljahr in die Sekundarstufe I übertraten. Die Stichprobe besteht aus N = 909 Schüler:innen (51.5% w; 48.8% m; Durchschnittsalter t₁ = 10.7, SD = 0.61) der 5. (t₁), 6 (t₂) bzw. 7 (t₃) Klasse aus zwei Schweizer Kantonen. Die Konstrukte wurden durch Fragebogen mit etablierten Instrumenten gemessen (Lernzielorientierung: drei Items nach Midgley et al., 2000, α = .62; Passungswahrnehmung: fünf Items nach Neuenschwander & Frank, 2009; α = .80; Klassengemeinschaft: vier Items nach Eder, 1997; α = .65). Zur Überprüfung der Fragestellung wurde ein latentes Wachstumskurvenmodell (latent growth curve model, LGCM) in Mplus berechnet und der Verlauf der Lernzielorientierung sowie der Passungswahrnehmung über die drei Messzeitpunkte hinweg modelliert. Die wahrgenommene Klassengemeinschaft zum ersten Messzeitpunkt wurde als Prädiktor für die beiden Slopes in das Modell aufgenommen. Sowohl für Lernzielorientierung als auch Passungswahrnehmung wurden metrische sowie skalare Messinvarianz über die drei Messzeitpunkte hinweg nachgewiesen. Ergebnisse Das finale Modell wies zufriedenstellende Fit-Werte auf (χ²(330) = 630.867; p < .001; CFI = .93; RMSEA = .03; SRMR = .05). Die Ergebnisse zeigen, dass sowohl die Lernzielorientierung als auch die Passungswahrnehmung über die drei Messzeitpunkte hinweg signifikant abnahmen. Die beiden Slopes korrelierten signifikant miteinander Die Klassengemeinschaft zum ersten Messzeitpunkt zeigte signifikante Effekte auf die Slopes der Lernzielorientierung bzw. der Passungswahrnehmung. Eine ausgeprägte Klassengemeinschaft zum ersten Messzeitpunkt führt somit zu einem geringeren Rückgang der beiden Konstrukte über die weiteren Messzeitpunkte. Bedeutung Die Ergebnisse bestätigen die Annahme, dass die Lernzielorientierung beim Übertritt in die Sekundarstufe I abnimmt. Der signifikante Zusammenhang zwischen den negativen Entwicklungen der Lernzielorientierung und der Passungswahrnehmung zeigt, dass der Rückgang der Zielorientierung mit einem gleichzeitigen Rückgang der Passungswahrnehmung zusammenhängt, was Annahmen der Stage-Environment-Fit-Theorie bestätigt. Weiterhin zeigt sich, dass sich die wahrgenommene Klassengemeinschaft in der Primarstufe nachhaltig auf die Veränderung der Passungswahrnehmung sowie der Lernzielorientierung auswirkt. Lehrpersonen können durch das Schaffen eines von Gemeinschaftssinn geprägten Klassenklimas in der Primarstufe dazu beitragen, dass der Übertritt in die Sekundarstufe I von einem weniger starken Rückgang der Passungswahrnehmung sowie der Lernzielorientierung begleitet wird. Paper Session Die Bedeutung des Lernkontextes für motivationale, emotionale und Verhaltensprozesse von Schülerinnen an Schulen in sozialräumlich deprivierter Lage Sina Ludwig¹, Julia Holzer², Luisa Grützmacher¹, Barbara Schober², Manfred Prenzel¹, Marko Lüftenegger^1,2 ¹Zentrum für Lehrerinnenbildung, Universität Wien, Österreich; ²Fakultät für Psychologie, Institut für Psychologie der Entwicklung und Bildung, Universität Wien, Österreich *Theoretischer Hintergrund und Forschungsfrage:* Bildungsgerechtigkeit ist immer noch eine große Herausforderung im österreichischen Bildungssystem (Bruneforth et al., 2012; Lassnigg, 2015). Die Mehrgliedrigkeit des Bildungssystems bietet den Schülerinnen aufgrund der schulformspezifischen curricularen Vorgaben, Instruktionskulturen und Lehrerinnenausbildung unterschiedliche Lern- und Entwicklungsmilieus, die sich auf die Leistungs- und Persönlichkeitsentwicklung der Schülerinnen auswirkt (Baumert et al., 2006, S. 98f.). Aus diesem Grund ist es in Schulen in sozial deprivierter Lage besonders wichtig einen anregenden Lernkontext zu schaffen. Basierend auf der Self-Determination Theory kann angenommen werden, dass intrinsische Lernmotivation und Wohlbefinden in einem förderlichen Lernkontext entstehen und wiederum Prädiktoren des Lernverhaltens von Schülerinnen sind (Chiu, 2022; Ryan & Deci, 2000; Vansteenkiste et al., 2010). Anregende Kontextfaktoren sollen demnach zu einem beharrlicheren, aufmerksameren und intrinsisch motivierten Lernen beitragen. Das Ziel dieser Studie ist es, ein tieferes Verständnis für die Lernprozesse von Mittelschülerinnen an Schulen in sozialräumlich deprivierter Lage in Österreich zu erlangen und die Forschungsfrage zu beantworten, wie der von Schülerinnen wahrgenommene Lernkontext (d.h. Beziehungen zu Lehrpersonen und Klassenkameradinnen sowie störungsfreier Unterricht) mit motivational-emotionalen Prozessen und ihrem Lernverhalten zusammenhängt. Hierfür wird basierend auf Annahmen der Self-Determination Theory erwartet, dass der Lernkontext (d.h. ein störungsfreier Unterricht, die Lehrerinnen-Schülerinnen-Beziehung und die Klassengemeinschaft) Beharrlichkeit und kognitive Aktivierung beim Lernen vorhersagt (direkte Effekte), mediiert über intrinsische Lernmotivation und positive Emotionen (indirekte Effekte). Methode:* Die Stichprobe umfasst 5900 Schülerinnen von 45 österreichischen Mittelschulen in sozialräumlich deprivierter Lage. Die Daten wurden zwischen Februar und April 2022 mittels eines Online-Fragebogens mit geschlossenem Antwortformat erhoben. In diesem wurden folgende Messinstrumente* eingesetzt: (1) Störungsfreier Unterricht wurde mit drei Items gemessen (Fauth, 2021), (2) Lehrerinnen-Schülerinnen-Beziehung sowie Klassengemeinschaft wurden mit jeweils drei Items erhoben (LFSK 4-8; Eder & Mayr, 2000), (3) intrinsische Lernmotivation wurde mit drei Items gemessen (MoMa 1.0; Gaspard et al., 2019), (4) positive Emotionen und Beharrlichkeit beim Lernen wurden jeweils mit drei Items erfasst (EPOCH-G-S-Skala; Bürger et al., 2023) und (5) kognitive Aktivierung wurde mit fünf für den Studienkontext erstellten Items gemessen. Bei allen Skalen handelt es sich um fünfstufige Likertskalen mit ausreichenden bis guten inneren Konsistenzen (ω = .64 bis .93). Im methodischen Vorgehen wurde zunächst die Faktorenstruktur des Mediationsmodells mittels einer CFA überprüft. Anschließend wurden latente Pfadanalysen, bei der die hierarchische Datenstruktur der Schulklassen durch Cluster-robuste Standardfehler berücksichtigt wurde, mit Mplus berechnet. *Ergebnisse:* Es zeigten sich *direkte Effekte* des wahrgenommenen Lernkontextes auf das Lernverhalten der Schülerinnen. Konkret wurden signifikante direkte Effekte (1) der Lehrerinnen-Schülerinnen-Beziehung und (2) der Klassengemeinschaft auf kognitive Aktivierung und Beharrlichkeit, sowie (3) des störungsfreien Unterrichts auf die kognitive Aktivierung gefunden. Indirekte Effekte* des wahrgenommenen Lernkontextes auf das Lernverhalten der Schülerinnen, vermittelt über die motivational-emotionalen Mediatoren, zeigten sich ebenfalls. Signifikante indirekte Effekte (1) der Lehrerinnen-Schülerinnen-Beziehung, (2) der Klassengemeinschaft und (3) des störungsfreien Unterrichts auf die kognitive Aktivierung und die Beharrlichkeit, mediiert durch die intrinsische Motivation und positiven Emotionen, konnten identifiziert werden. Die Ergebnisse sind im Einklang mit den Hypothesen. Faktoren wie gute Beziehungen zu Lehrpersonen und Klassenkameradinnen und ein störungsfreier Unterricht können Wohlbefinden und motivationsfördernd sein und in weiterer Folge zu einem beharrlicheren und kognitiv angeregteren Lernen bei Schülerinnen beitragen. Lehrpersonen sollten sich folglich darum bemühen, für die Schülerinnen eine Lernumgebung zu schaffen, die von positiven Beziehungen geprägt und möglichst frei von Störungen ist. Die Studienergebnisse zeigen, dass an österreichischen Schulstandorten mit hohem Anteil an benachteiligten Schülerinnen ein anregender Lernkontext für die Lernprozesse der Kinder besonders wichtig ist. Paper Session Think-Pair-Share: Einfluss von Kooperation auf die mündliche Beteiligung (schüchterner) Schülerinnen und Schüler Susanne Jurkowski¹, Lukas Mundelsee^1,2 ¹Universität Erfurt, Deutschland; ²Universität Heidelberg, Deutschland Theoretischer Hintergrund Die mündliche Beteiligung im Unterricht erfüllt wichtige Funktionen für das Lernen und ist mit höheren Lernfortschritten assoziiert (für einen Überblick siehe Rocca, 2010). Allerdings sind die Chancen von Schülerinnen und Schülern (SuS), sich am Unterricht zu beteiligen, nicht gleich. Beispielsweise warten Lehrkräfte im Mittel gerade einmal 2,5 Sekunden, bis sie die ersten SuS aufrufen (Heinze & Erhard, 2006). Damit bleibt den SuS wenig Zeit, um ihre Gedanken zu sortieren und schließlich zu entscheiden, ob sie sich melden. Dies scheint besonders problematisch für schüchterne SuS zu sein, die vielleicht gute Ideen haben, aber zögern, sich zu beteiligen. „Think-Pair-Share“ (TPS) ist eine Lehrmethode aus dem kooperativen Lernen. Dabei denken die Schüler zunächst allein über eine Frage nach (Think-Phase), besprechen sie dann mit einem Lernpartner (Pair-Phase) und melden sich schließlich, um ihre Ideen mit der ganzen Klasse zu teilen (Share-Phase). Damit bietet TPS den SuS die Möglichkeit, ihre Ideen zu überprüfen, zu vertiefen und ihr Vertrauen in die eigene Antwort zu stärken. Deshalb wird von TPS behauptet, dass es die Beteiligung aller, insbesondere aber der schüchternen SuS erhöhen könnte (Coplan & Rudasill, 2016). In einer experimentellen Feldstudie überprüften wir die Forschungsfragen, (a) ob TPS die Meldehäufigkeit von (schüchternen) SuS im Vergleich zu zwei anderen Unterrichtsmethoden erhöht und (b) welche Gründe es für das (Nicht-)Melden gibt. Methode Die Stichprobe bestand aus 393 SuS (M_Alter = 14.36, SD_Alter = 0.60). Schüchternheit wurde mittels Fragebogen erfasst. Anschließend wurden die SuS von der Lehrkraft gefragt, wie bestimmte Faktoren (z.B. Naturkatastrophen) mit dem weltweiten Hunger in Verbindung stehen. Unter Verwendung eines kontrollierten Crossover-Designs durchliefen die SuS schließlich drei Bedingungen: (1) Kontrollbedingung ohne Think- oder Pair-Phase (S-Bedingung), (2) Bedingung mit 1-minütiger Think-Phase (TS-Bedingung) sowie (3) vollständige TPS-Bedingung mit zusätzlicher 2-minütiger Pair-Phase. Zu Beginn jeder Share-Phase wiederholte die Lehrkraft die Frage und wartete 10 Sekunden auf Meldungen. Anschließend wurden die SuS gebeten, einen kurzen Fragebogen zu ihrer Meldung, ihren Motiven für das (Nicht-)Melden und ihrer Zustandsangst auszufüllen. Meldungen und Motive dienten in den Analysen als abhängige Variablen, die Zustandsangst als Mediator, während die experimentelle Bedingung, Schüchternheit und deren Interaktion als unabhängige Variablen fungierten. Mit den eingesammelten Notizen der SuS sowie Beobachtungen konnten wir die Gültigkeit des selbstberichteten Meldens bestätigen. Ergebnisse In den Multilevel-Hauptanalysen zeigten die Kontraste einen signifikanten Unterschied in den Meldungen der TPS- gegenüber der S-Bedingung und keine signifikanten Unterschiede für die anderen Kontraste. Dieses Muster blieb stabil, wenn Schüchternheit in das Modell mit aufgenommen wurde, die Interaktionseffekte mit Schüchternheit wurden jedoch nicht signifikant. Analysen der Motive für das (Nicht-)Melden zeigten, dass schüchterne SuS das Nichtmelden häufiger mit Unsicherheit und der Unlust, im Mittelpunkt stehen zu wollen, begründeten. Eine Multilevel-Mediationsanalyse ergab einen signifikanten indirekten Effekt für TPS, wenn die Bedingung mit TS verglichen wurde, und einen marginalen indirekten Effekt, wenn TPS mit S verglichen wurde, was darauf hindeutet, dass der positive Effekt von TPS auf die Meldungen durch ein geringeres Maß an Zustandsangst vermittelt wird. Diskussion Die Studie zeigt, dass TPS im Vergleich zum traditionellen Unterrichtsansatz, bei dem die Lehrkraft eine Frage stellt und darauf wartet, dass sich die SuS melden und ihre Antwort sagen (S-Bedingung), die Meldehäufigkeit erhöhen kann. Wir fanden diese positive Beziehung nur für TPS und nicht für TS, was nahelegt, dass der Gedankenaustausch mit einem Partner das Vertrauen in die eigenen Antworten und die Bereitschaft, diese mit der Klasse zu teilen, fördern kann. Die Mediationsanalysen deuten darauf hin, dass teilweise auf eine niedrigere Zustandsangst in der TPS-Bedingung zurückgeführt werden kann. Schüchternere SuS scheinen zwar nicht im besonderen Maße, jedoch ähnlich stark von TPS zu profitieren wie weniger schüchterne SuS. Für schüchterne SuS war die soziale Bewertung das Hauptmotiv, warum sie sich nicht meldeten. Paper Session Die Bedeutung von Supervision für emotionales Erleben und langfristige Karriereintention von Nachwuchswissenschaftler:innen Ronja Steinhauser¹, Oliver Dickhäuser¹, Raven Rinas², Martin Daumiller², Markus Dresel², Stefan Janke¹ ¹Universität Mannheim, Deutschland; ²Universität Augsburg, Deutschland Hochschulen sind nicht nur für Studierende, sondern auch für Nachwuchswissenschaftler:innen ein wichtiger Bildungs- und Qualifikationskontext. Während Bildungsprozesse und ‑entscheidungen in dieser Gruppe noch weit weniger beforscht sind, weisen Studien darauf hin, dass viele Nachwuchswissenschaftler:innen im Verlauf ihrer Tätigkeit das Interesse an einer langfristigen wissenschaftlichen Karriere verlieren. Dieser Rückgang der wissenschaftlichen Karriereintention steht nicht nur im Zusammenhang mit Stellenknappheit, sondern auch mit Faktoren wie hohem Stressempfinden im Arbeitskontext (Dorenkamp & Weiß, 2018; Roach & Sauermann, 2017). Um den Verlust von wissenschaftlichem Talent zu minimieren, ist es von Bedeutung, die Wirkmechanismen hinter diesem Phänomen besser zu verstehen. Ein wichtiger kontextueller Einflussfaktor dürfte hierbei die Supervision von Nachwuchswissenschaftler:innen sein (De Clercq et al., 2019; Scaffidi & Berman, 2011). Entsprechend der Selbstbestimmungstheorie zeichnet sich eine wohlbefindensförderliche Supervision insbesondere dadurch aus, dass die psychologischen Grundbedürfnisse nach Autonomie, Kompetenz* und sozialer Eingebundenheit unterstützt werden (Van der Linden et al., 2018). Dabei wird angenommen, dass Autonomieunterstützung (z. B. Einbeziehen in wichtige Entscheidungen), Strukturierung (Förderung von Kompetenzerleben; z. B. Erwartungen deutlich machen) und soziale Unterstützung (z. B. Wertschätzung unabhängig von Leistung) diese Grundbedürfnisse unterstützen und dadurch Wohlbefinden fördern (Larson et al., 2019; Wollast et al., 2023). Bisherige Forschung im Promotionskontext legt insbesondere nahe, dass bedürfnisförderliches Supervisionsverhalten positiv mit Persistenz der Promovierenden assoziiert ist (Van der Linden et al., 2018), wobei dieser Zusammenhang vermutlich zumindest anteilig durch emotionales Erleben vermittelt wird (Wollast et al., 2023). Dabei wurde bisher allerdings Persistenz ausschließlich aus der Perspektive des Promotionsabbruchs und nicht im Sinne einer langfristigen wissenschaftlichen Karriereintention betrachtet. Darüber hinaus gibt es bisher keine Befunde zur differenziellen Bedeutsamkeit verschiedener diskreter Emotionen wie Freude, Ärger oder Angst. Um diese Forschungslücke zu schließen, führten wir eine Online-Umfrage mit 292 Nachwuchswissenschaftler:innen (69.5% Doktorand:innen, 30.5% Postdoktorand:innen, 53% weiblich, M_Alter = 32.0) durch, in der diese unter anderem zur Autonomieunterstützung, Strukturierung und sozialen Unterstützung ihrer Supervisor:innen (Van der Linden et al., 2018), den erlebten Emotionen Freude, Angst und Ärger während ihrer Forschungsarbeit und ihrer langfristigen wissenschaftlichen Karriereintention Auskunft gaben. Zur Beantwortung der Forschungsfrage berechneten wir ein Pfadmodell unter Verwendung einer Maximum-Likelihood-Schätzung mit robusten Standardfehlern. Für Autonomieunterstützung und Strukturierung zeigten sich positive Assoziationen mit Freude. Darüber hinaus zeigten sich nur für Autonomieunterstützung negative Assoziationen mit Ärger und Angst. Für soziale Unterstützung zeigten sich keine bedeutsamen Zusammenhänge. Freude fungierte darüber hinaus als Mediator für den Zusammenhang zwischen Strukturierung und der Absicht, langfristig in der Wissenschaft zu arbeiten. Auch wenn Angst nicht als Mediator fungierte, zeigte sich als Nebenbefund ein positiver Zusammenhang mit der Absicht, langfristig in der Wissenschaft zu arbeiten. Explorative Analysen weisen auf differenzielle Zusammenhangsmuster für Nachwuchswissenschaftler:innen unterschiedlicher Karrierestufen hin, beispielsweise in der Form, dass Autonomiegewährung eine größere Rolle für Postdoktorand:innen als für Doktorand:innen spielt. Die Befunde der Studie stellen die Bedeutung von Supervisor:innen für Wohlbefinden und Karrieregestaltung von Nachwuchswissenschaftler:innen heraus. Insbesondere Autonomieunterstützung und Strukturierung scheinen zu einem positiveren emotionalen Erleben von Nachwuchswissenschaftler:innen zu führen. Die erlebte Freude bei der Arbeit scheint wiederum eine langfristige Karriere in der Wissenschaft attraktiver zu machen. Wie auch in anderen Studien zeigten sich keine Zusammenhänge zwischen sozialer Unterstützung der Supervisor:innen, Emotionen und langfristigen Karriereplänen. Dies deutet darauf hin, dass die soziale Unterstützung in den Hintergrund rückt, wenn Autonomieunterstützung und Strukturierung gegeben sind. Die Ergebnisse unterstreichen, dass bei der Ausbildung von Nachwuchswissenschaftler:innen auch kontextuelle Faktoren, wie Supervision, verstärkt in den Blick genommen werden sollten. Dabei scheint nicht nur die Art der Unterstützung bedeutend zu sein, sondern auch, inwiefern diese auf den aktuellen Betreuungsabschnitt der Nachwuchswissenschaftler:innen und die damit einhergehenden Bedürfnisse abgestimmt ist. Fortbildungsmaßnahmen zu autonomiegewährender und strukturierender Supervision könnten Supervisor:innen dabei unterstützen, qualitativ hochwertige Betreuung zu bieten, die wiederum Wohlbefinden und Persistenz bei jungen Wissenschaftler:innen fördert.
15:20 - 17:00	3-17: Sprachliche und textuelle Merkmale Ort: S16
	Paper Session Komplexitätsanalysen von Lernmaterialien des bilingualen Wirtschaftsunterrichts Luisa Scherzinger, Taiga Brahm, Kordula De Kuthy, Detmar Meurers Eberhard Karls Universität Tübingen, Deutschland Die fortschreitende Globalisierung und die Etablierung von Englisch als Lingua franca machen die Partizipation von Schüler:innen am internationalen Wirtschaftsgeschehen wahrscheinlicher, was allerdings einer frühzeitigen Vorbereitung bedarf. Eine vielversprechende Möglichkeit hierfür stellt Content and Language Integrated Learning im Fach Wirtschaft dar, denn hier werden fachbezogene Inhalte in einer Fremdsprache vermittelt (Coyle et al., 2010) und somit fachliches, sprachliches und kulturelles Lernen miteinander verknüpft (Coyle, 2007). Das Fach Wirtschaft eignet sich aufgrund seiner global ausgerichteten Themenschwerpunkte wie Güter- und Arbeitsmärkte und seiner Multiperspektivität besonders gut und ermöglicht durch die Einbeziehung der Lingua franca zudem ein authentisches handlungs- und aufgabenorientiertes Sprachlernen. Bisher stellt bilingualer Wirtschaftsunterricht jedoch ein Nischenphänomen dar und geht mit einem Mangel an verfügbaren Lernmaterialien einher. Um die erfolgreiche Integration des bilingualen Wirtschaftsunterrichts in Schulen voranzubringen, sind hochwertige Unterrichtsmaterialien unverzichtbar. Insbesondere authentischer, lebensweltlicher (Mehisto, 2012) und verständlicher Sprachinput leicht über dem aktuellen Sprachniveau der Schüler:innen gilt als Schlüssel zum Zweitspracherwerb im bilingualen Unterricht (Krashen, 1996; Vygotsky, 1978). Beispielsweise zeigen bilinguale Programme mit verständlichem Sprachinput gegenüber monolingualen Programmen einen positiven Effekt auf die Englischleistungen der Schüler:innen (McField & McField, 2014). Die Verständlichkeit der Lernmaterialien steht also in direktem Zusammenhang mit dem Lernerfolg der Schüler:innen. Vor diesem Hintergrund und als Orientierungshilfe für die zukünftige Erstellung von bilingualen Materialien untersucht die vorliegende Studie systematisch die Verständlichkeit von englischsprachigen Lernmaterialien für den bilingualen Wirtschaftsunterricht der Sekundarstufe. Da linguistische Komplexitätsmaße ein Indikator für die Entwicklung der Bildungssprache darstellen (Weiss & Meurers, 2019), bilden sie die Grundlage dieser Lernmaterialanalyse. Insbesondere die Variabilität zwischen den Faktoren vorgegebene Klassenstufe, Textarten (redaktionelle, adaptierte und direkt zitierte Texte) sowie mögliche Anpassungsprozesse zitierter Texte sind dabei von Interesse: Unterscheidet sich die Variabilität der sprachlichen Textkomplexität zwischen Lernmaterialien für verschiedene Klassenstufen? Zeigt die Analyse der Lernmaterialien Unterschiede der Textkomplexität in adaptierten, zitierten und redaktionell erstellten Texten auf? Welche sprachlichen Komplexitätsmaße wurden bei der Modifikation von zitierten Texten verändert? Insgesamt wurden 30 Lernmaterialien – von Schulbüchern bis hin zu einzelnen Unterrichtsplänen – für den bilingualen Wirtschaftsunterricht in Deutschland gesammelt und digital in unformatierte reine Texte umgewandelt. Für diese Studie waren lediglich die Einführungstexte, Zusammenfassungen und Arbeitsanleitungen relevant (n = 1529). Auf Basis von in einer anderen Lernmaterialanalyse als aussagekräftig hervorgehobenen Komplexitätsmaßen (Berendes et al., 2018) und mithilfe von explorativen Untersuchungen wurden für jeden Text computergestützte linguistische Komplexitätsanalysen mit der Common Text Analysis Platform (Chen & Meurers, 2016) durchgeführt. Die Ergebnisse wurden wiederum mit RStudio deskriptiv ausgewertet und grafisch mithilfe von Konfidenzintervallen und Violinplots dargestellt. Im Detail wurden oberflächliche Maße wie Satz- und Textlänge, lexikalische Maße zum lexikalischen Reichtum oder syntaktische Komplexitätsmaße beispielsweise zur Anzahl der Nebensätze angewandt. Die Analysen ergaben eine unsystematische Komplexitätsprogression über die Sekundarstufen hinweg, was die kontinuierliche Sprachentwicklung der Schüler:innen erschweren könnte. Zudem wies der lexikalische Reichtum erhebliche Schwankungen auf, sowohl zwischen den Klassenstufen als auch den einzelnen Textsorten. Im Vergleich zu redaktionell erstellten Texten waren die direkt zitierten Texte außerdem durch tendenziell längere Sätze und komplexere Strukturen gekennzeichnet. Zuletzt zeigte sich die Tendenz, bei der Modifikation von zitierten Texten stark zu vereinfachen und zu kürzen, was jedoch nicht zwangsweise vorteilhaft ist für das Textverständnis der Lernenden (Fillmore & Snow, 2003). In Anbetracht des allgemeinen Mangels an Lernmaterialien verdeutlichen diese Ergebnisse, dass bilinguale Wirtschaftslehrkräfte sich nicht auf die Hochwertigkeit der bestehenden Materialien verlassen können und deshalb häufig ihre eigenen Materialien erstellen müssen. Außerdem ist bei der zukünftigen Entwicklung von bilingualen Wirtschaftsmaterialien ein stärkerer Fokus auf Sprachsensibilität zu legen, z.B. durch die Zusammenarbeit von Verlegern, Linguisten und Lehrkräften. Darüber hinaus zeigt unsere Analyse, wie wichtig es ist, bereits in bilingualen Ausbildungsprogrammen Kompetenzen zur Materialgestaltung zu fördern. Paper Session Effekte sprachlicher Merkmale mündlicher Erklärungen auf das Verständnis von Schüler:innen im Deutschunterricht Catharina Tippe¹, Nadine Cruz Neri¹, Poldi Kuhl², Jan Retelsdorf¹ ¹Universität Hamburg, Deutschland; ²Leuphana Universität Lüneburg, Deutschland Theoretischer Hintergrund Mündliche Erklärungen von Lehrkräften sind eine der häufigsten Kommunikationsformen im Unterricht (Behrens, 2022; Berthold, 2012). Sie haben das Ziel, die Schüler:innen beim Wissensaufbau zu unterstützen und ein Verständnis für fachliche Inhalte zu erzeugen (Leinhardt, 2001). Anspruchsvolle basale Verstehensprozesse bei der Textverarbeitung beanspruchen kognitive Ressourcen (Kintsch, 1988). Daraus kann mentale Erschöpfung resultieren (Hockey, 2013), deren Effekte im Zusammenhang mit der Motivation stehen (Herlambang et al., 2021). Diese motivationalen Aspekte können das Textverständnis beeinflussen (Cruz Neri et al., 2023). Die Sprache ist das zentrale Medium mündlicher Erklärungen. Bei der Rezeption müssen Lernende ein Situationsmodell (Kintsch, 1988) entwickeln und sich hierfür mit der sprachlichen Gestaltung durch die erklärende Lehrkraft auseinandersetzen. Es ist jedoch bekannt, dass die sprachliche Gestaltung von Texten, zu denen auch mündliche Erklärungen zählen (Clinton-Lisell, 2022; Stephany, 2018), das Verständnis der Schüler:innen beeinflussen kann (Cruz Neri & Retelsdorf, 2022). Bestimmte Textmerkmale, wie z. B. lokale Kohäsionsmittel, sind förderlich für die kognitiven Prozesse des Textverstehens (McNamara et al., 2011; Ozuru et al., 2009). Trotz der zentralen Bedeutung mündlicher Erklärungen für den unterrichtlichen Kontext liegen kaum Erkenntnisse zur sprachlichen Gestaltung durch Lehrkräfte und Effekte auf das Verständnis der Schüler:innen vor. Eine Ausnahme hiervon bildet die Studie von Schmitz et al. (2023), die den Einfluss der globalen Kohäsion auf das Hörverstehen anhand informativer Hörtexte untersuchte und nachwies, dass globale Kohäsionsmittel das Hörverstehen fördern. Fragestellung In der vorliegenden Studie soll untersucht werden, (1) ob sprachliche Merkmale mündlicher Erklärungen von Lehrkräften Effekte auf das Verständnis von Schüler:innen haben. Zudem wird geprüft, (2) inwieweit motivationale Aspekte diesen Effekt mediieren. Methoden Es wurden zwei videografierte Erklärungen mit gleichem Inhalt, aber unterschiedlichen sprachlichen Merkmalen, erstellt: Eine sprachlich einfache und eine sprachlich schwierigere Erklärungsvariante. Als Erklärungsgegenstand diente eine Thematik aus dem Deutschunterricht. Es wurden fünf sprachliche Merkmale fokussiert, die als Indikatoren für sprachliche Komplexität gelten (White, 2012). Jeweils eine videografierte Erklärungsvariante (einfach/schwierig; randomisierte Zuweisung) wurden von N = 102 Schüler:innen der achten und neunten Jahrgangsstufe zweier Gymnasien betrachtet. Nach dem Anschauen des Videos wurde die Motivation erhoben (2 Items, a = .62). Das Verständnis des Inhalts der Erklärung wurde durch einen Test überprüft (16 Items, max. 24 Punkte, a = .76). Um zu prüfen, ob die sprachliche Gestaltung Effekte auf das Verständnis der Schüler:innen hat und inwieweit die Motivation diesen Zusammenhang mediiert, wurde eine Mediationsanalyse berechnet. Die sprachliche Gestaltung diente als unabhängige Variable, die Leistung im Verständnistest als abhängige Variable und die Motivation als Mediator. Ausgewählte Ergebnisse und Diskussion Bezogen auf die erste Forschungsfrage zeigte sich, dass die einfache sprachliche Gestaltung zu signifikant höheren Ergebnissen im Verständnistest führte, β = -0.47, t (99) = -2.39, p = .019. Schüler:innen mit der einfachen Erklärungsvariante erzielten im Verständnistest durchschnittlich 2.3 Punkte mehr (n = 51, M = 15.18, SD = 3.77) als Schüler:innen mit der schwierigen Erklärungsvariante (n = 51, M = 12.88, SD = 5.58). Bei zusätzlicher Aufnahme des Mediators Motivation in das Modell zur Beantwortung der zweiten Forschungsfrage wurde der Mediator von der sprachlichen Gestaltung signifikant negativ vorhergesagt, β = -0.57, t (99) = -2.95, p = .004. Dagegen wurde die Leistung der Schüler:innen im Verständnistest durch die Motivation nicht signifikant vorhergesagt, β = 0.13, t (99) = 1.09, p = .277. Die Wirkung der sprachlichen Gestaltung auf die Leistung wird folglich nicht durch die Motivation mediiert. Insgesamt zeigt sich, dass die sprachliche Gestaltung das Verständnis und die Motivation der Schüler:innen beeinflusst. Die Befunde legen nahe, dass Lehrkräfte die sprachliche Komplexität von mündlichen Erklärungen stärker berücksichtigen sollten. Für die Entwicklung von mündlichen Erklärungen bedeutet das, schwierigkeitsgenerierende sprachliche Mittel zu beachten. Dadurch können Lernende beim Verständnis mündlicher Erklärungen und der Bildung eines kohärenten Situationsmodells (Kintsch, 1988) unterstützt werden. Paper Session What you see is what you get? Wie Aufmerksamkeit den Einfluss von Texteigenschaften auf die Textbeurteilung beeinflusst Yves Furer¹, Steffen Gottschling², Birgit Brucker³, Anna-Katharina Praetorius⁴ ¹Pädagogische Hochschule Zürich; ²Hochschule der Medien Stuttgart; ³Leibniz-Institut für Wissensmedien Tübingen; ⁴Universität Zürich Theoretischer Hintergrund und Fragestellung Schreiben stellt eine komplexe Fähigkeit dar, wobei wichtige Teilkomponenten im Laufe der Primarschule erworben werden (Hayes, 2012). Während am Schulbeginn hierarchieniedrige Komponenten wie Handschrift und Rechtschreibung im Fokus stehen (Kim & Park, 2019), wird die Bedeutung von hierarchiehöheren Komponenten wie Kohärenzbildung und Adressatenorientierung erst nach einigen Jahren grösser (Limpo, Alves & Fidalgo, 2014). Idealerweise unterstützen Lehrer:innen diesen Prozess. Um jedoch gezielt Unterstützungsmassnahmen auswählen zu können, müssen Lehrer:innen in der Lage sein, hierarchiehöhere und -niedrige Fähigkeiten ihrer Schüler:innen akkurat zu erfassen. Verschiedene Ergebnisse (Graham, Harris & Hebert, 2011; Jansen, Vögelin, Machts, Keller & Möller, 2021) deuten allerdings darauf hin, dass hierarchieniedrige Fähigkeiten wie Rechtschreibung die Beurteilung von hierarchiehohen wie Kohärenz beeinflussen. Bislang fehlen jedoch Erklärungsansätze, wieso diese Verzerrungen auftreten. Eine mögliche Erklärung könnte sein, dass Lehrer:innen bei der Verarbeitung von diagnostischen Informationen aus Texten einfach verfügbare und weniger komplexe hierarchieniedrige cues gegenüber hierarchiehohen bevorzugen, indem sie ihnen mehr Aufmerksamkeit schenken (Tversky & Kahneman, 1974). Orthographiefehler erfordern weniger Aufmerksamkeit beim Beurteilen, weil sie sich auf der Textoberfläche (Coltheart, Rastle, Perry, Langdon & Ziegler, 2001) wahrnehmen lassen. Hingegen erfordern hierarchiehöhere cues für beispielsweise Kohärenz den Aufbau eines vertiefteren Textverständnisses. Inwiefern diese Annahmen zutreffen, wurde bislang empirisch noch nicht untersucht. Die vorliegende Studie untersucht deshalb, ob: das Urteil über Texte durch experimentell manipulierte cues beeinflusst werden kann und die Aufmerksamkeit für diese hierarchiehohe- bzw. niedrige cues in einem Zusammenhang zu diesen Urteilen steht. Methode Um diese Fragestellungen zu beantworten, wurden Lehramtstudierenden (N = 58) jeweils acht verschiedene Schülertexte zur Beurteilung vorgelegt. Sie wurden gebeten jene Stellen im Text zu markieren, welche die Schüler:innen nochmals überarbeiten sollten. Dabei sollten die Lehramtstudierenden besonders auf Kohärenz und Wortschatz (hierarchiehoch) und die Rechtschreibung (hierarchieniedrig) achten. Im Anschluss an das Markieren gaben sie ein Urteil zum Text in Form einer Ziffernote (AV 1) ab. Während dem Beurteilen wurde mittels Eyetracking erfasst, wie lange sie cues für hierarchiehohe und niedrige Fähigkeiten (AV 2) fixierten. Basierend auf Beach und McConnel (2019) wurde davon ausgegangen, dass die Fixationsdauern sich als Aufmerksamkeit für bestimmte cues interpretieren lassen. Die ursprünglich authentischen Schülertexte wurden an sechs bzw. acht Stellen gezielt im Hinblick auf hierarchiehohe und niedrige cues (UV) manipuliert, um vier verschiedene Experimentalbedingungen zu erzeugen. Daraus resultiert ein 2x2 Within-Design, in dem cues entweder positiv oder negativ ausgeprägt waren. Hierarchieniedrige cues beinhalteten entweder einen deutlichen Rechtschreibfehler oder waren korrekt geschrieben. Hierarchiehohe cues wurden in Bezug auf Kohärenz und Wortschatz manipuliert. Beispielsweise erlaubte ein Pronomen entweder eine anaphorische Referenz oder erzeugte ein Kohärenzbruch. Beim Wortschatz unterstützte ein Wort entweder die Funktion des Textes oder es war eher unpassend und allgemein. Ergebnisse und Diskussion Varianzanalysen mit Messwiederholung zeigten einen Haupteffekt der Ausprägung der hierarchniedrigen cues (Orthographiefehler) auf die Beurteilung (F(1, 57) = 21.57, p < .001, η_p² = .275). Jedoch hatte die Ausprägung der hierarchiehohen cues keinen Einfluss auf die Beurteilung der Texte. Für die Aufmerksamkeit zeigen sich ähnliche Ergebnisse. Nur die negativen hierarchieniedrigen Merkmale wurden signifikant länger betrachtet als die anderen cues (F(1,57) = 52.978, p > .001, η_p² = .482). Die Ergebnisse bestätigen den Einfluss von salienten Textmerkmalen wie Orthographiefehler auf die Beurteilung von Texten (Graham et al., 2011). Zusätzlich konnte zeigt werden, dass bei diesen hierarchieniedrigen cue Beurteilung und Aufmerksamkeit zusammenhängen. Jedoch wurden hierarchiehöhere cues wohl von den Lehramtsstudierenden gar nicht als solche erkannt. Gleichzeitig stellen sich methodische Fragen. Stärker redigierte Schülertexte würden eine strengere Kontrolle der Stimuli erlauben und damit vielleicht klarere Resultate hervorbringen. Allerdings erhöht sich dadurch die Gefahr Artefakte zu produzieren, da sich die ökologische Validität reduziert (Wineburg, Breakstone, McGrew, Smith & Ortega, 2022). Paper Session It’s not just Text: The Combination of Typographic Design and a Narrative Frame are Essential to Improve Learning from Text Juliette C. Désiron¹, Tino Endres², Charlotte Vössing², Lukas Beck³, Erik Spiekermann², Alexander Renkl⁴ ¹University of Zurich, Zurich, Switzerland; ²University of Freiburg, Germany; ³Bauhaus-University Weimar, Germany; ⁴University of the Arts Bremen, Germany Theoretical background. Despite advancements in digitalization, schools often depend on written texts for learning. Particularly with complex content, the texts can be lengthy, prolonging the time students require to comprehend those texts. Maintaining attention during these extended periods is a significant challenge for learners (Inzlicht & Schmeichel, 2012). Consequently, teachers might wonder how to aid their students in this difficult endeavour. One promising approach seems to lie in increasing the situational interest that learners experience during the learning (Renninger & Hidi, 2022). Indeed, enhanced situational interest has been linked to sustained learning gains (Wong & Adesope, 2021). Following that argumentation, teachers face the challenge of elevating situational interest when using written texts. Research in emotional design identifies two key components that might help with this endeavour: the material must be visually appealing to trigger situational interest and must convey the value of the content to maintain situational interest (Endres et al., 2020). The visual attractiveness of texts is largely determined by their typographical characteristics (Spiekermann, 2022). Therefore, a text designed with engaging typography should trigger students' situational interest for the material. To maintain situational interest, narratives including a social agent have been demonstrated to convey value and support sustained learning (Schneider et al., 2023). Research question. The present study aimed to merge insights from typographical design and emotional design research. We expect text design and content frame to interact in their influence on learning over time. The combination of typographical design and narrative frame should lead to the best learning outcome, especially in sustained learning. Further, we expect that typographical design triggers situational interest and that a narrative frame maintains that interest, resulting in higher sustained learning (moderated-mediation analysis). Methods. We implemented a 2x2x2 experimental design: text design (neutral vs. typographic, between-subjects), content frame (expository vs. narrative, between-subjects), and learning phase (initial vs. sustained, within-subjects). Data from 132 students (54% female, M_age=16.04 years) were analyzed. Neutral texts employed 12-points Time New Roman with 1-point spacing, while typographic text utilized a distinct layout using the Garamont font family. Expository frame presented examples neutrally, whereas narrative frame linked examples to a social agent. All four texts had comparable length and readability (Flesch: 50,52,50,52). Students were randomly assigned to read one of four texts (30 minutes). Post-reading, participants were assessed for triggered (α=.725) and maintained situational interest (α=.839), and responded to retention and comprehension questions on initial and sustained learning phase separately (for all subscales McDonald´s ω ≥.50). 25% of data was coded by a second rater revealing good interrater reliability (ICCs >.90). Results. The mixed ANOVA showed an interaction between text design and content frame, F(2,127)=3.71, p=.027, ƞ_p²=.05. The combination of typographical design and narrative frame produced the highest learning outcomes for both retention and comprehension. The learning phase did not impact this interaction, F(2,127)=2.00, p=.438. Mediation analyses did not support the moderated-mediation analysis of typographical design increasing triggered situational interest, indirect effect =0.16, CI⁹⁵[-0.27, 0.67]. However, the combined condition of typographical design and narrative frame elevated triggered situational interest, which in turn increased maintained situational interest and finally benefited sustained comprehension and retention in a sequential mediation analysis, indirect effect =1.69, CI⁹⁵[.23, 3.54]. Discussion. This study demonstrated the positive impact of merging typographical design and narrative frame during learning from text. Both elements were essential to trigger and maintain situational interest. Contrary to our expectations, the benefit was not limited to sustained learning but extended to initial learning as well. The findings underscore the significance of typographically well-designed learning materials. Educators should prioritize professional materials and incorporate narratives to facilitate learning.
15:20 - 17:00	3-18: Multimethodische Perspektiven auf Studienwahl und Studiumsverläufe Ort: S22
	Paper Session Wo braucht es Orientierung? - Eine gesamtheitliche Kategorisierung der Orientierungsbedarfe von Schülerinnen bei der Berufs- und Studienwahl Tillmann Woller, Stefan Janke, Karina Karst Universität Mannheim, Deutschland Der Anteil an Schülerinnen in gymnasialen Oberstufen steigt (Autorengruppe Bildungsberichterstattung, 2018). Schülerinnen die mit ihrem Schulabschluss eine (Fach-) Hochschulzugangsberechtigung erwerben, stehen eine Vielzahl von Bildungswegen offen. Zentrale Stellen betonen in Anbetracht der schwer überschaubaren Auswahlmöglichkeiten, dass der Orientierungsprozess „bedarfsgerecht begleitet werden“ solle (KMK, 2017). Zahlreiche Forschungsarbeiten (Henderich 2005, Zoyke 2012, Hirschi 2013, Zoyke 2017) unterstreichen die Wichtigkeit einer Individualisierung des Studien- und Berufsorientierungsprozesses, im Sinne einer Ausrichtung nach den Bedarfen der einzelnen Schülerinnen. Die Herausforderung besteht entsprechend darin Prozeduren zu entwickeln, die beratende Personen dabei unterstützen, individuelle Bedarfe von Schülerinnen präzise diagnostizieren zu können. Daran anknüpfend zielt diese Untersuchung darauf ab, die Gesamtheit möglicher Orientierungsbedarfe sowohl zu erfassen als auch zu kategorisieren. Mit Hilfe des dadurch generierten Überblickswissens sollen beratende Personen Schülerinnen besser in ihrem Orientierungsprozess unterstützen können. Die zentrale Forschungsfrage lautet: Was sind die Bedarfe von Schülerinnen während des Berufs- und Studienorientierungsprozesses und wie lassen sie sich zum Einsatz in der Orientierungspraxis kategorisieren? Methodisch folgten wir den Grundprinzipien der Grounded Theory, um einen umfassenden Blick auf das Phänomen der Orientierungsbedarfe zu gewinnen (Corbin & Strauss, 2015). Da zu erwarten ist, dass Schülerinnen selbst ein eher eingeschränktes Verständnis von einem optimalen Orientierungsprozess haben, werden die Beratungsbedarfe aus Sicht von Expertinnen für Studien- und Berufsberatung analysiert. Hierzu wurden leitfadenbasierte, semi-strukturierte Expertinneninterviews geführt. Gemäß des Prinzips des theoretical sampling (Corbin & Strauss, 2015) wurden 21 Akteure identifiziert, welche die Orientierungslandschaft für Schülerinnen mit dem Abschlussziel Hochschulzugangsberechtigung möglichst umfassend abbilden, und schließlich befragt. Es wurden Interviews mit sechs BO-Lehrkräften, drei Berufsberaterinnen der Bundesagentur für Arbeit, zwei Akteuren von Kammern, jeweils einem Mitglied von Schule-Wirtschaft Baden-Württemberg und der G.b.R. BoriS, einer Verwaltungsangestellten, die kommunal den Übergang Schule-Beruf organisiert sowie sieben Studienberaterinnen unterschiedlicher Hochschularten zwischen März und September 2023 durchgeführt. Jedes Interview wurde in einer Audiodatei aufgezeichnet (durchschnittlich 41:31 Minuten) und anschließend transkribiert (Dresing & Pehl, 2020). Die Interviewtranskripte bilden einen Datenkorpus, welcher mittels einer typenbildenden qualitativen Inhaltsanalyse (Kuckartz & Rädiker, 2020) in MAXQDA ausgewertet wurde. Die von den Interviewpartnerinnen benannten Bedarfe wurden in vier Dimensionen kategorisiert. (1) Die erste Dimension lautet Selbst- und Sozialbedarfe, welche die Subkategorien Selbstreflexion, Entscheidungsprozessbedarfe und Persistenzbedarfe umfasst. Ein Selbstreflexionsbedarf ist beispielsweise, seine eigenen Interessen zu kennen. Mit einem Unsicherheitsgefühl umgehen zu können, ist ein Entscheidungsprozessbedarf. Als Persistenzbedarf gilt z.B., dass sich Schülerinnen an Regeln halten können sollten. (2) Die zweite Dimension sind Informationsbedarfe, welche einerseits Wissen über die Recherche und Ausgestaltung von Orientierungsangeboten und andererseits über potenzielle Bildungsgangsoptionen beinhaltet. Ein Bedarf der Subkategorie Wissen über Orientierungsangebote ist beispielsweise, Webseiten zu kennen, über die man Studiengänge finden kann. Die Entscheidung, ob man eine Ausbildung oder ein Studium beginnen möchte, ist ein Bildungsgangsoptionsbedarf. (3) Die dritte Dimension beinhaltet Bedarfe nach studien- und berufspraktischem Wissen, wie etwa den beruflichen Alltag eines potenziellen Zielberufs kennen zu lernen. (4) Dimension vier sind Übergangsorganisationsbedarfe, welche die drei Subkategorien finanzielle Planung, Organisation des Wohnorts und das Bewerbungsverfahren für den weiterführenden Bildungsgang enthalten. Ein finanzieller Planungsbedarf ist z.B. die Beantragung eines Studienkredits. Zur Organisation des Wohnorts kann der Bedarf bestehen, einen Studentenwohnheimsplatz zu beantragen. Für die Organisation des Bewerbungsverfahrens sollten die Bewerbungsfristen bekannt sein. Abschließend werden Bezüge der explorierten Bedarfe zu gängigen Theorien zur Berufs- und Studienwahl sowie zu Konstrukten, wie Berufswahlbereitschaft (Ratschinski, 2014) oder Berufswahlkompetenz (Driesel-Lange et al., 2010) diskutiert. Um die Bedarfe in den orientierungspraktischen Kontext transferieren zu können, wurde zu jedem Bedarf ein entsprechendes Lernziel formuliert. Zusätzlich wurden alle Bedarfe mittels zweier Merkmale typologisiert: erstens der Bedarfsdimension und entsprechender Subkategorien und zweitens anhand des Anforderungsbereichs des aus dem Bedarf abgeleiteten Lernziels. Die daraus gewonnene Typologisierung der Bedarfe wird auf der GEBF vorgestellt und deren theoretische sowie Orientierungspraktische Implikationen sollen erörtert werden. Paper Session Erfahrungen und Strategien von Erstakademikerinnen im Studium – Wirkung und Effektivität von Förderprogrammen Lea Raczkowski, Tina Seufert Universität Ulm / Institut für Psychologie und Pädagogik, Deutschland Herkunftsspezifische Disparitäten beim Übergang in die Hochschule und innerhalb der akademischen Ausbildung sind bereits umfassend erforscht (vgl. z. B. Buchholz et al. 2022; Lörz et al. 2015). Kinder aus Nichtakademikerfamilien besuchen seltener ein Gymnasium, erwerben seltener die Hochschulreife (vgl. Autorinnengruppe Bildungsberichterstattung 2022, S. 203) und nehmen weniger häufig ein Hochschulstudium auf (vgl. Quast et al. 2023). Auch im weiteren Verlauf der Hochschulausbildung sind Erstakademikerinnen unterrepräsentiert (vgl. Stifterverband für die Deutsche Wissenschaft & McKinsey & Company 2022, S. 13). Die Gruppe der Erstakademikerinnen setzt sich aus unterschiedlichen Milieus zusammen, die divergierende Lebensführungen und Erfahrungen aufweisen (vgl. Lange-Vester 2020, S. 398). Alle eint jedoch ihre soziale Herkunft außerhalb des akademischen Feldes mit seinen distinktiven Habitus-Mustern (vgl. ebd.). Zumeist erleben Erstakademikerinnen ein Gefühl von Fremdheit und zweifeln an ihrer Zugehörigkeit zum akademischen Umfeld (vgl. ebd.; vgl. Hild 2019). Eine Studie zur Effektivität von NRW-Talentscouting zeigt, dass beratungsintensive Förderangebote zur Verringerung sozialer Bildungsungleichheit beitragen können (vgl. Erdmann et al. 2022a, 2022b). Jedoch fehlen bislang flächendeckende Erkenntnisse zur Wirksamkeit solcher Angebote. Ziel dieser Arbeit ist es, die Erfahrungen und Umgangsweisen von Erstakademikerinnen im Hochschulstudium zu ermitteln und die Effektivität von Förderprogrammen am Beispiel des Vereins First Generation Aachen e.V.* zu prüfen. Dieses dient den Geförderten als Hilfestellung im Umgang mit ihren Herausforderungen im Studium und setzt sich aus Mentoring und Workshops zusammen. Für diese Arbeit wurden fünf Geförderte, drei Mentorinnen und zwei Coaches in Form von problemzentrierten Interviews* (Witzel 2000) befragt. Die Auswertung der Interviewdaten erfolgte in Anlehnung an die inhaltlich strukturierende qualitative Inhaltsanalyse nach Kuckartz (2018). Nach der Durchsicht aller verschriftlichten Interviewdaten schloss die initiierende Textarbeit sowie das Verfassen der Fallzusammenfassungen an. Anschließend erfolgte die erste Kodierung des gesamten Materials anhand der thematischen Hauptkategorien, die sich aus den Themen der Interviewleitfäden ergaben. Nach der ersten Kodierung wurden alle kodierten Textstellen erneut gesichtet und in Subkategorien ausdifferenziert. Anschließend erhielt jede identifizierte Kategorie eine Kategoriendefinition und wurde zu einem Kategoriensystem zusammengefasst. Im Sinne Kuckartz (2018) erfolgte anschließend ein erneuter Kodierprozess mithilfe des ausdifferenzierten Kategoriensystems (vgl. ebd., S. 100). Nach Abschluss aller Kodierphasen wurden fallbezogene thematische Zusammenfassungen der Subkategorien innerhalb der Hauptkategorien vorgenommen. Diese dienten als Grundlage für die weitere kategorienbasierte Auswertung entlang der Hauptkategorien (vgl. ebd., S. 118). Hierzu wurden alle Subkategorien der jeweiligen Hauptkategorien deskriptiv und vergleichend dargelegt und mit prototypischen Zitaten aus den Transkripten untermauert (vgl. ebd., S. 118–119). Die Ergebnisse zeigen, dass die Herausforderungen und Strategien von Erstakademikerinnen vielfältig sind. Die genannten Hürden reichen von Schwierigkeiten, die primär die innere Verfassung wie Emotionen, intrinsische Motivation* oder Selbstregulation betreffen, bis hin zu ebenjenen, die eng mit mangelnden Ressourcen und äußeren Faktoren verbunden sind. Einige der Herausforderungen weisen eine enge Verknüpfung auf und beeinflussen sich wechselseitig. So wird der nicht mit den Eltern geteilte Erfahrungsraum Studium als Ursprung weiterer Herausforderungen beschrieben. Insbesondere Strategien im Zusammenhang mit sozialen Kontakten werden häufig genannt. Hierbei spielt die Unterstützung des Vereins eine wichtige Rolle. Die übergeordnete Herausforderung scheint dabei das Anerkennen der eigenen Identität als Erstakademikerin zu sein. Das neugewonnene studentische Selbstverständnis und das Bewusstsein der Benachteiligung aufgrund der sozialen Herkunft ist dabei Treiber eines inneren Konfliktes der Zugehörigkeit. Dies kann als Habitus-Struktur-Konflikt beschrieben werden, der seinerseits die Umgangsweisen mit den erlebten Herausforderungen prägt (vgl. Schmitt 2010). Da sich soziale Ungleichheit jedoch über die alltäglichen Wahrnehmungs-, Denk- und Handlungsmuster etabliert (vgl. Hild 2019, S. 427) ist das Konzept des Vereins, tief verwurzelte Glaubenssätze aufzulösen und die Bestärkung der Studierenden in den Fokus zu rücken, besonders sinnvoll. Solche Unterstützungsangebote, stellen einen Raum der Ermutigung dar, ohne die aus frühen Bildungsetappen verankerten Benachteiligungen auszuklammern. Darüber hinaus hilft die Förderung den Studierenden dabei Spannungsverhältnisse zwischen ihrem ‚bestehenden‘ und ‚neuen‘ Habitus auszuhalten. Paper Session Eltern- und Lehrpersonerwartungen sowie Leistungen und Anstrengungs-bereitschaft von Jugendlichen als Determinanten von intergenerationaler Bildungsmobilität Markus P. Neuenschwander, Lukas Ramseier, Ariana Garrote Pädagogische Hochschule FHNW, Schweiz Theoretischer Hintergrund* In stratifizierten Ländern wie der Schweiz erreichen die meisten Jugendlichen den gleichen Bildungsabschluss wie ihre Eltern (Bauer & Riphahn, 2007; Blossfeld et al., 2016). Biografiestudien zeigten, dass neben Leistungen und Anstrengungsbereitschaft hohe Leistungserwartungen von Eltern und Lehrpersonen zur Erklärung der intergenerationalen Bildungsmobilität (d.h. Bildungsaufstieg und -abstieg) wichtig sind (Kellmer, 2015; Spiegler, 2018). Als Bildungsaufstieg wird definiert, wenn die Jugendlichen einen höheren Sek II-Abschluss als ihre Eltern erreicht haben. Ein Bildungsabstieg meint, dass sie einen tieferen Sek II-Abschluss als ihre Eltern erreicht haben. Die Häufigkeit von intergenerationaler Bildungsmobilität zeigt, wie sehr Herkunftseffekte auf Bildungsabschlüsse korrigiert werden können. Im Schweizer Bildungssystem werden Jugendliche nach der Sekundarstufe I aufgrund ihrer Leistungen und Anstrengungsbereitschaft in eine allgemeinbildende Schule oder Berufsbildung zugewiesen. Die Durchlässigkeit zwischen diesen beiden Bildungskanälen ist gering (Babel & Lagana, 2016). Daher sind Leistungen und Anstrengungsbereitschaft in der Sekundarstufe I für den Sek II-Abschluss zentral. Studien zu selbsterfüllenden Prophezeiungen zeigen, dass hohe Leistungserwartungen von Eltern und Lehrpersonen die Leistungen und Anstrengungsbereitschaft von Jugendlichen erhöhen (Wang et al., 2018; Urhahne & Wijnia, 2021). Leistungserwartungen von Eltern und Lehrpersonen könnten daher indirekt über die Leistungen und Anstrengungsbereitschaft der Jugendlichen einen Bildungsaufstieg bzw. Bildungsabstieg vorhersagen. Allerdings gibt es keine Längsschnittstudien, welche den Effekt von Leistungserwartungen von Eltern und Lehrpersonen zu Beginn der Sekundarstufe I auf die Wahrscheinlichkeit eines Bildungsaufstiegs und Bildungsabstiegs geprüft haben. Entsprechende Evidenzen könnten pädagogische Strategien begründen, um die Wahrscheinlichkeit von intergenerationaler Mobilität zu beeinflussen (Buchmann et al., 2020). Fragestellung Wie sehr sagen Leistungserwartungen von Lehrpersonen und Eltern im 7. Schuljahr die Wahrscheinlichkeit von Bildungsaufstiegen und Bildungsabstiegen vorher? Werden diese Effekte durch die Leistungen der Jugendlichen in Deutsch und Mathematik sowie ihre Anstrengungsbereitschaft mediiert? Methode Die Fragen wurden mit Längsschnittdaten der Schweizer WiSel-Studie bearbeitet. Lehrpersonen und Eltern füllten im 7. Schuljahr und Jugendliche im 9. Schuljahr einen Fragebogen aus. Ausgewertet wurden die Daten von allen Jugendlichen, die im 9. Schuljahr an der Studie teilnahmen (N=2376, weiblich =46.5%, Durchschnittsalter im 9. Schuljahr: 15.49 Jahre). Leistungserwartungen der Eltern am Ende des 7. Schuljahres: Die Eltern schätzten mit je 3 Items ihre Erwartungen für Deutsch und Mathematik reliabel ein. Die Elternangaben zu ihren höchsten Bildungsabschlüssen wurden gruppiert: (1) Mittelschulabschluss, (2), Berufsbildungsabschluss, (3) ohne Sek II-Abschluss. Leistungserwartungen der Lehrpersonen im 7. Schuljahr: Lehrpersonen gaben ihre Erwartung an die Leistungen der Jugendlichen in Deutsch und Mathematik mit je einem Item an. Die Leistungen der Jugendlichen in Deutsch und Mathematik im 7. Schuljahr wurden mit standardisierten reliablen Leistungstests erfasst und mit IRT analysiert (Moser et al., 2011). Anstrengungsbereitschaft: Die Jugendlichen schätzten ihre Anstrengungsbereitschaft im 9. Schuljahr mit 4 Items in Anlehnung an Schmidt et al. (1998) ein (α = .89). Den Fragebogendaten konnten die Bildungsabschlüsse der Jugendlichen fünf Jahre nach dem 9. Schuljahr aus amtlichen Strukturdaten zugeordnet werden: (1) Mittelschulabschluss, (2) Berufsbildungsabschluss, (3) ohne Sek II-Abschluss. Die fehlenden Werte waren zufällig verteilt und wurden mit der FIML-Prozedur in Mplus 8 bearbeitet. Geschlecht, Staatsangehörigkeit und die Persönlichkeitseigenschaft Gewissenhaftigkeit wurden kontrolliert. Ergebnisse Strukturgleichungsmodelle mit guter Modellpassung zeigen, dass die Wahrscheinlichkeit eines Bildungsaufstiegs durch Anstrengungsbereitschaft und Leistungen signifikant erklärt werden kann. Indirekte Effekte der Lehrpersonenerwartungen und der Elternerwartungen im 7. Schuljahr auf die Wahrscheinlichkeit eines Bildungsabstiegs waren signifikant. Das Modell zum Bildungsabstieg zeigte eine gute Modellpassung. Tiefe Anstrengungsbereitschaft und tiefe Leistungen sagten die Wahrscheinlichkeit eines Bildungsabstiegs signifikant vorher. Elternerwartungen und Lehrpersonenerwartungen sagten den Bildungsabstieg indirekt signifikant vorher. Die Ergebnisse zeigen erstmals, dass hohe Bildungserwartungen von Eltern und Lehrpersonen an Jugendliche im 7. Schuljahr indirekt einen Bildungsaufstieg bzw. Bildungsabstieg 7 Jahre später vorhersagen. Die Effekte werden durch Leistungen und Anstrengungsbereitschaft vollständig mediiert. Die Befunde sind im Hinblick auf Massnahmen zur Erhöhung intergenerationaler Bildungsmobilität relevant. Paper Session Organisationales Commitment zum Ausbildungsbetrieb und Studienabbruch im dualen Studium – eine Ereignisanalyse Wild Steffen¹, Sebastian Rahn², Meyer Thomas³ ¹Technische Universität Dortmund, Deutschland; ²htw saar, Deutschland; ³Duale Hochschule Baden-Württemberg Stuttgart, Deutschland Theoretischer Hintergrund Der Einfluss von den Ausbildungsstätten auf den Studienabbruch im dualen Studium, etwa vor dem Hintergrund der vielen Praxisphasen bei den Ausbildungsstätten, ist gering erforscht und theoretisch wenig elaboriert (Nickel et al., 2022). Erste Erklärungsansätze können sowohl aus der Hochschulforschung wie Bäulke et al. (2021), Heublein (2014) oder Tinto (1975) als auch aus der Berufsbildungsforschung wie Krötz und Deutscher (2022) herangezogen werden. In diesem Kontext stellt sich die Frage, welche Rolle die Verbundenheit, Zugehörigkeit und Identifikation mit einer Ausbildungsstätte für den Studienabbruch spielt. Angesichts der Argumentation von van Dick (2017) und Felfe (2020), dass bei höherem Commitment Freiräume für Engagement im Unternehmen besser genutzt werden oder Veränderungen sowie neue Entwicklungen eher akzeptiert werden, ist es verwunderlich, dass Commitment bisher in diesem Kontext ein Schattendasein fristet. Der Side-Bets-Ansatz von Becker (1960) stellt rationale Kosten-Nutzen-Abwägungen in den Mittelpunkt der Commitmentforschung, während Mowday et al. (1982) die emotionale Komponente betonen. Meyer und Allen (1991) haben diese Ansätze zum Modell des organisationalem Commitments weiterentwickelt, das die drei Dimensionen des affektiven Commitments („wollen“), kalkulatorischen Commitments („müssen“) und normativen Commitments („sollen“) umfasst (Voigt & Jöns, 2006). Empirische Ergebnisse von Meyer et al. (2002) zeigen in einer Metaanalyse auf, dass der Zusammenhang zwischen affektivem Commitment und Leistungsergebnissen höher ist als bei den beiden anderen Komponenten des Commitments. Weitere Metaanalysen zeigen einen positiven Zusammenhang zwischen dem organisationalen Commitment und Wohlbefinden bei der Arbeit (Kleine et al., 2019) sowie mit der Tätigkeit einer sinnvollen Arbeit (Allan et al., 2019). Fragestellung Das Risiko des Studienabbruchs ist im ersten Studienjahr am höchsten (Chen, 2012). Allerdings sind relevante Indikatoren von Seiten der Ausbildungsstätten im dualen Studium gering erforscht. Vor dem Hintergrund des bisherigen Forschungsstandes stellt sich daher die Frage, welchen Einfluss das organisationale Commitment im ersten Studienjahr auf den Studienabbruch hat. Im Einzelnen werden folgende Hypothesen untersucht H1: Je höher das affektive Commitment ist, umso geringer ist das Risiko eines Studienabbruch bei einem Studierenden. H2: Je höher das kalkulatorische Commitment ist, umso geringer ist das Risiko eines Studienabbruch bei einem Studierenden. H3: Je höher das normative Commitment ist, umso geringer ist das Risiko eines Studienabbruch bei einem Studierenden. Methode Wir verwendeten die erhobene Daten der vierten Panelwelle des Forschungsprojekts „Studienverlauf – Weichenstellungen, Erfolgskriterien und Hürden im Verlauf des Studiums an der DHBW“ (Deuer & Meyer, 2020) mit 2,263 dual Studierenden aus dem ersten Studienjahr (März 2019) mit einmaliger Messung, d. h. Querschnittsdesign . Zum Ende des Studienjahres (30. September 2019) wurde von der Hochschulverwaltung die Information über 149 Studienabbrüche in den Datensatz integriert. Die gemessenen drei Skalen zum organisationalen Commitment basierend auf dem Instrument von Felfe et al. (2002) zeigen problematische bis ausgezeichnete Reliabilitäten (ω = .66–.88). Zur Analyse der Daten wurde eine Cox Regression verwendet (Schendera, 2014). Das Modell wurde mit den Variablen Alter, Abiturnote, Studienfach (Technik vs. Wirtschaft), Geschlecht, Bildungsherkunft und den drei psychologischen Grundbedürfnissen (Ryan & Deci, 2017) kontrolliert. Ergebnisse Die Analyse zeigt, dass die emotionale Komponente, hier das affektive Commitment (HR = 0.68; p ≤ .001), einen negativen Einfluss auf den Studienabbruch besitzt. Dagegen besitzen die Komponenten der rationale Kosten-Nutzen-Abwägungen, hier das kalkulatorische Commitment (HR = 0.98; p = .852) und das normative Commitment (HR = 1.10; p = .349), keinen signifikanten Effekt auf den Studienabbruch. Die Ergebnisse untermauern, dass das Commitment zum Ausbildungsbetrieb ein wichtiger Faktor ist, der in die theoretische Modellierung zum Studienabbruch bei dual Studierenden aufgenommen werden muss. Ausbildungsbetriebe könnten u.a. bei der Steigerung des affektiven Commitment ansetzen, etwa durch die Sensibilisierung von Ausbildungsleiter:innen, um einen Studienabbruch entgegenzuwirken. Zukünftige Studien zum Commitment sollten die Auswirkung, wie etwa auf einen Studienfachwechsel oder den Wechsel in eine berufliche Ausbildung, als abhängige Variable weiter aufgreifen.
15:20 - 17:00	3-19: (Scheinbares) Wissen von Lehrkräften Ort: S23
	Paper Session Erfahrene Lehrer:innen wissen mehr – Entwicklung des pädagogischen-psychologischen Wissens über 15 Jahre Nikolaus Bönke, Thamar Voss Universität Freiburg, Deutschland Theoretischer Hintergrund Das pädagogische-psychologische Wissen (PPK) ist das professionsspezifische Wissen über die effektive Gestaltung von Lehr-Lernsituation (Voss et al., 2011). Empirische Studien weisen auf die Bedeutung des PPK für den beruflichen Erfolg von Lehrer:innen hin: Die Schüler:innen profitieren durch eine bessere Qualität des Unterrichts von Lehrer:innen mit höherem PPK (z. B. König et al., 2021) und die Lehrer:innen selbst berichten ein höheres berufliches Wohlbefinden (Gindele & Voss, 2017). Im Rahmen der wenigen Studien zur Entwicklung des PPK, zeigte sich, dass das PPK nach dem Ende des Vorbereitungsdienstes bis in die frühe Berufseinstiegsphase im Mittel ansteigt (Blömeke et al., 2015). Unklar ist jedoch, wie das PPK sich langfristig in der beruflichen Phase entwickelt und welche persönlichen Voraussetzungen eine positive Entwicklung begünstigen. Fragestellung Die Ziele der vorliegenden Studie sind daher (1) die Beschreibung der langfristigen Entwicklung des PPK sowie (2) die Untersuchung von Prädiktoren dieser Entwicklung. Wir erwarten (1) einen Anstieg des PPK vom Vorbereitungsdienst bis in die berufliche Praxis sowie (2) einen stärkeren Anstieg für Lehrer:innen, die sich als selbstwirksam erleben. Explorativ werden zudem die Zusammenhänge der Veränderung mit Geschlecht und Abiturdurchschnittsnote analysiert. Methode Die Stichprobe bestand aus (angehenden) Mathematiklehrer:innen, die an Sekundarschulen in Deutschland unterrichteten. Das PPK der Lehrer:innen wurde zu insgesamt drei Messzeitpunkten über 15 Jahre vom Vorbereitungsdienst bis in die langjährige berufliche Praxis hinein erhoben: zwei Mal während des Vorbereitungsdienstes, in der Anfangsphase (T1: 2007/2008, n_T1 = 746) und zum Ende des Vorbereitungsdienstes (T2: 2008/2009, n_T2 = 568) sowie ein weiteres Mal nach ca. 15 Jahren (T3: 2022, n_T3 = 142). Erfasst wurde das PPK über eine Kurzversion eines validierten 39-Item-Tests (Voss et al., 2011, 2014). Der Test bestand aus insgesamt 12 Items (offene Fragen und videobasierte Items). Der Test wies in Anbetracht der geringen Anzahl der Test-Items und der Breite des inhaltlichen Konstrukts eine akzeptable Reliabilität auf (ω_T1= .72, ω_T2= .59, ω_T3= .68). Zur Erklärung von Unterschieden in der Veränderung des PPK wurden die Selbstwirksamkeitsüberzeugungen (Schmitz & Schwarzer, 2000; 10 Items, ω = .79), das Geschlecht und die Abiturdurchschnittsnote der Lehrer:innen abgefragt. Vorläufige Ergebnisse (1) Die Veränderung des PPK über die Zeit wurde mit einem gemischten linearen Modell (linear mixed model) berechnet. Im Mittel stieg das PPK statistisch signifikant an, sowohl von T1 zu T2 mit einem großen Effekt (β = .67, p < .001) als auch von T2 zu T3 mit einem mittleren Effekt (β = .61, p < .001). Zudem fanden sich substanzielle interindividuelle Unterschiede in den Veränderungen, weshalb wir die Prädiktoren in das Modell zur Erklärung der Unterschiede aufnahmen. (2) Es zeigten sich als Haupteffekte, dass das PPK bei Frauen höher war als bei Männern (β = .11, p = .003). Zudem war eine bessere Abiturdurchschnittsnote (β = .09, p = .013) positiv mit dem PPK assoziiert. Für keine der Prädiktorvariablen zeigten sich signifikante Interaktionseffekte auf die Entwicklung des PPK. Diskussion Die Studie leistet einen wichtigen Beitrag zum Erkenntnisgewinn, da es bislang keine Längsschnittstudien gab, die das PPK anhand von validierten Kompetenztests über einen langen Zeitraum hinweg untersucht haben. Die Ergebnisse weisen darauf hin, dass es vielen Lehrer:innen gelingt, die Lerngelegenheiten im Vorbereitungsdienst und in der beruflichen Phase für den Wissenserwerb zu nutzen: Wir fanden einen deutlichen Anstieg im Vorbereitungsdienst und auch in der beruflichen Phase. Jedoch fanden sich neben den mittleren Anstiegen auch substanzielle interindividuelle Unterschiede in den Veränderungen, die sich nur unzureichend durch die untersuchten Merkmale erklären ließen. Daher sollten in weiteren Analysen auch die Einflüsse von Kontextbedingungen an den Schulen und von weiteren persönlichen Merkmalen auf die Veränderung des PPK untersucht werden. Diese Analysen werden bis zur GEBF vorliegen. Paper Session Essener Tests zur Erfassung des standardorientierten bildungswissenschaftlichen Wissens (ESBW-Test) – Evaluation der Subskalenerweiterung „Inklusion und Digitalisierung“ (ESBW-ID) Nils Nolte, Dorit Wiethege, David Alexej Tobinski, Detlev Leutner Universität Duisburg-Essen, Deutschland Theoretischer Hintergrund Die Kultusministerkonferenz (KMK) gibt seit 2004 Standards für die Kompetenzen vor, die in der Lehramtsausbildung erreicht werden sollen (Ständige Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland [KMK], 2004-2022). Müser et al. (2022) entwickelten mit dem Essener Test zur Erfassung des standardorientierten bildungswissenschaftlichen Wissens (ESBW) ein Testverfahren, um den Erwerb der in den KMK-Standards festgelegten theoretischen Kompetenzen in den vier Kompetenzbereichen Unterrichten, Erziehen, Beurteilen und Innovieren zu überprüfen. Hierbei wurde gezeigt, dass der entwickelte Test klassische Testgütekriterien erfüllt und das bildungswissenschaftliche Wissen sowohl als einheitliches Konstrukt als auch in Form der vier Kompetenzbereiche als einzelne Dimensionen abbilden kann. Fragestellung Die KMK-Standards wurden 2015 bzw. 2019 um Anforderungen zur Inklusion und Digitalisierung erweitert, die in der ersten Version des ESBW-Tests noch nicht abgedeckt waren. Der vorliegende Beitrag beschreibt die Erweiterung des Tests um Items zur Inklusion und Digitalisierung und berichtet erste Ergebnisse zur Evaluation der neuen Items. Ein Schwerpunkt wurde bei der Evaluation auf die Abgrenzung des abgefragten bildungswissenschaftlichen Wissens von Alltagswissen gelegt, indem die Testleistung von Studierenden unterschiedlichen Studienfortschritts (Studienanfänger ≤6 Fachsemester n = 195; Studienfortgeschrittene >6 Fachsemester n = 122) mit Lehrkräften (n = 64) einerseits und bildungswissenschaftlichen Laien (n = 183) andererseits verglichen wurde. Methode Die neuen Items wurden auf Basis der auf die vier Kompetenzbereichen der KMK-Standards aufgeteilten Anforderungen zu den Themen Inklusion und Digitalisierung in Kooperation mit Fachexperten generiert. Für die Evaluation der neuen Items wurden Daten von Lehrkräften und fortgeschrittenen Studierenden herangezogen, um ausreichende Kenntnisse für eine robuste Evaluation annehmen zu können. Die Güte des erweiterten Testinstruments wurde mit sowohl klassischen Reliabilitätskriterien als auch mithilfe von IRT-Modellen geprüft. Im Rahmen der IRT-Skalierungen wurde zudem auch die Dimensionalität des erweiterten Tests geprüft. Da der Test sowohl Single- als auch Multiple-Choice-Items beinhaltet, wurden Partial-Credit-Modelle (PCM) geschätzt. Weiterhin wurden ANOVA-basierte Gruppenvergleiche zwischen den Laien, Studierenden und Lehrkräften angestellt, um die Spezifität des abgefragten Wissens für die Bildungswissenschaften im Vergleich zu Alltagswissen zu prüfen. Hierbei wurden sowohl die Gesamtleistung als auch die Leistungen in den einzelnen Kompetenzbereichen sowie spezifisch in den neuen Themenbereichen Inklusion und Digitalisierung zwischen den Gruppen verglichen. Ergebnisse Unter Einschluss aller neu entwickelten Items war Cronbachs Alpha für die Gesamtskala (α = .82) und die Subskalen gut bis akzeptabel (zwischen .63 in der Subskala Erziehen und .42 in der Subskala Beurteilen). DieLösungshäufigkeiten lagen größtenteils im gewünschten Bereich zwischen 5% und 95%. Sowohl das eindimensionale (EAP-Reliabilität = .84) als auch das vierdimensionale PCM (EAP-Reliabilitäten zwischen .70 und .77) passten gut auf die Daten. Alle Items wiesen einen akzeptablen Itemfit im einparametrischen Modell auf (Infit zwischen 0.86 und 1.29; Bond & Fox, 2007). Bei einigen Items (neuen wie alten) zeigte sich substanzielles DIF zwischen den Gruppen, das noch tiefergehend untersucht und sowohl bei der finalen Itemauswahl für den erweiterten Test als auch bei der finalen Schätzung der Personenfähigkeiten berücksichtigt werden wird. Hinsichtlich der Testleistungen zeigten sich signifikante Unterschiede zwischen den Gruppen sowohl in der Gesamtleistung (F(2,362) = 11.58, p < .001) als auch in einzelnen Subskalen (F(2,362) zwischen 3.11 und 15.47, p zwischen .027 und <.001). Bei durch Post-hoc-Tests belegten deskriptiven Vergleichen fiel markant auf, dass in den meisten (Sub-)Skalen auf der einen Seite Laien und Studienanfänger ähnliche Leistungen zeigten, welche signifikant schlecher waren als die (ebenfalls auf vergleichbarem Niveau liegenden) Leistungen der Studienfortgeschrittenen und Lehrkräfte auf der anderen Seite. Insgesamt wiesen die meisten Items zur Inklusion und Digitalisierung gute Kennwerte auf, sodass die finale Itemauswahl aus sowohl statistischen als auch inhaltlichen Gesichtspunkten durchgeführt werden kann. Der Gruppenvergleich zeigte zudem, dass der ESBW-Test tatsächlich vor allem im Studium erworbenes bildungswissenschaftliches Wissen misst und nicht bloßes Alltagswissen. Paper Session Psychologische Fehlvorstellungen, Bildungsmythen und epistemische Überzeugungen von Studierenden Linda Wirthwein, Rolf Daniel Jürgens, Bernadette Gold, Ricarda Steinmayr TU Dortmund, Deutschland Fehlinformationen über psychologische Themen sowie bildungspsychologische Mythen sind in der Bevölkerung, so auch unter Studierenden, weit verbreitet (z.B. Deibl & Zumbach, 2023; Menz et al., 2021). Entsprechende Fehlvorstellungen können insbesondere bei Lehramtsstudierenden ungünstige Auswirkungen auf das unterrichtliche Handeln haben (Asberger et al., 2021; König et al., 2012). Daher ist es relevant, die Entstehung psychologischer Mythen sowie Bildungsmythen besser zu verstehen. Forschung zu Determinanten entsprechender Fehlvorstellungen kommen allerdings zu widersprüchlichen Ergebnissen (vgl. Deibl & Zumbach, 2023). Darüber hinaus existieren Vorurteile gegenüber der Psychologie als Wissenschaft, was sich beispielsweise in unzutreffenden epistemischen Überzeugungen (subjektive Vorstellungen über die Natur des Wissens und den Prozessen des Wissenserwerbs) widerspiegelt (Hofer, 2001; Peter et al., 2016). Bisherige Studien konnten bereits substantielle Zusammenhänge zwischen epistemischen Überzeugungen und dem Vorhandensein von Bildungsmythen aufzeigen (Berweger et al., 2023). Ziel der vorliegenden Studie ist es zum einen, Lehramtsstudierende unterschiedlicher Fächer und Studierende ohne (bildungs-)psychologische Inhalte in ihren psychologischen Fehlvorstellungen, Bildungsmythen und epistemischen Überzeugungen zu vergleichen. Vermutet wurde eine geringere Ausprägung in den zuvor beschriebenen Konstrukten für Studierende des Unterrichtsfachs Psychologie verglichen mit anderen (Lehramts-)Studierenden. Des Weiteren sollten angehende Lehrkräfte geringere Werte aufweisen als Studierende ohne (bildungs-)psychologische Inhalte im Studium. Darüber hinaus werden ausgewählte Determinanten psychologischer Fehlkonzeptionen und Bildungsmythen untersucht (soziodemographische Variablen, Persönlichkeitsvariablen, epistemische Überzeugungen, Studienfortschritt, Abiturdurchschnittsnote). Dazu wurden insgesamt N = 391 Bachelorstudierende befragt (n = 103 Lehramtsstudierende mit Unterrichtsfach Psychologie; n = 187 Lehramtsstudierende anderer Fächer; n = 101 Studierende ohne psychologische Inhalte; 73% weiblich; durchschnittliches Alter M = 21.54, SD = 4.06). Vorgegebenen wurden bereits etablierte Skalen zur Erfassung der Bildungsmythen (QUEBEC; Asberger et al., 2020) sowie der epistemischen Überzeugungen (EBI-AM; Peter et al., 2016). Ein Instrument zur Erfassung der psychologischen Fehlkonzeptionen wurde aus dem Englischen übersetzt (Hughes et al., 2013). Die Skalen ließen sich anhand konfirmatorischer Faktorenanalysen überwiegend replizieren, die internen Konsistenzen lagen im zufriedenstellenden Bereich. Analysen zur Messinvarianz wiesen auf zumindest metrische Invarianz zwischen den Gruppen hin. In den durchgeführten multi- und univariaten Kovarianzanalysen (Kovariaten: Alter, Geschlecht, Semesteranzahl, Persönlichkeit) mit anschließenden Post-hoc-Vergleichen wiesen Studierende ohne psychologische Studieninhalte signifikant mehr psychologische Fehlvorstellungen auf als Studierende des Unterrichtsfachs Psychologie (d = 0.65) und als andere Lehramtsstudierende (d = 0.55). Bezüglich der erfassten Bildungsmythen wurden keine statistisch signifikanten Gruppenunterschiede gefunden. Studierende ohne psychologische Studieninhalte hatten eine statistisch signifikant ungünstigere epistemische Überzeugung zur Psychologie als Wissenschaft als Lehramtsstudierende (d = 0.43) und als angehende Psychologielehrkräfte (d = 0.39). Insgesamt stimmten sämtliche Studierende sowohl den psychologischen Fehlannahmen als auch den jeweiligen Bildungsmythen eher zu. Neben Persönlichkeitseigenschaften (Extraversion, Gewissenhaftigkeit) erwiesen sich die epistemischen Überzeugungen als positive signifikante Prädiktoren zur Vorhersage der Anzahl an psychologischen Fehlkonzeptionen. Ein niedrigerer sozioökonomischer Status und eine schlechtere Abiturdurchschnittsnote gingen mit einer höheren Anzahl an psychologischen Fehlkonzeptionen einher. Des Weiteren war ein geringeres Alter mit einer höheren Anzahl an Fehlkonzeptionen assoziiert. Bezüglich des Bildungsmythos Klassenwiederholung waren vor allem ausgewählte Persönlichkeitseigenschaften sowie die epistemischen Überzeugungen positive signifikante Prädiktoren; der sozioökonomische Status erwies sich wiederum als negativer Prädiktor. Die restlichen Bildungsmythen ließen sich durch die erfassten Prädiktoren jedoch nicht statistisch signifikant vorhersagen. Während sich unsere Hypothesen bzgl. der Ausprägung der psychologischen Fehlannahmen bestätigten und vor allem die angehenden Psychologielehrkräfte die geringste Anzahl an psychologischen Fehlkonzeptionen aufwiesen, wurden bezüglich der Bildungsmythen keine signifikanten Gruppenunterschiede gefunden. Die hohe Zustimmung der Lehramtsstudierenden unabhängig vom Fach zu den jeweiligen Bildungsmythen sind ein Hinweis auf die Notwendigkeit, entsprechende Mythen in der universitären Lehrkraftausbildung konkret anzusprechen und zu revidieren, so dass durch psychologische und bildungsbezogene Fehlannahmen (z.B. zur Klassengröße oder Klassenwiederholung) keine Nachteile für Schülerinnen und Schüler oder gesellschaftliche Kosten verursacht werden (König et al., 2012). Paper Session Confirmation Bias als Barriere evidenzinformierter Schulpraxis? Kirstin Schmidt, Emily Lara Moritz, Samuel Merk Pädagogische Hochschule Karlsruhe, Deutschland Im Rahmen der sogenannten evidenzinformierten Schulpraxis werden Lehrpersonen dazu angehalten, wissenschaftliche Evidenz in ihre professionellen Überzeugungen und in ihr professionelles Handlungswissen zu integrieren. Ziel dabei ist es die Schul- und Unterrichtsqualität sowie Schüler:innenleistungen zu steigern (z.B. Bauer et al., 2015; Brown et al., 2022). Allerdings identifizieren diverse Studien zahlreiche Barrieren, die Lehrpersonen davon abhalten evidenzinformierte Handlungen zu realisieren. Diese umfassen unter anderem limitierte Ressourcen wie Zeitmangel oder fehlende methodische Kompetenzen (z.B. van Schaik et al., 2018). Auch kognitive Verzerrungen wie der prominente Confirmation Bias (CB) werden als Barrieren diskutiert. CB beschreibt das Phänomen, dass Informationen, die konsistent zu eigenen Überzeugungen sind bevorzugt, weniger kritisch hinterfragt oder eher erinnert werden als Informationen, die inkonsistent zu diesen sind (z.B. Oswald & Grosjean, 2004). Auch wenn umfangreiche Grundlagenforschung zu CB in verschiedenen Kontexten vorliegt, wurde dieser im Kontext evidenzinformierter Schulpraxis weniger systematisch analysiert. Es existieren zwar erste Hinweise, dass CB bei der Bewertung bildungswissenschaftlicher Studien (Masnick & Zimmermann, 2009) und dem Vertrauen in bildungswissenschaftliche Aussagen (Schmidt et al., 2022) zum Tragen kommt. Offen bleibt allerdings, inwieweit CB der Idee evidenzinformierter Schulpraxis–Überzeugungen und Handlungswissen von Lehrpersonen mittels wissenschaftlicher Evidenz zu informieren (auch als Belief-/Knowledge-Updating bezeichnet)–tatsächlich entgegensteht. Die vorliegende experimentelle Studie setzt an dieser Forschungslücke an und untersucht, inwieweit die Konsistenz zwischen Überzeugungen und wissenschaftlicher Evidenz 1) die Bewertung von Studienergebnissen, das Belief-Updating in 2) Richtung und 3) Sicherheit sowie 4) das Updating der Handlungstendenz bei Lehramtsstudierenden beeinflusst. Hierfür wurden N = 83 Lehramtsstudierende (65% weiblich; M_Semester = 2.3) in einem Between-Person Design mit dem Thema „Gendergerechte Sprache in der Schule“ und der Frage, „ob die Verwendung des generischen Maskulinums bei Lehrpersonen zu einer überproportionalen Assoziation mit männlichen Schülern führt“, konfrontiert. Die Studierenden beantworteten zunächst verschiedene Fragen: Sie sollten 1) anhand einer 7-stufigen Likertskala angeben, inwieweit sie sich in ihrem zukünftigen Unterricht bemühen werden, Bezeichnungen zu verwenden, die über die rein männliche Form hinausgehen (indem sie z.B. die weibliche und männliche Form oder geschlechtsneutrale Bezeichnungen verwenden; Handlungstendenz), 2) aus einem dichotomen Item ihre Überzeugung zu diesem Thema auswählen und 3) anhand einer 5-stufigen Likertskala ausdrücken, wie sicher sie sich in dieser Überzeugung sind. Anschließend erhielten die Teilnehmenden einen Kurzbericht einer experimentellen Studie, in dem die Ergebnisse so manipuliert wurden, dass diese zufällig entweder konsistent oder inkonsistent zur angegebenen Überzeugung waren (Between-Person Faktor; Operationalisierung von Belief-Konsistenz). Die Studierenden wurden dann befragt, wie überzeugend sie das Studienergebnis fanden (Antwortmöglichkeiten mittels 5-stufiger Likertskala), bevor ihre Handlungstendenz, Überzeugungsrichtung und -sicherheit erneut erhoben wurden, um die entsprechenden Updatings zu analysieren. Zur Beantwortung der Forschungsfragen wurden bayesianische verallgemeinerte Mehrebenenmodelle (Kruschke, 2015) mithilfe der propabilistischen Programmiersprache Stan geschätzt. Diese bieten hypothesenkonform starke Evidenz dafür, dass Lehramtsstudierende überzeugungskonsistente Studienergebnisse deutlich überzeugender einschätzen als überzeugungsinkonsistente (d = .92, 95% Highest Density Posterior Intervals [HDPI] = [ .53, 1.32]). Es zeigt sich keine starke Evidenz für eine Änderung der Überzeugungsrichtung (OR = 6.2, 95%HDPI = [0.99, 1.18]) und schwache Evidenz für eine substanzielle Änderung der Überzeugungssicherheit (d = 0.62, 95%HDPI = [0.19, 1.05]). Für eine Änderung der Handlungstendenz lag für diejenigen, die überzeugungsinkonsistente Forschungsergebnisse erhielten, keine starke Evidenz vor (d = .22; 95%HDPI = [0.16, .614]). Während die befragten Lehramtsstudierende im Sinne eines CB überzeugungsinkonsistente Forschungsergebnisse stark abwerten, passen sie ihre Überzeugungssicherheit an die präsentierte Evidenz an. Weder für eine Anpassung ihrer Überzeugungen und Handlungstendenzen noch für deren Ausbleiben liegt starke Evidenz vor– die Ergebnisse sind eher als inkonklusiv zu interpretieren. Eine Replikation mittels Bayesian Updating ist daher geplant. Zusätzlich sind die Ergebnisse aufgrund einer fehlenden thematischen Variation in ihrer externen Validität eingeschränkt. Dennoch bieten sie interessante Anhaltspunkte mit Blick auf die Frage, inwieweit CB der Idee evidenzinformierter Schulpraxis entgegensteht, welche im Vortrag diskutiert werden.
15:20 - 17:00	3-20: Soziale Ungleichheiten in der schulischen Bildung Ort: S24
	Paper Session Wenn sie nur wollen? Eine Individual Participant Data-Meta-Analyse zum Zusammenhang zwischen sozioökonomischem Status und Merkmalen der Leistungsmotivation von Schüler:innen Sarah Grünthal, Lena Keller, Julia Kretschmann, Hanna Dumont, Martin Brunner Universität Potsdam, Deutschland Theoretischer Hintergrund Die Leistungsmotivation von Schüler:innen spielt eine wichtige Rolle für ihr Lernverhalten und bestimmt ihren Bildungs- und Berufserfolg (Quílez-Robres et al., 2021). So konnte in Meta-Analysen gezeigt werden, dass Schüler:innen und Studierende mit höherer Selbstwirksamkeitserwartungen, Leistungsmotivation und höheren akademischen Selbstkonzepten bessere Leistungen aufwiesen (z.B. Multon et al., 1991; Robbins et al., 2004). Das Erwartungs-Wert-Modell nach Eccles (1983) nimmt an, dass sich die Leistungsmotivation von Schüler:innen in Abhängigkeit ihrer Erfolgserwartungen bzgl. einer Aktivität und dem beigemessenen subjektiven Wert entwickelt. Während man unter Erfolgserwartungen beispielsweise das akademische Selbstkonzept und die Selbstwirksamkeitserwartung versteht, untergliedert sich die Wertkomponente in Zielerreichungswert, intrinsischen Wert, Nützlichkeit sowie die relativen (emotionalen) Kosten (Eccles, 1983). Das General Model of Relations Among Parental Influences on Children‘s Motivation von Eccles (1993) geht als Erweiterung des Erwartungs-Wert-Modells davon aus, dass der sozioökonomische Status (SÖS) beeinflusst, welche außerschulischen Erfahrungen Eltern ihren Kindern ermöglichen können (z.B. gemeinsames Vorlesen, Instrumentenunterricht, Sportvereinsmitgliedschaft, Museumsbesuche) und wie sie ihre Kinder beim schulischen Lernfortschritt unterstützen können (z.B. Hilfestellung bei Hausaufgaben). Diese Erfahrungen beeinflussen die Erfolgserwartungen und Werte, die Kinder und Jugendlichen, insbesondere auch in Bezug auf schulisches Lernen entwickeln. Dabei ist vor allem zu bedenken, dass im Vergleich zu Schüler:innen aus sozioökonomisch begünstigten Familien, Kinder aus Familien mit niedrigerem SÖS oftmals weniger Möglichkeiten haben herauszufinden, worin sie gut sind, was sie interessiert und was ihnen Spaß macht, sowie ihren Interessen und Leidenschaften nachzugehen (Eccles, 1993). Der SÖS wird typischerweise als multidimensionales Konstrukt verstanden, das sich aus dem Bildungsniveau der Eltern, dem beruflichen Status der Eltern und deren Einkommen zusammensetzt (z.B. Ditton & Maaz, 2015). Darüber hinaus ist es plausibel anzunehmen, dass eine differenziertere Erfassung bildungsrelevanter Ressourcen (z.B. Bücherbestand im Haushalt), einen vertieften Einblick geben kann, inwiefern Eltern ihren Kindern anregende Lerngelegenheiten bieten können bzw. die schulische Entwicklung ihrer Kinder fördern können. Während der Zusammenhang zwischen SÖS und schulischer Leistung bereits gut erforscht ist (z.B. Chmielewski, 2019; Liu et al., 2022; Sirin, 2005), wurde der Zusammenhang zwischen SÖS und motivationalen Merkmalen jedoch bislang kaum systematisch untersucht. Fragestellungen Um diese Lücke zu schließen, untersuchen wir aus internationaler Perspektive inwiefern SÖS und Merkmale der Leistungsmotivation zusammenhängen und ob die Stärke und Richtung des Zusammenhangs über Länder, Domänen, motivationale Merkmale, Zeit und SÖS-Indikatoren hinweg variieren. Methode Zur Beantwortung dieser Fragestellungen führen wir mit Daten des Programme for International Student Assessment (PISA 2000–2018) eine Individual Participant Data-Meta-Analyse durch (Brunner et al., 2023). Im ersten Schritt berechnen wir hierfür für jede Stichprobe pro Land die Korrelationen zwischen SÖS-Indikatoren und den motivationalen Merkmalen. Im zweiten Schritt integrieren wir die Korrelationen meta-analytisch. Als SÖS-Indikatoren wurden der höchste berufliche Status der Eltern (HISEI), das höchste Bildungsniveau der Eltern in absolvierten Bildungsjahren, der Bücherbestand im Haushalt und zur Verfügung stehende Bildungsressourcen im Haushalt (z.B. Schreibtisch, Wörterbuch) verwendet. Als Erfolgserwartungen der Leistungsmotivation nutzten wir verfügbare Daten zu domänenspezifischen akademischen Selbstkonzepten und Selbstwirksamkeitserwartungen. Als Wertkomponenten untersuchten wir die intrinsische Motivation (z.B. Interesse oder Freude am Lesen), die instrumentelle Motivation, sowie emotionale Kostenkomponenten (z.B. Mathematikangst). Die motivationalen Merkmale wurden mithilfe von Skalen erfasst, die jeweils 3 bis 9 Items umfassten und ein vierstufiges Antwortformat nutzten (z.B. 1 = stimme gar nicht zu bis 4 = stimme völlig zu). Ergebnisse Erste Ergebnisse bestätigen, dass es domänenspezifische, indikatorspezifische und merkmalsspezifische Unterschiede im Zusammenhang zwischen SÖS und motivationalen Merkmalen bei 15-jährigen Schüler:innen gibt. Über alle motivationalen Merkmale hinweg konnte der stärkste Zusammenhang mit der Anzahl an Büchern und Bildungsressourcen im Haushalt verzeichnet werden. In Haushalten mit vielen Büchern und Bildungsressourcen könnte der Wert von Bildung stärker betont werden, was die motivationalen Merkmale der Schüler:innen positiv beeinflussen könnte. Der direkte Zugang zu Büchern und anderen Bildungsressourcen könnte dabei die Lernmöglichkeiten und Lernbereitschaft der Schüler:innen erhöhen. Paper Session Social Inequality in Adolescents’ Social, Emotional, and Behavioral Skills: Main Effects or Intersectionality? Clemens Lechner¹, Julian Urban^1,2 ¹GESIS, Deutschland; ²Universität Trier Theoretical background One of the primary objectives of education shared by many researchers, practitioners, and policymakers is fostering skills and achievement, particularly in disadvantaged youth (e.g., Grosz et al., 2021; Kautz et al., 2014; OECD, 2019, 2021). A fundamental prerequisite for such efforts is a comprehensive understanding of existing inequalities, that is, how contextual and socio-demographic characteristics affect the level and development of skills. An established findings in educational psychology is that cognitive skills and achievement are unevenly distributed among youth (e.g., OECD, 2019). Whether the same applies to social, emotional, and behavioral skills (SEB; i.e., non-cognitive skills) is much less clear, despite the crucial role of SEB skills for academic success (e.g., Guo et al., 2022; Mammadov, 2021; Poropat, 2009). Initial studies reported small to medium-sized socio-demographic differences in SEB skills by age/grade level, gender, and/or parental SES (e.g., OECD, 2021; Guo et al., 2022; Feraco et al., 2023; Lechner et al., 2021) but are limited for the following reason. The studies predominantly focused on a single or few potential contextual/socio-demographic characteristics in isolation (e.g., SES or gender or age/grade level; for exceptions, see Feraco et al., 2023; OECD, 2021). This hinders a comparison of the relative strength of different influences on the levels of SEB skills. Even more important, it precludes examining interactions of unique constellations of (dis-)advantages in skills that arise from the simultaneous membership in multiple social categories – a concept known as intersectionality (Keller et al., 2023). Research question This study aimed to investigate social inequality, in particular intersectionality, in adolescents’ SEB skills. We considered gender, parental SES (as measured by parents’ education), adolescents’ school track, and migration background as intersecting social categories. Methods We analyzed a stratified sample of 1,664 adolescents aged 14–20 years (M_age = 17, 48% female, 33% academic background, 50% academic school track, 31% migration background). We assessed adolescents’ SEB skills using the German version of the Behavioral, Emotional, and Self-Regulatory Skills Inventory (BESSI; Lechner et al., 2022). BESSI covers five broad domains (Self-management, Emotional resilience, Cooperation, Social engagement, and Innovation) and includes 32 fine-grained SEB skill facets (e.g., stress regulation or time management). To examine intersectionality, we used the Multilevel Analysis of Individual Heterogeneity and Discriminatory Accuracy (MAIHDA) approach (Keller et al., 2023). The MAIHDA approach enables the partitioning of variance in between stratum and within stratum variance and permits partitioning of between-stratum variance into variance due to main effects and variance due to intersectionality. We conducted MAIHDA using Bayesian multilevel modelling for each respective BESSI facet and domain clustered in the 16 demographic strata. Results and Discussion On average, adolescents reported “good” to “very good” SEB skill levels. We found negligible bivariate effects of gender and migration background on SEB skills (all \|ds\| < 0.20) but found substantial effects of parental background and school track. These effects were especially pronounced for SEB skills of the domain Innovation (d_{Parental Background} = 0.55; d_SchoolTrack = 0.49) favoring an academic background and school track. Regarding intersectionality, the demographic strata collectively explained up to 8.78% of the variance in SEB skills. The majority of this variance can be attributed to main effects with between 0.14% and 1.48% variance due to intersectionality. Our findings provide further insights into social inequality in SEB skills. Because we found little evidence for intersectionality, we conclude that social inequality along the lines of the socio-demographic characteristics we investigated occurs in the form of main effects. However, there is a need for further studies investigating social inequality in SEB skills to understand the underlying processes and foster the SEB skills of (disadvantaged) adolescents. Paper Session Situationsanalyse digitaler Ungleichheit: Warum bestehen herkunftsspezifische Unterschiede in den digitalen Kompetenzen von Schülerinnen? Yannick Stelter, Markus Lörz DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland Ausgangspunkt:* In Deutschland sind die sozialen Ungleichheiten im Bildungssystem besonders ausgeprägt – sowohl in den Abschlüssen, als auch in den schulischen Kompetenzen (OECD, 2019). Mit der zunehmenden Digitalisierung im Bildungsbereich entstehen zudem Dynamiken, deren Auswirkungen auf soziale Ungleichheiten bisher nur unzureichend erforscht sind. Eine dieser Entwicklungen betrifft die digitalen Kompetenzen der Schülerinnen. Dabei lässt sich beobachten, dass sowohl der Einsatz digitaler Medien, als auch der souveräne Umgang mit digitalen Medien an Bedeutung gewinnen (Drossel et al., 2019). Nicht zuletzt als Voraussetzung, um erfolgreich am immer digitalen werdenden Unterricht teilzunehmen. Theoretischer Hintergrund:* Ein zentrales Ergebnis der bisherigen Forschung ist, dass die digitalen Kompetenzen von Schülerinnen in Abhängigkeit der sozialen Herkunft variieren. Während der Zusammenhang zwischen digitalen Kompetenzen und sozialem Hintergrund gut erforscht ist, sind die Ursachen dieser Disparitäten noch weitgehend unklar. Insbesondere über den Prozess des ungleichen Erwerbs digitaler Kompetenzen herrscht Uneinigkeit (Hargittai & Hsieh, 2014). Für ein umfassendes Verständnis der Entstehung von Bildungsungleichheit bietet es sich an, alle am Bildungserwerb beteiligten Akteurinnen – wie Schule, Lehrerinnen, Eltern und Schülerinnen – in den Blick zu nehmen. In der digitalen Ungleichheitsforschung wurde in den vergangenen Jahren zudem der Begriff des „Digital Divide“ geprägt (van Dijk, 2006). Hierbei wird zwischen dem Zugang zu digitalen Medien (first level divide) und der Nutzung digitaler Medien (second level divide) unterschieden (DiMaggio et al., 2004; Scheerder et al., 2017). Für ein umfassendes Verständnis digitalisierungsbezogener Unterschiede ist es nach Helsper (2012), Senkbeil (2018), sowie Van Deursen und van Dijk (2014) zudem empfehlenswert, über die digitalisierungsbezogenen Ressourcen hinaus auch motivationale Aspekte in den Blick zu nehmen. Fragestellung: Ziel des vorliegenden Beitrags ist es die Entstehung herkunftsspezifischer Unterschiede in den digitalen Kompetenzen von Schülerinnen zu untersuchen. Dabei soll die Rolle der verschiedenen Akteurinnen und ihre digitalen Ressourcen herausgearbeitet werden. Hierzu ist es zunächst erforderlich, das Ausmaß der digitalen Unterschiede bei den verschiedenen Akteurinnen systematisch zu ermitteln und anschließend in einem integrativen Modell, den Einfluss der Akteurinnen und ihrer digitalen Ressourcen auf die herkunftsspezifischen Unterschiede im Erwerb digitaler Kompetenzen zu untersuchen. Daten und Methoden: In dem vorliegenden Beitrag verwenden wir die Daten der ICILS-Studie 2018 (Eickelmann et al., 2019; IEA, 2019). Hierbei handelt es sich um eine repräsentative Schulleistungsuntersuchung bei der die computer- und informationsbezogenen Kompetenzen von Schülerinnen der achten Jahrgangsstufe untersucht wurden. In der Analyse gehen wir in zwei Schritten vor. Zunächst wird deskriptiv dargelegt, inwieweit sich die Rahmenbedingungen für den Erwerb computer- und informationsbezogener Kompetenzen zwischen den verschiedenen sozialen Herkunftsgruppen unterscheiden. Anschließend untersuchen wir auf Basis von OLS-Regressionen inwieweit die Ursachen der herkunftsspezifischen Unterschiede auf Schülerinnenebene, auf Elternebene oder auf Schulebene zu finden sind. Ergebnisse: Die empirischen Analysen zeigen, dass insbesondere auf Schülerinnenebene im Zugang und der Nutzung digitaler Medien herkunftsspezifische Unterschiede bestehen. Zudem unterscheiden sich die Unterstützungsmöglichkeiten im Elternhaus nach sozialer Herkunft. Auf Schulebene finden wird dagegen nur geringe Hinweise auf herkunftsspezifische Unterschiede in der digitalen Ausstattung und der Nutzung digitaler Medien. Die Ursache für die herkunftsspezifischen Unterschiede in den digitalen Kompetenzen sind daher vorwiegend auf Schülerinnen- und Elternebene zu suchen und weniger in Ausstattungsunterschieden der Schulen begründet. Paper Session Soziale Herkunft, ganztägige Betreuung und Kompetenzentwicklung von Grundschulkindern Fabian Siegel, Benjamin Gröschl, Hartmut Ditton, Katja Scharenberg LMU München Bildungserfolg und gesellschaftliche Positionierung sind vor allem in Deutschland eng mit der sozialen Herkunft verknüpft (Ehmke & Jude, 2010; Faller, 2019; OECD, 2021; Shavit et al., 1998). Als eine Maßnahme zur Reduktion solcher herkunftsbedingten Unterschiede wurden wiederholt ganztägige Betreuungsformen diskutiert, die erhoffte "homogenisierende Wirkung der Schule" (Bourdieu & Passeron, 1971, S. 28) aber nur selten differenziert untersucht (Fischer & Kielblock, 2022; Linberg et al., 2018; Steinmann et al., 2019). Klassischen theoretischen Ansätzen (Bourdieu, 2012; Bourdieu & Passeron, 1971; Coleman, 1966, 1988) und empirischen Befunden (Fend, 1981; Hattie, 2009) folgend, wird die Internalisierung kulturellen Kapitals oftmals durch die in unterschiedlichen Bildungskontexten (z.B. Schule, Hort, Elternhaus) verbrachte Zeit operationalisiert. Ebenso wichtig erscheinen jedoch die Qualität und Intensität dort stattfindender Aktivitäten und Interaktionen (Bourdieu, 2012; Coleman, 1988; Steinmann et al., 2019). Ziel unseres Beitrags ist daher, den in hierzu bislang vorliegenden Forschungsarbeiten reduzierten Fokus auf rein zeitliche und linear angenommene Kompensationseffekte von Beschulungs- bzw. Betreuungsangeboten (Bos et al., 2010; Steinmann et al., 2019) auf die Kompetenzentwicklung von Schüler:innen um Aspekte der Betreuungsqualität und -intensität zu erweitern. Die soziale Herkunft, d.h. vor allem die damit assoziierten ökonomischen und kulturellen Ressourcen, bildet ein zentrales und zugleich vielschichtiges Konzept in der empirischen Bildungsforschung (Breen et al., 2012; Marks & O’Connell, 2021; Müller & Gangl, 2006; Sirin, 2005). Der elterliche Bildungsstand und sozioökonomische Status gelten, auch durch einschlägige Forschungsempfehlungen (APA, 2007; OECD, 2018; Reiss et al., 2019; U.S. Department of Education, 2012), als die wohl meistverwendeten Kontrollvariablen der Bildungsforschung (Breen & Jonsson, 2005; Sirin, 2005; Thomson, 2018). Die entsprechende Modellauswahl folgt dagegen eher einer "Mimikry bisher veröffentlichter Werke" (Thaning & Hällsten, 2020, S. 536) als einer expliziten methodischen Diskussion (Bukodi & Goldthorpe, 2013; Lee et al., 2019; Ludwig-Mayerhofer et al., 2020; Meraviglia & Buis, 2015). Dabei kann die Operationalisierung von "Hintergrundvariablen" (Schneider, 2016, S. 41) einen erheblichen Einfluss auf die Resultate einer Hauptuntersuchung haben (Burnham et al., 2002; Harwell et al., 2017; Blossfeld, 2019). Unser Beitrag zeigt anhand longitudinaler Daten aus dem Nationalen Bildungspanel (NEPS, Startkohorte 2; Artelt & Sixt, 2023; Blossfeld & Roßbach, 2019), dass die Entwicklung mathematischer Kompetenzen von Grundschulkindern sowohl mit den bereits zu Beginn der Schulzeit unterschiedlichen Kompetenzniveaus (β=0.55; p<0.01; R²=0.20) als auch mit den ökonomischen Ressourcen (β=0.27; p<0.01; R²=0.07) und dem Bildungshintergrund der Eltern (=0.2<β<0.50; p<0.01; R²=0.08) einerseits zusammenhängt, andererseits aber auch komplex und nicht-linear interagiert. Die Modellanpassungsgüte und Effektstärken unterscheiden sich daher deutlich zwischen den, nach Kompetenzniveau und sozialer Herkunft differenzierten, Untersuchungsgruppen (0.12≤β≤0.38; p<0.05; 0.01≤R²≤0.40). Die in diesem Beitrag präsentierten Teilergebnisse aus dem DFG-Projekt [Anonymisiert] können so teilweise die gesellschaftlich erhofften, kompensatorischen Effekte von Schule belegen. Daneben finden sich aber auch verstärkende, oft als „Matthäus-Effekt“ (Merton, 1988) zusammengefasste, Einflüsse qualitativ unterschiedlicher Betreuungsformen. Die Wirkung von Ganztagsbeschulung, Hortbetreuung oder auch einfacher Mittagsbetreuung variiert zudem abhängig vom Kompetenzniveau und der sozialen Herkunft der Grundschulkinder. Schon zu Beginn der Schulzeit unterdurchschnittlich kompetente Schüler:innen mit niedriger sozialer Herkunft zeigen bis zum Ende der Grundschulzeit kaum Veränderungen in den Kompetenzen relativ zur Gesamtkohorte, während Schüler:innen hoher sozialer Herkunft deutlich aufholen. Demgegenüber können anfänglich überdurchschnittlich kompetente Kinder hoher sozialer Gruppen ihr Niveau über die Grundschulzeit halten, während sich bei Schüler:innen mit niedriger sozialer Herkunft im gleichen Zeitraum der Kompetenzvorsprung deutlich verringert. Unser Beitrag zeigt, dass eine parametrisch nicht-lineare Modellierung des kulturellen und ökonomischen Hintergrunds theoretisch und methodisch notwendig ist, um hierbei relevante Wirkmechanismen herausstellen und differenzielle Effekte unterschiedlicher Betreuungsformen auf die herkunftsspezifische Kompetenzentwicklung im Zeitverlauf nachweisen zu können. Dadurch gelingt es nicht nur, die entsprechenden Bildungs- und Selektionsprozesse besser zu verstehen. Vielmehr geben unsere Befunde auch Hinweise darauf, gezielt Partizipationsprozesse anzustoßen und Bildungsangebote so zu gestalten, dass herkunftsbedingten Bildungsungleichheiten entgegengewirkt werden kann.
17:00 - 18:00	Keynote 1: Prof. Dr. Pam Grossmann: Core Practices for Teaching: A Language for Developing and Improving Professional Practice Ort: H05
18:00 - 19:30	Postersession Ort: Foyer Haus 6
	Poster Die Kultur der Digitalität an Schulen partizipativ gestalten: Lehrkräftefortbildungen zur Integration von generativer KI in neue Lern- und Prüfungssettings Marcus Kindlinger, Katrin Hahn-Laudenberg Universität Leipzig, Deutschland Kontext/Relevanz: Künstliche Intelligenz (KI) prägt bereits jetzt Wirtschaftssysteme und Gesellschaften (OECD, 2022) und wird in den kommenden Jahren voraussichtlich weitere tiefgreifende Veränderungen mit sich bringen, zum Beispiel für globale Arbeitsmärkte (World Economic Forum, 2023) und auch direkt für Bildungsprozesse (Schleicher, 2021). In Demokratien tragen Bildungssysteme mehr als nur die Verantwortung, Schüler:innen auf den individuellen Umgang mit KI vorzubereiten. Sie müssen darüber hinaus auch Fähigkeiten vermitteln, die es Bürger:innen ermöglichen, an Diskussionen über die gesamtgesellschaftliche Nutzung und Regulierung von KI und verwandten Technologien zu partizipieren. Ein möglicher Weg dahin ist, Schüler:innen bereits in ihrem Bildungsprozess an Entscheidungen über digitale Transformationsprozesse teilhaben zu lassen. Ziel: Ziel dieses Projekts ist es, das Potenzial von textgenerierender KI wie ChatGPT zur Anregung einer Diskussion über eine „Kultur der Digitalität“ (Stalder, 2016; Stalder & Kuttner, 2022) an Schulen zu nutzen. Im Zentrum des Projekts stehen Workshops mit Lehrkräften und Lehrenden aus der zweiten Phase der Lehramtsbildung. In diesen werden Möglichkeiten erarbeitet, Experimente zu einer digitalen Transformation des schulischen Lernens gemeinsam mit Schüler:innen zu gestalten; beispielsweise in Form von innovativen, KI-integrierenden Prüfungskonzepten. Der Austausch und die Zusammenarbeit der Lehrkräfte während dieser Workshops soll sie befähigen, als Akteure eines institutionellen Wandels zu wirken. Durch das partizipative Modell sollen Stimmen und Perspektiven von Schüler:innen im Mittelpunkt KI-bezogener Transformationsprozesse stehen und diese zugleich zukunftsrelevante Fähigkeiten erwerben können (Krommer, 2021). Darüber hinaus sollen die Veränderungsprozesse durch den Einbezug verschiedener Beteiligter nachhaltiger und effektiver gestaltet werden. Methodik: Das Projekt ist als designbasierte Forschung (siehe z.B. Anderson & Shattuck, 2012; McKenney & Reeves, 2019) konzipiert und umfasst dabei drei zentrale Elemente: Prototypenentwicklung mit Lehramtsstudierenden: In einem ersten Zyklus (10/2023-02/2024) wird das Fortbildungskonzept mit Lehramtsstudierenden im Sinne eines Prototypen-Workshops entwickelt und erprobt. Dabei werden erste Ideen für konkrete partizipative Formate zu schulbezogenen Transformationsprozessen entwickelt, diskutiert und evaluiert. Workshops mit Lehrkräften und Lehrenden aus der zweiten Phase der Lehramtsbildung: Aufbauend auf die Erkenntnisse aus den Prototypen wird das Konzept in zwei Workshop-Zyklen (ab 06/2024) mit berufstätigen Lehrkräften sowie mit Lehrenden aus der zweiten Phase der Lehramtsbildung umgesetzt und, auf Grundlage von Evaluations- und Implementationsuntersuchungen, schrittweise angepasst. Die Teilnehmenden erwerben zunächst grundlegendes Wissen über pädagogische Möglichkeiten zum Einsatz von KI und zu Partizipationsformaten. Darüber hinaus soll jedoch eine intensive Auseinandersetzung mit „Design Thinking“ in Bildungsprozessen stattfinden (Luka, 2014). Innovationen in der Unterrichts- und Prüfungsplanung werden dabei als Experimente verstanden, mit denen nicht nur der eigene Unterricht verändert wird, sondern auch über das eigene Klassenzimmer hinauswirkende Transformationsprozesse angeregt werden können. Ansatzpunkte dafür bieten besonders flexible und gemeinsam mit Schüler:innen anpassbare Lehrplankomponenten wie projektbasierte Prüfungen. Zur Konzeption und Umsetzung der Workshops arbeiten wir mit Praxispartnern aus der Lehrkräftebildung zusammen. Begleitende multimethodische Evaluation: In allen drei Zyklen werden Prozesse und mögliche Wirkungen der Prototypen bzw. der Workshops evaluiert und die daraus gezogenen Erkenntnisse für die Weiterentwicklung des Angebots genutzt. Im ersten Workshop-Zyklus mit Lehrkräften findet eine Implementationsbegleitung an den Schulen der Teilnehmenden statt, sodass die Umsetzung von partizipativen Transformationsprozessen im realen Schulkontext tiefergehend untersucht werden kann. Je nach Zyklus werden Methoden wie Interviews, Dokumentenanalysen, Beobachtungen und Fragebogenerhebungen trianguliert. Erwartete Ergebnisse: Im Rahmen unserer Begleitforschung entstehen insbesondere Erkenntnisse über Möglichkeiten und Hindernisse bei der Anregung von Veränderungsprozessen durch gezielte Lehrkräftefortbildungen, sowohl mit Blick auf die Gestaltung von Schüler:innenpartizipation als auch auf digitale Transformation an Schulen. Darüber hinaus werden Bedingungen und mögliche Wirkungen von Schüler:innenpartizipation an digitalen Transformationsprozessen in den Blick genommen. Zuletzt wird mit dem Projekt eine methodische Verzahnung zwischen den Inhalten der Workshops (Design Thinking) und der übergreifenden Entwicklung des Fortbildungskonzepts (designbasierte Forschung) erprobt und untersucht. Diskussion: Im Rahmen der Posterpräsentation möchten wir mögliche Herausforderungen der Implementation unseres Konzepts sowie die methodischen Möglichkeiten unserer Evaluations- und Implementationsforschung diskutieren. Poster Viel hilft viel? Eine Untersuchung des Zusammenhangs von Feedback und Leseleistung für verschiedene Schülergruppen und Länder Simon Munk, Lisa Ziernwald, Jörg-Henrik Heine, Doris Holzberger Technische Universität München, Deutschland 1. Theoretischer Hintergrund Lesen gilt als Schlüsselkompetenz für gesellschaftliche Teilhabe und Bildungserfolg (Graham & Perin, 2007; OECD, 2019). Jüngste Befunde zeigen jedoch, dass viele Schülerinnen diese Grundfähigkeiten nicht ausreichend besitzen (McElvany et al., 2023). Eine Möglichkeit, Schülerinnen beim Lesen zu unterstützen, kann Feedback durch die Lehrkraft sein (Hattie, 2023). Experimentelle Befunde zeigen unabhängig vom Schulfach, dass Feedback zu einem höheren Lernerfolg führen kann (Wisniewski et al., 2020). Betrachtet man jedoch nicht-experimentelle Studienergebnisse, so findet man häufig nur schwache Zusammenhänge zwischen Feedback und Leseleistung (Ma et al., 2022; Yan & Chiu, 2022). Damit bleibt offen, warum sich entgegen theoretischer Annahmen und experimenteller Befunde keine stärkeren positiven Zusammenhänge zwischen Feedback und Leseleistung zeigen. Wir wollen deshalb dazu beitragen, den Zusammenhang besser zu verstehen und die Generalisierbarkeit über verschiedene Schülergruppen und Länder hinweg untersuchen. Hierfür analysieren wir erstens die Verteilung von Feedback auf Schülerinnen unterschiedlicher Kompetenzstufen. Bisherige Befunde zeigten, dass Lehrkräfte häufiger mit leistungsstarken Schülerinnen interagieren, da sie sich beispielsweise erhoffen, so zügiger im Unterrichtsgespräch voran zu kommen (Decristan et al., 2020). Gleichzeitig zeigte Sacher (1995), dass Lehrkräfte beim Aufrufen von Schülerinnen, die sich nicht gemeldet haben, stärker auf leistungsschwache Schülerinnen zurückgreifen, möglicherweise um sicherzugehen, dass diese nicht den Anschluss verlieren. Wir nehmen deshalb an, dass Lehrkräfte ihr Feedback nicht gleichmäßig auf Schülerinnen unterschiedlicher Kompetenzstufen verteilen. Erhalten einige Schülerinnen mehr und andere weniger Feedback, so könnten sich die Effekte ausgleichen und somit eine Erklärung für die schwachen Zusammenhänge zwischen Feedback und Leseleistung in nicht-experimentellen Settings sein. Zweitens betrachten wir, ob Schülerinnen, die zuhause eine andere Sprache als in der Schule sprechen (sogenannte Multilingual Learners), unterschiedlich von Feedback hinsichtlich ihrer Leseleistung profitieren. Multilingual Learners zeichnen sich durch eine durchschnittlich niedrigere Leseleistung (Yan & Chiu, 2022) und weniger Unterstützung durch die Eltern bei sprachlichen Problemen (Göbel et al., 2011) aus. Multilingual Learners könnten aufgrund dieser doppelten Benachteiligung stärker auf Lehrkräftefeedback angewiesen sein und deshalb mehr davon profitieren. Um Aussagen zur Generalisierbarkeit des Zusammenhangs zwischen Feedback und Leseleistung treffen zu können, untersuchen wir daher die moderierende Rolle der zuhause gesprochenen Sprache. Neben den Unterschieden zwischen verschiedenen Schülergruppen könnten auch Unterschiede zwischen Ländern ein Grund für die schwachen Zusammenhänge zwischen Feedback und Leseleistung sein. Auch hier könnten sich die Effekte aus unterschiedlichen Ländern in internationalen Studien ausgleichen. Bisherige Befunde weisen darauf hin, dass sowohl Feedback als auch die Rolle der zuhause gesprochenen Sprache je nach Kontext im jeweiligen Land variiert (De Luque & Sommer, 2000; Finch et al., 2021; Heine et al., 2001). 2. Fragestellungen* In unserem Beitrag beleuchten wir die folgenden drei Forschungsfragen: Wie groß ist der Zusammenhang zwischen Feedback und Leseleistung? Wie verteilen Lehrkräfte ihr Feedback auf Schülerinnen unterschiedlicher Kompetenzstufen? Unterscheidet sich der Zusammenhang für Multilingual Learners? Um die Generalisierbarkeit der Ergebnisse über Ländergrenzen hinweg besser einschätzen zu können, führen wir die Analysen getrennt für jedes Land und über alle Länder hinweg durch. 3. Methode* Um die Forschungsfragen zu untersuchen, analysieren wir den PISA 2018-Datensatz mit N = 505.906 Schülerinnen (50,35 % weiblich; durchschnittlich 15,79 Jahre alt) aus 75 Ländern. Hierbei verwenden wir ein metaanalytisches Vorgehen (Brunner et al., 2022). In einem ersten Schritt berechnen wir die Ergebnisse getrennt für jedes Land und integrieren sie dann in einem zweiten Schritt zu einem größeren Gesamtbild, wodurch wir gezielt die Heterogenität zwischen den Ländern analysieren können. 4. Ergebnisse* Unsere Ergebnisse zeigen, dass Lehrkräfte ihr Feedback ungleich auf Schülerinnen unterschiedlicher Kompetenzstufen verteilen. Entgegen unserer Annahmen scheinen jedoch Multilingual Learners nicht unterschiedlich von Feedback zu profitieren. Weiter zeigen sich deutliche Unterschiede zwischen den Ländern. Damit könnten die schwachen Zusammenhänge zwischen Feedback und Leseleistung an einer ungleichen Verteilung von Feedback und Länderunterschieden liegen. Poster Same same but different? Eine latente Multigruppen-Profilanalyse von berufsbezogenen digitalen Kompetenzüberzeugungen (angehender) Lehrkräfte Jennifer Quast¹, Charlott Rubach², Raphaela Porsch¹ ¹Otto-von-Guericke Universität Magdeburg, Deutschland; ²Universität Rostock, Deutschland Die Entwicklung berufsbezogener digitaler Kompetenzüberzeugungen stellt eine wichtige Aufgabe für die Aus- und Weiterbildung von Lehrkräften dar (Eickelmann & Drossel, 2020). Lehramtsstudierende und Lehrkräfte stellen jedoch hinsichtlich ihrer berufsbezogenen digitalen Kompetenzüberzeugungen in verschiedenen Kompetenzbereichen keine homogenen Gruppen dar (Akyuz, 2023; Aslan & Zhu, 2016; Chen et al., 2023). Die Lehrkräftebildung steht demnach vor der Herausforderung, der Heterogenität (angehender) Lehrkräfte in ihren berufsbezogenen digitalen Kompetenzüberzeugungen angemessen zu begegnen. Personenzentrierte Ansätze, wie latente Profilanalysen, ermöglichen es, innerhalb einer Population Personen mit ähnlichen Merkmalen zu Profilen zusammenzufassen und stellen damit eine Möglichkeit dar, die Heterogenität (angehender) Lehrkräften zu erfassen. Bisher gibt es erst wenige Arbeiten, die Profile berufsbezogener digitaler Kompetenzüberzeugungen von Lehramtsstudierenden (z. B. Tondeur et al., 2017) und Lehrkräften (z. B. Schulze-Vorberg et al., 2021) erstellten. Unseres Wissens nach hat bislang noch keine Studie ausschließlich berufsbezogene digitale Kompetenzüberzeugungen (angehender) Lehrkräfte in verschiedenen Kompetenzdimensionen mithilfe latenter Profilanalysen untersucht und überprüft, welche Profillösungen sich in beiden Gruppen zeigen. Solche Befunde sind jedoch von hoher Relevanz, um individuelle Entwicklungsbedarfe von Lehramtsstudierenden und Lehrkräften in den unterschiedlichen Kompetenzbereichen festzustellen und um diese Bedarfe in der Aus- und Weiterbildung zu berücksichtigen. Mithilfe einer latenten Multigruppen-Profilanalyse (Morin, 2016) werden Profile von berufsbezogenen digitalen Kompetenzüberzeugungen (angehender) Lehrkräfte erstellt und folgende Fragestellungen beantwortet: Welche Profile berufsbezogener digitaler Kompetenzüberzeugungen von (angehenden) Lehrkräfte lassen sich unterscheiden? Stimmt die Anzahl an Profilen zwischen beiden Gruppen überein? Wie ähnlich sind sich die Profile berufsbezogener digitaler Kompetenzüberzeugungen von Lehramtsstudierenden und Lehrkräften? Für die Analysen wurden Daten von n = 698 Lehrkräften (72.0 % weiblich) und n = 524 Lehramtsstudierenden (74.8 % weiblich) aus Deutschland verwendet, die im Mai/Juni 2020 an einer Online-Befragung im Rahmen des DigiKompEL-Projekts (Rubach & Lazarides, 2017-2020) teilgenommen haben. Die berufsbezogenen digitalen Kompetenzüberzeugungen wurden mittels eines Instruments auf Grundlage des DigCompEdu-Rahmenmodells (Redecker & Punie, 2017) erfasst (Quast et al., 2023). Das Instrument umfasst 33 Items in sieben Skalen: 1) Administration und Weiterbildung, 2) Unterrichtsplanung, 3) Lehren und Unterstützung von Schülerinnen, 4) Evaluation, 5) Schülerinnenorientierung, 6) Förderung der Digitalen Kompetenz der Schülerinnen sowie 7) Datenschutz und Urheberrecht. Die Items wurden auf einer 5-stufigen Likertskala (1 = gar nicht kompetent bis 5 = sehr kompetent) bewertet. Zur Beantwortung der Forschungsfragen wurden für beide Gruppen getrennt latente Profilanalysen unter Berücksichtigung sechs verschiedener Spezifikationen der Varianz-Kovarianz-Matrix durchgeführt (Fragestellung 1). Die jeweils besten Profillösungen beider Gruppen wurden dann in einer latenten Multigruppen-Profilanalyse (Fragestellung 2) miteinander verglichen. Die Ergebnisse zeigen, dass sich beide Gruppen in drei Profile unterteilen lassen: eher niedrige (Profil 1), mittlere-ambivalente (Profil 2) und eher hohe (Profil 3) berufsbezogene digitale Kompetenzüberzeugungen. Da sich beide Gruppen mit jeweils drei Profilen abbilden lassen, sind die Voraussetzungen für die Durchführung einer latenten Multigruppen-Profilanalyse gegeben. Die Ergebnisse der latenten Multigruppen-Profilanalyse zeigen, dass zwischen den drei Profilen beider Gruppen eine konfigurale Ähnlichkeit (configural similarity) besteht. Es lässt sich jedoch lediglich eine partielle strukturelle Ähnlichkeit (structural similarity) zwischen den drei Profilen beider Gruppen feststellen. Ein Profilpaar unterscheidet sich in einer Kompetenzdimension strukturell voneinander: Die Lehramtsstudierenden des mittleren-ambivalenten Profils berichten in der Kompetenzdimension ‚Datenschutz und Urheberrecht‘ niedrigere Kompetenzüberzeugungen als die Lehrkräfte aus dem mittleren-ambivalenten Profil. Die berufsbezogenen digitalen Kompetenzüberzeugungen der Lehramtsstudierenden im mittleren-ambivalenten Profil in ‚Datenschutz und Urheberrecht‘ liegen knapp über den Kompetenzüberzeugungen der niedrigen Profile der Lehramtsstudierenden und Lehrkräfte. Das entstandene Modell partieller struktureller Ähnlichkeit weist jedoch sowohl eine Ähnlichkeit der Streuung (dispersion similarity) als auch der Verteilung (distributional similarity) auf. Die Analysen weisen demnach darauf hin, dass die Profile berufsbezogener digitaler Kompetenzüberzeugungen von Lehrkräften und Lehramtsstudierenden – mit Ausnahme einer Kompetenzdimension in den mittleren-ambivalenten Profilen beider Gruppen – fast identisch sind. Detailliertere Ergebnisse der getrennt durchgeführten latenten Profilanalysen und der latenten Multigruppen-Profilanalyse sollen auf der Tagung vorgestellt und diskutiert werden. Poster Validierung eines Fragebogens zur Erfassung allgemeiner und domänenspezifischer Überzeugungen mittels psychometrischer Netzwerke Eric Klopp, Robin Stark Universität des Saarlandes, Deutschland Theoretischer Hintergrund Epistemologische Überzeugungen (eÜ) sind ein wichtiger Prädiktor wissenschaftlichen Denkens in einer Disziplin (Fischer et al., 2014), wobei allgemeine und domänenspezifische Überzeugungen unterschieden werden können (Muis et al., 2006). Zur Untersuchung der Zusammenhänge zwischen epistemologischen Überzeugungen und anderen Konstrukten wie z.B. Studienleistungen, sind valide Skalen zur Erfassung sowohl allgemeiner als auch domänenspezifischer eÜ erforderlich. Entwickelt wurden Items zur Erfassung der folgenden sechs Dimensionen (vgl. Klopp et al., akzeptiert): Persönliche Rechtfertigung (PR), Rechtfertigung durch Autoritäten (RA), Rechtfertigung durch verschiedene Quellen (RQ), Rechtfertigung durch die Wissenschaftliche Gemeinschaft (RG), Sicherheit des Wissens (SW) und Reflexive Natur (RN). Die Items sind so konstruiert, dass diese sich im Falle allgemeiner eÜ auf Wissenschaft im Allgemeinen beziehen, während die domänenspezifischen Items durch Austausch des Ausdrucks „Wissenschaft“ auf eine Domäne angepasst werden können. Die vorliegende Studie behandelt die Untersuchung der strukturellen Validität des Fragebogens, sowohl für allgemeine als auch domänenspezifische eÜ, mittels psychometrischer Netzwerke (Constantini et al., 2014). Ein Netzwerk besteht aus Knoten, welche die Items repräsentieren, und die durch Kanten verbunden sind. Die Kanten repräsentieren paarweise Interaktionen zwischen den Knoten, die im Sinne von Partialkorrelationen zu verstehen sind. Ein wichtiges Element ist die Schätzung der im Netzwerk vorhandenen Kanten, wobei üblicherweise Regularisierungsverfahren eingesetzt werden (Epskamp et al., 2017). Weiterhin lassen sich in Netzwerken Communities nachweisen. Das sind Gruppen von Knoten, die untereinander hohe Gemeinsamkeiten aufweisen. Somit sollten die zu einer Skala gehörenden Items als Community im Netzwerk nachzuweisen sein (Briganti et al., 2018; Golino & Epskamp, 2017). Fragestellung Im Folgenden werden die Hypothese untersucht, dass sich die sechs genannten eÜ-Dimensionen sowohl für die allgemeine als auch die domänenspezifische Version des Fragebogens im Sinne von Communities im Sinne struktureller Validität in einem Netzwerk nachweisen lassen. Methode Die Netzwerke wurden anhand einer Stichprobe von 232 Lehramtsstudierenden für die allgemeinen eÜ und 262 Lehramtsstudierenden für die domänenspezifischen eÜ mittels EBICglasso-Regularisierung geschätzt (λ=.25; Epskamp et al., 2017). Die domänenspezifischen Items bezogen sich auf die Domäne Bildungswissenschaften. Zur Absicherung des Netzwerkstruktur wurde die Akkuratheit der Kanten sowie die Stabilität des Netzwerkes mithilfe der Bootstrap-Methode mit 1000 Bootstrapstichproben untersucht (Epskamp et al., 2018). Zur Bestimmung der Community-Struktur wurde der Spinglass-Algorithmus eingesetzt (Yang et al., 2016). Ergebnisse Hinsichtlich der Stabilität zeigte sich nur eine geringe Abweichung der geschätzten Werte vom Mittelwert des Bootstraps (max. Abweichung von Schätzer und Booststrapmittelwert: 0.025 allgemein, 0.045 domänenspezifisch). Auch wiesen das Netzwerk ausreichende Stabilitäten auf (CSa=.593, CSd=.596). Für allgemeine eÜ ergab sich ein Netzwerk mit sechs Communities, die mit der Ausnahme eines Items der Skala RG die ursprünglichen Skalen repräsentierten. Das Item der RG-Skala wurde der Community zugeordnet, die RN repräsentiert, und bezieht sich auf die diskursive Entstehung von Wissen in der wissenschaftlichen Gemeinschaft. Für domänenspezifische eÜ ergab sich ein Netzwerk mit fünf Communities, wobei die Items der Dimension RA und SW zusammen eine Community bilden. Weiterhin wurden zwei Items, eines davon das gleiche wie im Falle des Netzwerks für allgemeine eÜ, der Community zugeordnet, die die Skala RN repräsentiert. Das andere Item wurde ursprünglich der Skala RQ zugeordnet und bezieht sich auf die Bestätigung von Wissen durch verschiedene Evidenzquellen. Diskussion Für allgemeine eÜ zeigt sich eine robuste Netzwerkstruktur, welche die vorgesehenen Dimensionen abbildet. Im Fall domänenspezifischer Skalen zeigt sich ein Zusammenfallen der Skalen RA und SW in eine Community, was darauf hindeutet, dass Lehramtsstudierende Aspekte der Sicherheit von Wissen mit der Rechtfertigung von bildungswissenschaftlichen Aussagen in Verbindung bringen. Die beobachteten Verschiebungen einiger Items, sowohl im Fall allgemeiner als auch domänenspezifischer eÜ zu anderen Skalen sind inhaltlich nachvollziehbar und legen eine geringfügige Revision dieser Items nahe. Allerdings sollte die Communitystruktur auch hinsichtlich anderer Domänen als die Bildungswissenschaften und auch mit anderen Stichproben geprüft werden. Poster Förderung der Lernzielorientierung im Biologieunterricht durch autonomieförderliches Lehrerverhalten Nadine Großmann, Matthias Wilde, Tim Kirchhoff Universität zu Köln, Deutschland Theoretischer Hintergrund Obwohl die Lernmotivation der Schüler:innen substantiell zum erfolgreichen Lernen beiträgt und als ein bedeutsames Qualitätsmerkmal von Unterricht gilt (Helmke, 2009), sind negative Veränderungen im Verlauf der Schullaufbahn zu verzeichnen (Spinath et al., 2016). Dies gilt im Besonderen für Lernzielorientierungen (Spinath et al., 2016). Lernzielorientierungen stellen neben Leistungszielorientierungen zentrale Dimensionen motivationaler Orientierung dar (Ames, 1992). Verfolgen Individuen Lernziele, so wollen sie ihre Kompetenzen erweitern oder Neues lernen (Ames, 1992). Hingegen fokussieren Leistungsziele die Demonstration von Kompetenzen (Annäherungs-Leistungsziel) oder das Vermeiden, Inkompetenz zu zeigen (Vermeidungs-Leistungsziel) (Ames, 1992). Lernzielorientierungen werden positive Effekte auf die Leistung (Spinath, 2009) und die intrinsische Motivation von Schüler:innen (Benita et al., 2014; Elliot & Church, 1997) zugeschrieben. Ames (1992) beschreibt im TARGET-Modell Strategien zur Förderung von Lernzielorientierungen (s. auch Benning et al., 2019). Demnach soll das Angebot vielfältiger und interessierender Aufgaben den Lernenden bedeutungsvolle Lernaktivitäten bieten und ihre Lernzielorientierung positiv beeinflussen (Ames, 1992). Hierfür könnte autonomieförderliches Lehrerverhalten eine Umsetzungsmöglichkeit sein. Verhalten sich Lehrkräfte autonomieförderlich, so verdeutlichen sie z.B. die persönliche Relevanz eines Unterrichtsthemas oder ermöglichen den Schüler:innen Wahlmöglichkeiten, um die Aktivitäten vielfältig zu gestalten (Su & Reeve, 2011). Empfinden die Schüler:innen eine Aufgabe als persönlich bedeutsam und können Entscheidungen über ihren Lernprozess treffen, so möchten sie wahrscheinlich die Aufgabe verstehen und ihre Fähigkeiten verbessern. Dies könnte sich positiv auf ihre Lernzielorientierung auswirken (Ames, 1992). Jedoch neigen Lehrkräfte oft zu kontrollierendem Verhalten (Martinek, 2010), welches wettbewerbsfokussiert ist und externale Handlungsanreize betont (Reeve, 2015). Dies fördert vermutlich keine Lernzielorientierung, sondern eine Leistungszielorientierung (Ames, 1992). Hypothesen Aufgrund dieser theoretischen Überlegungen ergeben sich folgende Hypothesen: H₁: Schüler:innen, die autonomieförderlich unterrichtet werden, haben eine stärker ausgeprägte Lernzielorientierung als Schüler:innen, die kontrollierend unterrichtet werden. H₂: Schüler:innen, die kontrollierend unterrichtet werden, haben eine stärker ausgeprägte Leistungszielorientierung als Schüler:innen, die autonomieförderlich unterrichtet werden. Methode In einer quasi-experimentellen Studie wurden 150 Schüler:innen der sechsten Jahrgansstufe (M_Alter=11.46 Jahre, SD_Alter=0.55 Jahre, 52% weiblich) im Fach Biologie unterrichtet. In fünf Klassen (n=86) wurde autonomieförderliches Lehrerverhalten und in vier Klassen (n=64) kontrollierendes Lehrerverhalten implementiert. Die Unterrichtssequenz zum Thema Ernährung und Verdauung umfasste insgesamt 180 Minuten. Die Dimensionen der Zielorientierungen wurden mithilfe der Skalen zur Erfassung der Lern- und Leistungsmotivation nach Spinath et al. (2012) erfasst. Die genutzten Items bezogen sich im Pretest auf die Zielorientierung im regulären Biologieunterricht (α=.81–.85), und im Posttest auf den durchgeführten Unterricht mit variiertem Lehrerverhalten (α=.88–.93). Als Implementationskontrolle wurde eine übersetzte und adaptierte Version des Fragebogens Perceived Self-Determination nach Reeve (2002) eingesetzt, um die Autonomiewahrnehmung der Schüler:innen zu erheben (α=.86). Um zu prüfen, ob sich die Autonomiewahrnehmung sowie die Zielorientierungen der Schüler:innen nach der durchgeführten Unterrichtseinheit in Abhängigkeit des Treatments unterscheiden, wurden eine ANOVA und eine MANCOVA durchgeführt. Ergebnisse und Diskussion Die Autonomiewahrnehmung ist bei den Schüler:innen, die autonomieförderlich unterrichtet wurden (M=3.15, SD=0.56), im Durchschnitt höher als bei den kontrollierend unterrichteten Schüler:innen (M=2.50, SD=0.82). In der ANOVA ergeben sich signifikante Unterschiede in der Autonomiewahrnehmung (F(1, 148)=33.26, p<.001, η²=.18). Dies deutet auf eine gelungene Implementation des Lehrerverhaltens hin. Die Lernzielorientierung ist bei den autonomieförderlich unterrichteten Schüler:innen (M=2.93, SD=0.60) durchschnittlich stärker ausgeprägt, als bei den kontrollierend unterrichteten Schüler:innen (M=2.34, SD=1.07). Die MANCOVA ergibt signifikante Unterschiede zwischen den Treatments für die Lernzielorientierung (F(1,148)=17.95, p<.001, η²=.11). Für die Annäherungs-Leistungszielorientierung (F(1,148)=0.18, p=.67) und die Vermeidungs-Leistungszielorientierung (F(1,148)=0.01, p=.91) ergeben sich keine signifikanten Unterschiede zwischen den Treatments. Durch ein autonomieförderliches Lehrerverhalten kann anscheinend die Lernzielorientierung der Schüler:innen positiv beeinflusst werden. Die vermutete Nähe der Maßnahmen zur Förderung von Lernzielorientierungen und der Autonomiewahrnehmung scheint sich in der Praxis zu bestätigen. Dagegen konnte kein Einfluss des kontrollierenden Verhaltens auf die Leistungszielorientierungen gezeigt werden. Möglicherweise unterscheidet sich das kontrollierende Lehrerverhalten kaum von dem Lehrerverhalten im regulären Biologieunterricht (vgl. Martinek, 2010). Poster Gute wissenschaftliche Praxis - Digitale Lernmodule im Fach Chemie André Kolbe, Carolin Eitemüller, Katrin Schüßler, Maik Walpuski Universität Duisburg-Essen, Deutschland Theoretischer Hintergrund Gute wissenschaftliche Praxis (GWP) bildet das Fundament der Integrität in der Wissenschaft. Die Deutsche Forschungsgemeinschaft (DFG) hat im Jahr 1998 Leitlinien zur Sicherung der GWP veröffentlicht, die stetig aktualisiert werden (All European Academies, 2017). Ziel der DFG ist es, eine verbindliche Kultur wissenschaftlicher Integrität an Forschungsinstitutionen zu etablieren (Deutsche Forschungsgemeinschaft, 2022). Es ist daher unerlässlich, bereits dem wissenschaftlichen Nachwuchs während des Studiums Grundlagen der GWP zu vermitteln und damit eine ehrliche Wissenschaftskultur zu fördern. Fuerholzer et al. (2020) entwickelten GWP-Kurse für Medizinstudierende und konnten eine signifikante Veränderung im Wissen und den Einstellungen der Studierenden gegenüber den Leitlinien der GWP zeigen. Allerdings fehlen flächendeckende GWP-Module für die naturwissenschaftlichen Fächer sowie Erkenntnisse über lernwirksame Merkmale solcher Module. Für das Selbststudium spielen in diesem Zusammenhang multimediale Lernmaterialien eine wichtige Rolle, da sie motivationale und organisatorische Anreize für eine vertiefte Auseinandersetzung liefern und einen deutlichen Mehrwert hinsichtlich der Lernwirksamkeit gegenüber Paper-Pencil-Lernmaterialien bieten (Damnik et al., 2018). Dabei können interaktive Lernmaterialien das Lernen effektiver und effizienter gestalten und zu einem tieferen konzeptuellen Verständnis beitragen (Baumgartner & Herber, 2013) und generative Aktivitäten können eine aktive Auseinandersetzung mit den Lerninhalten bewirken (Fiorella, 2021). Für eine gute wissenschaftliche Praxis erscheint neben der Kenntnis entsprechender allgemeiner Regeln vor allem die Umsetzung der Regeln, die meist an komplexe und vor allem fachspezifische Situationen gebunden ist, besonders wichtig. Es ist daher anzunehmen, dass Fallbeispiele eine besonders gute Lerngelegenheit sein können (Zumbach et al., 2008). Da Sogunro (2014) zeigen konnte, dass textlastige Lerninhalte die Motivation negativ beeinflussen und das Lernen behindern, können die Lernmaterialien durch Fallbeispiele im Comicstil textlich entlastet werden. Comics können zudem die Lernmotivation steigern und ermöglichen es Lerninhalte interessant zu präsentieren (Fitri Dwi Arini et al., 2016; Sipayung et al., 2020). Bisher wurde allerdings nicht untersucht, ob digitale Selbstlernmaterialien, die mit Fallbeispielen in Form von Comics angereichert wurden, den Erwerb von GWP besser ermöglichen als Lernmaterialien ohne Comics. Fragestellung Es sollen daher folgende Forschungsfragen untersucht werden: FF1:Inwiefern wirken die digitalen Lernmodulen auf die kognitive Belastung, die Usability und die Motivation bei Studierenden? FF2:Inwiefern kann mit digitalen Lernmodulen der Erwerb GWP bei Studierenden gefördert werden? FF3:Inwiefern unterscheiden sich digitale Lernmodule mit Comics von Lernmodulen ohne Comics hinsichtlich Lernwirksamkeit, kognitiver Belastung und Usability? FF4:Inwiefern unterscheiden sich digitale Lernmodule mit Comics von Lernmodulen ohne Comics hinsichtlich der Motivation? Methode Im Rahmen eines Kooperationsprojekts an drei nordrheinwestfälischen Universitäten besteht die Gelegenheit, GWP-Module für Bachelor-, Master- und Promotionsstudierende der Naturwissenschaften als Selbstlernmaterialien zu entwickeln und empirisch zu untersuchen. Die Forschungsfragen sollen mittels Pre-Post-Kontrollgruppen-Designs an Chemiestudierenden der Bachelor-, Master- und Promotionsstudiengänge mit einer Stichprobengröße von 150 Studierenden untersucht werden. Da zur Tagung nur Daten zur ersten Forschungsfrage vorliegen werden, wird im Folgenden ausschließlich die darauf bezogene Methodik erläutert. Zu Beginn des Wintersemesters 2023/2024 wird eine digitale GWP-Lerneinheit mit einer Stichprobe aus 70 Bachelor-, Master- und Promotionsstudierenden hinsichtlich (a) kognitiver Belastung, (b) Usability und (c) Motivation evaluiert. Die kognitive Belastung wird während der Bearbeitung mit Items von Kalyuga et al. (2001) und Paas (1992) und abschließend mit Items von Krieglstein et al. (2023) erhoben. Die Usability wird mit Items nach Schrepp (2023) und die Motivation mit Items nach Breyer und Bluemke (2016) erhoben. Die Ergebnisse dieser ersten Studie werden auf der Tagung präsentiert. Ausblick Der praktische Ertrag des Projekts besteht in der Entwicklung von evaluierten GWP-Lerneinheiten. Diese können zu GWP-Modulen zusammengestellt und in bestehende Curricula integriert werden. Einen theoretischen Beitrag liefert die Studie durch Erkenntnisse zur Lernwirksamkeit von Fallbeispielen im Comicstil in GWP-Lernmodulen unter Berücksichtigung kognitiver Belastung, Usability und Motivation. Poster Überzeugungen und weitere Teilnahmedeterminanten Jugendlicher in Bezug auf Making-Aktivitäten: Eine Interviewstudie Sophie Uhing¹, Kathrin Smolarczyk², Stephan Kröner¹ ¹Lehrstuhl für Empirische Bildungsforschung, Friedrich-Alexander-Universität Erlangen-Nürnberg; ²Hochschule Rhein-Waal Während jüngere Kinder sich noch relativ leicht für Naturwissenschaften und Technik begeistern lassen, sinkt dieses Interesse ab dem Alter von 12 Jahren stetig (Trotman, 2017), insbesondere bei Mädchen (Sadler et al., 2012). Die Förderung von Freizeitaktivitäten im MINT-Bereich (Mathe, Informatik, Naturwissenschaften und Technik) könnte geeignet sein, dieser Entwicklung zu begegnen (Posner & Vandell, 1999; Smolarczyk & Kröner, 2023). Dies betrifft auch die Förderung von Making, d. h. der Verwendung von 3D-Druckern, Lasercuttern oder Mikrocontrollern zur Herstellung individueller Artefakte. Derartige Making-Aktivitäten finden häufig in Makerspaces und Fab Labs statt und bergen ein enormes Potenzial, Jugendliche für MINT (Smolarczyk & Kröner, 2023) zu begeistern. Um Konzepte für die Motivierung von Kindern und Jugendlichen, insbesondere von Mädchen, für freizeitliches Making zu entwickeln, ist es wichtig, die dafür einschlägigen Überzeugungen zu kennen. Um diese zu erheben, haben wir im Rahmen des BMBF-geförderten Projekts EnvironMINT eine Interviewstudie auf Basis der Theorie des geplanten Verhaltens (TPB; Ajzen, 1991) mit N = 29 Teilnehmende (weiblich: n = 14) im Alter von 11 bis 15 Jahren durchgeführt. Eine deduktiv-induktive qualitative Inhaltsanalyse (Mayring, 2014) ergab ein differenziertes Kategoriensystem. Es fanden sich Überzeugungen zu den deduktiv gesetzten Kategorien hinsichtlich der TPB-Konstrukte verhaltensbezogene Einstellungen, personen- und umweltbezogene Kontrollüberzeugungen und subjektive Norm. Diese konnten induktiv in weitere Subkategorien unterteilt werden. Bei den verhaltensbezogenen Einstellungen stellten sich Einstellungen in Bezug auf eigene Gestaltungsmöglichkeiten als besonders bedeutsam heraus. Den Befragten gefiel die Idee, eigene Gegenstände entwerfen zu können sowie an bestehende Hobbies anzuknüpfen. In Bezug auf personenbezogene Kontrollüberzeugungen wurden u. a. – meist negative – Selbstwirksamkeitserwartungen genannt. Die Teilnehmenden gaben an, dass sie sich nicht sicher wären, ob sie Making-Aktivitäten nachgehen könnten, da ihnen diese Aktivitäten kompliziert erschienen und sie nicht sicher seien, ob sie die Aktivitäten bis zum Ende durchführen würden. Bei umweltbezogenen Kontrollüberzeugungen wurden z. B. Aussagen zu (gewünschten) Hilfestellungen getätigt. Diese bezogen sich darauf, dass die Befragten sich wünschten, von anderen Personen Unterstützung zu erhalten. Ferner gaben die Befragten mehrheitlich an, keine Orte zu kennen, an den Making-Aktivitäten möglich sind. In Bezug auf die subjektive Norm wurde vor allem genannt, dass die Familie oder Freunde es gut fänden, wenn die Befragten Making-Aktivitäten nachgingen. Es zeigte sich, dass die befragten Kinder und Jugendlichen Making-Aktivitäten grundsätzlich offen gegenüberstehen. Hervorstechend war, dass die Mehrheit der Jugendlichen keine Orte kannte, an denen Making-Aktivitäten möglich sind. Um Makerspaces als derartige Orte bekannter zu machen könnte es helfen, deren Zusammenarbeit mit Schulen zu stärken, insbesondere mit solchen, an denen hohe Anteile benachteiligter Jugendlicher zu finden sind (Aschbacher et al., 2009). Ebenfalls auffällig war die insgesamt geringe makingbezogene Selbstwirksamkeit der befragten Jugendlichen. Vor deren Hintergrund erscheint es naheliegend, an dieser Stelle bereits zu oder vor Beginn von Making-Aktivitäten fördernd einzuwirken. Außerdem erscheint es hilfreich, mit Makingangeboten an bestehende Hobbies von Jugendlichen anzuknüpfen und so bereits bestehende von Jugendlichen auch für die Making-Förderung zu nutzen. Es wird diskutiert, wie das erstellte Kategoriensystem für die Entwicklung eines Fragebogens zur Erhebung von Maker-Überzeugungen genutzt werden kann, der in künftigen Studien zur Erhebung der Effekte von Interventionen auf makingbezogene Überzeugungen von Jugendlichen genutzt werden kann. Poster Längsschnittstudie zur Entwicklung des ePCK von Lehramtsstudierenden in einer simulationsbasierten Videolernumgebung – Machen Scaffolds den Unterschied? Dagmar Traub, Marie Irmer, Eva Weiß, Birgit J. Neuhaus Ludwig-Maximilians-Universität München, Deutschland Theoretischer Hintergrund Die Beschreibung des fachdidaktischen Professionswissen von Lehrkräften kann mit Hilfe des Refined Consensus Model (RCM) of PCK geschehen (Carlson & Daehler, 2019), wobei zwischen drei PCK-Bereichen unterschieden wird: (1) dem collective PCK (cPCK), das dem gesammelten und publiziertem fachdidaktischen Wissen entspricht, das in der Community geteilt wird, (2) dem personal PCK (pPCK), welches sich auf das fachdidaktische Wissen einer einzelnen Person bezieht und (3) dem enacted PCK (ePCK), das in konkreten Unterrichtssituationen gezeigt wird. Um Studierende bereits früh Einblicke in Unterrichtssituationen zu ermöglichen und so an das handlungsorientierte ePCK heranzuführen, kann der Einsatz von simulationsbasierten Videolernumgebungen sinnvoll sein (Südkamp et al., 2008). Die im Rahmen der DFG-Forschergruppe Cosima entwickelte Videolernumgebung DiKoBi (Kramer et al., 2020) ermöglicht diesen Zugang. Studierende sollen nach dem Konzept des Professional Vision (Seidel & Stürmer, 2014) biologiespezifische Aspekte von Unterrichtsqualität in Unterrichtssituationen beschreiben, erklären und Handlungsalternativen aufzeigen, wobei sie ihr ePCK trainieren. Fragestellung Das fachdidaktische Studium kann mit Hilfe des RCM (Carlson & Daehler, 2019) beschrieben werden. Studierende bauen im Verlauf des Studiums sukzessive ihr fachdidaktisches Wissen auf. Während in den ersten Vorlesungen ein stärkerer Fokus auf fachdidaktischen Theorien und damit dem cPCK liegt, wenden Studierende dieses Wissen in den darauffolgenden Semestern auf die Planung von ersten Unterrichtseinheiten an, bevor sie schließlich gegen Ende des Studiums in Schulpraktika Unterricht selbst gestalten (ePCK). Offen ist jedoch, ob sich diese Entwicklung von deklarativem hin zu prozeduralem Wissen, und damit ePCK, tatsächlich so finden lässt. Wir stellen uns die Fragen: Wie entwickelt sich das ePCK von Lehramtsstudierenden der Biologie im Verlauf ihres biologiedidaktischen Studiums? Kann die Entwicklung von ePCK durch die Verwendung fachdidaktischer Hilfestellungen in Form von Scaffolds unterstützt werden? Methode Mit Studierenden für das Lehramt Biologie am Gymnasium wurde eine Längsschnittstudie mit zwei zeitversetzten Kohorten durchgeführt. Über einen Zeitraum von vier Semestern bearbeiteten die Studierenden mehrfach die Videolernumgebung DiKoBi (Kramer et al., 2020). Kohorte 1 (N=15) diente als Kontrollgruppe. Sie bearbeitete zu zwei Zeitpunkten die Lernumgebung: zu Beginn ihres biologiedidaktischen Studiums im 4. Semester und am Ende des 7. Semesters in der letzten biologiedidaktischen Lehrveranstaltung. Kohorte 2 (N=6) diente als Experimentalgruppe. Sie bearbeitete die Lernumgebung an fünf Messzeitpunkten jeweils im Rahmen von biologiedidaktischen Lehrveranstaltungen: im 4., 5., 6. sowie am Anfang und am Ende des 7. Fachsemesters. An den Messzeitpunkten 2-4 erhielten die Studierenden der Kohorte 2 für die Bearbeitung der Lernumgebung Hilfestellungen in Form von PCK-Scaffolds (kurze Texte, zu denen in der Lernumgebung gezeigten Aspekten von Unterrichtsqualität). Die Antworten der Studierenden wurden bezüglich der Qualität des gezeigten ePCK durch menschliche Kodierer bewertet. Zur Analyse der Veränderungen wurde eine Mixed ANOVA berechnet. Ergebnisse Die Mixed ANOVA zeigte keinen signifikanten Interaktionseffekt zwischen dem Messzeitpunkt und der Kohorte (F(1,19)=2.93, p=.103, partiales η²=.134, N=21), jedoch einen signifikanten Haupteffekt für den Messzeitpunkt auf die Leistung bezüglich des ePCK (F(1,19)=34.36, p≤.001, partiales η²=.644, N=21). Sowohl Kohorte 1 (MZP1: M=.167, SD=.078; MZP5: M=.268, SD=.085) als auch Kohorte 2 (MZP1: M=.253, SD=.127; MZP5: M=.437, SD=.152) verbesserten ihr ePCK signifikant. Diskussion Beide Kohorten konnten ihr in der Lernumgebung gezeigtes ePCK zwischen dem ersten und dem fünften Messzeitpunkt signifikant steigern. Dieses Ergebnis unterstützt die Annahme, dass im Verlauf des Studiums eine Entwicklung zu einem stärker prozedural orientierten PCK (=ePCK) vollzogen wird (vgl. Irmer et al., 2023). Interessant ist, dass bei Kohorte 2 weder die Unterstützung durch Scaffolds, noch ein Lerneffekt durch die häufigere Bearbeitung der Lernumgebung, einen signifikanten Einfluss auf diese Entwicklung hatten. Aufgrund der geringen Stichprobengröße müssen die Ergebnisse jedoch mit Vorsicht betrachtet werden. Poster Peer-Effekte in der frühkindlichen Bildungsforschung: Der Einfluss der Zusammensetzung der Peergruppe auf die Sprachkompetenz Franziska Hürlimann¹, Daniel Schmerse¹, Oliver Lüdtke^2,3 ¹Pädagogische Hochschule der Fachhochschule Nordwestschweiz, Schweiz; ²Leibniz Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN); ³Zentrum für internationale Bildungsvergleichsstudien (ZIB) Theoretischer Hintergrund Sprachkompetenzen sind für den Bildungserfolg von Kindern von zentraler Bedeutung, wobei ihre Entwicklung maßgeblich von Umwelterfahrungen geprägt wird und eng mit der sozioökonomischen Situation der Familie verbunden ist (Hoff, 2006). Heutzutage ist neben der Familie die Kindertagesstätte für die Mehrheit der Kinder eine wichtige Lernumgebung, in der sie einen wesentlichen Teil ihrer Zeit mit Gleichaltrigen interagieren (Jahreiß et al., 2018). Trotz zunehmender Forschung ist die Frage, welchen Einfluss Peergruppen in Kindertageseinrichtungen und Grundschulen auf den Erwerb sprachlicher Kompetenzen und damit künftige Bildungschancen haben, bisher unzureichend beantwortet. Der vorliegende Beitrag fokussiert in dieser Hinsicht auf die Bedeutung der sprachleistungsbezogenen und sozioökonomischen Komposition der Peergruppe. Kompositionseffekte auf Schulleistungen sind für soziale, ethnisch-kulturelle und fähigkeitsbezogene Kompositionsmerkmale inzwischen gut dokumentiert (Baumert et al., 2006; Bellin, 2009; Dumont et al., 2013; Nikolova, 2011). Nationale Arbeiten zu Sprachkompetenzen in frühkindlichen Bildungseinrichtungen haben vorrangig den Zusammenhang mit dem Anteil an Kindern mit Migrationshintergrund bzw. nicht-deutscher Familiensprache untersucht, mit uneindeutigen Befunden (Ebert et al., 2013; Hogrebe & Pomykaj, 2019; Kohl et al., 2019). Internationale Forschungsergebnisse aus dem vorschulischen Bereich legen für die durchschnittliche sprachliche Kompetenz der Peergruppe (Atkins-Burnett et al., 2017; Foster et al., 2020; Henry & Rickman, 2007; Mashburn et al., 2009) oder deren sozioökonomischer Zusammensetzung (Reid & Ready, 2013; Weiland & Yoshikawa, 2014) einen positiven Einfluss auf die individuelle Sprachentwicklung nahe, wobei die Effektgrössen erheblich variieren und auch mehrere Studien keine Hinweise auf Peer-Effekte finden (Choi et al., 2018, Riberio et al., 2017; Yang et al., 2023). Für Deutschland berichtet Schmerse (2021), dass mehrsprachige Kinder in Gruppen mit höherem Sprachniveau einen größeren Wortschatzzuwachs aufwiesen. In der Studie von Kohl et al. (2022) zeigten sich dagegen weder allgemeine noch differenzielle Peer-Effekte auf die sprachlichen Kompetenzen. Fragestellung Bislang wurde für den deutschsprachigen Kontext noch wenig untersucht, 1) inwieweit im Vorschul- und frühem Grundschulbereich ein Zusammenhang zwischen der Zusammensetzung der Peergruppe hinsichtlich der mittleren Sprachfähigkeiten und des mittleren sozioökonomischen Status (SES) mit der Sprachentwicklung eines Kinders besteht. 2) ob sich Peer-Effekte differenziell in Abhängigkeit vom a) familiären Sprachhintergrund, b) individuellen SES, sowie c) sprachlichen Ausgangsniveau zeigen. Der vorliegende Beitrag adressiert diese Fragen systematisch. Methode Bisherige Studien zu Peer-Effekten und Sprachkompetenzen basieren zumeist auf Analysen einzelner Primärdatensätze und unterscheiden sich zudem in ihren statistischen Modellierungsansätzen. Ziel der vorliegenden Untersuchung ist es, im Rahmen einer Zwei-Schritte Individual Participant Data Meta-Analyse belastbare Ergebnisse zu generieren. Dafür werden Daten aus fünf deutschen Studien mit mehr als 12.000 Kindern zwischen 2 bis 10 Jahren in etwa 1.500 Gruppen einbezogen, darunter die NEPS-Startkohorte 2 (Blossfeld & Roßbach, 2019) und BiKS-3-10 (Weinert et al., 2013). Alle berücksichtigten Studien haben den rezeptiven Wortschatz mittels etablierter Testverfahren zu mehreren Messzeitpunkten sowie nonverbale kognitive Fähigkeiten und zentrale familiäre Hintergrundmerkmale erfasst. Nach der über alle Datensätze konsistenten Behandlung fehlender Werte und Auswahl der Kovariate werden im ersten Schritt dieselben Mehrebenen-Regressionsmodelle spezifiziert, um Peer-Effekte auf die Sprachkompetenzen und Cross-Level-Interaktionen für jeden Datensatz zu schätzen. Im zweiten Schritt werden die Effektgrößen meta-analytisch zusammengefasst. Ergebnisse Vorläufige Ergebnisse einiger bisher analysierter Datensätze zeigen einen Peer-Effekt der durchschnittlichen Sprachkenntnisse (β =.12, p =.04), der allerdings nach Hinzunahme des mittleren SES der Peers nicht mehr signifikant ist. Der mittlere SES auf Gruppenebene hängt positiv (β =.01 bis .31, p ≤ .03) mit der individuellen Sprachkompetenz zusammen. Außerdem finden sich signifikante Cross-Level-Interaktionen der mittleren Sprachkenntnisse mit sprachlichem Ausgangsniveau (β = -.16 bis -.18, p = .003) sowie individuellem SES (β = -.16 bis -.19, p ≤ .019), die darauf hindeuten, dass das Sprachniveau der Gruppe vor allem bei Kindern mit niedrigem individuellen SES und sprachlichem Ausgangsniveau die individuelle Sprachkompetenz beeinflusst. Die bevorstehende Meta-Analyse wird ein umfassenderes Bild dieser Zusammenhänge liefern und mögliche Implikationen aufzeigen. Poster Kontroll- und Valenzüberzeugungen von Medizinstudierenden: Eine Längsschnittstudie Nadja Karossa¹, Thomas Rotthoff¹, Ann-Kathrin Schindler¹, Sabine Polujanski¹, Melissa Özsoy², Ulrike Nett¹ ¹Universität Augsburg, Deutschland; ²Ludwig-Maximilians Universität München Theoretischer Hintergrund Es ist mittlerweile theoretisch und empirisch belegt, dass das emotionale Erleben von Studierenden ein bedeutender Prädiktor nicht nur für die Lernleistung, sondern auch für das Wohlbefinden und die psychische Gesundheit von Studierenden ist (z.B. Izard, 2010). Die Kontroll-Wert-Theorie (Pekrun, 2006) postuliert, dass die subjektive Bewertung der objektiven Gegebenheiten einer Situation darüber entscheidet, welche Emotionen in der jeweiligen Situation erlebt werden. Zwei Komponenten sind dabei zentral:(1)die subjektive Kontrolle über die Lernsituation bzw. das Lern- und Leistungsergebnis und (2)der Wert der Lernsituation bzw. des Lern- und Leistungsergebnisses. Die Wertüberzeugungen können in die Facetten intrinsischer Wert, Nützlichkeit, Anstrengung, Kosten und Wichtigkeit unterteilt werden (Gaspard et al.,2015). Das Auftreten spezifischer diskreter studienbezogener Emotionen kann theoretisch als auch empirisch auf das Wert- und Kontrollerleben von Studierenden zurückgeführt werden (Pekrun, 2006). Eine Studie zu Emotionen von Medizinstudierenden belegte etwa Zusammenhänge zwischen Selbstkontrolle, der Vermeidung negativer Emotionen und einer daraus resultierenden positiven Selbstwirksamkeit (Duffy, 2016). Darüber hinaus gibt es für verschiedene Populationen Hinweise darauf, dass ein positives emotionales Erleben als Schutzfaktor gegenüber Belastungserleben wirkt (Bailey & Phillips, 2016). Über das emotionale Erleben von Medizinstudierenden ist bislang wenig bekannt. Dies ist ein relevanter Befund, da Medizinstudierende national wie international eine hohe Prävalenz von Depressivität aufweisen (z.B. Dyrbye et al., 2014). Zudem konnte eine zunehmende Inzidenz von Burnout und Depressivität im Verlauf des Studiums beobachtet werden (z.B. Ludwig et al.,2015). Diese Studien untersuchten die Zusammenhänge jedoch überwiegend korrelativ. Für die Untersuchung kausaler Zusammenhänge zwischen Kontroll- und Valenzüberzeugungen und Emotionen sind wiederum Längsschnittdesigns notwendig, um inter- und intraindividuelle Unterschiede sowie Veränderungen von Medizinstudierenden zu erfassen. Fragestellung Das Ziel der vorliegenden Studie besteht darin, die reziproken Zusammenhänge zwischen Kontroll- und Valenzüberzeugungen und Emotionen bei Medizinstudierenden zu untersuchen. Des Weiteren wird untersucht, wie Überzeugungen und Emotionen mit der Studienleistung zusammenhängen. Methode Die längsschnittlich konzipierte Datenerhebung fand an acht deutschen Universitäten (Studiengang Medizin) über drei Messzeitpunkte hinweg statt. Die Stichprobe setzt sich aus 2.152 Medizinstudierenden zusammen (T1:n=1.108, 73.1% weiblich, M_Alter=23.73 Jahre, SD_Alter=4.15 Jahre; T2:n=1.163, 70.2% weiblich, M_Alter=23.63 Jahre, SD_Alter=4.31 Jahre; T3:n=940, 68.5% weiblich, M_Alter=23.74 Jahre, SD_Alter=4.52 Jahre). Zu jedem Messzeitpunkt konnten neue Studierende in die Studie aufgenommen werden. So nahmen insgesamt 296 Studierende an drei Messzeitpunkten, 470 Studierende an zwei Messzeitpunkten teil. Kontrolle wurde mit der Skala zur allgemeinen Selbstwirksamkeitserwartung (Schwarzer & Jerusalem, 1999) auf einer vierstufigen Likert-Skala erfasst. Valenz wurde mit der Skala von Gaspard et al. (2015) auf einer vierstufigen Likert-Skala erhoben. Emotionen wurden mit der Medical Education Scale (Duffy, 2016) auf einer fünfstufigen Likert-Skala erfasst. Die Analysen wurden mit dem Programm Mplus (Muthén & Muthén,1998–2017) durchgeführt. Ergebnisse Mit Hilfe von Neighbour-Change-Modellen zeigt sich, dass sich die mittleren latenten Valenzüberzeugungen für den intrinsischen Wert (β=-0.185,p=.000), Nützlichkeit (β=0.104,p=.010) sowie Kosten (β=0.184,p=.000) zwischen dem ersten und zweiten Messzeitpunkt signifikant verändert haben. Für Anstrengung (β=0.253,p=.000, β=-0.119,p=.010) und Wichtigkeit (β=-0.242,p=.000, β=-0.144,p=.001) zeigen sich jeweils signifikante Veränderungen zwischen dem ersten und zweiten sowie dem zweiten und dritten Messzeitpunkt. Darüber hinaus deuten die Ergebnisse darauf hin, dass sich die Medizinstudierenden sowohl in ihren Ausgangswerten als auch in ihren Veränderungswerten unterscheiden. Deshalb werden in weiteren Analyseschritten zusätzliche Variablen aufgenommen, die diese interindividuellen Unterschiede möglicherweise aufklären können. Auf der Konferenz werden weitere Befunde zum Zusammenhang von Kontroll- und Valenzüberzeugungen und Emotionen und Leistung vorgestellt. Diskussion Die Ergebnisse deuten darauf hin, dass sich die wertbezogenen Facetten im Laufe des Erhebungszeitraums negativ verändern. Auf dieser Basis könnte überlegt werden, dass Medizinstudierende insbesondere während dieser Belastungshotspots von universitärer Seite unterstützt werden könnten, z.B. durch Beratungsangebote. Aus den Erkenntnissen lassen sich zudem gezielte gesundheitsförderliche Maßnahmen für die medizinische Ausbildung ableiten, die es Studierenden ermöglichen, präventive individuelle Voraussetzungen zu entwickeln und sich Strategien zur Bewältigung von studien- und berufsbezogenen Belastungssituationen zu erarbeiten. Poster Bildungs- und migrationsbezogene Unterschiede in der Studienabbruchneigung - Worauf lassen sie sich zurückführen und haben sie sich durch die Pandemie vergrößert? Lea Grosser, Susanne Bergann, Irmela Blüthmann, Rainer Watermann Freie Universität Berlin, Deutschland Studierende aus nicht-akademischen Elternhäusern (Heublein et al., 2017; Klein & Müller, 2020) sowie Studierende mit Migrationshintergrund (Klein & Neugebauer, 2023; Mishra & Müller, 2021) brechen ihr Studium häufiger ab. Zu den Ursachen dieser herkunftsbezogenen Ungleichheiten ist jedoch wenig bekannt. Tinto (1975) beschreibt den Studienabbruch als Ergebnis einer geringen akademischen und sozialen Integration. Diese Aspekte können je nach sozialem Hintergrund variieren (Boudon, 1974; Bourdieu, 1982, 1992) und somit herkunftsbezogene Unterschiede im Studienabbruch erklären. Für Studierende mit Migrationshintergrund könnten zusätzlich sprachliche Defizite eine Rolle spielen (Suarez-Orozco & Suarez-Orozco, 2008). Studien belegen die Bedeutung sowohl leistungsbezogener Aspekte (Isleib, 2019; Klein & Müller, 2020) als auch der sozialen Integration (Katrevich & Aruguete, 2017; Li & Carroll, 2017; Zea et al., 1997) für die Erklärung von bildungs- und migrationsbezogenen Unterschieden im Abbruchverhalten. Bislang existieren aber kaum Studien, die das Tinto-Modell zur Erklärung herkunftsbezogener Ungleichheiten herangezogen haben. Die Pandemie bedingte zusätzliche Herausforderungen, wie finanzielle Unsicherheiten und mangelnde Austauschmöglichkeiten (Becker & Lörz, 2020; Besa et al., 2021), weshalb vermutet wird, dass sich Ungleichheiten verschärft haben. Theoretisch könnte das Konzept der Digital Inequality (DiMaggio & Hargittai, 2001) einen Erklärungsansatz bieten. So könnten herkunftsbedingte Unterschiede in der technischen Ausstattung und in Digitalkompetenzen Einfluss auf die Leistungsentwicklung und den Austausch mit Studierenden und Lehrenden in digitalen Lehr-Lernformaten und damit auf die Abbruchneigung haben. Zusätzlich könnte eine unterschiedliche finanzielle Belastung eine Rolle spielen (Becker & Lörz, 2020; Meier et al., 2022; Trammell et al., 2023). Internationale Studien finden sowohl Hinweise auf bildungsbezogene Unterschiede in der technischen Ausstattung während der Pandemie (Mates et al., 2021) als auch auf eine Zunahme migrationsbezogener Unterschiede in der sozialen (Barringer et al., 2023) und akademischen Integration (Alon et al., 2023). Für Deutschland finden sich Hinweise, dass sich herkunfts- und migrationsbezogene Unterschiede in der Studienabbruchintention während der Pandemie vergrößert haben (Koopmann et al., 2023; Lörz et al. 2021). Andere Studien fanden hingegen keine pandemiebedingte Verschärfung von Ungleichheiten (Becker & Lörz, 2020; Lörz et al., 2020). Insgesamt existieren kaum vergleichende Studien zu Subgruppenunterschieden vor und während der Pandemie. Der vorliegende Beitrag untersucht 1. inwieweit sich bildungs- und migrationsbezogene Unterschiede in der Abbruchneigung auf Unterschiede in der akademischen und sozialen Integration zurückführen lassen und 2. inwieweit sich herkunftsbezogene Ungleichheiten pandemiebedingt vergrößert haben. Die Datengrundlage bilden Befragungen Masterstudierender einer größeren deutschen Universität aus 2017 (N = 1387) und 2021 (N = 1703). Einen nicht-akademischen Bildungshintergrund hatten 31% und 41% einen Migrationshintergrund. Zur Beantwortung der Fragen wurden latente Regressionsanalysen in Mplus gerechnet, in die der Befragungszeitpunkt, der Bildungs- und Migrationshintergrund sowie sukzessive die akademische Integration (Noten und Leistungsselbsteinschätzungen), die soziale Integration (soziales Klima, Zugehörigkeitsgefühl, Lehrenden-Studierenden-Beziehung) und die Erwerbstätigkeit als Prädiktoren der Studienabbruchneigung aufgenommen wurden. Die Analysen erfolgten unter Berücksichtigung der geschachtelten Datenstruktur, die Parameterschätzung erfolgte mit FIML. Um zu prüfen, ob sich herkunftsbezogene Unterschiede vergrößert haben, wurden Interaktionseffekte des Bildungs- und Migrationshintergrunds mit dem Befragungszeitpunkt berechnet. Zusätzlich wurden Subgruppenunterschiede in den technischen Voraussetzungen für die Online-Lehre (technische Ausstattung, Internetverbindung) untersucht. Die Fächergruppe, das Fachsemester, das Geschlecht und das Alter wurden in allen Analysen kontrolliert. In Bezug auf die erste Frage finden wir theoriekonform, dass die akademische und soziale Integration wesentliche Prädiktoren der Studienabbruchneigung sind. Für bildungsbezogene Unterschiede in der Abbruchneigung spielen neben der akademischen Integration vor allem Aspekte der sozialen Integration eine Rolle. Nach Kontrolle der sozialen Herkunft zeigten sich keine migrationsbezogenen Unterschiede in der Abbruchneigung. Hinsichtlich der zweiten Frage zeigten sich trotz herkunftsbezogener Unterschiede in der technischen Ausstattung keine Hinweise auf eine pandemiebedingte Verschärfung von Ungleichheiten in der Abbruchneigung. Dies gilt auch für Ungleichheiten in Bezug auf die Erwerbstätigkeit. Die Ergebnisse werden unter Berücksichtigung der Limitationen aufgrund des Studiendesigns im Vergleich zu Ergebnissen bisheriger Studien (Lörz et al., 2021) diskutiert. Poster Untersuchung der reziproken Beziehung zwischen Prüfungsangst und Vermeidungsleistungszielen Paulina Feige¹, Rebecca Lazarides², Rainer Watermann¹ ¹Freie Universität Berlin, Deutschland; ²Universität Potsdam Prüfungsangst steht in Verbindung mit zahlreichen ungünstigen schulrelevanten Merkmalen, wie einer geringen Selbstwirksamkeit oder Leistung und kann somit die akademische Entwicklung von Schülerinnen und Schülern negativ beeinflussen (von der Embse et al., 2018). Zahlreiche Studienergebnisse weisen zudem auf einen positiven Zusammenhang mit Vermeidungsleistungszielen hin (Dull et al., 2015; Eum & Rice, 2011; Lui et al., 2020; Middelton & Midgley, 1999; Putwain & Daniels, 2010; Putwain et al., 2010). Hinsichtlich der Richtung des Zusammenhangs wird angenommen, dass Vermeidungsleistungsziele durch die Fokussierung auf das Lernergebnis und das Vermeiden von Misserfolgen die Entstehung von Ängsten in Prüfungssituationen begünstigen können (Kontroll-Wert Theorie, Pekrun, 2006; Pekrun & Elliot, 2007). Diese Annahme hat sich in der Forschungsliteratur etabliert (Dull et al., 2015; Eum & Rice, 2011; Lui et al., 2020; Middelton & Midgley, 1999; Putwain & Daniels, 2010; Putwain et al., 2010). Aufgrund größtenteils querschnittlicher Studienanlagen besteht jedoch wenig solide empirische Evidenz für die angenommene Wirkrichtung. Die vorliegende Studie untersucht daher die reziproke Beziehung zwischen Prüfungsängsten und Vermeidungsleistungszielen. Dazu wurden die Daten von 1770 Schülerinnen und Schülern (51,02 % weiblich) der Trends in International Mathematics and Science Study (TIMSS) Übergangsstudie (Becker et al., 2010) in den ersten drei Jahren in der weiterführenden Schule (Klassen 5-7) in einem latenten Cross-Lagged Panel Modell ausgewertet. Prüfungsangst wurde fachunspezifisch durch die Facetten worry (3 Items, Helmke, 1992) und emotionality (4 Items, in Anlehnung an Hodapp et al., 1982) gemessen. Die Vermeidungsleistungszielorientierung wurde ebenfalls fachunspezifisch mit drei Items gemessen (in Anlehnung an Schwinger & Wild, 2006). Aufgrund der hohen Multikollinearität der beiden Prüfungsangstfacetten wurden die Zusammenhänge für worry und emotionality in separaten Modellen betrachtet. Da Mädchen und Jungen sich hinsichtlich beider Merkmale unterscheiden (Gherasim et al., 2013; von Embse et al., 2018), wurden zusätzlich Mehrgruppen- (Mädchen/Jungen) Cross-Lagged Panel Modelle berechnet, um die Ergebnisse auf Robustheit zu prüfen. In den Modellen über alle Schülerinnen und Schüler hinweg, zeigten sich unter Kontrolle standardisierter Leistungsscores in Deutsch und Mathematik signifikante kreuzverzögerte Effekte beider Prüfungsangstfacetten auf die Vermeidungsleistungsziele, wobei sich konsistentere Zusammenhänge mit worry zeigten. Es zeigten sich keine signifikanten Effekte vice versa. In den nach Geschlechtern getrennten Modellen zeigten sich ähnliche Zusammenhänge für Jungen und Mädchen, wobei die Effekte bei den Mädchen über die Zeit hinweg tendenziell stabiler waren. Im Widerspruch zu der in der Literatur vorherrschenden Annahme, dass Vermeidungsleistungsziele den Prüfungsängsten vorausgehen, deutet die vorliegende Studie auf ein umgekehrtes Wirkmuster zu Beginn der Sekundarstufe hin. Aufgrund des längsschnittlichen Designs der Studie liefern die Ergebnisse einen wichtigen Beitrag zum Verständnis der Kausalbeziehung zwischen Prüfungsängsten und Vermeidungsleistungszielen. Im nächsten Schritt soll das Modell ausgehend vom trichotomen Modell der Zielorientierungen (Elliot & Harackiewicz, 1996) durch Annäherungsleistungsziel- und Lernzielorientierung erweitert werden. Die Erkenntnisse können dazu beitragen, Interventionen zu entwickeln, die darauf abzielen, Prüfungsangst zu reduzieren und günstige Zielorientierungen zu entwickeln. Poster Critical Online Reasoning in Higher Education. Assessing knowledge acquisition in online settings in Germany Olga Zlatkin-Troitschanskaia¹, Johannes Hartig², Jennifer Fischer¹, Dimitri Molerov¹ ¹Johannes Gutenberg-Universität Mainz, Deutschland; ²DIPF, Leibniz-Institut für Bildungsforschung und Bildungsinformation Theoretical Background Learning in online environments has become the new normality in 21^st century higher education worldwide and across domains (Grothaus et al., 2021). Compared to face-to-face or guided online learning settings with preselected information sources, self-directed learning with the Internet necessitates a skillset among students to assess the quality (e.g., credibility) of online sources and information accessed and employed for their learning (Wineburg et al., 2022). As per previous research, a set of critical online reasoning skills (COR, (authors, 2020a,b,c) for related concepts) identified three important facets: first, online information acquisition (OIA skills), including using appropriate search queries, databases etc.; second, critical information evaluation (CIE skills), including evaluating website credibility by appropriate cues; third, reasoning based on evidence, argumentation, and synthesis (REAS skills), including using evidence to create and justify a valid argument. Although conceptualizing, assessing, and fostering the respective skills is crucial, still little is known about students’ self-directed learning on the Internet and key influences on students’ search for and use of online sources (see review in authors, 2021). Students and graduates lack COR skills to properly search, select, evaluate, and integrate information gained from the Internet, impairing their learning success (Osborne et al., 2022). To approach this challenge in higher education, understand and foster students' self-directed online learning, the DFG established an interdisciplinary Research Unit, presented in this poster. Research questions The overarching questions of the three research areas are: Area-A. How do students' online information skills (generic and domain-specific: GEN-COR and DOM-COR) develop throughout undergraduate programs and in relation to each other in four disciplines (medicine, economics, physics, sociology), when controlling for personal and contextual influence variables? Area-B. What is the quality of the online sources and information students use for learning, and for solving course-related GEN and DOM-COR tasks? How are information features related to students’ COR skills and their learning outcomes? Area-C. What processes (web behavior, eye movements, reasoning patterns) are characteristic of successful vs. unsuccessful COR performance? What patterns are identifiable between the annotated data of online information features and students’ COR-process and performance? Method The DFG research unit consists of nine projects with about 50 researchers from 16 disciplines (including communication, computer and cognitive sciences, psychology, psychometrics and learning analytics, education and didactics, linguistics, etc.), which conduct quantitative, qualitative, and mixed-methods analyses in the three areas – including longitudinal COR-assessment, content analyses of online information, eye-tracking with think-alouds and integrative data-driven analyses and learning analytics. To validly measure GEN- and DOM-COR-skills, we developed and validated (AERA et al. 2014) open and closed computer-based performance tasks, enabling either search on the real Internet or in preselected information pools (authors, 2022). For the ongoing four-year panel study, a random sample is drawn from a full cohort of 5,000 students to achieve a representative sample across the four disciplines, resulting in N=1,200 students (300 from each discipline). Participants solve two DOM-COR and two GEN-COR tasks at each measurement, based on a booklet design with linked behavioral indicators to allow for Item Response Theory-equating. Results We present the theoretical-conceptual, methodological, and assessment framework of the new DFG-Research Unit and initial results from the 1^st measurement (winter term 2023/24) on GEN- and DOM-COR levels students show at the beginning of their university studies in four disciplines. Furthermore, we provide unique results on quality and features (e.g., linguistic, narrative) of online sources and information beginning students use as learning input for studying and solving GEN- and DOM-COR-tasks. Finally, we present first insights on successful vs. unsuccessful COR-task-solving strategies and discuss implications for successfully studying online in higher education. Poster Evidenz- und datenbasiertes Entscheiden von Lehramtsstudierenden: Zusammenhänge mit Wissen über Forschungsmethoden, Selbstwirksamkeitsüberzeugungen und Einstellungen Till Schmäing, Bernadette Gold TU Dortmund, Deutschland Die Verwendung systematisch gewonnener Daten zur Unterrichts- und Schulentwicklung stellt schon lange eine Erwartung an professionelle Lehrkräfte dar (Bernhardt, 2005; Lange et al., 2012; NCLB, 2002) und wird als datenbasiertes Entscheiden bezeichnet (data-based decision-making, DBDM; Kippers et al., 2018; Schildkamp & Kuiper, 2010). Datenbasierte Entscheidungen verbessern nachweislich die Leistungen der Schüler:innen (Bernhardt, 2009; Park & Datnow, 2009; Van Geel et al., 2016) und fördern Schulentwicklungsprozesse (Potter et al., 2002). Der Begriff „Daten“ kann sich dabei auf Leistungsdaten von Schüler:innen, systematisch erhobene Fragebogen- und Beobachtungsdaten oder auch auf wissenschaftliche Erkenntnisse beziehen (Schildkamp, 2019). Unterschiedliche Studien konnten jedoch belegen, dass Lehrer:innen weder systematisch erhobene Daten noch bildungswissenschaftliche Erkenntnisse häufig für ihre Praxis heranziehen (Hetmanek et al., 2015; Lysenko et al., 2014; van Schaik et al., 2018). Stattdessen liegt der Fokus eher auf den unterschiedlichen eigenständig gewonnenen Erfahrungen aus der schulischen Praxis (Allen, 2009). Um Lehramtsstudierende möglichst gut auf eine daten- und evidenzorientierte Praxis vorzubereiten, sind Kenntnisse über solche potenziellen Prädiktoren zentral. Zu diesen Prädiktoren gehört einerseits das Wissen über Forschungsmethoden, um Daten und Evidenz verstehen und beurteilen zu können (Mandinach & Gummer, 2016; Thomm et al., 2021). Darüber hinaus benötigen (angehende) Lehrkräfte womöglich auch motivationale Voraussetzungen, wie beispielsweise forschungsbezogene Selbstwirksamkeitsüberzeugungen, Interesse an Forschung und positive Einstellungen zum Nutzen von Wissenschaft (Datnow & Hubbard, 2016; Mandinach & Gummer, 2013; Thomm et al., 2021; van Schaik et al., 2018). Die vorliegende Studie untersucht dementsprechend, ob daten-/evidenzbasierte Entscheidungen von Lehramtsstudierenden durch ihr Wissen über Forschungsmethoden, positive Einstellungen, Selbstwirksamkeitsüberzeugungen und Interesse vorhergesagt werden können, um somit Hinweise auf die Bedeutung ihrer Förderung in der ersten Phase der Lehrkräftebildung zu erhalten. Methode An dem Survey nahmen 122 Studierende (M = 22.47, SD = 4.71 Jahre) der Universität Erfurt zu einem Messzeitpunkt teil. Dabei wurden die daten-/evidenzbasierten Entscheidungen mit drei Fallvignetten von Zeuch und Souvignier (2015) erfasst, in denen die Studierenden unterschiedliche Argumente in Bezug auf die drei dargelegten Szenarien zu bewerten haben. Während die Auswertung der Fallvignetten zum wissenschaftlichen Denken mit Quasi-Paarvergleichen umgesetzt worden Als Prädiktoren wurden das Wissen über Forschungsmethoden anhand eines Tests (Behrmann, 2016; 36 Items), die forschungsbezogene Selbstwirksamkeit (Wessels et al., 2016; 9 Items; Cronbachs α = .7), das gefühlsbezogene Interesse an Forschung (Wessels et al., 2016; 10 Items; Cronbachs α =.64) und der Nutzen der Wissenschaft für die Berufspraxis von Lehrkräften (Zeuch & Souvignier, 2015; 9 Items; Cronbachs α = .35) erfasst. Als Kontrollvariable wurde das Kognitionsbedürfnis (Beißert et al., 2015) aufgenommen. Eine explorative Faktorenanalyse zum Interesse an Forschung legte ein Modell mit drei Faktoren (Literaturarbeit, Planung der Studie & die Arbeit mit den Daten und Erkenntnisanwendung) nahe, welches für das weitere Vorgehen angenommen wurde. Zur Auswertung der Fragestellung wurde eine multiple lineare Regressionsanalyse durchgeführt. Ergebnisse Das Regressionsmodell zeigte einen schwachen Einfluss aller Variablen auf daten-/evidenzbasierte Entscheidungen der Lehramtsstudierenden (R² = .104, F[8, 103] = 1.50, p = .17, f² = .12). Bei Betrachtung der einzelnen Prädiktoren zeigte sich lediglich das Wissen über Forschungsmethoden als statistisch signifikant für die Vorhersage des daten-/evidenzbasierte Entscheidens (β = .23; p = .02). Diskussion Die Ergebnisse illustrieren den Zusammenhang zwischen der mit Fallvignetten erhobenen daten-/evidenzbasierte Entscheidungen und dem objektiv gemessenen Wissen über Forschungsmethoden und verdeutlichen somit die Bedeutung des tatsächlichen Wissens im Vergleich zur durch Selbsteinschätzungen erfassten forschungsbezogenen Selbstwirksamkeitsüberzeugungen, Interesse und Einstellungen. Somit ist die Förderung von forschungsmethodischen Wissensinhalten im Lehramtsstudium möglicherweise ein Weg, um zukünftige Lehrkräfte auf daten-/evidenzbasierte Entscheidungen vorzubereiten. Aufgrund des querschnittlichen Designs ist jedoch keine Schlussfolgerung über die kausale Richtung möglich. Interessant wäre dementsprechend eine längsschnittliche Betrachtung der Entwicklung der hier betrachteten Variablen und ihre Wechselwirkungen über die Zeit des Lehramtsstudiums. Poster Entwicklung eines digitalen Blitzlesetests zur Erfassung der Geschwindigkeit im lexikalischen Abruf bei Schüler:innen mit niedrigen Leseleistungen Judith Zellner, Nikola Ebenbeck, Markus Gebhardt Ludwig-Maximilians-Universität München, Deutschland Theorie und Fragestellungen Lesen bildet die Basis für alle Bildungsbereiche und die Teilhabe an der Gesellschaft. Trotzdem erreichen ca. 20% der Schüler:innen die Mindeststandards basaler Lesekompetenz nicht (Stanat et al., 2022), wobei vor allem Schüler:innen mit sonderpädagogischem Unterstützungsbedarf (SPU) niedrige Leseleistungen zeigen (Gebhardt et al., 2015,). Insbesondere für diese Schüler:innen sind digitale Tests geeignet, um Leseschwierigkeiten präventiv zu vermeiden und Leseschwierigkeiten frühzeitig identifizieren (Ebenbeck, 2023, Liebers et al., 2019). Mit diesem Hintergrund wurde ein neues digitales Aufgabenformat entwickelt, das die Geschwindigkeit im lexikalischen Abruf misst (Ebenbeck et al, 2023). Dabei werden Schüler:innen Wörter mit unterschiedlicher Anzeigedauer als „Blitzlesetest“ präsentiert. In dieser Studie wird das Aufgabenformat des Blitzlesetests auf seine Eignung für die Leistungsmessung in inklusiven Schulen anhand folgender Fragen untersucht: Ist das Verwenden unterschiedlicher Anzeigedauern als schwierigkeitsgenerierendes Merkmal für die Testentwicklung geeignet? Kann der Test die Leistungen von leseschwachen Schüler:innen (mit SPU) genau erfassen? Daten und Methoden 400 Schüler:innen mit und ohne SPU aus inklusiven Grundschulen (Jahrgangsstufen 2 bis 4, M_Alter=8,51, SD_Alter=1,22) und Förderzentren für geistige Entwicklung (Jahrgangsstufen 2 bis 9, M_Alter=11,29, SD_Alter=2,02) bearbeiteten den digitalen Blitzlesetest online auf Tablets. 314 Schüler:innen hatten keinen SPU, 43 Schüler:innen hatten einen SPU Lernen, Sprache oder Verhalten (LSV) und 43 Schüler:innen hatten einen SPU Geistige Entwicklung (GE). Der Test wurde basierend auf seiner analogen Vorgängerversion weiterentwickelt (Jungjohann et al., 2023) und steht auf der Plattform Levumi.de (Mühling et al., 2017) frei zur Verfügung. Er besteht aus 30 Items. Jedes Item umfasst ein Wort, das für 0.25 Sekunden, 0.5 Sekunden, 1 Sekunde oder 2 Sekunden angezeigt wird. Nachdem das Wort auf dem Bildschirm „aufgeblitzt“ ist, wählen die Schüler:innen aus vier möglichen Wörtern das eben angezeigte Wort aus. Der Test hat keine Zeitbegrenzung, wurde aber meistens innerhalb von drei bis fünf Minuten durchgeführt. Die Items werden in einem eindimensionalen dichotomen Raschmodell mit dem R-Paket pairwise (Heine, 2023) kalibriert. Mittels Andersen’s Likelihood Ratio Test (LR-Test) wird der globale Fit und der globale Differential Item Functioning (DIF) der Gruppen mit und ohne SPU getestet. Mittels Graphischem Modell Test (GRM) und Wald Test wird der DIF auf Itemebene überprüft. Mit einer einfaktoriellen und multifaktoriellen Varianzanalyse wird überprüft, inwiefern die Anzeigedauer der Items die Schwierigkeit der Items für Schüler:innen mit und ohne SPU bedingt. Ergebnisse Die Ergebnisse des LR-Tests deuten auf eine gute Passung des Raschmodells für den Blitzlesetest hin (χ²=30,76, df=59, p=1). Im Wald-Test zeigen sich keine signifikanten Abweichungen der geschätzten Itemparameter zwischen den Schüler:innen mit und ohne SPU. Insgesamt liegt kein DIF vor. Der est misst über alle Gruppen stabil und ist somit gut geeignet, um schwache Leseleistungen, auch von Schüler:innen mit SPU, genau zu erfassen. Die Anzeigedauer hat einen signifikanten Einfluss auf die Itemschwierigkeit (F(3) = 6.732, p < .01), wobei Items mit kürzerer Anzeigedauer schwieriger sind als Items mit längerer Anzeigedauer. Der größte Unterschied ist dabei, wie zu erwarten, zwischen Items mit der kürzesten (0.25 Sekunden) und der längsten Anzeigedauer (2 Sekunden, p < .01) zu verzeichnen. Schüler:innen ohne SPU sowie mit verschiedenen SPU schneiden in den Itemgruppen signifikant unterschiedlich ab (F(1) = 16.511, Pillai = 0.14, p < .001). Diese Unterschiede bleiben auch in der einfaktoriellen post-hoc Betrachtung für jede Anzeigedauer bestehen (p < .001). Schlussfolgerungen für die weitere Testentwicklung von ökonomisch einsetzbaren Instrumenten für inklusive Klassen werden diskutiert. Poster Erfassung motivationsregulatorischer Selbstwirksamkeit – zwei Skalen im Vergleich Olena Kryshko¹, Alexander Luft^1,2, Charlotte Dignath¹, Detlev Leutner² ¹TU Dortmund, Deutschland; ²Universität Duisburg-Essen, Deutschland Im Rahmen des selbstregulierten Lernens beschreibt die motivationale Selbstregulation den komplexen Prozess der Überwachung und Steuerung des eigenen Motivationsniveaus, der theoretischen Modellen sowie empirischen Befunden zufolge über gesteigerte Motivation potenziell zum akademischen Erfolg und Wohlbefinden von Lernenden beitragen kann (Grunschel et al., 2016; Miele & Scholer, 2018; Schwinger & Stiensmeier-Pelster, 2012; Wolters, 2003). Während sich diesbezügliche Forschung bisher schwerpunktmäßig auf unterschiedliche Motivationsregulationsstrategien fokussierte (Engelschalk et al., 2017; Schwinger et al., 2009, 2012; Wolters, 1998, 1999), wurde in den letzten Jahren die Relevanz motivationsregulatorischer Selbstwirksamkeit betont, die eine effektive Strategienutzung ermöglichen bzw. begünstigen soll (Kryshko et al., 2022, 2023; Trautner & Schwinger, 2020, 2022). Zur Erfassung motivationsregulatorischer Selbstwirksamkeit von Lernenden werden im deutschsprachigen Raum zwei Selbstberichtskalen (mit jeweils fünf Items) verwendet. Es handelt sich dabei zum einen um die von Trautner und Schwinger (2020) entwickelte Skala (folgend: MotregSW₁) und zum anderen um eine Subskala des Selbststeuerungsinventars von Kuhl und Fuhrmann (1998), welche Kryshko et al. (2023) adaptierten (folgend: MotregSW₂). Bisher wurden diese Skalen allerdings nicht gleichzeitig in einer Studie eingesetzt, um deren Vergleichbarkeit sicherzustellen und somit die Interpretation sowie Generalisierbarkeit bisheriger sowie künftiger Befunde zu erleichtern. Vor diesem Hintergrund wird in dieser Studie der Forschungsfrage nachgegangen, inwieweit diese zwei Skalen vergleichbar in Bezug auf ihre psychometrischen Eigenschaften sind. Zur Überprüfung der Skalenvergleichbarkeit werden aktuelle Standards zur Validierung pädagogisch-psychologischer Testverfahren herangezogen (AERA et al., 2014). Die Datenerhebung erfolgte im Rahmen einer Online-Befragung von N = 350 Bachelorstudierenden unterschiedlicher Fächer an einer großen Universität (68.6% weiblich). Die Studierenden waren durchschnittlich 22.33 Jahre alt (SD=4.15; Min=18; Max=50) und in ihrem vierten Fachsemester (M=4.06; SD=2.30; Min=1; Max=16). Die Teilnehmenden wurden um einige demographische Angaben sowie die Beantwortung einer Reihe von Fragebogenitems (mithilfe eines vier- bis fünfstufigen Likert-Antwortformats) gebeten. Neben den obengenannten Skalen zur Erfassung motivationsregulatorischer Selbstwirksamkeit wurden weitere Messinstrumente eingesetzt. Die Nutzung von Motivationsregulationsstrategien wurde mit dem Fragebogen von Schwinger et al. (2007) erfasst. Zur Erfassung studienbezogener Selbstwirksamkeit wurde die Skala von Schwarzer und Jerusalem (1999) adaptiert. Die Erfassung von Studienmotivation erfolgte mit der adaptierten Erwartung-Wert-Kosten-Skala von Kosovich et al. (2015). Zur Operationalisierung der Studienleistung wurden die Teilnehmenden nach ihrem derzeitigen Notendurchschnitt gefragt. Zudem wurden Zufriedenheit mit Studieninhalten sowie Zufriedenheit mit der Bewältigung von Studienbelastungen mit den gleichnamigen Skalen von Westermann et al. (1996) erhoben. Zur Überprüfung der internen Struktur der beiden MotregSW-Skalen wurden konfirmatorische Faktoranalysen sowie Reliabilitätsanalysen berechnet. Außerdem wurden der Zusammenhang dieser Skalen miteinander sowie ihre jeweiligen Zusammenhänge mit verwandten Konstrukten (Motivationsregulationsstrategien, studienbezogene Selbstwirksamkeit) sowie angenommenen Outcomes (Studienmotivation, Studienleistung und Studienzufriedenheit) untersucht. Mit einer Methode zum Vergleich von Korrelationen (Hittner et al., 2003) wurde geprüft, ob sich die Zusammenhänge der beiden MotregSW-Skalen mit jeweils anderen untersuchten Konstrukten signifikant voneinander unterscheiden. Schließlich wurden für beide Skalen Messinvarianzen zwischen Gruppen hinsichtlich der Variablen Geschlecht, Migrationshintergrund und Bildungsherkunft überprüft. Die angenommene einfaktorielle Struktur konnte für beide Skalen bestätigt werden (MotregSW₁: χ²=12.953, df=5, p=.024; CFI=0.994; TLI=0.988; SRMR=0.022; RMSEA [90% CI]=0.046 [.000–.099]; MotregSW₂: χ²= 8.326, df=5, p=.137; CFI=0.986; TLI=0.973; SRMR=0.024; RMSEA [90% CI]=0.069 [.023–.116]). Zudem zeigten beide Skalen vergleichbar hohe interne Konsistenzen (α/ω jeweils >.80) und korrelierten positiv und stark miteinander (r=.775, p<.001). Beide Skalen wiesen darüber hinaus erwartungskonforme Zusammenhänge in vergleichbarer Stärke mit verwandten Konstrukten sowie unterschiedlichen Outcome-Variablen auf. Schließlich zeigten sich für beide Skalen vollständige Messinvarianzen bezüglich der Bildungsherkunft, allerdings keine ausreichenden Messinvarianzniveaus bezüglich des Geschlechts und des Migrationshintergrunds, sodass Gruppenvergleiche im Hinblick auf diese Variablen mit Vorsicht interpretiert werden sollten. Insgesamt deuten die Befunde auf die psychometrische Äquivalenz der beiden MotregSW-Skalen hin und legen somit ihre mögliche austauschbare Verwendung nahe. Im Rahmen des Posterbeitrags werden diese Befunde ausführlicher diskutiert sowie um Ergebnisse der Inhaltsanalyse der jeweiligen Skalenitems und die daraus resultierenden Optimierungsvorschläge ergänzt. Poster Intraindividuelle Analyse von Burnout und Engagement von Oberstufenschülerinnen – eine latent transition-Analyse der Profile über die Zeit Sarah Bebermeier¹, Ziwen Teuber², Kim Laura Austerschmidt³, Malin Brückmann⁴ ¹Leibniz Universität Hannover, Deutschland; ²Universität Luxemburg, Luxemburg; ³Evangelisches Klinikum Bethel Bielefeld, Deutschland; ⁴Universität Bielefeld, Deutschland Theoretischer Hintergrund:* Oberstufenschülerinnen kurz vor dem Abitur müssen viele Herausforderungen bewältigen (Albert et al., 2015) und erleben oft Stress (Oerke, 2012; Spangler et al., 2002). Teuber et al. (2020) zeigten, dass hohe Anforderungen, welche die individuellen Bewältigungsmöglichkeiten von Schülerinnen übersteigen, mit höherem Burnouterleben und geringerem schulischem Engagement einhergehen. Es kommt zu schlechteren Leistungen (Teuber et al., 2020) und zu negativen Konsequenzen für die psychische Gesundheit (Salmela‐Aro & Upadyaya, 2014). Ein Großteil der Forschung zu Burnout und Engagement beschäftigt sich variablenzentriert mit Prädiktoren und Konsequenzen der beiden Konstrukte. Häufig werden nur einzelne Facetten von Burnout (z.B. Erschöpfung, reduziertes Wirksamkeitserleben) oder Engagement (z.B. Hingabe, Vertieftsein) fokussiert. Personenzentrierte Ansätze, die berücksichtigen, dass sich Personen hinsichtlich Burnouterleben und Engagement individuell unterscheiden, gibt es nur wenige. So fanden Leiter und Maslach (2016) mittels eines personenzentrierten Ansatzes fünf qualitativ differenzierbare Profile bei Mitarbeitenden aus dem Gesundheitssystem (belastet, überfordert, zynisch, ineffektiv, engagiert) und Virtanen et al. (2018) sowie Cheung und Li (2019) identifizierten drei Profile zur Höhe der individuellen Burnoutausprägung (gering, mittel, hoch) bei Mittelstufenschülerinnen. Neben der intraindividuellen Konstellation von Burnout und Engagement ist auch die Stabilität der Profile über die Zeit, empirisch bisher kaum untersucht. Fragestellungen:* (1) Wie viele und welche Profile hinsichtlich der drei Burnoutfacetten Erschöpfung, Zynismus und reduziertes Wirksamkeitserleben und der drei Engagementdimensionen Hingabe, Vertieftsein und Energie lassen sich bei Oberstufenschülerinnen identifizieren? Es wird erwartet, dass sich die Profile in quantitativer und qualitativer Hinsicht unterscheiden. (2) Wie stabil sind die Profile der Oberstufenschülerinnen innerhalb eines Schulhalbjahres? Es wird erwartet, dass die Profilzugehörigkeit mehrheitlich stabil ist und adaptive sowie maladaptive Profilwechsel auftreten. Methode: Mittels einer Online-Studie wurden demographische und schulbezogene Informationen (7 Items), Burnout (10 Items), Engagement (6 Items) und schulische Leistung (1 Item) von Oberstufenschülerinnen erhoben (N = 1.375, weiblich = 923). Um die theoretischen Annahmen zu den Konstellationen der Burnoutfacetten und Engagementdimensionen zu prüfen, wurden mittels einer latenten Profilanalyse Anzahl und Charakteristika der Profile ermittelt. Anschließend wurden Längsschnittdaten (n = 248) genutzt, um die Stabilität der Profile zu überprüfen. Für beide Messzeitpunkte wurde je eine latente Profilanalyse durchgeführt und dann eine latent transition-Analyse zur Bestimmung der Profilwechsel vorgenommen. Ergebnisse: Auf Basis der statistischen Gütekriterien und der inhaltlichen Interpretierbarkeit zeigt sich zu beiden Messzeitpunkten eine 5-Profillösung. Die identifizierten fünf Profile differenzieren vor allem in quantitativer Hinsicht: Profil 1 (n = 119; 8.7%) zeichnet sich durch unterdurchschnittliches Burnouterleben und weit überdurchschnittliches Engagement aus (Engagierte). Profil 2 (n = 391; 28.4%) zeichnet sich durch unterdurchschnittliches Burnouterleben und leicht überdurchschnittliches Engagement aus (Pragmatische). Profil 3 (n = 546; 39.7%) zeichnet sich durch durchschnittliches Burnouterleben und durchschnittliches Engagement aus (Durchschnittliche) und Profil 4 (n = 259; 18.8%) zeichnet sich durch überdurchschnittliches Burnouterleben und unterdurchschnittliches Engagement aus (Belastete). Profil 5, dem wenige Schülerinnen angehören (n = 60; 4.4%) zeigt qualitative Unterschiede und Engagement trotz überdurchschnittlichem Burnouterleben (Über-Engagierte). Es zeigen sich signifikante Zusammenhänge zwischen den Profilen und schulischer Leistung (η = .31, p <.001): Engagierte und Pragmatische berichten häufiger als erwartet eine bessere Durchschnittsnote, während Belastete und Über-Engagierte häufiger eine schlechtere Durchschnittsnote berichten. Der Vergleich der Profilzugehörigkeit zwischen beiden Messzeitpunkten weist eine hohe Stabilität auf (n = 131; 52.82%). Es lassen sich 15 verschiedenen Arten von Profilwechseln, sowohl adaptiver als auch maladaptiver Art identifizieren. Diskussion: Fast ein Fünftel der Oberstufenschülerinnen unserer Stichprobe wurde als „Belastete“ mit überdurchschnittlichem Burnouterleben und unterdurchschnittlichem Engagement klassifiziert. Dies unterstreicht den Bedarf an Forschung und zielgerichteter Präventions- und Interventionsplanung. Zukünftig sollten Prädiktoren der Profilstabilität und -wechsel sowie Effekte auf schulische Leistung und psychische Gesundheit betrachtet werden. Implikationen des Dropouts im Längsschnitt werden für die aktuellen Befunde diskutiert. Poster Neue Notenzusammensetzung – Neue Noten? Wie die österreichische Maturareform von 2020 das Notengebungsverhalten von Lehrerinnen verändert Vincent Schatz, Roman Zviagintsev, Nele Kampa Universität Wien, Österreich, Zentrum für Lehrerinnenbildung Einleitung* Abschlussprüfungen der allgemeinen Hochschulreife basieren auf der Allokationsfunktion von Schulnoten (Beckers et al., 2010). Ihre Auswirkungen auf Bildungswege sind immens, weshalb Notenreformen, z.B. bei Matura-(Abitur)Prüfungen, im besonderen Maße wissenschaftlicher Untersuchungen bedürfen. Standardbasierte Leistungsfeststellungen und von Lehrerinnen vergebene Jahresnoten messen unterschiedliche Formen von schulischer Leistung (Willingham et al., 2002). Während die Ergebnisse standardbasierter Leistungsfeststellungen vorrangig Daten über akademische* Leistungen der Schülerinnen liefern, beinhalten Jahresnoten zusätzlich verschiedene andere Faktoren, sog. nicht-akademischen* Leistungen, z.B. Mitarbeit, Fleiß und individueller Lernfortschritt (Brookhart et al., 2016; Cross & Frary, 1999). Jahresnoten orientieren sich weiters am mittleren Leistungsniveau einer Klasse, der sog. Bezugsnorm (Hübner et al., 2020; Marsh & O'Mara, 2010), und sind deutlich stärker mit der Tendenz von Lehrerinnen konfrontiert, Schülerinnen möglichst gute Note vergeben zu wollen (pulling for students), was insbesondere bei Schülerinnen mit eher schlechten schulischen Leistungen zutrifft (McMillan, 2003). Zudem weist die Literatur auf einen deutlichen Zusammenhang zwischen Überzeugungen von Lehrpersonen (sog. teacher beliefs) und Aspekten ihres pädagogischen Handelns hin (Pilcher, 1994), was auch auf die Jahresnotenvergabe, die von unterschiedlichen teachers‘* grading beliefs beeinflusst sein kann, zutrifft (Bonner & Chen, 2021). Im Gegensatz dazu zielen standardbasierte Leistungsfeststellungen auf nationale Vergleichbarkeit ab und basieren auf zentral festgelegten Kriterien (z.B. zentrale Abschlussprüfungen der allgemeinen Hochschulreife). Jahresnoten und Ergebnisse von standardbasierten Leistungsfeststellungen verfolgen demnach unterschiedliche Ziele und die erreichten Ziffernnoten unterscheiden sich in ihrer inhaltlichen Aussage bezüglich der erbrachten Leistungen. Inwiefern Änderungen der Funktion von Jahresnoten, z.B. durch Notenreformen, auch zu einem veränderten Notengebungsverhalten von Lehrerinnen führen und inwiefern dies mit Charakteristika und grading beliefs* von Lehrkräften zusammenhängt, ist bisher noch nicht ausreichend untersucht. Eine Ausnahme ist eine irische Studie (Doyle et al., 2021), die eine deutliche Verbesserung der Noten der irischen Leaving Certificates zeigte, nachdem die Verantwortung für deren Bewertung von einem zentralen Bewertungskomitee auf die jeweiligen Lehrerinnen übertragen wurde. Mit einer ähnlichen Situation ist Österreich seit einer nationalen Notenreform im Jahr 2020 konfrontiert. Seitdem fließen in das Zentralmaturazeugnis die Ergebnisse der Zentralmaturaprüfungen UND der Jahresleistungen der Abschlussklasse der Sekundarstufe II mit ein. Statistische Daten lassen bereits erkennen, dass diese Notenreform zu deutlich höheren Bestehensquoten bei der Zentralmatura geführt hat (ca. 13% vor versus ca. 5% nach 2020) (Statistik Austria, 2023). Forschungsfragen* Unsere Forschungsfragen sind somit: - Ist die Verbesserung der Zentralmaturanoten auf das Einfließen der Jahresabschlussnoten seit der österreichischen Notenreform 2020 zurückzuführen? - Haben sich seit 2020 neben den Zentralmaturanoten auch die Jahresabschlussnoten verbessert? - Gibt es einen Zusammenhang zwischen den höheren Bestehensquoten bei der Zentralmatura seit 2020 und teachers‘ grading beliefs? Methode In zwei Bundesländern Österreichs (Wien und Tirol) erheben wir im Herbst 2023 längsschnittlich die Zentralmatura- und Jahresabschlussnoten von 2017 bis 2023 an insgesamt 20 Schulen und somit Noten von ca. 200 Lehrerinnen vor, während und nach der Notenreform 2020. Anschließend beantworten diese Lehrkräfte einen Fragebogen zu ihren grading beliefs* in Bezug auf die Funktionen der Schulnotenvergabe im Allgemeinen, ihrer Einstellung zur Zentralmaturanotenvergabe im Besonderen sowie zu ihren Einstellungen gegenüber einer Reihe von alternativen Möglichkeiten zur Leistungsbeurteilung. Eine Verknüpfung dieser beiden Datenquellen erlaubt uns, (individuelle) Veränderungen im Benotungsverhalten von Jahresabschluss- und Zentralmaturanoten sowie Zusammenhänge mit zugrundeliegenden grading beliefs zu erforschen. Die Daten werden diesen Winter mit längsschnittlichen und mehrebenanalytischen Verfahren ausgewertet. Erwartete Ergebnisse Aufgrund der beschriebenen Datenlage nehmen wir an, dass in den Jahresabschlusszeugnissen entweder generell bessere Noten als in den Zentralmaturaprüfungen vergeben werden oder (als wahrscheinlichere Annahme) sich die Jahresabschlussnoten seit 2020 verbessert haben. Aufgrund des Pulling-For-Students-Effekts nehmen wir weiters an, dass die Notenanhebung insbesondere bei niedrigen Notengraden stattgefunden hat. Zusammenhänge zwischen weiteren im Fragebogen enthaltenen Konstrukten zur Erfassung von teachers‘ grading beliefs und individuellem Notengebungsverhalten werden wir aufgrund der unzureichenden Literaturlage auf explorative Weise untersuchen. Poster Wenn’s wichtig ist hab‘ ich keine Angst – und wenn doch, dann ein Problem! Eine Untersuchung von Klassenfaktoren und Geschlechtsunterschieden im Zusammenhang von Prüfungsangst und Noten im Mathematikunterricht. Noro Schlorke, Patrick Paschke, Ricarda Steinmayr Technische Universität Dortmund, Deutschland [Theorie, Fragestellungen] Angst vor Prüfungen stellt Lehrinstitutionen vor Herausforderungen. Es besteht die Gefahr, dass ein wiederkehrender psychologischer Faktor einen systematischen Einfluss auf die Bewertung und damit den Erfolg von Schülerinnen und Schülern (SuS) hat. Bereits vor über 40 Jahren wurde der negative Effekt von Prüfungsangst auf Noten ausgiebig untersucht (Deffenbacher, 1980). Generell unterscheidet man bei der Prüfungsangst eine Besorgheits- und eine Aufgeregtheitskomponente (Hembree, 1988). Die Besorgtheitskomponente scheint in einem stärkeren Zusammenhang mit Schulleistung zu stehen (Seipp, 1991; Steinmayr et al., 2016). Auch zeigen neuere, domänenspezifische Untersuchungen, dass Mädchen/Frauen stärker unter Mathematik bezogener Prüfungsangst leiden (Lowe, 2014; Putwain et al., 2014; Núñez-Peña et al., 2016). Diese Geschlechtsunterschiede wurden in Zusammenhang mit Gender-Bias in Erwartungen von Lehrkräften über die Mathematik-Fähigkeiten ihrer SuS gesetzt (Robinson-Cimpian, 2014; Ayuso et al., 2021). Dies impliziert stärker negative Effekte von Lehrkraft-Effekten auf die Prüfungsangst von Mädchen. Der Effekt von Klassenfaktoren auf Prüfungsangst wurde bereits 1988 erstmalig untersucht. Helmke (1988) zeigte einen positiven Zusammenhang zwischen der durch Lehrkräfte vermittelten Relevanz guter Noten und der Stärke des Effekts von Prüfungsangst auf Noten auf. Untersuchungen zu weiteren Unterrichtsmerkmalen liegen unserer Kenntnis nach nicht vor, ebenso nicht dazu, ob diese Effekte durch das Geschlecht moderiert werden. Aus der beschriebenen Literatur ergeben sich folgende Hypothesen für das Unterrichtsfach Mathematik: In Unterrichtsklassen, in denen eine hohe Leistung von höherer Relevanz sind, hat die Besorgniskomponente der Prüfungsangst einen stärkeren negativen Effekt auf Noten (Hypothese 1). Mädchen leiden stärker unter Prüfungsangst in Mathematik (Hypothese 2) und lehrkraftabhängige Klassenfaktoren haben einen stärkeren negativen Effekt auf Mädchen als auf Jungen (Hypothese 3). [Methode] In der vorliegenden Studie wurden 33 Schulklassen der Stufen 8 und 9 mit insgesamt 767 SuS (Durchschnittliches Alter: 14.1 Jahre; SD: 0.82; 361 Jungen, 403 Mädchen) in Nordrhein-Westfalen untersucht. Die Kinder füllten einen Fragebogen zu Klassenvariablen (Unterrichtsdruck, Vermittlungsqualität und Kontrolle der Schülerarbeit) (LFSK, Eder, 1998;) sowie Prüfungsangst (Schwarzer, Jerusalem, 1999) aus. Ihre Mathematikkompetenz wurde mit Hilfe des TIMSS (Baumert et al., 1998) und ihre numerische Intelligenz durch die Zahlenfolgenskala des CFT-R (Weiß, 2013) erfasst. Die beiden letzteren Variablen dienten als Kontrollvariablen. Darüber hinaus wurden die SUS zu ihrer letzten Mathematiknote befragt (negativ kodiert). Die Items der Klassenvariablen wurden innerhalb jeder Klasse aggregiert. [Ergebnisse] Zur Überprüfung der Hypothesen 1 und 3 wurden jeweils ein Mehrebenen-Modell für jede der Klassenvariablen berechnet. Die Hypothesen konnten für Vermittlungsqualität und Klassendruck nicht bestätigt werden. Das Mehrebenen-Modell für Kontrolle der Schülerarbeit (X² = 0.00, CFI = .917, RMSEA = .048, SRMR = .048) bestätigte die Hypothesen 1 und 3. Im Folgenden werden standardisierte Effektgrößen berichtet. Die Interaktion zwischen Besorgtheit und Kontrolle der Schülerarbeit auf die Note wurde signifikant (β = -.697, p = .006). Die Interaktion zwischen Kontrolle der Schülerarbeit und Geschlecht auf die Besorgnis wurde ebenfalls signifikant (β = -.516, p = .006). Wie Hypothese 2 vorhersagt, leiden Mädchen stärker unter Besorgtheit vor Prüfungen (β = -.18, p < .001). Für die Dimension der Aufgeregtheit (X² = 0.00, CFI = .897, RMSEA = .050, SRMR = .050) können die Hypothesen 1 und 3 nicht bestätigt werden. [Relevanz] Die Ergebnisse dieser Studie bestätigen vorherige Ergebnisse, dass unabhängig vom Potential und den Kompetenzen kontrollierende Unterrichtsmerkmale wie eine häufige Kontrolle der Schülerarbeit zu einem stärkeren negativen Effekt der Prüfungsangst auf die Mathematiknote führt, als auch, dass Mädchen stärker unter Prüfungsangst im Fach Mathematik leiden. Ergänzt wird dieser Befund in dieser Studie darum, dass eine stärkere Kontrolle der Schülerarbeit in der Klasse für Jungen zu einer Senkung der Prüfungsangst führt, während der Effekt sich für Mädchen umdreht. Der Beitrag wird vor dem Hintergrund der Bedeutung der Ergebnisse für den STEM-Bereich und alternativer, möglicherweise Prüfungsangst senkender Unterrichtsmerkmale diskutiert. Poster Behaviorale Erfassung der Handlungsadaptivität nach Fehlern: Entwicklung eines Untersuchungsparadigmas Jana Spear¹, Donna Bryce¹, Carolin Burmeister², Maria Tulis³, Robert Grassinger², Markus Dresel¹ ¹Universität Augsburg; ²Pädagogische Hochschule Weingarten; ³Universität Salzburg Fehler sind eine wichtige Lernchance in Lernprozessen, da sie unter anderem Rückmeldung über Fehlkonzepte oder fehlendes Wissen liefern (Zhang & Fiorella, 2023). Um das in Fehlern liegende Lernpotenzial optimal nutzen zu können, ist ein adaptiver Umgang damit essentiell (z.B. Grassinger et al., 2018). Theoretisch unterschieden werden kann zwischen adaptiven affektiv-motivationalen und adaptiven auf die Lernhandlung bezogenen Reaktionen auf Fehler (Dresel et al., 2013). Postuliert wird, dass affektiv-motivationale Reaktionen auf Fehler zwar eine notwendige Voraussetzung für handlungsbezogene Fehlerreaktionen sind, allerdings nur letztere, also Anpassungen im Lernhandeln, im direkten Zusammenhang mit Lernerfolg stehen (Grassinger et al., 2018). Die Studienlage hierzu ist allerdings dadurch limitiert, dass sie auf reinen Selbstberichtsdaten beruht. Vor allem bei der Untersuchung von Kindern wird der alleinige Einsatz von Selbstberichten oftmals kritisch gesehen, da ein reliables und valides Antwortverhalten hier nicht immer gesichert ist (Conijn et al., 2020). Auch wenn der Kind-Perspektive in der Forschung ein wichtiger Beitrag zugeschrieben wird (Landgraf et al., 2018), scheint eine Ergänzung durch behaviorale Daten gewinnbringend zu sein. Unabhängig davon liegt nach wie vor wenig Evidenz dazu vor, ob sich adaptive, auf die Lernhandlung bezogene Reaktionen auf Fehler wie postuliert positiv auf den Wissenserwerb auswirken. Um diese beiden Forschungsanliegen zu adressieren, wird ein Experimentalparadigma anhand von zwei Studien vorgestellt, das sowohl eine zusätzliche behaviorale Erfassung handlungsadaptiver Fehlerreaktionen als auch eine Untersuchung des unmittelbaren Effektes auf den Wissenserwerb ermöglicht. Dabei diente die erste Studie zunächst der grundsätzlichen Erprobung des Paradigmas und des Verhaltensindikators handlungsadaptiver Fehlerreaktionen mit Studierenden. Aufbauend darauf wird in Studie 2 eine Übertragung auf die Population der Grundschulkinder erfolgen. In Studie 1 wurde eine digitale Lernumgebung genutzt, die von 177 Studierenden des Lehramts (Alter: M = 20.3 Jahre; SD = 3.3; 72 % weiblich) bearbeitet wurde. Sie durchliefen vier aufeinanderfolgende Lern-Test-Zyklen sowie eine Prä- und Posterfassung des Wissensstandes. Die Lernphasen bestanden dabei aus tutoriellen Erklärungen zu Forschungsmethoden. Die darauffolgenden Testphasen enthielten schwere Aufgaben, auf die ein Richtig/Falsch Feedback folgte. Eine falsche Antwort bot die Möglichkeit, die Lerneinheit bis zu zwei Mal freiwillig zu wiederholen. Der Anteil solcher freiwilligen Wiederholungen an der Gesamtanzahl der fehlerhaft beantworteten Aufgaben diente als behavioraler Indikator handlungsadaptiver Fehlerreaktionen. Zusätzlich wurden die handlungsadaptiven Reaktionen auf Fehler im Selbstbericht mit einem bereits umfassend validiertem Instrument erfasst (Tulis et al., 2018). Es konnte gezeigt werden, dass der behaviorale Indikator der Handlungsadaptivität in engem Zusammenhang mit dem Selbstberichtsinstrument (r = .58; p < .01) steht, was für dessen Validität spricht. Mit Strukturgleichungsmodellen konnte gezeigt werden, dass die behaviorale Handlungsadaptivität einen positiven Effekt auf das Posttest-Wissen hat, nach Kontrolle des Vorwissens der ProbandInnen (β = .31, p < .001). Die selbstberichtete Handlungsadaptivität während der Lernhandlung stand in einem ähnlich positiven Zusammenhang mit dem Wissenserwerb, ebenfalls nach Kontrolle des Vorwissens (β = .22, p < .01). Die korrespondierende Ergebnismuster der beiden Messmethoden verweisen darauf, dass sich handlungsbezogene Reaktionen auf Fehler für Erwachsene sowohl im Selbstbericht als auch auf behavioraler Ebene zuverlässig erheben lassen. Des Weiteren stützen sie die Annahme, dass auf die Lernhandlung bezogene Reaktionen auf Fehler einen zentralen Beitrag für das Lernen aus Fehlern liefern. Studie 2 befindet sich gerade in der Durchführung. Die Operationalisierung erfolgt analog zur Studie 1. Die Inhalte der digitalen Lernumgebung werden dabei an das Grundschulalter angepasst und sollen Sachverhalte zum Rechnen und zum Rechtschreiben behandeln. Die Ergebnisse der Studie 2 zur Übertragung des Paradigmas auf Grundschulkinder werden bis zum Zeitpunkt der Tagung vorliegen und dort berichtet. Poster Fortbildungsinteressen von Lehrkräften - What matters? Melissa Meurel Universität Münster, Deutschland Die dritte Phase der Lehrkräftebildung macht mit durchschnittlich 35 Jahren den längsten Zeitraum aus, in dem Lehrkräfte fortlaufend ihre Kompetenzen weiterentwickeln müssen, um die sich stetig wandelnden Herausforderungen des Berufsalltags bewältigen zu können (Pasternack et al., 2017, S. 20). Für die berufsbegleitende Professionalisierung von Lehrkräften werden Fortbildungen eine zentrale Bedeutung zugesprochen, zudem werden sie als ein wichtiges Instrument für den Transfer von Innovationen in die Schule verstanden (DVLfB, 2018, S. 8). Wie aber kann der Transfer bestmöglich gelingen? Für die Gestaltung von entsprechenden Veranstaltungen liegen in der Fortbildungsforschung evidenzbasierte Qualitätskriterien vor (z. B. Lipowsky 2023). Es ist jedoch auch wichtig, die Übereinstimmung des Fortbildungsangebots mit den Bedürfnissen der Lehrkräfte zu berücksichtigen. Obwohl Lehrkräfte grundsätzlich verpflichtet sind, sich fortzubilden, ist diese Verpflichtung in vielen Bundesländern nicht quantifiziert. Daher liegt es im Ermessen der Lehrkräfte, ob und in welchem Ausmaß sie dieser Fortbildungspflicht nachkommen (Pasternack et al., 2017, S. 240). In der Fortbildungspraxis zeigt sich, dass die individuellen Interessen der Lehrkräfte als zentraler Prädiktor für Lehr-Lern-Prozesse sowie ausschlaggebender Beweggrund zur Fortbildungsteilnahme (Krille 2020, S. 21) weitestgehend unberücksichtigt sowie unzureichend systematisch erhoben werden (Heinemann 2019, S. 44). So widmet sich die vorliegende Arbeit der Erfassung des Interesses nordrhein-westfälischer Geographielehrkräfte an fachspezifischen Fortbildungen. Das Interesse bildet im Sinne der pädagogisch-psychologischen Interessentheorie eine bedeutungsmäßig herausgehobene Person-Gegenstands-Relation, wobei Interessengegenstände Inhalte, Tätigkeiten oder Kontexteumfassen können (Krapp & Prenzel 2011, S. 32). An dieser Stelle setzt das Dissertationsvorhaben mit dem Ziel an, das Interesse von Lehrkräften an Inhalten und Tätigkeiten bei Fortbildungen sowie potenzielle Einflussfaktoren auf das Interesse zu ermitteln (Meurel 2023). Auf Basis der Forschungsergebnisse sollen Handlungsempfehlungen hinsichtlich der Gestaltung zukünftiger Fortbildungen abgeleitet werden. Als ausgewählter Teilaspekt fokussiert das Poster auf die Forschungsfrage Welche Faktoren beeinflussen das Lehrkräfteinteresse bei Fortbildungen?. Da für das vorliegende Forschungsprojekt keine respektive nur wenige Evidenzen vorliegen, wird sich für die empirische Umsetzung für ein Vorstudienmodell als Untersuchungsdesign entschieden (Döring & Bortz 2016, S. 184). In einem ersten Schritt dient eine qualitative Vorstudie in Form von leitfadengestützten Interviews mit acht Expertinnen und Experten zur Exploration des Forschungsfeldes. Die Interviewdaten werden mittels inhaltlich strukturierender Inhaltsanalyse in Anlehnung an Kuckartz (2018, S. 100) ausgewertet und die Ergebnisse genutzt, um Hypothesen zur Interessenausprägung von Geographielehrkräften zu generieren. Hierbei werden die Hypothesen durch bestehende Studien der Fortbildungs- respektive Interessenforschung gestützt. Die qualitative Vorstudie stellt die Vorarbeit für die quantitative Hauptstudie dar, in der die Hypothesen im Rahmen einer standardisierten Online-Befragung überprüft werden (N= 172). Die Ermittlung des Lehrkräfteinteresses erfolgte mittels fünfstufiger Likkert-Skala von 1=„interessiert mich nicht“ bis 5=„interessiert mich sehr“. Die Fragebogenitems wurden literaturbasiert unter Rückbezug auf die Vorstudienergebnisse entwickelt. Nebst deskriptiver Statistik erfolgen inferenzstatistische Analysen mittels SPSS. Konkret werden für die Beantwortung der Forschungsfrage ausgehend von Korrelationsanalysen zwischen der abhängigen Variable Lehrkräfteinteresse und den unabhängigen Variablen mittels linearen Regressionsanalyse ein Vorhersagemodell für die Interessenausprägung aufgestellt. Die Untersuchung zeigt, dass die befragten Lehrkräfte grundsätzlich ein hohes Interesse an fachspezifischen Fortbildungen aufweisen (X̅=gesamt=3.98). Hinsichtlich der einzelnen Inhaltsbereiche sind heterogene Interessenausprägungen zu verzeichnen, wobei übergeordnete Trends zu identifizieren sind (Meurel, 2023). Durch die Gesamtheit der explorativ getesteten unabhängigen Variablen kann eine Varianzaufklärung in Höhe von 39,60 % (korrigiertes R²= .396) erklärt werden. Das Vorhersagemodell ist statistisch signifikant ((F(1,149)= 84.830), p <.001) und identifiziert in der in der nachfolgenden Reihenfolge die unabhängigen Variablen 1.) Überzeugung hinsichtlich Fortbildungen (T= 7.441, p <.001, β= .518), 2.) Fachinteresse (T= 2.910, p= .004, β= .205) und 3.) berufliche Belastung (T= 2.228, p= .027, β= .144) der befragten Geographielehrkräfte als Prädiktoren für das Lehrkräfteinteresse bei Fortbildungen. Vor diesem Hintergrund umfassen Implikationen für die Fortbildungspraxis 1) die Entwicklung einer Fortbildungskultur, 2.) die Förderung der Interessentwicklung an und bei Fortbildungen und 3.) die Schaffung eines adressatenorientierten Fortbildungsrahmens. Poster „Die Audio-Feedbacks waren super!“ – Wie bewerten Studierende vorbereitete, direkte Rückmeldungen bei der Analyse von Unterrichtsvideos in der asynchronen Online-Lehre Tabea Zmiskol, Miriam Hess Otto-Friedrich-Universität Bamberg, Deutschland a) Forschungsstand und theoretische Bezüge Der Analyse von Unterrichtsvideos werden positive Lerneffekte zugesprochen, die zunehmend systematisch empirisch untersucht werden (zsf. Steffensky & Kleinknecht, 2016). Die Arbeit mit Unterrichtsvideos in der asynchronen Online-Lehre ermöglicht es Studierenden zudem, sich Wissensinhalte eigenständig, zeit- und ortsungebunden zu erarbeiten (Gröschner 2021). So zeigen auch Befragungen von Studierenden, dass diese den Einsatz von Unterrichtsvideos auch und gerade in der Online-Lehre als motivierend und lernförderlich empfinden, allerdings teilweise Austausch und Rückmeldung vermissen (Hess, 2021). Zudem deuten Studierendenbefragungen darauf hin, dass vorbereitete Sprachkommentare durch Expert:innen dem Bedürfnis nach Rückmeldung entgegenkommen (Zmiskol & Hess, in Druck). b) Fragestellung und Zielsetzung Das Teilprojekt „Interaktive Unterrichtsvideos in der Lehrerinnen- und Lehrerbildung“ (InViLebi), das im Rahmen des Projekts „Digitale Kulturen der Lehre entwickeln“ (DiKuLe) von der Stiftung „Innovation in der Hochschullehre“ gefördert wird, untersucht, wie sich sogenannte interaktive Unterrichtsvideos in der asynchronen Online-Lehre einsetzen lassen, um die Entwicklung der professionellen Wahrnehmung von Studierenden zu fördern (z.B. Sherin & van Es, 2009). Ein besonderer Fokus liegt dabei auch auf der Frage, wie online eine sinnvolle, direkte Rückmeldung an Studierende in großen Lerngruppen erfolgen kann. Der Posterbeitrag fokussiert folgende Fragen: (1) Wie werden vorbereitete Sprachkommentare von den Studierenden angenommen sowie in ihrer Qualität und Lernwirksamkeit eingeschätzt? (2) Wie groß ist das Bedürfnis der teilnehmenden Studierenden nach einer (direkten) Rückmeldung? c) Methode(n) und Design Die Datengrundlage der Untersuchung bieten eine Einführungsvorlesung und ein Grundlagenseminar, die im Wintersemester 2022/23 an der Universität Bamberg stattfanden und in deren Rahmen Studierende eine asynchrone Online-Lerneinheit zum Thema „Umgang mit Leistungsheterogenität im Grundschulunterricht“ bearbeiteten (N=319 Studierende des Grundschullehramts; 87,8% weiblich; M_{(Fachsemester)}=2.3; SD_{(Fachsemester)}=1.3). Die Erhebung erfolgte in einem quasi-experimentellen Prä-Post-Design mit vier Interventionsgruppen. Die Interventionsgruppen unterscheiden sich darin, ob die Studierenden die Unterrichtsvideos A) fragengeleitet mit Sprachkommentar als direkter Rückmeldung (= interaktive Videoanalyse), B) fragengeleitet ohne Sprachkommentar, C) offen mit Sprachkommentar oder D) offen ohne Sprachkommentar analysierten. Die Fragebögen des Prä-/Posttests sowie zu Beobachtungsmethode (fragengeleitet vs. offen) und Sprachkommentar (mit vs. ohne Sprachkommentar) bestanden aus geschlossenen und offenen Fragen. Diese werden deskriptivstatistisch, varianz- und inhaltsanalytisch ausgewertet. d) (Zwischen-)Ergebnisse Der Sprachkommentar wurde in den Gruppen, in denen er angeboten wurde (Gruppe A und C), von den Studierenden nach Selbstaussage gut angenommen und in der Regel mindestens einmal, teils auch mehrfach angehört. Die Studierenden schätzten die direkte Rückmeldung durch die vorbereiteten Sprachkommentare als weitgehend qualitativ hochwertig und lernwirksam ein (z.B. stimmten 85.4% der Studierenden auf einer 7-stufigen Skala der Aussage „Das Feedback der Dozentin hat mir gezeigt, wie eine gute Analyse der Unterrichtsvideos aussieht.“ überwiegend oder voll zu; M=6.3, SD=0.9). Insgesamt blieb das Bedürfnis nach Rückmeldung im Prä-Post-Vergleich unverändert hoch. e) Diskussion der Ergebnisse und Ausblick Zwischen den geschlossenen (Skalenwert) und offenen (Erklärung) Selbstangaben der Studierenden zu ihrem Nutzungsverhalten rund um die Sprachkommentare gibt es Diskrepanzen, die darauf hinweisen, dass die Annahme des Angebots Sprachkommentar deutlich differenzierter ausfällt, als es in der Erhebung zunächst abgefragt wurde. Entsprechende vertiefende Erhebungen stehen für das kommende Jahr an. Insgesamt scheint sich der Sprachkommentar als akzeptierte Möglichkeit zum Erhalten direkter Rückmeldungen bei Videoanalysen in der Online-Lehre zu bestätigen. Poster Classroom Management, auffälliges Verhalten und Lehrkraftfeedback – Wie wirkt Lehrkrafthandeln auf auffällige Schülerinnen im Grundschulunterricht? Raphael Plutz, Markus Spilles, Christian Huber Bergische Universität Wuppertal Theoretischer Hintergrund* Classroom Management gilt als eine der zentralen Voraussetzungen zur Umsetzung eines störungsfeien Unterrichts und zur Erhöhung der aktiven Lernzeit (u.a. Helmke, 2007). In der Literatur sind verschiedene Operationalisierungen des Konstrukts zu finden. Ein spezifischer Ansatz ist das sogenannte low profile Classroom Management (Borich, 2016; Helmke, 2007; Rinne, 1982) (LPCM). Prämisse des LPCM ist das möglichst niedrigschwellige Reagieren auf kleinere Unterrichtsstörungen, sodass das Fortschreiten des Unterrichts nicht unterbrochen wird (Borich, 2016). Die Klassengemeinschaft wird in diesem Sinne nicht am gemeinsamen Weiterlernen gehindert. Die Umsetzung eines LPCM könnte allerdings weiterhin Potential bieten, um die soziale Integration von Schulkindern, die den Unterricht stören, nicht zu gefährden. Diese ist ein psychologisches Grundbedürfnis (Ryan & Deci, 2001) und gilt als Grundvoraussetzung für schulisches Lernen und eine förderliche emotional-soziale Entwicklung. Soziale Ausgrenzung geht hingegen mit einer Vielzahl schulisch relevanter Risikofaktoren wie Aggressivität, Angststörungen, depressive Symptome und schwachen Schulleistungen oder Schulabsentismus einher (Newcomb, Bukowski & Pattee, 1993; Wentzel, Jablansky & Scalise, 2021; Flook, Repetti & Ullmann, 2005). Dabei kann angenommen werden, dass Kinder mit Verhaltensproblemen bis zu dreimal häufiger von sozialer Ausgrenzung im inklusiven Unterricht betroffen als ihre Mitschülerinnen ohne sonderpädagogischen Förderbedarf (Bless, 2007; Huber, Nicolay & Schulze, 2021). Einen möglichen Erklärungsansatz bietet die Perspektive der social referencing theory* (Feinman, 1992). Gemäß dieser beeinflusst das durch die Mitschülerinnen wahrnehmbare Lehrkraftfeedback die soziale Integration von Kindern mit auffälligem Verhalten (Huber, 2019). Fragestellung* Die zugrundeliegende Studie basiert auf einem Wirkmodell, nach dem Classroom Management einerseits das Sozialverhalten von Schulkindern mit Verhaltensproblemen günstig beeinflusst und andererseits die Häufigkeit von reaktivem negativem Lehrkraftfeedback reduziert. Es wird angenommen, dass der Zusammenhang zwischen sozialer Integration und Verhaltensproblemen im Unterricht insbesondere in Schulkassen hoch ist, in denen die Lehrkräfte ein reaktives Classroom Management zeigen, bei dem Kinder für die Klassenöffentlichkeit nachvollziehbar auf Regelverstöße hingewiesen werden. Den theoretischen Grundlagen entsprechend sollte LPCM die Häufigkeit von reaktivem negativem Lehrkraftfeedback, das von den Mitschülerinnen wahrgenommen werden kann, reduzieren. Weiterhin ist auch eine abschwächende Wirkung auf den Zusammenhang von Verhaltensproblemen und sozialer Akzeptanz denkbar. Methode* Die Fragestellung wurden als Teil eines Forschungsprojektes des Arbeitsbereiches Rehabilitationswissenschaften mit dem Förderschwerpunkt Emotional-soziale Entwicklung der Bergischen Universität Wuppertal untersucht. Dabei wurden 690 Schulkinder (54 % weiblich) aus 35 Klassen der 3. und 4. Jahrgangsstufe (M_Alter = 9.19; SD_Alter = 0.88) befragt sowie die Klassenlehrkräfte (91 % weiblich; M_LK-Alter = 42.12; SD_LK-Alter = 9.70) in ihrem Unterricht beobachtet und durch zuvor geschulte Raterinnen beurteilt. Als abhängige Variable (AV) wurde das öffentlich wahrnehmbare negative Lehrkraftfeedback über ein Peer-Ratingverfahren erfasst. Bei diesem schätzten die Schülerinnen ein, wie häufig ihre Mitschülerinnen grundsätzlich von ihrer Klassenlehrkraft getadelt werden. Als unabhängige Variablen wurden die Verhaltensprobleme pro Schülerin über die Items zu oppositionellem und störendem Verhalten der deutschsprachigen Version der Integrated Teacher Report Form (ITRF) (Casale, Volpe, Hennemann, Briesch, Daniels & Grosche, 2019) aus der Lehrkraftperspektive (UV1) und das LPCM mittels eines in dem Arbeitsbereich entworfenen Beobachtungsbogens (UV2) erfasst. Ergebnisse Für die Datenanalyse wurden Mehrebenenregressionsanalysen mittels des R-Pakets lme4 (Bates, Mächler, Bolker & Walker, 2015) durchgeführt. Dabei sind die individuellen Schülerinnenmerkmale auf Level 1 (AV1, UV1) und das LPCM (UV2) auf Level 2 angesiedelt. Erwartet wird eine Cross-Level-Interaktion des LPCM auf den Zusammenhang zwischen Verhaltensproblemen und verhaltensbezogenem negativem Feedback. Eine erste Analyse der Daten zeigt, dass im Sinne der theoretischen Annahmen eine Interaktion zwischen dem störenden Verhalten und LPCM bei einer Reduktion des wahrgenommen negativen Lehrkraftfeedbacks zu beobachten ist (β = -0.01; p = .034). Im Rahmen weiterführender Analysen sollen weitere mögliche positive Effekte untersucht werden. Diese stellen, neben den Annahmen der social referencing theory* und des LPCM, eine Grundlage für die Diskussion des Posterbeitrages dar. Poster Selbstwirksamkeit von Lehramtsstudierenden im Unterrichtspraktikum: Eine Analyse latenter Veränderungen und die Bedeutung der Qualität des Mentorings Irina Sachs¹, Andreas Bach¹, Johannes König² ¹Paris Lodron Universität Salzburg, Österreich; ²Universität zu Köln Theoretischer Hintergrund. Schulpraktika sind für Lehramtsstudierende ein bedeutender Bestandteil ihres Lehramtsstudiums (Bach, 2020; König et al., 2018). Insbesondere Unterrichtspraktika ermöglichen Handlungserfahrungen, die nach der Selbstwirksamkeitstheorie (Bandura, 1997) eine wichtige Informationsquelle zum Aufbau und zur Veränderung von Selbstwirksamkeit bilden (Bach & Hagenauer, 2022; Morris et al., 2017). Studienergebnisse belegen für Studierende mehrheitlich Anstiege, aber auch Rückgänge ihrer Selbstwirksamkeit im Verlauf von Schulpraktika (im Überblick Bach, 2022). Die Qualität des schulischen Mentorings stellt in diesem Professionalisierungsprozess eine wichtige Rahmenbedingung dar (Clarke et al., 2014; Hoffman et al., 2015, Reintjes et al., 2018), wobei die verschiedenen Mentoring-Konzepte in Bezug auf die Gestaltung der Beziehungen zwischen Mentorinnen und Mentees in konstruktivistisch orientierte und transmissive Ansätze differenziert werden (Braun et al., 2022; Richter et al., 2013; Wang & Odell, 2002). Konstruktivistisch ausgerichtetes Mentoring hat sich bei berufseinsteigenden Lehrpersonen als selbstwirksamkeitsförderlich erwiesen (LoCasale-Crouch et al., 2012; Richter et al., 2013). Für Schulpraktika fehlen jedoch Studien, die untersucht haben, ob diese Mentoring-Ansätze auch relevante Erklärungsfaktoren für Veränderungen der Selbstwirksamkeit von Lehramtsstudierenden darstellen. Fragestellung.* Die Studie griff dieses Forschungsdesiderat auf. Untersucht wurde die Frage, welchen Effekt konstruktivistisch und transmissiv orientiertes Mentoring auf die Veränderung der Selbstwirksamkeit von Studierenden während ihres Unterrichtspraktikums in den Dimensionen Instruktionsstrategien, Classroom Management und Schülerinnen-Engagement hat. Methode.* Es handelt sich um eine Längsschnittstudie über ein Studiensemester mit zwei Messzeitpunkten. Befragt wurden 231 Lehramtsstudierende der Universität Salzburg (68,4 % weiblich, Alter: M = 22.88, SD = 3.46), die mehrheitlich im fünften Bachelor-Semester Lehramt Sekundarstufe studierten und die in der Regel zwei zeitlich parallele semesterbegleitende Unterrichtspraktika in den von ihnen studierten Unterrichtsfächern absolvierten. Zur Erfassung des konstruktivistisch und transmissiv orientierten Mentorings in beiden Praktika wurde eine adaptierte Skala von Richter et al. (2013) genutzt (konstruktivistisch orientiertes Mentoring: α = .82 bzw. .87; vier Items; transmissiv orientiertes Mentoring: α = .74 bzw. .81; drei Items, vierstufiges Antwortformat). Die Selbstwirksamkeit wurde mit einer Skala von Pfitzner-Eden et al. (2014) erfasst (Instruktionsstrategien: α_t1 = .65 bzw. α_t2= .64; Classroom Management: α_t1 = .88 bzw. α_t2= .83; Schülerinnen-Engagement: α_t1 = .68 bzw. α_t2= .74; jeweils vier Items, fünfstufiges Antwortformat). Die Veränderungsanalysen erfolgten mittels True-Intraindividual-Change(TIC)-Modellen* (Steyer, et al., 1997, 2000). Die Mentoring-Variablen wurden anschließend als unabhängige Variablen in die TIC-Modelle aufgenommen. Die statistischen Analysen wurden mit dem Programm Mplus 8.8 (Muthén & Muthén, 1998–2017) durchgeführt. Die Parameterschätzungen basierten auf dem Maximum-Likelihood-Robust(MLR)-Verfahren. Fehlende Werte wurden mittels Full-Information-Maximum-Likelihood (FIML)-Verfahren berücksichtigt. Ergebnisse und ihre Bedeutung. Die Selbstwirksamkeitsüberzeugungen bezogen auf Instruktionsstrategien (M_T1 = 4.11, SD = 0.33; M_Diff = 0.09, SD = 0.27; d = 0.30) und Classroom Management (M_T1 = 3.28, SD = 0.88; M_Diff = 0.32, SD = 0.65; d = 0.41) stiegen im Mittel statistisch signifikant an. Für die Selbstwirksamkeit in Bezug auf Schülerinnen-Engagement zeigte sich keine statistisch signifikante Veränderung (M_T1 = 4.01, SD = 0.42; M_Diff = 0.06, SD = 0.38). Darüber hinaus wurden statistisch signifikante interindividuelle Unterschiede im Ausgangswert und im latenten Veränderungswert für alle drei Dimensionen von Selbstwirksamkeit gefunden. Konstruktivistisch orientiertes Mentoring hatte einen schwachen Effekt auf die Selbstwirksamkeitsveränderung in Bezug auf Instruktionsstrategien (ß = .19, p = .036) und bezogen auf Classroom Management (ß = .20, p = .038). Transmissiv orientiertes Mentoring hatte keine statistisch signifikanten Effekte. Die Ergebnisse der Studie bestätigen die theoretischen Annahmen (Bandura, 1997) sowie frühere empirische Studienbefunde (Bach, 2022; Klassen & Durksen, 2014), dass Schulpraktika bedeutsame Lerngelegenheiten für positive Selbstwirksamkeitsveränderungen darstellen können, wobei Mentoring diesen Prozess unterstützen kann. Die Ergebnisse erweitern den Forschungsstand, indem empirische Evidenz für die Bedeutung von konstruktivistischem Mentoring im Kontext von Schulpraktika und für verschiedene Domänen von Selbstwirksamkeit vorliegen. Poster Der begleitete Einsatz von Lehramtsstudierenden als Lernbegleiter:innen in Schulen: Reflexion der Professionalisierungschancen und Herausforderungen Kerstin Göbel, Zuzanna M. Preusche Universität Duisburg-Essen, Deutschland Praxisphasen während des Studiums, die meist in einem Zusammenspiel verschiedener Akteure wie Schulen, Ausbildungszentren sowie den jeweiligen Universitäten stattfinden, leisten einen wichtigen Beitrag zur Professionalisierung von angehenden Lehrpersonen (Degeling et al., 2019; Kunter et al., 2011). Eine besondere Praxis-Begleitung von Studierenden in Schulen wurde in NRW u. a. im Rahmen des Programms students@school (gefördert durch das Landesprogramm „Ankommen und Aufholen für Schülerinnen und Schüler“) realisiert. Hier wurden Studierende als Lernbegleiter:innen eingesetzt, um Lehrkräfte im Unterricht zu unterstützen. Die studentischen Lernbegleiter:innen sollten in den Schulen vor allem mit Schüler:innen arbeiten, die durch die pandemiebedingten Schulschließungen in ihrer Kompetenzentwicklung beeinträchtigt waren (Helm, 2020; Dreer & Kracke, 2021; Huber & Helm, 2020). Im Gegensatz zu dem aufgrund des fortwährenden Lehrpersonenmangels häufig nicht ausreichend ausgebildeten und oft unerfahrenen Vertretungspersonal an Schulen (Tillmann, 2020), wurde der Einsatz der Studierenden im Programm u. a. von Zentren für Lehrkräftebildung, den Bildungswissenschaften sowie den Fachdidaktiken verschiedener Universitäten systematisch begleitet. Den Studierenden wurde dadurch theoriegeleitet und praxisorientiert durch Lehrpersonen und Universität, die Möglichkeit gegeben, ihre professionelle Handlungskompetenzen zu entwickeln. Das vorliegende Poster widmet sich der Frage, inwiefern ein derartiges Programm, welches für die Studierenden außerhalb der universitären Praktika stattfindet, zu ihrer Professionalisierung als angehende Lehrpersonen beitragen kann. Hierzu wurden in einer ersten explorativen Untersuchung acht in dem Programm tätige Studierende in einem problemzentrierten Interview nach Witzel (2000) zu ihren Erfahrungen, den wahrgenommenen Herausforderungen und der Entwicklung von professionellen Handlungskompetenzen im Sinne des Professionswissens (pädagogisches Wissen und fachdidaktisches Wissen), ihrer selbstregulativen Fähigkeiten, ihrer Überzeugungen und Wertehaltungen sowie ihrer motivationalen Orientierungen befragt. Die Interviews wurden mit der strukturierenden qualitativen Inhaltsanalyse nach Kuckartz (2012) analysiert, hierfür wurden sowohl deduktive als auch induktive Kategorien entwickelt. Erste Ergebnisse deuten auf einen positiven Effekt der Teilnahme an dem Programm für die eigene Professionalisierung und die Bestätigung des Berufswunsches hin. Bezüglich des pädagogischen Wissens gaben die Studierenden mehrheitlich an, vor allem praktisches und informelles Wissen erworben zu haben sowie durch die Beobachtung unterschiedlicher Lehrpersonen im Unterricht ihr Wissen erweitert zu haben sowie erste Erfahrungen im Führen einer Klasse gesammelt zu haben. Die Vermittlung von fachdidaktischen und bildungswissenschaftlichen Lerninhalten stellt eine wichtige Komponente des Programms dar; die Studierenden gaben diesbezüglich an, dass sie lernen konnten, welche Aspekte für Schüler:innen beim Erlenen neuer Inhalte (z. B. dem Umgang mit unterschiedlichem Vorwissen oder der Bedeutung von stetiger Wiederholung) besonders wichtig sein können. Im Hinblick auf die Selbstregulation berichteten die Studierenden durch die Arbeit in der Schule Flexibilität und Anpassungsfähigkeit entwickelt zu haben, um mit den situativen Gegebenheiten und den spezifischen Bedürfnissen der Schüler:innen umzugehen. Die Befunde zum Einsatze von Studierenden als Lernbegleiter:innen in Schulen werden im Hinblick auf das Potenzial für Professionalisierungprozesse diskutiert. Poster Transferaktivitäten und transferbezogene Einstellungen in Projekten der empirischen Bildungsforschung – Entwicklung eines quantitativen Befragungsinstruments Caroline J. Scherer¹, Elizabeth Farley-Ripple², Mareike Kunter¹, Ulrike Hartmann¹ ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation; ²University of Delaware Theoretischer Hintergrund* Von den Ergebnissen empirischer Bildungsforschung wird häufig erwartet, dass diese eine hohe praktische Relevanz für schulische Akteure aufweisen und Verbesserungen in der Schulpraxis bewirken (Farley-Ripple et al., 2018). Die Realität bleibt allerdings oftmals hinter diesen Erwartungen zurück (z.B. Stark, 2017). So gestaltet sich der Transfer zwischen Forschung und Praxis insgesamt als Herausforderung, was u.a. im Begriff Research Practice Gap zum Ausdruck kommt. In der Annahme, Erkenntnisse aus der Forschung könnten direkt in die Praxis übertragen werden, kommt ein transmissives Verständnis von Transfer zum Ausdruck (Mohajerzad & Schrader, 2022). In der Literatur wird Transfer allerdings zunehmend als bidirektionale Aufgabe konzeptualisiert, bei der erst durch das Zusammenspiel von Forschung als Angebotsseite und Bildungspraxis als Nutzungsseite praktische Relevanz erzeugt wird (Brühwiler & Leutwyler, 2020; Farley-Ripple et al., 2018). Bisherige Forschungserkenntnisse beziehen sich überwiegend auf die Nutzung bildungswissenschaftlicher Befunde durch Akteure aus der Praxis. Will man Transferaktivitäten erfolgreicher machen, ist es jedoch auch notwendig, die Perspektive der Forschenden besser zu verstehen. Hier dominieren bisher theoretische Diskurse über die Bedeutung von Praxisrelevanz für die Erkenntnisse empirischer Bildungsforschung. Es liegen jedoch kaum empirische Studien zu den Bedingungen und Herausforderungen von Transferbemühungen aus der Perspektive Forschender vor. Erste Anhaltspunkte liefert eine Interviewstudie von Hartmann und Kunter (2022), deren Resultate aufzeigen, dass Praxisperspektiven insgesamt in einem geringen Ausmaß in Projekte der empirischen Bildungsforschung einbezogen werden. Darüber hinaus zeigten sich innerhalb von und zwischen Projekten deutliche Unterschiede hinsichtlich Erscheinungsformen und Ausmaß der Praxisbezüge. Diese Ergebnisse basieren jedoch auf einer kleinen, nicht repräsentativen Stichprobe und sollten daher durch quantitative Datenerhebungen abgesichert und ergänzt werden. Dies ermöglicht perspektivisch auch den Vergleich von Transferaktivitäten in der Bildungsforschung hinsichtlich ihrer Zusammenhänge mit unterschiedlichen organisationalen oder kulturellen Kontexten. Ziel der Studie Das Poster stellt die Konzeption eines deutschsprachigen Messinstruments vor, mithilfe dessen Transferaktivitäten und transferbezogene Einstellungen Forschender in Projekten der empirischen Bildungsforschung quantitativ erfasst werden sollen. Als theoretischer Rahmen des Instruments dient das Modell von Farley-Ripple et al. (2018), welches sechs Tiefendimensionen des Transfers postuliert. Methode Basis des entwickelten Instruments ist der Survey of Evidence in Education for Researchers (SEE-R) (May et al., 2018), der vom Rahmenmodell von Farley-Ripple et al. (2018) ausgeht. Dieser erfasst die Tiefe der Produktion (depth of production) von Forschung und damit deren Relevanz für die Praxis in den Dimensionen Evidence, Search/Dissemination, Interpretation, Participation, Frequency und Decision Stage. Weiterhin werden sowohl institutionelle Rahmenbedingungen als auch individuelle Kapazitäten erfasst, um das Ausmaß potenzieller Research Practice Gaps festzustellen. Der SEE-R wurde in weiten Teilen übernommen, aus dem Englischen übersetzt und für den deutschen Kontext adaptiert. Das Instrument wurde zudem um weitere Skalen zu Einstellungen und Motivation bezüglich des Engagements auf einzelnen Transferdimensionen ergänzt, die aus der Interviewstudie von Hartmann und Kunter (2022) abgeleitet wurden. In Skalen mit geschlossenem Antwortformat werden die Befragten beispielsweise nach ihrer Zustimmung zu diversen Aussagen oder nach der Häufigkeit bestimmter Aktivitäten befragt. Einzelne offene Items zielen außerdem auf Details zur Arbeit der Forschenden ab. Auf dem Poster werden das Instrument sowie erste Ergebnisse aus der Pilotierung des Online-Fragebogens (Skalen- und Dimensionsanalysen sowie Korrelationsanalysen) anhand einer Stichprobe von N ≈ 30 Projektleitungen aus Bildungsforschungsprojekten präsentiert. Zudem wird die mehrstufige Sampling-Strategie für die Haupterhebung vorgestellt, die das Ziel eines interkulturellen Vergleichs von Transferaktivitäten in Projekten der Bildungsforschung zwischen Deutschland und USA verfolgt. Ausblick Mit dem entwickelten Messinstrument soll erfasst werden, inwieweit in Forschungsprojekten Transferaktivitäten im Hinblick auf die sechs genannten Dimensionen des Modelles von Farley-Ripple et al. (2018) stattfinden. Daneben werden durch die Abbildung individueller Kapazitäten und Motivationen sowie institutioneller Rahmenbedingungen einige Ansatzpunkte für Veränderungen im Hinblick auf ein bidirektionales Transferverständnis aufgezeigt. Auf Basis der Pilotierungsergebnisse werden mögliche Anpassungen des Instrumentes diskutiert. Poster Wahrnehmung schulischer Elterngespräche – Eine Untersuchung visueller Aufmerksamkeitsprozesse bei Expert:innen und Noviz:innen mittels Eye-Tracking Kristina Ackel-Eisnach¹, Inga Wagner², Alexandra Merkert¹, Ilona Weyrauch¹, Josef Strasser¹ ¹Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau, Deutschland; ²Zentrum für empirische pädagogische Forschung, Deutschland Schulische Elterngespräche und die damit zusammenhängende Gesprächsführung bilden ein wichtiges Handlungsfeld von Lehrkräften (u.a. Schnebel, 2017). Anders als professionelle Berater:innen in der pädagogisch-psychologischen Praxis werden Lehrkräfte hinsichtlich Beratung und Gesprächsführung jedoch eher rudimentär ausgebildet (u.a. Aich & Behr, 2019). Dies führt im Schulalltag häufig dazu, dass Elterngespräche von Lehrkräften als anstrengend und schwierig erlebt werden (Gartmeier, 2018; Lemmer, 2012). Die Forschung zur Expertise professioneller Berater:innen weist auf die Bedeutung eines adäquaten individuellen Fallverständnisses für kompetente Beratung hin. Dieses basiert auf einer professionellen Wahrnehmung der Situation, u. a. der Anliegen der Interaktionspartner:innen, deren Emotionen und Bedürfnisse (Strasser & Gruber, 2015; Strasser et al., 2005). Im deutschen Sprachraum ist die professionelle Wahrnehmung bei Lehrkräften im Rahmen schulischer Elterngespräche noch wenig untersucht (u.a. Behr, 2023; Lenske et al., 2022). Ein anderes Bild zeigt sich hingegen für die Untersuchung von Lehrkräften hinsichtlich der Unterschiede zwischen Expert:innen und Noviz:innen in der Wahrnehmung von Unterrichtssituationen. In diesem Bereich verwendet eine steigende Zahl an Studien mittlerweile Eye Tracking, um visuelle Aufmerksamkeitsprozesse zu untersuchen und daraus auf die professionelle Unterrichtswahrnehmung von Lehramtsstudierenden und erfahrenen Lehrkräften zu schließen (u. a. Grub et al. 2020). Vor dem Hintergrund der kritischen Diskussion der Eye-Mind-Hypothese (Just & Carpenter, 1980) erscheint jedoch eine Methodentriangulation aus Eye Tracking-Daten und Verbaldaten sinnvoll (Orquin & Holmqvist, 2018), um die dahinterliegenden kognitiven Prozesse besser abbilden zu können. Das Projekt „BiB – Beratung im Blick“ bringt deshalb Blickbewegungs- und retrospektive Laut-Denken-Daten bei der Betrachtung videographierter Gespräche zusammen. Es wird erforscht, was die Wahrnehmung von Beratungssituationen bestimmt. Dabei interessieren vor allem, welche Rolle Merkmale der Beratenden (Erfahrung, Wissen und z.B. Empathie) spielt (Selbstauskunft der Teilnehmenden). Untersucht werden hierzu Expert:innen und Noviz:innen aus der pädagogischen bzw. psychologischen Beratungspraxis mittels Eye-Tracking. Die geplante Stichprobe besteht aus n = 10 Expert:innen (> 15 Jahre Berufserfahrung in der pädagogisch-psychologischen Beratungspraxis) und n = 10 Noviz:innen (Lehramtsstudierende im ersten oder zweiten Semester). Bislang wurden Daten von n = 8 Lehramtsstudierenden erhoben (Alter: M = 22.4, SD= 2.3; Geschlecht: 5 weibliche, 3 männliche). Die Datenerhebung wird bis zum Zeitpunkt der Konferenz abgeschlossen sein. Der Untersuchungsablauf gliedert sich in mehrere Phasen. Zunächst wird den Proband:innen nach einer kurzen Einführung ein authentisches videographiertes schulisches Elterngespräch (durch Expert:innenratings geprüft) gezeigt. Hierbei werden die Blickbewegungen (u. a. Fixationen, Sakkaden) der Proband:innen mittels Eye-Tracking gemessen. Anschließend beantworten die Proband:innen drei Fragen zur kognitiven Belastung (Paas, 1992). Danach betrachten die Proband:innen nochmals das Video mit ihren Blickbewegungen und verbalisieren dazu, was sie bei den Blickbewegungen gedacht haben (retrospective thinking aloud). Die Personen werden mit Bild und Ton aufgenommen. Zuletzt füllen die Proband:innen einen standardisierten Fragebogen aus. Dieser beinhaltetet Fragen zu soziodemographischen Merkmalen, Vorerfahrungen, Präferenz zur verbalen und visuellen Informationsverarbeitung (Kirby et al., 1988), Empathie (Leibetseder et al., 2001) und beratungsbezogener Selbstwirksamkeit (Hertel, 2009). Vorläufige Analysen des bereits erhobenen Samples lassen Unterschiede in der Wahrnehmung zwischen Personen mit und ohne Beratungserfahrung vermuten. Dies soll im weiteren Untersuchungsablauf weiter analysiert werden. Die Ergebnisse der vorliegenden Studie versprechen neuartige Einblicke in die Grundlagen der professionellen Wahrnehmung von Beratungssituationen. Durch die Identifikation maßgeblicher Kennzeichen expertenhaften Wahrnehmens sollen Ansatzpunkte für passgenauere Ausbildungs- und Trainingsprogramme für angehende Berater:innen und die Lehramtsausbildung gewonnen werden. Poster Was wäre, wenn Bayern inklusive Schulen anstatt Förderschulen hätte? Eine räumlich-strukturierte Simulationsstudie zur inklusiven Bildungslandschaft basierend auf amtlichen Schulstatistiken von 2020 Nikola Ebenbeck, Markus Gebhardt Ludwig-Maximilians-Universität München, Deutschland Theorie und Fragestellungen Inklusion zu implementieren erfordert strukturelle Änderungen im bestehenden Schulsystem, einschließlich der Schließung von Förderschulen. Bisher wurden diese Maßnahmen nur in einigen Bundesländern umgesetzt (Steinmetz et al., 2021), während beispielsweise in Bayern nicht die Anzahl an Schüler:innen in Förderschulen reduziert wurde. Das Festhalten am Förderschulsystem führt zu systematischen Verzerrungen bei der Identifizierung, Zuweisung und der Auswahl von Schulstandorten in Deutschland (Ebenbeck et al., 2023; Goldan & Grosche, 2021; Helbig & Steinmetz, 2021). Offen bleibt, wie der Übergang zu einem inklusiven Schulsystem erfolgen kann, ob alle Förderschulen oder lediglich sonderpädagogische Förderzentren (für Lern-, Sprach- und Verhaltensbedarf; SFZs) geschlossen werden sollten oder ob spezialisierte Förderschulen für Hören, Sehen, motorische und geistige Entwicklung beibehalten werden sollten. Des Weiteren stellt sich die Frage, ob Schüler mit Behinderungen anstatt in Förderschulen in nahegelegenen Regelschulen oder in ausgewählten inklusiven Grundschulen mit einer Förderquote von 20% wie beispielsweise in Österreich (Buchner & Gebhardt, 2011) unterrichtet werden sollen. In dieser Simulationsstudie wird untersucht, wie ein inklusives Primarschulsystem in Bayern aussehen könnte: Inwieweit vergrößern sich die Grundschulen durch eine Auflösung der Förderschulen? Inwieweit verändern sich die Förderquoten der Grundschulen durch eine Auflösung der Förderschulen? Beeinflusst die Siedlungsstruktur der Landkreise die Umsetzungsmöglichkeit inklusiver Schulsysteme? Daten und Methoden Es werden vier inklusive Schulsysteme deterministisch in der Statistiksoftware R modelliert und verglichen: Modell 1a: Schließung aller Förderschulen und wohnortnahe Inklusion an allen Grundschulen Modell 1b: Schließung aller Förderschulen und Inklusion an inklusiven Grundschulen Modell 2a: Schließung aller SFZs und wohnortnahe Inklusion an allen Grundschulen Modell 2b: Schließung aller SFZs und Inklusion an inklusiven Grundschulen Als Datengrundlage dienen der Beschulungsort aller Grund- und Förderschüler in Bayern im Jahr 2020 (N = 475.087) des Bayerischen Ministeriums für Unterricht und Kultus sowie offene Geodaten. Die Verteilung der Förderschüler auf die jeweiligen Grundschulen erfolgt in den Modellen 1a und 2a mittels Proportional Allocation: N ist die Gesamtzahl der Förderschüler im Landkreis und m die Anzahl der Grundschulen. Die Anzahl der Schüler an jeder Grundschule sei G_i für i = 1, 2, …, m. Anzahl der neuen Förderschüler auf Grundschule i = N / (Σ (k = 1 bis m) G_k) * G_i In den Modellen 1b und 2b werden Grundschulen nach Größe sortiert, beginnend mit der größten im Landkreis, als Inklusionsschulen ausgewählt und bis zu einer Förderquote von 20% aufgefüllt: Anzahl der neuen Förderschüler auf Grundschule i = 0,2 * G_i + Σ(k=1 bis i-1) (Anzahl der verteilten Förderschüler_k - F_i) * 0,8 wobei k die vorherigen Schulen repräsentiert, die bereits betrachtet wurden. Mittels Hypothesentests wird untersucht, ob sich die Grundschulgrößen und Förderquoten in städtischen und ländlichen Gebieten zwischen den Modellen unterscheiden. Ergebnisse Nur die Schließung aller Förderschulen (Modelle 1a und 1b) führen zu einer signifikanten Erhöhung der Schülerzahlen in den Grundschulen (Modell 1a: t(4438.8) = -3.6751, p < .001; Modell 1b: t(4327.8)=-3.3768, p < .001). Die Schließung der SFZs (Modelle 2a und 2b) führen zu keiner signifikanten Erhöhung der Schülerzahlen. Im städtischen und ländlichen Raum entwickeln sich die Schülerzahlen nicht unterschiedlich, ein aktuell vorherrschender signifikanter Unterschied in den Schulgrößen zwischen Stadt und Land (p < .001) bleibt jedoch bestehen. Das Inklusionsschulprinzip (Modell 1b und 2b) führt für die meisten Grundschulen zu keiner Steigung in den Schülerzahlen, dafür gewinnen wenige Grundschulen prozentual und insgesamt viele Schüler:innen dazu und wachsen stark an. Dennoch bestehen signifikante Unterschiede in der mittleren Steigung der Schülerzahlen in allen Modellen zwischen städtischen und ländlichen Schulen (p < .001). Die Modelle 1a und 2a haben weniger Extremwerte durchschnittlich höhere Steigungen an Schülerzahlen, da sich die Schüler:innen gleichmäßig auf alle Grundschulen verteilen. Die Förderquote steigt in allen Modellen signifikant an (p > .001), ist jedoch nicht abhängig von der Siedlungsstruktur der Landkreise. Poster Erhebungen von Kompetenzen im Online-Assessment Kathrin Thums¹, Karin Gehrer¹, Lara Petersen², Lena Engelhardt³, Frank Goldhammer³, Kathrin Lockl¹, Ilka Wolter¹ ¹LIfBi – Leibniz-Institut für Bildungsverläufe, Deutschland; ²IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik; ³DIPF\| Leibniz-Institut für Bildungsforschung und Bildungsinformation Hintergrund: In Large-Scale-Assessments werden überwiegend hoch standardisierte und gut erprobte Verfahren zur Erhebung kognitiver Daten eingesetzt. Mittlerweile gehören neben computerbasierten Erhebungen (CBA), nicht zuletzt auch pandemiebedingt, web-basierte Online-Assessments zu den üblichen Erhebungsverfahren, welche neben niedrigeren Kosten auch eine flexiblere Teilnahme hinsichtlich Zeit und Ort der Erhebung ermöglichen. Diese technologiebasierten Erhebungsverfahren greifen zudem die alltäglichen Routinen und Arbeitsgeräte der Studienteilnehmenden auf. Vielfältige Studien und Metaanalysen haben sich bereits mit Unterschieden zwischen überwachter bzw. beobachteter (proctored) Testung im Vergleich zu unbeobachteter (unproctored) web-basierter Online-Testung beschäftigt (u. a. Gnambs, 2023; Steger et al., 2020; Wise et al., 2019). Die Ergebnisse zeigen, dass bei unbeobachteten web-basierten Erhebungen Verzerrungseffekte durch Täuschungen der Teilnehmenden auftreten können oder sich das Antwortverhalten verändert, wie zum Beispiel durch schnelles Antworten (Kroehne et al., 2020). Jedoch kann auf Basis anfallender Prozessdaten unerlaubtes und nicht erwünschtes Testverhalten erfasst werden (Lindner et al., 2019; Steger et al., 2021). Die Herausforderungen für Online-Testungen betreffen neben der Sicherstellung der Datenqualität auch die Teilnahmebereitschaft der Zielpersonen, die technische Umsetzung sowie die Gestaltung des Testsettings. Vor diesem Hintergrund ist das Ziel der vorliegenden Studie, die im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld & Roßbach, 2019) durchgeführt wird, zwei Online-Testbedingungen auszugestalten und zu erproben. Hierbei soll untersucht werden, ob die zwei Online-Testbedingungen eine vergleichbar gute Datenqualität liefern, wie die im NEPS bisher übliche face-to-face Erhebungssituation im Haushalt. Fragestellungen: Die Fragestellungen der Studie beziehen sich auf das Ausmaß der Überwachung (Proctoring) sowie die Ausgestaltung einer überwachten Online-Testung: (a) Inwiefern ist eine Begleitung der Testung durch die persönliche oder virtuelle Anwesenheit von Interviewerinnen bei Kompetenzerhebungen notwendig? (b) Welche Form und welches Ausmaß an automatisierter Rückmeldung (Prompts) auf abweichendes Bearbeitungsverhalten ist während einer Testdurchführung erforderlich und kann Verhaltensanpassungen bewirken? Methode:* Diese Fragestellungen sollen mit einem Online-Experiment innerhalb der NEPS-Startkohorte der Klasse 9 (SC4) beantwortet werden. Im Jahr 2024/2025 (17. Erhebungswelle) soll die dann vorliegende Stichprobe von ca. N = 2,200 jungen Erwachsenen (~ 29 Jahre) randomisiert in drei Experimentalgruppen aufgeteilt werden. In allen drei Gruppen werden die Teilnehmenden Kompetenztests aus den Domänen Lesen und Mathematik sowie einen Fragebogen bearbeiten. Die Kontrollbedingung entspricht dem bisher standardisiertem Verfahren eines face-to-face Computer Assisted Personal Interview (CAPI) im Haushalt der Teilnehmenden. Die Teilnehmenden nutzen für die Testbearbeitung den mitgebrachten NEPS-Laptop und der/die Interviewerin ist dauerhaft physisch im Hintergrund anwesend. Diese Erhebungsbedingung ist den Teilnehmenden vertraut, da diese der bislang eingesetzte Erhebungsmodus in den früheren Messzeitpunkten war. Die erste Experimental-Bedingung ist eine synchrone onlinebasierte Kompetenztestung, mit einem geteilten Bildschirm von Teilnehmenden und Interviewerinnen. Dabei wird das eigene Gerät der Teilnehmenden verwendet. Die Interviewerin kann dabei auf Wunsch dauerhaft im Videoanruf sichtbar sein oder sich im Hintergrund für Fragen zur Verfügung halten. Die zweite experimentelle Bedingung ist eine asynchrone onlinebasierte Kompetenztestung. Die Teilnehmenden erhalten per Post die Zugangsberechtigungen und sind dann in der Testdurchführung in Zeit und Ort auf ihren eigenen Geräten völlig frei. Während der Bearbeitung erhalten die Teilnehmenden bei abweichendem Bearbeitungsverhalten ein automatisiertes Feedback. Die Indikatoren für abweichendes Verhalten werden auf Basis empirischer Daten aus früheren Erhebungen dieser Kohorte entwickelt. Diese Indikatoren geben Aufschluss über zu schnelles Antwortverhalten (Rapid Guessing), sehr langsame Bearbeitung bzw. Inaktivität, Auslassen von Items oder den Wechsel auf ein anderes Browser-Fenster (Kroehne et al., 2020). Ausblick auf Ergebnisse und Bedeutsamkeit:* Das Experiment soll hinsichtlich verschiedener Kriterien ausgewertet werden: Zum einen in Bezug auf individuelle Indikatoren der Erhebungsteilnahme, Dropouts oder fehlende Werte und zum anderen bezüglich des Testbearbeitungsverhaltens, wie Antwortzeiten oder Cheating-Indikatoren, um Rückschlüsse auf die Datenqualität zu geben. Zentrale psychometrische Item- und Testkennwerte wie Schwierigkeit und Reliabilität werden ebenfalls zur Beurteilung herangezogen. Durch die Auswertung der Experimentdaten sollen Empfehlungen für zukünftige Online-Erhebungen von Kompetenzdaten in Large-Scale-Assessments abgeleitet werden. Poster Effekte des Schreibflüssigkeitstrainings „Die Schreibstarken“ in Abhängigkeit vom Schreibmedium – Tablet und Eingabestift oder Papier und Stift Anne Griepentrog TU Chemnitz, Deutschland Oftmals werden in Forschungsprojekten analoge Fördermaterialien entwickelt und erfolgreich evaluiert, dennoch können viele Schüler:innen diese Materialien nicht nutzen. Denn insbesondere die Materialbeschaffung und -nutzung stellt viele Schulen vor organisatorische und finanzielle Herausforderungen. Die unterschiedliche Auslegung der Lernmittelfreiheit durch die Länder führt dabei auch zu Kosten für die Erziehungsberechtigten. Auf bereits an den Schulen vorhandenen oder im Rahmen des Digitalpakts anzuschaffenden digitalen Medien, wie Tablets und dazugehörige Eingabestifte, könnten Materialien als PDF-Dateien problemlos zur Verfügung gestellt und die Förderung aller Schüler:innen gewährleistet werden. Die Besonderheiten des Mediums Tablet lassen jedoch nicht uneingeschränkt die Annahme zu, dass die so modifizierten Fördermaterialien die gleiche Wirksamkeit entfalten. Dies gilt im Kontext des Schreibens insbesondere für die Förderung der Schreibflüssigkeit, die unter anderem das schnelle, automatisierte und korrekte Aufschreiben von Wörtern (Transkriptionsflüssigkeit) umfasst (McCutchen 1996) und damit auf die Automatisierung der Motorik beim Schreiben abzielt. Verschiedene Studien untersuchen den Einfluss der glatteren Tablet-Oberfläche auf das Schreiben. Dabei zeigt sich vor allem für Kindergarten- und Schulkinder bis zur 9. Klasse, dass die glattere Oberfläche eine erhöhte motorische Kontrolle beim Schreiben erfordert (Mayer et al. 2020; Alamargot & Morin 2015) und die fehlende Bewegungswahrnehmung durch verstärktes visuelles Feedback kompensiert wird (Guilbert et al. 2019). Für eine Förderung des flüssigen Schreibens könnte das Medium sich somit als hinderlich erweisen. Gleichzeitig zeigen Studien, dass Erwachsene sich gut an die Bedingungen des Tablets anpassen (Gerth et al. 2016). Außerdem zeigen sich keine Unterschiede beim flüssigen Schreiben von im Umgang mit Tablet und Eingabestift Erfahrenen, und mit Stift und Papier Schreibenden (Osugi et al. 2019). Es ist somit zu vermuten, dass nicht nur die Schreiberfahrung, und damit bereits fortgeschrittene Automatisierung der Motorik, für das Schreiben mit Tablet und Eingabestift ausschlaggebend ist, sondern auch die Vorerfahrungen mit diesem Medium. Darüber hinaus konnte in Studien zur Förderung der Schreibmotorik auf Buchstabenebene bereits nachgewiesen werden, dass Kinder für den gleichen Lerneffekt mit dem Tablet dreimal weniger Wiederholungen benötigten als mit Stift und Papier (Patchan & Puranik 2016). Dies könnte sich positiv auf die Förderung der Schreibflüssigkeit auswirken. In der vorliegenden Dissertationsstudie soll der Frage nachgegangen werden, inwiefern sich ein positiv evaluiertes analoges Schreibflüssigkeitstraining ohne Wirksamkeitsverlust auf die Anwendung mit einem Tablet übertragen lässt. Zur Beantwortung der Fragestellung wird das Schreibflüssigkeitstraining „Die Schreibstarken“ (Stephany et al., i. Dr.) mit verschiedenen Medien (Paper-Pencil, Tablet/Eingabestift) erprobt und der Effekt des Mediums auf die Steigerung der Schreibflüssigkeit untersucht. Hierfür wurde das ursprüngliche Trainingsmaterial zunächst anhand von Daten aus Lehrerinterviews, Unterrichtsbeobachtungen sowie der Analyse von Schüler:innenbearbeitungen weiterentwickelt und neben der Paper-Pencil-Version eine beschreibbare PDF-Version erstellt. In einem nächsten Schritt wird das Training in einem Prä-Posttest-Design mit einer Kontrollgruppe und zwei Interventionsgruppen in neun Klassen der 3. und 4. Jahrgangsstufe in einem Zeitraum von zwölf Wochen eingesetzt. Eine der Interventionsgruppen erhält das Training als Paper-Pencil-Variante, die andere in Form einer beschreibbaren PDF auf dem Tablet. Beide Interventionsgruppen erhalten das Training von zuvor geschulten Lehrkräften. Abhängige Variable ist die Schreibflüssigkeit gemessen auf Buchstaben-, Wort- und Satzebene (Alphabettask, Wörter und Sätze auf Zeit verschriften (Stephany et al. 2020)). Dabei werden die Testungen sowohl als Paper-Pencil-Version durchgeführt als auch als PDF-Version am Tablet. Als Kontrollvariablen fungieren die soziodemografischen Daten, Vorerfahrungen mit der Arbeit mit Tablets, erhoben anhand von Fragebögen sowie die Motivation der Schüler:innen im Umgang mit dem Material. Begleitet wird die Intervention von drei Austauschtreffen zwischen den Lehrkräften der Interventionsgruppen, sodass die Verbindlichkeit des Trainingseinsatzes erhöht wird und Probleme niedrigschwellig angesprochen werden können. Das Poster legt die datengestützte Weiterentwicklung sowie die digitale Adaption des Trainingsmaterials dar und zeigt das Studiendesign sowie die Erhebungsinstrumente. Poster Grundvorstellungen zu Sinus und Kosinus in der 10. Klassenstufe: Erstes Messinstrument und Zusammenhänge mit motivationalen Variablen Sandy Chwastek¹, Hannes Becker², Johanna Harding¹, Alexander Salle², Carola Grunschel¹ ¹Universität Münster, Deutschland; ²Universität Osnabrück, Deutschland Mentale Repräsentationen mathematischer Inhalte, sogenannte Grundvorstellungen, tragen maßgeblich zum Verständnis von mathematischen Sachverhalten und somit der Mathematikleistung von Schülerinnen bei (Blum et al., 2004; Griesel et al., 2019). Während für andere zentrale Bereiche der Sekundarstufe I Testinstrumente zu Grundvorstellungen vorliegen, ist dies für Sinus und Kosinus in der Trigonometrie noch nicht der Fall. Dabei ist der Erwerb von tragfähigen Vorstellungen in diesem Inhaltsgebiet besonders relevant sowie herausfordernd, da mit fortschreitendem Unterricht in sogenannten Grundvorstellungsumbrüchen die Grundvorstellungen am Dreieck durch die Grundvorstellung am Einheitskreis verallgemeinert und ergänzt werden (Wartha, 2007). Bisher liegen keine Erkenntnisse vor, wie der herausfordernde Erwerb von Grundvorstellungen und Grundvorstellungsumbrüchen mit der Motivation von Schülerinnen im Zusammenhang steht. Erste Ergebnisse aus der Chemie legen nahe, dass das Konzeptwissen von Schüler:innen mit der Lernfreude zusammenhängt (Höft & Bernholt, 2019). Generell sind Mathematikleistungen von Schülerinnen (teilweise wechselwirkend) mit motivationalen Variablen wie dem mathematischen Fähigkeitsselbstkonzept (Jansen et al., 2019; Hermann & Vollmeyer, 2017; Schäfer, 2010), der Lernfreude (Henschel et al., 2019) und der Lernzielorientierung (Girnat et al., 2020; Keys et al., 2012) assoziiert. In der vorliegenden Pilotstudie wurden einerseits ein Test zur Erfassung von Grundvorstellungen und Grundvorstellungsumbrüchen zu Sinus und Kosinus entwickelt sowie andererseits Zusammenhänge zwischen dem Abschneiden in diesen Tests und obigen motivationalen Variablen untersucht. Insgesamt N= 57 Schüler:innen im Alter von 15 bis 16 Jahren (52% Mädchen) aus zwei zehnten Gymnasialklassen derselben Schule bearbeiteten zu zwei verschiedenen Zeitpunkten von den Autoren entwickelte Tests mit je vier Items zu obigen Grundvorstellungen sowie etablierte motivationale Fragebögen. Nach den Unterrichtseinheiten zu Sinus und Kosinus am Dreieck (T1) bearbeiteten die Schüler:innen einen Test zu ihren Grundvorstellungen zu Sinus am rechtwinkligen Dreieck (GVD) sowie Kalkülaufgaben (lösbar ohne Grundvorstellungen). Nach der Einführung zu Sinus und Kosinus am Einheitskreis (T2) bearbeiteten sie erneut den Test zu GVD sowie einen Test zu Grundvorstellungen zu Sinus am Einheitskreis (GVE) und einen Test zu Grundvorstellungsumbrüchen beim Übergang vom Sinus am rechtwinkligen Dreieck zum Sinus am Einheitskreis (GVU). Zudem wurden jeweils das Fähigkeitsselbstkonzept im Fach Mathematik (Marsh, 1990), die Lernzielorientierung (Spinath et al., 2012) sowie Lernfreude (in Anlehnung an Bieleke et al., 2021) in Bezug auf Sinus und Kosinus erhoben. Die vier Tests (GVD, GVE, GVU, Kalkül) wiesen eine gute interne Konsistenz (α= .74-.83) auf. Die Schülerinnen zeigten signifikant bessere Testwerte in Kalkül- als in allen Grundvorstellungsaufgaben. Folglich fiel den Schülerinnen die Anwendung mathematischer Formeln leichter als Aufgaben, für die eine höhere Abstraktionsfähigkeit notwendig war. Die Testwerte in GVD nahmen von T1 zu T2 signifikant ab, t(45)= 2.238, p= .030, d= .330. Dies legt nahe, dass es durch eine Erweiterung der Grundvorstellungen am Einheitskreis zu einer Verunsicherung in Bezug auf alte Lerninhalte kommen könnte. Alle Testwerte beider Messzeitpunkte korrelierten signifikant positiv miteinander (r= .47-.71) und mit den motivationalen Variablen Fähigkeitsselbstkonzept, r= .41-.55, Lernfreude, r= .41-.56, und Lernzielorientierung, r= .31-.39. Die Korrelationen mit der Lernzielorientierung fielen somit am geringsten aus, was auf die noch stärkere Relevanz der Konstrukte Lernfreude und Fähigkeitsselbstkonzept für die Grundvorstellungen hindeutet. Das Fähigkeitsselbstkonzept korrelierte am geringsten mit der Skala des neuen Themas (GVE; r= .41), während die Lernfreude am stärksten mit einem besseren Verständnis von Grundvorstellungsumbrüchen (GVU, r = .56) assoziiert war. Bis zur Tagung werden noch qualitative Analysen der Lösungswege der Schüler:innen angestellt, die ebenfalls präsentiert werden sollen. Da die vorliegenden Tests sich als gutes Messinstrument für Grundvorstellungen zu Sinus und Kosinus erwiesen, sollen sie auch in zukünftiger Forschung angewandt werden. Auf der Basis einer Studie mit einer größeren Stichprobe sollen die Zusammenhänge mit motivationalen Variablen bei Kontrolle von Geschlecht und Sprachkenntnissen genauer geklärt werden. Poster Der Zusammenhang zwischen Need for Cognition und der Entwicklung des akademischen Interesses bei Schülerinnen und Schülern am Gymnasium Julia Matthes, Vsevolod Scherrer, Franzis Preckel Universität Trier, Deutschland Need for Cognition (NFC) beschreibt das Bedürfnis einer Person nach kognitiver Herausforderung und die empfundene Freude am Denken (Cacioppo & Petty, 1982; Strobel & Strobel, 2016). Unterschiede in diesem Merkmal können Unterschiede im Lernen und der Entwicklung des kognitiven Potenzials erklären (von Stumm & Ackerman, 2013). Personen mit hohem NFC sind stärker motiviert, sich kognitiv anzustrengen und wählen eher kognitiv anspruchsvolle Aufgaben als Personen mit niedrigem NFC (Furnham & Thorne, 2013). Bisher gibt es nur wenige Studien zur Entwicklung der kognitiven Motivation. Frühe Arbeiten legen nahe, dass es aus positivem Feedback, dem Gefühl von Kompetenz und Erfolg bei kognitiven Herausforderungen sowie erlebter Zufriedenheit entsteht (Cacioppo et al., 1996). Interesse kann als Wertschätzung verstanden werden, die sich in einem Zustand positiven emotionalen Empfindens bei der Auseinandersetzung mit dem Interessengegenstand äußern kann (Krapp, 1992). Ebenso kann Interesse die Motivation beschreiben, sich weiterhin mit dem Interessengegenstand zu beschäftigen (Renninger & Su, 2019). Interesse entsteht nach dem Vier-Phasen-Modell der Interessenentwicklung (Hidi & Renninger, 2006) von situationalem Interesse, das zunächst ausgelöst und über eine Zeit lang aufrechterhalten wird, bis hin zu individuellem Interesse, das mit der Zeit weiter an Stärke gewinnt. Diese Entwicklung wird von Personen- und Umweltvariablen beeinflusst. Zu den Personenvariablen gehören beispielsweise positive Emotionen, anhaltende Aufmerksamkeit und Ausdauer sowie domänenspezifisches Wissen. Querschnittsstudien zeigen, dass NFC positiv mit diesen Variablen und dem akademischen Interesse zusammenhängt (Amabile et al., 1994; Feist, 2012; Petty et al., 2009; Preckel, 2014). Daher könnte NFC ein Faktor sein, der zum Interessenpotenzial einer Person beiträgt. Bisher gibt es jedoch nur wenige längsschnittliche Befunde zur Beziehung zwischen NFC und Interesse. Die vorliegende Studie zielt darauf ab, diese Lücke zu schließen, indem sie die wechselseitigen Beziehungen zwischen NFC und akademischem Interesse in drei Schulfächern (Mathematik, Deutsch und Englisch als Fremdsprache) untersucht. Daten von N=922 Schülerinnen und Schülern (40% weiblich) der Klassen 5 bis 7 am Gymnasium wurden über vier Messzeitpunkte erfasst. NFC wurde mit 11 positiv formulierten Items der NFC-Teens-Skala* (Preckel, 2014) zu Messzeitpunkt 1-3 erhoben. Das Interesse wurde zu jedem Messzeitpunkt mit drei Items erfasst, die auf dem Self-Regulation Questionnaire (Ryan & Connell, 1989) basieren und auf die Fächer Mathematik, Deutsch und Englisch angepasst wurden. Das Wissen in diesen Fächern wurde mit standardisierten Leistungstests erhoben (4 Testversionen für die 4 Messzeitpunkte; Götz et al., 2013a, 2013b; Harder & Ziegler, 2009; Schneider et al., 2017; Souvignier et al., 2008) und pro Domäne IRT-skaliert (eindimensionales Raschmodell, R-Paket TAM; Robitzsch et al., 2019). Die Reliabilitäten aller Skalen liegen zwischen .70 und .91. Die Datenanalysen wurden mit MPlus 8.7 durchgeführt. Messinvarianz der NFC- und Interessensmaße über die Zeit wurde überprüft. Um die Richtung der längsschnittlichen Beziehungen zwischen den Konstrukten zu untersuchen, wurden die daten mithilfe von autoregressiven Cross-lagged Panel Strukturgleichungsmodellen über alle Zeitpunkte hinweg analysiert. Zusätzlich wurde das domänenspezifische Wissen der Schülerinnen und Schüler kontrolliert. In allen Schulfächern wurden Veränderungen im Interesse positiv durch NFC vorhergesagt (β_Mathe= .17**/ .10/ 16; β_Deutsch= .17/ .03/ .08; β_Englisch= .14*/ .10/ .11), während Veränderungen in NFC nicht oder negativ durch Interesse vorhergesagt wurden (β_Mathe= .02/ .05; β_Deutsch= -.04/ -.04; β_Englisch= -.09/ -.04). Die Ergebnisse änderten sich nicht wesentlich, wenn das domänenspezifische Wissen kontrolliert wurde. Sie deuten darauf hin, dass die Förderung von NFC zu einer positiven Entwicklung des akademischen Interesses von Schülerinnen und Schülern beitragen kann. Die Untersuchung unterstützt damit die Relevanz von NFC im Lern- und Leistungskontext. Poster Potenziale einer Ausstattung von Kinderkrippen mit ausgewählten Büchern und Spielen für das Wort- und Grammatikverständnis Nina Bauer¹, Annabell Daniel², Nadine Besser³, Franka Baron⁴, Dorothea Dornheim³, Simone Lehrl⁵, Anja Linberg¹ ¹Deutsches Jugendinstitut, Deutschland; ²Ludwig-Maximilians-Universität, Deutschland; ³Universität Bamberg, Deutschland; ⁴Universität Bern, Schweiz; ⁵Pädagogische Hochschule Weingarten, Deutschland Die sprachförderliche Wirkung von Kinderbüchern für Kinder im Krippenalter ist bereits anhand einer Vielzahl von Studien belegt worden: Nicht nur die positiven Effekte gemeinsamer Bilderbuchbetrachtung von Bezugsperson und Kind konnten in diversen Studien nachgewiesen werden (z.B. Hargrave & Sénéchal, 2000; Mol et al., 2009; Weisleder et al., Whitehurst et al., 1988; 2018). Auch das Vorhandensein von Büchern in der häuslichen Lernumwelt von Kindern unter drei Jahren erwies sich in mehreren Untersuchungen als sprachfördernd (z.B. NICHD Early Child Care Research Network, 2006; Niklas & Schneider, 2013). Gesellschaftsspiele im Zusammenhang mit Spracherwerb bei Kindern unter drei Jahren wurden bislang weniger häufig untersucht. Wenige Studien verweisen jedoch darauf, dass auch dieses Medium förderlich auf die Sprachkompetenzen von Kindern wirken bzw. einen wertvollen Bestandteil der häuslichen Lernumwelt darstellen kann (z.B. Hassinger-Das et al., 2016; Wood, 2002). Neben der häuslichen Lernumwelt stellen jedoch auch Einrichtungen der frühkindlichen Bildung, Betreuung und Erziehung (FBBE) auch bereits in frühen Alter eine zentrale Lernumwelt dar und Studien, welche sich auf die Wirkung der Materialaustattung in Kinderkrippen fokussieren, sind vergleichsweise selten. Daher geht dieser Beitrag den folgenden Fragen nach: (1) Steht die Ausstattung von ausgewählten Kinderbüchern und -spielen für Krippengruppen mit einer Verbesserung des kindlichen Wort- und Grammatikverstehens in einem Zusammenhang? (2) Wie beeinflussen die Nutzungsintensität der Materialien diese Verbesserung? Die Daten dafür stammen aus der Interventionsstudie „Frühe mathematische Entwicklung und die Bedeutung von Interaktionsqualität in Kindertageseinrichtungen“ (EarlyMath), welche die Wirkung einer Fortbildung und der Ausstattung mit einer Spielzeugkiste auf die kindliche Entwicklung mittels Interventions- und Kontrollgruppen untersuchte. In der vorliegenden Studie wurden zwei Messzeitpunkte genutzt, bei welchen bei Kindern im Alter von 2,7 Jahre und 3,1 Jahren das Wort- und Grammatikverständnis erfasst wurde (n= 233, in 75 Krippengruppen). Als Instrument für die Messung des Wortverständnisses diente eine Kombination aus einem Untertest des SETK-2 (Grimm, 200) und einem Teil des Peabody Picture Vocabulary Tests (PPVT-IV) in deutscher Fassung (Lenhard et al., 2015). Das Grammatikverständnis wurde mithilfe eines SETK-2 Untertest (Grimm, 2000) und des TROG-D (Fox-Boyer, 2020) erhoben. Zwischen den beiden Messzeitpunkten wurden für 63 Krippengruppen (203 Kinder) eine Spielzeugkiste zur Verfügung gestellt, welche fünf Bilderbücher und sechs Gesellschaftsspiele ab zwei Jahren enthielten. Bei der Auswahl der Bücher wurde sich an den Techniken des dialogischen Lesens nach Whitehurst und Kollegen (1988) orientiert. Die Auswahl der Spiele orientierte sich an Hauser und KollegInnen (2014). In den Gruppen, die eine Spielzeugkiste erhielten, absolvierte jeweils eine Fachkraft eine Schulung zu frühkindlichen Förderung und Interaktionsgestaltung mit Büchern, Spielen und in Alltagssituationen. Die Nutzungsintensität der Materialien wurde anhand von Fragebögen erhoben, in denen die Fachkräfte angaben, wie häufig und lange sie gemeinsam mit den Kindern die Materialien der Spielzeugkiste nutzten. Die Berechnungen wurden mithilfe von Kovarianzanalysen (Fragestellung 1) und moderierten Regressionsanalysen (Fragestellung 2) mit R-Studio durchgeführt. Es konnte ein statistisch signifikanter positiver Einfluss der Spielzeugkiste auf das Grammatikverständnis unter Kontrolle der Kompetenzen zum ersten Messzeitpunkt und des sozioökonomischen Hintergrundes identifiziert werden (ß = .24, p<.037). Im Gegensatz dazu konnte kein signifikanter Einfluss der Spielzeugkiste auf das Wortverständnis gefunden werden. Auch der Einfluss der Nutzungsintensität erwies sich als nicht signifikant, jedoch lassen sich Tendenzen erkennen: eine längere Nutzung der Toybox-Spiele führt durchaus in geringem Ausmaß zu einem schwächeren Zusammenhang der Sprachverständniswerten zwischen den beiden Messzeitpunkten (ß =-.01, p<.147). Vor dem Hintergrund der Limitationen der Studie und Analysen werden die Implikationen der Ergebnisse diskutiert. Poster Adaptive Unterstützung in MINT-Lernumgebungen zur Förderung der Kompetenz und Selbstwirksamkeitserwartung beim Experimentieren Elena Meister¹, Felix Nell¹, Silke Mikelskis-Seifert¹, Wolfram Rollett¹, Katja Scharenberg², Jennifer Stemmann¹, Oliver Straser¹, Nadine Tramowsky¹ ¹Pädagogische Hochschule Freiburg, Deutschland; ²LMU München Das vom BMBF geförderte Projekt AdUmint (Adaptive Unterstützung in MINT-Lernumgebungen zur Förderung experimenteller Kompetenz und Selbstwirksamkeit) hat zum Ziel, digitales adaptives Unterrichtsmaterial zum Experimentieren zu entwickeln, welches die Experimentierkompetenz sowie die experimentierbezogene Selbstwirksamkeitserwartung von Schülerinnen fördern kann. Dabei führen die an unserer Studie teilnehmenden Schülerinnen Hands-On Experimente aus den MINT-Fächern durch, die sich auf verschiedene Aspekte des Klimawandels beziehen. Untersucht wird die Wirksamkeit barrierearmer Instruktionen und gestufter Lernhilfen in Abhängigkeit von unterschiedlichen Darstellungsformen und unter Berücksichtigung verschiedener Heterogenitätsmerkmale. Das Experiment ist eine methodisch besonders kontrollierte Art der wissenschaftlichen Erkenntnisgewinnung. Es wird im Kontext Schule in fast allen MINT-Domänen als fachspezifische Unterrichtsmethode eingesetzt, mit dem Ziel, Lernen zu initiieren und Lernende kognitiv zu aktivieren (Stemmann & Tramowsky, 2021). In unserem Projekt wird das Experimentieren als eine Kompetenz aufgefasst, die sich aus kognitiven und motivationalen Facetten zusammensetzt (Weinert, 2001). Aktuelle Forschungen beschreiben hierbei die Notwendigkeit zur Förderung der Experimentierkompetenz. So haben Schülerinnen häufig Schwierigkeiten bei der Formulierung von Forschungsfragen und Hypothesen (Kuhn & Dean, 2005). Auch die Planung, Durchführung und Reflexion von Experimenten fällt ihnen oft nicht leicht (Hilfert-Rüpell et al., 2010). Hierbei lassen sich insbesondere Probleme bei der Kontrolle und Variation von Variablen in der Planung eines Experiments hervorheben (Schwichow et al., 2020). Auch die Verknüpfung zwischen den zuvor formulierten Hypothesen und den Ergebnissen eines Experiments bereitet den Schülerinnen Schwierigkeiten (Hammann et al., 2006). Da für die Vermittlung von Inhalten das Schülerinnenexperiment eine größere Wirksamkeit im Vergleich zum Demonstrationsexperiment aufweist (Walker, 2013), werden in unserem Projekt Hands-On Experimente zur Entwicklung von Experimentierkompetenz eingesetzt. Das Experimentieren wird bei der Gestaltung der Experimente als ein eigenständiges Lernziel gesehen (Abd-El-Khalick et al., 2004), welches fachunabhängig vermittelt werden kann. Vor diesem theoretischen Hintergrund hat sich das AdUmint-Projekt zum Ziel gesetzt, die Wirkung von adaptiven Maßnahmen in digitalen MINT-Lernumgebungen zu untersuchen. Dabei wird zwischen der Förderung von Experimentierkompetenzen und der damit verbundenen Selbstwirksamkeitserwartung sowie der differentiellen Effekte der Maßnahmen für Schülerinnen mit unterschiedlichen Lernvoraussetzungen unterschieden. Hieraus ergeben sich folgende Forschungsfragen: Inwieweit fördern Instruktionen in verschiedenen Darstellungsformen und gestufte Lernhilfen die Experimentierkompetenz und Selbstwirksamkeitserwartung in digitalen MINT-Lernumgebungen? Welche Teilfähigkeiten beim Experimentieren werden von den verschiedenen Repräsentationsformen und gestuften Lernhilfen unterstützt? Welche Schülerinnen profitieren jeweils durch welche Darstellungsformen der Instruktion in digitalen MINT-Lernumgebungen bezüglich der Förderung der Experimentierkompetenzen und Selbstwirksamkeitserwartung im besonderen Maße? Welche Schülerinnen werden durch gestufte Lernhilfen in ihren Experimentierkompetenzen und ihrer Selbstwirksamkeitserwartung gefördert? Bei dem zum Einsatz kommenden Studiendesign handelt es sich um ein experimentelles Prä-Post-Design mit Messwiederholung. In der im Oktober 2023 stattfindenden Pilotierung werden Daten mit 120 Schülerinnen der sechsten Klasse in allen Schulformen erhoben. Für die ab Januar 2024 beginnende Hauptstudie sind 600 Versuchspersonen eingeplant. Beim Versuchsplan handelt es sich um ein 2x2 faktorielles Design. Als unabhängige Variablen dienen einerseits die Modalität der Instruktionen, die je nach Gruppenzuordnung textbasiert oder multimedial zur Verfügung stehen. Die zweite unabhängige Variable besteht im Zugang zu gestuften Lernhilfen. Die Kontrollgruppe (KG) und die Experimentalgruppe (EG) 1 arbeiten jeweils mit textbasierten Instruktionen, wobei die EG 1 bei selbsteingeschätztem Bedarf zusätzlich Zugang zu gestuften Lernhilfen hat. Die EG 2 und 3 erhalten jeweils multimediale Instruktionen, wobei die EG 3 zusätzlich auf gestufte Lernhilfen zugreifen kann. Die quantitative Datenauswertung erfolgt anhand eines Allgemeinen linearen Modells (ALM). Darüber hinaus werden Multiple Regressionen und Multiple Kovarianzanalysen (MANCOVA)* im Auswertungsprozess verwendet. Das Poster stellt Anlage, Design und erste Ergebnisse aus der Pilotierung vor. Die zu erwartenden Ergebnisse aus unserem Projekt sind von theoretischer und praktischer Bedeutung für die Gestaltung von Lernumgebungen und sollen die Unterrichtspraxis nachhaltig verändern. Poster Digitaler Stress im Kindesalter? Vorstellung eines Multi-Kohorten-Sequenz-Designs und Präsentation erster Ergebnisse einer Pilotstudie Arvid Nagel, Felix Kruse PH NMS Bern, Schweiz In den letzten Jahren haben sich die Lebensumstände von Kindern und Jugendlichen erheblich verändert. Seit der Jahrtausendwende wachsen sie in einer Welt auf, in der die Nutzung von Informations- und Kommunikationstechnologie zum alltäglichen Standard gehört. Dies führte dazu, dass Prensky (2001) den Begriff der Digital Natives prägte. Interaktive Medien spielen eine entscheidende Rolle in der Sozialisation von Kindern und sind aus ihrem Alltag nicht mehr wegzudenken. Digitale soziale Netzwerke, Smartphones und Computerspiele gehören zu den beliebtesten Freizeitaktivitäten und nehmen neben Familie, Schule und Peers eine zentrale Position ein (u.a. Feierabend et al., 2022). Für viele junge Menschen beginnt der Tag mit einem Blick auf soziale Netzwerke, ihre Aktivitäten werden maßgeblich von der unmittelbaren Verfügbarkeit neuer Medien beeinflusst und der Tag endet oft mit einem letzten Eintrag in den Netzwerken. Kurz gesagt: Die Lebenswelten junger Menschen sind heutzutage von verschiedenen interaktiven Medien geprägt. Forscher:innen, Eltern, Lehrer:innen und (bilungs-)politische Entscheidungsträger:innen stellen sich die Frage, welche Auswirkungen dieses Medienverhalten auf Individuen und die Gesellschaft hat. Obwohl in den letzten Jahren intensive Forschungsbemühungen im Kontext der Medienwirkungsforschung unternommen wurden, bestehen immer noch erhebliche Wissenslücken, insbesondere im Hinblick auf das Kindesalter und vor allem hinsichtlich problematischer und pathologischer Nutzungsweisen interaktiver Medien von Schüler:innen der Primarstufe (vgl. Kliesener et al., 2022). Dieses Forschungsdesiderat aufnehmend, werden in einer Längsschnittstudie mit drei Messzeitpunkten, die im Februar 2024 beginnt, die nachfolgenden forschungsleitenden Fragestellungen untersucht: Welche Auswirkungen hat der Konsum interaktiver Medien im Kindesalter auf bildungsbezogene Faktoren wie Schulnoten, Lernfreude, Selbstkonzept, Einstellungen zur Schule und Aufmerksamkeit? Darüber hinaus werden gesundheitsbezogene Kriterien wie psychische Gesundheit, schulisches Wohlbefinden, Einsamkeit und digitaler Stress analysiert. Ein spezielles Augenmerk gilt der Frage, wie sich digitaler Stress bei Kindern entwickelt und welche Faktoren diesen erklären können. Um diese leitenden Forschungsfragen zu beantworten, wird ein quantitativer Forschungsansatz verfolgt. Dabei werden insgesamt 1500 Schüler:innen der 3. bis 6. Klasse der Primarstufe im Kanton Bern sowohl in einem Querschnitts- als auch in einem Längsschnittvergleich innerhalb eines Multi-Kohorten-Sequenz-Designs untersucht. Als statistische Analyseverfahren sollen mehrebenanalytische Strukturgleichungsmodelle sowie cross-lagged Panelmodelle herangezogen werden, um einerseits der hierarchischen Datenstruktur sowie der simultanen strukturüberprüfenden Hypothesenprüfung und andererseits der analytischen Betrachtung von Panel- und Trenddaten (Multi-Kohorten-Sequenz-Design) gerecht zu werden. Die Datenerhebungen erfolgen ab Februar 2024 mittels wiederholter jährlicher schriftlicher Befragungen der Schüler:innen, die online durchgeführt werden. Diese Befragungen finden innerhalb ihrer Klassengemeinschaften statt und ermöglichen einen detaillierten Einblick in die genannten bildungs- und gesundheitsbezogenen Variablen im Zusammenhang mit dem Konsum interaktiver Medien im Kindesalter. Zudem erfolgen Eltern- und Lehrpersonenbefragungen, welche thematisch mit dem Forschungsfokus assoziiert sind. Im Rahmen des Beitrags sollen die ersten Ergebnisse einer Pilotstudie zum diesem Themenkomplex präsentiert werden. Im Herbst 2023 konnten 240 Schüler:innen im Alter von 8 bis 13 Jahren der Klassenstufen 3.-6. aus drei Primarschulen im Kanton Bern mittels eines Online-Fragebogens befragt werden. Die Operationalisierungen, die deskriptiven Befunde und Zusammenhangsanalysen sowie die Faktorstrukturen der Skalenentwicklungen zum digitalen Stress, Internet Gaming Disorder sowie der problematischen Social Media Nutzung sollen präsentiert, kritisch reflektiert und diskutiert werden. Neben der Darlegung der theoretischen Grundlagen des Untersuchungsdesigns und den empirischen Erkenntnissen der Pilotierung werden die Befunde auch vor dem Hintergrund des institutionellen Auftrag die Schüler:innen hinsichtlich eines ergebnisorientierten und funktionalen Umgangs mit Informations- und Kommunikationstechnologien zu unterstützen, reflektiert und diskutiert. Poster Reflexives Schreiben von Lehramtsstudierenden: Eine Analyse mit Verfahren maschinellen Lernens und vortrainierten Sprachmodellen Chengming Zhang¹, Veronika Solopova², Florian Hofmann¹, Michaela Gläser-Zikuda¹ ¹FAU Erlangen-Nürnberg, Deutschland; ²FU Berlin, Deutschland Theoretischer Hintergrund. Reflexives Schreiben kann als Tätigkeit von Personen, „die im Medium des Schreibens über Handlungen und Tätigkeiten nachdenken, sie in ihrem Kontext mit Abstand betrachten und bewerten“ (Rott, 2018, 36; vgl. Korthagen & Vasalos, 2005) definiert werden. Obgleich Ansätze zur Förderung reflexiven Schreibens insbesondere auch in der Lehrerinnenbildung implementiert wurden, wurde oft nur eine eingeschränkte Wirksamkeit belegt (Körkkö et al., 2016; Poldner et al., 2014). Ein Grund hierfür liegt vermutlich in der Komplexität des reflexiven Schreibens (Ullmann, 2019). Aktuelle Forschungsergebnisse zeigen jedoch, dass maschinelles Lernen und vortrainierte Sprachmodelle zur Analyse von Reflexionstexten sowie daran anknüpfend für Entwicklung von Feedbackmechanismen für reflexives Schreiben eingesetzt werden könnten (Nehyba & Štefánik, 2023; Wulff et al., 2022). Trotz dieser Fortschritte gibt es bei der Anwendung von KI zur Beurteilung von reflexiven Schreibens noch einige Herausforderungen, wie eine oftmals geringe Datenqualität, insbesondere bei der Erhebung von Reflexionstexten. Viele Studien basieren auf unklaren Zielen und Kriterien für die zu verfassenden Reflexionstexte. Der methodische bzw. technische Ansatz stellt ebenfalls eine Herausforderung dar. Häufig wird eine Analyse auf Satz- und nicht auf Dokumentenebene durchgeführt. Fragestellung.* Das Ziel dieser Studie besteht demzufolge darin, die verschiedene Merkmale von Reflexionstexten zu erfassen, um diese anschließend mithilfe maschinellem Lernens sowie vortrainierter Sprachmodelle zu kategorisieren. Daraus ergeben sich folgende Fragestellungen: F1: In welchem Ausmaß lassen sich mit Verfahren maschinellen Lernens und diverser Sprachrepräsentationen Reflexionstexte von Lehramtsstudierenden klassifizieren? F2: Wie effizient erweisen sich die vortrainierten Sprachmodelle bei der Klassifizierung von Reflexionstexten von Lehramtsstudierenden ? F3: Wie effizient hinsichtlich der Klassifizierung von Reflexionstexten von Lehramtsstudierenden sind maschinelles Lernen und vortrainierte Sprachmodelle im Vergleich? Methode. Im Rahmen dieser Studie wurden 1043 Reflexionstexte in Lehrveranstaltungen in drei Semestern (WS 2021/22, SoSe 2022 und WS 2022/23) an einer Universität erhoben. Die Reflexionstexte stammen überwiegend von weiblichen Studierenden (ca. 70%) aus verschiedenen Lehramtsstudiengängen. Die Reflexionstexte hatten im Durchschnitt einen Umfang von 251,38 Wörtern (SD = 143,08) und wurden basierend auf dem theoretischen Modell von Hatton und Smith (1995) mit Hilfe einer strukturierenden qualitativen Inhaltsanalyse (Gläser-Zikuda et al., 2020) kodiert. Insgesamt 261 Texte wurden dem Niveau „beschreibendes Schreiben“, 545 dem Niveau „deskriptive Reflexion“, 209 dem Niveau „dialogische Reflexion“ und 28 dem höchsten Niveau „kritische Reflexion“ zugeordnet. Die Intercoder-Reliabilität für die Kodierung der Reflexionstexte in den drei Semestern zeigte akzeptable Cohen‘s Kappa-Koeffizienten von 0,67, 0,66 und 0,73 (McHugh, 2012). Anschließend wurden alle Texte mithilfe von maschinellem Lernen und durch den Einsatz vortrainierter Sprachmodelle klassifiziert. Folgende Algorithmen des maschinellen Lernens wurden verwendet: Entscheidungsbäume, Support Vector Machines, Random Forest, Ridge Classifier, SGD Classifier, XGB Classifier und Gradient Boosting Classifier. Ferner nutzten wir drei Methoden zur Merkmalsextraktion: BoW (Bag of Words), TF-IDF (Term Frequency-Inverse Document Frequency) und LIWC2015 (Linguistic Inquiry and Word Count). Bei der Anwendung vortrainierter Sprachmodelle kamen BERT, RoBERTa, Longformer und BigBird zum Einsatz. Ergebnisse. Für die erste Forschungsfrage zeigt sich, dass die durchschnittliche Genauigkeit von Algorithmen des maschinellen Lernens in der Regel unter 60 % liegt. Unter den leistungsstärksten Kombinationen war die Kombination des Gradient-Boosting-Klassifikators mit LIWC2015 besonders effektiv und erreichte eine Genauigkeit von 61,97 %. Mit Blick auf die zweite Forschungsfrage lässt sich feststellen, dass sich eine Genauigkeit von 73,28 % bzw. 74,25 % für die Modelle BERT und RoBERTa ergab. BigBird und Longformer schnitten mit Genauigkeitsraten von 76,26 % bzw. 77,22 % noch besser ab. Auf dieser Grundlage kann für die letzte Forschungsfrage festgestellt werden, dass das vortrainierte Sprachmodell das traditionelle maschinelle Lernen mit einer um 15 % höheren Genauigkeit deutlich übertrifft. Im Kontext des aktuellen Forschungsstandes zeigt sich also, dass die hier eingesetzten Modelle eine im Vergleich zu den bisher oft eingesetzten Methoden überlegene Klassifikation von Reflexionstexten auf der Ebene des gesamten Dokuments ermöglichen. Poster Sind Veränderbarkeitstheorien über Leistungsemotionen emotionsspezifisch? Maike Trautner¹, Rebekka Leim², Malte Schwinger² ¹Philipps-Universität Marburg, Deutschland, AE Entwicklungspsychologie; ²Philipps-Universität Marburg, Deutschland, AE Pädagogische Psychologie Beim Lernen treten unterschiedliche Emotionen auf, die sich sowohl förderlich als auch hinderlich auf den Lernprozess auswirken können (Camacho-Morles et al., 2021). Die Regulation dieser lernbezogenen Emotionen hat nachweislich wesentlichen Einfluss auf den Lernerfolg (z.B. Gumora & Arsenio, 2002; Ivcevic & Brackett, 2014). Ob und wie gut Emotionen reguliert werden, hängt davon ab, ob Lernende grundsätzlich von der Veränderbarkeit und Kontrollierbarkeit von Emotionen überzeugt sind (Tamir et al., 2007). Diese impliziten Veränderbarkeitstheorien wurden im akademischen Kontext bislang nur in Bezug auf Emotionen im Allgemeinen untersucht, nicht aber bezüglich spezifischer Emotionen wie Langeweile oder Angst. Die Frage, wie domäenenspezifisch implizite Veränderbarkeistheorien sind wird Dieser Beitrag geht daher der offenen Frage nach, ob es sich bei impliziten Veränderbarkeitstheorien über Leistungsemotionen eher um eine globale, emotionsübergreifende Theorie handelt oder Lernende eher unabhängige Theorien über einzelne Emotionen haben. Außerdem wird geprüft, ob Veränderbarkeitstheorien über Leistungsemotionen mit höheren Selbstwirksamkeitserwartungen für Emotionsregulation und dem Einsatz von Emotionsregulationsstrategien, sowie dem dispositionellen Erleben von Leistungsemotionen zusammenhängen. Dieses Wissen kann helfen, Emotionsregulationstrainings effektiver und zielgerichteter zu gestalten. N = 421 Studierende (78.1% weiblich, M_Alter = 22.37, SD_Alter= 3.74, 47.3% Psychologiestudierende) nahmen an einer querschnittlichen Fragebogenstudie teil. Um implizite Veränderbarkeitstheorien über Leistungsemotionen differenziert zu erfassen wurden die allgemeinen vier Items von Tamir et al. (2007) an neun verschiedene Leistungsemotionen angepasst. Selbstwirksamkeit für Emotionsregulation wurde mit der Subskala „using and managing your own emotions“ von Kirk et al. (2008), das Erleben von Leistungsemotionen mit dem AEQ-S (Bieleke et al., 2021), die Emotionsregulationsstrategien kognitive Neubewertung und expressive Unterdrückung mit dem deutschen Emotion Regulation Questionnaire (Abler & Kessler, 2009) erfasst. Zur Untersuchung der Dimensionalität impliziter Veränderbarkeitstheorien über Leistungsemotionen wurden verschiedene a priori definierte Strukturgleichungsmodelle gegeneinander getestet. Die Zusammenhänge mit den weiteren Konstrukten wurden mittels bivariater Korrelationen geprüft. Die Vergleiche verschiedener Strukturgleichungsmodelle zur Überprüfung der Dimensionalität impliziter Veränderbarkeitstheorien über Leistungsemotionen ergab die beste Modellpassung für ein Modell mit neun emotionsspezifischen, korrelierten Theorien und zugelassenen Fehlerkorrelationen zwischen den je parallel formulierten Items (χ²[414] = 629.84 (p < .001), CFI =.,97, SRMR = .04). Die Vergleichsmodelle mit einem zusätzlichen Globalfaktor 2. Ordnung oder einem Bifaktor für globale Veränderbarkeitstheorien über Emotionen passten signifikant schlechter zu den Daten. Im Mittel hielten die Studierenden alle Emotionen für eher veränderbar (M_{Erleichterung}= 3.24 bis M_Ärger = 3.97; Zustimmungsskala von 1 bis 5). Die emotionsspezifischen Theorien wiesen gute interne Konsistenzen auf (.82 < ω < .91) und korrelierten moderat bis hoch positiv untereinander (.29 < r < .59). Je stärker Lernende überzeugt waren, positive (bzw. negative) Emotionen seien veränderbar, desto häufiger (bzw. seltener) erlebten sie entsprechende Emotionen mit Ausnahme von Freude und Erleichterung. Veränderbarkeitstheorien zu Leistungsemotionen gingen mit höherer Selbstwirksamkeit für Emotionsregulation (.18 < r < .29, p < .01), mehr kognitiver Umbewertung (.16 < r < .33, p < .01), sowie tendenziell mit einem selteneren Einsatz expressiver Unterdrückung zur Emotionsregulation einher (-.15 < r < .01; .01 < p < .19). Die vorliegende Studie konnte zeigen, dass Lernende eher differenzierte Veränderbarkeitstheorien über verschiedene Leistungsemotionen haben als eine globale Theorie über Emotionen im Allgemeinen, aber auch, dass je veränderbarer sie eine Emotion fanden, sie tendenziell auch andere Emotionen veränderbar fanden. Dies impliziert, dass eine emotionsspezifische Erfassung dieser Theorien möglich ist und in zukünftiger Forschung genauer berücksichtigt werden sollte. Zukünftige Forschung sollte darüber hinaus Zusammenhänge verschiedener Theorien auf intraindividueller Ebene untersuchen, um mögliche individuelle Konstellationen an Veränderbarkeitstheorien über bestimmte Emotionen aufzudecken. Veränderbarkeitstheorien über Leistungsemotionen gingen mit konstruktiverer Emotionsregulation, weniger aber mit Unterdrückung als eher maladaptiver Strategie einher. Experimentelle und Interventionsstudien sollten daher zeigen, ob das explizite Adressieren von Veränderbarkeitstheorien über bestimmte Leistungsemotionen im Rahmen von Emotionsregulationstrainings zu effektiverer Selbstregulation beiträgt. Poster Innovative Lehr-Lernformate in der kaufmännischen Unterrichtspraxis: Gelingensbedingungen und Herausforderungen bei der Implementation einer Bürosimulation Sophia Gentner, Jürgen Seifried Universität Mannheim, Deutschland Die Notwendigkeit der digitalen Transformation im Bildungsbereich und die zunehmende Relevanz digitaler Tools im Unterricht ergeben sich aus einer Vielzahl von Anforderungen. In der kaufmännischen Bildung lässt sich dies insbesondere mit den Veränderungen in der Arbeitswelt in Verbindung bringen. Die fortschreitende Digitalisierung von Geschäftsprozessen führt zu veränderten Anforderungen an die Kompetenzen von Auszubildenden, wodurch eine Anpassung von Lehr-Lernprozessen und Unterrichtsmethoden erforderlich wird. Ein Ansatz zur Gestaltung digitaler Lehr-Lernprozesse in der beruflichen Bildung stellt die Verwendung authentischer Simulationen dar. Diese bilden Situationen aus dem realen Arbeitskontext ab und bieten vielfältige Lernmöglichkeiten (Chernikova et al., 2020, 2023; Plass & Schwartz, 2014). In der kaufmännischen Domäne ermöglichen Bürosimulationen, dass Lernende berufliche Handlungskompetenzen in einem geschützten Rahmen erwerben und sich damit auf die Anforderungen der digitalen Arbeitswelt vorbereiten können (Caruso, 2019; Rausch et al., 2021). Zudem bieten solche digitalen Umgebungen auch die Möglichkeit, in heterogenen Lerngruppen die individuellen Lern- und Leistungsstände zu berücksichtigen. Durch den Einsatz von Logdatenanalysen können beispielsweise personalisierte Unterstützungen in Form von Prompts angeboten und Lernende damit in ihrem Lernprozess individuell unterstützt werden (Deutscher et al., 2022). Bei der Bewältigung der digitalen Transformation von Unterricht kommt insbesondere den Lehrkräften eine zentrale Rolle zu (Seufert et al. 2018). Sie stehen vor der Aufgabe, neue Technologien und Lehrmethoden in ihrem Unterricht zu implementieren. Die erfolgreiche Implementierung digitaler Tools im Unterricht ist jedoch keine Selbstverständlichkeit und unterliegt verschiedenen Einflussfaktoren. So sind beispielsweise die Relevanz der wahrgenommenen Nützlichkeit und die Benutzerfreundlichkeit einer Technologie von Bedeutung (Technology Acceptance Model, Davis, 1985; für den beruflichen Bildungskontext siehe Antonietti et al., 2022). Neben den Charakteristika des Implementationsgegenstands können aber auch zahlreiche andere kontextbezogene Faktoren Einfluss auf die Implementation innovativer Lehr-Lernformate in die Bildungspraxis nehmen (Schrader et al., 2020). Zur Unterstützung von erfolgreichen Implementationsprozessen kommt insbesondere Erkenntnissen zu den Bedingungsfaktoren sowie deren Zusammenspiel Relevanz zu (Antonietti et al., 2022; Gräsel et al., 2020). Vor diesem Hintergrund zielt die im Posterbeitrag thematisierte Interviewstudie darauf ab, relevante Bedingungen für die Implementation einer digitalen Bürosimulation aus der Sicht von Lehrkräften zu identifizieren: Welche Faktoren werden von Lehrkräften als förderlich für die Implementation einer digitalen Bürosimulation in der kaufmännischen Unterrichtspraxis wahrgenommen? Welche als hinderlich? Um diesen Fragen nachzugehen, wurden semi-strukturierte Interviews mit Referendar:innen und Lehrkräften (N = 25) durchgeführt, die zuvor an einem Workshop zur Einführung der simulationsbasierten Lehr-Lernumgebung teilgenommen haben. Die Auswertung erfolgte mittels einer qualitativen Inhaltsanalyse. Unter Rückgriff auf aktuelle Literatur der Implementationsforschung (z.B. Schrader et al., 2020, s.o.) wurden übergreifende Kategorien für Bedingungsfaktoren gebildet, weitere Subkategorien ergaben sich induktiv aus dem Datenmaterial. Dabei wurde differenziert, ob thematisierte Aspekte als förderlich oder herausfordernd für den Implementationsprozess wahrgenommen werden. Es zeigt sich, dass verschiedene Charakteristika der Software als förderlich für deren Implementation wahrgenommen werden. Dazu zählt beispielsweise die Realitätsnähe der Lernumgebung sowie die Möglichkeit, ganzheitliches und selbstorganisiertes Lernen zu unterstützen. Daneben sind aber auch Merkmale der Lehrpersonen (z.B. Motivation), oder institutionelle Charakteristika (z.B. die Unterstützung des Kollegiums) und die Form der Unterstützung beim Implementationsprozess (z.B. Workshops) relevante Implementationsbedingungen. Eine zentrale Herausforderung stellt der Zeitaufwand dar, der zu Einarbeitung und Implementation benötigt wird. Die identifizierten Gelingensbedingungen und Herausforderungen tragen schließlich dazu bei, Handlungsempfehlungen für zukünftige Implementationsprozesse in der beruflichen Bildung abzuleiten. Poster Kulturelle Bildung und gesellschaftliche Transformation – auf dem Weg zur Aufarbeitung des Forschungsstandes Lisa Birnbaum, Alexander Christ, Stephan Kröner Friedrich-Alexander-Universität Erlangen-Nürnberg, Deutschland Theoretischer Hintergrund Im Rahmen gesellschaftlichen Wandels gerät auch kulturelle Bildung in ein Spannungsfeld aus Bewahrung von Bewährtem, Anpassung an veränderte Rahmenbedingungen und aktiver Gestaltung der Zukunft (Reinwand-Weiss, 2023). Im Praxisfeld der kulturellen Bildung kommt Themenbereichen wie Inklusion und Teilhabe oder der Ermöglichung eines vielfältigen kulturellen Angebots in ländlichen Räumen besondere Bedeutung zu (Büdel & Kolleck, 2023). Um beurteilen zu können, inwieweit gesellschaftlicher Wandel mittels kultureller Bildung andressiert werden kann und welche Evidenz zu Gelingensbedingungen und Herausforderungen vorliegen, sind breit angelegte, textmininggestützte Forschungssynthesen hilfreich (Christ et al., 2021) Fragestellung Um das Forschungsfeld zur kulturellen Bildung vor dem Hintergrund gesellschaftlicher Transformation zu kartieren, soll (a) ein Überblick über das Forschungsfeld insgesamt gewonnen werden und es sollen (b) mit Inklusion und ländlichen Räumen ausgewählte aktuelle Themenbereiche der kulturellen Bildung vertieft analysiert werden. Dabei wird jeweils im Detail untersucht, in welchem Ausmaß belastbare Evidenz vorliegt und welche inhaltlichen und forschungsmethodischen Schwerpunkte sich erkennen lassen. Methode Im geplanten Projekt wird in den Datenbanken Scopus und ERIC mit breiten Suchbefehlen nach Zeitschriftenartikeln recherchiert. Die relevanten Begriffe zu kultureller Bildung inklusive ihrer Facetten wie bildende und darstellende Kunst, Literatur oder Musik finden bei der Suche ebenso Berücksichtigung wie relevante Begriffe zu gesellschaftlicher Transformation sowie insbesondere zu Inklusion und ländlichen Räume. Für Titel, Zusammenfassungen und Schlüsselbegriffe sowie für die Zeitschriften-Titel aller im Korpus enthaltenen Arbeiten wird jeweils eine Reihe sogenannter Signifikanzwerte bestimmt. Sie ergeben sich (a) aus dem Anteil der Wörter, der indikativ für kulturelle Bildung als solche oder eine ihrer Facetten ist, und (b) aus dem Anteil der Wörter, der jeweils auf eine gesellschaftliche Transformationslinie verweist, und (c) aus dem Anteil, der die Exklusion einer Arbeit naheliegt. Die so bestimmten Signifikanzwerte werden in darauffolgenden Iterationen aus priorisierten manuellen Sichtungen und Optimierung der Signifikanzwerte bei minimaler Anzahl zu sichtender Datenbanktreffer ein- bzw. ausgeschlossen. Alle eingeschlossenen Arbeiten werden anschließend per Topic Modeling thematisch kartiert. Ergebnisse Mit Hilfe von Gap Maps werden sowohl Schwerpunkte der internationalen Forschung zur kulturellen Bildung vor dem Hintergrund gesellschaftlicher Transformation als auch Forschungslücken aufgezeigt. Aufbauend auf der Kartierung des Feldes werden zu ausgewählten Schwerpunkten vertiefende Synthesen durchgeführt, insbesondere zu den Bereichen Inklusion und ländliche Räume. Schließlich werden die Ergebnisse der Kartierung in eine interaktive Web-App integriert, welche zur Visualisierung der Ergebnisse dient und es ermöglicht, nicht im Korpus enthaltene Arbeiten im erarbeiteten Topic Model zu verorten. Auf dem vorgestellten Poster werden erste Ergebnisse zur iterativen Entwicklung des Suchterms präsentiert. Diskussion Möglichkeiten und Grenzen der eingesetzten Machine-Learning-Verfahren sowie Implikationen für die weitere Entwicklung der Forschung zur kulturellen Bildung werden diskutiert. Poster Ist die Trennung von Tonfolge und Rhythmus beim Erlernen neuer Stücke hilfreich? – Eine empirische Betrachtung vor dem Hintergrund der Cognitive Load Theory Miriam Knebusch, Johannes Hasselhorn, Daniel Fiedler Friedrich-Alexander-Universität Erlangen-Nürnberg Um das Erlernen und Üben eines neuen Musikstückes möglichst effektiv zu unterstützen, werden von Lehrkräften traditionell zahlreiche Methoden wie die Reduktion des Tempos, der Fokus auf kleinere Abschnitte oder der Fokus auf einzelne Aspekte der Musik eingesetzt (z.B. Langeheine 1999). Häufig konzentrieren sich dabei die Lehrkräfte erst einmal auf die Tonhöhen ohne Berücksichtigung der rhythmischen Struktur, um u.a. die Komplexität des Lerngegenstands zu reduzieren. Inwiefern das getrennte Einüben von Tonhöhe und Rhythmus tatsächlich Lernvorteile mit sich bringt, kann allerdings kritisch hinterfragt werden. Vor dem Hintergrund der Cognitive Load Theory (Sweller, 1988, 2005) kann dabei die Belastung des Arbeitsgedächtnisses in den Blick genommen werden. Dabei ist eine Überlastung aufgrund zu hoher Informationsdichte zu vermeiden. Ein zentrales Maß zur individuellen Einschätzung der Komplexität eines (Lern-) Gegenstands ist die Element Interactivity (Chen, Klyuga & Sweller, 2015), die nicht nur die Vernetzung der zu verarbeitenden Informationen berücksichtigt, sondern gleichzeitig auch noch das Vorwissen einer Person einbezieht (Leahy & Sweller, 2019; Sweller, 2006). Es kann daher vermutet werden, dass insbesondere (instrumentale) musikalische Vorerfahrung eine notwendige Voraussetzung dafür darstellt, dass die getrennte Betrachtung von Tonhöhe und Rhythmus tatsächlich hilfreich für das Erlernen einer Melodie oder eines neuen Stücks ist. Das Ziel der vorliegenden Studie ist es daher, basierend auf einem experimentellen Studiendesign, zu überprüfen, ob Proband:innen verschiedener musikalischer Erfahrungsstufen nach zwei verschiedenen Einstudierungsmethoden (Methode 1: Rhythmus und Tonhöhe gleichzeitig vs. Methode 2: Erst die Tonhöhen, dann den Rhythmus) am Bodenklavier kurze Stücke unterschiedlich erfolgreich erlernen. Dabei wurde das Bodenklavier als weitgehend unbekanntes Musikinstrument ausgewählt, um Einflüsse spezifischer instrumentaler Vorkenntnisse zu reduzieren. Basierend auf den theoretischen Hintergründen gehen wir davon aus, dass Personen mit hoher musikalischer Erfahrung von Methode 2 profitieren; hingegen Personen mit geringer musikalischer Erfahrung eher von Methode 1. In dem experimentellen Design werden die Probandinnen (randomisiert) den beiden Methoden zugeordnet. Die Bewertung des Lernerfolgs erfolgt auf der Grundlage der Anzahl der notwendigen Wiederholungen, bis eine Person ein Stück in Bezug auf Tonhöhen und Rhythmus fehlerfrei spielen kann. Zusätzlich werden sowohl der Globalfaktor des Goldsmiths Musical Sophistication Index (Fiedler & Müllensiefen, 2015), die Arbeitsgedächtnisleistung (Backward-Digit-Span) als auch soziodemografische Hintergrundvariablen erfasst. Die Auswertung der Daten erfolgt in einem varianzanalytischen Ansatz. Die Datenerhebung ist aktuell noch nicht abgeschlossen, vorläufige Ergebnisse auf der Basis von N=40 Versuchspersonen zeigen bereits die erwarteten Effekte. In einer ANCOVA mit abhängiger Variable Anzahl Versuche und Arbeitsgedächtnisleistung als Kovariate zeigt sich ein signifikanter, mittlerer Interaktionseffekt zwischen Übemethode und musikalischer Erfahrung (F=4.31, p=0.04, part. η²=0.06). Personen mit geringerer musikalischer Expertise benötigen durchschnittlich 2.24 Versuche mehr, wenn sie die Tonfolge zunächst unabhängig vom Rhythmus erlernen. Bis zur Tagung sollen diese Ergebnisse in einer größeren Stichprobe bestätigt werden. Mithilfe dieser Studie können Erkenntnisse über die Eignung einer Übemethode für verschiedene Schülerinnen abhängig von deren musikalischer Vorerfahrung gewonnen und Lehrkräfte dabei unterstützt werden, passgenaue Methoden anzuwenden. Somit kann unsere Forschung zur Binnendifferenzierung beim Erlernen von Musikstücken beitragen. Basierend auf unseren Ergebnissen können also nicht nur die traditionellen Methoden zur Einstudierung von Stücken überprüft, sondern darüber hinaus theorie- und evidenzbasierte Ansätze in die pädagogische Praxis überführt werden. Poster Zur inkrementellen Varianz des Selbstkonzepts zur Vorhersage von subjektivem Wohlbefindens bei Jugendlichen über Persönlichkeit hinaus Victoria Sophie Listing¹, Miriam Schmitz¹, Prof. Dr. Maike Luhmann², Prof. Dr. Marcus Roth³, Prof. Dr. Ricarda Steinmayr¹ ¹Technische Universität Dortmund; ²Ruhr-Universität Bochum; ³Universität Duisburg-Essen Im Forschungsfeld des subjektiven Wohlbefindens (SWB) Erwachsener nimmt die Persönlichkeit eine besondere Stellung als eine der stärksten und beständigsten Determinanten ein (Diener & Lucas, 1999). Allerdings existieren nur wenige Studien zu der Frage, ob die Persönlichkeit auch bei Jugendlichen als wichtiger Prädiktor des SWBs gilt (Winzer et al., 2021). Deswegen prüfen wir, inwiefern Persönlichkeit bei Jugendlichen mit verschiedenen Aspekten des SWBs assoziiert ist (Hypothese 1). Überdies wurde noch nicht untersucht, ob neben der Persönlichkeit als Prädiktor, auch Selbstkonzeptfacetten inkrementell Varianz im SWB erklären können. Diese Berücksichtigung sollte nicht unbeachtet bleiben, da sich das Selbstkonzept, als charakteristische Anpassung an die Big Five und die Umwelt, ebenfalls auf das individuelle Verhalten auswirkt (Pervin et al., 2005). Dementsprechend wurde überprüft, ob das Selbstkonzept über den Beitrag der Persönlichkeitsmerkmale hinaus zu der Vorhersage der allgemeinen Lebenszufriedenheit und Stimmung beiträgt (Hypothese 2). Entsprechend des Brunswik'schen Symmetrieprinzips (Wittmann, 2002) gehen wir davon aus, dass jene Selbstkonzeptfacetten, die den gleichen Kontext wie die bereichsspezifische Lebenszufriedenheit adressieren (z.B. Fähigkeitsselbstkonzept - schulbezogene Lebenszufriedenheit), über den Beitrag von Persönlichkeitsmerkmalen hinaus die beste Vorhersage der bereichsspezifischen Lebenszufriedenheit leisten (Hypothese 3) (Kretzschmar et al., 2018). Die Stichprobe setzte sich aus N = 1269 Achtklässlerinnen aus NRW zusammen (M_Alter = 13.31, SD = 0.6; 57.9% weiblich) und wurde im Rahmen der ersten Erhebungswelle (17.10.2022 – 16.12.2022) des GLÜCKS-Projekts gewonnen. Folgenden Aspekte des SWBs wurden erfasst: habituelle Lebenszufriedenheit (HSWBS; Dalbert, 2002), positive und negative Stimmung (SPANE; Rahm et al., 2017) sowie bereichsspezifische Lebenszufriedenheit mit Freunden, Familie, Schule und der eigenen Person (MLSSL; Huebner et al., 1998). Als Prädiktoren wurden die Big Five (BFI-K KJ; Kupper et al., 2019) sowie Selbstkonzeptfacetten (Fähigkeitsselbstkonzept, Aussehen, körperliche Fähigkeiten, Beziehung zu den Eltern, Beziehung zu Personen anderen & gleichen Geschlechts) betrachtet (SDQ III; Schwanzer et al., 2005). Um Multikollinearität entgegenzuwirken, wurden Relative Weight Analysen (RWA) als Alternative zu multiplen Regressionen durchgeführt. Diese bestimmen den relativen Beitrag, den ein Prädiktor zur Varianzaufklärung des Kriteriums leistet (Johnson, 2004). Bezüglich Hypothese 1 wurden sieben RWA durchgeführt, bei denen die Big Five die habituelle und bereichsspezifische Lebenszufriedenheit sowie die Stimmung vorhersagten. Für die Hypothesen 2 und 3 wurden sieben RWA durchgeführt, bei denen die oben genannten Kriterien durch die Big Five und das Selbstkonzept vorhergesagt wurden. Übereinstimmend mit Hypothese 1 zeigte sich, dass die Big Five rund 35% Varianz im SWB aufklärten (R² = .11 - .35). Neurotizismus erwies sich als wichtigster Prädiktor und erklärte 53.1% der aufgeklärten Varianz der habituellen Lebenszufriedenheit, 50.7% der positiven und 78.0% der negativen Stimmung. Auch in den Lebenszufriedenheitsfacetten Freunde, eigene Person und Familie erwies sich Neurotizismus als wichtigster Prädiktor und erklärte jeweils 46.0%, 39.3% und 54.9%. Die schulische Lebenszufriedenheit (43.2%) wurde am stärksten durch Gewissenhaftigkeit erklärt. Gemäß Hypothese 2 zeigte sich, unter Berücksichtigung der Selbstkonzeptfacetten, eine Erhöhung der Varianzaufklärung im SWB auf 56% (R² = .23 - .56). Das elterliche Selbstkonzept erwies sich als wichtigster Prädiktor und erklärte 28.9% der habituellen Lebenszufriedenheit, 27.7% der positiven und 24.2% der negativen Stimmung. Entsprechend Hypothese 3 zeigte sich, dass die Selbstkonzeptfacetten, die im gleichen Kontext wie die Lebenszufriedenheitsbereiche waren, das höchste Inkrement erbrachten. Das elterliche Selbstkonzept erklärte 61,7% der familiären Zufriedenheit. Bei der Zufriedenheit mit der eigenen Person erwies sich das Aussehen bezogene Selbstkonzept als wichtigster Prädiktor (32.3%). Beziehungen zu Personen gleichen Geschlechts erklärten zu 60.2% die Zufriedenheit mit Peers. Insgesamt zeigten unsere Befunde, dass die Persönlichkeit auch bei Jugendlichen eine wichtige Determinante des SWBs ist. Wir konnten verdeutlichen, dass domänenspezifische Selbstkonzeptfacetten nicht nur inkrementell das entsprechende bereichsspezifische SWB prädizierten, sondern mitunter mehr Varianz im SWB erklärten als Persönlichkeitsmerkmale. Auch bei der Lebenszufriedenheit scheint die Kontextualisierung eine große Rolle für die Validität des Selbstkonzepts zu spielen (Kretzschmar et al., 2018). Poster Adaptivität im Kontext des selbstregulierten Lernens Tabea Daria Eberli, Yves Karlen Universität Zürich, Schweiz Selbstreguliertes Lernen beschreibt die Schülerinnen als aktive Lernende ihres eigenen Lernprozesses, den sie durch den Einsatz von Lernstrategien überwachen und regulieren, um die gewünschten Ziele zu erreichen (Zimmerman, 2002). Die bisherige Forschung hat gezeigt, dass Lernende Schwierigkeiten im SRL haben und individuelle Unterschiede in den Fähigkeitsausprägungen im SRL vorhanden sind (z.B. Heirweg et al., 2019; Karlen, 2016). Während selbstregulierte Lernende von mehr Autonomie profitieren können, sind Lernende mit geringen SRL-Kompetenzen stärker auf die Unterstützung der Lehrperson angewiesen. Dies bedingt jedoch, dass die Lehrpersonen die Fähigkeiten ihrer Lernenden im Bereich des SRL kennen und wissen, wie sie ihren Unterricht adaptiv an den individuellen Voraussetzungen anpassen können (Corno, 2001). Eine individuelle und adaptive Unterstützung setzt voraus, dass die Lehrperson die individuellen Kompetenzunterschiede ihrer Schülerinnen wahrnimmt und über instruktionale Strategien verfügt, um auf diese reagieren zu können (Dumont & Ready, 2023; Corno 2008). Aktuelle Modelle zu den professionellen Kompetenzen von Lehrkräften im Bereich des SRL (z.B. Karlen et al., 2020) heben die Bedeutung der adaptiven Kompetenz hervor. Lehrkräfte sollen die Förderung von SRL an die individuellen Voraussetzungen und Möglichkeiten der Lernenden anpassen und während der Förderung die Entwicklung von SRL durch gezieltes Scaffolding unterstützen. Bisher wurden die Forschungsbereiche zur Adaptivität und zum SRL kaum miteinander verbunden. Es fehlen insbesondere Studien, die untersuchen, inwiefern Lehrkräfte adaptive Unterstützungsmassnahmen im Kontext des SRL berücksichtigen. Basierend auf diesen Forschungsdesiderata sollen in diesem Beitrag das Konzept der Adaptivität und das SRL miteinander verknüpft werden. Ziel ist es, zu untersuchen, welche adaptiven Strategien bei der Förderung von SRL eingesetzt werden. Die folgenden Forschungsfragen werden untersucht: Inwieweit sind sich die Lehrpersonen der individuellen Fähigkeiten ihrer Lernenden im Bereich des SRL bewusst und wie setzen sie dieses Wissen in ihrem Unterricht um? Welche adaptiven Strategien setzen die Lehrkräfte bei der Förderung von SRL ein? Inwiefern haben das Wissen, die Überzeugung, die Motivation und die eigenen SRL-Kompetenzen einen Einfluss auf den Einsatz adaptiver Strategien? Zur Beantwortung der Fragestellungen werden sowohl quantitative als auch qualitative Daten verwendet, welche im Rahmen einer längsschnittlichen Interventionsstudie zur Förderung der professionellen Kompetenzen der Lehrpersonen im SRL erfasst wurden. Insgesamt N=54 Lehrpersonen sowie deren N= 1012 Schülerinnen nahmen an der Interventionsstudie teil. In einer Follow-up-Messung wurden N = 26 Lehrkräfte 7 bis 9 Monate nach der einjährigen Intervention zur Förderung des SRL im Unterricht befragt. Der Interviewkatalog enthielt Fragen zur Adaptivität und zur Diagnose des Lernprozesses der Schülerinnen. Die qualitative Inhaltsanalyse der Interviews gibt Aufschluss darüber, welche adaptiven Strategien die Lehrpersonen bei der Förderung von SRL verwenden, welche Methoden sie als nützlich empfinden und weshalb. Auf der Grundlage der quantitativen Daten (verschiedene Skalen zum professionellen Wissen, den Überzeugungen, der Motivation und den eigenen SRL-Kompetenzen der Lehrkräfte) zielt diese Studie darauf ab, zu verstehen, welche Lehrpersonen den Einsatz von adaptiven Strategien verwenden. Die Ergebnisse dieser multimethodischen Studie werden derzeit ausgewertet und können auf der GEBF vorgestellt werden. Poster Förderung der professionellen Wahrnehmung technologiegestützten Unterrichts: Ist das Lernen mit Lösungsbeispielen im Fadingverfahren wirksam? Christina Wekerle, Eva Kaistra, Johanna Dufter, Ingo Kollar Universität Augsburg, Deutschland Theoretischer Hintergrund* Um die Vorteile digitaler Technologien für die Unterstützung der Lernprozesse von Schülerinnen zu nutzen, ist es notwendig, dass angehende Lehrkräfte eine professionelle (Unterrichts-)Wahrnehmung entwickeln. Diese umfasst die Fähigkeit, relevante Situationen im technologiegestützten Unterricht auf der Grundlage empirischer Erkenntnisse zu erkennen (Noticing), zu erklären und alternative Handlungsmöglichkeiten zu identifizieren (Knowledge-Based Reasoning; van Es, 2011). Jedoch begegnen Lehramtsstudierende hierbei häufig Schwierigkeiten. Eine bereits bewährte Methode zur Förderung professioneller Wahrnehmung ist das fallbasierte Lernen, das sich insbesondere dann als effektiv erweist, wenn den Lernenden Lösungsbeispiele zur Verfügung gestellt werden (Renkl, 2011). Hierbei kann Fading, das schrittweise Ausblenden von Lösungsschritten, den Übergang vom Lernen mit Lösungsbeispielen zu eigenständigem Problemlösen erleichtern (Klopp & Stark, 2018). In der vorliegenden Studie wurde untersucht, wie sich das Fading von Lösungsbeispielen im Vergleich zu vollständigen Lösungsbeispielen und selbstständigem Problemlösen auf das Noticing und Reasoning über technologiegestützte Unterrichtssituationen von Lehramtsstudierenden auswirkt. Methode* Im Pretest sollten 224 Lehramtsstudierende (M_age= 22.12, SD = 3.28; 79% weiblich) auf Basis einer Beschreibung einer technologiegestützten Unterrichtsstunde (Fallvignette) ein Unterrichtsproblem offen analysieren. Drei darauffolgende Fallvignetten wurden von den Studierenden entweder analysiert (Problemlösen, N = 72), sie erhielten vollständige Lösungsbeispiele zu den Fallvignetten (Lösungsbeispiele ohne Fading, N = 74) oder erhielten Lösungsbeispiele, bei denen zunehmend mehr Schritte selbst ausgeführt werden mussten. Im Posttest analysierten die Studierenden drei Probleme der Pretestvignette. Zwei unabhängige Coder erreichten für das Noticing (Cohen’s k = .88), die Verwendung von Theorie (Cohen’s k = .86) sowie die Angemessenheit der Theorieverwendung (Cohen’s k = .85) beim Reasoning im Pre- und Posttest jeweils eine gute Übereinstimmung. Ergebnisse Bezüglich des Noticing zeigte sich ein signifikanter, großer Effekt der Bedingung, F(2,220) = 33.90, p < .001, partielles η² = .236. Studierende der beiden Lösungsbeispielbedingungen schnitten beim Noticing besser ab als Studierende der Problemlösebedingung, p < .001, unterschieden sich jedoch nicht voneinander, p > .05. Die Häufigkeit der Verwendung von Theorie unterschied sich nicht signifikant zwischen den Bedingungen, F(2,220) = .74, p > .05. Jedoch konnte ein signifikanter, großer Effekt für die Angemessenheit der Theorieverwendung festgestellt werden, F(2,166) = 12.71, p < .001, partielles η² = .19. Studierende der beiden Lösungsbeispielbedingungen zeigten eine größere Angemessenheit ihrer Theorieverwendung als die der Problemlösebedingung, p < .05. Außerdem waren Studierende der vollständigen Lösungsbeispielbedingung Studierenden der Lösungsbeispielbedingung mit Fading überraschenderweise überlegen, p = .02. Diskussion Während die Ergebnisse illustrieren, dass die Studierenden, die Lösungsbeispiele erhielten, besser in der Lage waren, relevante Situationen zu erkennen und wissenschaftliche Quellen angemessen zur Interpretation zu verwenden, ergaben sich keine zusätzlichen Vorteile durch das Fading. Eine mögliche Erklärung könnte sein, dass die Studierenden nicht genug Expertise besaßen, um von dem Fading zu profitieren. Diese Annahme konnte mithilfe einer explorativen Analyse der von den Studierenden selbst bearbeiteten Schritte während der Intervention geprüft werden. 63% der Studierenden zeigten zu Beginn der Fadingphase noch keine ideale Analyse. Es werden entsprechende Konsequenzen für Folgestudien gezogen. Poster Misserfolgsattributionen von Lehramtsstudierenden und ihre emotionalen und kognitiven Korrelate als Ausgangspunkt musikpädagogischer Forschung Daniel Fiedler¹, Anne C. Frenzel², Johannes Hasselhorn¹, Marina E. Pfeifer² ¹Friedrich-Alexander-Universität Erlangen-Nürnberg, Deutschland; ²Ludwig-Maximilians-Universität München Theoretischer Hintergrund Die Attributionstheorie (Heider, 1958) beschreibt, wie Individuen Informationen nutzen, um kausale Erklärungen für Verhaltensweisen von Menschen vorzunehmen, wobei diese Erklärungen entweder internal oder external attribuiert werden. Weiner (1985, 1994) erweiterte diese Theorie für die Wirkung von Attributionen auf Emotionen und detaillierte, welche Attributionskonstellationen (internal/external, stabil/variabel, kontrollierbar/unkontrollierbar) emotional günstig bzw. ungünstig sein sollten. Basierend auf Weiners Annahmen und Frenzels (2014) Modell von Unterrichts- bzw. Lehrerinnenemotionen konzipierten wir Vignetten zu vier möglichen Misserfolgen (Motivation, Leistung, Disziplin und Beziehung mit Schülerinnen) beim Unterrichten im Allgemeinen und des Faches Musik im Speziellen. Ziele der Studie Ziel der ersten Studie war es, die Funktionalität dieser Vignetten bei Lehramtsstudierenden aller Fächer und Schularten zu überprüfen und Zusammenhänge mit Lehrerinnenemotionen sowie kognitiven Konstrukten wie Reflexionsbereitschaft und Selbstwirksamkeit zu analysieren. Ziel der zweiten Studie ist es, zu überprüfen, ob die von uns konstruierten Vignetten musikunterrichtsspezifisch übertragen und bei Lehramtsstudierenden des Faches Musik aller Schularten reliabel angewandt werden können. Methodisches Vorgehen & Ergebnisse* Die Stichprobe von Studie 1 umfasste 440 Lehramtsstudierenden der LMU München (84.9% weiblich, 14.9% männlich, 0.2% nicht-binär, M_Alter = 22.9 Jahre, SD_Alter = 4.06), die einen Online-Fragebogen ausfüllten. In den Attributionsvignetten wurden jeweils allgemeine Misserfolgsszenarien dargestellt, deren Verursachung entlang von emotional günstigen bis hin zu ungünstigen Attributionspolen beurteilt wurden. Daneben erfassten wir Lehrerinnenemotionen (Teacher Emotions Scale, Frenzel et al., 2016), Reflexion (Kunter at al., 2017) und Selbstwirksamkeit (Norwegian Teacher Self-Efficacay Scale, Skaalvik & Skaalvik, 2007) in den Dimensionen Unterrichten, Motivieren, mit Eltern/Kolleginnen kooperieren, mit Problemen umgehen, Unterricht an Bedürfnisse anpassen und Disziplin wahren. Die Ergebnisse zeigten, dass das allgemeine Attributionsverhalten reliabel erfasst werden kann (a = .78; w = .78; Cronbach, 1951; McDonald, 1999). Entsprechend der Theorie gehen höhere Attributionswerte, d.h. internale, variable und kontrollierbare Zuschreibungen, mit einer erhöhten Reflexionsbereitschaft (r = .24, p < .001), mit höherer Selbstwirksamkeit in allen sechs NTSES-Dimensionen (r zwischen .09 und .17, p < .05) und mit mehr Freude (r = .21, p < .001), weniger Wut (r = -.26, p < .001) sowie weniger Angst (r = -.15, p < .001) beim Unterrichten einher. Basierend auf diesen Vignetten, wurden für Studie 2 Vignetten konstruiert, die musikunterrichtspezifische Misserfolgssituationen beschreiben (u.a. Liedeinstudierung, Klassenmusizieren etc.) und bislang 30 Lehramtsstudierende des Faches Musik befragt. Wir gehen basierend auf Studie 1 davon aus, dass wir aufgezeigten Zusammenhänge zwischen den Attributionstendenzen von Lehramtsstudierenden mit Reflexionsbereitschaft, Selbstwirksamkeit und Lehrerinnenemotionen auch in Studie 2 abbilden können. Außerdem gehen wir davon aus, dass die korrelativen Effektstärken der beiden Studien nahezu identisch sein werden. Diskussion* Die Ergebnisse unserer Studien können einen Hinweis dafür liefern, dass die von uns entwickelten Vignetten ein kontextspezifisches reliables Maß für emotionsgünstige Attributionen von Misserfolgsszenarien darstellen und zur Untersuchung von musikunterrichtsspezifischen Situationen eingesetzt werden können. Darüber hinaus können auf der Grundlage weiterer Forschung allgemeine und musikunterrichtsspezifische Videovignetten entwickelt werden, um u.a. (Musik-)Lehramtsstudierende auf die Herausforderungen im Berufsfeld praxisorientiert und in Bezug auf emotionsgünstige Attributionen vorzubereiten. Poster Impulse für die Weiterentwicklung von Schule und Unterricht durch (die Arbeit mit Ergebnissen aus) Vergleichsarbeiten in Grund- und Sekundarschulen Ilona Weyrauch^1,2, Franziska Wick^1,2, Michael Zimmer-Müller², Ingmar Hosenfeld², Josef Strasser^1,2 ¹Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau, Campus Landau, Deutschland; ²Zentrum für Empirische Pädagogische Forschung (zepf), RPTU, Campus Landau Ausgangslage Es liegen zahlreiche quantitative Daten vor, die belegen, dass Vergleichsarbeiten nicht in dem Maße zur Schul- und Unterrichtsentwicklung genutzt werden, wie sie genutzt werden könnten (Wagner et al., 2019, Ophoff, 2013, Ophoff et al. 2019). Die erwünschten Wirkungen bleiben eher aus. Gleichzeitig wird gerade auf VERA-Tagungen immer wieder von einzelnen Schulen berichtet, die sehr wohl mit Ergebnissen aus VERA weiterarbeiten und dabei individuelle Wege gefunden haben. Was diese Schulen konkret machen und in welcher Hinsicht sie in welcher Weise mit den Ergebnissen weiterarbeiten, wurde bislang nicht näher untersucht. Diesem Defizit sollte mit der vorliegenden Studie abgeholfen werden. Fragestellung Ziel der Studie war es herauszufinden, welche konkreten Praktiken und Vorgehensweisen der Weiterarbeit mit VERA sich an Schulen finden und was diese selbst von einer solchen Weiterarbeit berichten. Dabei sollen zudem Faktoren aufgespürt werden, die förderlich für eine Weiterarbeit mit VERA-Ergebnissen sind oder sich als hinderlich erweisen. Im Einzelnen wurden Fragen nachgegangen, wie an den Schulen mit VERA-Ergebnissen umgegangen wird, ob VERA bzw. VERA-Ergebnisse in den schulischen Jahresablauf integriert werden, wer an den Schulen mit diesen Ergebnissen weiterarbeitet und ob dadurch Schul- und Unterrichtsentwicklung vorangebracht werden. Methode Um ein möglichst weites Spektrum an konkreten Praktiken so wie die jeweilige Perspektive der Handelnden offen zu erfassen, kamen qualitative Expert:inneninterviews zum Einsatz. Da es an den Schulen mehrere Akteur:innen gibt, die in unterschiedlichem Maß mit den Vergleichsarbeiten betraut sind, scheint ein mehrperspektivischer Blick sinnvoll zu sein. Deshalb wurden sowohl Schulleitungen wie auch Lehrkräfte, die an ihren Schulen mit VERA arbeiten bzw. weiterarbeiten, befragt. Die Mehrperspektive sollte erfasst werden, indem von jeder Schule die Schulleitung und eine weitere Lehrkraft befragt wird. Der Interview-Leitfaden beinhaltete zunächst Fragen, die sich mit dem Umgang von VERA-Daten befassten und nach dem ‚allgemeinen Procedere‘ fragten, wie VERA an der Schule organisiert wird. An der Studie nahmen 26 Schulen aus mehreren Bundesländern teil. Überwiegend wurden Schulleitungen und Lehrkräfte mit speziellen Aufgaben befragt. Die Interviews wurden via Zoom geführt, wobei nur Audio-Aufnahmen angefertigt, die anschließend transkribiert wurden. Die Daten wurden inhaltsanalytisch ausgewertet. Für die erste Kodierung wurde ein deduktiver Ansatz gewählt. Dabei wurde neben Hintergrundvariablen zur interviewten Person erfasst, wie Verantwortlichkeiten verteilt sind, wer an der Schule die VERA-Ergebnisse in den Blick nimmt und ob Handlungsideen entwickelt und umgesetzt werden. Als weitere Kategorien waren ‚Wünsche‘ und ‚Kritik‘ und ob in der Anwendung von VERA eine Nützlichkeit gesehen wird. Die Intercoder-Reliabilität betrug 𝛋=.64. Für die Feinkodierung wurde eine induktive Vorgehensweise in Anlehnung an Kuckartz gewählt (Rädiger & Kuckartz, 2019). Ergebnisse Es wurden unterschiedliche Praktiken und Vorgehensweisen im Umgang mit VERA-Ergebnissen an den Schulen festgestellt, die die Weiterarbeit mit den Ergebnissen beeinflussen. Diese lassen sich grob zwei Kategorien zuordnen. Bei der ersten Vorgehensweise verbleiben die VERA-Ergebnisse bei der Lehrkraft. Es bleibt also der einzelnen Lehrkraft überlassen, inwieweit sie damit weiterarbeitet. Es werden Gründe für schlechte VERA-Ergebnisse und auch für ein Nicht-Handeln genannt. Bei der zweiten Vorgehensweise wird von einer gemeinsamen Weiterarbeit im Kollegium berichtet. An diesen Schulen werden in der Regel mehrere Verfahren des Monitoring genutzt, um zum einen Schulentwicklung voranzubringen und zum anderen als diagnostische Maßnahme den Bildungsverlauf der Schüler:innen positiv zu beeinflussen. Diskussion Nach der bisherigen Auswertung der Ergebnisse kann vermutet werden, dass, wenn VERA als ‚angeordnete Maßnahme‘ verstanden wird, die VERA-Ergebnisse auf Lehrkraft-Ebene verbleiben. Es werden Gründe angeführt, warum diese Ergebnisse nicht als zufriedenstellend angesehen werden. Wenn VERA als Schulentwicklungstool verstanden wird, sind die Schulleitung in der Lage, die Ergebnisse zu interpretieren und Maßnahmen zu ergreifen. Der Umgang mit den Ergebnissen wird als integraler Bestandteil der Schulentwicklung gesehen. Die Annahme ist, dass die verschiedenen Vorgehensweisen auf unterschiedlichen Haltungen und Überzeugungen beruhen, was noch näher untersucht werden müsste. Poster Partizipation und individuelle kognitive Aktivierung - Digital Storytelling in inklusiven Grundschulklassen Henrik Frisch, Julia Warmdt, Christoph Ratz, Sanna Pohlmann-Rother JMU Würzburg, Deutschland Theorie und Fragestellungen Normativ wird der Anspruch formuliert, Unterricht qualitativ hochwertig zu gestalten. Wie dies vor dem Hintergrund aktueller gesellschaftlicher Entwicklungen gelingen kann, ist weitgehend unerforscht (Begrich et al., 2023). Im Fokus des Beitrags stehen die differenziellen Effekte der Unterrichtsqualitätsforschung in einer Kultur der Digitalität und mit dem Anspruch allen Kindern in inklusiven Gruppen gemeinsame Lerngelegenheiten zu ermöglichen. Dabei wird einerseits die individuelle kognitive Aktivierung sowie andererseits die inhaltliche Partizipation der Schüler:innen mit Schwerpunkt Geistige Entwicklung am Digital Storytelling fokussiert. Forschungen zum digitalgestützten (Quast, Rubach & Lazarides, 2021) sowie zum inklusiven Unterricht (Bohl, Budde & Rieger-Ladich, 2017) nehmen Bezug auf die klassische Unterrichtsqualitätsforschung und damit einhergehend auf die kognitive Aktivierung. In einem kognitiv aktivierenden Unterricht sollen alle Lernenden entsprechend ihrer individuellen Lernvoraussetzungen zur Auseinandersetzung mit anspruchsvollen Aufgaben angeregt werden, die Verstehen und Schlussfolgern fördern (Grünkorn & Klieme, 2020). In einem inklusiven Unterricht mit einer großen Heterogenität an Lernausgangslagen wird davon ausgegangen, dass die (digitalen) Aufgabenstellungen bzw. Handlungen der Lehrkraft und Mitschüler:innen individuell verschieden kognitiv aktivierend erlebt werden (Rieser & Decristan, 2023). Im Rahmen der Dissertation wird der Frage nachgegangen, welche Lehr- und Lernsituationen im digitalgestützten und inklusiven Unterricht als individuell kognitiv aktivierend beschrieben werden können? In diesem Beitrag liegt der Fokus auf der inhaltlichen Dimension der Partizipation. Diese wird als aktive Teilhabe an gemeinsamen Lernprozessen und dem Gemeinsamen Gegenstand verstanden. Schüler:innen mit Schwerpunkt Geistige Entwicklung sind bezüglich der Partizipation an inklusivem Unterricht eine besonders gefährdete Schülergruppe (Hellmich et al., 2017). Gleichzeitig gilt die Partizipation aber auch als Grundbedingung für Inklusion (Schwab, 2018) und aus sonderpädagogischer Perspektive als Grundlage für alle weiteren Diskussionen über Unterrichtsqualität (Heimlich, 2018). Es stellt sich somit die Frage, wie Schüler:innen mit Schwerpunkt Geistige Entwicklung an Inhalten des digital-inklusiven Unterrichts partizipieren. Digitalgestützter und inklusiver Unterricht kann zu einer Vielzahl an Konzepten gestaltet werden, wie beispielsweise zum Digital Storytelling. Im Rahmen des Digital Storytellings kann die gemeinsame literarische Geschichte durch die vielfältigen, multimodalen Ausdrucksmöglichkeiten auf verschiedenen Leistungsniveaus weitererzählt werden (Warmdt et al., 2023). Methodisches Vorgehen In acht inklusiven, ersten und zweiten Partnerklassen wurde eine Projektwoche zum „Digital Storytelling mit Hund Milo“ (Warmdt & Frisch, 2023) aus drei Perspektiven videografiert. Die aufbereiteten und transkribierten Videodaten wurden mittels qualitativer Inhaltsanalyse mit Fokus auf die individuelle kognitive Aktivierung und die inhaltliche Partizipation ausgewertet (Kuckartz & Rädiker, 2022). Auswertungsergebnisse und Diskussion Erste Ergebnisse weisen darauf hin, dass die Erst- und Zweitklässler:innen in unterschiedlichen Momenten zum Digital Storytelling individuell kognitiv aktiviert sein können, wie beispielsweise bei der Entwicklung einer eigenen Idee zum Fortverlauf der Geschichte. In der Arbeitsphase zum Digital Storytelling wird von den Schüler:innen in der Summe 130 Mal eine eigene Idee generiert. Dabei entwickeln die Schüler:innen mehr als dreimal so häufig eine Idee mithilfe der enaktiven Figuren (N = 84), als eine eigene Idee zu formulieren (N = 24) bzw. hierzu überlegen (N = 22). An der Ideenentwicklung beteiligen sich sowohl Schüler:innen mit Schwerpunkt Geistige Entwicklung, als auch Grundschüler:innen - wobei innerhalb der Schüler:innengruppe eine große Heterogenität erkennbar ist. Während beispielsweise sieben Schüler:innen keine Ideen entwickeln, generiert ein Schüler mit Schwerpunkt Geistige Entwicklung 19 Ideen zum Fortverlauf der Geschichte. Bezüglich der Partizipation der Schüler:innen mit Schwerpunkt Geistige Entwicklung am Digital Storytelling weisen erste Ergebnisse auf eine in zentralen Aspekten des Lernprozesses eingeschränkte Partizipation hin: Obwohl Schüler:innen mit Schwerpunkt Geistige Entwicklung literarische Ideen einbringen und ausgestalten, werden diese von ihren Mitschüler:innen nur selten aufgenommen und finden sich kaum in den Endprodukten des Digital Storytelling. Darüber hinaus nutzen Schüler:innen mit Schwerpunkt Geistige Entwicklung das iPad beim Digital Storytelling deutlich weniger als ihre Mitschüler:innen ohne sonderpädagogischen Schwerpunkt. Die ersten Ergebnisse sollen im Rahmen der Posterpräsentation diskutiert werden. Poster Ein heuristisches Rahmenmodell für videobasierte Lehr-Lernszenarien in der Hochschullehre Katharina Sophie Heiler, Christina Wekerle, Alena Bischoff, Moritz Schweiger, Kristina Peuschel, Kerstin Proske, Birgit Weckerle, Lisa Vettermann, Ann-Kathrin Schindler Universität Augsburg, Deutschland Theoretischer Hintergrund Professionelle Wahrnehmung ist eine situationsspezifische Fähigkeit, die für jeden spezifischen beruflichen Kontext erlernt werden muss (Blömeke et al., 2015; Goodwin, 1994). Sie setzt sich aus den Komponenten noticing (wissensbasierte Identifikation von Schlüsselelementen) und knowledge-based reasoning (Verarbeitung wahrgenommener Aspekte) zusammen (Seidel & Stürmer, 2014). Zur Förderung professioneller Wahrnehmung eignen sich insbesondere Videos, die authentische Situationen aus verschiedenen Berufsfeldern zeigen, um die Kluft zwischen Hochschulbildung und Berufspraxis zu überbrücken (Stokking et al., 2003). Der entscheidende Aspekt bei der Videonutzung ist jedoch nicht das Video selbst, sondern wie es genutzt wird (Blomberg et al., 2013). Hier mangelt es an Rahmenmodellen, die vorhandenes empirisches und praktisches Wissen integrieren, um Hochschullehrende bei der Planung, Umsetzung, Evaluierung und Verbreitung videobasierter Lehr-Lernszenarien anzuleiten. Ziel dieses Beitrags war, ein Rahmenmodell zu entwickeln, das (1) für videobasiertes Lehren und Lernen relevante, aber bisher separierte pädagogisch-psychologische Forschungsstränge integriert und (2) eine leicht zugängliche Heuristik für Akteure verschiedener Fachdisziplinen bietet, die einen strukturierten Ansatz für videobasierte Lehre und Forschung suchen. Methode Das Rahmenmodell wurde in einem iterativen deduktiv-induktiven Prozess in interdisziplinären Gruppendiskussionen mit Mitgliedern aus vier verschiedenen Fachdisziplinen entwickelt. Zunächst wurden Annahmen über relevante Akteure und Prozesse aus der Literatur abgeleitet (deduktiv), die den Kern des Rahmenmodells bildeten. Es wurde Forschung zu professioneller Wahrnehmung (Seidel & Stürmer, 2014), technologisch-pädagogischem Fachwissen (TPACK; Koehler et al., 2014; Koehler & Mishra, 2009) und hochwertigen Lernaktivitäten (ICAP; Chi & Wylie, 2014) berücksichtigt. Anschließend wurde das Modell in Lehrveranstaltungen der vier Disziplinen erprobt und auf Grundlage praktischer Felderfahrungen induktiv angepasst. Diese Iterationen wurden wiederholt, bis sich das Rahmenmodell als anwendbar für alle vier Fachdisziplinen erwies. Ergebnisse Im vorliegenden Rahmenmodell ist die Entwicklung professioneller Wahrnehmung durch videobasierte Lehr-Lernszenarien das zentrale Anliegen. Es werden verschiedene Stakeholder definiert, die am Prozess beteiligt sind, darunter Hochschullehrende, Feldexpertinnen und Studierende. Während Hochschullehrende dafür verantwortlich sind, durch hochwertige Lehr-Lernaktivitäten eine adäquate Förderumgebung zu schaffen (Kollar & Fischer, 2019), können Berufsfeldexpertinnen Hochschullehrenden authentische Einblicke ins Berufsfeld vermitteln und bei der Festlegung von Indikatoren für professionelle Wahrnehmung unterstützen (Gegenfurtner & Seppänen, 2013). Die Teilnahme von Studierenden an der Entwicklung der Videoszenarien kann mit großen Lernpotenzialen einhergehen (Koehler et al., 2004). Basierend auf Angebots-Nutzen-Modellen (Sailer et al., 2021), wird die Implementierung von Lehr-Lernszenarien in vier Phasen unterteilt: (Re-)Design, Lehren, Evaluieren und Teilen. Während des Designs werden relevante Inhalte identifiziert, Lernziele festgelegt und Videos ausgewählt oder erstellt (Blomberg et al., 2013). Beim Lehren können basierend auf dem ICAP-Modell (Chi & Wylie, 2014) vier unterschiedlich hochwertige Lernaktivitätsmodi bei Studierenden angeregt werden. Während die passive Auseinandersetzung mit einem Video (d.h. Anschauen) mit wenig Potenzialen zur Entwicklung von professioneller Wahrnehmung einhergeht, kann die aktive (z.B. Beantworten von MC-Fragen), gefolgt von der konstruktiven (z.B. Videoanalyse basierend auf Prompts) und interaktiven Auseinandersetzung (z.B. Diskussion in Kleingruppen basierend auf Prompts) den Lernerfolg zunehmend positiv beeinflussen. In der Evaluationsphase kann die Entwicklung professioneller Wahrnehmung mithilfe von standardisierten Fragebögen (Seidel & Stürmer, 2014), Feedbackrunden und Beobachtungsprotokollen (Chi et al., 2018) bewertet werden. Schließlich erfolgt in der Teilen-Phase die strukturierte Beschreibung und Verbreitung der Lehr-Lernszenarien unter Hochschullehrerinnen und -institutionen durch Konferenzen, Publikationen und OER-Plattformen (z.B. OER Commons). Zur Umsetzung dieser Phasen ist zentral, dass die Stakeholder, insbesondere Hochschullehrende, über relevantes Fachwissen, pädagogisches Wissen, technologisches Wissen und integrierte Wissensfacetten (d.h. technologisch-pädagogischem Fachwissen) verfügen. Um den interdisziplinären Charakter des Rahmenmodells zu verdeutlichen, werden Beispiele aus vier verschiedenen Disziplinen vorgestellt. Diskussion Das Rahmenmodell kann durch die Integration dreier zentraler Forschungsstränge einen umfassenden Leitfaden für die videobasierten Hochschullehre in verschiedenen Disziplinen bieten. Auch wenn das Modell aktuell nur als theoretisches Konstrukt existiert, bewährte es sich bei der Umsetzung einzelner Lehr-Lernszenarien. Dennoch steht eine systematische experimentelle Forschung zur Umsetzung der einzelnen Phasen aus. Poster Entwicklung einer Wissenslandkarte als Ausgangspunkt von Unterrichtsplanung Marcus Schiolko, Mathias Ropohl Universität Duisburg-Essen, Deutschland Theoretischer Hintergrund und Fragestellung* Bisherige Studien zur professionellen Kompetenz von angehenden Lehrkräften haben sich hauptsächlich auf die Unterrichtsdurchführung konzentriert, während die Unterrichtsplanung von angehenden Lehrkräfte in der empirischen Bildungsforschung bisher weniger betont wurde (König & Rothland, 2022; Wernke & Zierer, 2017). Trotzdem hat Unterrichtsplanung durch die gedankliche Antizipation des durchzuführenden Unterrichts eine große Einflussnahme auf die Unterrichtsqualität und den -erfolg (Tebrügge, 2001; Wengert, 1989). Daher ist das Planen von Unterricht bereits im Studium Teil des Curriculums (KMK, 2004, 2019). Angehenden Lehrkräften gelingt es selten im Planungsprozess Verknüpfungen zwischen den verschiedenen Planungsentscheidungen und damit inhaltliche Kohärenz herzustellen (Gassmann, 2013). Die Planungen zeichnen sich durch lineare nicht zusammenhängende Planungsentscheidungen aus (Westerman, 1991). In Bezug auf den Fachinhalt zeigt sich in den Unterrichtsplanungen, dass die zentralen Ideen bzw. Konzepte eines Themas selten mit anderen zentralen Ideen verknüpft werden (Park & Chen, 2012), weil in der Sicherungsphase der Fokus auf eine Fixierung der erarbeiteten Ideen und Konzepten liegt (Beyer & Davis, 2012; Weitzel & Blank, 2020). Für den amerikanischen Raum wurden visuelle Repräsentationen fachinhaltlicher Konzepte, sogenannte Wissenslandkarten, entworfen. Diese ermöglichen eine visuelle Darstellung zum sachlogischen Aufbau von Konzepten sowie deren Weiterentwicklung und Fortführung. Ziel ist es, Lehrkräfte beim Verständnis von grundlegenden naturwissenschaftlichen Konzepten zu stärken, Verknüpfungen zu verdeutlichen, das benötigte Vorwissen der Lernenden abzuleiten und vorauszublicken, welches Wissen prospektiv thematisiert wird (AAAS, 2001, 2007). Die Wissenslandkarten aus dem amerikanischen Raum sind allerdings zu inkonsistent zu den nationalen Bildungsstandards (KMK, 2020), lassen sich aber für den deutschsprachigen Raum adaptieren, da die Bildungsziele der naturwissenschaftlichen Fächer anhand von einzelnen Basiskonzepten organisiert werden (Celik, 2022, Demuth et al., 2005). Wissenslandkarten bieten somit als Werkzeug in der Lehrkräftebildung das noch ungenutzte Potential die Unterrichtsplanung von angehenden Lehrkräften vorzuentlasten, indem sie mithilfe der Wissenslandkarte im Planungsprozess qualifiziert werden, sowohl einzelne Planungsentscheidungen als auch Fachinhalte zu verknüpfen. Daher bedarf es zunächst der validen Erstellung einer Wissenslandkarte, die dann als Werkzeug in der Unterrichtsplanung eingesetzt werden kann. Vor diesem Hintergrund lautet die Forschungsfrage, inwiefern wird die Darstellung eines naturwissenschaftlichen Basiskonzepts mithilfe einer Wissenslandkarte von Expert:innen als valide eingeschätzt. Methode Aufbauend auf einer Literaturrecherche und der Erstellung einer Wissenslandkarte wurde eine schriftliche anonyme online Experten:innenbefragung (N = 13) durchgeführt. Die Expertengruppe setzte sich aus Professoren:innen, Fachleiter:innen und Lehrkräften mit mehrjähriger Berufserfahrung zusammen. Für den quantitativen Ansatz wurde zum einen das Übereinstimmungsmaß Fleiss-Kappa für die Antworten der Expert:innen herangezogen und zum anderen zur Beurteilung der Güte eine Grenzwertbestimmung durchgeführt. Die qualitative Auswertung der schriftlichen Rückmeldungen erfolgte mittels qualitativer Inhaltsanalyse. Das Kategoriensystem für die inhaltliche Analyse wurde in einem induktiven Verfahren erstellt. Als Übereinstimmungsmaß für die Kodierung wird die Interrater-Reliabilität Cohens Kappa (κ) herangezogen. Ergebnisse und Diskussion Die berechneten Fleiss-Kappa-Werte über alle Antworten waren sowohl für die Gesamtstichprobe (κ = .06) als auch für die einzelnen Expertengruppen (-.03 ≤ κ ≤ .14) gering bis mangelhaft und damit nicht zufriedenstellend. Dies ist mit Blick auf die Forschungsfrage allerdings kein Indiz für keine Validität. Die berechneten Kappa-Werte zur Überprüfung der Interrater-Reliabilität zur inhaltlichen Analyse (.78 ≤ κ ≤ .98) weisen zufriedenstellende Ergebnisse auf. Ferner zeigen die qualitativen Rückmeldungen zur Eignung der Fachinhalte für das Basiskonzept eine hohe Akzeptanz, da hauptsächlich einzelne Begrifflichkeiten oder Formulierungen von den Expert:innen angemerkt wurden. Insbesondere erscheinen die Verknüpfungen zwischen den einzelnen Fachinhalten unterschiedlichen Vorstellungen zu unterliegen und ein Konsens über viele Expert:innen hinweg sich daher als schwierig zu gestalten. Dennoch zeigen die Rückmeldungen des Expertenratings, dass sich die curricularen Vorgaben für ein naturwissenschaftliches Basiskonzept mithilfe einer Wissenslandkarte mit gewissen Einschränkungen abbilden lassen. Im Folgenden wird die Wissenslandkarte mit passenden digitalen Lehr-Lern-Materialen erweitert. Dieses kombinierte Angebot wird in einer Interventionsstudie eingesetzt, um zu überprüfen, ob die schriftlichen Planungen kohärenter werden. Poster Was und wie lernen japanischen Lehrkräfte mithilfe der Lesson Study Methode? Julian Bucher, Klara Kager, Miriam Vock Universität Potsdam, Deutschland Theoretischer Hintergrund Kurzgesagt geht es bei einer Lesson Study darum einen gemeinsam geplanten Unterricht im Team zu beobachten, zu analysieren und anschließend diesen Unterricht ausgehend von den Bedürfnissen der Schülerinnen und Schüler zu reflektieren und weiterzuentwickeln (Lewis et al., 2019). Dieser ursprünglich aus Japan stammende Ansatz der Lehrkräfteweiterbildung hat sich nicht zu Letzt auf Grund Japans guten Ergebnissen bei TIMSS (1995) und PISA (2000), seit den 2000er-Jahren weltweit verbreitet (Kim et al., 2021). Dabei wurde stets auch versucht Lesson Study an die Gegebenheiten vor Ort anzupassen und lokale Besonderheiten zu berücksichtigen (Stigler & Hiebert, 2016). Da über die japanische Praxis international jedoch kaum publiziert wird, ist nicht klar, wie stark die Methode bei der Rezeption außerhalb Japans verändert wurde. Als ein zentrales Merkmal von Lesson Study wird in der internationalen Rezeption stets die intensive Zusammenarbeit der Lehrkräfte betont (Lewis et al., 2019; Seleznyov, 2018). Obwohl Lesson Study in Japan seit Jahrzehnten ein fester Bestandteil des Schulsystems ist (Lewis & Perry, 2013), sieht die Mehrheit der japanischen Schulleitungen der TALIS Studie (2018) zufolge dennoch einen Bedarf, die Zusammenarbeit von Lehrkräften zu verbessern (OECD, 2019). Dies führt zu folgenden Fragestellungen: 1) Wie beschreiben japanischen Lehrkräfte die Anwendung der Lesson Study Methode in ihrer Praxis? Inwiefern weichen diese Beschreibungen von der internationalen Rezeption ab? 2) Inwiefern nehmen Lehrkräfte in Japan Lesson Study tatsächlich als einen kooperativen Ansatz zur Weiterentwicklung ihrer eigenen Professionalität wahr? 2) Was und wie lernen sie durch die Anwendung von Lesson Study an ihrer Schule? Sollte Lesson Study in Schulen bei der eigenen Weiterbildung nur eine untergeordnete Rolle spielen, ist darüber hinaus zu klären, wo und in welcher Form professionelle Weiterbildung und professionelles Lernen stattdessen stattfindet. Dies ist insbesondere vor dem Hintergrund interessant, da äußere strukturelle Rahmenbedingungen (z.B. zeitliche oder personelle Ressourcen) oft als elementar für den Erfolg von Lesson Study angesehen werden (Jakobeit et al., 2021), in Deutschland jedoch häufig nicht gegeben sind. Methode Zur Beantwortung dieser Fragestellungen wurden im Sommer 2023 semistrukturierte Interviews mit N = 15 japanischen Lehrkräften geführt. Bei der Zusammenstellung der Stichprobe wurde darauf geachtet, eine möglichst große Spannbreite an Merkmalen (Alter, Geschlecht, Schulart, etc.) abzudecken. Die Datenanalyse wurde in Form einer thematischen Analyse nach Braun und Clarke (2006) durchgeführt. Insbesondere wurden alle Audioaufnahmen transkribiert, in-vivo kodiert, kategorisiert und schließlich Themen zugewiesen wurden. Die Analyse konzentrierte sich dabei auf die Einstellungen, Haltungen und Erfahrungen der Lehrkräfte mit Lesson Study an ihren Schulen einerseits und andererseits auf die von den Lehrkräften beschriebene Situation, in denen sie selbst lernten und die aus ihrer Sicht wichtig für ihre persönliche Entwicklung waren. Ergebnisse Es zeigt sich, dass alle befragten Lehrkräfte die Lesson Study Methode als (teilweise) gewinnbringend für ihre persönliche Weiterentwicklung wahrnehmen und dabei insbesondere die Möglichkeit den Unterricht von anderen Lehrkräften zu beobachten schätzen. Allerdings wurde auch deutlich, dass freiwillige Formate außerhalb der eigenen Schule bevorzugt werden und die Lesson Study Aktivitäten in der Schule selbst nicht immer als positiv wahrgenommen werden. Hierbei zeigte sich auch, dass gerade in der Schule selbst häufig kein gemeinsames Planen des Unterrichts stattfindet und die zu behandelten Themen oft von der Schulleitung oder übergeordneten Behörden vorgegeben werden. Poster Lernende im Mathematikunterricht kognitiv aktivieren - Erfahrungen mit dem "building thinking classrooms" Ansatz Felix Kapp¹, Björn Beling², Ulrich Kortenkamp³ ¹IPN - Leibniz Institut für die Pädagogik der Naturwissenschaften und Mathematik, Deutschland; ²Goethe Gymnasium Lichterfelde, Berlin; ³Universität Potsdam Einleitung: Um erkenntnisreiche Lernprozesse im Mathematikunterricht zu initiieren, sind kognitiv anspruchsvolle und gut strukturierte Lernmöglichkeiten erforderlich, welche begleitet werden durch individuelles Feedback, adaptive Anleitung und ein Monitoring des Lernprozesses (Baumert et al., 2010). Die 14 Lehrpraktiken, welche Liljedahl (2020) im "building-thinking-classrooms" (BTC) Ansatz postuliert, greifen diese Erkenntnisse auf und versuchen durch eine Neugestaltung des Mathematikunterrichts die Unterrichtsqualität zu steigern. Die Verwendung von anspruchsvollen Aufgaben ("thinking-tasks"), die Arbeit in zufällig zusammengesetzten Gruppen und die Reflektion des eigenen Fortschritts (mit "check-your-understanding-questions") regt mehr Engagement und eine tiefere Elaboration an (Liljedahl, 2020). Das Ziel der vorliegenden Studie ist es, die Effekte einer Umstellung des Mathematikunterrichts im Sinne des BTC-Ansatzes zu untersuchen und einen Beitrag zur Beantwortung folgender Forschungsfragen zu leisten: 1) Wie nehmen Schülerinnen und Schüler den Unterricht im Format "building-thinking-classrooms" hinsichtlich ihrer kognitiven Aktivierung wahr? 2) Welche Aspekte werden als herausfordernd oder besonders bemerkenswert berichtet? Methode: Neunundachtzig Lernende (42 Mädchen, 41 Jungen, 5 nicht-binär, 1 fehlender Wert, M = 15.04 Jahre, SD = 1.63) aus der 9. (n = 56) und 12. Klasse (n = 33) einer deutschen Schule nahmen an der Studie teil, in welcher alle Lernenden 90 Minuten im BTC-Ansatz unterrichtet wurden und im Anschluss daran zu ihrer Wahrnehmung des Unterrichts im Vergleich zu traditionellem Unterricht befragt wurden. Der Unterricht begann mit der Präsentation der sogenannten "thinking-task" vor der ganzen Klasse. Im Anschluss daran wurden die Lernenden zufällig in Gruppen zu je drei Personen eingeteilt und begannen auf einer eigenen Tafel zu arbeiten. Die Lehrkraft beobachtete die Arbeit in den Gruppen, leistete Unterstützung bei Bedarf und stellte weitere Aufgaben, wenn die Gruppe die erste Aufgabe erfolgreich gelöst hatte. Dabei bestand das Feedback der Lehrkraft aus weiterführenden Hinweisen, welche zum Ziel hatten den Flow innerhalb der Gruppe aufrecht zu erhalten. In den letzten 15 Minuten wurden die Inhalte der Lerneinheit an einem Gruppenbeispiel zusammengefasst gefolgt von einer Phase, in der die Lernenden individuelle Notizen zu den wichtigsten Inhalten machten. Die Nachbefragung erfasste die kognitive Aktivierung (7 Items aus Helmke & Helmke, 2014, z.B. "Inwieweit trifft folgende Aussage zu: Ich fasse den Lerninhalt mit eigenen Worten zusammen." von "nie(1)" bis "oft(4)") sowie zwei Items zum Lernen durch Nachahmen des Lehrers (z.B."Ich lerne Mathematik, indem ich den Erklärungen des Lehrers folge." von "nie(1)" bis "oft(4)"). Die Lernenden schätzten dabei anhand der 9 Fragen sowohl die Unterrichtsstunde im BTC-Format ein als auch traditionellen Mathematikunterricht. Eine weitere Frage erfasste, was im zurückliegenden 90-minütigen Mathematikunterricht bemerkenswert war. Ergebnisse: Die beschriebene kognitive Aktivierung war signifikant höher (t(85) = -8.08, p < .001) im BTC-Format (MW=3.04, SD=.52) als beim traditionellen Mathematikunterricht (MW=2.4, SD=.49). Das Nachahmen wurde häufiger (t(87) = 4.99, p < .001) im traditionellen Mathematikunterricht berichtet (MW=3.45, SD=.60) als im BTC-Format (MW=2.94, SD=.79). Vierzig Freitextantworten benannten einen "positiven Aspekt der Gruppenarbeit". Darüber hinaus verwiesen mehrere Kommentare darauf, dass es im BTC-Format "mehr Spaß mache", "das Thema besser verstanden werde" und "es einfacher sei, innerhalb der Gruppe Fragen zu stellen". Sechs Kommentare enthielten kritische Aspekte: diese enthielten die "Gruppenzusammensetzungen, in denen Mitglieder der Gruppe überhaupt nichts beitrugen", die "Herausforderung, Aufgaben ohne die notwendigen Vorkenntnisse zu bearbeiten", die "Schwierigkeit, die eigene Kompetenz unabhängig von der Gruppenleistung zu beurteilen" sowie das "Problem der Vorbereitung auf die Prüfung, weil im Unterricht keine Notizen gemacht wurden". Fazit: In der vorliegenden Untersuchung berichteten Lernende, dass Mathematikunterricht entlang der 14 Lehrpraktiken des BTC-Ansatzes als kognitiv aktivierender wahrgenommen wird als traditioneller Mathematikunterricht. Das Format wird als anspruchsvoll und motivierend beschrieben, kritisch wird auf Herausforderungen der Methode hingewiesen: die Gruppenzusammensetzung, das Verfassen von Notizen am Ende der Unterrichtseinheiten sowie die Berücksichtigung von Vorkenntnissen müssen beim "building-thinking-classrooms" Ansatz bedacht werden. Zukünftige Untersuchungen sollten die motivationalen und kognitiven Effekte des BTC-Ansatzes im Vergleich zu einer Kontrollgruppe untersuchen. Poster Zum Scheitern verurteilt? Die Rolle individueller Eingangsvoraussetzungen beim Abbruch des Lehramtsstudiums: Erlebte Integration und die Nutzung von Lerngelegenheiten David Simon¹, Jürgen Schneider¹, Mareike Kunter^1,2 ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ²Goethe-Universität Frankfurt am Main, Deutschland Die vorliegende Studie befindet sich in Bearbeitung und will bedeutsame Profile innerhalb einer Population Lehramtsstudierender in Bezug auf individuelle Eigenschaften vor Eintritt in das Studium beschreiben (Eingangsvoraussetzungen). Wir nehmen an, dass sich, in Einklang mit bisheriger Forschung, mindestens ein Risikoprofil findet, welches zu einem späteren Zeitpunkt eine höhere Studienabbruchquote zeigt. Dieser Beitrag beschäftigt sich mit den Gründen für diesen Zusammenhang. Theoretischer Hintergrund Wir beziehen uns auf zwei theoretische Konzepte: Das Integrationsmodell von Tinto (1975) und das Angebot-Nutzungs-Modell (z.B., Helmke, 2012). Während das Integrationsmodell die erfolgslose Integration in das akademische und soziale System innerhalb der Hochschule als Erklärung für den Studienabbruch sieht, dient das Angebot-Nutzungs-Modell der Erklärung von Lehr- und Lernprozessen. Im Fokus steht dabei die Vorhersage vornehmlich wünschenswerter Lernergebnisse, wie formaler Noten oder der Entwicklung professioneller Kompetenzen in der Lehramtsausbildung (Möller et al., 2023; Kunter et al., 2013). Der Abbruch des Studiums kann als negativ gewendetes Lernergebnis verstanden werden (vgl. Bernholt et al., 2023). Die zentrale Annahme solcher Modelle ist es, dass eine Lernumgebung als Angebot verstanden wird, in der Studienerfolg kein passiver Prozess ist, sondern von der individuellen Nutzung von Lerngelegenheiten durch die Studierenden abhängt (Helmke, 2012). Als Gründe sowohl für Unterschiede in der Nutzung wie auch für Unterschiede in der akademischen und sozialen Integration zwischen Personen, werden individuelle Unterschiede innerhalb der Voraussetzungen Lernender gesehen (Kunter et al., 2013; Tinto, 1975). Allgemeine Untersuchungen der Ursachen des Studienabbruchs unterstreichen die Relevanz individueller Eingangsvoraussetzungen (vgl. Heublein et al., 2017). Oft werden diese Merkmale einzeln betrachtet. Wir zielen darauf ab, Profile zu beschreiben, die diese Eingangsvoraussetzungen kombinieren. Nachteile sind bei formal geringerem sozioökonomischen Status, Migrationshintergrund, nicht-gymnasialer Hochschulzulassungsberechtigung, geringeren vorakademischen Leistungen, einer vorherigen Berufsausbildung, einer niedrigeren Ausprägung des Persönlichkeitsmerkmals Gewissenhaftigkeit und einer vornehmlich extrinsischen Motivation für die Wahl des Lehramtsstudiums zu erwarten (vgl. Isleib et al., 2019). Hinsichtlich der Prozesse innerhalb des Studiums, die zum tatsächlichen Studienabbruch führen, folgen wir der Argumentation von Wolf (2019), dass Mitglieder eines Risikoprofils, die eine höhere Intention das Studium abzubrechen berichteten, vorhandene Lerngelegenheiten möglicherweise nicht so produktiv nutzten wie ihre Mitstudierenden, was wiederum ihre Lernergebnisse negativ beeinflusste (Wolf, 2019, S. 130). In Anlehnung an die Ausführungen von Tinto (1975) gehen wir außerdem davon aus, dass es diesen Studierenden nicht gelingt, sich in das akademische und soziale System der Hochschule zu integrieren, was einen Studienabbruch begünstigt und darüber hinaus die Zielverpflichtung hemmt. Wir nehmen an, dass sich Letzteres in einer ungünstigen Nutzung der verfügbaren Lerngelegenheiten zeigt, operationalisiert durch die aktive Zeit in formellen Lerngelegenheiten innerhalb und informellen Lerngelegenheiten außerhalb der Hochschule sowie der wahrgenommene Praxisorientierung des Studiums. Fragestellung Wir behandeln zwei Forschungsfragen: Forschungsfrage 1: Lassen sich innerhalbe einer Population Lehramtsstudierender statistisch unterscheidbare Gruppen auf Basis ihrer individuellen Eingangsvoraussetzung bilden, von denen mindestens eine als Risikoprofil eingestuft werden kann? Forschungsfrage 2: Zeigen Mitglieder dieses Risikoprofils eine geringere soziale und akademische Integration und führt diese wiederum zu einer unproduktiveren Nutzung von Lerngelegenheiten, was einen höheren Anteil an Studierenden, die das Lehramtsstudium abbrechen bedingt? Methode Unsere Analysen werden auf Daten des Lehramtsstudierenden-Panels als Teil der Startkohorte Studierende (SC5) des Nationalen Bildungspanels (NEPS; Blossfeld & Roßbach, 2019) basieren. Es ermöglicht uns, die Fragestellungen in einem längsschnittlichen Design zu untersuchen. Zur Beantwortung der Forschungsfrage 1 werden wir eine Latente Klassenanalyse auf Basis der oben genannten Eingangsvoraussetzungen rechnen. Zur Beantwortung der Forschungsfrage 2 werden wir mehrere Strukturgleichungsmodelle spezifizieren. Dabei überprüfen wir die Vorhersagen des Integrationsmodells und des Angebot-Nutzungs-Modells zunächst separat. Anschließend werden wir beide Modellannahmen im Sinne der Forschungsfrage 2 kombinieren. Ergebnisse Die Studie befindet sich parallel zu dieser Einreichung in der Präregistrierung. Die Ergebnisse werden zum Konferenzzeitpunkt vorliegen. Wir möchten sie gerne im Rahmen der GEBF 2024 vorstellen und diskutieren. Poster Faktoren, die das derzeitige von einem idealen inklusiven Schulsystem unterscheiden: Perspektiven von Lehrkräften vor und nach der Covid19-Pandemie Melanie Basten¹, Fabian Schumacher² ¹Universität Trier, Deutschland; ²Universität Bielefeld, Deutschland Theoretischer Hintergrund Lehrkräfte stehen zahlreichen Herausforderungen gegenüber, um Schüler:innen auf die Arbeits- und Lebenswelt vorzubereiten (Böttinger & Schulz, 2023). U.a. müssen Lehrkräfte inklusiven Unterricht gestalten (KMK, 2011), aber auch digitale Medien verwenden und Medienkompetenz vermitteln (KMK, 2017), um allen Schüler:innen die Partizipation an der Gestaltung der Gesellschaft zu ermöglichen. In der Zeit der Corona-Pandemie musste Distanzunterricht durchgeführt werden, was einen hohen Zeit- und Handlungsdruck auf die Lehrkräfte ausübte (Forell et al., 2021). Gleichzeitig blieb die Forderung, heterogene Schülerschaften zu unterrichten und auch marginalisierten Gruppen zu berücksichtigen, bestehen. Lehrkräfte haben beiden bildungspolitischen Anforderungen gegenüber Vorbehalte, die Umsetzung von Bildungsinnovationen hängt aber maßgeblich von ihnen ab (Bosse et al., 2017; Nistor, 2018). Gleichzeitig haben auch systemische Bedingungen einen Einfluss darauf, wie gut sich die Forderungen nach inklusivem und digitalem Unterricht umsetzen lassen (Hartung et al., 2021). Fragestellung In der aktuellen Studie soll untersucht werden, was sich aus Sicht von Lehrkräften systemisch ändern müsste, um ein funktionierendes inklusives Schulsystem zu ermöglichen. Durch die Corona-Pandemie wurde das inklusive Unterrichten vor weitere Herausforderungen gestellt, da Unterricht nun teilweise auf digitale Medien angewiesen war. Daher soll analysiert werden, ob sich die berichteten Änderungsbedarfe in einer Befragung kurz nach der Pandemie insbesondere in dieser Hinsicht verändert oder erweitert haben. Methode Stichprobe und Untersuchungsdesign Für die Untersuchung wurden bundesweit Lehrer:innen aller Schulformen rekrutiert. Die Befragung fand anonym und online über Unipark statt. Bei der Befragung vor der Corona-Pandemie 2019/20 beantworteten 115, bei der Befragung nach der Corona-Pandemie 2022 87 Lehrkräfte die Fragen zu den systemischen Änderungsbedarfen. Die Stichprobenzusammensetzungen stellen sich folgendermaßen dar: 2020 mit 16,9 Jahren Berufserfahrung, Geschlecht 25,2% männlich, 60,9% weiblich, 39% Gymnasium, 20% Grundschule, 19% Förderschule, 16,5% Gesamtschule, je ca. 1% Hauptschule, Realschule oder andere Schulformen; 2022 mit 16,4 Jahren Berufserfahrung, Geschlecht 18,4% männlich, 71,3% weiblich, 51% Grundschule, 33% Gymnasium, 7% Gesamtschule, 6% Realschule, je 1% Sekundarschule, Förderschule oder andere Schulformen. Datenerhebung Die Datenerhebung erfolgte schriftlich mit einem Online-Fragebogen. 2019/2020 und 2022 wurde die Frage gestellt: „Welche Kriterien unterscheiden Ihrer Meinung nach das ideale vom derzeitigen Schulsystem?“ 2022 wurde als zweite Frage gestellt: „Wenn Sie nun an die Corona-Zeit denken, fallen Ihnen dann noch weitere Kriterien ein, in denen sich das ideale vom derzeitigen Schulsystem unterscheidet?“ Datenanalyse Mithilfe der qualitativen Inhaltsanalyse nach Mayring (2016) wurden die schriftlichen Aussagen der Lehrkräfte zusammenfassend kategorisiert. Die Interrater-Übereinstimmungen betrugen K = .92 (2020) und K = .97 (2022) (Wirtz & Caspar, 2002). Ergebnisse und ihre Bedeutung Die Lehrkräfte können sich insgesamt grundsätzlich vorstellen, inklusiven Unterricht zu gestalten, halten aber die systemischen Voraussetzungen für nicht ausreichend, um dieser Anforderung nachzukommen. Sowohl 2020 als auch 2022 waren die am häufigsten genannten Unterschiede zwischen dem derzeitigen und einem idealen Schulsystem der Personalschlüssel (2020: 19% der Aussagen, 2022: 17% der Aussagen), die Größe der Lerngruppe (2020: 11%, 2022: 14%), (multiprofessionelle) Kooperationen (2020: 4%, 2022: 12%), zeitliche Kapazitäten (2020: 5%, 2022: 7%), räumliche Gegebenheiten (2020: 8%, 2022: 5%) und Entlastung (2020: 5%, 2022: 4%). Die größten systemischen Probleme bei der Umsetzung eines inklusiven Schulsystems werden von den Lehrkräften auch nach der Pandemie noch genauso wahrgenommen wie davor. Auf die Digitalisierung wurde 2022 in nur 9 Aussagen bei der ersten Frage Bezug genommen, 64 Aussagen wurden erst auf Nachfrage mit Verweis auf die Pandemie ergänzt. Bei der Digitalisierung wurden als häufigste Probleme die digitale Infrastruktur (24% der Aussagen) und die digitale Weiterbildung (5%) benannt. Bei der Befragung 2020 wurden keine Aussagen zur Digitalisierung getroffen, aber auch 2022 zeigte sich, dass die Digitalisierung nicht mit einem inklusiven Schulsystem verknüpft wahrgenommen wird. Vielmehr wird dieses Problem erst auf Nachfrage einzeln benannt, obwohl die Verknüpfung beider Themen (Diklusion) einen Mehrwert für die Teilhabe aller hat (Böttinger & Schulz, 2023). Poster „Was Du glaubst, ist was Du tust?“ Diskrepanz zwischen Einstellungen von Lehrerinnen und deren Handeln im Bereich Klassenführung Julia Kienzler, Thamar Voss Universität Freiburg, Deutschland Theoretischer Hintergrund* Neben der kognitiven Aktivierung und der konstruktiven Unterstützung gilt ein störungspräventives Klassenmanagement als eine Basisdimension guten Unterrichts (z.B. Praetorius et al., 2018). Zur Minimierung und Prävention von Unterrichtsstörungen gilt die Anwendung der Prinzipien des operanten Konditionierens als wichtiges Mittel (Marzano et al., 2009). Trotz positiver Forschungsbefunde bezüglich der Wirksamkeit von Verstärkungs- und Bestrafungsstrategien zeigen (angehende) Lehrkräften häufig eine ablehnende Haltung gegenüber den Prinzipien operanten Konditionierens (Ahmad et al., 2022; Kienzler et al., 2023). Dabei reichen die Lehrkrafteinstellungen von einer geringen Wirksamkeit der Strategien bis hin zur Überzeugung eines schädlichen Einflusses der Prinzipien auf die Schülerinnen, im Besonderen für Bestrafung (Dovey et al.,2017; Maag, 2001). Betrachtet man jedoch das Lehrerinnenverhalten im Unterricht zeigt sich, dass Verstärkungs- und Bestrafungsstrategien trotzdem gängige Maßnahme von Lehrerinnen zur Vermeidung und Eindämmung unerwünschten Verhaltens darstellen (Little et al., 2003; Marzano et al., 2009). Wenden Lehrerinnen dauerhaft Unterrichtspraktiken an, deren Einsatz sie nach eigenen Angaben nicht gutheißen, kann dies zu höherem Stresserleben und weniger Zufriedenheit im Beruf führen (Greene et al., 2008). *Fragestellung* Vor diesem Hintergrund untersuchen wir, ob sich diese Diskrepanz zwischen den Einstellungen (angehender) Lehrerinnen zu Verstärkung und Bestrafung im Unterricht und der selbst berichteten Wahrscheinlichkeit entsprechende Strategien anzuwenden, abbilden lässt. Auf der Basis der theory of planned behavior* (Ajzen, 1991) und dem Einstellungs-Verhaltensmodell MODE (Olsen et al., 2008) untersuchen wir zudem, mit welchen individuellen und kontextbezogenen Faktoren das Ausmaß der Diskrepanz in Zusammenhang steht. Wir fokussieren dabei das Stresserleben der (angehenden) Lehrerinnen, die Berufserfahrung, die wahrgenommen Überzeugungen der sozialen Bezugsgruppe (subjektive Norm), die Ergebniserwartung bezüglich der Störungsprävention sowie das Wissen über die Prinzipien des operanten Konditionierens. Methode* Angestrebt ist, dass an der laufenden Studie 30 Lehramtsstudierende und 30 Lehrerinnen teilnehmen. Alle Teilnehmenden lesen fünf kurze Vignetten fiktiver Unterrichtszenarien, in denen störendes Verhalten von Schülerinnen beschrieben wird. Nach der ersten Vignette geben die Teilnehmenden in einem offenen Antwortformat an, welche Strategien sie als Lehrerin in dieser Situation anwenden und wie sie die Strategien in Rangfolge nach aufsteigender Wahrscheinlichkeit der Anwendung bringen würden. Nach den vier weiteren Vignetten entscheiden die Teilnehmenden in einem forced-choice* Format mit Zeitbeschränkung, zwischen zwei kontrastierenden Handlungsoptionen, die sich verschiedenen Prinzipien des operanten Konditionierens zuordnen lassen. Anschließend beantworteten die (angehenden) Lehrerinnen Fragen zu ihrem Stresserleben im Umgang mit Unterrichtsstörungen, ihrer Ergebniserwartung bezogen auf die Anwendung von Strategien des Classroom Managements, ihren Einstellungen gegenüber operantem Konditionieren, sowie zu den vermuteten Erwartungen ihrer Bezugsgruppe (Schulleitung, Kolleginnen, Kommilitoninnen) an das eigene Verhalten. Zudem wird das Wissen zu den Prinzipien des Operanten Konditionierens mittels eines validierten Kontrollitems (Kienzler et al., 2023) erfasst. Erwartete Ergebnisse* Die Daten werden zum Zeitpunkt der GEBF ausgewertet sein. Unter Verwendung etablierter Maße der Metakognitionsforschung (bias, accuracy, z.B. Schraw, 2009) erwarten wir eine statistisch bedeutsame Abweichung zwischen der Einstellung der Lehrkräfte zu Verstärkung und Bestrafung im Unterricht und der selbst berichteten Wahrscheinlichkeit entsprechende Strategien auszuüben. Dabei gehen wir von einer größeren Abweichung für Bestrafung als für Verstärkung aus. Wir erwarten ebenfalls eine größere Abweichung, wenn die Entscheidung über den Einsatz von Handlungsstrategien unter Zeitdruck getroffen wird als wenn eine reflektiertere Entscheidung vorliegt. Weiterhin analysieren wir, ob die Ausprägung der Abweichungen zwischen Überzeugung und Verhalten mit individuellen und kontextbezogenen Faktoren zusammenhängt. Wir nehmen an, dass die Diskrepanz… größer ist bei hohem Stresserleben in Störungssituationen, geringer ist bei positiver Ergebniserwartung hinsichtlich des Einsatzes der geplanten Strategie, geringer ist bei höherem Wissen über operantes Konditionieren, geringer ist bei mehr Berufserfahrung, geringer ist, wenn die Einstellungen der Lehrpersonen mit denen der sozialen Bezugsgruppe übereinstimmen. Implikationen der Befunde für die Lehrerinnenbildung werden bei der Tagung diskutiert. Poster Emotionen beim Lernen mit Videos – Wie Freude und Ärger sowie die beobachtete Unterrichtsqualität von Videoclips die Videoanalyse von Lehramtsstudierenden beeinflussen Isabell Tucholka¹, Bernadette Gold² ¹Universität Erfurt, Deutschland; ²TU Dortmund, Deutschland Theoretischer Hintergrund In der Lehrkräftebildung werden immer häufiger Videoanalysen eingesetzt, um die professionelle Unterrichtswahrnehmung der Studierenden zu fördern (Gaudin & Chaliès, 2015, König et al., 2022; Santagata et al., 2021), d. h. ihre Fähigkeit, relevante Unterrichtssituationen zu erkennen* und wissensbasiert zu interpretieren (Sherin, 2007) sowie auf dieser Grundlage mögliche Handlungsalternativen abzuleiten (Stahnke & Blömeke, 2021). Neben kognitiven Prozessen kann das Beobachten und Analysieren von Videos allerdings auch emotionale Reaktionen auslösen (Chan et al., 2018; Kleinknecht & Schneider, 2013). Während Studierende und auch praktizierende Lehrkräfte bei der Videoarbeit überwiegend Freude zu empfinden scheinen, gibt es Hinweise darauf, dass das Empfinden positiver und negativer Emotionen auch teils damit zusammenhängt, inwiefern die beobachtete Unterrichtsqualität als effektiv eingeschätzt wird (Kleinknecht & Schneider, 2013; Tucholka & Gold, 2023). Hinsichtlich der Gestaltung videobasierter Lerngelegenheiten im Lehramtsstudium (z.B. Kang & van Es, 2019) wurden Emotionen bisher allerdings kaum bedacht. Emotionale Prozesse sind dabei eng mit kognitiven verknüpft (Fiedler & Beier, 2014; Forgas, 2023; Pekrun, 2018) und beeinflussen daher möglicherweise auch die Videoanalyse bzw. die professionelle Wahrnehmung. Freude geht tendenziell mit einem offeneren Denkstil und breiterer Aufmerksamkeit einher (Forgas, 2017; Schwarz, 2000), was das Erkennen relevanter Ereignisse und das Generieren von Alternativen begünstigen könnte, während negativer Affekt wie Ärger eher zu einem stärkeren Fokus auf Details führt (Moons & Mackie, 2007; Schwarz, 2000), was vorteilhaft für eine tiefgründigere wissensbasierte Interpretation wäre (Gold & Windscheid, 2020; Kleinknecht & Schneider, 2013). Fragestellung Trotz einem zunehmenden Fokus auf die optimale Gestaltung videobasierter Lernumgebungen (z.B. Kang & van Es, 2019) wurde die Rolle von Emotionen im Zusammenhang mit kognitiven Videoanalyseprozessen bisher kaum gezielt untersucht. Ziel unserer Studie ist es daher, den Einfluss von Emotionen (Ärger/Freude) sowie der im Video präsentierten Unterrichtsqualität am Beispiel der Klassenführung (effektiv/ineffektiv) auf die professionelle Wahrnehmung von Lehramtsstudierenden zu betrachten. Methodik An diesem Experiment im 2x3-Design (Klassenführungsqualität: effektiv/ineffektiv; induzierte Emotion: Freude/Ärger/Neutral) nahmen 183 Lehramtsstudierende im Rahmen von Klassenführungsseminaren teil (83.06% weiblich; M_Alter = 23.40, SD_Alter = 2.03; a-priori-Poweranalyse: ANOVA fixed effects, special, main effects and interaction; groups = 6, df = 2; f = .25, α = .05, power of .8: N = 158) und wurden randomisiert auf die sechs Bedingungen verteilt. Sie bearbeiteten einen Klassenführungswissenstest und erhielten gruppenabhängig eine standardisierte positive/negative Rückmeldung dazu, um Freude bzw. Ärger zu induzieren (bzw. keine Rückmeldung für neutrale Gruppen). Anschließend beobachteten sie ein Unterrichtsvideo, das überwiegend effektive bzw. ineffektive Klassenführungsqualität zeigte (basierend auf einem Expertenrating), und analysierten dieses in einer offenen Schreibaufgabe (basierend auf Gippert et al., 2022). Die Daten werden aktuell daraufhin kodiert, wie viele relevante Ereignisse erkannt, wie tiefgründig diese analysiert und wie viele Handlungsalternativen dazu generiert wurden. Die Auswertung wird voraussichtlich durch ANOVAs mit den Zwischensubjektfaktoren „induzierte Emotion“ und „Video“ erfolgen. Dabei wird auf potenzielle Kovariaten überprüft (z.B. Motivation, Need for Cognition). Ergebnisse Um die Wirksamkeit der Manipulation sicherzustellen, wurden die Studierenden vor und nach dem Beobachten des Videos nach ihrem aktuellen Befinden gefragt (8-stufige Likertskala: Ich freue/ärgere/langweile mich.). Eine MANOVA zum ersten Messzeitpunkt zeigte zunächst die erwartete Wirkung der Emotionsmanipulation (F(4, 346) = 48.34, p <.001, np² = .358). Entscheidender ist, dass diese Unterschiede im Freude- und Ärgerempfinden auch nach der Videobeobachtung noch signifikant waren (Freudeempfinden: (F(2, 172) = 18.58, p <.001, np² = .178), Ärgerempfinden: (F(2, 173) = 14.62, p <.001, np² = .145). Ebenso führte das Video mit effektiver Klassenführung wie erwartet zu signifikant mehr Freude (F(1, 172) = 6.37, p <.001, np² = .036) und weniger Ärger (F(1, 172) = 11.25, p <.001, np² = .061) als das Video mit ineffektiver Klassenführung, wenn auch mit kleineren Effektstärken. Ergebnisse zur dargestellten Fragestellung liegen aktuell noch nicht vor, werden aber im Poster präsentiert. Poster Pädagogische Diagnostik im Musikunterricht: Wie stark beeinflusst die Informationsbreite die Urteilsgenauigkeit angehender Musiklehrkräfte? Lena Samel¹, Friedrich Platz¹, Johannes Hasselhorn² ¹HMDK Stuttgart; ²FAU Erlangen-Nürnberg Die Pädagogische Diagnostik stellt einen zentralen Bestandteil des professionellen Lehrerhandelns dar (Hesse & Latzko, 2017) und umfasst alle formellen und informellen diagnostischen Tätigkeiten zur Informationsgewinnung über Schüler:innen und ihre Fertigkeitsentwicklung. Eine bisher etablierte Operationalisierung der diagnostischen Kompetenz ist die Urteilsgenauigkeit nach Schrader und Helmke (1987), die eine Unterteilung in Niveau-, Differenzierungs- und Vergleichskomponente vorschlagen. Inhaltlich handelt es sich um ein Maß der Übereinstimmung zwischen den lehrkräfteseitig antizipierten und in standardisierten Einzelerhebungssituationen empirisch erfassten Individualleistungen von Schüler:innen. Während für Kernfächer wie Mathematik oder (Fremd-)Sprachen bereits eine Vielzahl an Studien zur Urteilsgenauigkeit existieren (vgl. Urhahne & Wijnia, 2021; Südkamp et al., 2012), liegen für das Fach Musik bislang kaum Forschungsergebnisse vor. Dabei ist insbesondere die Diagnostik von musikpraktischen Leistungen mit besonderen Herausforderungen für die Musiklehrkräfte verbunden. Zum einen zeigt die musikpsychologische Forschung im außerschulischen Bereich, dass die ästhetische Urteilsbildung (i.d.R.) zu musikalischen Einzelbeiträgen – sogar von Expert:innen – mit einer geringen Homogenität einhergeht (u.a. Passarotto et al., 2023) und darüber hinaus das Ergebnis einer multifaktoriell, individuell gewichteten Entscheidungsfindung in sozialen Kontexten ist (McPherson & Schubert, 2022; Platz & Kopiez, 2022). Zum anderen gibt es bisher weder ein theoretisch fundiertes Modell über die pädagogische Urteilsbildung musikpraktischer Darbietungen, noch eine evidenzgestützte Annahme darüber, ob ein Transfer modellspezifischer Bewertungskriterien aus der musikpsychologischen Forschung zur ästhetischen Darbietungsbeurteilung für die pädagogische Diagnostik im schulischen Kontext möglich ist, in dem bspw. die Musikpraxis (und die hieraus resultierenden Lernprodukte) nahezu ausschließlich als Gruppenleistungen vorliegen (z.B. Klassengesang). So müssen Musiklehrkräfte in der Lage sein, aus akustisch komplexen Gruppensituationen ausreichend Informationen für eine Individualdiagnostik herausziehen zu können, was ihnen jedoch nur teilweise gelingt (vgl. Hasselhorn et al., 2022). Auch wenn Einzelgesangssituationen im Musikunterricht nur selten vorkommen, besteht dennoch die Möglichkeit auf technischem Wege Einzelaufnahmen von Schüler:innen beim Gruppenmusizieren anzufertigen, die im Anschluss an die Erhebungssituation beurteilt werden könnten. Das Ziel unserer Studie besteht in der empirischen Bestimmung, wie genau angehende Musiklehrkräfte solche Einzelgesangsleistungen von Schüler:innen sowohl evaluieren als auch prognostizieren können. Zudem wird untersucht, ob ihre Urteilsgenauigkeit durch die Informationsbreite beeinflusst wird, wobei hierunter der Umfang an Informationen über die Leistungsfähigkeit der Schüler:innen in unterschiedlichen Situationen verstanden wird. Zur Beantwortung der Forschungsfrage wurde eine Onlinestudie mit N = 98 Musikstudierenden durchgeführt, in deren Verlauf den Proband:innen Einzelaufnahmen von 10 Schüler:innen präsentiert wurden. Die Aufnahmen stammen aus einem bestehenden Korpus, der Gesangsleistungen von Schüler:innen der 9. Jahrgangsstufe sowie reliable Beurteilungen aller Leistungen u.a. durch Lehrkräfte umfasst (Hasselhorn, 2015, S. 122). Die Operationalisierung der Informationsbreite (UV₁) erfolgte durch einen standardisierten Zusammenschnitt (a) einer schülerseitigen Gesangsdarbietung („Guten Abend, gut‘ Nacht“) oder aber (b) von Ausschnitten aus drei unterschiedlichen Stücken („Bruder Jakob“, „Guten Abend, gut‘ Nacht“ und „Kalte Sterne“) unter Konstanthalten der Abspiellänge für alle Hörbeispiele. Nach randomisierter Zuordnung der Proband:innen zu einer der beiden Untersuchungsbedingungen wurden diese aufgefordert, die gehörte Darbietung anhand der HTR-G-Skala zur Bewertung schülerseitiger Gesangsleistungen zu beurteilen (Hasselhorn, 2015, S. 82). Danach sollten sie eine Einschätzung unter Verwendung derselben Skala abgeben, welche Leistung der jeweiligen Schülerin bzw. des jeweiligen Schülers sie für zwei weitere Stücke unterschiedlichen Anforderungsniveaus erwarten würden, wobei ihnen hierfür nur das jeweilige Notenbild präsentiert wurde. Anhand der vorhandenen Beurteilungen konnten in der Datenanalyse die Komponenten der Urteilsgenauigkeit nach Schrader und Helmke (1987) berechnet werden. Darüber hinaus wurden Multilevel Regression Analysen durchgeführt (Karst et al., 2017). Unsere Ergebnisse zeigen, dass die Urteilsgenauigkeit angehender Musiklehrkräfte vergleichbar ist mit den Leistungen der Lehrkräfte anderer Fächer (s. Urhahne & Wijnia, 2021; Südkamp et al., 2012). Im Vergleich zu den Analysen nach Schrader und Helmke (1987), ermöglichen die regressionsanalytischen Ansätze jedoch differenziertere Aussagen: Erst mit ihnen lässt sich der Effekt der Informationsbreite auf das Urteilsverhalten der angehenden Musiklehrkräfte in differenziellen Analysen nachweisen. Poster Wie kann Notizenmachen von Lehrvideos lernwirksam inszeniert werden? Anke Wischgoll, Monika Post TU Dortmund, Deutschland Theoretischer Hintergrund Lehrvideos sind in den letzten Jahren in der Lehrkräfteausbildung immer häufiger in digitalen Lernumgebungen genutzt worden. Es ist jedoch noch wenig erforscht, wie tiefgreifende Lernprozesse beim Betrachten von Lehrvideos in digitalen Lernumgebungen gefördert werden können. Im ICAP-Rahmen zeigen Chi und Wiley (2014), dass die Auseinandersetzung der Lernenden mit dem Lerngegenstand beim Betrachten eines Videos in einer konstruktiven Beschäftigungsform wie Selbsterklärungen eher gesteigert werden kann als in einer aktiven Beschäftigungsform wie dem Anhalten eines Videos. Das Anfertigen von Notizen ist eine gängige Lernaktivität, um Informationen aus Vorlesungen, Texten oder Videos zu verdichten. Die Forschung hat gezeigt, dass das Anfertigen von Notizen starke Auswirkungen auf den Lernfortschritt haben kann (Kiewra, Colliot & Lu 2018). Durch das Anfertigen von Notizen externalisieren die Lernenden ihre Gedanken, sie erinnern sich und reorganisieren die Lerninhalte, die sie gehört, gelesen oder beobachtet haben. Auf diese Weise interagieren die Lernenden mit dem Material, indem sie es mit ihrem Vorwissen vergleichen und kontrastieren und zu einer mentalen Repräsentation verdichtet (DiVesta & Gray 1973). Wiederholt haben Forschungsergebnisse belegen können, dass die Notizen der Studierenden oft unvollständig und die mentale Repräsentation des dargebotenen Lerninhalts inkonsistent sind (Kiewra, Colliot & Lu 2018). Mit fokussierenden Selbsterklärungsprompts kann die Qualität von Notizen verbessert werden. Diese unterstützen die Informationsselektion stärker als offene Selbsterklärungsprompts (Berthold, Eysink & Renkl 2009). Fragestellung Ziel der Studie war es, herauszufinden, wie Studierende durch Notizenmachen von Lehrvideos profitieren können. Folgende Hypothesen wurden getestet: (1) Lernende der Experimentalgruppe, die fokussierende Prompts erhalten, (EG-F) verfassen qualitativ bessere Notizen als Lernende der Experimentalgruppe, die offene Prompts erhalten (EG-O). (2) Lernende der EG-F zeigen bessere Posttestleistungen als Lernende der EG-O. (3) Die Experimentalgruppen EG-O und EG-F zeigen bessere Posttestleistungen als die Kontrollgruppe. Methode An der Interventionsstudie nahmen 256 angehenden Mathematiklehrkräfte teil, die zufällig einer von drei Bedingungen zugeteilt wurden: Jede Gruppe sah zwei Lehrvideos: eines über das Konzept der Wahrscheinlichkeit (i.e., Teil-Ganzes-Beziehung) und eines darüber, wie man dieses Konzept Lernenden erklären kann (i.e., bedeutungsbezogene Sprache). Eine der Experimentalgruppen (EG-O) wurde aufgefordert, sich Notizen zu wichtigen Informationen zu machen (offene Prompts). Die andere Experimentalgruppe (EG-F) wurde aufgefordert, sich Notizen zur Wahrscheinlichkeit und zum Sprachgebrauch zu machen (fokussierende Prompts). Die Kontrollgruppe wurde nicht aufgefordert, sich Notizen zu machen. Nach jedem Lehrvideo wurden die Teilnehmenden gebeten, die vermittelten Informationen in Übungsaufgaben anzuwenden. Vor und nach der Intervention wurde das konzeptuelle Wissen und der Gebrauch von bedeutungsbezogener Sprache mit speziell entwickelten Items getestet. Ergebnisse Unsere Ergebnisse zeigten, (1) dass die Notizen der EG-F signifikant besser waren als die Notizen der EG-O, (2) dass die EG-F signifikant bessere Posttestleistungen zeigte als die EG-O, (3) dass zwischen der Kontrollgruppe und der EG-F keine Unterschiede in Hinblick auf die Posttestleistung vorlagen, jedoch zwischen der Kontrollgruppe und der EG-O zugunsten der Kontrollgruppe. Wir konnten zeigen, dass Prompts in digitalen Lernumgebungen nur dann wirksam zu sein scheinen, wenn sie die Fokussierung auf relevante Informationen lenken. Prompts, die zur Selbsterklärung einladen, aber keine unterstützende Fokussierung anbieten, erwiesen sich in unserer Studie als weniger wirksam. Literatur Berthold, K., Eysink, T. H. S., & Renkl, A. (2009). Assisting self-explanation prompts are more effective than open prompts when learning with multiple representations. Instructional Science, 37(4), 345-363. Chi, M. T., & Wylie, R. (2014). The ICAP framework: Linking cognitive engagement to active learning outcomes. Educational Psychologist, 49(4), 219-243. Di Vesta, F. J., & Gray, G. S. (1973). Listening and note taking: II. Journal of Educational Psychology, 64(3), 278-287. Kiewra, K. A., Colliot, T., & Lu, J. (2018). Note this: How to improve student note taking. IDEA Paper #73. IDEA Center, Inc., CC BY NC ND. Poster Implizite und explizite Einstellungen gegenüber diversitätsgenerierenden Merkmalen: Eine Untersuchung zentraler Alterskohorten Sabrina König, Justine Stang-Rabrig, Nele McElvany TU Dortmund, Deutschland Theoretischer Hintergrund und Forschungsstand Unsere Gesellschaft ist von Heterogenität geprägt. Zu diversitätsgenerierenden Merkmalen gehören beispielsweise das Geschlecht, der Migrationshintergrund oder die soziale Herkunft (vgl. Four Layers of Diversity, Gardenswartz & Rowe, 2003). Zu diesen diversitätsgenierenden Merkmalen liegen in der Gesellschaft implizite und explizite Einstellungen vor. Diese können – trotz der bestehenden Vielfalt – negativ sein (Ingroup/outgroup favoritism; Doornkamp et al., 2022; König et al., 2022; Sabin et al., 2015; Stang et al., 2021). Insbesondere negative implizite Einstellungen können weitreichende Folgen in Form von zum Beispiel diskriminierendem Verhalten haben, da sie unbewusst das Verhalten einer Person beeinflussen (z. B. Brown, 2017). Bisherige Arbeiten fokussierten größtenteils auf lediglich ein diversitätsgenerierendes Merkmal sowie auf eine spezifische Personengruppe wie beispielsweise Lehrkräfte (Del Río et al., 2019; Denessen et al., 2022; Glock & Klapproth, 2017). Wie jedoch bei Mitgliedern verschiedener, zentraler Altersgruppen, von Kindergartenkindern bis Senior:innen, Einstellungen zu verschiedenen heterogenitäts-generierenden Merkmalen ausgeprägt sind, ist unklar. Des Weiteren ist wenig zu personalen (z. B. Persönlichkeitseigenschaften) sowie kontextspezifischen (z. B. Werte) Variablen bekannt, die mit den Einstellungen zusammenhängen können sowie zu Konsequenzen von Einstellungen gegenüber diversitätsgenerierenden Merkmalen (z.B. Verhaltensintentionen; Theorie des geplanten Verhaltens; Ajzen, 1985). Um entsprechend die unterschiedlichen Diversitätsdimensionen des Modells von Gardenswartz und Rowe (2003) abzubilden, werden in dieser Studie die sowohl impliziten, eher unbewussten, als auch expliziten, bewussten Einstellungen gegenüber verschiedenen heterogenitätserzeugenden Merkmalen wie zum Beispiel „Geschlecht“, „Religion“ und „Migrationshintergrund“ in fünf verschiedenen Alterskohorten (Kindergartenkinder, Schüler:innen der vierten und neunten Jahrgangsstufe, Erwachsene und Senior:innen) untersucht. Fragestellung In der vorliegenden Studie werden die genannten Altersgruppen, vom Kindergarten- bis zum Erwachsenenalter, in den Blick genommen, um zu untersuchen, 1) in welchem Ausmaß implizite und explizite Einstellungen gegenüber den ausgewählten diversitätsgenerierenden Merkmalen (Geschlecht, Religion, Migrationshintergrund, Berufsgruppen, ökonomischer Status, sexuelle Orientierung) vorliegen und 2) ob sich Unterschiede in den Ausprägungen impliziter und expliziter Einstellungen zwischen den fünf Alterskohorten zeigen. Darüber hinaus werden theoriegeleitet 3) personenbezogene (z.B. Persönlichkeit) und umgebungsspezifische (z.B. Werte) Faktoren, die mit impliziten und expliziten Einstellungen in Zusammenhang stehen können, untersucht sowie 4) weitere zentrale Variablen, die mit Einstellungen zusammenhängen können (z.B. Verhaltensintention). Methode Zur Erfassung der impliziten Einstellungen der sechs diversitätsgenerierenden Merkmale werden Implizite Assoziationstests (IATs) eingesetzt. Dabei wird die Assoziationsstärke zwischen kognitiven Strukturen (Konzepten) über Reaktionszeiten gemessen. Das Ausführen einer bestimmten Verhaltensreaktion (z. B. das Drücken eine Tastaturtaste) ist leichter, wenn zwischen zwei Konzepten eher eine hohe als eine niedrige Assoziationsstärke vorliegt (Greenwald et al., 1998; Nosek et al., 2007). Als Stimulusmaterial kommen sowohl Fotos als auch Wörter zum Einsatz. Explizite Einstellungen und weitere zentrale Variablen, die in einem Zusammenhang mit der Ausprägung von Einstellungen stehen können, sowie soziodemografische Angaben werden im Anschluss an die IATs über einen Fragebogen per etablierter Skalen erhoben. Dabei erfolgen die Erhebungen entweder tabletbasiert (Kindergarten, Schule, Senioreneinrichtungen) oder online (Erwachsene, Senior:innen). Eine a priori Stichprobenumfangsplanung (f = .25, α = .05, 1-β = .80) ergab für die Kohorten (Schüler:innen Klasse 4/ 9, Erwachsene und Senior:innen) je n = 868, in denen von insgesamt sechs IAT-Themen jeweils zwei randomisiert dargeboten werden. Für die Kohorte der Kindergartenkinder ergibt sich eine Substichprobengröße von n = 410, da hier von lediglich drei IAT-Themen („Geschlecht“, „Migrationshintergrund“, „sexuelle Orientierung“) jeweils zwei randomisiert dargeboten werden. Ergebnisse Der Erhebungsstart ist Oktober 2023. Es wird erwartet, dass negative Einstellungen gegenüber den untersuchten Merkmalen vorliegen und dass Strukturgleichungsmodelle Unterschiede sowohl in den Ausprägungen der impliziten und expliziten Einstellungen gegenüber den heterogenitätserzeugenden Merkmalen als auch zwischen den Kohorten aufzeigen. Auch wird vermutet, dass personen- und kontextspezifische Variablen in Zusammenhang mit dem Ausmaß der untersuchten Einstellungen stehen und, dass diese beispielsweise Verhaltensintentionen vorhersagen können. Die Ergebnisse werden methodisch und inhaltlich diskutiert. Zudem werden Implikationen für Forschung und Praxis vorgestellt. Poster "Risikoschüler:innen" im Bildungssystem – Ergebnisse aus dem Projekt Regain Potential Gerlinde Lenske¹, Alexandra Merkert² ¹Leuphana Universität Lüneburg, Deutschland; ²Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau, Deutschland Theoretischer Hintergrund Der Anteil an Personen ohne abgeschlossene Berufsausbildung oder Abitur steigt. So erhöhte sich der Wert bei den heute 25- bis 34-Jährigen in den letzten Jahren von 13 % auf 16 % (OECD, 2021; OECD, 2023). Darüber hinaus ist der Einfluss des sozioökonomischen Status auf den Bildungserfolg in Deutschland bedeutender als in anderen OECD-Staaten. Dies deutet darauf hin, dass es im deutschen Bildungssystem weniger gut gelingt, entsprechende Nachteile, die aus herkunftsbedingten Disparitäten resultieren, auszugleichen (OECD, 2019). Folglich drohen insbesondere sozial benachteiligte Kinder und Jugendliche in die Gefahr der Bildungsarmut (siehe u. a. Allmendinger, 1999; Tenorth, 2009) zu geraten. Bildungsarmut wird als ein Zustand definiert, der zu Restriktionen führt, sich sozial, kulturell, ökonomisch und politisch zu integrieren und an elementaren gesellschaftlichen Prozessen zu partizipieren (Ferger, 2015). Gründe für die Risikolage finden sich häufig bereits in Schule und Elternhaus. Insbesondere wenn Grundbedürfnisse bzw. Grundmotivationen (Deci & Ryan, 1985; Längle, 2016) nicht erfüllt bzw. berücksichtigt werden, kann eine verhängnisvolle Abwärtsspirale beginnen (Kammler, 2013; Huber et al., 2015). Lernende die keine Passung ins Bildungssystem erfahren, antworten oftmals mit Problemverhalten wie Resignation, Leistungsverweigerung oder Aggression (Baumann et al., 2020). Diese als störend oder destruktiv empfundenen Verhaltensweisen zeigen allerdings auch Problemlagen im System auf (Mücke, 2019). Um diese zu bearbeiten, erscheint es notwendig, die Perspektiven, Bedarfe und Wünsche von gefährdeten Schüler:innen sowie mögliche Schlüsselerlebnisse im Verlauf ihrer Schulzeit empirisch zu beleuchten und ggf. Muster zu identifizieren. Die gewonnen Erkenntnisse können zur Entwicklung von Interventionen (z. B. in Orientierung an der Resilienzforschung, siehe Nord, 2012) genutzt werden sowie in die Lehramtsausbildung einfließen (bspw. im Kontext von Klassenführung, siehe u. a. Lenske & Mayr, 2015). Fragestellung Im Fokus des Posterbeitrags steht die Frage nach den Wünschen und Bedarfen von Jugendlichen, die im Verlauf ihrer Schulzeit (beginnend mit der Einschulung) schulische Tiefpunkte durchlitten haben bzw. aktuell durchleben (bspw. markiert durch Versetzungsgefährdung, stark unterdurchschnittliches schulisches Wohlbefinden oder emotionale Erschöpfung). Untersucht wird außerdem, was sich aus der Perspektive der Befragten an Schule verändern müsste, um die Situation zu verbessern bzw. nach welchen Schlüsselerlebnissen sie wieder einen Aufschwung erfahren haben. Methode Datengrundlage bilden 60 problemzentrierte Interviews (Witzel, 2000) mit Sekundarstufenschüler:innen der 7., 8. und 9. Jahrgangsstufe (unter Einbezug von systemischen Therapie- bzw. Beratungsmethoden wie der Rekonstruktion der eigenen Lebenslinie). Im Mixed-Method-Design wurden anhand von Fragebögen außerdem schulisches Wohlbefinden (Gerecht et al., 2012), schulbezogene Selbstwirksamkeitserwartung (Jerusalem & Satow, 1999), die Lehrenden-Lernenden-Beziehung (Fickermann & Weißhaupt, 1998) sowie emotionale Erschöpfung (adaptiert nach Maslach & Jackson, 1986) erhoben. Die qualitativen Daten werden nach der Transkription der Interviews in Anlehnung an die inhaltlich strukturierende qualitative Inhaltanalyse nach Mayring (2022, unter Verwendung von MAXQDA) ausgewertet und mit den quantitativen Daten (mittels R) in Bezug gesetzt. Ergebnisse In ersten Analysen im Rahmen der noch laufenden Datenauswertung zeichnet sich bereits ab, dass Lehrkräfte durch beziehungsförderliches Verhalten erheblichen Einfluss auf die erlebte Unterstützung, das Wohlbefinden inkl. der Freude am Lernen nehmen, was sich vor allem bezüglich vielfach belasteter Schüler:innen (bspw. mitbedingt durch die familiäre Situation) zeigt. Diese Risikogruppe berichtet oftmals von dem Gefühl, nicht ernstgenommen oder missverstanden zu werden. Wichtig erscheint ihnen demgegenüber, dass Lehrkräfte sie als Person wertschätzen (auch unabhängig von schulischen Leistungen). Markantes Lehrkraftverhalten, egal ob positiv oder negativ, erweist sich als äußert (ein-)prägsam. Anhand der retrospektiv geschilderten Erfahrungen lässt sich erkennen, dass es Lehrkräften teilweise nicht gelingt, eine adäquate Beziehung zu dieser Schüler:innengruppe aufzubauen und es folglich zu ablehnendem Verhalten auf beiden Seiten kommt. Die Daten legen außerdem nahe, das Verständnis von Risikoschüler:innen insbesondere hinsichtlich solcher Personen zu erweitern, die sich durch stummes Leiden (hohe emotionale Erschöpfung und geringes schulisches Wohlbefinden bei gleichzeitig eher unauffälligem Verhalten) auszeichnen. Auffällig häufig wird außerdem von Mobbing-Erfahrungen in der Schule berichtet. Poster Geschlechterstereotypisierung von Spielzeug bei Gurndschulkindern Julia Kozisnik¹, Hanna Beißert^1,2,3 ¹Goethe Universität Frankfurt am Main; ²DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ³IDeA-Center for Individual Development and Adaptive Education Frankfurt Geschlechterstereotype sind tief in unserer Gesellschaft verwurzelt. Sie sind Vorstellungen darüber, wie männliche und weibliche Personen sich zu verhalten und welche Interessen sie zu verfolgen haben (Athenstaedt&Alfermann,2011;Hannover,2006). Stereotype werden innerhalb der Gesellschaft (re)produziert, indem sie von verschiedenen Sozialisationsinstanzen an die Kinder weitervermittelt werden. So lernen Kinder früh, wie sich Mädchen und Jungen gemäß der Normvorstellungen verhalten sollen und welche Interessen und Spielvorlieben für ihr Geschlecht als angemessen gelten. Dies schränkt die individuelle Entwicklung ein und begünstigt, dass sich im späteren Entwicklungsverlauf auch akademische und Berufsinteressen entlang stereotyper Geschlechtsvorstellungen entwickeln. Seit einiger Zeit gibt es einen gesellschaftlichen Wandel, der dazu führt, dass Geschlechterstereotype aufgebrochen werden (Athenstaedt&Alfermann,2011).Doch wie weit spiegelt sich dieser gesellschaftliche Wandel in der Erfahrungswelt von Kindern wider? Bei Kindern äußern sich Geschlechtsstereotype insbesondere in der Spielzeugnutzung (Ruble et al.,2006). Die vorliegende Studie untersucht, wie stark die Geschlechtertypisierung von Spielzeug bei Grundschulkindern heutzutage ausgeprägt ist und ob dabei Geschlechtsunterschiede bestehen. 40 Kinder zwischen 8 und 11 Jahren (M=9.23,SD=0.73, 20 weiblich, 20 männlich) bearbeiteten einen Fragebogen, in dem sie 26 Spielzeuge, die entweder als stereotyp weiblich, stereotyp männlich oder neutral angesehen werden können, einem von zwei fiktiven Kindern (Marie, Tom) zuordnen sollten. Die Spielzeuge wurden zuvor von Erwachsenen im Hinblick auf weibliche/männliche Stereotypität hin pilotiert. Die Kinder beantworteten für jedes dieser Spielzeuge drei Fragen: 1.Glaubst du, das jeweilige Spielzeug gehört Marie oder Tom? 2.Würde auch das andere Kind damit spielen? 3.Würdest du mit diesem Spielzeug spielen? Fast alle Kinder ordneten die Spielzeuge entsprechend gängiger Geschlechtsstereotypen zu: Stereotyp weibliche Spielzeuge wurden zu 99.15% dem fiktiven Mädchen zugeordnet, χ²(4)=80.00,p<.001, stereotyp männliche Spielzeuge zu 98.28% dem fiktiven Jungen, χ²(1)=40.00,p<.001. Bei der Zuordnung der neutralen Spielzeuge orientierten sich die Kinder tendenziell am eigenen Geschlecht, wobei diese Tendenz bei Jungen deutlich stärker ausgeprägt war als bei Mädchen. Um zu untersuchen, ob Mädchen und Jungen unterschiedliche Auffassungen bezüglich der Stereotypität von Spielzeug haben, wurden Chi²-Unabhängigkeitstests durchgeführt, die weder bei den stereotyp weiblichen noch bei den stereotyp männlichen Spielzeugen Zusammenhänge mit dem Geschlecht der teilnehmenden Kinder ergaben, ps>.005. Lediglich bei der Zuordnung der geschlechtsneutralen Spielsachen gab es Geschlechtsunterschiede in der Wahrnehmung des Spielzeugs,χ²(8)=14.86,p=.031. Weiterhin konnte sich die Mehrheit der Kinder nicht vorstellen, dass das jeweils andere fiktive Kind mit den jeweils stereotyp andersgeschlechtlichen Spielzeugen spielen würde. Die Mädchen gingen bei mädchentypischen Spielsachen zu 75.83% und bei jungentypischen zu 70.27% davon aus, dass das jeweils andersgeschlechtliche fiktive Kind kein Interesse an den jeweiligen Spielsachen hätte. Bei den Jungen war dies bei mädchentypischen zu 80.83% und bei jungentypischen Spielzeugen zu 65.83% der Fall.Die Teilnehmenden sahen es also als wahrscheinlicher an, dass Mädchen mit jungentypischem Spielzeug spielen, als dass Jungen mit mädchentypischem Spielzeug spielen. Bei den geschlechtsneutralen Spielzeugen gab die Mehrheit (72.53% der Mädchen, 73.95% der Jungen) an, dass beide fiktiven Kinder mit diesen Spielzeugen spielen würden. Bei den eigenen Vorlieben bekundeten 56.3% der Mädchen und nur 5.83% der Jungen Interesse an den als stereotyp weiblichen Spielzeugen. Obwohl hier eine klare Geschlechtstendenz besteht, entschied sich interessanterweise fast die Hälfte der Mädchen gegen diese Spielzeuge – auch wenn sie diese innerhalb der ersten Frage als mädchentypisch eingestuft hatten.Mit den stereotyp männlichen Spielzeugen würden 88.33% der Jungen und 27.68% der Mädchen spielen. Hervorzuheben ist, dass Mädchen 4.75-fach häufiger mit stereotyp männlichen Spielzeugen spielen würden als Jungen mit stereotyp weiblichen Spielsachen. Insgesamt vollziehen Kinder trotz gesellschaftlichen Wandels weiterhin eine starke Geschlechtsstereotypisierung von Kinderspielzeug, wobei sich Jungen intensiver als Mädchen an den Geschlechternormen orientieren. Da Kinder einen Großteil ihres Lebens in Bildungseinrichtungen verbringen, hat das pädagogische Fachpersonal großes Potenzial, stereotypen Überzeugungen von Kindern entgegenzusteuern. So sollten Erzieherinnen und Grundschullehrkräfte für das Thema sensibilisiert werden, um eine Interessenentwicklung abseits von gesellschaftlichen Stereotypen und Erwartungen zu fördern. Poster Authenticity of a virtual classroom to train conflict regulation competences in student teachers Sinah Auchtor, Antje Biermann, Roland Brünken Universität des Saarlandes, Deutschland Becoming a teacher not only includes the accumulation of factual knowledge, but also the “know-how”, i.e. the professional skills required to be a proficient teacher (Grossman et al., 2009). One essential professional skill for teachers is the ability to regulate themselves during conflict (Baumert & Kunter, 2006). From teacher professionalization research, it is well known, that conflicts in classroom and a poor student-teacher relationship will be associated with stress and negative emotions in teachers (Dicke et al., 2015; Krause et al., 2011; Kyriacou, 2001). To gain such professional skills, it is necessary to systematically train them during conflict situations, which is not possible in a classroom setting due to their accidental nature. Virtual classrooms provide a way to systematically train professional behavior, since situations can be repeated, and different approaches can be tried in the same setting (Ericsson, 2006). The effectiveness of virtual training depends on the perceived reality of the simulated scenario. It should evoke comparable cognitive processes and affective reactions (like emotions towards the disruptive student) as an interaction with a real student in a real classroom setting will do. If a virtual scenario is seen as realistic and authentic by the users, it can result in a feeling of presence, what means, that people feel, think, and behave like the way they do in a similar situation in the real world (Pertaub, Slater, & Baker, 2002). The MITHOS-Project aims to create a virtual classroom with adaptive virtual agent behavior to train student teachers in effective conflict regulation (e.g., regulate their emotions, develop perspective taking, and prosocial behavior). For this purpose, scenarios were developed that provide the course of a classroom conflict (e. g. a student playing with a mobile instead of working on the task). RQ1.* How realistic is the classroom perceived? If the classroom and the student agents are perceived as realistic, we will see this as an indicator for authenticity of the scenario and the interaction. RQ 2. Will student teachers, who interact with the VR-setting, have negative emotions, when the virtual student behaves non-compliantly? If the negative behavior of the student evokes negative feelings and stress, we will see this as an indicator for authenticity of the scenario and the interaction. To investigate our research questions, we let student teachers (N=18, age M=26.61 years, SD=6.50; semester M=7.00, SD=3.63) teach virtual student agents a self-developed opening sequence in one of their subjects. We assessed the perceived realism of the classroom with a believability (Seufert et al., 2022) and a realism (Poeschl & Doering, 2013) scale and evoked emotions and perception of the conflict and its resolution with self-developed items (all with a 5-point Likert scale). The results show that the situation was perceived as a conflict by the student teachers (M=4.32, SD=.89) that is comparable with a real-life classroom conflict (M= 3.35, SD=1.04) and for almost all of them, this conflict was not solved at the end of the simulation. Overall, the classroom was perceived as partly realistic (M=2.79, SD=.97). The student’s behavior was described as disruptive, rebellious, challenging, disrespectful and alarming (with a mean (± standard deviation) of 4.68 (±.58), 4.53 (±.70), 3.95 (±1.08), 4.21 (±.98) and 3.32 (±1.29) respectively). The negative emotions (like f.e. agitation, nervousness, disappointment, anger) towards his behavior (M=3.23, SD=.74) were stronger than the ones towards the other students (M=2.10, SD=.90). Regarding our research questions, the scenario and the interaction elicit negative emotions in the student teachers. The scenario is perceived as authentic and can therefore be used to train professional skills. Areas of improvement are also identified and discussed. Poster Critical Thinking – Erfassung des kritischen Umgangs mit Internet-basierten Informationen von Studierenden im internationalen Vergleich Katharina Frank¹, Olga Zlatkin-Troitschanskaia¹, Dominik Braunheim¹, Marie Nagel¹, Richard Shavelson² ¹Johannes Gutenberg-Universität Mainz, Deutschland; ²Stanford Graduate School of Education, United States Theoretischer Hintergrund. Studierende nutzen im Lernprozess zunehmend digitale Angebote zur Informationsbeschaffung (Mauer et al., 2020; Yu et al., 2018). Der freie Zugang zu einer großen Menge an digitalen Ressourcen birgt jedoch die Herausforderung, auf unzuverlässige oder gar falsche Inhalte beim Lernen zurückzugreifen (Bak et al., 2019; Richter & Maier, 2018). Diese Informationsflut bedarf einen kritischen Umgang mit Online-Medien und deren Inhalten (Liu et al., 2014; Osborne et al., 2022; Tribukait, 2017). Die Kompetenz, mehrere und teilweise widersprüchliche Quellen kritisch zu bewerten und anhand dieser Quellen zu einem argumentieren Schluss zu kommen (Critical Thinking, CT), wird für den Erfolg im Studium immer wichtiger (Weber et al., 2019). Trotz der hohen Relevanz wird CT oft nur in begrenztem Ausmaß universitär gefördert bzw. ist wenig explizit curricular verankert (Wineburg et al., 2018; Autoren, 2019). Für die Etablierung effektiver pädagogischen Interventionen in der Lehre ist die valide Erfassung des CT von Studierenden unabdingbar, wobei insbesondere in internationaler Perspektive u.a. die Komplexität der Entwicklung und Validierung eines CT-Assessments zu berücksichtigen ist (Berman et al., 2020; Braun et al., 2020; Davey et al., 2015; Ronderos et al. 2021). Fragestellung. Um das CT von Studierenden valide zu messen, wurde in einem internationalen Konsortium ein komplexes Szenario-basiertes Perfomance Assessment (PA) entwickelt. Ein PA beinhaltet eine realitätsnahe Simulation einer Entscheidungssituation. Es enthält vorselektierte (un-)relevante, (un-)zuverlässige und teilweise widersprüchliche Quellen und Informationen, die den Studierenden bei ihrer Entscheidung zur Verfügung stehen. Es wurde ein harmonisiertes PA für eine international-vergleichende Studie entwickelt und in vier Ländern (Deutschland, Kolumbien, Schweiz, USA) Cognitive Labs (CogLab) mit je zehn Studierenden nach einem gemeinsamen Protokoll durchgeführt. Der Antwortprozess der Studierenden zum PA wird im CogLab durch Think Alouds begleitet (Leighton, 2017), um u.a. die übergeordnete Fragestellung zu untersuchen, inwieweit mittels des international harmonisierten PA das CT von Studierenden länderübergreifend erfasst werden kann und welche Gemeinsamkeiten oder Differenzen sich bei den theoretisch erwarteten kognitiven Prozessen bei der PA-Bearbeitung zeigen. Methode. Nach einer Pre-Test-Studie mit 10 Probanden (n₁=5 deutsch-sprachiges PA und n₂=5 englisch-sprachiges PA) im Sommersemester 2023 umfasst die CogLab-Studie im Wintersemester 2023/2024 Erhebungen an den vier o.g. internationalen Standorten mit jeweils N=10 Bachelor-Studierenden. Die schriftlichen Antworten von Probanden zum PA werden anhand eines international harmonisierten Scoring-Schema mit 5-Punkte-Likertskala zu vier CT-Facetten (Analysieren und Bewerten der Informationen; Erkennen und Abwägen der Konsequenzen; Formulieren und Kommunizieren eines kohärenten Arguments; Perspektivenübernahme; s. Braun et al., 2020) mit 17 Subdimensionen von mind. zwei Ratern ausgewertet, um die CT-Performance zu bestimmen. Die qualitative Inhaltsanalyse der transkribierten Think Aloud-Daten aus den CogLabs werden mittels eines weiteren einheitlich harmonisierten Scoring-Schema der PA-Aufgabenlösung, Informationsverarbeitung und Argumentation bei der Entscheidungsfindung etc. ausgewertet. Ergebnisse. Die Ergebnisse der Pre-Test-Studie deuten auf unzureichende CT-Kompetenzen der Studierenden hin (Mean₁=2.173; Mean₂=1.613 von maximal 5 Punkten), wobei in allen Facetten starke Varianz u.a. auch in der Anzahl der verwendeten Quellen vorliegt. Die bisherigen Ergebnisse stehen im Einklang mit früherer Forschung, die auf eine insgesamt unzureichende und begrenzte Förderung von CT-Kompetenz im Studium hinweist. In dem Poster werden v.a. die zentralen Ergebnisse aus der Validierungsanalyse des neuen PA und dabei insbesondere der kognitiven Prozesse bei der PA-Bearbeitung. Bei der Analyse werden neben Hinweisen auf die Einsetzbarkeit des neuen PA (z.B. Äquivalenz der Antwortprozesse) (Padilla & Leighton, 2017; Solano-Flores & Li, 2009) im internationalen Vergleich (Berman et al., 2020), auch tiefergreifende Einblicke in die Unterschiede im CT-Niveau der Studierenden in vier Ländern gewonnen, wobei u.a. sprachliche und kulturelle Unterschiede als Kontextvariablen für Konstruktirrelevante Varianz (Oliveri et al., 2019) berücksichtigt werden. Die Erkenntnisse können nicht nur zur Weiterentwicklung der Forschung zur validen CT-Erfassung beitragen in internationalen Studien beitragen, sondern auch wichtige Hinweise auf die Förderung von CT liefern, die für die Hochschullehre relevant sind. Poster Gamification at school: A cross-cultural focus group study on likes and dislikes regarding computer games Lia Grahl¹, Konstanze Schoeps², Silvia Postigo-Zegarra², Alessia Signorelli³, Annalisa Morganti³, José Antonio Lozano-Quilis⁴, Frances Hoferichter¹ ¹Universität Greifswald; ²University of València; ³University of Perugia; ⁴Politecnical University of València Theoretical Background Social and emotional skills determine how well people adjust to their environment, maintain relationships, pursue goals, understand and manage emotions and learn from experience (Napolitano et al., 2021). Particularly, students from disadvantaged backgrounds have reported to lack social-emotional competences compared to their more advantaged peers (OECD, 2021) and often experience rejection and social exclusion by their classmates (Wahl et al., 2022). However, gamification may be a promising approach to engage all students of a class in playing together and learn new competencies (Zeybek & Saygı,2023). In fact, research indicates that serious games focusing on students’ social and emotional learning (SEL) have been linked to promote mental health problems and enhanced well-being (De la Barrera et al., 2021). Taking a European youth perspective, it is not clear yet, what likes and dislikes students across different countries associate with serious games in order to engage them in participating in a digital SEL-intervention to develop socio-emotional competences, promoting well-being and social inclusion (SEL4@ll). Research Question Previous to the design and implementation of the serious game SEL4@ll, using a target- and needs oriented approach, the aim of this study was to analyze students’ uses and preferences for a serious game and collect ideas for its design. Furthermore, we were interested in their perception on social inclusion and their socio-emotional problems and needs. Method Following a co-creative approach in designing a serious game, 45 secondary school students (M_age = 14.92, age range 12-16 years, 44% girls) from Greifswald (n = 18), Valencia (n = 15), and Perugia (n = 12) participated in focus group interviews during school hours, lasting about 60 minutes. The focus groups were thematically centered around a) emotions and motives related to playing videogames, b) expectations and preferences for a serious game as well as c) perception of challenges and needs in students’ socio-emotional competences and social inclusion within the school. Focus groups were analyzed using thematic interpretive analysis (Braun & Clark, 2006). Results Results indicate that about 58% of all students use technical devices almost every day in their free time. The main reasons for playing videogames are that they experience positive emotions (fun, satisfaction), they feel socially connected and just find it relaxing. The most important thing that students mentioned is that it should resemble a real videogame, with all the features that they like in their favorite videogames and with the possibility to customize according to their preferences and needs. Adolescents from the focus groups feel quite incompetent regarding their emotions. They often feel overwhelmed by unpleasant emotions (stress, frustration, fear, anger) and tend to use dysfunctional emotional regulation strategies such as aggressive behavior, holding on or escaping from the emotion. In the focus groups, students discussed a variety of social problems at school related to maltreatment based on lack of respect, social exclusion and teachers’ lack of support for students. Nevertheless, they came up with a number of suggestions that would help to improve the social climate at school, for instance, improving group culture, developing empathy, learning conflict resolution skills and getting support from adults. Conclusions The focus groups indicate that European adolescents could benefit from a serious game like SEL4@ll to improve their social and emotional skills and enhance school well-being and social inclusion. Poster Was wissen wir über die Unterrichtsqualität an inklusiven Grundschulen? - Ein systematischer Literaturreview Katja Martin, Stefanie Bosse, Nadine Spörer Universität Potsdam, Deutschland Bislang zeigten vergleichende Studien, dass Kinder mit sonderpädagogischem Förderbedarf eine günstigere kognitive Kompetenzentwicklung aufweisen, wenn sie in einer inklusiven Lernumwelt beschult werden im Kontrast zur Beschulung an Förderschulen (Kocaj et al., 2014; Lindsay, 2007; Myklebust, 2006; Ruijs & Peetsma, 2009). Dabei bleibt ungeklärt, welche Merkmale der Lernumwelt diese verschiedenen Kompetenzniveaus bedingen. Ein wichtiger Prädiktor für die Kompetenzen der Schulkinder ist die Unterrichtsqualität (Hattie, 2009). Entsprechend des Angebots-Nutzungs-Modells von Helmke (2017) lassen sich zehn Merkmale der Prozessqualität von Unterricht unterscheiden: Klassenführung, lernförderliches Klima, Motivierung, Klarheit und Strukturiertheit, Schülerorientierung, Aktivierung, Konsolidierung, Kompetenzorientierung, Umgang mit Heterogenität und Methodenvielfalt. Ein Literaturreview zur Unterrichtsqualität an Förderschulen ergab, dass sich bislang nur wenige Studien dieser Thematik widmeten (Autor:innen, 2018). Dementsprechend stellt sich die Frage: Zu welchen Ergebnissen kommt ein Literaturreview zur Unterrichtsqualität an inklusiven Grundschulen? Das Ziel dieser Untersuchung ist es, den Forschungsstand zur Unterrichtsqualität inklusiver Grundschulen in Deutschland systematisch zu erheben. Dazu wurden bisherige Studien mithilfe eines systematischen Literaturreviews analysiert und synthetisiert, um folgende Forschungsfragen zu beantworten: Welche Merkmale von Unterrichtsqualität (nach Helmke, 2017) werden in der Forschung adressiert? Wie hoch ist die Unterrichtsqualität an inklusiven Grundschulen? Zur Identifizierung relevanter Literatur wurden acht Datenbanken (z. B. PsycINFO, FIS Bildung) genutzt. Die Literatursuche basierte auf einer Suchsyntax von 100 logischen Kombinationen deutscher Schlüsselwörter, welche u.a. die zehn Unterrichtsqualitätsmerkmale adressierten (z. B. Inklusion UND Schule UND Motivierung). Anschließend wurden die N = 8586 ermittelten Publikationen in zwei Schritten selegiert, um adäquate Publikationen für die Volltextanalyse und Synthese herauszufiltern. Im ersten Selektionsschritt entschieden zwei unabhängige trainierte Rater:innen anhand von vier Ausschlusskriterien (ausschließlich kein Bezug zu Deutschland, zur Inklusion, zur Grundschule und zur Unterrichtsqualität), ob eine Publikation auf Basis des Titels relevant war oder nicht. Ausgeschlossen wurden Publikationen, wenn mindestens ein Ausschlusskriterium erfüllt war. In diesem Schritt wurden N = 2103 Publikationen angenommen (κ = 0.78). Im zweiten Schritt beurteilten zwei unabhängige Rater:innen basierend auf dem Abstract die Eignung der angenommenen Texte anhand von jeweils fünf Ein- und Ausschlusskriterien (Einschlusskriterien: empirische Studie, Bezug zum deutschen Schulsystem, zu Inklusion, zur Grundschule und zur Unterrichtsqualität). Für die Volltextanalyse wurden Publikationen eingeschlossen, wenn alle Einschlusskriterien, jedoch kein Ausschlusskriterium, erfüllt waren. Final wurden N = 30 Publikationen angenommen (κ = 0.90). Aktuell werden diese Volltexte anhand eines deduktiven Kategoriensystems von zwei unabhängigen Rater:innen kodiert. Dieses umfasst Publikationsmerkmale, Aspekte zum Forschungsdesign und der Stichprobe sowie Kategorien zu Forschungsergebnissen. Die Beurteilung der Unterrichtsqualitätshöhe erfolgte in drei Stufen (gering – mittel – hoch). Dies basierte entweder auf Zuordnung innerhalb der Studien (z.B. Normwerte) oder auf berichteten zentralen Tendenzen sowie Skalierungen der Messungen. Bislang wurden N = 9 Publikationen kodiert. Die Majorität bildeten quantitative Querschnittsstudien. Die Stichprobengröße variierte zwischen N = 33 bis 350 Personen. Zum derzeitigen Auswertungsstand wurden nicht alle Unterrichtsqualitätsmerkmale adressiert (z. B. Aktivierung, Motivierung). Am häufigsten wurden der Umgang mit Heterogenität (N = 6 Studien) und die Methodenvielfalt (N = 5 Studien) untersucht. Bezüglich der Differenzierung ergaben die Forschungsarbeiten, dass Lehrkräfte berichten, sie verfügen über zu wenig Wissen über differenzierendes Material (Beck, Lohmann & Hensen, 2015). Der Umgang mit Heterogenität nahm etwa ein Drittel der Unterrichtszeit ein (Textor, 2007). Ferner wurde herausgefunden, dass Lehrkräfte Binnendifferenzierung vielfältig praktizieren (Textor, 2007; Winkler, 2016). Hinsichtlich der Methodenvielfalt ergaben die Untersuchungen, dass offene Unterrichtsformen selten verwendet wurden (Krawitz, Theis-Scholz & Thümmel, 1996; Textor, 2007), 48% der Lehrkräfte jedoch offenen Unterricht als „wichtig“ einstuften (Krawitz et al., 1996). In Hinblick auf Sozialformen, fand der Unterricht an inklusiven Grundschulen vorwiegend im Klassenverband statt, gefolgt von Einzelarbeit und Partnerarbeit (Reichardt, 2009; Textor, 2007). Anzumerken ist, dass die Vergleichbarkeit der Studien aufgrund von stark variierenden Methoden und Stichproben limitiert ist. Bis zur Tagung werden alle Publikationen kodiert und analysiert werden. Poster „Obwohl die Daten immer dieselben sind …!“ - Die graphische Darstellung von Lernverläufen beeinflusst die eingenommene Bezugsnorm bei der Interpretation Erika Lunowa¹, Sarah Bez^1,2, Samuel Merk¹ ¹Pädagogische Hochschule Karlsruhe, Deutschland; ²Universität Tübingen, Deutschland Theoretischer Hintergrund Technologiebasiertes formatives Assessment hält zunehmend Einzug in deutschen Schulen (Jude et al., 2020) und bietet die Möglichkeit, Lernverläufe vieler Schülerinnen regelmäßig konstruktvalide zu erheben (Bez et al., 2023; Lachner et al., 2020). Diese Daten können der Lehrkraft in Echtzeit zur Verfügung gestellt werden (Molenaar & Knoop-van Campen, 2019) und ermöglichen eine adaptive Unterrichtsgestaltung (Lachner et al., 2020). Die dafür notwendige Leistungsbeurteilung kann durch den Vergleich mit einem Standard (Heckhausen, 1974) anhand von drei Bezugsnormen erfolgen: der „kriterialen Bezugsnorm“ (auch „sachliche Bezugsnorm“), der „sozialen Bezugsnorm“ sowie der „individuellen Bezugsnorm, welche auch als „intraindividuelle“, „ipsative“ oder „temporale Bezugsnorm“ bezeichnet wird (Merk & Bez, 2023). Bei der Wahl der Bezugsnorm handelt es sich nach Merk und Bez (2023) um eine normative Entscheidung, da für jede Bezugsnorm ein anderer Idealzustand festgelegt wird: Sehr gute Leistungen können dadurch gekennzeichnet sein, dass ein festgelegter Bildungsstandard, z. B. als höchste lehrplanbezogene Kompetenzstufe, erreicht wurde (kriteriale Bezugsnorm), dass die Schülerinnen mehr Punkte als ihre Mitschülerinnen erreichen (soziale Bezugsnorm) oder dass sie einen Lernzuwachs nachweisen können (individuelle Bezugsnorm). Dabei gilt die Orientierung an der individuellen Bezugsnorm über die damit einhergehende Motivationssteigerung als lernförderlich und die Verwendung der kriterialen Bezugsnorm als vorteilhaft, weil deutlich wird, welche lehrplanbezogenen Kompetenzen von welchen Lernenden (noch) nicht erworben wurden (Rheinberg, 2014). Die theoretische Grundlegung von Formativem Assessment impliziert die Anwendung dieser beiden Bezugsnormen. Obwohl in der Unterrichtspraxis mehrere Bezugsnormen verwendet werden (Lintorf & Buch, 2021), weisen Lehrkräfte die Tendenz zur Verwendung einer bestimmten Bezugsnorm auf. Diese sogenannte „Bezugsnormorientierung“ (Rheinberg, 1980) gilt als relativ stabil, wobei auch flexible Anteile angenommen werden (Lintorf & Buch, 2021). Empirisch begründet kann davon ausgegangen werden, dass Lehrkräfte prädominant sozial normieren, wobei es hierzu nur wenige Untersuchungen gibt (Lintorf & Buch, 2021; Wilbert & Gerdes, 2009; Wilbert & Grünke, 2010). In der Forschung wird die Bezugsnormorientierung von Lehrkräften häufig mit Hilfe von Selbstauskünften erhoben (Dickhäuser & Rheinberg, 2003), deren Validität durch Antworttendenzen beeinträchtigt sein kann (Eid et al., 2017). Gleichzeitig erscheint die „Kleine Beurteilungsaufgabe“ von Rheinberg (1980) wenig authentisch (Holder & Kessels, 2018), so dass alternative Erhebungsverfahren wünschenswert wären. Damit digitale formative Assessmentsysteme ihren Zweck erfüllen, sollten sie so gestaltet sein, dass individuell und kriterial normierte Rezeption der Lernverläufe naheliegt. Die Datenvisualisierung ist insofern bedeutsam, als dass Visualisierungen keine neutralen Datenabbildungen sind (Drucker, 2014) - die Graphiken können gezielt eine Bezugsnorm adressieren. Daher zielt die vorliegende Studie auf die Beantwortung folgender Forschungsfragen ab: (1) Verwenden Studierende unterschiedliche Bezugsnormen bei der Interpretation einer möglichst neutralen Darstellung von Lernverläufen? (2) Wie stark beeinflusst die graphische Darstellung von Lernverläufen unter Kontrolle der globalen Bezugsnormorientierung die eingenommene Bezugsnorm bei der Interpretation? Methode* In einem kontrollierten Online-Experiment wurden Daten von 103 Studenteninnen (davon 71 weiblich, 31 männlich und 1 divers) erhoben. Diese interpretierten zunächst eine möglichst neutrale Darstellung ökologisch valider Lernverläufe in einem offenen Textfeld. Mit einer geschlossenen Frage, welche Information die Studenteninnen zentral fänden, wurde die Bezugsnormorientierung erfasst. Zur Überprüfung der Konstruktvalidität wurde die „Kleine Beurteilungsaufgabe“ von Rheinberg (1980) bearbeitet. Anschließend erhielten die Studierenden dieselben Daten in einer bezugsnormhervorhebenden Darstellung. Dazu wurden entweder Leistungsergebnisse der Lernenden verbunden (individuelle Bezugsnorm) bzw. Kompetenzstufen (kriteriale Bezugsnorm) oder Informationen über eine Vergleichsgruppe (soziale Vergleichsnorm) eingezeichnet. Nach erneuter Beantwortung der offenen und geschlossenen Frage kann eine logistische Regression zur Beantwortung der Forschungsfragen berechnet werden. In einer multiplen Regression kann zusätzlich kontrolliert werden, ob die Studierenden bei der Randomisierung ihrer bevorzugten Bezugsnorm zugeordnet wurden. Ergebnisse und Diskussion Die Ergebnisse liegen zum Zeitpunkt der Konferenz vor und werden diskutiert. Poster Wie lassen sich digitale 3D-Modelle mechanisch-technischer Systeme im Technikunterricht einsetzen? Igor Gideon, Jennifer Stemmann Pädagogische Hochschule Freiburg, Deutschland Menschen werden fortwährend mit neuen mechanisch-technischen Alltagssystemen (z.B. Küchengeräte) konfrontiert. Während die Nutzung mithilfe von Bedienungsanleitungen oder eigenem Ausprobieren wenig Vorwissen erfordert (Stemmann, 2021), verlangt z.B. eine Reparatur Wissen über das grundlegende Funktionsprinzip technischer Systeme (Eberlin & Hock, 2014). Ziel des allgemeinbildenden Technikunterrichts ist es daher Schülerinnen darin zu fördern, Wissen über den Aufbau und Funktionsprinzipien technischer Systeme zu erwerben (Bildungsplan Baden-Württemberg, 2016). Hierzu wird oft die Unterrichtsmethode der Produktanalyse vorgeschlagen (z.B. Schlagenhauf, 2013), in der Lernende reale, industriell hergestellte Alltagsgeräte (z.B. Handrührgerät) demontieren, um deren Struktur* (Form und Anordnung von Einzelkomponenten) zu untersuchen. Die Herausforderungen in der Unterrichtspraxis bestehen dabei häufig in einer unzureichenden Anzahl vorhandener Demontagegeräte sowie lehrkräfteseitigem Aufwand für Reparatur oder Entsorgung. Zudem lassen sich die in mechanisch-technischen Systemen vorhandenen dynamischen Prozesse (d.h. Bewegungen einzelner Komponenten, die auf andere Komponenten wirken) im demontierten Zustand nicht betrachten. Digitale Modelle können hierbei eine Alternative darstellen. Zur Erfassung dynamischer Prozesse werden in diesem Kontext Animationen eingesetzt (Schnotz & Lowe, 2008). Allerdings zeigen Studien, dass Animationen die Aufmerksamkeit überwiegend auf dynamische Prozesse lenken und somit vom Erfassen der Strukturen ablenken (Ploetzner et al., 2021). Zur Strukturerfassung sind Bilder oft effektiver (ebd.). Diese sind aber statisch und ermöglichen nur eine begrenzte Perspektive, was für die Exploration mechanisch-technischer Systeme nachteilig sein kann. Digitale dreidimensionale Modelle bieten hingegen die Möglichkeit, sowohl die Struktur als auch dynamische Prozesse innerhalb einer Darstellung aus beliebigen Perspektiven zu betrachten. Die Lernwirksamkeit digitaler 3D-Modelle wurde z.B. in der Bautechnik (Carbonell-Carrera et al., 2021) oder bei der Steuerung digitaler Quadrocopter (Chen et al., 2020) vereinzelt erforscht. Studienergebnisse, welche die Lernwirksamkeit digitaler 3D-Modelle hinsichtlich der Struktur, des Verhaltens und Zusammenwirkens einzelner Komponenten eines mechanisch-technischen Systems beleuchten, fehlen allerdings. Die in den genannten Studien verwendeten 3D-Modelle lassen neben der Manipulation von Ansichten und Bauteilen auch die Simulation der stattfindenden dynamischen Prozesse zu. Da die Erstellung digitaler Simulationen technisch aufwändig und von Lehrkräften nicht leistbar ist, stellt sich die Frage, ob Lernende sich die dynamischen Prozesse anhand von (statischen) 3D-Modellen erschließen können, die diese Dynamik nicht simulieren. Wir nehmen an, dass Schülerinnen anhand der erfassten Systemstruktur in der Lage sind, die Bewegungen der Bauteile und ihr Zusammenspiel zu erschließen und so die gesamte Systemfunktion zu erkennen. Andererseits ist nicht auszuschließen, dass Schülerinnen Schwierigkeiten haben können, dynamische Aspekte ausschließlich anhand statischer digitaler 3D-Modelle zu erschließen, da dies zusätzliche kognitive Aktivitäten verlangt und Lernende überfordern kann (Khacharem et al., 2015). Dieser Beitrag untersucht, inwieweit Schülerinnen in der Lage sind, strukturelle und dynamische Aspekte mechanisch-technischer Systeme durch die Exploration digitaler 3D-Modelle zu erfassen und zu erschließen. Zur Beantwortung der Fragestellung wurde ein Wissenstest mit 27 Items entwickelt und an 45 Technikschülerinnen (M=14.6 Jahre, SD=.55 Jahre) pilotiert. Dieser erfasst das Wissen bezüglich der Struktur, des Verhaltens und des Zusammenwirkens einzelner Komponenten nach der Exploration. Außerdem wurden das gegenstandsspezifische Vorwissen, das allgemeine mechanisch-technische Verständnis (Hartweg et al., 2010) sowie die Fähigkeit zur mentalen Rotation (Yoon, 2011) ermittelt. Für die Durchführung der Studie wurde ein digitales 3D-Modell eines Türschlosses konstruiert. Nach der Ermittlung individueller Unterschiede mit den genannten Instrumenten wurde den 117 Lernenden (M=15.1 Jahre, SD=.77 Jahre) das Modell bereitgestellt mit der Aufgabe den Aufbau des Türschlosses zu untersuchen und seine Funktionsweise zu verstehen. Dieses Wissen und Verständnis wurden anschließend erfasst. Die Ergebnisse der vorliegenden explorativen Studie zeigen, dass digitale 3D-Modelle im Technikunterricht eine lernförderliche Wirkung haben können (Gideon et al., 2023). Allerdings wurden Schwierigkeiten der Lernenden bei der Beantwortung von Fragen zum Zusammenwirken der Einzelkomponenten festgestellt (Struktur: M=61,9%, SD=20,3%; Verhalten: M=65,5%, SD=21,1%; Zusammenwirken: M=40,1%, SD=22,7%). Infolgedessen werden weitergehende Untersuchungen durchgeführt, um Möglichkeiten zur Reduzierung dieses Verständnisproblems zu ergründen. Hierfür wird der Prozess des Explorationsverhaltens der Lernenden analysiert. Poster Digitale häusliche Lernumwelt – Veränderungen der elterlichen Unterstützung bei der informationsorientierten Internetnutzung von der fünften zur siebten Klassenstufe Nicole Gruchel¹, Ricarda Kurock², Heike M. Buhl¹ ¹Pädagogische Psychologie und Entwicklungspsychologie, Universität Paderborn, Deutschland; ²Kognitive Psychologie und Psychologiedidaktik, Universität Paderborn, Deutschland Hintergrund Die Nutzung digitaler Medien spielt für Bildungs- und Lernzwecke bereits seit vielen Jahren eine wichtige Rolle. Auch wenn die Digitalisierung in Schule und beim Lernen durch die COVID-19-Pandemie vorangeschritten ist, wird das Lernen mit digitalen Medien am Lernort Schule aber noch immer nicht systematisch vermittelt (Eickelmann & Gerick, 2020). Wichtige Kompetenzen im Umgang mit digitalen Medien werden somit eher im außerschulischen Bereich angeeignet, indem Kinder digitale Medien vor allem in familialen Lernsettings nutzen (Lauricella & Cingel, 2020; Scherer & Siddiq, 2019). Bei der Untersuchung der Rolle der Familie für das Lernen mit digitalen Medien ist die elterliche Unterstützung von zentraler Bedeutung, die im vorliegenden Kontext vor allem als konkrete elterliche Instruktion bei Internetaktivitäten betrachtet wird (Bonanati & Buhl, 2021). Neben der Quantität ist die Qualität elterlicher Instruktion entscheidend für die Motivation und das Lernen von Kindern (Knollmann & Wild, 2007; Wild, Rammert & Siegmund, 2006). Dabei erwies sich eine autonomieunterstützende, strukturgebende und zugleich wertschätzende Instruktion als besonders gewinnbringend (Griffith & Arnold, 2019; Ryan & Deci, 2000;). Aus der Forschung zur elterlichen Hausaufgabenunterstützung ist bekannt, dass die elterliche Unterstützung unter anderem auf Grund der steigenden Komplexität der Unterrichtsinhalte, der steigenden Selbstständigkeit sowie dem zunehmenden Autonomiebedürfnis der Lernenden im Schulverlauf abnimmt (Luplow & Schneider, 2018). Wie sich die elterliche Unterstützung bei der informationsorientierten Internetnutzung von Kindern über die Zeit verändert, ist in bisherigen Untersuchung bislang nur wenig betrachtet worden. Derartige Befunde könnten Hinweise auf eine geeignete zeitliche Verankerung von Fördermaßnahmen unter Einbezug der Familie geben. Fragestellung und Methode Ableitend ergibt sich für die vorliegende Untersuchung folgende Frage: Wie verändert sich die Quantität und Qualität elterlicher Unterstützung bei der informationsorientierten Internetnutzung von Kindern zwischen der 5. und 7. Klassenstufe? Zur Prüfung der Fragestellung werden längsschnittliche Daten genutzt, die im Rahmen des BMBF-Projekts „Digital Home Learning Environment“ im Jahr 2019/2020 in den fünften Klassen (~10-11 Jahre) und im Jahr 2021/22 in den siebten Klassen (~12-13 Jahre) erhoben wurden. Schriftlich befragt wurden Schüler:innen sowie deren Eltern innerhalb von Nordrhein-Westfalen. Für die vorliegende Untersuchung werden längsschnittliche Daten von insgesamt 395 Schüler:innen sowie 191 Eltern einbezogen. Veränderungen wurden mittels t-Test für unabhängige Stichproben ermittelt. Alle statistischen Analysen wurden mit der Software SPSS (Version 29.0) durchgeführt. Ergebnisse und ihre Bedeutung Von der fünften zur siebten Jahrgansstufe nahm die Quantität elterlicher Instruktion sowohl aus Eltern- als auch aus Kinderperspektive signifikant ab. Hinsichtlich der Qualität elterlicher Unterstützung zeigt in der Elternperspektive eine signifikante Abnahme der autonomieunterstützenden Instruktion, während in der Kinderperspektive sowohl eine Abnahme der autonomieunterstützenden als auch wertschätzenden Instruktion sichtbar wurde. Darüber hinaus zeigte sich, dass die Kinder der fünften Klasse bei der allgemeinen Nutzung digitaler Medien noch überwiegend von den Eltern unterstützt wurden, während die Kinder der siebten Klasse hingegen signifikant häufiger angaben, dass sich Eltern und Kinder bei der Nutzung digitaler Medien gegenseitig unterstützen und zum Teil Kinder sogar verstärkt ihre Eltern bei der Nutzung unterstützen. Die Ergebnisse der Studie schließen somit an bisherige Befunde im Bereich der elterlichen Hausaufgabenunterstützung an (Luplow & Schneider, 2018), zeigen jedoch auch, dass die elterliche Unterstützung insbesondere bei einer komplexeren Nutzung digitaler Medien im zunehmenden Alter auch immer vor dem Hintergrund der aktiven Rolle des Kindes betrachtet werden muss. Die Ergebnisse werden auch vor dem Hintergrund von Veränderungen durch die COVID-19-Pandemie diskutiert. Poster Epistemologische Überzeugungen als Einflussfaktoren beruflicher Belastungen und Beanspruchung im Lehrerinnen- und Lehrerberuf? Ergebnisse aus einer quantitativen Untersuchung von Grundschul- und Mittelschullehrkräften. Sibylle Schneider Universität Augsburg, Deutschland Gegenstand der Posterpräsentation sind epistemologische Überzeugungen als Einflussfaktoren auf die beruflichen Belastungen und das Beanspruchungserleben von Grundschul- und Mittelschullehrkräften. Bei letzteren beiden Konzepten handelt es sich zwar um kein völlig neues Forschungsthema, sind doch Lehrerinnen und Lehrer wie auch andere soziale und helfende Berufe überproportional häufig von Burnout u.ä. betroffen (Barth, 1997; Enzmann & Kleiber, 1989; Faber & Messner-Kaltenbrunner, 2017; Vandenberghe & Huberman, 2006). Im Hinblick auf Erklärungsfaktoren dafür wird in der vorgestellten Studie von einer bisher weniger gut beforschten Rahmung ausgegangen, worin neben epistemologischen Überzeugungen u.a. in diesem Zusammenhang auch soziologische und sozialstrukturelle Perspektiven in den Blick genommen werden. Kontextuelle Merkmale und die Komposition von Schulen und Klassen als Faktoren schulischer Umwelten werden häufig mit beruflichen Belastungen und Burnout im Lehrerberuf in Verbindung gebracht (Shackleton, Bonell, Jamal, Allen, Mathiot, Elbourne et al., 2019), darüber hinaus auch personale Ressourcen und Merkmale der subjektiven Wahrnehmung und Bewertung von Arbeitsbelastungen und des Beanspruchungserlebens von Lehrkräften, die einen wichtigen Teil der Lehrerprofessionalität darstellen (Cramer & Binder; 2015; Cramer, Friedrich & Merk, 2018: Integratives Rahmenmodell; Eder-Karavaya, Lohr & Treutner, 2021). Demgegenüber befinden sich in der vorliegenden Untersuchung folgende Fragen zu Einflussfaktoren auf das Stresserleben von Lehrkräften im Vordergrund des Forschungsinteresses: Wie wirken sich professionelle Überzeugungen, bspw. instruktivistische vs. konstruktivistische Teacher Beliefs, pädagogische Orientierungen und soziale Einstellungen, auf die Arbeitsüberforderung, das Kontrolliertheitserleben und die Arbeitsunzufriedenheit von Lehrerinnen und Lehrern, d.h. erste Anzeichen von Burnout, aus? Welche Unterschiede zeichnen sich dahingehend zwischen Grund- und Mittelschullehrkräften ab? Welche Effekte zeitigen sozialstrukturelle Merkmale und Herkunftsmerkmale der Lehrkräfte in ihrem Stresserleben im Vergleich zu Kontextmerkmalen von Schulen und Klassen? Antworten auf diese forschungsleitenden Fragen basieren auf Ergebnissen aus einer einmaligen Paper-Pencil-Befragung von Lehrkräften an Grund- und Mittelschulen (N=161) in zwei Metropolregionen im südbayerischen Raum (Ex-post-facto-Forschung, Surveydesign mit Querschnittuntersuchung und Selbstselektion der Untersuchungsteilnehmerinnen). Folgende Merkmal der Professionalität im Lehrerberuf, die je nach Ausprägung Stress im Beruf verursachen können, sind Gegenstand der Analyse: Teacher Beliefs (Traditional vs. Behaviorist Management, Traditional vs. Behaviorist Teaching, Constructivist Teaching, Constructivist Parents, nach Wooley & Wooley, 1999, übersetzt und validiert), pädagogische Orientierungen (Autonomie, Fürsorglichkeit des Lehrers, Anlageorientierung), Merkmale der Resilienz von Lehrkräften, Einstellungen zum Beruf und zu gesellschaftsrelevanten Themen, kulturelle Kapitalien und der sozialstrukturelle Status (Bildungsaufsteiger u.ä.), einschließlich der Kontextmerkmale von Schulen und Klassen. Der Kern dieser Studie stellt u.a. die Validierung eines Fragebogens zu Teacher Beliefs von Wooley und Wooley (1999) aus dem U.S.-amerikanischen Kontext dar, ein vermutlich bislang eher unbekanntes Untersuchungsinstrument im deutschsprachigen Kontext. Zentrale Befunde aus quantitativen Analysen zu den genannten Einflussgrößen auf berufliche Belastungen und das Beanspruchungserleben von Lehrkräften werden vorgestellt. Poster Politikdidaktische Überzeugungen von Lehrkräften und ihr Umgang mit Hatespeech in der Schule Julia Kansok-Dusche¹, Alexander Wettstein², Sebastian Wachs^3,4, Ludwig Bilz¹ ¹Institut für Gesundheit, Brandenburgisch-Technische Universität Cottbus-Senftenberg; ²Institut für Forschung, Entwicklung und Evaluation, Pädagogische Hochschule Bern; ³Institut für Erziehungswissenschaft, Universität Münster; ⁴National Anti-Bullying Research and Resource Centre, Dublin City University Hintergrund.* Hatespeech ist ein weltweites Phänomen, das auch an Schulen verbreitet ist (Castellanos et al., 2023) und pädagogische Präventions- und Interventionsmaßnahmen erfordert (Vereinte Nationen, 2021). Hatespeech wird hier als intentional herabwürdigende Äußerung über Personen verstanden, die auf zugeschriebene Merkmale sozialer Gruppen Bezug nimmt (Kansok-Dusche et al., 2022). Da der gesellschaftliche Umgang mit Hatespeech auch durch politische Akteure gestaltet wird, die individuelle Reaktionen darauf als politisches Handeln deuten (Europäische Kommission, 2019), könnten für den Umgang von Lehrkräften mit Hatespeech-Vorfällen in der Schule auch Aspekte ihrer politikdidaktischen Kompetenz bedeutsam sein. Der Beutelsbacher Konsens besagt, dass gesellschaftliche Kontroversen diskursiv und aus mehreren Perspektiven erörtert werden sollten (Wehling, 2016). Lehrkräfte unterscheiden sich jedoch stark in ihren Überzeugungen, inwieweit sie im Unterricht politisch Stellung beziehen sollten (Abs & Hahn-Laudenberg, 2017). Die Forschungsfrage richtet sich daher auf die Assoziation zwischen der politisch-didaktischen Überzeugung (PDÜ) von Lehrkräften und ihrem Umgang mit Hatespeech-Vorfällen in Schulen. Basierend auf einem Kompetenzmodell für Politiklehrende (Oberle, 2012 abgeleitet aus Baumert & Kunter, 2006) wird PDÜ als dispositionaler Aspekt der Interventionskompetenz von Lehrpersonen theoretisiert. Die Assoziationen zwischen PDÜ und Hatespeech-Interventionen (HI) bzw. der Nicht-Intervention ergibt sich durch einen kognitiven Abwägungsprozess (Krause et al., 2023) möglicherweise im Zusammenspiel mit weiteren Kompetenzfacetten (pluralistische Einstellung, politisches Interesse, Selbstwirksamkeit, Fähigkeit zum diskursiven Unterrichten, Wissen über Diskriminierung und Toleranzförderung). Wir erwarten direkte positive Assoziationen aller Kompetenzfacetten mit den drei HI (Hypothese 1) und negative Assoziationen mit der Nicht-Intervention (Hypothese 2). Methoden. Die Analyse basiert auf einer Stichprobe von 471 Sekundarschullehrenden aus 38 Schulen in Deutschland (n = 251) und der Schweiz (n = 220) (M_Alter = 42.8 Jahre 57.7% weiblich; 21.0% mit Migrationsstatus). Die Lehrpersonen beantworteten freiwillig und anonym einen Fragebogen (12/2020 – 04/2021). Es wurden drei Formen von HI erfasst (Bilz et al., 2023). Dies waren auf die beteiligten Schüler:innen gerichtete Interventionen (3 Items; α = .77), auf die Klasse gerichtete bildungsorientierte Interventionen (3 Items, α = .81) sowie kooperativ-kollegiale Interventionen (3 Items, α = .70). Ein Item erfasste die Nicht-Intervention. Mit multiplen Items und Skalen werden gemessen: politikdidaktische Überzeugungen (Abs & Hahn-Laudenberg, 2017; 2 Items; r = .76), die pluralistische Einstellung (Akkermann et al., 2014; 3 Items, α = .67), die Fähigkeit zum diskursiven Unterrichten (Diedrich, 2008; 4 Items, α = .79) und die Selbstwirksamkeitserwartung (Fischer et al., 2017; 8 Items, α = .80) sowie Wissen zum Thema Diskriminierung und verletzende Sprache (Neuentwicklung, 1 Item) und das politische Interesse (Otto & Bacherle, 2011; 5 Items, α = .93). Die Analysen erfolgen separat für die Interventionsmaßnahmen und die Nicht-Intervention mittels Korrelationsanalysen und Mehrebenen-Regressionen. Die Lehrkräfte werden auf Basis ihrer Schulzugehörigkeit gruppiert. Das Nullmodell ermittelt den ICC der Outcome-Variable. Das Kovariatenmodell prüft auf den Ebenen 1 und 2 direkte Effekte der Kontrollvariablen (Ebene 1: Geschlecht, Migrationsstatus, Berufserfahrung: Ebene 2: Land). Das Prädiktormodell erfasst direkte Effekte aller Prädiktoren bezüglich der jeweiligen Interventionsmaßname und der Nicht-Intervention. Eine Verbesserung der Modellgüte indiziert die relative Verringerung von Indizes wie AIC, BIC und ABIC. Ergebnisse und Diskussion. Die Berechnungen werden gerade durchgeführt. Die Ergebnisse sollen als Poster vorgestellt werden. Trotz Limitationen (z.B. Selbsteinschätzungen, Querschnittsdaten) kann die Studie Forschenden und Praktiker:innen helfen, die Rolle von PDÜ und anderen Aspekten der Interventionskompetenz von Lehrpersonen für deren Umgang mit Hatespeech besser zu verstehen. Poster Welche Rolle spielen Erfahrung und Kooperation für die Selbstwirksamkeit von Multiplikator:innen? Ella Dorothea Hansen¹, Rebekka Stahnke², Malte Lehmann³, Bettina Rösken-Winter³ ¹Technische Universität Dortmund; ²IPN - Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Berlin; ³Humboldt-Universität zu Berlin Theoretischer Hintergrund Über die Fortbildung von Lehrkräften können Veränderungen des Lehrkräftehandelns und der Unterrichtsqualität initiiert werden (Clarke & Hollingsworth, 2002). Das Projekt QuaMath hat das Ziel durch die Qualifizierung von Multiplikator:innen, die wiederum Lehrkräfte fortbilden, die mathematische Bildung in Deutschland langfristig zu verbessern. Die Gestaltung der Fortbildungen orientiert sich dabei an evidenzbasierten Prinzipien für einen qualitätvollen Mathematikunterricht (Prediger et al., 2022). Die Qualifizierungen der Mutliplikator:innen folgen zusätzlich sechs Gestaltungsprinzipien für eine qualitätvolle Lehrkräftefortbildung: Kooperationsanregung, Reflektionsanregung, Kompetenzorientierung, Teilnehmer:innenorientierung, Fallbezug und Lehr-Lern-Vielfalt (Barzel & Selter, 2015). Eine zentrale Rolle in der Wirkungskette kommt den Multiplikator:innen zu, die meist selbst Lehrkräfte sind. In ihrer Rolle als Multiplikator:innen bilden sie Lehrkräfte fort und initiieren Lehrkräftekooperation als einen wichtigen Faktor für Professionalisierung (Weißenrieder et al., 2015). Bei Lehrkräften zeigt sich, dass eine hohe Selbstwirksamkeitserwartung hinsichtlich des Fortbildungsgegenstands mit einer gesteigerten Motivation zum Transfer sowie einer verbesserten Transferleistung einhergeht (Grossman & Sales, 2011). Auch für Multiplikator:innen wird angenommen, dass ihre Selbstwirksamkeitserwartung bedeutsam für den Transfer von Konzepten in die Lehrkräftefortbildung und letztlich in den Schulalltag ist (Weißenrieder et al., 2015). Inwiefern die Selbstwirksamkeitserwartung von Multiplikator:innen dabei durch ihre Erfahrung sowie eigene Kooperationsaktivitäten beeinflusst wird, ist bisher unklar. Hier setzt der Beitrag an und widmet sich der Frage, inwiefern die Erfahrung und eigene Kooperationsaktivitäten die Selbstwirksamkeitserwartung von Multiplikator:innen hinsichtlich der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen beeinflussen. Methode Im Projekt QuaMath wurden 207 Multiplikator:innen mit Vorerfahrungen in der Lehrkräftefortbildung vor Beginn der Qualifizierung befragt. Zur Überprüfung der Fragestellung wurde ein standardisierter Fragebogen genutzt, der neben der Erfahrung als Lehrkraft und Multiplikator:in in Jahren, die Kooperationsaktivitäten mit anderen Multiplikator:innen sowie anderen Lehrkräften im Kollegium, die Überzeugung zur Bedeutung von Kooperation von Lehrkräften für den Transfer (jeweils 4 Items; adaptiert nach Meudt et al., 2020) sowie die Selbstwirksamkeitserwartung bezüglich der Vermittlung der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen (jeweils 3 Items; adaptiert nach Schwarzer & Jerusalem, 1999) erfragte. Die Ergebnisse der Reliabilitätsanalyse zeigen eine gute interne Konsistenz der verwendeten Skalen (α = .72 bis α = .85). Es wurden Multiple Regressionsanalysen durchgeführt, um den Einfluss von Erfahrungen und Kooperationsaktivitäten (Prädiktoren) auf die Selbstwirksamkeitserwartung hinsichtlich der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen (jeweils vorherzusagendes Kriterium) zu untersuchen. Ergebnisse Die Auswertung der erhobenen Daten zeigt, dass die Selbstwirksamkeitserwartung der Multiplikator:innen hinsichtlich der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen signifikant durch die Erfahrung als Multiplikator:in sowie durch eigene Kooperationsaktivitäten vorhergesagt werden kann (R² = .12 bis R² = .23). Die Erfahrungen als Multiplikator:in und die Überzeugung, dass die Kooperation von Lehrkräften für den Transfer wichtig ist, stellen positive Prädiktoren für die Selbstwirksamkeitserwartung hinsichtlich fast aller Gestaltungsprinzipien dar. Besonders hervorzuheben ist die Relevanz der Kooperationsaktivitäten der Multiplikator:innen in ihrer Rolle als Lehrkraft für die Selbstwirksamkeitserwartung bezüglich des Gestaltungsprinzips der Kooperationsanregung (ß = .23; p < .001). Die eigene Kooperation mit anderen Multiplikator:innen ist ein positiver Prädiktor für die Selbstwirksamkeit hinsichtlich überwiegend inhaltlich orientierter Gestaltungsprinzipien, wie der Kompetenzorientierung (ß = .20 bis ß = .33; p < .01). Diskussion Die Ergebnisse deuten darauf hin, dass sowohl die individuellen Erfahrungen als auch die Kooperationsaktivitäten der Multiplikator:innen bedeutsam für ihre Selbstwirksamkeitserwartung in Bezug auf die sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen sind. Insbesondere die Relevanz der Kooperation von Multiplikator:innen mit anderen Multiplikator:innen als auch ihre Kooperation mit Lehrkräften im eigenen Kollegium dienen als wichtige Ansatzpunkte für die Gestaltung der Qualifizierung der Multiplikator:innen im QuaMath-Projekt. Die Ergebnisse legen nahe, dass sich eine gute Kooperation sowohl zwischen Multiplikator:innen als auch Lehrkräften über eine gesteigerte Selbstwirksamkeitserwartung positiv auf die Umsetzung der Gestaltungsprinzipien für qualitätvolle Fortbildungen sowie der Prinzipien für qualitätvollen Mathematikunterricht auswirken könnte. Vertiefende Einblicke in diese Wirkungskette werden zukünftige Forschungsarbeiten in QuaMath liefern. Poster Wie wirkt ein digitales Punktefeld beim Lösen von multiplikativen Textaufgaben? Eva Schultheis, Katharina Loibl, Timo Leuders Pädagogische Hochschule Freiburg, Deutschland Forschungsbefunde zeigen, dass beträchtlich viele Lernende mit erheblichen Lücken in den grundlegenden mathematischen Basiskompetenzen in die Sekundarstufe I starten (Kasper et al., 2020). Insbesondere das konzeptionelle Verständnis der Grundrechenarten - oder kurz: das Operationsverständnis - ist nicht ausreichend entwickelt, was vor allem im Bereich der Multiplikation und Division deutlich wird (z.B. Schulz et al., 2017). Dieses multiplikative Operationsverständnis spielt jedoch eine entscheidende Rolle für das weitere mathematische Lernen, z.B. beim Erlernen von Brüchen, Prozentsätzen oder Funktionen (z.B. Hackenberg & Tillema, 2009). Ohne eine kompensatorische Förderung ist es unwahrscheinlich, dass die Lernenden, denen es an einem substanziellen multiplikativen Operationsverständnis mangelt, den Anforderungen des Mathematikunterrichts in der Sekundarstufe gerecht werden (Schulz et al., 2017). Operationsverständnis manifestiert sich an Textaufgaben (Gravenmeijer, 1997). Mangelndes Operationsverständnis bei Textaufgaben lässt auf unpassende oder fehlerhafte mentale Repräsentationen schließen (Hegarty et al., 1995). Dem Modell des integrierten Text-Bild-Verstehens von Schnotz und Bannert (2003) folgend, können externe Repräsentationen eine Hilfe darstellen (z.B. Dröse, 2019; Jitendra, 2019) und beim Aufbau mentaler Modelle im Löseprozess helfen (z.B. Thevenot 2010; Múñez et al., 2013), sofern die Übersetzung zwischen Text, Darstellung und Rechnung gelingt (Dewolf et al., 2014). Gelingen allerdings diese verstehensförderlichen Übersetzungsprozessen nicht, haben die (zusätzlichen) grafischen Darstellungen eher lernhinderliche Effekte (Ainsworth, 2006). Dieses Projekt untersucht, wie der Einsatz einer Punktefeld-Applikation beim Lösen von multiplikativen Textaufgaben wirkt, ob es Hinweise gibt, dass diese Wirkung in Abhängigkeit von der Ausprägung verschiedener Persönlichkeitsmerkmale (Vorwissen, Lesefähigkeit, induktives Denken, Mathematik-Angst und -Selbstkonzept, ICT-Kompetenz) systematisch variiert und ob bestimmte Lernendengruppen besondere Hilfestellungen benötigen. In der vorliegenden Studie wurden folgende Forschungsfragen untersucht: Wie wirkt ein digitales Punktefeld beim Lösen von multiplikativen Textaufgaben? Zeigen sich Hinweise für differentielle Effekte? In einem Prä-Post-Design mit teilnehmender Beobachtung bei der Intervention soll die Wirkung einer eigens entwickelten Punktefeld-Applikation auf das Lösen von multiplikativen Textaufgaben (kurzfristig) und auf die Förderung von multiplikativen Operationsverständnis (langfristig) sowie Hinweise zu eventuell vorliegenden differentiellen Effekten untersucht werden. Von Lernenden der 5. Klasse (N=32) wurde mit einem eigens dafür entwickelten und validierten Instrument das multiplikative Operationsverständnis erfasst (Testzeitpunkt T1). Nach einer kurzen Einweisung sollten diese anschließend möglichst eigenständig einem an ihren Lernstand (Testzeitpunkt T1) angepassten individualisierten Aufgabenplan folgend 6-8 multiplikative Textaufgaben mithilfe der Punktefeld-Applikation lösen. Während der Bearbeitung der Lernaufgaben wurden sie von einem Versuchsleiter beobachtet und ihre Äußerungen aufgezeichnet. Dieser Versuchsleiter gab auf Nachfrage Hilfsimpulse. Das Datenmaterial wurde hinsichtlich folgender Aspekte kodiert: Lösung der Aufgabe (richtig gelöst, mit Hilfe gelöst, nicht gelöst) und Art der Hilfestellung (technische Hilfe, inhaltliche Hilfe beim Aufbau des Punktefeldes, inhaltliche Hilfe beim Übersetzen des Punktefeldes in die Rechnung). Vier Wochen nach der Intervention wurde die Erfassung des multiplikativen Operationsverständnis wiederholt (delayed Posttest, Testzeitpunkt T2), um langfristige Veränderungen zu untersuchen. Diese Daten wurden mit JASP (t-Test bei abhängigen Stichproben, ANOVA) analysiert. Des Weiteren wurde Mathematik-Angst und -Selbstkonzept (PISA 2012), induktives Denken (Matrizentest aus CFR-20-R) und die selbst eingeschätzte Kompetenz mit Informations-technologien (PISA 2015) untersucht. Daten zum Zahlenverständnis, zum allgemeinen Operationsverständnis (über alle vier Operationen), sowie zum Leseverständnis lagen durch die Erhebung von Lernstand 5 (IBBW) vor. Der t-test für abhängige Stichproben zeigte eine signifikante Verbesserung um 1,34 Punkte von T1 zu T2 mit kleiner Effektstärke (p=0,016; d=0,451), was auf einen Lerneffekt hindeutet. Die Analyse der Prozessdaten zeigte, dass das Punktefeld vor allem bei den Leistungsschwächeren löse- und lernförderlich war, wenn auch häufig inhaltliche Unterstützung notwendig war. Dies deutet darauf hin, dass der lernwirksame Umgang mit der Punktefeld-Applikation durch eine gute, angepasste Instruktion vorbereitet werden muss und verbessert werden kann, und deckt sich mit früheren Studienbefunden (Hillmayr et al., 2020). Analysen zu weiteren differentiellen Effekten stehen noch aus. Poster Mit Flipped Learning, Rollenlernen und Reflexion Trainerinnen-Kompetenzen im Studium fördern – Evaluation eines Studienmoduls Maren Schmidt, Sandra Rothenbusch, Eva-Maria Schulte Technische Universität Braunschweig, Deutschland Die Digitalisierung ändert das Berufsbild von Trainerinnen drastisch: Unternehmen setzen zunehmend auf digitale Tools und selbstgesteuertes Lernen, sodass Trainerinnen zu Lernbegleitenden werden, die E-Learning, virtuelle und Präsenzformate flexibel kombinieren und auf individuelle Bedürfnisse der Teilnehmenden abstimmen (Kauffeld, 2016; Sammet & Wolf, 2019). Um interessierte Studierende der Arbeits- und Organisationspsychologie auf ihre neue Rolle als Lernbegleitende vorzubereiten und ihre Handlungskompetenzen zu stärken, wurde ein zweisemestriges Modul basierend auf den first principles of instruction (Merrill, 2002) entwickelt. Es verbindet im „flipped learning“-Design (Zhou, 2023) E-Learning-Einheiten und Präsenztermine mit einer Trainingshospitation. Eine ergebnis- (z.B. Kompetenzzuwachs) sowie prozessbezogene (z.B. Erfolgsfaktoren und Hindernisse) Evaluation (Kauffeld, 2016) entlang des Vier-Ebenen-Modells von Kirkpatrick (Reaktions-, Lern-, Verhaltens- und Ergebnisebene; Kirkpatrick & Kirkpatrick, 2006) und des Rahmenmodells des Transferprozesses nach Baldwin und Ford (1988) dient der Beurteilung und Weiterentwicklung des neuen Studienmoduls mit speziellem Fokus auf den Lerntransfer. Die drei zentralen Fragenstellungen der Evaluation lauten: Sind die Lehr- und Lernformate (Präsenztermine, E-Learning, Hospitation) nach den vier Ebenen von Kirkpatrick unterschiedlich erfolgreich? Welche Katalysatoren und Barrieren können für den Lerntransfer identifiziert werden? Werden durch das Modul die Handlungskompetenzen (Methoden-, Fach-, Sozial- und Selbstkompetenz; Kauffeld, 2016) der Teilnehmenden erhöht? Mittels eines quasi-experimentellen Designs wurden N = 84 Psychologiestudierende der TU Braunschweig wiederholt befragt. In der Interventionsgruppe befanden sich n = 13 Studierende, in der Kontrollgruppe n = 71 Studierende. Zur ergebnisorientierten Evaluation des Studienmoduls wurde der Questionnaire for Professional Training Evaluation (Q4TE; Grohmann & Kauffeld, 2013) mit seiner sechsstufigen Likert-Skala (1 = trifft überhaupt nicht zu* bis 6 = trifft voll und ganz zu) genutzt. Kompetenzen wurden durch Selbsteinschätzungen im Kompetenz-Reflexions-Inventar (KRI; Kauffeld, 2021) auf einer fünfstufigen Likert-Skala (1 = trifft überhaupt nicht zu bis 5 = trifft voll und ganz zu) und mit einem selbst-konstruierten Wissenstest, in dem maximal 12 Punkte erreicht werden konnten, erfasst. Zur prozessorientierten Evaluation kam das deutsche Lerntransfer-System-Inventar (GLTSI; Kauffeld et al., 2008) mit einer fünfstufigen Likert-Skala (1 = trifft überhaupt nicht zu bis 5 = trifft voll und ganz zu) zum Einsatz, das auf den Studienkontext adaptiert wurde. Zur Auswertung der Fragestellungen wurden non-parametrische Analyseverfahren verwendet. Ergebnisse zur ersten Fragestellung zeigen, dass sich nur die Lern- und Lehrformate auf Reaktionsebene, ꭓ²(2) = 10.31, p = .01, und Verhaltensebene, ꭓ²(2) = 6.53, p = .04, hinsichtlich ihrer Bewertungen unterscheiden. Paarweise Vergleiche zeigen, dass auf Reaktionsebene das Präsenzformat (M = 4.79, SD = .88, p = .02) und die Hospitation (M = 4.91, SD = 1.17, p < .01) im Vergleich zum E-Learning (M = 4.28, SD = .95) signifikant besser bewertet wurden. Auf Verhaltensebene wird das Präsenzformat (M = 4.66, SD = 1.01, p = .01) signifikant besser als das E-Learning (M = 4.24, SD = .85) bewertet. Bezüglich der zweiten Fragestellung zeigen erste Ergebnisse, dass insbesondere die positive Folge bei Anwendung (M = 4.5, SD = .54) sowie die Unterstützung derdes Vorgesetzten (M = 4.46, SD = .66) als Katalysatoren und Feedback (M = 3.13, SD = .98) sowie die Möglichkeit der Wissensanwendung (M = 3.34, SD = .92) als Barrieren dienen können. Zur dritten Fragestellung weisen erste Ergebnisse darauf hin, dass die Fachkompetenzen, ꭓ²(2) = 16.17, p < .01, und die Sozialkompetenzen, ꭓ²(2) = 6.41, p = .04, bei der Interventionsgruppe über das Studienmodul hinweg signifikant unterscheiden. Die Interventionsgruppe (M = 5.69, SD = 1.41) schnitt im Vergleich zur Kontrollgruppe (M = 2.13, SD = 1.34) signifikant besser im Wissenstest ab, U = 499, z = 5.03, p < .01. Das Studienmodul, diese und weitere Evaluationsergebnisse werden im Poster detailliert vorgestellt und anschließend diskutiert. Es wird ein theorie- und praxisbezogener Ausblick gegeben. Poster Der Ankereffekt bei der Rezeption von Evidenz - Eine kausale Mediationsstudie. Kristina Bohrer, Kirstin Schmidt, Samuel Merk Pädagogische Hochschule Karlsruhe, Deutschland Theoretischer Hintergrund* Evidenzinformierte Praxis bietet zahlreiche Vorteile für Entwicklungen der Lernumgebungen für die Schüler:innen oder die Schulentwicklung im Allgemeinen (Brown et al., 2017). Allerdings begegnen Lehrpersonen unterschiedlichen Barrieren, wenn sie mit Evidenz umgehen. Hierzu zählen neben externen Faktoren wie fehlende zeitliche Ressourcen (van Schaik et al., 2018) und individuell gering ausgeprägten (Forschungs-) Kompetenzen (Evans et al., 2017) auch unbewusste kognitive Verzerrungen, welche die Interpretation der Evidenz beeinflussen. Der Ankereffekt, dem zufolge eine numerische Schätzung an einem zuvor bekannten Vergleichsmaßstab ausgerichtet wird (Tversky & Kahneman, 1974), ist eine solche kognitive Verzerrung. Bisher wurde der Ankereffekt, unserem Wissen nach, nicht im Kontext der evidenzinformierten (Schul-)Praxis untersucht. Darüber hinaus werden die Mechanismen hinter der kognitiven Verzerrung stark diskutiert (z.B. Mochon & Frederick, 2013). Daher wurde in der ersten Studie analysiert, inwiefern verschiedene Anker die Bewertung von Forschungsergebnissen beeinflussen. In einer zweiten Studie wird davon ausgehend der Mechanismus hinter diesem Ankereffekt untersucht. Studie 1 In diesem randomisierten kontrollierten Online-Experiment erhielten N = 220 Lehramtsstudierende (85% weiblich, MSemester = 3,36) sequentiell und randomisiert zwei Forschungsberichte zu bildungswissenschaftlichen Themen, in denen die Stichprobengrößen der fiktiven Experimente enthalten waren (randomisiert N = 15 oder N = 500; unabhängige Variable). Die Teilnehmenden wurden anschließend gefragt, ob sie diese Stichprobengröße als angemessen empfinden, um die Forschungsfrage des Forschungsberichts zu beantworten (Likert Skala von 1 = stimme gar nicht zu bis 7 = stimme voll und ganz zu; abhängige Variable). Dieses 2x2 between-person Design resultiert in vier Gruppen (zwei Kontroll- und und zwei Experimentalgruppen). Insgesamt wurde angenommen, dass die Teilnehmenden die zweite und größere Stichprobengröße (N₂ = 500) als angemessener bewerten, wenn sie vorher den kleinen Anker erhalten haben (N₁ = 15) - und umgekehrt. Eine Bayesianische ANOVA zeigt starke Evidenz für große Ankereffekte in den Experimentalgruppen (d = 2,97 , BF₁₀ > 100). Doch unterscheidet sich die vorliegende Operationalisierung von bisherigen Studien zum Ankereffekt, da die Teilnehmenden nicht nach einer numerischen Schätzung, sondern nach der Interpretation eines numerischen Wertes gefragt wurden. Studie 2 Daher soll in einer zweiten Studie in einem ähnlichen experimentellen Design untersucht werden, ob die eigentlichen Ankereffekte die Bewertung bildungswissenschaftlicher Studien mediieren. Die Teilnehmenden erhalten hierfür erneut zwei Forschungsberichte mit randomisierten Stichprobengrößen, für die sie die Angemessenheit der Stichprobengröße bewerten sollen. Dabei wird angenommen, dass die Angemessenheitsbewertung über die antizipierte Stichprobengröße des zweiten Forschungsberichts (numerischer Ankereffekt) mediiert wird (Pirlott & MacKinnon, 2016). Um diese Hypothese zu testen, werden in einem concurrent double randomization design die Stichprobengrößen des ersten Forschungsberichts (unabhängige Variable) und antizipierten Stichprobengrößen des zweiten Forschungsberichts (Mediator) manipuliert. Dazu wird eine discouragement und encouragement Bedingung geschaffen (z.B. “Oft haben Forschende nicht genügend Ressourcen, so dass die Stichproben zu klein sind. Aber nur größere Stichproben würden den Effekt zuverlässig aufdecken”). Diskussion Die Relevanz der Ergebnisse kann anhand eines Beispiels verdeutlicht werden: Wenn (angehende) Lehrpersonen vor allem mit Studien mit großen Stichprobengrößen vertraut sind (wie Large-scale Assessments), dann kann dies mit Blick auf die Ergebnisse aus Studie 1 als ein Anker wirken. Dies kann letztlich zu einer Abwertung von (z.B. experimentellen) Studien mit kleineren Stichprobengrößen führen - auch wenn diese aufgrund großer Effektstärken dennoch eine suffiziente statistische Power aufweisen. Die Ergebnisse der zweiten Studie erlauben es, hinter die Mechanismen der Ab- oder Aufwertung von Evidenz durch (angehende) Lehrpersonen, bedingt durch den Ankereffekt, zu blicken. Das Wissen über die dahinterliegenden Mechanismen kann als erster Schritt dafür dienen, einen gelingenden Umgang mit Evidenz trotz des Ankereffekts zu erreichen. Poster Unterricht sollte EASI sein - Der Einfluss Erfahrener Wertschätzung in der Schule auf das Wohlbefinden, die Motivation und die Selbstwirksamkeitserwartung von Schülerinnen Maximilian Resch, Dr. Henrik Bellhäuser Johannes Gutenberg-Universität Mainz, Deutschland Sowohl im Arbeitskontext (Semmer et al., 2019) als auch im Kontext der universitären Lehre (Carstensen et al., 2021) zeigt sich die Relevanz von erfahrener Wertschätzung für das Wohlbefinden und die Zufriedenheit von Arbeitnehmenden und Lernenden. Zugleich wird deutlich, dass Wertschätzung noch immer ein zum Teil uneindeutig definiertes Konstrukt ist. So wird Wertschätzung beispielsweise mit Respekt (Grover, 2014), Belohnung (Bregenzer et al., 2022) oder sozialer Unterstützung (Sundin et al., 2007) gleichgesetzt und als synonym angenommen. Nichtsdestotrotz legen aktuelle Befunde und theoretische Abgrenzungen nahe, dass Wertschätzung als eigenständiges Konstrukt angesehen werden sollte, das inkrementelle Prädiktion über die Aufklärung durch andere Konstrukte - wie soziale Unterstützung - hinaus leistet (Semmer et al., 2019). Vor dem Hintergrund der inkongruenten Definition und Operationalisierung von Wertschätzung haben Resch & Bellhäuser (in prep.) das Konstrukt "Wahrgenommene Wertschätzung in Sozialen Interaktionen" (engl. Experienced Appreciation in Social Interactions"; EASI) entwickelt. Die Zugehörige EASI Work Skala* mit insgesamt k=15 Items für Kolleginnen und k=15 Items für direkte Vorgesetzte als Quelle von erfahrener Wertschätzung wurde zunächst im Arbeitskontext erprobt und validiert. Innerhalb der Untersuchung von EASI in einem Mehr-Studien-Design mit zwei Stichproben (N=231; N=391) bestätigte sich sowohl die theoretische Grundlage des Modells als auch die Annahme der Zusammenhänge zwischen EASI auf der einen Seite und der Zufriedenheit, Motivation und emotionalen Erschöpfung von Arbeitnehmenden auf der anderen Seite (Resch & Bellhäuser, in prep.). Als theoretische Grundlage für den angenommenen Wirkmechanismus dient die Stress as Offense to Self-Theorie (SOS) nach Semmer et al. (2019). Diese nimmt an, dass das Aufbauen und Aufrechterhalten eines positiven Selbstwertes ein grundlegendes, menschliches Bedürfnis darstellt. Wird der Selbst wert - und damit eben auch dieses Bedürfnis - nun angegriffen, so kommt es zu einem Stresserleben innerhalb der betroffenen Person. Der Selbstwert kann entweder gesteigert ("boost") oder angegriffen ("threat") werden (Pfister et al., 2020; Stocker et al., 2014). Die Wertschätzung, die Arbeitnehmende durch Ihre Kolleginnen und/ oder direkten Vorgesetzten erfahren, stellt einen solchen Angriff (sofern gering ausgeprägt) oder eine solche Steigerung (sofern hoch ausgeprägt) des Selbstwertes dar (Resch & Bellhäuser, in prep.). Kehrt man zur Ausgangslage des aktuellen, wissenschaftlichen Standes im Hinblick auf erfahrene Wertschätzung zurück, so zeigt sich, dass diese nicht nur für Arbeitnehmende, sondern ebenfalls für Studierende (Carstensen et al., 2021) und Schülerinnen (Tian et al., 2015) relevant ist. Zugleich zeigt sich auch in diesem Kontext eine starke Inkongruenz im Hinblick auf die Definitionen und Operationalisierungen von Wertschätzung, was wiederum zu einer Forschunglücke und uneindeutigen und wenig vergleichbaren Ergebnissen führt. Darüber hinaus stellt sich die Frage, inwieweit der erfahrene Wertschätzung neben dem Selbstwert auch eine relevante Rolle im Hinblick auf die individuelle Selbstwirksamkeitserwartung zukommt, wenn man diese in das Modell der 4 Quellen der Selbstwirksamkeit nach Bandura einordnet (Abderhalden & Jüngling, 2019). Aus diesem Grund ist es das Ziel der durchgeführten Studie (1) das Konstrukt EASI auf den Schulkontext zu übertragen, (2) theoretische Prämissen der SOS Theorie zu replizieren und (3) die erwarteten positiven Zusammenhänge zwischen erfahrener Wertschätzug und der Zufriedenheit, Motivation und Selbstwirksamkeitserwartung von Schülerinnen zu untersuchen; (4) kontrolliert um individuelle Persönlichkeitseigenschaften der Schülerinnen. Hierfür wurden N=461 Schülerinnen der Klassenstufen 5 - 9 in einer längsschnittlichen Tagebuchstudie an Gymnasien in Rheinland-Pfalz befragt (5. Klasse: n=100, 6.Klasse: n=104, 7. Klasse: n=22, 8. Klasse: n=199, 9. Klasse: n= 26; M_Gesamt=12,0 Jahre, SD=1,5 Jahre; n=179 weiblich, n=259 männlich, n=13 non-binär oder keine Angabe). Nach einer ersten querschnittlichen T1-Fragebogen-Erhebung füllten diese über einen Zeitraum von vier Wochen täglich morgens im Schulunterricht eine Tagebucherhebung aus (Gesamtrücklauf: K=5.327 Tagebuch-Einträge). Abgeschlossen wurde die Tagebucherhebung durch eine zweite T2-Fragebogen-Erhebung. In der Posterpräsentation werden theoretische Herleitung, Design und Probandinnen-Akquise, sowie Ergebnisse zur Reliabilität, Validität und im Hinblick auf die Verlaufsdaten und Multilevel-Analysen dargelegt und diskutiert. Poster KommSchreib! Ein Projekt zur Förderung von Schreibkompetenz, -motivation und sozialer Partizipation Josephine Gatzweiler, Pia Sieveke, Stefanie van Ophuysen, Sina Schürer, Vera Busse, Yvonne Erhardt Uni Münster, Deutschland Theoretischer Hintergrund und Fragestellung:* Kompetentes Schreiben ist eine Schlüsselkompetenz des 21. Jahrhunderts, die nicht nur zur gesellschaftlichen Partizipation und beruflichem Aufstieg befähigt (s. Busse, 2022), sondern auch für schulischen Erfolg im Allgemeinen sowie den erfolgreichen Übergang nach der Grundschule von zentraler Bedeutung ist (s. Cutler & Graham, 2008). Die Anbahnung entsprechender Textproduktionskompetenzen sollte bereits in der Grundschule erfolgen, wobei insbesondere ein prozessorientierter Ansatz, in dem Strategien zur Planung, Organisation und Überarbeitung eigener Texte vermittelt werden, für jüngere Lernende vielversprechend scheint (z.B. Cutler & Graham, 2008; s. Meta-Analyse Graham & Sandmel, 2011). Das Verfassen von Texten ist für viele Lernende herausfordernd, wobei herkunfts- und migrationsbedingte Leistungsdisparitäten gerade beim Schreiben besonders stark ausgeprägt sind und ein erhöhter Unterstützungsbedarf bei Lernenden besteht, in deren Familien nicht die Verkehrssprache gesprochen wird (Müller & Busse, 2023). Damit einhergehend ist die Förderung von Schreibmotivation und Selbstwirksamkeit bedeutsam, damit Lernende auch zukünftig Schreibprozesse initiieren und bei Schwierigkeiten persistieren (s. Busse et al., 2023). Neben der Förderung des Schreibens und der (Schreib-) Motivation ist die Ermöglichung von sozialer Partizipation aller Kinder ein wichtiges Ziel inklusiver Bildung (s. Grosche, 2015). Soziale Partizipation impliziert die Beteiligung an Interaktionen, das Erleben von Freundschaft, die Anerkennung durch Peers sowie die Wahrnehmung des Eingebundenseins (s. Koster et al., 2009). Da vor allem Kinder mit Migrationshintergrund zu einer Risikogruppe gehören (s. Cavicchiolo et al., 2020, Schürer et al., 2022), sind für sie Maßnahmen zur Stärkung sozialer Teilhabe besonders wichtig. Das vom BMBF-geförderte Projekt KommSchreib! fokussiert die Frage, wie die Textproduktion als zentraler Bereich der Schreibkompetenz sowie Schreibmotivation und Partizipation durch formelle (unterrichtliche) und informelle (außerunterrichtliche) schulische Lerngelegenheiten gefördert werden können. Um Schreibkompetenz, Schreibmotivation und die soziale Partizipation in der Intervention gemeinsam zu adressieren, wird verstärkt auf kooperative Lernformen beim Schreiben sowie auf Peer-Feedback gesetzt. Dies ist zur Förderung der Schreibkompetenz wirksam (Graham et al., 2012; Koster et al., 2015) und kann die Schreibmotivation unterstützen (s. Camacho et al., 2021). Kooperatives Lernen kann zudem als „Methode mit der höchsten Relevanz für die Förderung sozialer Integration“ betrachtet werden (Huber, 2019, S. 33), da sie den positiven Kontakt zwischen den Kindern fördert (Kontakthypothese). Darüber hinaus ist die Qualität der Lehrkraft-Lernenden-Beziehung für die soziale Partizipation von zentraler Bedeutung (Endendijk et al., 2022). Auf der Grundlage von zwei zentralen Interventionselementen (Montagsspiel, Lob-Memory) soll im Rahmen des Projekts das Interaktionsverhalten zwischen den Lernenden positiv beeinflusst werden, um darüber die soziale Partizipation der Lernenden zu verbessern. Methode: Das Projekt ist als (quasi)experimentelle Interventionsstudie mit einem Warte-Kontroll-Gruppendesign (Pre- und Posttest) angelegt. Die Stichprobe umfasst elf Grundschulen (~ 1.500 Schülerinnen der dritten und vierten Klasse). Um die Wirksamkeit der Intervention zu prüfen, werden schriftliche Lernenden- und Lehrkräfte-Befragungen sowie Lehrkräfteinterviews durchgeführt. Aufbauend auf theoretischen Vorüberlegungen und empirischen Befunden wurden im ersten Teil des Projektes in Kooperation mit Praxispartnerinnen an Grundschulen Interventionsinhalte und entsprechende Unterrichtsmaterialien entwickelt. Im zweiten Teil des Projektes wurden die Lehrkräfte im Hinblick auf die unterrichtliche Implementation von kooperativen prozessorientierten Schreib- und Feedbackaktivitäten sowie bezüglich weiterführender Aktivitäten zur Unterstützung sozialer Partizipation geschult. Zurzeit erfolgt an den Schulen der Experimentalgruppe die Implementierung im Regelunterricht durch die Lehrkräfte. In enger Verzahnung mit der Intervention in der Hauptstudie werden zusätzlich Schreib-AGen im Offenen Ganztag durchgeführt. Ergebnisse: Das Poster wird den theoretischen Hintergrund und das Design darstellen sowie Einblicke in die Lehrmaterialien geben. Wir hoffen zudem, erste Ergebnisse aus der Lernenden- und Lehrkräfte-Befragungen zu präsentieren. Poster ‚Programmieren von Robotern‘ – Wirksamkeit einer short-term-Intervention zur Förderung von Interesse und Selbstwirksamkeit sowie der Kreativität von Grundschulkindern Helvi Koch¹, Simon Baumgartner², Marianne Schüpbach¹ ¹Freie Universität Berlin, Deutschland; ²Pädagogische Hochschule Zürich, Schweiz Digitale Kompetenz ist in der heutigen Zeit essentiell, um am gesellschaftlichen Leben teilzuhaben (European Commission, 2022). Bereits für Grundschulkinder sind digitale Medien alltäglicher Bestandteil der außerschulischen Lebenswelt (KIM-Studie, 2020) und aufgrund dessen sollten sie auch innerschulisch nutzbar gemacht werden (Döbeli Honegger, 2017). Diesen Imperativ aufgreifend wird digitale Medienbildung in grundschulbezogenen Curricula und Empfehlungen als explizites Bildungsziel benannt (KMK, 2016; 2021). Dass das Lernen mit digitalen Medien mehr Lernpotential birgt, als lediglich die digitale Technik und die entsprechenden Applikationen bedienen zu können, wurde bereits mehrfach diskutiert (bspw. Giest, 2016; Iron, Peschel & Schmeinck, 2023). Auch gehe es nicht nur um Coding-Kenntnisse und um die Förderung rein technischer Problemlösekompetenz (Bergmann, 2023), sondern um Transferleistungen und insbesondere darum, digitale Medien zu nutzen (Baumgartner, in Vorb.), um kreative Lösungswege zu finden (Schmeinck, 2022), mithin kreativ gestalterisch tätig zu werden (Ferrari, 2012; Kafai & Burke, 2014). Zudem können sich die Schüler:innen beim Programmieren als selbstwirksame Konstrukteur:innen erleben und dadurch die die digitale Welt aktiv und kreativ mitgestalten (Bergner et al., 2018). Grundschulkinder haben insgesamt ein ausgeprägtes Interesse an digitalen Medien (KIM, 2020) und als Digital Natives sind sie prädispositioniert, hohe digitale Kompetenzen auszubilden. Ob sich das Interesse an digitalen Medien sogar noch steigern lässt, wenn Kinder konkrete Herausforderungen mittels digitaler Medien im Rahmen eines spezifischen Interventionsangebots meistern, wurde bislang noch nicht empirisch untersucht. Ob sich durch ein solches Angebot die Kreativität und die Selbstwirksamkeit der Kinder verbessern lassen, wurde ebenfalls noch nicht empirisch abgesichert. Die vorliegende Pilotstudie geht daher der Frage nach, ob sich durch eine spezifische Short-Term-Intervention zum kreativ-gestalterischen Einsatz von digitalen Medien im Grundschulunterricht (1) das Interesse an digitalen Medien, (2) die Selbstwirksamkeit hinsichtlich des Umgangs mit digitalen Medien sowie (3) die Kreativität steigern lassen. Ziel der Studie war also zum einen, die Wirksamkeit des Interventionsangebots auf Schülervariablen zu untersuchen, zum anderen wurde die generelle Implementierbarkeit der manualisierten Short-Term-Intervention geprüft. Das Interventionsangebot adressierte die digitale Bildung am Beispiel des Programmierens von Robotern (vgl. Dziubany, 2017; Koch & Giest, 2020), welches im Rahmen eines universitären Forschungsseminars von Lehramtsmaster-Studierenden als Projekttag an einer Ganztagsgrundschule durchgeführt wurde. An der Untersuchung nahmen insgesamt N = 156 Drittklässler teil. Das Studiendesign folgte einem Pre-Posttest-Untersuchungsplan mit Interventions- und Kontrollgruppe und die Wirksamkeit wurde anhand eines standardisierten und zweier selbstkonstruierter Instrumente überprüft (adaptierte und auf digitale Kompetenz ausgerichtete Skalen der IGLU sowie der KVS-P von Krampen et al., 1996 mit den Subskalen Ideenflüssigkeit und Ideenflexibilität zur Messung der Kreativität). Mit der Pilotstudie konnte gezeigt werden, dass sich die Intervention an einer Grundschule als Projekttag implementieren lässt. Inferenzstatistisch wurde die Effektivität des Interventionsangebots mit Messwiederholungsvarianzanalysen geprüft. Für die Selbstwirksamkeit hinsichtlich des Umgangs mit digitalen Medien wurde ein signifikanter Haupteffekt für den Faktor Zeit, F(1,155) = 14.13, p < .001, η² = .09 und ein signifikanter Interaktionseffekt für Zeit x Gruppe identifiziert, F(1,155) = 13.03, p < .001, η² = .09. Auch für die Kreativität konnte ein signifikanter Haupteffekt für den Faktor Zeit, F(1,155) = 70.55, p < .001, η² = .33 und ein signifikanter Interaktionseffekt für Zeit x Gruppe identifiziert werden, F(1,155) = 4.54, p < .05, η² = .03. Erwartungsgemäß zeigten Kinder der Interventionsgruppe nach der Intervention somit eine ausgeprägtere Selbstwirksamkeit und eine höhere Kreativität im Vergleich zu Kindern der Kontrollgruppe. Die Ausprägung des Interesses der Interventionskinder an digitalen Medien unterschied sich sowohl zum ersten als auch zum zweiten Messzeitpunkt hingegen nicht signifikant von der Ausprägung des Interesses der Kontrollgruppenkinder. Es lag kein statistisch bedeutsamer Effekt für den Interaktionsfaktor Zeit x Gruppe vor, F(1,155) = 137.00, p = n.s., η² = .09. Ein Effekt für den Hauptfaktor Zeit konnte ebenfalls nicht nachgewiesen werden, F(1,155) = 700.00, p = n.s., η² = .005. Poster Der Einfluss von Testen auf den Transfer beim Lernen von historischen Aussagen Samuel Bellinghausen, Jonathan Barenberg Universität Münster, Deutschland Theoretischer Hintergrund Der Befund, dass der aktive Abruf eines Gedächtnisinhalts zu einer verbesserten Behaltensleistung gegenüber neuerlichem Einprägen führt, wird in der experimentellen Gedächtnispsychologie als Testeffekt bezeichnet und konnte über verschiedene Populationen und Lerninhalte hinweg beobachtet werden (Roediger & Butler, 2011; Rowland, 2014). Tests sind somit nicht nur ein Mittel, um einen Leistungsstand zu erheben, sondern können eine Lerngelegenheit darstellen (Karpicke, 2017). Von großer praktischer Relevanz ist die Frage, ob der Vorteil des Testens auch dann besteht, wenn sich ein im Übungstest geforderter Abruf vom späteren finalen Test unterscheidet, dort also ein Transfer des Gelernten gefordert ist (Pan & Rickard, 2018). Ein vergleichsweise naher Transfer liegt bei Testformaten vor, bei denen sich die Testungen lediglich dadurch unterscheiden, welche Teilinformationen eines grundsätzlich identischen Lernmaterials als Hinweisreiz zur Verfügung stehen und welche als Antwort abgefragt werden (Barnett & Ceci, 2002). In bisherigen Studien war bei Lernmaterialien, die aus drei und mehr Elementen bestehen (z.B. Worttripel oder historische Aussagen), häufig kein Transfereffekt auf zuvor ungetestete Informationen, sondern lediglich ein Testeffekt für bereits im Übungstest abgefragte Bestandteile zu beobachten, was die praktische Bedeutung des Testeffekts stark einschränken würde (Hinze & Wiley, 2011; Pan et al., 2016). Die Joint Conditions Hypothesis von Rickard und Pan (2020) postuliert, dass bei einer Hinweisreiz-Antwort-Neuanordnung in den Fällen ein positiver Transfereffekt auftritt, in denen nicht zwei Bedingungen gleichzeitig vorliegen: (a) zwei oder mehr Hinweisreize werden im Übungstest präsentiert und (b) das im finalen Test abgefragte Element ist ein vorheriger Hinweisreiz. In einer Studie mit Worttripeln als Lernmaterial konnte bei Nichterfüllung der ersten Bedingung im Einklang mit der Joint Conditions Hypothesis in der Tat ein Transfereffekt auf im Übungstest nicht getestete Bestandteile nachgewiesen werden (Rickard & Pan, 2020). Fragestellung Ziel der vorliegenden Untersuchung ist es, die aktuelle Befundlage zu ergänzen und insbesondere das Auftreten von Transfereffekten bei authentischeren Lernmaterialien (wie historischen Aussagen mit drei zentralen Bestandteilen), unter Berücksichtigung der Joint Conditions Hypothesis, zu überprüfen. Methode Die Untersuchung wurde mit 30 Geschichtsstudierenden an zwei Terminen online durchgeführt. Beim ersten Termin wurden zunächst alle 24 Aussagen zum Lernen präsentiert. Im Anschluss daran wurde die Testbedingung innerhalb der Probandinnen variiert: Acht Aussagen wurden erneut komplett präsentiert (Kontrollbedingung), in acht Aussagen wurde der Abruf von zwei Informationen geübt, die im Abschlusstest als Hinweisreize dienten (umgekehrte Testung), und in acht Aussagen wurde der Abruf der Zielinformation des Abschlusstests und einer weiteren Information geübt (umgestellte Testung). In beiden Testbedingungen war somit die erste Bedingung der Joint Conditions Hypothesis* für ausbleibenden Transfer verletzt und ein Vorteil des Testens gegenüber dem neuerlichen Einprägen zu erwarten. Die Testungen erfolgten als Lückentext mit Feedback (korrekte Antwort). Die Gesamtzeit der Beschäftigung mit den Aussagen war in allen Bedingungen identisch. Die Zuteilung der Aussagen zu den drei Testbedingungen wurde über alle Teilnehmenden ausbalanciert. Beim zweiten Termin (eine Woche später) erfolgte der Abschlusstest ebenfalls als Lückentext, in dem in allen Bedingungen die gleiche Teilinformation abgefragt wurde. Ergebnisse Eine ANOVA ergab einen signifikanten Effekt des Faktors Testbedingung auf die Erfolgsquote im Abschlusstest (F(2,58)=6.31, p=.003, ηp²=.179). In paarweisen post-hoc-Bonferroni-Holm-Vergleichen zeigte sich, dass Studierende signifikant mehr Lücken in der umgestellten Testung, in der die relevante Lücke bereits im Übungstest abgefragt worden war, beantworten konnten als in den beiden anderen Bedingungen. Anders als erwartet, unterschieden sich die korrekten Antworten in Kontroll- und umgekehrter Testbedingung nicht. Diskussion Als Erklärung für den ausbleibenden Transfereffekt auf zuvor nicht getestete Bestandteile kommen strukturelle Unterschiede zwischen Worttripeln und (vermeintlich) dreiteiligen Aussagen, die sich womöglich nicht auf drei bedeutungstragende Elemente reduzieren lassen, in Betracht. Im Hinblick auf den Einsatz von Tests in authentischen Unterrichtskontexten weisen die Befunde auch auf die Bedeutung von extensiven Feedbackformen hin, die über korrektives Feedback hinausgehen (Pan et al., 2019). Poster Measuring Cognitive Ability From Young Age: Presenting a New Test Battery for Working Memory Capacity Benjamin Goecke¹, Johanna Hartung², Luc Zimny⁴, Jessika Golle¹, Patrick Lösche³, Oliver Wilhelm⁴ ¹Universität Tübingen, Deutschland; ²Universität Bonn, Deutschland; ³DIPF Leibniz-Institut für Bildungsforschung, Deutschland; ⁴Universität Ulm, Deutschland Cognitive abilities predict children’s future achievements, including school readiness, success in school, and academic achievement. However, measuring cognitive ability in young children is challenging because existing measurement instruments often require some basic level of curricular education which is problematic regarding the fairness of such measurement instruments. Additionally, existing measurement instruments for young children that do not require such basic levels of prior knowledge, for example tests of figural reasoning ability, are only hardly connectable to further ages. Thus, longitudinal studies of cognitive abilities spanning from childhood to adulthood are often limited by applying different measurement instruments at different ages. With the present work, we aim to remedy this situation. Extensive research has unveiled the fundamental mechanisms of working memory capacity (WMC) and has established WMC as a pivotal factor in individual differences in cognitive abilities. Thereby do tests of WMC assume no prior educational knowledge in the form of language mastery or numerical comprehension and should thus provide a better measure of basic cognitive performance. Thus, tests of WMC are ideally suited as an indicator of general cognitive functioning in children, adolescents, and adults. Nevertheless, available instruments for measuring WMC in children are unsatisfying in terms of a) operational continuity with conventional measures for adolescents and adults, b) multivariate nature of measurement, and c) implementation of established paradigms. Across several pilot studies and three main studies (N_total > 1000), we developed and validated a tablet-based WMC test battery which uses established WMC paradigms that can be applied from preschool to adult age. In study 1, we developed three child-contextualized WMC tests and investigated their difficulty, reliability, and validity in a sample of N = 343 first graders. In study 2, we extended the evidence for child-contextualized and age-adapted parametrizations of our tasks in a sample of N = 379 fifth to tenth graders. Further, we provide evidence that the child-contextualized tests are nearly identical to structurally equivalent conventional WMC tests with more abstract stimuli (ρ = .90) and that the new battery correlates strongly with a measure of fluid intelligence (ρ = .80). Study 3 is conceptualized as a longitudinal study with two measurement time points (t1 at the beginning of first grade, t2 at the end of first grade) and is currently ongoing with N ~ 130 children. In this study, we investigate the re-test reliability of the WMC tests and examine the relationship of WMC test performance with socio-demographic variables. Across all studies, we found strong evidence for good psychometric properties of the test battery for all assessed age groups. The tests pave the way for the identification of cognitive potential at young age and for follow-up longitudinal studies across the life span. The test battery is an easy-to-use tool for assessing WMC from preschool to adulthood, is applicable for all ability levels, can easily be adapted in terms of difficulty, and can be freely used for research purposes. We argue that our newly developed tests bear great potential for cross-national research due to their low requirements on literacy. The implemented audio-instructions can easily be exchanged to other languages and the tablet-based administration facilitates the distribution of test materials significantly. In addition to presenting a poster on our work, we will provide a hands-on experience of the test battery on site. Poster Digitale Kommunikation und Kollaboration: Eine Bedarfsanalyse zur kollegialen Nutzung von Videokonferenzen in der Schule Simone Malz, Marion Prof. Dr. Händel, Simon Biller Hochschule für angewandte Wissenschaften Ansbach, Deutschland Theoretischer Hintergrund Nach einer intensiven Phase der Digitalisierung an Schulen ist noch unklar, wie das sich das "new normal" nach der Corona-Pandemie im Schulkontext gestaltet (Siddiq et al., 2023). In den meisten Berufsfeldern sind Videokonferenzen als digital-gestützte Möglichkeit der Kommunikation und Kollaboration nicht mehr weg zu denken. Doch welche Rolle spielen sie im Arbeitsalltag von Lehrkräften und wie können Videokonferenzen die kollegiale Zusammenarbeit an Schulen fördern? Videokonferenzen ermöglichen ortsungebundene Kommunikation und können Teilnehmende in Kommunikations- und Interaktionssituationen versetzen, die vergleichsweise ähnlich zu analogen Kommunikationssituationen sind, da sie synchrone, mündliche sowie visuelle Kommunikation ermöglichen. Dies sind ideale Bedingungen, um soziale Präsenz (Hofer, 2023) erlebbar zu machen und dadurch die Qualität sozialer, medienvermittelter Interaktion zu erhöhen (vgl. Chew & Ng, 2021). Videokonferenzen haben somit möglicherweise das Potenzial, kollegiale Kooperation in der Schule zu unterstützen – einem Arbeitsfeld, in dem kollegiale Kollaboration eher die Ausnahme scheint (Richter & Pant, 2016) und das gleichzeitig durch den zunehmenden Lehrkräftemangel belastet ist (Bieber et al., 2020). Die Nutzung digitaler Technologien im schulischen Kontext scheint allerdings mit Unsicherheiten und Widerständen verbunden zu sein (Gerick et al., 2023). Gemäß der Unified Theory of Acceptance and Use of Technology (UTAUT; Venkatesh, 2003) hängt die Akzeptanz und Verwendung von Videokonferenzen stark von der Wahrnehmung der Benutzenden hinsichtlich ihrer Effektivität, des Nutzens für die Kommunikation und Kooperation, aber auch der Unterstützung durch Kolleg:innen und der Anwenderfreundlichkeit ab (Bailey et al., 2022) – Faktoren, die es auch im schulischen Kontext zu berücksichtigen gilt. Die vorliegende Studie zielt darauf ab, Beratungs- und Fortbildungsbedarf zur Nutzung von Videokonferenzen und digitaler Kommunikation aus Sicht von Lehrkräften zu erforschen. Fragestellung Insgesamt werden drei Fragestellungen untersucht: Wie sicher fühlen sich Lehrkräfte bei der Durchführung von und dem Beziehungsaufbau in Videokonferenzen? Sehen sie hier Fortbildungs- oder Beratungsbedarf und in welcher Form? Inwiefern sehen Lehrkräfte Bedarf, kollegiale Kommunikationsstrukturen durch digitale Lösungen effizienter zu gestalten? Welche Widerstände spüren Lehrkräfte in Bezug auf die Digitalisierung der kollegialen Zusammenarbeit und welche Maßnahmen würden ihnen helfen diese zu überwinden? Methode Zur Beantwortung der Fragestellungen ist eine Bedarfsanalyse mit Lehrkräften sowie weiteren Akteur:innen aus dem Schulumfeld geplant. Anhand von strukturierten Interviews mit offenen und geschlossenen Fragen sollen die Bedarfe für Fortbildung zur erfolgreichen digitalen Kommunikation und Kooperation unter Berücksichtigung bestehender Rahmenbedingungen ermittelt werden. Um einen möglichst ganzheitlichen Einblick in die schulischen Bedarfe zu erhalten, ist geplant, Akteur:innen verschiedener Schulformen sowie verschiedener Funktion wie beispielsweise Schulleitungen, Fachgruppenleitungen, Lehrkräfte sowie sozialpädagogisch Mitarbeitende zu berücksichtigen . Die erhaltenen Daten werden in Anlehnung an Schulze-Vorberg et al. (2021) anhand eines Kodiermanuals und unterstützt durch die Software MAXQDA ausgewertet. Zu erwartende Ergebnisse und Ausblick Die Bedarfsanalyse wird im Frühjahr 2024 abgeschlossen sein, so dass bis zur GEBF Konferenz im März 2023 erste Ergebnisse vorliegen werden. Die erhobenen Daten werden Einblicke in bestehende Strukturen, Herausforderungen und Potenziale digitaler Kommunikation und Kooperation im Arbeitsfeld Schule liefern. Basierend darauf werden perspektivisch Fortbildungs- und Beratungsmodule entwickelt, deren Inhalte und Materialien sich eng an den Ergebnissen der Bedarfsanalyse orientieren. Langfristiges Ziel ist die selbstregulierte Nutzung digitaler Kommunikationswerkzeuge und eine effiziente Kommunikationsgestaltung. Eingebettet sind die Studie sowie die Materialentwicklung, -evaluation und -verstetigung in ein deutschlandweites Verbundprojekt zur digitalen Schulentwicklung. Poster Entwicklung und Validierung einer deutschen Bias Awareness Skala für Geschlechtsstereotype von MINT-Lehrkräften Katharina Fink^1,4, Meike Bonefeld^3,4, Hanna Beißert^1,2,4 ¹DIPF \| Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ²Goethe Universität Frankfurt am Main; ³Universität Freiburg, Institut für Erziehungswissenschaften; ⁴IDeA-Zentrum Im MINT-Bereich lässt sich eine erhebliche Differenz der Geschlechterverteilung finden. Unabhängig davon, ob man sich die Berufswahl, die Studiengänge oder die belegten Kurse in der Schule ansieht, stellt man Diskrepanzen zwischen der Anzahl an männlichen und weiblichen Teilnehmenden im MINT-Bereich fest (Brotman & Moore, 2008; Makarova et al., 2019). In vergangenen Studien konnte als einer der möglichen Gründe dafür vorhandene Geschlechterstereotype identifiziert werden (Wang & Degol, 2017). Definiert werden Stereotype als verallgemeinernde, aber nicht unbedingt richtige Überzeugungen über eine bestimmte Gruppe von Personen, die anhand eines bestimmten Merkmales, hier das Geschlecht, kategorisiert werden (Becker-Carus & Wendt, 2017). Verschiedene Studien haben gezeigt, dass Lehrkräfte in den MINT-Fächern immer noch viele Vorurteile und Stereotypen haben (Beißert, McGuire & Mulvey, 2022). Da ein deutsches Kind mindestens 10 Jahre seines Lebens in der Schule verbringt und dabei von Lehrern und Lehrerinnen umgeben ist, die den Kindern ihre Einstellungen und Überzeugungen vermitteln und somit auch zukünftige Entscheidungen der Kinder beeinflussen, scheint es sinnvoll die Stereotype der Lehrkräfte zu reduzieren (Muntoni & Retelsdorf, 2020). Ein möglicher Weg dafür ist Bewusstsein für die eigenen Stereotype zu schaffen. Bargh (1999) geht davon aus, dass man sich seinen Stereotypen bewusst sein muss, um an ihnen arbeiten und sie reduzieren zu können. Wenn Menschen auf die Diskrepanzen zwischen ihren Werten und ihren möglicher Weise stereotypbasierten Einstellungen und Verhaltensweisen aufmerksam gemacht werden, kann dies zu weniger Vorurteilen und einem geringeren Ausmaß an Diskriminierung führen (Grube et al., 1994; Penner, 1971). Perry et al. (2015) führten erstmal den Begriff „Bias Awareness“ ein und definierten ihn als „die individuellen Unterschiede in der Sensibilität und Besorgnis der Menschen gegenüber ihrem Ausdruck subtiler Voreingenommenheit“ (2015, S. 1). Sie erklären weiter, dass dazu die Motivation zur Unvoreingenommenheit, die Anerkennung von Unstimmigkeiten, die Abwehrhaltung bei Konfrontationen und die Fähigkeit, die eigene Voreingenommenheit zu kompensieren, gehören. Bisher gibt es jedoch keine spezifische Skala, die das Bewusstsein der Lehrkräfte für ihre eigenen geschlechtsbezogenen Stereotypen erfasst. Ziel dieser Studie war es daher, eine deutsche Bias Awareness Skala für Geschlechterstereotype speziell für Lehrkräfte und den MINT-Kontext zu erstellen. Dafür wurde ein Item-Pool mit 32 Items erstellt, der zusätzlich zu den selbst generierten Items, bereits vorhandene Items aus etablierten Fragebögen nutzte, die inhaltlich angepasst wurden. Vorläufige Analysen wurden mit den Daten von 42 Lehrkräfte und Lehramtsstudierende (71% weiblich, 23% männlich, 2% divers) mit MINT-Fächern durchgeführt. Durch die Durchführung einer Hauptkomponentenanalyse mit einer Oblimin-Rotation sowie einer explorativen Faktoranalyse konnte eine Drei-Faktor-Struktur herausgearbeitet werden. Um die finale Skala so anwendungsfreundlich und daher kurz wie möglich zu gestalten, sowie gleichzeitig das Konstrukt valide zu erfassen, wurde sich für vier Items pro Faktor entschieden. Es wurden lediglich die Items mit der höchsten Faktorladung pro Faktor verwendet. Letztendlich blieben 12 Items, welche die finale Skala bilden. Diese zeigt mit einem Cronbachs Alpha von .84 eine gute interne Konsistenz (Blanz, 2015). Die erstellte Skala soll es ermöglichen, das Bewusstsein der eignen Stereotype zu erfassen und liefert daher eine bislang noch fehlende Basis, um Ansatzpunkte für Interventionsverfahren zur Reduzierung dieser Stereotype zu überprüfen und somit die Geschlechtsdisparitäten im MINT-Bereich zu verändern. Disclaimer: Bei den berichteten Ergebnissen handelt es sich um Ergebnisse von vorläufigen Analysen. Die Datenerhebung wurde noch nicht abgeschlossen, da ein N von mindestens 60 Personen angestrebt wird. Auf der GEBF 2024 werden ausschließlich finale Ergebnisse präsentiert. Poster Evidenzorientierte Lehre in der Schule - Beeinflusst die Betreuung von Lehramtsstudierenden Einstellungen von Lehrkräften? Linda Schirle, Christine Sälzer Universität Stuttgart, Deutschland Theoretischer Hintergrund Wissenschaftliche Erkenntnisse legen nicht von selbst spezifische situationsbezogene Lösungsansätze für die Schulpraxis nahe und eignen sich deshalb nicht als Zutaten für ein Rezept gelungenen Unterrichts. Die Berücksichtigung wissenschaftlichen Wissens bei professionellen Entscheidungen von Lehrkräften kann jedoch als rational gestütztes „Problembewusstsein, als Leitfaden und Hilfestellung, als Ergänzung und Korrektiv“ (Bauer et al., 2015, 2f) dienen. Diese eher moderate Forderung nach einem evidenzorientierten Denken und Handeln von Lehrkräften (EDHL) hat sich mittlerweile in einem stetig wachsenden Forschungsfeld etabliert (Bauer & Kollar, 2023). Wie Rochnia et. al (2022) herausarbeiten, reicht allerdings allein die Aufbereitung und zur Verfügungstellung von Evidenz, eingeordnet in Theorien (vgl. Bromme et al., 2014), nicht aus und die zentrale Herausforderung besteht in der Förderung der tatsächlichen Nutzung des bestehenden Angebots. Hierzu werden immer wieder ungünstige Einstellungen bei Lehramtsstudierenden wie Lehrkräften festgestellt (bspw. Voss, 2022 ; Thomm et al., 2021). So werden aktuell Transfer-Bestrebungen gefördert, die den Dialog zwischen Wissenschaft und Praxis im Bildungssystem vorantreiben sollen (bspw. lernen:digital). Ein bereits bestehender Kanal zwischen den lehrkräftebildenden Hochschulen und den Schulen sind die schulpraktischen Studien. Hier arbeiten Lehrkräfte in bestimmten Ausbildungsphasen mit Lehramtsstudierenden zusammen, die im Rahmen ihres Studiums das EDHL erlernen sollen (Bauer et al., 2015). Diese Zusammenarbeit könnte als Möglichkeit eines gezielten „Theorieschock[s]“ für die erfahrenen Lehrkräfte (Maennig-Fortmann et al., 2022) und als boundary crossing zwischen Theorie und Praxis betrachtet werden. Fragestellung Mit einem Blick auf das Forschungsfeld zum EDHL soll sich das dem Beitrag zugrunde liegende Promotionsvorhaben insbesondere der Fragestellung widmen: Können Einstellungen von Lehrkräften gegenüber evidenzorientierter Lehre und der empirischen Bildungsforschung durch eine Zusammenarbeit mit Lehramtsstudierenden – die das EDHL in ihrer universitären Ausbildung erwerben sollen – beeinflusst werden? Methode Anhand eines digitalen Fragebogens werden verschiedene Gruppen von Lehrkräften an drei Messzeitpunkten eines Schuljahres zu ihren Einstellungen gegenüber evidenzorientierter Lehre und der (Bildungs-)Wissenschaft befragt. Hierbei werden die Lehrkräfte nicht zufällig in die Gruppen eingeteilt, sondern sie entscheiden sich freiwillig (oder auf Anfrage der Schulleitung) dafür, eine bestimmte Art der Betreuung von Lehramtsstudierenden zu übernehmen. So lassen sich für das quasi-experimentelle Forschungsdesign zwei Experimentalgruppen (Betreuung von Studierenden in der Schulpraxis) und eine Kontrollgruppe (aktuell keine Betreuungsaufgabe) bilden, die sich jeweils aus Gymnasiallehrkräften unterschiedlicher Fächer zusammensetzen. Experimentalgruppe 1 bilden Lehrkräfte, die über ein Schuljahr hinweg die Betreuung von einzelnen Studierenden in einem Praktikumsprojekt übernehmen und verschiedene universitäre Angebote, u.a. zur Förderung evidenzorientierter Lehre, erhalten. Daneben bilden die Ausbildungslehrkräfte, welche in Baden-Württemberg die regulären Schulpraktika (dreiwöchiges Orientierungspraktikum und zwölfwöchiges Praxissemester) betreuen und regelmäßige Fortbildungen der Seminare für Aus- und Fortbildung von Lehrkräften (SAFL) erhalten, die Experimentalgruppe 2. Die Kontrollgruppe setzt sich aus Lehrkräften zusammen, die aktuell keine offiziellen Betreuungsaufgaben übernehmen und somit auch nicht zu den spezifischen Fortbildungsmaßnahmen eingeladen sind. Um Effekte der Zusammenarbeit mit Studierenden im Rahmen der unterschiedlichen Betreuungsaufgaben zu untersuchen, soll je eine Befragung zu Schuljahresbeginn, zum Jahreswechsel und zum Schuljahresende stattfinden. Ergebnisse und ihre Bedeutung Das Poster präsentiert das Studiendesign und erste Ergebnisse des Pretests mittels Think-Aloud-Protokollen. Die Betrachtung von Lehrkräften mit unterschiedlichen Betreuungsaufgaben soll einen Einblick ermöglichen, inwiefern Einstellungen gegenüber der evidenzorientierten Lehre und der empirischen Bildungsforschung im Austausch mit Studierenden adressiert oder sogar verändert werden. In Verbindung mit der Möglichkeit, Angebote der Universität oder der SAFL zu besuchen, die teilweise gezielt die Nutzung von Evidenz thematisieren, könnte die Betreuung schulpraktischer Ausbildungsphasen als boundary crossing zwischen Schulpraxis und Wissenschaft eine gegenseitige Wertschätzung (Hartmann et al., 2016) und damit auch positive Einstellungen der teilnehmenden Lehrkräfte fördern. Erfolgsfaktoren sollen identifiziert und im Lauf des Projekts erprobt werden. Poster Schulformwechsel nach „Optimistic Choice“ – sozial-emotionale und motivationale Konsequenzen des Nicht-Bestehens eines Probejahrs am Gymnasium in Abhängigkeit von Übergangsempfehlung und familiärem Hintergrund Katharina Kohl IPN Kiel, Deutschland Der Übergang von Grundschule in Sekundarschule stellt ein wichtiges normatives Lebensereignis dar (Knoppick et al., 2018), doch nicht alle Schüler:innen verbleiben im Laufe ihrer Schullaufbahn auf der ursprünglich gewählten Schulform. Die vorliegende Studie befasst sich damit, wie Schüler:innen, die zunächst ein Gymnasium besuchten, dort aber die Leistungsziele nicht erreichten, einen Wechsel auf eine andere Schulform erleben. Im Fokus stehen dabei vorherige Bildungsentscheidungen, insbesondere eine sogenannte „optimistic choice“, also eine Übergangsentscheidung, bei der Eltern das Gymnasium wählen, ohne dass eine entsprechende Empfehlung durch die Grundschule vorliegt (Birkelund, 2020). Da sowohl optimistic choice als auch Bildungsverläufe in Deutschland stark mit familiären Hintergrundmerkmalen, insbesondere soziökonomischem Hintergrund sowie Zuwanderungsgeschichte der Eltern, zusammenhängen (Dollmann & Weißmann, 2020), werden diese Merkmale ebenfalls einbezogen. Zusammenfassend beschäftigt sich diese Studie mit der Frage, welche Rolle optimistic choice und familiärer Hintergrund für das Erleben eines Wechsels von Gymnasium auf Gesamtschule und für die sozial-emotionale und motivationale Anpassung nach dem Wechsel spielen. Methode Die Daten kommen aus der BERLIN-Studie (Maaz et al., 2013), einer Evaluationsstudie zur Reform des Sekundarschulsystems in Berlin, welches die beiden Schulformen Gymnasium und Integrierte Sekundarschule (ISS, mit gymnasialer Oberstufe) umfasst. Der Schulübergang findet nach Klasse 6 statt, die Entscheidung für die Sekundarschulform treffen die Eltern mit Empfehlung der Grundschulen. Klasse 7 des Gymnasiums ist ein Probejahr, Schüler:innen, welche die Leistungskriterien nicht erreichen, wechseln auf eine ISS. Das analytische Sample umfasst Daten von 2943 Schüler:innen, die zum Zeitpunkt der Befragung Klasse 9 einer ISS besuchten, darunter 565 Schüler:innen, die nach der Grundschule zunächst ein Gymnasium besuchten, dieses jedoch aufgrund ungenügender Leistungen verlassen mussten. Die Schüler:innen beantworteten u.a. Fragen zu Leistungsmotivation, akademischem und sozialen Selbstkonzept, Schulangst und Schulzufriedenheit (Ratingskala 1-4; Skalen aus ELEMENT und Übergang-Studie) sowie ihren letzten Zeugnisnoten. Schüler:innen mit Wechselerfahrung gaben außerdem an, wie sie den Wechsel damals und zum Zeitpunkte der Datenerhebung erlebten. Für eine Substichprobe (n = 1680, davon 264 mit Wechselerfahrung) liegen Daten zu Schulabschluss (kein Abitur/Abitur) und Geburtsland der Eltern (dreistufig) vor. Ergebnisse und Diskussion Vorläufige Analysen zeigen eine heterogene retrospektive Bewertung des Wechsels: 35% der Schüler:innen gaben an, den Wechsel damals als sehr negativ/negativ empfunden zu haben, 35% als neutral, 30% als positiv/sehr positiv. Aus aktueller Sicht bewerteten 20% den Wechsel als sehr negativ/negativ, 30% als neutral und 50% als positiv/sehr positiv. Unter Kontrolle der sozialen Unterstützung durch Eltern, Lehrkräfte und Mitschüler:innen fanden sich keine Zusammenhänge zwischen Wechselerfahrung und optimistic choice sowie familiärem Hintergrund. Hinsichtlich der Anpassung nach dem Wechsel zeigten regressionsanalytische Ansätze, dass Schüler:innen, die vom Gymnasium auf eine ISS gewechselt waren, bessere Durchschnittsnoten erzielten als ihre Mitschüler:innen auf der ISS ohne Wechselerfahrung, und zwar vor allem Schüler:innen mit optimistic choice (conditional effect b = -0.18, p < .001). Unabhängig von optimistic choice zeigten sich unter Kontrolle der Durchschnittsnote marginal höhere Lernmotivation (ß = .03, p = .060) sowie höheres akademisches Selbstkonzept (ß = .04, p = .008) bei Schüler:innen mit Wechselerfahrung, während sich für soziales Selbstkonzept und Leistungsangst keine Unterschiede ergaben. Für die Schulzufriedenheit zeigte sich ein Unterschied zwischen Schüler:innen mit und ohne Wechselerfahrung nur für Schüler:innen mit Gymnasialempfehlung (niedrigere Zufriedenheit, b = -0.30, p < .001), nicht aber für diejenigen mit optimistic choice. Diese Zusammenhänge hingen für keinen der Outcomes vom familiären Hintergrund ab. Insgesamt deuten diese ersten Befunde auf eine tendenziell positive Anpassung nach Wechsel von Gymnasium auf ISS hin, mit teilweise günstigeren Befunden für Wechsel nach optimistic choice. Genauere Analysen mit komplexeren Methoden (Moderationsanalysen, Propensity-Score Matching) und breiterer Datenbasis (erweiterte Stichprobe, Perspektive der Eltern, Längsschnittdaten) stehen noch aus. Die Befunde der vorliegenden Studie haben wichtige praktische Implikationen, z.B. für die Beratung von Eltern bei der Schulwahl oder die Gestaltung von Schulübergängen und Schulwechseln. Poster Fachfremd Deutsch als Zweitsprache lehren: Selbstwirksamkeitserwartung und Bewältigungsstrategien Dominik Brodowy, Louisa Fortmann, Karin Zimmer Universität Vechta, Deutschland Theoretischer Hintergrund Für die Partizipation in der Gesellschaft ist Sprachkompetenz von grundlegender Bedeutung. Ihre Vermittlung ist über die gesamte Schulzeit wichtig: So sind die Sprachkompetenzen vieler Kinder am Übergang zur weiterführenden Schule niedrig (Lorenz et al. 2023). Auch besuchen im Jahr 2023 etwa eine Viertelmillion Kinder ohne Kenntnisse in der deutschen Unterrichtssprache eine deutsche Schule (Deutschlandfunk 2023). Zugleich prognostiziert die ständige Wissenschaftliche Kommission der Kultusministerkonferenz KMK bis 2025 einen Mangel von etwa 25.000 Lehrkräften und empfiehlt den Einsatz von Personal ohne traditionelles Lehramtsstudium (SWK 2023). Damit finden sich immer mehr Lehrkräfte ohne (formale) Ausbildung dazu vor die sehr herausfordernde Aufgabe gestellt, Sprachförderung in der deutschen Sprache zu betreiben. Nach Grieger (2022) ist die Unterrichtsqualität mit der Selbstwirksamkeitserwartung von Lehrkräften verknüpft. Unter Selbstwirksamkeitserwartung wird das fachspezifische Selbstverständnis zum Umgang mit herausfordernden Unterrichtssituationen verstanden (Bandura, 1997; Schwarzer und Warner 2014; Urton 2017). Individuen mit einer hohen sind im Vergleich zu denjenigen mit einer niedrigeren Selbstwirksamkeitserwartung eher bereit, langfristig anstrengende Aufgaben zu bewältigen (Schwarzer und Warner 2014; Urton 2017). Diese Bereitschaft wird einerseits aus in der Vergangenheit gemachten positiven Erfahrungen und andererseits aus den Beobachtungen anderer gespeist (Bandura 1997; Myers 2014; Urton 2017). Zudem kommt der Selbstwirksamkeitserwartung eine präventive Wirkung gegen Burnout zu (OECD 2009; Schwarzer und Warner 2014). Zu den bisher untersuchten Maßnahmen zur Förderung der Selbstwirksamkeitserwartung von Lehrkräften zählen auch kollegiale Beratungsstrukturen zum Umgang mit schwierigen Schülerinnen und kollegialen Hospitationen in den Unterrichtsstunden (Urton 2017). Über die zuvor ausgeführte individuelle Selbstwirksamkeitserwartung hinaus kann sich auch eine kollektive Selbstwirksamkeitserwartung entwickeln, zum Beispiel dann, wenn mehrere Lehrkräfte in der Vergangenheit erfolgreich zusammengearbeitet haben (Urton 2017). Der Beitrag untersucht welche individuellen wie kollektiven, mit der Selbstwirksamkeitserwartung verknüpften Bewältigungsstrategien im fachfremden Sprachförderunterricht zum Tragen kommen. Fragestellung* Die Selbstwirksamkeitserwartung wird als für die Tätigkeit der fachfremden Sprachförderlehrkraft zentrale Einstellungen zur Bewältigung schwieriger (Unterrichts-) Situationen verstanden, welche die Unterrichtsgestaltung beeinflusst. Wie entwickelt sich die Selbstwirksamkeitserwartung fachfremder Lehrkräfte im Fach Deutsch als Zweitsprache und welche Bedeutung haben individuelle und kollektive Bewältigungsstrategien für sie? Methode Es wurden neun Personen ohne traditionelles Lehramtsstudium, die Deutsch als Zweitsprache an zwei weiterführenden Schulen in Niedersachen unterrichten, mit Leitfadeninterviews nach Helfferich (2011) befragt. Der theoriebasierte Leitfaden ermöglichte die Untersuchung individueller Faktoren wie der Fähigkeit zur Stressbewältigung, dem Wirksamkeitsgefühl und der Problemlösefähigkeit. Darüber hinaus wurden die von den Lehrkräften dargestellten schulischen Rahmenbedingungen und von ihnen als relevant benannte Unterstützungsfaktoren innerhalb ihrer Schule analysiert. Veränderungen der Selbstwirksamkeitserwartung wurden durch einen synoptischen Vergleich der aus den Interviews gewonnenen Daten generiert. Die Auswertung erfolgte mit der inhaltlich strukturierenden qualitativen Inhaltsanalyse nach Kuckartz und Rädiker (2022). Ergebnisse Die Experteninterviews zeigen auf, dass die neun fachfremden Lehrkräfte mit zunehmender Berufserfahrung auf vielfältige und individuell unterschiedliche Bewältigungsstrategien zurückgreifen. Dazu zählen das Nutzen von Wissen über die Mehrsprachigkeit, den eigenen Spracherwerb der deutschen Sprache, fremdsprachendidaktische Prinzipien und das generelle pädagogische Fachwissen. Als innerschulische Strategien zur Bewältigung der schulischen Herausforderungen werden die kollegiale Zusammenarbeit und die Weiterbildung der Lehrkräfte aufgeführt. Zudem greifen die fachfremden Lehrkräfte datenschutzkonform auf außerschulische Expertise zu. Sieben der neun fachfremden Lehrkräfte wünschen sich mehr Erfahrungsaustausch mit innerschulischen wie auch mit schulexternen Fachkolleginnen. Bei allen Befragten gibt es Hinweise auf - individuell unterschiedliche - Veränderungen der Selbstwirksamkeitserwartung. Die Ergebnisse werden theoretisch eingeordnet und sollen im Weiteren den beteiligten Schulen zur Verfügung gestellt werden. Es ist geplant, in Folgeuntersuchungen die hier herausgearbeiteten Sichtweisen mit denen von Lehrkräften mit Lehramtsstudium im Bereich Deutsch beziehungsweise Deutsch als Zweitsprache zu vergleichen. Aufgrund der aktuellen Situation an den Schulen ist es wichtig, weitere Erkenntnisse auf dem Gebiet der Sprachförderung u.a. zur Herleitung von Handlungsempfehlungen für einen gelingenden Unterricht zu gewinnen, der für die gesellschaftliche Teilhabe der Heranwachsenden auch in der nachschulischen Zeit bedeutsam ist. Poster Individuelle Förderung durch Seiteneinsteiger:innen und grundständig ausgebildete Lehrkräfte an Förderschulen mit dem sonderpädagogischen Schwerpunkt Geistige Entwicklung Anna Seifart, Ewa Sliwinski, Nadine Poltz, Oliver Wendt, Antje Ehlert, Katrin Böhme Universität Potsdam, Deutschland Gegenwärtig stellt der Lehrkräftemangel eine der zentralen bildungspolitischen Herausforderungen im deutschen Bildungssystem dar (Porsch & Reintjes, 2023). Um die personellen Lücken zu schließen, wird in allen Bundesländern vermehrt auf Seiten- und Quereinsteiger:innen zurückgegriffen, welche die Unterrichtsversorgung sicherstellen sollen (Rothland & Pflanz, 2016). Im Land Brandenburg stieg der Anteil an Seiteneinsteiger:innen an Schulen in öffentlicher Trägerschaft innerhalb der letzten zehn Jahre von 4.3 % im Schuljahr 2012/13 auf 15.4 % im Schuljahr 2022/23 (Ministerium für Bildung Jugend und Sport [MBJS], 2023). An öffentlichen Förderschulen im sonderpädagogischen Schwerpunkt Geistige Entwicklung unterrichteten im Schuljahr 2022/23 sogar 32.8 % Seiteneinsteiger:innen (Böhme et al., 2023). Diese gestalten und planen – wie die grundständig sonderpädagogisch ausgebildeten Lehrkräfte – Unterrichts- und Förderangebote für die stark heterogene Gruppe der Schüler:innen mit einem sonderpädagogischen Schwerpunkt Geistige Entwicklung. Insbesondere an Förderschulen mit diesem sonderpädagogischen Schwerpunkt gilt das Bereitstellen von individuellen Förderangeboten durch die Lehrkraft als Voraussetzung, um den vielfältigen Lernausgangslagen und Kompetenzen der Schüler:innen adäquat zu begegnen (Stöppler & Wachsmuth, 2010; Fischer, 2008). Eine individuelle Gestaltung von Lerngelegenheiten stellt jedoch für alle Lehrkräfte – ungeachtet ihrer beruflichen Qualifizierung – „erhebliche Anforderungen an das Lehrerhandeln“ (Wischer, 2009, S. 6) und eine große Herausforderung dar. Richter et al. (2023) berichten in einer querschnittlich angelegten Studie, dass die Differenzierung im Unterricht von Lehrkräften zu Beginn des Seiteneinstiegs sogar als eine der zentralen unterrichtsbezogenen Herausforderungen wahrgenommen wird. Vor diesem Hintergrund und in Anbetracht des steigenden Anteils an Seiteneinsteiger:innen, stellt sich die Frage, ob sich das Ausmaß an unterbreiteten individuellen Förderangeboten zwischen grundständig ausgebildeten Lehrkräften und Seiteneinsteiger:innen unterscheidet. Im deutschsprachigen Raum existieren noch keine Studien, die das unterrichtliche Handeln beider Berufsgruppen vergleichen (Porsch, 2021; Richter, 2023). Es soll daher folgende Hypothese überprüft werden: Grundständig ausgebildete Lehrkräfte und Seiteneinsteiger:innen an Förderschulen im sonderpädagogischen Schwerpunkt Geistige Entwicklung unterscheiden sich nicht im Ausmaß an unterbreiteten individuellen Förderangeboten. Zur Beantwortung der Fragestellung wird auf Daten der Studie „Evaluation der Förderschulen mit dem Sonderpädagogischen Förderschwerpunkt Geistige Entwicklung im Land Brandenburg“ zurückgegriffen, in der ein onlinebasierter Lehrkräfte-Fragebogen verwendet wurde. Die Stichprobe umfasst 168 Lehrkräfte (81 % weiblich, 19 % männlich) aus allen 30 öffentlichen Förderschulen mit dem sonderpädagogischen Schwerpunkt Geistige Entwicklung im Land Brandenburg. Von den n = 168 Lehrkräften gaben 46 Personen (27.4 %) an, Seiteneinsteiger:in zu sein. Als Erhebungsinstrument diente eine adaptierte Version der Skala „Förderung nach individuellen Lernvoraussetzungen“ (Cronbachs α = .72), welche in PISA 2006 verwendet wurde (Frey et al., 2006). Die Lehrkräfte schätzten die eigene Unterbreitung an individuellen Fördermaßnahmen im Unterricht anhand von neun Items auf einer vierstufigen Likert-Skala mit den Abstufungen „1 = nie oder sehr selten; 2 = gelegentlich; 3 = häufig; 4 = fast immer oder immer“ ein. Die Ergebnisse zeigen, dass sowohl Seiteneinsteiger:innen als auch grundständig ausgebildete Lehrkräfte vergleichbar häufig individuelle Fördermaßnahmen unterbreiten (M_{Seiteneisteiger:innen} = 3.27, M_{grundständig}_{ausgebildete Lehrkräfte} = 3.38). Auch ein T-Test ergibt, dass kein signifikanter Unterschied (t(166) = -1.54, p = .013) in der Häufigkeit angebotener individueller Förderung zwischen den Gruppen festgestellt werden kann. Es scheint somit kein Zusammenhang zwischen der Gestaltung individueller Förderangebote und der Qualifikation der Lehrkräfte zu bestehen. Dieser Befund schließt an die Annahme an, dass die hohen Anforderungen der individualisierten Förderung für alle Lehrkräfte – ungeachtet der Grundausbildung – eine herausfordernde Aufgabe darstellen. Darüber hinaus zeigt die hohe Ausprägung der Mittelwerte beider Lehrkraft-Gruppen, dass im Mittel häufig individuelle Förderangebote bereitgestellt werden. Es soll an dieser Stelle jedoch darauf hingewiesen werden, dass die Häufigkeit angebotener Förderangebote keinesfalls Schlüsse zur Qualität der individuellen Förderung zulässt. Dennoch liefern die Ergebnisse vor dem Hintergrund des bestehenden Lehrkräftemangels eine interessante Erkenntnis. Es scheint, als seien Seiteneinsteiger:innen trotz weniger umfangreicher pädagogischer Grundausbildung in der Lage, den heterogenen Lernvoraussetzungen der Schüler:innen mit häufigen individualisierten Förderangeboten zu begegnen. Poster How to Systematic Review: Systematisches Review nach PRISMA zu Methoden der Sprachförderung im schulischen Kontext – A work in progress Lea Wiehe^1,3, Romy Räling^2,3, Maja Stegenwallner-Schütz² ¹Universität Potsdam, Department Grundschulpädagogik, Grundschulpädagogik Deutsch; ²Humboldt-Universität zu Berlin, Institut für Rehabilitationswissenschaften, Pädagogik bei Beeinträchtigungen der Sprache und Kommunikation; ³gemeinsame Erstautor:innenschaft Theoretischer Hintergrund. Systematische Reviews (SR) werden als strukturierte, prädefinierte Aufarbeitung, Bewertung und Synthese verfügbarer, empirischer Evidenz verstanden (Munn et al., 2018). Deshalb stellen SR ein wichtiges Instrument für die evidenzbasierte Praxis (EvP) dar, um Wirkungsbefunde zu pädagogischen Maßnahmen umfänglich zu evaluieren (Höfler & Vasylyeva, 2023). Bei SR kommen die drei klassischen E’s der Evaluationsforschung* zum Tragen: Wirksamkeit (Efficacy), Wirkung (Effectiveness) und Effizienz (Efficiency) (Pant, 2014; Wortman, 1983). Wirkung bezieht sich auf Nachweise aus natürlichen Anwendungsbedingungen (z.B. Unterrichtssituationen), Wirksamkeit dagegen auf klinisch kontrollierte Bedingungen und Effizienz auf Kosten-Nutzen-Abwägungen (Pant, 2014; Wirtz, 2021a, 2021b; Wortman, 1983). Auf eine Wirksamkeitsprüfung sollte immer eine Wirkungsprüfung folgen (Campbell et al., 2007). Pädagogische Maßnahmen sollten daher in Bezug auf beide Konzepte analysiert werden. Im sonderpädagogischen Förderschwerpunkt Sprache sind nur wenige SR verfügbar, welche bisher vorwiegend einzelne Sprachfördermethoden und/oder außerschulische therapeutische Interventionen fokussieren und entweder Wirksamkeit oder Wirkung bewerten (Überblick in Deutsche Gesellschaft für Phoniatrie und Pädaudiologie, 2022). SR zu wirkungsvollen und wirksamen Methoden zur Überwindung sprachlicher Barrieren im Schulsetting mit dem Fokus auf regelgeleitete Sprachdomänen fehlen jedoch bisher. Sprachliche Fähigkeiten sind für den Schulerfolg maßgeblich (z.B. McLeod et al., 2019) und sollten durch evaluiert wirkungsvolle und wirksame Methoden gefördert werden. Fragestellung. Die Einreichung entsteht im Rahmen eines Forschungsprojekts zur Erstellung eines SR zu wirksamen und wirkungsvollen Sprachfördermethoden im Schulkontext. Der Beitrag hat folgende methodisch fokussierte Fragestellungen: Wie können SR hochwertig und transparent erstellt werden? Welche Tools finden Anwendung? Wie können die Konzepte Wirksamkeit und Wirkung in pädagogischen SR Beachtung finden? Methode. Das SR wird präregistriert. Präregistrierung gilt als Maßnahme guter Wissenschaftspraxis und beinhaltet die Veröffentlichung der Forschungsdesignplanung vor Studiendurchführung. Sie hilft dabei den Reviewprozess transparent zu kommunizieren, fragwürdige Forschungsmethoden bzw. verzerrende Publikationspraktiken zu vermeiden sowie ungewollte Duplizierungen zu umgehen (Pieper & Rombey, 2022; Stewart et al., 2012). Rund 38 Prozent der derzeitig publizierten SR haben veröffentlichte Protokolle bzw. Präregistrierungen, wobei Registrierungen mit höherem Impactfaktor assoziiert sind (van der Braak et al., 2022). Eine Plattform für die SR-Präregistrierung, u.a. für den Bildungsbereich, ist PROSPERO - International prospective register of systematic reviews (https://www.crd.york.ac.uk/prospero/). PROSPERO gilt als eine der größten Registrierungsplattformen (Pieper & Rombey, 2022). Für die SR-Erstellung werden die Richtlinien der Preferred Reporting Items for Systematic reviews and Meta-Analyses 2020 (PRISMA 2020) angewendet (Page et al., 2021). PRISMA 2020 enthält 27-Checklisten-Punkte bezüglich der Fragestellung, Suchstrategie sowie Ergebnissynthese und ist darauf ausgerichtet, den Erstellungsprozess eines SR bezüglich der Methodik und Ergebnisaufbereitung transparent und nachvollziehbar zu berichten (Page et al., 2021). Die Recherche der SR-Evidenzen erfolgt in Meta- bzw. datenbankspezifischen Suchmaschinen (z.B. Web of Science, OVID) und wird durch eine separate Recherche in bestimmten Datenbanken (z.B. ERIC), die nicht in den Meta-Datenbanken vorkommen, sowie eine Handsuche ergänzt. Bei der Recherche wird eine Schlagwortsuche, die durch eine Versprachlichung der Fragestellungskonzepte modelliert wird, mit einer Thesaurus-Suche kombiniert. Für das SR-Prozessmanagement wird die webbasierte Softwarelösung covidence (https://www.covidence.org) verwendet, welche durch die Cochrane Collaboration empfohlen wird (Cochrane Collaboration, 2023). Das Tool ermöglicht das Screening von Titeln/Abstracts sowie Volltexten im Reviewer:innenteam und dokumentiert die Entscheidungsprozesse sowie Interrater-Reliabilität. In covidence wird auch eine Duplikatsprüfung durchgeführt, die eine hohe Akkuratesse und Spezifität aufweist (McKeown & Mir, 2021). Ergebnisse. Es soll eine exemplarische Darstellung des SR-Prozesses und der genutzten Tools erfolgen: So wird das PRISMA-Protokoll, die PROSPERO-Präregistrierung, die covidence-Nutzung, die verwendete Suchstrategie unter Bezugnahme der Verschlagwortung sowie die spezifischen Suchprinzipien der Datenbanken (Thesauri und Schlagwörter) vorgestellt. Im Spannungsfeld um die EvP in der Pädagogik wird deutlich, dass im Rahmen der Kritik an der EvP sowie auch in der EvP-Vermittlung häufig nicht hinreichend zwischen Effizienz, Wirksamkeit und Wirkung unterschieden wird. Aus diesem Grund werden die Kriterien für die Studienkategorisierung in Wirksamkeit und Wirkung vor- und an Exemplaren dargestellt. Poster Text vs. Grafik - wie sollte wissenschaftliche Evidenz an Lehrpersonen kommuniziert werden? Florian Kühlwein, Samuel Merk, Kirstin Schmidt Pädagogische Hochschule Karlsruhe, Deutschland Lehrpersonen werden von der Bildungsadministration und Bildungsforschung dazu aufgefordert, ihr professionelles Handeln auf Erkenntnisse empirischer Forschung zu stützen (Bauer et al., 2015; Europäische Kommission, 2007; KMK, 2004). Dieses Vorgehen wird unter dem Schlagwort der evidenzinformierten Schulpraxis (EIP) diskutiert (Brown et al., 2017) und dient letztlich der Verbesserung der Schulqualität (Slavin, 2020). Die Umsetzung EIP ist mit hohen Anforderungen verbunden. Gründe wie Zeitmangel, Schwierigkeiten beim Auffinden von Forschungsliteratur (Thomm et al., 2021) und auch fehlende forschungsmethodische Grundkenntnisse (Bauer et al., 2015) führen dazu, dass Lehrpersonen eher selten auf wissenschaftliche Evidenz zurückgreifen. Grundsätzlich gibt es zwei unterschiedliche Ansätze, Lehrpersonen im Umgang mit wissenschaftlicher Evidenz zu unterstützen: Im Sinne eines Angebots-Nutzungs-Modells (Brühwiler & Leutwyler, 2020) kann entweder auf das Angebot oder auf die Nutzung fokussiert werden. Letzteres kann beispielsweise durch eine systematische Förderung der wissenschaftlichen Forschungskompetenz von Lehrpersonen bewerkstelligt werden. Ersteres bezieht sich hingegen auf die Art und Weise, wie informativ und verständlich wissenschaftliche Ergebnisse an die Öffentlichkeit kommuniziert werden. Die vorliegende Studie befasst sich mit der Gestaltung von Wissenschaftskommunikation, wobei der Schwerpunkt auf der Darstellung von Effektstärken liegt. Aktuelle Forschungsstudien zeigen, dass Lehrpersonen verschiedene Formulierungen von Effektstärken unterschiedlich informativ einschätzen (Lortie-Forgues et al., 2021; Schmidt et al.,2023), aber zum Teil Fehlinterpretationen bezüglich Effektstärken und Inferenzstatistiken aufweisen (Schmidt et al. 2023). Hinsichtlich der Rezeption und Interpretation statistischer Kenngrößen aus Grafiken haben sowohl statistische Laien als auch Expert:innen Schwierigkeiten (Zhang et al., 2023). Merk et al. (2023) merken dagegen an, dass Lehrpersonen Mittelwertsunterschiede mit hoher Akkuratheit rezipieren können (Merk et al., 2023). Unserer Recherche nach gibt es bisher keine Studien, die die unterschiedlichen Darstellungen von Effektstärken vergleichen. An diesem Desiderat setzt die vorliegende Studie an: Es wird analysiert, ob sich schriftliche Formulierungen oder Grafiken besser dazu eignen, Effektstärken an Lehrpersonen zu kommunizieren. Konkret werden folgende Forschungsfragen beantwortet: Forschungsfrage 1: Wie akkurat (AV1), effizient (AV2), informativ (AV3) und relevant (AV4) werden grafisch und textlich dargestellte Effektstärken rezipiert? Forschungsfrage 2: Gibt es Unterschiede zwischen den Darstellungsweisen in Bezug auf AV1-AV4? In einer ersten Pilotierung werden zunächst N = 20 englischsprachige Lehrpersonen über Prolific rekrutiert. Die finale Stichprobengröße wird mittels Bayesian Updating (Schönbrodt & Wagenmakers, 2018) bestimmt, wobei die Datenerhebung so lange fortgesetzt wird, bis die Analysen ein a priori definiertes Maß an Evidenz (BF > 5 oder BF < 1/5) liefern. Die Lehrpersonen erhalten zunächst in einem Within-Between-Person Design jeweils einen Forschungsbericht zu einem bildungswissenschaftlichen Thema (z.B. Einsatz eines KI-Lesetutors), welcher zufällig aus vier verschiedenen Themen ausgewählt wird (Between-Person Faktor). Der Bericht kontextualisiert mehrere anschließend präsentierte Forschungsergebnisse, die zufällig in der dargestellten Effektstärke (Within-Person Faktor) und Darstellungsweise (Beispiel Text vs. Grafik: http://bit.ly/3QiCyi1; Within-Person Faktor) variieren. Anschließend werden folgende abhängigen Variablen erhoben: Die Ermittlung der Akkuratheit (AV1) erfolgt durch die Frage: „Schätzen Sie bitte ein, wie hoch die Wahrscheinlichkeit ist, dass eine zufällig ausgewählte Person aus der KI-Lesetutor-Gruppe ein besseres Ergebnis im Lesetest als eine zufällig ausgewählte Person aus der Gruppe ohne KI-Lesetutor erzielt“. Die Variable Effizienz (AV2) wird bestimmt, indem die Zeit bis zum ersten Eintrag im Feld der Akkuratheit vorgenommen wird. Die wahrgenommene Informativität (AV3) lässt sich mithilfe einer siebenstufigen Likert-Skala erfassen. Ferner wird die wahrgenommene Relevanz (AV4) mit der Frage „Wie viel € wären Sie bereit für den KI-Lesetutor auszugeben?“ festgestellt. Um die Forschungsfragen zu beantworten, werden explorative Analysen durchgeführt. Hierfür werden verschiedene bayesianische Mehrebenenmodelle spezifiziert (Kruschke, 2015), wobei deren Highest Density Intervalls Informationen über die Qualität und Sicherheit der Unterschiede zwischen den verschiedenen Darstellungsweisen in AV1 - AV4 bieten. Gleichzeitig wird die Vorhersagekraft der einzelnen Modelle mittels inkrementellem R2 via Bayes-Faktoren basierend auf Bridge Sampling verglichen (Gronau et al., 2017). Die Ergebnisse der Pilotierung und Haupterhebung werden im Rahmen der Posterpräsentation vorgestellt. Paper Session Untersuchung der Lernwirksamkeit einer adaptiven Web-App zur Übung und Wiederholung grundlegender Grammatik- und Rechtschreibregeln in der Sekundarstufe Christian Klotz, Uwe Maier Pädagogische Hochschule Schwäbisch Gmünd, Deutschland Es gibt ein stetig wachsendes Angebot an adaptiven, personalisierten Lernsystemen für die Wiederholung und Übung von Grundlagenwissen (Van Schoors et al., 2021). Diese passen sich durch formative Assessments und aufgabeninterne Rückmeldeschleifen dem individuellen Lernstand an (VanLehn, 2006). Experimentelle Befunde zur Lernwirksamkeit adaptiver Technologien sind vielversprechend, zeigen jedoch, dass die Lerneffekte von Aspekten des Systems sowie der Umsetzung abhängen (Zheng et al., 2022). Die Forschung konzentriert sich zudem auf MINT-Fächer, den Hochschulkontext und englischsprachige Lernsysteme. Uns ist lediglich eine experimentelle Feldstudie zu einem in Deutschland genutzten adaptiven Lernsystem bekannt (Scharnagl et al., 2014). Sowohl für die Bildungspraxis als auch die Bildungspolitik wäre es wünschenswert, wenn es mehr empirische Evidenz zur Wirksamkeit von adaptiven, digitalen Technologien für den Schulunterricht im deutschen Sprachraum geben würde. Am Beispiel einer adaptiven Lernapp für den Deutschunterricht gehen wir zwei Fragestellungen nach: (1) Welchen absoluten Lernzuwachs hat das adaptive Lernsystem unter kontrollierten Bedingungen? (2) In welchem Maße beeinflusst das Vorwissen den Lernzuwachs? Untersuchungsgegenstand ist die Web-App MasteryX (www.masteryx.de), die adaptive Übungen für Grammatik und Rechtschreibung in der Sekundarstufe anbietet. Einzelne Themen (bspw. „Kommasetzungsregeln“) sind nach Schwierigkeitslevels gegliedert. Formative Assessments steuern die Lernprogression. Auf jedem Level werden passende Instruktionen und Übungsaufgaben angeboten. Datengrundlage sind 491 Schüler/innen der Klassenstufen 6 bis 9 (32 Klassen aus sechs Realschulen) in Baden-Württemberg. MasteryX wurde in der Experimentalgruppe im regulären Unterricht drei Wochen lang zweimal pro Woche für jeweils 20 bis 30 Minuten eingesetzt, in der Kontrollgruppe nicht (Wartegruppe). Der Lernzuwachs wurde mit einem jeweils identischen Pretest und Posttest erfasst. Unabhängige Variable ist die Nutzung von MasteryX, abhängige Variable (AV) ist der Posttest-Score. Zur Bestimmung des Lernzuwachs (Forschungsfrage 1), wird eine Kovarianzanalyse mit der AV Posttest-Score (Faktor Nutzung MasteryX ja/nein) durchgeführt. Die Beeinflussung des Lernzuwachs durch das Vorwissen (Forschungsfrage 2) wird mit einer linearen Regression mit der AV absoluter Lernzuwachs sowie einer weiteren linearen Regression mit der AV normalisierter Lernzuwachs (Hake, 1998), bei dem die maximal mögliche Verbesserung von Pre- zu Posttest berücksichtigt wird, untersucht (Prädiktor jeweils Vorwissen). Mittels Kovarianzanalyse zeigt sich für die Nutzung von MasteryX bei Kontrolle der Kovariaten Pretest-Score, Alter, Selbstkonzept, der zu Hause gesprochenen Sprache sowie der Lernausstattung für den Posttest-Score ein signifikanter Unterschied zwischen den Gruppen mit einer Effektstärke von η_p²= 0.13. Die lineare Regression für den absoluten Lernzuwachs zeigt einen signifikanten negativen Zusammenhang mit Vorwissen, für den normalisierten Lernzuwachs ist das Modell nicht signifikant. Die Lernapp führt damit zu einem eher geringen, absoluten Lernzuwachs, der bei schwächeren Lernenden höher ausfällt, normalisiert jedoch für stärkere und schwächere Lernende gleichermaßen vorhanden ist. Die Befunde bieten eine Referenz für die Evaluation von ähnlichen adaptiven Übungstools, die überwiegend ergänzend zum Unterricht eingesetzt werden. Paper Session Generische und domänenspezifische Überzeugungen angehender Lehrkräfte zum Einsatz digitaler Tools im Unterricht: Identifikation und Analyse mithilfe einer Netzwerkanalyse Sarah Wilken, Benedikt Heuckmann Universität Münster, Deutschland Theoretischer Hintergrund Mit zunehmender Digitalisierung des Unterrichts wird der technologiebezogenen professionellen Kompetenz angehender Lehrkräfte eine immer wichtigere Bedeutung zugesprochen (Becker et al., 2020). Für das technologiebezogene Professionswissen als kognitive Facette professioneller Kompetenz greifen viele Arbeiten auf das TPaCK-Modell zurück, welches sowohl mit generischen als auch über fachspezifische Erhebungsinstrumente erfasst werden kann (Schmid et al., 2009; Arnold & Mahler, 2022). Dahingegen werden Überzeugungen (beliefs) zum Technologieeinsatz als motivational-affektive Facette professioneller Kompetenz (Blömeke et al., 2015) bislang überwiegend generisch und auf ihren prognostischen Gehalt hin untersucht (z.B. Vogelsang et al., 2019). Empirisch belegt ist, dass Überzeugungen der Lehrkräfte den Technologieeinsatz im Unterricht maßgeblich beeinflussen können (Kim et al., 2013). Bei der Integration digitaler Tools wirken Überzeugungen sowohl als Hürde als auch als Gelingensbedingung (Ertmer, 1999; Bice & Tang, 2022). Studien zeigten wiederholt, dass Überzeugungen zur Technologieintegration im Zusammenhang stehen mit Art und Häufigkeit von Technologieneinsatz im Unterricht (Kim et al., 2013; Bice & Tang, 2022). In der Forschungsliteratur werden Überzeugungen dabei sowohl lehr-lern-theoretisch als auch fachspezifisch ausdifferenziert (Van Driel et al., 2007). Fragestellung Für eine Lehrkräftebildung, die fachwissenschaftlich, fachdidaktisch und bildungswissenschaftlich organisiert ist, schließt sich die Frage an, inwiefern diese inhaltlichen Perspektiven auch in den Überzeugungen identifiziert werden können. Bislang ist noch weitestgehend ungeklärt, wie sich generisch lehr-lern-theoretische und fachspezifische Überzeugungen zum Einsatz digitaler Technologien im Fachkontext zueinander verhalten und ob diese in einem beliefsystem integriert sind. Im Vorhaben werden daher exemplarisch am Fachkontext Biologie zwei Forschungsfragen untersucht: FF1: Welche lehr-lern-theoretischen und fachspezifischen Überzeugungen zur Integration digitaler Medien lassen sich bei angehenden Biologielehrkräften identifizieren? FF2: Wie sind diese Überzeugungen innerhalb eines beliefsystem miteinander verknüpft? Methodik Zur Identifikation der Überzeugungen (FF1) wurden angehende Biologielehrkräfte in einem dreistufigen qualitativen Erhebungsverfahren mittels offener Fragen (n=105), Gruppendiskussionen (n=24) und leitfadengestützter Interviews (n=13) befragt (Schraw & Olafson, 2014). Die Kodiereinheiten (691) wurden mithilfe einer qualitativen Inhaltsanalyse deduktiv und induktiv durch zwei unabhängige Coder leitfadengestützt kategorisiert (κ=.61; substantielle Übereinstimmung). Für die Analyse der Verknüpfungen zwischen den Überzeugungen und der Differenzierung in lehr-lern-theoretische und fachspezifische Überzeugungen (FF2), wurde eine Netzwerkanalyse durchgeführt (Koponen et al., 2019). Der Grad der Vernetzung im beliefsystemwurde mithilfe des igraph Pakets (Csárdi et al., 2023) in R durch folgende Netzwerkparameter beschrieben (Newman, 2003): Dichte, Transitivität (Maximalwert 1 bedeutet maximale Verknüpfungsgrad) und Modularität (Maximalwert 1 bedeutet Zerfall in Untergruppen). Ergebnisse Die identifizierten Überzeugungen konnten 18 inhaltlich distinkten Kategorien zugeordnet werden (FF1), die sich in vier Hauptkategorien gruppieren: fachspezifische Überzeugungen (4 Unterkategorien), lehr-lern-theoretische Überzeugungen (9), kritische Überzeugungen (3) und Überzeugungen zu Rahmenbedingungen (2). Damit lassen sich u. a. lehr-lern-theoretische und fachspezifische Überzeugungen unterscheiden, die im Vortrag detaillierter vorgestellt werden. Netzwerkanalytisch zeigt sich ein beliefsystem in dem die Überzeugungen eng verknüpft sind und nicht in einzelne Untergruppen zerfallen (FF2). Das beliefsystem differenziert demnach statistisch nicht zwischen generischen und spezifischen Untergruppen (Modularität = 0,1). Alle identifizierten belief-Kategorien sind eng miteinander verknüpft (Dichte = 0,9; Transitivität = 0,91). Demnach können generische und fachspezifisch beliefs zwar inhaltsanalytisch unterschieden werden, liegen netzwerkanalytisch, aber eng verknüpft und nicht in distinkten Gruppen vor. Diskussion Insgesamt zeigt sich, dass eine große Breite an unterschiedlichen Überzeugungen identifiziert werden konnte (FF1), wobei lehr-lern-theoretische Überzeugungen teilweise mit bereits identifizierten Kategorien einhergehen (Knüsel-Schäfer, 2020; Thurm, 2020). Fachspezifische Überzeugungen, die häufig genannt wurden, erweitern jedoch bestehende Kategorien. Betrachtet man die Überzeugungen in einer Netzwerkanalyse, zeigt sich, dass domänenspezifische und lehr-lern-theoretische Überzeugungen eng verknüpft sind und nicht in zwei Untergruppen zerfallen. Diese Ergebnisse bestätigen Befunde, die von einer curricularen und pädagogischen Ausrichtung der Überzeugungen ausgehen (Van Direl et al., 2007). Den Ergebnissen folgend sollten Überzeugungen in der Fachdidaktik simultan aus inhaltlicher und lehr-lern-theoretischer Perspektive betrachtet werden. Poster Bilden Schulbücher die Nachhaltigkeitsziele der UN ab? – Ergebnisse einer Korpusanalyse mit Schulbüchern Elena Stroszeck¹, Jennifer Paetsch² ¹Universität Bamberg; ²Universität Potsdam 1. Theoretischer Hintergrund Im Jahr 2015 verabschiedeten die United Nations die Agenda 2030, in der nicht nur 17 inhaltsbezogene Nachhaltigkeitsziele explizit formuliert sind, sondern auch die Bildung für Nachhaltige Entwicklung (BNE) als eine verbindliche Maßnahme aller Staaten aufgeführt wird (vgl. United Nations General Assembly, 2015). Bereits zwei Jahre später setzte sich auch die Nationale Plattform Bildung für nachhaltige Entwicklung, das oberste Gremium für die deutsche Umsetzung des UNESCO Programms, eine strukturelle Verankerung von BNE zum Ziel (vgl. NAT, 2017). Eine Analyse der Lehrpläne aller 16 Bundesländer zeigt, dass BNE überwiegend integriert wurde und es einen Trend zur Umsetzung von BNE als Leitprinzip in allen Fächern gibt (Holst & Brock, 2020; vgl. auch Arnold, Carnap & Bormann, 2016). Gleichzeitig bestehen jedoch erhebliche Unterschiede zwischen den Bundesländern hinsichtlich der konzeptionellen Tiefe und der interdisziplinären Ausgestaltung (Holst et al., 2020). Inwieweit Diskrepanzen zwischen der Verankerung von BNE in Lehrplänen und der weiteren Umsetzung des Bildungskonzepts im Unterricht vorliegen, ist bislang unklar. Lindau und Kuckuck (2022) stellen fest, dass sich in Geographie-Schulbüchern nur ein geringer Anteil der Aufgaben dem Handlungskompetenzbereich im Kontext einer BNE beschäftigen. Vor diesem Hintergrund untersucht der vorliegende Beitrag die Frage, inwiefern die in der Agenda 2030 vorgegebenen Ziele auch in aktuellen Schulbüchern vorkommen und ob sich hier eine Passung finden lässt. 2. Fragestellungen Welche Bücher eignen sich zur Erstellung eines BNE-Korpus im Schulkontext? Welche Themenkomplexe bilden Schülbücher im Bereich BNE ab und in welcher Gewichtung? Wo liegen Kongruenzen der Themenkomplexe zu den offiziellen Nachhaltigkeitszielen der Agenda 2030? 3. Methode Mithilfe des Programms CorpusExplorer und TreeTagger (Rüdiger, 2018; Schmidt, 1995) wurden zwei Nachhaltigkeitsstrategiedokumente (Bundesregierung 2020 & 2022) und ein Dokument der UN zur Agenda 2030 (United Nations General Assembly, 2015) eingelesen und nach Westpfahl et al. (2017) annotiert, um zunächst die Suchbegriffe festzulegen. Auf den Webseiten der drei größten Schulbuchverlage wurde mithilfe der Suchbegriffe („nachhaltig/Nachhaltigkeit“, „Umwelt“ & „Klima“) unter bestimmten und einheitlichen Auswahlkriterien nach Schulbüchern gesucht. Die 25 Treffer wurden deskriptivstatistisch auf Inhalt, Fächer/Themen, Klassenstufen und Bundesland untersucht. Alle 25 Schulbücher wurden entweder digital erworben oder digitalisiert und mit dem CorpusExplorer eingelesen, hinsichtlich der Wortart annotiert und als Frequenzliste ausgegeben. Zur Beantwortung der zweiten Fragestellung, um demnach Relationen und Gewichtungen innerhalb des Korpus auszumachen, werden die Schulbücher mithilfe eines Correlated Topic Model analysiert, dies eignet sich insbesondere bei größeren Korpora (Vayansky & Kumar, 2020). Das Topic-Modeling wird mithilfe des Open-Source-Programms jsLDA (Mimno, 2023) durchgeführt. Dabei wird mit mindestens 30 Topics trainiert, während mindestens 100 Iterationen angestrebt werden. Die Stop-Wort-Liste ergibt sich aus der Annotation von Hilfs- und Modalwörtern, sowie einigen händisch ergänzten Wörtern. 4. Ergebnisse Vorläufige Ergebnisse beziehen sich auf die Merkmale des Korpus. Im Titel der Schulbücher findet sich vor allem der Begriff „Umwelt“ mit einem 18-maligen Vorkommen, während die Begriffe „Klima“ und „Nachhaltigkeit“ lediglich 9 und 10 Mal vorkommen. Zu 46 und 56 % sind Schulbücher aus dem Primarbereich bzw. weiterer Schulen vertreten. Die Themen und Fächer sind vielzählig und facettenreich (z.B. „Natur“, „Politik“, Sozialkunde, Geografie). Die Klassenstufenempfehlungen liegen vorrangig zwischen der zweiten und zehnten Klassenstufe. Insgesamt umfasst das bereinigte Korpus 42 600 Lemmata und 54 876 Types. Eine erste zählende Sichtung der Inhaltsverzeichnisse der 25 Bücher ergab, dass die Überbegriffe bzw. Themenkomplexe Klima (24), Wasser (10), Konsum (9), Energien (9) Müll (8) und Ernährung (7) besonders häufig vorkommen. Weniger häufig sind Themenkomplexe wie Gerechtigkeit und Rechte von Minderheiten bzw. Schutzgruppen (5), sowie Hunger und Armut (3) oder Wald (2). Ein Vergleich mit den 17 Nachhaltigkeitsziele der Agenda 2030 (vgl. Die Bundesregierung, 2020 & 2022) zeigt bereits erste Inkongruenzen und mögliche Gewichtungsunterschiede. Eine umfassende und vollständige quantitativ-statistische Analyse mithilfe des Topic Modelings steht noch aus. Poster Optimierung von Lernprozessen in der Hochschulbildung: Eine Untersuchung zum Prompt Engineering und der Qualität von KI-gestütztem Feedback Lucas Jasper Jacobsen¹, Kira Elena Weber² ¹Leuphana Universität Lüneburg; ²Universität Hamburg Theoretischer Hintergrund und Fragestellung Generative künstliche Intelligenz (GKI) zählt zu den potentesten Strukturen im Bereich des maschinellen Lernens (Abukmeil et al., 2021). Eines der prägendsten Frameworks innerhalb der GKI ist das der Generative Pretrained Transformer (GPT). Das wohl bekannteste Modell, ChatGPT, ist mit der Version GPT-4 das aktuell leistungsstärkste GPT auf dem Markt. Nach seiner Veröffentlichung hat ChatGPT innerhalb einer Woche mehr als eine Million Abonnenten gewonnen (Baidoo-Anu & Ansah, 2023). Obwohl ChatGPT seitdem in verschiedensten akademischen Kontexten genutzt wird (Stojanov, 2023), fehlt es an empirischen Studien, die die Qualität und den Einsatz dieser innovativen Systeme in der Hochschulbildung untersuchen (Crompton & Burke, 2023). In einer aktuellen Studie von Demszky et al. (2023) konnte gezeigt werden, dass Lehrkräfte die automatisiertes, formatives KI-Feedback erhielten, studentische Beiträge signifikant stärker akzeptierten und die Zufriedenheit der Studierenden mit dem Kurs stieg. Generell gilt Feedback als integraler Bestandteil von Bildungsprozessen in der Hochschule (Henderson et al., 2019), wobei die Qualität des Feedbacks sichergestellt werden sollte. Ein qualitativ hochwertiges Feedback zeichnet sich durch bestimmte Kriterien wie z.B. Konkretheit, Aktivierung und Empathie aus (Prilop et al., 2019). Jedoch fehlt es häufig an personellen und finanziellen Ressourcen zur Bereitstellung hochqualitativen Feedbacks (Demszky et al., 2023), weshalb KI-Feedback potentiell eine ökonomische Alternative darstellen kann. In der vorliegenden Studie gehen wir folgenden Fragestellungen nach: 1. Welche Art von Prompt wird benötigt, um eine hohe Qualität des KI-Feedbacks zu gewährleisten? 2. Welche Unterschiede zeigen sich zwischen Peer-, Expert:innen- und KI-Feedback hinsichtlich der Feedbackqualität und der inhaltlichen Korrektheit des Feedbacks? Methode In Anlehnung an Wittwer et al. (2020) formulierten wir zunächst ein Lernziel mit drei Fehlertypen. Anschließend entwickelten wir ein theoriegeleitetes Manual zur Erstellung hochqualitativer Prompts für generative KI. Um die besten Ergebnisse zu erzielen, haben wir verschiedene Prompt-Engineering-Ansätze in das Manual integriert (Kipp 2023, Lo 2023, ChatGPT & Enkin 2023). Wir nutzten unser Manual um drei Qualitätsstufen von Prompts (schlecht, mittel, gut) für ChatGPT zu erstellen und Feedback zum Lernziel zu erhalten. Die Qualität des KI-Feedbacks wurde mittels quantitativer Inhaltsanalyse, basierend auf einem Kodierungsschema, abgeleitet von Prilop et al. (2019), Prins et al. (2006) und Wu & Schunn (2021), durch drei geschulte Kodierer:innen kodiert. Daraufhin präsentierten wir das Lernziel 30 angehenden Lehrkräften im vierten Semester (Novizen), sieben Lehrkräfteausbilder:innen, zwei Professoren für Schulpädagogik, einem Lehrerseminarleiter und einem Schulleiter (Expert:innen) und baten sie, ebenfalls Feedback auf der Grundlage des hochqualitativen Prompts zu formulieren. Dieses Feedback wurde dann von denselben Kodierer:innen kodiert. Ergebnisse Der erste Prompt besaß laut unseres Manuals für Promptqualität eine niedrige, der zweite eine mittlere und der dritte eine hohe Qualität. Um das durch die drei Prompts generierte Feedback miteinander zu vergleichen, führten wir eine ANOVA mit Bonferroni-Posthoc-Tests durch. Unsere Ergebnisse zeigten signifikante Unterschiede zwischen den Prompts. Dabei beeinflusste die Qualität des Prompts direkt die Feedbackqualität: schlechte Prompts ergaben schlechtes Feedback, mittlere Prompts mittleres Feedback und gute Prompts gutes Feedback. Im Vergleich zeigte sich, dass Expert:innen und KI-Feedback signifikant besser als das von Noviz:innen waren. In zwei Kategorien übertraf das KI-Feedback sogar das Expert:innen Feedback signifikant. Diskussion Derzeit wird in der Hochschule meist Noviz:innen-Feedback in Form von Peer-Feedback verwendet, das jedoch nicht immer lernfördernd ist (Kluger & DeNisi, 1996). Darüber hinaus ist es für Expert:innen aufgrund mangelnder personeller und finanzieller Ressourcen schwierig, hochwertiges Feedback im Hochschulbereich zu geben (Demszky et al., 2023). KI-Feedback kann hier eine hochqualitative und zugleich kostengünstige Alternative darstellen. Ein besonders vielversprechendes Ergebnis unserer Studie ist, dass das von ChatGPT generierte Feedback die Qualität des Feedbacks von Novizen und sogar das der Expert:innen übertraf. Darüber hinaus unterstreicht unsere Studie die Bedeutung des Promptings und der Nutzung eines Manuals für hochqualitative Prompts beim Einsatz von ChatGPT.

Mobile Ansicht Druckansicht

Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: GEBF 2024

11. GEBF-Tagung

BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN - TRANSFER GESTALTEN Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024 Universität Potsdam

Veranstaltungsprogramm

BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN -
TRANSFER GESTALTEN
Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024
Universität Potsdam