11. GEBF-Tagung

BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN -
TRANSFER GESTALTEN
Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024
Universität Potsdam

JavaScript ist deaktiviert
Die JavaScript-Funktionalität Ihres Browsers ist deaktiviert. Um diese ConfTool-Funktion nutzen zu können, müssen Sie JavaScript aktivieren.
Hier finden Sie Informationen zur Aktivierung von JavaScript.
Bei Fragen oder Problemen wenden Sie sich bitte an das Organisationsteam unter gebf2024@uni-potsdam.de.

Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

Sitzungsübersicht

Sitzung

Postersession

Zeit:

Montag, 18.03.2024:

18:00 - 19:30

Ort: Foyer Haus 6

Foyer Haus 6

Präsentationen

Poster

Die Kultur der Digitalität an Schulen partizipativ gestalten: Lehrkräftefortbildungen zur Integration von generativer KI in neue Lern- und Prüfungssettings

Marcus Kindlinger, Katrin Hahn-Laudenberg

Universität Leipzig, Deutschland

Kontext/Relevanz: Künstliche Intelligenz (KI) prägt bereits jetzt Wirtschaftssysteme und Gesellschaften (OECD, 2022) und wird in den kommenden Jahren voraussichtlich weitere tiefgreifende Veränderungen mit sich bringen, zum Beispiel für globale Arbeitsmärkte (World Economic Forum, 2023) und auch direkt für Bildungsprozesse (Schleicher, 2021).

In Demokratien tragen Bildungssysteme mehr als nur die Verantwortung, Schüler:innen auf den individuellen Umgang mit KI vorzubereiten. Sie müssen darüber hinaus auch Fähigkeiten vermitteln, die es Bürger:innen ermöglichen, an Diskussionen über die gesamtgesellschaftliche Nutzung und Regulierung von KI und verwandten Technologien zu partizipieren. Ein möglicher Weg dahin ist, Schüler:innen bereits in ihrem Bildungsprozess an Entscheidungen über digitale Transformationsprozesse teilhaben zu lassen.

Ziel: Ziel dieses Projekts ist es, das Potenzial von textgenerierender KI wie ChatGPT zur Anregung einer Diskussion über eine „Kultur der Digitalität“ (Stalder, 2016; Stalder & Kuttner, 2022) an Schulen zu nutzen. Im Zentrum des Projekts stehen Workshops mit Lehrkräften und Lehrenden aus der zweiten Phase der Lehramtsbildung. In diesen werden Möglichkeiten erarbeitet, Experimente zu einer digitalen Transformation des schulischen Lernens gemeinsam mit Schüler:innen zu gestalten; beispielsweise in Form von innovativen, KI-integrierenden Prüfungskonzepten. Der Austausch und die Zusammenarbeit der Lehrkräfte während dieser Workshops soll sie befähigen, als Akteure eines institutionellen Wandels zu wirken.

Durch das partizipative Modell sollen Stimmen und Perspektiven von Schüler:innen im Mittelpunkt KI-bezogener Transformationsprozesse stehen und diese zugleich zukunftsrelevante Fähigkeiten erwerben können (Krommer, 2021). Darüber hinaus sollen die Veränderungsprozesse durch den Einbezug verschiedener Beteiligter nachhaltiger und effektiver gestaltet werden.

Methodik: Das Projekt ist als designbasierte Forschung (siehe z.B. Anderson & Shattuck, 2012; McKenney & Reeves, 2019) konzipiert und umfasst dabei drei zentrale Elemente:

Prototypenentwicklung mit Lehramtsstudierenden: In einem ersten Zyklus (10/2023-02/2024) wird das Fortbildungskonzept mit Lehramtsstudierenden im Sinne eines Prototypen-Workshops entwickelt und erprobt. Dabei werden erste Ideen für konkrete partizipative Formate zu schulbezogenen Transformationsprozessen entwickelt, diskutiert und evaluiert.
Workshops mit Lehrkräften und Lehrenden aus der zweiten Phase der Lehramtsbildung: Aufbauend auf die Erkenntnisse aus den Prototypen wird das Konzept in zwei Workshop-Zyklen (ab 06/2024) mit berufstätigen Lehrkräften sowie mit Lehrenden aus der zweiten Phase der Lehramtsbildung umgesetzt und, auf Grundlage von Evaluations- und Implementationsuntersuchungen, schrittweise angepasst. Die Teilnehmenden erwerben zunächst grundlegendes Wissen über pädagogische Möglichkeiten zum Einsatz von KI und zu Partizipationsformaten. Darüber hinaus soll jedoch eine intensive Auseinandersetzung mit „Design Thinking“ in Bildungsprozessen stattfinden (Luka, 2014). Innovationen in der Unterrichts- und Prüfungsplanung werden dabei als Experimente verstanden, mit denen nicht nur der eigene Unterricht verändert wird, sondern auch über das eigene Klassenzimmer hinauswirkende Transformationsprozesse angeregt werden können. Ansatzpunkte dafür bieten besonders flexible und gemeinsam mit Schüler:innen anpassbare Lehrplankomponenten wie projektbasierte Prüfungen. Zur Konzeption und Umsetzung der Workshops arbeiten wir mit Praxispartnern aus der Lehrkräftebildung zusammen.
Begleitende multimethodische Evaluation: In allen drei Zyklen werden Prozesse und mögliche Wirkungen der Prototypen bzw. der Workshops evaluiert und die daraus gezogenen Erkenntnisse für die Weiterentwicklung des Angebots genutzt. Im ersten Workshop-Zyklus mit Lehrkräften findet eine Implementationsbegleitung an den Schulen der Teilnehmenden statt, sodass die Umsetzung von partizipativen Transformationsprozessen im realen Schulkontext tiefergehend untersucht werden kann. Je nach Zyklus werden Methoden wie Interviews, Dokumentenanalysen, Beobachtungen und Fragebogenerhebungen trianguliert.

Erwartete Ergebnisse: Im Rahmen unserer Begleitforschung entstehen insbesondere Erkenntnisse über Möglichkeiten und Hindernisse bei der Anregung von Veränderungsprozessen durch gezielte Lehrkräftefortbildungen, sowohl mit Blick auf die Gestaltung von Schüler:innenpartizipation als auch auf digitale Transformation an Schulen. Darüber hinaus werden Bedingungen und mögliche Wirkungen von Schüler:innenpartizipation an digitalen Transformationsprozessen in den Blick genommen. Zuletzt wird mit dem Projekt eine methodische Verzahnung zwischen den Inhalten der Workshops (Design Thinking) und der übergreifenden Entwicklung des Fortbildungskonzepts (designbasierte Forschung) erprobt und untersucht.

Diskussion: Im Rahmen der Posterpräsentation möchten wir mögliche Herausforderungen der Implementation unseres Konzepts sowie die methodischen Möglichkeiten unserer Evaluations- und Implementationsforschung diskutieren.

Poster

Viel hilft viel? Eine Untersuchung des Zusammenhangs von Feedback und Leseleistung für verschiedene Schülergruppen und Länder

Simon Munk, Lisa Ziernwald, Jörg-Henrik Heine, Doris Holzberger

Technische Universität München, Deutschland

1. Theoretischer Hintergrund

Lesen gilt als Schlüsselkompetenz für gesellschaftliche Teilhabe und Bildungserfolg (Graham & Perin, 2007; OECD, 2019). Jüngste Befunde zeigen jedoch, dass viele Schüler*innen diese Grundfähigkeiten nicht ausreichend besitzen (McElvany et al., 2023). Eine Möglichkeit, Schüler*innen beim Lesen zu unterstützen, kann Feedback durch die Lehrkraft sein (Hattie, 2023). Experimentelle Befunde zeigen unabhängig vom Schulfach, dass Feedback zu einem höheren Lernerfolg führen kann (Wisniewski et al., 2020). Betrachtet man jedoch nicht-experimentelle Studienergebnisse, so findet man häufig nur schwache Zusammenhänge zwischen Feedback und Leseleistung (Ma et al., 2022; Yan & Chiu, 2022). Damit bleibt offen, warum sich entgegen theoretischer Annahmen und experimenteller Befunde keine stärkeren positiven Zusammenhänge zwischen Feedback und Leseleistung zeigen. Wir wollen deshalb dazu beitragen, den Zusammenhang besser zu verstehen und die Generalisierbarkeit über verschiedene Schülergruppen und Länder hinweg untersuchen.

Hierfür analysieren wir erstens die Verteilung von Feedback auf Schüler*innen unterschiedlicher Kompetenzstufen. Bisherige Befunde zeigten, dass Lehrkräfte häufiger mit leistungsstarken Schüler*innen interagieren, da sie sich beispielsweise erhoffen, so zügiger im Unterrichtsgespräch voran zu kommen (Decristan et al., 2020). Gleichzeitig zeigte Sacher (1995), dass Lehrkräfte beim Aufrufen von Schüler*innen, die sich nicht gemeldet haben, stärker auf leistungsschwache Schüler*innen zurückgreifen, möglicherweise um sicherzugehen, dass diese nicht den Anschluss verlieren. Wir nehmen deshalb an, dass Lehrkräfte ihr Feedback nicht gleichmäßig auf Schüler*innen unterschiedlicher Kompetenzstufen verteilen. Erhalten einige Schüler*innen mehr und andere weniger Feedback, so könnten sich die Effekte ausgleichen und somit eine Erklärung für die schwachen Zusammenhänge zwischen Feedback und Leseleistung in nicht-experimentellen Settings sein.

Zweitens betrachten wir, ob Schüler*innen, die zuhause eine andere Sprache als in der Schule sprechen (sogenannte Multilingual Learners), unterschiedlich von Feedback hinsichtlich ihrer Leseleistung profitieren. Multilingual Learners zeichnen sich durch eine durchschnittlich niedrigere Leseleistung (Yan & Chiu, 2022) und weniger Unterstützung durch die Eltern bei sprachlichen Problemen (Göbel et al., 2011) aus. Multilingual Learners könnten aufgrund dieser doppelten Benachteiligung stärker auf Lehrkräftefeedback angewiesen sein und deshalb mehr davon profitieren. Um Aussagen zur Generalisierbarkeit des Zusammenhangs zwischen Feedback und Leseleistung treffen zu können, untersuchen wir daher die moderierende Rolle der zuhause gesprochenen Sprache.

Neben den Unterschieden zwischen verschiedenen Schülergruppen könnten auch Unterschiede zwischen Ländern ein Grund für die schwachen Zusammenhänge zwischen Feedback und Leseleistung sein. Auch hier könnten sich die Effekte aus unterschiedlichen Ländern in internationalen Studien ausgleichen. Bisherige Befunde weisen darauf hin, dass sowohl Feedback als auch die Rolle der zuhause gesprochenen Sprache je nach Kontext im jeweiligen Land variiert (De Luque & Sommer, 2000; Finch et al., 2021; Heine et al., 2001).

2. Fragestellungen

In unserem Beitrag beleuchten wir die folgenden drei Forschungsfragen:

Wie groß ist der Zusammenhang zwischen Feedback und Leseleistung?
Wie verteilen Lehrkräfte ihr Feedback auf Schüler*innen unterschiedlicher Kompetenzstufen?
Unterscheidet sich der Zusammenhang für Multilingual Learners?

Um die Generalisierbarkeit der Ergebnisse über Ländergrenzen hinweg besser einschätzen zu können, führen wir die Analysen getrennt für jedes Land und über alle Länder hinweg durch.

3. Methode

Um die Forschungsfragen zu untersuchen, analysieren wir den PISA 2018-Datensatz mit N = 505.906 Schüler*innen (50,35 % weiblich; durchschnittlich 15,79 Jahre alt) aus 75 Ländern. Hierbei verwenden wir ein metaanalytisches Vorgehen (Brunner et al., 2022). In einem ersten Schritt berechnen wir die Ergebnisse getrennt für jedes Land und integrieren sie dann in einem zweiten Schritt zu einem größeren Gesamtbild, wodurch wir gezielt die Heterogenität zwischen den Ländern analysieren können.

4. Ergebnisse

Unsere Ergebnisse zeigen, dass Lehrkräfte ihr Feedback ungleich auf Schüler*innen unterschiedlicher Kompetenzstufen verteilen. Entgegen unserer Annahmen scheinen jedoch Multilingual Learners nicht unterschiedlich von Feedback zu profitieren. Weiter zeigen sich deutliche Unterschiede zwischen den Ländern. Damit könnten die schwachen Zusammenhänge zwischen Feedback und Leseleistung an einer ungleichen Verteilung von Feedback und Länderunterschieden liegen.

Poster

Same same but different? Eine latente Multigruppen-Profilanalyse von berufsbezogenen digitalen Kompetenzüberzeugungen (angehender) Lehrkräfte

Jennifer Quast¹, Charlott Rubach², Raphaela Porsch¹

¹Otto-von-Guericke Universität Magdeburg, Deutschland; ²Universität Rostock, Deutschland

Die Entwicklung berufsbezogener digitaler Kompetenzüberzeugungen stellt eine wichtige Aufgabe für die Aus- und Weiterbildung von Lehrkräften dar (Eickelmann & Drossel, 2020). Lehramtsstudierende und Lehrkräfte stellen jedoch hinsichtlich ihrer berufsbezogenen digitalen Kompetenzüberzeugungen in verschiedenen Kompetenzbereichen keine homogenen Gruppen dar (Akyuz, 2023; Aslan & Zhu, 2016; Chen et al., 2023). Die Lehrkräftebildung steht demnach vor der Herausforderung, der Heterogenität (angehender) Lehrkräfte in ihren berufsbezogenen digitalen Kompetenzüberzeugungen angemessen zu begegnen. Personenzentrierte Ansätze, wie latente Profilanalysen, ermöglichen es, innerhalb einer Population Personen mit ähnlichen Merkmalen zu Profilen zusammenzufassen und stellen damit eine Möglichkeit dar, die Heterogenität (angehender) Lehrkräften zu erfassen. Bisher gibt es erst wenige Arbeiten, die Profile berufsbezogener digitaler Kompetenzüberzeugungen von Lehramtsstudierenden (z. B. Tondeur et al., 2017) und Lehrkräften (z. B. Schulze-Vorberg et al., 2021) erstellten. Unseres Wissens nach hat bislang noch keine Studie ausschließlich berufsbezogene digitale Kompetenzüberzeugungen (angehender) Lehrkräfte in verschiedenen Kompetenzdimensionen mithilfe latenter Profilanalysen untersucht und überprüft, welche Profillösungen sich in beiden Gruppen zeigen. Solche Befunde sind jedoch von hoher Relevanz, um individuelle Entwicklungsbedarfe von Lehramtsstudierenden und Lehrkräften in den unterschiedlichen Kompetenzbereichen festzustellen und um diese Bedarfe in der Aus- und Weiterbildung zu berücksichtigen. Mithilfe einer latenten Multigruppen-Profilanalyse (Morin, 2016) werden Profile von berufsbezogenen digitalen Kompetenzüberzeugungen (angehender) Lehrkräfte erstellt und folgende Fragestellungen beantwortet:

Welche Profile berufsbezogener digitaler Kompetenzüberzeugungen von (angehenden) Lehrkräfte lassen sich unterscheiden? Stimmt die Anzahl an Profilen zwischen beiden Gruppen überein?
Wie ähnlich sind sich die Profile berufsbezogener digitaler Kompetenzüberzeugungen von Lehramtsstudierenden und Lehrkräften?

Für die Analysen wurden Daten von n = 698 Lehrkräften (72.0 % weiblich) und n = 524 Lehramtsstudierenden (74.8 % weiblich) aus Deutschland verwendet, die im Mai/Juni 2020 an einer Online-Befragung im Rahmen des DigiKompEL-Projekts (Rubach & Lazarides, 2017-2020) teilgenommen haben. Die berufsbezogenen digitalen Kompetenzüberzeugungen wurden mittels eines Instruments auf Grundlage des DigCompEdu-Rahmenmodells (Redecker & Punie, 2017) erfasst (Quast et al., 2023). Das Instrument umfasst 33 Items in sieben Skalen: 1) Administration und Weiterbildung, 2) Unterrichtsplanung, 3) Lehren und Unterstützung von Schüler*innen, 4) Evaluation, 5) Schüler*innenorientierung, 6) Förderung der Digitalen Kompetenz der Schüler*innen sowie 7) Datenschutz und Urheberrecht. Die Items wurden auf einer 5-stufigen Likertskala (1 = gar nicht kompetent bis 5 = sehr kompetent) bewertet. Zur Beantwortung der Forschungsfragen wurden für beide Gruppen getrennt latente Profilanalysen unter Berücksichtigung sechs verschiedener Spezifikationen der Varianz-Kovarianz-Matrix durchgeführt (Fragestellung 1). Die jeweils besten Profillösungen beider Gruppen wurden dann in einer latenten Multigruppen-Profilanalyse (Fragestellung 2) miteinander verglichen. Die Ergebnisse zeigen, dass sich beide Gruppen in drei Profile unterteilen lassen: eher niedrige (Profil 1), mittlere-ambivalente (Profil 2) und eher hohe (Profil 3) berufsbezogene digitale Kompetenzüberzeugungen. Da sich beide Gruppen mit jeweils drei Profilen abbilden lassen, sind die Voraussetzungen für die Durchführung einer latenten Multigruppen-Profilanalyse gegeben. Die Ergebnisse der latenten Multigruppen-Profilanalyse zeigen, dass zwischen den drei Profilen beider Gruppen eine konfigurale Ähnlichkeit (configural similarity) besteht. Es lässt sich jedoch lediglich eine partielle strukturelle Ähnlichkeit (structural similarity) zwischen den drei Profilen beider Gruppen feststellen. Ein Profilpaar unterscheidet sich in einer Kompetenzdimension strukturell voneinander: Die Lehramtsstudierenden des mittleren-ambivalenten Profils berichten in der Kompetenzdimension ‚Datenschutz und Urheberrecht‘ niedrigere Kompetenzüberzeugungen als die Lehrkräfte aus dem mittleren-ambivalenten Profil. Die berufsbezogenen digitalen Kompetenzüberzeugungen der Lehramtsstudierenden im mittleren-ambivalenten Profil in ‚Datenschutz und Urheberrecht‘ liegen knapp über den Kompetenzüberzeugungen der niedrigen Profile der Lehramtsstudierenden und Lehrkräfte. Das entstandene Modell partieller struktureller Ähnlichkeit weist jedoch sowohl eine Ähnlichkeit der Streuung (dispersion similarity) als auch der Verteilung (distributional similarity) auf. Die Analysen weisen demnach darauf hin, dass die Profile berufsbezogener digitaler Kompetenzüberzeugungen von Lehrkräften und Lehramtsstudierenden – mit Ausnahme einer Kompetenzdimension in den mittleren-ambivalenten Profilen beider Gruppen – fast identisch sind. Detailliertere Ergebnisse der getrennt durchgeführten latenten Profilanalysen und der latenten Multigruppen-Profilanalyse sollen auf der Tagung vorgestellt und diskutiert werden.

Poster

Validierung eines Fragebogens zur Erfassung allgemeiner und domänenspezifischer Überzeugungen mittels psychometrischer Netzwerke

Eric Klopp, Robin Stark

Universität des Saarlandes, Deutschland

Theoretischer Hintergrund
Epistemologische Überzeugungen (eÜ) sind ein wichtiger Prädiktor wissenschaftlichen Denkens in einer Disziplin (Fischer et al., 2014), wobei allgemeine und domänenspezifische Überzeugungen unterschieden werden können (Muis et al., 2006). Zur Untersuchung der Zusammenhänge zwischen epistemologischen Überzeugungen und anderen Konstrukten wie z.B. Studienleistungen, sind valide Skalen zur Erfassung sowohl allgemeiner als auch domänenspezifischer eÜ erforderlich. Entwickelt wurden Items zur Erfassung der folgenden sechs Dimensionen (vgl. Klopp et al., akzeptiert): Persönliche Rechtfertigung (PR), Rechtfertigung durch Autoritäten (RA), Rechtfertigung durch verschiedene Quellen (RQ), Rechtfertigung durch die Wissenschaftliche Gemeinschaft (RG), Sicherheit des Wissens (SW) und Reflexive Natur (RN). Die Items sind so konstruiert, dass diese sich im Falle allgemeiner eÜ auf Wissenschaft im Allgemeinen beziehen, während die domänenspezifischen Items durch Austausch des Ausdrucks „Wissenschaft“ auf eine Domäne angepasst werden können. Die vorliegende Studie behandelt die Untersuchung der strukturellen Validität des Fragebogens, sowohl für allgemeine als auch domänenspezifische eÜ, mittels psychometrischer Netzwerke (Constantini et al., 2014).
Ein Netzwerk besteht aus Knoten, welche die Items repräsentieren, und die durch Kanten verbunden sind. Die Kanten repräsentieren paarweise Interaktionen zwischen den Knoten, die im Sinne von Partialkorrelationen zu verstehen sind. Ein wichtiges Element ist die Schätzung der im Netzwerk vorhandenen Kanten, wobei üblicherweise Regularisierungsverfahren eingesetzt werden (Epskamp et al., 2017). Weiterhin lassen sich in Netzwerken Communities nachweisen. Das sind Gruppen von Knoten, die untereinander hohe Gemeinsamkeiten aufweisen. Somit sollten die zu einer Skala gehörenden Items als Community im Netzwerk nachzuweisen sein (Briganti et al., 2018; Golino & Epskamp, 2017).
Fragestellung
Im Folgenden werden die Hypothese untersucht, dass sich die sechs genannten eÜ-Dimensionen sowohl für die allgemeine als auch die domänenspezifische Version des Fragebogens im Sinne von Communities im Sinne struktureller Validität in einem Netzwerk nachweisen lassen.
Methode
Die Netzwerke wurden anhand einer Stichprobe von 232 Lehramtsstudierenden für die allgemeinen eÜ und 262 Lehramtsstudierenden für die domänenspezifischen eÜ mittels EBICglasso-Regularisierung geschätzt (λ=.25; Epskamp et al., 2017). Die domänenspezifischen Items bezogen sich auf die Domäne Bildungswissenschaften. Zur Absicherung des Netzwerkstruktur wurde die Akkuratheit der Kanten sowie die Stabilität des Netzwerkes mithilfe der Bootstrap-Methode mit 1000 Bootstrapstichproben untersucht (Epskamp et al., 2018). Zur Bestimmung der Community-Struktur wurde der Spinglass-Algorithmus eingesetzt (Yang et al., 2016).
Ergebnisse
Hinsichtlich der Stabilität zeigte sich nur eine geringe Abweichung der geschätzten Werte vom Mittelwert des Bootstraps (max. Abweichung von Schätzer und Booststrapmittelwert: 0.025 allgemein, 0.045 domänenspezifisch). Auch wiesen das Netzwerk ausreichende Stabilitäten auf (CSa=.593, CSd=.596).
Für allgemeine eÜ ergab sich ein Netzwerk mit sechs Communities, die mit der Ausnahme eines Items der Skala RG die ursprünglichen Skalen repräsentierten. Das Item der RG-Skala wurde der Community zugeordnet, die RN repräsentiert, und bezieht sich auf die diskursive Entstehung von Wissen in der wissenschaftlichen Gemeinschaft.
Für domänenspezifische eÜ ergab sich ein Netzwerk mit fünf Communities, wobei die Items der Dimension RA und SW zusammen eine Community bilden. Weiterhin wurden zwei Items, eines davon das gleiche wie im Falle des Netzwerks für allgemeine eÜ, der Community zugeordnet, die die Skala RN repräsentiert. Das andere Item wurde ursprünglich der Skala RQ zugeordnet und bezieht sich auf die Bestätigung von Wissen durch verschiedene Evidenzquellen.
Diskussion
Für allgemeine eÜ zeigt sich eine robuste Netzwerkstruktur, welche die vorgesehenen Dimensionen abbildet. Im Fall domänenspezifischer Skalen zeigt sich ein Zusammenfallen der Skalen RA und SW in eine Community, was darauf hindeutet, dass Lehramtsstudierende Aspekte der Sicherheit von Wissen mit der Rechtfertigung von bildungswissenschaftlichen Aussagen in Verbindung bringen. Die beobachteten Verschiebungen einiger Items, sowohl im Fall allgemeiner als auch domänenspezifischer eÜ zu anderen Skalen sind inhaltlich nachvollziehbar und legen eine geringfügige Revision dieser Items nahe. Allerdings sollte die Communitystruktur auch hinsichtlich anderer Domänen als die Bildungswissenschaften und auch mit anderen Stichproben geprüft werden.

Poster

Förderung der Lernzielorientierung im Biologieunterricht durch autonomieförderliches Lehrerverhalten

Nadine Großmann, Matthias Wilde, Tim Kirchhoff

Universität zu Köln, Deutschland

Theoretischer Hintergrund

Obwohl die Lernmotivation der Schüler:innen substantiell zum erfolgreichen Lernen beiträgt und als ein bedeutsames Qualitätsmerkmal von Unterricht gilt (Helmke, 2009), sind negative Veränderungen im Verlauf der Schullaufbahn zu verzeichnen (Spinath et al., 2016). Dies gilt im Besonderen für Lernzielorientierungen (Spinath et al., 2016). Lernzielorientierungen stellen neben Leistungszielorientierungen zentrale Dimensionen motivationaler Orientierung dar (Ames, 1992). Verfolgen Individuen Lernziele, so wollen sie ihre Kompetenzen erweitern oder Neues lernen (Ames, 1992). Hingegen fokussieren Leistungsziele die Demonstration von Kompetenzen (Annäherungs-Leistungsziel) oder das Vermeiden, Inkompetenz zu zeigen (Vermeidungs-Leistungsziel) (Ames, 1992). Lernzielorientierungen werden positive Effekte auf die Leistung (Spinath, 2009) und die intrinsische Motivation von Schüler:innen (Benita et al., 2014; Elliot & Church, 1997) zugeschrieben.

Ames (1992) beschreibt im TARGET-Modell Strategien zur Förderung von Lernzielorientierungen (s. auch Benning et al., 2019). Demnach soll das Angebot vielfältiger und interessierender Aufgaben den Lernenden bedeutungsvolle Lernaktivitäten bieten und ihre Lernzielorientierung positiv beeinflussen (Ames, 1992). Hierfür könnte autonomieförderliches Lehrerverhalten eine Umsetzungsmöglichkeit sein. Verhalten sich Lehrkräfte autonomieförderlich, so verdeutlichen sie z.B. die persönliche Relevanz eines Unterrichtsthemas oder ermöglichen den Schüler:innen Wahlmöglichkeiten, um die Aktivitäten vielfältig zu gestalten (Su & Reeve, 2011). Empfinden die Schüler:innen eine Aufgabe als persönlich bedeutsam und können Entscheidungen über ihren Lernprozess treffen, so möchten sie wahrscheinlich die Aufgabe verstehen und ihre Fähigkeiten verbessern. Dies könnte sich positiv auf ihre Lernzielorientierung auswirken (Ames, 1992). Jedoch neigen Lehrkräfte oft zu kontrollierendem Verhalten (Martinek, 2010), welches wettbewerbsfokussiert ist und externale Handlungsanreize betont (Reeve, 2015). Dies fördert vermutlich keine Lernzielorientierung, sondern eine Leistungszielorientierung (Ames, 1992).

Hypothesen

Aufgrund dieser theoretischen Überlegungen ergeben sich folgende Hypothesen:

H₁: Schüler:innen, die autonomieförderlich unterrichtet werden, haben eine stärker ausgeprägte Lernzielorientierung als Schüler:innen, die kontrollierend unterrichtet werden.

H₂: Schüler:innen, die kontrollierend unterrichtet werden, haben eine stärker ausgeprägte Leistungszielorientierung als Schüler:innen, die autonomieförderlich unterrichtet werden.

Methode

In einer quasi-experimentellen Studie wurden 150 Schüler:innen der sechsten Jahrgansstufe (M_Alter=11.46 Jahre, SD_Alter=0.55 Jahre, 52% weiblich) im Fach Biologie unterrichtet. In fünf Klassen (n=86) wurde autonomieförderliches Lehrerverhalten und in vier Klassen (n=64) kontrollierendes Lehrerverhalten implementiert. Die Unterrichtssequenz zum Thema Ernährung und Verdauung umfasste insgesamt 180 Minuten.

Die Dimensionen der Zielorientierungen wurden mithilfe der Skalen zur Erfassung der Lern- und Leistungsmotivation nach Spinath et al. (2012) erfasst. Die genutzten Items bezogen sich im Pretest auf die Zielorientierung im regulären Biologieunterricht (α=.81–.85), und im Posttest auf den durchgeführten Unterricht mit variiertem Lehrerverhalten (α=.88–.93). Als Implementationskontrolle wurde eine übersetzte und adaptierte Version des Fragebogens Perceived Self-Determination nach Reeve (2002) eingesetzt, um die Autonomiewahrnehmung der Schüler:innen zu erheben (α=.86).

Um zu prüfen, ob sich die Autonomiewahrnehmung sowie die Zielorientierungen der Schüler:innen nach der durchgeführten Unterrichtseinheit in Abhängigkeit des Treatments unterscheiden, wurden eine ANOVA und eine MANCOVA durchgeführt.

Ergebnisse und Diskussion

Die Autonomiewahrnehmung ist bei den Schüler:innen, die autonomieförderlich unterrichtet wurden (M=3.15, SD=0.56), im Durchschnitt höher als bei den kontrollierend unterrichteten Schüler:innen (M=2.50, SD=0.82). In der ANOVA ergeben sich signifikante Unterschiede in der Autonomiewahrnehmung (F(1, 148)=33.26, p<.001, η²=.18). Dies deutet auf eine gelungene Implementation des Lehrerverhaltens hin.

Die Lernzielorientierung ist bei den autonomieförderlich unterrichteten Schüler:innen (M=2.93, SD=0.60) durchschnittlich stärker ausgeprägt, als bei den kontrollierend unterrichteten Schüler:innen (M=2.34, SD=1.07). Die MANCOVA ergibt signifikante Unterschiede zwischen den Treatments für die Lernzielorientierung (F(1,148)=17.95, p<.001, η²=.11). Für die Annäherungs-Leistungszielorientierung (F(1,148)=0.18, p=.67) und die Vermeidungs-Leistungszielorientierung (F(1,148)=0.01, p=.91) ergeben sich keine signifikanten Unterschiede zwischen den Treatments.

Durch ein autonomieförderliches Lehrerverhalten kann anscheinend die Lernzielorientierung der Schüler:innen positiv beeinflusst werden. Die vermutete Nähe der Maßnahmen zur Förderung von Lernzielorientierungen und der Autonomiewahrnehmung scheint sich in der Praxis zu bestätigen. Dagegen konnte kein Einfluss des kontrollierenden Verhaltens auf die Leistungszielorientierungen gezeigt werden. Möglicherweise unterscheidet sich das kontrollierende Lehrerverhalten kaum von dem Lehrerverhalten im regulären Biologieunterricht (vgl. Martinek, 2010).

Poster

Gute wissenschaftliche Praxis - Digitale Lernmodule im Fach Chemie

André Kolbe, Carolin Eitemüller, Katrin Schüßler, Maik Walpuski

Universität Duisburg-Essen, Deutschland

Theoretischer Hintergrund

Gute wissenschaftliche Praxis (GWP) bildet das Fundament der Integrität in der Wissenschaft. Die Deutsche Forschungsgemeinschaft (DFG) hat im Jahr 1998 Leitlinien zur Sicherung der GWP veröffentlicht, die stetig aktualisiert werden (All European Academies, 2017). Ziel der DFG ist es, eine verbindliche Kultur wissenschaftlicher Integrität an Forschungsinstitutionen zu etablieren (Deutsche Forschungsgemeinschaft, 2022). Es ist daher unerlässlich, bereits dem wissenschaftlichen Nachwuchs während des Studiums Grundlagen der GWP zu vermitteln und damit eine ehrliche Wissenschaftskultur zu fördern.

Fuerholzer et al. (2020) entwickelten GWP-Kurse für Medizinstudierende und konnten eine signifikante Veränderung im Wissen und den Einstellungen der Studierenden gegenüber den Leitlinien der GWP zeigen. Allerdings fehlen flächendeckende GWP-Module für die naturwissenschaftlichen Fächer sowie Erkenntnisse über lernwirksame Merkmale solcher Module.

Für das Selbststudium spielen in diesem Zusammenhang multimediale Lernmaterialien eine wichtige Rolle, da sie motivationale und organisatorische Anreize für eine vertiefte Auseinandersetzung liefern und einen deutlichen Mehrwert hinsichtlich der Lernwirksamkeit gegenüber Paper-Pencil-Lernmaterialien bieten (Damnik et al., 2018). Dabei können interaktive Lernmaterialien das Lernen effektiver und effizienter gestalten und zu einem tieferen konzeptuellen Verständnis beitragen (Baumgartner & Herber, 2013) und generative Aktivitäten können eine aktive Auseinandersetzung mit den Lerninhalten bewirken (Fiorella, 2021).

Für eine gute wissenschaftliche Praxis erscheint neben der Kenntnis entsprechender allgemeiner Regeln vor allem die Umsetzung der Regeln, die meist an komplexe und vor allem fachspezifische Situationen gebunden ist, besonders wichtig. Es ist daher anzunehmen, dass Fallbeispiele eine besonders gute Lerngelegenheit sein können (Zumbach et al., 2008). Da Sogunro (2014) zeigen konnte, dass textlastige Lerninhalte die Motivation negativ beeinflussen und das Lernen behindern, können die Lernmaterialien durch Fallbeispiele im Comicstil textlich entlastet werden. Comics können zudem die Lernmotivation steigern und ermöglichen es Lerninhalte interessant zu präsentieren (Fitri Dwi Arini et al., 2016; Sipayung et al., 2020).

Bisher wurde allerdings nicht untersucht, ob digitale Selbstlernmaterialien, die mit Fallbeispielen in Form von Comics angereichert wurden, den Erwerb von GWP besser ermöglichen als Lernmaterialien ohne Comics.

Fragestellung

Es sollen daher folgende Forschungsfragen untersucht werden:

FF1:Inwiefern wirken die digitalen Lernmodulen auf die kognitive Belastung, die Usability und die Motivation bei Studierenden?

FF2:Inwiefern kann mit digitalen Lernmodulen der Erwerb GWP bei Studierenden gefördert werden?

FF3:Inwiefern unterscheiden sich digitale Lernmodule mit Comics von Lernmodulen ohne Comics hinsichtlich Lernwirksamkeit, kognitiver Belastung und Usability?

FF4:Inwiefern unterscheiden sich digitale Lernmodule mit Comics von Lernmodulen ohne Comics hinsichtlich der Motivation?

Methode

Im Rahmen eines Kooperationsprojekts an drei nordrheinwestfälischen Universitäten besteht die Gelegenheit, GWP-Module für Bachelor-, Master- und Promotionsstudierende der Naturwissenschaften als Selbstlernmaterialien zu entwickeln und empirisch zu untersuchen.

Die Forschungsfragen sollen mittels Pre-Post-Kontrollgruppen-Designs an Chemiestudierenden der Bachelor-, Master- und Promotionsstudiengänge mit einer Stichprobengröße von 150 Studierenden untersucht werden.

Da zur Tagung nur Daten zur ersten Forschungsfrage vorliegen werden, wird im Folgenden ausschließlich die darauf bezogene Methodik erläutert.

Zu Beginn des Wintersemesters 2023/2024 wird eine digitale GWP-Lerneinheit mit einer Stichprobe aus 70 Bachelor-, Master- und Promotionsstudierenden hinsichtlich (a) kognitiver Belastung, (b) Usability und (c) Motivation evaluiert. Die kognitive Belastung wird während der Bearbeitung mit Items von Kalyuga et al. (2001) und Paas (1992) und abschließend mit Items von Krieglstein et al. (2023) erhoben. Die Usability wird mit Items nach Schrepp (2023) und die Motivation mit Items nach Breyer und Bluemke (2016) erhoben. Die Ergebnisse dieser ersten Studie werden auf der Tagung präsentiert.

Ausblick

Der praktische Ertrag des Projekts besteht in der Entwicklung von evaluierten GWP-Lerneinheiten. Diese können zu GWP-Modulen zusammengestellt und in bestehende Curricula integriert werden. Einen theoretischen Beitrag liefert die Studie durch Erkenntnisse zur Lernwirksamkeit von Fallbeispielen im Comicstil in GWP-Lernmodulen unter Berücksichtigung kognitiver Belastung, Usability und Motivation.

Poster

Überzeugungen und weitere Teilnahmedeterminanten Jugendlicher in Bezug auf Making-Aktivitäten: Eine Interviewstudie

Sophie Uhing¹, Kathrin Smolarczyk², Stephan Kröner¹

¹Lehrstuhl für Empirische Bildungsforschung, Friedrich-Alexander-Universität Erlangen-Nürnberg; ²Hochschule Rhein-Waal

Während jüngere Kinder sich noch relativ leicht für Naturwissenschaften und Technik begeistern lassen, sinkt dieses Interesse ab dem Alter von 12 Jahren stetig (Trotman, 2017), insbesondere bei Mädchen (Sadler et al., 2012). Die Förderung von Freizeitaktivitäten im MINT-Bereich (Mathe, Informatik, Naturwissenschaften und Technik) könnte geeignet sein, dieser Entwicklung zu begegnen (Posner & Vandell, 1999; Smolarczyk & Kröner, 2023). Dies betrifft auch die Förderung von Making, d. h. der Verwendung von 3D-Druckern, Lasercuttern oder Mikrocontrollern zur Herstellung individueller Artefakte. Derartige Making-Aktivitäten finden häufig in Makerspaces und Fab Labs statt und bergen ein enormes Potenzial, Jugendliche für MINT (Smolarczyk & Kröner, 2023) zu begeistern. Um Konzepte für die Motivierung von Kindern und Jugendlichen, insbesondere von Mädchen, für freizeitliches Making zu entwickeln, ist es wichtig, die dafür einschlägigen Überzeugungen zu kennen. Um diese zu erheben, haben wir im Rahmen des BMBF-geförderten Projekts EnvironMINT eine Interviewstudie auf Basis der Theorie des geplanten Verhaltens (TPB; Ajzen, 1991) mit N = 29 Teilnehmende (weiblich: n = 14) im Alter von 11 bis 15 Jahren durchgeführt. Eine deduktiv-induktive qualitative Inhaltsanalyse (Mayring, 2014) ergab ein differenziertes Kategoriensystem.

Es fanden sich Überzeugungen zu den deduktiv gesetzten Kategorien hinsichtlich der TPB-Konstrukte verhaltensbezogene Einstellungen, personen- und umweltbezogene Kontrollüberzeugungen und subjektive Norm. Diese konnten induktiv in weitere Subkategorien unterteilt werden. Bei den verhaltensbezogenen Einstellungen stellten sich Einstellungen in Bezug auf eigene Gestaltungsmöglichkeiten als besonders bedeutsam heraus. Den Befragten gefiel die Idee, eigene Gegenstände entwerfen zu können sowie an bestehende Hobbies anzuknüpfen. In Bezug auf personenbezogene Kontrollüberzeugungen wurden u. a. – meist negative – Selbstwirksamkeitserwartungen genannt. Die Teilnehmenden gaben an, dass sie sich nicht sicher wären, ob sie Making-Aktivitäten nachgehen könnten, da ihnen diese Aktivitäten kompliziert erschienen und sie nicht sicher seien, ob sie die Aktivitäten bis zum Ende durchführen würden. Bei umweltbezogenen Kontrollüberzeugungen wurden z. B. Aussagen zu (gewünschten) Hilfestellungen getätigt. Diese bezogen sich darauf, dass die Befragten sich wünschten, von anderen Personen Unterstützung zu erhalten. Ferner gaben die Befragten mehrheitlich an, keine Orte zu kennen, an den Making-Aktivitäten möglich sind. In Bezug auf die subjektive Norm wurde vor allem genannt, dass die Familie oder Freunde es gut fänden, wenn die Befragten Making-Aktivitäten nachgingen.

Es zeigte sich, dass die befragten Kinder und Jugendlichen Making-Aktivitäten grundsätzlich offen gegenüberstehen. Hervorstechend war, dass die Mehrheit der Jugendlichen keine Orte kannte, an denen Making-Aktivitäten möglich sind. Um Makerspaces als derartige Orte bekannter zu machen könnte es helfen, deren Zusammenarbeit mit Schulen zu stärken, insbesondere mit solchen, an denen hohe Anteile benachteiligter Jugendlicher zu finden sind (Aschbacher et al., 2009). Ebenfalls auffällig war die insgesamt geringe makingbezogene Selbstwirksamkeit der befragten Jugendlichen. Vor deren Hintergrund erscheint es naheliegend, an dieser Stelle bereits zu oder vor Beginn von Making-Aktivitäten fördernd einzuwirken. Außerdem erscheint es hilfreich, mit Makingangeboten an bestehende Hobbies von Jugendlichen anzuknüpfen und so bereits bestehende von Jugendlichen auch für die Making-Förderung zu nutzen.

Es wird diskutiert, wie das erstellte Kategoriensystem für die Entwicklung eines Fragebogens zur Erhebung von Maker-Überzeugungen genutzt werden kann, der in künftigen Studien zur Erhebung der Effekte von Interventionen auf makingbezogene Überzeugungen von Jugendlichen genutzt werden kann.

Poster

Längsschnittstudie zur Entwicklung des ePCK von Lehramtsstudierenden in einer simulationsbasierten Videolernumgebung – Machen Scaffolds den Unterschied?

Dagmar Traub, Marie Irmer, Eva Weiß, Birgit J. Neuhaus

Ludwig-Maximilians-Universität München, Deutschland

Theoretischer Hintergrund

Die Beschreibung des fachdidaktischen Professionswissen von Lehrkräften kann mit Hilfe des Refined Consensus Model (RCM) of PCK geschehen (Carlson & Daehler, 2019), wobei zwischen drei PCK-Bereichen unterschieden wird: (1) dem collective PCK (cPCK), das dem gesammelten und publiziertem fachdidaktischen Wissen entspricht, das in der Community geteilt wird, (2) dem personal PCK (pPCK), welches sich auf das fachdidaktische Wissen einer einzelnen Person bezieht und (3) dem enacted PCK (ePCK), das in konkreten Unterrichtssituationen gezeigt wird. Um Studierende bereits früh Einblicke in Unterrichtssituationen zu ermöglichen und so an das handlungsorientierte ePCK heranzuführen, kann der Einsatz von simulationsbasierten Videolernumgebungen sinnvoll sein (Südkamp et al., 2008). Die im Rahmen der DFG-Forschergruppe Cosima entwickelte Videolernumgebung DiKoBi (Kramer et al., 2020) ermöglicht diesen Zugang. Studierende sollen nach dem Konzept des Professional Vision (Seidel & Stürmer, 2014) biologiespezifische Aspekte von Unterrichtsqualität in Unterrichtssituationen beschreiben, erklären und Handlungsalternativen aufzeigen, wobei sie ihr ePCK trainieren.

Fragestellung

Das fachdidaktische Studium kann mit Hilfe des RCM (Carlson & Daehler, 2019) beschrieben werden. Studierende bauen im Verlauf des Studiums sukzessive ihr fachdidaktisches Wissen auf. Während in den ersten Vorlesungen ein stärkerer Fokus auf fachdidaktischen Theorien und damit dem cPCK liegt, wenden Studierende dieses Wissen in den darauffolgenden Semestern auf die Planung von ersten Unterrichtseinheiten an, bevor sie schließlich gegen Ende des Studiums in Schulpraktika Unterricht selbst gestalten (ePCK). Offen ist jedoch, ob sich diese Entwicklung von deklarativem hin zu prozeduralem Wissen, und damit ePCK, tatsächlich so finden lässt. Wir stellen uns die Fragen:

Wie entwickelt sich das ePCK von Lehramtsstudierenden der Biologie im Verlauf ihres biologiedidaktischen Studiums?
Kann die Entwicklung von ePCK durch die Verwendung fachdidaktischer Hilfestellungen in Form von Scaffolds unterstützt werden?

Methode

Mit Studierenden für das Lehramt Biologie am Gymnasium wurde eine Längsschnittstudie mit zwei zeitversetzten Kohorten durchgeführt. Über einen Zeitraum von vier Semestern bearbeiteten die Studierenden mehrfach die Videolernumgebung DiKoBi (Kramer et al., 2020). Kohorte 1 (N=15) diente als Kontrollgruppe. Sie bearbeitete zu zwei Zeitpunkten die Lernumgebung: zu Beginn ihres biologiedidaktischen Studiums im 4. Semester und am Ende des 7. Semesters in der letzten biologiedidaktischen Lehrveranstaltung. Kohorte 2 (N=6) diente als Experimentalgruppe. Sie bearbeitete die Lernumgebung an fünf Messzeitpunkten jeweils im Rahmen von biologiedidaktischen Lehrveranstaltungen: im 4., 5., 6. sowie am Anfang und am Ende des 7. Fachsemesters. An den Messzeitpunkten 2-4 erhielten die Studierenden der Kohorte 2 für die Bearbeitung der Lernumgebung Hilfestellungen in Form von PCK-Scaffolds (kurze Texte, zu denen in der Lernumgebung gezeigten Aspekten von Unterrichtsqualität). Die Antworten der Studierenden wurden bezüglich der Qualität des gezeigten ePCK durch menschliche Kodierer bewertet. Zur Analyse der Veränderungen wurde eine Mixed ANOVA berechnet.

Ergebnisse

Die Mixed ANOVA zeigte keinen signifikanten Interaktionseffekt zwischen dem Messzeitpunkt und der Kohorte (F(1,19)=2.93, p=.103, partiales η²=.134, N=21), jedoch einen signifikanten Haupteffekt für den Messzeitpunkt auf die Leistung bezüglich des ePCK (F(1,19)=34.36, p≤.001, partiales η²=.644, N=21). Sowohl Kohorte 1 (MZP1: M=.167, SD=.078; MZP5: M=.268, SD=.085) als auch Kohorte 2 (MZP1: M=.253, SD=.127; MZP5: M=.437, SD=.152) verbesserten ihr ePCK signifikant.

Diskussion

Beide Kohorten konnten ihr in der Lernumgebung gezeigtes ePCK zwischen dem ersten und dem fünften Messzeitpunkt signifikant steigern. Dieses Ergebnis unterstützt die Annahme, dass im Verlauf des Studiums eine Entwicklung zu einem stärker prozedural orientierten PCK (=ePCK) vollzogen wird (vgl. Irmer et al., 2023). Interessant ist, dass bei Kohorte 2 weder die Unterstützung durch Scaffolds, noch ein Lerneffekt durch die häufigere Bearbeitung der Lernumgebung, einen signifikanten Einfluss auf diese Entwicklung hatten. Aufgrund der geringen Stichprobengröße müssen die Ergebnisse jedoch mit Vorsicht betrachtet werden.

Poster

Peer-Effekte in der frühkindlichen Bildungsforschung: Der Einfluss der Zusammensetzung der Peergruppe auf die Sprachkompetenz

Franziska Hürlimann¹, Daniel Schmerse¹, Oliver Lüdtke^2,3

¹Pädagogische Hochschule der Fachhochschule Nordwestschweiz, Schweiz; ²Leibniz Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN); ³Zentrum für internationale Bildungsvergleichsstudien (ZIB)

Theoretischer Hintergrund

Sprachkompetenzen sind für den Bildungserfolg von Kindern von zentraler Bedeutung, wobei ihre Entwicklung maßgeblich von Umwelterfahrungen geprägt wird und eng mit der sozioökonomischen Situation der Familie verbunden ist (Hoff, 2006). Heutzutage ist neben der Familie die Kindertagesstätte für die Mehrheit der Kinder eine wichtige Lernumgebung, in der sie einen wesentlichen Teil ihrer Zeit mit Gleichaltrigen interagieren (Jahreiß et al., 2018). Trotz zunehmender Forschung ist die Frage, welchen Einfluss Peergruppen in Kindertageseinrichtungen und Grundschulen auf den Erwerb sprachlicher Kompetenzen und damit künftige Bildungschancen haben, bisher unzureichend beantwortet. Der vorliegende Beitrag fokussiert in dieser Hinsicht auf die Bedeutung der sprachleistungsbezogenen und sozioökonomischen Komposition der Peergruppe. Kompositionseffekte auf Schulleistungen sind für soziale, ethnisch-kulturelle und fähigkeitsbezogene Kompositionsmerkmale inzwischen gut dokumentiert (Baumert et al., 2006; Bellin, 2009; Dumont et al., 2013; Nikolova, 2011). Nationale Arbeiten zu Sprachkompetenzen in frühkindlichen Bildungseinrichtungen haben vorrangig den Zusammenhang mit dem Anteil an Kindern mit Migrationshintergrund bzw. nicht-deutscher Familiensprache untersucht, mit uneindeutigen Befunden (Ebert et al., 2013; Hogrebe & Pomykaj, 2019; Kohl et al., 2019). Internationale Forschungsergebnisse aus dem vorschulischen Bereich legen für die durchschnittliche sprachliche Kompetenz der Peergruppe (Atkins-Burnett et al., 2017; Foster et al., 2020; Henry & Rickman, 2007; Mashburn et al., 2009) oder deren sozioökonomischer Zusammensetzung (Reid & Ready, 2013; Weiland & Yoshikawa, 2014) einen positiven Einfluss auf die individuelle Sprachentwicklung nahe, wobei die Effektgrössen erheblich variieren und auch mehrere Studien keine Hinweise auf Peer-Effekte finden (Choi et al., 2018, Riberio et al., 2017; Yang et al., 2023). Für Deutschland berichtet Schmerse (2021), dass mehrsprachige Kinder in Gruppen mit höherem Sprachniveau einen größeren Wortschatzzuwachs aufwiesen. In der Studie von Kohl et al. (2022) zeigten sich dagegen weder allgemeine noch differenzielle Peer-Effekte auf die sprachlichen Kompetenzen.

Fragestellung

Bislang wurde für den deutschsprachigen Kontext noch wenig untersucht,

1) inwieweit im Vorschul- und frühem Grundschulbereich ein Zusammenhang zwischen der Zusammensetzung der Peergruppe hinsichtlich der mittleren Sprachfähigkeiten und des mittleren sozioökonomischen Status (SES) mit der Sprachentwicklung eines Kinders besteht.

2) ob sich Peer-Effekte differenziell in Abhängigkeit vom a) familiären Sprachhintergrund, b) individuellen SES, sowie c) sprachlichen Ausgangsniveau zeigen.

Der vorliegende Beitrag adressiert diese Fragen systematisch.

Methode

Bisherige Studien zu Peer-Effekten und Sprachkompetenzen basieren zumeist auf Analysen einzelner Primärdatensätze und unterscheiden sich zudem in ihren statistischen Modellierungsansätzen. Ziel der vorliegenden Untersuchung ist es, im Rahmen einer Zwei-Schritte Individual Participant Data Meta-Analyse belastbare Ergebnisse zu generieren. Dafür werden Daten aus fünf deutschen Studien mit mehr als 12.000 Kindern zwischen 2 bis 10 Jahren in etwa 1.500 Gruppen einbezogen, darunter die NEPS-Startkohorte 2 (Blossfeld & Roßbach, 2019) und BiKS-3-10 (Weinert et al., 2013). Alle berücksichtigten Studien haben den rezeptiven Wortschatz mittels etablierter Testverfahren zu mehreren Messzeitpunkten sowie nonverbale kognitive Fähigkeiten und zentrale familiäre Hintergrundmerkmale erfasst. Nach der über alle Datensätze konsistenten Behandlung fehlender Werte und Auswahl der Kovariate werden im ersten Schritt dieselben Mehrebenen-Regressionsmodelle spezifiziert, um Peer-Effekte auf die Sprachkompetenzen und Cross-Level-Interaktionen für jeden Datensatz zu schätzen. Im zweiten Schritt werden die Effektgrößen meta-analytisch zusammengefasst.

Ergebnisse

Vorläufige Ergebnisse einiger bisher analysierter Datensätze zeigen einen Peer-Effekt der durchschnittlichen Sprachkenntnisse (β =.12, p =.04), der allerdings nach Hinzunahme des mittleren SES der Peers nicht mehr signifikant ist. Der mittlere SES auf Gruppenebene hängt positiv (β =.01 bis .31, p ≤ .03) mit der individuellen Sprachkompetenz zusammen. Außerdem finden sich signifikante Cross-Level-Interaktionen der mittleren Sprachkenntnisse mit sprachlichem Ausgangsniveau (β = -.16 bis -.18, p = .003) sowie individuellem SES (β = -.16 bis -.19, p ≤ .019), die darauf hindeuten, dass das Sprachniveau der Gruppe vor allem bei Kindern mit niedrigem individuellen SES und sprachlichem Ausgangsniveau die individuelle Sprachkompetenz beeinflusst. Die bevorstehende Meta-Analyse wird ein umfassenderes Bild dieser Zusammenhänge liefern und mögliche Implikationen aufzeigen.

Poster

Kontroll- und Valenzüberzeugungen von Medizinstudierenden: Eine Längsschnittstudie

Nadja Karossa¹, Thomas Rotthoff¹, Ann-Kathrin Schindler¹, Sabine Polujanski¹, Melissa Özsoy², Ulrike Nett¹

¹Universität Augsburg, Deutschland; ²Ludwig-Maximilians Universität München

Theoretischer Hintergrund

Es ist mittlerweile theoretisch und empirisch belegt, dass das emotionale Erleben von Studierenden ein bedeutender Prädiktor nicht nur für die Lernleistung, sondern auch für das Wohlbefinden und die psychische Gesundheit von Studierenden ist (z.B. Izard, 2010). Die Kontroll-Wert-Theorie (Pekrun, 2006) postuliert, dass die subjektive Bewertung der objektiven Gegebenheiten einer Situation darüber entscheidet, welche Emotionen in der jeweiligen Situation erlebt werden. Zwei Komponenten sind dabei zentral:(1)die subjektive Kontrolle über die Lernsituation bzw. das Lern- und Leistungsergebnis und (2)der Wert der Lernsituation bzw. des Lern- und Leistungsergebnisses. Die Wertüberzeugungen können in die Facetten intrinsischer Wert, Nützlichkeit, Anstrengung, Kosten und Wichtigkeit unterteilt werden (Gaspard et al.,2015). Das Auftreten spezifischer diskreter studienbezogener Emotionen kann theoretisch als auch empirisch auf das Wert- und Kontrollerleben von Studierenden zurückgeführt werden (Pekrun, 2006). Eine Studie zu Emotionen von Medizinstudierenden belegte etwa Zusammenhänge zwischen Selbstkontrolle, der Vermeidung negativer Emotionen und einer daraus resultierenden positiven Selbstwirksamkeit (Duffy, 2016). Darüber hinaus gibt es für verschiedene Populationen Hinweise darauf, dass ein positives emotionales Erleben als Schutzfaktor gegenüber Belastungserleben wirkt (Bailey & Phillips, 2016). Über das emotionale Erleben von Medizinstudierenden ist bislang wenig bekannt. Dies ist ein relevanter Befund, da Medizinstudierende national wie international eine hohe Prävalenz von Depressivität aufweisen (z.B. Dyrbye et al., 2014). Zudem konnte eine zunehmende Inzidenz von Burnout und Depressivität im Verlauf des Studiums beobachtet werden (z.B. Ludwig et al.,2015). Diese Studien untersuchten die Zusammenhänge jedoch überwiegend korrelativ. Für die Untersuchung kausaler Zusammenhänge zwischen Kontroll- und Valenzüberzeugungen und Emotionen sind wiederum Längsschnittdesigns notwendig, um inter- und intraindividuelle Unterschiede sowie Veränderungen von Medizinstudierenden zu erfassen.

Fragestellung

Das Ziel der vorliegenden Studie besteht darin, die reziproken Zusammenhänge zwischen Kontroll- und Valenzüberzeugungen und Emotionen bei Medizinstudierenden zu untersuchen. Des Weiteren wird untersucht, wie Überzeugungen und Emotionen mit der Studienleistung zusammenhängen.

Methode

Die längsschnittlich konzipierte Datenerhebung fand an acht deutschen Universitäten (Studiengang Medizin) über drei Messzeitpunkte hinweg statt. Die Stichprobe setzt sich aus 2.152 Medizinstudierenden zusammen (T1:n=1.108, 73.1% weiblich, M_Alter=23.73 Jahre, SD_Alter=4.15 Jahre; T2:n=1.163, 70.2% weiblich, M_Alter=23.63 Jahre, SD_Alter=4.31 Jahre; T3:n=940, 68.5% weiblich, M_Alter=23.74 Jahre, SD_Alter=4.52 Jahre). Zu jedem Messzeitpunkt konnten neue Studierende in die Studie aufgenommen werden. So nahmen insgesamt 296 Studierende an drei Messzeitpunkten, 470 Studierende an zwei Messzeitpunkten teil. Kontrolle wurde mit der Skala zur allgemeinen Selbstwirksamkeitserwartung (Schwarzer & Jerusalem, 1999) auf einer vierstufigen Likert-Skala erfasst. Valenz wurde mit der Skala von Gaspard et al. (2015) auf einer vierstufigen Likert-Skala erhoben. Emotionen wurden mit der Medical Education Scale (Duffy, 2016) auf einer fünfstufigen Likert-Skala erfasst. Die Analysen wurden mit dem Programm Mplus (Muthén & Muthén,1998–2017) durchgeführt.

Ergebnisse

Mit Hilfe von Neighbour-Change-Modellen zeigt sich, dass sich die mittleren latenten Valenzüberzeugungen für den intrinsischen Wert (β=-0.185,p=.000), Nützlichkeit (β=0.104,p=.010) sowie Kosten (β=0.184,p=.000) zwischen dem ersten und zweiten Messzeitpunkt signifikant verändert haben. Für Anstrengung (β=0.253,p=.000, β=-0.119,p=.010) und Wichtigkeit (β=-0.242,p=.000, β=-0.144,p=.001) zeigen sich jeweils signifikante Veränderungen zwischen dem ersten und zweiten sowie dem zweiten und dritten Messzeitpunkt. Darüber hinaus deuten die Ergebnisse darauf hin, dass sich die Medizinstudierenden sowohl in ihren Ausgangswerten als auch in ihren Veränderungswerten unterscheiden. Deshalb werden in weiteren Analyseschritten zusätzliche Variablen aufgenommen, die diese interindividuellen Unterschiede möglicherweise aufklären können. Auf der Konferenz werden weitere Befunde zum Zusammenhang von Kontroll- und Valenzüberzeugungen und Emotionen und Leistung vorgestellt.

Diskussion

Die Ergebnisse deuten darauf hin, dass sich die wertbezogenen Facetten im Laufe des Erhebungszeitraums negativ verändern. Auf dieser Basis könnte überlegt werden, dass Medizinstudierende insbesondere während dieser Belastungshotspots von universitärer Seite unterstützt werden könnten, z.B. durch Beratungsangebote. Aus den Erkenntnissen lassen sich zudem gezielte gesundheitsförderliche Maßnahmen für die medizinische Ausbildung ableiten, die es Studierenden ermöglichen, präventive individuelle Voraussetzungen zu entwickeln und sich Strategien zur Bewältigung von studien- und berufsbezogenen Belastungssituationen zu erarbeiten.

Poster

Bildungs- und migrationsbezogene Unterschiede in der Studienabbruchneigung - Worauf lassen sie sich zurückführen und haben sie sich durch die Pandemie vergrößert?

Lea Grosser, Susanne Bergann, Irmela Blüthmann, Rainer Watermann

Freie Universität Berlin, Deutschland

Studierende aus nicht-akademischen Elternhäusern (Heublein et al., 2017; Klein & Müller, 2020) sowie Studierende mit Migrationshintergrund (Klein & Neugebauer, 2023; Mishra & Müller, 2021) brechen ihr Studium häufiger ab. Zu den Ursachen dieser herkunftsbezogenen Ungleichheiten ist jedoch wenig bekannt. Tinto (1975) beschreibt den Studienabbruch als Ergebnis einer geringen akademischen und sozialen Integration. Diese Aspekte können je nach sozialem Hintergrund variieren (Boudon, 1974; Bourdieu, 1982, 1992) und somit herkunftsbezogene Unterschiede im Studienabbruch erklären. Für Studierende mit Migrationshintergrund könnten zusätzlich sprachliche Defizite eine Rolle spielen (Suarez-Orozco & Suarez-Orozco, 2008). Studien belegen die Bedeutung sowohl leistungsbezogener Aspekte (Isleib, 2019; Klein & Müller, 2020) als auch der sozialen Integration (Katrevich & Aruguete, 2017; Li & Carroll, 2017; Zea et al., 1997) für die Erklärung von bildungs- und migrationsbezogenen Unterschieden im Abbruchverhalten. Bislang existieren aber kaum Studien, die das Tinto-Modell zur Erklärung herkunftsbezogener Ungleichheiten herangezogen haben.

Die Pandemie bedingte zusätzliche Herausforderungen, wie finanzielle Unsicherheiten und mangelnde Austauschmöglichkeiten (Becker & Lörz, 2020; Besa et al., 2021), weshalb vermutet wird, dass sich Ungleichheiten verschärft haben. Theoretisch könnte das Konzept der Digital Inequality (DiMaggio & Hargittai, 2001) einen Erklärungsansatz bieten. So könnten herkunftsbedingte Unterschiede in der technischen Ausstattung und in Digitalkompetenzen Einfluss auf die Leistungsentwicklung und den Austausch mit Studierenden und Lehrenden in digitalen Lehr-Lernformaten und damit auf die Abbruchneigung haben. Zusätzlich könnte eine unterschiedliche finanzielle Belastung eine Rolle spielen (Becker & Lörz, 2020; Meier et al., 2022; Trammell et al., 2023). Internationale Studien finden sowohl Hinweise auf bildungsbezogene Unterschiede in der technischen Ausstattung während der Pandemie (Mates et al., 2021) als auch auf eine Zunahme migrationsbezogener Unterschiede in der sozialen (Barringer et al., 2023) und akademischen Integration (Alon et al., 2023). Für Deutschland finden sich Hinweise, dass sich herkunfts- und migrationsbezogene Unterschiede in der Studienabbruchintention während der Pandemie vergrößert haben (Koopmann et al., 2023; Lörz et al. 2021). Andere Studien fanden hingegen keine pandemiebedingte Verschärfung von Ungleichheiten (Becker & Lörz, 2020; Lörz et al., 2020). Insgesamt existieren kaum vergleichende Studien zu Subgruppenunterschieden vor und während der Pandemie.

Der vorliegende Beitrag untersucht 1. inwieweit sich bildungs- und migrationsbezogene Unterschiede in der Abbruchneigung auf Unterschiede in der akademischen und sozialen Integration zurückführen lassen und 2. inwieweit sich herkunftsbezogene Ungleichheiten pandemiebedingt vergrößert haben.

Die Datengrundlage bilden Befragungen Masterstudierender einer größeren deutschen Universität aus 2017 (N = 1387) und 2021 (N = 1703). Einen nicht-akademischen Bildungshintergrund hatten 31% und 41% einen Migrationshintergrund. Zur Beantwortung der Fragen wurden latente Regressionsanalysen in Mplus gerechnet, in die der Befragungszeitpunkt, der Bildungs- und Migrationshintergrund sowie sukzessive die akademische Integration (Noten und Leistungsselbsteinschätzungen), die soziale Integration (soziales Klima, Zugehörigkeitsgefühl, Lehrenden-Studierenden-Beziehung) und die Erwerbstätigkeit als Prädiktoren der Studienabbruchneigung aufgenommen wurden. Die Analysen erfolgten unter Berücksichtigung der geschachtelten Datenstruktur, die Parameterschätzung erfolgte mit FIML. Um zu prüfen, ob sich herkunftsbezogene Unterschiede vergrößert haben, wurden Interaktionseffekte des Bildungs- und Migrationshintergrunds mit dem Befragungszeitpunkt berechnet. Zusätzlich wurden Subgruppenunterschiede in den technischen Voraussetzungen für die Online-Lehre (technische Ausstattung, Internetverbindung) untersucht. Die Fächergruppe, das Fachsemester, das Geschlecht und das Alter wurden in allen Analysen kontrolliert.

In Bezug auf die erste Frage finden wir theoriekonform, dass die akademische und soziale Integration wesentliche Prädiktoren der Studienabbruchneigung sind. Für bildungsbezogene Unterschiede in der Abbruchneigung spielen neben der akademischen Integration vor allem Aspekte der sozialen Integration eine Rolle. Nach Kontrolle der sozialen Herkunft zeigten sich keine migrationsbezogenen Unterschiede in der Abbruchneigung. Hinsichtlich der zweiten Frage zeigten sich trotz herkunftsbezogener Unterschiede in der technischen Ausstattung keine Hinweise auf eine pandemiebedingte Verschärfung von Ungleichheiten in der Abbruchneigung. Dies gilt auch für Ungleichheiten in Bezug auf die Erwerbstätigkeit. Die Ergebnisse werden unter Berücksichtigung der Limitationen aufgrund des Studiendesigns im Vergleich zu Ergebnissen bisheriger Studien (Lörz et al., 2021) diskutiert.

Poster

Untersuchung der reziproken Beziehung zwischen Prüfungsangst und Vermeidungsleistungszielen

Paulina Feige¹, Rebecca Lazarides², Rainer Watermann¹

¹Freie Universität Berlin, Deutschland; ²Universität Potsdam

Prüfungsangst steht in Verbindung mit zahlreichen ungünstigen schulrelevanten Merkmalen, wie einer geringen Selbstwirksamkeit oder Leistung und kann somit die akademische Entwicklung von Schülerinnen und Schülern negativ beeinflussen (von der Embse et al., 2018). Zahlreiche Studienergebnisse weisen zudem auf einen positiven Zusammenhang mit Vermeidungsleistungszielen hin (Dull et al., 2015; Eum & Rice, 2011; Lui et al., 2020; Middelton & Midgley, 1999; Putwain & Daniels, 2010; Putwain et al., 2010). Hinsichtlich der Richtung des Zusammenhangs wird angenommen, dass Vermeidungsleistungsziele durch die Fokussierung auf das Lernergebnis und das Vermeiden von Misserfolgen die Entstehung von Ängsten in Prüfungssituationen begünstigen können (Kontroll-Wert Theorie, Pekrun, 2006; Pekrun & Elliot, 2007). Diese Annahme hat sich in der Forschungsliteratur etabliert (Dull et al., 2015; Eum & Rice, 2011; Lui et al., 2020; Middelton & Midgley, 1999; Putwain & Daniels, 2010; Putwain et al., 2010). Aufgrund größtenteils querschnittlicher Studienanlagen besteht jedoch wenig solide empirische Evidenz für die angenommene Wirkrichtung. Die vorliegende Studie untersucht daher die reziproke Beziehung zwischen Prüfungsängsten und Vermeidungsleistungszielen. Dazu wurden die Daten von 1770 Schülerinnen und Schülern (51,02 % weiblich) der Trends in International Mathematics and Science Study (TIMSS) Übergangsstudie (Becker et al., 2010) in den ersten drei Jahren in der weiterführenden Schule (Klassen 5-7) in einem latenten Cross-Lagged Panel Modell ausgewertet. Prüfungsangst wurde fachunspezifisch durch die Facetten worry (3 Items, Helmke, 1992) und emotionality (4 Items, in Anlehnung an Hodapp et al., 1982) gemessen. Die Vermeidungsleistungszielorientierung wurde ebenfalls fachunspezifisch mit drei Items gemessen (in Anlehnung an Schwinger & Wild, 2006). Aufgrund der hohen Multikollinearität der beiden Prüfungsangstfacetten wurden die Zusammenhänge für worry und emotionality in separaten Modellen betrachtet. Da Mädchen und Jungen sich hinsichtlich beider Merkmale unterscheiden (Gherasim et al., 2013; von Embse et al., 2018), wurden zusätzlich Mehrgruppen- (Mädchen/Jungen) Cross-Lagged Panel Modelle berechnet, um die Ergebnisse auf Robustheit zu prüfen. In den Modellen über alle Schülerinnen und Schüler hinweg, zeigten sich unter Kontrolle standardisierter Leistungsscores in Deutsch und Mathematik signifikante kreuzverzögerte Effekte beider Prüfungsangstfacetten auf die Vermeidungsleistungsziele, wobei sich konsistentere Zusammenhänge mit worry zeigten. Es zeigten sich keine signifikanten Effekte vice versa. In den nach Geschlechtern getrennten Modellen zeigten sich ähnliche Zusammenhänge für Jungen und Mädchen, wobei die Effekte bei den Mädchen über die Zeit hinweg tendenziell stabiler waren. Im Widerspruch zu der in der Literatur vorherrschenden Annahme, dass Vermeidungsleistungsziele den Prüfungsängsten vorausgehen, deutet die vorliegende Studie auf ein umgekehrtes Wirkmuster zu Beginn der Sekundarstufe hin. Aufgrund des längsschnittlichen Designs der Studie liefern die Ergebnisse einen wichtigen Beitrag zum Verständnis der Kausalbeziehung zwischen Prüfungsängsten und Vermeidungsleistungszielen. Im nächsten Schritt soll das Modell ausgehend vom trichotomen Modell der Zielorientierungen (Elliot & Harackiewicz, 1996) durch Annäherungsleistungsziel- und Lernzielorientierung erweitert werden. Die Erkenntnisse können dazu beitragen, Interventionen zu entwickeln, die darauf abzielen, Prüfungsangst zu reduzieren und günstige Zielorientierungen zu entwickeln.

Poster

Critical Online Reasoning in Higher Education. Assessing knowledge acquisition in online settings in Germany

Olga Zlatkin-Troitschanskaia¹, Johannes Hartig², Jennifer Fischer¹, Dimitri Molerov¹

¹Johannes Gutenberg-Universität Mainz, Deutschland; ²DIPF, Leibniz-Institut für Bildungsforschung und Bildungsinformation

Theoretical Background

Learning in online environments has become the new normality in 21^st century higher education worldwide and across domains (Grothaus et al., 2021). Compared to face-to-face or guided online learning settings with preselected information sources, self-directed learning with the Internet necessitates a skillset among students to assess the quality (e.g., credibility) of online sources and information accessed and employed for their learning (Wineburg et al., 2022).

As per previous research, a set of critical online reasoning skills (COR, (authors, 2020a,b,c) for related concepts) identified three important facets: first, online information acquisition (OIA skills), including using appropriate search queries, databases etc.; second, critical information evaluation (CIE skills), including evaluating website credibility by appropriate cues; third, reasoning based on evidence, argumentation, and synthesis (REAS skills), including using evidence to create and justify a valid argument.

Although conceptualizing, assessing, and fostering the respective skills is crucial, still little is known about students’ self-directed learning on the Internet and key influences on students’ search for and use of online sources (see review in authors, 2021). Students and graduates lack COR skills to properly search, select, evaluate, and integrate information gained from the Internet, impairing their learning success (Osborne et al., 2022). To approach this challenge in higher education, understand and foster students' self-directed online learning, the DFG established an interdisciplinary Research Unit, presented in this poster.

Research questions

The overarching questions of the three research areas are:

Area-A. How do students' online information skills (generic and domain-specific: GEN-COR and DOM-COR) develop throughout undergraduate programs and in relation to each other in four disciplines (medicine, economics, physics, sociology), when controlling for personal and contextual influence variables?

Area-B. What is the quality of the online sources and information students use for learning, and for solving course-related GEN and DOM-COR tasks? How are information features related to students’ COR skills and their learning outcomes?

Area-C. What processes (web behavior, eye movements, reasoning patterns) are characteristic of successful vs. unsuccessful COR performance? What patterns are identifiable between the annotated data of online information features and students’ COR-process and performance?

Method

The DFG research unit consists of nine projects with about 50 researchers from 16 disciplines (including communication, computer and cognitive sciences, psychology, psychometrics and learning analytics, education and didactics, linguistics, etc.), which conduct quantitative, qualitative, and mixed-methods analyses in the three areas – including longitudinal COR-assessment, content analyses of online information, eye-tracking with think-alouds and integrative data-driven analyses and learning analytics.

To validly measure GEN- and DOM-COR-skills, we developed and validated (AERA et al. 2014) open and closed computer-based performance tasks, enabling either search on the real Internet or in preselected information pools (authors, 2022). For the ongoing four-year panel study, a random sample is drawn from a full cohort of 5,000 students to achieve a representative sample across the four disciplines, resulting in N=1,200 students (300 from each discipline). Participants solve two DOM-COR and two GEN-COR tasks at each measurement, based on a booklet design with linked behavioral indicators to allow for Item Response Theory-equating.

Results

We present the theoretical-conceptual, methodological, and assessment framework of the new DFG-Research Unit and initial results from the 1^st measurement (winter term 2023/24) on GEN- and DOM-COR levels students show at the beginning of their university studies in four disciplines. Furthermore, we provide unique results on quality and features (e.g., linguistic, narrative) of online sources and information beginning students use as learning input for studying and solving GEN- and DOM-COR-tasks. Finally, we present first insights on successful vs. unsuccessful COR-task-solving strategies and discuss implications for successfully studying online in higher education.

Poster

Evidenz- und datenbasiertes Entscheiden von Lehramtsstudierenden: Zusammenhänge mit Wissen über Forschungsmethoden, Selbstwirksamkeitsüberzeugungen und Einstellungen

Till Schmäing, Bernadette Gold

TU Dortmund, Deutschland

Die Verwendung systematisch gewonnener Daten zur Unterrichts- und Schulentwicklung stellt schon lange eine Erwartung an professionelle Lehrkräfte dar (Bernhardt, 2005; Lange et al., 2012; NCLB, 2002) und wird als datenbasiertes Entscheiden bezeichnet (data-based decision-making, DBDM; Kippers et al., 2018; Schildkamp & Kuiper, 2010). Datenbasierte Entscheidungen verbessern nachweislich die Leistungen der Schüler:innen (Bernhardt, 2009; Park & Datnow, 2009; Van Geel et al., 2016) und fördern Schulentwicklungsprozesse (Potter et al., 2002). Der Begriff „Daten“ kann sich dabei auf Leistungsdaten von Schüler:innen, systematisch erhobene Fragebogen- und Beobachtungsdaten oder auch auf wissenschaftliche Erkenntnisse beziehen (Schildkamp, 2019). Unterschiedliche Studien konnten jedoch belegen, dass Lehrer:innen weder systematisch erhobene Daten noch bildungswissenschaftliche Erkenntnisse häufig für ihre Praxis heranziehen (Hetmanek et al., 2015; Lysenko et al., 2014; van Schaik et al., 2018). Stattdessen liegt der Fokus eher auf den unterschiedlichen eigenständig gewonnenen Erfahrungen aus der schulischen Praxis (Allen, 2009).

Um Lehramtsstudierende möglichst gut auf eine daten- und evidenzorientierte Praxis vorzubereiten, sind Kenntnisse über solche potenziellen Prädiktoren zentral. Zu diesen Prädiktoren gehört einerseits das Wissen über Forschungsmethoden, um Daten und Evidenz verstehen und beurteilen zu können (Mandinach & Gummer, 2016; Thomm et al., 2021). Darüber hinaus benötigen (angehende) Lehrkräfte womöglich auch motivationale Voraussetzungen, wie beispielsweise forschungsbezogene Selbstwirksamkeitsüberzeugungen, Interesse an Forschung und positive Einstellungen zum Nutzen von Wissenschaft (Datnow & Hubbard, 2016; Mandinach & Gummer, 2013; Thomm et al., 2021; van Schaik et al., 2018).

Die vorliegende Studie untersucht dementsprechend, ob daten-/evidenzbasierte Entscheidungen von Lehramtsstudierenden durch ihr Wissen über Forschungsmethoden, positive Einstellungen, Selbstwirksamkeitsüberzeugungen und Interesse vorhergesagt werden können, um somit Hinweise auf die Bedeutung ihrer Förderung in der ersten Phase der Lehrkräftebildung zu erhalten.

Methode

An dem Survey nahmen 122 Studierende (M = 22.47, SD = 4.71 Jahre) der Universität Erfurt zu einem Messzeitpunkt teil. Dabei wurden die daten-/evidenzbasierten Entscheidungen mit drei Fallvignetten von Zeuch und Souvignier (2015) erfasst, in denen die Studierenden unterschiedliche Argumente in Bezug auf die drei dargelegten Szenarien zu bewerten haben. Während die Auswertung der Fallvignetten zum wissenschaftlichen Denken mit Quasi-Paarvergleichen umgesetzt worden Als Prädiktoren wurden das Wissen über Forschungsmethoden anhand eines Tests (Behrmann, 2016; 36 Items), die forschungsbezogene Selbstwirksamkeit (Wessels et al., 2016; 9 Items; Cronbachs α = .7), das gefühlsbezogene Interesse an Forschung (Wessels et al., 2016; 10 Items; Cronbachs α =.64) und der Nutzen der Wissenschaft für die Berufspraxis von Lehrkräften (Zeuch & Souvignier, 2015; 9 Items; Cronbachs α = .35) erfasst. Als Kontrollvariable wurde das Kognitionsbedürfnis (Beißert et al., 2015) aufgenommen. Eine explorative Faktorenanalyse zum Interesse an Forschung legte ein Modell mit drei Faktoren (Literaturarbeit, Planung der Studie & die Arbeit mit den Daten und Erkenntnisanwendung) nahe, welches für das weitere Vorgehen angenommen wurde. Zur Auswertung der Fragestellung wurde eine multiple lineare Regressionsanalyse durchgeführt.

Ergebnisse

Das Regressionsmodell zeigte einen schwachen Einfluss aller Variablen auf daten-/evidenzbasierte Entscheidungen der Lehramtsstudierenden (R² = .104, F[8, 103] = 1.50, p = .17, f² = .12). Bei Betrachtung der einzelnen Prädiktoren zeigte sich lediglich das Wissen über Forschungsmethoden als statistisch signifikant für die Vorhersage des daten-/evidenzbasierte Entscheidens (β = .23; p = .02).

Diskussion

Die Ergebnisse illustrieren den Zusammenhang zwischen der mit Fallvignetten erhobenen daten-/evidenzbasierte Entscheidungen und dem objektiv gemessenen Wissen über Forschungsmethoden und verdeutlichen somit die Bedeutung des tatsächlichen Wissens im Vergleich zur durch Selbsteinschätzungen erfassten forschungsbezogenen Selbstwirksamkeitsüberzeugungen, Interesse und Einstellungen. Somit ist die Förderung von forschungsmethodischen Wissensinhalten im Lehramtsstudium möglicherweise ein Weg, um zukünftige Lehrkräfte auf daten-/evidenzbasierte Entscheidungen vorzubereiten. Aufgrund des querschnittlichen Designs ist jedoch keine Schlussfolgerung über die kausale Richtung möglich. Interessant wäre dementsprechend eine längsschnittliche Betrachtung der Entwicklung der hier betrachteten Variablen und ihre Wechselwirkungen über die Zeit des Lehramtsstudiums.

Poster

Entwicklung eines digitalen Blitzlesetests zur Erfassung der Geschwindigkeit im lexikalischen Abruf bei Schüler:innen mit niedrigen Leseleistungen

Judith Zellner, Nikola Ebenbeck, Markus Gebhardt

Ludwig-Maximilians-Universität München, Deutschland

Theorie und Fragestellungen

Lesen bildet die Basis für alle Bildungsbereiche und die Teilhabe an der Gesellschaft. Trotzdem erreichen ca. 20% der Schüler:innen die Mindeststandards basaler Lesekompetenz nicht (Stanat et al., 2022), wobei vor allem Schüler:innen mit sonderpädagogischem Unterstützungsbedarf (SPU) niedrige Leseleistungen zeigen (Gebhardt et al., 2015,). Insbesondere für diese Schüler:innen sind digitale Tests geeignet, um Leseschwierigkeiten präventiv zu vermeiden und Leseschwierigkeiten frühzeitig identifizieren (Ebenbeck, 2023, Liebers et al., 2019). Mit diesem Hintergrund wurde ein neues digitales Aufgabenformat entwickelt, das die Geschwindigkeit im lexikalischen Abruf misst (Ebenbeck et al, 2023). Dabei werden Schüler:innen Wörter mit unterschiedlicher Anzeigedauer als „Blitzlesetest“ präsentiert.

In dieser Studie wird das Aufgabenformat des Blitzlesetests auf seine Eignung für die Leistungsmessung in inklusiven Schulen anhand folgender Fragen untersucht:

Ist das Verwenden unterschiedlicher Anzeigedauern als schwierigkeitsgenerierendes Merkmal für die Testentwicklung geeignet?
Kann der Test die Leistungen von leseschwachen Schüler:innen (mit SPU) genau erfassen?

Daten und Methoden

400 Schüler:innen mit und ohne SPU aus inklusiven Grundschulen (Jahrgangsstufen 2 bis 4, M_Alter=8,51, SD_Alter=1,22) und Förderzentren für geistige Entwicklung (Jahrgangsstufen 2 bis 9, M_Alter=11,29, SD_Alter=2,02) bearbeiteten den digitalen Blitzlesetest online auf Tablets. 314 Schüler:innen hatten keinen SPU, 43 Schüler:innen hatten einen SPU Lernen, Sprache oder Verhalten (LSV) und 43 Schüler:innen hatten einen SPU Geistige Entwicklung (GE). Der Test wurde basierend auf seiner analogen Vorgängerversion weiterentwickelt (Jungjohann et al., 2023) und steht auf der Plattform Levumi.de (Mühling et al., 2017) frei zur Verfügung. Er besteht aus 30 Items. Jedes Item umfasst ein Wort, das für 0.25 Sekunden, 0.5 Sekunden, 1 Sekunde oder 2 Sekunden angezeigt wird. Nachdem das Wort auf dem Bildschirm „aufgeblitzt“ ist, wählen die Schüler:innen aus vier möglichen Wörtern das eben angezeigte Wort aus. Der Test hat keine Zeitbegrenzung, wurde aber meistens innerhalb von drei bis fünf Minuten durchgeführt.

Die Items werden in einem eindimensionalen dichotomen Raschmodell mit dem R-Paket pairwise (Heine, 2023) kalibriert. Mittels Andersen’s Likelihood Ratio Test (LR-Test) wird der globale Fit und der globale Differential Item Functioning (DIF) der Gruppen mit und ohne SPU getestet. Mittels Graphischem Modell Test (GRM) und Wald Test wird der DIF auf Itemebene überprüft. Mit einer einfaktoriellen und multifaktoriellen Varianzanalyse wird überprüft, inwiefern die Anzeigedauer der Items die Schwierigkeit der Items für Schüler:innen mit und ohne SPU bedingt.

Ergebnisse

Die Ergebnisse des LR-Tests deuten auf eine gute Passung des Raschmodells für den Blitzlesetest hin (χ²=30,76, df=59, p=1). Im Wald-Test zeigen sich keine signifikanten Abweichungen der geschätzten Itemparameter zwischen den Schüler:innen mit und ohne SPU. Insgesamt liegt kein DIF vor. Der est misst über alle Gruppen stabil und ist somit gut geeignet, um schwache Leseleistungen, auch von Schüler:innen mit SPU, genau zu erfassen. Die Anzeigedauer hat einen signifikanten Einfluss auf die Itemschwierigkeit (F(3) = 6.732, p < .01), wobei Items mit kürzerer Anzeigedauer schwieriger sind als Items mit längerer Anzeigedauer. Der größte Unterschied ist dabei, wie zu erwarten, zwischen Items mit der kürzesten (0.25 Sekunden) und der längsten Anzeigedauer (2 Sekunden, p < .01) zu verzeichnen. Schüler:innen ohne SPU sowie mit verschiedenen SPU schneiden in den Itemgruppen signifikant unterschiedlich ab (F(1) = 16.511, Pillai = 0.14, p < .001). Diese Unterschiede bleiben auch in der einfaktoriellen post-hoc Betrachtung für jede Anzeigedauer bestehen (p < .001).

Schlussfolgerungen für die weitere Testentwicklung von ökonomisch einsetzbaren Instrumenten für inklusive Klassen werden diskutiert.

Poster

Erfassung motivationsregulatorischer Selbstwirksamkeit – zwei Skalen im Vergleich

Olena Kryshko¹, Alexander Luft^1,2, Charlotte Dignath¹, Detlev Leutner²

¹TU Dortmund, Deutschland; ²Universität Duisburg-Essen, Deutschland

Im Rahmen des selbstregulierten Lernens beschreibt die motivationale Selbstregulation den komplexen Prozess der Überwachung und Steuerung des eigenen Motivationsniveaus, der theoretischen Modellen sowie empirischen Befunden zufolge über gesteigerte Motivation potenziell zum akademischen Erfolg und Wohlbefinden von Lernenden beitragen kann (Grunschel et al., 2016; Miele & Scholer, 2018; Schwinger & Stiensmeier-Pelster, 2012; Wolters, 2003). Während sich diesbezügliche Forschung bisher schwerpunktmäßig auf unterschiedliche Motivationsregulationsstrategien fokussierte (Engelschalk et al., 2017; Schwinger et al., 2009, 2012; Wolters, 1998, 1999), wurde in den letzten Jahren die Relevanz motivationsregulatorischer Selbstwirksamkeit betont, die eine effektive Strategienutzung ermöglichen bzw. begünstigen soll (Kryshko et al., 2022, 2023; Trautner & Schwinger, 2020, 2022).

Zur Erfassung motivationsregulatorischer Selbstwirksamkeit von Lernenden werden im deutschsprachigen Raum zwei Selbstberichtskalen (mit jeweils fünf Items) verwendet. Es handelt sich dabei zum einen um die von Trautner und Schwinger (2020) entwickelte Skala (folgend: MotregSW₁) und zum anderen um eine Subskala des Selbststeuerungsinventars von Kuhl und Fuhrmann (1998), welche Kryshko et al. (2023) adaptierten (folgend: MotregSW₂). Bisher wurden diese Skalen allerdings nicht gleichzeitig in einer Studie eingesetzt, um deren Vergleichbarkeit sicherzustellen und somit die Interpretation sowie Generalisierbarkeit bisheriger sowie künftiger Befunde zu erleichtern. Vor diesem Hintergrund wird in dieser Studie der Forschungsfrage nachgegangen, inwieweit diese zwei Skalen vergleichbar in Bezug auf ihre psychometrischen Eigenschaften sind. Zur Überprüfung der Skalenvergleichbarkeit werden aktuelle Standards zur Validierung pädagogisch-psychologischer Testverfahren herangezogen (AERA et al., 2014).

Die Datenerhebung erfolgte im Rahmen einer Online-Befragung von N = 350 Bachelorstudierenden unterschiedlicher Fächer an einer großen Universität (68.6% weiblich). Die Studierenden waren durchschnittlich 22.33 Jahre alt (SD=4.15; Min=18; Max=50) und in ihrem vierten Fachsemester (M=4.06; SD=2.30; Min=1; Max=16). Die Teilnehmenden wurden um einige demographische Angaben sowie die Beantwortung einer Reihe von Fragebogenitems (mithilfe eines vier- bis fünfstufigen Likert-Antwortformats) gebeten.

Neben den obengenannten Skalen zur Erfassung motivationsregulatorischer Selbstwirksamkeit wurden weitere Messinstrumente eingesetzt. Die Nutzung von Motivationsregulationsstrategien wurde mit dem Fragebogen von Schwinger et al. (2007) erfasst. Zur Erfassung studienbezogener Selbstwirksamkeit wurde die Skala von Schwarzer und Jerusalem (1999) adaptiert. Die Erfassung von Studienmotivation erfolgte mit der adaptierten Erwartung-Wert-Kosten-Skala von Kosovich et al. (2015). Zur Operationalisierung der Studienleistung wurden die Teilnehmenden nach ihrem derzeitigen Notendurchschnitt gefragt. Zudem wurden Zufriedenheit mit Studieninhalten sowie Zufriedenheit mit der Bewältigung von Studienbelastungen mit den gleichnamigen Skalen von Westermann et al. (1996) erhoben.

Zur Überprüfung der internen Struktur der beiden MotregSW-Skalen wurden konfirmatorische Faktoranalysen sowie Reliabilitätsanalysen berechnet. Außerdem wurden der Zusammenhang dieser Skalen miteinander sowie ihre jeweiligen Zusammenhänge mit verwandten Konstrukten (Motivationsregulationsstrategien, studienbezogene Selbstwirksamkeit) sowie angenommenen Outcomes (Studienmotivation, Studienleistung und Studienzufriedenheit) untersucht. Mit einer Methode zum Vergleich von Korrelationen (Hittner et al., 2003) wurde geprüft, ob sich die Zusammenhänge der beiden MotregSW-Skalen mit jeweils anderen untersuchten Konstrukten signifikant voneinander unterscheiden. Schließlich wurden für beide Skalen Messinvarianzen zwischen Gruppen hinsichtlich der Variablen Geschlecht, Migrationshintergrund und Bildungsherkunft überprüft.

Die angenommene einfaktorielle Struktur konnte für beide Skalen bestätigt werden (MotregSW₁: χ²=12.953, df=5, p=.024; CFI=0.994; TLI=0.988; SRMR=0.022; RMSEA [90% CI]=0.046 [.000–.099]; MotregSW₂: χ²= 8.326, df=5, p=.137; CFI=0.986; TLI=0.973; SRMR=0.024; RMSEA [90% CI]=0.069 [.023–.116]). Zudem zeigten beide Skalen vergleichbar hohe interne Konsistenzen (α/ω jeweils >.80) und korrelierten positiv und stark miteinander (r=.775, p<.001). Beide Skalen wiesen darüber hinaus erwartungskonforme Zusammenhänge in vergleichbarer Stärke mit verwandten Konstrukten sowie unterschiedlichen Outcome-Variablen auf. Schließlich zeigten sich für beide Skalen vollständige Messinvarianzen bezüglich der Bildungsherkunft, allerdings keine ausreichenden Messinvarianzniveaus bezüglich des Geschlechts und des Migrationshintergrunds, sodass Gruppenvergleiche im Hinblick auf diese Variablen mit Vorsicht interpretiert werden sollten.

Insgesamt deuten die Befunde auf die psychometrische Äquivalenz der beiden MotregSW-Skalen hin und legen somit ihre mögliche austauschbare Verwendung nahe. Im Rahmen des Posterbeitrags werden diese Befunde ausführlicher diskutiert sowie um Ergebnisse der Inhaltsanalyse der jeweiligen Skalenitems und die daraus resultierenden Optimierungsvorschläge ergänzt.

Poster

Intraindividuelle Analyse von Burnout und Engagement von Oberstufenschüler*innen – eine latent transition-Analyse der Profile über die Zeit

Sarah Bebermeier¹, Ziwen Teuber², Kim Laura Austerschmidt³, Malin Brückmann⁴

¹Leibniz Universität Hannover, Deutschland; ²Universität Luxemburg, Luxemburg; ³Evangelisches Klinikum Bethel Bielefeld, Deutschland; ⁴Universität Bielefeld, Deutschland

Theoretischer Hintergrund: Oberstufenschüler*innen kurz vor dem Abitur müssen viele Herausforderungen bewältigen (Albert et al., 2015) und erleben oft Stress (Oerke, 2012; Spangler et al., 2002). Teuber et al. (2020) zeigten, dass hohe Anforderungen, welche die individuellen Bewältigungsmöglichkeiten von Schüler*innen übersteigen, mit höherem Burnouterleben und geringerem schulischem Engagement einhergehen. Es kommt zu schlechteren Leistungen (Teuber et al., 2020) und zu negativen Konsequenzen für die psychische Gesundheit (Salmela‐Aro & Upadyaya, 2014). Ein Großteil der Forschung zu Burnout und Engagement beschäftigt sich variablenzentriert mit Prädiktoren und Konsequenzen der beiden Konstrukte. Häufig werden nur einzelne Facetten von Burnout (z.B. Erschöpfung, reduziertes Wirksamkeitserleben) oder Engagement (z.B. Hingabe, Vertieftsein) fokussiert. Personenzentrierte Ansätze, die berücksichtigen, dass sich Personen hinsichtlich Burnouterleben und Engagement individuell unterscheiden, gibt es nur wenige. So fanden Leiter und Maslach (2016) mittels eines personenzentrierten Ansatzes fünf qualitativ differenzierbare Profile bei Mitarbeitenden aus dem Gesundheitssystem (belastet, überfordert, zynisch, ineffektiv, engagiert) und Virtanen et al. (2018) sowie Cheung und Li (2019) identifizierten drei Profile zur Höhe der individuellen Burnoutausprägung (gering, mittel, hoch) bei Mittelstufenschüler*innen. Neben der intraindividuellen Konstellation von Burnout und Engagement ist auch die Stabilität der Profile über die Zeit, empirisch bisher kaum untersucht.

Fragestellungen: (1) Wie viele und welche Profile hinsichtlich der drei Burnoutfacetten Erschöpfung, Zynismus und reduziertes Wirksamkeitserleben und der drei Engagementdimensionen Hingabe, Vertieftsein und Energie lassen sich bei Oberstufenschüler*innen identifizieren? Es wird erwartet, dass sich die Profile in quantitativer und qualitativer Hinsicht unterscheiden. (2) Wie stabil sind die Profile der Oberstufenschüler*innen innerhalb eines Schulhalbjahres? Es wird erwartet, dass die Profilzugehörigkeit mehrheitlich stabil ist und adaptive sowie maladaptive Profilwechsel auftreten.

Methode: Mittels einer Online-Studie wurden demographische und schulbezogene Informationen (7 Items), Burnout (10 Items), Engagement (6 Items) und schulische Leistung (1 Item) von Oberstufenschüler*innen erhoben (N = 1.375, weiblich = 923). Um die theoretischen Annahmen zu den Konstellationen der Burnoutfacetten und Engagementdimensionen zu prüfen, wurden mittels einer latenten Profilanalyse Anzahl und Charakteristika der Profile ermittelt. Anschließend wurden Längsschnittdaten (n = 248) genutzt, um die Stabilität der Profile zu überprüfen. Für beide Messzeitpunkte wurde je eine latente Profilanalyse durchgeführt und dann eine latent transition-Analyse zur Bestimmung der Profilwechsel vorgenommen.

Ergebnisse: Auf Basis der statistischen Gütekriterien und der inhaltlichen Interpretierbarkeit zeigt sich zu beiden Messzeitpunkten eine 5-Profillösung. Die identifizierten fünf Profile differenzieren vor allem in quantitativer Hinsicht: Profil 1 (n = 119; 8.7%) zeichnet sich durch unterdurchschnittliches Burnouterleben und weit überdurchschnittliches Engagement aus (Engagierte). Profil 2 (n = 391; 28.4%) zeichnet sich durch unterdurchschnittliches Burnouterleben und leicht überdurchschnittliches Engagement aus (Pragmatische). Profil 3 (n = 546; 39.7%) zeichnet sich durch durchschnittliches Burnouterleben und durchschnittliches Engagement aus (Durchschnittliche) und Profil 4 (n = 259; 18.8%) zeichnet sich durch überdurchschnittliches Burnouterleben und unterdurchschnittliches Engagement aus (Belastete). Profil 5, dem wenige Schüler*innen angehören (n = 60; 4.4%) zeigt qualitative Unterschiede und Engagement trotz überdurchschnittlichem Burnouterleben (Über-Engagierte).

Es zeigen sich signifikante Zusammenhänge zwischen den Profilen und schulischer Leistung (η = .31, p <.001): Engagierte und Pragmatische berichten häufiger als erwartet eine bessere Durchschnittsnote, während Belastete und Über-Engagierte häufiger eine schlechtere Durchschnittsnote berichten. Der Vergleich der Profilzugehörigkeit zwischen beiden Messzeitpunkten weist eine hohe Stabilität auf (n = 131; 52.82%). Es lassen sich 15 verschiedenen Arten von Profilwechseln, sowohl adaptiver als auch maladaptiver Art identifizieren.

Diskussion: Fast ein Fünftel der Oberstufenschüler*innen unserer Stichprobe wurde als „Belastete“ mit überdurchschnittlichem Burnouterleben und unterdurchschnittlichem Engagement klassifiziert. Dies unterstreicht den Bedarf an Forschung und zielgerichteter Präventions- und Interventionsplanung. Zukünftig sollten Prädiktoren der Profilstabilität und -wechsel sowie Effekte auf schulische Leistung und psychische Gesundheit betrachtet werden. Implikationen des Dropouts im Längsschnitt werden für die aktuellen Befunde diskutiert.

Poster

Neue Notenzusammensetzung – Neue Noten? Wie die österreichische Maturareform von 2020 das Notengebungsverhalten von Lehrer*innen verändert

Vincent Schatz, Roman Zviagintsev, Nele Kampa

Universität Wien, Österreich, Zentrum für Lehrer*innenbildung

Einleitung

Abschlussprüfungen der allgemeinen Hochschulreife basieren auf der Allokationsfunktion von Schulnoten (Beckers et al., 2010). Ihre Auswirkungen auf Bildungswege sind immens, weshalb Notenreformen, z.B. bei Matura-(Abitur)Prüfungen, im besonderen Maße wissenschaftlicher Untersuchungen bedürfen.

Standardbasierte Leistungsfeststellungen und von Lehrer*innen vergebene Jahresnoten messen unterschiedliche Formen von schulischer Leistung (Willingham et al., 2002). Während die Ergebnisse standardbasierter Leistungsfeststellungen vorrangig Daten über akademische Leistungen der Schüler*innen liefern, beinhalten Jahresnoten zusätzlich verschiedene andere Faktoren, sog. nicht-akademischen Leistungen, z.B. Mitarbeit, Fleiß und individueller Lernfortschritt (Brookhart et al., 2016; Cross & Frary, 1999). Jahresnoten orientieren sich weiters am mittleren Leistungsniveau einer Klasse, der sog. Bezugsnorm (Hübner et al., 2020; Marsh & O'Mara, 2010), und sind deutlich stärker mit der Tendenz von Lehrer*innen konfrontiert, Schüler*innen möglichst gute Note vergeben zu wollen (pulling for students), was insbesondere bei Schüler*innen mit eher schlechten schulischen Leistungen zutrifft (McMillan, 2003). Zudem weist die Literatur auf einen deutlichen Zusammenhang zwischen Überzeugungen von Lehrpersonen (sog. teacher beliefs) und Aspekten ihres pädagogischen Handelns hin (Pilcher, 1994), was auch auf die Jahresnotenvergabe, die von unterschiedlichen teachers‘ grading beliefs beeinflusst sein kann, zutrifft (Bonner & Chen, 2021).

Im Gegensatz dazu zielen standardbasierte Leistungsfeststellungen auf nationale Vergleichbarkeit ab und basieren auf zentral festgelegten Kriterien (z.B. zentrale Abschlussprüfungen der allgemeinen Hochschulreife). Jahresnoten und Ergebnisse von standardbasierten Leistungsfeststellungen verfolgen demnach unterschiedliche Ziele und die erreichten Ziffernnoten unterscheiden sich in ihrer inhaltlichen Aussage bezüglich der erbrachten Leistungen.

Inwiefern Änderungen der Funktion von Jahresnoten, z.B. durch Notenreformen, auch zu einem veränderten Notengebungsverhalten von Lehrer*innen führen und inwiefern dies mit Charakteristika und grading beliefs von Lehrkräften zusammenhängt, ist bisher noch nicht ausreichend untersucht. Eine Ausnahme ist eine irische Studie (Doyle et al., 2021), die eine deutliche Verbesserung der Noten der irischen Leaving Certificates zeigte, nachdem die Verantwortung für deren Bewertung von einem zentralen Bewertungskomitee auf die jeweiligen Lehrer*innen übertragen wurde. Mit einer ähnlichen Situation ist Österreich seit einer nationalen Notenreform im Jahr 2020 konfrontiert. Seitdem fließen in das Zentralmaturazeugnis die Ergebnisse der Zentralmaturaprüfungen UND der Jahresleistungen der Abschlussklasse der Sekundarstufe II mit ein. Statistische Daten lassen bereits erkennen, dass diese Notenreform zu deutlich höheren Bestehensquoten bei der Zentralmatura geführt hat (ca. 13% vor versus ca. 5% nach 2020) (Statistik Austria, 2023).

Forschungsfragen

Unsere Forschungsfragen sind somit:

- Ist die Verbesserung der Zentralmaturanoten auf das Einfließen der Jahresabschlussnoten seit der österreichischen Notenreform 2020 zurückzuführen?

- Haben sich seit 2020 neben den Zentralmaturanoten auch die Jahresabschlussnoten verbessert?

- Gibt es einen Zusammenhang zwischen den höheren Bestehensquoten bei der Zentralmatura seit 2020 und teachers‘ grading beliefs?

Methode

In zwei Bundesländern Österreichs (Wien und Tirol) erheben wir im Herbst 2023 längsschnittlich die Zentralmatura- und Jahresabschlussnoten von 2017 bis 2023 an insgesamt 20 Schulen und somit Noten von ca. 200 Lehrer*innen vor, während und nach der Notenreform 2020. Anschließend beantworten diese Lehrkräfte einen Fragebogen zu ihren grading beliefs in Bezug auf die Funktionen der Schulnotenvergabe im Allgemeinen, ihrer Einstellung zur Zentralmaturanotenvergabe im Besonderen sowie zu ihren Einstellungen gegenüber einer Reihe von alternativen Möglichkeiten zur Leistungsbeurteilung. Eine Verknüpfung dieser beiden Datenquellen erlaubt uns, (individuelle) Veränderungen im Benotungsverhalten von Jahresabschluss- und Zentralmaturanoten sowie Zusammenhänge mit zugrundeliegenden grading beliefs zu erforschen. Die Daten werden diesen Winter mit längsschnittlichen und mehrebenanalytischen Verfahren ausgewertet.

Erwartete Ergebnisse

Aufgrund der beschriebenen Datenlage nehmen wir an, dass in den Jahresabschlusszeugnissen entweder generell bessere Noten als in den Zentralmaturaprüfungen vergeben werden oder (als wahrscheinlichere Annahme) sich die Jahresabschlussnoten seit 2020 verbessert haben. Aufgrund des Pulling-For-Students-Effekts nehmen wir weiters an, dass die Notenanhebung insbesondere bei niedrigen Notengraden stattgefunden hat. Zusammenhänge zwischen weiteren im Fragebogen enthaltenen Konstrukten zur Erfassung von teachers‘ grading beliefs und individuellem Notengebungsverhalten werden wir aufgrund der unzureichenden Literaturlage auf explorative Weise untersuchen.

Poster

Wenn’s wichtig ist hab‘ ich keine Angst – und wenn doch, dann ein Problem! Eine Untersuchung von Klassenfaktoren und Geschlechtsunterschieden im Zusammenhang von Prüfungsangst und Noten im Mathematikunterricht.

Noro Schlorke, Patrick Paschke, Ricarda Steinmayr

Technische Universität Dortmund, Deutschland

[Theorie, Fragestellungen]

Angst vor Prüfungen stellt Lehrinstitutionen vor Herausforderungen. Es besteht die Gefahr, dass ein wiederkehrender psychologischer Faktor einen systematischen Einfluss auf die Bewertung und damit den Erfolg von Schülerinnen und Schülern (SuS) hat. Bereits vor über 40 Jahren wurde der negative Effekt von Prüfungsangst auf Noten ausgiebig untersucht (Deffenbacher, 1980). Generell unterscheidet man bei der Prüfungsangst eine Besorgheits- und eine Aufgeregtheitskomponente (Hembree, 1988). Die Besorgtheitskomponente scheint in einem stärkeren Zusammenhang mit Schulleistung zu stehen (Seipp, 1991; Steinmayr et al., 2016). Auch zeigen neuere, domänenspezifische Untersuchungen, dass Mädchen/Frauen stärker unter Mathematik bezogener Prüfungsangst leiden (Lowe, 2014; Putwain et al., 2014; Núñez-Peña et al., 2016). Diese Geschlechtsunterschiede wurden in Zusammenhang mit Gender-Bias in Erwartungen von Lehrkräften über die Mathematik-Fähigkeiten ihrer SuS gesetzt (Robinson-Cimpian, 2014; Ayuso et al., 2021). Dies impliziert stärker negative Effekte von Lehrkraft-Effekten auf die Prüfungsangst von Mädchen.

Der Effekt von Klassenfaktoren auf Prüfungsangst wurde bereits 1988 erstmalig untersucht. Helmke (1988) zeigte einen positiven Zusammenhang zwischen der durch Lehrkräfte vermittelten Relevanz guter Noten und der Stärke des Effekts von Prüfungsangst auf Noten auf. Untersuchungen zu weiteren Unterrichtsmerkmalen liegen unserer Kenntnis nach nicht vor, ebenso nicht dazu, ob diese Effekte durch das Geschlecht moderiert werden.

Aus der beschriebenen Literatur ergeben sich folgende Hypothesen für das Unterrichtsfach Mathematik: In Unterrichtsklassen, in denen eine hohe Leistung von höherer Relevanz sind, hat die Besorgniskomponente der Prüfungsangst einen stärkeren negativen Effekt auf Noten (Hypothese 1). Mädchen leiden stärker unter Prüfungsangst in Mathematik (Hypothese 2) und lehrkraftabhängige Klassenfaktoren haben einen stärkeren negativen Effekt auf Mädchen als auf Jungen (Hypothese 3).

[Methode]

In der vorliegenden Studie wurden 33 Schulklassen der Stufen 8 und 9 mit insgesamt 767 SuS (Durchschnittliches Alter: 14.1 Jahre; SD: 0.82; 361 Jungen, 403 Mädchen) in Nordrhein-Westfalen untersucht. Die Kinder füllten einen Fragebogen zu Klassenvariablen (Unterrichtsdruck, Vermittlungsqualität und Kontrolle der Schülerarbeit) (LFSK, Eder, 1998;) sowie Prüfungsangst (Schwarzer, Jerusalem, 1999) aus. Ihre Mathematikkompetenz wurde mit Hilfe des TIMSS (Baumert et al., 1998) und ihre numerische Intelligenz durch die Zahlenfolgenskala des CFT-R (Weiß, 2013) erfasst. Die beiden letzteren Variablen dienten als Kontrollvariablen. Darüber hinaus wurden die SUS zu ihrer letzten Mathematiknote befragt (negativ kodiert). Die Items der Klassenvariablen wurden innerhalb jeder Klasse aggregiert.

[Ergebnisse]

Zur Überprüfung der Hypothesen 1 und 3 wurden jeweils ein Mehrebenen-Modell für jede der Klassenvariablen berechnet. Die Hypothesen konnten für Vermittlungsqualität und Klassendruck nicht bestätigt werden. Das Mehrebenen-Modell für Kontrolle der Schülerarbeit (X² = 0.00, CFI = .917, RMSEA = .048, SRMR = .048) bestätigte die Hypothesen 1 und 3. Im Folgenden werden standardisierte Effektgrößen berichtet. Die Interaktion zwischen Besorgtheit und Kontrolle der Schülerarbeit auf die Note wurde signifikant (β = -.697, p = .006). Die Interaktion zwischen Kontrolle der Schülerarbeit und Geschlecht auf die Besorgnis wurde ebenfalls signifikant (β = -.516, p = .006). Wie Hypothese 2 vorhersagt, leiden Mädchen stärker unter Besorgtheit vor Prüfungen (β = -.18, p < .001). Für die Dimension der Aufgeregtheit (X² = 0.00, CFI = .897, RMSEA = .050, SRMR = .050) können die Hypothesen 1 und 3 nicht bestätigt werden.

[Relevanz]

Die Ergebnisse dieser Studie bestätigen vorherige Ergebnisse, dass unabhängig vom Potential und den Kompetenzen kontrollierende Unterrichtsmerkmale wie eine häufige Kontrolle der Schülerarbeit zu einem stärkeren negativen Effekt der Prüfungsangst auf die Mathematiknote führt, als auch, dass Mädchen stärker unter Prüfungsangst im Fach Mathematik leiden. Ergänzt wird dieser Befund in dieser Studie darum, dass eine stärkere Kontrolle der Schülerarbeit in der Klasse für Jungen zu einer Senkung der Prüfungsangst führt, während der Effekt sich für Mädchen umdreht. Der Beitrag wird vor dem Hintergrund der Bedeutung der Ergebnisse für den STEM-Bereich und alternativer, möglicherweise Prüfungsangst senkender Unterrichtsmerkmale diskutiert.

Poster

Behaviorale Erfassung der Handlungsadaptivität nach Fehlern: Entwicklung eines Untersuchungsparadigmas

Jana Spear¹, Donna Bryce¹, Carolin Burmeister², Maria Tulis³, Robert Grassinger², Markus Dresel¹

¹Universität Augsburg; ²Pädagogische Hochschule Weingarten; ³Universität Salzburg

Fehler sind eine wichtige Lernchance in Lernprozessen, da sie unter anderem Rückmeldung über Fehlkonzepte oder fehlendes Wissen liefern (Zhang & Fiorella, 2023). Um das in Fehlern liegende Lernpotenzial optimal nutzen zu können, ist ein adaptiver Umgang damit essentiell (z.B. Grassinger et al., 2018). Theoretisch unterschieden werden kann zwischen adaptiven affektiv-motivationalen und adaptiven auf die Lernhandlung bezogenen Reaktionen auf Fehler (Dresel et al., 2013). Postuliert wird, dass affektiv-motivationale Reaktionen auf Fehler zwar eine notwendige Voraussetzung für handlungsbezogene Fehlerreaktionen sind, allerdings nur letztere, also Anpassungen im Lernhandeln, im direkten Zusammenhang mit Lernerfolg stehen (Grassinger et al., 2018). Die Studienlage hierzu ist allerdings dadurch limitiert, dass sie auf reinen Selbstberichtsdaten beruht. Vor allem bei der Untersuchung von Kindern wird der alleinige Einsatz von Selbstberichten oftmals kritisch gesehen, da ein reliables und valides Antwortverhalten hier nicht immer gesichert ist (Conijn et al., 2020). Auch wenn der Kind-Perspektive in der Forschung ein wichtiger Beitrag zugeschrieben wird (Landgraf et al., 2018), scheint eine Ergänzung durch behaviorale Daten gewinnbringend zu sein. Unabhängig davon liegt nach wie vor wenig Evidenz dazu vor, ob sich adaptive, auf die Lernhandlung bezogene Reaktionen auf Fehler wie postuliert positiv auf den Wissenserwerb auswirken. Um diese beiden Forschungsanliegen zu adressieren, wird ein Experimentalparadigma anhand von zwei Studien vorgestellt, das sowohl eine zusätzliche behaviorale Erfassung handlungsadaptiver Fehlerreaktionen als auch eine Untersuchung des unmittelbaren Effektes auf den Wissenserwerb ermöglicht. Dabei diente die erste Studie zunächst der grundsätzlichen Erprobung des Paradigmas und des Verhaltensindikators handlungsadaptiver Fehlerreaktionen mit Studierenden. Aufbauend darauf wird in Studie 2 eine Übertragung auf die Population der Grundschulkinder erfolgen.

In Studie 1 wurde eine digitale Lernumgebung genutzt, die von 177 Studierenden des Lehramts (Alter: M = 20.3 Jahre; SD = 3.3; 72 % weiblich) bearbeitet wurde. Sie durchliefen vier aufeinanderfolgende Lern-Test-Zyklen sowie eine Prä- und Posterfassung des Wissensstandes. Die Lernphasen bestanden dabei aus tutoriellen Erklärungen zu Forschungsmethoden. Die darauffolgenden Testphasen enthielten schwere Aufgaben, auf die ein Richtig/Falsch Feedback folgte. Eine falsche Antwort bot die Möglichkeit, die Lerneinheit bis zu zwei Mal freiwillig zu wiederholen. Der Anteil solcher freiwilligen Wiederholungen an der Gesamtanzahl der fehlerhaft beantworteten Aufgaben diente als behavioraler Indikator handlungsadaptiver Fehlerreaktionen. Zusätzlich wurden die handlungsadaptiven Reaktionen auf Fehler im Selbstbericht mit einem bereits umfassend validiertem Instrument erfasst (Tulis et al., 2018).

Es konnte gezeigt werden, dass der behaviorale Indikator der Handlungsadaptivität in engem Zusammenhang mit dem Selbstberichtsinstrument (r = .58; p < .01) steht, was für dessen Validität spricht. Mit Strukturgleichungsmodellen konnte gezeigt werden, dass die behaviorale Handlungsadaptivität einen positiven Effekt auf das Posttest-Wissen hat, nach Kontrolle des Vorwissens der ProbandInnen (β = .31, p < .001). Die selbstberichtete Handlungsadaptivität während der Lernhandlung stand in einem ähnlich positiven Zusammenhang mit dem Wissenserwerb, ebenfalls nach Kontrolle des Vorwissens (β = .22, p < .01). Die korrespondierende Ergebnismuster der beiden Messmethoden verweisen darauf, dass sich handlungsbezogene Reaktionen auf Fehler für Erwachsene sowohl im Selbstbericht als auch auf behavioraler Ebene zuverlässig erheben lassen. Des Weiteren stützen sie die Annahme, dass auf die Lernhandlung bezogene Reaktionen auf Fehler einen zentralen Beitrag für das Lernen aus Fehlern liefern.

Studie 2 befindet sich gerade in der Durchführung. Die Operationalisierung erfolgt analog zur Studie 1. Die Inhalte der digitalen Lernumgebung werden dabei an das Grundschulalter angepasst und sollen Sachverhalte zum Rechnen und zum Rechtschreiben behandeln. Die Ergebnisse der Studie 2 zur Übertragung des Paradigmas auf Grundschulkinder werden bis zum Zeitpunkt der Tagung vorliegen und dort berichtet.

Poster

Fortbildungsinteressen von Lehrkräften - What matters?

Melissa Meurel

Universität Münster, Deutschland

Die dritte Phase der Lehrkräftebildung macht mit durchschnittlich 35 Jahren den längsten Zeitraum aus, in dem Lehrkräfte fortlaufend ihre Kompetenzen weiterentwickeln müssen, um die sich stetig wandelnden Herausforderungen des Berufsalltags bewältigen zu können (Pasternack et al., 2017, S. 20). Für die berufsbegleitende Professionalisierung von Lehrkräften werden Fortbildungen eine zentrale Bedeutung zugesprochen, zudem werden sie als ein wichtiges Instrument für den Transfer von Innovationen in die Schule verstanden (DVLfB, 2018, S. 8). Wie aber kann der Transfer bestmöglich gelingen? Für die Gestaltung von entsprechenden Veranstaltungen liegen in der Fortbildungsforschung evidenzbasierte Qualitätskriterien vor (z. B. Lipowsky 2023). Es ist jedoch auch wichtig, die Übereinstimmung des Fortbildungsangebots mit den Bedürfnissen der Lehrkräfte zu berücksichtigen. Obwohl Lehrkräfte grundsätzlich verpflichtet sind, sich fortzubilden, ist diese Verpflichtung in vielen Bundesländern nicht quantifiziert. Daher liegt es im Ermessen der Lehrkräfte, ob und in welchem Ausmaß sie dieser Fortbildungspflicht nachkommen (Pasternack et al., 2017, S. 240). In der Fortbildungspraxis zeigt sich, dass die individuellen Interessen der Lehrkräfte als zentraler Prädiktor für Lehr-Lern-Prozesse sowie ausschlaggebender Beweggrund zur Fortbildungsteilnahme (Krille 2020, S. 21) weitestgehend unberücksichtigt sowie unzureichend systematisch erhoben werden (Heinemann 2019, S. 44). So widmet sich die vorliegende Arbeit der Erfassung des Interesses nordrhein-westfälischer Geographielehrkräfte an fachspezifischen Fortbildungen. Das Interesse bildet im Sinne der pädagogisch-psychologischen Interessentheorie eine bedeutungsmäßig herausgehobene Person-Gegenstands-Relation, wobei Interessengegenstände Inhalte, Tätigkeiten oder Kontexteumfassen können (Krapp & Prenzel 2011, S. 32).

An dieser Stelle setzt das Dissertationsvorhaben mit dem Ziel an, das Interesse von Lehrkräften an Inhalten und Tätigkeiten bei Fortbildungen sowie potenzielle Einflussfaktoren auf das Interesse zu ermitteln (Meurel 2023). Auf Basis der Forschungsergebnisse sollen Handlungsempfehlungen hinsichtlich der Gestaltung zukünftiger Fortbildungen abgeleitet werden. Als ausgewählter Teilaspekt fokussiert das Poster auf die Forschungsfrage Welche Faktoren beeinflussen das Lehrkräfteinteresse bei Fortbildungen?.

Da für das vorliegende Forschungsprojekt keine respektive nur wenige Evidenzen vorliegen, wird sich für die empirische Umsetzung für ein Vorstudienmodell als Untersuchungsdesign entschieden (Döring & Bortz 2016, S. 184). In einem ersten Schritt dient eine qualitative Vorstudie in Form von leitfadengestützten Interviews mit acht Expertinnen und Experten zur Exploration des Forschungsfeldes. Die Interviewdaten werden mittels inhaltlich strukturierender Inhaltsanalyse in Anlehnung an Kuckartz (2018, S. 100) ausgewertet und die Ergebnisse genutzt, um Hypothesen zur Interessenausprägung von Geographielehrkräften zu generieren. Hierbei werden die Hypothesen durch bestehende Studien der Fortbildungs- respektive Interessenforschung gestützt. Die qualitative Vorstudie stellt die Vorarbeit für die quantitative Hauptstudie dar, in der die Hypothesen im Rahmen einer standardisierten Online-Befragung überprüft werden (N= 172). Die Ermittlung des Lehrkräfteinteresses erfolgte mittels fünfstufiger Likkert-Skala von 1=„interessiert mich nicht“ bis 5=„interessiert mich sehr“. Die Fragebogenitems wurden literaturbasiert unter Rückbezug auf die Vorstudienergebnisse entwickelt. Nebst deskriptiver Statistik erfolgen inferenzstatistische Analysen mittels SPSS. Konkret werden für die Beantwortung der Forschungsfrage ausgehend von Korrelationsanalysen zwischen der abhängigen Variable Lehrkräfteinteresse und den unabhängigen Variablen mittels linearen Regressionsanalyse ein Vorhersagemodell für die Interessenausprägung aufgestellt.

Die Untersuchung zeigt, dass die befragten Lehrkräfte grundsätzlich ein hohes Interesse an fachspezifischen Fortbildungen aufweisen (X̅=gesamt=3.98). Hinsichtlich der einzelnen Inhaltsbereiche sind heterogene Interessenausprägungen zu verzeichnen, wobei übergeordnete Trends zu identifizieren sind (Meurel, 2023). Durch die Gesamtheit der explorativ getesteten unabhängigen Variablen kann eine Varianzaufklärung in Höhe von 39,60 % (korrigiertes R²= .396) erklärt werden. Das Vorhersagemodell ist statistisch signifikant ((F(1,149)= 84.830), p <.001) und identifiziert in der in der nachfolgenden Reihenfolge die unabhängigen Variablen 1.) Überzeugung hinsichtlich Fortbildungen (T= 7.441, p <.001, β= .518), 2.) Fachinteresse (T= 2.910, p= .004, β= .205) und 3.) berufliche Belastung (T= 2.228, p= .027, β= .144) der befragten Geographielehrkräfte als Prädiktoren für das Lehrkräfteinteresse bei Fortbildungen.

Vor diesem Hintergrund umfassen Implikationen für die Fortbildungspraxis 1) die Entwicklung einer Fortbildungskultur, 2.) die Förderung der Interessentwicklung an und bei Fortbildungen und 3.) die Schaffung eines adressatenorientierten Fortbildungsrahmens.

Poster

„Die Audio-Feedbacks waren super!“ – Wie bewerten Studierende vorbereitete, direkte Rückmeldungen bei der Analyse von Unterrichtsvideos in der asynchronen Online-Lehre

Tabea Zmiskol, Miriam Hess

Otto-Friedrich-Universität Bamberg, Deutschland

a) Forschungsstand und theoretische Bezüge

Der Analyse von Unterrichtsvideos werden positive Lerneffekte zugesprochen, die zunehmend systematisch empirisch untersucht werden (zsf. Steffensky & Kleinknecht, 2016). Die Arbeit mit Unterrichtsvideos in der asynchronen Online-Lehre ermöglicht es Studierenden zudem, sich Wissensinhalte eigenständig, zeit- und ortsungebunden zu erarbeiten (Gröschner 2021). So zeigen auch Befragungen von Studierenden, dass diese den Einsatz von Unterrichtsvideos auch und gerade in der Online-Lehre als motivierend und lernförderlich empfinden, allerdings teilweise Austausch und Rückmeldung vermissen (Hess, 2021). Zudem deuten Studierendenbefragungen darauf hin, dass vorbereitete Sprachkommentare durch Expert:innen dem Bedürfnis nach Rückmeldung entgegenkommen (Zmiskol & Hess, in Druck).

b) Fragestellung und Zielsetzung

Das Teilprojekt „Interaktive Unterrichtsvideos in der Lehrerinnen- und Lehrerbildung“ (InViLebi), das im Rahmen des Projekts „Digitale Kulturen der Lehre entwickeln“ (DiKuLe) von der Stiftung „Innovation in der Hochschullehre“ gefördert wird, untersucht, wie sich sogenannte interaktive Unterrichtsvideos in der asynchronen Online-Lehre einsetzen lassen, um die Entwicklung der professionellen Wahrnehmung von Studierenden zu fördern (z.B. Sherin & van Es, 2009). Ein besonderer Fokus liegt dabei auch auf der Frage, wie online eine sinnvolle, direkte Rückmeldung an Studierende in großen Lerngruppen erfolgen kann. Der Posterbeitrag fokussiert folgende Fragen: (1) Wie werden vorbereitete Sprachkommentare von den Studierenden angenommen sowie in ihrer Qualität und Lernwirksamkeit eingeschätzt? (2) Wie groß ist das Bedürfnis der teilnehmenden Studierenden nach einer (direkten) Rückmeldung?

c) Methode(n) und Design

Die Datengrundlage der Untersuchung bieten eine Einführungsvorlesung und ein Grundlagenseminar, die im Wintersemester 2022/23 an der Universität Bamberg stattfanden und in deren Rahmen Studierende eine asynchrone Online-Lerneinheit zum Thema „Umgang mit Leistungsheterogenität im Grundschulunterricht“ bearbeiteten (N=319 Studierende des Grundschullehramts; 87,8% weiblich; M_{(Fachsemester)}=2.3; SD_{(Fachsemester)}=1.3). Die Erhebung erfolgte in einem quasi-experimentellen Prä-Post-Design mit vier Interventionsgruppen.

Die Interventionsgruppen unterscheiden sich darin, ob die Studierenden die Unterrichtsvideos A) fragengeleitet mit Sprachkommentar als direkter Rückmeldung (= interaktive Videoanalyse), B) fragengeleitet ohne Sprachkommentar, C) offen mit Sprachkommentar oder D) offen ohne Sprachkommentar analysierten.

Die Fragebögen des Prä-/Posttests sowie zu Beobachtungsmethode (fragengeleitet vs. offen) und Sprachkommentar (mit vs. ohne Sprachkommentar) bestanden aus geschlossenen und offenen Fragen. Diese werden deskriptivstatistisch, varianz- und inhaltsanalytisch ausgewertet.

d) (Zwischen-)Ergebnisse

Der Sprachkommentar wurde in den Gruppen, in denen er angeboten wurde (Gruppe A und C), von den Studierenden nach Selbstaussage gut angenommen und in der Regel mindestens einmal, teils auch mehrfach angehört. Die Studierenden schätzten die direkte Rückmeldung durch die vorbereiteten Sprachkommentare als weitgehend qualitativ hochwertig und lernwirksam ein (z.B. stimmten 85.4% der Studierenden auf einer 7-stufigen Skala der Aussage „Das Feedback der Dozentin hat mir gezeigt, wie eine gute Analyse der Unterrichtsvideos aussieht.“ überwiegend oder voll zu; M=6.3, SD=0.9). Insgesamt blieb das Bedürfnis nach Rückmeldung im Prä-Post-Vergleich unverändert hoch.

e) Diskussion der Ergebnisse und Ausblick

Zwischen den geschlossenen (Skalenwert) und offenen (Erklärung) Selbstangaben der Studierenden zu ihrem Nutzungsverhalten rund um die Sprachkommentare gibt es Diskrepanzen, die darauf hinweisen, dass die Annahme des Angebots Sprachkommentar deutlich differenzierter ausfällt, als es in der Erhebung zunächst abgefragt wurde. Entsprechende vertiefende Erhebungen stehen für das kommende Jahr an. Insgesamt scheint sich der Sprachkommentar als akzeptierte Möglichkeit zum Erhalten direkter Rückmeldungen bei Videoanalysen in der Online-Lehre zu bestätigen.

Poster

Classroom Management, auffälliges Verhalten und Lehrkraftfeedback – Wie wirkt Lehrkrafthandeln auf auffällige Schüler*innen im Grundschulunterricht?

Raphael Plutz, Markus Spilles, Christian Huber

Bergische Universität Wuppertal

Theoretischer Hintergrund

Classroom Management gilt als eine der zentralen Voraussetzungen zur Umsetzung eines störungsfeien Unterrichts und zur Erhöhung der aktiven Lernzeit (u.a. Helmke, 2007). In der Literatur sind verschiedene Operationalisierungen des Konstrukts zu finden. Ein spezifischer Ansatz ist das sogenannte low profile Classroom Management (Borich, 2016; Helmke, 2007; Rinne, 1982) (LPCM). Prämisse des LPCM ist das möglichst niedrigschwellige Reagieren auf kleinere Unterrichtsstörungen, sodass das Fortschreiten des Unterrichts nicht unterbrochen wird (Borich, 2016). Die Klassengemeinschaft wird in diesem Sinne nicht am gemeinsamen Weiterlernen gehindert. Die Umsetzung eines LPCM könnte allerdings weiterhin Potential bieten, um die soziale Integration von Schulkindern, die den Unterricht stören, nicht zu gefährden. Diese ist ein psychologisches Grundbedürfnis (Ryan & Deci, 2001) und gilt als Grundvoraussetzung für schulisches Lernen und eine förderliche emotional-soziale Entwicklung. Soziale Ausgrenzung geht hingegen mit einer Vielzahl schulisch relevanter Risikofaktoren wie Aggressivität, Angststörungen, depressive Symptome und schwachen Schulleistungen oder Schulabsentismus einher (Newcomb, Bukowski & Pattee, 1993; Wentzel, Jablansky & Scalise, 2021; Flook, Repetti & Ullmann, 2005). Dabei kann angenommen werden, dass Kinder mit Verhaltensproblemen bis zu dreimal häufiger von sozialer Ausgrenzung im inklusiven Unterricht betroffen als ihre Mitschüler*innen ohne sonderpädagogischen Förderbedarf (Bless, 2007; Huber, Nicolay & Schulze, 2021). Einen möglichen Erklärungsansatz bietet die Perspektive der social referencing theory (Feinman, 1992). Gemäß dieser beeinflusst das durch die Mitschüler*innen wahrnehmbare Lehrkraftfeedback die soziale Integration von Kindern mit auffälligem Verhalten (Huber, 2019).

Fragestellung

Die zugrundeliegende Studie basiert auf einem Wirkmodell, nach dem Classroom Management einerseits das Sozialverhalten von Schulkindern mit Verhaltensproblemen günstig beeinflusst und andererseits die Häufigkeit von reaktivem negativem Lehrkraftfeedback reduziert. Es wird angenommen, dass der Zusammenhang zwischen sozialer Integration und Verhaltensproblemen im Unterricht insbesondere in Schulkassen hoch ist, in denen die Lehrkräfte ein reaktives Classroom Management zeigen, bei dem Kinder für die Klassenöffentlichkeit nachvollziehbar auf Regelverstöße hingewiesen werden. Den theoretischen Grundlagen entsprechend sollte LPCM die Häufigkeit von reaktivem negativem Lehrkraftfeedback, das von den Mitschüler*innen wahrgenommen werden kann, reduzieren. Weiterhin ist auch eine abschwächende Wirkung auf den Zusammenhang von Verhaltensproblemen und sozialer Akzeptanz denkbar.

Methode

Die Fragestellung wurden als Teil eines Forschungsprojektes des Arbeitsbereiches Rehabilitationswissenschaften mit dem Förderschwerpunkt Emotional-soziale Entwicklung der Bergischen Universität Wuppertal untersucht. Dabei wurden 690 Schulkinder (54 % weiblich) aus 35 Klassen der 3. und 4. Jahrgangsstufe (M_Alter = 9.19; SD_Alter = 0.88) befragt sowie die Klassenlehrkräfte (91 % weiblich; M_LK-Alter = 42.12; SD_LK-Alter = 9.70) in ihrem Unterricht beobachtet und durch zuvor geschulte Rater*innen beurteilt.

Als abhängige Variable (AV) wurde das öffentlich wahrnehmbare negative Lehrkraftfeedback über ein Peer-Ratingverfahren erfasst. Bei diesem schätzten die Schüler*innen ein, wie häufig ihre Mitschüler*innen grundsätzlich von ihrer Klassenlehrkraft getadelt werden.

Als unabhängige Variablen wurden die Verhaltensprobleme pro Schüler*in über die Items zu oppositionellem und störendem Verhalten der deutschsprachigen Version der Integrated Teacher Report Form (ITRF) (Casale, Volpe, Hennemann, Briesch, Daniels & Grosche, 2019) aus der Lehrkraftperspektive (UV1) und das LPCM mittels eines in dem Arbeitsbereich entworfenen Beobachtungsbogens (UV2) erfasst.

Ergebnisse

Für die Datenanalyse wurden Mehrebenenregressionsanalysen mittels des R-Pakets lme4 (Bates, Mächler, Bolker & Walker, 2015) durchgeführt. Dabei sind die individuellen Schüler*innenmerkmale auf Level 1 (AV1, UV1) und das LPCM (UV2) auf Level 2 angesiedelt. Erwartet wird eine Cross-Level-Interaktion des LPCM auf den Zusammenhang zwischen Verhaltensproblemen und verhaltensbezogenem negativem Feedback. Eine erste Analyse der Daten zeigt, dass im Sinne der theoretischen Annahmen eine Interaktion zwischen dem störenden Verhalten und LPCM bei einer Reduktion des wahrgenommen negativen Lehrkraftfeedbacks zu beobachten ist (β = -0.01; p = .034).

Im Rahmen weiterführender Analysen sollen weitere mögliche positive Effekte untersucht werden. Diese stellen, neben den Annahmen der social referencing theory und des LPCM, eine Grundlage für die Diskussion des Posterbeitrages dar.

Poster

Selbstwirksamkeit von Lehramtsstudierenden im Unterrichtspraktikum: Eine Analyse latenter Veränderungen und die Bedeutung der Qualität des Mentorings

Irina Sachs¹, Andreas Bach¹, Johannes König²

¹Paris Lodron Universität Salzburg, Österreich; ²Universität zu Köln

Theoretischer Hintergrund. Schulpraktika sind für Lehramtsstudierende ein bedeutender Bestandteil ihres Lehramtsstudiums (Bach, 2020; König et al., 2018). Insbesondere Unterrichtspraktika ermöglichen Handlungserfahrungen, die nach der Selbstwirksamkeitstheorie (Bandura, 1997) eine wichtige Informationsquelle zum Aufbau und zur Veränderung von Selbstwirksamkeit bilden (Bach & Hagenauer, 2022; Morris et al., 2017). Studienergebnisse belegen für Studierende mehrheitlich Anstiege, aber auch Rückgänge ihrer Selbstwirksamkeit im Verlauf von Schulpraktika (im Überblick Bach, 2022). Die Qualität des schulischen Mentorings stellt in diesem Professionalisierungsprozess eine wichtige Rahmenbedingung dar (Clarke et al., 2014; Hoffman et al., 2015, Reintjes et al., 2018), wobei die verschiedenen Mentoring-Konzepte in Bezug auf die Gestaltung der Beziehungen zwischen Mentor*innen und Mentees in konstruktivistisch orientierte und transmissive Ansätze differenziert werden (Braun et al., 2022; Richter et al., 2013; Wang & Odell, 2002). Konstruktivistisch ausgerichtetes Mentoring hat sich bei berufseinsteigenden Lehrpersonen als selbstwirksamkeitsförderlich erwiesen (LoCasale-Crouch et al., 2012; Richter et al., 2013). Für Schulpraktika fehlen jedoch Studien, die untersucht haben, ob diese Mentoring-Ansätze auch relevante Erklärungsfaktoren für Veränderungen der Selbstwirksamkeit von Lehramtsstudierenden darstellen.

Fragestellung. Die Studie griff dieses Forschungsdesiderat auf. Untersucht wurde die Frage, welchen Effekt konstruktivistisch und transmissiv orientiertes Mentoring auf die Veränderung der Selbstwirksamkeit von Studierenden während ihres Unterrichtspraktikums in den Dimensionen Instruktionsstrategien, Classroom Management und Schüler*innen-Engagement hat.

Methode. Es handelt sich um eine Längsschnittstudie über ein Studiensemester mit zwei Messzeitpunkten. Befragt wurden 231 Lehramtsstudierende der Universität Salzburg (68,4 % weiblich, Alter: M = 22.88, SD = 3.46), die mehrheitlich im fünften Bachelor-Semester Lehramt Sekundarstufe studierten und die in der Regel zwei zeitlich parallele semesterbegleitende Unterrichtspraktika in den von ihnen studierten Unterrichtsfächern absolvierten. Zur Erfassung des konstruktivistisch und transmissiv orientierten Mentorings in beiden Praktika wurde eine adaptierte Skala von Richter et al. (2013) genutzt (konstruktivistisch orientiertes Mentoring: α = .82 bzw. .87; vier Items; transmissiv orientiertes Mentoring: α = .74 bzw. .81; drei Items, vierstufiges Antwortformat). Die Selbstwirksamkeit wurde mit einer Skala von Pfitzner-Eden et al. (2014) erfasst (Instruktionsstrategien: α_t1 = .65 bzw. α_t2= .64; Classroom Management: α_t1 = .88 bzw. α_t2= .83; Schüler*innen-Engagement: α_t1 = .68 bzw. α_t2= .74; jeweils vier Items, fünfstufiges Antwortformat). Die Veränderungsanalysen erfolgten mittels True-Intraindividual-Change(TIC)-Modellen (Steyer, et al., 1997, 2000). Die Mentoring-Variablen wurden anschließend als unabhängige Variablen in die TIC-Modelle aufgenommen. Die statistischen Analysen wurden mit dem Programm Mplus 8.8 (Muthén & Muthén, 1998–2017) durchgeführt. Die Parameterschätzungen basierten auf dem Maximum-Likelihood-Robust(MLR)-Verfahren. Fehlende Werte wurden mittels Full-Information-Maximum-Likelihood (FIML)-Verfahren berücksichtigt.

Ergebnisse und ihre Bedeutung. Die Selbstwirksamkeitsüberzeugungen bezogen auf Instruktionsstrategien (M_T1 = 4.11, SD = 0.33; M_Diff = 0.09, SD = 0.27; d = 0.30) und Classroom Management (M_T1 = 3.28, SD = 0.88; M_Diff = 0.32, SD = 0.65; d = 0.41) stiegen im Mittel statistisch signifikant an. Für die Selbstwirksamkeit in Bezug auf Schüler*innen-Engagement zeigte sich keine statistisch signifikante Veränderung (M_T1 = 4.01, SD = 0.42; M_Diff = 0.06, SD = 0.38). Darüber hinaus wurden statistisch signifikante interindividuelle Unterschiede im Ausgangswert und im latenten Veränderungswert für alle drei Dimensionen von Selbstwirksamkeit gefunden. Konstruktivistisch orientiertes Mentoring hatte einen schwachen Effekt auf die Selbstwirksamkeitsveränderung in Bezug auf Instruktionsstrategien (ß = .19, p = .036) und bezogen auf Classroom Management (ß = .20, p = .038). Transmissiv orientiertes Mentoring hatte keine statistisch signifikanten Effekte. Die Ergebnisse der Studie bestätigen die theoretischen Annahmen (Bandura, 1997) sowie frühere empirische Studienbefunde (Bach, 2022; Klassen & Durksen, 2014), dass Schulpraktika bedeutsame Lerngelegenheiten für positive Selbstwirksamkeitsveränderungen darstellen können, wobei Mentoring diesen Prozess unterstützen kann. Die Ergebnisse erweitern den Forschungsstand, indem empirische Evidenz für die Bedeutung von konstruktivistischem Mentoring im Kontext von Schulpraktika und für verschiedene Domänen von Selbstwirksamkeit vorliegen.

Poster

Der begleitete Einsatz von Lehramtsstudierenden als Lernbegleiter:innen in Schulen: Reflexion der Professionalisierungschancen und Herausforderungen

Kerstin Göbel, Zuzanna M. Preusche

Universität Duisburg-Essen, Deutschland

Praxisphasen während des Studiums, die meist in einem Zusammenspiel verschiedener Akteure wie Schulen, Ausbildungszentren sowie den jeweiligen Universitäten stattfinden, leisten einen wichtigen Beitrag zur Professionalisierung von angehenden Lehrpersonen (Degeling et al., 2019; Kunter et al., 2011). Eine besondere Praxis-Begleitung von Studierenden in Schulen wurde in NRW u. a. im Rahmen des Programms students@school (gefördert durch das Landesprogramm „Ankommen und Aufholen für Schülerinnen und Schüler“) realisiert. Hier wurden Studierende als Lernbegleiter:innen eingesetzt, um Lehrkräfte im Unterricht zu unterstützen. Die studentischen Lernbegleiter:innen sollten in den Schulen vor allem mit Schüler:innen arbeiten, die durch die pandemiebedingten Schulschließungen in ihrer Kompetenzentwicklung beeinträchtigt waren (Helm, 2020; Dreer & Kracke, 2021; Huber & Helm, 2020). Im Gegensatz zu dem aufgrund des fortwährenden Lehrpersonenmangels häufig nicht ausreichend ausgebildeten und oft unerfahrenen Vertretungspersonal an Schulen (Tillmann, 2020), wurde der Einsatz der Studierenden im Programm u. a. von Zentren für Lehrkräftebildung, den Bildungswissenschaften sowie den Fachdidaktiken verschiedener Universitäten systematisch begleitet. Den Studierenden wurde dadurch theoriegeleitet und praxisorientiert durch Lehrpersonen und Universität, die Möglichkeit gegeben, ihre professionelle Handlungskompetenzen zu entwickeln.

Das vorliegende Poster widmet sich der Frage, inwiefern ein derartiges Programm, welches für die Studierenden außerhalb der universitären Praktika stattfindet, zu ihrer Professionalisierung als angehende Lehrpersonen beitragen kann. Hierzu wurden in einer ersten explorativen Untersuchung acht in dem Programm tätige Studierende in einem problemzentrierten Interview nach Witzel (2000) zu ihren Erfahrungen, den wahrgenommenen Herausforderungen und der Entwicklung von professionellen Handlungskompetenzen im Sinne des Professionswissens (pädagogisches Wissen und fachdidaktisches Wissen), ihrer selbstregulativen Fähigkeiten, ihrer Überzeugungen und Wertehaltungen sowie ihrer motivationalen Orientierungen befragt. Die Interviews wurden mit der strukturierenden qualitativen Inhaltsanalyse nach Kuckartz (2012) analysiert, hierfür wurden sowohl deduktive als auch induktive Kategorien entwickelt. Erste Ergebnisse deuten auf einen positiven Effekt der Teilnahme an dem Programm für die eigene Professionalisierung und die Bestätigung des Berufswunsches hin. Bezüglich des pädagogischen Wissens gaben die Studierenden mehrheitlich an, vor allem praktisches und informelles Wissen erworben zu haben sowie durch die Beobachtung unterschiedlicher Lehrpersonen im Unterricht ihr Wissen erweitert zu haben sowie erste Erfahrungen im Führen einer Klasse gesammelt zu haben. Die Vermittlung von fachdidaktischen und bildungswissenschaftlichen Lerninhalten stellt eine wichtige Komponente des Programms dar; die Studierenden gaben diesbezüglich an, dass sie lernen konnten, welche Aspekte für Schüler:innen beim Erlenen neuer Inhalte (z. B. dem Umgang mit unterschiedlichem Vorwissen oder der Bedeutung von stetiger Wiederholung) besonders wichtig sein können. Im Hinblick auf die Selbstregulation berichteten die Studierenden durch die Arbeit in der Schule Flexibilität und Anpassungsfähigkeit entwickelt zu haben, um mit den situativen Gegebenheiten und den spezifischen Bedürfnissen der Schüler:innen umzugehen. Die Befunde zum Einsatze von Studierenden als Lernbegleiter:innen in Schulen werden im Hinblick auf das Potenzial für Professionalisierungprozesse diskutiert.

Poster

Transferaktivitäten und transferbezogene Einstellungen in Projekten der empirischen Bildungsforschung – Entwicklung eines quantitativen Befragungsinstruments

Caroline J. Scherer¹, Elizabeth Farley-Ripple², Mareike Kunter¹, Ulrike Hartmann¹

¹DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation; ²University of Delaware

Theoretischer Hintergrund

Von den Ergebnissen empirischer Bildungsforschung wird häufig erwartet, dass diese eine hohe praktische Relevanz für schulische Akteure aufweisen und Verbesserungen in der Schulpraxis bewirken (Farley-Ripple et al., 2018). Die Realität bleibt allerdings oftmals hinter diesen Erwartungen zurück (z.B. Stark, 2017). So gestaltet sich der Transfer zwischen Forschung und Praxis insgesamt als Herausforderung, was u.a. im Begriff Research Practice Gap zum Ausdruck kommt.

In der Annahme, Erkenntnisse aus der Forschung könnten direkt in die Praxis übertragen werden, kommt ein transmissives Verständnis von Transfer zum Ausdruck (Mohajerzad & Schrader, 2022). In der Literatur wird Transfer allerdings zunehmend als bidirektionale Aufgabe konzeptualisiert, bei der erst durch das Zusammenspiel von Forschung als Angebotsseite und Bildungspraxis als Nutzungsseite praktische Relevanz erzeugt wird (Brühwiler & Leutwyler, 2020; Farley-Ripple et al., 2018).

Bisherige Forschungserkenntnisse beziehen sich überwiegend auf die Nutzung bildungswissenschaftlicher Befunde durch Akteure aus der Praxis. Will man Transferaktivitäten erfolgreicher machen, ist es jedoch auch notwendig, die Perspektive der Forschenden besser zu verstehen. Hier dominieren bisher theoretische Diskurse über die Bedeutung von Praxisrelevanz für die Erkenntnisse empirischer Bildungsforschung. Es liegen jedoch kaum empirische Studien zu den Bedingungen und Herausforderungen von Transferbemühungen aus der Perspektive Forschender vor. Erste Anhaltspunkte liefert eine Interviewstudie von Hartmann und Kunter (2022), deren Resultate aufzeigen, dass Praxisperspektiven insgesamt in einem geringen Ausmaß in Projekte der empirischen Bildungsforschung einbezogen werden. Darüber hinaus zeigten sich innerhalb von und zwischen Projekten deutliche Unterschiede hinsichtlich Erscheinungsformen und Ausmaß der Praxisbezüge. Diese Ergebnisse basieren jedoch auf einer kleinen, nicht repräsentativen Stichprobe und sollten daher durch quantitative Datenerhebungen abgesichert und ergänzt werden. Dies ermöglicht perspektivisch auch den Vergleich von Transferaktivitäten in der Bildungsforschung hinsichtlich ihrer Zusammenhänge mit unterschiedlichen organisationalen oder kulturellen Kontexten.

Ziel der Studie

Das Poster stellt die Konzeption eines deutschsprachigen Messinstruments vor, mithilfe dessen Transferaktivitäten und transferbezogene Einstellungen Forschender in Projekten der empirischen Bildungsforschung quantitativ erfasst werden sollen. Als theoretischer Rahmen des Instruments dient das Modell von Farley-Ripple et al. (2018), welches sechs Tiefendimensionen des Transfers postuliert.

Methode

Basis des entwickelten Instruments ist der Survey of Evidence in Education for Researchers (SEE-R) (May et al., 2018), der vom Rahmenmodell von Farley-Ripple et al. (2018) ausgeht. Dieser erfasst die Tiefe der Produktion (depth of production) von Forschung und damit deren Relevanz für die Praxis in den Dimensionen Evidence, Search/Dissemination, Interpretation, Participation, Frequency und Decision Stage. Weiterhin werden sowohl institutionelle Rahmenbedingungen als auch individuelle Kapazitäten erfasst, um das Ausmaß potenzieller Research Practice Gaps festzustellen. Der SEE-R wurde in weiten Teilen übernommen, aus dem Englischen übersetzt und für den deutschen Kontext adaptiert. Das Instrument wurde zudem um weitere Skalen zu Einstellungen und Motivation bezüglich des Engagements auf einzelnen Transferdimensionen ergänzt, die aus der Interviewstudie von Hartmann und Kunter (2022) abgeleitet wurden. In Skalen mit geschlossenem Antwortformat werden die Befragten beispielsweise nach ihrer Zustimmung zu diversen Aussagen oder nach der Häufigkeit bestimmter Aktivitäten befragt. Einzelne offene Items zielen außerdem auf Details zur Arbeit der Forschenden ab.

Auf dem Poster werden das Instrument sowie erste Ergebnisse aus der Pilotierung des Online-Fragebogens (Skalen- und Dimensionsanalysen sowie Korrelationsanalysen) anhand einer Stichprobe von N ≈ 30 Projektleitungen aus Bildungsforschungsprojekten präsentiert. Zudem wird die mehrstufige Sampling-Strategie für die Haupterhebung vorgestellt, die das Ziel eines interkulturellen Vergleichs von Transferaktivitäten in Projekten der Bildungsforschung zwischen Deutschland und USA verfolgt.

Ausblick

Mit dem entwickelten Messinstrument soll erfasst werden, inwieweit in Forschungsprojekten Transferaktivitäten im Hinblick auf die sechs genannten Dimensionen des Modelles von Farley-Ripple et al. (2018) stattfinden. Daneben werden durch die Abbildung individueller Kapazitäten und Motivationen sowie institutioneller Rahmenbedingungen einige Ansatzpunkte für Veränderungen im Hinblick auf ein bidirektionales Transferverständnis aufgezeigt. Auf Basis der Pilotierungsergebnisse werden mögliche Anpassungen des Instrumentes diskutiert.

Poster

Wahrnehmung schulischer Elterngespräche – Eine Untersuchung visueller Aufmerksamkeitsprozesse bei Expert:innen und Noviz:innen mittels Eye-Tracking

Kristina Ackel-Eisnach¹, Inga Wagner², Alexandra Merkert¹, Ilona Weyrauch¹, Josef Strasser¹

¹Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau, Deutschland; ²Zentrum für empirische pädagogische Forschung, Deutschland

Schulische Elterngespräche und die damit zusammenhängende Gesprächsführung bilden ein wichtiges Handlungsfeld von Lehrkräften (u.a. Schnebel, 2017). Anders als professionelle Berater:innen in der pädagogisch-psychologischen Praxis werden Lehrkräfte hinsichtlich Beratung und Gesprächsführung jedoch eher rudimentär ausgebildet (u.a. Aich & Behr, 2019). Dies führt im Schulalltag häufig dazu, dass Elterngespräche von Lehrkräften als anstrengend und schwierig erlebt werden (Gartmeier, 2018; Lemmer, 2012).

Die Forschung zur Expertise professioneller Berater:innen weist auf die Bedeutung eines adäquaten individuellen Fallverständnisses für kompetente Beratung hin. Dieses basiert auf einer professionellen Wahrnehmung der Situation, u. a. der Anliegen der Interaktionspartner:innen, deren Emotionen und Bedürfnisse (Strasser & Gruber, 2015; Strasser et al., 2005).

Im deutschen Sprachraum ist die professionelle Wahrnehmung bei Lehrkräften im Rahmen schulischer Elterngespräche noch wenig untersucht (u.a. Behr, 2023; Lenske et al., 2022). Ein anderes Bild zeigt sich hingegen für die Untersuchung von Lehrkräften hinsichtlich der Unterschiede zwischen Expert:innen und Noviz:innen in der Wahrnehmung von Unterrichtssituationen. In diesem Bereich verwendet eine steigende Zahl an Studien mittlerweile Eye Tracking, um visuelle Aufmerksamkeitsprozesse zu untersuchen und daraus auf die professionelle Unterrichtswahrnehmung von Lehramtsstudierenden und erfahrenen Lehrkräften zu schließen (u. a. Grub et al. 2020). Vor dem Hintergrund der kritischen Diskussion der Eye-Mind-Hypothese (Just & Carpenter, 1980) erscheint jedoch eine Methodentriangulation aus Eye Tracking-Daten und Verbaldaten sinnvoll (Orquin & Holmqvist, 2018), um die dahinterliegenden kognitiven Prozesse besser abbilden zu können.

Das Projekt „BiB – Beratung im Blick“ bringt deshalb Blickbewegungs- und retrospektive Laut-Denken-Daten bei der Betrachtung videographierter Gespräche zusammen. Es wird erforscht, was die Wahrnehmung von Beratungssituationen bestimmt. Dabei interessieren vor allem, welche Rolle Merkmale der Beratenden (Erfahrung, Wissen und z.B. Empathie) spielt (Selbstauskunft der Teilnehmenden). Untersucht werden hierzu Expert:innen und Noviz:innen aus der pädagogischen bzw. psychologischen Beratungspraxis mittels Eye-Tracking.

Die geplante Stichprobe besteht aus n = 10 Expert:innen (> 15 Jahre Berufserfahrung in der pädagogisch-psychologischen Beratungspraxis) und n = 10 Noviz:innen (Lehramtsstudierende im ersten oder zweiten Semester). Bislang wurden Daten von n = 8 Lehramtsstudierenden erhoben (Alter: M = 22.4, SD= 2.3; Geschlecht: 5 weibliche, 3 männliche). Die Datenerhebung wird bis zum Zeitpunkt der Konferenz abgeschlossen sein.

Der Untersuchungsablauf gliedert sich in mehrere Phasen. Zunächst wird den Proband:innen nach einer kurzen Einführung ein authentisches videographiertes schulisches Elterngespräch (durch Expert:innenratings geprüft) gezeigt. Hierbei werden die Blickbewegungen (u. a. Fixationen, Sakkaden) der Proband:innen mittels Eye-Tracking gemessen. Anschließend beantworten die Proband:innen drei Fragen zur kognitiven Belastung (Paas, 1992). Danach betrachten die Proband:innen nochmals das Video mit ihren Blickbewegungen und verbalisieren dazu, was sie bei den Blickbewegungen gedacht haben (retrospective thinking aloud). Die Personen werden mit Bild und Ton aufgenommen. Zuletzt füllen die Proband:innen einen standardisierten Fragebogen aus. Dieser beinhaltetet Fragen zu soziodemographischen Merkmalen, Vorerfahrungen, Präferenz zur verbalen und visuellen Informationsverarbeitung (Kirby et al., 1988), Empathie (Leibetseder et al., 2001) und beratungsbezogener Selbstwirksamkeit (Hertel, 2009).

Vorläufige Analysen des bereits erhobenen Samples lassen Unterschiede in der Wahrnehmung zwischen Personen mit und ohne Beratungserfahrung vermuten. Dies soll im weiteren Untersuchungsablauf weiter analysiert werden.

Die Ergebnisse der vorliegenden Studie versprechen neuartige Einblicke in die Grundlagen der professionellen Wahrnehmung von Beratungssituationen. Durch die Identifikation maßgeblicher Kennzeichen expertenhaften Wahrnehmens sollen Ansatzpunkte für passgenauere Ausbildungs- und Trainingsprogramme für angehende Berater:innen und die Lehramtsausbildung gewonnen werden.

Poster

Was wäre, wenn Bayern inklusive Schulen anstatt Förderschulen hätte? Eine räumlich-strukturierte Simulationsstudie zur inklusiven Bildungslandschaft basierend auf amtlichen Schulstatistiken von 2020

Nikola Ebenbeck, Markus Gebhardt

Ludwig-Maximilians-Universität München, Deutschland

Theorie und Fragestellungen

Inklusion zu implementieren erfordert strukturelle Änderungen im bestehenden Schulsystem, einschließlich der Schließung von Förderschulen. Bisher wurden diese Maßnahmen nur in einigen Bundesländern umgesetzt (Steinmetz et al., 2021), während beispielsweise in Bayern nicht die Anzahl an Schüler:innen in Förderschulen reduziert wurde. Das Festhalten am Förderschulsystem führt zu systematischen Verzerrungen bei der Identifizierung, Zuweisung und der Auswahl von Schulstandorten in Deutschland (Ebenbeck et al., 2023; Goldan & Grosche, 2021; Helbig & Steinmetz, 2021). Offen bleibt, wie der Übergang zu einem inklusiven Schulsystem erfolgen kann, ob alle Förderschulen oder lediglich sonderpädagogische Förderzentren (für Lern-, Sprach- und Verhaltensbedarf; SFZs) geschlossen werden sollten oder ob spezialisierte Förderschulen für Hören, Sehen, motorische und geistige Entwicklung beibehalten werden sollten. Des Weiteren stellt sich die Frage, ob Schüler mit Behinderungen anstatt in Förderschulen in nahegelegenen Regelschulen oder in ausgewählten inklusiven Grundschulen mit einer Förderquote von 20% wie beispielsweise in Österreich (Buchner & Gebhardt, 2011) unterrichtet werden sollen.

In dieser Simulationsstudie wird untersucht, wie ein inklusives Primarschulsystem in Bayern aussehen könnte:

Inwieweit vergrößern sich die Grundschulen durch eine Auflösung der Förderschulen?
Inwieweit verändern sich die Förderquoten der Grundschulen durch eine Auflösung der Förderschulen?
Beeinflusst die Siedlungsstruktur der Landkreise die Umsetzungsmöglichkeit inklusiver Schulsysteme?

Daten und Methoden

Es werden vier inklusive Schulsysteme deterministisch in der Statistiksoftware R modelliert und verglichen:

Modell 1a: Schließung aller Förderschulen und wohnortnahe Inklusion an allen Grundschulen
Modell 1b: Schließung aller Förderschulen und Inklusion an inklusiven Grundschulen
Modell 2a: Schließung aller SFZs und wohnortnahe Inklusion an allen Grundschulen
Modell 2b: Schließung aller SFZs und Inklusion an inklusiven Grundschulen

Als Datengrundlage dienen der Beschulungsort aller Grund- und Förderschüler in Bayern im Jahr 2020 (N = 475.087) des Bayerischen Ministeriums für Unterricht und Kultus sowie offene Geodaten.

Die Verteilung der Förderschüler auf die jeweiligen Grundschulen erfolgt in den Modellen 1a und 2a mittels Proportional Allocation: N ist die Gesamtzahl der Förderschüler im Landkreis und m die Anzahl der Grundschulen. Die Anzahl der Schüler an jeder Grundschule sei G_i für i = 1, 2, …, m.

Anzahl der neuen Förderschüler auf Grundschule i = N / (Σ (k = 1 bis m) G_k) * G_i

In den Modellen 1b und 2b werden Grundschulen nach Größe sortiert, beginnend mit der größten im Landkreis, als Inklusionsschulen ausgewählt und bis zu einer Förderquote von 20% aufgefüllt:

Anzahl der neuen Förderschüler auf Grundschule i = 0,2 * G_i + Σ(k=1 bis i-1) (Anzahl der verteilten Förderschüler_k - F_i) * 0,8

wobei k die vorherigen Schulen repräsentiert, die bereits betrachtet wurden.

Mittels Hypothesentests wird untersucht, ob sich die Grundschulgrößen und Förderquoten in städtischen und ländlichen Gebieten zwischen den Modellen unterscheiden.

Ergebnisse

Nur die Schließung aller Förderschulen (Modelle 1a und 1b) führen zu einer signifikanten Erhöhung der Schülerzahlen in den Grundschulen (Modell 1a: t(4438.8) = -3.6751, p < .001; Modell 1b: t(4327.8)=-3.3768, p < .001). Die Schließung der SFZs (Modelle 2a und 2b) führen zu keiner signifikanten Erhöhung der Schülerzahlen. Im städtischen und ländlichen Raum entwickeln sich die Schülerzahlen nicht unterschiedlich, ein aktuell vorherrschender signifikanter Unterschied in den Schulgrößen zwischen Stadt und Land (p < .001) bleibt jedoch bestehen. Das Inklusionsschulprinzip (Modell 1b und 2b) führt für die meisten Grundschulen zu keiner Steigung in den Schülerzahlen, dafür gewinnen wenige Grundschulen prozentual und insgesamt viele Schüler:innen dazu und wachsen stark an. Dennoch bestehen signifikante Unterschiede in der mittleren Steigung der Schülerzahlen in allen Modellen zwischen städtischen und ländlichen Schulen (p < .001). Die Modelle 1a und 2a haben weniger Extremwerte durchschnittlich höhere Steigungen an Schülerzahlen, da sich die Schüler:innen gleichmäßig auf alle Grundschulen verteilen. Die Förderquote steigt in allen Modellen signifikant an (p > .001), ist jedoch nicht abhängig von der Siedlungsstruktur der Landkreise.

Poster

Erhebungen von Kompetenzen im Online-Assessment

Kathrin Thums¹, Karin Gehrer¹, Lara Petersen², Lena Engelhardt³, Frank Goldhammer³, Kathrin Lockl¹, Ilka Wolter¹

¹LIfBi – Leibniz-Institut für Bildungsverläufe, Deutschland; ²IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik; ³DIPF| Leibniz-Institut für Bildungsforschung und Bildungsinformation

Hintergrund:

In Large-Scale-Assessments werden überwiegend hoch standardisierte und gut erprobte Verfahren zur Erhebung kognitiver Daten eingesetzt. Mittlerweile gehören neben computerbasierten Erhebungen (CBA), nicht zuletzt auch pandemiebedingt, web-basierte Online-Assessments zu den üblichen Erhebungsverfahren, welche neben niedrigeren Kosten auch eine flexiblere Teilnahme hinsichtlich Zeit und Ort der Erhebung ermöglichen. Diese technologiebasierten Erhebungsverfahren greifen zudem die alltäglichen Routinen und Arbeitsgeräte der Studienteilnehmenden auf. Vielfältige Studien und Metaanalysen haben sich bereits mit Unterschieden zwischen überwachter bzw. beobachteter (proctored) Testung im Vergleich zu unbeobachteter (unproctored) web-basierter Online-Testung beschäftigt (u. a. Gnambs, 2023; Steger et al., 2020; Wise et al., 2019). Die Ergebnisse zeigen, dass bei unbeobachteten web-basierten Erhebungen Verzerrungseffekte durch Täuschungen der Teilnehmenden auftreten können oder sich das Antwortverhalten verändert, wie zum Beispiel durch schnelles Antworten (Kroehne et al., 2020). Jedoch kann auf Basis anfallender Prozessdaten unerlaubtes und nicht erwünschtes Testverhalten erfasst werden (Lindner et al., 2019; Steger et al., 2021). Die Herausforderungen für Online-Testungen betreffen neben der Sicherstellung der Datenqualität auch die Teilnahmebereitschaft der Zielpersonen, die technische Umsetzung sowie die Gestaltung des Testsettings. Vor diesem Hintergrund ist das Ziel der vorliegenden Studie, die im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld & Roßbach, 2019) durchgeführt wird, zwei Online-Testbedingungen auszugestalten und zu erproben. Hierbei soll untersucht werden, ob die zwei Online-Testbedingungen eine vergleichbar gute Datenqualität liefern, wie die im NEPS bisher übliche face-to-face Erhebungssituation im Haushalt.

Fragestellungen:

Die Fragestellungen der Studie beziehen sich auf das Ausmaß der Überwachung (Proctoring) sowie die Ausgestaltung einer überwachten Online-Testung: (a) Inwiefern ist eine Begleitung der Testung durch die persönliche oder virtuelle Anwesenheit von Interviewer*innen bei Kompetenzerhebungen notwendig? (b) Welche Form und welches Ausmaß an automatisierter Rückmeldung (Prompts) auf abweichendes Bearbeitungsverhalten ist während einer Testdurchführung erforderlich und kann Verhaltensanpassungen bewirken?

Methode:

Diese Fragestellungen sollen mit einem Online-Experiment innerhalb der NEPS-Startkohorte der Klasse 9 (SC4) beantwortet werden. Im Jahr 2024/2025 (17. Erhebungswelle) soll die dann vorliegende Stichprobe von ca. N = 2,200 jungen Erwachsenen (~ 29 Jahre) randomisiert in drei Experimentalgruppen aufgeteilt werden. In allen drei Gruppen werden die Teilnehmenden Kompetenztests aus den Domänen Lesen und Mathematik sowie einen Fragebogen bearbeiten.

Die Kontrollbedingung entspricht dem bisher standardisiertem Verfahren eines face-to-face Computer Assisted Personal Interview (CAPI) im Haushalt der Teilnehmenden. Die Teilnehmenden nutzen für die Testbearbeitung den mitgebrachten NEPS-Laptop und der/die Interviewer*in ist dauerhaft physisch im Hintergrund anwesend. Diese Erhebungsbedingung ist den Teilnehmenden vertraut, da diese der bislang eingesetzte Erhebungsmodus in den früheren Messzeitpunkten war.

Die erste Experimental-Bedingung ist eine synchrone onlinebasierte Kompetenztestung, mit einem geteilten Bildschirm von Teilnehmenden und Interviewer*innen. Dabei wird das eigene Gerät der Teilnehmenden verwendet. Die Interviewer*in kann dabei auf Wunsch dauerhaft im Videoanruf sichtbar sein oder sich im Hintergrund für Fragen zur Verfügung halten.

Die zweite experimentelle Bedingung ist eine asynchrone onlinebasierte Kompetenztestung. Die Teilnehmenden erhalten per Post die Zugangsberechtigungen und sind dann in der Testdurchführung in Zeit und Ort auf ihren eigenen Geräten völlig frei. Während der Bearbeitung erhalten die Teilnehmenden bei abweichendem Bearbeitungsverhalten ein automatisiertes Feedback. Die Indikatoren für abweichendes Verhalten werden auf Basis empirischer Daten aus früheren Erhebungen dieser Kohorte entwickelt. Diese Indikatoren geben Aufschluss über zu schnelles Antwortverhalten (Rapid Guessing), sehr langsame Bearbeitung bzw. Inaktivität, Auslassen von Items oder den Wechsel auf ein anderes Browser-Fenster (Kroehne et al., 2020).

Ausblick auf Ergebnisse und Bedeutsamkeit:

Das Experiment soll hinsichtlich verschiedener Kriterien ausgewertet werden: Zum einen in Bezug auf individuelle Indikatoren der Erhebungsteilnahme, Dropouts oder fehlende Werte und zum anderen bezüglich des Testbearbeitungsverhaltens, wie Antwortzeiten oder Cheating-Indikatoren, um Rückschlüsse auf die Datenqualität zu geben. Zentrale psychometrische Item- und Testkennwerte wie Schwierigkeit und Reliabilität werden ebenfalls zur Beurteilung herangezogen. Durch die Auswertung der Experimentdaten sollen Empfehlungen für zukünftige Online-Erhebungen von Kompetenzdaten in Large-Scale-Assessments abgeleitet werden.

Poster

Effekte des Schreibflüssigkeitstrainings „Die Schreibstarken“ in Abhängigkeit vom Schreibmedium – Tablet und Eingabestift oder Papier und Stift

Anne Griepentrog

TU Chemnitz, Deutschland

Oftmals werden in Forschungsprojekten analoge Fördermaterialien entwickelt und erfolgreich evaluiert, dennoch können viele Schüler:innen diese Materialien nicht nutzen. Denn insbesondere die Materialbeschaffung und -nutzung stellt viele Schulen vor organisatorische und finanzielle Herausforderungen. Die unterschiedliche Auslegung der Lernmittelfreiheit durch die Länder führt dabei auch zu Kosten für die Erziehungsberechtigten. Auf bereits an den Schulen vorhandenen oder im Rahmen des Digitalpakts anzuschaffenden digitalen Medien, wie Tablets und dazugehörige Eingabestifte, könnten Materialien als PDF-Dateien problemlos zur Verfügung gestellt und die Förderung aller Schüler:innen gewährleistet werden.

Die Besonderheiten des Mediums Tablet lassen jedoch nicht uneingeschränkt die Annahme zu, dass die so modifizierten Fördermaterialien die gleiche Wirksamkeit entfalten. Dies gilt im Kontext des Schreibens insbesondere für die Förderung der Schreibflüssigkeit, die unter anderem das schnelle, automatisierte und korrekte Aufschreiben von Wörtern (Transkriptionsflüssigkeit) umfasst (McCutchen 1996) und damit auf die Automatisierung der Motorik beim Schreiben abzielt.
Verschiedene Studien untersuchen den Einfluss der glatteren Tablet-Oberfläche auf das Schreiben. Dabei zeigt sich vor allem für Kindergarten- und Schulkinder bis zur 9. Klasse, dass die glattere Oberfläche eine erhöhte motorische Kontrolle beim Schreiben erfordert (Mayer et al. 2020; Alamargot & Morin 2015) und die fehlende Bewegungswahrnehmung durch verstärktes visuelles Feedback kompensiert wird (Guilbert et al. 2019). Für eine Förderung des flüssigen Schreibens könnte das Medium sich somit als hinderlich erweisen.
Gleichzeitig zeigen Studien, dass Erwachsene sich gut an die Bedingungen des Tablets anpassen (Gerth et al. 2016). Außerdem zeigen sich keine Unterschiede beim flüssigen Schreiben von im Umgang mit Tablet und Eingabestift Erfahrenen, und mit Stift und Papier Schreibenden (Osugi et al. 2019).
Es ist somit zu vermuten, dass nicht nur die Schreiberfahrung, und damit bereits fortgeschrittene Automatisierung der Motorik, für das Schreiben mit Tablet und Eingabestift ausschlaggebend ist, sondern auch die Vorerfahrungen mit diesem Medium. Darüber hinaus konnte in Studien zur Förderung der Schreibmotorik auf Buchstabenebene bereits nachgewiesen werden, dass Kinder für den gleichen Lerneffekt mit dem Tablet dreimal weniger Wiederholungen benötigten als mit Stift und Papier (Patchan & Puranik 2016). Dies könnte sich positiv auf die Förderung der Schreibflüssigkeit auswirken.

In der vorliegenden Dissertationsstudie soll der Frage nachgegangen werden, inwiefern sich ein positiv evaluiertes analoges Schreibflüssigkeitstraining ohne Wirksamkeitsverlust auf die Anwendung mit einem Tablet übertragen lässt. Zur Beantwortung der Fragestellung wird das Schreibflüssigkeitstraining „Die Schreibstarken“ (Stephany et al., i. Dr.) mit verschiedenen Medien (Paper-Pencil, Tablet/Eingabestift) erprobt und der Effekt des Mediums auf die Steigerung der Schreibflüssigkeit untersucht.

Hierfür wurde das ursprüngliche Trainingsmaterial zunächst anhand von Daten aus Lehrerinterviews, Unterrichtsbeobachtungen sowie der Analyse von Schüler:innenbearbeitungen weiterentwickelt und neben der Paper-Pencil-Version eine beschreibbare PDF-Version erstellt.
In einem nächsten Schritt wird das Training in einem Prä-Posttest-Design mit einer Kontrollgruppe und zwei Interventionsgruppen in neun Klassen der 3. und 4. Jahrgangsstufe in einem Zeitraum von zwölf Wochen eingesetzt. Eine der Interventionsgruppen erhält das Training als Paper-Pencil-Variante, die andere in Form einer beschreibbaren PDF auf dem Tablet. Beide Interventionsgruppen erhalten das Training von zuvor geschulten Lehrkräften. Abhängige Variable ist die Schreibflüssigkeit gemessen auf Buchstaben-, Wort- und Satzebene (Alphabettask, Wörter und Sätze auf Zeit verschriften (Stephany et al. 2020)). Dabei werden die Testungen sowohl als Paper-Pencil-Version durchgeführt als auch als PDF-Version am Tablet. Als Kontrollvariablen fungieren die soziodemografischen Daten, Vorerfahrungen mit der Arbeit mit Tablets, erhoben anhand von Fragebögen sowie die Motivation der Schüler:innen im Umgang mit dem Material. Begleitet wird die Intervention von drei Austauschtreffen zwischen den Lehrkräften der Interventionsgruppen, sodass die Verbindlichkeit des Trainingseinsatzes erhöht wird und Probleme niedrigschwellig angesprochen werden können.

Das Poster legt die datengestützte Weiterentwicklung sowie die digitale Adaption des Trainingsmaterials dar und zeigt das Studiendesign sowie die Erhebungsinstrumente.

Poster

Grundvorstellungen zu Sinus und Kosinus in der 10. Klassenstufe: Erstes Messinstrument und Zusammenhänge mit motivationalen Variablen

Sandy Chwastek¹, Hannes Becker², Johanna Harding¹, Alexander Salle², Carola Grunschel¹

¹Universität Münster, Deutschland; ²Universität Osnabrück, Deutschland

Mentale Repräsentationen mathematischer Inhalte, sogenannte Grundvorstellungen, tragen maßgeblich zum Verständnis von mathematischen Sachverhalten und somit der Mathematikleistung von Schüler*innen bei (Blum et al., 2004; Griesel et al., 2019). Während für andere zentrale Bereiche der Sekundarstufe I Testinstrumente zu Grundvorstellungen vorliegen, ist dies für Sinus und Kosinus in der Trigonometrie noch nicht der Fall. Dabei ist der Erwerb von tragfähigen Vorstellungen in diesem Inhaltsgebiet besonders relevant sowie herausfordernd, da mit fortschreitendem Unterricht in sogenannten Grundvorstellungsumbrüchen die Grundvorstellungen am Dreieck durch die Grundvorstellung am Einheitskreis verallgemeinert und ergänzt werden (Wartha, 2007). Bisher liegen keine Erkenntnisse vor, wie der herausfordernde Erwerb von Grundvorstellungen und Grundvorstellungsumbrüchen mit der Motivation von Schüler*innen im Zusammenhang steht. Erste Ergebnisse aus der Chemie legen nahe, dass das Konzeptwissen von Schüler:innen mit der Lernfreude zusammenhängt (Höft & Bernholt, 2019). Generell sind Mathematikleistungen von Schüler*innen (teilweise wechselwirkend) mit motivationalen Variablen wie dem mathematischen Fähigkeitsselbstkonzept (Jansen et al., 2019; Hermann & Vollmeyer, 2017; Schäfer, 2010), der Lernfreude (Henschel et al., 2019) und der Lernzielorientierung (Girnat et al., 2020; Keys et al., 2012) assoziiert. In der vorliegenden Pilotstudie wurden einerseits ein Test zur Erfassung von Grundvorstellungen und Grundvorstellungsumbrüchen zu Sinus und Kosinus entwickelt sowie andererseits Zusammenhänge zwischen dem Abschneiden in diesen Tests und obigen motivationalen Variablen untersucht.

Insgesamt N= 57 Schüler:innen im Alter von 15 bis 16 Jahren (52% Mädchen) aus zwei zehnten Gymnasialklassen derselben Schule bearbeiteten zu zwei verschiedenen Zeitpunkten von den Autoren entwickelte Tests mit je vier Items zu obigen Grundvorstellungen sowie etablierte motivationale Fragebögen. Nach den Unterrichtseinheiten zu Sinus und Kosinus am Dreieck (T1) bearbeiteten die Schüler:innen einen Test zu ihren Grundvorstellungen zu Sinus am rechtwinkligen Dreieck (GVD) sowie Kalkülaufgaben (lösbar ohne Grundvorstellungen). Nach der Einführung zu Sinus und Kosinus am Einheitskreis (T2) bearbeiteten sie erneut den Test zu GVD sowie einen Test zu Grundvorstellungen zu Sinus am Einheitskreis (GVE) und einen Test zu Grundvorstellungsumbrüchen beim Übergang vom Sinus am rechtwinkligen Dreieck zum Sinus am Einheitskreis (GVU). Zudem wurden jeweils das Fähigkeitsselbstkonzept im Fach Mathematik (Marsh, 1990), die Lernzielorientierung (Spinath et al., 2012) sowie Lernfreude (in Anlehnung an Bieleke et al., 2021) in Bezug auf Sinus und Kosinus erhoben.

Die vier Tests (GVD, GVE, GVU, Kalkül) wiesen eine gute interne Konsistenz (α= .74-.83) auf. Die Schüler*innen zeigten signifikant bessere Testwerte in Kalkül- als in allen Grundvorstellungsaufgaben. Folglich fiel den Schüler*innen die Anwendung mathematischer Formeln leichter als Aufgaben, für die eine höhere Abstraktionsfähigkeit notwendig war. Die Testwerte in GVD nahmen von T1 zu T2 signifikant ab, t(45)= 2.238, p= .030, d= .330. Dies legt nahe, dass es durch eine Erweiterung der Grundvorstellungen am Einheitskreis zu einer Verunsicherung in Bezug auf alte Lerninhalte kommen könnte. Alle Testwerte beider Messzeitpunkte korrelierten signifikant positiv miteinander (r= .47-.71) und mit den motivationalen Variablen Fähigkeitsselbstkonzept, r= .41-.55, Lernfreude, r= .41-.56, und Lernzielorientierung, r= .31-.39. Die Korrelationen mit der Lernzielorientierung fielen somit am geringsten aus, was auf die noch stärkere Relevanz der Konstrukte Lernfreude und Fähigkeitsselbstkonzept für die Grundvorstellungen hindeutet. Das Fähigkeitsselbstkonzept korrelierte am geringsten mit der Skala des neuen Themas (GVE; r= .41), während die Lernfreude am stärksten mit einem besseren Verständnis von Grundvorstellungsumbrüchen (GVU, r = .56) assoziiert war. Bis zur Tagung werden noch qualitative Analysen der Lösungswege der Schüler:innen angestellt, die ebenfalls präsentiert werden sollen.

Da die vorliegenden Tests sich als gutes Messinstrument für Grundvorstellungen zu Sinus und Kosinus erwiesen, sollen sie auch in zukünftiger Forschung angewandt werden. Auf der Basis einer Studie mit einer größeren Stichprobe sollen die Zusammenhänge mit motivationalen Variablen bei Kontrolle von Geschlecht und Sprachkenntnissen genauer geklärt werden.

Poster

Der Zusammenhang zwischen Need for Cognition und der Entwicklung des akademischen Interesses bei Schülerinnen und Schülern am Gymnasium

Julia Matthes, Vsevolod Scherrer, Franzis Preckel

Universität Trier, Deutschland

Need for Cognition (NFC) beschreibt das Bedürfnis einer Person nach kognitiver Herausforderung und die empfundene Freude am Denken (Cacioppo & Petty, 1982; Strobel & Strobel, 2016). Unterschiede in diesem Merkmal können Unterschiede im Lernen und der Entwicklung des kognitiven Potenzials erklären (von Stumm & Ackerman, 2013). Personen mit hohem NFC sind stärker motiviert, sich kognitiv anzustrengen und wählen eher kognitiv anspruchsvolle Aufgaben als Personen mit niedrigem NFC (Furnham & Thorne, 2013). Bisher gibt es nur wenige Studien zur Entwicklung der kognitiven Motivation. Frühe Arbeiten legen nahe, dass es aus positivem Feedback, dem Gefühl von Kompetenz und Erfolg bei kognitiven Herausforderungen sowie erlebter Zufriedenheit entsteht (Cacioppo et al., 1996).

Interesse kann als Wertschätzung verstanden werden, die sich in einem Zustand positiven emotionalen Empfindens bei der Auseinandersetzung mit dem Interessengegenstand äußern kann (Krapp, 1992). Ebenso kann Interesse die Motivation beschreiben, sich weiterhin mit dem Interessengegenstand zu beschäftigen (Renninger & Su, 2019). Interesse entsteht nach dem Vier-Phasen-Modell der Interessenentwicklung (Hidi & Renninger, 2006) von situationalem Interesse, das zunächst ausgelöst und über eine Zeit lang aufrechterhalten wird, bis hin zu individuellem Interesse, das mit der Zeit weiter an Stärke gewinnt. Diese Entwicklung wird von Personen- und Umweltvariablen beeinflusst. Zu den Personenvariablen gehören beispielsweise positive Emotionen, anhaltende Aufmerksamkeit und Ausdauer sowie domänenspezifisches Wissen. Querschnittsstudien zeigen, dass NFC positiv mit diesen Variablen und dem akademischen Interesse zusammenhängt (Amabile et al., 1994; Feist, 2012; Petty et al., 2009; Preckel, 2014). Daher könnte NFC ein Faktor sein, der zum Interessenpotenzial einer Person beiträgt. Bisher gibt es jedoch nur wenige längsschnittliche Befunde zur Beziehung zwischen NFC und Interesse.

Die vorliegende Studie zielt darauf ab, diese Lücke zu schließen, indem sie die wechselseitigen Beziehungen zwischen NFC und akademischem Interesse in drei Schulfächern (Mathematik, Deutsch und Englisch als Fremdsprache) untersucht.

Daten von N=922 Schülerinnen und Schülern (40% weiblich) der Klassen 5 bis 7 am Gymnasium wurden über vier Messzeitpunkte erfasst. NFC wurde mit 11 positiv formulierten Items der NFC-Teens-Skala (Preckel, 2014) zu Messzeitpunkt 1-3 erhoben. Das Interesse wurde zu jedem Messzeitpunkt mit drei Items erfasst, die auf dem Self-Regulation Questionnaire (Ryan & Connell, 1989) basieren und auf die Fächer Mathematik, Deutsch und Englisch angepasst wurden. Das Wissen in diesen Fächern wurde mit standardisierten Leistungstests erhoben (4 Testversionen für die 4 Messzeitpunkte; Götz et al., 2013a, 2013b; Harder & Ziegler, 2009; Schneider et al., 2017; Souvignier et al., 2008) und pro Domäne IRT-skaliert (eindimensionales Raschmodell, R-Paket TAM; Robitzsch et al., 2019). Die Reliabilitäten aller Skalen liegen zwischen .70 und .91. Die Datenanalysen wurden mit MPlus 8.7 durchgeführt. Messinvarianz der NFC- und Interessensmaße über die Zeit wurde überprüft. Um die Richtung der längsschnittlichen Beziehungen zwischen den Konstrukten zu untersuchen, wurden die daten mithilfe von autoregressiven Cross-lagged Panel Strukturgleichungsmodellen über alle Zeitpunkte hinweg analysiert. Zusätzlich wurde das domänenspezifische Wissen der Schülerinnen und Schüler kontrolliert.

In allen Schulfächern wurden Veränderungen im Interesse positiv durch NFC vorhergesagt (β_Mathe= .17***/ .10*/ 16**; β_Deutsch= .17***/ .03/ .08; β_Englisch= .14***/ .10*/ .11*), während Veränderungen in NFC nicht oder negativ durch Interesse vorhergesagt wurden (β_Mathe= .02/ .05; β_Deutsch= -.04/ -.04; β_Englisch= -.09*/ -.04). Die Ergebnisse änderten sich nicht wesentlich, wenn das domänenspezifische Wissen kontrolliert wurde. Sie deuten darauf hin, dass die Förderung von NFC zu einer positiven Entwicklung des akademischen Interesses von Schülerinnen und Schülern beitragen kann. Die Untersuchung unterstützt damit die Relevanz von NFC im Lern- und Leistungskontext.

Poster

Potenziale einer Ausstattung von Kinderkrippen mit ausgewählten Büchern und Spielen für das Wort- und Grammatikverständnis

Nina Bauer¹, Annabell Daniel², Nadine Besser³, Franka Baron⁴, Dorothea Dornheim³, Simone Lehrl⁵, Anja Linberg¹

¹Deutsches Jugendinstitut, Deutschland; ²Ludwig-Maximilians-Universität, Deutschland; ³Universität Bamberg, Deutschland; ⁴Universität Bern, Schweiz; ⁵Pädagogische Hochschule Weingarten, Deutschland

Die sprachförderliche Wirkung von Kinderbüchern für Kinder im Krippenalter ist bereits anhand einer Vielzahl von Studien belegt worden: Nicht nur die positiven Effekte gemeinsamer Bilderbuchbetrachtung von Bezugsperson und Kind konnten in diversen Studien nachgewiesen werden (z.B. Hargrave & Sénéchal, 2000; Mol et al., 2009; Weisleder et al., Whitehurst et al., 1988; 2018). Auch das Vorhandensein von Büchern in der häuslichen Lernumwelt von Kindern unter drei Jahren erwies sich in mehreren Untersuchungen als sprachfördernd (z.B. NICHD Early Child Care Research Network, 2006; Niklas & Schneider, 2013). Gesellschaftsspiele im Zusammenhang mit Spracherwerb bei Kindern unter drei Jahren wurden bislang weniger häufig untersucht. Wenige Studien verweisen jedoch darauf, dass auch dieses Medium förderlich auf die Sprachkompetenzen von Kindern wirken bzw. einen wertvollen Bestandteil der häuslichen Lernumwelt darstellen kann (z.B. Hassinger-Das et al., 2016; Wood, 2002).

Neben der häuslichen Lernumwelt stellen jedoch auch Einrichtungen der frühkindlichen Bildung, Betreuung und Erziehung (FBBE) auch bereits in frühen Alter eine zentrale Lernumwelt dar und Studien, welche sich auf die Wirkung der Materialaustattung in Kinderkrippen fokussieren, sind vergleichsweise selten.

Daher geht dieser Beitrag den folgenden Fragen nach:
(1) Steht die Ausstattung von ausgewählten Kinderbüchern und -spielen für Krippengruppen mit einer Verbesserung des kindlichen Wort- und Grammatikverstehens in einem Zusammenhang?
(2) Wie beeinflussen die Nutzungsintensität der Materialien diese Verbesserung?

Die Daten dafür stammen aus der Interventionsstudie „Frühe mathematische Entwicklung und die Bedeutung von Interaktionsqualität in Kindertageseinrichtungen“ (EarlyMath), welche die Wirkung einer Fortbildung und der Ausstattung mit einer Spielzeugkiste auf die kindliche Entwicklung mittels Interventions- und Kontrollgruppen untersuchte. In der vorliegenden Studie wurden zwei Messzeitpunkte genutzt, bei welchen bei Kindern im Alter von 2,7 Jahre und 3,1 Jahren das Wort- und Grammatikverständnis erfasst wurde (n= 233, in 75 Krippengruppen). Als Instrument für die Messung des Wortverständnisses diente eine Kombination aus einem Untertest des SETK-2 (Grimm, 200) und einem Teil des Peabody Picture Vocabulary Tests (PPVT-IV) in deutscher Fassung (Lenhard et al., 2015). Das Grammatikverständnis wurde mithilfe eines SETK-2 Untertest (Grimm, 2000) und des TROG-D (Fox-Boyer, 2020) erhoben. Zwischen den beiden Messzeitpunkten wurden für 63 Krippengruppen (203 Kinder) eine Spielzeugkiste zur Verfügung gestellt, welche fünf Bilderbücher und sechs Gesellschaftsspiele ab zwei Jahren enthielten. Bei der Auswahl der Bücher wurde sich an den Techniken des dialogischen Lesens nach Whitehurst und Kollegen (1988) orientiert. Die Auswahl der Spiele orientierte sich an Hauser und KollegInnen (2014). In den Gruppen, die eine Spielzeugkiste erhielten, absolvierte jeweils eine Fachkraft eine Schulung zu frühkindlichen Förderung und Interaktionsgestaltung mit Büchern, Spielen und in Alltagssituationen. Die Nutzungsintensität der Materialien wurde anhand von Fragebögen erhoben, in denen die Fachkräfte angaben, wie häufig und lange sie gemeinsam mit den Kindern die Materialien der Spielzeugkiste nutzten. Die Berechnungen wurden mithilfe von Kovarianzanalysen (Fragestellung 1) und moderierten Regressionsanalysen (Fragestellung 2) mit R-Studio durchgeführt.

Es konnte ein statistisch signifikanter positiver Einfluss der Spielzeugkiste auf das Grammatikverständnis unter Kontrolle der Kompetenzen zum ersten Messzeitpunkt und des sozioökonomischen Hintergrundes identifiziert werden (ß = .24, p<.037). Im Gegensatz dazu konnte kein signifikanter Einfluss der Spielzeugkiste auf das Wortverständnis gefunden werden. Auch der Einfluss der Nutzungsintensität erwies sich als nicht signifikant, jedoch lassen sich Tendenzen erkennen: eine längere Nutzung der Toybox-Spiele führt durchaus in geringem Ausmaß zu einem schwächeren Zusammenhang der Sprachverständniswerten zwischen den beiden Messzeitpunkten (ß =-.01, p<.147).

Vor dem Hintergrund der Limitationen der Studie und Analysen werden die Implikationen der Ergebnisse diskutiert.

Poster

Adaptive Unterstützung in MINT-Lernumgebungen zur Förderung der Kompetenz und Selbstwirksamkeitserwartung beim Experimentieren

Elena Meister¹, Felix Nell¹, Silke Mikelskis-Seifert¹, Wolfram Rollett¹, Katja Scharenberg², Jennifer Stemmann¹, Oliver Straser¹, Nadine Tramowsky¹

¹Pädagogische Hochschule Freiburg, Deutschland; ²LMU München

Das vom BMBF geförderte Projekt AdUmint (Adaptive Unterstützung in MINT-Lernumgebungen zur Förderung experimenteller Kompetenz und Selbstwirksamkeit) hat zum Ziel, digitales adaptives Unterrichtsmaterial zum Experimentieren zu entwickeln, welches die Experimentierkompetenz sowie die experimentierbezogene Selbstwirksamkeitserwartung von Schüler*innen fördern kann. Dabei führen die an unserer Studie teilnehmenden Schüler*innen Hands-On Experimente aus den MINT-Fächern durch, die sich auf verschiedene Aspekte des Klimawandels beziehen. Untersucht wird die Wirksamkeit barrierearmer Instruktionen und gestufter Lernhilfen in Abhängigkeit von unterschiedlichen Darstellungsformen und unter Berücksichtigung verschiedener Heterogenitätsmerkmale.

Das Experiment ist eine methodisch besonders kontrollierte Art der wissenschaftlichen Erkenntnisgewinnung. Es wird im Kontext Schule in fast allen MINT-Domänen als fachspezifische Unterrichtsmethode eingesetzt, mit dem Ziel, Lernen zu initiieren und Lernende kognitiv zu aktivieren (Stemmann & Tramowsky, 2021). In unserem Projekt wird das Experimentieren als eine Kompetenz aufgefasst, die sich aus kognitiven und motivationalen Facetten zusammensetzt (Weinert, 2001). Aktuelle Forschungen beschreiben hierbei die Notwendigkeit zur Förderung der Experimentierkompetenz. So haben Schüler*innen häufig Schwierigkeiten bei der Formulierung von Forschungsfragen und Hypothesen (Kuhn & Dean, 2005). Auch die Planung, Durchführung und Reflexion von Experimenten fällt ihnen oft nicht leicht (Hilfert-Rüpell et al., 2010). Hierbei lassen sich insbesondere Probleme bei der Kontrolle und Variation von Variablen in der Planung eines Experiments hervorheben (Schwichow et al., 2020). Auch die Verknüpfung zwischen den zuvor formulierten Hypothesen und den Ergebnissen eines Experiments bereitet den Schüler*innen Schwierigkeiten (Hammann et al., 2006). Da für die Vermittlung von Inhalten das Schüler*innenexperiment eine größere Wirksamkeit im Vergleich zum Demonstrationsexperiment aufweist (Walker, 2013), werden in unserem Projekt Hands-On Experimente zur Entwicklung von Experimentierkompetenz eingesetzt. Das Experimentieren wird bei der Gestaltung der Experimente als ein eigenständiges Lernziel gesehen (Abd-El-Khalick et al., 2004), welches fachunabhängig vermittelt werden kann.

Vor diesem theoretischen Hintergrund hat sich das AdUmint-Projekt zum Ziel gesetzt, die Wirkung von adaptiven Maßnahmen in digitalen MINT-Lernumgebungen zu untersuchen. Dabei wird zwischen der Förderung von Experimentierkompetenzen und der damit verbundenen Selbstwirksamkeitserwartung sowie der differentiellen Effekte der Maßnahmen für Schüler*innen mit unterschiedlichen Lernvoraussetzungen unterschieden. Hieraus ergeben sich folgende Forschungsfragen:

Inwieweit fördern Instruktionen in verschiedenen Darstellungsformen und gestufte Lernhilfen die Experimentierkompetenz und Selbstwirksamkeitserwartung in digitalen MINT-Lernumgebungen?
Welche Teilfähigkeiten beim Experimentieren werden von den verschiedenen Repräsentationsformen und gestuften Lernhilfen unterstützt?
Welche Schüler*innen profitieren jeweils durch welche Darstellungsformen der Instruktion in digitalen MINT-Lernumgebungen bezüglich der Förderung der Experimentierkompetenzen und Selbstwirksamkeitserwartung im besonderen Maße?
Welche Schüler*innen werden durch gestufte Lernhilfen in ihren Experimentierkompetenzen und ihrer Selbstwirksamkeitserwartung gefördert?

Bei dem zum Einsatz kommenden Studiendesign handelt es sich um ein experimentelles Prä-Post-Design mit Messwiederholung. In der im Oktober 2023 stattfindenden Pilotierung werden Daten mit 120 Schüler*innen der sechsten Klasse in allen Schulformen erhoben. Für die ab Januar 2024 beginnende Hauptstudie sind 600 Versuchspersonen eingeplant.

Beim Versuchsplan handelt es sich um ein 2x2 faktorielles Design. Als unabhängige Variablen dienen einerseits die Modalität der Instruktionen, die je nach Gruppenzuordnung textbasiert oder multimedial zur Verfügung stehen. Die zweite unabhängige Variable besteht im Zugang zu gestuften Lernhilfen. Die Kontrollgruppe (KG) und die Experimentalgruppe (EG) 1 arbeiten jeweils mit textbasierten Instruktionen, wobei die EG 1 bei selbsteingeschätztem Bedarf zusätzlich Zugang zu gestuften Lernhilfen hat. Die EG 2 und 3 erhalten jeweils multimediale Instruktionen, wobei die EG 3 zusätzlich auf gestufte Lernhilfen zugreifen kann.

Die quantitative Datenauswertung erfolgt anhand eines Allgemeinen linearen Modells (ALM). Darüber hinaus werden Multiple Regressionen und Multiple Kovarianzanalysen (MANCOVA) im Auswertungsprozess verwendet.

Das Poster stellt Anlage, Design und erste Ergebnisse aus der Pilotierung vor. Die zu erwartenden Ergebnisse aus unserem Projekt sind von theoretischer und praktischer Bedeutung für die Gestaltung von Lernumgebungen und sollen die Unterrichtspraxis nachhaltig verändern.

Poster

Digitaler Stress im Kindesalter? Vorstellung eines Multi-Kohorten-Sequenz-Designs und Präsentation erster Ergebnisse einer Pilotstudie

Arvid Nagel, Felix Kruse

PH NMS Bern, Schweiz

In den letzten Jahren haben sich die Lebensumstände von Kindern und Jugendlichen erheblich verändert. Seit der Jahrtausendwende wachsen sie in einer Welt auf, in der die Nutzung von Informations- und Kommunikationstechnologie zum alltäglichen Standard gehört. Dies führte dazu, dass Prensky (2001) den Begriff der Digital Natives prägte. Interaktive Medien spielen eine entscheidende Rolle in der Sozialisation von Kindern und sind aus ihrem Alltag nicht mehr wegzudenken. Digitale soziale Netzwerke, Smartphones und Computerspiele gehören zu den beliebtesten Freizeitaktivitäten und nehmen neben Familie, Schule und Peers eine zentrale Position ein (u.a. Feierabend et al., 2022). Für viele junge Menschen beginnt der Tag mit einem Blick auf soziale Netzwerke, ihre Aktivitäten werden maßgeblich von der unmittelbaren Verfügbarkeit neuer Medien beeinflusst und der Tag endet oft mit einem letzten Eintrag in den Netzwerken. Kurz gesagt: Die Lebenswelten junger Menschen sind heutzutage von verschiedenen interaktiven Medien geprägt. Forscher:innen, Eltern, Lehrer:innen und (bilungs-)politische Entscheidungsträger:innen stellen sich die Frage, welche Auswirkungen dieses Medienverhalten auf Individuen und die Gesellschaft hat. Obwohl in den letzten Jahren intensive Forschungsbemühungen im Kontext der Medienwirkungsforschung unternommen wurden, bestehen immer noch erhebliche Wissenslücken, insbesondere im Hinblick auf das Kindesalter und vor allem hinsichtlich problematischer und pathologischer Nutzungsweisen interaktiver Medien von Schüler:innen der Primarstufe (vgl. Kliesener et al., 2022).
Dieses Forschungsdesiderat aufnehmend, werden in einer Längsschnittstudie mit drei Messzeitpunkten, die im Februar 2024 beginnt, die nachfolgenden forschungsleitenden Fragestellungen untersucht: Welche Auswirkungen hat der Konsum interaktiver Medien im Kindesalter auf bildungsbezogene Faktoren wie Schulnoten, Lernfreude, Selbstkonzept, Einstellungen zur Schule und Aufmerksamkeit? Darüber hinaus werden gesundheitsbezogene Kriterien wie psychische Gesundheit, schulisches Wohlbefinden, Einsamkeit und digitaler Stress analysiert. Ein spezielles Augenmerk gilt der Frage, wie sich digitaler Stress bei Kindern entwickelt und welche Faktoren diesen erklären können. Um diese leitenden Forschungsfragen zu beantworten, wird ein quantitativer Forschungsansatz verfolgt. Dabei werden insgesamt 1500 Schüler:innen der 3. bis 6. Klasse der Primarstufe im Kanton Bern sowohl in einem Querschnitts- als auch in einem Längsschnittvergleich innerhalb eines Multi-Kohorten-Sequenz-Designs untersucht. Als statistische Analyseverfahren sollen mehrebenanalytische Strukturgleichungsmodelle sowie cross-lagged Panelmodelle herangezogen werden, um einerseits der hierarchischen Datenstruktur sowie der simultanen strukturüberprüfenden Hypothesenprüfung und andererseits der analytischen Betrachtung von Panel- und Trenddaten (Multi-Kohorten-Sequenz-Design) gerecht zu werden. Die Datenerhebungen erfolgen ab Februar 2024 mittels wiederholter jährlicher schriftlicher Befragungen der Schüler:innen, die online durchgeführt werden. Diese Befragungen finden innerhalb ihrer Klassengemeinschaften statt und ermöglichen einen detaillierten Einblick in die genannten bildungs- und gesundheitsbezogenen Variablen im Zusammenhang mit dem Konsum interaktiver Medien im Kindesalter. Zudem erfolgen Eltern- und Lehrpersonenbefragungen, welche thematisch mit dem Forschungsfokus assoziiert sind.
Im Rahmen des Beitrags sollen die ersten Ergebnisse einer Pilotstudie zum diesem Themenkomplex präsentiert werden. Im Herbst 2023 konnten 240 Schüler:innen im Alter von 8 bis 13 Jahren der Klassenstufen 3.-6. aus drei Primarschulen im Kanton Bern mittels eines Online-Fragebogens befragt werden. Die Operationalisierungen, die deskriptiven Befunde und Zusammenhangsanalysen sowie die Faktorstrukturen der Skalenentwicklungen zum digitalen Stress, Internet Gaming Disorder sowie der problematischen Social Media Nutzung sollen präsentiert, kritisch reflektiert und diskutiert werden. Neben der Darlegung der theoretischen Grundlagen des Untersuchungsdesigns und den empirischen Erkenntnissen der Pilotierung werden die Befunde auch vor dem Hintergrund des institutionellen Auftrag die Schüler:innen hinsichtlich eines ergebnisorientierten und funktionalen Umgangs mit Informations- und Kommunikationstechnologien zu unterstützen, reflektiert und diskutiert.

Poster

Reflexives Schreiben von Lehramtsstudierenden: Eine Analyse mit Verfahren maschinellen Lernens und vortrainierten Sprachmodellen

Chengming Zhang¹, Veronika Solopova², Florian Hofmann¹, Michaela Gläser-Zikuda¹

¹FAU Erlangen-Nürnberg, Deutschland; ²FU Berlin, Deutschland

Theoretischer Hintergrund. Reflexives Schreiben kann als Tätigkeit von Personen, „die im Medium des Schreibens über Handlungen und Tätigkeiten nachdenken, sie in ihrem Kontext mit Abstand betrachten und bewerten“ (Rott, 2018, 36; vgl. Korthagen & Vasalos, 2005) definiert werden. Obgleich Ansätze zur Förderung reflexiven Schreibens insbesondere auch in der Lehrer*innenbildung implementiert wurden, wurde oft nur eine eingeschränkte Wirksamkeit belegt (Körkkö et al., 2016; Poldner et al., 2014). Ein Grund hierfür liegt vermutlich in der Komplexität des reflexiven Schreibens (Ullmann, 2019). Aktuelle Forschungsergebnisse zeigen jedoch, dass maschinelles Lernen und vortrainierte Sprachmodelle zur Analyse von Reflexionstexten sowie daran anknüpfend für Entwicklung von Feedbackmechanismen für reflexives Schreiben eingesetzt werden könnten (Nehyba & Štefánik, 2023; Wulff et al., 2022). Trotz dieser Fortschritte gibt es bei der Anwendung von KI zur Beurteilung von reflexiven Schreibens noch einige Herausforderungen, wie eine oftmals geringe Datenqualität, insbesondere bei der Erhebung von Reflexionstexten. Viele Studien basieren auf unklaren Zielen und Kriterien für die zu verfassenden Reflexionstexte. Der methodische bzw. technische Ansatz stellt ebenfalls eine Herausforderung dar. Häufig wird eine Analyse auf Satz- und nicht auf Dokumentenebene durchgeführt.

Fragestellung. Das Ziel dieser Studie besteht demzufolge darin, die verschiedene Merkmale von Reflexionstexten zu erfassen, um diese anschließend mithilfe maschinellem Lernens sowie vortrainierter Sprachmodelle zu kategorisieren. Daraus ergeben sich folgende Fragestellungen:

F1: In welchem Ausmaß lassen sich mit Verfahren maschinellen Lernens und diverser Sprachrepräsentationen Reflexionstexte von Lehramtsstudierenden klassifizieren?

F2: Wie effizient erweisen sich die vortrainierten Sprachmodelle bei der Klassifizierung von Reflexionstexten von Lehramtsstudierenden ?

F3: Wie effizient hinsichtlich der Klassifizierung von Reflexionstexten von Lehramtsstudierenden sind maschinelles Lernen und vortrainierte Sprachmodelle im Vergleich?

Methode. Im Rahmen dieser Studie wurden 1043 Reflexionstexte in Lehrveranstaltungen in drei Semestern (WS 2021/22, SoSe 2022 und WS 2022/23) an einer Universität erhoben. Die Reflexionstexte stammen überwiegend von weiblichen Studierenden (ca. 70%) aus verschiedenen Lehramtsstudiengängen. Die Reflexionstexte hatten im Durchschnitt einen Umfang von 251,38 Wörtern (SD = 143,08) und wurden basierend auf dem theoretischen Modell von Hatton und Smith (1995) mit Hilfe einer strukturierenden qualitativen Inhaltsanalyse (Gläser-Zikuda et al., 2020) kodiert. Insgesamt 261 Texte wurden dem Niveau „beschreibendes Schreiben“, 545 dem Niveau „deskriptive Reflexion“, 209 dem Niveau „dialogische Reflexion“ und 28 dem höchsten Niveau „kritische Reflexion“ zugeordnet. Die Intercoder-Reliabilität für die Kodierung der Reflexionstexte in den drei Semestern zeigte akzeptable Cohen‘s Kappa-Koeffizienten von 0,67, 0,66 und 0,73 (McHugh, 2012). Anschließend wurden alle Texte mithilfe von maschinellem Lernen und durch den Einsatz vortrainierter Sprachmodelle klassifiziert. Folgende Algorithmen des maschinellen Lernens wurden verwendet: Entscheidungsbäume, Support Vector Machines, Random Forest, Ridge Classifier, SGD Classifier, XGB Classifier und Gradient Boosting Classifier. Ferner nutzten wir drei Methoden zur Merkmalsextraktion: BoW (Bag of Words), TF-IDF (Term Frequency-Inverse Document Frequency) und LIWC2015 (Linguistic Inquiry and Word Count). Bei der Anwendung vortrainierter Sprachmodelle kamen BERT, RoBERTa, Longformer und BigBird zum Einsatz.

Ergebnisse. Für die erste Forschungsfrage zeigt sich, dass die durchschnittliche Genauigkeit von Algorithmen des maschinellen Lernens in der Regel unter 60 % liegt. Unter den leistungsstärksten Kombinationen war die Kombination des Gradient-Boosting-Klassifikators mit LIWC2015 besonders effektiv und erreichte eine Genauigkeit von 61,97 %. Mit Blick auf die zweite Forschungsfrage lässt sich feststellen, dass sich eine Genauigkeit von 73,28 % bzw. 74,25 % für die Modelle BERT und RoBERTa ergab. BigBird und Longformer schnitten mit Genauigkeitsraten von 76,26 % bzw. 77,22 % noch besser ab. Auf dieser Grundlage kann für die letzte Forschungsfrage festgestellt werden, dass das vortrainierte Sprachmodell das traditionelle maschinelle Lernen mit einer um 15 % höheren Genauigkeit deutlich übertrifft. Im Kontext des aktuellen Forschungsstandes zeigt sich also, dass die hier eingesetzten Modelle eine im Vergleich zu den bisher oft eingesetzten Methoden überlegene Klassifikation von Reflexionstexten auf der Ebene des gesamten Dokuments ermöglichen.

Poster

Sind Veränderbarkeitstheorien über Leistungsemotionen emotionsspezifisch?

Maike Trautner¹, Rebekka Leim², Malte Schwinger²

¹Philipps-Universität Marburg, Deutschland, AE Entwicklungspsychologie; ²Philipps-Universität Marburg, Deutschland, AE Pädagogische Psychologie

Beim Lernen treten unterschiedliche Emotionen auf, die sich sowohl förderlich als auch hinderlich auf den Lernprozess auswirken können (Camacho-Morles et al., 2021). Die Regulation dieser lernbezogenen Emotionen hat nachweislich wesentlichen Einfluss auf den Lernerfolg (z.B. Gumora & Arsenio, 2002; Ivcevic & Brackett, 2014). Ob und wie gut Emotionen reguliert werden, hängt davon ab, ob Lernende grundsätzlich von der Veränderbarkeit und Kontrollierbarkeit von Emotionen überzeugt sind (Tamir et al., 2007). Diese impliziten Veränderbarkeitstheorien wurden im akademischen Kontext bislang nur in Bezug auf Emotionen im Allgemeinen untersucht, nicht aber bezüglich spezifischer Emotionen wie Langeweile oder Angst. Die Frage, wie domäenenspezifisch implizite Veränderbarkeistheorien sind wird Dieser Beitrag geht daher der offenen Frage nach, ob es sich bei impliziten Veränderbarkeitstheorien über Leistungsemotionen eher um eine globale, emotionsübergreifende Theorie handelt oder Lernende eher unabhängige Theorien über einzelne Emotionen haben. Außerdem wird geprüft, ob Veränderbarkeitstheorien über Leistungsemotionen mit höheren Selbstwirksamkeitserwartungen für Emotionsregulation und dem Einsatz von Emotionsregulationsstrategien, sowie dem dispositionellen Erleben von Leistungsemotionen zusammenhängen. Dieses Wissen kann helfen, Emotionsregulationstrainings effektiver und zielgerichteter zu gestalten.

N = 421 Studierende (78.1% weiblich, M_Alter = 22.37, SD_Alter= 3.74, 47.3% Psychologiestudierende) nahmen an einer querschnittlichen Fragebogenstudie teil. Um implizite Veränderbarkeitstheorien über Leistungsemotionen differenziert zu erfassen wurden die allgemeinen vier Items von Tamir et al. (2007) an neun verschiedene Leistungsemotionen angepasst. Selbstwirksamkeit für Emotionsregulation wurde mit der Subskala „using and managing your own emotions“ von Kirk et al. (2008), das Erleben von Leistungsemotionen mit dem AEQ-S (Bieleke et al., 2021), die Emotionsregulationsstrategien kognitive Neubewertung und expressive Unterdrückung mit dem deutschen Emotion Regulation Questionnaire (Abler & Kessler, 2009) erfasst. Zur Untersuchung der Dimensionalität impliziter Veränderbarkeitstheorien über Leistungsemotionen wurden verschiedene a priori definierte Strukturgleichungsmodelle gegeneinander getestet. Die Zusammenhänge mit den weiteren Konstrukten wurden mittels bivariater Korrelationen geprüft.

Die Vergleiche verschiedener Strukturgleichungsmodelle zur Überprüfung der Dimensionalität impliziter Veränderbarkeitstheorien über Leistungsemotionen ergab die beste Modellpassung für ein Modell mit neun emotionsspezifischen, korrelierten Theorien und zugelassenen Fehlerkorrelationen zwischen den je parallel formulierten Items (χ²[414] = 629.84 (p < .001), CFI =.,97, SRMR = .04). Die Vergleichsmodelle mit einem zusätzlichen Globalfaktor 2. Ordnung oder einem Bifaktor für globale Veränderbarkeitstheorien über Emotionen passten signifikant schlechter zu den Daten. Im Mittel hielten die Studierenden alle Emotionen für eher veränderbar (M_{Erleichterung}= 3.24 bis M_Ärger = 3.97; Zustimmungsskala von 1 bis 5). Die emotionsspezifischen Theorien wiesen gute interne Konsistenzen auf (.82 < ω < .91) und korrelierten moderat bis hoch positiv untereinander (.29 < r < .59). Je stärker Lernende überzeugt waren, positive (bzw. negative) Emotionen seien veränderbar, desto häufiger (bzw. seltener) erlebten sie entsprechende Emotionen mit Ausnahme von Freude und Erleichterung. Veränderbarkeitstheorien zu Leistungsemotionen gingen mit höherer Selbstwirksamkeit für Emotionsregulation (.18 < r < .29, p < .01), mehr kognitiver Umbewertung (.16 < r < .33, p < .01), sowie tendenziell mit einem selteneren Einsatz expressiver Unterdrückung zur Emotionsregulation einher (-.15 < r < .01; .01 < p < .19).

Die vorliegende Studie konnte zeigen, dass Lernende eher differenzierte Veränderbarkeitstheorien über verschiedene Leistungsemotionen haben als eine globale Theorie über Emotionen im Allgemeinen, aber auch, dass je veränderbarer sie eine Emotion fanden, sie tendenziell auch andere Emotionen veränderbar fanden. Dies impliziert, dass eine emotionsspezifische Erfassung dieser Theorien möglich ist und in zukünftiger Forschung genauer berücksichtigt werden sollte. Zukünftige Forschung sollte darüber hinaus Zusammenhänge verschiedener Theorien auf intraindividueller Ebene untersuchen, um mögliche individuelle Konstellationen an Veränderbarkeitstheorien über bestimmte Emotionen aufzudecken. Veränderbarkeitstheorien über Leistungsemotionen gingen mit konstruktiverer Emotionsregulation, weniger aber mit Unterdrückung als eher maladaptiver Strategie einher. Experimentelle und Interventionsstudien sollten daher zeigen, ob das explizite Adressieren von Veränderbarkeitstheorien über bestimmte Leistungsemotionen im Rahmen von Emotionsregulationstrainings zu effektiverer Selbstregulation beiträgt.

Poster

Innovative Lehr-Lernformate in der kaufmännischen Unterrichtspraxis: Gelingensbedingungen und Herausforderungen bei der Implementation einer Bürosimulation

Sophia Gentner, Jürgen Seifried

Universität Mannheim, Deutschland

Die Notwendigkeit der digitalen Transformation im Bildungsbereich und die zunehmende Relevanz digitaler Tools im Unterricht ergeben sich aus einer Vielzahl von Anforderungen. In der kaufmännischen Bildung lässt sich dies insbesondere mit den Veränderungen in der Arbeitswelt in Verbindung bringen. Die fortschreitende Digitalisierung von Geschäftsprozessen führt zu veränderten Anforderungen an die Kompetenzen von Auszubildenden, wodurch eine Anpassung von Lehr-Lernprozessen und Unterrichtsmethoden erforderlich wird. Ein Ansatz zur Gestaltung digitaler Lehr-Lernprozesse in der beruflichen Bildung stellt die Verwendung authentischer Simulationen dar. Diese bilden Situationen aus dem realen Arbeitskontext ab und bieten vielfältige Lernmöglichkeiten (Chernikova et al., 2020, 2023; Plass & Schwartz, 2014). In der kaufmännischen Domäne ermöglichen Bürosimulationen, dass Lernende berufliche Handlungskompetenzen in einem geschützten Rahmen erwerben und sich damit auf die Anforderungen der digitalen Arbeitswelt vorbereiten können (Caruso, 2019; Rausch et al., 2021). Zudem bieten solche digitalen Umgebungen auch die Möglichkeit, in heterogenen Lerngruppen die individuellen Lern- und Leistungsstände zu berücksichtigen. Durch den Einsatz von Logdatenanalysen können beispielsweise personalisierte Unterstützungen in Form von Prompts angeboten und Lernende damit in ihrem Lernprozess individuell unterstützt werden (Deutscher et al., 2022).

Bei der Bewältigung der digitalen Transformation von Unterricht kommt insbesondere den Lehrkräften eine zentrale Rolle zu (Seufert et al. 2018). Sie stehen vor der Aufgabe, neue Technologien und Lehrmethoden in ihrem Unterricht zu implementieren. Die erfolgreiche Implementierung digitaler Tools im Unterricht ist jedoch keine Selbstverständlichkeit und unterliegt verschiedenen Einflussfaktoren. So sind beispielsweise die Relevanz der wahrgenommenen Nützlichkeit und die Benutzerfreundlichkeit einer Technologie von Bedeutung (Technology Acceptance Model, Davis, 1985; für den beruflichen Bildungskontext siehe Antonietti et al., 2022). Neben den Charakteristika des Implementationsgegenstands können aber auch zahlreiche andere kontextbezogene Faktoren Einfluss auf die Implementation innovativer Lehr-Lernformate in die Bildungspraxis nehmen (Schrader et al., 2020). Zur Unterstützung von erfolgreichen Implementationsprozessen kommt insbesondere Erkenntnissen zu den Bedingungsfaktoren sowie deren Zusammenspiel Relevanz zu (Antonietti et al., 2022; Gräsel et al., 2020).

Vor diesem Hintergrund zielt die im Posterbeitrag thematisierte Interviewstudie darauf ab, relevante Bedingungen für die Implementation einer digitalen Bürosimulation aus der Sicht von Lehrkräften zu identifizieren: Welche Faktoren werden von Lehrkräften als förderlich für die Implementation einer digitalen Bürosimulation in der kaufmännischen Unterrichtspraxis wahrgenommen? Welche als hinderlich? Um diesen Fragen nachzugehen, wurden semi-strukturierte Interviews mit Referendar:innen und Lehrkräften (N = 25) durchgeführt, die zuvor an einem Workshop zur Einführung der simulationsbasierten Lehr-Lernumgebung teilgenommen haben. Die Auswertung erfolgte mittels einer qualitativen Inhaltsanalyse. Unter Rückgriff auf aktuelle Literatur der Implementationsforschung (z.B. Schrader et al., 2020, s.o.) wurden übergreifende Kategorien für Bedingungsfaktoren gebildet, weitere Subkategorien ergaben sich induktiv aus dem Datenmaterial. Dabei wurde differenziert, ob thematisierte Aspekte als förderlich oder herausfordernd für den Implementationsprozess wahrgenommen werden. Es zeigt sich, dass verschiedene Charakteristika der Software als förderlich für deren Implementation wahrgenommen werden. Dazu zählt beispielsweise die Realitätsnähe der Lernumgebung sowie die Möglichkeit, ganzheitliches und selbstorganisiertes Lernen zu unterstützen. Daneben sind aber auch Merkmale der Lehrpersonen (z.B. Motivation), oder institutionelle Charakteristika (z.B. die Unterstützung des Kollegiums) und die Form der Unterstützung beim Implementationsprozess (z.B. Workshops) relevante Implementationsbedingungen. Eine zentrale Herausforderung stellt der Zeitaufwand dar, der zu Einarbeitung und Implementation benötigt wird. Die identifizierten Gelingensbedingungen und Herausforderungen tragen schließlich dazu bei, Handlungsempfehlungen für zukünftige Implementationsprozesse in der beruflichen Bildung abzuleiten.

Poster

Kulturelle Bildung und gesellschaftliche Transformation – auf dem Weg zur Aufarbeitung des Forschungsstandes

Lisa Birnbaum, Alexander Christ, Stephan Kröner

Friedrich-Alexander-Universität Erlangen-Nürnberg, Deutschland

Theoretischer Hintergrund

Im Rahmen gesellschaftlichen Wandels gerät auch kulturelle Bildung in ein Spannungsfeld aus Bewahrung von Bewährtem, Anpassung an veränderte Rahmenbedingungen und aktiver Gestaltung der Zukunft (Reinwand-Weiss, 2023). Im Praxisfeld der kulturellen Bildung kommt Themenbereichen wie Inklusion und Teilhabe oder der Ermöglichung eines vielfältigen kulturellen Angebots in ländlichen Räumen besondere Bedeutung zu (Büdel & Kolleck, 2023). Um beurteilen zu können, inwieweit gesellschaftlicher Wandel mittels kultureller Bildung andressiert werden kann und welche Evidenz zu Gelingensbedingungen und Herausforderungen vorliegen, sind breit angelegte, textmininggestützte Forschungssynthesen hilfreich (Christ et al., 2021)

Fragestellung

Um das Forschungsfeld zur kulturellen Bildung vor dem Hintergrund gesellschaftlicher Transformation zu kartieren, soll (a) ein Überblick über das Forschungsfeld insgesamt gewonnen werden und es sollen (b) mit Inklusion und ländlichen Räumen ausgewählte aktuelle Themenbereiche der kulturellen Bildung vertieft analysiert werden. Dabei wird jeweils im Detail untersucht, in welchem Ausmaß belastbare Evidenz vorliegt und welche inhaltlichen und forschungsmethodischen Schwerpunkte sich erkennen lassen.

Methode

Im geplanten Projekt wird in den Datenbanken Scopus und ERIC mit breiten Suchbefehlen nach Zeitschriftenartikeln recherchiert. Die relevanten Begriffe zu kultureller Bildung inklusive ihrer Facetten wie bildende und darstellende Kunst, Literatur oder Musik finden bei der Suche ebenso Berücksichtigung wie relevante Begriffe zu gesellschaftlicher Transformation sowie insbesondere zu Inklusion und ländlichen Räume. Für Titel, Zusammenfassungen und Schlüsselbegriffe sowie für die Zeitschriften-Titel aller im Korpus enthaltenen Arbeiten wird jeweils eine Reihe sogenannter Signifikanzwerte bestimmt. Sie ergeben sich (a) aus dem Anteil der Wörter, der indikativ für kulturelle Bildung als solche oder eine ihrer Facetten ist, und (b) aus dem Anteil der Wörter, der jeweils auf eine gesellschaftliche Transformationslinie verweist, und (c) aus dem Anteil, der die Exklusion einer Arbeit naheliegt. Die so bestimmten Signifikanzwerte werden in darauffolgenden Iterationen aus priorisierten manuellen Sichtungen und Optimierung der Signifikanzwerte bei minimaler Anzahl zu sichtender Datenbanktreffer ein- bzw. ausgeschlossen. Alle eingeschlossenen Arbeiten werden anschließend per Topic Modeling thematisch kartiert.

Ergebnisse

Mit Hilfe von Gap Maps werden sowohl Schwerpunkte der internationalen Forschung zur kulturellen Bildung vor dem Hintergrund gesellschaftlicher Transformation als auch Forschungslücken aufgezeigt.

Aufbauend auf der Kartierung des Feldes werden zu ausgewählten Schwerpunkten vertiefende Synthesen durchgeführt, insbesondere zu den Bereichen Inklusion und ländliche Räume. Schließlich werden die Ergebnisse der Kartierung in eine interaktive Web-App integriert, welche zur Visualisierung der Ergebnisse dient und es ermöglicht, nicht im Korpus enthaltene Arbeiten im erarbeiteten Topic Model zu verorten. Auf dem vorgestellten Poster werden erste Ergebnisse zur iterativen Entwicklung des Suchterms präsentiert.

Diskussion

Möglichkeiten und Grenzen der eingesetzten Machine-Learning-Verfahren sowie Implikationen für die weitere Entwicklung der Forschung zur kulturellen Bildung werden diskutiert.

Poster

Ist die Trennung von Tonfolge und Rhythmus beim Erlernen neuer Stücke hilfreich? – Eine empirische Betrachtung vor dem Hintergrund der Cognitive Load Theory

Miriam Knebusch, Johannes Hasselhorn, Daniel Fiedler

Friedrich-Alexander-Universität Erlangen-Nürnberg

Um das Erlernen und Üben eines neuen Musikstückes möglichst effektiv zu unterstützen, werden von Lehrkräften traditionell zahlreiche Methoden wie die Reduktion des Tempos, der Fokus auf kleinere Abschnitte oder der Fokus auf einzelne Aspekte der Musik eingesetzt (z.B. Langeheine 1999). Häufig konzentrieren sich dabei die Lehrkräfte erst einmal auf die Tonhöhen ohne Berücksichtigung der rhythmischen Struktur, um u.a. die Komplexität des Lerngegenstands zu reduzieren.

Inwiefern das getrennte Einüben von Tonhöhe und Rhythmus tatsächlich Lernvorteile mit sich bringt, kann allerdings kritisch hinterfragt werden. Vor dem Hintergrund der Cognitive Load Theory (Sweller, 1988, 2005) kann dabei die Belastung des Arbeitsgedächtnisses in den Blick genommen werden. Dabei ist eine Überlastung aufgrund zu hoher Informationsdichte zu vermeiden. Ein zentrales Maß zur individuellen Einschätzung der Komplexität eines (Lern-) Gegenstands ist die Element Interactivity (Chen, Klyuga & Sweller, 2015), die nicht nur die Vernetzung der zu verarbeitenden Informationen berücksichtigt, sondern gleichzeitig auch noch das Vorwissen einer Person einbezieht (Leahy & Sweller, 2019; Sweller, 2006). Es kann daher vermutet werden, dass insbesondere (instrumentale) musikalische Vorerfahrung eine notwendige Voraussetzung dafür darstellt, dass die getrennte Betrachtung von Tonhöhe und Rhythmus tatsächlich hilfreich für das Erlernen einer Melodie oder eines neuen Stücks ist.

Das Ziel der vorliegenden Studie ist es daher, basierend auf einem experimentellen Studiendesign, zu überprüfen, ob Proband:innen verschiedener musikalischer Erfahrungsstufen nach zwei verschiedenen Einstudierungsmethoden (Methode 1: Rhythmus und Tonhöhe gleichzeitig vs. Methode 2: Erst die Tonhöhen, dann den Rhythmus) am Bodenklavier kurze Stücke unterschiedlich erfolgreich erlernen. Dabei wurde das Bodenklavier als weitgehend unbekanntes Musikinstrument ausgewählt, um Einflüsse spezifischer instrumentaler Vorkenntnisse zu reduzieren. Basierend auf den theoretischen Hintergründen gehen wir davon aus, dass Personen mit hoher musikalischer Erfahrung von Methode 2 profitieren; hingegen Personen mit geringer musikalischer Erfahrung eher von Methode 1.

In dem experimentellen Design werden die Proband*innen (randomisiert) den beiden Methoden zugeordnet. Die Bewertung des Lernerfolgs erfolgt auf der Grundlage der Anzahl der notwendigen Wiederholungen, bis eine Person ein Stück in Bezug auf Tonhöhen und Rhythmus fehlerfrei spielen kann. Zusätzlich werden sowohl der Globalfaktor des Goldsmiths Musical Sophistication Index (Fiedler & Müllensiefen, 2015), die Arbeitsgedächtnisleistung (Backward-Digit-Span) als auch soziodemografische Hintergrundvariablen erfasst. Die Auswertung der Daten erfolgt in einem varianzanalytischen Ansatz. Die Datenerhebung ist aktuell noch nicht abgeschlossen, vorläufige Ergebnisse auf der Basis von N=40 Versuchspersonen zeigen bereits die erwarteten Effekte. In einer ANCOVA mit abhängiger Variable Anzahl Versuche und Arbeitsgedächtnisleistung als Kovariate zeigt sich ein signifikanter, mittlerer Interaktionseffekt zwischen Übemethode und musikalischer Erfahrung (F=4.31, p=0.04, part. η²=0.06). Personen mit geringerer musikalischer Expertise benötigen durchschnittlich 2.24 Versuche mehr, wenn sie die Tonfolge zunächst unabhängig vom Rhythmus erlernen. Bis zur Tagung sollen diese Ergebnisse in einer größeren Stichprobe bestätigt werden.

Mithilfe dieser Studie können Erkenntnisse über die Eignung einer Übemethode für verschiedene Schüler*innen abhängig von deren musikalischer Vorerfahrung gewonnen und Lehrkräfte dabei unterstützt werden, passgenaue Methoden anzuwenden. Somit kann unsere Forschung zur Binnendifferenzierung beim Erlernen von Musikstücken beitragen. Basierend auf unseren Ergebnissen können also nicht nur die traditionellen Methoden zur Einstudierung von Stücken überprüft, sondern darüber hinaus theorie- und evidenzbasierte Ansätze in die pädagogische Praxis überführt werden.

Poster

Zur inkrementellen Varianz des Selbstkonzepts zur Vorhersage von subjektivem Wohlbefindens bei Jugendlichen über Persönlichkeit hinaus

Victoria Sophie Listing¹, Miriam Schmitz¹, Prof. Dr. Maike Luhmann², Prof. Dr. Marcus Roth³, Prof. Dr. Ricarda Steinmayr¹

¹Technische Universität Dortmund; ²Ruhr-Universität Bochum; ³Universität Duisburg-Essen

Im Forschungsfeld des subjektiven Wohlbefindens (SWB) Erwachsener nimmt die Persönlichkeit eine besondere Stellung als eine der stärksten und beständigsten Determinanten ein (Diener & Lucas, 1999). Allerdings existieren nur wenige Studien zu der Frage, ob die Persönlichkeit auch bei Jugendlichen als wichtiger Prädiktor des SWBs gilt (Winzer et al., 2021). Deswegen prüfen wir, inwiefern Persönlichkeit bei Jugendlichen mit verschiedenen Aspekten des SWBs assoziiert ist (Hypothese 1). Überdies wurde noch nicht untersucht, ob neben der Persönlichkeit als Prädiktor, auch Selbstkonzeptfacetten inkrementell Varianz im SWB erklären können. Diese Berücksichtigung sollte nicht unbeachtet bleiben, da sich das Selbstkonzept, als charakteristische Anpassung an die Big Five und die Umwelt, ebenfalls auf das individuelle Verhalten auswirkt (Pervin et al., 2005). Dementsprechend wurde überprüft, ob das Selbstkonzept über den Beitrag der Persönlichkeitsmerkmale hinaus zu der Vorhersage der allgemeinen Lebenszufriedenheit und Stimmung beiträgt (Hypothese 2). Entsprechend des Brunswik'schen Symmetrieprinzips (Wittmann, 2002) gehen wir davon aus, dass jene Selbstkonzeptfacetten, die den gleichen Kontext wie die bereichsspezifische Lebenszufriedenheit adressieren (z.B. Fähigkeitsselbstkonzept - schulbezogene Lebenszufriedenheit), über den Beitrag von Persönlichkeitsmerkmalen hinaus die beste Vorhersage der bereichsspezifischen Lebenszufriedenheit leisten (Hypothese 3) (Kretzschmar et al., 2018).

Die Stichprobe setzte sich aus N = 1269 Achtklässler*innen aus NRW zusammen (M_Alter = 13.31, SD = 0.6; 57.9% weiblich) und wurde im Rahmen der ersten Erhebungswelle (17.10.2022 – 16.12.2022) des GLÜCKS-Projekts gewonnen. Folgenden Aspekte des SWBs wurden erfasst: habituelle Lebenszufriedenheit (HSWBS; Dalbert, 2002), positive und negative Stimmung (SPANE; Rahm et al., 2017) sowie bereichsspezifische Lebenszufriedenheit mit Freunden, Familie, Schule und der eigenen Person (MLSSL; Huebner et al., 1998). Als Prädiktoren wurden die Big Five (BFI-K KJ; Kupper et al., 2019) sowie Selbstkonzeptfacetten (Fähigkeitsselbstkonzept, Aussehen, körperliche Fähigkeiten, Beziehung zu den Eltern, Beziehung zu Personen anderen & gleichen Geschlechts) betrachtet (SDQ III; Schwanzer et al., 2005). Um Multikollinearität entgegenzuwirken, wurden Relative Weight Analysen (RWA) als Alternative zu multiplen Regressionen durchgeführt. Diese bestimmen den relativen Beitrag, den ein Prädiktor zur Varianzaufklärung des Kriteriums leistet (Johnson, 2004). Bezüglich Hypothese 1 wurden sieben RWA durchgeführt, bei denen die Big Five die habituelle und bereichsspezifische Lebenszufriedenheit sowie die Stimmung vorhersagten. Für die Hypothesen 2 und 3 wurden sieben RWA durchgeführt, bei denen die oben genannten Kriterien durch die Big Five und das Selbstkonzept vorhergesagt wurden.

Übereinstimmend mit Hypothese 1 zeigte sich, dass die Big Five rund 35% Varianz im SWB aufklärten (R² = .11 - .35). Neurotizismus erwies sich als wichtigster Prädiktor und erklärte 53.1% der aufgeklärten Varianz der habituellen Lebenszufriedenheit, 50.7% der positiven und 78.0% der negativen Stimmung. Auch in den Lebenszufriedenheitsfacetten Freunde, eigene Person und Familie erwies sich Neurotizismus als wichtigster Prädiktor und erklärte jeweils 46.0%, 39.3% und 54.9%. Die schulische Lebenszufriedenheit (43.2%) wurde am stärksten durch Gewissenhaftigkeit erklärt. Gemäß Hypothese 2 zeigte sich, unter Berücksichtigung der Selbstkonzeptfacetten, eine Erhöhung der Varianzaufklärung im SWB auf 56% (R² = .23 - .56). Das elterliche Selbstkonzept erwies sich als wichtigster Prädiktor und erklärte 28.9% der habituellen Lebenszufriedenheit, 27.7% der positiven und 24.2% der negativen Stimmung. Entsprechend Hypothese 3 zeigte sich, dass die Selbstkonzeptfacetten, die im gleichen Kontext wie die Lebenszufriedenheitsbereiche waren, das höchste Inkrement erbrachten. Das elterliche Selbstkonzept erklärte 61,7% der familiären Zufriedenheit. Bei der Zufriedenheit mit der eigenen Person erwies sich das Aussehen bezogene Selbstkonzept als wichtigster Prädiktor (32.3%). Beziehungen zu Personen gleichen Geschlechts erklärten zu 60.2% die Zufriedenheit mit Peers.

Insgesamt zeigten unsere Befunde, dass die Persönlichkeit auch bei Jugendlichen eine wichtige Determinante des SWBs ist. Wir konnten verdeutlichen, dass domänenspezifische Selbstkonzeptfacetten nicht nur inkrementell das entsprechende bereichsspezifische SWB prädizierten, sondern mitunter mehr Varianz im SWB erklärten als Persönlichkeitsmerkmale. Auch bei der Lebenszufriedenheit scheint die Kontextualisierung eine große Rolle für die Validität des Selbstkonzepts zu spielen (Kretzschmar et al., 2018).

Poster

Adaptivität im Kontext des selbstregulierten Lernens

Tabea Daria Eberli, Yves Karlen

Universität Zürich, Schweiz

Selbstreguliertes Lernen beschreibt die Schüler*innen als aktive Lernende ihres eigenen Lernprozesses, den sie durch den Einsatz von Lernstrategien überwachen und regulieren, um die gewünschten Ziele zu erreichen (Zimmerman, 2002). Die bisherige Forschung hat gezeigt, dass Lernende Schwierigkeiten im SRL haben und individuelle Unterschiede in den Fähigkeitsausprägungen im SRL vorhanden sind (z.B. Heirweg et al., 2019; Karlen, 2016). Während selbstregulierte Lernende von mehr Autonomie profitieren können, sind Lernende mit geringen SRL-Kompetenzen stärker auf die Unterstützung der Lehrperson angewiesen. Dies bedingt jedoch, dass die Lehrpersonen die Fähigkeiten ihrer Lernenden im Bereich des SRL kennen und wissen, wie sie ihren Unterricht adaptiv an den individuellen Voraussetzungen anpassen können (Corno, 2001). Eine individuelle und adaptive Unterstützung setzt voraus, dass die Lehrperson die individuellen Kompetenzunterschiede ihrer Schüler*innen wahrnimmt und über instruktionale Strategien verfügt, um auf diese reagieren zu können (Dumont & Ready, 2023; Corno 2008). Aktuelle Modelle zu den professionellen Kompetenzen von Lehrkräften im Bereich des SRL (z.B. Karlen et al., 2020) heben die Bedeutung der adaptiven Kompetenz hervor. Lehrkräfte sollen die Förderung von SRL an die individuellen Voraussetzungen und Möglichkeiten der Lernenden anpassen und während der Förderung die Entwicklung von SRL durch gezieltes Scaffolding unterstützen. Bisher wurden die Forschungsbereiche zur Adaptivität und zum SRL kaum miteinander verbunden. Es fehlen insbesondere Studien, die untersuchen, inwiefern Lehrkräfte adaptive Unterstützungsmassnahmen im Kontext des SRL berücksichtigen.

Basierend auf diesen Forschungsdesiderata sollen in diesem Beitrag das Konzept der Adaptivität und das SRL miteinander verknüpft werden. Ziel ist es, zu untersuchen, welche adaptiven Strategien bei der Förderung von SRL eingesetzt werden. Die folgenden Forschungsfragen werden untersucht:

Inwieweit sind sich die Lehrpersonen der individuellen Fähigkeiten ihrer Lernenden im Bereich des SRL bewusst und wie setzen sie dieses Wissen in ihrem Unterricht um?
Welche adaptiven Strategien setzen die Lehrkräfte bei der Förderung von SRL ein?
Inwiefern haben das Wissen, die Überzeugung, die Motivation und die eigenen SRL-Kompetenzen einen Einfluss auf den Einsatz adaptiver Strategien?

Zur Beantwortung der Fragestellungen werden sowohl quantitative als auch qualitative Daten verwendet, welche im Rahmen einer längsschnittlichen Interventionsstudie zur Förderung der professionellen Kompetenzen der Lehrpersonen im SRL erfasst wurden. Insgesamt N=54 Lehrpersonen sowie deren N= 1012 Schüler*innen nahmen an der Interventionsstudie teil. In einer Follow-up-Messung wurden N = 26 Lehrkräfte 7 bis 9 Monate nach der einjährigen Intervention zur Förderung des SRL im Unterricht befragt. Der Interviewkatalog enthielt Fragen zur Adaptivität und zur Diagnose des Lernprozesses der Schüler*innen. Die qualitative Inhaltsanalyse der Interviews gibt Aufschluss darüber, welche adaptiven Strategien die Lehrpersonen bei der Förderung von SRL verwenden, welche Methoden sie als nützlich empfinden und weshalb. Auf der Grundlage der quantitativen Daten (verschiedene Skalen zum professionellen Wissen, den Überzeugungen, der Motivation und den eigenen SRL-Kompetenzen der Lehrkräfte) zielt diese Studie darauf ab, zu verstehen, welche Lehrpersonen den Einsatz von adaptiven Strategien verwenden. Die Ergebnisse dieser multimethodischen Studie werden derzeit ausgewertet und können auf der GEBF vorgestellt werden.

Poster

Förderung der professionellen Wahrnehmung technologiegestützten Unterrichts: Ist das Lernen mit Lösungsbeispielen im Fadingverfahren wirksam?

Christina Wekerle, Eva Kaistra, Johanna Dufter, Ingo Kollar

Universität Augsburg, Deutschland

Theoretischer Hintergrund

Um die Vorteile digitaler Technologien für die Unterstützung der Lernprozesse von Schüler*innen zu nutzen, ist es notwendig, dass angehende Lehrkräfte eine professionelle (Unterrichts-)Wahrnehmung entwickeln. Diese umfasst die Fähigkeit, relevante Situationen im technologiegestützten Unterricht auf der Grundlage empirischer Erkenntnisse zu erkennen (Noticing), zu erklären und alternative Handlungsmöglichkeiten zu identifizieren (Knowledge-Based Reasoning; van Es, 2011). Jedoch begegnen Lehramtsstudierende hierbei häufig Schwierigkeiten. Eine bereits bewährte Methode zur Förderung professioneller Wahrnehmung ist das fallbasierte Lernen, das sich insbesondere dann als effektiv erweist, wenn den Lernenden Lösungsbeispiele zur Verfügung gestellt werden (Renkl, 2011). Hierbei kann Fading, das schrittweise Ausblenden von Lösungsschritten, den Übergang vom Lernen mit Lösungsbeispielen zu eigenständigem Problemlösen erleichtern (Klopp & Stark, 2018).

In der vorliegenden Studie wurde untersucht, wie sich das Fading von Lösungsbeispielen im Vergleich zu vollständigen Lösungsbeispielen und selbstständigem Problemlösen auf das Noticing und Reasoning über technologiegestützte Unterrichtssituationen von Lehramtsstudierenden auswirkt.

Methode

Im Pretest sollten 224 Lehramtsstudierende (M_age= 22.12, SD = 3.28; 79% weiblich) auf Basis einer Beschreibung einer technologiegestützten Unterrichtsstunde (Fallvignette) ein Unterrichtsproblem offen analysieren. Drei darauffolgende Fallvignetten wurden von den Studierenden entweder analysiert (Problemlösen, N = 72), sie erhielten vollständige Lösungsbeispiele zu den Fallvignetten (Lösungsbeispiele ohne Fading, N = 74) oder erhielten Lösungsbeispiele, bei denen zunehmend mehr Schritte selbst ausgeführt werden mussten. Im Posttest analysierten die Studierenden drei Probleme der Pretestvignette. Zwei unabhängige Coder erreichten für das Noticing (Cohen’s k = .88), die Verwendung von Theorie (Cohen’s k = .86) sowie die Angemessenheit der Theorieverwendung (Cohen’s k = .85) beim Reasoning im Pre- und Posttest jeweils eine gute Übereinstimmung.

Ergebnisse

Bezüglich des Noticing zeigte sich ein signifikanter, großer Effekt der Bedingung, F(2,220) = 33.90, p < .001, partielles η² = .236. Studierende der beiden Lösungsbeispielbedingungen schnitten beim Noticing besser ab als Studierende der Problemlösebedingung, p < .001, unterschieden sich jedoch nicht voneinander, p > .05. Die Häufigkeit der Verwendung von Theorie unterschied sich nicht signifikant zwischen den Bedingungen, F(2,220) = .74, p > .05. Jedoch konnte ein signifikanter, großer Effekt für die Angemessenheit der Theorieverwendung festgestellt werden, F(2,166) = 12.71, p < .001, partielles η² = .19. Studierende der beiden Lösungsbeispielbedingungen zeigten eine größere Angemessenheit ihrer Theorieverwendung als die der Problemlösebedingung, p < .05. Außerdem waren Studierende der vollständigen Lösungsbeispielbedingung Studierenden der Lösungsbeispielbedingung mit Fading überraschenderweise überlegen, p = .02.

Diskussion

Während die Ergebnisse illustrieren, dass die Studierenden, die Lösungsbeispiele erhielten, besser in der Lage waren, relevante Situationen zu erkennen und wissenschaftliche Quellen angemessen zur Interpretation zu verwenden, ergaben sich keine zusätzlichen Vorteile durch das Fading. Eine mögliche Erklärung könnte sein, dass die Studierenden nicht genug Expertise besaßen, um von dem Fading zu profitieren. Diese Annahme konnte mithilfe einer explorativen Analyse der von den Studierenden selbst bearbeiteten Schritte während der Intervention geprüft werden. 63% der Studierenden zeigten zu Beginn der Fadingphase noch keine ideale Analyse. Es werden entsprechende Konsequenzen für Folgestudien gezogen.

Poster

Misserfolgsattributionen von Lehramtsstudierenden und ihre emotionalen und kognitiven Korrelate als Ausgangspunkt musikpädagogischer Forschung

Daniel Fiedler¹, Anne C. Frenzel², Johannes Hasselhorn¹, Marina E. Pfeifer²

¹Friedrich-Alexander-Universität Erlangen-Nürnberg, Deutschland; ²Ludwig-Maximilians-Universität München

Theoretischer Hintergrund

Die Attributionstheorie (Heider, 1958) beschreibt, wie Individuen Informationen nutzen, um kausale Erklärungen für Verhaltensweisen von Menschen vorzunehmen, wobei diese Erklärungen entweder internal oder external attribuiert werden. Weiner (1985, 1994) erweiterte diese Theorie für die Wirkung von Attributionen auf Emotionen und detaillierte, welche Attributionskonstellationen (internal/external, stabil/variabel, kontrollierbar/unkontrollierbar) emotional günstig bzw. ungünstig sein sollten. Basierend auf Weiners Annahmen und Frenzels (2014) Modell von Unterrichts- bzw. Lehrer*innenemotionen konzipierten wir Vignetten zu vier möglichen Misserfolgen (Motivation, Leistung, Disziplin und Beziehung mit Schüler*innen) beim Unterrichten im Allgemeinen und des Faches Musik im Speziellen.

Ziele der Studie

Ziel der ersten Studie war es, die Funktionalität dieser Vignetten bei Lehramtsstudierenden aller Fächer und Schularten zu überprüfen und Zusammenhänge mit Lehrer*innenemotionen sowie kognitiven Konstrukten wie Reflexionsbereitschaft und Selbstwirksamkeit zu analysieren. Ziel der zweiten Studie ist es, zu überprüfen, ob die von uns konstruierten Vignetten musikunterrichtsspezifisch übertragen und bei Lehramtsstudierenden des Faches Musik aller Schularten reliabel angewandt werden können.

Methodisches Vorgehen & Ergebnisse

Die Stichprobe von Studie 1 umfasste 440 Lehramtsstudierenden der LMU München (84.9% weiblich, 14.9% männlich, 0.2% nicht-binär, M_Alter = 22.9 Jahre, SD_Alter = 4.06), die einen Online-Fragebogen ausfüllten. In den Attributionsvignetten wurden jeweils allgemeine Misserfolgsszenarien dargestellt, deren Verursachung entlang von emotional günstigen bis hin zu ungünstigen Attributionspolen beurteilt wurden. Daneben erfassten wir Lehrer*innenemotionen (Teacher Emotions Scale, Frenzel et al., 2016), Reflexion (Kunter at al., 2017) und Selbstwirksamkeit (Norwegian Teacher Self-Efficacay Scale, Skaalvik & Skaalvik, 2007) in den Dimensionen Unterrichten, Motivieren, mit Eltern/Kolleg*innen kooperieren, mit Problemen umgehen, Unterricht an Bedürfnisse anpassen und Disziplin wahren. Die Ergebnisse zeigten, dass das allgemeine Attributionsverhalten reliabel erfasst werden kann (a = .78; w = .78; Cronbach, 1951; McDonald, 1999). Entsprechend der Theorie gehen höhere Attributionswerte, d.h. internale, variable und kontrollierbare Zuschreibungen, mit einer erhöhten Reflexionsbereitschaft (r = .24, p < .001), mit höherer Selbstwirksamkeit in allen sechs NTSES-Dimensionen (r zwischen .09 und .17, p < .05) und mit mehr Freude (r = .21, p < .001), weniger Wut (r = -.26, p < .001) sowie weniger Angst (r = -.15, p < .001) beim Unterrichten einher.

Basierend auf diesen Vignetten, wurden für Studie 2 Vignetten konstruiert, die musikunterrichtspezifische Misserfolgssituationen beschreiben (u.a. Liedeinstudierung, Klassenmusizieren etc.) und bislang 30 Lehramtsstudierende des Faches Musik befragt. Wir gehen basierend auf Studie 1 davon aus, dass wir aufgezeigten Zusammenhänge zwischen den Attributionstendenzen von Lehramtsstudierenden mit Reflexionsbereitschaft, Selbstwirksamkeit und Lehrer*innenemotionen auch in Studie 2 abbilden können. Außerdem gehen wir davon aus, dass die korrelativen Effektstärken der beiden Studien nahezu identisch sein werden.

Diskussion

Die Ergebnisse unserer Studien können einen Hinweis dafür liefern, dass die von uns entwickelten Vignetten ein kontextspezifisches reliables Maß für emotionsgünstige Attributionen von Misserfolgsszenarien darstellen und zur Untersuchung von musikunterrichtsspezifischen Situationen eingesetzt werden können. Darüber hinaus können auf der Grundlage weiterer Forschung allgemeine und musikunterrichtsspezifische Videovignetten entwickelt werden, um u.a. (Musik-)Lehramtsstudierende auf die Herausforderungen im Berufsfeld praxisorientiert und in Bezug auf emotionsgünstige Attributionen vorzubereiten.

Poster

Impulse für die Weiterentwicklung von Schule und Unterricht durch (die Arbeit mit Ergebnissen aus) Vergleichsarbeiten in Grund- und Sekundarschulen

Ilona Weyrauch^1,2, Franziska Wick^1,2, Michael Zimmer-Müller², Ingmar Hosenfeld², Josef Strasser^1,2

¹Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau, Campus Landau, Deutschland; ²Zentrum für Empirische Pädagogische Forschung (zepf), RPTU, Campus Landau

Ausgangslage

Es liegen zahlreiche quantitative Daten vor, die belegen, dass Vergleichsarbeiten nicht in dem Maße zur Schul- und Unterrichtsentwicklung genutzt werden, wie sie genutzt werden könnten (Wagner et al., 2019, Ophoff, 2013, Ophoff et al. 2019). Die erwünschten Wirkungen bleiben eher aus. Gleichzeitig wird gerade auf VERA-Tagungen immer wieder von einzelnen Schulen berichtet, die sehr wohl mit Ergebnissen aus VERA weiterarbeiten und dabei individuelle Wege gefunden haben. Was diese Schulen konkret machen und in welcher Hinsicht sie in welcher Weise mit den Ergebnissen weiterarbeiten, wurde bislang nicht näher untersucht. Diesem Defizit sollte mit der vorliegenden Studie abgeholfen werden.

Fragestellung

Ziel der Studie war es herauszufinden, welche konkreten Praktiken und Vorgehensweisen der Weiterarbeit mit VERA sich an Schulen finden und was diese selbst von einer solchen Weiterarbeit berichten. Dabei sollen zudem Faktoren aufgespürt werden, die förderlich für eine Weiterarbeit mit VERA-Ergebnissen sind oder sich als hinderlich erweisen. Im Einzelnen wurden Fragen nachgegangen, wie an den Schulen mit VERA-Ergebnissen umgegangen wird, ob VERA bzw. VERA-Ergebnisse in den schulischen Jahresablauf integriert werden, wer an den Schulen mit diesen Ergebnissen weiterarbeitet und ob dadurch Schul- und Unterrichtsentwicklung vorangebracht werden.

Methode

Um ein möglichst weites Spektrum an konkreten Praktiken so wie die jeweilige Perspektive der Handelnden offen zu erfassen, kamen qualitative Expert:inneninterviews zum Einsatz. Da es an den Schulen mehrere Akteur:innen gibt, die in unterschiedlichem Maß mit den Vergleichsarbeiten betraut sind, scheint ein mehrperspektivischer Blick sinnvoll zu sein. Deshalb wurden sowohl Schulleitungen wie auch Lehrkräfte, die an ihren Schulen mit VERA arbeiten bzw. weiterarbeiten, befragt. Die Mehrperspektive sollte erfasst werden, indem von jeder Schule die Schulleitung und eine weitere Lehrkraft befragt wird.

Der Interview-Leitfaden beinhaltete zunächst Fragen, die sich mit dem Umgang von VERA-Daten befassten und nach dem ‚allgemeinen Procedere‘ fragten, wie VERA an der Schule organisiert wird.

An der Studie nahmen 26 Schulen aus mehreren Bundesländern teil. Überwiegend wurden Schulleitungen und Lehrkräfte mit speziellen Aufgaben befragt. Die Interviews wurden via Zoom geführt, wobei nur Audio-Aufnahmen angefertigt, die anschließend transkribiert wurden.

Die Daten wurden inhaltsanalytisch ausgewertet. Für die erste Kodierung wurde ein deduktiver Ansatz gewählt. Dabei wurde neben Hintergrundvariablen zur interviewten Person erfasst, wie Verantwortlichkeiten verteilt sind, wer an der Schule die VERA-Ergebnisse in den Blick nimmt und ob Handlungsideen entwickelt und umgesetzt werden. Als weitere Kategorien waren ‚Wünsche‘ und ‚Kritik‘ und ob in der Anwendung von VERA eine Nützlichkeit gesehen wird.

Die Intercoder-Reliabilität betrug 𝛋=.64. Für die Feinkodierung wurde eine induktive Vorgehensweise in Anlehnung an Kuckartz gewählt (Rädiger & Kuckartz, 2019).

Ergebnisse

Es wurden unterschiedliche Praktiken und Vorgehensweisen im Umgang mit VERA-Ergebnissen an den Schulen festgestellt, die die Weiterarbeit mit den Ergebnissen beeinflussen. Diese lassen sich grob zwei Kategorien zuordnen. Bei der ersten Vorgehensweise verbleiben die VERA-Ergebnisse bei der Lehrkraft. Es bleibt also der einzelnen Lehrkraft überlassen, inwieweit sie damit weiterarbeitet. Es werden Gründe für schlechte VERA-Ergebnisse und auch für ein Nicht-Handeln genannt.

Bei der zweiten Vorgehensweise wird von einer gemeinsamen Weiterarbeit im Kollegium berichtet. An diesen Schulen werden in der Regel mehrere Verfahren des Monitoring genutzt, um zum einen Schulentwicklung voranzubringen und zum anderen als diagnostische Maßnahme den Bildungsverlauf der Schüler:innen positiv zu beeinflussen.

Diskussion

Nach der bisherigen Auswertung der Ergebnisse kann vermutet werden, dass, wenn VERA als ‚angeordnete Maßnahme‘ verstanden wird, die VERA-Ergebnisse auf Lehrkraft-Ebene verbleiben. Es werden Gründe angeführt, warum diese Ergebnisse nicht als zufriedenstellend angesehen werden. Wenn VERA als Schulentwicklungstool verstanden wird, sind die Schulleitung in der Lage, die Ergebnisse zu interpretieren und Maßnahmen zu ergreifen. Der Umgang mit den Ergebnissen wird als integraler Bestandteil der Schulentwicklung gesehen.

Die Annahme ist, dass die verschiedenen Vorgehensweisen auf unterschiedlichen Haltungen und Überzeugungen beruhen, was noch näher untersucht werden müsste.

Poster

Partizipation und individuelle kognitive Aktivierung - Digital Storytelling in inklusiven Grundschulklassen

Henrik Frisch, Julia Warmdt, Christoph Ratz, Sanna Pohlmann-Rother

JMU Würzburg, Deutschland

Theorie und Fragestellungen

Normativ wird der Anspruch formuliert, Unterricht qualitativ hochwertig zu gestalten. Wie dies vor dem Hintergrund aktueller gesellschaftlicher Entwicklungen gelingen kann, ist weitgehend unerforscht (Begrich et al., 2023). Im Fokus des Beitrags stehen die differenziellen Effekte der Unterrichtsqualitätsforschung in einer Kultur der Digitalität und mit dem Anspruch allen Kindern in inklusiven Gruppen gemeinsame Lerngelegenheiten zu ermöglichen. Dabei wird einerseits die individuelle kognitive Aktivierung sowie andererseits die inhaltliche Partizipation der Schüler:innen mit Schwerpunkt Geistige Entwicklung am Digital Storytelling fokussiert.

Forschungen zum digitalgestützten (Quast, Rubach & Lazarides, 2021) sowie zum inklusiven Unterricht (Bohl, Budde & Rieger-Ladich, 2017) nehmen Bezug auf die klassische Unterrichtsqualitätsforschung und damit einhergehend auf die kognitive Aktivierung. In einem kognitiv aktivierenden Unterricht sollen alle Lernenden entsprechend ihrer individuellen Lernvoraussetzungen zur Auseinandersetzung mit anspruchsvollen Aufgaben angeregt werden, die Verstehen und Schlussfolgern fördern (Grünkorn & Klieme, 2020). In einem inklusiven Unterricht mit einer großen Heterogenität an Lernausgangslagen wird davon ausgegangen, dass die (digitalen) Aufgabenstellungen bzw. Handlungen der Lehrkraft und Mitschüler:innen individuell verschieden kognitiv aktivierend erlebt werden (Rieser & Decristan, 2023). Im Rahmen der Dissertation wird der Frage nachgegangen, welche Lehr- und Lernsituationen im digitalgestützten und inklusiven Unterricht als individuell kognitiv aktivierend beschrieben werden können?
In diesem Beitrag liegt der Fokus auf der inhaltlichen Dimension der Partizipation. Diese wird als aktive Teilhabe an gemeinsamen Lernprozessen und dem Gemeinsamen Gegenstand verstanden. Schüler:innen mit Schwerpunkt Geistige Entwicklung sind bezüglich der Partizipation an inklusivem Unterricht eine besonders gefährdete Schülergruppe (Hellmich et al., 2017). Gleichzeitig gilt die Partizipation aber auch als Grundbedingung für Inklusion (Schwab, 2018) und aus sonderpädagogischer Perspektive als Grundlage für alle weiteren Diskussionen über Unterrichtsqualität (Heimlich, 2018). Es stellt sich somit die Frage, wie Schüler:innen mit Schwerpunkt Geistige Entwicklung an Inhalten des digital-inklusiven Unterrichts partizipieren.

Digitalgestützter und inklusiver Unterricht kann zu einer Vielzahl an Konzepten gestaltet werden, wie beispielsweise zum Digital Storytelling. Im Rahmen des Digital Storytellings kann die gemeinsame literarische Geschichte durch die vielfältigen, multimodalen Ausdrucksmöglichkeiten auf verschiedenen Leistungsniveaus weitererzählt werden (Warmdt et al., 2023).

Methodisches Vorgehen

In acht inklusiven, ersten und zweiten Partnerklassen wurde eine Projektwoche zum „Digital Storytelling mit Hund Milo“ (Warmdt & Frisch, 2023) aus drei Perspektiven videografiert. Die aufbereiteten und transkribierten Videodaten wurden mittels qualitativer Inhaltsanalyse mit Fokus auf die individuelle kognitive Aktivierung und die inhaltliche Partizipation ausgewertet (Kuckartz & Rädiker, 2022).

Auswertungsergebnisse und Diskussion

Erste Ergebnisse weisen darauf hin, dass die Erst- und Zweitklässler:innen in unterschiedlichen Momenten zum Digital Storytelling individuell kognitiv aktiviert sein können, wie beispielsweise bei der Entwicklung einer eigenen Idee zum Fortverlauf der Geschichte. In der Arbeitsphase zum Digital Storytelling wird von den Schüler:innen in der Summe 130 Mal eine eigene Idee generiert. Dabei entwickeln die Schüler:innen mehr als dreimal so häufig eine Idee mithilfe der enaktiven Figuren (N = 84), als eine eigene Idee zu formulieren (N = 24) bzw. hierzu überlegen (N = 22). An der Ideenentwicklung beteiligen sich sowohl Schüler:innen mit Schwerpunkt Geistige Entwicklung, als auch Grundschüler:innen - wobei innerhalb der Schüler:innengruppe eine große Heterogenität erkennbar ist. Während beispielsweise sieben Schüler:innen keine Ideen entwickeln, generiert ein Schüler mit Schwerpunkt Geistige Entwicklung 19 Ideen zum Fortverlauf der Geschichte.

Bezüglich der Partizipation der Schüler:innen mit Schwerpunkt Geistige Entwicklung am Digital Storytelling weisen erste Ergebnisse auf eine in zentralen Aspekten des Lernprozesses eingeschränkte Partizipation hin: Obwohl Schüler:innen mit Schwerpunkt Geistige Entwicklung literarische Ideen einbringen und ausgestalten, werden diese von ihren Mitschüler:innen nur selten aufgenommen und finden sich kaum in den Endprodukten des Digital Storytelling. Darüber hinaus nutzen Schüler:innen mit Schwerpunkt Geistige Entwicklung das iPad beim Digital Storytelling deutlich weniger als ihre Mitschüler:innen ohne sonderpädagogischen Schwerpunkt.

Die ersten Ergebnisse sollen im Rahmen der Posterpräsentation diskutiert werden.

Poster

Ein heuristisches Rahmenmodell für videobasierte Lehr-Lernszenarien in der Hochschullehre

Katharina Sophie Heiler, Christina Wekerle, Alena Bischoff, Moritz Schweiger, Kristina Peuschel, Kerstin Proske, Birgit Weckerle, Lisa Vettermann, Ann-Kathrin Schindler

Universität Augsburg, Deutschland

Theoretischer Hintergrund

Professionelle Wahrnehmung ist eine situationsspezifische Fähigkeit, die für jeden spezifischen beruflichen Kontext erlernt werden muss (Blömeke et al., 2015; Goodwin, 1994). Sie setzt sich aus den Komponenten noticing (wissensbasierte Identifikation von Schlüsselelementen) und knowledge-based reasoning (Verarbeitung wahrgenommener Aspekte) zusammen (Seidel & Stürmer, 2014). Zur Förderung professioneller Wahrnehmung eignen sich insbesondere Videos, die authentische Situationen aus verschiedenen Berufsfeldern zeigen, um die Kluft zwischen Hochschulbildung und Berufspraxis zu überbrücken (Stokking et al., 2003). Der entscheidende Aspekt bei der Videonutzung ist jedoch nicht das Video selbst, sondern wie es genutzt wird (Blomberg et al., 2013). Hier mangelt es an Rahmenmodellen, die vorhandenes empirisches und praktisches Wissen integrieren, um Hochschullehrende bei der Planung, Umsetzung, Evaluierung und Verbreitung videobasierter Lehr-Lernszenarien anzuleiten.

Ziel dieses Beitrags war, ein Rahmenmodell zu entwickeln, das (1) für videobasiertes Lehren und Lernen relevante, aber bisher separierte pädagogisch-psychologische Forschungsstränge integriert und (2) eine leicht zugängliche Heuristik für Akteure verschiedener Fachdisziplinen bietet, die einen strukturierten Ansatz für videobasierte Lehre und Forschung suchen.

Methode

Das Rahmenmodell wurde in einem iterativen deduktiv-induktiven Prozess in interdisziplinären Gruppendiskussionen mit Mitgliedern aus vier verschiedenen Fachdisziplinen entwickelt. Zunächst wurden Annahmen über relevante Akteure und Prozesse aus der Literatur abgeleitet (deduktiv), die den Kern des Rahmenmodells bildeten. Es wurde Forschung zu professioneller Wahrnehmung (Seidel & Stürmer, 2014), technologisch-pädagogischem Fachwissen (TPACK; Koehler et al., 2014; Koehler & Mishra, 2009) und hochwertigen Lernaktivitäten (ICAP; Chi & Wylie, 2014) berücksichtigt. Anschließend wurde das Modell in Lehrveranstaltungen der vier Disziplinen erprobt und auf Grundlage praktischer Felderfahrungen induktiv angepasst. Diese Iterationen wurden wiederholt, bis sich das Rahmenmodell als anwendbar für alle vier Fachdisziplinen erwies.

Ergebnisse

Im vorliegenden Rahmenmodell ist die Entwicklung professioneller Wahrnehmung durch videobasierte Lehr-Lernszenarien das zentrale Anliegen. Es werden verschiedene Stakeholder definiert, die am Prozess beteiligt sind, darunter Hochschullehrende, Feldexpert*innen und Studierende. Während Hochschullehrende dafür verantwortlich sind, durch hochwertige Lehr-Lernaktivitäten eine adäquate Förderumgebung zu schaffen (Kollar & Fischer, 2019), können Berufsfeldexpert*innen Hochschullehrenden authentische Einblicke ins Berufsfeld vermitteln und bei der Festlegung von Indikatoren für professionelle Wahrnehmung unterstützen (Gegenfurtner & Seppänen, 2013). Die Teilnahme von Studierenden an der Entwicklung der Videoszenarien kann mit großen Lernpotenzialen einhergehen (Koehler et al., 2004). Basierend auf Angebots-Nutzen-Modellen (Sailer et al., 2021), wird die Implementierung von Lehr-Lernszenarien in vier Phasen unterteilt: (Re-)Design, Lehren, Evaluieren und Teilen. Während des Designs werden relevante Inhalte identifiziert, Lernziele festgelegt und Videos ausgewählt oder erstellt (Blomberg et al., 2013). Beim Lehren können basierend auf dem ICAP-Modell (Chi & Wylie, 2014) vier unterschiedlich hochwertige Lernaktivitätsmodi bei Studierenden angeregt werden. Während die passive Auseinandersetzung mit einem Video (d.h. Anschauen) mit wenig Potenzialen zur Entwicklung von professioneller Wahrnehmung einhergeht, kann die aktive (z.B. Beantworten von MC-Fragen), gefolgt von der konstruktiven (z.B. Videoanalyse basierend auf Prompts) und interaktiven Auseinandersetzung (z.B. Diskussion in Kleingruppen basierend auf Prompts) den Lernerfolg zunehmend positiv beeinflussen. In der Evaluationsphase kann die Entwicklung professioneller Wahrnehmung mithilfe von standardisierten Fragebögen (Seidel & Stürmer, 2014), Feedbackrunden und Beobachtungsprotokollen (Chi et al., 2018) bewertet werden. Schließlich erfolgt in der Teilen-Phase die strukturierte Beschreibung und Verbreitung der Lehr-Lernszenarien unter Hochschullehrer*innen und -institutionen durch Konferenzen, Publikationen und OER-Plattformen (z.B. OER Commons). Zur Umsetzung dieser Phasen ist zentral, dass die Stakeholder, insbesondere Hochschullehrende, über relevantes Fachwissen, pädagogisches Wissen, technologisches Wissen und integrierte Wissensfacetten (d.h. technologisch-pädagogischem Fachwissen) verfügen. Um den interdisziplinären Charakter des Rahmenmodells zu verdeutlichen, werden Beispiele aus vier verschiedenen Disziplinen vorgestellt.

Diskussion

Das Rahmenmodell kann durch die Integration dreier zentraler Forschungsstränge einen umfassenden Leitfaden für die videobasierten Hochschullehre in verschiedenen Disziplinen bieten. Auch wenn das Modell aktuell nur als theoretisches Konstrukt existiert, bewährte es sich bei der Umsetzung einzelner Lehr-Lernszenarien. Dennoch steht eine systematische experimentelle Forschung zur Umsetzung der einzelnen Phasen aus.

Poster

Entwicklung einer Wissenslandkarte als Ausgangspunkt von Unterrichtsplanung

Marcus Schiolko, Mathias Ropohl

Universität Duisburg-Essen, Deutschland

Theoretischer Hintergrund und Fragestellung

Bisherige Studien zur professionellen Kompetenz von angehenden Lehrkräften haben sich hauptsächlich auf die Unterrichtsdurchführung konzentriert, während die Unterrichtsplanung von angehenden Lehrkräfte in der empirischen Bildungsforschung bisher weniger betont wurde (König & Rothland, 2022; Wernke & Zierer, 2017). Trotzdem hat Unterrichtsplanung durch die gedankliche Antizipation des durchzuführenden Unterrichts eine große Einflussnahme auf die Unterrichtsqualität und den -erfolg (Tebrügge, 2001; Wengert, 1989). Daher ist das Planen von Unterricht bereits im Studium Teil des Curriculums (KMK, 2004, 2019).

Angehenden Lehrkräften gelingt es selten im Planungsprozess Verknüpfungen zwischen den verschiedenen Planungsentscheidungen und damit inhaltliche Kohärenz herzustellen (Gassmann, 2013). Die Planungen zeichnen sich durch lineare nicht zusammenhängende Planungsentscheidungen aus (Westerman, 1991). In Bezug auf den Fachinhalt zeigt sich in den Unterrichtsplanungen, dass die zentralen Ideen bzw. Konzepte eines Themas selten mit anderen zentralen Ideen verknüpft werden (Park & Chen, 2012), weil in der Sicherungsphase der Fokus auf eine Fixierung der erarbeiteten Ideen und Konzepten liegt (Beyer & Davis, 2012; Weitzel & Blank, 2020).

Für den amerikanischen Raum wurden visuelle Repräsentationen fachinhaltlicher Konzepte, sogenannte Wissenslandkarten, entworfen. Diese ermöglichen eine visuelle Darstellung zum sachlogischen Aufbau von Konzepten sowie deren Weiterentwicklung und Fortführung. Ziel ist es, Lehrkräfte beim Verständnis von grundlegenden naturwissenschaftlichen Konzepten zu stärken, Verknüpfungen zu verdeutlichen, das benötigte Vorwissen der Lernenden abzuleiten und vorauszublicken, welches Wissen prospektiv thematisiert wird (AAAS, 2001, 2007). Die Wissenslandkarten aus dem amerikanischen Raum sind allerdings zu inkonsistent zu den nationalen Bildungsstandards (KMK, 2020), lassen sich aber für den deutschsprachigen Raum adaptieren, da die Bildungsziele der naturwissenschaftlichen Fächer anhand von einzelnen Basiskonzepten organisiert werden (Celik, 2022, Demuth et al., 2005). Wissenslandkarten bieten somit als Werkzeug in der Lehrkräftebildung das noch ungenutzte Potential die Unterrichtsplanung von angehenden Lehrkräften vorzuentlasten, indem sie mithilfe der Wissenslandkarte im Planungsprozess qualifiziert werden, sowohl einzelne Planungsentscheidungen als auch Fachinhalte zu verknüpfen. Daher bedarf es zunächst der validen Erstellung einer Wissenslandkarte, die dann als Werkzeug in der Unterrichtsplanung eingesetzt werden kann. Vor diesem Hintergrund lautet die Forschungsfrage, inwiefern wird die Darstellung eines naturwissenschaftlichen Basiskonzepts mithilfe einer Wissenslandkarte von Expert:innen als valide eingeschätzt.

Methode

Aufbauend auf einer Literaturrecherche und der Erstellung einer Wissenslandkarte wurde eine schriftliche anonyme online Experten:innenbefragung (N = 13) durchgeführt. Die Expertengruppe setzte sich aus Professoren:innen, Fachleiter:innen und Lehrkräften mit mehrjähriger Berufserfahrung zusammen. Für den quantitativen Ansatz wurde zum einen das Übereinstimmungsmaß Fleiss-Kappa für die Antworten der Expert:innen herangezogen und zum anderen zur Beurteilung der Güte eine Grenzwertbestimmung durchgeführt. Die qualitative Auswertung der schriftlichen Rückmeldungen erfolgte mittels qualitativer Inhaltsanalyse. Das Kategoriensystem für die inhaltliche Analyse wurde in einem induktiven Verfahren erstellt. Als Übereinstimmungsmaß für die Kodierung wird die Interrater-Reliabilität Cohens Kappa (κ) herangezogen.

Ergebnisse und Diskussion

Die berechneten Fleiss-Kappa-Werte über alle Antworten waren sowohl für die Gesamtstichprobe (κ = .06) als auch für die einzelnen Expertengruppen (-.03 ≤ κ ≤ .14) gering bis mangelhaft und damit nicht zufriedenstellend. Dies ist mit Blick auf die Forschungsfrage allerdings kein Indiz für keine Validität. Die berechneten Kappa-Werte zur Überprüfung der Interrater-Reliabilität zur inhaltlichen Analyse (.78 ≤ κ ≤ .98) weisen zufriedenstellende Ergebnisse auf. Ferner zeigen die qualitativen Rückmeldungen zur Eignung der Fachinhalte für das Basiskonzept eine hohe Akzeptanz, da hauptsächlich einzelne Begrifflichkeiten oder Formulierungen von den Expert:innen angemerkt wurden. Insbesondere erscheinen die Verknüpfungen zwischen den einzelnen Fachinhalten unterschiedlichen Vorstellungen zu unterliegen und ein Konsens über viele Expert:innen hinweg sich daher als schwierig zu gestalten. Dennoch zeigen die Rückmeldungen des Expertenratings, dass sich die curricularen Vorgaben für ein naturwissenschaftliches Basiskonzept mithilfe einer Wissenslandkarte mit gewissen Einschränkungen abbilden lassen. Im Folgenden wird die Wissenslandkarte mit passenden digitalen Lehr-Lern-Materialen erweitert. Dieses kombinierte Angebot wird in einer Interventionsstudie eingesetzt, um zu überprüfen, ob die schriftlichen Planungen kohärenter werden.

Poster

Was und wie lernen japanischen Lehrkräfte mithilfe der Lesson Study Methode?

Julian Bucher, Klara Kager, Miriam Vock

Universität Potsdam, Deutschland

Theoretischer Hintergrund

Kurzgesagt geht es bei einer Lesson Study darum einen gemeinsam geplanten Unterricht im Team zu beobachten, zu analysieren und anschließend diesen Unterricht ausgehend von den Bedürfnissen der Schülerinnen und Schüler zu reflektieren und weiterzuentwickeln (Lewis et al., 2019). Dieser ursprünglich aus Japan stammende Ansatz der Lehrkräfteweiterbildung hat sich nicht zu Letzt auf Grund Japans guten Ergebnissen bei TIMSS (1995) und PISA (2000), seit den 2000er-Jahren weltweit verbreitet (Kim et al., 2021). Dabei wurde stets auch versucht Lesson Study an die Gegebenheiten vor Ort anzupassen und lokale Besonderheiten zu berücksichtigen (Stigler & Hiebert, 2016). Da über die japanische Praxis international jedoch kaum publiziert wird, ist nicht klar, wie stark die Methode bei der Rezeption außerhalb Japans verändert wurde. Als ein zentrales Merkmal von Lesson Study wird in der internationalen Rezeption stets die intensive Zusammenarbeit der Lehrkräfte betont (Lewis et al., 2019; Seleznyov, 2018). Obwohl Lesson Study in Japan seit Jahrzehnten ein fester Bestandteil des Schulsystems ist (Lewis & Perry, 2013), sieht die Mehrheit der japanischen Schulleitungen der TALIS Studie (2018) zufolge dennoch einen Bedarf, die Zusammenarbeit von Lehrkräften zu verbessern (OECD, 2019). Dies führt zu folgenden Fragestellungen:

1) Wie beschreiben japanischen Lehrkräfte die Anwendung der Lesson Study Methode in ihrer Praxis? Inwiefern weichen diese Beschreibungen von der internationalen Rezeption ab?

2) Inwiefern nehmen Lehrkräfte in Japan Lesson Study tatsächlich als einen kooperativen Ansatz zur Weiterentwicklung ihrer eigenen Professionalität wahr?

2) Was und wie lernen sie durch die Anwendung von Lesson Study an ihrer Schule?

Sollte Lesson Study in Schulen bei der eigenen Weiterbildung nur eine untergeordnete Rolle spielen, ist darüber hinaus zu klären, wo und in welcher Form professionelle Weiterbildung und professionelles Lernen stattdessen stattfindet. Dies ist insbesondere vor dem Hintergrund interessant, da äußere strukturelle Rahmenbedingungen (z.B. zeitliche oder personelle Ressourcen) oft als elementar für den Erfolg von Lesson Study angesehen werden (Jakobeit et al., 2021), in Deutschland jedoch häufig nicht gegeben sind.

Methode

Zur Beantwortung dieser Fragestellungen wurden im Sommer 2023 semistrukturierte Interviews mit N = 15 japanischen Lehrkräften geführt. Bei der Zusammenstellung der Stichprobe wurde darauf geachtet, eine möglichst große Spannbreite an Merkmalen (Alter, Geschlecht, Schulart, etc.) abzudecken. Die Datenanalyse wurde in Form einer thematischen Analyse nach Braun und Clarke (2006) durchgeführt. Insbesondere wurden alle Audioaufnahmen transkribiert, in-vivo kodiert, kategorisiert und schließlich Themen zugewiesen wurden. Die Analyse konzentrierte sich dabei auf die Einstellungen, Haltungen und Erfahrungen der Lehrkräfte mit Lesson Study an ihren Schulen einerseits und andererseits auf die von den Lehrkräften beschriebene Situation, in denen sie selbst lernten und die aus ihrer Sicht wichtig für ihre persönliche Entwicklung waren.

Ergebnisse

Es zeigt sich, dass alle befragten Lehrkräfte die Lesson Study Methode als (teilweise) gewinnbringend für ihre persönliche Weiterentwicklung wahrnehmen und dabei insbesondere die Möglichkeit den Unterricht von anderen Lehrkräften zu beobachten schätzen. Allerdings wurde auch deutlich, dass freiwillige Formate außerhalb der eigenen Schule bevorzugt werden und die Lesson Study Aktivitäten in der Schule selbst nicht immer als positiv wahrgenommen werden. Hierbei zeigte sich auch, dass gerade in der Schule selbst häufig kein gemeinsames Planen des Unterrichts stattfindet und die zu behandelten Themen oft von der Schulleitung oder übergeordneten Behörden vorgegeben werden.

Poster

Lernende im Mathematikunterricht kognitiv aktivieren - Erfahrungen mit dem "building thinking classrooms" Ansatz

Felix Kapp¹, Björn Beling², Ulrich Kortenkamp³

¹IPN - Leibniz Institut für die Pädagogik der Naturwissenschaften und Mathematik, Deutschland; ²Goethe Gymnasium Lichterfelde, Berlin; ³Universität Potsdam

Einleitung: Um erkenntnisreiche Lernprozesse im Mathematikunterricht zu initiieren, sind kognitiv anspruchsvolle und gut strukturierte Lernmöglichkeiten erforderlich, welche begleitet werden durch individuelles Feedback, adaptive Anleitung und ein Monitoring des Lernprozesses (Baumert et al., 2010). Die 14 Lehrpraktiken, welche Liljedahl (2020) im "building-thinking-classrooms" (BTC) Ansatz postuliert, greifen diese Erkenntnisse auf und versuchen durch eine Neugestaltung des Mathematikunterrichts die Unterrichtsqualität zu steigern. Die Verwendung von anspruchsvollen Aufgaben ("thinking-tasks"), die Arbeit in zufällig zusammengesetzten Gruppen und die Reflektion des eigenen Fortschritts (mit "check-your-understanding-questions") regt mehr Engagement und eine tiefere Elaboration an (Liljedahl, 2020). Das Ziel der vorliegenden Studie ist es, die Effekte einer Umstellung des Mathematikunterrichts im Sinne des BTC-Ansatzes zu untersuchen und einen Beitrag zur Beantwortung folgender Forschungsfragen zu leisten: 1) Wie nehmen Schülerinnen und Schüler den Unterricht im Format "building-thinking-classrooms" hinsichtlich ihrer kognitiven Aktivierung wahr? 2) Welche Aspekte werden als herausfordernd oder besonders bemerkenswert berichtet?

Methode: Neunundachtzig Lernende (42 Mädchen, 41 Jungen, 5 nicht-binär, 1 fehlender Wert, M = 15.04 Jahre, SD = 1.63) aus der 9. (n = 56) und 12. Klasse (n = 33) einer deutschen Schule nahmen an der Studie teil, in welcher alle Lernenden 90 Minuten im BTC-Ansatz unterrichtet wurden und im Anschluss daran zu ihrer Wahrnehmung des Unterrichts im Vergleich zu traditionellem Unterricht befragt wurden. Der Unterricht begann mit der Präsentation der sogenannten "thinking-task" vor der ganzen Klasse. Im Anschluss daran wurden die Lernenden zufällig in Gruppen zu je drei Personen eingeteilt und begannen auf einer eigenen Tafel zu arbeiten. Die Lehrkraft beobachtete die Arbeit in den Gruppen, leistete Unterstützung bei Bedarf und stellte weitere Aufgaben, wenn die Gruppe die erste Aufgabe erfolgreich gelöst hatte. Dabei bestand das Feedback der Lehrkraft aus weiterführenden Hinweisen, welche zum Ziel hatten den Flow innerhalb der Gruppe aufrecht zu erhalten. In den letzten 15 Minuten wurden die Inhalte der Lerneinheit an einem Gruppenbeispiel zusammengefasst gefolgt von einer Phase, in der die Lernenden individuelle Notizen zu den wichtigsten Inhalten machten. Die Nachbefragung erfasste die kognitive Aktivierung (7 Items aus Helmke & Helmke, 2014, z.B. "Inwieweit trifft folgende Aussage zu: Ich fasse den Lerninhalt mit eigenen Worten zusammen." von "nie(1)" bis "oft(4)") sowie zwei Items zum Lernen durch Nachahmen des Lehrers (z.B."Ich lerne Mathematik, indem ich den Erklärungen des Lehrers folge." von "nie(1)" bis "oft(4)"). Die Lernenden schätzten dabei anhand der 9 Fragen sowohl die Unterrichtsstunde im BTC-Format ein als auch traditionellen Mathematikunterricht. Eine weitere Frage erfasste, was im zurückliegenden 90-minütigen Mathematikunterricht bemerkenswert war.

Ergebnisse: Die beschriebene kognitive Aktivierung war signifikant höher (t(85) = -8.08, p < .001) im BTC-Format (MW=3.04, SD=.52) als beim traditionellen Mathematikunterricht (MW=2.4, SD=.49). Das Nachahmen wurde häufiger (t(87) = 4.99, p < .001) im traditionellen Mathematikunterricht berichtet (MW=3.45, SD=.60) als im BTC-Format (MW=2.94, SD=.79). Vierzig Freitextantworten benannten einen "positiven Aspekt der Gruppenarbeit". Darüber hinaus verwiesen mehrere Kommentare darauf, dass es im BTC-Format "mehr Spaß mache", "das Thema besser verstanden werde" und "es einfacher sei, innerhalb der Gruppe Fragen zu stellen". Sechs Kommentare enthielten kritische Aspekte: diese enthielten die "Gruppenzusammensetzungen, in denen Mitglieder der Gruppe überhaupt nichts beitrugen", die "Herausforderung, Aufgaben ohne die notwendigen Vorkenntnisse zu bearbeiten", die "Schwierigkeit, die eigene Kompetenz unabhängig von der Gruppenleistung zu beurteilen" sowie das "Problem der Vorbereitung auf die Prüfung, weil im Unterricht keine Notizen gemacht wurden".

Fazit: In der vorliegenden Untersuchung berichteten Lernende, dass Mathematikunterricht entlang der 14 Lehrpraktiken des BTC-Ansatzes als kognitiv aktivierender wahrgenommen wird als traditioneller Mathematikunterricht. Das Format wird als anspruchsvoll und motivierend beschrieben, kritisch wird auf Herausforderungen der Methode hingewiesen: die Gruppenzusammensetzung, das Verfassen von Notizen am Ende der Unterrichtseinheiten sowie die Berücksichtigung von Vorkenntnissen müssen beim "building-thinking-classrooms" Ansatz bedacht werden. Zukünftige Untersuchungen sollten die motivationalen und kognitiven Effekte des BTC-Ansatzes im Vergleich zu einer Kontrollgruppe untersuchen.

Poster

Zum Scheitern verurteilt? Die Rolle individueller Eingangsvoraussetzungen beim Abbruch des Lehramtsstudiums: Erlebte Integration und die Nutzung von Lerngelegenheiten

David Simon¹, Jürgen Schneider¹, Mareike Kunter^1,2

¹DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ²Goethe-Universität Frankfurt am Main, Deutschland

Die vorliegende Studie befindet sich in Bearbeitung und will bedeutsame Profile innerhalb einer Population Lehramtsstudierender in Bezug auf individuelle Eigenschaften vor Eintritt in das Studium beschreiben (Eingangsvoraussetzungen). Wir nehmen an, dass sich, in Einklang mit bisheriger Forschung, mindestens ein Risikoprofil findet, welches zu einem späteren Zeitpunkt eine höhere Studienabbruchquote zeigt. Dieser Beitrag beschäftigt sich mit den Gründen für diesen Zusammenhang.

Theoretischer Hintergrund

Wir beziehen uns auf zwei theoretische Konzepte: Das Integrationsmodell von Tinto (1975) und das Angebot-Nutzungs-Modell (z.B., Helmke, 2012). Während das Integrationsmodell die erfolgslose Integration in das akademische und soziale System innerhalb der Hochschule als Erklärung für den Studienabbruch sieht, dient das Angebot-Nutzungs-Modell der Erklärung von Lehr- und Lernprozessen. Im Fokus steht dabei die Vorhersage vornehmlich wünschenswerter Lernergebnisse, wie formaler Noten oder der Entwicklung professioneller Kompetenzen in der Lehramtsausbildung (Möller et al., 2023; Kunter et al., 2013). Der Abbruch des Studiums kann als negativ gewendetes Lernergebnis verstanden werden (vgl. Bernholt et al., 2023). Die zentrale Annahme solcher Modelle ist es, dass eine Lernumgebung als Angebot verstanden wird, in der Studienerfolg kein passiver Prozess ist, sondern von der individuellen Nutzung von Lerngelegenheiten durch die Studierenden abhängt (Helmke, 2012). Als Gründe sowohl für Unterschiede in der Nutzung wie auch für Unterschiede in der akademischen und sozialen Integration zwischen Personen, werden individuelle Unterschiede innerhalb der Voraussetzungen Lernender gesehen (Kunter et al., 2013; Tinto, 1975).

Allgemeine Untersuchungen der Ursachen des Studienabbruchs unterstreichen die Relevanz individueller Eingangsvoraussetzungen (vgl. Heublein et al., 2017). Oft werden diese Merkmale einzeln betrachtet. Wir zielen darauf ab, Profile zu beschreiben, die diese Eingangsvoraussetzungen kombinieren. Nachteile sind bei formal geringerem sozioökonomischen Status, Migrationshintergrund, nicht-gymnasialer Hochschulzulassungsberechtigung, geringeren vorakademischen Leistungen, einer vorherigen Berufsausbildung, einer niedrigeren Ausprägung des Persönlichkeitsmerkmals Gewissenhaftigkeit und einer vornehmlich extrinsischen Motivation für die Wahl des Lehramtsstudiums zu erwarten (vgl. Isleib et al., 2019). Hinsichtlich der Prozesse innerhalb des Studiums, die zum tatsächlichen Studienabbruch führen, folgen wir der Argumentation von Wolf (2019), dass Mitglieder eines Risikoprofils, die eine höhere Intention das Studium abzubrechen berichteten, vorhandene Lerngelegenheiten möglicherweise nicht so produktiv nutzten wie ihre Mitstudierenden, was wiederum ihre Lernergebnisse negativ beeinflusste (Wolf, 2019, S. 130). In Anlehnung an die Ausführungen von Tinto (1975) gehen wir außerdem davon aus, dass es diesen Studierenden nicht gelingt, sich in das akademische und soziale System der Hochschule zu integrieren, was einen Studienabbruch begünstigt und darüber hinaus die Zielverpflichtung hemmt. Wir nehmen an, dass sich Letzteres in einer ungünstigen Nutzung der verfügbaren Lerngelegenheiten zeigt, operationalisiert durch die aktive Zeit in formellen Lerngelegenheiten innerhalb und informellen Lerngelegenheiten außerhalb der Hochschule sowie der wahrgenommene Praxisorientierung des Studiums.

Fragestellung

Wir behandeln zwei Forschungsfragen:

Forschungsfrage 1: Lassen sich innerhalbe einer Population Lehramtsstudierender statistisch unterscheidbare Gruppen auf Basis ihrer individuellen Eingangsvoraussetzung bilden, von denen mindestens eine als Risikoprofil eingestuft werden kann?

Forschungsfrage 2: Zeigen Mitglieder dieses Risikoprofils eine geringere soziale und akademische Integration und führt diese wiederum zu einer unproduktiveren Nutzung von Lerngelegenheiten, was einen höheren Anteil an Studierenden, die das Lehramtsstudium abbrechen bedingt?

Methode

Unsere Analysen werden auf Daten des Lehramtsstudierenden-Panels als Teil der Startkohorte Studierende (SC5) des Nationalen Bildungspanels (NEPS; Blossfeld & Roßbach, 2019) basieren. Es ermöglicht uns, die Fragestellungen in einem längsschnittlichen Design zu untersuchen. Zur Beantwortung der Forschungsfrage 1 werden wir eine Latente Klassenanalyse auf Basis der oben genannten Eingangsvoraussetzungen rechnen. Zur Beantwortung der Forschungsfrage 2 werden wir mehrere Strukturgleichungsmodelle spezifizieren. Dabei überprüfen wir die Vorhersagen des Integrationsmodells und des Angebot-Nutzungs-Modells zunächst separat. Anschließend werden wir beide Modellannahmen im Sinne der Forschungsfrage 2 kombinieren.

Ergebnisse

Die Studie befindet sich parallel zu dieser Einreichung in der Präregistrierung. Die Ergebnisse werden zum Konferenzzeitpunkt vorliegen. Wir möchten sie gerne im Rahmen der GEBF 2024 vorstellen und diskutieren.

Poster

Faktoren, die das derzeitige von einem idealen inklusiven Schulsystem unterscheiden: Perspektiven von Lehrkräften vor und nach der Covid19-Pandemie

Melanie Basten¹, Fabian Schumacher²

¹Universität Trier, Deutschland; ²Universität Bielefeld, Deutschland

Theoretischer Hintergrund

Lehrkräfte stehen zahlreichen Herausforderungen gegenüber, um Schüler:innen auf die Arbeits- und Lebenswelt vorzubereiten (Böttinger & Schulz, 2023). U.a. müssen Lehrkräfte inklusiven Unterricht gestalten (KMK, 2011), aber auch digitale Medien verwenden und Medienkompetenz vermitteln (KMK, 2017), um allen Schüler:innen die Partizipation an der Gestaltung der Gesellschaft zu ermöglichen. In der Zeit der Corona-Pandemie musste Distanzunterricht durchgeführt werden, was einen hohen Zeit- und Handlungsdruck auf die Lehrkräfte ausübte (Forell et al., 2021). Gleichzeitig blieb die Forderung, heterogene Schülerschaften zu unterrichten und auch marginalisierten Gruppen zu berücksichtigen, bestehen. Lehrkräfte haben beiden bildungspolitischen Anforderungen gegenüber Vorbehalte, die Umsetzung von Bildungsinnovationen hängt aber maßgeblich von ihnen ab (Bosse et al., 2017; Nistor, 2018). Gleichzeitig haben auch systemische Bedingungen einen Einfluss darauf, wie gut sich die Forderungen nach inklusivem und digitalem Unterricht umsetzen lassen (Hartung et al., 2021).

Fragestellung

In der aktuellen Studie soll untersucht werden, was sich aus Sicht von Lehrkräften systemisch ändern müsste, um ein funktionierendes inklusives Schulsystem zu ermöglichen. Durch die Corona-Pandemie wurde das inklusive Unterrichten vor weitere Herausforderungen gestellt, da Unterricht nun teilweise auf digitale Medien angewiesen war. Daher soll analysiert werden, ob sich die berichteten Änderungsbedarfe in einer Befragung kurz nach der Pandemie insbesondere in dieser Hinsicht verändert oder erweitert haben.

Methode

Stichprobe und Untersuchungsdesign

Für die Untersuchung wurden bundesweit Lehrer:innen aller Schulformen rekrutiert. Die Befragung fand anonym und online über Unipark statt. Bei der Befragung vor der Corona-Pandemie 2019/20 beantworteten 115, bei der Befragung nach der Corona-Pandemie 2022 87 Lehrkräfte die Fragen zu den systemischen Änderungsbedarfen. Die Stichprobenzusammensetzungen stellen sich folgendermaßen dar: 2020 mit 16,9 Jahren Berufserfahrung, Geschlecht 25,2% männlich, 60,9% weiblich, 39% Gymnasium, 20% Grundschule, 19% Förderschule, 16,5% Gesamtschule, je ca. 1% Hauptschule, Realschule oder andere Schulformen; 2022 mit 16,4 Jahren Berufserfahrung, Geschlecht 18,4% männlich, 71,3% weiblich, 51% Grundschule, 33% Gymnasium, 7% Gesamtschule, 6% Realschule, je 1% Sekundarschule, Förderschule oder andere Schulformen.

Datenerhebung

Die Datenerhebung erfolgte schriftlich mit einem Online-Fragebogen. 2019/2020 und 2022 wurde die Frage gestellt: „Welche Kriterien unterscheiden Ihrer Meinung nach das ideale vom derzeitigen Schulsystem?“ 2022 wurde als zweite Frage gestellt: „Wenn Sie nun an die Corona-Zeit denken, fallen Ihnen dann noch weitere Kriterien ein, in denen sich das ideale vom derzeitigen Schulsystem unterscheidet?“

Datenanalyse

Mithilfe der qualitativen Inhaltsanalyse nach Mayring (2016) wurden die schriftlichen Aussagen der Lehrkräfte zusammenfassend kategorisiert. Die Interrater-Übereinstimmungen betrugen K = .92 (2020) und K = .97 (2022) (Wirtz & Caspar, 2002).

Ergebnisse und ihre Bedeutung

Die Lehrkräfte können sich insgesamt grundsätzlich vorstellen, inklusiven Unterricht zu gestalten, halten aber die systemischen Voraussetzungen für nicht ausreichend, um dieser Anforderung nachzukommen. Sowohl 2020 als auch 2022 waren die am häufigsten genannten Unterschiede zwischen dem derzeitigen und einem idealen Schulsystem der Personalschlüssel (2020: 19% der Aussagen, 2022: 17% der Aussagen), die Größe der Lerngruppe (2020: 11%, 2022: 14%), (multiprofessionelle) Kooperationen (2020: 4%, 2022: 12%), zeitliche Kapazitäten (2020: 5%, 2022: 7%), räumliche Gegebenheiten (2020: 8%, 2022: 5%) und Entlastung (2020: 5%, 2022: 4%). Die größten systemischen Probleme bei der Umsetzung eines inklusiven Schulsystems werden von den Lehrkräften auch nach der Pandemie noch genauso wahrgenommen wie davor.

Auf die Digitalisierung wurde 2022 in nur 9 Aussagen bei der ersten Frage Bezug genommen, 64 Aussagen wurden erst auf Nachfrage mit Verweis auf die Pandemie ergänzt. Bei der Digitalisierung wurden als häufigste Probleme die digitale Infrastruktur (24% der Aussagen) und die digitale Weiterbildung (5%) benannt. Bei der Befragung 2020 wurden keine Aussagen zur Digitalisierung getroffen, aber auch 2022 zeigte sich, dass die Digitalisierung nicht mit einem inklusiven Schulsystem verknüpft wahrgenommen wird. Vielmehr wird dieses Problem erst auf Nachfrage einzeln benannt, obwohl die Verknüpfung beider Themen (Diklusion) einen Mehrwert für die Teilhabe aller hat (Böttinger & Schulz, 2023).

Poster

„Was Du glaubst, ist was Du tust?“ Diskrepanz zwischen Einstellungen von Lehrer*innen und deren Handeln im Bereich Klassenführung

Julia Kienzler, Thamar Voss

Universität Freiburg, Deutschland

Theoretischer Hintergrund

Neben der kognitiven Aktivierung und der konstruktiven Unterstützung gilt ein störungspräventives Klassenmanagement als eine Basisdimension guten Unterrichts (z.B. Praetorius et al., 2018). Zur Minimierung und Prävention von Unterrichtsstörungen gilt die Anwendung der Prinzipien des operanten Konditionierens als wichtiges Mittel (Marzano et al., 2009). Trotz positiver Forschungsbefunde bezüglich der Wirksamkeit von Verstärkungs- und Bestrafungsstrategien zeigen (angehende) Lehrkräften häufig eine ablehnende Haltung gegenüber den Prinzipien operanten Konditionierens (Ahmad et al., 2022; Kienzler et al., 2023). Dabei reichen die Lehrkrafteinstellungen von einer geringen Wirksamkeit der Strategien bis hin zur Überzeugung eines schädlichen Einflusses der Prinzipien auf die Schüler*innen, im Besonderen für Bestrafung (Dovey et al.,2017; Maag, 2001). Betrachtet man jedoch das Lehrer*innenverhalten im Unterricht zeigt sich, dass Verstärkungs- und Bestrafungsstrategien trotzdem gängige Maßnahme von Lehrer*innen zur Vermeidung und Eindämmung unerwünschten Verhaltens darstellen (Little et al., 2003; Marzano et al., 2009). Wenden Lehrer*innen dauerhaft Unterrichtspraktiken an, deren Einsatz sie nach eigenen Angaben nicht gutheißen, kann dies zu höherem Stresserleben und weniger Zufriedenheit im Beruf führen (Greene et al., 2008).

Fragestellung

Vor diesem Hintergrund untersuchen wir, ob sich diese Diskrepanz zwischen den Einstellungen (angehender) Lehrer*innen zu Verstärkung und Bestrafung im Unterricht und der selbst berichteten Wahrscheinlichkeit entsprechende Strategien anzuwenden, abbilden lässt. Auf der Basis der theory of planned behavior (Ajzen, 1991) und dem Einstellungs-Verhaltensmodell MODE (Olsen et al., 2008) untersuchen wir zudem, mit welchen individuellen und kontextbezogenen Faktoren das Ausmaß der Diskrepanz in Zusammenhang steht. Wir fokussieren dabei das Stresserleben der (angehenden) Lehrer*innen, die Berufserfahrung, die wahrgenommen Überzeugungen der sozialen Bezugsgruppe (subjektive Norm), die Ergebniserwartung bezüglich der Störungsprävention sowie das Wissen über die Prinzipien des operanten Konditionierens.

Methode

Angestrebt ist, dass an der laufenden Studie 30 Lehramtsstudierende und 30 Lehrer*innen teilnehmen. Alle Teilnehmenden lesen fünf kurze Vignetten fiktiver Unterrichtszenarien, in denen störendes Verhalten von Schüler*innen beschrieben wird. Nach der ersten Vignette geben die Teilnehmenden in einem offenen Antwortformat an, welche Strategien sie als Lehrer*in in dieser Situation anwenden und wie sie die Strategien in Rangfolge nach aufsteigender Wahrscheinlichkeit der Anwendung bringen würden. Nach den vier weiteren Vignetten entscheiden die Teilnehmenden in einem forced-choice Format mit Zeitbeschränkung, zwischen zwei kontrastierenden Handlungsoptionen, die sich verschiedenen Prinzipien des operanten Konditionierens zuordnen lassen. Anschließend beantworteten die (angehenden) Lehrer*innen Fragen zu ihrem Stresserleben im Umgang mit Unterrichtsstörungen, ihrer Ergebniserwartung bezogen auf die Anwendung von Strategien des Classroom Managements, ihren Einstellungen gegenüber operantem Konditionieren, sowie zu den vermuteten Erwartungen ihrer Bezugsgruppe (Schulleitung, Kolleg*innen, Kommiliton*innen) an das eigene Verhalten. Zudem wird das Wissen zu den Prinzipien des Operanten Konditionierens mittels eines validierten Kontrollitems (Kienzler et al., 2023) erfasst.

Erwartete Ergebnisse

Die Daten werden zum Zeitpunkt der GEBF ausgewertet sein. Unter Verwendung etablierter Maße der Metakognitionsforschung (bias, accuracy, z.B. Schraw, 2009) erwarten wir eine statistisch bedeutsame Abweichung zwischen der Einstellung der Lehrkräfte zu Verstärkung und Bestrafung im Unterricht und der selbst berichteten Wahrscheinlichkeit entsprechende Strategien auszuüben. Dabei gehen wir von einer größeren Abweichung für Bestrafung als für Verstärkung aus. Wir erwarten ebenfalls eine größere Abweichung, wenn die Entscheidung über den Einsatz von Handlungsstrategien unter Zeitdruck getroffen wird als wenn eine reflektiertere Entscheidung vorliegt. Weiterhin analysieren wir, ob die Ausprägung der Abweichungen zwischen Überzeugung und Verhalten mit individuellen und kontextbezogenen Faktoren zusammenhängt. Wir nehmen an, dass die Diskrepanz…

größer ist bei hohem Stresserleben in Störungssituationen,
geringer ist bei positiver Ergebniserwartung hinsichtlich des Einsatzes der geplanten Strategie,
geringer ist bei höherem Wissen über operantes Konditionieren,
geringer ist bei mehr Berufserfahrung,
geringer ist, wenn die Einstellungen der Lehrpersonen mit denen der sozialen Bezugsgruppe übereinstimmen.

Implikationen der Befunde für die Lehrer*innenbildung werden bei der Tagung diskutiert.

Poster

Emotionen beim Lernen mit Videos – Wie Freude und Ärger sowie die beobachtete Unterrichtsqualität von Videoclips die Videoanalyse von Lehramtsstudierenden beeinflussen

Isabell Tucholka¹, Bernadette Gold²

¹Universität Erfurt, Deutschland; ²TU Dortmund, Deutschland

Theoretischer Hintergrund

In der Lehrkräftebildung werden immer häufiger Videoanalysen eingesetzt, um die professionelle Unterrichtswahrnehmung der Studierenden zu fördern (Gaudin & Chaliès, 2015, König et al., 2022; Santagata et al., 2021), d. h. ihre Fähigkeit, relevante Unterrichtssituationen zu erkennen und wissensbasiert zu interpretieren (Sherin, 2007) sowie auf dieser Grundlage mögliche Handlungsalternativen abzuleiten (Stahnke & Blömeke, 2021). Neben kognitiven Prozessen kann das Beobachten und Analysieren von Videos allerdings auch emotionale Reaktionen auslösen (Chan et al., 2018; Kleinknecht & Schneider, 2013). Während Studierende und auch praktizierende Lehrkräfte bei der Videoarbeit überwiegend Freude zu empfinden scheinen, gibt es Hinweise darauf, dass das Empfinden positiver und negativer Emotionen auch teils damit zusammenhängt, inwiefern die beobachtete Unterrichtsqualität als effektiv eingeschätzt wird (Kleinknecht & Schneider, 2013; Tucholka & Gold, 2023).

Hinsichtlich der Gestaltung videobasierter Lerngelegenheiten im Lehramtsstudium (z.B. Kang & van Es, 2019) wurden Emotionen bisher allerdings kaum bedacht. Emotionale Prozesse sind dabei eng mit kognitiven verknüpft (Fiedler & Beier, 2014; Forgas, 2023; Pekrun, 2018) und beeinflussen daher möglicherweise auch die Videoanalyse bzw. die professionelle Wahrnehmung. Freude geht tendenziell mit einem offeneren Denkstil und breiterer Aufmerksamkeit einher (Forgas, 2017; Schwarz, 2000), was das Erkennen relevanter Ereignisse und das Generieren von Alternativen begünstigen könnte, während negativer Affekt wie Ärger eher zu einem stärkeren Fokus auf Details führt (Moons & Mackie, 2007; Schwarz, 2000), was vorteilhaft für eine tiefgründigere wissensbasierte Interpretation wäre (Gold & Windscheid, 2020; Kleinknecht & Schneider, 2013).

Fragestellung

Trotz einem zunehmenden Fokus auf die optimale Gestaltung videobasierter Lernumgebungen (z.B. Kang & van Es, 2019) wurde die Rolle von Emotionen im Zusammenhang mit kognitiven Videoanalyseprozessen bisher kaum gezielt untersucht. Ziel unserer Studie ist es daher, den Einfluss von Emotionen (Ärger/Freude) sowie der im Video präsentierten Unterrichtsqualität am Beispiel der Klassenführung (effektiv/ineffektiv) auf die professionelle Wahrnehmung von Lehramtsstudierenden zu betrachten.

Methodik

An diesem Experiment im 2x3-Design (Klassenführungsqualität: effektiv/ineffektiv; induzierte Emotion: Freude/Ärger/Neutral) nahmen 183 Lehramtsstudierende im Rahmen von Klassenführungsseminaren teil (83.06% weiblich; M_Alter = 23.40, SD_Alter = 2.03; a-priori-Poweranalyse: ANOVA fixed effects, special, main effects and interaction; groups = 6, df = 2; f = .25, α = .05, power of .8: N = 158) und wurden randomisiert auf die sechs Bedingungen verteilt. Sie bearbeiteten einen Klassenführungswissenstest und erhielten gruppenabhängig eine standardisierte positive/negative Rückmeldung dazu, um Freude bzw. Ärger zu induzieren (bzw. keine Rückmeldung für neutrale Gruppen). Anschließend beobachteten sie ein Unterrichtsvideo, das überwiegend effektive bzw. ineffektive Klassenführungsqualität zeigte (basierend auf einem Expertenrating), und analysierten dieses in einer offenen Schreibaufgabe (basierend auf Gippert et al., 2022).

Die Daten werden aktuell daraufhin kodiert, wie viele relevante Ereignisse erkannt, wie tiefgründig diese analysiert und wie viele Handlungsalternativen dazu generiert wurden. Die Auswertung wird voraussichtlich durch ANOVAs mit den Zwischensubjektfaktoren „induzierte Emotion“ und „Video“ erfolgen. Dabei wird auf potenzielle Kovariaten überprüft (z.B. Motivation, Need for Cognition).

Ergebnisse

Um die Wirksamkeit der Manipulation sicherzustellen, wurden die Studierenden vor und nach dem Beobachten des Videos nach ihrem aktuellen Befinden gefragt (8-stufige Likertskala: Ich freue/ärgere/langweile mich.). Eine MANOVA zum ersten Messzeitpunkt zeigte zunächst die erwartete Wirkung der Emotionsmanipulation (F(4, 346) = 48.34, p <.001, np² = .358). Entscheidender ist, dass diese Unterschiede im Freude- und Ärgerempfinden auch nach der Videobeobachtung noch signifikant waren (Freudeempfinden: (F(2, 172) = 18.58, p <.001, np² = .178), Ärgerempfinden: (F(2, 173) = 14.62, p <.001, np² = .145). Ebenso führte das Video mit effektiver Klassenführung wie erwartet zu signifikant mehr Freude (F(1, 172) = 6.37, p <.001, np² = .036) und weniger Ärger (F(1, 172) = 11.25, p <.001, np² = .061) als das Video mit ineffektiver Klassenführung, wenn auch mit kleineren Effektstärken.

Ergebnisse zur dargestellten Fragestellung liegen aktuell noch nicht vor, werden aber im Poster präsentiert.

Poster

Pädagogische Diagnostik im Musikunterricht: Wie stark beeinflusst die Informationsbreite die Urteilsgenauigkeit angehender Musiklehrkräfte?

Lena Samel¹, Friedrich Platz¹, Johannes Hasselhorn²

¹HMDK Stuttgart; ²FAU Erlangen-Nürnberg

Die Pädagogische Diagnostik stellt einen zentralen Bestandteil des professionellen Lehrerhandelns dar (Hesse & Latzko, 2017) und umfasst alle formellen und informellen diagnostischen Tätigkeiten zur Informationsgewinnung über Schüler:innen und ihre Fertigkeitsentwicklung. Eine bisher etablierte Operationalisierung der diagnostischen Kompetenz ist die Urteilsgenauigkeit nach Schrader und Helmke (1987), die eine Unterteilung in Niveau-, Differenzierungs- und Vergleichskomponente vorschlagen. Inhaltlich handelt es sich um ein Maß der Übereinstimmung zwischen den lehrkräfteseitig antizipierten und in standardisierten Einzelerhebungssituationen empirisch erfassten Individualleistungen von Schüler:innen. Während für Kernfächer wie Mathematik oder (Fremd-)Sprachen bereits eine Vielzahl an Studien zur Urteilsgenauigkeit existieren (vgl. Urhahne & Wijnia, 2021; Südkamp et al., 2012), liegen für das Fach Musik bislang kaum Forschungsergebnisse vor. Dabei ist insbesondere die Diagnostik von musikpraktischen Leistungen mit besonderen Herausforderungen für die Musiklehrkräfte verbunden. Zum einen zeigt die musikpsychologische Forschung im außerschulischen Bereich, dass die ästhetische Urteilsbildung (i.d.R.) zu musikalischen Einzelbeiträgen – sogar von Expert:innen – mit einer geringen Homogenität einhergeht (u.a. Passarotto et al., 2023) und darüber hinaus das Ergebnis einer multifaktoriell, individuell gewichteten Entscheidungsfindung in sozialen Kontexten ist (McPherson & Schubert, 2022; Platz & Kopiez, 2022). Zum anderen gibt es bisher weder ein theoretisch fundiertes Modell über die pädagogische Urteilsbildung musikpraktischer Darbietungen, noch eine evidenzgestützte Annahme darüber, ob ein Transfer modellspezifischer Bewertungskriterien aus der musikpsychologischen Forschung zur ästhetischen Darbietungsbeurteilung für die pädagogische Diagnostik im schulischen Kontext möglich ist, in dem bspw. die Musikpraxis (und die hieraus resultierenden Lernprodukte) nahezu ausschließlich als Gruppenleistungen vorliegen (z.B. Klassengesang). So müssen Musiklehrkräfte in der Lage sein, aus akustisch komplexen Gruppensituationen ausreichend Informationen für eine Individualdiagnostik herausziehen zu können, was ihnen jedoch nur teilweise gelingt (vgl. Hasselhorn et al., 2022). Auch wenn Einzelgesangssituationen im Musikunterricht nur selten vorkommen, besteht dennoch die Möglichkeit auf technischem Wege Einzelaufnahmen von Schüler:innen beim Gruppenmusizieren anzufertigen, die im Anschluss an die Erhebungssituation beurteilt werden könnten.

Das Ziel unserer Studie besteht in der empirischen Bestimmung, wie genau angehende Musiklehrkräfte solche Einzelgesangsleistungen von Schüler:innen sowohl evaluieren als auch prognostizieren können. Zudem wird untersucht, ob ihre Urteilsgenauigkeit durch die Informationsbreite beeinflusst wird, wobei hierunter der Umfang an Informationen über die Leistungsfähigkeit der Schüler:innen in unterschiedlichen Situationen verstanden wird.

Zur Beantwortung der Forschungsfrage wurde eine Onlinestudie mit N = 98 Musikstudierenden durchgeführt, in deren Verlauf den Proband:innen Einzelaufnahmen von 10 Schüler:innen präsentiert wurden. Die Aufnahmen stammen aus einem bestehenden Korpus, der Gesangsleistungen von Schüler:innen der 9. Jahrgangsstufe sowie reliable Beurteilungen aller Leistungen u.a. durch Lehrkräfte umfasst (Hasselhorn, 2015, S. 122). Die Operationalisierung der Informationsbreite (UV₁) erfolgte durch einen standardisierten Zusammenschnitt (a) einer schülerseitigen Gesangsdarbietung („Guten Abend, gut‘ Nacht“) oder aber (b) von Ausschnitten aus drei unterschiedlichen Stücken („Bruder Jakob“, „Guten Abend, gut‘ Nacht“ und „Kalte Sterne“) unter Konstanthalten der Abspiellänge für alle Hörbeispiele. Nach randomisierter Zuordnung der Proband:innen zu einer der beiden Untersuchungsbedingungen wurden diese aufgefordert, die gehörte Darbietung anhand der HTR-G-Skala zur Bewertung schülerseitiger Gesangsleistungen zu beurteilen (Hasselhorn, 2015, S. 82). Danach sollten sie eine Einschätzung unter Verwendung derselben Skala abgeben, welche Leistung der jeweiligen Schülerin bzw. des jeweiligen Schülers sie für zwei weitere Stücke unterschiedlichen Anforderungsniveaus erwarten würden, wobei ihnen hierfür nur das jeweilige Notenbild präsentiert wurde.

Anhand der vorhandenen Beurteilungen konnten in der Datenanalyse die Komponenten der Urteilsgenauigkeit nach Schrader und Helmke (1987) berechnet werden. Darüber hinaus wurden Multilevel Regression Analysen durchgeführt (Karst et al., 2017).

Unsere Ergebnisse zeigen, dass die Urteilsgenauigkeit angehender Musiklehrkräfte vergleichbar ist mit den Leistungen der Lehrkräfte anderer Fächer (s. Urhahne & Wijnia, 2021; Südkamp et al., 2012). Im Vergleich zu den Analysen nach Schrader und Helmke (1987), ermöglichen die regressionsanalytischen Ansätze jedoch differenziertere Aussagen: Erst mit ihnen lässt sich der Effekt der Informationsbreite auf das Urteilsverhalten der angehenden Musiklehrkräfte in differenziellen Analysen nachweisen.

Poster

Wie kann Notizenmachen von Lehrvideos lernwirksam inszeniert werden?

Anke Wischgoll, Monika Post

TU Dortmund, Deutschland

Theoretischer Hintergrund

Lehrvideos sind in den letzten Jahren in der Lehrkräfteausbildung immer häufiger in digitalen Lernumgebungen genutzt worden. Es ist jedoch noch wenig erforscht, wie tiefgreifende Lernprozesse beim Betrachten von Lehrvideos in digitalen Lernumgebungen gefördert werden können. Im ICAP-Rahmen zeigen Chi und Wiley (2014), dass die Auseinandersetzung der Lernenden mit dem Lerngegenstand beim Betrachten eines Videos in einer konstruktiven Beschäftigungsform wie Selbsterklärungen eher gesteigert werden kann als in einer aktiven Beschäftigungsform wie dem Anhalten eines Videos.

Das Anfertigen von Notizen ist eine gängige Lernaktivität, um Informationen aus Vorlesungen, Texten oder Videos zu verdichten. Die Forschung hat gezeigt, dass das Anfertigen von Notizen starke Auswirkungen auf den Lernfortschritt haben kann (Kiewra, Colliot & Lu 2018). Durch das Anfertigen von Notizen externalisieren die Lernenden ihre Gedanken, sie erinnern sich und reorganisieren die Lerninhalte, die sie gehört, gelesen oder beobachtet haben. Auf diese Weise interagieren die Lernenden mit dem Material, indem sie es mit ihrem Vorwissen vergleichen und kontrastieren und zu einer mentalen Repräsentation verdichtet (DiVesta & Gray 1973). Wiederholt haben Forschungsergebnisse belegen können, dass die Notizen der Studierenden oft unvollständig und die mentale Repräsentation des dargebotenen Lerninhalts inkonsistent sind (Kiewra, Colliot & Lu 2018). Mit fokussierenden Selbsterklärungsprompts kann die Qualität von Notizen verbessert werden. Diese unterstützen die Informationsselektion stärker als offene Selbsterklärungsprompts (Berthold, Eysink & Renkl 2009).

Fragestellung

Ziel der Studie war es, herauszufinden, wie Studierende durch Notizenmachen von Lehrvideos profitieren können. Folgende Hypothesen wurden getestet: (1) Lernende der Experimentalgruppe, die fokussierende Prompts erhalten, (EG-F) verfassen qualitativ bessere Notizen als Lernende der Experimentalgruppe, die offene Prompts erhalten (EG-O). (2) Lernende der EG-F zeigen bessere Posttestleistungen als Lernende der EG-O. (3) Die Experimentalgruppen EG-O und EG-F zeigen bessere Posttestleistungen als die Kontrollgruppe.

Methode

An der Interventionsstudie nahmen 256 angehenden Mathematiklehrkräfte teil, die zufällig einer von drei Bedingungen zugeteilt wurden: Jede Gruppe sah zwei Lehrvideos: eines über das Konzept der Wahrscheinlichkeit (i.e., Teil-Ganzes-Beziehung) und eines darüber, wie man dieses Konzept Lernenden erklären kann (i.e., bedeutungsbezogene Sprache). Eine der Experimentalgruppen (EG-O) wurde aufgefordert, sich Notizen zu wichtigen Informationen zu machen (offene Prompts). Die andere Experimentalgruppe (EG-F) wurde aufgefordert, sich Notizen zur Wahrscheinlichkeit und zum Sprachgebrauch zu machen (fokussierende Prompts). Die Kontrollgruppe wurde nicht aufgefordert, sich Notizen zu machen. Nach jedem Lehrvideo wurden die Teilnehmenden gebeten, die vermittelten Informationen in Übungsaufgaben anzuwenden. Vor und nach der Intervention wurde das konzeptuelle Wissen und der Gebrauch von bedeutungsbezogener Sprache mit speziell entwickelten Items getestet.

Ergebnisse

Unsere Ergebnisse zeigten, (1) dass die Notizen der EG-F signifikant besser waren als die Notizen der EG-O, (2) dass die EG-F signifikant bessere Posttestleistungen zeigte als die EG-O, (3) dass zwischen der Kontrollgruppe und der EG-F keine Unterschiede in Hinblick auf die Posttestleistung vorlagen, jedoch zwischen der Kontrollgruppe und der EG-O zugunsten der Kontrollgruppe.

Wir konnten zeigen, dass Prompts in digitalen Lernumgebungen nur dann wirksam zu sein scheinen, wenn sie die Fokussierung auf relevante Informationen lenken. Prompts, die zur Selbsterklärung einladen, aber keine unterstützende Fokussierung anbieten, erwiesen sich in unserer Studie als weniger wirksam.

Literatur

Berthold, K., Eysink, T. H. S., & Renkl, A. (2009). Assisting self-explanation prompts are more effective than open prompts when learning with multiple representations. Instructional Science, 37(4), 345-363.

Chi, M. T., & Wylie, R. (2014). The ICAP framework: Linking cognitive engagement to active learning outcomes. Educational Psychologist, 49(4), 219-243.

Di Vesta, F. J., & Gray, G. S. (1973). Listening and note taking: II. Journal of Educational Psychology, 64(3), 278-287.

Kiewra, K. A., Colliot, T., & Lu, J. (2018). Note this: How to improve student note taking. IDEA Paper #73. IDEA Center, Inc., CC BY NC ND.

Poster

Implizite und explizite Einstellungen gegenüber diversitätsgenerierenden Merkmalen: Eine Untersuchung zentraler Alterskohorten

Sabrina König, Justine Stang-Rabrig, Nele McElvany

TU Dortmund, Deutschland

Theoretischer Hintergrund und Forschungsstand

Unsere Gesellschaft ist von Heterogenität geprägt. Zu diversitätsgenerierenden Merkmalen gehören beispielsweise das Geschlecht, der Migrationshintergrund oder die soziale Herkunft (vgl. Four Layers of Diversity, Gardenswartz & Rowe, 2003). Zu diesen diversitätsgenierenden Merkmalen liegen in der Gesellschaft implizite und explizite Einstellungen vor. Diese können – trotz der bestehenden Vielfalt – negativ sein (Ingroup/outgroup favoritism; Doornkamp et al., 2022; König et al., 2022; Sabin et al., 2015; Stang et al., 2021). Insbesondere negative implizite Einstellungen können weitreichende Folgen in Form von zum Beispiel diskriminierendem Verhalten haben, da sie unbewusst das Verhalten einer Person beeinflussen (z. B. Brown, 2017). Bisherige Arbeiten fokussierten größtenteils auf lediglich ein diversitätsgenerierendes Merkmal sowie auf eine spezifische Personengruppe wie beispielsweise Lehrkräfte (Del Río et al., 2019; Denessen et al., 2022; Glock & Klapproth, 2017). Wie jedoch bei Mitgliedern verschiedener, zentraler Altersgruppen, von Kindergartenkindern bis Senior:innen, Einstellungen zu verschiedenen heterogenitäts-generierenden Merkmalen ausgeprägt sind, ist unklar. Des Weiteren ist wenig zu personalen (z. B. Persönlichkeitseigenschaften) sowie kontextspezifischen (z. B. Werte) Variablen bekannt, die mit den Einstellungen zusammenhängen können sowie zu Konsequenzen von Einstellungen gegenüber diversitätsgenerierenden Merkmalen (z.B. Verhaltensintentionen; Theorie des geplanten Verhaltens; Ajzen, 1985). Um entsprechend die unterschiedlichen Diversitätsdimensionen des Modells von Gardenswartz und Rowe (2003) abzubilden, werden in dieser Studie die sowohl impliziten, eher unbewussten, als auch expliziten, bewussten Einstellungen gegenüber verschiedenen heterogenitätserzeugenden Merkmalen wie zum Beispiel „Geschlecht“, „Religion“ und „Migrationshintergrund“ in fünf verschiedenen Alterskohorten (Kindergartenkinder, Schüler:innen der vierten und neunten Jahrgangsstufe, Erwachsene und Senior:innen) untersucht.

Fragestellung

In der vorliegenden Studie werden die genannten Altersgruppen, vom Kindergarten- bis zum Erwachsenenalter, in den Blick genommen, um zu untersuchen, 1) in welchem Ausmaß implizite und explizite Einstellungen gegenüber den ausgewählten diversitätsgenerierenden Merkmalen (Geschlecht, Religion, Migrationshintergrund, Berufsgruppen, ökonomischer Status, sexuelle Orientierung) vorliegen und 2) ob sich Unterschiede in den Ausprägungen impliziter und expliziter Einstellungen zwischen den fünf Alterskohorten zeigen. Darüber hinaus werden theoriegeleitet 3) personenbezogene (z.B. Persönlichkeit) und umgebungsspezifische (z.B. Werte) Faktoren, die mit impliziten und expliziten Einstellungen in Zusammenhang stehen können, untersucht sowie 4) weitere zentrale Variablen, die mit Einstellungen zusammenhängen können (z.B. Verhaltensintention).

Methode

Zur Erfassung der impliziten Einstellungen der sechs diversitätsgenerierenden Merkmale werden Implizite Assoziationstests (IATs) eingesetzt. Dabei wird die Assoziationsstärke zwischen kognitiven Strukturen (Konzepten) über Reaktionszeiten gemessen. Das Ausführen einer bestimmten Verhaltensreaktion (z. B. das Drücken eine Tastaturtaste) ist leichter, wenn zwischen zwei Konzepten eher eine hohe als eine niedrige Assoziationsstärke vorliegt (Greenwald et al., 1998; Nosek et al., 2007). Als Stimulusmaterial kommen sowohl Fotos als auch Wörter zum Einsatz. Explizite Einstellungen und weitere zentrale Variablen, die in einem Zusammenhang mit der Ausprägung von Einstellungen stehen können, sowie soziodemografische Angaben werden im Anschluss an die IATs über einen Fragebogen per etablierter Skalen erhoben. Dabei erfolgen die Erhebungen entweder tabletbasiert (Kindergarten, Schule, Senioreneinrichtungen) oder online (Erwachsene, Senior:innen).

Eine a priori Stichprobenumfangsplanung (f = .25, α = .05, 1-β = .80) ergab für die Kohorten (Schüler:innen Klasse 4/ 9, Erwachsene und Senior:innen) je n = 868, in denen von insgesamt sechs IAT-Themen jeweils zwei randomisiert dargeboten werden. Für die Kohorte der Kindergartenkinder ergibt sich eine Substichprobengröße von n = 410, da hier von lediglich drei IAT-Themen („Geschlecht“, „Migrationshintergrund“, „sexuelle Orientierung“) jeweils zwei randomisiert dargeboten werden.

Ergebnisse

Der Erhebungsstart ist Oktober 2023. Es wird erwartet, dass negative Einstellungen gegenüber den untersuchten Merkmalen vorliegen und dass Strukturgleichungsmodelle Unterschiede sowohl in den Ausprägungen der impliziten und expliziten Einstellungen gegenüber den heterogenitätserzeugenden Merkmalen als auch zwischen den Kohorten aufzeigen. Auch wird vermutet, dass personen- und kontextspezifische Variablen in Zusammenhang mit dem Ausmaß der untersuchten Einstellungen stehen und, dass diese beispielsweise Verhaltensintentionen vorhersagen können. Die Ergebnisse werden methodisch und inhaltlich diskutiert. Zudem werden Implikationen für Forschung und Praxis vorgestellt.

Poster

"Risikoschüler:innen" im Bildungssystem – Ergebnisse aus dem Projekt Regain Potential

Gerlinde Lenske¹, Alexandra Merkert²

¹Leuphana Universität Lüneburg, Deutschland; ²Rheinland-Pfälzische Technische Universität Kaiserslautern-Landau, Deutschland

Theoretischer Hintergrund

Der Anteil an Personen ohne abgeschlossene Berufsausbildung oder Abitur steigt. So erhöhte sich der Wert bei den heute 25- bis 34-Jährigen in den letzten Jahren von 13 % auf 16 % (OECD, 2021; OECD, 2023). Darüber hinaus ist der Einfluss des sozioökonomischen Status auf den Bildungserfolg in Deutschland bedeutender als in anderen OECD-Staaten. Dies deutet darauf hin, dass es im deutschen Bildungssystem weniger gut gelingt, entsprechende Nachteile, die aus herkunftsbedingten Disparitäten resultieren, auszugleichen (OECD, 2019). Folglich drohen insbesondere sozial benachteiligte Kinder und Jugendliche in die Gefahr der Bildungsarmut (siehe u. a. Allmendinger, 1999; Tenorth, 2009) zu geraten. Bildungsarmut wird als ein Zustand definiert, der zu Restriktionen führt, sich sozial, kulturell, ökonomisch und politisch zu integrieren und an elementaren gesellschaftlichen Prozessen zu partizipieren (Ferger, 2015). Gründe für die Risikolage finden sich häufig bereits in Schule und Elternhaus. Insbesondere wenn Grundbedürfnisse bzw. Grundmotivationen (Deci & Ryan, 1985; Längle, 2016) nicht erfüllt bzw. berücksichtigt werden, kann eine verhängnisvolle Abwärtsspirale beginnen (Kammler, 2013; Huber et al., 2015). Lernende die keine Passung ins Bildungssystem erfahren, antworten oftmals mit Problemverhalten wie Resignation, Leistungsverweigerung oder Aggression (Baumann et al., 2020). Diese als störend oder destruktiv empfundenen Verhaltensweisen zeigen allerdings auch Problemlagen im System auf (Mücke, 2019). Um diese zu bearbeiten, erscheint es notwendig, die Perspektiven, Bedarfe und Wünsche von gefährdeten Schüler:innen sowie mögliche Schlüsselerlebnisse im Verlauf ihrer Schulzeit empirisch zu beleuchten und ggf. Muster zu identifizieren. Die gewonnen Erkenntnisse können zur Entwicklung von Interventionen (z. B. in Orientierung an der Resilienzforschung, siehe Nord, 2012) genutzt werden sowie in die Lehramtsausbildung einfließen (bspw. im Kontext von Klassenführung, siehe u. a. Lenske & Mayr, 2015).

Fragestellung

Im Fokus des Posterbeitrags steht die Frage nach den Wünschen und Bedarfen von Jugendlichen, die im Verlauf ihrer Schulzeit (beginnend mit der Einschulung) schulische Tiefpunkte durchlitten haben bzw. aktuell durchleben (bspw. markiert durch Versetzungsgefährdung, stark unterdurchschnittliches schulisches Wohlbefinden oder emotionale Erschöpfung). Untersucht wird außerdem, was sich aus der Perspektive der Befragten an Schule verändern müsste, um die Situation zu verbessern bzw. nach welchen Schlüsselerlebnissen sie wieder einen Aufschwung erfahren haben.

Methode

Datengrundlage bilden 60 problemzentrierte Interviews (Witzel, 2000) mit Sekundarstufenschüler:innen der 7., 8. und 9. Jahrgangsstufe (unter Einbezug von systemischen Therapie- bzw. Beratungsmethoden wie der Rekonstruktion der eigenen Lebenslinie). Im Mixed-Method-Design wurden anhand von Fragebögen außerdem schulisches Wohlbefinden (Gerecht et al., 2012), schulbezogene Selbstwirksamkeitserwartung (Jerusalem & Satow, 1999), die Lehrenden-Lernenden-Beziehung (Fickermann & Weißhaupt, 1998) sowie emotionale Erschöpfung (adaptiert nach Maslach & Jackson, 1986) erhoben. Die qualitativen Daten werden nach der Transkription der Interviews in Anlehnung an die inhaltlich strukturierende qualitative Inhaltanalyse nach Mayring (2022, unter Verwendung von MAXQDA) ausgewertet und mit den quantitativen Daten (mittels R) in Bezug gesetzt.

Ergebnisse

In ersten Analysen im Rahmen der noch laufenden Datenauswertung zeichnet sich bereits ab, dass Lehrkräfte durch beziehungsförderliches Verhalten erheblichen Einfluss auf die erlebte Unterstützung, das Wohlbefinden inkl. der Freude am Lernen nehmen, was sich vor allem bezüglich vielfach belasteter Schüler:innen (bspw. mitbedingt durch die familiäre Situation) zeigt. Diese Risikogruppe berichtet oftmals von dem Gefühl, nicht ernstgenommen oder missverstanden zu werden. Wichtig erscheint ihnen demgegenüber, dass Lehrkräfte sie als Person wertschätzen (auch unabhängig von schulischen Leistungen). Markantes Lehrkraftverhalten, egal ob positiv oder negativ, erweist sich als äußert (ein-)prägsam. Anhand der retrospektiv geschilderten Erfahrungen lässt sich erkennen, dass es Lehrkräften teilweise nicht gelingt, eine adäquate Beziehung zu dieser Schüler:innengruppe aufzubauen und es folglich zu ablehnendem Verhalten auf beiden Seiten kommt. Die Daten legen außerdem nahe, das Verständnis von Risikoschüler:innen insbesondere hinsichtlich solcher Personen zu erweitern, die sich durch stummes Leiden (hohe emotionale Erschöpfung und geringes schulisches Wohlbefinden bei gleichzeitig eher unauffälligem Verhalten) auszeichnen. Auffällig häufig wird außerdem von Mobbing-Erfahrungen in der Schule berichtet.

Poster

Geschlechterstereotypisierung von Spielzeug bei Gurndschulkindern

Julia Kozisnik¹, Hanna Beißert^1,2,3

¹Goethe Universität Frankfurt am Main; ²DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ³IDeA-Center for Individual Development and Adaptive Education Frankfurt

Geschlechterstereotype sind tief in unserer Gesellschaft verwurzelt. Sie sind Vorstellungen darüber, wie männliche und weibliche Personen sich zu verhalten und welche Interessen sie zu verfolgen haben (Athenstaedt&Alfermann,2011;Hannover,2006). Stereotype werden innerhalb der Gesellschaft (re)produziert, indem sie von verschiedenen Sozialisationsinstanzen an die Kinder weitervermittelt werden. So lernen Kinder früh, wie sich Mädchen und Jungen gemäß der Normvorstellungen verhalten sollen und welche Interessen und Spielvorlieben für ihr Geschlecht als angemessen gelten. Dies schränkt die individuelle Entwicklung ein und begünstigt, dass sich im späteren Entwicklungsverlauf auch akademische und Berufsinteressen entlang stereotyper Geschlechtsvorstellungen entwickeln.

Seit einiger Zeit gibt es einen gesellschaftlichen Wandel, der dazu führt, dass Geschlechterstereotype aufgebrochen werden (Athenstaedt&Alfermann,2011).Doch wie weit spiegelt sich dieser gesellschaftliche Wandel in der Erfahrungswelt von Kindern wider? Bei Kindern äußern sich Geschlechtsstereotype insbesondere in der Spielzeugnutzung (Ruble et al.,2006). Die vorliegende Studie untersucht, wie stark die Geschlechtertypisierung von Spielzeug bei Grundschulkindern heutzutage ausgeprägt ist und ob dabei Geschlechtsunterschiede bestehen.

40 Kinder zwischen 8 und 11 Jahren (M=9.23,SD=0.73, 20 weiblich, 20 männlich) bearbeiteten einen Fragebogen, in dem sie 26 Spielzeuge, die entweder als stereotyp weiblich, stereotyp männlich oder neutral angesehen werden können, einem von zwei fiktiven Kindern (Marie, Tom) zuordnen sollten. Die Spielzeuge wurden zuvor von Erwachsenen im Hinblick auf weibliche/männliche Stereotypität hin pilotiert. Die Kinder beantworteten für jedes dieser Spielzeuge drei Fragen: 1.Glaubst du, das jeweilige Spielzeug gehört Marie oder Tom? 2.Würde auch das andere Kind damit spielen? 3.Würdest du mit diesem Spielzeug spielen?

Fast alle Kinder ordneten die Spielzeuge entsprechend gängiger Geschlechtsstereotypen zu: Stereotyp weibliche Spielzeuge wurden zu 99.15% dem fiktiven Mädchen zugeordnet, χ²(4)=80.00,p<.001, stereotyp männliche Spielzeuge zu 98.28% dem fiktiven Jungen, χ²(1)=40.00,p<.001. Bei der Zuordnung der neutralen Spielzeuge orientierten sich die Kinder tendenziell am eigenen Geschlecht, wobei diese Tendenz bei Jungen deutlich stärker ausgeprägt war als bei Mädchen.

Um zu untersuchen, ob Mädchen und Jungen unterschiedliche Auffassungen bezüglich der Stereotypität von Spielzeug haben, wurden Chi²-Unabhängigkeitstests durchgeführt, die weder bei den stereotyp weiblichen noch bei den stereotyp männlichen Spielzeugen Zusammenhänge mit dem Geschlecht der teilnehmenden Kinder ergaben, ps>.005. Lediglich bei der Zuordnung der geschlechtsneutralen Spielsachen gab es Geschlechtsunterschiede in der Wahrnehmung des Spielzeugs,χ²(8)=14.86,p=.031.

Weiterhin konnte sich die Mehrheit der Kinder nicht vorstellen, dass das jeweils andere fiktive Kind mit den jeweils stereotyp andersgeschlechtlichen Spielzeugen spielen würde. Die Mädchen gingen bei mädchentypischen Spielsachen zu 75.83% und bei jungentypischen zu 70.27% davon aus, dass das jeweils andersgeschlechtliche fiktive Kind kein Interesse an den jeweiligen Spielsachen hätte. Bei den Jungen war dies bei mädchentypischen zu 80.83% und bei jungentypischen Spielzeugen zu 65.83% der Fall.Die Teilnehmenden sahen es also als wahrscheinlicher an, dass Mädchen mit jungentypischem Spielzeug spielen, als dass Jungen mit mädchentypischem Spielzeug spielen. Bei den geschlechtsneutralen Spielzeugen gab die Mehrheit (72.53% der Mädchen, 73.95% der Jungen) an, dass beide fiktiven Kinder mit diesen Spielzeugen spielen würden.

Bei den eigenen Vorlieben bekundeten 56.3% der Mädchen und nur 5.83% der Jungen Interesse an den als stereotyp weiblichen Spielzeugen. Obwohl hier eine klare Geschlechtstendenz besteht, entschied sich interessanterweise fast die Hälfte der Mädchen gegen diese Spielzeuge – auch wenn sie diese innerhalb der ersten Frage als mädchentypisch eingestuft hatten.Mit den stereotyp männlichen Spielzeugen würden 88.33% der Jungen und 27.68% der Mädchen spielen. Hervorzuheben ist, dass Mädchen 4.75-fach häufiger mit stereotyp männlichen Spielzeugen spielen würden als Jungen mit stereotyp weiblichen Spielsachen.

Insgesamt vollziehen Kinder trotz gesellschaftlichen Wandels weiterhin eine starke Geschlechtsstereotypisierung von Kinderspielzeug, wobei sich Jungen intensiver als Mädchen an den Geschlechternormen orientieren.

Da Kinder einen Großteil ihres Lebens in Bildungseinrichtungen verbringen, hat das pädagogische Fachpersonal großes Potenzial, stereotypen Überzeugungen von Kindern entgegenzusteuern. So sollten Erzieher*innen und Grundschullehrkräfte für das Thema sensibilisiert werden, um eine Interessenentwicklung abseits von gesellschaftlichen Stereotypen und Erwartungen zu fördern.

Poster

Authenticity of a virtual classroom to train conflict regulation competences in student teachers

Sinah Auchtor, Antje Biermann, Roland Brünken

Universität des Saarlandes, Deutschland

Becoming a teacher not only includes the accumulation of factual knowledge, but also the “know-how”, i.e. the professional skills required to be a proficient teacher (Grossman et al., 2009). One essential professional skill for teachers is the ability to regulate themselves during conflict (Baumert & Kunter, 2006). From teacher professionalization research, it is well known, that conflicts in classroom and a poor student-teacher relationship will be associated with stress and negative emotions in teachers (Dicke et al., 2015; Krause et al., 2011; Kyriacou, 2001). To gain such professional skills, it is necessary to systematically train them during conflict situations, which is not possible in a classroom setting due to their accidental nature. Virtual classrooms provide a way to systematically train professional behavior, since situations can be repeated, and different approaches can be tried in the same setting (Ericsson, 2006).

The effectiveness of virtual training depends on the perceived reality of the simulated scenario. It should evoke comparable cognitive processes and affective reactions (like emotions towards the disruptive student) as an interaction with a real student in a real classroom setting will do. If a virtual scenario is seen as realistic and authentic by the users, it can result in a feeling of presence, what means, that people feel, think, and behave like the way they do in a similar situation in the real world (Pertaub, Slater, & Baker, 2002).

The MITHOS-Project aims to create a virtual classroom with adaptive virtual agent behavior to train student teachers in effective conflict regulation (e.g., regulate their emotions, develop perspective taking, and prosocial behavior). For this purpose, scenarios were developed that provide the course of a classroom conflict (e. g. a student playing with a mobile instead of working on the task).

RQ1. How realistic is the classroom perceived? If the classroom and the student agents are perceived as realistic, we will see this as an indicator for authenticity of the scenario and the interaction.

RQ 2. Will student teachers, who interact with the VR-setting, have negative emotions, when the virtual student behaves non-compliantly? If the negative behavior of the student evokes negative feelings and stress, we will see this as an indicator for authenticity of the scenario and the interaction.

To investigate our research questions, we let student teachers (N=18, age M=26.61 years, SD=6.50; semester M=7.00, SD=3.63) teach virtual student agents a self-developed opening sequence in one of their subjects. We assessed the perceived realism of the classroom with a believability (Seufert et al., 2022) and a realism (Poeschl & Doering, 2013) scale and evoked emotions and perception of the conflict and its resolution with self-developed items (all with a 5-point Likert scale).

The results show that the situation was perceived as a conflict by the student teachers (M=4.32, SD=.89) that is comparable with a real-life classroom conflict (M= 3.35, SD=1.04) and for almost all of them, this conflict was not solved at the end of the simulation. Overall, the classroom was perceived as partly realistic (M=2.79, SD=.97).

The student’s behavior was described as disruptive, rebellious, challenging, disrespectful and alarming (with a mean (± standard deviation) of 4.68 (±.58), 4.53 (±.70), 3.95 (±1.08), 4.21 (±.98) and 3.32 (±1.29) respectively). The negative emotions (like f.e. agitation, nervousness, disappointment, anger) towards his behavior (M=3.23, SD=.74) were stronger than the ones towards the other students (M=2.10, SD=.90).

Regarding our research questions, the scenario and the interaction elicit negative emotions in the student teachers. The scenario is perceived as authentic and can therefore be used to train professional skills. Areas of improvement are also identified and discussed.

Poster

Critical Thinking – Erfassung des kritischen Umgangs mit Internet-basierten Informationen von Studierenden im internationalen Vergleich

Katharina Frank¹, Olga Zlatkin-Troitschanskaia¹, Dominik Braunheim¹, Marie Nagel¹, Richard Shavelson²

¹Johannes Gutenberg-Universität Mainz, Deutschland; ²Stanford Graduate School of Education, United States

Theoretischer Hintergrund. Studierende nutzen im Lernprozess zunehmend digitale Angebote zur Informationsbeschaffung (Mauer et al., 2020; Yu et al., 2018). Der freie Zugang zu einer großen Menge an digitalen Ressourcen birgt jedoch die Herausforderung, auf unzuverlässige oder gar falsche Inhalte beim Lernen zurückzugreifen (Bak et al., 2019; Richter & Maier, 2018). Diese Informationsflut bedarf einen kritischen Umgang mit Online-Medien und deren Inhalten (Liu et al., 2014; Osborne et al., 2022; Tribukait, 2017). Die Kompetenz, mehrere und teilweise widersprüchliche Quellen kritisch zu bewerten und anhand dieser Quellen zu einem argumentieren Schluss zu kommen (Critical Thinking, CT), wird für den Erfolg im Studium immer wichtiger (Weber et al., 2019). Trotz der hohen Relevanz wird CT oft nur in begrenztem Ausmaß universitär gefördert bzw. ist wenig explizit curricular verankert (Wineburg et al., 2018; Autoren, 2019). Für die Etablierung effektiver pädagogischen Interventionen in der Lehre ist die valide Erfassung des CT von Studierenden unabdingbar, wobei insbesondere in internationaler Perspektive u.a. die Komplexität der Entwicklung und Validierung eines CT-Assessments zu berücksichtigen ist (Berman et al., 2020; Braun et al., 2020; Davey et al., 2015; Ronderos et al. 2021).

Fragestellung. Um das CT von Studierenden valide zu messen, wurde in einem internationalen Konsortium ein komplexes Szenario-basiertes Perfomance Assessment (PA) entwickelt. Ein PA beinhaltet eine realitätsnahe Simulation einer Entscheidungssituation. Es enthält vorselektierte (un-)relevante, (un-)zuverlässige und teilweise widersprüchliche Quellen und Informationen, die den Studierenden bei ihrer Entscheidung zur Verfügung stehen. Es wurde ein harmonisiertes PA für eine international-vergleichende Studie entwickelt und in vier Ländern (Deutschland, Kolumbien, Schweiz, USA) Cognitive Labs (CogLab) mit je zehn Studierenden nach einem gemeinsamen Protokoll durchgeführt. Der Antwortprozess der Studierenden zum PA wird im CogLab durch Think Alouds begleitet (Leighton, 2017), um u.a. die übergeordnete Fragestellung zu untersuchen, inwieweit mittels des international harmonisierten PA das CT von Studierenden länderübergreifend erfasst werden kann und welche Gemeinsamkeiten oder Differenzen sich bei den theoretisch erwarteten kognitiven Prozessen bei der PA-Bearbeitung zeigen.

Methode. Nach einer Pre-Test-Studie mit 10 Probanden (n₁=5 deutsch-sprachiges PA und n₂=5 englisch-sprachiges PA) im Sommersemester 2023 umfasst die CogLab-Studie im Wintersemester 2023/2024 Erhebungen an den vier o.g. internationalen Standorten mit jeweils N=10 Bachelor-Studierenden. Die schriftlichen Antworten von Probanden zum PA werden anhand eines international harmonisierten Scoring-Schema mit 5-Punkte-Likertskala zu vier CT-Facetten (Analysieren und Bewerten der Informationen; Erkennen und Abwägen der Konsequenzen; Formulieren und Kommunizieren eines kohärenten Arguments; Perspektivenübernahme; s. Braun et al., 2020) mit 17 Subdimensionen von mind. zwei Ratern ausgewertet, um die CT-Performance zu bestimmen. Die qualitative Inhaltsanalyse der transkribierten Think Aloud-Daten aus den CogLabs werden mittels eines weiteren einheitlich harmonisierten Scoring-Schema der PA-Aufgabenlösung, Informationsverarbeitung und Argumentation bei der Entscheidungsfindung etc. ausgewertet.

Ergebnisse. Die Ergebnisse der Pre-Test-Studie deuten auf unzureichende CT-Kompetenzen der Studierenden hin (Mean₁=2.173; Mean₂=1.613 von maximal 5 Punkten), wobei in allen Facetten starke Varianz u.a. auch in der Anzahl der verwendeten Quellen vorliegt. Die bisherigen Ergebnisse stehen im Einklang mit früherer Forschung, die auf eine insgesamt unzureichende und begrenzte Förderung von CT-Kompetenz im Studium hinweist. In dem Poster werden v.a. die zentralen Ergebnisse aus der Validierungsanalyse des neuen PA und dabei insbesondere der kognitiven Prozesse bei der PA-Bearbeitung. Bei der Analyse werden neben Hinweisen auf die Einsetzbarkeit des neuen PA (z.B. Äquivalenz der Antwortprozesse) (Padilla & Leighton, 2017; Solano-Flores & Li, 2009) im internationalen Vergleich (Berman et al., 2020), auch tiefergreifende Einblicke in die Unterschiede im CT-Niveau der Studierenden in vier Ländern gewonnen, wobei u.a. sprachliche und kulturelle Unterschiede als Kontextvariablen für Konstruktirrelevante Varianz (Oliveri et al., 2019) berücksichtigt werden. Die Erkenntnisse können nicht nur zur Weiterentwicklung der Forschung zur validen CT-Erfassung beitragen in internationalen Studien beitragen, sondern auch wichtige Hinweise auf die Förderung von CT liefern, die für die Hochschullehre relevant sind.

Poster

Gamification at school: A cross-cultural focus group study on likes and dislikes regarding computer games

Lia Grahl¹, Konstanze Schoeps², Silvia Postigo-Zegarra², Alessia Signorelli³, Annalisa Morganti³, José Antonio Lozano-Quilis⁴, Frances Hoferichter¹

¹Universität Greifswald; ²University of València; ³University of Perugia; ⁴Politecnical University of València

Theoretical Background

Social and emotional skills determine how well people adjust to their environment, maintain relationships, pursue goals, understand and manage emotions and learn from experience (Napolitano et al., 2021). Particularly, students from disadvantaged backgrounds have reported to lack social-emotional competences compared to their more advantaged peers (OECD, 2021) and often experience rejection and social exclusion by their classmates (Wahl et al., 2022). However, gamification may be a promising approach to engage all students of a class in playing together and learn new competencies (Zeybek & Saygı,2023). In fact, research indicates that serious games focusing on students’ social and emotional learning (SEL) have been linked to promote mental health problems and enhanced well-being (De la Barrera et al., 2021). Taking a European youth perspective, it is not clear yet, what likes and dislikes students across different countries associate with serious games in order to engage them in participating in a digital SEL-intervention to develop socio-emotional competences, promoting well-being and social inclusion (SEL4@ll).

Research Question

Previous to the design and implementation of the serious game SEL4@ll, using a target- and needs oriented approach, the aim of this study was to analyze students’ uses and preferences for a serious game and collect ideas for its design. Furthermore, we were interested in their perception on social inclusion and their socio-emotional problems and needs.

Method

Following a co-creative approach in designing a serious game, 45 secondary school students (M_age = 14.92, age range 12-16 years, 44% girls) from Greifswald (n = 18), Valencia (n = 15), and Perugia (n = 12) participated in focus group interviews during school hours, lasting about 60 minutes. The focus groups were thematically centered around a) emotions and motives related to playing videogames, b) expectations and preferences for a serious game as well as c) perception of challenges and needs in students’ socio-emotional competences and social inclusion within the school. Focus groups were analyzed using thematic interpretive analysis (Braun & Clark, 2006).

Results

Results indicate that about 58% of all students use technical devices almost every day in their free time. The main reasons for playing videogames are that they experience positive emotions (fun, satisfaction), they feel socially connected and just find it relaxing. The most important thing that students mentioned is that it should resemble a real videogame, with all the features that they like in their favorite videogames and with the possibility to customize according to their preferences and needs. Adolescents from the focus groups feel quite incompetent regarding their emotions. They often feel overwhelmed by unpleasant emotions (stress, frustration, fear, anger) and tend to use dysfunctional emotional regulation strategies such as aggressive behavior, holding on or escaping from the emotion. In the focus groups, students discussed a variety of social problems at school related to maltreatment based on lack of respect, social exclusion and teachers’ lack of support for students. Nevertheless, they came up with a number of suggestions that would help to improve the social climate at school, for instance, improving group culture, developing empathy, learning conflict resolution skills and getting support from adults.

Conclusions

The focus groups indicate that European adolescents could benefit from a serious game like SEL4@ll to improve their social and emotional skills and enhance school well-being and social inclusion.

Poster

Was wissen wir über die Unterrichtsqualität an inklusiven Grundschulen? - Ein systematischer Literaturreview

Katja Martin, Stefanie Bosse, Nadine Spörer

Universität Potsdam, Deutschland

Bislang zeigten vergleichende Studien, dass Kinder mit sonderpädagogischem Förderbedarf eine günstigere kognitive Kompetenzentwicklung aufweisen, wenn sie in einer inklusiven Lernumwelt beschult werden im Kontrast zur Beschulung an Förderschulen (Kocaj et al., 2014; Lindsay, 2007; Myklebust, 2006; Ruijs & Peetsma, 2009). Dabei bleibt ungeklärt, welche Merkmale der Lernumwelt diese verschiedenen Kompetenzniveaus bedingen. Ein wichtiger Prädiktor für die Kompetenzen der Schulkinder ist die Unterrichtsqualität (Hattie, 2009). Entsprechend des Angebots-Nutzungs-Modells von Helmke (2017) lassen sich zehn Merkmale der Prozessqualität von Unterricht unterscheiden: Klassenführung, lernförderliches Klima, Motivierung, Klarheit und Strukturiertheit, Schülerorientierung, Aktivierung, Konsolidierung, Kompetenzorientierung, Umgang mit Heterogenität und Methodenvielfalt. Ein Literaturreview zur Unterrichtsqualität an Förderschulen ergab, dass sich bislang nur wenige Studien dieser Thematik widmeten (Autor:innen, 2018). Dementsprechend stellt sich die Frage: Zu welchen Ergebnissen kommt ein Literaturreview zur Unterrichtsqualität an inklusiven Grundschulen?

Das Ziel dieser Untersuchung ist es, den Forschungsstand zur Unterrichtsqualität inklusiver Grundschulen in Deutschland systematisch zu erheben. Dazu wurden bisherige Studien mithilfe eines systematischen Literaturreviews analysiert und synthetisiert, um folgende Forschungsfragen zu beantworten: Welche Merkmale von Unterrichtsqualität (nach Helmke, 2017) werden in der Forschung adressiert? Wie hoch ist die Unterrichtsqualität an inklusiven Grundschulen?

Zur Identifizierung relevanter Literatur wurden acht Datenbanken (z. B. PsycINFO, FIS Bildung) genutzt. Die Literatursuche basierte auf einer Suchsyntax von 100 logischen Kombinationen deutscher Schlüsselwörter, welche u.a. die zehn Unterrichtsqualitätsmerkmale adressierten (z. B. Inklusion UND Schule UND Motivierung). Anschließend wurden die N = 8586 ermittelten Publikationen in zwei Schritten selegiert, um adäquate Publikationen für die Volltextanalyse und Synthese herauszufiltern.

Im ersten Selektionsschritt entschieden zwei unabhängige trainierte Rater:innen anhand von vier Ausschlusskriterien (ausschließlich kein Bezug zu Deutschland, zur Inklusion, zur Grundschule und zur Unterrichtsqualität), ob eine Publikation auf Basis des Titels relevant war oder nicht. Ausgeschlossen wurden Publikationen, wenn mindestens ein Ausschlusskriterium erfüllt war. In diesem Schritt wurden N = 2103 Publikationen angenommen (κ = 0.78). Im zweiten Schritt beurteilten zwei unabhängige Rater:innen basierend auf dem Abstract die Eignung der angenommenen Texte anhand von jeweils fünf Ein- und Ausschlusskriterien (Einschlusskriterien: empirische Studie, Bezug zum deutschen Schulsystem, zu Inklusion, zur Grundschule und zur Unterrichtsqualität). Für die Volltextanalyse wurden Publikationen eingeschlossen, wenn alle Einschlusskriterien, jedoch kein Ausschlusskriterium, erfüllt waren. Final wurden N = 30 Publikationen angenommen (κ = 0.90).

Aktuell werden diese Volltexte anhand eines deduktiven Kategoriensystems von zwei unabhängigen Rater:innen kodiert. Dieses umfasst Publikationsmerkmale, Aspekte zum Forschungsdesign und der Stichprobe sowie Kategorien zu Forschungsergebnissen. Die Beurteilung der Unterrichtsqualitätshöhe erfolgte in drei Stufen (gering – mittel – hoch). Dies basierte entweder auf Zuordnung innerhalb der Studien (z.B. Normwerte) oder auf berichteten zentralen Tendenzen sowie Skalierungen der Messungen. Bislang wurden N = 9 Publikationen kodiert. Die Majorität bildeten quantitative Querschnittsstudien. Die Stichprobengröße variierte zwischen N = 33 bis 350 Personen. Zum derzeitigen Auswertungsstand wurden nicht alle Unterrichtsqualitätsmerkmale adressiert (z. B. Aktivierung, Motivierung). Am häufigsten wurden der Umgang mit Heterogenität (N = 6 Studien) und die Methodenvielfalt (N = 5 Studien) untersucht. Bezüglich der Differenzierung ergaben die Forschungsarbeiten, dass Lehrkräfte berichten, sie verfügen über zu wenig Wissen über differenzierendes Material (Beck, Lohmann & Hensen, 2015). Der Umgang mit Heterogenität nahm etwa ein Drittel der Unterrichtszeit ein (Textor, 2007). Ferner wurde herausgefunden, dass Lehrkräfte Binnendifferenzierung vielfältig praktizieren (Textor, 2007; Winkler, 2016). Hinsichtlich der Methodenvielfalt ergaben die Untersuchungen, dass offene Unterrichtsformen selten verwendet wurden (Krawitz, Theis-Scholz & Thümmel, 1996; Textor, 2007), 48% der Lehrkräfte jedoch offenen Unterricht als „wichtig“ einstuften (Krawitz et al., 1996). In Hinblick auf Sozialformen, fand der Unterricht an inklusiven Grundschulen vorwiegend im Klassenverband statt, gefolgt von Einzelarbeit und Partnerarbeit (Reichardt, 2009; Textor, 2007). Anzumerken ist, dass die Vergleichbarkeit der Studien aufgrund von stark variierenden Methoden und Stichproben limitiert ist. Bis zur Tagung werden alle Publikationen kodiert und analysiert werden.

Poster

„Obwohl die Daten immer dieselben sind …!“ - Die graphische Darstellung von Lernverläufen beeinflusst die eingenommene Bezugsnorm bei der Interpretation

Erika Lunowa¹, Sarah Bez^1,2, Samuel Merk¹

¹Pädagogische Hochschule Karlsruhe, Deutschland; ²Universität Tübingen, Deutschland

Theoretischer Hintergrund

Technologiebasiertes formatives Assessment hält zunehmend Einzug in deutschen Schulen (Jude et al., 2020) und bietet die Möglichkeit, Lernverläufe vieler Schüler*innen regelmäßig konstruktvalide zu erheben (Bez et al., 2023; Lachner et al., 2020). Diese Daten können der Lehrkraft in Echtzeit zur Verfügung gestellt werden (Molenaar & Knoop-van Campen, 2019) und ermöglichen eine adaptive Unterrichtsgestaltung (Lachner et al., 2020).

Die dafür notwendige Leistungsbeurteilung kann durch den Vergleich mit einem Standard (Heckhausen, 1974) anhand von drei Bezugsnormen erfolgen: der „kriterialen Bezugsnorm“ (auch „sachliche Bezugsnorm“), der „sozialen Bezugsnorm“ sowie der „individuellen Bezugsnorm, welche auch als „intraindividuelle“, „ipsative“ oder „temporale Bezugsnorm“ bezeichnet wird (Merk & Bez, 2023). Bei der Wahl der Bezugsnorm handelt es sich nach Merk und Bez (2023) um eine normative Entscheidung, da für jede Bezugsnorm ein anderer Idealzustand festgelegt wird: Sehr gute Leistungen können dadurch gekennzeichnet sein, dass ein festgelegter Bildungsstandard, z. B. als höchste lehrplanbezogene Kompetenzstufe, erreicht wurde (kriteriale Bezugsnorm), dass die Schüler*innen mehr Punkte als ihre Mitschüler*innen erreichen (soziale Bezugsnorm) oder dass sie einen Lernzuwachs nachweisen können (individuelle Bezugsnorm). Dabei gilt die Orientierung an der individuellen Bezugsnorm über die damit einhergehende Motivationssteigerung als lernförderlich und die Verwendung der kriterialen Bezugsnorm als vorteilhaft, weil deutlich wird, welche lehrplanbezogenen Kompetenzen von welchen Lernenden (noch) nicht erworben wurden (Rheinberg, 2014). Die theoretische Grundlegung von Formativem Assessment impliziert die Anwendung dieser beiden Bezugsnormen.

Obwohl in der Unterrichtspraxis mehrere Bezugsnormen verwendet werden (Lintorf & Buch, 2021), weisen Lehrkräfte die Tendenz zur Verwendung einer bestimmten Bezugsnorm auf. Diese sogenannte „Bezugsnormorientierung“ (Rheinberg, 1980) gilt als relativ stabil, wobei auch flexible Anteile angenommen werden (Lintorf & Buch, 2021). Empirisch begründet kann davon ausgegangen werden, dass Lehrkräfte prädominant sozial normieren, wobei es hierzu nur wenige Untersuchungen gibt (Lintorf & Buch, 2021; Wilbert & Gerdes, 2009; Wilbert & Grünke, 2010). In der Forschung wird die Bezugsnormorientierung von Lehrkräften häufig mit Hilfe von Selbstauskünften erhoben (Dickhäuser & Rheinberg, 2003), deren Validität durch Antworttendenzen beeinträchtigt sein kann (Eid et al., 2017). Gleichzeitig erscheint die „Kleine Beurteilungsaufgabe“ von Rheinberg (1980) wenig authentisch (Holder & Kessels, 2018), so dass alternative Erhebungsverfahren wünschenswert wären.

Damit digitale formative Assessmentsysteme ihren Zweck erfüllen, sollten sie so gestaltet sein, dass individuell und kriterial normierte Rezeption der Lernverläufe naheliegt. Die Datenvisualisierung ist insofern bedeutsam, als dass Visualisierungen keine neutralen Datenabbildungen sind (Drucker, 2014) - die Graphiken können gezielt eine Bezugsnorm adressieren. Daher zielt die vorliegende Studie auf die Beantwortung folgender Forschungsfragen ab:

(1) Verwenden Studierende unterschiedliche Bezugsnormen bei der Interpretation einer möglichst neutralen Darstellung von Lernverläufen?

(2) Wie stark beeinflusst die graphische Darstellung von Lernverläufen unter Kontrolle der globalen Bezugsnormorientierung die eingenommene Bezugsnorm bei der Interpretation?

Methode

In einem kontrollierten Online-Experiment wurden Daten von 103 Studenten*innen (davon 71 weiblich, 31 männlich und 1 divers) erhoben. Diese interpretierten zunächst eine möglichst neutrale Darstellung ökologisch valider Lernverläufe in einem offenen Textfeld. Mit einer geschlossenen Frage, welche Information die Studenten*innen zentral fänden, wurde die Bezugsnormorientierung erfasst. Zur Überprüfung der Konstruktvalidität wurde die „Kleine Beurteilungsaufgabe“ von Rheinberg (1980) bearbeitet. Anschließend erhielten die Studierenden dieselben Daten in einer bezugsnormhervorhebenden Darstellung. Dazu wurden entweder Leistungsergebnisse der Lernenden verbunden (individuelle Bezugsnorm) bzw. Kompetenzstufen (kriteriale Bezugsnorm) oder Informationen über eine Vergleichsgruppe (soziale Vergleichsnorm) eingezeichnet. Nach erneuter Beantwortung der offenen und geschlossenen Frage kann eine logistische Regression zur Beantwortung der Forschungsfragen berechnet werden. In einer multiplen Regression kann zusätzlich kontrolliert werden, ob die Studierenden bei der Randomisierung ihrer bevorzugten Bezugsnorm zugeordnet wurden.

Ergebnisse und Diskussion

Die Ergebnisse liegen zum Zeitpunkt der Konferenz vor und werden diskutiert.

Poster

Wie lassen sich digitale 3D-Modelle mechanisch-technischer Systeme im Technikunterricht einsetzen?

Igor Gideon, Jennifer Stemmann

Pädagogische Hochschule Freiburg, Deutschland

Menschen werden fortwährend mit neuen mechanisch-technischen Alltagssystemen (z.B. Küchengeräte) konfrontiert. Während die Nutzung mithilfe von Bedienungsanleitungen oder eigenem Ausprobieren wenig Vorwissen erfordert (Stemmann, 2021), verlangt z.B. eine Reparatur Wissen über das grundlegende Funktionsprinzip technischer Systeme (Eberlin & Hock, 2014). Ziel des allgemeinbildenden Technikunterrichts ist es daher Schüler*innen darin zu fördern, Wissen über den Aufbau und Funktionsprinzipien technischer Systeme zu erwerben (Bildungsplan Baden-Württemberg, 2016). Hierzu wird oft die Unterrichtsmethode der Produktanalyse vorgeschlagen (z.B. Schlagenhauf, 2013), in der Lernende reale, industriell hergestellte Alltagsgeräte (z.B. Handrührgerät) demontieren, um deren Struktur (Form und Anordnung von Einzelkomponenten) zu untersuchen.

Die Herausforderungen in der Unterrichtspraxis bestehen dabei häufig in einer unzureichenden Anzahl vorhandener Demontagegeräte sowie lehrkräfteseitigem Aufwand für Reparatur oder Entsorgung. Zudem lassen sich die in mechanisch-technischen Systemen vorhandenen dynamischen Prozesse (d.h. Bewegungen einzelner Komponenten, die auf andere Komponenten wirken) im demontierten Zustand nicht betrachten. Digitale Modelle können hierbei eine Alternative darstellen. Zur Erfassung dynamischer Prozesse werden in diesem Kontext Animationen eingesetzt (Schnotz & Lowe, 2008). Allerdings zeigen Studien, dass Animationen die Aufmerksamkeit überwiegend auf dynamische Prozesse lenken und somit vom Erfassen der Strukturen ablenken (Ploetzner et al., 2021). Zur Strukturerfassung sind Bilder oft effektiver (ebd.). Diese sind aber statisch und ermöglichen nur eine begrenzte Perspektive, was für die Exploration mechanisch-technischer Systeme nachteilig sein kann. Digitale dreidimensionale Modelle bieten hingegen die Möglichkeit, sowohl die Struktur als auch dynamische Prozesse innerhalb einer Darstellung aus beliebigen Perspektiven zu betrachten. Die Lernwirksamkeit digitaler 3D-Modelle wurde z.B. in der Bautechnik (Carbonell-Carrera et al., 2021) oder bei der Steuerung digitaler Quadrocopter (Chen et al., 2020) vereinzelt erforscht. Studienergebnisse, welche die Lernwirksamkeit digitaler 3D-Modelle hinsichtlich der Struktur, des Verhaltens und Zusammenwirkens einzelner Komponenten eines mechanisch-technischen Systems beleuchten, fehlen allerdings.

Die in den genannten Studien verwendeten 3D-Modelle lassen neben der Manipulation von Ansichten und Bauteilen auch die Simulation der stattfindenden dynamischen Prozesse zu. Da die Erstellung digitaler Simulationen technisch aufwändig und von Lehrkräften nicht leistbar ist, stellt sich die Frage, ob Lernende sich die dynamischen Prozesse anhand von (statischen) 3D-Modellen erschließen können, die diese Dynamik nicht simulieren. Wir nehmen an, dass Schüler*innen anhand der erfassten Systemstruktur in der Lage sind, die Bewegungen der Bauteile und ihr Zusammenspiel zu erschließen und so die gesamte Systemfunktion zu erkennen. Andererseits ist nicht auszuschließen, dass Schüler*innen Schwierigkeiten haben können, dynamische Aspekte ausschließlich anhand statischer digitaler 3D-Modelle zu erschließen, da dies zusätzliche kognitive Aktivitäten verlangt und Lernende überfordern kann (Khacharem et al., 2015).

Dieser Beitrag untersucht, inwieweit Schüler*innen in der Lage sind, strukturelle und dynamische Aspekte mechanisch-technischer Systeme durch die Exploration digitaler 3D-Modelle zu erfassen und zu erschließen.

Zur Beantwortung der Fragestellung wurde ein Wissenstest mit 27 Items entwickelt und an 45 Technikschüler*innen (M=14.6 Jahre, SD=.55 Jahre) pilotiert. Dieser erfasst das Wissen bezüglich der Struktur, des Verhaltens und des Zusammenwirkens einzelner Komponenten nach der Exploration. Außerdem wurden das gegenstandsspezifische Vorwissen, das allgemeine mechanisch-technische Verständnis (Hartweg et al., 2010) sowie die Fähigkeit zur mentalen Rotation (Yoon, 2011) ermittelt. Für die Durchführung der Studie wurde ein digitales 3D-Modell eines Türschlosses konstruiert. Nach der Ermittlung individueller Unterschiede mit den genannten Instrumenten wurde den 117 Lernenden (M=15.1 Jahre, SD=.77 Jahre) das Modell bereitgestellt mit der Aufgabe den Aufbau des Türschlosses zu untersuchen und seine Funktionsweise zu verstehen. Dieses Wissen und Verständnis wurden anschließend erfasst.

Die Ergebnisse der vorliegenden explorativen Studie zeigen, dass digitale 3D-Modelle im Technikunterricht eine lernförderliche Wirkung haben können (Gideon et al., 2023). Allerdings wurden Schwierigkeiten der Lernenden bei der Beantwortung von Fragen zum Zusammenwirken der Einzelkomponenten festgestellt (Struktur: M=61,9%, SD=20,3%; Verhalten: M=65,5%, SD=21,1%; Zusammenwirken: M=40,1%, SD=22,7%). Infolgedessen werden weitergehende Untersuchungen durchgeführt, um Möglichkeiten zur Reduzierung dieses Verständnisproblems zu ergründen. Hierfür wird der Prozess des Explorationsverhaltens der Lernenden analysiert.

Poster

Digitale häusliche Lernumwelt – Veränderungen der elterlichen Unterstützung bei der informationsorientierten Internetnutzung von der fünften zur siebten Klassenstufe

Nicole Gruchel¹, Ricarda Kurock², Heike M. Buhl¹

¹Pädagogische Psychologie und Entwicklungspsychologie, Universität Paderborn, Deutschland; ²Kognitive Psychologie und Psychologiedidaktik, Universität Paderborn, Deutschland

Hintergrund

Die Nutzung digitaler Medien spielt für Bildungs- und Lernzwecke bereits seit vielen Jahren eine wichtige Rolle. Auch wenn die Digitalisierung in Schule und beim Lernen durch die COVID-19-Pandemie vorangeschritten ist, wird das Lernen mit digitalen Medien am Lernort Schule aber noch immer nicht systematisch vermittelt (Eickelmann & Gerick, 2020). Wichtige Kompetenzen im Umgang mit digitalen Medien werden somit eher im außerschulischen Bereich angeeignet, indem Kinder digitale Medien vor allem in familialen Lernsettings nutzen (Lauricella & Cingel, 2020; Scherer & Siddiq, 2019).

Bei der Untersuchung der Rolle der Familie für das Lernen mit digitalen Medien ist die elterliche Unterstützung von zentraler Bedeutung, die im vorliegenden Kontext vor allem als konkrete elterliche Instruktion bei Internetaktivitäten betrachtet wird (Bonanati & Buhl, 2021). Neben der Quantität ist die Qualität elterlicher Instruktion entscheidend für die Motivation und das Lernen von Kindern (Knollmann & Wild, 2007; Wild, Rammert & Siegmund, 2006). Dabei erwies sich eine autonomieunterstützende, strukturgebende und zugleich wertschätzende Instruktion als besonders gewinnbringend (Griffith & Arnold, 2019; Ryan & Deci, 2000;).

Aus der Forschung zur elterlichen Hausaufgabenunterstützung ist bekannt, dass die elterliche Unterstützung unter anderem auf Grund der steigenden Komplexität der Unterrichtsinhalte, der steigenden Selbstständigkeit sowie dem zunehmenden Autonomiebedürfnis der Lernenden im Schulverlauf abnimmt (Luplow & Schneider, 2018). Wie sich die elterliche Unterstützung bei der informationsorientierten Internetnutzung von Kindern über die Zeit verändert, ist in bisherigen Untersuchung bislang nur wenig betrachtet worden. Derartige Befunde könnten Hinweise auf eine geeignete zeitliche Verankerung von Fördermaßnahmen unter Einbezug der Familie geben.

Fragestellung und Methode

Ableitend ergibt sich für die vorliegende Untersuchung folgende Frage:

Wie verändert sich die Quantität und Qualität elterlicher Unterstützung bei der informationsorientierten Internetnutzung von Kindern zwischen der 5. und 7. Klassenstufe?

Zur Prüfung der Fragestellung werden längsschnittliche Daten genutzt, die im Rahmen des BMBF-Projekts „Digital Home Learning Environment“ im Jahr 2019/2020 in den fünften Klassen (~10-11 Jahre) und im Jahr 2021/22 in den siebten Klassen (~12-13 Jahre) erhoben wurden. Schriftlich befragt wurden Schüler:innen sowie deren Eltern innerhalb von Nordrhein-Westfalen. Für die vorliegende Untersuchung werden längsschnittliche Daten von insgesamt 395 Schüler:innen sowie 191 Eltern einbezogen.

Veränderungen wurden mittels t-Test für unabhängige Stichproben ermittelt. Alle statistischen Analysen wurden mit der Software SPSS (Version 29.0) durchgeführt.

Ergebnisse und ihre Bedeutung

Von der fünften zur siebten Jahrgansstufe nahm die Quantität elterlicher Instruktion sowohl aus Eltern- als auch aus Kinderperspektive signifikant ab. Hinsichtlich der Qualität elterlicher Unterstützung zeigt in der Elternperspektive eine signifikante Abnahme der autonomieunterstützenden Instruktion, während in der Kinderperspektive sowohl eine Abnahme der autonomieunterstützenden als auch wertschätzenden Instruktion sichtbar wurde. Darüber hinaus zeigte sich, dass die Kinder der fünften Klasse bei der allgemeinen Nutzung digitaler Medien noch überwiegend von den Eltern unterstützt wurden, während die Kinder der siebten Klasse hingegen signifikant häufiger angaben, dass sich Eltern und Kinder bei der Nutzung digitaler Medien gegenseitig unterstützen und zum Teil Kinder sogar verstärkt ihre Eltern bei der Nutzung unterstützen. Die Ergebnisse der Studie schließen somit an bisherige Befunde im Bereich der elterlichen Hausaufgabenunterstützung an (Luplow & Schneider, 2018), zeigen jedoch auch, dass die elterliche Unterstützung insbesondere bei einer komplexeren Nutzung digitaler Medien im zunehmenden Alter auch immer vor dem Hintergrund der aktiven Rolle des Kindes betrachtet werden muss. Die Ergebnisse werden auch vor dem Hintergrund von Veränderungen durch die COVID-19-Pandemie diskutiert.

Poster

Epistemologische Überzeugungen als Einflussfaktoren beruflicher Belastungen und Beanspruchung im Lehrerinnen- und Lehrerberuf? Ergebnisse aus einer quantitativen Untersuchung von Grundschul- und Mittelschullehrkräften.

Sibylle Schneider

Universität Augsburg, Deutschland

Gegenstand der Posterpräsentation sind epistemologische Überzeugungen als Einflussfaktoren auf die beruflichen Belastungen und das Beanspruchungserleben von Grundschul- und Mittelschullehrkräften. Bei letzteren beiden Konzepten handelt es sich zwar um kein völlig neues Forschungsthema, sind doch Lehrerinnen und Lehrer wie auch andere soziale und helfende Berufe überproportional häufig von Burnout u.ä. betroffen (Barth, 1997; Enzmann & Kleiber, 1989; Faber & Messner-Kaltenbrunner, 2017; Vandenberghe & Huberman, 2006). Im Hinblick auf Erklärungsfaktoren dafür wird in der vorgestellten Studie von einer bisher weniger gut beforschten Rahmung ausgegangen, worin neben epistemologischen Überzeugungen u.a. in diesem Zusammenhang auch soziologische und sozialstrukturelle Perspektiven in den Blick genommen werden.

Kontextuelle Merkmale und die Komposition von Schulen und Klassen als Faktoren schulischer Umwelten werden häufig mit beruflichen Belastungen und Burnout im Lehrerberuf in Verbindung gebracht (Shackleton, Bonell, Jamal, Allen, Mathiot, Elbourne et al., 2019), darüber hinaus auch personale Ressourcen und Merkmale der subjektiven Wahrnehmung und Bewertung von Arbeitsbelastungen und des Beanspruchungserlebens von Lehrkräften, die einen wichtigen Teil der Lehrerprofessionalität darstellen (Cramer & Binder; 2015; Cramer, Friedrich & Merk, 2018: Integratives Rahmenmodell; Eder-Karavaya, Lohr & Treutner, 2021). Demgegenüber befinden sich in der vorliegenden Untersuchung folgende Fragen zu Einflussfaktoren auf das Stresserleben von Lehrkräften im Vordergrund des Forschungsinteresses: Wie wirken sich professionelle Überzeugungen, bspw. instruktivistische vs. konstruktivistische Teacher Beliefs, pädagogische Orientierungen und soziale Einstellungen, auf die Arbeitsüberforderung, das Kontrolliertheitserleben und die Arbeitsunzufriedenheit von Lehrerinnen und Lehrern, d.h. erste Anzeichen von Burnout, aus? Welche Unterschiede zeichnen sich dahingehend zwischen Grund- und Mittelschullehrkräften ab? Welche Effekte zeitigen sozialstrukturelle Merkmale und Herkunftsmerkmale der Lehrkräfte in ihrem Stresserleben im Vergleich zu Kontextmerkmalen von Schulen und Klassen?

Antworten auf diese forschungsleitenden Fragen basieren auf Ergebnissen aus einer einmaligen Paper-Pencil-Befragung von Lehrkräften an Grund- und Mittelschulen (N=161) in zwei Metropolregionen im südbayerischen Raum (Ex-post-facto-Forschung, Surveydesign mit Querschnittuntersuchung und Selbstselektion der Untersuchungsteilnehmer*innen). Folgende Merkmal der Professionalität im Lehrerberuf, die je nach Ausprägung Stress im Beruf verursachen können, sind Gegenstand der Analyse: Teacher Beliefs (Traditional vs. Behaviorist Management, Traditional vs. Behaviorist Teaching, Constructivist Teaching, Constructivist Parents, nach Wooley & Wooley, 1999, übersetzt und validiert), pädagogische Orientierungen (Autonomie, Fürsorglichkeit des Lehrers, Anlageorientierung), Merkmale der Resilienz von Lehrkräften, Einstellungen zum Beruf und zu gesellschaftsrelevanten Themen, kulturelle Kapitalien und der sozialstrukturelle Status (Bildungsaufsteiger u.ä.), einschließlich der Kontextmerkmale von Schulen und Klassen. Der Kern dieser Studie stellt u.a. die Validierung eines Fragebogens zu Teacher Beliefs von Wooley und Wooley (1999) aus dem U.S.-amerikanischen Kontext dar, ein vermutlich bislang eher unbekanntes Untersuchungsinstrument im deutschsprachigen Kontext. Zentrale Befunde aus quantitativen Analysen zu den genannten Einflussgrößen auf berufliche Belastungen und das Beanspruchungserleben von Lehrkräften werden vorgestellt.

Poster

Politikdidaktische Überzeugungen von Lehrkräften und ihr Umgang mit Hatespeech in der Schule

Julia Kansok-Dusche¹, Alexander Wettstein², Sebastian Wachs^3,4, Ludwig Bilz¹

¹Institut für Gesundheit, Brandenburgisch-Technische Universität Cottbus-Senftenberg; ²Institut für Forschung, Entwicklung und Evaluation, Pädagogische Hochschule Bern; ³Institut für Erziehungswissenschaft, Universität Münster; ⁴National Anti-Bullying Research and Resource Centre, Dublin City University

Hintergrund. Hatespeech ist ein weltweites Phänomen, das auch an Schulen verbreitet ist (Castellanos et al., 2023) und pädagogische Präventions- und Interventionsmaßnahmen erfordert (Vereinte Nationen, 2021). Hatespeech wird hier als intentional herabwürdigende Äußerung über Personen verstanden, die auf zugeschriebene Merkmale sozialer Gruppen Bezug nimmt (Kansok-Dusche et al., 2022). Da der gesellschaftliche Umgang mit Hatespeech auch durch politische Akteure gestaltet wird, die individuelle Reaktionen darauf als politisches Handeln deuten (Europäische Kommission, 2019), könnten für den Umgang von Lehrkräften mit Hatespeech-Vorfällen in der Schule auch Aspekte ihrer politikdidaktischen Kompetenz bedeutsam sein. Der Beutelsbacher Konsens besagt, dass gesellschaftliche Kontroversen diskursiv und aus mehreren Perspektiven erörtert werden sollten (Wehling, 2016). Lehrkräfte unterscheiden sich jedoch stark in ihren Überzeugungen, inwieweit sie im Unterricht politisch Stellung beziehen sollten (Abs & Hahn-Laudenberg, 2017). Die Forschungsfrage richtet sich daher auf die Assoziation zwischen der politisch-didaktischen Überzeugung (PDÜ) von Lehrkräften und ihrem Umgang mit Hatespeech-Vorfällen in Schulen. Basierend auf einem Kompetenzmodell für Politiklehrende (Oberle, 2012 abgeleitet aus Baumert & Kunter, 2006) wird PDÜ als dispositionaler Aspekt der Interventionskompetenz von Lehrpersonen theoretisiert. Die Assoziationen zwischen PDÜ und Hatespeech-Interventionen (HI) bzw. der Nicht-Intervention ergibt sich durch einen kognitiven Abwägungsprozess (Krause et al., 2023) möglicherweise im Zusammenspiel mit weiteren Kompetenzfacetten (pluralistische Einstellung, politisches Interesse, Selbstwirksamkeit, Fähigkeit zum diskursiven Unterrichten, Wissen über Diskriminierung und Toleranzförderung). Wir erwarten direkte positive Assoziationen aller Kompetenzfacetten mit den drei HI (Hypothese 1) und negative Assoziationen mit der Nicht-Intervention (Hypothese 2).

Methoden. Die Analyse basiert auf einer Stichprobe von 471 Sekundarschullehrenden aus 38 Schulen in Deutschland (n = 251) und der Schweiz (n = 220) (M_Alter = 42.8 Jahre 57.7% weiblich; 21.0% mit Migrationsstatus). Die Lehrpersonen beantworteten freiwillig und anonym einen Fragebogen (12/2020 – 04/2021).

Es wurden drei Formen von HI erfasst (Bilz et al., 2023). Dies waren auf die beteiligten Schüler:innen gerichtete Interventionen (3 Items; α = .77), auf die Klasse gerichtete bildungsorientierte Interventionen (3 Items, α = .81) sowie kooperativ-kollegiale Interventionen (3 Items, α = .70). Ein Item erfasste die Nicht-Intervention. Mit multiplen Items und Skalen werden gemessen: politikdidaktische Überzeugungen (Abs & Hahn-Laudenberg, 2017; 2 Items; r = .76), die pluralistische Einstellung (Akkermann et al., 2014; 3 Items, α = .67), die Fähigkeit zum diskursiven Unterrichten (Diedrich, 2008; 4 Items, α = .79) und die Selbstwirksamkeitserwartung (Fischer et al., 2017; 8 Items, α = .80) sowie Wissen zum Thema Diskriminierung und verletzende Sprache (Neuentwicklung, 1 Item) und das politische Interesse (Otto & Bacherle, 2011; 5 Items, α = .93).

Die Analysen erfolgen separat für die Interventionsmaßnahmen und die Nicht-Intervention mittels Korrelationsanalysen und Mehrebenen-Regressionen. Die Lehrkräfte werden auf Basis ihrer Schulzugehörigkeit gruppiert. Das Nullmodell ermittelt den ICC der Outcome-Variable. Das Kovariatenmodell prüft auf den Ebenen 1 und 2 direkte Effekte der Kontrollvariablen (Ebene 1: Geschlecht, Migrationsstatus, Berufserfahrung: Ebene 2: Land). Das Prädiktormodell erfasst direkte Effekte aller Prädiktoren bezüglich der jeweiligen Interventionsmaßname und der Nicht-Intervention. Eine Verbesserung der Modellgüte indiziert die relative Verringerung von Indizes wie AIC, BIC und ABIC.

Ergebnisse und Diskussion. Die Berechnungen werden gerade durchgeführt. Die Ergebnisse sollen als Poster vorgestellt werden. Trotz Limitationen (z.B. Selbsteinschätzungen, Querschnittsdaten) kann die Studie Forschenden und Praktiker:innen helfen, die Rolle von PDÜ und anderen Aspekten der Interventionskompetenz von Lehrpersonen für deren Umgang mit Hatespeech besser zu verstehen.

Poster

Welche Rolle spielen Erfahrung und Kooperation für die Selbstwirksamkeit von Multiplikator:innen?

Ella Dorothea Hansen¹, Rebekka Stahnke², Malte Lehmann³, Bettina Rösken-Winter³

¹Technische Universität Dortmund; ²IPN - Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Berlin; ³Humboldt-Universität zu Berlin

Theoretischer Hintergrund

Über die Fortbildung von Lehrkräften können Veränderungen des Lehrkräftehandelns und der Unterrichtsqualität initiiert werden (Clarke & Hollingsworth, 2002). Das Projekt QuaMath hat das Ziel durch die Qualifizierung von Multiplikator:innen, die wiederum Lehrkräfte fortbilden, die mathematische Bildung in Deutschland langfristig zu verbessern. Die Gestaltung der Fortbildungen orientiert sich dabei an evidenzbasierten Prinzipien für einen qualitätvollen Mathematikunterricht (Prediger et al., 2022). Die Qualifizierungen der Mutliplikator:innen folgen zusätzlich sechs Gestaltungsprinzipien für eine qualitätvolle Lehrkräftefortbildung: Kooperationsanregung, Reflektionsanregung, Kompetenzorientierung, Teilnehmer:innenorientierung, Fallbezug und Lehr-Lern-Vielfalt (Barzel & Selter, 2015). Eine zentrale Rolle in der Wirkungskette kommt den Multiplikator:innen zu, die meist selbst Lehrkräfte sind. In ihrer Rolle als Multiplikator:innen bilden sie Lehrkräfte fort und initiieren Lehrkräftekooperation als einen wichtigen Faktor für Professionalisierung (Weißenrieder et al., 2015). Bei Lehrkräften zeigt sich, dass eine hohe Selbstwirksamkeitserwartung hinsichtlich des Fortbildungsgegenstands mit einer gesteigerten Motivation zum Transfer sowie einer verbesserten Transferleistung einhergeht (Grossman & Sales, 2011). Auch für Multiplikator:innen wird angenommen, dass ihre Selbstwirksamkeitserwartung bedeutsam für den Transfer von Konzepten in die Lehrkräftefortbildung und letztlich in den Schulalltag ist (Weißenrieder et al., 2015). Inwiefern die Selbstwirksamkeitserwartung von Multiplikator:innen dabei durch ihre Erfahrung sowie eigene Kooperationsaktivitäten beeinflusst wird, ist bisher unklar. Hier setzt der Beitrag an und widmet sich der Frage, inwiefern die Erfahrung und eigene Kooperationsaktivitäten die Selbstwirksamkeitserwartung von Multiplikator:innen hinsichtlich der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen beeinflussen.

Methode

Im Projekt QuaMath wurden 207 Multiplikator:innen mit Vorerfahrungen in der Lehrkräftefortbildung vor Beginn der Qualifizierung befragt. Zur Überprüfung der Fragestellung wurde ein standardisierter Fragebogen genutzt, der neben der Erfahrung als Lehrkraft und Multiplikator:in in Jahren, die Kooperationsaktivitäten mit anderen Multiplikator:innen sowie anderen Lehrkräften im Kollegium, die Überzeugung zur Bedeutung von Kooperation von Lehrkräften für den Transfer (jeweils 4 Items; adaptiert nach Meudt et al., 2020) sowie die Selbstwirksamkeitserwartung bezüglich der Vermittlung der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen (jeweils 3 Items; adaptiert nach Schwarzer & Jerusalem, 1999) erfragte. Die Ergebnisse der Reliabilitätsanalyse zeigen eine gute interne Konsistenz der verwendeten Skalen (α = .72 bis α = .85). Es wurden Multiple Regressionsanalysen durchgeführt, um den Einfluss von Erfahrungen und Kooperationsaktivitäten (Prädiktoren) auf die Selbstwirksamkeitserwartung hinsichtlich der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen (jeweils vorherzusagendes Kriterium) zu untersuchen.

Ergebnisse

Die Auswertung der erhobenen Daten zeigt, dass die Selbstwirksamkeitserwartung der Multiplikator:innen hinsichtlich der sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen signifikant durch die Erfahrung als Multiplikator:in sowie durch eigene Kooperationsaktivitäten vorhergesagt werden kann (R² = .12 bis R² = .23). Die Erfahrungen als Multiplikator:in und die Überzeugung, dass die Kooperation von Lehrkräften für den Transfer wichtig ist, stellen positive Prädiktoren für die Selbstwirksamkeitserwartung hinsichtlich fast aller Gestaltungsprinzipien dar. Besonders hervorzuheben ist die Relevanz der Kooperationsaktivitäten der Multiplikator:innen in ihrer Rolle als Lehrkraft für die Selbstwirksamkeitserwartung bezüglich des Gestaltungsprinzips der Kooperationsanregung (ß = .23; p < .001). Die eigene Kooperation mit anderen Multiplikator:innen ist ein positiver Prädiktor für die Selbstwirksamkeit hinsichtlich überwiegend inhaltlich orientierter Gestaltungsprinzipien, wie der Kompetenzorientierung (ß = .20 bis ß = .33; p < .01).

Diskussion

Die Ergebnisse deuten darauf hin, dass sowohl die individuellen Erfahrungen als auch die Kooperationsaktivitäten der Multiplikator:innen bedeutsam für ihre Selbstwirksamkeitserwartung in Bezug auf die sechs Gestaltungsprinzipien für qualitätvolle Fortbildungen sind. Insbesondere die Relevanz der Kooperation von Multiplikator:innen mit anderen Multiplikator:innen als auch ihre Kooperation mit Lehrkräften im eigenen Kollegium dienen als wichtige Ansatzpunkte für die Gestaltung der Qualifizierung der Multiplikator:innen im QuaMath-Projekt. Die Ergebnisse legen nahe, dass sich eine gute Kooperation sowohl zwischen Multiplikator:innen als auch Lehrkräften über eine gesteigerte Selbstwirksamkeitserwartung positiv auf die Umsetzung der Gestaltungsprinzipien für qualitätvolle Fortbildungen sowie der Prinzipien für qualitätvollen Mathematikunterricht auswirken könnte. Vertiefende Einblicke in diese Wirkungskette werden zukünftige Forschungsarbeiten in QuaMath liefern.

Poster

Wie wirkt ein digitales Punktefeld beim Lösen von multiplikativen Textaufgaben?

Eva Schultheis, Katharina Loibl, Timo Leuders

Pädagogische Hochschule Freiburg, Deutschland

Forschungsbefunde zeigen, dass beträchtlich viele Lernende mit erheblichen Lücken in den grundlegenden mathematischen Basiskompetenzen in die Sekundarstufe I starten (Kasper et al., 2020). Insbesondere das konzeptionelle Verständnis der Grundrechenarten - oder kurz: das Operationsverständnis - ist nicht ausreichend entwickelt, was vor allem im Bereich der Multiplikation und Division deutlich wird (z.B. Schulz et al., 2017). Dieses multiplikative Operationsverständnis spielt jedoch eine entscheidende Rolle für das weitere mathematische Lernen, z.B. beim Erlernen von Brüchen, Prozentsätzen oder Funktionen (z.B. Hackenberg & Tillema, 2009). Ohne eine kompensatorische Förderung ist es unwahrscheinlich, dass die Lernenden, denen es an einem substanziellen multiplikativen Operationsverständnis mangelt, den Anforderungen des Mathematikunterrichts in der Sekundarstufe gerecht werden (Schulz et al., 2017).

Operationsverständnis manifestiert sich an Textaufgaben (Gravenmeijer, 1997). Mangelndes Operationsverständnis bei Textaufgaben lässt auf unpassende oder fehlerhafte mentale Repräsentationen schließen (Hegarty et al., 1995). Dem Modell des integrierten Text-Bild-Verstehens von Schnotz und Bannert (2003) folgend, können externe Repräsentationen eine Hilfe darstellen (z.B. Dröse, 2019; Jitendra, 2019) und beim Aufbau mentaler Modelle im Löseprozess helfen (z.B. Thevenot 2010; Múñez et al., 2013), sofern die Übersetzung zwischen Text, Darstellung und Rechnung gelingt (Dewolf et al., 2014). Gelingen allerdings diese verstehensförderlichen Übersetzungsprozessen nicht, haben die (zusätzlichen) grafischen Darstellungen eher lernhinderliche Effekte (Ainsworth, 2006).

Dieses Projekt untersucht, wie der Einsatz einer Punktefeld-Applikation beim Lösen von multiplikativen Textaufgaben wirkt, ob es Hinweise gibt, dass diese Wirkung in Abhängigkeit von der Ausprägung verschiedener Persönlichkeitsmerkmale (Vorwissen, Lesefähigkeit, induktives Denken, Mathematik-Angst und -Selbstkonzept, ICT-Kompetenz) systematisch variiert und ob bestimmte Lernendengruppen besondere Hilfestellungen benötigen.

In der vorliegenden Studie wurden folgende Forschungsfragen untersucht:

Wie wirkt ein digitales Punktefeld beim Lösen von multiplikativen Textaufgaben?
Zeigen sich Hinweise für differentielle Effekte?

In einem Prä-Post-Design mit teilnehmender Beobachtung bei der Intervention soll die Wirkung einer eigens entwickelten Punktefeld-Applikation auf das Lösen von multiplikativen Textaufgaben (kurzfristig) und auf die Förderung von multiplikativen Operationsverständnis (langfristig) sowie Hinweise zu eventuell vorliegenden differentiellen Effekten untersucht werden.

Von Lernenden der 5. Klasse (N=32) wurde mit einem eigens dafür entwickelten und validierten Instrument das multiplikative Operationsverständnis erfasst (Testzeitpunkt T1). Nach einer kurzen Einweisung sollten diese anschließend möglichst eigenständig einem an ihren Lernstand (Testzeitpunkt T1) angepassten individualisierten Aufgabenplan folgend 6-8 multiplikative Textaufgaben mithilfe der Punktefeld-Applikation lösen. Während der Bearbeitung der Lernaufgaben wurden sie von einem Versuchsleiter beobachtet und ihre Äußerungen aufgezeichnet. Dieser Versuchsleiter gab auf Nachfrage Hilfsimpulse. Das Datenmaterial wurde hinsichtlich folgender Aspekte kodiert: Lösung der Aufgabe (richtig gelöst, mit Hilfe gelöst, nicht gelöst) und Art der Hilfestellung (technische Hilfe, inhaltliche Hilfe beim Aufbau des Punktefeldes, inhaltliche Hilfe beim Übersetzen des Punktefeldes in die Rechnung). Vier Wochen nach der Intervention wurde die Erfassung des multiplikativen Operationsverständnis wiederholt (delayed Posttest, Testzeitpunkt T2), um langfristige Veränderungen zu untersuchen. Diese Daten wurden mit JASP (t-Test bei abhängigen Stichproben, ANOVA) analysiert.

Des Weiteren wurde Mathematik-Angst und -Selbstkonzept (PISA 2012), induktives Denken (Matrizentest aus CFR-20-R) und die selbst eingeschätzte Kompetenz mit Informations-technologien (PISA 2015) untersucht. Daten zum Zahlenverständnis, zum allgemeinen Operationsverständnis (über alle vier Operationen), sowie zum Leseverständnis lagen durch die Erhebung von Lernstand 5 (IBBW) vor.

Der t-test für abhängige Stichproben zeigte eine signifikante Verbesserung um 1,34 Punkte von T1 zu T2 mit kleiner Effektstärke (p=0,016; d=0,451), was auf einen Lerneffekt hindeutet. Die Analyse der Prozessdaten zeigte, dass das Punktefeld vor allem bei den Leistungsschwächeren löse- und lernförderlich war, wenn auch häufig inhaltliche Unterstützung notwendig war. Dies deutet darauf hin, dass der lernwirksame Umgang mit der Punktefeld-Applikation durch eine gute, angepasste Instruktion vorbereitet werden muss und verbessert werden kann, und deckt sich mit früheren Studienbefunden (Hillmayr et al., 2020). Analysen zu weiteren differentiellen Effekten stehen noch aus.

Poster

Mit Flipped Learning, Rollenlernen und Reflexion Trainer*innen-Kompetenzen im Studium fördern – Evaluation eines Studienmoduls

Maren Schmidt, Sandra Rothenbusch, Eva-Maria Schulte

Technische Universität Braunschweig, Deutschland

Die Digitalisierung ändert das Berufsbild von Trainer*innen drastisch: Unternehmen setzen zunehmend auf digitale Tools und selbstgesteuertes Lernen, sodass Trainer*innen zu Lernbegleitenden werden, die E-Learning, virtuelle und Präsenzformate flexibel kombinieren und auf individuelle Bedürfnisse der Teilnehmenden abstimmen (Kauffeld, 2016; Sammet & Wolf, 2019). Um interessierte Studierende der Arbeits- und Organisationspsychologie auf ihre neue Rolle als Lernbegleitende vorzubereiten und ihre Handlungskompetenzen zu stärken, wurde ein zweisemestriges Modul basierend auf den first principles of instruction (Merrill, 2002) entwickelt. Es verbindet im „flipped learning“-Design (Zhou, 2023) E-Learning-Einheiten und Präsenztermine mit einer Trainingshospitation. Eine ergebnis- (z.B. Kompetenzzuwachs) sowie prozessbezogene (z.B. Erfolgsfaktoren und Hindernisse) Evaluation (Kauffeld, 2016) entlang des Vier-Ebenen-Modells von Kirkpatrick (Reaktions-, Lern-, Verhaltens- und Ergebnisebene; Kirkpatrick & Kirkpatrick, 2006) und des Rahmenmodells des Transferprozesses nach Baldwin und Ford (1988) dient der Beurteilung und Weiterentwicklung des neuen Studienmoduls mit speziellem Fokus auf den Lerntransfer.

Die drei zentralen Fragenstellungen der Evaluation lauten: Sind die Lehr- und Lernformate (Präsenztermine, E-Learning, Hospitation) nach den vier Ebenen von Kirkpatrick unterschiedlich erfolgreich? Welche Katalysatoren und Barrieren können für den Lerntransfer identifiziert werden?

Werden durch das Modul die Handlungskompetenzen (Methoden-, Fach-, Sozial- und Selbstkompetenz; Kauffeld, 2016) der Teilnehmenden erhöht?

Mittels eines quasi-experimentellen Designs wurden N = 84 Psychologiestudierende der TU Braunschweig wiederholt befragt. In der Interventionsgruppe befanden sich n = 13 Studierende, in der Kontrollgruppe n = 71 Studierende. Zur ergebnisorientierten Evaluation des Studienmoduls wurde der Questionnaire for Professional Training Evaluation (Q4TE; Grohmann & Kauffeld, 2013) mit seiner sechsstufigen Likert-Skala (1 = trifft überhaupt nicht zu bis 6 = trifft voll und ganz zu) genutzt. Kompetenzen wurden durch Selbsteinschätzungen im Kompetenz-Reflexions-Inventar (KRI; Kauffeld, 2021) auf einer fünfstufigen Likert-Skala (1 = trifft überhaupt nicht zu bis 5 = trifft voll und ganz zu) und mit einem selbst-konstruierten Wissenstest, in dem maximal 12 Punkte erreicht werden konnten, erfasst. Zur prozessorientierten Evaluation kam das deutsche Lerntransfer-System-Inventar (GLTSI; Kauffeld et al., 2008) mit einer fünfstufigen Likert-Skala (1 = trifft überhaupt nicht zu bis 5 = trifft voll und ganz zu) zum Einsatz, das auf den Studienkontext adaptiert wurde. Zur Auswertung der Fragestellungen wurden non-parametrische Analyseverfahren verwendet.

Ergebnisse zur ersten Fragestellung zeigen, dass sich nur die Lern- und Lehrformate auf Reaktionsebene, ꭓ²(2) = 10.31, p = .01, und Verhaltensebene, ꭓ²(2) = 6.53, p = .04, hinsichtlich ihrer Bewertungen unterscheiden. Paarweise Vergleiche zeigen, dass auf Reaktionsebene das Präsenzformat (M = 4.79, SD = .88, p = .02) und die Hospitation (M = 4.91, SD = 1.17, p < .01) im Vergleich zum E-Learning (M = 4.28, SD = .95) signifikant besser bewertet wurden. Auf Verhaltensebene wird das Präsenzformat (M = 4.66, SD = 1.01, p = .01) signifikant besser als das E-Learning (M = 4.24, SD = .85) bewertet.

Bezüglich der zweiten Fragestellung zeigen erste Ergebnisse, dass insbesondere die positive Folge bei Anwendung (M = 4.5, SD = .54) sowie die Unterstützung der*des Vorgesetzten (M = 4.46, SD = .66) als Katalysatoren und Feedback (M = 3.13, SD = .98) sowie die Möglichkeit der Wissensanwendung (M = 3.34, SD = .92) als Barrieren dienen können.

Zur dritten Fragestellung weisen erste Ergebnisse darauf hin, dass die Fachkompetenzen, ꭓ²(2) = 16.17, p < .01, und die Sozialkompetenzen, ꭓ²(2) = 6.41, p = .04, bei der Interventionsgruppe über das Studienmodul hinweg signifikant unterscheiden. Die Interventionsgruppe (M = 5.69, SD = 1.41) schnitt im Vergleich zur Kontrollgruppe (M = 2.13, SD = 1.34) signifikant besser im Wissenstest ab, U = 499, z = 5.03, p < .01.

Das Studienmodul, diese und weitere Evaluationsergebnisse werden im Poster detailliert vorgestellt und anschließend diskutiert. Es wird ein theorie- und praxisbezogener Ausblick gegeben.

Poster

Der Ankereffekt bei der Rezeption von Evidenz - Eine kausale Mediationsstudie.

Kristina Bohrer, Kirstin Schmidt, Samuel Merk

Pädagogische Hochschule Karlsruhe, Deutschland

Theoretischer Hintergrund

Evidenzinformierte Praxis bietet zahlreiche Vorteile für Entwicklungen der Lernumgebungen für die Schüler:innen oder die Schulentwicklung im Allgemeinen (Brown et al., 2017). Allerdings begegnen Lehrpersonen unterschiedlichen Barrieren, wenn sie mit Evidenz umgehen. Hierzu zählen neben externen Faktoren wie fehlende zeitliche Ressourcen (van Schaik et al., 2018) und individuell gering ausgeprägten (Forschungs-) Kompetenzen (Evans et al., 2017) auch unbewusste kognitive Verzerrungen, welche die Interpretation der Evidenz beeinflussen. Der Ankereffekt, dem zufolge eine numerische Schätzung an einem zuvor bekannten Vergleichsmaßstab ausgerichtet wird (Tversky & Kahneman, 1974), ist eine solche kognitive Verzerrung. Bisher wurde der Ankereffekt, unserem Wissen nach, nicht im Kontext der evidenzinformierten (Schul-)Praxis untersucht. Darüber hinaus werden die Mechanismen hinter der kognitiven Verzerrung stark diskutiert (z.B. Mochon & Frederick, 2013). Daher wurde in der ersten Studie analysiert, inwiefern verschiedene Anker die Bewertung von Forschungsergebnissen beeinflussen. In einer zweiten Studie wird davon ausgehend der Mechanismus hinter diesem Ankereffekt untersucht.

Studie 1

In diesem randomisierten kontrollierten Online-Experiment erhielten N = 220 Lehramtsstudierende (85% weiblich, MSemester = 3,36) sequentiell und randomisiert zwei Forschungsberichte zu bildungswissenschaftlichen Themen, in denen die Stichprobengrößen der fiktiven Experimente enthalten waren (randomisiert N = 15 oder N = 500; unabhängige Variable). Die Teilnehmenden wurden anschließend gefragt, ob sie diese Stichprobengröße als angemessen empfinden, um die Forschungsfrage des Forschungsberichts zu beantworten (Likert Skala von 1 = stimme gar nicht zu bis 7 = stimme voll und ganz zu; abhängige Variable). Dieses 2x2 between-person Design resultiert in vier Gruppen (zwei Kontroll- und und zwei Experimentalgruppen). Insgesamt wurde angenommen, dass die Teilnehmenden die zweite und größere Stichprobengröße (N₂ = 500) als angemessener bewerten, wenn sie vorher den kleinen Anker erhalten haben (N₁ = 15) - und umgekehrt. Eine Bayesianische ANOVA zeigt starke Evidenz für große Ankereffekte in den Experimentalgruppen (d = 2,97 , BF₁₀ > 100). Doch unterscheidet sich die vorliegende Operationalisierung von bisherigen Studien zum Ankereffekt, da die Teilnehmenden nicht nach einer numerischen Schätzung, sondern nach der Interpretation eines numerischen Wertes gefragt wurden.

Studie 2

Daher soll in einer zweiten Studie in einem ähnlichen experimentellen Design untersucht werden, ob die eigentlichen Ankereffekte die Bewertung bildungswissenschaftlicher Studien mediieren. Die Teilnehmenden erhalten hierfür erneut zwei Forschungsberichte mit randomisierten Stichprobengrößen, für die sie die Angemessenheit der Stichprobengröße bewerten sollen. Dabei wird angenommen, dass die Angemessenheitsbewertung über die antizipierte Stichprobengröße des zweiten Forschungsberichts (numerischer Ankereffekt) mediiert wird (Pirlott & MacKinnon, 2016). Um diese Hypothese zu testen, werden in einem concurrent double randomization design die Stichprobengrößen des ersten Forschungsberichts (unabhängige Variable) und antizipierten Stichprobengrößen des zweiten Forschungsberichts (Mediator) manipuliert. Dazu wird eine discouragement und encouragement Bedingung geschaffen (z.B. “Oft haben Forschende nicht genügend Ressourcen, so dass die Stichproben zu klein sind. Aber nur größere Stichproben würden den Effekt zuverlässig aufdecken”).

Diskussion

Die Relevanz der Ergebnisse kann anhand eines Beispiels verdeutlicht werden: Wenn (angehende) Lehrpersonen vor allem mit Studien mit großen Stichprobengrößen vertraut sind (wie Large-scale Assessments), dann kann dies mit Blick auf die Ergebnisse aus Studie 1 als ein Anker wirken. Dies kann letztlich zu einer Abwertung von (z.B. experimentellen) Studien mit kleineren Stichprobengrößen führen - auch wenn diese aufgrund großer Effektstärken dennoch eine suffiziente statistische Power aufweisen. Die Ergebnisse der zweiten Studie erlauben es, hinter die Mechanismen der Ab- oder Aufwertung von Evidenz durch (angehende) Lehrpersonen, bedingt durch den Ankereffekt, zu blicken. Das Wissen über die dahinterliegenden Mechanismen kann als erster Schritt dafür dienen, einen gelingenden Umgang mit Evidenz trotz des Ankereffekts zu erreichen.

Poster

Unterricht sollte EASI sein - Der Einfluss Erfahrener Wertschätzung in der Schule auf das Wohlbefinden, die Motivation und die Selbstwirksamkeitserwartung von Schüler*innen

Maximilian Resch, Dr. Henrik Bellhäuser

Johannes Gutenberg-Universität Mainz, Deutschland

Sowohl im Arbeitskontext (Semmer et al., 2019) als auch im Kontext der universitären Lehre (Carstensen et al., 2021) zeigt sich die Relevanz von erfahrener Wertschätzung für das Wohlbefinden und die Zufriedenheit von Arbeitnehmenden und Lernenden.

Zugleich wird deutlich, dass Wertschätzung noch immer ein zum Teil uneindeutig definiertes Konstrukt ist. So wird Wertschätzung beispielsweise mit Respekt (Grover, 2014), Belohnung (Bregenzer et al., 2022) oder sozialer Unterstützung (Sundin et al., 2007) gleichgesetzt und als synonym angenommen.

Nichtsdestotrotz legen aktuelle Befunde und theoretische Abgrenzungen nahe, dass Wertschätzung als eigenständiges Konstrukt angesehen werden sollte, das inkrementelle Prädiktion über die Aufklärung durch andere Konstrukte - wie soziale Unterstützung - hinaus leistet (Semmer et al., 2019).

Vor dem Hintergrund der inkongruenten Definition und Operationalisierung von Wertschätzung haben Resch & Bellhäuser (in prep.) das Konstrukt "Wahrgenommene Wertschätzung in Sozialen Interaktionen" (engl. Experienced Appreciation in Social Interactions"; EASI) entwickelt. Die Zugehörige EASI Work Skala mit insgesamt k=15 Items für Kolleg*innen und k=15 Items für direkte Vorgesetzte als Quelle von erfahrener Wertschätzung wurde zunächst im Arbeitskontext erprobt und validiert.

Innerhalb der Untersuchung von EASI in einem Mehr-Studien-Design mit zwei Stichproben (N=231; N=391) bestätigte sich sowohl die theoretische Grundlage des Modells als auch die Annahme der Zusammenhänge zwischen EASI auf der einen Seite und der Zufriedenheit, Motivation und emotionalen Erschöpfung von Arbeitnehmenden auf der anderen Seite (Resch & Bellhäuser, in prep.).

Als theoretische Grundlage für den angenommenen Wirkmechanismus dient die Stress as Offense to Self-Theorie (SOS) nach Semmer et al. (2019). Diese nimmt an, dass das Aufbauen und Aufrechterhalten eines positiven Selbstwertes ein grundlegendes, menschliches Bedürfnis darstellt. Wird der Selbst wert - und damit eben auch dieses Bedürfnis - nun angegriffen, so kommt es zu einem Stresserleben innerhalb der betroffenen Person. Der Selbstwert kann entweder gesteigert ("boost") oder angegriffen ("threat") werden (Pfister et al., 2020; Stocker et al., 2014). Die Wertschätzung, die Arbeitnehmende durch Ihre Kolleg*innen und/ oder direkten Vorgesetzten erfahren, stellt einen solchen Angriff (sofern gering ausgeprägt) oder eine solche Steigerung (sofern hoch ausgeprägt) des Selbstwertes dar (Resch & Bellhäuser, in prep.).

Kehrt man zur Ausgangslage des aktuellen, wissenschaftlichen Standes im Hinblick auf erfahrene Wertschätzung zurück, so zeigt sich, dass diese nicht nur für Arbeitnehmende, sondern ebenfalls für Studierende (Carstensen et al., 2021) und Schüler*innen (Tian et al., 2015) relevant ist. Zugleich zeigt sich auch in diesem Kontext eine starke Inkongruenz im Hinblick auf die Definitionen und Operationalisierungen von Wertschätzung, was wiederum zu einer Forschunglücke und uneindeutigen und wenig vergleichbaren Ergebnissen führt.

Darüber hinaus stellt sich die Frage, inwieweit der erfahrene Wertschätzung neben dem Selbstwert auch eine relevante Rolle im Hinblick auf die individuelle Selbstwirksamkeitserwartung zukommt, wenn man diese in das Modell der 4 Quellen der Selbstwirksamkeit nach Bandura einordnet (Abderhalden & Jüngling, 2019).

Aus diesem Grund ist es das Ziel der durchgeführten Studie (1) das Konstrukt EASI auf den Schulkontext zu übertragen, (2) theoretische Prämissen der SOS Theorie zu replizieren und (3) die erwarteten positiven Zusammenhänge zwischen erfahrener Wertschätzug und der Zufriedenheit, Motivation und Selbstwirksamkeitserwartung von Schüler*innen zu untersuchen; (4) kontrolliert um individuelle Persönlichkeitseigenschaften der Schüler*innen.

Hierfür wurden N=461 Schüler*innen der Klassenstufen 5 - 9 in einer längsschnittlichen Tagebuchstudie an Gymnasien in Rheinland-Pfalz befragt (5. Klasse: n=100, 6.Klasse: n=104, 7. Klasse: n=22, 8. Klasse: n=199, 9. Klasse: n= 26; M_Gesamt=12,0 Jahre, SD=1,5 Jahre; n=179 weiblich, n=259 männlich, n=13 non-binär oder keine Angabe). Nach einer ersten querschnittlichen T1-Fragebogen-Erhebung füllten diese über einen Zeitraum von vier Wochen täglich morgens im Schulunterricht eine Tagebucherhebung aus (Gesamtrücklauf: K=5.327 Tagebuch-Einträge). Abgeschlossen wurde die Tagebucherhebung durch eine zweite T2-Fragebogen-Erhebung.

In der Posterpräsentation werden theoretische Herleitung, Design und Proband*innen-Akquise, sowie Ergebnisse zur Reliabilität, Validität und im Hinblick auf die Verlaufsdaten und Multilevel-Analysen dargelegt und diskutiert.

Poster

KommSchreib! Ein Projekt zur Förderung von Schreibkompetenz, -motivation und sozialer Partizipation

Josephine Gatzweiler, Pia Sieveke, Stefanie van Ophuysen, Sina Schürer, Vera Busse, Yvonne Erhardt

Uni Münster, Deutschland

Theoretischer Hintergrund und Fragestellung:

Kompetentes Schreiben ist eine Schlüsselkompetenz des 21. Jahrhunderts, die nicht nur zur gesellschaftlichen Partizipation und beruflichem Aufstieg befähigt (s. Busse, 2022), sondern auch für schulischen Erfolg im Allgemeinen sowie den erfolgreichen Übergang nach der Grundschule von zentraler Bedeutung ist (s. Cutler & Graham, 2008). Die Anbahnung entsprechender Textproduktionskompetenzen sollte bereits in der Grundschule erfolgen, wobei insbesondere ein prozessorientierter Ansatz, in dem Strategien zur Planung, Organisation und Überarbeitung eigener Texte vermittelt werden, für jüngere Lernende vielversprechend scheint (z.B. Cutler & Graham, 2008; s. Meta-Analyse Graham & Sandmel, 2011). Das Verfassen von Texten ist für viele Lernende herausfordernd, wobei herkunfts- und migrationsbedingte Leistungsdisparitäten gerade beim Schreiben besonders stark ausgeprägt sind und ein erhöhter Unterstützungsbedarf bei Lernenden besteht, in deren Familien nicht die Verkehrssprache gesprochen wird (Müller & Busse, 2023). Damit einhergehend ist die Förderung von Schreibmotivation und Selbstwirksamkeit bedeutsam, damit Lernende auch zukünftig Schreibprozesse initiieren und bei Schwierigkeiten persistieren (s. Busse et al., 2023). Neben der Förderung des Schreibens und der (Schreib-) Motivation ist die Ermöglichung von sozialer Partizipation aller Kinder ein wichtiges Ziel inklusiver Bildung (s. Grosche, 2015). Soziale Partizipation impliziert die Beteiligung an Interaktionen, das Erleben von Freundschaft, die Anerkennung durch Peers sowie die Wahrnehmung des Eingebundenseins (s. Koster et al., 2009). Da vor allem Kinder mit Migrationshintergrund zu einer Risikogruppe gehören (s. Cavicchiolo et al., 2020, Schürer et al., 2022), sind für sie Maßnahmen zur Stärkung sozialer Teilhabe besonders wichtig.

Das vom BMBF-geförderte Projekt KommSchreib! fokussiert die Frage, wie die Textproduktion als zentraler Bereich der Schreibkompetenz sowie Schreibmotivation und Partizipation durch formelle (unterrichtliche) und informelle (außerunterrichtliche) schulische Lerngelegenheiten gefördert werden können. Um Schreibkompetenz, Schreibmotivation und die soziale Partizipation in der Intervention gemeinsam zu adressieren, wird verstärkt auf kooperative Lernformen beim Schreiben sowie auf Peer-Feedback gesetzt. Dies ist zur Förderung der Schreibkompetenz wirksam (Graham et al., 2012; Koster et al., 2015) und kann die Schreibmotivation unterstützen (s. Camacho et al., 2021). Kooperatives Lernen kann zudem als „Methode mit der höchsten Relevanz für die Förderung sozialer Integration“ betrachtet werden (Huber, 2019, S. 33), da sie den positiven Kontakt zwischen den Kindern fördert (Kontakthypothese). Darüber hinaus ist die Qualität der Lehrkraft-Lernenden-Beziehung für die soziale Partizipation von zentraler Bedeutung (Endendijk et al., 2022). Auf der Grundlage von zwei zentralen Interventionselementen (Montagsspiel, Lob-Memory) soll im Rahmen des Projekts das Interaktionsverhalten zwischen den Lernenden positiv beeinflusst werden, um darüber die soziale Partizipation der Lernenden zu verbessern.

Methode:

Das Projekt ist als (quasi)experimentelle Interventionsstudie mit einem Warte-Kontroll-Gruppendesign (Pre- und Posttest) angelegt. Die Stichprobe umfasst elf Grundschulen (~ 1.500 Schüler*innen der dritten und vierten Klasse). Um die Wirksamkeit der Intervention zu prüfen, werden schriftliche Lernenden- und Lehrkräfte-Befragungen sowie Lehrkräfteinterviews durchgeführt.

Aufbauend auf theoretischen Vorüberlegungen und empirischen Befunden wurden im ersten Teil des Projektes in Kooperation mit Praxispartner*innen an Grundschulen Interventionsinhalte und entsprechende Unterrichtsmaterialien entwickelt. Im zweiten Teil des Projektes wurden die Lehrkräfte im Hinblick auf die unterrichtliche Implementation von kooperativen prozessorientierten Schreib- und Feedbackaktivitäten sowie bezüglich weiterführender Aktivitäten zur Unterstützung sozialer Partizipation geschult. Zurzeit erfolgt an den Schulen der Experimentalgruppe die Implementierung im Regelunterricht durch die Lehrkräfte. In enger Verzahnung mit der Intervention in der Hauptstudie werden zusätzlich Schreib-AGen im Offenen Ganztag durchgeführt.

Ergebnisse:

Das Poster wird den theoretischen Hintergrund und das Design darstellen sowie Einblicke in die Lehrmaterialien geben. Wir hoffen zudem, erste Ergebnisse aus der Lernenden- und Lehrkräfte-Befragungen zu präsentieren.

Poster

‚Programmieren von Robotern‘ – Wirksamkeit einer short-term-Intervention zur Förderung von Interesse und Selbstwirksamkeit sowie der Kreativität von Grundschulkindern

Helvi Koch¹, Simon Baumgartner², Marianne Schüpbach¹

¹Freie Universität Berlin, Deutschland; ²Pädagogische Hochschule Zürich, Schweiz

Digitale Kompetenz ist in der heutigen Zeit essentiell, um am gesellschaftlichen Leben teilzuhaben (European Commission, 2022). Bereits für Grundschulkinder sind digitale Medien alltäglicher Bestandteil der außerschulischen Lebenswelt (KIM-Studie, 2020) und aufgrund dessen sollten sie auch innerschulisch nutzbar gemacht werden (Döbeli Honegger, 2017). Diesen Imperativ aufgreifend wird digitale Medienbildung in grundschulbezogenen Curricula und Empfehlungen als explizites Bildungsziel benannt (KMK, 2016; 2021).

Dass das Lernen mit digitalen Medien mehr Lernpotential birgt, als lediglich die digitale Technik und die entsprechenden Applikationen bedienen zu können, wurde bereits mehrfach diskutiert (bspw. Giest, 2016; Iron, Peschel & Schmeinck, 2023). Auch gehe es nicht nur um Coding-Kenntnisse und um die Förderung rein technischer Problemlösekompetenz (Bergmann, 2023), sondern um Transferleistungen und insbesondere darum, digitale Medien zu nutzen (Baumgartner, in Vorb.), um kreative Lösungswege zu finden (Schmeinck, 2022), mithin kreativ gestalterisch tätig zu werden (Ferrari, 2012; Kafai & Burke, 2014). Zudem können sich die Schüler:innen beim Programmieren als selbstwirksame Konstrukteur:innen erleben und dadurch die die digitale Welt aktiv und kreativ mitgestalten (Bergner et al., 2018).

Grundschulkinder haben insgesamt ein ausgeprägtes Interesse an digitalen Medien (KIM, 2020) und als Digital Natives sind sie prädispositioniert, hohe digitale Kompetenzen auszubilden. Ob sich das Interesse an digitalen Medien sogar noch steigern lässt, wenn Kinder konkrete Herausforderungen mittels digitaler Medien im Rahmen eines spezifischen Interventionsangebots meistern, wurde bislang noch nicht empirisch untersucht. Ob sich durch ein solches Angebot die Kreativität und die Selbstwirksamkeit der Kinder verbessern lassen, wurde ebenfalls noch nicht empirisch abgesichert.
Die vorliegende Pilotstudie geht daher der Frage nach, ob sich durch eine spezifische Short-Term-Intervention zum kreativ-gestalterischen Einsatz von digitalen Medien im Grundschulunterricht (1) das Interesse an digitalen Medien, (2) die Selbstwirksamkeit hinsichtlich des Umgangs mit digitalen Medien sowie (3) die Kreativität steigern lassen.
Ziel der Studie war also zum einen, die Wirksamkeit des Interventionsangebots auf Schülervariablen zu untersuchen, zum anderen wurde die generelle Implementierbarkeit der manualisierten Short-Term-Intervention geprüft. Das Interventionsangebot adressierte die digitale Bildung am Beispiel des Programmierens von Robotern (vgl. Dziubany, 2017; Koch & Giest, 2020), welches im Rahmen eines universitären Forschungsseminars von Lehramtsmaster-Studierenden als Projekttag an einer Ganztagsgrundschule durchgeführt wurde.
An der Untersuchung nahmen insgesamt N = 156 Drittklässler teil. Das Studiendesign folgte einem Pre-Posttest-Untersuchungsplan mit Interventions- und Kontrollgruppe und die Wirksamkeit wurde anhand eines standardisierten und zweier selbstkonstruierter Instrumente überprüft (adaptierte und auf digitale Kompetenz ausgerichtete Skalen der IGLU sowie der KVS-P von Krampen et al., 1996 mit den Subskalen Ideenflüssigkeit und Ideenflexibilität zur Messung der Kreativität).
Mit der Pilotstudie konnte gezeigt werden, dass sich die Intervention an einer Grundschule als Projekttag implementieren lässt. Inferenzstatistisch wurde die Effektivität des Interventionsangebots mit Messwiederholungsvarianzanalysen geprüft. Für die Selbstwirksamkeit hinsichtlich des Umgangs mit digitalen Medien wurde ein signifikanter Haupteffekt für den Faktor Zeit, F(1,155) = 14.13, p < .001, η² = .09 und ein signifikanter Interaktionseffekt für Zeit x Gruppe identifiziert, F(1,155) = 13.03, p < .001, η² = .09. Auch für die Kreativität konnte ein signifikanter Haupteffekt für den Faktor Zeit, F(1,155) = 70.55, p < .001, η² = .33 und ein signifikanter Interaktionseffekt für Zeit x Gruppe identifiziert werden, F(1,155) = 4.54, p < .05, η² = .03. Erwartungsgemäß zeigten Kinder der Interventionsgruppe nach der Intervention somit eine ausgeprägtere Selbstwirksamkeit und eine höhere Kreativität im Vergleich zu Kindern der Kontrollgruppe. Die Ausprägung des Interesses der Interventionskinder an digitalen Medien unterschied sich sowohl zum ersten als auch zum zweiten Messzeitpunkt hingegen nicht signifikant von der Ausprägung des Interesses der Kontrollgruppenkinder. Es lag kein statistisch bedeutsamer Effekt für den Interaktionsfaktor Zeit x Gruppe vor, F(1,155) = 137.00, p = n.s., η² = .09. Ein Effekt für den Hauptfaktor Zeit konnte ebenfalls nicht nachgewiesen werden, F(1,155) = 700.00, p = n.s., η² = .005.

Poster

Der Einfluss von Testen auf den Transfer beim Lernen von historischen Aussagen

Samuel Bellinghausen, Jonathan Barenberg

Universität Münster, Deutschland

Theoretischer Hintergrund

Der Befund, dass der aktive Abruf eines Gedächtnisinhalts zu einer verbesserten Behaltensleistung gegenüber neuerlichem Einprägen führt, wird in der experimentellen Gedächtnispsychologie als Testeffekt bezeichnet und konnte über verschiedene Populationen und Lerninhalte hinweg beobachtet werden (Roediger & Butler, 2011; Rowland, 2014). Tests sind somit nicht nur ein Mittel, um einen Leistungsstand zu erheben, sondern können eine Lerngelegenheit darstellen (Karpicke, 2017).

Von großer praktischer Relevanz ist die Frage, ob der Vorteil des Testens auch dann besteht, wenn sich ein im Übungstest geforderter Abruf vom späteren finalen Test unterscheidet, dort also ein Transfer des Gelernten gefordert ist (Pan & Rickard, 2018). Ein vergleichsweise naher Transfer liegt bei Testformaten vor, bei denen sich die Testungen lediglich dadurch unterscheiden, welche Teilinformationen eines grundsätzlich identischen Lernmaterials als Hinweisreiz zur Verfügung stehen und welche als Antwort abgefragt werden (Barnett & Ceci, 2002).

In bisherigen Studien war bei Lernmaterialien, die aus drei und mehr Elementen bestehen (z.B. Worttripel oder historische Aussagen), häufig kein Transfereffekt auf zuvor ungetestete Informationen, sondern lediglich ein Testeffekt für bereits im Übungstest abgefragte Bestandteile zu beobachten, was die praktische Bedeutung des Testeffekts stark einschränken würde (Hinze & Wiley, 2011; Pan et al., 2016). Die Joint Conditions Hypothesis von Rickard und Pan (2020) postuliert, dass bei einer Hinweisreiz-Antwort-Neuanordnung in den Fällen ein positiver Transfereffekt auftritt, in denen nicht zwei Bedingungen gleichzeitig vorliegen: (a) zwei oder mehr Hinweisreize werden im Übungstest präsentiert und (b) das im finalen Test abgefragte Element ist ein vorheriger Hinweisreiz. In einer Studie mit Worttripeln als Lernmaterial konnte bei Nichterfüllung der ersten Bedingung im Einklang mit der Joint Conditions Hypothesis in der Tat ein Transfereffekt auf im Übungstest nicht getestete Bestandteile nachgewiesen werden (Rickard & Pan, 2020).

Fragestellung

Ziel der vorliegenden Untersuchung ist es, die aktuelle Befundlage zu ergänzen und insbesondere das Auftreten von Transfereffekten bei authentischeren Lernmaterialien (wie historischen Aussagen mit drei zentralen Bestandteilen), unter Berücksichtigung der Joint Conditions Hypothesis, zu überprüfen.

Methode

Die Untersuchung wurde mit 30 Geschichtsstudierenden an zwei Terminen online durchgeführt. Beim ersten Termin wurden zunächst alle 24 Aussagen zum Lernen präsentiert. Im Anschluss daran wurde die Testbedingung innerhalb der Proband*innen variiert: Acht Aussagen wurden erneut komplett präsentiert (Kontrollbedingung), in acht Aussagen wurde der Abruf von zwei Informationen geübt, die im Abschlusstest als Hinweisreize dienten (umgekehrte Testung), und in acht Aussagen wurde der Abruf der Zielinformation des Abschlusstests und einer weiteren Information geübt (umgestellte Testung). In beiden Testbedingungen war somit die erste Bedingung der Joint Conditions Hypothesis für ausbleibenden Transfer verletzt und ein Vorteil des Testens gegenüber dem neuerlichen Einprägen zu erwarten. Die Testungen erfolgten als Lückentext mit Feedback (korrekte Antwort). Die Gesamtzeit der Beschäftigung mit den Aussagen war in allen Bedingungen identisch. Die Zuteilung der Aussagen zu den drei Testbedingungen wurde über alle Teilnehmenden ausbalanciert. Beim zweiten Termin (eine Woche später) erfolgte der Abschlusstest ebenfalls als Lückentext, in dem in allen Bedingungen die gleiche Teilinformation abgefragt wurde.

Ergebnisse

Eine ANOVA ergab einen signifikanten Effekt des Faktors Testbedingung auf die Erfolgsquote im Abschlusstest (F(2,58)=6.31, p=.003, ηp²=.179). In paarweisen post-hoc-Bonferroni-Holm-Vergleichen zeigte sich, dass Studierende signifikant mehr Lücken in der umgestellten Testung, in der die relevante Lücke bereits im Übungstest abgefragt worden war, beantworten konnten als in den beiden anderen Bedingungen. Anders als erwartet, unterschieden sich die korrekten Antworten in Kontroll- und umgekehrter Testbedingung nicht.

Diskussion

Als Erklärung für den ausbleibenden Transfereffekt auf zuvor nicht getestete Bestandteile kommen strukturelle Unterschiede zwischen Worttripeln und (vermeintlich) dreiteiligen Aussagen, die sich womöglich nicht auf drei bedeutungstragende Elemente reduzieren lassen, in Betracht. Im Hinblick auf den Einsatz von Tests in authentischen Unterrichtskontexten weisen die Befunde auch auf die Bedeutung von extensiven Feedbackformen hin, die über korrektives Feedback hinausgehen (Pan et al., 2019).

Poster

Measuring Cognitive Ability From Young Age: Presenting a New Test Battery for Working Memory Capacity

Benjamin Goecke¹, Johanna Hartung², Luc Zimny⁴, Jessika Golle¹, Patrick Lösche³, Oliver Wilhelm⁴

¹Universität Tübingen, Deutschland; ²Universität Bonn, Deutschland; ³DIPF Leibniz-Institut für Bildungsforschung, Deutschland; ⁴Universität Ulm, Deutschland

Cognitive abilities predict children’s future achievements, including school readiness, success in school, and academic achievement. However, measuring cognitive ability in young children is challenging because existing measurement instruments often require some basic level of curricular education which is problematic regarding the fairness of such measurement instruments. Additionally, existing measurement instruments for young children that do not require such basic levels of prior knowledge, for example tests of figural reasoning ability, are only hardly connectable to further ages. Thus, longitudinal studies of cognitive abilities spanning from childhood to adulthood are often limited by applying different measurement instruments at different ages. With the present work, we aim to remedy this situation. Extensive research has unveiled the fundamental mechanisms of working memory capacity (WMC) and has established WMC as a pivotal factor in individual differences in cognitive abilities. Thereby do tests of WMC assume no prior educational knowledge in the form of language mastery or numerical comprehension and should thus provide a better measure of basic cognitive performance. Thus, tests of WMC are ideally suited as an indicator of general cognitive functioning in children, adolescents, and adults. Nevertheless, available instruments for measuring WMC in children are unsatisfying in terms of a) operational continuity with conventional measures for adolescents and adults, b) multivariate nature of measurement, and c) implementation of established paradigms. Across several pilot studies and three main studies (N_total > 1000), we developed and validated a tablet-based WMC test battery which uses established WMC paradigms that can be applied from preschool to adult age. In study 1, we developed three child-contextualized WMC tests and investigated their difficulty, reliability, and validity in a sample of N = 343 first graders. In study 2, we extended the evidence for child-contextualized and age-adapted parametrizations of our tasks in a sample of N = 379 fifth to tenth graders. Further, we provide evidence that the child-contextualized tests are nearly identical to structurally equivalent conventional WMC tests with more abstract stimuli (ρ = .90) and that the new battery correlates strongly with a measure of fluid intelligence (ρ = .80). Study 3 is conceptualized as a longitudinal study with two measurement time points (t1 at the beginning of first grade, t2 at the end of first grade) and is currently ongoing with N ~ 130 children. In this study, we investigate the re-test reliability of the WMC tests and examine the relationship of WMC test performance with socio-demographic variables. Across all studies, we found strong evidence for good psychometric properties of the test battery for all assessed age groups. The tests pave the way for the identification of cognitive potential at young age and for follow-up longitudinal studies across the life span. The test battery is an easy-to-use tool for assessing WMC from preschool to adulthood, is applicable for all ability levels, can easily be adapted in terms of difficulty, and can be freely used for research purposes. We argue that our newly developed tests bear great potential for cross-national research due to their low requirements on literacy. The implemented audio-instructions can easily be exchanged to other languages and the tablet-based administration facilitates the distribution of test materials significantly. In addition to presenting a poster on our work, we will provide a hands-on experience of the test battery on site.

Poster

Digitale Kommunikation und Kollaboration: Eine Bedarfsanalyse zur kollegialen Nutzung von Videokonferenzen in der Schule

Simone Malz, Marion Prof. Dr. Händel, Simon Biller

Hochschule für angewandte Wissenschaften Ansbach, Deutschland

Theoretischer Hintergrund

Nach einer intensiven Phase der Digitalisierung an Schulen ist noch unklar, wie das sich das "new normal" nach der Corona-Pandemie im Schulkontext gestaltet (Siddiq et al., 2023). In den meisten Berufsfeldern sind Videokonferenzen als digital-gestützte Möglichkeit der Kommunikation und Kollaboration nicht mehr weg zu denken. Doch welche Rolle spielen sie im Arbeitsalltag von Lehrkräften und wie können Videokonferenzen die kollegiale Zusammenarbeit an Schulen fördern?

Videokonferenzen ermöglichen ortsungebundene Kommunikation und können Teilnehmende in Kommunikations- und Interaktionssituationen versetzen, die vergleichsweise ähnlich zu analogen Kommunikationssituationen sind, da sie synchrone, mündliche sowie visuelle Kommunikation ermöglichen. Dies sind ideale Bedingungen, um soziale Präsenz (Hofer, 2023) erlebbar zu machen und dadurch die Qualität sozialer, medienvermittelter Interaktion zu erhöhen (vgl. Chew & Ng, 2021). Videokonferenzen haben somit möglicherweise das Potenzial, kollegiale Kooperation in der Schule zu unterstützen – einem Arbeitsfeld, in dem kollegiale Kollaboration eher die Ausnahme scheint (Richter & Pant, 2016) und das gleichzeitig durch den zunehmenden Lehrkräftemangel belastet ist (Bieber et al., 2020).

Die Nutzung digitaler Technologien im schulischen Kontext scheint allerdings mit Unsicherheiten und Widerständen verbunden zu sein (Gerick et al., 2023). Gemäß der Unified Theory of Acceptance and Use of Technology (UTAUT; Venkatesh, 2003) hängt die Akzeptanz und Verwendung von Videokonferenzen stark von der Wahrnehmung der Benutzenden hinsichtlich ihrer Effektivität, des Nutzens für die Kommunikation und Kooperation, aber auch der Unterstützung durch Kolleg:innen und der Anwenderfreundlichkeit ab (Bailey et al., 2022) – Faktoren, die es auch im schulischen Kontext zu berücksichtigen gilt. Die vorliegende Studie zielt darauf ab, Beratungs- und Fortbildungsbedarf zur Nutzung von Videokonferenzen und digitaler Kommunikation aus Sicht von Lehrkräften zu erforschen.

Fragestellung

Insgesamt werden drei Fragestellungen untersucht:

Wie sicher fühlen sich Lehrkräfte bei der Durchführung von und dem Beziehungsaufbau in Videokonferenzen? Sehen sie hier Fortbildungs- oder Beratungsbedarf und in welcher Form?
Inwiefern sehen Lehrkräfte Bedarf, kollegiale Kommunikationsstrukturen durch digitale Lösungen effizienter zu gestalten?
Welche Widerstände spüren Lehrkräfte in Bezug auf die Digitalisierung der kollegialen Zusammenarbeit und welche Maßnahmen würden ihnen helfen diese zu überwinden?

Methode

Zur Beantwortung der Fragestellungen ist eine Bedarfsanalyse mit Lehrkräften sowie weiteren Akteur:innen aus dem Schulumfeld geplant. Anhand von strukturierten Interviews mit offenen und geschlossenen Fragen sollen die Bedarfe für Fortbildung zur erfolgreichen digitalen Kommunikation und Kooperation unter Berücksichtigung bestehender Rahmenbedingungen ermittelt werden.

Um einen möglichst ganzheitlichen Einblick in die schulischen Bedarfe zu erhalten, ist geplant, Akteur:innen verschiedener Schulformen sowie verschiedener Funktion wie beispielsweise Schulleitungen, Fachgruppenleitungen, Lehrkräfte sowie sozialpädagogisch Mitarbeitende zu berücksichtigen . Die erhaltenen Daten werden in Anlehnung an Schulze-Vorberg et al. (2021) anhand eines Kodiermanuals und unterstützt durch die Software MAXQDA ausgewertet.

Zu erwartende Ergebnisse und Ausblick

Die Bedarfsanalyse wird im Frühjahr 2024 abgeschlossen sein, so dass bis zur GEBF Konferenz im März 2023 erste Ergebnisse vorliegen werden. Die erhobenen Daten werden Einblicke in bestehende Strukturen, Herausforderungen und Potenziale digitaler Kommunikation und Kooperation im Arbeitsfeld Schule liefern. Basierend darauf werden perspektivisch Fortbildungs- und Beratungsmodule entwickelt, deren Inhalte und Materialien sich eng an den Ergebnissen der Bedarfsanalyse orientieren. Langfristiges Ziel ist die selbstregulierte Nutzung digitaler Kommunikationswerkzeuge und eine effiziente Kommunikationsgestaltung. Eingebettet sind die Studie sowie die Materialentwicklung, -evaluation und -verstetigung in ein deutschlandweites Verbundprojekt zur digitalen Schulentwicklung.

Poster

Entwicklung und Validierung einer deutschen Bias Awareness Skala für Geschlechtsstereotype von MINT-Lehrkräften

Katharina Fink^1,4, Meike Bonefeld^3,4, Hanna Beißert^1,2,4

¹DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, Deutschland; ²Goethe Universität Frankfurt am Main; ³Universität Freiburg, Institut für Erziehungswissenschaften; ⁴IDeA-Zentrum

Im MINT-Bereich lässt sich eine erhebliche Differenz der Geschlechterverteilung finden. Unabhängig davon, ob man sich die Berufswahl, die Studiengänge oder die belegten Kurse in der Schule ansieht, stellt man Diskrepanzen zwischen der Anzahl an männlichen und weiblichen Teilnehmenden im MINT-Bereich fest (Brotman & Moore, 2008; Makarova et al., 2019). In vergangenen Studien konnte als einer der möglichen Gründe dafür vorhandene Geschlechterstereotype identifiziert werden (Wang & Degol, 2017). Definiert werden Stereotype als verallgemeinernde, aber nicht unbedingt richtige Überzeugungen über eine bestimmte Gruppe von Personen, die anhand eines bestimmten Merkmales, hier das Geschlecht, kategorisiert werden (Becker-Carus & Wendt, 2017). Verschiedene Studien haben gezeigt, dass Lehrkräfte in den MINT-Fächern immer noch viele Vorurteile und Stereotypen haben (Beißert, McGuire & Mulvey, 2022). Da ein deutsches Kind mindestens 10 Jahre seines Lebens in der Schule verbringt und dabei von Lehrern und Lehrerinnen umgeben ist, die den Kindern ihre Einstellungen und Überzeugungen vermitteln und somit auch zukünftige Entscheidungen der Kinder beeinflussen, scheint es sinnvoll die Stereotype der Lehrkräfte zu reduzieren (Muntoni & Retelsdorf, 2020).

Ein möglicher Weg dafür ist Bewusstsein für die eigenen Stereotype zu schaffen. Bargh (1999) geht davon aus, dass man sich seinen Stereotypen bewusst sein muss, um an ihnen arbeiten und sie reduzieren zu können. Wenn Menschen auf die Diskrepanzen zwischen ihren Werten und ihren möglicher Weise stereotypbasierten Einstellungen und Verhaltensweisen aufmerksam gemacht werden, kann dies zu weniger Vorurteilen und einem geringeren Ausmaß an Diskriminierung führen (Grube et al., 1994; Penner, 1971). Perry et al. (2015) führten erstmal den Begriff „Bias Awareness“ ein und definierten ihn als „die individuellen Unterschiede in der Sensibilität und Besorgnis der Menschen gegenüber ihrem Ausdruck subtiler Voreingenommenheit“ (2015, S. 1). Sie erklären weiter, dass dazu die Motivation zur Unvoreingenommenheit, die Anerkennung von Unstimmigkeiten, die Abwehrhaltung bei Konfrontationen und die Fähigkeit, die eigene Voreingenommenheit zu kompensieren, gehören. Bisher gibt es jedoch keine spezifische Skala, die das Bewusstsein der Lehrkräfte für ihre eigenen geschlechtsbezogenen Stereotypen erfasst.

Ziel dieser Studie war es daher, eine deutsche Bias Awareness Skala für Geschlechterstereotype speziell für Lehrkräfte und den MINT-Kontext zu erstellen. Dafür wurde ein Item-Pool mit 32 Items erstellt, der zusätzlich zu den selbst generierten Items, bereits vorhandene Items aus etablierten Fragebögen nutzte, die inhaltlich angepasst wurden. Vorläufige Analysen wurden mit den Daten von 42 Lehrkräfte und Lehramtsstudierende (71% weiblich, 23% männlich, 2% divers) mit MINT-Fächern durchgeführt.

Durch die Durchführung einer Hauptkomponentenanalyse mit einer Oblimin-Rotation sowie einer explorativen Faktoranalyse konnte eine Drei-Faktor-Struktur herausgearbeitet werden. Um die finale Skala so anwendungsfreundlich und daher kurz wie möglich zu gestalten, sowie gleichzeitig das Konstrukt valide zu erfassen, wurde sich für vier Items pro Faktor entschieden. Es wurden lediglich die Items mit der höchsten Faktorladung pro Faktor verwendet. Letztendlich blieben 12 Items, welche die finale Skala bilden. Diese zeigt mit einem Cronbachs Alpha von .84 eine gute interne Konsistenz (Blanz, 2015).

Die erstellte Skala soll es ermöglichen, das Bewusstsein der eignen Stereotype zu erfassen und liefert daher eine bislang noch fehlende Basis, um Ansatzpunkte für Interventionsverfahren zur Reduzierung dieser Stereotype zu überprüfen und somit die Geschlechtsdisparitäten im MINT-Bereich zu verändern.

Disclaimer: Bei den berichteten Ergebnissen handelt es sich um Ergebnisse von vorläufigen Analysen. Die Datenerhebung wurde noch nicht abgeschlossen, da ein N von mindestens 60 Personen angestrebt wird. Auf der GEBF 2024 werden ausschließlich finale Ergebnisse präsentiert.

Poster

Evidenzorientierte Lehre in der Schule - Beeinflusst die Betreuung von Lehramtsstudierenden Einstellungen von Lehrkräften?

Linda Schirle, Christine Sälzer

Universität Stuttgart, Deutschland

Theoretischer Hintergrund

Wissenschaftliche Erkenntnisse legen nicht von selbst spezifische situationsbezogene Lösungsansätze für die Schulpraxis nahe und eignen sich deshalb nicht als Zutaten für ein Rezept gelungenen Unterrichts. Die Berücksichtigung wissenschaftlichen Wissens bei professionellen Entscheidungen von Lehrkräften kann jedoch als rational gestütztes „Problembewusstsein, als Leitfaden und Hilfestellung, als Ergänzung und Korrektiv“ (Bauer et al., 2015, 2f) dienen. Diese eher moderate Forderung nach einem evidenzorientierten Denken und Handeln von Lehrkräften (EDHL) hat sich mittlerweile in einem stetig wachsenden Forschungsfeld etabliert (Bauer & Kollar, 2023).

Wie Rochnia et. al (2022) herausarbeiten, reicht allerdings allein die Aufbereitung und zur Verfügungstellung von Evidenz, eingeordnet in Theorien (vgl. Bromme et al., 2014), nicht aus und die zentrale Herausforderung besteht in der Förderung der tatsächlichen Nutzung des bestehenden Angebots. Hierzu werden immer wieder ungünstige Einstellungen bei Lehramtsstudierenden wie Lehrkräften festgestellt (bspw. Voss, 2022 ; Thomm et al., 2021). So werden aktuell Transfer-Bestrebungen gefördert, die den Dialog zwischen Wissenschaft und Praxis im Bildungssystem vorantreiben sollen (bspw. lernen:digital). Ein bereits bestehender Kanal zwischen den lehrkräftebildenden Hochschulen und den Schulen sind die schulpraktischen Studien. Hier arbeiten Lehrkräfte in bestimmten Ausbildungsphasen mit Lehramtsstudierenden zusammen, die im Rahmen ihres Studiums das EDHL erlernen sollen (Bauer et al., 2015). Diese Zusammenarbeit könnte als Möglichkeit eines gezielten „Theorieschock[s]“ für die erfahrenen Lehrkräfte (Maennig-Fortmann et al., 2022) und als boundary crossing zwischen Theorie und Praxis betrachtet werden.

Fragestellung

Mit einem Blick auf das Forschungsfeld zum EDHL soll sich das dem Beitrag zugrunde liegende Promotionsvorhaben insbesondere der Fragestellung widmen: Können Einstellungen von Lehrkräften gegenüber evidenzorientierter Lehre und der empirischen Bildungsforschung durch eine Zusammenarbeit mit Lehramtsstudierenden – die das EDHL in ihrer universitären Ausbildung erwerben sollen – beeinflusst werden?

Methode

Anhand eines digitalen Fragebogens werden verschiedene Gruppen von Lehrkräften an drei Messzeitpunkten eines Schuljahres zu ihren Einstellungen gegenüber evidenzorientierter Lehre und der (Bildungs-)Wissenschaft befragt. Hierbei werden die Lehrkräfte nicht zufällig in die Gruppen eingeteilt, sondern sie entscheiden sich freiwillig (oder auf Anfrage der Schulleitung) dafür, eine bestimmte Art der Betreuung von Lehramtsstudierenden zu übernehmen. So lassen sich für das quasi-experimentelle Forschungsdesign zwei Experimentalgruppen (Betreuung von Studierenden in der Schulpraxis) und eine Kontrollgruppe (aktuell keine Betreuungsaufgabe) bilden, die sich jeweils aus Gymnasiallehrkräften unterschiedlicher Fächer zusammensetzen. Experimentalgruppe 1 bilden Lehrkräfte, die über ein Schuljahr hinweg die Betreuung von einzelnen Studierenden in einem Praktikumsprojekt übernehmen und verschiedene universitäre Angebote, u.a. zur Förderung evidenzorientierter Lehre, erhalten. Daneben bilden die Ausbildungslehrkräfte, welche in Baden-Württemberg die regulären Schulpraktika (dreiwöchiges Orientierungspraktikum und zwölfwöchiges Praxissemester) betreuen und regelmäßige Fortbildungen der Seminare für Aus- und Fortbildung von Lehrkräften (SAFL) erhalten, die Experimentalgruppe 2. Die Kontrollgruppe setzt sich aus Lehrkräften zusammen, die aktuell keine offiziellen Betreuungsaufgaben übernehmen und somit auch nicht zu den spezifischen Fortbildungsmaßnahmen eingeladen sind. Um Effekte der Zusammenarbeit mit Studierenden im Rahmen der unterschiedlichen Betreuungsaufgaben zu untersuchen, soll je eine Befragung zu Schuljahresbeginn, zum Jahreswechsel und zum Schuljahresende stattfinden.

Ergebnisse und ihre Bedeutung

Das Poster präsentiert das Studiendesign und erste Ergebnisse des Pretests mittels Think-Aloud-Protokollen. Die Betrachtung von Lehrkräften mit unterschiedlichen Betreuungsaufgaben soll einen Einblick ermöglichen, inwiefern Einstellungen gegenüber der evidenzorientierten Lehre und der empirischen Bildungsforschung im Austausch mit Studierenden adressiert oder sogar verändert werden. In Verbindung mit der Möglichkeit, Angebote der Universität oder der SAFL zu besuchen, die teilweise gezielt die Nutzung von Evidenz thematisieren, könnte die Betreuung schulpraktischer Ausbildungsphasen als boundary crossing zwischen Schulpraxis und Wissenschaft eine gegenseitige Wertschätzung (Hartmann et al., 2016) und damit auch positive Einstellungen der teilnehmenden Lehrkräfte fördern. Erfolgsfaktoren sollen identifiziert und im Lauf des Projekts erprobt werden.

Poster

Schulformwechsel nach „Optimistic Choice“ – sozial-emotionale und motivationale Konsequenzen des Nicht-Bestehens eines Probejahrs am Gymnasium in Abhängigkeit von Übergangsempfehlung und familiärem Hintergrund

Katharina Kohl

IPN Kiel, Deutschland

Der Übergang von Grundschule in Sekundarschule stellt ein wichtiges normatives Lebensereignis dar (Knoppick et al., 2018), doch nicht alle Schüler:innen verbleiben im Laufe ihrer Schullaufbahn auf der ursprünglich gewählten Schulform. Die vorliegende Studie befasst sich damit, wie Schüler:innen, die zunächst ein Gymnasium besuchten, dort aber die Leistungsziele nicht erreichten, einen Wechsel auf eine andere Schulform erleben. Im Fokus stehen dabei vorherige Bildungsentscheidungen, insbesondere eine sogenannte „optimistic choice“, also eine Übergangsentscheidung, bei der Eltern das Gymnasium wählen, ohne dass eine entsprechende Empfehlung durch die Grundschule vorliegt (Birkelund, 2020). Da sowohl optimistic choice als auch Bildungsverläufe in Deutschland stark mit familiären Hintergrundmerkmalen, insbesondere soziökonomischem Hintergrund sowie Zuwanderungsgeschichte der Eltern, zusammenhängen (Dollmann & Weißmann, 2020), werden diese Merkmale ebenfalls einbezogen.

Zusammenfassend beschäftigt sich diese Studie mit der Frage, welche Rolle optimistic choice und familiärer Hintergrund für das Erleben eines Wechsels von Gymnasium auf Gesamtschule und für die sozial-emotionale und motivationale Anpassung nach dem Wechsel spielen.

Methode

Die Daten kommen aus der BERLIN-Studie (Maaz et al., 2013), einer Evaluationsstudie zur Reform des Sekundarschulsystems in Berlin, welches die beiden Schulformen Gymnasium und Integrierte Sekundarschule (ISS, mit gymnasialer Oberstufe) umfasst. Der Schulübergang findet nach Klasse 6 statt, die Entscheidung für die Sekundarschulform treffen die Eltern mit Empfehlung der Grundschulen. Klasse 7 des Gymnasiums ist ein Probejahr, Schüler:innen, welche die Leistungskriterien nicht erreichen, wechseln auf eine ISS.

Das analytische Sample umfasst Daten von 2943 Schüler:innen, die zum Zeitpunkt der Befragung Klasse 9 einer ISS besuchten, darunter 565 Schüler:innen, die nach der Grundschule zunächst ein Gymnasium besuchten, dieses jedoch aufgrund ungenügender Leistungen verlassen mussten. Die Schüler:innen beantworteten u.a. Fragen zu Leistungsmotivation, akademischem und sozialen Selbstkonzept, Schulangst und Schulzufriedenheit (Ratingskala 1-4; Skalen aus ELEMENT und Übergang-Studie) sowie ihren letzten Zeugnisnoten. Schüler:innen mit Wechselerfahrung gaben außerdem an, wie sie den Wechsel damals und zum Zeitpunkte der Datenerhebung erlebten. Für eine Substichprobe (n = 1680, davon 264 mit Wechselerfahrung) liegen Daten zu Schulabschluss (kein Abitur/Abitur) und Geburtsland der Eltern (dreistufig) vor.

Ergebnisse und Diskussion

Vorläufige Analysen zeigen eine heterogene retrospektive Bewertung des Wechsels: 35% der Schüler:innen gaben an, den Wechsel damals als sehr negativ/negativ empfunden zu haben, 35% als neutral, 30% als positiv/sehr positiv. Aus aktueller Sicht bewerteten 20% den Wechsel als sehr negativ/negativ, 30% als neutral und 50% als positiv/sehr positiv. Unter Kontrolle der sozialen Unterstützung durch Eltern, Lehrkräfte und Mitschüler:innen fanden sich keine Zusammenhänge zwischen Wechselerfahrung und optimistic choice sowie familiärem Hintergrund.

Hinsichtlich der Anpassung nach dem Wechsel zeigten regressionsanalytische Ansätze, dass Schüler:innen, die vom Gymnasium auf eine ISS gewechselt waren, bessere Durchschnittsnoten erzielten als ihre Mitschüler:innen auf der ISS ohne Wechselerfahrung, und zwar vor allem Schüler:innen mit optimistic choice (conditional effect b = -0.18, p < .001). Unabhängig von optimistic choice zeigten sich unter Kontrolle der Durchschnittsnote marginal höhere Lernmotivation (ß = .03, p = .060) sowie höheres akademisches Selbstkonzept (ß = .04, p = .008) bei Schüler:innen mit Wechselerfahrung, während sich für soziales Selbstkonzept und Leistungsangst keine Unterschiede ergaben. Für die Schulzufriedenheit zeigte sich ein Unterschied zwischen Schüler:innen mit und ohne Wechselerfahrung nur für Schüler:innen mit Gymnasialempfehlung (niedrigere Zufriedenheit, b = -0.30, p < .001), nicht aber für diejenigen mit optimistic choice. Diese Zusammenhänge hingen für keinen der Outcomes vom familiären Hintergrund ab.

Insgesamt deuten diese ersten Befunde auf eine tendenziell positive Anpassung nach Wechsel von Gymnasium auf ISS hin, mit teilweise günstigeren Befunden für Wechsel nach optimistic choice. Genauere Analysen mit komplexeren Methoden (Moderationsanalysen, Propensity-Score Matching) und breiterer Datenbasis (erweiterte Stichprobe, Perspektive der Eltern, Längsschnittdaten) stehen noch aus. Die Befunde der vorliegenden Studie haben wichtige praktische Implikationen, z.B. für die Beratung von Eltern bei der Schulwahl oder die Gestaltung von Schulübergängen und Schulwechseln.

Poster

Fachfremd Deutsch als Zweitsprache lehren: Selbstwirksamkeitserwartung und Bewältigungsstrategien

Dominik Brodowy, Louisa Fortmann, Karin Zimmer

Universität Vechta, Deutschland

Theoretischer Hintergrund

Für die Partizipation in der Gesellschaft ist Sprachkompetenz von grundlegender Bedeutung. Ihre Vermittlung ist über die gesamte Schulzeit wichtig: So sind die Sprachkompetenzen vieler Kinder am Übergang zur weiterführenden Schule niedrig (Lorenz et al. 2023). Auch besuchen im Jahr 2023 etwa eine Viertelmillion Kinder ohne Kenntnisse in der deutschen Unterrichtssprache eine deutsche Schule (Deutschlandfunk 2023). Zugleich prognostiziert die ständige Wissenschaftliche Kommission der Kultusministerkonferenz KMK bis 2025 einen Mangel von etwa 25.000 Lehrkräften und empfiehlt den Einsatz von Personal ohne traditionelles Lehramtsstudium (SWK 2023). Damit finden sich immer mehr Lehrkräfte ohne (formale) Ausbildung dazu vor die sehr herausfordernde Aufgabe gestellt, Sprachförderung in der deutschen Sprache zu betreiben.

Nach Grieger (2022) ist die Unterrichtsqualität mit der Selbstwirksamkeitserwartung von Lehrkräften verknüpft. Unter Selbstwirksamkeitserwartung wird das fachspezifische Selbstverständnis zum Umgang mit herausfordernden Unterrichtssituationen verstanden (Bandura, 1997; Schwarzer und Warner 2014; Urton 2017). Individuen mit einer hohen sind im Vergleich zu denjenigen mit einer niedrigeren Selbstwirksamkeitserwartung eher bereit, langfristig anstrengende Aufgaben zu bewältigen (Schwarzer und Warner 2014; Urton 2017). Diese Bereitschaft wird einerseits aus in der Vergangenheit gemachten positiven Erfahrungen und andererseits aus den Beobachtungen anderer gespeist (Bandura 1997; Myers 2014; Urton 2017). Zudem kommt der Selbstwirksamkeitserwartung eine präventive Wirkung gegen Burnout zu (OECD 2009; Schwarzer und Warner 2014).

Zu den bisher untersuchten Maßnahmen zur Förderung der Selbstwirksamkeitserwartung von Lehrkräften zählen auch kollegiale Beratungsstrukturen zum Umgang mit schwierigen Schüler*innen und kollegialen Hospitationen in den Unterrichtsstunden (Urton 2017). Über die zuvor ausgeführte individuelle Selbstwirksamkeitserwartung hinaus kann sich auch eine kollektive Selbstwirksamkeitserwartung entwickeln, zum Beispiel dann, wenn mehrere Lehrkräfte in der Vergangenheit erfolgreich zusammengearbeitet haben (Urton 2017).

Der Beitrag untersucht welche individuellen wie kollektiven, mit der Selbstwirksamkeitserwartung verknüpften Bewältigungsstrategien im fachfremden Sprachförderunterricht zum Tragen kommen.

Fragestellung

Die Selbstwirksamkeitserwartung wird als für die Tätigkeit der fachfremden Sprachförderlehrkraft zentrale Einstellungen zur Bewältigung schwieriger (Unterrichts-) Situationen verstanden, welche die Unterrichtsgestaltung beeinflusst. Wie entwickelt sich die Selbstwirksamkeitserwartung fachfremder Lehrkräfte im Fach Deutsch als Zweitsprache und welche Bedeutung haben individuelle und kollektive Bewältigungsstrategien für sie?

Methode

Es wurden neun Personen ohne traditionelles Lehramtsstudium, die Deutsch als Zweitsprache an zwei weiterführenden Schulen in Niedersachen unterrichten, mit Leitfadeninterviews nach Helfferich (2011) befragt. Der theoriebasierte Leitfaden ermöglichte die Untersuchung individueller Faktoren wie der Fähigkeit zur Stressbewältigung, dem Wirksamkeitsgefühl und der Problemlösefähigkeit. Darüber hinaus wurden die von den Lehrkräften dargestellten schulischen Rahmenbedingungen und von ihnen als relevant benannte Unterstützungsfaktoren innerhalb ihrer Schule analysiert. Veränderungen der Selbstwirksamkeitserwartung wurden durch einen synoptischen Vergleich der aus den Interviews gewonnenen Daten generiert. Die Auswertung erfolgte mit der inhaltlich strukturierenden qualitativen Inhaltsanalyse nach Kuckartz und Rädiker (2022).

Ergebnisse

Die Experteninterviews zeigen auf, dass die neun fachfremden Lehrkräfte mit zunehmender Berufserfahrung auf vielfältige und individuell unterschiedliche Bewältigungsstrategien zurückgreifen. Dazu zählen das Nutzen von Wissen über die Mehrsprachigkeit, den eigenen Spracherwerb der deutschen Sprache, fremdsprachendidaktische Prinzipien und das generelle pädagogische Fachwissen. Als innerschulische Strategien zur Bewältigung der schulischen Herausforderungen werden die kollegiale Zusammenarbeit und die Weiterbildung der Lehrkräfte aufgeführt. Zudem greifen die fachfremden Lehrkräfte datenschutzkonform auf außerschulische Expertise zu. Sieben der neun fachfremden Lehrkräfte wünschen sich mehr Erfahrungsaustausch mit innerschulischen wie auch mit schulexternen Fachkolleg*innen. Bei allen Befragten gibt es Hinweise auf - individuell unterschiedliche - Veränderungen der Selbstwirksamkeitserwartung.

Die Ergebnisse werden theoretisch eingeordnet und sollen im Weiteren den beteiligten Schulen zur Verfügung gestellt werden. Es ist geplant, in Folgeuntersuchungen die hier herausgearbeiteten Sichtweisen mit denen von Lehrkräften mit Lehramtsstudium im Bereich Deutsch beziehungsweise Deutsch als Zweitsprache zu vergleichen. Aufgrund der aktuellen Situation an den Schulen ist es wichtig, weitere Erkenntnisse auf dem Gebiet der Sprachförderung u.a. zur Herleitung von Handlungsempfehlungen für einen gelingenden Unterricht zu gewinnen, der für die gesellschaftliche Teilhabe der Heranwachsenden auch in der nachschulischen Zeit bedeutsam ist.

Poster

Individuelle Förderung durch Seiteneinsteiger:innen und grundständig ausgebildete Lehrkräfte an Förderschulen mit dem sonderpädagogischen Schwerpunkt Geistige Entwicklung

Anna Seifart, Ewa Sliwinski, Nadine Poltz, Oliver Wendt, Antje Ehlert, Katrin Böhme

Universität Potsdam, Deutschland

Gegenwärtig stellt der Lehrkräftemangel eine der zentralen bildungspolitischen Herausforderungen im deutschen Bildungssystem dar (Porsch & Reintjes, 2023). Um die personellen Lücken zu schließen, wird in allen Bundesländern vermehrt auf Seiten- und Quereinsteiger:innen zurückgegriffen, welche die Unterrichtsversorgung sicherstellen sollen (Rothland & Pflanz, 2016). Im Land Brandenburg stieg der Anteil an Seiteneinsteiger:innen an Schulen in öffentlicher Trägerschaft innerhalb der letzten zehn Jahre von 4.3 % im Schuljahr 2012/13 auf 15.4 % im Schuljahr 2022/23 (Ministerium für Bildung Jugend und Sport [MBJS], 2023). An öffentlichen Förderschulen im sonderpädagogischen Schwerpunkt Geistige Entwicklung unterrichteten im Schuljahr 2022/23 sogar 32.8 % Seiteneinsteiger:innen (Böhme et al., 2023). Diese gestalten und planen – wie die grundständig sonderpädagogisch ausgebildeten Lehrkräfte – Unterrichts- und Förderangebote für die stark heterogene Gruppe der Schüler:innen mit einem sonderpädagogischen Schwerpunkt Geistige Entwicklung. Insbesondere an Förderschulen mit diesem sonderpädagogischen Schwerpunkt gilt das Bereitstellen von individuellen Förderangeboten durch die Lehrkraft als Voraussetzung, um den vielfältigen Lernausgangslagen und Kompetenzen der Schüler:innen adäquat zu begegnen (Stöppler & Wachsmuth, 2010; Fischer, 2008). Eine individuelle Gestaltung von Lerngelegenheiten stellt jedoch für alle Lehrkräfte – ungeachtet ihrer beruflichen Qualifizierung – „erhebliche Anforderungen an das Lehrerhandeln“ (Wischer, 2009, S. 6) und eine große Herausforderung dar. Richter et al. (2023) berichten in einer querschnittlich angelegten Studie, dass die Differenzierung im Unterricht von Lehrkräften zu Beginn des Seiteneinstiegs sogar als eine der zentralen unterrichtsbezogenen Herausforderungen wahrgenommen wird. Vor diesem Hintergrund und in Anbetracht des steigenden Anteils an Seiteneinsteiger:innen, stellt sich die Frage, ob sich das Ausmaß an unterbreiteten individuellen Förderangeboten zwischen grundständig ausgebildeten Lehrkräften und Seiteneinsteiger:innen unterscheidet. Im deutschsprachigen Raum existieren noch keine Studien, die das unterrichtliche Handeln beider Berufsgruppen vergleichen (Porsch, 2021; Richter, 2023). Es soll daher folgende Hypothese überprüft werden:

Grundständig ausgebildete Lehrkräfte und Seiteneinsteiger:innen an Förderschulen im sonderpädagogischen Schwerpunkt Geistige Entwicklung unterscheiden sich nicht im Ausmaß an unterbreiteten individuellen Förderangeboten.

Zur Beantwortung der Fragestellung wird auf Daten der Studie „Evaluation der Förderschulen mit dem Sonderpädagogischen Förderschwerpunkt Geistige Entwicklung im Land Brandenburg“ zurückgegriffen, in der ein onlinebasierter Lehrkräfte-Fragebogen verwendet wurde. Die Stichprobe umfasst 168 Lehrkräfte (81 % weiblich, 19 % männlich) aus allen 30 öffentlichen Förderschulen mit dem sonderpädagogischen Schwerpunkt Geistige Entwicklung im Land Brandenburg. Von den n = 168 Lehrkräften gaben 46 Personen (27.4 %) an, Seiteneinsteiger:in zu sein. Als Erhebungsinstrument diente eine adaptierte Version der Skala „Förderung nach individuellen Lernvoraussetzungen“ (Cronbachs α = .72), welche in PISA 2006 verwendet wurde (Frey et al., 2006). Die Lehrkräfte schätzten die eigene Unterbreitung an individuellen Fördermaßnahmen im Unterricht anhand von neun Items auf einer vierstufigen Likert-Skala mit den Abstufungen „1 = nie oder sehr selten; 2 = gelegentlich; 3 = häufig; 4 = fast immer oder immer“ ein.

Die Ergebnisse zeigen, dass sowohl Seiteneinsteiger:innen als auch grundständig ausgebildete Lehrkräfte vergleichbar häufig individuelle Fördermaßnahmen unterbreiten (M_{Seiteneisteiger:innen} = 3.27, M_{grundständig}_{ausgebildete Lehrkräfte} = 3.38). Auch ein T-Test ergibt, dass kein signifikanter Unterschied (t(166) = -1.54, p = .013) in der Häufigkeit angebotener individueller Förderung zwischen den Gruppen festgestellt werden kann. Es scheint somit kein Zusammenhang zwischen der Gestaltung individueller Förderangebote und der Qualifikation der Lehrkräfte zu bestehen. Dieser Befund schließt an die Annahme an, dass die hohen Anforderungen der individualisierten Förderung für alle Lehrkräfte – ungeachtet der Grundausbildung – eine herausfordernde Aufgabe darstellen. Darüber hinaus zeigt die hohe Ausprägung der Mittelwerte beider Lehrkraft-Gruppen, dass im Mittel häufig individuelle Förderangebote bereitgestellt werden. Es soll an dieser Stelle jedoch darauf hingewiesen werden, dass die Häufigkeit angebotener Förderangebote keinesfalls Schlüsse zur Qualität der individuellen Förderung zulässt. Dennoch liefern die Ergebnisse vor dem Hintergrund des bestehenden Lehrkräftemangels eine interessante Erkenntnis. Es scheint, als seien Seiteneinsteiger:innen trotz weniger umfangreicher pädagogischer Grundausbildung in der Lage, den heterogenen Lernvoraussetzungen der Schüler:innen mit häufigen individualisierten Förderangeboten zu begegnen.

Poster

How to Systematic Review: Systematisches Review nach PRISMA zu Methoden der Sprachförderung im schulischen Kontext – A work in progress

Lea Wiehe^1,3, Romy Räling^2,3, Maja Stegenwallner-Schütz²

¹Universität Potsdam, Department Grundschulpädagogik, Grundschulpädagogik Deutsch; ²Humboldt-Universität zu Berlin, Institut für Rehabilitationswissenschaften, Pädagogik bei Beeinträchtigungen der Sprache und Kommunikation; ³gemeinsame Erstautor:innenschaft

Theoretischer Hintergrund. Systematische Reviews (SR) werden als strukturierte, prädefinierte Aufarbeitung, Bewertung und Synthese verfügbarer, empirischer Evidenz verstanden (Munn et al., 2018). Deshalb stellen SR ein wichtiges Instrument für die evidenzbasierte Praxis (EvP) dar, um Wirkungsbefunde zu pädagogischen Maßnahmen umfänglich zu evaluieren (Höfler & Vasylyeva, 2023). Bei SR kommen die drei klassischen E’s der Evaluationsforschung zum Tragen: Wirksamkeit (Efficacy), Wirkung (Effectiveness) und Effizienz (Efficiency) (Pant, 2014; Wortman, 1983). Wirkung bezieht sich auf Nachweise aus natürlichen Anwendungsbedingungen (z.B. Unterrichtssituationen), Wirksamkeit dagegen auf klinisch kontrollierte Bedingungen und Effizienz auf Kosten-Nutzen-Abwägungen (Pant, 2014; Wirtz, 2021a, 2021b; Wortman, 1983). Auf eine Wirksamkeitsprüfung sollte immer eine Wirkungsprüfung folgen (Campbell et al., 2007). Pädagogische Maßnahmen sollten daher in Bezug auf beide Konzepte analysiert werden.

Im sonderpädagogischen Förderschwerpunkt Sprache sind nur wenige SR verfügbar, welche bisher vorwiegend einzelne Sprachfördermethoden und/oder außerschulische therapeutische Interventionen fokussieren und entweder Wirksamkeit oder Wirkung bewerten (Überblick in Deutsche Gesellschaft für Phoniatrie und Pädaudiologie, 2022). SR zu wirkungsvollen und wirksamen Methoden zur Überwindung sprachlicher Barrieren im Schulsetting mit dem Fokus auf regelgeleitete Sprachdomänen fehlen jedoch bisher. Sprachliche Fähigkeiten sind für den Schulerfolg maßgeblich (z.B. McLeod et al., 2019) und sollten durch evaluiert wirkungsvolle und wirksame Methoden gefördert werden.

Fragestellung. Die Einreichung entsteht im Rahmen eines Forschungsprojekts zur Erstellung eines SR zu wirksamen und wirkungsvollen Sprachfördermethoden im Schulkontext. Der Beitrag hat folgende methodisch fokussierte Fragestellungen: Wie können SR hochwertig und transparent erstellt werden? Welche Tools finden Anwendung? Wie können die Konzepte Wirksamkeit und Wirkung in pädagogischen SR Beachtung finden?

Methode. Das SR wird präregistriert. Präregistrierung gilt als Maßnahme guter Wissenschaftspraxis und beinhaltet die Veröffentlichung der Forschungsdesignplanung vor Studiendurchführung. Sie hilft dabei den Reviewprozess transparent zu kommunizieren, fragwürdige Forschungsmethoden bzw. verzerrende Publikationspraktiken zu vermeiden sowie ungewollte Duplizierungen zu umgehen (Pieper & Rombey, 2022; Stewart et al., 2012). Rund 38 Prozent der derzeitig publizierten SR haben veröffentlichte Protokolle bzw. Präregistrierungen, wobei Registrierungen mit höherem Impactfaktor assoziiert sind (van der Braak et al., 2022). Eine Plattform für die SR-Präregistrierung, u.a. für den Bildungsbereich, ist PROSPERO - International prospective register of systematic reviews (https://www.crd.york.ac.uk/prospero/). PROSPERO gilt als eine der größten Registrierungsplattformen (Pieper & Rombey, 2022).

Für die SR-Erstellung werden die Richtlinien der Preferred Reporting Items for Systematic reviews and Meta-Analyses 2020 (PRISMA 2020) angewendet (Page et al., 2021). PRISMA 2020 enthält 27-Checklisten-Punkte bezüglich der Fragestellung, Suchstrategie sowie Ergebnissynthese und ist darauf ausgerichtet, den Erstellungsprozess eines SR bezüglich der Methodik und Ergebnisaufbereitung transparent und nachvollziehbar zu berichten (Page et al., 2021).

Die Recherche der SR-Evidenzen erfolgt in Meta- bzw. datenbankspezifischen Suchmaschinen (z.B. Web of Science, OVID) und wird durch eine separate Recherche in bestimmten Datenbanken (z.B. ERIC), die nicht in den Meta-Datenbanken vorkommen, sowie eine Handsuche ergänzt. Bei der Recherche wird eine Schlagwortsuche, die durch eine Versprachlichung der Fragestellungskonzepte modelliert wird, mit einer Thesaurus-Suche kombiniert.

Für das SR-Prozessmanagement wird die webbasierte Softwarelösung covidence (https://www.covidence.org) verwendet, welche durch die Cochrane Collaboration empfohlen wird (Cochrane Collaboration, 2023). Das Tool ermöglicht das Screening von Titeln/Abstracts sowie Volltexten im Reviewer:innenteam und dokumentiert die Entscheidungsprozesse sowie Interrater-Reliabilität. In covidence wird auch eine Duplikatsprüfung durchgeführt, die eine hohe Akkuratesse und Spezifität aufweist (McKeown & Mir, 2021).

Ergebnisse. Es soll eine exemplarische Darstellung des SR-Prozesses und der genutzten Tools erfolgen: So wird das PRISMA-Protokoll, die PROSPERO-Präregistrierung, die covidence-Nutzung, die verwendete Suchstrategie unter Bezugnahme der Verschlagwortung sowie die spezifischen Suchprinzipien der Datenbanken (Thesauri und Schlagwörter) vorgestellt.

Im Spannungsfeld um die EvP in der Pädagogik wird deutlich, dass im Rahmen der Kritik an der EvP sowie auch in der EvP-Vermittlung häufig nicht hinreichend zwischen Effizienz, Wirksamkeit und Wirkung unterschieden wird. Aus diesem Grund werden die Kriterien für die Studienkategorisierung in Wirksamkeit und Wirkung vor- und an Exemplaren dargestellt.

Poster

Text vs. Grafik - wie sollte wissenschaftliche Evidenz an Lehrpersonen kommuniziert werden?

Florian Kühlwein, Samuel Merk, Kirstin Schmidt

Pädagogische Hochschule Karlsruhe, Deutschland

Lehrpersonen werden von der Bildungsadministration und Bildungsforschung dazu aufgefordert, ihr professionelles Handeln auf Erkenntnisse empirischer Forschung zu stützen (Bauer et al., 2015; Europäische Kommission, 2007; KMK, 2004). Dieses Vorgehen wird unter dem Schlagwort der evidenzinformierten Schulpraxis (EIP) diskutiert (Brown et al., 2017) und dient letztlich der Verbesserung der Schulqualität (Slavin, 2020).
Die Umsetzung EIP ist mit hohen Anforderungen verbunden. Gründe wie Zeitmangel, Schwierigkeiten beim Auffinden von Forschungsliteratur (Thomm et al., 2021) und auch fehlende forschungsmethodische Grundkenntnisse (Bauer et al., 2015) führen dazu, dass Lehrpersonen eher selten auf wissenschaftliche Evidenz zurückgreifen.

Grundsätzlich gibt es zwei unterschiedliche Ansätze, Lehrpersonen im Umgang mit wissenschaftlicher Evidenz zu unterstützen: Im Sinne eines Angebots-Nutzungs-Modells (Brühwiler & Leutwyler, 2020) kann entweder auf das Angebot oder auf die Nutzung fokussiert werden. Letzteres kann beispielsweise durch eine systematische Förderung der wissenschaftlichen Forschungskompetenz von Lehrpersonen bewerkstelligt werden. Ersteres bezieht sich hingegen auf die Art und Weise, wie informativ und verständlich wissenschaftliche Ergebnisse an die Öffentlichkeit kommuniziert werden. Die vorliegende Studie befasst sich mit der Gestaltung von Wissenschaftskommunikation, wobei der Schwerpunkt auf der Darstellung von Effektstärken liegt.

Aktuelle Forschungsstudien zeigen, dass Lehrpersonen verschiedene Formulierungen von Effektstärken unterschiedlich informativ einschätzen (Lortie-Forgues et al., 2021; Schmidt et al.,2023), aber zum Teil Fehlinterpretationen bezüglich Effektstärken und Inferenzstatistiken aufweisen (Schmidt et al. 2023).
Hinsichtlich der Rezeption und Interpretation statistischer Kenngrößen aus Grafiken haben sowohl statistische Laien als auch Expert:innen Schwierigkeiten (Zhang et al., 2023). Merk et al. (2023) merken dagegen an, dass Lehrpersonen Mittelwertsunterschiede mit hoher Akkuratheit rezipieren können (Merk et al., 2023).

Unserer Recherche nach gibt es bisher keine Studien, die die unterschiedlichen Darstellungen von Effektstärken vergleichen. An diesem Desiderat setzt die vorliegende Studie an: Es wird analysiert, ob sich schriftliche Formulierungen oder Grafiken besser dazu eignen, Effektstärken an Lehrpersonen zu kommunizieren. Konkret werden folgende Forschungsfragen beantwortet:

Forschungsfrage 1: Wie akkurat (AV1), effizient (AV2), informativ (AV3) und relevant (AV4) werden grafisch und textlich dargestellte Effektstärken rezipiert?

Forschungsfrage 2: Gibt es Unterschiede zwischen den Darstellungsweisen in Bezug auf AV1-AV4?

In einer ersten Pilotierung werden zunächst N = 20 englischsprachige Lehrpersonen über Prolific rekrutiert. Die finale Stichprobengröße wird mittels Bayesian Updating (Schönbrodt & Wagenmakers, 2018) bestimmt, wobei die Datenerhebung so lange fortgesetzt wird, bis die Analysen ein a priori definiertes Maß an Evidenz (BF > 5 oder BF < 1/5) liefern.

Die Lehrpersonen erhalten zunächst in einem Within-Between-Person Design jeweils einen Forschungsbericht zu einem bildungswissenschaftlichen Thema (z.B. Einsatz eines KI-Lesetutors), welcher zufällig aus vier verschiedenen Themen ausgewählt wird (Between-Person Faktor). Der Bericht kontextualisiert mehrere anschließend präsentierte Forschungsergebnisse, die zufällig in der dargestellten Effektstärke (Within-Person Faktor) und Darstellungsweise (Beispiel Text vs. Grafik: http://bit.ly/3QiCyi1; Within-Person Faktor) variieren.

Anschließend werden folgende abhängigen Variablen erhoben:

Die Ermittlung der Akkuratheit (AV1) erfolgt durch die Frage: „Schätzen Sie bitte ein, wie hoch die Wahrscheinlichkeit ist, dass eine zufällig ausgewählte Person aus der KI-Lesetutor-Gruppe ein besseres Ergebnis im Lesetest als eine zufällig ausgewählte Person aus der Gruppe ohne KI-Lesetutor erzielt“. Die Variable Effizienz (AV2) wird bestimmt, indem die Zeit bis zum ersten Eintrag im Feld der Akkuratheit vorgenommen wird. Die wahrgenommene Informativität (AV3) lässt sich mithilfe einer siebenstufigen Likert-Skala erfassen. Ferner wird die wahrgenommene Relevanz (AV4) mit der Frage „Wie viel € wären Sie bereit für den KI-Lesetutor auszugeben?“ festgestellt.

Um die Forschungsfragen zu beantworten, werden explorative Analysen durchgeführt. Hierfür werden verschiedene bayesianische Mehrebenenmodelle spezifiziert (Kruschke, 2015), wobei deren Highest Density Intervalls Informationen über die Qualität und Sicherheit der Unterschiede zwischen den verschiedenen Darstellungsweisen in AV1 - AV4 bieten. Gleichzeitig wird die Vorhersagekraft der einzelnen Modelle mittels inkrementellem R2 via Bayes-Faktoren basierend auf Bridge Sampling verglichen (Gronau et al., 2017).

Die Ergebnisse der Pilotierung und Haupterhebung werden im Rahmen der Posterpräsentation vorgestellt.

Paper Session

Untersuchung der Lernwirksamkeit einer adaptiven Web-App zur Übung und Wiederholung grundlegender Grammatik- und Rechtschreibregeln in der Sekundarstufe

Christian Klotz, Uwe Maier

Pädagogische Hochschule Schwäbisch Gmünd, Deutschland

Es gibt ein stetig wachsendes Angebot an adaptiven, personalisierten Lernsystemen für die Wiederholung und Übung von Grundlagenwissen (Van Schoors et al., 2021). Diese passen sich durch formative Assessments und aufgabeninterne Rückmeldeschleifen dem individuellen Lernstand an (VanLehn, 2006). Experimentelle Befunde zur Lernwirksamkeit adaptiver Technologien sind vielversprechend, zeigen jedoch, dass die Lerneffekte von Aspekten des Systems sowie der Umsetzung abhängen (Zheng et al., 2022). Die Forschung konzentriert sich zudem auf MINT-Fächer, den Hochschulkontext und englischsprachige Lernsysteme. Uns ist lediglich eine experimentelle Feldstudie zu einem in Deutschland genutzten adaptiven Lernsystem bekannt (Scharnagl et al., 2014). Sowohl für die Bildungspraxis als auch die Bildungspolitik wäre es wünschenswert, wenn es mehr empirische Evidenz zur Wirksamkeit von adaptiven, digitalen Technologien für den Schulunterricht im deutschen Sprachraum geben würde. Am Beispiel einer adaptiven Lernapp für den Deutschunterricht gehen wir zwei Fragestellungen nach: (1) Welchen absoluten Lernzuwachs hat das adaptive Lernsystem unter kontrollierten Bedingungen? (2) In welchem Maße beeinflusst das Vorwissen den Lernzuwachs?

Untersuchungsgegenstand ist die Web-App MasteryX (www.masteryx.de), die adaptive Übungen für Grammatik und Rechtschreibung in der Sekundarstufe anbietet. Einzelne Themen (bspw. „Kommasetzungsregeln“) sind nach Schwierigkeitslevels gegliedert. Formative Assessments steuern die Lernprogression. Auf jedem Level werden passende Instruktionen und Übungsaufgaben angeboten. Datengrundlage sind 491 Schüler/innen der Klassenstufen 6 bis 9 (32 Klassen aus sechs Realschulen) in Baden-Württemberg. MasteryX wurde in der Experimentalgruppe im regulären Unterricht drei Wochen lang zweimal pro Woche für jeweils 20 bis 30 Minuten eingesetzt, in der Kontrollgruppe nicht (Wartegruppe). Der Lernzuwachs wurde mit einem jeweils identischen Pretest und Posttest erfasst.

Unabhängige Variable ist die Nutzung von MasteryX, abhängige Variable (AV) ist der Posttest-Score. Zur Bestimmung des Lernzuwachs (Forschungsfrage 1), wird eine Kovarianzanalyse mit der AV Posttest-Score (Faktor Nutzung MasteryX ja/nein) durchgeführt. Die Beeinflussung des Lernzuwachs durch das Vorwissen (Forschungsfrage 2) wird mit einer linearen Regression mit der AV absoluter Lernzuwachs sowie einer weiteren linearen Regression mit der AV normalisierter Lernzuwachs (Hake, 1998), bei dem die maximal mögliche Verbesserung von Pre- zu Posttest berücksichtigt wird, untersucht (Prädiktor jeweils Vorwissen).

Mittels Kovarianzanalyse zeigt sich für die Nutzung von MasteryX bei Kontrolle der Kovariaten Pretest-Score, Alter, Selbstkonzept, der zu Hause gesprochenen Sprache sowie der Lernausstattung für den Posttest-Score ein signifikanter Unterschied zwischen den Gruppen mit einer Effektstärke von η_p²= 0.13. Die lineare Regression für den absoluten Lernzuwachs zeigt einen signifikanten negativen Zusammenhang mit Vorwissen, für den normalisierten Lernzuwachs ist das Modell nicht signifikant. Die Lernapp führt damit zu einem eher geringen, absoluten Lernzuwachs, der bei schwächeren Lernenden höher ausfällt, normalisiert jedoch für stärkere und schwächere Lernende gleichermaßen vorhanden ist. Die Befunde bieten eine Referenz für die Evaluation von ähnlichen adaptiven Übungstools, die überwiegend ergänzend zum Unterricht eingesetzt werden.

Paper Session

Generische und domänenspezifische Überzeugungen angehender Lehrkräfte zum Einsatz digitaler Tools im Unterricht: Identifikation und Analyse mithilfe einer Netzwerkanalyse

Sarah Wilken, Benedikt Heuckmann

Universität Münster, Deutschland

Theoretischer Hintergrund

Mit zunehmender Digitalisierung des Unterrichts wird der technologiebezogenen professionellen Kompetenz angehender Lehrkräfte eine immer wichtigere Bedeutung zugesprochen (Becker et al., 2020). Für das technologiebezogene Professionswissen als kognitive Facette professioneller Kompetenz greifen viele Arbeiten auf das TPaCK-Modell zurück, welches sowohl mit generischen als auch über fachspezifische Erhebungsinstrumente erfasst werden kann (Schmid et al., 2009; Arnold & Mahler, 2022). Dahingegen werden Überzeugungen (beliefs) zum Technologieeinsatz als motivational-affektive Facette professioneller Kompetenz (Blömeke et al., 2015) bislang überwiegend generisch und auf ihren prognostischen Gehalt hin untersucht (z.B. Vogelsang et al., 2019).

Empirisch belegt ist, dass Überzeugungen der Lehrkräfte den Technologieeinsatz im Unterricht maßgeblich beeinflussen können (Kim et al., 2013). Bei der Integration digitaler Tools wirken Überzeugungen sowohl als Hürde als auch als Gelingensbedingung (Ertmer, 1999; Bice & Tang, 2022). Studien zeigten wiederholt, dass Überzeugungen zur Technologieintegration im Zusammenhang stehen mit Art und Häufigkeit von Technologieneinsatz im Unterricht (Kim et al., 2013; Bice & Tang, 2022). In der Forschungsliteratur werden Überzeugungen dabei sowohl lehr-lern-theoretisch als auch fachspezifisch ausdifferenziert (Van Driel et al., 2007).

Fragestellung

Für eine Lehrkräftebildung, die fachwissenschaftlich, fachdidaktisch und bildungswissenschaftlich organisiert ist, schließt sich die Frage an, inwiefern diese inhaltlichen Perspektiven auch in den Überzeugungen identifiziert werden können. Bislang ist noch weitestgehend ungeklärt, wie sich generisch lehr-lern-theoretische und fachspezifische Überzeugungen zum Einsatz digitaler Technologien im Fachkontext zueinander verhalten und ob diese in einem beliefsystem integriert sind. Im Vorhaben werden daher exemplarisch am Fachkontext Biologie zwei Forschungsfragen untersucht:

FF1: Welche lehr-lern-theoretischen und fachspezifischen Überzeugungen zur Integration digitaler Medien lassen sich bei angehenden Biologielehrkräften identifizieren?

FF2: Wie sind diese Überzeugungen innerhalb eines beliefsystem miteinander verknüpft?

Methodik

Zur Identifikation der Überzeugungen (FF1) wurden angehende Biologielehrkräfte in einem dreistufigen qualitativen Erhebungsverfahren mittels offener Fragen (n=105), Gruppendiskussionen (n=24) und leitfadengestützter Interviews (n=13) befragt (Schraw & Olafson, 2014). Die Kodiereinheiten (691) wurden mithilfe einer qualitativen Inhaltsanalyse deduktiv und induktiv durch zwei unabhängige Coder leitfadengestützt kategorisiert (κ=.61; substantielle Übereinstimmung). Für die Analyse der Verknüpfungen zwischen den Überzeugungen und der Differenzierung in lehr-lern-theoretische und fachspezifische Überzeugungen (FF2), wurde eine Netzwerkanalyse durchgeführt (Koponen et al., 2019). Der Grad der Vernetzung im beliefsystemwurde mithilfe des igraph Pakets (Csárdi et al., 2023) in R durch folgende Netzwerkparameter beschrieben (Newman, 2003): Dichte, Transitivität (Maximalwert 1 bedeutet maximale Verknüpfungsgrad) und Modularität (Maximalwert 1 bedeutet Zerfall in Untergruppen).

Ergebnisse

Die identifizierten Überzeugungen konnten 18 inhaltlich distinkten Kategorien zugeordnet werden (FF1), die sich in vier Hauptkategorien gruppieren: fachspezifische Überzeugungen (4 Unterkategorien), lehr-lern-theoretische Überzeugungen (9), kritische Überzeugungen (3) und Überzeugungen zu Rahmenbedingungen (2). Damit lassen sich u. a. lehr-lern-theoretische und fachspezifische Überzeugungen unterscheiden, die im Vortrag detaillierter vorgestellt werden.

Netzwerkanalytisch zeigt sich ein beliefsystem in dem die Überzeugungen eng verknüpft sind und nicht in einzelne Untergruppen zerfallen (FF2). Das beliefsystem differenziert demnach statistisch nicht zwischen generischen und spezifischen Untergruppen (Modularität = 0,1). Alle identifizierten belief-Kategorien sind eng miteinander verknüpft (Dichte = 0,9; Transitivität = 0,91). Demnach können generische und fachspezifisch beliefs zwar inhaltsanalytisch unterschieden werden, liegen netzwerkanalytisch, aber eng verknüpft und nicht in distinkten Gruppen vor.

Diskussion

Insgesamt zeigt sich, dass eine große Breite an unterschiedlichen Überzeugungen identifiziert werden konnte (FF1), wobei lehr-lern-theoretische Überzeugungen teilweise mit bereits identifizierten Kategorien einhergehen (Knüsel-Schäfer, 2020; Thurm, 2020). Fachspezifische Überzeugungen, die häufig genannt wurden, erweitern jedoch bestehende Kategorien. Betrachtet man die Überzeugungen in einer Netzwerkanalyse, zeigt sich, dass domänenspezifische und lehr-lern-theoretische Überzeugungen eng verknüpft sind und nicht in zwei Untergruppen zerfallen. Diese Ergebnisse bestätigen Befunde, die von einer curricularen und pädagogischen Ausrichtung der Überzeugungen ausgehen (Van Direl et al., 2007). Den Ergebnissen folgend sollten Überzeugungen in der Fachdidaktik simultan aus inhaltlicher und lehr-lern-theoretischer Perspektive betrachtet werden.

Poster

Bilden Schulbücher die Nachhaltigkeitsziele der UN ab? – Ergebnisse einer Korpusanalyse mit Schulbüchern

Elena Stroszeck¹, Jennifer Paetsch²

¹Universität Bamberg; ²Universität Potsdam

1. Theoretischer Hintergrund

Im Jahr 2015 verabschiedeten die United Nations die Agenda 2030, in der nicht nur 17 inhaltsbezogene Nachhaltigkeitsziele explizit formuliert sind, sondern auch die Bildung für Nachhaltige Entwicklung (BNE) als eine verbindliche Maßnahme aller Staaten aufgeführt wird (vgl. United Nations General Assembly, 2015). Bereits zwei Jahre später setzte sich auch die Nationale Plattform Bildung für nachhaltige Entwicklung, das oberste Gremium für die deutsche Umsetzung des UNESCO Programms, eine strukturelle Verankerung von BNE zum Ziel (vgl. NAT, 2017). Eine Analyse der Lehrpläne aller 16 Bundesländer zeigt, dass BNE überwiegend integriert wurde und es einen Trend zur Umsetzung von BNE als Leitprinzip in allen Fächern gibt (Holst & Brock, 2020; vgl. auch Arnold, Carnap & Bormann, 2016). Gleichzeitig bestehen jedoch erhebliche Unterschiede zwischen den Bundesländern hinsichtlich der konzeptionellen Tiefe und der interdisziplinären Ausgestaltung (Holst et al., 2020). Inwieweit Diskrepanzen zwischen der Verankerung von BNE in Lehrplänen und der weiteren Umsetzung des Bildungskonzepts im Unterricht vorliegen, ist bislang unklar. Lindau und Kuckuck (2022) stellen fest, dass sich in Geographie-Schulbüchern nur ein geringer Anteil der Aufgaben dem Handlungskompetenzbereich im Kontext einer BNE beschäftigen. Vor diesem Hintergrund untersucht der vorliegende Beitrag die Frage, inwiefern die in der Agenda 2030 vorgegebenen Ziele auch in aktuellen Schulbüchern vorkommen und ob sich hier eine Passung finden lässt.
2. Fragestellungen

Welche Bücher eignen sich zur Erstellung eines BNE-Korpus im Schulkontext?
Welche Themenkomplexe bilden Schülbücher im Bereich BNE ab und in welcher Gewichtung?
Wo liegen Kongruenzen der Themenkomplexe zu den offiziellen Nachhaltigkeitszielen der Agenda 2030?

3. Methode

Mithilfe des Programms CorpusExplorer und TreeTagger (Rüdiger, 2018; Schmidt, 1995) wurden zwei Nachhaltigkeitsstrategiedokumente (Bundesregierung 2020 & 2022) und ein Dokument der UN zur Agenda 2030 (United Nations General Assembly, 2015) eingelesen und nach Westpfahl et al. (2017) annotiert, um zunächst die Suchbegriffe festzulegen.
Auf den Webseiten der drei größten Schulbuchverlage wurde mithilfe der Suchbegriffe („nachhaltig/Nachhaltigkeit“, „Umwelt“ & „Klima“) unter bestimmten und einheitlichen Auswahlkriterien nach Schulbüchern gesucht. Die 25 Treffer wurden deskriptivstatistisch auf Inhalt, Fächer/Themen, Klassenstufen und Bundesland untersucht.
Alle 25 Schulbücher wurden entweder digital erworben oder digitalisiert und mit dem CorpusExplorer eingelesen, hinsichtlich der Wortart annotiert und als Frequenzliste ausgegeben. Zur Beantwortung der zweiten Fragestellung, um demnach Relationen und Gewichtungen innerhalb des Korpus auszumachen, werden die Schulbücher mithilfe eines Correlated Topic Model analysiert, dies eignet sich insbesondere bei größeren Korpora (Vayansky & Kumar, 2020). Das Topic-Modeling wird mithilfe des Open-Source-Programms jsLDA (Mimno, 2023) durchgeführt. Dabei wird mit mindestens 30 Topics trainiert, während mindestens 100 Iterationen angestrebt werden. Die Stop-Wort-Liste ergibt sich aus der Annotation von Hilfs- und Modalwörtern, sowie einigen händisch ergänzten Wörtern.

4. Ergebnisse

Vorläufige Ergebnisse beziehen sich auf die Merkmale des Korpus. Im Titel der Schulbücher findet sich vor allem der Begriff „Umwelt“ mit einem 18-maligen Vorkommen, während die Begriffe „Klima“ und „Nachhaltigkeit“ lediglich 9 und 10 Mal vorkommen. Zu 46 und 56 % sind Schulbücher aus dem Primarbereich bzw. weiterer Schulen vertreten. Die Themen und Fächer sind vielzählig und facettenreich (z.B. „Natur“, „Politik“, Sozialkunde, Geografie). Die Klassenstufenempfehlungen liegen vorrangig zwischen der zweiten und zehnten Klassenstufe. Insgesamt umfasst das bereinigte Korpus 42 600 Lemmata und 54 876 Types.
Eine erste zählende Sichtung der Inhaltsverzeichnisse der 25 Bücher ergab, dass die Überbegriffe bzw. Themenkomplexe Klima (24), Wasser (10), Konsum (9), Energien (9) Müll (8) und Ernährung (7) besonders häufig vorkommen. Weniger häufig sind Themenkomplexe wie Gerechtigkeit und Rechte von Minderheiten bzw. Schutzgruppen (5), sowie Hunger und Armut (3) oder Wald (2). Ein Vergleich mit den 17 Nachhaltigkeitsziele der Agenda 2030 (vgl. Die Bundesregierung, 2020 & 2022) zeigt bereits erste Inkongruenzen und mögliche Gewichtungsunterschiede. Eine umfassende und vollständige quantitativ-statistische Analyse mithilfe des Topic Modelings steht noch aus.

Poster

Optimierung von Lernprozessen in der Hochschulbildung: Eine Untersuchung zum Prompt Engineering und der Qualität von KI-gestütztem Feedback

Lucas Jasper Jacobsen¹, Kira Elena Weber²

¹Leuphana Universität Lüneburg; ²Universität Hamburg

Theoretischer Hintergrund und Fragestellung

Generative künstliche Intelligenz (GKI) zählt zu den potentesten Strukturen im Bereich des maschinellen Lernens (Abukmeil et al., 2021). Eines der prägendsten Frameworks innerhalb der GKI ist das der Generative Pretrained Transformer (GPT). Das wohl bekannteste Modell, ChatGPT, ist mit der Version GPT-4 das aktuell leistungsstärkste GPT auf dem Markt. Nach seiner Veröffentlichung hat ChatGPT innerhalb einer Woche mehr als eine Million Abonnenten gewonnen (Baidoo-Anu & Ansah, 2023). Obwohl ChatGPT seitdem in verschiedensten akademischen Kontexten genutzt wird (Stojanov, 2023), fehlt es an empirischen Studien, die die Qualität und den Einsatz dieser innovativen Systeme in der Hochschulbildung untersuchen (Crompton & Burke, 2023). In einer aktuellen Studie von Demszky et al. (2023) konnte gezeigt werden, dass Lehrkräfte die automatisiertes, formatives KI-Feedback erhielten, studentische Beiträge signifikant stärker akzeptierten und die Zufriedenheit der Studierenden mit dem Kurs stieg. Generell gilt Feedback als integraler Bestandteil von Bildungsprozessen in der Hochschule (Henderson et al., 2019), wobei die Qualität des Feedbacks sichergestellt werden sollte. Ein qualitativ hochwertiges Feedback zeichnet sich durch bestimmte Kriterien wie z.B. Konkretheit, Aktivierung und Empathie aus (Prilop et al., 2019). Jedoch fehlt es häufig an personellen und finanziellen Ressourcen zur Bereitstellung hochqualitativen Feedbacks (Demszky et al., 2023), weshalb KI-Feedback potentiell eine ökonomische Alternative darstellen kann. In der vorliegenden Studie gehen wir folgenden Fragestellungen nach: 1. Welche Art von Prompt wird benötigt, um eine hohe Qualität des KI-Feedbacks zu gewährleisten? 2. Welche Unterschiede zeigen sich zwischen Peer-, Expert:innen- und KI-Feedback hinsichtlich der Feedbackqualität und der inhaltlichen Korrektheit des Feedbacks?

Methode

In Anlehnung an Wittwer et al. (2020) formulierten wir zunächst ein Lernziel mit drei Fehlertypen. Anschließend entwickelten wir ein theoriegeleitetes Manual zur Erstellung hochqualitativer Prompts für generative KI. Um die besten Ergebnisse zu erzielen, haben wir verschiedene Prompt-Engineering-Ansätze in das Manual integriert (Kipp 2023, Lo 2023, ChatGPT & Enkin 2023). Wir nutzten unser Manual um drei Qualitätsstufen von Prompts (schlecht, mittel, gut) für ChatGPT zu erstellen und Feedback zum Lernziel zu erhalten. Die Qualität des KI-Feedbacks wurde mittels quantitativer Inhaltsanalyse, basierend auf einem Kodierungsschema, abgeleitet von Prilop et al. (2019), Prins et al. (2006) und Wu & Schunn (2021), durch drei geschulte Kodierer:innen kodiert. Daraufhin präsentierten wir das Lernziel 30 angehenden Lehrkräften im vierten Semester (Novizen), sieben Lehrkräfteausbilder:innen, zwei Professoren für Schulpädagogik, einem Lehrerseminarleiter und einem Schulleiter (Expert:innen) und baten sie, ebenfalls Feedback auf der Grundlage des hochqualitativen Prompts zu formulieren. Dieses Feedback wurde dann von denselben Kodierer:innen kodiert.

Ergebnisse

Der erste Prompt besaß laut unseres Manuals für Promptqualität eine niedrige, der zweite eine mittlere und der dritte eine hohe Qualität. Um das durch die drei Prompts generierte Feedback miteinander zu vergleichen, führten wir eine ANOVA mit Bonferroni-Posthoc-Tests durch. Unsere Ergebnisse zeigten signifikante Unterschiede zwischen den Prompts. Dabei beeinflusste die Qualität des Prompts direkt die Feedbackqualität: schlechte Prompts ergaben schlechtes Feedback, mittlere Prompts mittleres Feedback und gute Prompts gutes Feedback. Im Vergleich zeigte sich, dass Expert:innen und KI-Feedback signifikant besser als das von Noviz:innen waren. In zwei Kategorien übertraf das KI-Feedback sogar das Expert:innen Feedback signifikant.

Diskussion

Derzeit wird in der Hochschule meist Noviz:innen-Feedback in Form von Peer-Feedback verwendet, das jedoch nicht immer lernfördernd ist (Kluger & DeNisi, 1996). Darüber hinaus ist es für Expert:innen aufgrund mangelnder personeller und finanzieller Ressourcen schwierig, hochwertiges Feedback im Hochschulbereich zu geben (Demszky et al., 2023). KI-Feedback kann hier eine hochqualitative und zugleich kostengünstige Alternative darstellen. Ein besonders vielversprechendes Ergebnis unserer Studie ist, dass das von ChatGPT generierte Feedback die Qualität des Feedbacks von Novizen und sogar das der Expert:innen übertraf. Darüber hinaus unterstreicht unsere Studie die Bedeutung des Promptings und der Nutzung eines Manuals für hochqualitative Prompts beim Einsatz von ChatGPT.

Mobile Ansicht Druckansicht

Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: GEBF 2024

11. GEBF-Tagung

BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN - TRANSFER GESTALTEN Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024 Universität Potsdam

Veranstaltungsprogramm

BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN -
TRANSFER GESTALTEN
Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024
Universität Potsdam