Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Nach Track oder Beitragstyp der Sitzung filtern 
Nur Sitzungen am Veranstaltungsort 
 
 
Sitzungsübersicht
Ort: H05
Hörsaal, 500 TN
Datum: Montag, 18.03.2024
9:30 - 10:00Eröffnung
Ort: H05
10:30 - 12:101-01: Schüler:innenurteile zum Unterricht im Kontext heterogener Lerngruppen
Ort: H05
 
Symposium

Schüler:innenurteile zum Unterricht im Kontext heterogener Lerngruppen

Chair(s): Jasmin Decristan (Bergische Universität Wuppertal), Benjamin Fauth (Institut für Bildungsanalysen Baden-Württemberg (IBBW) und Universität Tübingen)

Diskutant*in(nen): Sebastian Röhl (Universität Tübingen)

Die Heterogenität von Schüler:innen in Schulklassen ist ein zentrales Thema sowohl bildungspolitischer und pädagogischer Debatten als auch der empirischen Unterrichtsforschung (vgl. Gräsel, Decristan & König, 2017). Eine hohe Unterrichtsqualität wird dabei als mitentscheidend dafür angesehen, das Lernen und die Motivation der Lernenden zu fördern und trägt zudem zu einem erfolgreichen Umgang mit Heterogenität bei (Klieme, 2019).

Unterrichtsqualität wird dabei oft als ein zwischen Klassen oder Lehrkräften variierendes Merkmal angesehen. Damit einher geht, dass interindividuelle Unterschiede in der Wahrnehmung von Unterrichtsqualität oft als (fehlerhafte) Abweichungen von der geteilten Wahrnehmung der in einer Klasse einheitlich realisierten Unterrichtsqualität betrachtet werden. Erst in jüngster Zeit werden Zusammenhänge zwischen Merkmalen der Schüler:innen in einer Klasse und der Unterrichtsqualität verstärkt in den Blick genommen (z.B. Göllner et al., 2018). Dabei können Zusammenhänge sowohl auf der Individualebene (z.B. Atlay et al. 2019) als auch auf der Klassenebene (als Kompositionseffekte; z.B. Fauth et al., 2021) unterschieden werden.

Konzeptionell wird Unterricht als interaktives und ko-konstruktives Geschehen zwischen Lehrenden und Lernenden in der Auseinandersetzung mit den Lerninhalten beschrieben (Fend, 1998; Klieme, 2019). Vor diesem Hintergrund lässt sich nur schwerlich von einem einheitlichen, für alle Schüler:innen gleichen, Unterrichtsangebot sprechen. Die Interaktionen einer Lehrenden mit den verschiedenen Lernenden innerhalb einer Klasse unterscheiden sich abhängig von deren Lernvoraussetzungen (differential teacher treatment, Bohlmann & Weinstein, 2013; Decristan, Jansen & Fauth, 2023).

Im Zuge der Debatte um Heterogenität gibt es verstärkte Bemühungen, den Unterricht besser an die Lernvoraussetzungen der individuellen Schüler*innen und der Lerngruppe anzupassen und somit adaptiv zu gestalten (Dumont, 2019). Hier geht es also um eine intendierte und gezielte Individualisierung. Hierfür kommt wiederum der Lehrkraft eine entscheidende Bedeutung zu.

Die Befunde zur Wirksamkeit dieser Maßnahmen beziehen sich jedoch oft auf Lerngruppen, während die individuelle Passung von Unterricht und Lernvoraussetzungen bislang kaum empirisch beleuchtet wurde. Einen wichtigen Ansatzpunkt hierfür stellt die systematische Berücksichtigung von interindividuellen Unterschieden in der Wahrnehmung des Unterrichts in Abhängigkeit von den jeweiligen Lernvoraussetzungen der Schüler:innen dar. Es kann beispielsweise angenommen werden, dass adaptiver Unterricht, also ein Unterricht, der zu den heterogenen Lernvoraussetzungen passt, mit vergleichsweise geringen Unterschieden in den Wahrnehmungen des Unterrichts durch die Schüler:innen einhergeht.

Vor diesem Hintergrund ist das Ziel dieses Symposiums, die Zusammenhänge zwischen heterogenen Lernvoraussetzungen in den Klassen bzw. Maßnahmen zum Umgang mit Heterogenität mit der von Schüler*innen wahrgenommenen Unterrichtsqualität eingehender in den Blick zu nehmen.

Beitrag 1 untersucht Zusammenhänge zwischen Klassenkomposition und wahrgenommener Unterrichtsqualität und bezieht hier zugleich Merkmale der unterrichtenden Lehrkraft (Selbstwirksamkeit im Umgang mit heterogenen Lerngruppen) in die Analysen mit ein, um Moderationseffekte zu testen. Beitrag 2 nimmt anschließend in den Blick, inwieweit Lehrkräfte auf Individual- als auch auf Klassenebene das Unterrichtsangebot für unterschiedliche Schüler:innen adaptieren und inwiefern das wiederum mit Unterrichtsoutcomes zusammenhängt. Auch hier bilden die Schüler:innenurteile zur Unterrichtsqualität die Grundlage der empirischen Analysen. Die nächsten beiden Beiträge führen den Strang zum Umgang mit Heterogenität systematisch fort. Beitrag 3 untersucht den Zusammenhang zwischen individuellen Lernvoraussetzungen und der Wahrnehmung des Unterrichts an Grundschulen, die u.a. für einen besonders gelungenen Umgang mit Heterogenität ausgezeichnet wurden. Hieran anknüpfend wird geprüft, inwieweit Maßnahmen der Differenzierung durch die Lehrkraft zu weniger Wahrnehmungsunterschieden im Sinne einer besseren Passung führen. Beitrag 4 exploriert den Zusammenhang von Mehrsprachigkeit und der Wahrnehmung von Klassenführung und Klassenklima durch die Schüler:innen im Kontext einer Intervention, die darauf abzielte, die sprachlichen Ressourcen mehrsprachiger Grundschulkinder besser zu adressieren.

 

Beiträge des Symposiums

 

Zusammenhänge zwischen Klassenkomposition und Unterrichtsqualität in Klassen derselben Lehrkraft: Die Rolle der Selbstwirksamkeit der Lehrkraft im Umgang mit heterogenen Lerngruppen

Anne Heinschel1, Sofie Henschel1, Camilla Rjosk2
1Institut zur Qualitätsentwicklung im Bildungswesen, 2Universität Potsdam

Da sich die Unterrichtsqualität als prädiktiv für den Lernerfolg von Schüler:innen erwiesen hat (Praetorius et al., 2018), ist es von besonderem Interesse die Komplexität des Unterrichts anhand seiner Bedingungsfaktoren zu erklären und dadurch besser verstehen zu können. Auf Grundlage des Angebots-Nutzungs-Modells des Unterrichts (Vieluf et al., 2020) wird davon ausgegangen, dass sowohl Merkmale der Lehrkraft (insb. professionelle Kompetenzen; Seidel, 2014) als auch der Klasse (mittlere Ausprägungen und Heterogenitätsmaße u.a. in Bezug auf Geschlecht, Zuwanderungshintergrund, Vorwissen, Interesse; Helmke, 2017) die Qualität des Unterrichts beeinflussen.

Studien deuten darauf hin, dass neben dem professionellen Wissen (Voss et al., 2022) vor allem motivationale Merkmale der Lehrkraft (Enthusiasmus, Interesse, Selbstwirksamkeit; Baier et al., 2019; Lazarides & Schiefele, 2021a) für die Gestaltung qualitätsvoller Unterrichtsprozesse relevant sind. Bezogen auf Merkmale der Klassenkomposition zeigen Studien ebenfalls, dass neben den typischerweise untersuchten distalen und kognitiven Merkmalen (sozioökonomische Zusammensetzung, Anteil mehrsprachiger Schüler:innen, mittlere bzw. Streuung der kognitiven Fähigkeiten, Decristan et al., 2017; Fauth et al., 2021; Rjosk et al., 2014) auch motivationale Merkmale der Klassenkomposition wie das mittlere Interesse zur Erklärung von Unterschieden in der Unterrichtsqualität beitragen (Fauth et al., 2021; Lazarides et al., 2019). Dies ist auch unabhängig von der unterrichtenden Lehrkraft zu beobachten (Fauth et al., 2020; Heinschel et al., 2023).

Aufgrund ihrer Bedeutung für den Lernerfolg sollte Unterrichtsqualität möglichst unabhängig von Klassenmerkmalen ein hohes Niveau erreicht. Insofern ist es von besonderem Interesse herauszufinden, inwiefern eine Lehrkraft dazu beitragen kann, Effekte der Klassenkomposition auf die Unterrichtsqualität abzumildern. Als relevant für den konstruktiven Umgang mit Heterogenität gelten dabei vor allem die Motivation und die Einstellungen der Lehrkraft (Trautmann & Wischer, 2011). Erste Studien deuten an, dass die Lehrkraftmotivation Effekte des Anteils mehrsprachiger Schüler:innen auf die Unterrichtsqualität moderieren kann (Hachfeld & Lazarides, 2021). Es ist aber unklar, inwiefern dies auch für weitere Effekte der Klassenkomposition sowie über mehrere Klassen einer Lehrkraft hinweg gilt.

Vor diesem Hintergrund untersuchen wir (1) inwiefern Merkmale der Klasse und die Selbstwirksamkeit der Lehrkraft im Umgang mit heterogenen Lerngruppen je einen spezifischen Beitrag zur Erklärung von Unterschieden in der Unterrichtsqualität zwischen Klassen leisten. Zudem wird untersucht, (2) ob die Selbstwirksamkeit der Lehrkraft Effekte der Klasse auf die Unterrichtsqualität im Sinne einer negativen Moderation abschwächen kann.

Wir nutzen Daten aus dem IQB-Bildungstrend 2018 (Stanat et al., 2022), in denen für jede Lehrkraft Angaben von mehreren nichtgymnasialen Klassen zu ihrer Unterrichtsqualität im Mathematikunterricht (kognitive Aktivierung, 12 Items, α = .81; Schülerorientierung, 5 Items, α = .88; Störungen, 3 Items, α = .91) vorliegen (217 Klassen, 105 Lehrkräfte, insgesamt 3550 Schüler:innen). In latent-manifesten Drei-Ebenen-Strukturgleichungsmodellen (Marsh et al., 2009) betrachten wir (1) Effekte der Klassenkomposition (mittleres fachbezogenes Interesse, 4 Items, α = 0.89, sowie deren Streuung; mittlere kognitive Fähigkeiten sowie deren Streuung, Wilhelm et al., 2014; mittlerer sozioökonomischer Hintergrund: HISEI; Anteil Mädchen; Anteil mehrsprachiger Schüler:innen) und der Selbstwirksamkeit der Lehrkraft im Umgang mit heterogenen Lerngruppen (6 Items, α = .87) sowie (2) Interaktionseffekte dieser Merkmale auf die genannten Dimensionen der Unterrichtsqualität. Als Kontrollvariablen werden die genannten Klassenmerkmale auf Individualebene sowie das Geschlecht und die Berufserfahrung der Lehrkräfte berücksichtigt.

Vorläufige Analysen deuten darauf hin, dass ein höheres mittleres Interesse mit höherer Schülerorientierung und kognitiver Aktivierung, ein höherer Anteil mehrsprachiger Schüler:innen mit höherer kognitiver Aktivierung und ein höherer Anteil weiblicher Schüler:innen mit einem niedrigeren Niveau an Störungen einhergeht. Heterogenität der Klasse bezogen auf kognitive Fähigkeiten und fachliches Interesse steht nicht in Zusammenhang mit Merkmalen der Unterrichtsqualität. Eine höhere Selbstwirksamkeit der Lehrkraft geht mit höherer Schülerorientierung und kognitiver Aktivierung einher, moderiert jedoch keine Zusammenhänge von Klassenmerkmalen und Unterrichtsqualität. Die Ergebnisse werden mit Blick auf die Frage diskutiert, inwiefern Merkmale der Lehrkraft das Bemühen um qualitätsvollen Unterricht unabhängig von der Klassenkomposition fördern können.

 

Adaptive Unterrichtsqualität: Ermittlung von lehrkraft- und klassenspezifischen Urteilseffekten bei Schülereinschätzungen

Ann-Kathrin Jaekel1, Alexander Jung1, Richard Göllner2
1Universität Tübingen, 2Universität Tübingen und Universität Regensburg

Theoretischer Hintergrund

Merkmale, wie die Klassenführung, die Lernunterstützung oder der kognitive Anregungsgehalt einer gelten als zentrale Aspekte eines qualitätsvollen Unterrichts (Hamre & Pianta, 2010; Klieme et al., 2009; Praetorius et al., 2018). Die dafür notwendigen Kompetenzen erwerben Lehrkräfte im Rahmen ihrer Ausbildung und während ihrer beruflichen Tätigkeit. Allerdings berücksichtigen bisherige Studie kaum, inwieweit Lehrkräfte ihr Unterrichtshandeln im Sinne verschiedener Qualitätsdimensionen an den Erfordernissen einer Klasse ausrichten. Eine Studie von Voss und Kollegen (2022) zeigte beispielsweise, dass die Unterrichtsqualität von ein und derselben Lehrkraft über unterschiedliche Klassen hinweg variierte. Die Autorinnen und Autoren interpretierten diese Ergebnisse dahingehend, dass es nicht allen Lehrkräften in gleicher Weise gelingt in unterschiedlichen Klassen ein gleich hohes Maß an Unterrichtsqualität zu erreichen. Andererseits muss berücksichtigt werden, dass eine Anpassung des konkreten Lehrkraftverhaltens an die Bedürfnisse einer spezifischen Klasse durchaus im Sinne eines adaptiven Unterrichts zu verstehen ist. Während beispielsweise die Schülerinnen und Schüler der einen Klasse ein höheres Monitoring benötigen, ist das für eine andere Klasse nicht notwendigerweise der Fall. Ziel der vorliegenden Studie war es daher, auf der Grundlage von Längsschnittdaten sowohl lehrkraft- als auch klassenspezifische Aspekte der Unterrichtsqualität auf der Grundlage von Schülereinschätzungen zu ermitteln.

Methode

Daten der UNITAS-Studie wurden in den Jahren 2018 und 2019 in 25 baden-württembergischen Schulen aller Klassenstufen der Sekundarstufe I erhoben. Insgesamt nahmen N = 6.479 Schülerinnen und Schüler aus insgesamt 401 Klassen an der Befragung im Frühjahr/Sommer 2018 teil. Im Mittelpunkt der Befragung stand die Erfassung der Unterrichtsqualität anhand von Schülereinschätzungen in den Fächern Mathematik und Deutsch. Schülerinnen und Schüler wurden nach einem Jahr wiederholt befragt. Erfragt wurden die Unterrichtsqualität entlang der drei Qualitätsdomänen „guten“ Unterrichts. Für die vorliegende Studie wurden die Qualitätsdimensionen Monitoring, Störungen, Lernunterstützung, Feedback, anspruchsvolle Aufgaben und Sokratischer Dialog ausgewählt. Zur Beantwortung der Fragestellung wurde ein Längsschnittmodell verwendet, welches die zeitlichen Stabilitäten, für die durch Schülerinnen und Schüler beurteilten Qualitätsdimensionen, ermittelte (Göllner et al., 2018). Die zeitlichen Stabilitäten wurden für drei Gruppen anhand eines Mehrgruppenmodells getrennt betrachtet: a) gleiche Schülerinnen und Schüler mit unterschiedlicher Lehrkraft (lehrkraftunspezifisch, K = 76 Klassen), b) gleiche Lehrkraft mit unterschiedlichen Schülerinnen und Schülern (lehrkraftspezifisch, K = 163 Klassen) und c) gleiche Lehrkraft mit gleichen Schülerinnen und Schülern (klassen- und lehrkraftspezifisch, K = 118 Klassen). Entsprechend der Forschungsfragen standen die zeitlichen Stabilitäten der Schülerurteile auf der Klasseneben im Mittelpunkt der Analysen.

Ergebnisse

Die Ergebnisse des Mehrgruppenmodells zeigten entlang der klassischen Modellgütekriterien eine jeweils gute Passung für sechs Einzelmodelle im Hinblick auf die gängigen Modelgütekriterien. Die zeitlichen Stabilitäten variierten über die sechs Qualitätsdimensionen und über die drei Gruppen zwischen r = .25 (Sokratischer Dialog) und r = .56 (Anspruchsvolle Aufgaben). Getrennt nach Gruppen, zeigten sich erwartungsgemäß die höchsten Stabilitäten für die Gruppe mit gleichen Schülerinnen und Schülern sowie gleicher Lehrkraft (.34 ≤ r ≤ .75). Die Stabilitäten der Gruppe mit gleichen Schülerinnen und Schülern aber unterschiedlicher Lehrkraft (.28 ≤ r ≤ .45) und der Gruppe mit gleicher Lehrkraft aber unterschiedlichen Schülerinnen und Schülern (.26 ≤ r ≤ .52) fielen demgegenüber geringer aus. Weiterführende Modelle zur Quantifizierung der Stabilitätsunterschiede zeigten, dass unter Kontrolle der lehrkraftunspezifischen Stabilitäten die klassen- und lehrkraftspezifischen Urteilseffekte mit Ausnahme des Sokratischen Dialogs statistisch signifikant waren (ps‘ < .05). Diese Urteilseffekte konnten für die meisten Qualitätsdimensionen auf lehrkraftspezifische Effekte zurückgeführt werden. Lediglich für das Monitoring einer Lehrkraft und das Ausmaß an Störungen fanden sich darüber hinaus klassenspezifische Effekte, die im Sinne eines gelungenen oder weniger gelungenen adaptiven Lehrkraftverhaltens interpretiert werden können.

 

Adaptiver Unterricht aus Sicht von Schüler:innen: Unterrichtswahrnehmungen in Abhängigkeit individueller Lernvoraussetzungen

Katharina Schnitzler1, Nora Fröhlich2, Jasmin Decristan3, Benjamin Fauth4, Hanna Dumont1
1Universität Potsdam, 2Institut für Bildungsanalysen Institut für Bildungsanalysen Baden-Württemberg (IBBW), 3Universität Wuppertal, 4Institut für Bildungsanalysen Baden-Württemberg (IBBW) und Üniversität Tübingen

Aktuelle empirische Befunde zeigen, dass sich Grundschüler:innen innerhalb einer Klasse in der Wahrnehmung ihres Unterrichts in Abhängigkeit ihrer individuellen soziodemographischen, kognitiven und motivationalen Lernvoraussetzungen unterscheiden (Igler et al., 2019; Stang und McElvany, 2021). Dabei bleibt eine offene Frage, inwiefern diese Divergenzen in individuell unterschiedlichen Wahrnehmungen desselben Unterrichts oder in tatsächlichen, wenn auch nicht intendierten Unterschieden im Unterrichtsangebot begründet sind (Igler et al., 2019). Vor diesem Hintergrund werden zunehmend Forderungen laut, den Unterricht adaptiv zu gestalten, also gezielt an die individuellen Lernvoraussetzungen der Schüler:innen anzupassen (Dumont, 2019). Im Hinblick auf die Wahrnehmung der Unterrichtsqualität wäre hier denkbar, dass sich Schüler:innen mit unterschiedlichen Lernvoraussetzungen gleichermaßen herausgefordert und unterstützt fühlen und daher in ihrer Unterrichtswahrnehmung übereinstimmen. Im vorliegenden Beitrag wird der Fokus auf die Unterrichtswahrnehmung von Schüler:innen an Grundschulen gelegt, die mit dem Deutschen Schulpreis unter anderem für ihren produktiven Umgang mit individuellen Lernvoraussetzungen ausgezeichnet worden sind. Daher ist davon auszugehen, dass die Preisträgerschulen gezielt Maßnahmen der Differenzierung—als ein zentrales Merkmal von adaptivem Unterricht— einsetzen. Dabei wird der Frage nachgegangen, inwiefern sich Schüler:innen innerhalb von Klassen in ihrer Unterrichtswahrnehmung in Abhängigkeit individueller Lernvoraussetzungen unterscheiden. Zusätzlich wird untersucht, ob dabei dem Grad der Differenzierung im Unterricht eine moderierende Rolle zukommt.

Zur Beantwortung der Fragen wurden Daten von N = 552 Schüler:innen (51.05% weiblich; 25.4% mit Migrationshintergrund) aus 50 Klassen der 3. und 4. Jahrgangsstufe von neun Preisträger-Schulen genutzt. Neben soziodemographischen Lernvoraussetzungen (Geschlecht, SÖS und Migrationshintergrund) wurden kognitive (kognitive Fähigkeiten, Lese- und Mathematikleistung) und motivationale Lernvoraussetzungen (Selbstkonzept in Deutsch und Mathe, Interesse an Deutsch und Mathe, Anstrengungsbereitschaft und Lernfreude) mittels standardisierter Tests beziehungsweise Fragebögen erfasst (α = 0.80 – 0.92; ICC1 = 0.01 – 0.09). Die Unterrichtswahrnehmung der Schüler:innen wurde ebenfalls über Fragebögen zu den drei Basisdimensionen der Unterrichtsqualität (kognitive Aktivierung, konstruktive Unterstützung und Klassenmanagement) erhoben (α = 0.75 – 0.89; ICC1 = 0.11 – 0.20). Die Differenzierung im Unterricht wurde über eine Skala von den Schüler:innen erfragt (α = 0.78; ICC1 = 0.62).

Um den Zusammenhang der Unterrichtswahrnehmung mit den Lernvoraussetzungen der Schüler:innen zu prüfen, wurden Mehrebenen-Regressionsanalysen durchgeführt. Auf Individualebene wurden die am Klassenmittelwert zentrierten Lernvoraussetzungen als Prädiktoren aufgenommen. Auf Klassenebene wurden die aggregierten Klassenmittelwerte der Lernvoraussetzungen und die am Gesamtmittelwert zentrierte Unterrichtsdifferenzierung als Prädiktor modelliert. Um den Grad der Unterrichtsdifferenzierung als Moderator zu prüfen, wurden Cross-Level-Interaktionen zwischen den Lernvoraussetzungen und der Unterrichtsdifferenzierung einbezogen.

Innerhalb einer Klasse stimmten Schüler:innen mit unterschiedlichen soziodemographischen und kognitiven Lernvoraussetzungen in der Unterrichtswahrnehmung weitestgehend überein. Der SÖS und Migrationshintergrund standen in keinem Zusammenhang mit der Unterrichtswahrnehmung. Gleichwohl zeigten sich vereinzelt auch signifikante Unterschiede in der Unterrichtswahrnehmung. Mädchen nahmen die konstruktive Unterstützung und das Klassenmanagement höher wahr als Jungen. Schüler:innen mit höheren kognitiven Fähigkeiten nahmen die kognitive Aktivierung niedriger wahr, während Schüler:innen mit höheren Testleistungen die konstruktive Unterstützung und die Klassenführung höher wahrnahmen. Die motivationalen Lernvoraussetzungen standen in einem systematischen Zusammenhang mit der Unterrichtswahrnehmung innerhalb der Klassen. Alle erfassten motivationalen Lernvoraussetzungen hingen signifikant positiv mit der Wahrnehmung der drei Basisdimensionen der Unterrichtsqualität zusammen, d.h. motiviertere Schüler:innen nahmen den Unterricht positiver war. Die Cross-Level-Interaktionen waren nicht signifikant und zeigten, dass die Differenzierung im Unterricht die Zusammenhänge nicht moderierte.

Obwohl im adaptiven Unterricht alle Schüler:innen gleichermaßen gefördert werden sollten, konnten insbesondere Unterschiede in der Unterrichtswahrnehmung in Abhängigkeit der motivationalen Lernvoraussetzungen festgestellt werden. Auch stimmten die Schüler:innen in einem stärker differenzierten Unterricht nicht mehr in ihrer Wahrnehmung des Unterrichts überein. Die Studie leistet einen ersten Beitrag dazu die Wahrnehmung des Unterrichts in Abhängigkeit von individuellen Lernvoraussetzungen und Differenzierung zu explorieren und hieraus Hinweise zur Adaptivität von Unterricht abzuleiten.

 

Wahrnehmung von Classroom Management und Klassenklima von Schüler*innen im Kontext einer Intervention zum Einbezug von Familiensprachen im Unterricht

Jasmin Decristan1, Victoria Bertram2, Valentina Reitenbach1, Katharina Maria Schneider3, Dominique Rauch3
1Universität Wuppertal, 2DIPF ∣ Leibniz-Institut für Bildungsforschung und Bildungsinformation, 3PH Ludwigsburg

Die zunehmende Globalisierung und Migration geht mit einer großen Sprachenvielfalt in heutigen Schulklassen in Europa einher. In der Forschung wurden zahlreiche Vorstellungen und Konzepte eingebracht, um die verschiedenen Familiensprachen der Schüler*innen als Ressource im Unterricht aufzugreifen (z.B. Duarte & Günther-Van der Meij, 2018; Lorenz et al., 2021). So bezieht sich der Ansatz des „Translanguaging“ auf eine flexible Verwendung aller Sprachen mehrsprachiger Schüler*innen, um das gesamte sprachliche Repertoire zu nutzen (z.B. Lewis et al., 2012). Empirische Studien im Kontext des Fremdsprachenlernens zeigen die Potenziale von Translanguaging für ein effektives Classroom Management und positives Klassenklima auf.

Auf der andren Seite werden in vielen europäischen Ländern die sprachlichen Ressourcen mehrsprachiger Schüler*innen im Unterricht kaum aufgegriffen (z. B. Ellis et al., 2010 in Deutschland und Österreich; Lorenz et al., 2021 in Norwegen). Dieser „monolinguale Habitus“ (Gogolin, 1997) spiegelt sich auch in Bedenken von Lehrkräften zum Einbezug verschiedener Familiensprachen im Unterricht wider (z.B. Bredthauer & Engfer, 2016). Diese Bedenken beziehen sich – in genau umgekehrter Weise – auf ein niedriges Classroom Management durch organisatorische Herausforderungen, Störungen und weniger Lernzeit sowie auf ein schlechteres Klassenklima durch den Ausschluss vor allem monolingualer Schüler*innen, die die Sprachen der anderen Kinder nicht verstehen.

Forschungsfragen

Der Beitrag untersucht daher den Zusammenhang zwischen dem Einbezug von Familiensprachen im Unterricht und Unterrichtsqualität in heutigen migrationsbedingt mehrsprachigen Grundschulklassen. Dabei wird gefragt: (1.) Welche Bedeutung hat der Einbezug von Familiensprachen für die Wahrnehmung von Classroom Management und Klassenklima von Grundschulkindern? (2.) Inwieweit unterscheiden sich einsprachig-deutsche Schüler*innen in ihrer Wahrnehmung von ihren mehrsprachigen Mitschüler*innen? (3.) Welcher Zusammenhang zeigt sich zwischen der Familiensprachennutzung im Unterricht und der Wahrnehmung von Classroom Management und Klassenklima?

Methode

Die Daten stammen aus einer Interventionsstudie in Klassen der vierten Jahrgangsstufe in Deutschland. Lehrkräfte der Treatmentgruppe (TG) nahmen an Fortbildungen zu einer Unterrichtsreihe teil und setzten die Inhalte anschließend in ihren Klassen um. Lehrkräfte der Kontrollgruppe (KG) setzten ihren regulären Deutschunterricht fort. Die Unterrichtsreihe (12 Unterrichtsstunden á 45 Minuten) in der TG zielte darauf ab, die Deutsch-Lesekompetenz der Schüler*innen zu verbessern. Dafür wurde die kooperative Lernmethode des Reziproken Lehrens eingesetzt (z.B. Rosenshine & Meister, 1984). Mehrsprachigen Schüler*innen wurden zusätzliche Stimuli zum Translanguaging gegeben, und zwar durch (a) bilinguales Material, (b) nach Familiensprachen zusammengesetzte Kleingruppen und (c) Impulse zur Wertschätzung sprachlicher Vielfalt.

Insgesamt nahmen 51 Klassen (32 TG, 19 KG) teil. Die Schüler*innen waren im Mittel 10 Jahre alt. Von 916 Schüler*innen waren 605 (66,0%) mehrsprachig (68,4% TG, 63,5% KG).

Vor (t1) und nach (t2) der Intervention fanden Erhebungen in den Klassen statt. Dabei wurden Classroom Management (5 Items; α>.85, ICC1>.17, ICC2>.77) und Klassenklima (4 Items; α>.73, ICC1>.09, ICC2>.61) über Schüler*innenfragenbögen adaptiert nach Fauth et al. (2014) erfasst. Von den mehrsprachigen Schüler*innen in der TG gaben 40.7% an, während der Unterrichtsreihe mehrere Sprachen verwendet zu haben.

Ergebnisse und Implikationen

Es wurden Mehrebenenanalysen mit MPlus 8.9 (Muthén & Muthén, 2012–2022) berechnet und die Prädiktorvariablen auf individueller und auf Klassenebene aggregiert. In allen Analysen wurden die t1-Werte von Unterrichtsqualität als Kontrollvariablen eingefügt. Die Ergebnisse zeigen, dass (1.) Schüler*innen in der TG ein höheres Classroom Management und positiveres Klassenklima wahrnahmen als Schüler*innen in der KG, dass (2). sich einsprachige und mehrsprachige Schüler*innen nicht in ihrer Wahrnehmung von Unterrichtsqualität unterschieden und dass (3). weder der individuelle Gebrauch mehrerer Sprachen noch der Anteil an Schüler*innen mit multiplem Sprachgebrauch in einer Klasse mit der Wahrnehmung von Unterrichtsqualität in Beziehung stand. Die Ergebnisse liefern empirische Hinweise dazu, dass – entgegen der oftmals geäußerten Befürchtungen – die Nutzung von Herkunftssprachen nicht zu geringerer Unterrichtsqualität führt. Vielmehr wurde im Rahmen der Intervention ein Unterricht realisiert, in dem alle Schüler*innen, egal ob mehrsprachig oder nicht, ein effektives Classroom Management und positives Klassenklima wahrnahmen.

 
13:10 - 14:502-01: Sinkende Bereitschaft schulischer Akteurinnen und Akteure zur Teilnahme an Datenerhebungen - Ursachen und Handlungsansätze
Ort: H05
 
GEBF-Panel

Sinkende Bereitschaft schulischer Akteurinnen und Akteure zur Teilnahme an Datenerhebungen - Ursachen und Handlungsansätze

Steffen Schindler1, Jasmin Decristan2, Christof Wecker3, Jutta von Maurice4, Karina Karst5

1Universität Bamberg; 2Bergische Universität Wuppertal; 3Universität Hildesheim; 4Leibniz-Institut für Bildungsverläufe Bamberg; 5Universität Mannheim

Daten aus Erhebungen an Schulen sind eine wesentliche Grundlage der Empirischen Bildungsforschung. In den letzten Jahren scheint die Teilnahmebereitschaft von schulischen Akteurinnen und Akteuren stetig zu sinken. Vor diesem Hintergrund wurde auf Initiative des GEBF-Vorstands im Frühjahr 2023 eine Arbeitsgruppe eingerichtet, die es sich zur Aufgabe gemacht hat, dieses Thema eingehender zu beleuchten und herauszuarbeiten, welche Handlungsoptionen für die Empirische Bildungsforschung bestehen und auf welchem Selbstverständnis das eigene Handeln beruht. Die Ergebnisse dieser Arbeitsgruppe fließen in ein Positionspapier der Gesellschaft für Empirische Bildungsforschung ein, das Forschenden als Grundlage für das eigene Handeln dienen sowie den Austausch verschiedener Fachverbände zu diesem Themenkreis initiieren kann.

Die Ursachen für eine gesunkene Teilnahmebereitschaft schulischer Akteurinnen und Akteure scheinen vielfältiger Natur zu sein. Grundsätzlich lässt sich anführen, dass empirische Forschung und schulische Praxis unterschiedlichen Eigenlogiken folgen und unterschiedliche Anreizsysteme bieten, die nicht zwingend miteinander kompatibel sind. Das Kerngeschäft der Schulen ist die Bildung und Erziehung von Schülerinnen und Schülern, und die aktuellen Anforderungen im Zuge einer zunehmenden Heterogenität der Lernenden im Kontext des gegenwärtigen Fachkräftemangels an Schulen stellen die Schulen vor massive Herausforderungen, deren Bewältigung verständlicherweise priorisiert wird. Bereitschaft und Ressourcen schulischer Akteurinnen und Akteure für eine Teilnahme an Forschungsprojekten sind entsprechend deutlich reduziert. Gleichermaßen sind diese an zeitnahen Rückmeldungen mit möglichst für sie passenden und konkreten Handlungsempfehlungen mit einer auch ohne vertiefte Statistikkenntnisse verständlichen Ergebnisaufbereitung interessiert. Andererseits ist eine forschungsmethodisch angemessene Aufbereitung, Analyse und Interpretation der erhobenen Daten in der Regel zeitaufwändig, und mögliche Implikationen sind mit Vorsicht und unter Berücksichtigung der Komplexität schulischer Bildungsprozesse zu formulieren. Es lässt sich vermuten, dass Sinnhaftigkeit, Mehrwert und Nützlichkeit von Erhebungen für schulische Akteurinnen und Akteure oft zu wenig ersichtlich sind.

Im Rahmen der Bewertung der Teilnahmebereitschaft schulischer Akteurinnen und Akteure ist anzuerkennen, dass in den letzten 25 Jahren im Zuge der empirischen Wende zahlreiche Schulen an verschiedensten umfangreichen Erhebungen und Vergleichsstudien teilgenommen haben, von internationalen Vergleichsstudien mit umfangreichen Stichproben über Studien des nationalen Bildungsmonitorings auf Basis der KMK-Bildungsstandards sowie Lernstandserhebungen und Vergleichsarbeiten zur Qualitätssicherung auf Schulebene bis hin zu unzähligen kleineren wie größeren Forschungsprojekten und Qualifikationsarbeiten empirischer Bildungsforscherinnen und -forscher.

In der Zusammenarbeit mit schulischen Akteurinnen und Akteuren erschwert die Fluktuation von wissenschaftlichen Mitarbeiterinnen und Mitarbeitern den längerfristigen kontinuierlichen Aufbau von Kooperationsbeziehungen. Zugleich wird die Vorbereitung und Begleitung der Genehmigungsverfahren der für Erhebungen in Schulen zuständigen Behörden in den Bundesländern oftmals als Hindernis wahrgenommen. Die Verfahren erscheinen hierbei oftmals vergleichsweise aufwändig und erfordern eine umfangreiche Expertise, nicht zuletzt im Umgang mit datenschutzrechtlichen Bestimmungen und landesspezifischen schulrechtlichen Auflagen sowie im Datenmanagement.

Auf der Jahreskonferenz 2024 der GEBF soll ein offenes Beitragsformat als Anlass genutzt werden, einleitend die bisherigen Ergebnisse der Arbeitsgruppe in ihren Grundzügen zu skizzieren und anschließend im Rahmen einer Podiumsdiskussion und einem weiteren gemeinsamen Austausch zur Diskussion zu stellen. Die Zusammensetzung des Podiums umfasst Vertreterinnen und Vertreter verschiedener Stakeholdergruppen (Schulpraxis, Ministerium) sowie verschiedener Forschungszugänge der Empirischen Bildungsforschung.

Die moderierte Podiumsdiskussion startet mit kurzen Statements der Podiumsteilnehmenden, in denen dazu Stellung genommen wird, welche Faktoren aus der jeweiligen Perspektive maßgeblich mit der Teilnahmebereitschaft für Erhebungen an Schulen verbunden sind und welche Maßnahmen zukünftig wichtig wären. Anschließend soll anhand verschiedener Leitfragen die Diskussion auf dem Podium eröffnet werden. Darüber hinaus werden alle Teilnehmenden der Tagung eingeladen, sich aktiv in die Diskussion einzubringen, um die verschiedenen Perspektiven und Handlungsfelder in ihrer Breite angemessen abzudecken und diese in der Folge in dem Positionspapier angemessen berücksichtigen zu können.

Teilnehmende der Podiumsdiskussion:

Svenja Bundt (IEA, International Association for the Evaluation of Educational Achievement)

Prof. Dr. Uta Hauck-Thum (LMU München)

Prof. Dr. Tina Seidel (TU München)

Prof. Dr. Petra Stanat (SWK; IQB; Humboldt-Universität Berlin)

Ulf Weltzin (Schulleiter, Schule am Kirschgarten, Bernau)

Jens Fischer-Kottenstede ( Hessisches Ministerium für Kultus, Bildung und Chancen, Wiesbaden)

Dr. Jonas Ringler (DIPF, Abteilung „Struktur und Steuerung des Bildungswesens“, Frankfurt a.M.)

Moderation Prof. Dr. Steffen Schindler (Vize-Präsident der GEBF, Universität Bamberg)

 
15:20 - 17:003-01: Trendanalysen sprachlicher Kompetenzen auf Systemebene: Ergebnisse des IQB-Bildungstrends 2022 und weiterführende Analysen
Ort: H05
 
Eingeladenes Symposium

Trendanalysen sprachlicher Kompetenzen auf Systemebene: Ergebnisse des IQB-Bildungstrends 2022 und weiterführende Analysen

Chair(s): Stefan Schipolowski (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin), Rebecca Schneider (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin), Karoline A. Sachse (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin), Petra Stanat (Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin)

Diskutant*in(nen): Miriam Vock (Universität Potsdam)

Das Institut zur Qualitätsentwicklung im Bildungswesen (IQB) führt als wissenschaftliche Einrichtung der Länder regelmäßig Studien durch, um das Erreichen der in den Bildungsstandards der Kultusministerkonferenz (KMK) definierten Kompetenzziele zu überprüfen. Im IQB-Bildungstrend 2022 (Stanat et al., 2023) wurden die sprachlichen Kompetenzen von Neuntklässler:innen in den Fächern Deutsch und Englisch in der Sekundarstufe I nach den Jahren 2009 und 2015 im Jahr 2022 zum dritten Mal erfasst. Damit ist es erstmals möglich, für die genannten Fächer in der Sekundarstufe I Entwicklungstrends über drei Messzeitpunkte zu beschreiben. Im Rahmen des Symposiums werden zentrale Ergebnisse des IQB-Bildungstrends 2022 vorgestellt und durch vertiefende Analysen zu den erreichten Kompetenzen und motivationalen Merkmalen der Schüler:innen in der Sekundarstufe I ergänzt.

Im ersten Beitrag wird der IQB-Bildungstrend 2022 als Teil des nationalen Bildungsmonitorings vorgestellt. Es werden die wichtigsten Ergebnisse der Studie zum Erreichen der Bildungsstandards und zu geschlechtsbezogenen, sozialen und zuwanderungsbezogenen Disparitäten im Jahr 2022 und im Trend präsentiert.

Der zweite Beitrag richtet den Blick auf das Fach Englisch, in dem sich – anders als im Fach Deutsch – die von den Schüler:innen erreichten Kompetenzen positiv entwickelt haben. Vor diesem Hintergrund geht der Beitrag der Frage nach, welche Rolle die Englischnutzung der Schüler:innen in der Freizeit sowie ein früher Beginn des Englischunterrichts in der Grundschule für das im Jahr 2022 erreichte Kompetenzniveau im Lese- und Hörverstehen spielen.

Neben den kognitiven Kompetenzen der Schüler:innen bilden motivationale Merkmale wichtige Aspekte des Bildungserfolgs. Im dritten Beitrag werden Analysen zu den fachbezogenen Selbstkonzepten und Interessen der Jugendlichen im Fach Deutsch dargestellt, wobei Unterschiede zwischen verschiedenen Teilpopulationen im Jahr 2022 und im Trend im Vordergrund stehen. Zudem wird der Frage nachgegangen, inwieweit die Trends in den motivationalen Merkmalen zwischen den Jahren 2015 und 2022 mit den erreichten Kompetenzen der Schüler:innen und der Zusammensetzung der Schüler:innenschaft zusammenhängen.

Im vierten Beitrag werden Analysen zu Geschlechterunterschieden im Selbstkonzept und Interesse in den Fächern Deutsch und Mathematik im Jahr 2022 präsentiert. Im Fokus steht dabei die Frage, inwieweit das Design der Befragungsinstrumente (Reihenfolge der Fragen zu Geschlecht, Geschlechterstereotypen und motivationalen Merkmalen) die Angaben zum Selbstkonzept und zum Interesse beeinflusst.

 

Beiträge des Symposiums

 

Überblick zu den Hauptbefunden des IQB-Bildungstrends 2022

Petra Stanat, Stefan Schipolowski
Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin

Keywords: IQB-Bildungstrend, sprachliche Kompetenzen, Deutsch, Englisch, Disparitäten

Die Bildungsstandards der Kultusministerkonferenz (KMK) für die sprachlichen Fächer Deutsch und Englisch in der Sekundarstufe I definieren, welche Kompetenzen Schüler:innen entwickelt haben sollen, wenn sie den Ersten Schulabschluss (ESA; KMK, 2005a, 2005b) beziehungsweise den Mittleren Schulabschluss (MSA; KMK, 2004a, 2004b) erwerben. Für die Fächer Deutsch und Englisch in der Sekundarstufe I fand die erste Studie zur Überprüfung des Erreichens der Bildungsstandards im Jahr 2009 statt (IQB-Ländervergleich 2009; Köller et al., 2010). Im IQB-Bildungstrend 2015 (Stanat et al., 2016) und im IQB-Bildungstrend 2022 (Stanat et al., 2023) wurden die Kompetenzen von Neuntklässler:innen in diesen Fächern zum zweiten bzw. dritten Mal untersucht. Neben den Kompetenztests umfassten die Erhebungen Befragungen der teilnehmenden Schüler:innen, ihrer Eltern, Lehrkräfte und Schulleitungen, um schulische und außerschulische Lernbedingungen zu erfassen.

In diesem Beitrag wird zunächst dargestellt, wie die von Schüler:innen am Ende der Sekundarstufe I erreichten Kompetenzen im Jahr 2022 in den Fächern Deutsch (Lesen, Zuhören und Orthografie) und Englisch (Leseverstehen und Hörverstehen) ausgeprägt sind und wie sie sich zwischen den Jahren 2009, 2015 und 2022 verändert haben. Anschließend wird der Frage nachgegangen, inwieweit im Jahr 2022 geschlechtsbezogene, soziale und zuwanderungsbezogene Disparitäten bestehen und inwieweit Veränderungen in diesen Disparitäten festgestellt werden konnten.

Die Ergebnisse des IQB-Bildungstrends 2022 zeigen nahezu spiegelbildliche Entwicklungen für die betrachteten Fächer: Während im Fach Deutsch in allen untersuchten Kompetenzbereichen in Deutschland insgesamt und in fast allen Ländern zwischen den Jahren 2015 und 2022 signifikante Kompetenzrückgänge zu verzeichnen sind, zeigen sich im Fach Englisch – wie bereits im Zeitraum 2009 bis 2015 – bundesweit positive Trends. Im Fach Deutsch sind die Anteile der Schüler:innen, die im Jahr 2022 die Mindeststandards verfehlen, besonders hoch. Den Mindeststandard für den MSA verfehlen rund 33 Prozent aller Neuntklässler:innen im Lesen, etwa 34 Prozent im Zuhören und rund 22 Prozent in der Orthografie. Im Fach Englisch fallen die Ergebnisse insgesamt günstiger aus. Hier verfehlen im Jahr 2022 im Leseverstehen knapp 24 Prozent und im Hörverstehen rund 14 Prozent aller Neuntklässler:innen den Mindeststandard für den MSA. Zudem erreicht im Fach Englisch ein relativ großer Anteil der Jugendlichen ein besonders hohes Kompetenzniveau (Optimalstandards), insbesondere an den Gymnasien.

Auch im IQB-Bildungstrend 2022 zeigen sich wieder geschlechtsbezogene, soziale und zuwanderungsbezogene Disparitäten (Kompetenzvorteile für Mädchen, für Schüler:innen aus Haushalten mit höherem kulturellen Kapital und für Jugendliche ohne Zuwanderungshintergrund). Während die sozialen und zuwanderungsbezogenen Disparitäten in früheren Studien weitgehend stabil geblieben waren, haben sie sich zwischen den Jahren 2015 und 2022 bundesweit in fast allen untersuchten Kompetenzbereichen signifikant verstärkt.

In der Gesamtschau weisen die Befunde erneut darauf hin, dass im Fach Deutsch der Fokus stärker auf die Sicherung der Mindeststandards gelegt werden sollte. Wichtig ist ferner, die sprachliche Förderung von Schüler:innen auf den Prüfstand zu stellen, die mit geringen Deutschkenntnissen ins deutsche Bildungssystem kommen, und zu fragen, wie diese weiter verbessert werden kann. Auch die Förderung des Interesses von Jugendlichen am Fach Deutsch, das sehr schwach ausgeprägt war und sich weiter reduziert hat, sollte in der Forschung und Praxis verstärkt in den Fokus genommen werden.

 

Positive Trends im Fach Englisch: Welche Rolle spielen die Englischnutzung in der Freizeit und der Englischunterricht in der Grundschule?

Stefan Schipolowski, Karoline A. Sachse
Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin

Keywords: Englisch als Fremdsprache, Leseverstehen, Hörverstehen, Freizeitverhalten

Die Ergebnisse des nationalen Bildungsmonitorings zeigen, dass die Neuntklässler:innen in Deutschland seit Beginn der Messungen im Mittel immer höhere Kompetenzniveaus im englischsprachigen Lese- und Hörverstehen erreichen. So ist der Anteil der Jugendlichen, die den Mittleren Schulabschluss anstreben und im Hörverstehen im Fach Englisch den Optimalstandard für den MSA erreichen (GER-Niveau B2.2 oder höher) zwischen den Jahren 2009 und 2022 um 15 Prozentpunkte und im Leseverstehen sogar um fast 21 Prozentpunkte gestiegen (Niemietz et al., 2023). Als mögliche Erklärungen für diese positiven Entwicklungen, die in fast allen Ländern zu beobachten sind, nennen Stanat et al. (2023) zum einen eine intensivere Nutzung der englischen Sprache durch Kinder und Jugendliche in der Freizeit, vor allem im Zusammenhang mit der zunehmenden Verbreitung digitaler Medien, und zum anderen Weiterentwicklungen des Englischunterrichts, darunter die Etablierung frühen Englischunterrichts in der Grundschule (Porsch et al., 2023).

Im IQB-Bildungstrend 2022 bearbeiteten mehr als 31.000 Neuntklässler:innen aus allen 16 Bundesländern Testaufgaben zu den Bildungsstandards im Lese- und Hörverstehen im Fach Englisch. Zudem wurden die Schüler:innen gefragt, in welchen Jahrgangsstufen sie in der Schule Englischunterricht erhalten haben und wie häufig sie die englische Sprache in der Freizeit nutzen. Dabei wurde sowohl die Verwendung von Englisch im Zusammenhang mit digitalen Medien (z. B. Filme und Serien auf Englisch schauen, englischsprachige Webseiten besuchen) als auch bei anderen Aktivitäten (z. B. Bücher auf Englisch lesen, außerhalb des Unterrichts mit anderen Englisch sprechen) berücksichtigt.

Regressionsanalysen unter Berücksichtigung der komplexen Stichprobenstruktur zeigen für die Daten zum Jahr 2022 enge Zusammenhänge zwischen einem Gesamtwert, der die Häufigkeit der Nutzung der englischen Sprache in der Freizeit abbildet, und den Kompetenzschätzern (Plausible Values) zum englischsprachigen Leseverstehen (r = .50) und Hörverstehen (r = .54). Die Zusammenhänge bleiben auch bei statistischer Kontrolle der Schulart (Gymnasium versus andere Schulart) und wesentlicher soziodemografischer Hintergrundmerkmale (Geschlecht, Buchbesitz und sozioökonomischer Status der Familie, Häufigkeit der Nutzung der deutschen Sprache in der Familie) substanziell (r = .44 bzw. r = .50).

Neben häufigerer Nutzung von Englisch in der Freizeit ist auch ein früher Beginn des Englischunterrichts in der Grundschule mit Kompetenzvorteilen in der 9. Jahrgangsstufe assoziiert. In einem Regressionsmodell mit drei Ebenen (Länder, Schulen, Schüler:innen) zeigt sich unter Kontrolle soziodemografischer Hintergrundmerkmale auf der Individualebene ein signifikanter Kompetenzvorsprung für Jugendliche, die bereits vor Klasse 3 in der Schule Englischunterricht erhalten haben (+26 bzw. +24 Punkte auf der Berichtsmetrik im Lese- bzw. Hörverstehen gegenüber Jugendlichen, die erst ab Klasse 4 oder später Englischunterricht erhalten haben).

Insgesamt legen die Befunde nahe, dass sowohl die Englischnutzung in der Freizeit als auch die Etablierung frühen Englischunterrichts in der Grundschule für die langjährigen positiven Trends im Fach Englisch von Bedeutung sind. Die Effekte sind dabei auch dann substantiell, wenn beide Faktoren (Freizeitnutzung der englischen Sprache und früher Beginn des Englischunterrichts) gemeinsam sowie unter Berücksichtigung soziodemografischer Hintergrundmerkmale modelliert werden. Diese und weitere Ergebnisse werden im Vortrag präsentiert, diskutiert und hinsichtlich ihrer Relevanz für die Praxis eingeordnet.

 

Kohortentrends in schulischer Motivation im Fach Deutsch: Zusammenhänge mit Veränderungen in den Leistungen und der Zusammensetzung der Schüler:innenschaft

Rebecca Schneider, Sebastian Weirich
Institut zur Qualitätsentwicklung im Bildungswesen an der Humboldt-Universität zu Berlin

Keywords: Motivation, Selbstkonzept, Interesse, Schülermerkmale, schulische Leistung

Motivationale Merkmale bilden neben kognitiven Fähigkeiten wichtige Aspekte des Bildungserfolgs und werden deshalb regelmäßig in Schulleistungsstudien untersucht. Für das Fach Deutsch weisen empirische Befunde des IQB-Bildungstrends 2022 in der Sekundarstufe I auf einen leichten Rückgang im Selbstkonzept und Interesse in Deutschland in den untersuchten Kohorten hin, also auf ungünstige Veränderungen in motivationalen Merkmalen im Zeitverlauf auf Populationsebene (-.29 ≤ d ≤ -.22; Schneider et al., 2023). Da fachbezogene Leistungen substantiell mit korrespondierenden Selbstkonzepten und Interessen zusammenhängen (z. B. Möller et al., 2020; Valentine et al., 2004) und auch für Leistungen im Fach Deutsch ungünstige Kohortenunterschiede für Neuntklässler:innen beobachtet wurden (Boemmel & Schneider, 2023), stellt sich die Frage, inwieweit sich die Veränderungen in den motivationalen Merkmalen auf die Veränderungen in den Leistungen zurückführen lassen. Ergebnisse für Mathematik und die naturwissenschaftlichen Fächer deuten jedoch darauf hin, dass sich Trends in der Motivation nicht bedeutsam auf Testleistungs- und Notenunterschiede zwischen Kohorten zurückführen lassen (Schneider, Gentrup et al., 2022). Daher soll in diesem Beitrag zusätzlich untersucht werden, inwieweit Veränderungen in der Zusammensetzung der Schüler:innenschaft mit Kohortentrends in der Motivation in Zusammenhang stehen. So berichten beispielsweise Schüler:innen mit Zuwanderungshintergrund in Deutschland teilweise geringere Selbstkonzepte im Fach Deutsch als Schüler:innen ohne Zuwanderungshintergrund (z. B. Shajek et al., 2006; siehe aber auch Schöber et al., 2015). Da sich in den betrachteten Zeiträumen der Anteil von Schüler:innen mit Zuwanderungshintergrund in der Gesamtpopulation erhöht hat (Henschel et al., 2023), könnte sich dies auch auf die Trends für die motivationalen Merkmale im Fach Deutsch ausgewirkt haben.

In diesem Beitrag sollen deshalb zum einen Motivationstrends in verschiedenen Subpopulationen von Schüler:innen (z. B. nach Zuwanderungshintergrund) analysiert sowie zum anderen untersucht werden, ob die gefundenen Kohortentrends im Selbstkonzept und im Interesse im Fach Deutsch in der Gesamtpopulation auf Unterschiede in schulischen Leistungen zwischen Kohorten und/oder auf Veränderungen in der Zusammensetzung der Schüler:innenschaft zwischen den Erhebungszeitpunkten zurückgeführt werden können.

Die Analysen basieren auf Daten der IQB-Bildungstrends 2015 und 2022 für jeweils über 30.000 Neuntklässler:innen. Das Selbstkonzept und Interesse der Schüler:innen im Fach Deutsch wurde zu den beiden Erhebungszeitpunkten mit den gleichen Items erhoben. Als Leistungsindikatoren wurden die Testleistungen der Schüler:innen in den Kompetenzbereichen Lesen, Zuhören und Orthografie sowie die Schulnote im Fach Deutsch herangezogen. Zudem wurden vier Merkmale der Schüler:innenschaft in die Analysen einbezogen, die nicht dem Einfluss des Schulsystems unterliegen: der Zuwanderungshintergrund der Schüler:innen, die zu Hause gesprochene Sprache, der Highest International Socio-Economic Index of Occupational Status (HISEI) als Indikator des sozioökonomischen Status sowie die Anzahl der Bücher zu Hause als Indikator für das kulturelle Kapital der Fami¬lie.

Neben den Trendergebnissen für die anhand dieser Hintergrundmerkmale gebildeten Subgruppen von Schüler:innen werden die Ergebnisse adjustierter Trends berichtet. Diese schätzen, wie die Veränderungen in den beiden motivationalen Konstrukten im Fach Deutsch ausfallen würden, wenn die mittlere Ausprägung der Leistungen und der Merkmale der Schüler:innenschaft zwischen den Erhebungs¬zeitpunkten konstant geblieben wäre (vgl. z. B. Mayer et al., 2016). Die Analysen zeigen, dass sich die adjustierten Mittelwerte im Selbstkonzept und im Interesse unter Berücksichtigung sowohl der Leistungen als auch der untersuchten Populationsmerkmale zu den einzelnen Messzeitpunkten nur geringfügig von den nicht-adjustierten Mittelwerten unterscheiden. Entsprechend sind die Trends zwischen 2015 und 2022 in den beiden motivationalen Merkmalen auch nach der Adjustierung weiterhin signifikant negativ und fallen ähnlich groß aus wie die Trends ohne Adjustierung. Abschließend sollen u. a. Implikationen der Befunde für das Bildungssystem diskutiert werden.

 

Auswirkungen von Priming des Geschlechts auf das berichtete fachspezifische Selbstkonzept und Interesse von Schüler:innen in geschlechterkonnotierten Schulfächern

Annika Liebelt, Sarah Gentrup, Rebecca Schneider, Sofie Henschel
Institut zur Qualitätsentwicklung im Bildungswesen (IQB)

Keywords: Selbstkonzept, Interesse, Sekundarstufe, Priming, Geschlechterstereotype

Mädchen und Jungen unterscheiden sich teilweise deutlich bezüglich ihrer fachspezifischen Selbstkonzepte und Interessen. So weisen Mädchen im Mittel ein positiveres Selbstkonzept und höheres Interesse in den Bereichen Lesen und Schreiben im Fach Deutsch auf als Jungen (z. B. Böhme et al., 2016; Diedrich et al., 2019; Schneider et al., 2022), wohingegen Jungen ein positiveres Selbstkonzept und höheres Interesse in Mathematik berichten (z. B. Else-Quest et al., 2010; Jansen et al., 2019; Schneider et al., 2022). Diese motivationalen Geschlechterdisparitäten spiegeln sich fachspezifisch in der Leistung der Schüler:innen wider, wobei der mathematische Leistungsvorsprung von Jungen deutlich kleiner ausfällt (z. B. Else-Quest et al., 2010; Schipolowski et al., 2019) als der sprachliche Vorsprung der Mädchen (z. B. Gentrup et al., 2022; Reilly et al., 2019).

Als eine mögliche Erklärung für derartige Geschlechterdisparitäten werden Geschlechterstereotype und deren Auswirkungen diskutiert (Kessels & Heyder, 2010). Chalabaev et al. (2013) argumentieren, dass Stereotype auf verschiedenen Wegen einen Einfluss auf Personen ausüben können  zum einen durch die Verinnerlichung von Stereotypen, zum anderen durch deren situative Auswirkungen. Zu den situativen Konsequenzen von Stereotypen gehört das Phänomen des Stereotype Threat: Ist ein Stereotyp über eine Gruppe in der Gesellschaft verbreitet und werden Personen der entsprechenden Gruppe in einer Situation mit diesem konfrontiert, verhalten sie sich häufig dem Stereotyp entsprechend (Steele & Aronson, 1995). Die Forschung zu Stereotype Threat konzentriert sich im schulischen Kontext vor allem auf Leistungen von Schüler:innen. Es wurde gezeigt, dass sich durch Priming der weiblichen Identität oder vorherrschender Geschlechterstereotype die Leistung von Mädchen bzw. Frauen in Mathematiktests verschlechterte (z. B. Ambady et al., 2001; Franceschini et al., 2014). Ungeklärt ist, ob Stereotype situativ auch das fachspezifische Selbstkonzept und Interesse von Schüler:innen beeinflussen können. Auch im Schulkontext können Situationen wiederkehrend auftreten, in denen Geschlechterstereotype oder die Zugehörigkeit zu einem Geschlecht aktiviert werden. Dadurch könnte die Motivation der geschlechterstereotypisierten Gruppe beeinträchtigt werden, was wiederum negative Konsequenzen für die weitere Lernentwicklung haben kann.

Im Beitrag wird deshalb anhand von Daten des IQB-Bildungstrends 2022 in der 9. Jahrgangsstufe untersucht, ob das Selbstkonzept und Interesse von Mädchen und Jungen in Deutsch und Mathematik in Abhängigkeit vom Priming der Geschlechterkategorie variiert. Um zu untersuchen, ob das Priming der Geschlechterkategorie einen Einfluss auf die Ausprägung der motivationalen Konstrukte hat, wurde in einem Teilsample von 2.489 Schüler:innen aus 142 Schulen in sechs Bundesländern ein Rotationsdesign realisiert. Die Schüler:innen wurden schulweise zufällig einer von drei Gruppen zugeordnet, in denen die Reihenfolge der gestellten Fragen zu Geschlecht, Geschlechterstereotypen, fachspezifischem Selbstkonzept und Interesse rotiert war. Dadurch ergibt sich eine Variation der Stärke des Primings. Während Schüler:innen der Rotation 1 ihr fachspezifisches Selbstkonzept und Interesse ohne vorheriges Priming einschätzten, wurde in Rotation 2 durch vorherige Abfrage ihres Geschlechts die Geschlechterkategorie aktiviert. In Rotation 3 wurden vor Beantwortung der motivationalen Items neben der Geschlechterkategorie zusätzlich auch Geschlechterstereotype bewusst gemacht. Alle Analysen werden fachspezifisch und unter Berücksichtigung der komplexen Datenstruktur durchgeführt. Zur Fragestellung nach den Primingeffekten sind noch keine Analysen erfolgt, da die Studie zunächst präregistriert werden soll. Zur Präsentation auf der GEBF werden die Ergebnisse vorliegen.

Die im IQB-Bildungstrend 2022 gefundenen stabilen bzw. leicht ansteigenden Geschlechterdisparitäten verdeutlichen, dass weiterhin gezielte Anstrengungen zur Reduktion geschlechtsspezifischer Unterschiede im schulischen Kontext notwendig sind. Die Priming-Studie wird hierzu neue Erkenntnisse zum Einfluss von Geschlechterstereotypen in spezifischen Situationen liefern.

 
17:00 - 18:00Keynote 1: Prof. Dr. Pam Grossmann: Core Practices for Teaching: A Language for Developing and Improving Professional Practice
Ort: H05
Datum: Dienstag, 19.03.2024
9:00 - 10:00Keynote 2: Prof. Dr. Jutta Allmendinger: Transfer zwischen Forschung und Politik: was es braucht, und was nicht
Ort: H05
10:30 - 12:104-01: Diskussionforum: Large Language Models und Betrugsverhalten in Bildungskontexten - Welche Forschungspotenziale ergeben sich für die empirische Bildungsforschung?
Ort: H05
 
Offenes Beitragsformat

Diskussionforum: Large Language Models und Betrugsverhalten in Bildungskontexten - Welche Forschungspotenziale ergeben sich für die empirische Bildungsforschung?

Stefan Janke1, Martin Daumiller2

1Universität Mannheim, Deutschland; 2Universität Augsburg, Deutschland

Die rasante Weiterentwicklung der Künstlichen Intelligenz (KI) und insbesondere von Large Language Models (LLMs) wie ChatGPT birgt immense Potenziale sowie Herausforderungen für den Bildungsbereich. Durch LLMs lassen sich komplexe Texte produzieren, die von durch Menschen selbst generiertem Material kaum zu unterscheiden sind, was neue Möglichkeiten für betrügerisches Verhalten ermöglicht. Aufgrund der einfachen und schnellen Zugänglichkeit von LLMs, können Schüler:innen, Studierenden, aber auch Wissenschaftler:innen sie nutzen, um ohne besondere Eigenleistung Lösungen für Prüfungsfragen generieren zu lassen, sowie Hausarbeiten oder wissenschaftliche Arbeiten zu verfassen. Dies fordert die Integrität des Bildungssystems auf bisher noch nicht dagewesene Weise heraus. Während die gesellschaftliche Debatte über die Bedeutung von LLMs für Betrugsverhalten in Bildungskontexten bereits im Gange ist, befindet sich die empirische Auseinandersetzung dazu noch in den Kinderschuhen. Es mangelt insbesondere an einer Erschließung des Forschungsfeldes im Sinne der empirischen Bildungsforschung. Dabei sind nicht nur mögliche Forschungsfelder abzustecken und Forschungsfragen zu präzisieren, sondern es bedarf auch einer grundsätzlichen Gegenstandsbestimmung, was im Kontext von LLMs als betrügerisches Verhalten zu verstehen ist. Eine entsprechende Felderschließung kann allerdings nur mit Hilfe eines multidisziplinären Blickes auf den Forschungsbereich erfolgen. Zu diesem Zweck diskutieren wir das Forschungsfeld umfassend mit einem Panel aus Expert:innen verschiedener Forschungsdisziplinen.

Das Expert:innenpanel besteht gezielt zur Hälfte aus empirischen Bildungswissenschaftler:innen und zur Hälfte aus Expert:innen aus den Bereichen Philosophie und Informatik. Diese Expertise erlaubt besonders umfassende und fundierte Einblicke in das Themenfeld. Als Expertin für Technikphilosophie rückt JProf. Dr. Amrei Bahr die normativen Aspekte der Debatte in den Fokus (insbesondere: was macht Betrugsverhalten und Eigenleistung im Kontext von LLMs aus?). Prof. Dr. Debora Weber-Wulff wird als Plagiats- und Medienexpertin die technischen Möglichkeiten und Problemstellungen der Detektion bei Betrugsverhalten mit LLMs thematisieren. Aus Sicht der empirischen Bildungsforschung werden wiederum Prof. Dr. Katharina Scheiter als psychologische Expertin für digitale Bildung und Prof. Dr. Dirk Ifenthaler als wirtschaftspädagogischer Experte für technologiebasiertes Instruktionsdesign die Debatte in die bereits bestehende empirische Auseinandersetzung zum Einsatz künstlicher Intelligenz in Bildungsprozessen einordnen. Dabei wird besonders darauf fokussiert, wo bereits bestehendes Wissen bei der Erschließung des Forschungsfeldes hilfreich sein kann und welche Fragestellungen völlig neu erschlossen werden müssen.

Das Diskussionsforum startet nach einer knappen Einleitung der Chairs mit kurzen Eingangsstatements der Expert:innen (jeweils 5 Minuten für die 4 Expert:innen und die Einführung). Auf diesen Eingangsstatements aufbauend erfolgt eine moderierte Diskussion von etwa 40 Minuten. Am Anfang der Diskussion beschäftigen wir uns mit der normativen Frage danach, was betrügerisches Handeln in Bildungskontexten vor dem Hintergrund von LLMs auszeichnet (ca. 10 Minuten). Dem folgt eine halbstündige Diskussion der folgenden fünf Fragen, die unter Nutzung von ChatGPT unter Berücksichtigung des Tagungsmottos („Bildung verstehen – Partizipation erreichen – Transfer gestalten) generiert wurden:

1) Welche Indikatoren könnten dazu genutzt werden, um betrügerisches Verhalten mithilfe von LLMs in Bildungskontexten zu identifizieren?

2) Welche Forschungsansätze könnten tiefergehende Einblicke in die individuellen Beweggründe für betrügerisches Verhalten in Bildungskontexten mit Hilfe von LLMs ermöglichen?

3) Wie könnten empirische Studien helfen, die Wirksamkeit von Richtlinien und Sanktionen zur Prävention von betrügerischem Verhalten mit LLMs in Bildungskontexten zu bewerten und entsprechende Empfehlungen abzuleiten?

4) Wie kann empirische Bildungsforschung zur Entwicklung von Lernressourcen beitragen, um Lernende zu befähigen, LLMs verantwortungsvoll zu nutzen und ethische Leitlinien zu internalisieren?

5) Auf welche Weise könnten empirische Studien dazu beitragen, eine evidenzbasierte Grundlage für die Gestaltung von Schulungsprogrammen für Lehrende und Lernende im Umgang mit LLMs zu schaffen?

Das Panel mündet in einer Plenumsdiskussion, für die etwa 25 Minuten vorgesehen sind. Im Rahmen der Plenumsdiskussion erhalten die anwesenden Teilnehmenden die Möglichkeit (1) weitere Fragen an die Expert:innen zu stellen und (2) eigene Positionen zu den aufgeworfenen Fragen zu formulieren.

Das vorgestellte Diskussionsforum soll somit einen fruchtbaren Startpunkt für eine umfassende Themenerschließung des Gegenstandes „Betrugsverhalten mit Hilfe von Large Language Models in Bildungskontexten“ bieten. Wir hoffen mit dem Forum empirische Arbeiten zu inspirieren, die besser erkennbar machen, wie es Bildungseinrichtungen möglich ist, auch in Zeiten von LLMs akademische Integrität zu erhalten.

 
13:10 - 14:505-01: PISA 2022: Vertiefende Analysen für Erklärungsansätze der aktuellen PISA-Ergebnisse in Deutschland
Ort: H05
 
Eingeladenes Symposium

PISA 2022: Vertiefende Analysen für Erklärungsansätze der aktuellen PISA-Ergebnisse in Deutschland

Chair(s): Doris Lewalter (Zentrum für internationale Bildungsvergleichsstudien (ZIB), Technische Universität München (TUM))

Diskutant*in(nen): Burkhard Priemer (Humboldt Universität zu Berlin)

Im Rahmen der PISA-Studie wird untersucht, wie gut 15-jährige Schüler*innen gegen Ende

ihrer Pflichtschulzeit alltagsnahe Aufgaben in Mathematik, im Lesen und in den

Naturwissenschaften lösen können. Die Befunde der aktuellen PISA-Studie 2022 zeigen auf,

dass für die Schüler*innen in Deutschland in allen drei Bereichen – Mathematik,

Naturwissenschaften und Lesen – Leistungseinbußen im Vergleich zu 2018 zu verzeichnen

sind, die im internationalen Vergleich überdurchschnittlich hoch ausfallen. Während die

mittleren Kompetenzen der Jugendlichen in Deutschland 2018 in allen drei Bereichen noch

über dem jeweiligen OECD-Durchschnitt lagen, ist dies in PISA 2022 nur noch für die

naturwissenschaftliche Kompetenz der Fall. In Mathematik und im Lesen unterscheiden sich

die Kompetenzen nicht mehr signifikant vom OECD-Durchschnitt.

Die Gruppe der leistungsschwachen Schüler*innen, ist in Deutschland im Vergleich zu 2018

zudem in allen drei Bereichen gewachsen. Leistungsschwache Jugendliche werden mit hoher

Wahrscheinlichkeit ohne zusätzliche Förderung weder den Anforderungen weiterführender

Schulen noch denen der beruflichen Ausbildung gewachsen sein. Ihr Anteil fällt an nicht

gymnasialen Schulen, u.a. Haupt- oder Realschulen, deutlich höher aus als an Gymnasien.

Diese Entwicklung kann durch mehreren Faktoren beeinflusst sein. Es kann davon ausgegangen

werden, dass sowohl die Schulschließungen (vgl. Betthäuser, et al, 2023) und der damit

verbundene Distanzunterricht (Lewalter, et al., 2023) negative Effekte hatten, als auch

Merkmale der Schüler*innen (Diedrich, et al., 2023) sowie Merkmale des Unterrichts (Schiepe-

Tiska, et al., 2023) mit den gefundenen Kompetenzniveaus in Zusammenhang stehen. Im

Rahmen des Symposiums wird der gemeinsamen Forschungsfrage nachgegangen, inwiefern

Merkmale der Schüler*innen als auch schulische Rahmenbedingungen und Merkmale des

Unterrichts mit der Leistung der Schüler*innen in den verschiedenen Domänen in

Zusammenhang stehen.

Müller et al., untersuchen mittels latenter Profilanalysen den Zusammenhang von

Merkmalskombinationen der Schüler*innen und deren Kompetenzen in den drei Domänen der

PISA-Studie (Mathematik, Lesen und Naturwissenschaften). Dabei stellen sie die gefundenen

Profile und Zusammenhänge anhand der Daten der PISA-Studien aus 2018 und 2022 einander

gegenüber.

Kastorff untersucht in ihrem Beitrag den Zusammenhang zwischen schulischen und

individuellen Gelingensbedingungen, wie beispielsweise die Ausstattung der Schulen mit

materiellen und personellen ICT Ressourcen für den Lernerfolg in den Naturwissenschaften.

Dabei wird zum einen ein Vergleich von Schüler*innen an Gymnasien sowie an nicht

gymnasialen Schularten durchgeführt und zum anderen die Gruppe der leistungsschwachen

Schüler*innen in den Blick genommen.

Todtenhöfer et al., stellen demgegenüber den Unterricht im Fach Mathematik und seinen Bezug

zu Bildungsstandards und mehrdimensionalen Bildungszielen in den Fokus ihrer Analysen. Sie

gehen der Frage nach, inwieweit Prüfungsaufgaben, die den Unterrichtsstoff eines bestimmten

Unterrichtszeitraums repräsentativ abbilden, Teilkompetenzen entsprechend der

Bildungsstandards adressieren. Als Ergänzung wird der konstruierte Lebensweltbezug als ein

mögliches motivationales Potenzial kompetenzorientierten Unterrichts hinzugezogen.

Anschließend wird untersucht, wie Unterricht, der dieser inhaltlichen Ausrichtung folgt, mit

den mehrdimensionalen Bildungszielen in PISA 2022 (Mathematikkompetenz, Freude und

Interesse sowie instrumentelle Motivation) zusammenhängt.

Diedrich et al, kombinieren verschiede Schüler*innenmerkmalesowie des Geschlechts und des

sozioökonomischen beruflichen Status der Eltern in zusammenfassenden Regressionsanalysen.

Als Kriterium wird die mathematische Kompetenz der Schüler*innen herangezogen. Die

Analysen werden für alle Erhebungsrunden durchgeführt, in denen Mathematik Hauptdomäne

war (2003, 2012 und 2022), sodass eine Entwicklung des Einflusses verschiedener

Erklärungsfaktoren betrachtet werden kann.

 

Beiträge des Symposiums

 

Krisenrelevante Merkmalsprofile von Schüler*innen vor und nach der Pandemie

Maren Müller, Jennifer Diedrich, Doris Lewalter
Zentrum für internationale Bildungsvergleichsstudien (ZIB), Technische Universität München (TUM)

Theoretischer Hintergrund und Fragestellungen

Die Folgen der Maßnahmen zur Eindämmung der Corona-Pandemie wurden in einer Vielzahl

wissenschaftlicher Veröffentlichungen (u.a. Betthäuser et al., 2023) untersucht. Die PISA 2022

Studie liefert ergänzend Hinweise auf die Rahmenbedingungen und Gestaltung des

Distanzunterrichts in Deutschland und auf internationaler Ebene (Lewalter et al., 2023). Hierbei

spielt auch der Einsatz digitaler Medien eine wichtige Rolle. Eine zentrale Frage ist, welche

Merkmale von Schüler*innen mit einer erfolgreichen Bewältigung dieser Situation assoziiert

sind und in diesen herausfordernden Lernumgebungen Vorteile bringen. Dieser

Themenstellung geht der Beitrag anhand von Daten zu zwei Messzeitpunkten vor und nach der

Pandemie nach.

Resilienz (Rutter, 2006), die Fähigkeit zur Selbstregulation (Blume et al., 2021) sowie das

Zugehörigkeitsgefühl zur Schule (Holzer et al., 2021) zählen zu Eigenschaften, die in

Krisenzeiten einen besseren Umgang mit den einhergehenden Herausforderungen im

Schulkontext nahelegen. Allgemein wird auch ein positives Fähigkeitsselbstkonzept als

lernförderlich angesehen (Karlen et al., 2021). Mit Blick auf den Distanzunterricht ist der

kompetente Umgang mit digitalen Medien vermutlich besonders relevant. Die genannten

Merkmale treten nicht isoliert in Schüler*innen auf, sondern in verschiedenen

Merkmalskombinationen, die in unterschiedlicher Weise mit Leistung zusammenhängen. Mit

Blick auf die Situation vor und nach der Pandemie und die Ausprägung der Merkmale bei

Schüler*innen in Deutschland stellen sich demnach die folgenden Forschungsfragen:

1. Welche Merkmalsprofile zeigen sich bei Schüler*innen in Deutschland vor und nach der

Pandemie?

2. Gibt es Unterschiede zwischen Schüler*innen verschiedener Merkmalsprofile

hinsichtlich der Kompetenz in den drei PISA-Domänen Mathematik, Lesen und

Naturwissenschaften?

Methode

Die Fragestellungen werden anhand einer latenten Profilanalyse der Daten der PISA-Studie

2018 und PISA 2022 beantwortet. Die berücksichtigten Merkmale werden durch etablierte

Skalen der PISA-Studie gemessen (Mang, et al., 2023), deren Ausprägungen die Werte 1 bis 4

annehmen können. Bei allen Werten handelt es sich um die Selbsteinschätzung der

Jugendlichen. Alle Analysen werden in R (Version 4.2.2) durchgeführt. Es werden anhand der

z-standardisierten Variablen ICT-Kompetenz, Resilienz, Selbstregulation, und

Zugehörigkeitsgefühl zur Schule Merkmalsprofile erstellt und auf signifikante Unterschiede hin

überprüft. Abschließend werden die Schüler*innen abhängig von ihrer Profilzugehörigkeit

hinsichtlich ihrer Kompetenz in den drei PISA-Domänen (Mathematik, Lesen,

Naturwissenschaften) beschrieben.

Ergebnisse

Die Schüler*innen (PISA 2018: N = 5451; PISA 2022: N = 6116) können auf Basis der

verwendeten Merkmale bei PISA 2018 drei Profilen zugeordnet werden, die als „Mainstream“,

„Vulnerable“ und „Außenseiter*innen“ bezeichnet werden. Mainstream zeichnet sich durch

leicht überdurchschnittliche Werte in Selbstregulation, ICT-Kompetenz, Zugehörigkeitsgefühl

und Resilienz aus. Die Vulnerablen und Außenseiter*innen weisen leicht

unterdurchschnittliche Werte bei Selbstregulation, ICT-Kompetenz und Resilienz auf. Auch

das Zugehörigkeitsgefühl zur Schule ist bei beiden Profilen unterdurchschnittlich, wobei die

Außenseiter*innen für dieses Merkmal sehr viel niedrigere Werte aufweisen (M = - 2.4). Im

Jahr 2018 schneiden die Außenseiter*innen und Vulnerablen in allen drei Domänen schlechter

ab als der Durchschnitt. Die Kompetenzen des Mainstreams liegen in allen drei Bereichen über

dem Durchschnitt. Bei PISA 2022 zeigen sich ebenfalls drei Profile die jedoch anders

charakterisiert werden können, als jene in 2018: die „Allrounder*innen“, „Geeks“ und

„Nonliner*innen“. Für die „Nonliner*innen“ liegen die Werte für ICT-Kompetenz im Mittel

1.35 SD unter dem Durchschnitt und diese Schüler*innen zeigen in allen drei Domänen

unterdurchschnittliche Kompetenzen. Die „Allrounder*innen“ haben die höchsten Werte in

Selbstregulation, ICT-Kompetenz und Zugehörigkeitsgefühl und erzielen in allen drei

Domänen die höchsten Kompetenzwerte. Die Kompetenzen der „Geeks“ mit niedrigen Werten

beim Zugehörigkeitsgefühl und zugleich überdurchschnittlichen Werten bei der ICT-

Kompetenz liegen in allen drei Domänen im Durchschnitt. Bezüglich der Resilienz

unterscheiden sich die Profile kaum. Im Vergleich zu den Ergebnissen für 2018 zeigt sich, dass

die ICT-Kompetenz in größerem Maße mit dem Erreichen höherer Mathematikkompetenz

assoziiert werden kann. Ein zusätzlich hohes Zugehörigkeitsgefühl zur Schule sowie hohe

selbstregulative Fähigkeiten scheinen darüber hinaus zentral bei der Erreichung

überdurchschnittlicher Kompetenzwerte.

 

Post-Pandemic & lessons learned: schulische und individuelle Gelingensbedingungen des Lernerfolgs in den Naturwissenschaften - Evidenz aus PISA 2022

Tamara Kastorff
Zentrum für internationale Bildungsvergleichsstudien (ZIB), Technische Universität München (TUM)

Theoretischer Hintergrund und Fragestellungen

Naturwissenschaftliche Kompetenz ist von zentraler Bedeutung für Schüler*innen, damit sie in

Bereichen wie dem Gesundheits- und Umweltschutz nicht nur aktiv handeln können, sondern

auch die Folgen des eigenen Handelns einschätzen können (Sailer et al., 2021). Die

naturwissenschaftliche Kompetenz ist zudem entscheidend für eine erfolgreiche Teilhabe an

einer naturwissenschaftlich-technisch geprägten Gesellschaft (z. B., Schiepe-Tiska et al., 2019).

Die aktuellen Ergebnisse der PISA Studie in 2022 zeigen jedoch, dass die Schüler*innen in

Deutschland signifikant schlechter in den Naturwissenschaften abschnitten, als dies in PISA

2018 der Fall war (Kastorff et al., 2023). Schüler*innen an Gymnasien schneiden noch relativ

gut in den Naturwissenschaften ab, während ein Drittel der Schüler*innen an nicht gymnasialen

Schularten nicht die Kompetenzstufe II erreicht, die als kritische Hürde zur erfolgreichen

Teilhabe an der naturwissenschaftlichen-technischen Gesellschaft gesehen wird. Folglich

weisen die Befunde der aktuellen PISA-Studie auf, dass besonders bei Schüler*innen an nicht

gymnasialen Schularten ein vermehrter Förderbedarf besteht und somit die Breitenförderung

im Sinne einer naturwissenschaftlichen Kompetenz für alle nicht gelingt. Diese Befunde sind

in Teilen auch mit der Corona-Pandemie und den damit einhergehenden Auswirkungen auf das

Bildungswesen zu erklären (Betthäuser et al., 2023). Aufgrund der gravierenden aktuellen PISA

Ergebnisse stellt sich die Frage, inwiefern sowohl schulische Gelingensbedingungen während

der Corona-Pandemie, wie beispielsweise die Ausstattung der Schulen mit materiellen und

personellen ICT Ressourcen als auch Maßnahmen zur Erhaltung des Unterrichtsgeschehens

sowie individuelle Gelingensbedingungen auf Ebene der Schüler*innen, wie beispielsweise der

sozioökonomische Status, in Deutschland während der Corona-Pandemie von Bedeutung

waren. Im Rahmen des vorliegenden Beitrags werden daher die Fragestellungen untersucht,

welche schulischen und individuellen Gelingensbedingungen für den Lernerfolg in den

Naturwissenschaften ausgemacht werden können. Dabei wird auch auf einen Vergleich von

Schüler*innen an Gymnasien sowie an nicht gymnasialen Schularten eingegangen.

Methode

An der PISA-Studie nahmen N = 6116 sowie N = 260 Schulleitungen in Deutschland teil. Von

den teilnehmenden Schüler*innen besuchten N = 2273 Gymnasien und N = 3590 nicht

gymnasiale Schularten. Als Datengrundlage des vorliegenden Beitrages diente zum einen der

PISA Kompetenztest zur Messung der naturwissenschaftlichen Kompetenz von

Fünfzehnjährigen. Zum anderen wurden die Antworten der Schüler*innen sowie der

Schulleitungen basierend auf Fragebogendaten für die Analysen herangezogen, um sowohl

individuelle als auch schulische Gelingensbedingungen in die Analysen einzubeziehen.

Aufgrund der genesteten Datenstruktur wurden die Angaben der Schüler*innen und

Schulleitungen mittels Mehrebenenanalysen in R analysiert.

Ergebnisse und Diskussion

Die Ergebnisse zeigen, dass bei Schüler*innen an nicht gymnasialen Schularten (ß = 6.78, SE

= 2.78, p <.005) als auch an Gymnasien (ß = 11.58, SE = 3.91, p <.000 ) schulische

Gelingensbedingungen wie beispielsweise Aktivitäten zur Erhaltung des

Unterrichtsgeschehens während der Corona-Pandemie einen signifikant positiven Effekt auf

die Naturwissenschaftliche Kompetenz aufweisen. Gleichzeitig zeigt sich, dass Probleme beim

Selbstlernen der Schüler*innen, mit einer niedrigeren naturwissenschaftlichen Kompetenz bei

Schüler*innen lediglich an Gymnasien assoziiert sind (ß = -15.82, SE= 3.26, p < .000). Zudem

weist lediglich an nicht gymnasialen Schularten die Qualität der Ausstattung mit materiellen

und personellen ICT-Ressourcen einen positiven Effekt auf die naturwissenschaftliche

Kompetenz auf (ß = 9.67, SE = 4.85, p <.000). Insgesamt veranschaulichen die Ergebnisse die

Relevanz schulischer Rahmenbedingungen für die naturwissenschaftliche Kompetenz auch

während der Ausnahmesituation der Corona-Pandemie. Betrachtet man die Schüler*innen

unterhalb Kompetenzstufe II gesondert, so konnten keine signifikanten Gelingensbedingungen

auf Schulebene identifiziert werden. Die Diskussion der Ergebnisse erfolgt unter

Berücksichtigung der schulischen und individuellen Faktoren, die in potenziellen zukünftigen

Ausnahmesituationen entscheidend sein könnten, um den Erfolg im naturwissenschaftlichen

Lernen aufrechtzuerhalten.

 

Zwischen Prüfungsaufgaben und Leistung: Kompetenzorientierter Mathematikunterricht und mehrdimensionale Bildungsziele in PISA 2022

Pia Todtenhöfer1, Anja chiepe-Tiska2, Anna Heinle2, Mirjam Weis1, Doris Lewalter1
1Zentrum für internationale Bildungsvergleichsstudien (ZIB), Technische Universität München (TUM), 2Universität Koblenz

Theoretischer Hintergrund

PISA 2022 hat gezeigt, dass die Schüler*innen in Deutschland im Vergleich zu vorherigen

PISA-Erhebungsrunden eine geringere Mathematikkompetenz aufweisen (Diedrich et al.,

2023). Eine zentrale Stellschraube, die Mathematikkompetenz zu verbessern, ist der

Mathematikunterricht (Schiepe-Tiska et al., 2023). Bereits im Jahr 2002 wurden die nationalen

Bildungsstandards entwickelt, um zu definieren, welche Kompetenzen Schüler*innen am Ende

eines bestimmten Bildungsabschnittes erworben haben sollen (KMK, 2002). Die

Bildungsstandards können zusätzlich um die Perspektive motivationaler Lernergebnisse

erweitert werden (Schiepe-Tiska et al., 2021), die aufgrund der Umstellung zu

kompetenzorientierten Lehrplänen mehr in den Fokus gerückt sind (KMK, 2010). Ziel eines

kompetenzorientierten Unterrichts sollte folglich sein, sowohl die Kompetenzbereiche der

Bildungsstandards (hier zusammengefasst in die Kategorien Fachkenntnisse, Fachmethoden,

Kommunikation, Reflexion) als auch motivationale Aspekte (hier dargestellt durch den

konstruierten Lebensweltbezug) in der Unterrichtsgestaltung abzudecken. Diese

Unterrichtsgestaltung besteht im Mathematikunterricht zum Großteil aus Unterrichts- und

Prüfungsaufgaben, deren Lösungen von Schüler*innen erarbeitet werden (Reiss & Hammer,

2021). Eine Analyse der Prüfungsaufgaben ermöglicht einen konkreten Einblick in das

Unterrichtsangebot, da sie den Unterrichtsstoff eines bestimmten Unterrichtszeitraums

repräsentativ abbilden sollen und besonderes Potenzial haben, das Erreichen

mehrdimensionaler Bildungsziele zu fördern.

Fragestellung

Darauf basierend befassen sich folgenden Analysen zunächst mit der Frage, inwieweit die

untersuchten Prüfungsaufgaben Teilkompetenzen entsprechend der Bildungsstandards

adressieren. Als Ergänzung wird der konstruierte Lebensweltbezug als ein mögliches

motivationales Potenzial kompetenzorientierten Unterrichts hinzugezogen. Anschließend wird

untersucht, wie ein Unterricht, der dieser inhaltlichen Ausrichtung folgt, mit den

mehrdimensionalen Bildungszielen in PISA 2022 (Mathematikkompetenz, Freude und

Interesse sowie instrumentelle Motivation) zusammenhängt.

Methode

Die Daten basieren auf N = 891 Prüfungsanalyseeinheiten von 43 Lehrkräften, deren Klassen

im Rahmen von PISA 2022 erfasst worden sind. Für die Analyse der Prüfungsaufgaben wurden

im Rahmen von PISA-Ceco eingesetzte Klassenarbeiten aus dem Schuljahr 2021/2022

eingesammelt. Die Aufgaben wurden unter anderem in Bezug auf die Dimensionen

„Orientierung an den Kompetenzbereichen der Bildungsstandards“ (Fachkenntnisse,

Fachmethoden, Kommunikation, Reflexion) sowie in Bezug auf den konstruierten

Lebensweltbezug als ein motivationsfördernder Faktor analysiert (ausführliches

Kategorienschema: Heinle et al., 2023). Alle Kategorien wurden anhand dichotomer

Antwortkategorien doppelt kodiert. Bei abweichenden Kodierungen einigten sich die

Rater*innen auf einen Code. Diese Prüfungsaufgaben wurden mit dem klassenbasierten

Datensatz der Schüler*innen aus PISA 2022 (rund N = 600) verbunden, um eine Verbindung

der Schülerleistungen (Mathematikkompetenz, Freude und Interesse sowie Motivation) mit den

genannten Unterrichtsmerkmalen (Fachkenntnisse, Fachmethoden, Kommunikation, Reflexion

sowie der konstruierte Lebensweltbezug) herzustellen.

Ergebnisse

Bezogen auf die Orientierung der Prüfungsaufgaben an den Bildungsstandards zeigt sich, dass

die Kategorien Fachkenntnisse (99.9%) und Fachmethoden (89.9%) in nahezu allen

Prüfungsaufgaben vorkommen und daher grundsätzlich Bestandteil der Prüfungsaufgaben aller

Lehrkräfte sind. In gewisser Hinsicht erfüllen die Prüfungsaufgaben aller Lehrkräfte

Teilkompetenzen der Bildungsstandards. Das Kommunizieren (10.3%) wird hingegen nur in

etwa einem Zehntel der Aufgaben verlangt und der Kompetenzbereich Reflexion (0.3%) ist so

gut wie kein Bestandteil der Prüfungsaufgaben. Es wird erwartet, dass sich Unterschiede in der

mathematischen Kompetenz und Motivation der Schüler*innen aus PISA 2022 zeigen, wenn

zu den gegebenen Fachkenntnissen und Fachmethoden zusätzlich Kommunikation als kreativer

Umgang mit Mathematik hinzukommt. 30.2 % der Lehrkräfte fordern ausschließlich die

Kompetenzbereiche Fachkenntnisse und Fachmethoden, entsprechend 69.8 % der Lehrkräfte

zusätzlich den Kompetenzbereich Kommunikation 90.7 % der Lehrkräfte gestalten ihre

Prüfungsaufgabe grundsätzlich mithilfe eines konstruierten Lebensweltbezugs. Ein genauerer

Blick in die Ergebnisse zeigt allerdings, dass sich der konstruierte Lebensweltbezug insgesamt

in nur einem Viertel der Aufgaben (26.4 %) wiederfindet und somit von den Lehrkräften nicht

konstant eingesetzt wird.

In einem abschließenden Schritt wird überprüft, ob das zusätzliche Fordern von

Kommunikation zu einer höheren mathematischen Kompetenz oder zu einer höheren

Motivation führt. Anschließend wird untersucht, ob der konstruierte Lebensweltbezug als

motivationales Potenzial der Aufgaben einen Einfluss auf die Mathematikkompetenz, die

Freude und das Interesse sowie die Motivation der Schüler*innen in PISA 2022 hat.

 

Entwicklung der mathematischen Kompetenz in PISA und ihre Prädiktoren

Jennifer Diedrich1, Sabine Patzl1, Frank Reinhold2, Doris Lewalter1
1Zentrum für internationale Bildungsvergleichsstudien (ZIB), Technische Universität München (TUM), 2Pädagogische Hochschule Freiburg, Institut für Mathematische Bildung

Theoretischer Hintergrund

Die mathematische Kompetenz Fünfzehnjähriger liegt in PISA 2022 in Deutschland (M = 475

Punkte) nicht mehr signifikant über dem Durchschnitt der OECD-Staaten (M = 472 Punkte).

Diese durchschnittliche Kompetenz liegt auch unter jener in PISA 2003 (M = 503 Punkte) und

2012 (M = 514 Punkte), als Mathematik zuletzt jeweils Hauptdomäne war. Zur Einordnung der

Kompetenzen wird in PISA stets das Geschlecht sowie der sozioökonomische berufliche Status

der Eltern erhoben. Für die Hauptdomäne werden zudem in PISA auch die

domänenspezifischen Emotionen, Motivationen und Einstellungen erfragt. In PISA 2022, wie

auch in 2003 und 2012, zeigten Jungen höhere mathematische Kompetenzen als Mädchen

(Diedrich, Reinhold, Heinze, & Reiss, 2023) und der Zusammenhang des sozioökonomischen

beruflichen Status der Eltern mit der Kompetenz der Jugendlichen hat sich seit 2012 nicht

verändert (Mang et al., 2023). Im Bereich der mathematikbezogenen Merkmale der

Schüler*innen waren von PISA 2003 bis 2012 nur geringe und zwischen 2012 und 2022

signifikante Veränderungen zu verzeichnen: die mathematikbezogene Ängstlichkeit nahm seit

2012 signifikant zu, während Freude und Interesse an Mathematik, mathematikbezogene

instrumentelle Motivation sowie Selbstwirksamkeitserwartung hinsichtlich

innermathematischer und einfacher Anwendungsaufgaben signifikant abnahmen (Diedrich,

Patzl, Seßler, & Reinhold, 2023). Der vorliegende Beitrag kombiniert diese einzelnen

Merkmale in gemeinsamen Regressionsanalysen.

Fragestellung

Wie viel Varianz an der mathematischen Kompetenz Fünfzehnjähriger kann durch folgende

Faktoren aufgeklärt werden?

1. die mathematikbezogene Ängstlichkeit, Freude und Interesse an Mathematik,

mathematikbezogene instrumentelle Motivation sowie Selbstwirksamkeitserwartung?

2. das Geschlecht?

3. den sozioökonomischen beruflichen Status der Eltern?

Methode

Zur Beantwortung der Fragestellungen wird die mathematische Kompetenz in drei

Regressionsmodellen vorhergesagt durch 1) die mathematikbezogenen Emotionen,

Motivationen und Einstellungen, 2) ergänzt um das Geschlecht sowie 3) ergänzt um den

sozioökonomischen beruflichen Status der Eltern. Diese Modelle werden getrennt für die

Erhebungsrunden 2003, 2012 und 2022 gerechnet, in denen Mathematik jeweils die

Hauptdomäne war. Das Kriterium wurde auf Basis der Plausible Values geschätzt. Die

Merkmale des ersten Modells wurden im Schüler*innenfragebogen erhoben. Um die

Vergleichbarkeit trotz leicht veränderter Zusammensetzung des Fragebogens zu gewährleisten

wurden die vier Merkmale reskaliert (Lewalter et al., 2023; Abschnitt 12.7). Beim Geschlecht

wurde die Angabe aus der Schüler*innenlistung verwendet und der sozioökonomische

berufliche Status (HISEI) wurde dem Elternfragebogen entnommen. Alle Analysen wurden

mittels des IDB Analyzer 5.0 (IEA, 2023) durchgeführt.

Ergebnisse

In allen Modellen klärt die mathematikbezogene Ängstlichkeit sowie die

Selbstwirksamkeitserwartung einen signifikanten Anteil an der Varianz der mathematischen

Kompetenz auf. Für die Ängstlichkeit variiert dieser Anteil von β = -.13 (2022) bis β = -.22

(2012). Die Selbstwirksamkeitserwartung variiert zwischen β = .50 (2012) und β = .42 (2022).

Die Selbstwirksamkeitserwartung ist ein stärkerer Prädiktor als der sozioökonomische

berufliche Status der Eltern (β = .28 (2003); β = .27 (2012 und 2022)). Das Geschlecht klärt nur

in 2012 einen signifikanten aber marginalen Anteil an der Varianz in der mathematischen

Kompetenz (β = -.05) auf. Freude und Interesse an Mathematik sowie mathematikbezogene

instrumentelle Motivation sind nur in PISA 2003 signifikante Prädiktoren der mathematischen

Kompetenz Fünfzehnjähriger. Insgesamt werden durch die Merkmale in den drei Modelle in

allen Jahren substantielle Anteil an der mathematischen Kompetenz vorhergesagt (R² = .37

(2003); R² = .39 (2012); R² = .33 (2022)). Diese Befunde stehen im Einklang mit bisherigen

Meta-Analysen zum Zusammenhang der Ängstlichkeit (Ma, 1999) sowie der

Selbstwirksamkeitserwartung (Reinhold, et al, under review) mit der Leistung in Mathematik.

Insbesonder die Bedeutung der Selbstwirksamkeitserwartung („Mit Hilfe eines Zugfahrplanes

ausrechnen, wie lange man von einem Ort zum anderen brauchen würde“) wird im Beitrag

kritisch diskutiert.

 
15:20 - 17:006-01: Alternative Qualifikationswege für Lehrkräfte ohne traditionelles Lehramtsstudium in Zeiten des Lehrkräftemangels
Ort: H05
 
GEBF-Panel

Alternative Qualifikationswege für Lehrkräfte ohne traditionelles Lehramtsstudium in Zeiten des Lehrkräftemangels

Rebecca Lazarides1, Cornelia Gräsel2, Dirk Richter1, Mathias Iffert3, Susanne Lin-Klitzing4, Claudia Zinke5, Thiel Felicitas6

1Universität Potsdam, Deutschland; 2Bergische Universität Wuppertal; 3Landesinstitut für Schule und Medien Brandenburg; 4Deutscher Philologenverbandes; 5Ministerium für Bildung, Jugend und Sport des Landes Brandenburg; 6Freie Universität Berlin

Die Gesellschaft für Empirische Bildungsforschung (GEBF) hat eine Stellungnahme zu alternativen Wegen zum Beruf der Lehrkraft verfasst, die seit mehreren Jahren in vielen Bundesländern eingeführt wurden, um dem Lehrkräftemangel zu begegnen. Diese alternativen Qualifikationswege sind mittlerweile keine „Notlösungen“ mehr, sondern verfestigen sich und haben angesichts der steigenden Zahl an Teilnehmenden Auswirkungen auf das gesamte System der Lehrkräftebildung. Im Panel werden existierende Qualifikationswege diskutiert, deren Ziel es ist, dem Lehrkräftemangel zu begegnet. Dabei steht die Frage der Anbindung an Universitäten, die wissenschaftliche Orientierung der Qualifikationswege und die Einhaltung von etablierten Qualifikationsstandards im Vordergrund.

Wir streben eine rege Diskussion und Talkrunde unter den Beteiligten an in der Vertreter:innen des GEBF-Vorstandes, der empirischen (Lehrkräfte-)Bildungsforschung, der Bildungspolitik (Ministerium für Bildung, Jugend und Sport des Landes Brandenburg), der dritten Phase der Lehrkräftebildung (Landesinstitut für Schule und Medien Berlin-Brandenburg) und der Lehrkräfte (Deutscher Philologenverband e.V.) miteinander zum Thema der alternativen Qualifikationswege für Lehrkräfte ins Gespräch kommen.

 
17:00 - 18:30Mitgliederversammlung
Ort: H05
Datum: Mittwoch, 20.03.2024
9:00 - 10:407-01: Beobachterratings als Königsweg zur Erfassung von Unterrichtsqualität?!
Ort: H05
 
Symposium

Beobachterratings als Königsweg zur Erfassung von Unterrichtsqualität?!

Chair(s): Anna-Katharina Praetorius (Universität Zürich), Anika Dreher (Pädagogische Hochschule Freiburg, Deutschland)

Diskutant*in(nen): Wida Wemmer-Rogh (Universität Zürich)

Einschätzungen externer Beobachtender für die Erfassung von Unterrichtsqualität werden viele Vorteile beigemessen: Externe Beobachtende sind nicht in das Geschehen involviert, haben vielfältige Vergleichsmöglichkeiten und sollten durch ein durchlaufenes Training Unterrichtsqualität valide einschätzen können. Folglich werden Beobachterratings vielfach als Königsweg, Goldstandard oder vereinzelt sogar als objektive Messung bezeichnet und entsprechend in vielen Studien eingesetzt. Dennoch zeigen sich in vielen dieser Studien Befunde, die auf eine optimierungsbedürftige Validität von Beobachterratings zu Unterrichtsqualität hinweisen (für eine Übersicht siehe Praetorius & Charalambous, 2018). Eine mögliche Erklärung für diese Befundlage könnte darin liegen, dass die Bedingungen, unter denen diese potenziellen Vorteile von Beobachterratings gelten, aktuell noch nicht ausreichend geklärt sind.

Bei genauerer Betrachtung wird deutlich, dass die genannten Vorteile auf einer Reihe von Annahmen beruhen (für eine ähnliche Argumentation zu Fachspezifität siehe Dreher & Leuders, 2021): So muss unter anderem (a) das Beobachtungssetting so gewählt sein, dass eine Beobachtung der für eine Einschätzung von Unterrichtsqualität relevanten Aspekte überhaupt möglich ist, (b) die Rater:innen die nötigen Kompetenzen besitzen, um die Einschätzungen valide durchführen zu können und (c) die Instrumente so konstruiert sein, dass sie alle relevanten Aspekte zur Einschätzung der Unterrichtsqualitätsdimensionen beinhalten.

Bislang existieren nur wenige Untersuchungen, die sich vertieft damit auseinandersetzen, inwiefern die obigen Annahmen hinsichtlich Beobachtungssetting, Kompetenzen von Rater:innen und Instrumenten zutreffen. An diesem Desiderat setzt das Symposium an. Die Beiträge setzen sich vertieft mit je einer der Annahmen auseinander und nutzen zu deren Überprüfung ein experimentelles Design.

In Beitrag 1 wird in Bezug auf das oftmals videobasierte Beobachtungssetting kritisch in den Blick genommen, inwiefern die üblicherweise genutzten Kameraperspektiven (1 Klassenkamera, 1 Lehrpersonenkamera) dazu führen, dass relevante Aspekte zur Einschätzung von Unterrichtsqualität übersehen werden. Zur Überprüfung wurden traditionelle und 360°-Kameraperspektiven in einem within-person-Design eingesetzt und die erfassten Begründungen der Unterrichtsqualitätseinschätzungen miteinander verglichen. Die Befunde deuten darauf hin, dass das Erkennen qualitätsrelevanter Unterrichtsereignisse sowie die Validität der Begründungen der Einschätzungen im traditionellen Setting nicht schlechter gelingt als in der 360°-Bedingung.

Beitrag 2 fokussiert auf die Frage, ob die Dauer von Beobachtertrainings zu Unterrichtsqualität einen Unterschied macht für die Validität der Unterrichtseinschätzungen. Dazu wurden in einem experimentellen Prä-Post-Design dieselben Videos vor und nach einem kurzen (7.5h) bzw. langen (13h) Training hinsichtlich der Dimensionen Klassenführung, motivational-emotionale Unterstützung, kognitive Aktivierung sowie Auswahl und Thematisierung von Inhalten eingeschätzt und mittels Differenzscores mit Masterratings abgeglichen. Es zeigen sich lediglich für 2 der 12 möglichen Gruppenunterschiede Vorteile für ein längeres Training und dies in Bezug auf kognitive Aktivierung.

Der Fokus von Beitrag 3 schliesslich liegt auf der Frage, inwiefern Beobachtende mit Fachexpertise Qualitätsaspekte von Mathematikunterricht anhand von üblichen generischen Beobachtungskriterien valide einschätzen können oder dafür fachspezifische Beobachtungskriterien benötigen.

Dazu haben Mathematik-Seminarlehrkräfte geskriptete Mathematikunterrichtsvideos in einem within-person-Design jeweils anhand eines generischen und eines fachspezifischen Items zu einem Unterrichtsqualitätsaspekt geratet. Es zeigten sich in bestimmten Fällen systematische Unterschiede in den Ratings der beiden Items. Diese Ergebnisse deuten darauf hin, dass einige übliche generische Beobachtungskriterien zentrale fachspezifische Aspekte der Unterrichtsqualitätsdimensionen nicht erfassen.

Zusammengenommen zeichnen die Beiträge ein gemischtes Bild hinsichtlich der Annahmen zu Beobachtungssettings, Kompetenzen von Rater:innen und eingesetzten Instrumenten. Sie deuten darauf hin, dass Beobachtereinschätzungen nicht per se als Königsweg zur Erfassung von Unterrichtsqualität bezeichnet werden können, sondern eine vertiefte Auseinandersetzung mit ebendiesen Annahmen notwendig erscheint, um ausreichende Validität zu gewährleisten.

 

Beiträge des Symposiums

 

Unterrichtsbeobachtung in traditionellen und immersiven Videoumgebungen und deren Ein-fluss auf offene Begründungen für Unterrichtsqualitätsratings

Tosca Daltoè1, Maximilian Irion2, Linn Hansen3, Julia Larissa Blank4, Benjamin Fauth1, Ulrich Trautwein2, Richard Göllner2
1Universität Tübingen, Institut für Bildungsanalysen Baden-Württemberg, 2Universität Tübingen, 3Pädagogische Hochschule Freiburg, 4Institut für Bildungsanalysen Baden-Württemberg

Die Unterrichtsbeobachtung durch externe Beobachtende ist eine zentrale Perspektive zur Erfassung von Unterrichtsqualität (z. B. Fauth et al., 2020). In der Unterrichtsforschung und Lehrkräftebildung werden Unterrichtsbeobachtungen meist anhand von Unterrichtsvideos durchgeführt, die eine systematische Unterrichtsanalyse ermöglichen (Krammer & Reusser, 2005; Syring et al., 2015). Neben dem großen Potenzial videobasierter Unterrichtsbeobachtungen haben traditionelle Unterrichtsvideos allerdings auch Limitationen bezüglich der Validität resultierender Beobachtungsratings. Verschiedene Forschungsarbeiten zeigen, dass die Kameraperspektive in Unterrichtsvideos die Wahrnehmung des Unterrichts sowie Unterrichtsqualitätsratings beeinflusst (Cortina et al., 2018; Mahler et al., 2023; Paulicke et al., 2019). Eine Möglichkeit, diesem Einfluss der Kameraperspektive entgegenzutreten, ist der Einsatz von 360-Grad-Unterrichtsvideos.

In 360-Grad-Videos wird die Blickrichtung auf den gefilmten Unterricht vom Standpunkt der Kamera aus frei gewählt, z. B. durch Kopfbewegungen in einer Virtual-Reality (VR)-Brille (Balzaretti et al., 2019). Beobachtende erleben Unterricht in 360-Grad-Videos immersiver (Daltoè et al., 2023; Ferdig & Kosko, 2020; Gold & Windscheid, 2020) und strengen sich bei der Unterrichtsbeobachtung mehr an als in traditionellen Videoumgebungen (Daltoè et al., 2023). Durch dieses veränderte Beobachtungserleben könnten Beobachtende relevante Unterrichtsereignisse in immersiven Videoumgebungen besser erkennen und Unterrichtsqualität dadurch treffender einschätzen. Gleichzeitig könnte es aber auch sein, dass Beobachtende relevante Unterrichtsereignisse übersehen, unter anderem dadurch, dass diese aktiv durch Kopfbewegungen angesteuert werden müssen. Es stellt sich daher die Frage, ob sich immersive Videoumgebungen zur Erfassung von Unterrichtsqualität unter Verwendung bisheriger Beobachtungsinstrumente eignen oder ob Beobachtungsratings anders ausfallen und begründet werden als in traditionellen Videoumgebungen.

In einer ersten Studie von Gold und Windscheid (2020) unterschieden sich Unterrichtsqualitätsratings zwischen traditionellen und 360-Grad-Videos nicht. Darauf aufbauend fanden wir in einer ersten Untersuchung Hinweise darauf, dass sich Unterrichtsqualitätsratings zwischen den Videoumgebungen nur dann unterscheiden, wenn die Wahrnehmung der Interaktion zwischen Lehrkraft und Lernenden im Mittelpunkt steht (Daltoè et al., 2023). Diese bisherigen Befunde basieren auf hoch-inferenten Unterrichtsqualitätsratings und sollten durch eine Analyse offener Begründungen für diese Ratings erweitert werden, um zu prüfen, welche Unterrichtsereignisse gesehen und zur Begründung der Ratings herangezogen werden. Aus diesem Grund untersucht der vorliegende Beitrag, ob sich offene Begründungen für Unterrichtsqualitätsratings je nach Videoumgebung (traditionell vs. immersiv) unterscheiden. Folgende Forschungsfragen stehen im Fokus:

1. Zeigen sich Unterschiede zwischen den Videoumgebungen bezüglich des Erkennens qualitätsrelevanter Unterrichtsereignisse?

2. Zeigen sich Unterschiede zwischen den Videoumgebungen bezüglich der Indikatoren, die für die Begründung der Unterrichtsqualitätsratings herangezogen werden?

In der vorliegenden Untersuchung betrachteten N = 75 Lehramtsstudierende jeweils zwei von insgesamt fünf geskripteten Unterrichtsvideos, davon eines in einer traditionellen Videoumgebung am PC und eines in einer immersiven Videoumgebung mit einer VR-Brille. Nach jedem Video schätzten die Lehramtsstudierenden die Unterrichtsqualität in den Videos mit dem Unterrichtsfeedbackbogen Tiefenstrukturen (UFB; Fauth et al., 2021) ein und gaben dabei offene Begründungen für das Unterrichtsqualitätsrating ab. Die insgesamt 368 offenen Begründungen wurden mithilfe eines Kodierleitfadens mit zwei übergeordneten Kategorien kodiert: 1. Erkennen die Lehramtsstudierenden die qualitätsrelevanten Unterrichtsereignisse? 2. Ist die Begründungen für das UFB-Rating im Sinne der Beobachtungsindikatoren valide? (vgl. Ansatz von Praetorius et al., 2012). Die Kodierung durch zwei geschulte Ratende ergab eine prozentuale Übereinstimmung von 83.7% sowie eine substanzielle Interrater-Reliabilität von κ = .64 (vgl. Landis & Koch, 1977). Voneinander abweichende Kodierungen wurden diskutiert und eine Konsenskodierung gebildet. Im nächsten Schritt wurden die Kodierungen zwischen den Videoumgebungen mittels t-Tests verglichen.

Die vorläufigen Befunde weisen darauf hin, dass sich weder das Erkennen qualitätsrelevanter Unterrichtsereignisse (Forschungsfrage 1; t(145) = 1.05, p = .294), noch die Validität der Begründungen für die Ratings (Forschungsfrage 2; t(145) = 0.25, p = .803) zwischen den Videoumgebungen unterscheidet.

Die vorliegende Untersuchung legt nahe, dass die untersuchten Indikatoren für das Erkennen und Beurteilen von Unterrichtsqualität gleichermaßen in den verschiedenen Videoumgebungen genutzt werden können. Limitationen der vorliegenden Untersuchung sowie Implikationen für Forschung und Praxis werden diskutiert.

 

Welche Rolle spielt die Dauer von Trainings für Beobachter:innen zur Einschätzung von Unterrichtsqualität für die Qualität der Ratings?

Valerie Gitzi1, Thilo Kleickmann2, Olga Lichtner2, Mirjam Steffensky3, Aiso Heinze3, Anna-Katharina Praetorius1
1Universität Zürich, 2Christian-Abrechts-Universität zu Kiel, 3Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik

Theoretischer Hintergrund

Einschätzungen von Beobachter:innen gelten oft als Königsweg zur Erfassung von Unterrichtsqualität (Helmke, 2022). Der Einsatz von Trainings für Rater:innen gilt dabei als Standard (Praetorius, 2013). Trotz deren häufiger Durchführung besteht nach wie vor erhebliche Unklarheit hinsichtlich der optimalen Ausgestaltung solcher Trainings (Lemay et al., 2021). Selbst bei der Frage nach der idealen Länge von Trainings finden sich extreme Unterschiede in der Literatur, die nicht weiter begründet werden (z.B. Nowińska et al., 2017; Lemay et al., 2021). Die vorliegende Studie beschäftigt sich mit der Frage, ob eine Variation der Dauer mit Unterschieden in der Qualität der Unterrichtsbeobachtungen (d.h. Reliabilität und Validität) einhergeht. In der Unterrichtsqualitätsforschung gibt es dazu bislang keine theoretischen oder empirischen Auseinandersetzungen. Werden andere Forschungsgebiete herangezogen, können Argumente in verschiedene Richtungen abgeleitet werden: Je länger das Training dauert, desto valider sollten Ratings sein (z.B. Floden, 2002; Atkinson & Shiffrin, 1968) aber auch, dass sich keine Veränderung der Ratings aufgrund der Dauer identifizieren lassen (Craik & Lockhart,1972, Bhowmik et al., 2021). Da mehr Argumente für eine längere Dauer sprechen, vermuten wir, dass ein längeres Training mit einer höheren Validität der Unterrichtseinschätzungen einhergeht.

Methode

In einem prä-registrierten, experimentellen Forschungsdesign mit Prä-Post-Design haben wir die zuvor formulierte Forschungsfrage für hoch-inferente Ratings von Unterrichtsqualität untersucht. Dafür wurde ein 13-stündiges (n = 34 Teilnehmende ) mit einem 7.5-stündigen (n = 41 Teilnehmende) kontrastiert. Die beiden Trainingsbedingungen unterschieden sich hinsichtlich der Inhalte nicht, sondern lediglich in der Ausführlichkeit, mit der diese thematisiert wurden. Die Teilnehmenden beurteilten vor und nach dem Training dieselben zehn Unterrichtsvideos (fünf zum Thema «Verdunsten und Kondensieren» und fünf zum Thema «Pythagoras»). Die Teilnehmenden bewerteten diese Videos anhand von vier übergeordneten Dimensionen (Klassenführung, motivational-emotionale Unterstützung, kognitive Aktivierung und Auswahl & Thematisierung des Inhalts) (Rogh et al., 2020).

Die Reliabilität wird mittels Interrater-Übereinstimmungen bestimmt. Die Überprüfung der Validität der Ratings findet über Differenzwerte zu Masterratings statt. Die beiden Gruppen werden anhand von dimensionsweise durchgeführten Regressionsanalysen verglichen, bei denen die Präratings als Kovariate, die Gruppenzugehörigkeit als unabhängige Variable und die Differenzwerte als abhängige Variable eingingen. Beide Fächer werden sowohl getrennt als auch aggregiert betrachtet.

Ergebnisse und Diskussion

Zunächst zeigte sich deskriptiv, dass sowohl für das kurze als auch das lange Training die Mittelwerte der Differenzwerte zum Prä-Messzeitpunkt höher lagen als jene des Post-Messzeitpunkts (Gruppe kurzes Training: Prä (0.63 ≤ x̄ ≤ 1.11) und Post (0.46 ≤ x̄ ≤ 0.68) und Gruppe langes Training: Prä (0.72 ≤ x̄ ≤ 1.12) und Post (0.48 ≤ x̄ ≤ 0.65)). Das bedeutet, dass die Rater:innen im Post-Rating näher an den Ratings der Master-Ratings lagen und damit als valider eingeschätzt werden können.

Von den 12 möglichen Gruppenunterschieden zwischen kurzem und langem Training (4 Dimensionen jeweils für Mathematik, Naturwissenschaften und zusammengenommen) zeigen sich lediglich bei zwei signifikante Unterschiede in der vermuteten Richtung: Bei der Dimension kognitive Aktivierung zeigen sich statistisch signifikante Gruppenunterschiede für die naturwissenschaftlichen Videos (ß = -.48**) sowie über alle Videos hinweg (ß = -.38*). Das bedeutet, dass die Validität in der Gruppe mit dem längeren Training nach dem Training höher ausgeprägt ist als in der Gruppe mit kürzerem Training – dies jedoch nur für die Dimension kognitive Aktivierung.

Die Befunde deuten darauf hin, dass sich die Hypothese, dass ein längeres Training für die Validität von Ratings vorteilhaft ist, lediglich für kognitive Aktivierung bestätigen lässt. Die Limitationen der vorliegenden Studie einbeziehend werden abschliessend Implikationen für zukünftige Studien abgeleitet, die Einschätzungen zur Unterrichtsqualität von Beobachter:innen einsetzen wollen.

 

Erfassung von Unterrichtsqualität durch Beobachterratings – Die Rolle der Fachspezifität von Beobachtungskriterien

Linn Hansen1, Marita Friesen2, Anika Dreher1
1Pädagogische Hochschule Freiburg, 2Pädagogische Hochschule Heidelberg

Theoretischer Hintergrund und Fragestellung

Beobachterratings spielen in der Unterrichtsqualitätsforschung eine wichtige Rolle. Eine zentrale Herausforderung besteht jedoch darin, dass Beobachterratings von verschiedenen Faktoren (z.B. unterschiedlichen Iteminterpretationen) beeinflusst werden (Praetorius, 2013). So stellt sich beispielsweise die Frage, wie fachspezifisch Rater:innen und Beobachtungskriterien sein müssen, um Unterrichtsqualität valide zu erfassen (z.B. Lindmeier & Heinze, 2020). Um die Bedeutung von Fachspezifität für Beobachterratings genauer zu untersuchen, schlugen Dreher und Leuders (2021) vor, die Varianzquellen Unterrichtssituationen, Beobachtungskriterien und Rater:innen sowie deren Wechselwirkungen zu berücksichtigen. Dabei wird erwartet, dass sich diese Varianzquellen durch verschiedene Grade an Fachspezifität systematisch auf die Einschätzung der Unterrichtsqualität auswirken können.

In unserem Forschungsprojekt wird folglich anhand von fachspezifischen Unterrichtssituationen untersucht, wie sich die systematische Variation der Fachspezifität von Rater:innen und Beobachtungskriterien (Items) auf die erfasste Unterrichtsqualität auswirkt. Insbesondere wird erwartet, dass fachspezifische Rater:innen Fachunterricht häufig auch anhand rein generischer Kriterien valide einschätzen können, manchmal jedoch übliche generische Items zentrale fachspezifische Aspekte nicht erfassen. Um diese erwartete Rolle der Fachspezifität von Beobachtungskriterien zu prüfen, werden zunächst Unterrichtsqualitätsratings von fachspezifischen Rater:innen betrachtet.

Methode

Es wurden sechs geskriptete Videos von Mathematikunterricht erstellt, in denen jeweils ein Unterrichtsqualitätsaspekt nach dem Unterrichtsfeedbackbogen (UFB) (Fauth et al., 2021) manipuliert wurde. Dabei wurden jeweils zwei Videoversionen erstellt: Eine Version enthält einen fachdidaktischen Normverstoß zum fokussierten Unterrichtsqualitätsaspekt, den die andere Version nicht enthält. Analog zum Beispiel aus Dreher und Leuders (2021) wurde für jedes Video neben dem generischen Item (UFB) auch ein fachspezifisches Item formuliert. Die Videos wurden so konzipiert, dass sich die Normverstöße in drei Videos nur auf das fachspezifische Item auswirken sollten. In den anderen drei Videos sollten beide Items den Normverstoß erfassen.

Ein Beispiel für den ersten Fall ist das Video zum Aspekt „Engagement der Schülerinnen und Schüler“: Der Normverstoß besteht darin, dass die Lernenden zwar engagiert am Unterrichtsgeschehen beteiligt sind, sich dieses Engagement aber nicht auf das fachliche Lernen bezieht. In diesem inkongruenten Fall erwarten wir Varianz durch die Fachspezifität der Beobachtungskriterien: Fachspezifische Rater:innen sollten das generische Item, das sich auf das allgemeine Engagement der Lernenden bezieht, positiv, das fachspezifische Item jedoch negativ raten. Ein Beispiel für den zweiten, kongruenten Fall ist das Video zum Unterrichtsqualitätsaspekt „Individuelle Unterstützung“. Hier wird für das fachspezifische Item keine grundsätzlich andere Einschätzung erwartet als für das generische, weil der Normverstoß bereits vom generischen Item erfasst wird.

Wie im illustrierenden Beispiel aus Dreher und Leuders (2021) wird für alle sechs Videos erwartet, dass die Normverstöße für generische Rater:innen kaum sichtbar sind, so dass in einer späteren Projektphase die Varianz durch die Fachspezifität der Rater:innen untersucht werden kann.

Beide Items werden jeweils auf vierstufigen Likert-Skalen geratet und die Einschätzung in offenen Antworten begründet. Erste Daten beziehen sich auf N=24 Mathematik-Seminarlehrkräfte (fachspezifische Rater:innen) ohne spezifisches Training. Die Teilnehmenden wurden zufällig in zwei Subgruppen eingeteilt und erhielten für jeden Unterrichtsqualitätsaspekt jeweils randomisiert eine der Videoversionen. Da dieser Beitrag auf die Videoversionen mit Normverstoß fokussiert, liegen pro Video Daten von n=12 Rater:innen vor.

Ergebnisse

Während sich die Ratings in den kongruenten Fällen nicht signifikant voneinander unterscheiden, wurden in den inkongruenten Fällen die fachspezifischen Items signifikant negativer geratet (MdnVideo1=2, MdnVideo2=3, MdnVideo3=2) als die generischen Items (MdnVideo1=4, MdnVideo2=3.5, MdnVideo3=4) (Video 1: Z=-2.70, p=<.05 r=-.60; Video 2: Z=-1.73, p=<0.5, r=-.39; Video 3: Z=-2.57, p=<.05, r=-.57). Die Effektstärken entsprechen mittleren bis starken Effekten. Die Kodierung der offenen Antworten bestätigt zudem einen Zusammenhang der negativen Ratings der fachspezifischen Items mit dem Erkennen der Normverstöße.

Diese vorläufigen Ergebnisse zeigen die Fachspezifität von Beobachtungskriterien als Varianzquelle für Beobachterratings in den angenommenen Fällen. Diese Ergebnisse können damit zu einem besseren Verständnis der Bedingungen beitragen, unter denen generisch formulierte Items für die Erfassung von Unterrichtsqualität selbst durch Rater:innen mit Fachexpertise nicht ausreichen.

 
11:10 - 12:508-01: Teach-R: Simulationsbasierte Lehramtsausbildung in VR
Ort: H05
 
Symposium

Teach-R: Simulationsbasierte Lehramtsausbildung in VR

Chair(s): Axel Wiepke (Universität Potsdam, Deutschland)

Diskutant*in(nen): Axel Wiepke (Universität Potsdam)

Unterschiedliche Methoden werden im Lehramtsstudium genutzt, um einen Übergang von der Theorie zur Praxis des Lehrens zu unterstützen (Hedtke, 2000). So können zum Beispiel Videomitschnitte als Grundlage zur Reflexion über Unterrichtssituationen dienen (Richter et al., 2022), schriftliche Fallvignetten eine "innere Vorbereitung" auf Unterrichtseinheiten ermöglichen (Lübcke et al., 2019), Unterrichtsplanung und -forschung als Bindeglied fungieren (Gagel, 1983), oder Praktika, sowohl mit als auch ohne eigene Lehrtätigkeit, Einblicke in den Schulalltag bieten (Brocca, 2020). Der praktische Kontakt zu realen Klassen wird oft als entscheidend angesehen, um das theoretische Wissen in der Praxis zu erproben (Hedtke, 2000). Jedoch gehen damit hoher organisatorischer und personeller Aufwand und begrenzte Generalisierbarkeit der Erfahrungen an Schulen einher (ebd.).

Doch auch andere Trainingsmethoden haben Herausforderungen. Beispielsweise fehlt es oft an Interaktivität in Videos und Texten, Datenschutzbedenken können bei der Verwendung von Videos und Praktika auftreten, und es bedarf einer hohen Abstraktionsfähigkeit, um aus Unterrichtsplänen und -forschung Erkenntnisse für die Praxis zu ziehen. Die Übertragbarkeit dieser Methoden in die Praxis kann selten umfassend untersucht werden, aufgrund von mangelnder Wiederholbarkeit und unterschiedlichen Schwerpunkten in der Theorie (z.B. Ökonomie und Effektivität der Lehrmethoden) und der Praxis (Persönlichkeitswerte – Was macht eine "gute Lehrkraft" aus mir?) (Oelkers, 1999).

Ein Ansatz, der sich diesen Herausforderungen widmet, ist die Virtual Reality (VR)-Simulation, wie sie im Projekt "Teach-R" vorgestellt wird (Wiepke et al., 2019a). Teach-R umfasst eine VR-Umgebung und eine Weboberfläche zur Steuerung von virtuellen Schülerinnen und Schüler (vSuS). In der VR-Umgebung können Lehramtsstudierende den Erstkontakt mit einer Klasse von bis zu 30 vSuS in einer realitätsnahen Simulation erleben und praktische Erfahrungen sammeln. Der erste Einsatz erfolgte im Jahr 2018 an der Universität Potsdam im Rahmen eines Kurses zum Umgang mit Unterrichtsstörungen. Seitdem wurde Teach-R weiterentwickelt, unter anderem durch die Möglichkeit von Unterrichtsgesprächen mit den vSuS. Das Projekt bietet eine interdisziplinäre Plattform, die Informatik, Erziehungswissenschaften, Fachdidaktiken und empirische Forschung miteinander verknüpft. Innerhalb der Anwendung können Daten erfasst werden, wie z.B. Bewegungsprofile oder Aufzeichnungen der Nutzenden während der Simulation, die sowohl für die Reflexion als auch für die Forschung genutzt werden können. Über die Webplattform kann ein Coach die Lehrkraft hinsichtlich ihrer didaktischen Methoden bewerten, was bei den vSuS verschiedene, vordefinierte Animationen und Rückmeldungen auslösen kann. Das Verhalten der vSuS kann auch direkt gesteuert oder anhand festgelegter Skripts angepasst werden. Die Lernumgebung kann durch Änderungen des Wetters oder der Lautstärke im Schulgebäude beeinflusst werden (Wiepke et al., 2021). Dadurch lassen sich gezielte Szenarien erstellen und reproduzieren, was sowohl das Training von Lehrmethoden als auch die Erforschung des Verhaltens im virtuellen Unterricht ermöglicht (Huang et al., 2021).

Das Open-Source-Projekt "Teach-R" wird in immer größerem Umfang in Hochschulseminaren eingesetzt, um innovative Lehrmethoden zu erproben und die vermittelten didaktischen Ansätze zu untersuchen. Im Rahmen dieses Symposiums werden einige der bereits existierenden Szenarien aus unterschiedlichen Fachdisziplinen vorgestellt. Dabei werden Lehrformate, anvisierte Kompetenzen und Forschungsschwerpunkte beschrieben, sowie die Erweiterbarkeit und die Anwendung aus technischer Perspektive näher beleuchtet. Es werden Beiträge erwartet aus der Wirtschaftspädagogik, der Sport- und Chemiedidaktik, sowie aus den Erziehungswissenschaften und der Informatik. Die Autorinnen und Autoren der eingereichten Beiträge werden in Gruppen ihre eigenen Erfahrungen mit Teach-R teilen, gemeinsam diskutieren und die Diskussion dann für das gesamte Plenum öffnen. Nach den Präsentationen der Gruppen wird das Symposium mit einer offenen Diskussionsrunde abgeschlossen.

 

Beiträge des Symposiums

 

Teach-R in der Sportlehrkräftebildung

David Wiesche1, Raphael Zender2, Britta Fischer3
1Universität Duisburg-Essen, 2Humboldt-Universität zu Berlin, 3Christian-Albrechts-Universität zu Kiel

Das Ziel des Schulsports ist nicht nur, die Heranwachsenden in die Bewegungs-, Spiel- und Sportkultur einzuführen und eine Handlungsfähigkeit in dieser Kultur zu ermöglichen, sondern auch einen Beitrag zur ganzheitlichen Entwicklungsförderung durch Bewegung, Spiel und Sport zu leisten (Kurz, 2008). Die Sportlehrkräftebildung an deutschen Universitäten, die neben theoretischen Inhalten auch sportpraktische Seminare beinhaltet, fokussiert dabei traditionell auf normierte Sportarten oder Bewegungsfelder. Die Verbesserung von Wahrnehmungsfähigkeit und Bewegungskompetenz sind sowohl im Studium, als auch im Schulsport prominente Zielperspektiven. Die Fähigkeit, lernrelevante Unterrichtsereignisse erkennen und theoriebasiert interpretieren zu können (z. B. Meschede et al., 2017), also Wahrnehmungsprozesse, sind für ein professionelles Sportlehrkräftehandeln relevant. Zudem ist auch das Wissen über Wahrnehmungs- bis hin zu Verstehensprozessen von Schülerinnen und Schülern (SuS) bedeutsam.

Die Entwicklung von Medienkompetenzen ist eine Querschnittsaufgabe der Schule, die alle Fächer betrifft. Dabei wird im sportpädagogischen Diskurs vor allem ein Blick auf den Einsatz von digitalen Medien (z.B. Greve et al., 2020) sowie das Lehren und Lernen mit und in digitalen Medien im Sport (Fischer & Paul, 2020) gelegt. Der Proklamation der KMK (2021), dass immersive Technologien wie Virtual Reality (VR) bei der Entwicklung innovativer, digitaler Lernformate im Unterricht zu beachten, zu reflektieren und einzubeziehen sind, wird an wenigen Standorten in Deutschland umgesetzt. Dabei ist Körpererfahrung in VR ein Teil des gesellschaftlichen Transformationsprozesses (Wiesche et al., 2023). Das Potenzial von VR für Körpererfahrung (Bielefeld, 1991) im Sinne eines mehrperspektivischen Sportunterrichts ist noch unerforscht und es bestehen Unsicherheiten aus medizinischer und pädagogischer Perspektive (Zender et al., 2022).

Mit der Teach-R-Sporthalle steht eine Umgebung zur Verfügung, in der Simulationen im Kontext des Sportunterrichts ermöglicht werden. Dabei wird die VR-Sporthalle auf der einen Seite als ein möglicher Raum für Formen von Bewegung, Spiel und Sport verstanden: Wenn körperliche Praktiken im physischen Raum über Interfaces in den digitalen Raum übertragen werden, eröffnet sich ein hybrider Raum, in dem Körpererfahrungen und damit auch eine Reflexion derselben ermöglicht werden, die sowohl für das Verständnis von Körper als auch von Virtualität genutzt werden können.

Auf der anderen Seite sollen in der VR-Sporthalle Simulationen erarbeitet werden, an denen Wahrnehmungs-, Deutungs- und Handlungskompetenzen in Bezug auf die Qualität der Unterrichtsgestaltung entwickelt werden können. Dabei stehen einerseits die Klassenführung vor dem Hintergrund einer doppelten Verletzbarkeit (Herrmann & Gerlach, 2020), andererseits das Nähe-Distanz Verhältnis zwischen SuS und Lehrkraft als sportpädagogische Themen im Mittelpunkt der Professionalisierung von Sportlehrkräften.

Die Abbildungen 1 und 2 illustrieren den aktuellen Entwicklungsstand der VR-Sporthalle, welche als Erweiterung von Teach-R konzipiert wurde. Diese Erweiterung, realisiert in enger Zusammenarbeit mit dem Teach-R-Team und erfahrenen Sportlehrkräften, berücksichtigt sowohl die Hauptsporthalle als auch zugehörige Nebenräume wie Gerätelager und Umkleidekabinen in seiner Umsetzung. Die Konzeption der Räumlichkeiten orientierte sich dabei an den baulichen Vorgaben für neu zu errichtende Sporthallen in Berlin, sowohl hinsichtlich der Raumgrößen als auch der Anzahl der Räume. Des Weiteren wurden die bewährten Teach-R-Interaktionskonzepte aufgegriffen. Zum gegenwärtigen Zeitpunkt sind noch keine virtuellen SuS in die VR-Sporthalle integriert.

Im nächsten Schritt sollen virtuelle SuS in die VR-Sporthalle integriert werden, die sich in standardisierten Situationen bewegen. Die Definition dieser standardisierten Situationen bezüglich der Themen (1) Klassenführung sowie (2) Nähe und Distanz werden aktuell erarbeitet. Ziel ist es, ein konsequenzfreies Lernen und Explorieren von Handlungsmustern in der Sporthalle zu ermöglichen.

Aus wissenschaftlicher Perspektive soll darüber hinaus der Frage nachgegangen werden, ob das Erleben von Nähe und Distanz in Teach-R zum Ausgangspunkt für einen Reflexionsprozess bei (angehenden) Lehrkräften genutzt werden kann. Durch phänomenologische Beschreibungen des Erlebten von unterschiedlicher “virtuelle Nähe” in ausgewählten Situationen wie einem Einzelgespräch, bei Hilfestellungen oder in Unterrichtsgesprächen mit SuS-Gruppen können Rückschlüsse auf die Konzeption von möglichen Trainingsszenarien geschlossen werden.

 

Die Potenziale eines virtuellen Klassenzimmers für die Erklärfähigkeit von Lehramtsstudierenden

Jürgen Seifried, Robert Mühldorfer, Christian Mayer
Universität Mannheim

Einleitung

Im Beitrag wird ein Lehrkonzept zur Förderung des Kompetenzerwerbs im Studium der Wirtschaftspädagogik vorgestellt. Das Studium hat das Ziel, angehende Lehrkräfte bestmöglich auf zukünftige Herausforderungen in Schule und Unterricht vorzubereiten bzw. entsprechende Lerngelegenheiten bereit zu stellen. Diesbezüglich ist das Erproben von (fach-)didaktischen Alternativen im Rahmen von authentischen Unterrichtsszenarien bereits im Studium von hoher Bedeutung (Dalgarno et al., 2016; Grossman, 2018). Das virtuelle Klassenzimmer Teach-R (Wiepke et al., 2019) bietet hier die Möglichkeit, dass sich angehende Lehrpersonen gezielt mit der die Gestaltung von Unterrichtserklärungen auseinander setzen.

Theorie

Fehleranfällige Unterrichtserklärungen von Lehramtsstudierenden und angehenden Lehrpersonen sind keine Seltenheit (Borko et al., 1992; Guler & Celik, 2016; Halim & Meerah, 2002; Leinhardt, 1989). Sie haben z. B. Schwierigkeiten, das Vorwissen der Lernenden richtig einzuschätzen (Sánchez et al., 1999) und können bei Rückfragen der Lernenden wenig flexibel reagieren (Borko & Livingston, 1989; Leinhardt, 1989). Schwierigkeiten gibt es auch hinsichtlich der Darstellung von Lerninhalten (Borko et al., 1992; Inoue, 2009; Kinach, 2002; Wheeldon, 2012) und dem Aufzeigen lebensnaher Praxisbeispiele (Borko et al., 1992; Inoue, 2009; Wheeldon, 2012). Als eine Ursache für die mangelnde Erklärfähigkeit werden Defizite beim inhaltlichen Wissen angeführt (Borko et al., 1992; Eisenhart et al., 1993; Halim & Meerah, 2002; Thanheiser, 2009). Allerdings lassen sich entsprechende Fähigkeiten auch fördern. So wies bspw. (Miltz, 1972) in einer der wenigen Experimental-Kontrollgruppenstudien in diesem Bereich nach, dass Trainingseinheiten zum verständlichen Erklären die Erklärfähigkeit signifikant verbessern. Darüber hinaus verbessert Feedback durch Mentor:innen die Fähigkeiten angehender Lehrpersonen (Borko et al., 1992; Eisenhart et al., 1993).

Adressierte Kompetenzen

Im Fokus des Teach-R-Unterrichtsszenarios steht zum einen die Entwickelung der Erklärfähigkeit von Lehramtsstudierenden unter authentischen Bedingungen und zum anderen die Förderung der Reflexionsfähigkeit der eigenen Unterrichtserklärung (Richter et al., 2022). Video-Aufzeichnungen aus dem Unterrichtsszenario dienen den Studierenden als Ausgangspunkt zur Reflexion über ihr unterrichtliches Handeln. Studierenden nutzen die Methode der qualitativen Inhaltsanalyse von Videodaten zur theoriegeleiteten Analyse von Lehr-Lernsituationen, um ihr eigenes fachdidaktisches Handeln selbständig kritisch zu überdenken.

Lehrformat

Das virtuelle Klassenzimmer (Teach-R) wird Rahmen des Seminars „Reflexion wirtschaftsberuflicher Lernumgebungen“ im Studiengang Wirtschaftspädagogik an der Universität Mannheim eingesetzt. Hierfür wurde ein vorprogrammiertes impulsgesteuertes Unterrichtsgespräch zur Thematik der Nachfrageverschiebung (Volkswirtschaftslehre) entwickelt. Die Simulation wird zu Beginn und zum Ende des Semesters eingesetzt (HTC Vive Pro-Eye). Die Studierenden analysieren das unterrichtliche Handeln anhand gängiger Qualitätsdimensionen zur Analyse von Erklärprozessen (z. B. (Findeisen, 2017): Fachlicher Gehalt, Lernendenzentrierung, Prozessstruktur, Repräsentation und Sprache). Dabei greifen sie die Technik der qualitativen Inhaltsanalyse nach (Mayring, 2022) zurück und arbeiten mit MAXQDA.

Zur Analyse der Erklärfähigkeit wird aktuell ein Versuchs-Kontrollgruppen-Design (Versuchsgruppe: n=16, Kontrollgruppe; n=11) umgesetzt. Beide Gruppen führen eine Unterrichtserklärung zur Nachfrageverschiebung zu zwei Messzeitpunkten durch. Es wird durch die Authentizität und dem Immersionserleben im virtuellen Klassenzimmer (Teach-R) erwartet, dass die VR-Gruppe Vorteile gegenüber der Kontrollgruppe aufweist. Das Projekt befindet sich derzeit in der Erhebungsphase; die Datenerhebung und -analyse wird zur Tagung abgeschlossen sein. Im Zuge der Weiterentwicklung des Lehrkonzepts wollen wir uns verstärkt um gezielt ausgewählte Teilaspekte der Erklärfähigkeit widmen (Huang Y. et al., 2023). So kann die Aufmerksamkeit noch gezielter auf relevante Aspekte gelernt werden. Es wird erwartet, dass so die Potenziale der VR-Umgebung noch besser genutzt werden können.

 

Virtual Reality Teaching Partner: Studie zur Wahrnehmung realer und VR-basierter Unterrichtssimulationen

Eric Richter1, Kira E, Weber2, Lucas J. Jacobsen3, Dirk Richter1, Yizhen Huang1
1Universität Potsdam, 2Universität Hamburg, 3Leuphana Universität Lüneburg

Theoretischer Hintergrund

Unterrichtssimulationen sind fester Bestandteil der Lehramtsausbildung (Grossman, Hammerness, et al., 2009). Diese Art des Lernens ermöglicht es situationsspezifisches Wissen und pädagogische Kompetenzen zu vermitteln, um so Transfer in die spätere Berufspraxis zu erleichtern (Kramer et al., 2020).

Entscheidend für den Lernerfolg in praxisorientierten Lernumgebungen wie Simulationen ist das Ausmaß der wahrgenommenen Authentizität. Dabei handelt es sich um den Grad der Ähnlichkeit zwischen den Merkmalen der Lernumgebung und dem tatsächlichen Kontext in der beruflichen Praxis (Grossman, Compton, et al., 2009; Shavelson, 2012).

Die Bereitstellung authentischer Simulationen in der physischen Realität ist zeit- und ressourcenintensiv. Im Gegensatz dazu lassen sich standardisierte und realistische Simulationen in der virtuellen Realität (VR) leichter durchführen, da sie nicht auf menschliche Akteure angewiesen sind. VR ist eine Sammlung digitaler Technologien, die es ermöglichen, realistische Erfahrungen in virtuellen Umgebungen zu schaffen (McGarr, 2020). Aufgrund ihres hohen Grades an Realismus und Kontrollierbarkeit haben VR-Anwendungen in der Lehramtsausbildung an Bedeutung gewonnen (Huang et al., 2023). Es gibt erste Hinweise darauf, dass VR-basierte Microteaching-Erfahrungen die Selbstwirksamkeit und das Wissen von Lehramtsstudierenden in Bezug auf das Klassenmanagement steigern können (z. B. Seufert et al., 2022). Bislang wurde jedoch nicht untersucht, ob Lehramtsstudierende VR-basierte Microteaching-Erfahrungen ähnlich authentisch wahrnehmen wie reale Unterrichtssimulationen.

Um diese Frage zu beantworten, wurden in der vorliegenden Studie die Einschätzungen von Lehramtsstudierenden zur Authentizität und kognitiven Eingebundenheit von Unterrichtssimulationen in der VR und in der physischen Realität untersucht.

Methode

Diese Studie wurde im Rahmen des bildungswissenschaftlichen Blockseminars "Become a VR Teaching Partner: Unterricht erproben, analysieren und Feedback geben" (ca. 4. Semester) durchgeführt. Während des Seminars wurden Lehramtsstudierende darauf vorbereitet, selbstständig Unterrichtssimulationen für Kommiliton:innen anzubieten, deren Unterricht zu beobachten, zu analysieren und ihren Peers anschließend Feedback zur Qualität des Unterrichts zu geben. Die Unterrichtssimulationen wurden entweder in der VR oder in der physischen Realität angeboten (nVR = 43, nReal = 14). Im Anschluss an diese Peer-Learning-Möglichkeit wurden 57 Lehramtsstudierende, die an der Unterrichtssimulation teilgenommen hatten, gebeten, ihre Erfahrungen mit einer der beiden Simulationen im Hinblick darauf zu bewerten, wie authentisch (Codreanu et al., 2020) und wie kognitiv involvierend (Schubert et al., 2001) die Simulation empfunden wurde.

Die VR-Simulation wurde mit Teach-R (ehemals VR-Klassenzimmer; Wiepke et al., 2019) durchgeführt, welches 30 virtuelle Schüler:innen abbildete. Die Teilnehmer:innen erlebten die Simulation mithilfe des HTC VIVE Headsets, das sie in das virtuelle Klassenzimmer versetzte. Während der VR-Simulation hielten die Teilnehmenden einen vierminütigen Vortrag zu einem vordefinierten Thema und reagierten dabei auf vorprogrammierte Störungen im VR-Klassenzimmer. Die reale Simulation folgte dem gleichen Skript, wurde jedoch von fünf geschulten Schauspieler:innen inszeniert, die die Rollen der fiktiven Schüler:innen übernahmen. Die Lehraufgabe blieb in beiden Simulationsszenarien identisch.

Ergebnisse und Diskussion

Wir verwendeten den Brunner-Munzel-Test - eine robuste Version des Mann-Whitney's U-Tests (Karch, 2021) - um die Verteilungen der Bewertungen von Authentizität und kognitiver Eingebundenheit zwischen den beiden Simulationsbedingungen zu vergleichen. Die Teilnehmenden bewerteten die VR- und die reale Simulation in Bezug auf Authentizität (MVR = 2.93, MReal = 2.98, p = .79) und kognitive Eingebundenheit (MVR = 3.62, MReal = 3.55, p = .69) ohne signifikante Unterschiede.

Die vorliegende Studie zeigt somit, dass Lehramtsstudierende VR-basierte und reale Unterrichtssimulationen in Bezug auf Authentizität und kognitive Eingebundenheit ähnlich erleben. Dieses Ergebnis ist angesichts des Fehlens vergleichbarer Studien zu VR-basierten und realen Unterrichtserfahrungen von Bedeutung. Validierungsstudien wie diese, die die Wahrnehmung von Lehramtsstudierenden in VR- und realen Klassenzimmern vergleichen, sind notwendig, um die ökologische Validität von VR-Anwendungen in der Lehramtsausbildung beschreiben zu können. Unsere Ergebnisse gehören vor diesem Hintergrund zu den ersten, die die Vergleichbarkeit von VR- und realen Unterrichtssituationen empirisch belegen und das Potenzial der Integration von VR-Technologie in die Lehramtsausbildung unterstreichen.

 

Generalisierung spezifischer Entwicklungen der simulationsbasierten Lehre von Teach-R

Axel Wiepke
Universität Potsdam

Verschiedene Fachdisziplinen nutzen simulationsbasierte Lehre durch das Teach-R-Projekt. Hier ist es möglich, verschiedene Lehrinhalte und Schwerpunkte in der Interaktion mit virtuellen Schülerinnen und Schülern (vSuS) in einer Virtual Reality (VR)-Umgebung anzusprechen. Die Vielfalt an Disziplinen führt zu Anforderungen an die Software, die in angepassten Versionen (Derivaten) mit speziellen Funktionen resultieren. Die Funktionen sollen jedoch generalisiert werden, damit andere Disziplinen eigene Inhalte einbinden können. Der Beitrag soll die Spannung zwischen spezifischen Inhalten und generalisierbaren Interaktionen anhand des Entwicklungsprozesses beleuchten.

Teach-R Genese

Die ursprüngliche Version des Projekts (Paulicke & Wiepke, 2018) umfasste ein VR-Klassenzimmer mit frontaler Sitzordnung, einen Avatar für die Lehrkraft und 30 homogenen vSuS. Das Verhalten der vSuS wurde basierend auf disziplinübergreifenden Verhaltensmustern aus realen Unterrichtsvideos modelliert (Paulicke et al., 2015). Folgend wurde je eine der Verhaltensweisen für die sieben Kategorien von Schülerverhalten (Kounin, 2006) exemplarische in eine virtuelle Darstellung überführt. Neben der Steuerung der vSuS über eine Weboberfläche war in VR das Greifen von Objekten und die Bewegung im Raum möglich.

Darauf aufbauend wurden in Forschungsprojekten mit verschiedenen Fachdisziplinen Derivate entwickelt, die sowohl als Ausgangspunkt für weitere Entwicklungen dienten als auch von den jeweiligen Projektpartnern weiterentwickelt wurden. Zunächst sollte Training des Klassenraummanagements mit den Erziehungswissenschaften ermöglicht werden. Besonderes Augenmerk lag hier auf der Wiederholbarkeit von Unterrichtssituationen. Daraus ergab sich die Funktion des Skripts, das Verhaltensweisen, auslösende vSuS und Zeitpunkt des Verhaltens in einer Textdatei festlegte (Wiepke et al., 2019). Zudem wurden die vSuS vielfältiger gestaltet, und Daten zur späteren Reflexion erfasst. Die Daten umfassten Anzahl der „störenden“ Verhaltensweisen der vSuS, Positionsdaten der Lehrkraft und die zurückgelegten Meter in der VR.

Im zweiten Derivat wurde Teach-R in Zusammenarbeit mit der Geschichtsdidaktik um Unterrichtsgespräche erweitert, in denen Erkenntnisstufen durch ein impulsgesteuertes Unterrichtsgesprächs erreicht werden konnten (Fenn & Arlt, 2023). Dafür wurde der Ablauf des Gesprächs mittels eines Strukturbaums konzipiert, in dem vSuS-Aussagen entworfen wurden, die auf „gelungene“, „akzeptable“ oder „irreführende“ Aussagen der Lehrkraft passten. Entworfen wurden die Bäume mit einer grafischen Oberfläche, um ohne Programmierkenntnisse erweiterbar zu sein. Durch die Geschichtsdidaktik wurden drei Themengebiete inklusive Unterrichtsmaterialien (Poster und Unterrichtspläne) angefertigt und mehrere Audiodateien für jede entworfene vSuS-Aussage aufgenommen. Zudem wurden weitere Sitzordnungen (Fischgräte und Hufeisen) implementiert, die als diskussionsförderlich angesehen wurden.

Das Derivat der Chemiedidaktik adressierte Experimentierphasen im Unterricht und den individuellen Fortschritt der vSuS im Experiment. Die Strukturbäume wurden dafür so verändert, dass jeder einzelne vSuS einen eigenen Zustand hatte. So konnten z.B. einige vSuS das Experiment beendet haben und andere noch immer im Gespräch mit der Lehrkraft ihre Angst vor dem Brenner überwinden (Wiepke et al., 2022). Darüber hinaus wurde auf die zeitkritische Interaktion mit vSuS beim Experimentieren Wert gelegt. Dafür wurde ein realer Raum mit Tischanordnung vermessen und virtualisiert, um Tische und Wände als haptisches Feedback nutzen zu können, wenn das Training in diesem Raum stattfindet.

Generalisierbarkeit spezifischer Entwicklungen

Auch in weiteren Projekten wurden die Bedarfe der jeweiligen Fachdisziplin erhoben und spezifische Erweiterungen vorgenommen. Die Kommunikation der vSuS mit der Lehrkraft wandelte sich so von der Website-Steuerung, zum Skript, zum Klassen-Strukturbaum, zum individuellen Strukturbaum, nun hin zum teilrandomisierten und zeitabhängigen Verhalten von Einzel- und Partnerarbeiten. Dabei bot jeder Schritt der Entwicklung spezifische Lösungen für spezifische Anwendungsfälle, kann jedoch ohne Programmierkenntnisse (mit entsprechendem Aufwand) für weitere Themenbereiche angepasst werden. Dies wird weiter unterstützt durch verschiedene Sitzordnungen und fachspezifische Klassenräume. Es wurden auch weitere Anpassungen und Erweiterungen vorgenommen, die neben der Nutzerfreundlichkeit auch weitere Möglichkeiten im VR Klassenzimmer erschließen, wie z.B. das Präsentieren von Folien, Schreiben an der Tafel, Wettererscheinungen auf dem Schulhof oder eine Pausenklingel.

 

Reflexion durch Teach-R adressieren

Christina Hildebrandt, Amitabh Banerji
Universität Potsdam

Teach-R Variante für die Ausbildung im Fach Chemie: Das Laborklassenzimmer

In der Variante „Laborklassenzimmer“ unterrichten die Studierenden eine Lerngruppe aus virtuellen Schülerinnen und Schülern (vSuS), welche in Partnerarbeit ein Experiment am Gasbrenner durchführt. Die Verhaltensweisen der vSuS und die auftretenden fachspezifischen Störungen (z.B. vSuS haben Angst vor dem Gasbrenner) basieren dabei auf Praxisbeispielen und werden von einem dem Szenario zu Grunde liegenden Strukturmodell gesteuert. Die angehenden Lehrkräfte werden mit diesen fachspezifischen Störungen konfrontiert, die in einem 8- bis 10-minütigen Szenario adressiert werden sollen (Wiepke et al., 2022). Das Szenario wird hierbei vom Lehrpersonal über die Webanwendung eines externen Coachs begleitet. Die vSuS werden über diesen Coach im Hinblick auf die Handlungsentscheidungen der angehenden Lehrkräfte manipuliert und geben somit eine Form des Feedbacks, welches neben der durchgeführten Handlung selbst sowie der Entscheidungsfindung im Nachgang diskutiert und reflektiert werden soll.

Teach-R weist dabei in mehrfacher Hinsicht großes Potential auf, da realistische Trainingssituationen ermöglicht werden, die es zulassen (herausfordernden) Unterrichtssituationen interaktiv zu begegnen, diese zu erproben und prozedurales Wissen zu adressieren (Wiepke et al., 2022). Hierdurch erschließen sich echte Lehr-Lern-Gelegenheiten mit starkem Praxisbezug für die Ausbildung von Lehrpersonal an Hochschule. Der Einsatz moderner digitaler Technik im Rahmen der Lehramtsausbildung markiert hierbei einen wichtigen Schritt im Hinblick auf den digitalen Wandel, der sich bisher vor allem in den Fachwissenschaften sowie in der Ausprägung von Informations- und Kommunikationswegen der Schülerinnen und Schüler rasant vollzieht. So können jedoch auch Lehrkräfte erreicht und Kompetenzen im Sinne des DPaCK-Modells (DPacK: Digitality-related Pedagogical Content Knowledge) aufgebaut und erweitern werden (Huwer et al., 2019).

Forschungsgegenstand: Reflexionskompetenz

Der Lehrberuf ist mit vielfältigen Aufgaben und Kompetenzanforderungen hoch komplex und anspruchsvoll (Henke & Schrader, 2006). Angehende Lehrkräfte müssen deshalb unbedingt befähigt werden, eigene Unterrichtsplanungen und Durchführungen selbstkritisch zu hinterfragen sowie ihr unterrichtliches Handeln zu analysieren, um ihre Kompetenzen weiterentwickeln zu können. Die Reflexionskompetenz besetzt somit hinsichtlich der Verbesserung, Entwicklung und Anpassung von Unterricht eine Schlüsselposition (Helmke, 2012) und muss daher zentraler Bestandteil der Ausbildung sein, welchen es jedoch im Hinblick auf Unterrichtsdurchführung zu schärfen gilt. Denn Studien zeigen, dass Studierende Unterricht oftmals stark deskriptiv, wenig systematisch sowie wenig kritisch-reflektierend analysieren (Rothland & Zorn, 2015; Hatton & Smith, 1995).

Das Teach-R Szenario soll entsprechend einen ersten Reflexionsprozess anstoßen, der für eine zielführende und überlegte Handlung notwendig ist und den es nachfolgend im Rahmen einer Lehrveranstaltung zu erweitern und vertiefen gilt. Reflexion wird somit hinsichtlich der zwei Typen (Reflexion in der Handlung, Reflexion nach der Handlung; (Schön, 1983; Wyss, 2013) fachwissenschaftlich betrachtet. Die Entwicklung eines ersten Konzepts einer das Szenario integrierende Lehrveranstaltung, welche Reflexion am fachdidaktischen Inhalt der fachspezifischen Unterrichtsstörungen ermöglicht um adäquate Handlungsstrategien erproben und im Nachgang diskutieren zu können, ist eines der anvisierten Ziele. Um Reflexionskompetenz potentiell messbar adressieren und erweitern zu können, wird ein Modell zur Reflexion, entwickelt für den Physikunterricht von Nowak et al. zugrunde gelegt und angewendet. Es beschreibt eine ideale vollständige Reflexion über fünf Elemente (potenziell begründete Ausführungen zu Rahmenbedingungen, Unterrichtssituationen, Bewertungen, Alternativen, Konsequenzen) unter Bezugnahme auf die Wissensbasis (untergliedert in CK, PCK, GPK) und ermöglicht die Anwendung als Forschungsinstrument, welches die Untersuchung der Entwicklung der Reflexionsfähigkeit zum Ziel hat. Auch kann es Studierenden als Leitlinie beim Reflektieren und Dozierenden als Instrument zur Einschätzung der Güte der Studierendenreflexionen dienen (Nowak et al., 2019).

Grundlegend soll untersucht werden, ob und inwiefern gezielte und angeleitete Unterrichtsreflexionen ausgehend von einem virtuellen Setting zu einer signifikanten Steigerung der Handlungskompetenz führen und inwiefern sich diese Reflexionen objektiv, reliabel und valide messen lassen.

 
13:50 - 14:50Keynote 3: Prof. Dr. Michael Becker-Mrotzek: Transfer sprachlicher Förderkonzepte gestalten
Ort: H05
14:50 - 15:15Verabschiedung
Ort: H05

 
Impressum · Kontaktadresse:
Datenschutzerklärung · Veranstaltung: GEBF 2024
Conference Software: ConfTool Pro 2.8.105
© 2001–2025 by Dr. H. Weinreich, Hamburg, Germany