11. GEBF-Tagung
BILDUNG VERSTEHEN - PARTIZIPATION ERREICHEN -
TRANSFER GESTALTEN
Haupttagung: 18. - 20.03.2024 | Nachwuchstagung: 21.03.2024
Universität Potsdam
Veranstaltungsprogramm
Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.
|
Sitzungsübersicht | |
Ort: H01 Hörsaal, 100 TN |
Datum: Montag, 18.03.2024 | |
10:30 - 12:10 | 1-05: Lernen und Unterrichten mit Videos: Wirkung auf motivationale und lernbezogene Prozesse Ort: H01 |
|
Symposium
Lernen und Unterrichten mit Videos: Wirkung auf motivationale und lernbezogene Prozesse Dieses Symposium versammelt drei Beiträge, in denen der Einsatz von Videos in Lehr-Lern-Prozessen experimentell erforscht wird. Gemeinsames Ziel aller Beitragenden ist es, Aspekte zu untersuchen, die den didaktisch effektiven Einsatz von Videos zur Vermittlung fachspezifischer Inhalte in schulischer und universitärer Lehre determinieren. Aktuelle Forschung betont, dass sowohl Gestaltungselemente innerhalb eines Videos (z.B. die Sichtbarkeit und das Verhalten einer Lehrperson) als auch Merkmale der Lernenden selbst (z.B. ihr Vorwissen oder spezifische Kompetenzen) einen Einfluss darauf haben, wie Videos wahrgenommen werden und Lernerfolge unterstützt werden können. Das vorliegende Symposium trägt zum aktuellen Diskurs um den effektiven Einsatz von Videos in Lehr-Lern-Prozessen bei, indem es Ergebnisse dreier experimenteller Studien zusammenführt, die unterschiedliche Einflussfaktoren bezüglich des Lernens mit und durch Videos in den Blick nehmen. In Beitrag 1 wird experimentell untersucht, ob die Einblendung eines ‚Talking Head‘, also des Gesichts einer Lehrperson im Video, die Wahrnehmung von Studierenden hinsichtlich verschiedener Videomaterialien in einer Lernphase beeinflusst (z.B. Zufriedenheit und soziale Präsenz). Zudem wurde die Sichtbarkeit des ‚Talking Head‘ auch in einer sich anschließenden Testphase systematisch variiert, in der Informationen aus den gesehenen Lernvideos erfragt wurden. Die statistischen Analysen konnten weder Haupteffekte noch Interaktionseffekte des ‚Talking Head‘ in der Lern- und Testphase aufzeigen. Diese Befunde deuten in Übereinstimmung mit früheren Forschungsergebnissen darauf hin, dass mögliche positive Wirkungen der Einblendung einer Lehrperson (z.B. Abrufhinweise) durch negative Wirkungen (z.B. kognitive Überlastung) aufgehoben werden. Beitrag 2 fragt danach, wie sich die Körperhaltungen einer Lehrperson als ‚Social Cue‘ in einem Video auf die Wahrnehmung Studierender und ihren Einstellungen gegenüber der Lehrperson und dem Thema des Videos auswirken. Experimentell wurde die Körperhaltung der Lehrperson systematisch bezüglich der Dimensionen Vertikalität (aufrecht/zusammengesunken) und Horizontalität (offen/geschlossen) in einem Lehrvideo variiert. Die Analysen zeigten, dass beide Dimension die Wahrnehmung der Lehrperson durch Studierende hinsichtlich Enthusiasmus, Agency und Communion sowie empfundener Sympathie gegenüber der Lehrperson signifikant prägten. Der empfundene Respekt gegenüber der Lehrperson wurde hingegen nur durch die horizontale Dimension beeinflusst. Zudem wirkten beiden Dimensionen der Körperhaltung indirekt, mediiert durch den wahrgenommenen Enthusiasmus, auf das Interesse und die Motivation der Lernenden. Weitere Mediationsanalysen ergaben, dass die vertikale und die horizontale Dimension die Sympathie und den Respekt der Studierenden gegenüber der Lehrperson beeinflussten, wiederum indirekt mediiert durch deren Wahrnehmung von Agency und Communion der Lehrperson. Beitrag 3 widmet sich geschichtsbezogenen 360°-Videos, die auf Grund ihrer immersiven Merkmale herausfordernd für Lernende sein können. In einem universitären Schülerlabor wurde untersucht, ob sich durch ein kognitives Strategietraining, experimentell variiert bezüglich der Hinzunahme von Inhalten zu spezifischen Emotionsregulationsstrategien, die kognitive Verarbeitung der Schüler:innen in Bezug auf die vermittelten Inhalte stärken, sowie deren emotionale Verarbeitung abmildern lässt. Zudem wurde die Sozialform einer video-analytischen Arbeitsphase der Schüler:innen (Einzelarbeit vs. Kollaboration) variiert. Die Ergebnisse weisen darauf hin, dass kollaborative Arbeitsgruppen die kognitive und kritisch-reflexive Verarbeitung geschichtsbezogener 360°-Videos begünstigen. Das explizite Emotionsregulationsstrategien-Training führte während der Trainingsphase zu einer verstärkten Berücksichtigung emotionsbezogener Aspekte, hatte aber darüber hinaus keine weiteren Effekte. Zusammengenommen bieten die Beiträge wichtige Hinweise für den effektiven Einsatz von Videos in Lehr-Lern-Prozessen, indem sie differenzierte Befunde bieten, die sowohl die didaktische Gestaltung von Videos adressieren, als auch kontextuelle Merkmale wie z.B. die Förderung spezifischer Kompetenzen zur Rezeption von Videos in den Blick nehmen. Die Studien werden im Hinblick auf ihre Übertragbarkeit in schulische und außerschulische Lehr-Lern-Praxis, ihre Stärken und methodischen Limitationen diskutiert. Ebenso werden Anknüpfungspunkte für zukünftige Forschungsarbeiten herausgearbeitet. Beiträge des Symposiums Ein Talking Head als Abrufhinweis? Sichtbarkeit der Lehrperson in der Lern- und Testphase Theoretischer Hintergrund Das Einblenden einer Lehrperson in Lernvideos kann sowohl Vor- als auch Nachteile haben. Einerseits können soziale Hinweisreize im Lernmaterial gemäß der Social-Agency-Theory (Mayer, 2014a) soziale Reaktionen, eine vertiefte Verarbeitung und somit besseres Lernen auslösen. Andererseits kann die sichtbare Lehrperson laut des Kohärenz-Prinzips der Cognitive Theory of Multimedia Learning (Mayer, 2014a) zu kognitiver Überlastung führen. Die empirische Evidenz zu Lehrpersonen in Lernvideos ist heterogen (Henderson & Schroeder, 2021). Beispielsweise beobachten einige Studien lernförderliche Effekte (Pi & Hong, 2016), während andere keine (Kizilcec et al., 2014) oder lernhinderliche Effekte (Wilson et al., 2018) berichten. Auch für Maße wie soziale Präsenz oder Zufriedenheit ergibt sich ein heterogenes Befundbild (Sondermann & Merkt, 2023a,b). Eyetracking-Studien zeigen jedoch übereinstimmend, dass sichtbare Lehrpersonen häufig angesehen werden (Kizilcec et al., 2014). Bisherige Forschung konzentriert sich dabei aber vornehmlich auf in der Lernphase sichtbare Lehrpersonen. Offen bleibt, welchen Einfluss es hat, wenn Lehrpersonen (zusätzlich) in der Testphase sichtbar sind. Häufiges Ansehen der Lehrperson könnte dazu führen, dass die vermittelten Lerninhalte eng mit der Lehrperson verknüpft werden (Tulving & Thomson, 1973). So könnte ein Bild der Lehrperson in der Testphase als Hinweisreiz den Abruf von Informationen aus dem Video erleichtern. Bisherige Forschung zeigte bereits, dass dekorative Bilder aus der Lernphase den Abruf von Informationen in der Testphase verbessern konnten (Schneider et al., 2020). Fragestellung Unser Onlineexperiment untersucht die Effekte einer sichtbaren Lehrperson in Form eines Talking Heads (TH) in der Lernphase (in einem Lernvideo) und/oder in der Testphase (im anschließenden Wissenstest). Basierend auf bisheriger Forschung haben wir für Lernen (Abruf) eine Interaktion erwartet, indem der sichtbare TH nur dann lernförderliche Effekte hat, wenn er sowohl in der Lern- als auch in der Testphase sichtbar war, weil er so als Abrufhinweis den Abruf erleichtern kann. Explorative Analysen sollten außerdem potenzielle Effekte des TH in der Lernphase auf verschiedene Bewertungsmaße (z.B. soziale Präsenz, Zufriedenheit) untersuchen. Hypothesen, explorative Forschungsfragen sowie die Prozedur wurden präregistriert (https://aspredicted.org/FN7_3C2). Methode Im Rahmen eines 2x2-Between-Designs (Lernphase: TH vs. kein TH; Testphase: TH vs. kein TH) wurden die Teilnehmenden randomisiert einer der vier Bedingungen zugewiesen. Insgesamt sahen 161 Studierende (109 weiblich, 50 männlich, 1 divers, 1 keine Angabe, MAlter=33.32, SDAlter=11.84) vier Lernvideos zu verschiedenen Themen (z.B. Burkina Faso), die jeweils aus verschiedenen Folien bestanden. Dabei sahen die Lernenden entweder alle Videos mit TH, der die Inhalte vortrug, oder alle Videos ohne TH. Die Tonspur und die visuellen Lerninhalte in den Lernvideos waren jeweils komplett identisch. Als zweiter Faktor wurde variiert, ob beim Wissenstest neben dem jeweiligen Wissensitem ein Bild des TH zu sehen war oder nicht. Nach einer anfänglichen Selbstauskunft zu Vorwissen und Interesse bzgl. der vier Videothemen sahen die Lernenden die vier Lernvideos. Anschließen wurden verschiedene Bewertungsmaße (u.a. soziale Präsenz, Zufriedenheit) erfragt. Darauf folgte der Wissenstest, der aus 24 offenen Fragen (6 pro Thema) bestand und Fakten aus den Videos abfragte. Abschließend folgten Kontrollfragen und demografische Angaben. Ergebnisse und Diskussion Vorläufige Analysen zeigten keine vorab bestehenden Bedingungsunterschiede bzgl. Vorwissen und Interesse. Eine zweifaktorielle ANOVA zeigte außerdem weder Haupteffekte der Sichtbarkeit des TH während der Lern- und Testphase noch eine Interaktion hinsichtlich der Lernergebnisse, alle F<2.17. Auch auf Bewertungsmaße (z.B. soziale Präsenz, Zufriedenheit) hatte der in der Lernphase sichtbare TH keinen Einfluss, alle F<1. Folglich liefern unsere vorläufigen Ergebnisse keine Hinweise darauf, dass ein zusätzliches Einblenden der Lehrperson in der Testphase den Abruf von Informationen erleichtern kann. Die ausbleibenden Effekte auf Lernen und verschiedene Bewertungsmaße konnten die Ergebnisse einer früheren Studie mit ähnlichen Materialien (Sondermann & Merkt, 2023b) replizieren. Eine potenzielle Erklärung für die ausbleibenden Effekte könnte darin liegen, dass sich potenzielle positive Effekte der Lehrperson (sozialer Hinweisreiz, Abrufhinweis) und negative Effekte (kognitive Überlastung) gegenseitig aufgehoben haben. Straighten your back, open your arms! Wirkung der Körperhaltung einer Lehrperson auf Lernende Theoretischer Hintergrund Aktuelle Forschung zur Sichtbarkeit von Lehrpersonen in Erklärvideos betont die Wirkung von ‚Social Cues‘ (Mayer, 2014b) auf Lernende (Alemdag, 2022). So zeigen Studien, dass Lernleistungen durch Blickkontakt (Fiorella et al. 2019), Körperorientierung (Beege et al. 2017) und Gestik der Lehrperson (Dargue et al., 2019) beeinflusst werden können. Die Wirkung der Köperhaltung in Erklärvideos wurde unseres Wissens bisher nicht systematisch untersucht, obschon sie eine zentrale Komponente nonverbaler Kommunikation darstellt (Collier, 2021). Bisherige Forschung demonstriert positive Einflüsse von ‚High-Power-Posen‘ versus ‚Low-Power-Posen‘ auf die Wahrnehmung agentischer Merkmale wie Kompetenz und Dominanz (Abele & Yzerbyt, 2021; Rennung et al., 2016) und Sympathie (Waldron, 1975); sowie negative Einflüsse auf Mitleid (Rennung et al., 2016) und kommunale Eigenschaften (Abele & Yzerbyt, 2021). Körner und Schütz (2020) verweisen darauf, dass frühere Forschung zur Wirkung von Körperhaltungen durch uneinheitliche Differenzierungen geprägt ist. Dies berücksichtigend haben wir die Körperhaltung einer Lehrperson in einem Videotutorial bezüglich der Dimensionen Vertikalität (aufrecht/zusammengesunken) und Horizontalität (offen/geschlossen) variiert, um zu untersuchen, wie sich unterschiedliche Ausprägungen auf Lernende auswirken. Den Variationen entsprechend gab es eine ‚High-Power‘-Bedingung (aufrecht/offen), eine ‚Low-Power‘-Bedingung (zusammengesunken/geschlossen) sowie zwei unbestimmte Bedingungen (aufrecht/geschlossen; zusammengesunken/offen). Hypothesen Wir haben angenommen, dass eine aufrechte und offene Körperhaltung (versus einer zusammengesunkenen und geschlossenen) einen positiven Einfluss auf das Interesse (H1) und die Motivation (H2) von Studierenden hat. Wir haben erwartet, dass diese Effekte durch wahrgenommenen Enthusiasmus der Lehrperson mediiert werden (H1.1 und H2.1). Weiterhin haben wir angenommen, dass eine aufrechte (versus einer zusammengesunkenen) Körperhaltung einen ausgeprägteren Respekt der Studierenden erwirkt (H3) und dieser Effekt durch wahrgenommene Agency der Lehrperson mediiert wird (H3.1). Außerdem haben wir angenommen, dass eine offene (versus einer geschlossen) Körperhaltung zu einer ausgeprägteren Sympathie der Studierenden führt (H4) und dieser Effekt durch wahrgenommene Communion der Lehrperson mediiert wird (H4.1). Methode Nach einer randomisierten Zuordnung Studierender in eine der vier Experimentalbedingungen, in der sie eine Variation des Videotutorials sahen, wurden die Teilnehmenden gebeten, ihre Einschätzung hinsichtlich Themen-Interesse (Pawek, 2009), Themen-Motivation (Velayutham et al., 2011), Respekt und Sympathie gegenüber der Lehrperson (Wojciszke et al., 2009) sowie die Wahrnehmung der Lehrperson bezüglich Enthusiasmus (Kunter et al., 2008), Agency und Communion (Abele & Yzerbyt 2021) anzugeben. Die Stichprobe bestand aus 434 Studierenden unterschiedlicher Fachrichtungen (47.7% männlich, 51.2% weiblich, 1.2% divers; MAlter=24.5, SDAlter=4.21), die über www.prolific.com rekrutiert wurden. Das Experiment wurde präregistriert (Author & Author, 2023). Ergebnisse Zweifaktoriellen ANOVAs zeigten keine direkten Einflüsse der Dimensionen Vertikalität und Horizontalität auf Interesse und Motivation (H1 und H2). Respekt gegenüber der Lehrperson wurde durch Horizontalität beeinflusst, F(1, 430)=4.51, p=.028, η2=.011, nicht aber durch Vertikalität oder eine Interaktion beider Dimensionen (H3). Sympathie gegenüber der Lehrperson wurde durch Vertikalität, F(1, 430)=6,132, p=.014, η2=.014, Horizontalität, F(1, 430)=21.741, p<.001, η2=.048, und eine Interaktion beider Dimensionen, F(1, 430)=10.060, p=.002, η2=.023, beeinflusst (H4). Die Mediator-Variable wahrgenommener Enthusiasmus wurde durch Vertikalität, F(1, 430)=7.105, p=.008, η2=.016, Horziontalität, F(1, 430)=34.033, p < .001, η2 = .073, und eine Interaktion beider Dimensionen, F(1, 430) = 25.418, p<.001, η2=.056, beeinflusst. Gleiches galt für wahrgenomme Agency (Vertikalität: F(1, 430)=18.385, p<.001, η2=.041; Horizontalität: F(1, 430)=7.289, p=.007, η2=.017; Interaktion: F(1, 430)=4.927, p=.027, η2=.011) und Communion (Vertikalität: F(1, 430)=9.087, p=.003, η2=.021; Horizontalität: F(1, 430)=63.046, p<.001, η2=.128; Interaktion: F(1, 430)=16.161, p<.001, η2=.036). Kontrast-Analysen bezüglich aller Effekte zeigten, dass die ‚Low-Power‘-Bedingung jeweils zu den geringsten Bewertungen führte, während Gruppenunterschiede zwischen den anderen Bedingungen uneindeutiger waren. Analysen bestätigten alle Mediations-Hypothesen, gleichwohl direkte Effekt teilweise ausblieben (H1, H2 und H3). Diskussion Die Ergebnisse betonen die Wirkungen von Körhaltungen als ‚Social Cues‘ in Erklärvideos. Insbesondere die Abwesenheit einer ‚Low-Power-Pose‘ scheint zu positiven Effekten zu führen (Elkjær et al., 2022). Wir diskutieren die Ergebnisse bezüglich möglicher Geschlechter-Effekte (Hoogerheide et al., 2018) und Suppressor-Effekten bei den Mediations-Analysen (Rucker et al., 2011). Auswirkungen von Emotionsregulation und Kollaboration auf den Umgang mit geschichtsbezogenen 360°-Videos Geschichtsbezogene Virtual Reality (VR) Medien, wie 360°-Videos, werden zunehmend entwickelt (Bunnenberg, 2020). Die ZDF History 360° Reihe verspricht beispielsweise “eine virtuelle Reise zu historischen Orten” (https://history360.zdf.de/). Das virtuelle Time&History Museum möchte mit VR-Dokumentationen, wie dem Führerbunker, Anwendern ermöglichen, “Geschichte hautnah erleben” zu können (https://nordxr.de/fuehrerbunker-vr-de/). Auch auf YouTube sind zahlreiche geschichtsbezogene 360°-Videos frei verfügbar. Obwohl solche VR-Medien von Bildungspolitikern als innovative Ansätze für den Geschichtsunterricht angepriesen werden (Schulministerium NRW, 2021), können geschichtsbezogene VR-Medien aufgrund ihrer immersiven Merkmale und emotionalisierenden Darstellung der Inhalte herausfordernd für Lernende sein (Bunnenberg, 2018). So besteht die Gefahr, dass Lernende die Inhalte eher emotional als kognitiv verarbeiten (Parong und Mayer, 2021). Um einer emotionalen Überwältigung (Brauer, 2019) zu begegnen, zeigten sich in einer Vorstudie der Autor:innen erste positive, jedoch weiter ausbaubare Effekte eines Strategietrainings auf die Nutzung kognitiver Strategien (z.B. Inhalt zusammenfassen) bei der Verarbeitung geschichtsbezogener 360°-Videos. Die vorliegende Studie untersucht, ob sich eine stärker kognitive und weniger emotionale Verarbeitung der Videos noch besser unterstützen lässt, wenn Schüler:innen ein Strategietraining erhalten, welches sowohl kognitive Strategien als auch Emotionsregulationsstrategien (z.B. Aufmerksamkeitsstrategien zur Fokussierung auf nicht emotionale Aspekte; McRae & Gross, 2020) vermittelt. Da Emotionsregulation sowohl die Regulation eigener Emotionen als auch die anderer umfassen kann (McRae & Gross, 2020), könnte eine gemeinsame Verarbeitung geschichtsbezogener 360°-Videos womöglich besonders förderlich sein. Bisherige Befunde zu Effekten des Co-Viewings (Zillich, 2014, Tal-Or, 2016) und zur Wirksamkeit kollaborativen Lernens (Nokes-Malach, 2015) sind jedoch inkonsistent. Daher soll zudem exploriert werden, wie sich eine kollaborative Videoanalyse auf die Verarbeitung auswirkt. Methode: 157 Schüler:innen aus zehn Schulklassen der Jahrgangsstufen 11 und 12 nahmen an einer experimentellen Studie im 2x2 Design mit Gruppen-Randomisierung auf Klassenebene in einem universitären Schülerlabor teil. Variiert wurden die Trainingsart (kognitive Strategien & Emotionsregulationsstrategien vs. nur kognitive Strategien) und die Sozialform (kooperativ vs. individuell). Am Tag des Experiments analysierten Schüler:innen zunächst ein geschichtsbezogenes 360°-Video in Kleingruppen oder Einzelarbeit. Darauf folgte das Strategietraining mit einer Instruktions- und Übungsphase. Die Instruktion vermittelte die Funktion von nur kognitiven Strategien oder zusätzlich Emotionsregulationsstrategien für das Analysieren geschichtsbezogener 360°-Videos. Während der Übung wendeten die Schüler:innen in Kleingruppen- oder Einzelarbeit die Strategien mithilfe einer Checkliste für die Korrektur ihrer eingangs erstellten Videoanalysen an. Nach dem Training analysierten die Schüler:innen ein zweites 360°-Video in Einzelarbeit. Die vor, während und nach dem Training angefertigten schriftlichen Videoanalysen der Schüler:innen wurden mit Blick auf inhalts- und medienbezogene (z.B. Medium charakterisieren), aufgabenbezogene (z.B. Schlussfolgerungen ziehen), reflexive-evaluative (z.B. distanzierte Beschreibung des Eintauchens) sowie emotionsbezogene Aspekte (z.B. Emotionen beschreiben) analysiert. Zwei Rater kodierten 100% der Daten und erreichten vor der Diskussion ihrer Unstimmigkeiten eine zufriedenstellende Übereinstimmung für alle Codes (κ = 0.72 - 1.0). Ergebnisse und Diskussion: Vor dem Training wiesen die Analysen von Kleingruppen mehr aufgabenbezogene (BF10 = 1,11) sowie reflexive-evaluative (BF10 = 1,64) Elemente auf als die in Einzelarbeit angefertigten Analysen. Unter den instruktionalen Bedingungen der Übung führte Kollaboration zu einer verstärkten Berücksichtigung von inhalts- und medienbezogenen (BFincl = 2,54) sowie aufgabenbezogenen (BFincl = 2,11) Aspekten. Zusammengenommen sprechen diese Ergebnisse (von Bayesian ANOVAs) für zwar kleine, aber positive Effekte von Kollaboration auf die kognitive und vor allem auch kritisch-reflektierte Verarbeitung geschichtsbezogener 360°-Videos. Nach dem Training zeigte sich ein Effekt von vorheriger Kollaboration auf einen erhöhten Einbezug emotionsbezogener Elemente (BF10 = 1,32). Dies könnte auf eine zuvor erfahrene soziale Akzeptanz emotionaler Reaktionen zurückzuführen sein. Das Training mit Emotionsregulationsstrategien führte lediglich unter instruktionalen Bedingungen zu einer verstärkten Berücksichtigung emotionsbezogener Elemente (BFincl = 8,74). Demnach führte das Training mit Emotionsregulation zu einer erhöhten Aufmerksamkeit auf emotionale Aspekte des Videos und dessen Wirkung (und dies nur während des Trainings), jedoch nicht zu einer stärkeren (im Vergleich zum Training mit nur kognitiven Strategien) Umlenkung dieser Aufmerksamkeit auf nicht-emotionale Aspekte. |
13:10 - 14:50 | 2-05: Handlungsnahe Kompetenzmessung mit Simulationen in der Lehrkräftebildung: Potentiale und Herausforderungen Ort: H01 |
|
Symposium
Handlungsnahe Kompetenzmessung mit Simulationen in der Lehrkräftebildung: Potentiale und Herausforderungen Die Lehrkräftebildung hat zum Ziel, insbesondere die professionellen Kompetenzen (angehender) Lehrkräfte zu fördern (Kultusministerkonferenz, 2022). Weinert (2001) definiert den Begriff Kompetenzen als die verfügbaren bzw. erlernbaren kognitiven Fähigkeiten und Fertigkeiten, sowie die damit verbundenen motivationalen, volitionalen und sozialen Fähigkeiten eines Individuums, um bestimmte Probleme in variablen Situationen erfolgreich zu lösen. Bereits seit längerer Zeit wird in diesem Zusammenhang kritisiert, dass klassische Verfahren wie Wissenstests für die Kompetenzmessung nicht geeignet sind, da keine authentische Anwendung des Wissens in konkreten beruflichen Anforderungssituationen stattfindet (Shavelson, 2010; Ufer & Neumann, 2018). Blömeke et al. (2015) verstehen unter Kompetenz ein Kontinuum zwischen kognitiven und affektiv-motivationalen Dispositionen, die bestimmten situationsspezifischen Fähigkeiten unterliegen, und der beobachtbaren Leistung in einer professionellen Anforderungssituation. Alternativ wird diskutiert, die Prozesse, die einer solchen Leistung vorangegangen sind, direkt zu messen um Rückschlüsse über die Zusammenhänge zwischen individuellen Voraussetzungen, erfolgversprechenden Problemlöseprozessen und der letztendlichen Leistung treffen zu können (Hammer & Ufer, 2023; Heitzmann et al., 2019; Herppich et al., 2018). Um professionelle Kompetenzen umfassend zu messen und die angenommenen Zusammenhänge zwischen Dispositionen, Prozessen und Leistung zu prüfen, sind standardisierte Erhebungsformate notwendig, in denen professionelle Anforderungssituationen authentisch nachgebildet werden, Kompetenzen in vergleichbaren und wiederholbaren Situationen gezeigt werden müssen, und somit eine objektive, handlungsnahe Messung beobachtbaren Verhaltens möglich ist (Albu & Lindmeier, 2023; Blömeke et al., 2011; Fischer et al., 2022; McClelland, 1973; Messick, 1995; Shavelson, 2012; Ufer & Neumann, 2018; White, 1959). Dazu können Simulationen dienen, die beispielsweise rollenspiel- oder videobasiert konkrete berufliche Anforderungen möglichst authentisch abbilden und es durch die Kontrolle von Störfaktoren erlauben, die kognitive Belastung der Lernenden zu kontrollieren (Codreanu et al., 2020; Grossman et al., 2009). Dieses Symposium geht anhand von drei Fächern (Biologie, Englisch, Mathematik) der Frage nach, wie Zusammenhänge zwischen Dispositionen, Prozessen und Leistungen für einzelne Kompetenzbereiche modelliert, in Simulationen erfassbar gemacht und empirisch geprüft werden können. Neben den konkreten Modellen und Ergebnissen sollen auch Herausforderungen bei der Kompetenzmessung in Simulationen diskutiert werden. Aufgrund der langen Tradition simulationsbasierten Lernens in der Medizinausbildung (z.B. Lane & Rollnick, 2007) wurde hierfür ein Diskutant aus der Medizindidaktik angefragt. Der erste Beitrag stellt die Entwicklung und Validierung einer rollenspielbasierten Simulation vor, die zur Messung der Feedbackkompetenz angehender Englischlehrkräfte genutzt werden kann und in diesem Zusammenhang als alternatives Prüfungsformat diskutiert wird. Der zweite Beitrag fokussiert die Diagnosekompetenz als Teil professioneller Handlungskompetenz (Baumert & Kunter, 2006). Mit der Klassenraumsimulation SKRBio wurde eine digitale Lernumgebung entwickelt, mit der die Diagnosekompetenz von Biologie-Lehramtsstudierenden gemessen und prospektiv gefördert werden soll. Der dritte Beitrag bezieht sich ebenfalls auf die Messung von Diagnosekompetenz, allerdings in Bezug auf die Lehramtsausbildung Mathematik. Vorgestellt wird eine Operationalisierung diagnostischer Kompetenz anhand einzelner Indikatoren und deren handlungsnahe Messung in rollenspielbasierten Simulationen. Ziel ist es durch eine systematische Erfassung einzelner Indikatoren die Beziehungen dieser Indikatoren genauer zu verstehen. Die Erkenntnisse aus dem Fach Englisch in Bezug auf Feedbackkompetenz in Gegenüberstellung zu den Erkenntnissen aus den Fächern Biologie und Mathematik in Bezug auf Diagnosekompetenz soll es ermöglichen, Vorgehensweisen und Ergebnisse über verschiedene Kompetenzbereiche hinweg zu diskutieren. Der Vergleich zwischen den Fächern Biologie und Mathematik in Bezug auf die Messung von Diagnosekompetenz soll die Diskussion von Ergebnissen zwischen verschiedenen Domänen ermöglichen. Beiträge des Symposiums Entwicklung und Validierung einer rollenspielbasierten Simulation als Prüfungsverfahren für das Lehramtsstudium im Fach Englisch Hintergrund Angehenden Lehrkräften gelingt es häufig nicht, ihr im Studium erworbenes Wissen in typischen beruflichen Anforderungssituationen adäquat anzuwenden (Zeichner, 2010). Daher wird wie bspw. im Core Practices Approach (Grossman, 2021) vorgeschlagen, auch in der ersten Phase der Lehramtsausbildung handlungsnähere Anteile professioneller Kompetenz (Blömeke et al., 2015) vermehrt in den Fokus zu rücken. Diese Anteile sind bisher aber typischerweise nicht Gegenstand von Prüfungen. Prüfungsverfahren der ersten Phase (z.B. Klausuren, mündliche Prüfungen) fokussieren meist die (deklarative und prozedurale) Ebene des Wissens (vgl. Miller, 1990). Handlungsnahe Kompetenzen werden häufig erst in der zweiten Phase in unterrichtspraktischen Prüfungen (vgl. Ebene Action, Miller, 1990) adressiert. Es zeichnet sich also eine Lücke zwischen weniger handlungsnahen Prüfungen im Lehramtsstudium und Prüfungen unter kaum standardisierbaren Bedingungen des realen Berufsfeldes im Vorbereitungsdienst ab. In Anlehnung an andere professionsorientierte Studiengänge wie der Medizin könnte der Einsatz rollenspielbasierter Simulationen einen Beitrag dazu leisten, diese Lücke zu verkleinern (Dotger et al., 2010). Hierbei werden typische Standardanforderungen des Berufs unter möglichst authentischen, aber komplexitätsreduzierten Bedingungen standardisiert in rollenspielähnlichen Szenarien simuliert (Pierre & Breuer, 2013). Derartige Simulationsprüfungen haben zudem das Potenzial, schon den Kompetenzerwerb Studierender stärker an beruflichen Handlungsanforderungen zu orientieren (Sopka et al., 2013), finden z.B. in der Fremdsprachenlehrkräftebildung aber kaum Berücksichtigung (Abendroth-Timmer, 2011). Ziele & Fragestellung Ziele dieses Beitrags sind daher die Entwicklung und Validierung eines Prototyps für eine rollenspielbasierte Simulationsprüfung zur Erfassung der Feedbackkompetenz angehender Englischlehrkräfte im Kompetenzbereich Schreiben (Pang 2018; Hattie & Timperley 2007). So soll der Frage nachgegangen werden, inwiefern sich eine rollenspielbasierte Simulation als mögliches handlungsnäheres Prüfungsformat für das Lehramtsstudium am Beispiel des Unterrichtsfachs Englisch eignet. Methode In der entwickelten Simulation führen Studierende ein Gespräch, in welchem sie standardisierten Lernenden (Schauspieler:innen) adaptives Feedback zu einem schriftlichen Lernprodukt geben müssen (Nassaji, 2017). Als Grundlage dient ein literaturbasiert entwickeltes Rahmenmodell der Feedbackkompetenz im Bereich Schreiben, das als Raster zur Bewertung der videografierten Leistung der Studierenden operationalisiert wurde (vgl. Hyland, 2019; Lotz et al., 2015; Ferris, 2013). Die Schauspieler:innen wurden in einem achtwöchigen Trainingszeitraum unter anderem im Umgang mit so genannten verbal triggers zur gezielten Adressierung von Kompetenzfacetten geschult, um eine Standardisierung der Prüfungssituation zu gewährleisten (Dotger et al., 2010). Um sicherzustellen, dass ein solches (für die Lehramtsausbildung) neues Prüfungsformat in der Hochschullehre zielgerecht eingesetzt werden kann, wurden in der Entwicklung dem argument-based approach of validation (Kane, 2013) folgend mehrere Validierungsschritte vorgenommen. In einer Pilotuntersuchung (N1=10 Studierende) nahmen die Teilnehmenden im Anschluss an die Simulation an stimulated-recall-Interviews zur Validierung der verbal triggers teil, die strukturierend-inhaltsanalytisch ausgewertet wurden (Kuckartz & Rädiker, 2022). In der Hauptuntersuchung (N2=51 Studierende) wurden u.a. fachdidaktisches Wissen (Kirchhoff, 2017), Sprachkompetenz (Lemhöfer & Broersma, 2012) und Feedbackwissen (Schütze et al., 2017) der Teilnehmenden erhoben sowie strukturierte Leitfadeninterviews zur Akzeptanz der Simulation geführt. Ergebnisse & Diskussion In den stimulated-recall-Interviews zeichnet sich ab, dass die verbal triggers angestrebte Handlungsweisen evozieren können und von den Teilnehmenden überwiegend im Rahmen der intendierten Kompetenzfacetten wahrgenommen werden. Sie empfinden die Simulationen als authentisch, akzeptieren das Simulationsgespräch grundsätzlich als mögliches Prüfungsformat und beschreiben es im Vergleich zu schriftlichen und mündlichen Prüfungen als praxisrelevanter. Der aktuelle Stand der quantitativen Auswertungen (n=10, je n=5 B.Ed./M.Ed.b) zeigt, dass Masterstudierende nach dem Praxissemester signifikant höhere Testscores in der Simulationsprüfung erreichen als Bachelorstudierende (t(8)=3.045, d= 1.926, p=.016), was als Indikator für die Validität der Simulation betrachtet werden kann. Es ergeben sich in den vorläufigen Ergebnissen aber keine signifikanten Korrelationen zwischen Testscore und fachdidaktischem Wissen (r=.181, p=.617), Sprachkompetenz (r=-.114, p=.754) und Feedbackwissen (r=.523, p=.112). Die Validierung des Bewertungsrasters durch Expertenbefragungen wird derzeit durchgeführt. Insgesamt scheint die entwickelte Simulation grundsätzlich als Prüfungsformat geeignet zu sein. Der Ansatz lässt sich außerdem auf andere Kompetenzbereiche der Lehramtsausbildung übertragen (z.B. Beratungskompetenz, Gerich, 2016). Messung der Diagnosekompetenz zum Experimentieren mit der Klassenraumsimulation SKRBio Hintergrund Diagnosekompetenz ist ein elementarer Bestandteil professioneller Handlungskompetenz von Lehrkräften und wesentlich für die Leistungsbeurteilung der Schülerinnen und Schüler (Baumert & Kunter, 2006; Leuders et al., 2022). Während der beruflichen Einstiegsphase stehen Lehrkräfte im Klassenraum zunächst einer Vielzahl neuer Herausforderungen gegenüber (z. B. praktische Umsetzung ihrer Unterrichtsplanung), wodurch diagnostisches Handeln im Unterricht oft vernachlässigt wird (Levin et al., 2009). Digitale Lernumgebungen wie Klassenraumsimulationen bieten die Möglichkeit, bereits im Studium realitätsnahe Lernsituationen zu schaffen, in denen handlungsbezogene Kompetenzen in einer sicheren Umgebung angewendet werden können (Bradley & Kendall, 2014). Die Komplexität realer Unterrichtssituationen kann hier gezielt reduziert und so können spezifische Kompetenzen fokussiert eingeübt werden (Grossmann et al., 2009; Hillmayr et al., 2020). Mit der Klassenraumsimulation SKRBio (Fischer et al., 2022) zum Experimentieren (Facette: Planung eines Experiments) wurde eine Lernumgebung entwickelt, mit der die Diagnosekompetenz von Lehramtsstudierenden gemessen und gefördert werden soll. Die Diagnosekompetenz wird im SKRBio als Urteilsgenauigkeit in Hinblick auf die korrekte Niveauzuordnung von Schülerantworten basierend auf einem Kompetenzmodell nach Wellnitz & Mayer (2013) operationalisiert. Studierende führen im SKRBio eine simulierte Unterrichtssequenz nach einem Frage-Antwort-Schema durch, wobei die virtuellen Schülerinnen und Schüler in ihren Antworten die Planung eines Experiments beschreiben. Während der Unterrichtssequenz müssen die Studierenden jede dieser Antworten bewerten, indem zuerst Aspekte des Experimentierens (z. B. Messung der abhängigen Variable, Konstanthaltung von Störgrößen) in einer Antwort identifiziert und die Antwort darauf basierend einer Niveaustufe zugeordnet wird. Für die Zuordnung der Niveaustufe IV müssen beispielsweise die Aspekte „Variation der unabhängigen Variable“, „Messung der abhängigen Variable“ sowie „Konstanthaltung von Störgrößen“ in einer Antwort enthalten sein. Am Ende soll die Gesamtleistung der einzelnen Lernenden bewertet werden. Um den Diagnoseprozess zu unterstützen, wurde ein Chatbot als Prototyp eines adaptiven Feedbackgebers in die Klassenraumsimulation integriert. Fragestellung 1. Wie genau diagnostizieren Biologie-Lehramtsstudierende die Antworten und welche Schwierigkeiten lassen sich bei der Diagnose feststellen? 2. Welche Personenmerkmale der Studierenden zeigen einen Einfluss auf die Diagnosekompetenz? 3. Inwiefern wird der Chatbot als Unterstützungstool verwendet? Methode In einer explorativen online durchgeführten Interventionsstudie mit dem SKRBio einschließlich Pre- und Posttest-Befragung wurde die Diagnosekompetenz von 86 Biologie-Lehramtsstudierenden (77 % weiblich, 52 % im Masterstudium) gemessen. Zudem wurden Kontrollvariablen (z. B. Fachwissen, Motivation, Lernstrategien) in den Pre- und Posttest-Fragebögen erhoben. Ergebnisse & Diskussion Die Studierenden konnten 48 % der Antworten (N = 2519) der korrekten Niveaustufe zuordnen, allerdings identifizierten sie in nur 28 % der Antworten alle Aspekte des Experimentierens korrekt. Dabei zeigte sich eine signifikante Beziehung zwischen der Diagnose und der zugrundeliegenden Niveaustufe: X2 (4, n = 2519) = 195.91, p < .001. Bei der Identifikation der Aspekte des Experimentierens scheint besonders die korrekte Verwendung der abhängigen und unabhängigen Variable Schwierigkeiten zu bereiten. Hinsichtlich der Niveaustufen wurden die zweite und dritte Niveaustufe seltener korrekt diagnostiziert als die übrigen Niveaustufen. Korrelationsanalysen zeigten, dass das Fachwissen (rs = .328, p < .005), die persönlichen Lernstrategien (rs = .253, p < .019), sowie das Selbstkonzept (rs = .214, p < .048) leicht positiv mit der Diagnosekompetenz korrelierten. Der integrierte Chatbot wurde von 55 Teilnehmenden für mindestens eine Anfrage genutzt. Die meisten Fragen bezogen sich auf die abhängige (47 Anfragen) oder unabhängige (36 Anfragen) Variable sowie auf das Kompetenzmodell (57 Anfragen). Die Nutzung des Chatbots stützt die Vermutung, dass die Identifikation der abhängigen und unabhängigen Variable in den Schülerantworten eine Herausforderung für Biologie-Lehramtsstudierende darstellt. Obgleich die Fokussierung auf die Diagnose einzelner Antworten eine Limitation gegenüber einem komplexen Unterrichtsgespräch darstellt, bietet der SKRBio dennoch die Möglichkeit, diagnostisches Handeln in einer simulierten Unterrichtssequenz anzuwenden und zu messen. Insbesondere die Zweiteilung der Diagnosen im SKRBio in Aspekte und Niveaustufen erweist sich dabei als gewinnbringend in Hinblick auf eine differenzierte Messung der Diagnosekompetenz von Studierenden. Messung von und Beziehungen zwischen einzelnen Indikatoren der diagnostischen Kompetenz angehender Mathematiklehrkräfte Hintergrund Adaptive unterrichtliche Entscheidungen können nur dann erfolgen, wenn Lehrkräfte die Bedarfe ihrer Schüler:innen akkurat einschätzen können (van de Pol et al., 2010). Der Erwerb diagnostischer Kompetenz ist daher bereits Ziel der hochschulischen Lehrkräfteausbildung (Kultusministerkonferenz, 2022). Heitzmann et al. (2019) verstehen unter dem Begriff Diagnostizieren das zielgerichtete Sammeln und Integrieren von Informationen zum Treffen professioneller Entscheidungen. Modelle diagnostischer Kompetenz nehmen an, dass professionelles Wissen diagnostischer Kompetenz als wesentliche kognitive Ressource zugrunde liegt, dessen Wirkung durch motivationale Ressourcen moderiert werden kann (Herppich et al., 2018). In der bisherigen Forschung wurde die diagnostische Akkuratheit als handlungsnahes Leistungsmaß für Diagnosekompetenz verwendet (Behrmann & Souvignier, 2013; Südkamp et al., 2012). Herppich et al. (2018) schlagen vor, auch Indikatoren des diagnostischen Prozesses, der zu dieser Leistung geführt hat, zu berücksichtigen und Beziehungen zwischen individuellen Ressourcen, diagnostischen Prozessen und diagnostischer Akkuratheit zu untersuchen. Als Teil der Evidenzgenerierung im diagnostischen Prozess stellt sich die Frage, inwiefern angehende Lehrkräfte Aufgaben wählen, die das Potential haben, diagnostische Informationen zu liefern (van den Kieboom et al., 2014). Fragestellung 1. Welche Zusammenhänge zeigt das professionelle Wissen angehender Mathematiklehrkräfte zu handlungsnahen Indikatoren des diagnostischen Prozesses und der diagnostischen Leistung? 2. Inwiefern moderiert individuelles Interesse die Zusammenhänge zwischen Wissen und den genannten handlungsnahen Indikatoren? Methode Um Indikatoren diagnostischer Kompetenz handlungsnah zu erfassen, wurde eine Rollenspielsimulation diagnostischer Einzelinterviews entwickelt, in der Mathematiklehramtsstudierende als Lehrkraft den Lernstand eine:r Schüler:in (gespielt von eine:r geschulten Mitarbeiter:in) in der Dezimalbruchrechnung diagnostizieren. Die Studierenden wählen dazu Aufgaben aus einem vorgegebenen Aufgabenset und beobachten die Aufgabenbearbeitung. Nach circa 30 Minuten Interview bewerten sie den Lernstand in neun Einzelfacetten der Dezimalbruchrechnung („sicher beherrscht“, „nicht sicher beherrscht“, „keine Diagnose möglich“). Als Indikatoren für den diagnostischen Prozess wurde der Anteil der Aufgaben berechnet, die hohes diagnostisches Potential haben bzw. neue Informationen über vorher beobachtete Antworten hinaus liefern. Aus der diagnostischen Leistung wurde die Akkuratheit der Diagnose als Indikator der diagnostischen Kompetenz untersucht. Weiterhin wurde das fachliche und fachdidaktische Wissen mit Paper-Pencil-Tests gemessen. Als motivationale Ressourcen wurden das Interesse an Diagnostik und an Mathematikdidaktik mit etablierten Skalen (Rotgans & Schmidt, 2011) erhoben. An der Studie nahmen N = 63 Mathematiklehramtsstudierende teil, die nacheinander zwei von vier randomisiert zugeteilten Schülerprofilen diagnostizierten. Die statistische Auswertung erfolgte aufgrund der genesteten Struktur der Daten mit linearen Mischmodellen. Ergebnisse Für die Auswahl der Aufgaben zeigte sich, dass im zweiten Interview signifikant mehr Aufgaben mit hohem diagnostischem Potential ausgewählt wurden (M=7.86) als im ersten Interview (M=6.35, F(1;59.25)=15.00; p<.001). Eine signifikante Anpassung der Aufgabenauswahl auf Basis vorheriger Antworten im Laufe eines Interviews konnte nicht beobachtet werden. Im Mittel erreichten die Teilnehmenden eine Akkuratheit von 0.67 (SD=0.15; min=0.22; max=1.00); signifikante Unterschiede zwischen den beiden Interviews wurden nicht beobachtet. Es zeigten sich signifikante Zusammenhänge zwischen dem Fachwissen und Aufgabenauswahl (B=0.030; F(1;59.46)=5.13; p=.027) und Akkuratheit (B=0.031; F(1;59.10)=5.30; p=.025), jedoch nicht für das fachdidaktische Wissen oder das Interesse. Signifikante Interaktionseffekte zwischen Fachwissen bzw. fachdidaktischem Wissen und Interesse zeigten sich sowohl für die Aufgabenauswahl als auch für die Akkuratheit. Diskussion Die positiven Zusammenhänge weisen darauf hin, dass sich diagnostische Kompetenz sowohl in Ressourcen, Prozessmaßen wie auch Leistungsmaßen zeigt. Sie erweitern Resultate von van den Kieboom et al. (2014) um die Betrachtung diagnostischer Prozesse. Die Rolle fachdidaktischen Wissens über Fachwissen hinaus sollte in zukünftigen Studien mit größerer statistischer Power ebenso weiter untersucht werden wie die Wirkkette von Ressourcen über Prozessmaße hin zu Leistungsmaßen. Die beobachteten Interaktionseffekte weisen darauf hin, dass Wissen vor allem dann für eine handlungsnahe Anwendung aktiviert wird, wenn günstige motivationale Voraussetzungen vorliegen (Herppich et al., 2018). Von Interesse wäre weiterhin eine breitere Erhebung von Prozess- und Leistungsmaßen, z.B. in Bezug auf die Nutzung professionellen Wissens während des Interviews in Notizen und schriftlichen Diagnoseberichten. |
15:20 - 17:00 | 3-05: Messung und Förderung schriftsprachlicher Fähigkeiten Ort: H01 |
|
Symposium
Messung und Förderung schriftsprachlicher Fähigkeiten Schriftsprachliche Fähigkeiten sind von zentraler Bedeutung für den Bildungserfolg und spielen eine Schlüsselrolle in zahlreichen gesellschaftlichen Bereichen. Die Entwicklung dieser Fähigkeiten sowie ihre Messung sind hoch relevante Forschungsfelder der empirischen Bildungsforschung, das von verschiedenen Fachgebieten in fruchtbarem Austausch intensiv untersucht wird. Angesichts der Vielfalt der Anwendungsbereiche von Sprache, unterschiedlicher Textformen, der komplexen Natur sowohl rezeptiver als auch produktiver Fähigkeiten und der Berücksichtigung verschiedener Sprachen (Muttersprachen, Fremdsprachen und Unterrichtssprachen) bleibt dieses Forschungsfeld trotz langjähriger Untersuchungen dynamisch und aktiv. Das Symposium präsentiert aktuelle Forschungsergebnisse zur Messung und Förderung schriftsprachlicher Fähigkeiten aus verschiedenen am Feld beteiligten Fächern (Sprachdidaktik, Erziehungswissenschaften, Psychologie und Computerlinguistik). Es werden schriftsprachliche Fähigkeiten in Deutsch als Unterrichtssprache, Englisch als Fremdsprache und in nicht-deutschen Herkunftssprachen untersucht. Die Fragestellungen reichen von der grundsätzlichen Konzeptualisierung der Kompetenzkonstrukten über verschiedene Messmethoden bis zur Förderung der sprachlichen Entwicklung. Der erste Beitrag primär konzeptionelle Beitrag befasst sich mit der grundsätzlichen Definition (schrift-) sprachlicher Fähigkeiten und ihrer Messung am Beispiel der 2022 weiterentwickelte KMK-Bildungsstandards im Fach Deutsch. Ein Schwerpunkt liegt hier auf Möglichkeiten und Grenzen des computerbasierten Assessments. Im zweiten Beitrag wird anhand eines computerbasierten Assessments für Englisch als Fremdsprache untersucht, welche diagnostischen Informationen aus den beim Schreiben aufgezeichneten Logdaten gewonnen werden können. Auch der dritte Beitrag behandelt die computerbasierte Erfassung von schriftsprachlichen Fähigkeiten in Englisch als Fremdsprache. Hier wird untersucht, wie eine visualisierte Annotation von Textqualität in argumentativen Essays hergestellt werden kann und wie diese diagnostisch, aber auch für Feedback zu Trainingszwecken genutzt werden kann. Der vierte Beitrag befasst sich schließlich mit mehrsprachigen Schreibfähigkeiten in Deutsch als Unterrichtssprache, nicht-deutschen Herkunftssprachen und Englisch als Fremdsprache. Es wird untersucht, inwieweit verschiedene sozio-kontextuelle Einflussfaktoren die Entwicklung dieser Fähigkeiten unterschiedlich beeinflussen. Die Ergebnisse der in den Beiträgen vorgestellten Forschung tragen zu einem besseren Verständnis der Konstrukte bei, mit denen interindividuelle Unterschiede in schriftsprachlichen Fähigkeiten beschrieben werden können. Dieses tiefere Verständnis erlaubt eine bezogen auf die Konstrukte validere Messung und eine gezieltere Förderung schriftsprachlicher Fähigkeiten. Ein abschließender Diskussionsbeitrag adressiert unter anderem Limitationen und künftigen Forschungsbedarf sowie die Entwicklungsperspektiven einer immer stärker technologiebasierten Messung sprachlicher Fähigkeiten. Beiträge des Symposiums Der Kompetenzbereich „Schreiben" in den neuen Bildungsstandards der KMK - Folgen für die Testung von Schreibfertigkeiten und Schreibkompetenzen Theoretischer Hintergrund Im Mittelpunkt dieses Beitrags stehen konzeptionelle Überlegungen zum technologiebasierten Assessment (TBA) von Schreibfertigkeiten und Schreibkompetenzen. Ausgehend von den 2022 weiterentwickelten KMK-Bildungsstandards im Fach Deutsch werden in dem Beitrag Modelle (testbarer) Schreibfertigkeiten und -kompetenzen diskutiert. Dabei spielen fachdidaktische Erwägungen u. a. zur Bildung in der digitalen Welt eine zentrale Rolle. Während nämlich handschriftlich Zeichen graphomotorisch auf physische Oberflächen (z. B. auf Papier) formiert und die Oberflächen verändert werden, werden beim digitalen Schreiben vorgeformte Zeichen (von einer Tastatur, einem Display etc.) ausgewählt, ohne dass es zu physischen Veränderungen kommt. Daraus resultieren unterschiedliche Modi des Schreibens, die sich gleichermaßen auf das „Wie“ (Schreibfertigkeiten, Schreibflüssigkeit, Schreibstrategien etc.) und auf das „Was“ (Textsorten, Kommunikationsformen etc.) beziehen. In der Forschung werden vor diesem Hintergrund Effekte berichtet, die sich auf die jeweiligen Varianten „technologiebasiert“ (TBA) und „papierbasisert“ (PBA) beziehen. Berichtet werden u. a. Moduseffekte sowie formatspezifische Leistungsunterschiede (u. a. Wagner et al. 2021). Teils lassen sich die Unterschiede sogar bis auf einzelne Lupenstellen bzw. Fehlerschwerpunkte beziehen, z. B. auf die Groß-Kleinschreibung, aber auch die Vokalkürze (u. a. Frahm 2012). Jung et al. (2021) berichten zudem über eine Zunahme des Korrekturverhaltens im Rahmen der digitalen Testungen. Vor diesem Hintergrund werden in dem konzeptionellen Beitrag Konsequenzen für die Testentwicklung im Fach Deutsch in der Primar- und der Sekundarstufe aufgezeigt und es wird aus der aktuellen Aufgabenentwicklung des IQB berichtet. Fragestellungen Welche konzeptionellen Veränderungen müssen bei der Umsetzung von Testaufgaben zur Orthografie in das TBA-Format bedacht werden? Methode Es wird anhand von Beispielen aus der aktuellen Entwicklung von Aufgaben zu den weiterentwickelten Bildungsstandards berichtet (k = 300 Aufgaben je Jahrgangsstufe), die 2026 (Primarstufe) bzw. 2027 (Sekundarstufe) normiert werden sollen. Dazu werden konzeptionelle Überlegungen zu Testaufgaben präsentiert. Die Aufgaben werden aktuell mit Lehrkräften, Fachdidaktiker*innen und Bildungsforscher*innen entwickelt. Ergebnisse und ihre Bedeutung Bereits in der Entwicklung ist absehbar, dass bestimmte Aufgabentypen (Korrekturaufgaben, Richtig-Falsch-Aufgaben, Sortieraufgaben, Begründungsaufgaben) ohne Einschränkungen in das TBA-Format überführt werden können. Gleichwohl stellen insbesondere die Korrekturaufgaben besondere Anforderungen an die digitale Umsetzung vorzunehmender Korrekturen orthografisch falscher Schreibungen. Beim Aufgabenformat der Lückensatzdiktate schließen sich weitere Studien zum Vergleich der TBA- und PBA-Formate an (N = ca. 1000 in 2024). Ergänzend soll eine Videostudie (N = 50) in 2024 hier Hinweise dazu geben, wie Schüler*innen mit der neuen Variante der Testung umgehen, in der manche Aufgabenformate im TBA-Format, Lückensatzdiktate aber auf Papier angeboten werden. Eine solche „Tablet-Papier-Hybridvariante“ scheint aus fachwissenschaftlicher und fachdidaktischer Sicht für den Gegenstand „orthografisches Schreiben“ besonders angemessen zu sein. Wie Schüler*innen aber mit dem Wechsel zwischen Handschrift und digitaler Bearbeitung umgehen, wird erst Teil dieser Studie sein. Eine Sequenzanalyse von Prozessen und Strategien bei der Bearbeitung integrierter Schreibaufgaben im English for Academic Purposes Theoretischer Hintergrund Integrierte Schreibaufgaben, insbesondere im Kontext von English for Academic Purposes (Hirvela, 2016), werden immer beliebter, um die Kombination von Verstehen (Lesen) und produktiven Fähigkeiten (Schreiben) zu bewerten (Chan, 2013). Da solche Aufgaben den koordinierten Einsatz von Fähigkeiten und Handlungen in einem begrenzten Zeitrahmen erfordern, wenden die Lernenden verschiedene Strategien an, um die Aufgabe erfolgreich zu bewältigen (Cho & Lee, 2016; Payant et al., 2019). Die Forschung zur strategischen Verarbeitung konzentriert sich hauptsächlich auf die Vielfalt der eingesetzten Strategien und Prozesse, weniger jedoch auf die Frage, wann und wo diese Strategien am effektivsten sind (Dinsmore et al., 2020). Für das integrierten Schreibens wurde diese Forschung größtenteils durch selbstberichtete Messungen und Think-Aloud-Protokolle durchgeführt. Beispielsweise zeigen die Studien von Plakans (2008, 2009a, 2009b), dass Schreibende mit höherer Kompetenz stärker mit dem Ausgangstext interagieren und mehr globale Lesestrategien anwenden, während weniger erfahrene Schreibende vermehrt lokale Lesestrategien nutzen. Mit der zunehmenden Verbreitung computerbasierter Testverfahren hat die Forschung begonnen, Prozesse und Strategien bei der Verarbeitung von Aufgaben mithilfe von Log-Daten zu untersuchen. In der Schreibforschung hat beispielsweise die Verwendung von keystrokes zur Untersuchung von Schreibprozessen und -strategien zugenommen (z. B. Larios et al., 2001; Talebinamvar & Zarrabi, 2022; Révész et al., 2022). Fragestellung Aufbauend auf bestehender Forschung zum integrierten Schreiben und den Schreibprozessen besteht das Ziel dieser Studie darin, Prozesse und Strategien des integrierten Schreibens sequenzanalytisch zu untersuchen. Insbesondere interessieren uns dabei folgende Fragen: 1) Ist es möglich, bestimmte Muster bei der Verarbeitung (Prozesse und Strategien) integrierter Schreibaufgaben zu identifizieren? 2) Wie ist die Verteilung dieser Muster in den verschiedenen integrierte Schreibaufgabentypen? 3) Wie stabil sind diese Muster innerhalb von Personen, d.h. bei der Verarbeitung von zwei Aufgaben durch denselben Teilnehmer: in? 4) Besteht ein Zusammenhang zwischen den Verhaltensmustern bei der Bearbeitung integrierter Schreibaufgaben und der Textqualität der resultierenden integrierten Schreibprodukte? Methode Insgesamt wurden vier integrierte Schreibaufgaben entwickelt, die auf wissenschaftlichen Einführungstexten aus den Bereichen Sozial- und Naturwissenschaften basieren. Zwei dieser Aufgaben erforderten von den Teilnehmenden die Erstellung einer Zusammenfassung, während es sich bei den anderen beiden um Stellungnahmen handelte. Die Ausgangstexte hatten jeweils etwa 1000 Wörter, und die erwartete Länge des schriftlichen Produkts lag zwischen 300 und 350 Wörtern. Die Untersuchung umfasste eine Stichprobe von 379 Abiturient: innen und Studierenden in englischsprachigen Studiengängen. Jede/r Teilnehmende bearbeitete online eine oder zwei der integrierten Schreibaufgaben, die zufällig zugeteilt wurden. Die 601 verfassten Textprodukte wurden anschließend von sechs geschulten Bewertenden anhand einer fünfstufigen Bewertungsskala anhand von neun Analysekriterien bewertet (z.B. Verwendung des Ausgangtextes, Diskurssynthese, sprachlichen Qualität). Um die Sequenzen von Prozessen und Strategien zu analysieren, extrahierten wir die Log-Daten der Aufgabenverarbeitung. Diese Log-Daten wurden als Zustände definiert, die als relevante/r Prozess oder Strategie betrachtet werden (z.B. Ausgangstext scrollen, Hervorheben, Notizen machen, flüssiges Schreiben, Bearbeiten des Geschriebenes, Pause). Anschließend führten wir die Sequenzanalysen mit dem R-Paket TraMineR (Gabadinho et al., 2011) durch, identifizierten Cluster und führten deskriptive sowie Varianzanalysen durch. Ergebnisse und ihre Bedeutung Die Analysen ergaben vier Muster bei der Verarbeitung von integrierten Schreibaufgaben: das „schnelle“ Muster, das „strategische“, das „Notizen-“ und das „geringe Interaktionsmuster“. Das „schnelle“ Muster erwies sich als am häufigsten angewendet, während das „Notizenmuster“ weniger häufig vorkam. Hinsichtlich der Stabilität der Muster in zwei integrierten Schreibaufgaben, die von demselben Teilnehmer durchgeführt wurden, fanden wir eine relativ hohe Assoziation zwischen den Mustern der ersten und der zweiten Aufgabe. Es gab jedoch eine Tendenz zum Wechsel auf das „schnelle“ Muster in der zweiten Aufgabe. Schließlich wiesen Aufgaben, die ein „strategisches“ Muster aufwiesen, signifikant höhere Textqualität auf im Vergleich zu Aufgaben, die ein „geringes Interaktionsmuster“ zeigten. Die Ergebnisse werden im Hinblick auf eine mögliche diagnostische Nutzung und auf Implikationen für die Anwendung in der Lehre diskutiert. Automatisierte Annotation von Textmerkmalen zu Beurteilungs- und Trainingszwecken Theoretischer Hintergrund Schreiben in der Fremdsprache Englisch gehört zu den zentralen Bildungszielen der gymnasialen Oberstufe und ist relevant für Studierfähigkeit und employability in einer zunehmend globalisierten Welt. Insbesondere das argumentative Schreiben nimmt dabei einen hohen Stellenwert ein. Es kann als Fähigkeit verstanden werden, die eigene Meinung zu einem Thema adressatenspezifisch zu strukturieren und mittels grammatischer und lexikalischer Mittel differenziert darzustellen, sodass Leser*innen wichtige Punkte erkennen und erinnern können (CEFR, 2001). In der Forschungsgruppe des Erstautors wurde in den letzten Jahren eine umfassende Analyse eines authentischen Korpus von english argumentative essays von Schüler*innen aus dem 11. Schuljahr zu zwei Schreibprompts aus dem TOEFL-Test vorgenommen („independent writing“). In der vorliegenden Studie wurden aus demselben Sample eine Gruppe von Texten vertieft analysiert. Die Annotationen von menschlichen Ratern zu zentralen Aspekten der Textqualität werden mit Hilfe von Algorithmen des natural language processing (Deane, 2013) vorhergesagt und hieraus Visualsierungen von Textqualitäten in den Schülertexten erstellt. Entsprechend „visualisierte“ Texte können in der Unterrichtspraxis wie auch der Forschung zu verschiedenen Zwecken verwendet werden. Eine erste Anwendungsmöglichkeit ist automatisiertes Feedback: Durch die automatisierte Annotation erhalten die Lernenden „live“ Rückmeldungen zu den Qualitäten ihrer Texte und können diese bei der Texterstellung nutzen. Eine zweite Anwendungsmöglichkeit ist das Training von diagnostischen Kompetenzen von Lehrpersonen (Coldarci, 1986). Die Visualisierungen können Lehrpersonen helfen, bestimmte Aspekte von Textqualität einfacher und genauer zu beurteilen. Auf diese Anwendung fokussiert der vorliegende Vortrag. Fragestellung Wie lassen authentische Schülertexte aus dem 11. Schuljahr (english argumentative essays), bei denen bestimmte Textmerkmale automatisch visualisiert sind, für das Training der diagnostischen Kompetenzen von Lehrpersonen nutzen? Methode Diese Studie basiert auf einem Korpus von N = 2289 Texten von Schülerinnen und Schülern aus dem 11. Schuljahr zu zwei Schreibprompts aus dem TOEFL Test („independent writing“; Rupp et al., 2019). Aus diesem Korpus wurden 100 Texte randomisiert ausgewählt und von Human Ratern vertieft analysiert. Im Beitrag werden zwei Textaspekte vorgestellt, nämlich „spelling“ und „argumentation quality“. Bei „spelling“ werden die Rechtschreibefehler in einem Text direkt von einer Software annotiert und danach im Text visualisiert. Durch menschliche Rater erfolgte danach ein „debugging“, wobei der Bereich der Rechtschreibung abgetrennt wurde von den Ebene Grammatik und Wortschatzqualität. Im Bereich „arumentation quality“ erfolgte ein Rating der Texte an Hand zentaler Elemente der Argumentation durch menschliche Beurteiler (claim, counterclaim, rebuttal, etc.). Die Inter-Rater Übereinstimmung war gut (Kappa = .8). Diese human ratings wurden händisch in Texten visualisiert. Ebenso laufen im Moment Versuche, diese human ratings durch Natural Language Processing (Deane, 2023) automatisch vorherzusagen. Ein einer Studie zur Diagnosekompetenz werden die visualisierten Texte (angehenden) Lehrpersonen zur Beurteilung auf analytischen Beurteilungsrastern vorgelegt. Es wird untersucht, ob die Visualisierungen den Proband*innen helfen, die visualisierten Texte gegenüber einem Benchmark Rating genauer zu beurteilen. Dabei wird also der Einfluss von Textvisualisierungen auf teacher judgment accuracy (Coladarci, 1986) untersucht. Als Versuchsgruppe dient eine Gruppe von Probandinnen und Probanden, welche die Texte ohne Visualisierungen beurteilen. Ergebnisse und ihre Bedeutung Datenerhebungen zur Studie „Visualisierung der Rechtschreibung“ beginnen im Oktober 2023, sodass in dem Beitrag erste Ergebnisse vorgestellt werden können (N = 100 Teilnehmer*innen). Wir erwarten, dass die Visualisierung von Aspekten der Rechtschreibung Lehrpersonen hilft, sprachliche Aspekte der Texte einfacher und genauer zu beurteilen. Gleichzeitig wird geprüft, ob diese Visualisierungen zu Halo-Effekten führen. Dies könnte z.B. bedeuten, dass bei vielen Rechtschreibefehlern auch negativere Bewertungen der Argumentation oder dem Inhalt der Texte entstehen. Die hier vorgestellten empirischen Studien können einen Einblick geben, wie moderne Techniken der (automatisierten) Textannotation Lehrpersonen bei ihrer Arbeit unterstützen können, z.B. durch Training ihrer diagnostischen Fähigkeiten. Sie können aber auch auf problematische Aspekte aufmerksam machen, z.B. Verzerrungen durch zu starke Aufmerksamkeit auf ein Merkmal. Diese Aspekte werden in dem Beitrag kritisch beleuchtet. Sozio-kontextuelle Einflussfaktoren auf mehrsprachige Schreibfähigkeiten und -praktiken Theoretischer Hintergrund Unsere Studie untersucht die Auswirkungen sozio-kontextueller Einflussfaktoren auf die Entwicklung mehrsprachiger Schreibfähigkeiten und -praktiken bei Sekundarschülern in Deutschland. Einem humankapitaltheoretischen Ansatz folgend, verstehen wir Effekte der sozialen Herkunft auf das Erlernen und die Praxis des Schreibens in mehreren Sprachen als Zusammenspiel von elterlichen Investitionen in das Humankapital ihrer Kinder sowie der Investitionen der Jugendlichen in ihr eigenes Humankapital. Der handlungstheoretische Investitionsmechanismus besteht dabei aus drei Elementen: der Motivation für Bildungsinvestitionen, dem Zugang zu Bildungsressourcen in Lernkontexten und der Effizienz des Lernprozesses (z. B. Chiswick & Miller, 1995; Esser, 2006; Schnoor, 2019). Die wachsende Anzahl von Forschungsarbeiten zur Entwicklung mehrsprachigen Schreibens bei Jugendlichen liefert Hinweise auf die vernetzte Natur von mehrsprachigen Schreibfähigkeiten innerhalb mehrsprachiger Repertoires (z.B., Schnoor & Usanova, 2023; Schoonen et al., 2011; Riehl, 2021). Allerdings ist wenig über den Einfluss sozio-kontextueller Faktoren auf die Entwicklung komplexer mehrsprachiger Schreibrepertoires bekannt, insbesondere bei Migrantenjugendlichen der zweiten Generation, die ihre Bildungskarrieren in Deutschland verbracht haben (Böhmer, 2015; Usanova, 2019). Methode Forschungsmethodisch muss man, um die Komplexität sozio-kontextuelle Einflüsse auf mehrsprachige Schreibfähigkeiten und -praktiken abbilden zu können, das gesamte mehrsprachige Schreibrepertoire der Jugendlichen berücksichtigen. Wir nutzen hierzu Daten der Längsschnittstudie "Mehrsprachigkeitsentwicklung im Zeitverlauf (MEZ)" (Gogolin et al., 2017), die die Entwicklung von Mehrsprachigkeit und deren Einflussfaktoren bei Sekundarschüler:innen mit und ohne Migrationshintergrund in Deutschland untersucht hat. Für unsere Analyse nutzen wir ein longitudinales Sample von lebensweltlich mehrsprachigen Jugendlichen mit deutsch-russichem (n = 996 Beobachtungen) oder deutsch-türkischem (n = 1832 Beobachtungen) Sprachhintergrund. Wir nutzen Testdaten zur Schreibfähigkeit in Deutsch (Mehrheitssprache), Russisch oder Türkisch (Herkunftssprache) und Englisch (erste Fremdsprache) sowie Fragebogendaten zu Schreibraktiken und Merkmalen der sozialen Herkunft. Zur statistischen Modellierung des oben genannten Investitionsmechanismus schätzen wir ein Fixed-Effects-Panelpfadmodell in Mplus. Die gewählte Art der Modellierung hat zwei zentrale Vorteile: Einerseits, erlaubt der pfadanalytische Ansatz, Effekte mehrerer unabhängigen Variablen (soziale Herkunft) auf mehrere abhängige Variablen (Schreibfähigkeiten, Schreibpraxen in Deutsch Herkunftssprache und Englisch) simultan zu schätzen. Andererseits ermöglicht die Panelstruktur der Daten die Bereinigung der geschätzten Pfadkoeffizienten um unbeobachtete Heterogenität, was, bei der Mannigfaltigkeit möglicher Einflussfaktoren auf mehrsprachige Schreibfähigkeit und -praktiken, die Interpretation der Ergebnisse erheblich erleichtert. Ergebnisse und ihre Bedeutung Unsere Ergebnisse zeigen, dass im Vergleich zum Deutschen die Schreibfähigkeiten und -praktiken in der Herkunftssprache und Englisch stärker von sozialen Kontextfaktoren beeinflusst werden. Darüber hinaus spielen die einzelnen sozialen Kontextfaktoren sehr unterschiedlich Rollen, je nachdem, ob man auf ihre Wirkung auf Schreibfähigkeiten oder -praxen betrachtet. |
Datum: Dienstag, 19.03.2024 | |
10:30 - 12:10 | 4-05: Lernen in digitalen Umgebungen – Modellierung, Messung und Förderung der Kompetenzen von Studierenden im Umgang mit Online-Informationen Ort: H01 |
|
Symposium
Lernen in digitalen Umgebungen – Modellierung, Messung und Förderung der Kompetenzen von Studierenden im Umgang mit Online-Informationen Studierende nutzen zunehmend Online-Informationen zum Lernen im Studium (Maurer et al., 2020). Die Nutzung digitaler Lernumgebungen und -inhalte nimmt stetig zu und gewinnt sowohl mittels etablierter Lernplattformen aber auch innerhalb kaum regulierter Informationsräume des offenen Internets immer stärker an Bedeutung. Die gezielte Suche, Auswahl, Bewertung und Integration von Online-Informationen für den eigenen Wissenserwerb erfordert jedoch besondere Fähigkeiten. Insbesondere das erfolgreiche Lernen mit dem Internet ist aufgrund der Überfülle von algorithmisch vorselektierten, vorwiegend unverifizierten, didaktisch kaum aufbereiteten und teilweise inkorrekten Informationen voraussetzungsreich (Wineburg et al., 2022). Während die Forschung zum Lernen in moderierten digitalen Umgebungen gerade nach der Pandemie zunahm, ist das Lernverhalten von Nutzer:innen in der offenen Internet-Informationslandschaft noch wenig erforscht (Osborne et al., 2022). Dies umfasst insbesondere die mangelnde Forschung zur Entwicklung und Förderung kritischer Fähigkeiten, die einen erfolgreichen Wissenserwerb auch in Selbstlernsettings sicherstellen (Wissenschaftsrat, 2022). In diesem Symposium werden aktuelle nationale und internationale Forschungsarbeiten zur theoretisch-konzeptuellen Modellierung und validen Messung der Fähigkeiten zum kritischen Umgang mit Online-Informationen und ihrer Entwicklung bei Hochschulstudierenden vorgestellt und kritisch diskutiert. Die Studien umfassen die Analysen der genutzten Informationsquellen und Inhalte bei der Lösung von fachübergreifenden Aufgaben, wie zum Klimawandel und Gesundheit. Um ein detailliertes Bild der komplexen Lernsituation im Umgang mit Online-Informationen aufzubereiten, behandeln die Beiträge jeweils unterschiedliche, sich ergänzende Perspektiven auf den Wissenserwerb in geschlossenen und offenen Internet-Informationsumgebungen. Dabei werden zum einen Studierendenfähigkeiten zum kritischen Umgang mit Online-Information bei Lösung von Aufgaben zu o.g. Alltagsthemen mittels neu entwickelter komplexer szenariobasierter Aufgaben mit freier Internetrecherche erfasst. Die spezifischen Fähigkeiten von Hochschulstudierenden im Umgang mit Online-Informationen werden im ersten Beitrag als kritisches Online-Reasoning (COR) theoretisch eingebettet, empirisch operationalisiert und erfasst. Die drei untersuchten COR-Facetten umfassen Online-Informationsbeschaffung, kritische Informationsbewertung, und evidenzbasiertes Argumentieren und Synthetisieren der Informationen. Ausgehend von der theoretisch-konzeptuellen Grundlage wird im Beitrag die Entwicklung innovativer Aufgabenformate vorgestellt, die freie Internetrecherche ermöglichen. Die Datengrundlage bilden die bereits abgeschlossene Pilotierungsstudie sowie die ersten Ergebnisse aus der laufenden Hauptstudie mit 1200 Studierenden bundesweit. Zum anderen werden die bei der Bearbeitung dieser COR-Aufgaben im Internet vorgefundenen und genutzten Quellen und Informationen in einer weiteren Teilstudie untersucht (genutzte Webseiten, Plattformen etc.), welche Studierende zur Lösung dieser Aufgaben verwendet haben. Die Interaktion von Lernenden mit der Internet-Informationslandschaft wird dabei mittels innovativer Verzahnung der hermeneutisch rekonstruktiven sowie narrativen Methoden untersucht. Damit werden im zweiten Beitrag Merkmale und Qualität der Online-Informationen analysiert, die die Studierenden als Quelle des Wissenserwerbs (auch bei der COR-Aufgabenbearbeitung) nutzen. Die aufgezeichneten besuchten Webseiten werden hierbei im Zusammenhang mit den Studierendenantworten zu den COR-Aufgaben untersucht – mit Fokus auf enthaltene latente Bedeutungsstrukturen und narratives Framing der genutzten Informationen und deren Manifestation in den Aufgaben-Antworten. So zeigt die Analyse z.B. auf, welche Online-Quellen und Autorinnen als „Autoritäten“ von den Studierenden zitiert bzw. als „Expertenwissen“ angesehen wurden und inwieweit Studierende die in diesen Quellen enthaltenen normativen Setzungen und Deutungen unreflektiert übernehmen und dabei zu inkorrekten Schlussfolgerungen z.B. bei Ursache-Working-Betrachtung von e-Bikes auf Gesundheit kommen. Im dritten Beitrag werden mittels eines komplexen computergestützten szenariobasierten Aufgabensettings werden besonders die (Teil-)Fähigkeiten im kritischen Denken zur Quellen- und Informationsbewertung und argumentativen Synthese erfasst. Die Studierenden verfassen dazu einen argumentativen Essay zu einer sozialen Dilemmasituation anhand einer vorgegebenen Dokumentbibliothek (geschlossener Informationspool) mit unterschiedlich verlässlichen und relevanten Quellen (mit kontrollierten Pro- und Contra-Argumenten). Hierbei werden insbesondere argumentationsrelevante Fähigkeiten wie Ausgewogenheit und kritische Einordnung der Informationen bewertet. In der hier vorgestellten längsschnittlichen Interventionsstudie über zwei Semester werden signifikante Verbesserungen bei Lösung der Aufgaben aus diesem Assessmenttool berichtet, wobei mit drei zunehmend intensiveren Interventionen auch jeweils die Performanz der Studierenden steigt. Abschließend wird im Diskussionsbeitrag der präsentierte Forschungstand zur Erfassung der Kompetenzen von Studierenden im Umgang mit Online-Informationen aus der Perspektive der allgemeinen Hochschul-Kompetenzdiagnostik kritisch betrachtet. Beiträge des Symposiums Erfassung der kritischen Informationsnutzung im Internet durch interaktive computerbasierte Aufgaben Theoretischer Hintergrund Das Internet ist für Studierende eine essentielle Informationsquelle zu studienrelevanten Themen (Maurer et al., 2020; Autoren, 2021). Dabei stehen Studierende vor besonderen Herausforderungen, wenn sie das Internet als Wissensressource nutzen. Studierende benötigen nicht nur die Fähigkeit, das Internet strategisch nach hochqualitativen Quellen und Informationen zu durchsuchen, sondern auch in der Lage sein, Suchergebnisse kritisch zu evaluieren und verlässliche Quellen zu identifizieren. Die Informationen, die in der Regel aus verschiedenen Quellen stammen, müssen inhaltlich-argumentativ reflektiert, verknüpft und schließlich zur Beantwortung spezifischer Fragen, wie der Lösung von Studienaufgaben, effektiv angewendet werden können. Die Evaluierung der Relevanz, Glaubwürdigkeit und Vollständigkeit der gefundenen Informationen ist dabei von zentraler Bedeutung. Die allgemeine Fähigkeit hierzu, einschließlich der Informationsbeschaffung in Online-Umgebungen, der kritischen Informationsbewertung sowie der Argumentation und Synthese, wird als Generic Critical Online Reasoning (GEN-COR, Molerov et al., 2020) bezeichnet. In Abgrenzung zu Domain-Specific Critical Online Reasoning (DOM-COR), das sich auf den Umgang mit Informationen innerhalb spezifischer Studienfächer bezieht, erfordert GEN-COR kein fachspezifisches Wissen. Fragestellung Um GEN-COR mit den drei Facetten „Informationsbeschaffung“, „Bewertung“ und „Synthese“ valide erfassen zu können, ist ein hohes Maß an Interaktivität in einer authentischen Aufgabenumgebung erforderlich (Molerov et al., 2020; Nagel et al., 2020). Im Teilprojekt einer DFG-Forschungsgruppe [anonymisiert] haben wir daher komplexe szenarienbasierte Aufgaben zur Messung von GEN-COR entwickelt, um das Verhalten von Hochschulstudierenden bei der Informationsnutzung in realen Internet-Umgebungen zu erfassen. Des Weiteren werden in der Studie zusätzliche Tests zum Leseverständnis und Intelligenz eingesetzt, um auch die Beziehung zwischen GEN-COR und den zugrundeliegenden kognitiven Fähigkeiten vertieft zu untersuchen. Methode Die Studie begleitet Hochschulstudierende aus vier Fachdomänen (Medizin, Ökonomie, Soziologie und Physik) während ihrer ersten drei Jahre an der Universität, um die langfristige Entwicklung von COR-Fähigkeiten während des Studiums zu untersuchen und wichtige individuellen und kontextuellen Prädiktoren zu identifizieren. Zudem ermöglichen weitere entwickelte DOM-COR-Aufgaben, die domänenspezifisches Wissen in den o.g. Fächern erfordern, die Zusammenhänge zwischen den Leistungen in den generischen und domänenspezifischen COR-Aufgaben zu untersuchen. Die entwickelten GEN-COR-Aufgaben greifen allgemeine bzw. alltägliche Informationsprobleme auf, die kein spezifisches Fachwissen erfordern. Beispielsweise werden die Studierenden mit Fragen zum Recycling bestimmter Abfallprodukte oder zu möglichen Gesundheitsrisiken von Wohnortbedingungen konfrontiert, zu denen sie im freien Internet recherchieren und anschließend ein kritisches Statement mit Pro und Contra Argumenten aus den gefundenen Evidenzen zu den Fragen verfassen sollen. Zudem sollen auch recherchierte Quellen durch die Studierenden in ihrer Qualität (z.B. Zuverlässigkeit) beurteilt werden. Neben schriftlichen Antworten werden auch Verhaltensdaten in vivo erfasst, wie verwendete Suchbegriffe, aufgesuchte Internetseiten und Scrollbewegungen, um relevante Aspekte des COR-Aufgabenbearbeitungsprozesses zu analysieren. Hierzu zählen beispielsweise die Effizienz der Suchstrategien und die Einbeziehung zusätzlicher Informationen zur Verifizierung bei der Beurteilung von Quellen. Ergebnisse In einer ersten Pilotierung der vier neu entwickelten Aufgaben mit Hochschulstudierenden (N=16) wurde im Rahmen einer qualitativen Auswertung eine beachtliche Heterogenität in den Aufgabenleistungen der Studierenden festgestellt. Sowohl anhand der Analyse der Logdaten zum Vorgehen bei der Aufgabenbearbeitung und den Suchstrategien als auch in der inhaltlichen Qualität der schriftlichen Antworten zu den Aufgaben ließen sich deutliche Unterschiede bei High- versus Low-Performern erkennen. Die Aufgaben sind somit geeignet, um theoretisch erwartete unterschiedliche Kompetenzniveaus im Bereich GEN-COR abbilden zu können. In der aktuell laufenden Hauptstudie werden die Aufgaben einer größeren Stichprobe von Studierenden (N=1200) aus den vier Fachdomänen vorgelegt. Auf Basis dieser Stichprobe werden im Symposium neben den qualitativen Pilotierungsergebnissen erste quantitative Ergebnisse zur Interrater-Reliabilität bei der Leistungsbeurteilung, der dimensionalen Struktur der erfassten Leistungen sowie der Skalen- und Itemeigenschaften vorgestellt. Die Ergebnisse werden im Hinblick auf ihre Implikationen für das längsschnittliche COR-Assessment und die Erfassung der Entwicklung von COR-Kompetenzen im Studiumsverlauf diskutiert. Zum kritischen Umgang Studierender mit Internetinformationen – Methodologische Potentiale hermeneutisch-rekonstruktiver und narrativer Analysen in digitalen Lernumgebungen Theoretischer Hintergrund/Fragestellung: Studierende unterschiedlicher Studienrichtungen nutzen zum Lernen Informationen im Internet, die in narrative Framings und latente Sinngehalte eingebettet sind. Im Teilprojekt einer DFG-Forschungsgruppe [anonymisiert] untersuchen wir, wie Studierende der Medizin, der Ökonomie und des Lehramts mit solchen Frames bei der Auswahl und Nutzung der Informationen für die Lösung von Internet-basierten Aufgaben umgehen. Dabei nehmen wir an, dass der „Sinn digital[en] sozialen Handelns […] in der Relationierung von Ding und Mensch in je spezifischen Situationen“ liegt, die sich wiederum „als Repräsentanten einer allgemeinen Situiertheit jeden sozialen Handelns deuten“ lassen (Wolf & Thiersch, 2023, S.68). Sowohl die Quellen-Recherche der Studierenden als auch die Textproduktion (Aufgabenantworten) werden als soziale Praxis betrachtet (Macgilchrist et al. 2023), die sich situativ vollziehend entlang der genannten Daten hermeneutisch rekonstruiert und interpretiert wird. Methode: Hierzu setzen wir ein neuartiges methodengemischtes Studiendesign ein und kombinieren die methodischen Zugänge der sequentiell vorgehenden rekonstruktiven Hermeneutik (Oevermann), die die Regelhaftigkeit von Handeln fokussiert (Dickel/Neumann 2021) und die narrative Analyse (Autoren, 2020), mit besonderer Sensibilität für sprachliche Merkmale (z.B. Methapern). Die Studierenden der unterschiedlichen Studiengänge werden gebeten, sogenannte GEN-COR-Aufgaben zu alltäglichen Themen (z.B. zur Gesundheitsförderung von E-Bikes) sowie domänenspezifische DOM-COR-Aufgaben (z.B. zur Start-Up-Gründung, in der Domäne Wirtschaft) zu lösen und dazu zuverlässige Internetquellen zu recherchieren (s. Beitrag 1). Anschließend untersuchen wir rekonstruktiv hermeneutisch und narrativ die Situation und, bezogen auf den gesamten Prozess der Aufgabenlösung, inwieweit die Studierenden Framings sowie latente bzw. normative Deutungen erkennen, die in den von ihnen verwendeten Quellen enthalten sind. Um die Entstehung studentischer Aufgabenlösungen als soziale Praxis zu untersuchen, ziehen wir die Aufgabenstellungen und alle digital erfassten Dokumente aus den individuellen Lösungsprozessen heran: verlinkte Webseiten, die besuchten bzw. genutzten Internetquellen, erstellte Antworten sowie Log-Daten (inkl. Suchbegriffe etc.), die die Denkprozesse der Studierenden in der situativen Internetumgebung dokumentieren. Anhand des multimodalen Datenkorpus arbeiten wir heraus, wie die Aufgabenlösungen situativ und interaktiv zwischen Studierenden und Internetumgebung hervorgebracht werden. Die rekonstruktive Analyse der in situ erzeugten sichtbaren Spuren, die die Studierenden beim Lösen der Aufgaben in digitalen Räumen erzeugen (wie Log-Daten, genutzte Quellen, formulierte Texte), machen ihre Informationsverarbeitungs- und Entscheidungsprozesse zur Nutzung bestimmter Quellen sichtbar, die ansonsten nicht manifest sind. Ergebnisse: Die kontrastierende Analyse von vier Fällen (Studierende des Lehramts und der Medizin) mit den je besten und schlechtesten Leistungen zu einer GEN-COR-Aufgabe rekonstruiert schrittweise die Situation und den Prozess der Auseinandersetzung von Studierenden mit Informationen in Internetumgebungen. Die Analysen der Antworten der Studierenden zeigen, dass Studierende den (latenten) Frames aus den genutzten Internet-Quellen mehr oder weniger unreflektiert folgen: So folgt z.B. der Proband ID3 den Framings, die die gesundheitliche Gefahr von E-Bikes auf bestimmte gesellschaftliche Gruppen (Ältere, Übergewichtige) hin engführen sowie weiteren normativen Setzungen und Deutungen (z.B. „Sportmuffel“). Dieses Framing aus den Quellen wird in der Antwort übernommen und nicht kritisch hinterfragt. Dies gilt auch für Bezugnahmen auf die in Quellen zitierten Experten. In den Antworten werden häufig „Experten“ wie „anerkannte Autoritäten“ zitiert und kaum hinterfragt, deren „Autorität“ bzw. „Expertise“ jedoch narrativ konstruiert ist (z.B. durch wörtliche Rede, die Nennung akademischer Titel, den Vorsitz in einer Fachorganisation). Neben solchen und anderen in den Antworten enthaltenen Ausdrucksgestalten (wie Metaphern, Sinndeutungen) zeigen die präsentierten Analysen: Inwiefern ein Selbstbezug, eine Positionierung des Subjekts und/oder ein souveräner, kritischer Standpunkt eingenommen wird; Inwiefern generische und/oder domänenspezifische (z.B. sportmedizinische) Aspekte berücksichtigt und kontextualisiert werden; Inwiefern von Studierenden als zuverlässig eingestufte Quellen (z.B. auch Werbe- bzw. Verkaufsseiten eines Fahrradherstellers) sich auf die Qualität im Antwortverhalten auswirken. Indem wir hermeneutische Rekonstruktion und Narratologie verschränken, beschreiten wir neue methodische Wege und zeigen, wie der neuartige Ansatz auch für Interaktionsanalysen in digitalen universitären Lehr-Lernräumen hilfreich sein könnte. Die Entwicklung kritischen Denkens in der Hochschulbildung. Empirische Evidenz für die Wirksamkeit direkter Unterweisung Theoretischer Hintergrund/Fragestellung: Die Popularität des Konstrukts „kritisches Denken“ (critical thinking) als identifizierte Kernkompetenz an der Schnittstelle Hochschule-Beruf steht in deutlichem Kontrast zum Mangel an Klarheit in der definitorischen Abgrenzung von verwandten Konstrukten wie Problemlösen und logischem Denken. Eine Folge davon ist, dass ein grauer Markt für methodisch fragwürdige Messinstrumente entstanden ist, die angeblich das individuelle Niveau von kritischem Denken für die Personalauswahl indizieren. Das Kernproblem aller, in der Regel auf Fragebögen basierenden Tests ist ihre mangelnde Validität, wenn man zeitgemäße Definitionen zugrunde legt, die u.a. die Reflektion der Zuverlässigkeit und Relevanz von Informationsressourcen mit einschließt (Shavelson, 2007). Die Validitätsprobleme herkömmlicher Erhebungsinstrumente lassen auch sehr fraglich erscheinen, ob der von Pascarella und Terenzini (2005) sekundäranalytisch geschätzte Zuwachs von .5 SD über 4 Studienjahre, über die in die Datensynopse einbezogenen Tests hinaus verallgemeinerbar ist, zumal die Autoren selbst anerkennen, dass sie 15 Jahre zuvor den Zuwachs mit 1.0 SD angegeben hatten (Pascarella & Terenzini, 1991). Ein neuer, zukunftsweisender Ansatz zur ökologisch validen Messung kritischen Denkens bei jungen Erwachsenen stellt das „Performance Assessment“ da (Braun et al., 2020; Shavelson et al., 2019). Unser Ansatz ist hierbei, die Studierenden mit einer sozial relevanten Entscheidungsdilemma zu konfrontieren, das auf echten komplexen Problemen in der zeitgenössischen Lebenswelt basiert. Hierfür stehen ihnen sieben bis acht vorausgewählte kuratierte Dokumente zur Verfügung, die mehr oder weniger relevante und vertrauenswürdige Information enthalten. Keine andere Quelle darf herangezogen werden (geschlossener Informationspool). Das Niveau kritischen Denkens in dem ein- bis zweiseitigen Essay, den die Studierenden schreiben, leitet sich nicht aus der Entscheidung selbst ab, sondern aus der Anzahl und Bewertung der für die Entscheidung herangezogenen Argumente. Bislang wurden drei solcher Performance Assessment Aufgaben (Bryn Bower Series, BBS) entwickelt, die auch im Kontext einer Lehrveranstaltung leicht eingesetzt werden können, da die Erhebungszeit auf 50 Minuten begrenzt ist. In einer ersten Studie im Jahr 2021 mit Psychologiestudierenden im 2. bis 4. Studienjahr konnten wir mit dem BBS-Instrument im Querschnitt keinen Effekt der Studiendauer auf das Niveau kritischen Denkens nachweisen. Für die längsschnittlich über ein Semester angelegte Hauptstudie gingen wir der Frage nach, welche Interventionen kritisches Denken nachhaltig verbessern. Die Kernhypothese lautete, dass der Zuwachs um so deutlicher ausfällt, je intensiver die Intervention. Methode: Stichprobe: 144 Studierende der Psychologie in der Lehrveranstaltung Pädagogische Psychologie an einer US-amerikanischen Universität. Messung am Anfang und Ende des Semesters (Herbst 2022) mit je zwei unterschiedlichen BBS-Aufgaben. Abhängige Variablen: 4 Indikatoren kritischen Denkens (Zahl der Argumente, Ausgewogenheit der Argumente („myside-bias“), Häufigkeit von Glaubwürdigkeitsaussagen in Bezug auf Dokumente, Textqualität) Unabhängige Variable: kumulative Interventionsintensität mit vier Stufen: 1 = keine Intervention (Kontrollgruppe), 2 = eine Vorlesung zu kritischem Denken, 3 = Vorlesung plus eine Kleingruppenübung zur zweiseitigen Argumentation, 4 = Vorlesung, Gruppenübung, plus Training in der Kodierung von BBS-Aufgaben). Ergebnisse: 1. Wie aufgrund der Vorstudie erwartet, zeigte die Kontrollgruppe keinen signifikanten Lernzuwachs. 2. Der Haupteffekt Intervention (Kontrollgruppe vs. Interventions-Gruppen) ist signifikant positiv. 3. Die Interventionsgruppen unterscheiden sich signifikant monoton kumulativ voneinander, d.h. Gruppe 4 > 3 > 2 > 1. Diskussion Die Studie zeigt, dass die Qualität kritischen Denkens nicht von selbst über die Studienjahre zunimmt. Nur dann, wenn kritisches Denken explizit (d.h., curricular eingebunden) unterrichtet wird, lassen sich substanzielle Zuwächse nachweisen. Allerdings zeigt sich auch, dass die von uns entwickelten Instrumente und Auswertungsverfahren zwar gute Beurteiler-Übereinstimmung erzielen und für Aggregatdiagnostik reliabel sind (z.B. für Kohorten- oder Institutionenvergleiche), aber für die Individualdiagnostik keine angemessene Messwiederholungreliabilität erzielen. |
13:10 - 14:50 | 5-05: Besser als ihr Ruf? Vorurteile vs. Empirie in der Lehrkräfteforschung Ort: H01 |
|
Symposium
Besser als ihr Ruf? Vorurteile vs. Empirie in der Lehrkräfteforschung Die zentrale Bedeutsamkeit des Lehrkraftberufs für unsere Gesellschaft gilt als unbestritten (Burroughs et al., 2019). Konsequenterweise rücken Lehrkräfte immer wieder in den Fokus der Öffentlichkeit und Printmedien (Blömeke et al. 2005; Rothland, 2022). Das dort gezeichnete Bild von Lehrkräften ist vielfältig und reicht von Mutmaßungen über eine mangelnde Eignung und Kompetenz der Personen, die den Lehrkraftberuf ergreifen, über postulierte Charakteristiken zu ihrer Persönlichkeit, bis hin zur Annahme, Lehrkräfte wiesen eine geringere Arbeitsmotivation auf als andere Berufsgruppen (Blömeke, 2005; Rothland, 2022; Terhart, 2013). Prominent sind hierbei neben Vorurteilen über geringere fachliche Leistungsvoraussetzungen der Personen, die das Lehramtsstudium ergreifen (Rothland, 2022), insbesondere Annahmen darüber, dass praktizierende Lehrkräfte eine hohe Reform- und Innovationsresistenz aufweisen (Lomba-Portela et al., 2022), was sich etwa in der Tatsache wiederspiegle, dass insbesondere deutsche Lehrkräfte und Schulen schlecht auf die Digitalisierung vorbereitete seien (Scheiter & Gogolin, 2021). In Zeiten des Lehrkräftemangels ist zudem die Debatte um die Eignung und Professionalisierung von Seiten- und Quereinsteiger*innen prominent, denen neben ungünstigen Berufswahlmotiven geringere professionelle Kompetenz zugeschrieben wird (Sanders, 2022). Das geplante Symposium hat zum Ziel, diese Werturteile über Lehrkräfte einer empirischen Prüfung zu unterziehen. Aus der Sicht verschiedener Disziplinen werden diese Vorurteile vor dem Hintergrund empirischer Befunde beleuchtet. Alle Fragestellungen werden in repräsentativen Stichproben untersucht, wobei sowohl Vergleiche zwischen (angehenden) Lehrkräften und anderen Studierenden sowie zu anderen Berufsgruppen angestellt werden. Der erste Beitrag greift die sogenannte negative Selektionshypothese auf und prüft das Vorurteil, dass Lehramtsstudierende weniger leistungsstark sind als andere Studierende. In einer repräsentativen Stichprobe deutscher Hochschulstudierender werden Studienleistungen zwischen Personen in Lehramts- und anderen Studiengängen unter Berücksichtigung ihrer Studienfächer verglichen. Darüber hinaus wird untersucht, ob die Daten Hinweise auf einen Wechsel von Personen, die in ihrem fachwissenschaftlichen Studium verhältnismäßig schlecht abschneiden, hin zum Lehramtsstudium liefern. Der zweite Beitrag liefert empirische Ergebnisse zur Kompetenzausgestaltung von Seiten- und Quereinsteiger*innen in den Lehrkraftberuf und stellt die Frage, ob und in welchen Aspekten ihrer professionellen Kompetenz diese Personen hinter traditionell ausgebildeten Lehrkräften zurückbleiben. Hierbei werden insbesondere motivationale Aspekte und Überzeugungen in den Blick genommen, die sich als prädiktiv für eine erfolgreiche Berufsausübung erwiesen haben. Der dritte Beitrag widmet sich schließlich der Frage, ob Lehrkräfte tatsächlich weniger innovatives Verhalten zeigen als ausgewählte andere Berufsgruppen. Neben der Analyse dieser Fragestellung in einer repräsentativen Stichprobe deutscher Hochschulabsolvent*innen beleuchtet der Beitrag anhand der genutzten Längsschnittdaten auch Unterschiede in häufig postulierten personalen und beruflichen Bedingungsfaktoren des individuellen Innovationsverhaltens. Die Bündelung und gemeinsame Diskussion dieser Beiträge, soll zu einem empirisch fundierten Lehrkräftebild beitragen und prominente Vorurteile auf die Probe stellen. Der Vergleich mit relevanten Referenzgruppen und unterschiedliche methodische Zugänge sollen eine aussagekräftige Einordnung der Kompetenz, Überzeugungen und des professionellen Verhaltens von Lehrkräften in diesen Bereichen ermöglichen. Dabei stellen die Beiträge empirische Evidenz bereit, die entgegen vielfach postulierter Vorurteile in vielen Aspekten ein Bild von kompetenten und progressiven Lehrkräften zeichnen und auch die Vorurteile gegenüber Seiteneinsteiger*innen teilweise zurückweisen. Gleichzeitig zeigen die Studien Punkte auf, in denen auf Basis der Ergebnisse tatsächlich Handlungsbedarf besteht. In einer gemeinsamen Diskussion werden Implikationen dieser Befunde für das Lehrkräftebild, sowie dessen mögliche Konsequenzen als Belastungsfaktor für praktizierende Lehrkräfte und die Attraktivität des Berufes (vgl. Köller et al., 2019; Rothland, 2022) erörtert. Beiträge des Symposiums Leistungsunterschiede zwischen Lehramtsstudierenden und Studierender anderer Studiengänge Lange hielt sich die Mär von der negativen Selektionshypothese in das Lehramtsstudium. Zahlreiche Studien belegen, dass Personen, die das Lehramtsstudium wählen, sich nicht generell hinsichtlich ihrer leistungsbezogenen Eingangsmerkmale unterscheiden (Neugebauer, 2013; Osada & Schaeper, 2022; Roloff Henoch et al., 2015). Vielmehr deuten die Ergebnisse auf eine Leistungsheterogenität innerhalb des Lehramtsstudiums hin, da die leistungsbezogenen Merkmale von nicht-gymnasialen Lehramtsstudiengängen geringer ausgeprägt sind als die des gymnasialen Lehramtsstudiums oder anderen Studiengängen. Trotz der geringen empirischen Evidenz, wird in der breiten Öffentlichkeit das Lehramtsstudium immer noch als relativ einfach gesehen und das Bild, dass dieses vor allem von leistungsschwächeren Personen gewählt wird, scheint immer noch vorzuherrschen (Köller et al., 2019). Dieses Vorurteil wird zudem von Hochschuldozierenden bestätigt, die Lehramtsstudierenden weniger kompetent einschätzen als andere Studierenden im selben Kurs (Carstensen et al., 2021; Ihme & Möller, 2015). Auch wenn bekannt ist, dass die Abiturnoten nicht die Wahrscheinlichkeit einer Wahl des Lehramtsstudiums beeinflussen, weiß man wenig darüber, ob Studierende im Lehramt generell schlechter als ihr Kommiliton*innen im gleichen Fach oder in ähnlichen Fächergruppen bewertet werden. Zudem kann das allgemeine Bild des Lehramtsstudium dazu führen, dass Studierende mit unzureichenden Leistungen in ihrem Fach in das Lehramtsstudium wechseln und dort das Fach weiterstudieren, da das Lehramtsstudium vermeintlich leichter sei. Fragestellung Die folgenden Forschungsfragen sind für den Beitrag leitend: (1) Unterscheiden sich die Studienleistungen von Lehramtsstudierenden von den Leistungen anderer Studierender? und (2) Wechseln Studierende bei unzureichenden Leistungen in ein Lehramtsstudium? Bei der Beantwortung der Fragestellungen werden die Studienfächer berücksichtigt, sowie bei Lehramtsstudierenden die angestrebte Schulart, um ein differenziertes Bild zu erhalten. Methode Zur Beantwortung der Forschungsfragen werden Daten der Kohorte 5 des nationalen Bildungspanels (NEPS) analysiert. Die Ausgangsstichprobe beinhaltet 17910 Studierenden, von denen 5500 in einem Lehramtsstudiengang immaktrikuliert waren und von 2010/11 bis 2022 kontinuierlich zu ihrer Studien- und Berufssituation befragt wurden. Aufgrund von Panelmortalität und unterschiedlichen Karrierewegen, sind die Analysen zu den unterschiedlichen Zeitpunkten reduziert. Anhand von Mittelwertsvergleichen und Regressionsmodellen wird untersucht, inwiefern sich die Studienleistungen zwischen den Gruppen unterscheiden. Dabei werden zunächst nur Lehramtsstudierende und andere Studierende verglichen, um danach in weiteren Modellen zu untersuchen, ob sich mögliche Differenzen durch die Hinzunahme der Studienfächer in die Analysemodelle sowie durch die Berücksichtigung der angestrebten Schulart erklären lassen. Zusätzlich werden soziodemografische Faktoren bei den Analysen kontrolliert, die sowohl die Wahl des Studiengangs als auch die Leistungen in Schule und Studium beeinflussen. Ergebnisse Den Forschungsfragen folgend wurde zunächst getestet, inwiefern es bereits ein Jahr nach Studienbeginn Differenzen hinsichtlich der Studienleistungen zwischen Lehramtsstudierenden und anderen Studierenden gibt. Mittelwertsvergleiche zeigen, dass sich die Studienleistungen (Lehramt M=2.25; Nicht-Lehramt M=2.27; p=0.2764) nicht signifikant (α < .05) unterscheiden. Auch ein Vergleich von Studierenden im Gymnasiallehramtsstudium (M=2.27) mit Nicht-Lehramtsstudierenden (M=2.27) ergibt keine signifikanten Unterschiede hinsichtlich der Studienleistungen (p=.8759). Allerdings zeigen sich in den Regressionsmodellen, dass bei Aufnahme der jeweiligen Studienbereiche Lehramtsstudierende signifikant schlechtere Noten aufweisen als andere Studierende. Dieses Muster zeigt sich auch, wenn man gezielt Lehramtsstudierende für das Gymnasiallehramt dieser Fächer mit Nicht-Lehramtsstudierenden vergleicht. Im Datensatz konnten 36 Personen identifiziert werden, die innerhalb der ersten drei Semester in das Lehramt gewechselt sind. Die vorläufigen Analysen deuten nicht darauf hin, dass Personen, die in das Lehramtsstudium wechselten, zuvor schlechtere Studienleistungen aufwiesen als Studierende, die nicht gewechselt sind. Auf der Konferenz werden weitere Untersuchungen der Studienleistungen im späteren Verlauf des Studiums präsentiert, die zusätzlich zu den Studienbereichen einzelne Studienfächer berücksichtigen und helfen, die Befunde besser einzuordnen. Auch durch eine Differenzierung der Lehramtsstudiums nach den angestrebten Schularten soll die Robustheit des Ergebnisses geprüft werden. Die im Symposium präsentierten Ergebnisse sollen eine Diskussion zu den Fragen anregen, inwiefern das stereotypische Bild der leistungsschwachen Lehramtsstudierenden zu halten ist. Professionelle Kompetenz: Ein Vergleich von traditionell und alternativ qualifizierten Lehrkräften Dem hohen Bedarf an Lehrpersonal an allgemeinbildenden und beruflichen Schulen in Deutschland bei gleichzeitig niedriger Verfügbarkeit voll ausgebildeter Lehrkräfte begegnet die Bildungspolitik aktuell zunehmend mit einer Öffnung der beruflichen Zugangswege zum Lehrkräfteberuf (Dedering 2020; Lucksnat et al., 2022). In vielen Bundesländern ist somit der Eintritt in den Lehrkraftberuf durch sogenannte Quer- oder Seiteneinstiege möglich, d. h. ohne Abschluss eines Lehramtsstudium und/oder Lehramtsreferendariat. Dieser Öffnung des Zugangs zum Lehrkraftberuf steht die Unsicherheit gegenüber, ob die nicht-traditionell ausgebildeten Lehrkräft trotz des Fehlens wichtiger Etappen des berufsbiographischen Entwicklungsprozesses (Terhart, 2011) dennoch über hinreichend professionelle Kompetenzen verfügen, um sich im anspruchsvollen Lehrkräfteberuf bewähren zu können. Der angenommene Mangel an berufsbezogenem Wissen nährt in der Öffentlichkeit wie in Fachkreisen die Befürchtung einer niedrigeren Unterrichtsqualität von Quer- und Seiteneinsteiger*innen, auch wenn es dafür noch keine empirische Evidenz gibt (Ziegler et al., 2022, GEBF 2023). Bisherige Studien deuten auf vorhandene Unterschiede zwischen traditionell und nicht-traditionell ausgebildeten Lehrkräften, etwa hinsichtlich fachdidaktischen und erziehungswissenschaftlichen Wissens, hin (z.B. Kleickmann & Anders, 2011; Lucksnat et al., 2020, 2022). Dies ist insofern plausibel, als dass diese Kompetenzdimensionen eine gezielt wissenschaftsbasierte Auseinandersetzung mit Theorien des Lehrens und Lernens voraussetzen, um eine reflektierte Anwendung dieses professionsbezogenes Handlungswissen in der Praxis überhaupt erst zu ermöglichen (Oser, 2001; Terhart, 2003). Die Befundlage ist gleichwohl alles andere als eindeutig. Zudem wurden in jüngeren Untersuchungen oftmals gerade die Seiteneinsteiger*innen vernachlässigt oder es kann nicht hinreichend zwischen Quer- und Seiteneinsteiger*innen unterschieden werden. Daraus abgeleitet untersucht dieser Beitrag folgende Forschungsfrage: Lässt sich empirische Evidenz für das Fehlen wichtiger professioneller Kompetenzen des Lehrkräfteberufes bei Seiten- und Quereinsteigenden finden oder handelt es sich bei diesbezüglichen Befürchtungen doch um Vorurteile? Der Beitrag lenkt den Blick auf den Vergleich von Quer- und Seiteneinsteiger*innen mit traditionell ausgebildeten Lehrkräften und untersucht Unterschiede hinsichtlich ausgewählter professionsbezogener Werthaltungen und Überzeugungen (transmissive und konstruktivistische Überzeugungen, kognitiv aktivierendes Unterrichten) sowie emotionale Kompetenzaspekte (Enthusiasmus für das Unterrichten, berufliches Wohlbefinden; Baumert & Kunter, 2006; Klieme et al., 2006; Kunter & Pohlmann, 2015; Kunter et al., 2011) zu Beginn einer Lehrkraftkarriere. Auf Basis der repräsentativen Daten der NEPS-Studierendenkohorte und des zugehörigen Lehramtsstudierenden-Panels (NEPS-Netzwerk, 2023; Schaeper et al., 2023; Ortenburger et al., 2023), in denen zunehmend auch Personen identifiziert werden können, die als Quer- und Seiteneinsteiger*innen in Schulen unterrichten (n=132), wird analysiert, inwieweit sich Lehrkräfte mit unterschiedlichen, nicht-traditionellen Berufszugangswegen unterscheiden. Zur Messung der interessierenden Konstrukte wurde jeweils der erste erfasste Messzeitpunkt zum Karrierebeginn berücksichtigt, welcher aufgrund des komplexen Paneldesigns in unterschiedlichen Befragungsjahren liegen kann. Für alle Konstrukte wurde auf bewährte Instrumente zurückgegriffen. Die transmissiven und konstruktivistischen Überzeugungen wurden mit jeweils vier Items gemessen (α=.714/.761), die Skala zum kognitiv aktivierenden Unterrichten mit fünf Items erfasst (α=.751); zur Messung des Enthusiasmus für das Unterrichten wurden vier Items eingesetzt (α=.894), zur Erfassung des beruflichen Wohlbefindens kam eine Skala zur emotionalen Erschöpfung (vier Items, α=.772) und eine Skala zur beruflichen Zufriedenheit (vier Items, α=.882) zum Einsatz (für alle Skalen: s. Ortenburger et al., 2023). Zur Analyse werden Strukturgleichungsmodelle genutzt, die einen (sehr) guten Modellfit zeigen (Model „Überzeugungen“: RMSEA: .044, CFI/TLI: .941/.928, SRMR: .061; Modell „Emotionen“: RMSEA: .058, CFI/TLI: .958/.956, SRMR: .056). Es zeigt sich, dass Unterschiede nicht nur zwischen traditionell und alternativ qualifizierten Lehrkräften, sondern auch innerhalb der Gruppe der alternativ qualifizierten Lehrkräfte zu beobachten sind, was eine differenzierte Betrachtung dieser Gruppe rechtfertigt. Im Beitrag werden Anlage und Ergebnisse der Untersuchung dargestellt, Limitationen diskutiert und zukünftige Untersuchungsschritte abgeleitet. Innovativer als ihr Ruf? Ein Vergleich von Lehrkräften und anderen Hochschulabsolvent*innen Der sich beschleunigende Wandel in der Gesellschaft und unserem Bildungssystem macht die Anpassungsfähigkeit und das innovative Verhalten von Lehrkräften zu entscheidenden Faktoren für die aktuelle und zukünftige Qualität von Schulen, sowie für die Motivation und Leistung von Schüler*innen (Hosseini & Haghighi Shirazi, 2021; Paniagua & Istance, 2018). Gleichzeitig gelten Lehrkräfte oft als weniger innovativ als andere Berufsgruppen und wenig bereit, Reformen anzunehmen (Ayaita & Stürmer, 2020; Terhart, 2013). Diese Tendenz wird zum einen auf Eigenschaften der Personen, die sich für den Lehrkraftberuf entscheiden, zum anderen auf Innovationshemmnisse im Schulsystem zurückgeführt. Dabei wird angenommen, dass Merkmale des Lehrkraftberuf, etwa eine hohe Jobsicherheit und vorhersehbare Karrierewege, insbesondere für Personen mit höherer Risikoaversion und geringerer Offenheit für neue Erfahrungen attraktiv ist (Ayaita & Stürmer, 2020; Le Fevre, 2014). Gleichzeitig gelten Arbeitsplatzmerkmale der Schulen, inbesondere bürokratische Strukturen, die den Handlungsspielraum der Lehrkräfte einschränken, und geringe zeitliche Ressourcen, als Hemmnis für innovatives Verhalten (vgl. Job Demand-Resources Model, Li & Zhu, 2022). Trotz der wiederholten Diskussion dieser Thematiken fehlen empirische Studien, die diese Annahmen empirisch prüfen. Ziel dieser Studie ist es daher zu untersuchen, ob Lehrkräfte tatsächlich weniger innovatives Verhalten zeigen als Personen vergleichbarer Berufsgruppen (andere Hochschulabsolvent*innen, sowie Personen, die andere Professionen und andere Soziale Dienstleistungsberufe ausüben, Forschungsfrage 1) und ob mögliche Unterschiede durch persönliche Charakteristiken (Risikobereitschaft und Offenheit für neue Erfahrungen) oder berufliche Faktoren (Handlungsspielraum und Zeitdruck) erklärt und vermittelt werden (Forschungsfrage 2). Analysiert werden hierzu Längsschnittdaten der repräsentativen Studienstart-Kohorte des National Bildungspanels (SC5, NEPS-Netzwerk, 2022). Für unsere Fragestellungen nutzen wir Selbstberichtsdaten von 368 Lehrkräften und 1614 anderen Hochschulabsolvent*innen. Die Teilnehmenden wurden zu drei Messzeitpunkten, vor (t1) und nach (t2) dem Berufseintritt, sowie ein weiteres Jahr später (t3) mittels standardisierter Skalen (Risikobereitschaft, Dohmen et al., 2011; Offenheit, Rammstedt & John, 2007; Autonomie, Stegmann et al., 2010; Zeitdruck/innovatives Verhalten, NEPS-Netzwerk, 2022) befragt. Nach einer Prüfung der Messinvarianz zwischen den Gruppen untersuchen wir unsere Unterschiedshypothesen mittels Regressionsanalysen, um für mögliche Gendereffekte zu kontrollieren. Die Frage nach Einflussfaktoren, die mögliche Unterschiede bedingen, analysieren wir anhand mediierter Strukturgleichungsmodelle. Unsere Ergebnisse zeigen, dass Lehrkräfte entgegen unserer Erwartungen signifikant mehr innovatives Verhalten als andere Hochschulabsolvent*innen berichten (β = .51, p < .001). Über alle Gruppen hinweg sagen die Offenheit und Risikobereitschaft (t1), sowie Autonomie und Zeitdruck (t2) der Teilnehmenden ihr innovatives Verhalten (t3) vorher und erklären 58% der Gesamtvarianz (CFI=.96, RMSEA=.048, SRMR=.031). Die berufliche Autonomie erweist sich als stärkster Prädiktor (β = .72) und mediiert zusätzlich den Zusammenhang zwischen Berufszugehörigkeit und innovativem Verhalten (βind=.22). Hierbei geht die Berufsgruppenzugehörigkeit mit einer höheren beruflichen Autonomie von Lehrkräften einher, welche wiederum mit höherem innovativem Verhalten assoziiert ist. Einen Effekt persönlicher Merkmale auf die Berufsgruppenzugehörigkeit, welcher ein späteres geringeres innovatives Verhalten von Lehrkräften erklären würde, finden wir nicht. Wenn die Umsetzung von Reformen im Bildungssystem nicht oder nur langsam gelingt, werden oft Lehrkräfte dafür verantwortlich gemacht. Man sagt ihnen wenig Innovativität und Offenheit für Neues nach. Diese Annahme bestätigen unsere Daten jedoch nicht. Auch einen geringeren Handlungsspielraum für Innovationen im Lehrkraftberuf, welcher häufig als Innovationshemmnis postuliert wird, können wir in dieser Studie nicht bestätigen. Lehrkräfte berichten vielmehr ein hohes Maß beruflicher Autonomie, welches sich für das innovative Verhalten von Personen in allen Berufen als bedeutsam erweist und in unseren Modellen als einziger Prädiktor auch Unterschiede zwischen Lehrkräften und anderen Berufsgruppen erklärt. Für praktische Interventionen mit dem Ziel, das innovative Verhalten von Lehrkräften zu steigern, weisen unsere Ergebnisse somit auf die höhere Relevanz von Modifikationen der Arbeitsplatzmerkmale relativ zu einem Fokus auf die Attraktion und Selektion von Lehrpersonen mit bestimmten personalen Merkmalen hin. Differenzierte Schulform- und Berufsgruppenvergleiche sowie Limitationen und weitere Implikationen der Befunde, auch im Hinblick auf das Image des Lehrkräfteberufs, werden auf der Konferenz diskutiert. |
15:20 - 17:00 | 6-05: Kompetenzentwicklung im Spannungsfeld von Klassifikation: Einblicke in Bildungsverläufe und schulische Lernerfolge von Schüler:innen mit besonderen Unterstützungsbedarfen in inklusiven Lernsettings Ort: H01 |
|
Symposium
Kompetenzentwicklung im Spannungsfeld von Klassifikation: Einblicke in Bildungsverläufe und schulische Lernerfolge von Schüler:innen mit besonderen Unterstützungsbedarfen in inklusiven Lernsettings In Deutschland werden Schüler:innen mit sonderpädagogischen Unterstützungsbedarfen zunehmend an allgemeinen Schulen unterrichtet (Autor:innengruppe Bildungsberichterstattung 2022). Gleichzeitig wächst auch die Heterogenität der Schüler:innen aufgrund von Flucht und Migration (Henschel, Heppt & Weirich, 2023). Im Sinne eines weiten Inklusionsbegriffs lernen somit Schüler:innen mit den unterschiedlichsten persönlichen Hintergründen, Lernvoraussetzungen und Lernbedürfnissen gemeinsam, so dass Heterogenität ein grundlegendes Prinzip im schulischen Kontext darstellt (Wischer, 2019). Vor diesem Hintergrund stellt sich die Frage, inwieweit eine Klassifikation von Schüler:innen, bspw. durch die Zuerkennung eines bereichsspezifischen, sonderpädagogischen Förderbedarfs, Gruppierungsoptionen bereithält, die – neben dem Risiko potentiell diskriminierender und stigmatisierender Zuschreibungen – auch positive pädagogische Effekte ermöglichen. Kann eine kategoriale Wahrnehmung im Sinne einer Klassifikation dazu beitragen, individuell notwendige Unterstützungsbedarfe so wahrzunehmen und zu beschreiben (Mußmann, 2015), dass inklusive schulische Lerngelegenheiten gewinnbringend gestaltet werden und auf diese Weise zu einem erfolgreichen schulischen Lernen beitragen können? Die Datenbasis aller drei Beiträge stammt aus dem interdisziplinären Kooperationsprojekt INSIDE „Schulische Inklusion und Übergänge nach der Sekundarstufe I in Deutschland“, das Schüler:innen mit und ohne besondere Unterstützungsbedarfe über mehrere Messzeitpunkte hinweg von der Klassenstufe sechs bis in den Berufsübergang begleitet. Hierbei bearbeiten die Schüler:innen Fragebögen sowie Kompetenztests. Ferner werden jeweils die Schulleitungen, Lehr- und Fachkräfte sowie die Eltern der Schüler:innen befragt. Die breite Datenbasis ermöglicht sowohl längsschnittliche als auch querschnittliche Analysen im Themenfeld von Klassifikation und Kompetenzentwicklung. Beitrag 1 betrachtet die Entwicklung der Lesekompetenz der Schüler:innen und geht hierbei der Frage nach, ob Lernende, die im Rahmen einer vorschulischen Sprachstandsdiagnostik als förderbedürftig klassifiziert wurden und auch entsprechende vorschulische Sprachförderung erhalten haben, in der 6. Jahrgangsstufe eine unauffällige Entwicklung ihrer Lesekompetenz zeigen. Für das verstehende Lesen und die Lesegeschwindigkeit finden sich für diese Schüler:innen keine Kompetenzunterschiede im Vergleich zu Schüler:innen ohne vorschulische Sprachauffälligkeiten. Ein möglicher Erklärungsansatz für diesen Befund ist, dass die vorschulische Sprachförderung eine kompensatorische Wirkung entfalten konnte. Beitrag 2 fokussiert ebenfalls auf die Lesekompetenz der Schüler:innen und analysiert die Klassifikationsgenauigkeit diagnostischer Entscheidungen für diesen Bereich. Es wird untersucht, wie hoch der Anteil an Schüler:innen mit einer falsch-positiven Diagnose im Lesen ausfällt und welche Faktoren die Wahrscheinlichkeit für falsch-positive Diagnosen beeinflussen. Personenbezogene Merkmale der Schüler:innen tragen zu falsch-positiven Diagnosen weniger stark bei als Aspekte des schulischen Lernerfolgs in anderen Kompetenzbereichen. Beitrag 3 untersucht die längsschnittliche Entwicklung der mathematischen sowie der Lesekompetenz in inklusiven Lerngruppen der Jahrgangsstufen 6 und 7 und differenziert hierbei zwischen Schüler:innen mit einem besonderen Unterstützungsbedarf in den Bereichen Lernen und Sprache im Vergleich zu Lernenden ohne besondere Unterstützungsbedarfe. Die Ergebnisse dokumentieren eine große Leistungsheterogenität und Unterschiede in den domänenspezifischen Entwicklungsprofilen der drei untersuchten Gruppen. Alle drei Beiträge behandeln somit den Kompetenzerwerb von Schüler:innen mit unterschiedlichen besonderen Unterstützungsbedarfen. Die Frage der Klassifikation wird dabei in unterschiedlicher Weise adressiert. Es wird jeweils hinterfragt, an welchen Stellen und mit welchen Zielen Klassifikationen im Kontext des inklusiven schulischen Lernens sinnvoll sein und wann sie zu Fehlentscheidungen und potenziell negativen Konsequenzen führen können. Insgesamt kann Klassifikation im Kontext inklusiven Lernens sowohl informativ und in diesem Sinne nutzbringend für die gelingende, differenzierende Gestaltung schulischer Lerngelegenheiten sein als auch zu problematischen Entwicklungen beitragen, wenn diagnostische Entscheidungen durch Urteilstendenzen und Beurteilungsfehler beeinflusst werden. In der Diskussion werden die skizzierten Vor- und Nachteile von Klassifikationsentscheidungen im Kontext inklusiver Bildung auf Kompetenzentwicklungen als Indikator für erfolgreiches schulisches Lernen bezogen, das Spannungsfeld von Diagnosegüte und Verzicht auf Klassifizierung nachgezeichnet und Handlungsoptionen für die inklusive Schule abgewogen. Beiträge des Symposiums Wirkt vorschulische Sprachförderung kompensatorisch? Zur Lesekompetenz von Schüler:innen der 6. Jahrgangsstufe mit vorschulisch attestiertem Sprachförderbedarf Für die Entwicklung sprachlicher Kompetenzen sind insbesondere die ersten Lebensjahre und frühe präventive Maßnahmen von zentraler Bedeutung (vgl. Newport et al., 2001; Paul & Roth, 2011). Daher sind auch eine frühzeitige Feststellung möglicher sprachlicher Entwicklungsprobleme und eine im Bedarfsfall bereits vorschulisch einsetzende Sprachförderung dringend angezeigt. Entsprechend empfehlen die Bundesländer verschiedene Maßnahmen, um die sprachliche Entwicklung der Kinder bereits im Vorschulalter zu beobachten und im Bedarfsfall durch frühe Sprachförderung unterstützen zu können (Neugebauer & Becker-Mrotzek, 2013). Diese Maßnahmen sind jedoch heterogen und die Feststellung eines Förderbedarfs führt nicht zwingend zu qualitativ und quantitativ ausreichender vorschulischer Sprachförderung. Es ist somit fraglich, ob die vorschulische Sprachförderung die festgestellten sprachlichen Entwicklungseinschränkungen reduzieren oder sogar aufheben und somit einen kompensatorischen Effekt entfalten kann (Roßbach & Hasselhorn, 2012). Daher möchten wir der Frage nachgehen, inwieweit eine vorschulische Sprachstandsfeststellung und die als Konsequenz aus einem festgestellten Bedarf tatsächlich erfolgte Sprachförderung zu einer unauffälligen schriftsprachlichen Entwicklung, operationalisiert über das Leseverstehen und die Lesegeschwindigkeit zu Beginn der Sekundarstufe I, beitragen und in diesem Sinne kompensatorisch wirksam werden kann. Anhand der Daten der retrospektiven INSIDE-Elternbefragung, die als computergestütztes Telefoninterview (CATI) gestaltet wurde, analysieren wir die lesebezogenen Kompetenzausprägungen von Schüler:innen mit vorschulisch festgestelltem Sprachförderbedarf und daraufhin erfolgter Sprachförderung im Vergleich zur Lesekompetenz der Gesamtstichprobe. Hierfür liegen die Angaben der Eltern von 1.707 Schüler:innen der sechsten Jahrgangsstufe vor, von denen N = 229 (13 %) zum Erhebungszeitpunkt sonderpädagogische Unterstützung erhielten. Für den hier dokumentierten 1. Messzeitpunkt liegen zum Themenkomplex der vorschulischen Sprachförderung Elternangaben für N = 1.626 Schüler:innen ((Alter: M= 12,6; SD= 0,56, Geschlechterverteilung: binär; 45,6% weiblich) vor. Die Lesekompetenzen der Schüler:innen wurden mittels eines standardisierten Kompetenztests zum verstehenden Lesen auf Basis adaptierter NEPS-Aufgaben (Stegenwallner-Schütz, et. al, 2022) sowie einem Test zur Lesegeschwindigkeit (Zimmermann, et. al, 2012) erfasst. Die Kompetenzen wurden mittels IRT-Modellen skaliert und für die Lesegeschwindigkeit wurde ein Summenscore gebildet. Laut Elternangaben wurde für 40% der 1.626 Schüler:innen vor Schulbeginn in der Kita oder unabhängig von der Kita einmalig eine Sprachstandsfeststellung durchgeführt; 20% gaben an, dass dies mehrmalig erfolgt ist. Für 277 (17%) dieser Kinder wurde als Ergebnis der Sprachstandsfeststellung ein Sprachförderbedarf attestiert. 253 dieser Kinder, also weit über 90%, erhielten nach dieser Feststellung ein Sprachförderangebot und nahmen dieses wahr. Lediglich 24 Kinder in der Stichprobe erhielten nach der Feststellung der Förderbedürftigkeit keine Sprachförderung. Die sechs Jahre später gemessene Lesekompetenz dieser Schüler:innen liegt sowohl für das verstehende Lesen als auch für die Lesegeschwindigkeit exakt auf dem Niveau der INSIDE-Gesamtstichprobe zum selben Messzeitpunkt. Die wenigen Schüler:innen, die vorschulisch zwar einen Sprachförderbedarf hatten, jedoch keine Sprachförderung erhielten, zeigen im Vergleich zu den geförderten Schüler:innen eine etwas geringere Kompetenz im verstehenden Lesen (WLE: -0.5), allerdings keine geringere Kompetenz hinsichtlich der Lesegeschwindigkeit. Der Effekt im verstehenden Lesen ist aufgrund der sehr geringen Stichprobengröße statistisch nicht bedeutsam und kann nicht interpretiert werden. Der Befund, dass diejenigen Schüler:innen, die vorschulisch einen Sprachförderbedarf hatten und daraufhin Sprachförderung erhielten, sechs Jahre später unauffällige Lesekompetenzen zeigen, kann aufgrund des Studiendesigns nicht eindeutig auf die vorschulische Sprachförderung zurückgeführt werden. Dennoch ist festzuhalten, dass diese Kinder, obwohl sie vorschulisch mit ungünstigeren Voraussetzungen gestartet sind, sechs Jahre später Kompetenzprofile ähnlich der Gesamtstichprobe aufweisen. Eine mögliche Erklärung für diesen Befund ist, dass die vorschulische Sprachförderung im Sinne einer kompensatorischen Förderung wirksam werden konnte. Aufgrund der elternseitig retrospektiven Erhebung des vorschulischen Sprachförderbedarfs können Erinnerungsfehler jedoch nicht ausgeschlossen werden; auch zeigt sich in den Daten eine gewisse Selektivität hinsichtlich der Teilnahmebereitschaft an der Elternbefragung. Ferner ist der Anteil an Schüler:innen mit besonderen Unterstützungsbedarfen in der INSIDE-Studie insgesamt besonders hoch, was bei der Einordnung der mittleren Lesekompetenz der Gesamtstichprobe ebenfalls kritisch berücksichtigt werden muss. Diese und weitere Aspekte sollen in der Diskussion des Beitrags thematisiert werden. Lässt sich aus Statusdiagnosen und Förderentscheidungen auf das Lesekompetenzniveau schließen? Eine Untersuchung zur Klassifikation von falsch-positiven Entscheidungen Theoretischer Hintergrund Der sonderpädagogische Unterstützungsbedarf dient der Identifikation von Schüler:innen, die ohne gezielte sonderpädagogische Unterstützung die Lernziele ihres Jahrgangs voraussichtlich nicht erreichen würden. Auch ist die Diagnose einer Teilleistungsschwäche im schriftsprachlichen Bereich in der Regel eine Voraussetzung für einen gewährten Nachteilsausgleich. Gleichsam verliert die Statusdiagnostik generell an Bedeutung und wird zunehmend durch prozessorientierte Diagnostik ersetzt, so dass ein besonderer Unterstützungsbedarf als identifiziert gelten kann, sobald Schüler:innen sonderpädagogische oder Leseförderung erhalten (Neumann & Lütje-Klose, 2020). Es ist aufgrund unterschiedlicher Diagnostikverfahren naheliegend, dass es über Schulen und Länder hinweg zu Überschneidungen in den Lesekompetenzverteilung zwischen Schüler:innen mit und ohne ermittelte Unterstützungsbedarfe kommen muss. Diagnostische Entscheidungen unterliegen in der Regel Urteilstendenzen (Hesse & Latzko, 2017) und individuelle Merkmale können zu Halo-Effekten (vgl. Thorndike, 1920) beitragen, so dass die Lesekompetenz möglicherweise unterschätzt wird. Ebenso können Referenzgruppeneffekte auftreten, wenn Lehrkräfte Schüler:innen mit vergleichbaren Lesekompetenzen aufgrund unterschiedlicher Klassenzusammensetzungen verschieden kompetent erleben (Kölm et al., 2020). Kaum untersucht ist bisher, weshalb bei Schüler:innen fälschlicherweise ein Unterstützungsbedarf ermittelt wurde, obwohl diese Schüler:innen eigentlich ausreichende Lesekompetenzen aufweisen. Der Beitrag dient der kritischen Reflexion der gegenwärtigen Diagnostikpraxis und der Interpretierbarkeit der berichteten Kompetenzverteilungen. Forschungsfragen In diesem Beitrag gehen wir der Frage nach, wie hoch der Anteil an Schüler:innen mit einer falsch-positiven Diagnose im Bereich Lesen ausfällt. Es soll untersucht werden, welche Faktoren die Wahrscheinlichkeit für falsch-positive Diagnosen beeinflussen. Geschlecht, sozioökonomischer Status, Migrationshintergrund, sowie Lesegeschwindigkeit und mathematische Fähigkeiten sollen als individuelle Merkmalsfaktoren berücksichtigt werden. Wir erwarten, dass negativ interpretierte Leistungsmerkmale, wie geringere kognitive Fähigkeiten oder eine geringere Lesegeschwindigkeit, die Wahrscheinlichkeit für eine falsch-positive Diagnose erhöht. Auf Klassenebene erwarten wir, dass sich Lehrkräfte bei der Beurteilung der Lesefähigkeiten individueller Schüler:innen an der durchschnittlichen Klassenleistung orientieren, d. h. ein Referenzgruppeneffekt besteht (vgl. Farkas, Sheehan & Grobe, 1990). Demnach müsste die Wahrscheinlichkeit eine falsch-positive Diagnose zu erhalten für durchschnittliche Leser:innen in Klassen mit einem starken durchschnittlichen Lesekompetenzniveau erhöht sein. Methode Wir verwenden INSIDE-Daten aus der 6. Jahrgangsstufe (N = 4.654, 48,75 % Schülerinnen, Durchschnittsalter 13,68 Jahre). 19,4 % der Schüler:innen haben einen identifizierten Unterstützungsbedarf (SPF in den Bereichen Lernen oder Sprache, attestierte Teilleistungsschwäche im Bereich Schriftsprache oder erhielten sonderpädagogische oder Leseförderung). Um die Effekte sowohl auf individueller als auch auf Klassenebene zu schätzen, verwenden wir eine Mehrebenenregression. Die Cut-Offs zwischen Schüler:innen mit und ohne Unterstützungsbedarf werden bestimmt, indem wir die Verteilung der Lesekompetenzwerte für das Leseverständnis heranziehen. Üblicherweise werden Werte innerhalb einer Standardabweichung vom Mittelwert einer Referenzgruppe als unauffällig klassifiziert. Wir nutzen dieses Kriterium, um Schüler:innen mit einem identifizierten Unterstützungsbedarf, die in der Lesekompetenz stärker als 1,04 Logits abschneiden, in die Gruppe der Falsch-Positiven einzuordnen. Die Richtig-Negativen stellen die Schüler:innen ohne identifizierten Unterstützungsbedarf dar. Ergebnisse Die Spezifität liegt für den nach unserer Definition identifizierten besonderen Unterstützungsbedarf bei 82,37 Prozent. Weder der Anteil an Schüler*innen mit Migrationshintergrund noch die mittlere Lesekompetenz bei gleichzeitiger Kontrolle des individuellen Leseverständnisses erwiesen sich als Prädiktoren für falsch-positive Klassifikationen. Jedoch stehen individuelle Faktoren wie die mathematischen Fähigkeiten oder die Schnelllesefähigkeit negativ mit der Wahrscheinlichkeit von falsch-positiven Beurteilungen im Zusammenhang. Außerdem scheinen bei Schüler:innen mit sonderpädagogischen Förderbedarfen eher mathematischen Fähigkeiten im Zusammenhang mit falsch-positiv Klassifikationen zu stehen, während bei Schüler:innen mit einer Teilleistungsschwäche dies insbesondere für die Schnelllesefähigkeit gilt. Diskussion Bei Rückschlüssen auf Basis von Status- oder Förderdiagnosen auf Lesekompetenzen von Schüler:innen sollte berücksichtigt werden, dass falsch-positive Entscheidungen vorliegen können. Die Ergebnisse der Regressionsanalyse können als Halo-Effekt für die Variablen Lesegeschwindigkeit und mathematische Fähigkeiten interpretiert werden. Aufgrund des engen Zusammenhangs zwischen Lesegeschwindigkeit und Leseverständnis ist das Leseverständnis möglicherweise schwer zu beurteilen, so dass falsch-positive Beurteilungen die Folge sind. Solche systematischen Urteilstendenzen lassen sich kaum vermeiden. Ihnen kann jedoch durch den komplementären Einsatz von objektiven Verfahren begegnet werden. Langsam, aber sicher? Die Kompetenzentwicklung von Schüler:innen mit besonderen Unterstützungsbedarfen in den Bereichen Sprache oder Lernen in der Sekundarstufe Theoretischer Hintergrund Die Implementierung inklusiver Bildung in der Schule stellt das gemeinsame Lernen von Schüler:innen mit und ohne sonderpädagogischen Unterstützungsbedarf in den Mittelpunkt. In der UN-Behindertenrechtskonvention hat sich Deutschland nicht nur zu einem inklusiven Bildungssystem verpflichtet, sondern auch zum Erheben statistischer Daten. Allerdings ist bislang wenig darüber bekannt, wie sich die schulischen Kompetenzen von Schüler:innen mit (sonderpädagogischem) Unterstützungsbedarf im Förderschwerpunkt Lernen oder Sprache im gemeinsamen Unterricht entwickeln. Longitudinale Erkenntnisse zur Kompetenzentwicklung von Schüler:innen mit besonderem Unterstützungsbedarf sind selten. Die Längsschnittanalyse von Jordon et al. (2002) zeigt, dass je nach Unterstützungsbedarf (ausschließlich Lesen vs. Mathematik und Lesen) Schüler:innen der Primarstufe unterschiedliche Kompetenzniveaus und -zuwächse erzielten. Anders als in der Domäne Lesen verzeichneten Schüler:innen mit dem umfassenden Unterstützungsbedarf in der Domäne Mathematik zwar niedrigere Niveaus, aber dennoch höhere Zuwächse. Schüler:innen im Förderschwerpunkt Lernen weisen gewöhnlich bedeutsame Lernrückstände in den Unterrichtsfächern Deutsch und Mathematik sowie unterdurchschnittliche intellektuelle Fähigkeiten auf (Grünke & Grosche, 2014) und unterscheiden sich dieser Hinsicht von Schüler:innen im Förderschwerpunkt Sprache. Demnach sind spezifische Kompetenzentwicklungen in den Bereichen Lesen und Mathematik je nach Förderschwerpunkt möglich, die teilweise vom kognitiven Fähigkeitsprofil der Schüler:innen abhängen (Stranghöner et al., 2017). Studien, die die Kompetenzentwicklung von Schüler:innen mit besonderen Unterstützungsbedarfen in der Sekundarstufe untersuchen, liegen bislang nicht vor. Die Schüler:innen mit dem Förderschwerpunkt Sprache oder Lernen umfassen ein breites Spektrum an kognitiven Fähigkeitsprofilen, gleichwohl sind unterdurchschnittliche intellektuelle Fähigkeiten ausschließlich ein Einschlussmerkmal für den Förderschwerpunkt Lernen. Daher sind Klassifikationen, nach denen Schüler:innen mit besonderen Unterstützungsbedarfen gruppiert werden, stets relevant für die Interpretation der Ergebnisse. Fragestellung In diesem Beitrag untersuchen wir, erstens, inwiefern querschnittliche Gruppenunterschiede in den Kompetenzwerten in der Jahrgangsstufe 6, also den Ausgangsniveaus der Gruppen mit Unterstützungsbedarfen im Bereich Lernen, im Bereich Sprache sowie ohne Unterstützungsbedarfe bestehen. Zweitens untersuchen wir, inwiefern sich die Kompetenzentwicklungen von der Jahrgangsstufe 6 zur Jahrgangsstufe 7 in den Domänen Lesen und Mathematik zwischen den drei Gruppen unterscheiden. Methode Wir präsentieren das Design für die längsschnittliche Kompetenzmessung in den Domänen Lesen und Mathematik in inklusiven und leistungsheterogenen Schulkontexten für die Jahrgangsstufen 6 und 7, das wir für die INSIDE-Studie (Inklusion in der Sekundarstufe I in Deutschland) entwickelt haben (vgl. Stegenwallner-Schütz et al., 2022). 1462 Schüler:innen haben in der Jahrgangsstufe 6 und 7 an den Kompetenztests und einem kognitiven Fähigkeitstest teilgenommen sowie einen Fragebogen bearbeitet. Auf Basis von Lehrkräfteangaben zu sonderpädagogischen oder klinischen Diagnosen sowie zu sonderpädagogischer Förderung wurden 97 Schüler:innen der Gruppe „Lernen“, 223 Schüler:innen der Gruppe „Sprache“ und 1142 Schüler:innen der Gruppe ohne Unterstützungsbedarf zugeordnet. Um die Kompetenzentwicklung, bzw. die Kompetenzen in der Jahrgangsstufe 7 zwischen den Gruppen zu vergleichen, wurde ein lineares Regressionsmodell separat für die Domänen Lesen und Mathematik eingesetzt mit der Gruppenzugehörigkeit, Kompetenzwerten zum ersten Messzeitpunkt, sowie Testwerten zu intellektuellen Fähigkeiten und Zuwanderungshintergrund als Prädiktorvariablen. Ergebnisse Kompetenzzuwächse zeichnen sich in allen Gruppen zwischen der Jahrgangsstufe 6 und 7 und in den beiden Domänen Lesen und Mathematik ab. Zwischen den Gruppen bestehen Unterschiede in der Stärke der Kompetenzentwicklung. Sowohl die Lese- als auch die mathematische Kompetenzentwicklung fällt bei Schüler:innen mit einem Unterstützungsbedarf im Bereich Lernen geringer aus als die der Schüler:innen mit einem Unterstützungsbedarf im Bereich Sprache (p < 0.01). Somit stützen diese Ergebnisse für die Sekundarstufe die Befunde von Jordon et al. (2002) aus der Primarstufe für die Lesekompetenzentwicklung. Ein Erklärungsansatz für den Gruppenunterschied liegt in den unterschiedlichen kognitiven Profilen begründet, die charakteristisch für die Zuweisung der diagnostischen Kategorien sind. Alternativ sind auch Einflüsse der unterschiedlicher Lernsettings, z.B. durch zieldifferenten Unterricht für die Schüler:innen mit Förderschwerpunkt Lernen, zu berücksichtigen. Die INSIDE-Studie bietet somit erstmals längsschnittliche Daten zur Kompetenzentwicklung von Schüler:innen in inklusiven Lerngruppen in der Sekundarstufe in Deutschland und spiegelt dabei deren gegenwärtige Leistungsheterogenität wider. |
Datum: Mittwoch, 20.03.2024 | |
9:00 - 10:40 | 7-05: Lernschwierigkeiten in den Bereichen Lesen und Mathematik: Über welche professionellen Kompetenzen bzw. über welches professionelle Wissen verfügen (angehende) Regel- und Förderlehrkräfte? Ort: H01 |
|
Symposium
Lernschwierigkeiten in den Bereichen Lesen und Mathematik: Über welche professionellen Kompetenzen bzw. über welches professionelle Wissen verfügen (angehende) Regel- und Förderlehrkräfte? Zur Thematik der professionellen Kompetenz von Lehrkräften und deren Erfassung wurden im letzten Jahrzehnt zahlreiche Publikationen veröffentlicht. Bisher kaum untersucht wurde die professionelle Kompetenz von Lehrkräften (und Studierenden) bezogen auf den Umgang mit Lernschwierigkeiten in den Bereichen Lesen und Mathematik (Lietz, 2021; Author et al., 2017; Schmid & Schabmann, 2016). Im Kontext der Umsetzung von inklusivem Unterricht kommt dieser Thematik hinsichtlich von Diagnose und Förderung besondere Bedeutung zu. Mit Blick auf eine adäquaten Unterstützung der Schüler:innen im Unterricht ist es zentral Kenntnisse darüber zu erlagen, ob und wie sich Regel- und Förderlehrkräfte in ihrer professionellen Kompetenz bezüglich Lernschwierigkeiten in den Bereichen Lesen und Mathematik unterscheiden. In Anlehnung an Shulman (1986) wird im Fachdiskurs zur professionellen Kompetenz zwischen fachlichem und fachdidaktischem Wissen unterschieden. Hinsichtlich der Thematik des Umgangs mit Lernschwierigkeiten scheint diese Unterscheidung schwierig zu sein (Phelps & Schilling, 2004; Lietz, 2021). Zudem stellt sich bei der Erfassung der professionellen Kompetenz immer die Frage nach der Unterscheidung von Wissen und Können. Wenn eine Lehrkraft beispielsweise weiß, dass die Kenntnis des dezimalen Stellenwertsystems eine wichtige Voraussetzung für den Erwerb der Grundoperationen ist, heißt das noch nicht, dass sie passende Fördermöglichkeiten kennt bzw. umsetzen kann. Wir unterscheiden deshalb in Anlehnung an Blömeke (2011) und Bremerich-Vos et al. (2011) bei der Erfassung von professioneller Kompetenz verschiedene kognitive Anforderungen: (1) Anforderungen im Sinn von Erinnern und Abrufen (eher deklaratives Wissen) und (2) Anforderungen im Sinn von Verstehen/Analysieren/Anwendung durch anwendungsbezogene Items. Je nach Schwerpunkt verwenden wir in den Beiträgen des professionellen Wissens oder der professionellen Kompetenz. Ein wichtiger Aspekt professioneller Kompetenz zum Thema Lernschwierigkeiten, der gemäß Artelt (2009) domänenspezifisch zu konzeptualisieren ist, ist die diagnostische Kompetenz. Hier zeigen sich mehrere Forschungslücken: Es fehlen geeignete Instrumente, insbesondere wenn es darum geht, die professionelle Kompetenz von Regel- und Förderlehrkräften mit demselben Instrument messinvariant zu erfassen (Lietz, 2021). Als Folge dieses Mangels fehlen Erkenntnisse zur Frage, was Lehrkräfte über Diagnose und Förderung bei Lernschwierigkeiten wissen. Schließlich fehlen Erkenntnisse zur Frage, ob und wie sich professionelle Kompetenz zum Umgang mit Lernschwierigkeiten auf den Leistungszuwachs der Schüler:innen auswirkt. Im Symposium werden vier Studien präsentiert, die sich aus unterschiedlichen Perspektiven mit der professionellen Kompetenz bzw. dem professionellen Wissen von Regel- und Förderehrkräften sowie von Lehramtsstudierenden zum Thema Lernschwierigkeiten befassen. Im ersten Beitrag liegt der Schwerpunkt auf einem ausgewählten Aspekt der diagnostischen Kompetenz: der Urteilsgenauigkeit. Es wird untersucht, wie akkurat Regellehrkräfte die Lesekompetenz von Lernenden mit und ohne besonderen Förderbedarf einschätzen können. Beitrag 2 untersucht, ob sich die diagnostische Kompetenz von Lehramtsstudierenden durch eine Lehrveranstaltung verbessern lässt und welche individuellen Merkmale die Entwicklung bedingen. In Beitrag 3 wird eine Untersuchung präsentiert, in der Interviews mit Regel- und Förderlehrkräften zum Thema „Förderung bei Leseschwierigkeiten“ mit einem hochinferenten Ratingverfahren analysiert wurden, um zu überprüfen, ob sich zwischen den beiden Personengruppen Unterschiede zeigen. In der Studie in Beitrag 4 wird untersucht, ob sich das professionelle Wissen von Regel- und Förderlehrkräften zum Umgang mit mathematischen Lernschwierigkeiten unterscheidet und ob und wie sich dies auf den Leistungszuwachs der Schüler:innen auswirkt. Im Symposium werden die Beiträge zum einen hinsichtlich der eingesetzten Instrumente, zum anderen hinsichtlich des Wissens bzw. der Kompetenz der unterschiedlichen Gruppen von Lehrkräften bzw. Lehramtsstudierenden diskutiert. Beiträge des Symposiums Die Urteilsgenauigkeit von Lehrkräften in der inklusiven Grundschule bezüglich des Leseverständnisses ihrer Schüler:innen Theoretischer Hintergrund Leseverständnis ist eine Schlüsselfähigkeit, die vorwiegend während der Grundschulzeit erworben werden sollte (Mendoza-Pinargote & Reyes-Meza, 2022). Allerdings nimmt die Zahl der Schüler:innen mit adäquaten Lesefähigkeiten ab, sodass ein Viertel der Viertklässler:innen über eine geringe Lesekompetenz verfügt (McElvany et al., 2023). Für den Aufbau des Leseverständnisses der Schüler:innen kommt den Lehrkräften eine zentrale Bedeutung zu (Hudson, 2022). Dazu gehört u.a. deren diagnostische Kompetenz, da diese als wichtige Voraussetzung für die Unterrichtsgestaltung und individuelle Förderung angesehen wird (Hasselhorn et al., 2019). Die Meta-Analyse von Südkamp und Kolleg:innen (2012) zeigte, dass Lehrkräfte die schulischen Leistungen von Schüler:innen durchschnittlich recht genau einschätzten, wenngleich eine hohe Variabilität der Beurteilungsleistung zwischen den Lehrkräften bestand (Gabriel et al., 2016). Von Interesse ist, inwiefern Lehrkräfte für die jeweilige Kompetenz relevante bzw. irrelevante Merkmale (Brunswik, 1956; Loibl et al., 2020) der Schüler:innen im Rahmen des Urteilsprozesses einbeziehen. Mit Blick auf die Merkmale der Schüler:innen wird deutlich, dass diese die Beurteilungsgenauigkeit der Lehrkräfte bei der Einschätzung des Leseverständnisses bedingten (Südkamp et al., 2012; Urhahne & Wijnia, 2021). Sowohl Begeny et al. (2011) als auch Paleczek et al. (2017) stellten fest, dass Lehrkräfte die Leseleistung von Leser:innen mit geringen und durchschnittlichen Leistungen schlechter beurteilen konnten. Weiterhin gibt es Belege dafür, dass Lehrkräfte Schüler:innenmerkmale, die für das zu bewertende Merkmal irrelevant sind, in ihre Bewertung einbeziehen (Südkamp et al., 2018). Dazu gehören u.a. Verhaltensauffälligkeiten (Schmidt & Schabmann, 2009), ein SPF (Author et al., 2020) sowie das Geschlecht der Schüler:innen (Klapp, 2015). Fragestellungen Basierend auf den oben genannten Forschungsbefunden werden die folgenden Fragestellungen untersucht: (1) Inwiefern sind Lehrkräfte in der Lage in inklusiven Klassen die Lesekompetenz einer heterogenen Schüler:innenschaft auf Wort-, Satz- und Textebene korrekt einzuschätzen? (2) Inwiefern wird die Einschätzung der Lesekompetenz durch die Merkmale Klassenstufe, SPF und Geschlecht der Schüler:innen bedingt? Methode In der Studie wurde das Leseverständnis von Schüler:innen der 2. bis 4. Jahrgangsstufe ohne (n = 1565) und mit SPF Lernen, Emotionale und soziale Entwicklung und Sprache (n = 381) auf Wort-, Satz- und Textebene anhand der ELFE 1-6 (Lenhard & Schneider, 2006) erfasst. Die Lehrkräfte (n = 102) schätzten anhand eines Kompetenzratings, welches den Bereichen der ELFE entspricht, die Fähigkeiten der Schüler:innen ihrer Klasse ein. Die Daten wurden mittels einer Mehrebenenanalyse modelliert. Dabei wurden die jeweilige Testleistung der Schüler:innen (Perzentile auf Wort-, Satz- und Textebene) durch das korrespondierende Rating der Lehrkräfte prädiziert. Die Effekte des Förderbedarfs (getrennt nach SPF Lernen, Emotionale und soziale Entwicklung und Sprache), der Klassenstufe und des Geschlechts wurden über Interaktionseffekte mit dem Rating beschrieben. Ergebnisse Hinsichtlich der ersten Fragestellung zeigte sich, dass die Lehrkrafturteile im unteren Leistungsbereich weniger differenzieren als im mittleren und oberen Leistungsbereich. Dabei ist die Differenzierung im Bereich des Wortverstehens deutlich geringer als für das Satz- und Textverstehen. Für die zweite Fragestellung deuten die Ergebnisse darauf hin, dass das Lehrkrafturteil ungenauer für Schüler:innen mit SPF im Bereich des Lernens sowie in niedrigeren Klassenstufen ist. Die Beurteilung der Leistung erfolgte unabhängig vom Geschlecht der Schüler:innen. Betrachtet man diese Ergebnisse in Zusammenhang mit der Annahme, dass Schüler:innen mit einem SPF Lernen, ebenso wie Schüler:innen niedrigerer Klassenstufen, eine geringere Leseverständniskompetenz aufweisen, so untermauern die Ergebnisse die Annahme, dass Lehrkräfte das Leseverständnis von Schüler:innen mit geringen Kompetenzen in diesem Bereich nur ungenau einschätzen können. Zudem zeigte sich, dass eine Erhöhung der Komplexität des zu bewertenden Merkmals (Leseverständnis auf Wort-, Satz- und Textebene) sowie eine höhere Klassenstufe zu einer differenzierteren Bewertung durch die Lehrkräfte führen. Dies könnte darauf zurückzuführen sein, dass die Lehrkräfte eine größere Anzahl von Merkmalen, mit Bedeutung für das Leseverständnis, berücksichtigen können. Entwicklung der diagnostischen Kompetenz von Lehramtsstudierenden bezüglich Leseschwierigkeiten Theoretischer Hintergrund Lesekompetenz bezeichnet die Fähigkeit, schriftsprachliche Formen zu verstehen und nutzen zu können. Damit ist sie eine zentrale Voraussetzung für den Lernerfolg; im Fach Deutsch sowie auch in anderen Unterrichtsfächern (Leisen, 2007; Rosebrock & Nix, 2012). Nach den Ergebnissen der Internationalen Grundschul-Lese-Untersuchung sind jedoch ein Viertel der Viertklässler: innen in Deutschland als schwach lesend einzustufen (McElvany et al., 2023). Um Lernende bestmöglich fördern und den Unterricht an deren Bedürfnisse anpassen zu können, müssen Lehrkräfte sowohl Wissen im Bereich der Förderung als auch in der Diagnostik aufweisen (Bäuerlein, 2014). Studien verweisen auf Probleme von Lehrkräften, die Lesekompetenz ihrer Lernenden einschätzen zu können (Karing, Matthäi & Artelt, 2011; Lorenz & Artelt, 2009); insbesondere bei Lernenden mit schwachen Leseleistungen (Bates & Nettelbeck, 2001; Feinberg & Shapiro, 2009). Um angehende Lehrkräfte früh auf die Schulpraxis vorzubereiten, sollten bereits während des Studiums die diagnostische Kompetenz gefördert (Grotegut & Klingsieck, 2022) und individuelle Determinanten für den Kompetenzerwerb in den Blick genommen werden. Dies erscheint insbesondere deshalb bedeutsam, da nach dem Modell von Blömeke et al. (2015) Lehrkräfte u.a. auf Basis von individuellen diagnostischen Dispositionen (z.B. Überzeugung, Erfahrung, Selbstkonzept und Motivation) in verschiedenen pädagogischen Handlungssituationen pädagogische Diagnostik durchführen (auch Leuders et al. 2018). Trotz ihrer Relevanz für die universitäre Lehrkräfteausbildung liegen über die Entwicklung der diagnostischen Kompetenz während des Studiums und ihrer Determinanten bislang noch wenig bzw. inkonsistente Befunde vor (Buholzer & Zulliger, 2013; Heeg, Bittorf & Schanze, 2021). Fragestellungen F1 Entwickelt sich die diagnostische Kompetenz von Studierenden bezüglich Leseschwierigkeiten positiv durch den Besuch eines Seminars im Bereich Diagnostik und Förderung von Lesekompetenzen? H1 Durch den Besuch eines Seminars im Bereich Diagnostik und Förderung von Lesekompetenzen kommt es bei Lehramtsstudierenden zu einem bedeutsamen Anstieg ihrer fachspezifischen diagnostischen Kompetenz. F2 Welche individuellen Merkmale bedingen eine positive Entwicklung der diagnostischen Kompetenz von Lehramtsstudierenden bezüglich Leseschwierigkeiten? H2 Die individuellen Merkmale Überzeugung, Erfahrung, Selbstkonzept und Motivation bedingen die Entwicklung der diagnostischen Kompetenz von Lehramtsstudierenden bezüglich Leseschwierigkeiten. Methode Für die Beantwortung der Fragestellungen wurden bzw. werden Studierende des Lehramtsstudiengangs für Sonderpädagogische Förderung der TU Dortmund zu zwei Messzeitpunkten (Anfang und Endes des Semesters) in zwei Erhebungswellen (Sommersemester 2023 und Wintersemester 2023/2024) zu ihrem professionellem Wissen als Facette der diagnostischen Kompetenz anhand einer gekürzten Version des Wissenstests von Lietz (2021) mit 24 Items (Cronbachs αMZP1 = .61; Cronbachs αMZP2 = .57) befragt. Bisher nahmen N = 36 Masterstudierende an der Umfrage im Längsschnitt teil (75.0% weiblich; MAlter = 26.14, SD = 5.71). Für die Erfassung der individuellen Merkmale wurden die Frage nach der Erfahrung durch das Praxissemester und die Skalen Überzeugungen zur Nützlichkeit Lesediagnostik, Selbstkonzept und Motivation bezüglich Diagnostik im Leseunterricht eingesetzt (alle Cronbachs α ≥ .84). Im Rahmen eines Seminars befassten sich die Studierenden mit der Thematik der Diagnostik und Förderung von Lesekompetenzen. Ergebnisse Erste Ergebnisse eines t-Tests für abhängige Stichproben zeigten einen signifikanten Anstieg der diagnostischen Kompetenz der Studierenden (MMZP1 = 0.68, SDMZP1 = 0.18; MMZP2 = 0.81, SDMZP2= 0.17; t(34) =-5.37 , p < .01 , d =-0.74). Studierende erreichten nach dem Besuch des Seminars einen höheren Wert in ihrer Diagnosekompetenz als am Anfang des Semesters. Mittels Regressionsanalysen konnte festgestellt werden, dass die Motivation (β = .41, SE = 0.04, p < .05) und das Selbstkonzept (β = -.39, SE = 0.04, p < .05) prädiktiv für die Entwicklung der diagnostischen Kompetenz waren, jedoch nicht die Überzeugungen und die Erfahrung. Die Ergebnisse leisten einen Beitrag für das noch nicht hinreichend untersuchte Feld der diagnostischen Kompetenz bezüglich Leseschwierigkeiten. Mit Blick auf die Lehrkraftausbildung können die erwarteten Ergebnisse die Bedeutsamkeit der Förderung von individuellen Merkmalen wie z.B. Motivation für eine optimale Aus- und Weitertbildung im Bereich der diagnostischen Kompetenz betonen. Professionelle Kompetenz von Regellehrkräften und Förderlehrkräften zur Leseförderung Theoretischer Hintergrund Professionelles Wissen wird im Bereich Lesen und Schriftspracherwerb häufig mittels Fragebögen erfasst (z.B. Van den Hurk et al., 2017; König et al., 2022; Jordan & Bratsch-Hines, 2020). Hier liegen beispielsweise Erkenntnisse zum linguistisches Grundlagenwissen und zum Wissen zu basalen Komponenten des Leseerwerbs vor (Moats, 2009). Erst vereinzelt untersucht worden ist das professionelle Wissen von Lehrkräften zur Leseförderung bzw. zur Förderung von Schüler:innen mit Leseschwierigkeiten (Jakobson et al., 2022; Lietz, 2021). Im Kontext von inklusivem Unterricht stellt sich zudem die Frage, ob sich Regel- und Förderlehrkräfte hinsichtlich ihres professionellen Wissens unterscheiden und ob dieses bei Lehrkräften mit unterschiedlicher Ausbildung (Grundschulpädagogik, Förderpädagogik) mit demselben Instrument messinvariant erfasst werden kann. Lietz (2021) hat das professionelle Wissen von Studierenden der Regel- und der Förderpädagogik mit einem Fragebogen erfasst. Für die Studierenden der Förderpädagogik konnte ein reliables Instrument entwickelt werden, für die Studierenden der Regelpädagogik ist dies nicht gelungen. Ein alternativer Zugang stellt die Durchführung und Analyse von leitfadengestützten Interviews (für das Leseverständnis Jakobson et al., 2022) dar. Dieses Vorgehen bietet den Vorteil, dass durch anwendungsbezogene Fragen ein stärkerer Praxisbezug im Sinn von Anwenden, Verstehen und Analysieren hergestellt werden kann als mit einem Fragebogen, und der Fokus somit stärker auf der professionellen Kompetenz liegt. Fragestellung Mittels einem hochinferenten Rating von leitfadengestützten Interviews wird folgende Frage untersucht: Über welche professionelle Kompetenz zur Leseförderung verfügen Regel- und Förderlehrkräfte? Methodisches Vorgehen Im Anschluss an zwei Unterrichtsbesuche wurden zu zwei Messzeitpunkten je ein leitfadengestütztes Interview zum Thema Leseförderung mit Regel- und Förderlehrkräften geführt (306 Interviews). Diese unterrichteten im Team auf der 2. bis 4. Klassenstufe (N = 153; Regellehrkräfte: n = 91; Förderlehrkräfte: n = 62) in inklusiven Klassen. Die Lehrkräfte wurden u.a. zu Förderzielen und Fördermaßnahmen eines leseschwachen Kindes aus der Klasse sowie zu wichtigen Aspekten ihrer Leseförderungspraxis befragt. Die Auswahl der leseschwachen Kinder erfolgte aufgrund der Leistungen in einem Leseverständnistest (ELFE 1-6; Lenhard & Schneider, 2006) Die Interviews wurden mit einem hochinferenten Ratingverfahren hinsichtlich der professionellen Kompetenz zur Leseförderung von drei Raterinnen theoriebasiert mit vier Indikatoren ausgewertet: (A) Weiß die Lehrkraft, dass die Leseflüssigkeit eine wichtige Voraussetzung für das Leseverständnis ist (z.B. Chard et al., 2012) und berücksichtigt sie dies für die Umsetzung der Leseförderung? (B) Wendet die Lehrkraft Maßnahmen zur Leseförderung an, die zu den Lernvoraussetzungen der Klasse bzw. einzelnen Lernenden passen und kann sie diese Maßnahmen unter Verwendung von Fachbegriffen begründen? (C) Berücksichtigt die Lehrkraft unterschiedliche Schwierigkeitsgrade von Texten für unterschiedliche Lernniveaus (z.B. Artelt, 2009)? (D) Weiß die Lehrkraft, dass bei der Förderung der Leseflüssigkeit je nach Lernstand gezielt auf der Wort-, Satz- oder Textebene gefördert werden soll (Lenhard et al., 2020)? 25% aller Interviews (n = 40) wurden über die gesamte Auswertungszeit verteilt von allen Raterinnen eingeschätzt und der Generalisierbarkeitskoeffizient wurde berechnet. Die Interraterreliabilität (G-Koeffizient) betrug .76 bis .94 und kann als gut bis sehr gut bezeichnet werden (Seidel et al., 2003). Nebst deskriptiven Analysen wurde mittels T-Tests untersucht, ob sich signifikante Unterschiede in der professionellen Kompetenz der Regel- und der Förderlehrkräfte zeigen. Ergebnisse Die Ergebnisse zeigen, dass die im Rating erfasste professionelle Kompetenz zur Leseförderung der Förderlehrkräfte (M = 2.47, SE = 0.13) im Vergleich zu den Regellehrkräften (M = 2.16, SE = 0.09) signifikant höher ausfiel (t (151) = -2.00, p = .047), jedoch mit einer kleinen Effektstärke (Cohens d = 0.33). Im Symposium wird das Instrument vorgestellt und der methodische Zugang wird diskutiert. Professionelles Wissen von Regel- und Förderlehrkräften zur Förderung bei mathematischen Lernschwierigkeiten Theoretischer Hintergrund Ein wichtiges Ziel von inklusivem Unterricht ist u.a. die fachliche Förderung der Lernenden. Untersuchungen zum professionellen Wissen von Regellehrkräften zeigten, dass das professionelle mathematikbezogene Wissen der Lehrkräfte bedeutsam ist für den Leistungszuwachs der Lernenden (z.B. Baumert et al., 2010; Hill et al., 2005). Bislang liegen nur wenig Erkenntnisse zum professionellen Wissen von (ausgebildeten) Förderlehrkräften vor. Nach Jandl und Moser Opitz (2017) verfügten ausgebildete Förderlehrkräfte über ein höheres professionelles Wissen bezüglich der mathematischen Förderung von Kindern mit einer intellektuellen Beeinträchtigung als Lehrkräfte ohne entsprechende Ausbildung. Feng und Sass (2013) zeigten auf, dass Schüler:innen mit Lernschwierigkeiten, die von ausgebildeten Förderlehrkräften unterrichtet wurden, bessere Leistungen in Mathematik erzielten als Lernende, die den Unterricht bei nicht sonderpädagogisch ausgebildeten Lehrkräften besuchten. Im Unterschied zur bisherigen Forschung fokussiert die vorliegende Studie das professionelle Wissen von Regel- und Förderlehrkräften, die im inklusiven Unterricht zusammenarbeiten und gemeinsam die Förderung von Schüler:innen mit mathematischen Lernschwierigkeiten verantworten. Fragestellungen 1. Wie unterscheiden sich Regel- und Förderlehrkräfte, die gemeinsam in inklusiven Klassen unterrichten, in ihrem professionellen Wissen zur Förderung bei mathematischen Lernschwierigkeiten? 2. Gibt es einen Zusammenhang zwischen dem professionellen Wissen und der sonderpädagogischen Ausbildung der Lehrkräfte? 3. Wirkt sich das professionelle Wissen auf den mathematischen Leistungszuwachs aller Schüler:innen aus? Methode Stichprobe Durchgeführt wurde eine Längsschnittstudie mit N = 156 Lehrkräften (n = 81 Regellehrkräfte, n = 61 Förderlehrkräfte mit sonderpädagogischer Ausbildung, 14 ohne sonderpädagogische Ausbildung) aus 81 inklusiven Klassen (N = 1390 Schüler:innen; n = 716 Jungen, n = 674 Mädchen) im 2. bis 4. Schuljahr. Instrumente Lehrkräfte Interview: Mittels eines Ratings von strukturierten Einzelinterviews mit Regel- und Förderlehrkräften wurde das professionelle Wissen der Lehrkräfte hinsichtlich der folgenden Aspekte ermittelt: Behandlung zentraler Inhalte (z.B. Bedeutung dezimales Stellenwertsystem), Verwendung geeigneter Arbeitsmittel und Veranschaulichungen; Kenntnis des Lernstands bzw. der Lernentwicklung ausgewählter Schüler:innen mit Lernschwierigkeiten (3 Items, McDonalds Omega = .67, Interraterreliabilität G-Koeffizient = .71 bis .81). Fragebogen: Mittels einer Online-Befragung wurde das professionelle Wissen der Regel- und Förderlehrkräfte zu Merkmalen und geeigneten Fördermaßnahmen bei mathematischen Lernschwierigkeiten erfasst (22 Items, WLE-Reliabilität = .71, Codierübereinstimmung Cohens Kappa = .74 bis .94 von 8 offenen Items). Instrumente Schüler:innen Mathematiktests: Es wurde ein von der Forschungsgruppe entwickelter Tests zur Ermittlung der grundlegenden arithmetischen Fähigkeiten der Schüler:innen eingesetzt (Anfang Klasse 2: 28 Items, Cronbachs Alpha = .90; Ende Klasse 2/Anfang Klasse 3: 30 Items, Cronbachs Alpha = .90, Ende Klasse 3/Anfang Klasse 4: 41 Items, Cronbachs Alpha = .92; Ende Klasse 4: 58 Items, Cronbachs Alpha = .92). Kontrollvariablen: Es erfolgte eine Erhebung des Geschlechts sowie der allgemeinen Denkfähigkeit entsprechend dem Alter (CFT 1-R, Weiß & Osterland, 2013, 150 Items, Cronbachs Alpha = .96; CFT 20-R, Weiß, 2006, 56 Items, Cronbachs Alpha = .82). Analysen Es wurden Mittelwertvergleiche und (Mehrebenen-) Strukturgleichungsmodelle bezogen auf die Gesamtstichprobe berechnet. Ergebnisse Frage 1: Die Analysen zeigen einen signifikanten Unterschied zwischen Regel- (n = 81) und Förderlehrkräften (n = 75) hinsichtlich des professionellen Wissens zur Förderung bei mathematischen Lernschwierigkeiten zugunsten der Förderlehrkräfte (Interview-Rating: d = 0.88, p < .01; Fragebogen: d = 0.34, p < .05). Frage 2: Zwischen der Art der Ausbildung (n = 95 Regellehrkräfte und Förderlehrkräfte ohne sonderpädagogische Ausbildung, n = 61 Förderlehrkräfte mit sonderpädagogischer Ausbildung) und dem professionellen Wissen besteht ein (tendenziell) positiver Zusammenhang (Interview-Rating β = .41, p < .001, Fragebogen β = .16, p = .06). Ausgebildete Förderlehrkräfte verfügen demnach über ein höheres professionelles Wissen als Förderlehrkräfte ohne sonderpädagogische Ausbildung und Regellehrkräfte. Frage 3: Das professionelle Wissen (Fragebogendaten) von Regel- (β = .14, p < .05) und Förderlehrkräften (β = .25, p < .05) hat einen positiven Einfluss auf den Leistungszuwachs der Schüler:innen der Gesamtstichprobe. Im Symposium werden die Ergebnisse hinsichtlich der eingesetzten Instrumente diskutiert. |
11:10 - 12:50 | 8-05: Unterricht auf Wiedergabe: Forschungs- und Nachnutzungspotenziale von Videodaten in der Unterrichtsforschung Ort: H01 |
|
Symposium
Unterricht auf Wiedergabe: Forschungs- und Nachnutzungspotenziale von Videodaten in der Unterrichtsforschung Videographien nehmen in der empirischen Unterrichtsforschung eine zentrale Rolle ein. Als etablierte Methode in der Forschungspraxis bieten sie tiefe Einblicke in Unterrichtsprozesse und -interaktionen. Ihnen wird ein besonderes Potenzial zugeschrieben, welches darin besteht, Theorien des Unterrichts zu entwickeln (Asbrand & Martens, 2018; Dinkelaker, 2020), sowie Modelle und Hypothesen zu prüfen (Grünkorn et al., 2020; Lotz, 2016). Dies wird möglich, da Videoforschungsdaten einzigartige Einblicke in den Unterricht als komplexes Interaktionsgeschehen bieten (Herrle et al., 2016). Die besondere Fähigkeit von Videoaufzeichnungen, zeitliche Abfolgen, simultane Geschehnisse, Interaktionen sowie Mimik, Gestik und Körperhaltung der Beteiligten zu erfassen, stellt eine Besonderheit dar (Corsten et al., 2020; Herrle et al., 2016). Die Komplexität von Videos, kombiniert mit der Möglichkeit zur Wiederholung und Anpassung, erleichtert die Analyse des komplexen Unterrichtsgeschehens erheblich und bietet einen bedeutenden Mehrwert gegenüber anderen Datenquellen wie Leistungstests oder Befragungen. Obwohl das Potenzial für den Erkenntnisgewinn durch die Analyse von Unterrichtsvideos immens zu sein scheint, stellt sich der Zugang zum Feld und die Erhebung dieser Videos als besonders herausfordernd dar. Demzufolge betonen verschiedene Forschungsgemeinschaften, dass ein zentraler Aspekt guter wissenschaftlicher Praxis in der Bereitstellung dieser wissenschaftlichen Daten für die spätere Nachnutzung liegt (DFG, 2019; DGfE et al., 2020). Die Bereitstellung von FAIRen Forschungsdaten gewährleistet nicht nur die Transparenz und Nachvollziehbarkeit von Studienergebnissen, sondern ermöglicht es auch, das volle Potenzial der aufwendig gesammelten Daten auszuschöpfen (Bainter & Curran, 2015; Raffaghelli & Manca, 2019; van der Zee & Reich, 2018). Das Symposium thematisiert das hohe Nachnutzungspotential von Unterrichtsvideos, trotz bestehender Herausforderungen bei Sekundäranalysen und insbesondere in ihrer Bereitstellung. Es wird zudem auf die Schwierigkeiten und Limitationen eingegangen, die bei der Arbeit mit Videos entstehen können. In diesem Symposium werden Beiträge von Expert*innen aus verschiedenen Disziplinen und mit unterschiedlichen Perspektiven vorgestellt. Diese Beiträge erstrecken sich über diverse Phasen des Forschungsprozesses – angefangen bei der Planung einer Videostudie bis hin zu den abschließenden Auswertungen und Ergebnissen der jeweiligen Projekte.
Beiträge des Symposiums Der Blick hinter die Kulissen: Technologische und methodologische Herausforderungen von Unterrichtsvideos In den vergangenen Jahren haben sich Unterrichtsvideos als bedeutsames Datenmaterial in der empirischen Unterrichtsforschung herausgestellt (Corsten et al., 2020; Häusler et al., 2022). Durch die videobasierten Beobachtungsdaten können Forschende tiefgreifende empirische Erkenntnisse über das komplexe Geschehen der Interaktion im Unterricht gewinnen (Herrle et al., 2016). Allerdings bringt die konkrete (Nach)Nutzung von aufgezeichnetem Unterrichtsmaterial in der empirischen Unterrichtsforschung gegenwärtig immer noch einige Herausforderungen mit sich. Im Vergleich zur langen Tradition von textbasierten Erhebungs- und Auswertungsmethoden, wird davon ausgegangen, dass der Diskurs um videogestützte Beobachtungen methodisch sowie methodologisch noch am Anfang steht (Baltruschat & Wagner-Willi, 2018). Die verstärkte Anwendung von Unterrichtsaufzeichnung hat zudem die Perspektive auf Unterricht maßgeblich beeinflusst (Dinkelaker, 2020). Neben den zwei etablierten Strömungen der Unterrichtsforschung – der videogestützten Unterrichtsqualitätsforschung und der qualitativ-rekonstruktiven Unterrichtsforschung – gewinnt inzwischen auch eine fachdidaktisch orientierte Unterrichtsforschung zunehmend an Bedeutung (Dinkelaker & Herrle, 2009; Riegler & Wiprächtiger-Geppert, 2018). Dabei wurde dieser Wandel teilweise durch die bisherige Vernachlässigung fachlicher Inhalte in Videostudien begünstigt, (Praetorius & Gräsel, 2021). Jedoch findet die Anwendung spezifischer Methoden zur Analyse von Unterrichtsvideos innerhalb dieser einzelnen (Teil)Disziplinen und Strömungen oftmals isoliert und ohne Verbindung zu anderen Ansätzen statt (Gröschner, 2019). Eine integrierte Betrachtung, die die Beziehung zwischen verschiedenen Ansätzen in einem Forschungskontext beleuchtet, fehlt häufig (Syring et al., 2023). Gerade im Hinblick auf die Bereitstellung von Unterrichtsvideos für die Zwecke der wissenschaftlichen Nachnutzung ist es nicht unerheblich, wie die erhobenen Videomaterialien beschaffen sind und in welchem Kontext diese zum Einsatz kommen. Vor diesem Hintergrund wird in diesem Beitrag ein detaillierter Blick auf die facettenreichen Anwendungsgebiete von Unterrichtsvideos innerhalb der empirischen Unterrichtsforschung geworfen. Es stellt sich jedoch die Frage, wie man die verschiedenen Forschungsansätze im Zusammenhang mit Unterrichtsvideos integriert und bewertet. Daher sollen in diesem Beitrag folgende Kernfragen behandelt werden: Wie kann eine integrierte Sichtweise aussehen, die die Beziehung zwischen verschiedenen Forschungsansätzen in der Unterrichtsforschung beleuchtet? Welche Kriterien sind entscheidend für die Qualität und (Nach)Nutzbarkeit des gesammelten Videomaterials? Ausgehend von zwei großangelegten Videostudien, soll gezeigt werden, wie die Art und Weise der Videoerhebungen die Möglichkeiten der Analyse, bspw. im Hinblick auf die Selektivität, den Blick auf den Unterricht und dadurch auch den Erkenntnisgewinn beeinflussen kann. Aus einer methodischen Perspektive zeigen (Re)Analysen der TALIS-Videostudie und erste methodische Triangulationen auf Basis der Unterrichtsvideos die Potenziale und Begrenzungen einer standardisierten Videoerfassung (Grünkorn et al., 2020; Schreyer, in Vorb.). Im Gegensatz dazu verdeutlichen Analysen der INTERFACH-Videostudie, bei der bis zu 15 Kameras im Klassenraum eingesetzt wurden, dass die Wahl der Kameraperspektive entscheidend für die Einschätzung der Interaktions- und Unterrichtsqualität sein kann (Schreyer, in Druck). Im Weiteren veranschaulicht diese Studie auch einige Grenzen in der praktischen Umsetzung zur Bereitstellung von Unterrichtsvideos. Abschließend wird diskutiert, wie diese Ansätze die Unterrichtsforschung bereichern können und welche methodologischen Überlegungen und technischen Lösungen notwendig sind, um das volle Potenzial von Unterrichtsvideos auszuschöpfen. Die vorgestellten Ansätze und Erkenntnisse sollen dazu anregen, die Möglichkeiten von Unterrichtsvideos in der Unterrichtsforschung weiter auszuloten und innovative Analysemethoden zu entwickeln, die den vielschichtigen und dynamischen Charakter des Unterrichts adäquat abbilden können. Rechtliche Rahmenbedingungen für das Teilen und Nachnutzen von Unterrichtsvideos. Eine Fallstudie in Australien und Deutschland Videos erfassen neben den interessierenden Unterrichtsprozessen auch Gesichter, Stimmen, persönliche Gespräche und potenziell sensible Informationen wie Migrationshintergründe oder Gesundheitsdaten. Zudem können urheberrechtlich geschützte Elemente in Unterrichtsvideos auftreten, etwa bei der Aufnahme von Lehrmaterialien oder den Produkten der Lernenden. Die Verarbeitung von Unterrichtsvideos ist daher mit rechtlichen Anforderungen verbunden, welche bei der Forschung und dem Teilen der Daten berücksichtigt werden müssen (Scheller, 2017). In diesem Beitrag werden die rechtlichen Rahmenbedingungen und ihre praktischen Auswirkungen auf die Erhebung, den Austausch und die Wiederverwendung von Unterrichtsvideos anhand einer Fallstudie beleuchtet (Yin, 2018). Die Fallstudie begleitet ein Forschungsprojekt, das Unterrichtsvideos an einer deutschen und einer australischen Schule erhebt, beginnend mit der Planung der Datenerhebung bis hin zur Archivierung der Daten in einem Forschungsdatenzentrum. Dabei werden die rechtlichen Vorgaben, Richtlinien und Anforderungen, die sich direkt auf den Umgang mit den Unterrichtsvideos beziehen, einbezogen. Die Datenanalyse erfolgt mithilfe der Software MAXQDA und basiert auf der Auswertung von mehr als 200 E-Mail-Korrespondenzen zwischen dem Forschungsprojekt und verschiedenen Akteuren, in denen der Umgang mit den Forschungsdaten ausgehandelt wird. Darüber hinaus gewährt ein Experteninterview mit einer Projektbeteiligten vertiefte Einblicke in die Aushandlungsprozesse. Mit der Methode des thematischen Kodierens (Flick 2014) wurden verschiedene Konfliktarten und Lösungen herausgearbeitet. Die Analyse zeigt, dass die rechtlichen Bestimmungen in Bezug auf Datenschutz und Urheberrecht in beiden Ländern sehr ähnlich sind. Dennoch variieren die Anforderungen an den Umgang mit den Forschungsdaten erheblich, je nach den genehmigenden Institutionen, was für die Forschenden zusätzliche, teilweise unnötige Hürden schafft. Verzögerungen bei der Datenerhebung ergeben sich aus unklaren Zuständigkeiten und Verfahren der genehmigenden Stellen. Hilfreiche Ressourcen und Arbeitsschritte für die Bereitstellung oder Nachnutzung von Unterrichtsvideos Eine bedeutende Stärke von Videoforschungsdaten liegt in ihrer Nutzbarkeit zur Beantwortung von Forschungsfragen über Forschungsparadigmen hinweg. Entsprechend gilt die Bereitstellung und Nachnutzung von Unterrichtsvideos als wertvoller Ansatz der Unterrichtsforschung. Bisher ist es in der Bildungsforschung allerdings nicht gelungen, eine Kultur der Bereitstellung und Nachnutzung von Unterrichtsvideos zu etablieren (Goodey et al., 2022). Von 36 Publikationen (Jahr 2022), die Unterrichtsvideos als Forschungsdaten nutzten, stellte lediglich ein Projekt (Troll, Pietsch & Besser, 2023) seine Videos zur Nachnutzung bereit. Auch bei der Nachnutzung zeigt sich ein ähnliches Bild. Bis 2022 stellte das Forschungsdatenzentrum Bildung am DIPF etwa 2200 Unterrichtsvideos für die Nachnutzung durch Forschende zur Verfügung. Zwischen 2016 und 2022 wurden lediglich 8 Publikationen aus Nachnutzung durch Selbstauskunft von Sekundärforschern und Google Alerts erfasst. Auch wenn diese Erfassung die tatsächliche Nachnutzung etwas unterschätzt (sie deckt etwa 75 % der tatsächlichen Nachnutzung ab; Daniel, 2023), bleibt die Quote dennoch auf einem niedrigen Niveau. Umfangreiche Erfahrungen bezüglich hilfreicher Ressourcen und essenzieller Arbeitsschritte im Umgang mit Videoforschungsdaten begünstigen den Prozess einer gelingenden Bereitstellung. Diese Ressourcen und Arbeitsschritte wurden allerdings noch kaum in die Forschungscommunity disseminiert. Forschende berichten von Unsicherheiten, offenen Fragen und fehlenden Routinen, die eine Bereitstellung und Nachnutzung verhindern (Steinhardt et al., 2022). Es fehlt also ein Überblick zu Ressourcen und Arbeitsschritten der Bereitstellung und Nachnutzung. Dabei liegt die Verantwortung für das Gelingen von Bereitstellung und Nachnutzung nicht alleinig bei den wissenschaftlich Forschenden. Die Verantwortung ist in einem “research ecosystem” (Europäische Kommission, 2018, S. 10) zwischen den Forschenden selbst und Forschungsinfrastrukturen, -bibliotheken, sowie -einrichtungen aufgeteilt. Das wissenschaftsunterstützende System (z.B. Forschungsdatenzentren) bietet Ressourcen, die den Prozess des Bereitstellens und Nachnutzens für Forschende deutlich erleichtern. Zudem können sie stellenweise Aufgaben ihres Expertisebereichs übernehmen (z.B. Aufbereitung und Dokumentation der Daten) und so Forschende entlasten. Diese vorhandenen Ressourcen sind bisher allerdings noch wenig disseminiert. Ziel des Beitrags ist es, Arbeitsschritte und Ressourcen für Forschende bezüglich der Bereitstellung und Nachnutzung von Unterrichtsvideos zu systematisieren. Dies soll Unsicherheiten im Prozess verringern und den Arbeitsaufwand für die Forschenden möglichst reduzieren. Anhand eines Prozessmodells werden wesentliche Arbeitsschritte für eine Bereitstellung oder Nachnutzung beschrieben und jeweilige Ressourcen aufgezeigt. Der Beitrag schärft das Bewusstsein für die gemeinsame Nutzung von Unterrichtsvideos und stellt deren Attraktivität für die Bildungsforschung und die Forschenden selbst heraus. Gleichzeitig wird aufgezeigt, an welchen Stellen noch Ressourcen und empirische Erkenntnisse fehlen, um eine Kultur der Bereitstellung und Nachnutzung weiter auszubauen. Einfluss der Förderung von Metakognition im Klassengespräch auf die Mathematikleistung Unter Metakognition wird meist das Denken über das eigene Denken und die Regulation des Denkens verstanden (Flavell, 1976, 1979). Seit Flavell (1976, 1979) gilt die Förderung von Metakognition der Lernenden als eine Maßnahme zur Verbesserung des Lernverhaltens und schließlich zur Steigerung der Lernergebnisse. Positive Effekte dieser Förderung wurden in zahlreichen Interventionsstudien nachgewiesen (Depaepe et al., 2010; Mevarech et al., 2010; Mevarech & Kramarski 2014) und durch Metaanalysen (De Boer et al., 2018; Dignath & Büttner, 2008; Verschaffel et al., 2019) bestätigt. Inspiriert durch Interventionsstudien haben Wissenschaftler Empfehlungen für die Förderung von Metakognition auch im regulären Unterricht – insbesondere im Klassengespräch – entwickelt (Veenman et al., 2006; Zepeda et al., 2019; Zion et al., 2005). Bisher fehlt jedoch an Erkenntnissen inwiefern solche Förderungsmaßnahmen im regulären Unterricht die Entwicklung der Mathematikleistung beeinflussen (Kyriakides et al., 2020; Zepeda et al. 2019). Ein Ziel der aktuellen Studie ist, den Einfluss der Förderung von Metakognition im Klassengespräch im regulären Mathematikunterricht auf die Entwicklung der Mathematikleistung unter Kontrolle individueller Merkmale der Lernenden und Merkmale der Klassen zu untersuchen. Zu diesem Zweck wurden Unterrichtsvideos und Leistungsdaten der Studie „Pythagoras - Unterrichtsqualität und mathematisches Verständnis in verschiedenen Unterrichtskulturen“ Klieme et al., 2009; Klieme & Reusser, 2003; Hugener et al., 2006; Lipowsky et al., 2006) re-analysiert. Der Datensatz besteht aus 40 Klassen (20 Klassen der 9. Jahrgangsstufe aus Deutschland, 20 Klassen der 8. Jahrgangsstufe aus der Schweiz). Diese wurden in drei Unterrichtsstunden zur Einführung in die Satzgruppe des Pythagoras gefilmt. Mit Leistungstests wurde u.a. das Verständnis des Satzes des Pythagoras nach der dritten gefilmten Unterrichtsstunde und das pythagorasspezifische Vorwissen direkt vor der Einführung in das Thema sowie das Beweisverständnis am Ende der gesamten Unterrichtsreihe zur Satzgruppe des Pythagoras und am Anfang des Schuljahres erfasst. Die Förderung von Metakognition im Klassengespräch wurde von zwei geschulten voneinander unabhängigen Ratern mit einem zweistufigen Ratinginstrumentarium mit sieben Items mit hochinferenten Skalen (Nowińska, 2013) erfasst. Eine Faktorenanalyse ergab, dass sich die sieben Items zu drei Skalen zusammenfassen lassen: (1) metakognitive Qualität des Klassengesprächs (Praktizieren metakognitiver Aktivitäten, Formulieren elaborierter Begründungen zu diesen Aktivitäten und Auseinandersetzung mit dem eigenen Verständnis der Fachinhalte des Unterrichts), (2) diskursive Unterrichtsqualität des Klassengesprächs (Praktizieren diskursiver Aktivitäten z.B. durch genaues Eingehen auf Beiträge von anderen und Bemühungen um ein präzises, gut nachvollziehbares Gespräch), (3) anspruchsvoller Diskurs (Engagement der Lernenden in metakognitive Aktivitäten in einem präzise untereinander geführten Austausch über die Fachinhalte des Unterrichts sowie Engagement in eine Diskussion zu anspruchsvollen Fragen zu diesen Inhalten). Der Einfluss der Förderung von Metakognition auf die Mathematikleistung wurde mit dem Ansatz der Mehrebenenanalysen untersucht. Die Ergebnisse zeigen, dass Förderung von Metakognition auch unter Kontrolle individueller Merkmale der Lernenden und Merkmale der Klasse einen positiven Einfluss auf die Mathematikleistung hat und zur Erklärung der Varianz in dieser beiträgt. Der Einfluss auf das Beweisverständnis fällt stärker aus als auf das Verständnis des Satzes des Pythagoras. Im Beitrag wird die Bedeutung der Ergebnisse diskutiert und eine Erklärung dieses Unterschieds vorgenommen. Am Beispiel der Studie werden Vor- und Nachteile der (Nach)Nutzung von Videos beleuchtet. Insbesondere wird gezeigt, an welchen Stellen in der Auswertung des Videomaterials methodische Herausforderungen zustande kamen und wie diese durch eine erneute Analyse der Videodaten und Anpassungen der Auswertungsmethoden behoben wurden. Die Herausforderungen betreffen u.a. die in den Videos abgebildete Vielfältigkeit des Klassengesprächs und der Interaktionen in ihm und konsequenterweise die Auswahl geeigneter Analyseeinheiten sowie die Aggregation der Ratings über die drei analysierten Unterrichtsstunden. Der Beitrag beleuchtet auch das Potenzial der durchgeführten Videoanalyse zur Erklärung des Einflusses einer metakognitiven Förderung der Lernenden auf die Mathematikleistung. |
Impressum · Kontaktadresse: Datenschutzerklärung · Veranstaltung: GEBF 2024 |
Conference Software: ConfTool Pro 2.8.105 © 2001–2025 by Dr. H. Weinreich, Hamburg, Germany |