Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
 
Sitzungsübersicht
Datum: Freitag, 27.03.2020
9:00 - 10:45F9-S17: Computerbasiertes formatives Assessment mit MINDSTEPS
S17 
 

Computerbasiertes formatives Assessment mit MINDSTEPS

Stéphanie Berger, Nina König, Lukas Giesinger, Martin J. Tomasik, Urs Moser

Institut für Bildungsevaluation, Assoziiertes Institut der Universität Zürich, Schweiz

Ziel diese Beitrags ist es, am Beispiel des adaptiven computerbasierten Assessment-Tools MINDSTEPS (www.mindsteps.ch; siehe auch Tomasik, Berger & Moser, 2018) aufzuzeigen, wie moderne Computertechnologie für regelmässiges formatives Assessment und personalisiertes Lernen in Schulklassen eingesetzt werden kann. MINDSTEPS ist eine Online-Itembank, die auf den Erkenntnissen des neuseeländischen Forscherteams um John Hattie basiert (z.B. Hattie, 2009; Hattie & Timperley, 2007). MINDSTEPS unterstützt Schülerinnen und Schüler sowie Lehrerinnen und Lehrer dabei, selbstverantwortlich den aktuellen Lernstand sowie Lernfortschritte der Schülerinnen und Schüler über die Zeit zu erfassen, beziehungsweise im Sinne von „Visible Learning“ sichtbar zu machen.

Zu diesem Zweck stehen in MINDSTEPS für die Fächer Deutsch, Englisch, Französisch und Mathematik zwischen 4‘000 und 12‘000 Aufgaben zur Verfügung, welche auf der Basis des kompetenzbasierten Deutschschweizer Lehrplans „Lehrplan 21“ entwickelt wurden. Die Aufgaben richten sich an Schülerinnen und Schüler von der 3. Klasse der Primarstufe bis zur 9. Klasse der Sekundarstufe I (Ende der obligatorischen Schulzeit). Sie sind inhaltlich nach Kompetenzen und Themen kategorisiert und empirisch auf einer vertikalen Skala auf der Basis der Item Response Theorie (IRT) verortet. Dank der vertikalen IRT-Skala können die Aufgaben adaptiv und somit den aktuellen Fähigkeiten der Schülerinnen und Schüler entsprechend ausgewählt werden (van der Linden & Glas, 2010; Wainer, 2000) und die Ergebnisse sind über verschiedene Messzeitpunkte hinweg vergleichbar. Da in MINDSTEPS nicht Tests sondern einzelne Aufgaben zur Verfügung stehen, können die Aufgaben je nach Fragestellung flexibel kombiniert werden: Zu allgemeinen adaptiven Standortbestimmungen innerhalb eines Kompetenzbereiches (z.B. Mathematik Zahl und Variable), zu Aufgabenserien mit thematischem Fokus (z.B. Brüche) oder zu Aufgabenserien zu ausgewählten Kompetenzen (z.B. Flexibel zählen, Zahlen nach der Grösse ordnen und Ergebnisse überschlagen).

Dieser Beitrag umfasst drei Teile. Im ersten Teil werden theoretische Grundlagen zum pädagogischen Konzept und zum zugrundeliegenden Messmodel von MINDSTEPS präsentiert. Einerseits wird die Bedeutung von datengestütztem Feedback für die Unterstützung des Lehr-Lern-Prozesses erläutert (Hattie & Timperley, 2007; Schildkamp, Lai, & Earl, 2013). Andererseits wird aufgezeigt, wie die Testaufgaben in der Itembank organisiert sind und wie sie auf der Basis der IRT auf einer vertikalen Skala, welche kompetenzorientiertes Feedback und die Verfolgung des Lernfortschrittes über die Zeit hinweg ermöglicht, verortet wurden (Berger, Verschoor, Eggen & Moser, 2019).

Im zweiten Teil des Beitrags demonstrieren wir ganz konkret, wie MINDSTEPS in der Schulpraxis eingesetzt werden kann. Es werden vier verschiedene Use Cases präsentiert, welche jeweils von praxisrelevanten Fragestellungen ausgehen, wie beispielsweise: „Welche Fortschritte machte meine Klasse im letzten Jahr in «Englisch Lesen»?“. Wir zeigen auf, wie in Anhängigkeit von der Fragestellung, welche die Lehrerinnen und Lehrer oder die Schülerinnen und Schüler haben, Aufgaben aus der Itembank zu Aufgabenserien mit unterschiedlichem Fokus zusammengestellt werden können und wie diese Aufgabenserien individuellen Schülerinnen und Schülern oder ganzen Klassen zugewiesen werden können. Anschliessend geben wir einen Einblick in die verschiedenen Aufgabenformate und zeigen, wie die Schülerinnen und Schüler die ihnen zugewiesenen Aufgabenserien online lösen können. Schliesslich präsentieren wir die Ergebnisrückmeldungen für die vier Use Cases und zeigen, wie die Klassenergebnisse und die individuellen Schülerergebnisse von den Lehrerinnen und Lehrern und den Schülerinnen und Schülern in der Praxis für die Klärung ihrer Fragen und als Ausgangspunkt für personalisiertes Lernen (vgl. Holmes, Anastopoulou, Schaumburg, & Mavrikis, 2018) genutzt werden können.

Im dritten Teil des Beitrages, wird das Publikum dazu eingeladen, die Möglichkeiten, Risiken und Grenzen der digitalen Leistungsmessung zu diskutieren. Die Diskussion wird anhand von Leitfragen moderiert. Wie kann digitale Leistungsmessung personalisiertes Lernen unterstützen? Wo bietet digitalisierte Leistungsmessung im Unterricht eine Entlastung für die Lehrperson? Welche Voraussetzungen müssen gegeben sein, damit die Ergebnisse eines Tools wie MINDSTEPS für die individuelle Förderung und die Unterrichtsentwicklung einen Mehrwert bringen? Welche Chancen bietet die digitalisierte Leistungsmessung für die empirische Bildungsforschung?

 
9:00 - 10:45F9‒H01: Überzeugungen von Lehrkräften: Aktuelle Befunde und Perspektiven
H01 
 

Überzeugungen von Lehrkräften: Aktuelle Befunde und Perspektiven

Chair(s): Katharina Hettinger (Universität Potsdam, Deutschland), Rebecca Lazarides (Universität Potsdam, Deutschland)

DiskutantIn(nen): Axinja Hachfeld (Universität Konstanz)

Einstellungen und Überzeugungen von Lehrkräften gelten als wichtige Bedingungsfaktoren für Unterrichtshandeln (z.B. Zee & Koomen, 2016) und damit für die Gestaltung von Bildungsprozessen im schulischen Kontext. Allerdings befassen sich Forschungsarbeiten häufig nur mit einzelnen Facetten von Lehrkräfteüberzeugungen. Das eingereichte Symposium ermöglicht einen umfassenden und detaillierten Überblick zur Bedeutung von Lehrkräfteüberzeugungen für verschiedene Aspekte beruflichen Handelns in der Bildungsinstitution Schule. Die Beiträge ergänzen die bisherige Forschung, indem sie die Bedeutung von Überzeugungen von Lehrkräften für die motivational-affektive Entwicklung von Lehrkräften (Beitrag 1), für das Wissen von Lehrkräften (Beitrag 2) sowie für Unterrichtshandeln und motivational-affektive Entwicklung Lernender (Beiträge 3 und 4) in den Blick nehmen.

Der erste Beitrag befasst sich ausgehend von Weiners‘ Attributionstheorie mit der Bedeutung von Überzeugungen von Lehrkräften für ihr berufliches Wohlbefinden. Dabei wird querschnittlich basierend auf den Daten des Nationalen Bildungspanels (NEPS) aufgezeigt, dass die Lehrkräfte, die ihrem eigenen Handeln (z.B. Unterrichtsgestaltung, Kooperation mit Lehrkräften) eine Bedeutung für die Leistungen von Schülerinnen und Schüler zuschreiben, auch eine hohe Arbeitszufriedenheit berichten. Wurde der Familie der Lernenden eine große Bedeutung zugeschrieben, berichteten die Lehrkräfte eine hohe Belastung.

Beitrag 2 befasst sich mit dem Einfluss von Wissen auf Überzeugungen von Lehrkräften zur Inklusion in der Schule. Es wurden Daten von Lehramtsstudierenden erhoben, die im Rahmen eines hochschulweiten Bildungsmonitorings an der Universität zu Köln im Rahmen des Projektes „Qualitätsoffensive Lehrerbildung“ befragt wurden. Die ersten Ergebnisse der querschnittlichen Befunde zeigen, dass ein signifikanter Einfluss von Wissen für inklusives Unterrichten auf die Überzeugungen zur inklusiven Bildung erwartet werden kann. Hierbei werden unterschiedlich hohe Einflüsse für die unterschiedlichen Überzeugungsskalen angenommen.

Beitrag 3 befasst sich basierend auf der sozial-kognitiven Theorie Banduras mit selbstbezogenen Überzeugungen von Lehrkräften – den allgemeinen Selbstwirksamkeitserwartungen und ihrer Bedeutung für die von Lernenden wahrgenommene Unterstützung und das Interesse im Grundschulmathematikunterricht. Die längsschnittlichen Mehrebenenanalysen basieren auf Daten des large-scale assessments BIKS und zeigen einen positiven Zusammenhang zwischen der Selbstwirksamkeit der Grundschullehrkräfte zum Ende der dritten Klasse und der wahrgenommenen Unterstützung zu Beginn der vierten Klasse. Die wahrgenommene Unterstützung sagte das Mathematikinteresse in der vierten Jahrgangsstufe vorher. Die Ergebnisse verweisen auf die Bedeutsamkeit der Selbstwirksamkeit von Lehrkräften für die von Lernenden wahrgenommene Unterrichtsgestaltung und motivationalen Merkmale Lernender.

Ebenfalls basierend auf Banduras sozial-kognitiver Theorie geht Beitrag 4 der Frage nach längsschnittlichen Zusammenhängen zwischen der Selbstwirksamkeitserwartung von Lehrkräften im Klassenmanagement, von Lernenden berichteten Unterrichtsqulitätsdimensionen und der Freude Lernender im Mathematikunterricht der Sekundarstufe nach. Ergebnisse der Mehrebenenanalysen zeigen, dass die Selbstwirksamkeitserwartung von Lehrkräften für Klassenmanagement zu Beginn des Schuljahres das von Lernenden wahrgenommene Monitoring und die soziale Eingebundenheit zur Mitte des Schuljahres vorhersagt. Soziale Eingebundenheit steht wiederum im Zusammenhang mit der Freude der Lernenden.

Die Beiträge des Symposiums verdeutlichen eindrücklich die Bedeutung von Lehrerüberzeugungen für Lehrkräftewohlbefinden, Unterrichtshandeln und Schülerentwicklung in einem interdisziplinären Symposium. Durch die teils längsschnittlichen Analyseansätze wird die Untersuchung der Bedeutung von Lehrkräfteüberzeugungen für Entwicklungsprozesse im schulischen Kontext deutlich. Durch die Fokussierung verschiedener Bildungskontexte (Primarstufe, Sekundarstufe, inklusive Lernsettings) werden zukünftige Perspektiven für weitere Forschungsarbeiten zu Überzeugungen von Lehrkräften hervorgehoben.

 

Beiträge des Symposiums

 

Was ist wichtig für Schulerfolg? Zusammenhänge zwischen den Überzeugungen von Lehrkräften und ihrem beruflichen Wohlbefinden

Anke Heyder
Technische Universität Dortmund

Theoretischer Hintergrund

Obwohl der Lehrerberuf sehr erfüllend sein kann, erleben viele Lehrkräfte ihre Tätigkeit als relativ belastend (Kyriacou, 2001). Deshalb ist es wichtig mehr darüber zu erfahren, welche Merkmale mit einem hohen bzw. niedrigen beruflichen Wohlbefinden von Lehrkräften ein-hergehen.

Diese Studie fokussiert die Überzeugungen von Lehrkräften, wie wichtig verschiedene Einflussfaktoren für den Schulerfolg von Kindern und Jugendliche sind, als Prädiktor ihres beruflichen Wohlbefindens. Lehrkräfte nennen häufig Merkmale der Schüler/-innen (z.B. ihre Anstrengungsbereitschaft), auf Lehrer-/Klassenebene (z.B. die Qualität des Unterrichts) und der Familie (z.B. ihr Bildungshintergrund) als Faktoren, die Schulleistung beeinflussen (Georgiou, 2018; Patterson, Kravchenko, Chen-Bouck, & Kelley, 2016; Fleckenstein, Zimmermann, Köller, & Möller, 2015). Die Bedeutung dieser Lehrerüberzeugungen zeigte sich u.a. bereits in signifikanten Zusammenhängen mit der Motivation und dem Hilflosigkeitserleben ihrer Schüler/-innen (z.B. Heyder & Brunner, 2018; Heyder, Weidinger, Cimpian & Steinmayr, 2019). Zum Zusammenhang mit dem beruflichen Wohlbefinden der Lehrkraft liegen keine bekannten empirischen Studien vor.

Fragestellung

Basierend auf der Attributionstheorie (z.B. Weiner, 2010) untersucht diese Studie den Zusammenhang zwischen den fokussierten Überzeugungen und dem beruflichen Wohlbefinden von Lehrkräften. Die Attributionstheorie beschreibt, wie die angenommene Ursache eines Ereignisses die folgenden Gedanken, Emotionen und Handlungen einer Person beeinflusst. Auf dieser Grundlage wird erwartet, dass eine hohe zugeschriebene Bedeutung von Lehrermerkmalen für Schulleistung mit einem höheren beruflichen Wohlbefinden einhergeht, weil diese für die Lehrkraft zu einem gewissen Grad kontrollierbar und veränderbar sind. Für die Bedeutung von Schüler- und Familienmerkmalen hingegen werden negative Zusammenhänge mit dem beruflichen Wohlbefinden erwartet, weil diese für die Lehrkraft kaum oder gar nicht veränderbar sind.

Methode

Die Stichprobe bestand aus 2331 Lehrkräften der Starkohorten 3 und 4 des Nationalen Bildungspanels (doi:10.5157/NEPS:SC3:5.0.0, doi:10.5157/NEPS:SC4:1.1.0; Blossfeld, Roß-bach, & von Maurice, 2011). Der größte Teil der Lehrkräfte war weiblich (62%) und 51-60 Jahren alt (34%).

Die Lehrkräfte beurteilten folgende neun Merkmale hinsichtlich ihrer Wichtigkeit für Schulleistung (1 = sehr unwichtig, 4= sehr wichtig; Mudiappa & Artelt, 2014): Finanzielle Situation und Bildungshintergrund der Eltern, Berufstätigkeit der Mutter, Anstrengungsbereitschaft, Begabung, und Sprachkompetenz des Kindes, Unterrichtsmethoden, Koordination zwischen den Lehrkräften einer Klasse und Unterrichtsqualität. Als Indikatoren des beruflichen Wohlbefindens wurden die Belastung (5 Items; Ditton, 2001) und Arbeitszufriedenheit (9 Items; Dann et al., 2014) der Lehrkräfte genutzt.

Ergebnisse

Faktorenanalysen stützten die eindimensionale Struktur der Konstrukte Belastung und Ar-beitszufriedenheit. Für die Lehrerüberzeugungen zeigte sich eine dreifaktorielle Struktur mit den Faktoren: Schüler-, Lehrer- und Familienmerkmale. Aufgrund der unbefriedigenden Reli-abilität des Schülerfaktors wurde das Item „Anstrengungsbereitschaft“ mit eingeschränkter Varianz (M = 3.78, SD = 0.43 auf einer Skala von 1-4) für die Analysen auf Skalenebene aus-geschlossen.

Auf Itemebene wurden fast alle Determinanten als wichtig beurteilt. Die Berufstätigkeit der Mutter wurde als am wenigsten wichtig und die Anstrengungsbereitschaft der/des Schüler/-in als am wichtigsten beurteilt. Auf Skalenebene wurde Schülermerkmalen eine größere Wichtigkeit zugeschrieben als Lehrermerkmalen, welche wiederum wichtiger wahrgenommen wurden als Familienmerkmale.

Die Hypothesen wurden in einem Strukturgleichungsmodell mit den Lehrerüberzeugungen als Prädiktoren der Belastung und Arbeitszufriedenheit geprüft. Es zeigten sich folgende signifi-kanten Zusammenhänge: Je größer die zugeschriebene Bedeutung von Lehrermerkmalen, des-to höher die Arbeitszufriedenheit. Je größer die zugeschriebene Bedeutung von Familien-merkmalen, desto geringer die Arbeitszufriedenheit und desto höher die Belastung. Für den Schülerfaktor wurden keine signifikanten Effekte gefunden.

Aufgrund der großen, heterogenen Stichprobe bereichern die Ergebnisse die bisherigen Befunde zu Lehrerüberzeugungen zu den Determinanten von Schulleistung. Die empirischen Zusammenhänge mit der Arbeitszufriedenheit und Belastung stützen größtenteils die auf Grundlage der Attributionstheorie aufgestellten Hypothesen. Ursachen für das Ausbleiben der erwarteten Zusammenhänge mit der Bedeutsamkeit von Schülermerkmalen könnten in ihrer relativ groben Erfassung und möglichen Deckeneffekten liegen. Hier wäre eine differenziertere Erfassung in Zukunft wünschenswert. Als weitere Limitationen der Studie gilt das querschnittliches Studiendesign, welches nicht ermöglicht, die Richtung der Effekte zu testen.

 

Der Einfluss von pädagogischem Wissen für inklusiven Unterricht auf Überzeugungen zur inklusiven Bildung

Sarah Strauß, Kristina Gerhard, Kai Kaspar, Conny Melzer, Johannes König
Universität Köln

Theoretischer Hintergrund

Der Umgang mit Heterogenität in Schule und Unterricht ist eine Kernanforderung an professionelles Handeln von Lehrpersonen, die im Zuge der Forderung nach der Umsetzung einer gemeinsamen Beschulung aller Schüler*innen (UN-Behindertenrechtskonvention 2006) noch weiter an Bedeutung gewonnen hat. Im Rahmen des Modells professioneller Kompetenz von Lehrkräften (Baumert & Kunter 2006, Blömeke et al. 2009) sind u.a. Wissen sowie Überzeugungen zentrale Komponenten für das professionelle Handeln einer Lehrkraft. Für die Überzeugungen hat die Forschung den Blick auf berufsbezogenen Überzeugungen speziell zum Thema Inklusion in den vergangenen Jahren deutlich erweitert (Einzelstudien z.B. Avramidis et al. 2000; Schwab & Seifert, 2015; Hellmich et al., 2016; Reviews/Überblicksartikel z.B. de Boer et al. 2011; Bosse & Spörer, 2014; Gasterstädt & Urban, 2016; Ruberg & Porsch 2017). Insbesondere die Problematik der fehlenden oder uneinheitlichen Definition des Inklusionsbegriffs (Grosche 2015) erschwert jedoch einen Vergleich sowohl der Instrumente als auch der Ergebnisse (Strauß & König 2017). Für den Bereich des professionellen Wissens, speziell das pädagogische Wissen, wurden bisher nur von einer Arbeitsgruppe konzeptionelle Überlegungen mit Blick auf spezifische Anforderungen die im Zuge der Inklusion entstehen (König et al. 2019), getätigt sowie ein damit verbundenes neues Testinstrument entwickelt (König et al. 2017).

Liegen zur modellhaften Vorstellung professioneller Kompetenz Ergebnisse zum Zusammen-spiel von Wissen und Überzeugungen vor, so sind diese vor dem Hintergrund veränderter Anforderungen an Lehrkräfte im Zuge der Inklusion erneut zu prüfen und ggf. differenziert zu betrachten. So ist bspw. unklar, ob sich spezifische Überzeugungen zu inklusivem Unterricht angehender Lehrkräfte möglicherweise stärker über die Zeit der Ausbildung verändern als bisher aus der Forschung zu Überzeugungen bspw. zum Lehren und Lernen bekannt ist. Aus diesem Grund wird im vorliegenden Beitrag die Beziehung von a) Überzeugungen zur inklusiven Bildung und b) pädagogischem Wissen für inklusiven Unterricht in den Blick genommen. Hierbei werden zwei Instrumente genutzt, die explizit auf inklusiven Unterricht ausgerichtet sind: a) ein Inventar zur Erfassung von Überzeugungen zur inklusiven Bildung, welches im Rahmen von sieben Skalen mit insgesamt 27 Items, u.a. verschiedene Ebenen der Begriffsdefinition (wie einen engen und weiten Inklusionsbegriff) differenziert betrachtet (Strauß & König 2017) sowie b) ein Wissenstest mit 44 Items, der pädagogisches Wissen für inklusiven Unterricht (general pedagogical knowledge for inclusive teaching, GPK-IT) (Kö-nig et al. 2017) fokussiert. Erste Einzelanalysen auf manifester Ebene liegen vor, welche zeigen, dass höhere Testleistungen mit positiveren Überzeugungen zur inklusiven Bildung ein-hergehen (König et al. 2017). Im vorliegenden Beitrag sollen darüberhinausgehende Analysen getätigt werden, welche die Beziehung von Wissen und Überzeugungen in den Blick nehmen und prüfen ob (größeres) Wissen einen (positiven) Einfluss auf Überzeugungen hat. Vor dem Hintergrund der Frage, ob Überzeugungen zum inklusiven Unterricht angehender Lehrkräfte im Rahmen ihrer Ausbildung positiv beeinflusst werden können, ist dies eine äußerst relevante Frage.

Fragestellung

Welchen Einfluss hat das pädagogische Wissen für inklusiven Unterricht auf die Überzeugun-gen zur inklusiven Bildung?

Methode

Es werden im Rahmen von Strukturgleichungsmodellen latente Pfadanalysen mit Mplus durchgeführt, bei denen die zwei Inhaltsdimensionen des Wissens als Prädiktorvariablen und die Überzeugungen als Kriteriumsvariablen verwendet werden. Berichtet werden neben deskriptiven Ergebnissen und Interkorrelationen die Regressionskoeffizienten.

Die Stichprobe umfasst 409 Lehramtsstudierende, die im Rahmen eines hochschulweiten Bil-dungsmonitorings an der Universität zu Köln im Rahmen des Projektes „Qualitätsoffensive Lehrerbildung“ befragt wurden. Zum Zeitpunkt der Datenerhebung befand sich jeweils rund die Hälfte der Studierenden im 4. Semester des Bachelor-Studiums (n = 214, 52 %) bzw. Master-Studiums (n = 195, 48 %).

Ergebnisse

Erste Ergebnisse der derzeit noch nicht abgeschlossenen Datenanalyse sowie die wenigen Vorarbeiten, auch aus vergleichbaren Studien die den Einfluss von Lerngelegenheiten auf Überzeugungen analysieren (z.B. Biedermann et al. 2012), lassen einen signifikanten Einfluss des Wissens auf die Überzeugungen erwarten, wobei unterschiedlich hohe Einflüsse für die unterschiedlichen Überzeugungsskalen angenommen werden.

 

Selbstwirksamkeit der Lehrkräfte als Bedingungsfaktoren der wahrgenommenen Unterstützung und des Mathematikinteresses in der Grundschule

Elisa Oppermann1, Rebecca Lazarides2
1Freie Universität Berlin, 2Universität Potsdam

Theoretischer Hintergrund

Das Mathematikinteresse von Schüler/innen ist ein zentraler Prädiktor für die Fächerwahl, die Bewältigung von Herausforderungen sowie die Leistungen in Mathematik (Simpkins, Davis-Kean, & Eccles, 2006; Tulis & Fulmer, 2013). Obgleich das Mathematikinteresse bereits im Laufe der Grundschulzeit sinkt (Jacobs, Lanza, Osgood, Eccles, & Wigfield, 2002), ist über die Einflussfaktoren des Mathematikinteresses in der Grundschule wenig bekannt. Aus theoretischer Perspektive im Sinne der Interessentheorie (Renninger & Su, 2012) sowie der Selbstbestimmungstheorie (Deci & Ryan, 1993) ist die Unterstützung Lernender durch die Lehrkräfte ausschlaggebend für die Interessensentwicklung. Die Bedeutsamkeit der Unterstützung im Unterricht für die Motivation Lernender zeigte sich auch in empirischen Studien für die Sekundarstufe (Dietrich, Dicke, Kracke, & Noack, 2015), für die Grundschule sind diese Zusammenhänge bisher kaum erforscht. Ferner fehlen Studien zu den Voraussetzungen unter-stützenden Lehrerhandelns auf Seiten der Grundschullehrkräfte. Nach Bandura (1977) ist die Selbstwirksamkeit von Lehrkräften prädiktiv für unterstützendes Verhalten im Unterricht. Empirische Befunde zum Zusammenhang zwischen der Selbstwirksamkeit von Lehrkräften und der wahrgenommenen Unterstützung im Unterricht sind für die Sekundarstufe jedoch inkonsistent (vgl. Holzberger, Philipp, & Kunter, 2013; Zee & Koomen, 2016). Der vorliegende Beitrag untersucht daher längsschnittliche Zusammenhänge zwischen der Selbstwirk-samkeit von Grundschullehrkräften, der wahrgenommenen Unterstützung im Unterricht und der Entwicklung des Mathematikinteresses in der Grundschulzeit.

Fragestellungen/Hypothesen

Es wird angenommen, dass die Selbstwirksamkeit der Lehrkräfte (T1) positiv mit der wahr-genommenen Unterstützung im Unterricht zusammenhängt (T2; Hypothese 1). Des Weiteren wird ein positiver Zusammenhang zwischen der wahrgenommenen Unterstützung und der Interessensentwicklung angenommen (T3-T2; Hypothese 2). Außerdem wird ein direkter Zusammenhang zwischen der Selbstwirksamkeit der Lehrkräfte und dem Mathematikinteresse angenommen (Hypothese 3).

Methode

Die Daten stammen von den ersten drei Messzeitpunkten (MZP) der BIKS-8-14 Studie (Artelt, Blossfeld, Faust, Rossbach, & Weinert, 2013). Hierbei wurden Schüler/innen berück-sichtigt, die nicht die Klasse wechselten (N = 2.082) und deren Lehrkräfte angaben, in dieser Klasse Mathematik zu unterrichten (N = 133). Die Selbstwirksamkeit der Lehrkräfte wurde am Ende der 3.Klasse (MZP1) erhoben (8 Items, ɑ = .70), die wahrgenommene Unterstützung der Schüler/innen durch die Lehrkräfte zu Beginn der 4. Klasse (MZP2; 6 Items, ɑ = .80) und das Mathematikinteresse der Schüler/innen am Ende der 3.Klasse (MZP1) sowie am Ende der 4.Klasse (MZP3) (4 Items, MZP1: ɑ = .89; MZP3: ɑ = .88). Die längsschnittlichen Zusam-menhänge wurden mithilfe einer Mehrebenen-Regressionsanalyse in Mplus untersucht. Als Kontrollvariablen wurde die Mathematikleistung auf Klassenebene sowie die Berufserfahrung der Lehrkräfte berücksichtig. Die Werte auf Level 1 wurden am Gruppenmittelwert zentriert und fehlende Werte mit „full information maximum likelihood“ geschätzt.

Ergebnisse und Diskussion

Im Modell (χ2 = 30.95, df = 10; RMSEA = 0.03; CFI = 0.90; SRMR = 0.03) zeigte sich ein positiver Zusammenhang zwischen der Selbstwirksamkeit der Grundschullehrkräfte zu MZP1 und der wahrgenommenen Unterstützung auf Klassenebene zu MZP2 (ß = .23, p < .05). Die wahrgenommene Unterstützung sagte wiederum die Entwicklung des Mathematikinteresses auf Klassenebene vorher: Je stärker sich Schüler/innen zu MZP2 unterstützt fühlten, desto höher war das Mathematikinteresse in der Klasse ein halbes Jahr später (MZP3) - unter Kon-trolle des Mathematikinteresses zu MZP1 (ß = .21, p < .05). Es zeigte sich kein direkter Effekt der Selbstwirksamkeit der Lehrkräfte zu MZP1 auf das Mathematikinteresse zu MZP3 (ß = .03, p > .05). Die Ergebnisse betonen die Bedeutsamkeit der Selbstwirksamkeit von Lehrkräften sowie der wahrgenommenen Unterstützung im Unterricht für die Interessensentwicklung am Ende der Grundschulzeit und bestätigen damit die theoretischen Annahmen (Bandura, 1977; Deci & Ryan, 1993; Renninger & Su, 2012). Die Förderung der Selbstwirksamkeit von Lehrkräften, z.B. in Fort- und Weiterbildungen, kommt somit auch den Schüler/innen zugute, da sich diese über die wahrgenommene Unterstützung im Unterricht positiv auf die Entwicklung des Mathematikinteresses von Grundschulkindern auswirkt.

 

Selbstwirksamkeit von Lehrkräften im Klassenmanagement und Unterrichtsqualität als Einflussfaktoren auf die Lernfreude in der Sekundarstufe

Katharina Hettinger, Rebecca Lazarides
Universität Potsdam

Theoretischer Hintergrund und Fragestellung

Die Selbstwirksamkeit von Lehrkräften gilt als bedeutsamer Bedingungsfaktor für qualitätsvolles Unterrichtshandeln, für reduziertes Belastungserleben im Beruf sowie für eine positive akademische Entwicklung von Schülerinnen und Schülern (Zee & Koomen, 2016). Basierend auf Banduras sozial-kognitiver Theorie (1986) gilt dabei die Selbstwirksamkeitserwartung als kontextspezifisches Merkmal, das stark bereichsspezifisch ausgeprägt ist. Allerdings befassen sich nur sehr wenige Studien mit den Wirkungen bereichsspezifischer Selbstwirksamkeit von Lehrkräften (bspw. Selbstwirksamkeit im Klassenmanagement) und die existierenden Arbeiten sind zumeist querschnittlich angelegt (Wolters & Daugherty, 2007). Die vorliegende Studie untersucht daher Effekte der Selbstwirksamkeit von Lehrkräften im Bereich Klassenmanagement auf die von Lernenden wahrgenommene Unterrichtsqualität und auf Veränderungen in der Lernfreude von Schülerinnen und Schülern. Darüber hinaus gehen wir der Frage nach, inwiefern Un-terrichtsqualitätsmerkmale die Wirkung von Selbstwirksamkeitserwartungen auf die Veränderung der Lernfreude vermitteln.

Methode

In dieser Studie wurden die Daten von 779 Neunt- (49.6%) und Zehntklässlern (50.4%) und ihren Mathematiklehrkräften (N = 40) in die Analysen einbezogen. Die Lernenden stammten aus 40 Klassen in 11 Schulen der Sekundarstufe (5 Gymnasien; 6 Integrierte Sekundarschulen) in Berlin und wurden einige Wochen nach Beginn des Schuljahres (T1) sowie erneut in der Mitte des Schuljahres (T2) im Rahmen einer Fragebogenerhebung zu Motivation und Unterricht im Fach Mathematik befragt. Um die Fragestellungen der hier vorgestellten Studie zu beantworten wurde ein längsschnittliches Mehrebenenmodell berechnet (doubly manifest; Marsh et al., 2009).

Die von den Lehrkräften berichtete Selbstwirksamkeit im Klassenmanagement wurde durch vier Items einer adaptierten Version des “Teacher’s Sense of Efficacy Scale” von Tschannen-Moran und Woolfolk Hoy (2001) (ɑ = .85) gemessen (Pfitzner-Eden, Thiel, & Horsley, 2015). Die Unterrichtsqualität wurde aus SchülerInnensicht erfasst, dabei bezogen wir Monitoring ein, das durch drei Items nach Kunter et al. (2008) erfasst (ɑ = .87) wurde sowie soziale Eingebundenheit (ɑ = .76, drei Items nach Rakoczy, 2006) und kognitive Aktiv-ierung (ɑ = .79; drei Items nach Kunter et al. (2008). Schließlich wurde Freude im Fach Mathematik durch vier Items Pekrun, Götz, und Frenzel (2005) erfasst (ɑ = .90).

Ergebnisse

Das angenommene Modell zeigte eine gute Passung zu den empirischen Daten, χ² = 618.199, df = 66, CFI = .98, TLI = 0.94; RMSEA = .03, SRMRwithin = .00, SRMRbetween = .08. Lehrkräfteselbstwirksamkeitserwartung im Klassenmanagement zu Beginn des Schuljahres stand in positivem und signifikantem Zusammenhang zu aggregierten SchülerInnenberichten des Monitorings in der Klasse (β = .39, SE = 0.18, p = .026) und zur sozialen Eingebundenheit jeweils zur Mitte des Schuljahres (β = .49, SE = 0.16, p = .003).

Der indirekte Effekt von Lehrkräfteselbstwirksamkeitserwartung in Klassenmanagement (T1)

auf die Freude der Lernenden (T2), vermittelt durch die von Lernenden wahrgenommenden Unterrichtsqualitätsdimensionen war allerdings nur marginal signifikant (βind = .20, SE = 0.11, p = .064, 95% CI [-.011, .411]). Auf SchülerInnenebene (L1) zeigte sich, dass die von Ler-nenden wahrgenommene soziale Eingebundenheit (T2) (β = .13, SE = 0.04, p = .001) und das Monitoring T2 (β = .10, SE = 0.04, p = .009) zu einer positiven Veränderung der Freude von Beginn zur Mitte des Schuljahres beitrugen. Diese Ergebnisse sind bedeutsam für die Forschung zu Lehrermotivation und Unterrichtsqualität, da sie zeigen, dass die Selbstwirksamkeit von Lehrkräften für Klassenmanagement erhöht die Lernendenwahrnehmung von Monitoring und sozialer Eingebundenheit in der Klasse.

 
9:00 - 10:45F9‒H02: Herausforderungen bei der Messung der Wirkungen von Unterricht
H02 
 

Herausforderungen bei der Messung der Wirkungen von Unterricht

Chair(s): Carmen Köhler (DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation), Alexander Naumann (DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation)

DiskutantIn(nen): Wolfgang Wagner (Eberhard Karls Universität Tübingen)

Ein zentrales Interesse in der Unterrichtsforschung besteht darin, die Wirkungen von Unterricht auf die Leistungsentwicklung und die motivationale Entwicklung von Schülerinnen und Schülern zu überprüfen. Wirkungen des Unterrichts zu identifizieren ist unter anderem eine methodisch hoch anspruchsvolle Herausforderung, da Unterricht ein komplexes System ist, in dem mehrere Komponenten ineinandergreifen, und auf verschiedenen Ebenen bestimmte Voraussetzungen für eine valide WIrksamkeitsprüfung gegeben sein müssen. Hierzu gehören (a) eine reliable und valide Messung sowie Modellierung relevanter Unterrichtsmerkmale, (b) die angemessene Erfassung und Modellierung wesentlicher Leistungs- und Lernergebnisse der Schülerinnen und Schüler sowie (c) ein angemessenes Analysemodell zur Bestimmung des Effektes der Wirkung von Unterricht auf die Leistungs- und Lernergebnisse. Im Symposium liegen die Fokusse auf diesen verschiedenen, und doch miteinander verknüpften, methodischen Herausforderungen.

Der erste Beitrag beschäftigt sich mit der Erfassung von Prozessen im Unterricht, also der Messung relevanter Unterrichtsmerkmale. Im Spezifischen wird geprüft, ob die kognitive Aktivierung, welche eine der drei Basisdimensionen guten Unterrichts darstellt, mithilfe von Merkmalen des Unterrichtsangebots bzw. dessen Nutzung erfassbar ist. Im Beitrag wird berichtet, wie die Skala mithilfe von hierarchischen Faktorenanalysen gebildet und anschließend auf Zuverlässigkeit und Konstruktvalidität geprüft wurde.

Im zweiten Beitrag liegt der Fokus weiterhin auf der Messung der Unterrichtsmerkmale. Im Zentrum steht hier die Modellierung der Urteilsakkuratheit von Lehrpersonen. Es wird ein Bayesianisches multivariates Mehrebenenmodell vorgeschlagen und angewendet, um die Akkuratheit diagnostischer Urteile von Lehrpersonen in verschiedenen Kompetenzbereichen gleichzeitig abzubilden. Im Beitrag wird dabei untersucht, wie konsistent die Urteilsakkuratheit über die verschiedenen Kompetenzbereiche hinweg ausgeprägt ist.

Der dritte Beitrag prüft, ob nichtkognitive Lernergebnisse auf eine Art und Weise gemessen werden, dass sie überhaupt Wirkungen von Unterricht erfassen können, also sensitiv gegenüber Unterrichtseffekten sind. Im Gegensatz zu Leistungstests wird die Instruktionssensitivität der Instrumente zur Erfassung nichtkognitiver Lernergebnisse bislang wenig untersucht. Entsprechend zielt der Beitrag darauf ab, das Konzept der Instruktionssensitivität auf nichtkognitive Lernergebnisse zu erweitern und die Implikationen für die Unterrichtseffektivitätsforschung zu diskutieren.

Im letzten Beitrag steht die Schätzung des Effektes von Unterricht im Fokus. Es wird aufgezeigt, unter welchen Bedingungen zwei gängige Analysemodelle—der Change-Score und ANCOVA Ansatz—bei Schätzung des Effektes von Unterricht übereinstimmen und wann sie zu verzerrten Schätzungen führen.

Alle Beiträge werden abschließend von Wolfgang Wagner im Hinblick auf zukunftsträchtige Ansätze und notwendige Weiterentwicklungen diskutiert.

 

Beiträge des Symposiums

 

Lässt sich das Potenzial zur kognitiven Aktivierung im Unterricht über Unterrichtsmaterialien erfassen?

Benjamin Herbert
DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation

In der Unterrichtsforschung werden verschiedene Datenquellen für die Auswertung der Unterrichtsqualität genutzt, wobei jede Quelle mit unterschiedlichen Vor- und Nachteilen verbunden ist (Waldis, Grob, Pauli & Reusser, 2010; Praetorius, Pauli, Reusser, Rakoczy & Klieme, 2014). Die Analyse gefilmter Unterrichtsstunden durch externe Beobachter*innen gilt durch ihre hohe Objektivität und die Möglichkeit, einen methodisch-didaktisch geschulten Blick zu gewährleisten, als Königsweg zur Erfassung von Unterrichtsmerkmalen (Helmke, 2014). Sie ist jedoch mit einem direkten Eingriff in den Unterricht sowie hohen Kosten und zeitlichem Aufwand verbunden. Eine bislang kaum genutzte Alternative besteht in der Analyse von Unterrichtsmaterialien. Diese verbindet ökonomische Vorteile mit der hohen Objektivität, die mit der Auswertung durch externe Beobachter*innen einhergeht.

Da Unterrichtsmaterialien nur die Angebotsseite von Unterricht abbilden, sind sie als Indikator für diejenigen Unterrichtsqualitätsmerkmale geeignet, die nicht ausschließlich auf Schüler*innen-Lehrer*innen-Interaktionen beruhen. Hierunter fällt beispielweise die kognitive Aktivierung, die eine der drei Basisdimensionen guten Unterrichts darstellt und darauf abzielt, ob Schüler*innen zu komplexen Denkprozessen und einer vertieften Auseinandersetzung mit dem Unterrichtsgegenstand angeregt werden (Klieme et al., 2001; Klieme & Rakoczy, 2008; Praetorius et al., 2018). Da sich die tatsächliche kognitive Aktivierung der Schüler*innen nur schwer an deren Verhalten erkennen lässt (Mayer, 2004; Renkl, 2011), wird häufig über Merkmale des Unterrichts und/oder dessen Nutzung durch die Lernenden stellvertretend das Potenzial zur kognitiven Aktivierung erfasst (Kunter & Voss, 2011; Lipowsky, 2015; Kunter & Trautwein, 2013).

Trotz ihrer Eignung wurden Unterrichtsmaterialien im Mathematikunterricht in Deutschland bislang nur in der COACTIV Studie herangezogen (Jordan et al., 2006; Baumert et al., 2010). Nach über fünfzehn Jahren ist mit der Leibniz Videostudie erstmals eine weitere Studie durchgeführt worden, die eine Auswertung von Unterrichtsmaterialien in Bezug auf das Potenzial zur kognitiven Aktivierung ermöglicht. In dieser wurden unterschiedliche Aspekte von kognitiver Aktivierung über Unterrichtsmaterialien erfasst, wobei einzelne Items in angepasster Form von COACTIV übernommen wurden. Zudem wurde ein innovatives Ratingverfahren durchgeführt: Alle Unterrichtsmaterialien einer Stunde (z.B. Ablaufpläne, visuelle Materialien, Lehrbuchseiten oder Aufgabenblätter) wurden als gemeinsames Set stellvertretend für die Unterrichtsstunde ausgewertet. Der Beitrag befasst sich daher mit der Forschungsfrage, ob sich das Potenzial einer Unterrichtsstunde zur kognitiven Aktivierung über die Unterrichtsmaterialien der Stunde erfassen lässt.

Es wird in einem analytischen Dreischritt vorgegangen. Zunächst wird eine Skala zum Potenzial der kognitiven Aktivierung entwickelt. Dazu werden neun theoriegeleitet ausgewählte Items, die verschiedene Aspekte von kognitiver Aktivierung abdecken, strukturanalytisch untersucht. Als Datengrundlage dienen 187 Unterrichtsstunden. Die Skala wird über eine hierarchische konfirmatorische Faktorenanalyse gebildet, wodurch die Ratingstruktur – alle Unterrichtsstunden wurden durch zwei unabhängige Rater*innen ausgewertet – und das ordinale Skalenniveau der Daten berücksichtigt werden. Die entwickelte Skala setzt sich aus sieben Items zusammen und weist gute Fit-Werte auf (χ²(70) = 145.32, p = .00, TLI = .969, CFI = .976, RMSEA = .076). Alle Faktorladungen liegen zwischen 0.32 und 0.86.

In einem zweiten Schritt wird über eine Abhängigkeitsstudie untersucht, wie zuverlässig die Skala von den Rater*innen erfasst werden kann. Datengrundlage ist eine Teilstichprobe aus 20 Unterrichtsstunden, deren Unterrichtsmaterialien jeweils von sechs Rater*innen ausgewertet wurden. Es zeigt sich, dass bereits bei der Auswertung durch eine/n Rater*in der G Koeffizient einen Wert von 0.7 übersteigt, der in anderen Studien der Unterrichtsforschung als Referenzwert für eine akzeptable Zuverlässigkeit verwendet wird (Praetorius et al., 2014).

Abschließend wird die Konstruktvalidität der entwickelten Skala getestet. Für etwa die Hälfte der ausgewerteten Unterrichtsstunden wurde die kognitive Aktivierung auch über Videoratings erfasst. Die Skalen der beiden Erhebungsinstrumente werden latent modelliert und miteinander korreliert (χ²(62) = 125.41, p = .00, RMSEA = .072, TLI = .920, CFI = .936). Die hierarchische Struktur der Daten wird aufgrund der geringeren Stichprobengröße nicht berücksichtigt. Es liegt eine signifikante mittlere Korrelation vor (r = .39, p = 0.00), was auf eine akzeptable Konstruktvalidität der entwickelten Skala hindeutet.

 

Zur Modellierung der Urteilsakkuratheit in multiplen Kompetenzbereichen und deren Beziehungen

Dimitra Kolovou1, Alexander Naumann2, Jan Hochweber1, Anna-Katharina Praetorius3
1Pädagogische Hochschule St.Gallen (PHSG), 2DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, 3Universität Zürich

Theoretischer Hintergrund

In zahlreichen Studien steht die Akkuratheit des Lehrerurteils bezüglich der Schülerleistung als Indikator diagnostischer Kompetenz im Fokus. Dabei werden jedoch oft einzelne Akkuratheitsmasse bezogen auf einen einzigen Kompetenzbereich verwendet, um Aussagen über die Akkuratheit von Lehrpersonen innerhalb eines Fachs zu treffen (siehe Gabriele et al., 2016; Lorenz & Artelt, 2009). Implizit wird damit davon ausgegangen, dass es sich bei der Urteilsakkuratheit um eine globale Fähigkeit von Lehrpersonen handelt und Resultate daher auf Urteile in verschiedenen Kompetenzbereichen verallgemeinert werden können (Herppich et al., 2017). Allerdings wurden bislang die Beziehungen zwischen der Urteilskkuratheit von Lehrpersonen über Kompetenzbereiche hinweg kaum untersucht (siehe jedoch Lorenz & Artelt, 2009).

In den sehr wenigen bisherigen Studien zu diesem Thema wurde die Urteilsakkuratheit über die lehrer- oder klassenweise berechnete Korrelation zwischen den im Test ermittelten und den von den Lehrpersonen beurteilten Schülerleistungen abgebildet (vgl. Lorenz & Artelt, 2009). Dabei wird die hierarchische Datenstruktur nur indirekt berücksichtigt. Zudem sind die so ermittelten Akkuratheitskennwerte zweifach messfehlerbehaftet, da die manifesten Schülertestwerte und die manifesten Lehrerurteile in die Analysen eingehen. Dies könnte zu einer Unterschätzung der empirischen Zusammenhänge der Urteilsakkuratheit in den jeweiligen Kompetenzbereichen führen.

Ziel des Beitrags ist es daher, zu untersuchen, inwiefern sich die Urteilsakkuratheit in multiplen Kompetenzbereichen und die Beziehungen zwischen diesen mithilfe von Mehrebenenmodellen mit latenten Variablen analysieren lassen, um einen adäquateren Umgang einerseits mit der hierarchischen Datenstruktur und anderseits mit dem Messfehler zu ermöglichen.

Methode

Die Analysen erfolgen mit Daten von 55 Deutschlehrpersonen aus der deutschsprachigen Schweiz, welche die Leistungen der von ihnen unterrichteten Schülerinnen und Schüler der Jahrgangstufe 7 beurteilten (N = 1255). Die Lehrpersonen wurden gebeten, für jeden Schüler Urteile zum individuellen Leistungsstand in den Kompetenzbereichen „Lesen“, „Hören“, und „Sprache(n) im Fokus“ abzugeben. Das Rating erfolgte auf einer zehnstufigen Skala von „leistungsschwach“ (1) bis „leistungsstark“ (10). Zu den eingeschätzten Schülern lagen auch Daten aus objektiven, lehrplankonformen Kompetenztests vor.

Für die simultane Analyse der Urteilsakkuratheit in multiplen Bereichen wurde ein einzelnes multivariates Mehrebenenmodell mit variierenden Koeffizienten („random intercepts and random slopes“) spezifiziert. Dabei stellt die Regressionskonstante (bei entsprechender Zentrierung) das erwartete Urteil für Schüler mit durchschnittlicher Leistung dar, während die Regressionssteigung darstellt, wie gut Lehrerurteile durch die Testergebnisse der Schüler vorhergesagt werden können, was als Maß für die Urteilsgenauigkeit der Lehrpersonen aufgefasst werden kann. Die Schülertestwerte (zentriert um den Gruppenmittelwert), geschätzt aus einem mehrdimensionalen Mehrebenen-IRT-Modell (ML-MIRT), wurden in jedem Kompetenzbereich als latenter Prädiktor (siehe Lüdtke et al., 2011) spezifiziert. Die latenten Korrelationen der Slopes über die Kompetenzbereiche hinweg liefern Informationen darüber, inwieweit die Urteilsakkuratheit der Lehrpersonen in den Kompetenzbereichen konsistent ist oder nicht. Alle Analysen wurden im Bayes-Framework in JAGS (Plummer, 2016) mittels Markov-Chain Monte Carlo (MCMC) durchgeführt.

Ergebnisse

Die mittleren Effekte der Schülertestwerte verweisen auf einen positiven Zusammenhang zwischen dem Schülertestwert und dem Lehrerurteil in allen Kompetenzbereichen. Sie variieren je nach Kompetenzbereich zwischen β = .71 (95% Bayesianisches Kredibilitätsintervall [BCI]: .59; .84; Sprache(n) im Fokus) und β = .91 (95% BCI: .76; .84; Hören). Die latenten Korrelationen über die Kompetenzbereiche zwischen der ermittelten Urteilsakkuratheit liegen zwischen r = .68 (95% BCI: .50; .84) und r = .78 (95% BCI: .65; .89).

Entsprechend kann – trotz eines substantiellen Zusammenhangs – nur mit gewissen Einschränkungen von der Akkuratheit in einem Kompetenzbereich auf diejenige im anderen Kompetenzbereich geschlossen werden. Dies steht im Einklang mit einigen vorherigen Studien (vgl. z.B. Lorenz & Artelt, 2009), welche manifeste Korrelationen über die Kompetenzbereiche untersuchten. Das eingesetzte Verfahren erweitert bisherige Ansätze (vgl. Karst et al., 2017; Meissel et al., 2017) und bietet einen angemesseneren Ansatz für die Modellierung der Urteilsakkuratheit in multiplen Kompetenzbereichen und deren Beziehungen auf latenter Ebene.

 

Instruktionssensitivität von Maßen nichtkognitiver Lernergebnisse

Alexander Naumann1, Burkhard Gniewosz2, Jan Hochweber3, Johannes Hartig1
1DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, 2Paris Lodron Universität Salzburg, 3Pädagogische Hochschule St.Gallen (PHSG)

Schülerleistung in curriculums- oder standardbasierten Tests dient regelmäßig als ein Kriterium für Aussagen über die Effektivität von Unterricht (z.B. Klieme, 2018; Kultusministerkonferenz, 2006; Marsh et al., 2012). Gültige Aussagen über die Unterrichtseffektivität auf Basis der Schülerleistung erfordert Leistungstests, die Wirkungen des Unterrichts erfassen können, also instruktionssensitiv (Polikoff, 2010) sind. Entsprechend wird heutzutage die Instruktionssensitivität (InSe) von Leistungstests regelmäßig untersucht (z.B. Grossman, Cohen, Ronfeldt, & Brown, 2014; Naumann, Rieser, Musow, Hochweber, & Hartig, 2019; Polikoff, 2016). Unterricht hat jedoch vielfältige Erträge, die nicht nur kognitive Fähigkeiten der Schülerinnen und Schüler, sondern auch nichtkognitive Lernergebnisse umfassen (Seidel & Shavelson, 2007). In den letzten Jahren finden diese nichtkognitiven Lernergebnisse wie Motivation oder Interesse zunehmend als Kriterien für Aussagen über die Unterrichtseffektivität Beachtung (z.B. Capella, Aber, & Kim, 2016). Jedoch wird auf Maße für solche nichtkognitiven Lernergebnisse das Konzept von InSe bisher nicht angewendet, so dass die Frage offen bleibt, inwieweit entsprechende Instrumente überhaupt dazu in der Lage sind, Wirkungen des Unterrichts zu erfassen. Ziel unseres Beitrags ist es daher, (a) das Konzept von InSe auf Maße nichtkognitiver Lernergebnisse zu erweitern und (b) exemplarisch die InSe ausgewählter Maße für motivational-affektive Konstrukte zu untersuchen und mit Leistungstestdaten zu vergleichen.

Maße für nichtkognitive Lernergebnisse werden in der Regel als Selbstberichte in Fragebögen mittels Likert-Items erhoben. Wir modellieren die InSe von Likert-Items, indem wir ein längsschnittliches Mehrebenen-IRT-Modell (LMLIRT; Naumann, Hartig, & Hochweber, 2017) zur Messung der InSe von dichotomen Items adaptieren. Im LMLIRT-Modell werden klassenspezifische Veränderungen der Itemschwierigkeit über Messzeitpunkte als Grundlage zur Beurteilung von zwei Facetten von InSe geschätzt: a) globale Sensitivität, die sich auf die mittlere Veränderung der klassenspezifischen Itemschwierigkeit zwischen den Messzeitpunkten bezieht, und b) differentielle Sensitivität, die sich auf die Streuung der Itemschwierigkeitsveränderung über Klassen bezieht. Wir übertragen diesen Ansatz auf das generalisierte Partial Credit Model (GPCM; Muraki, 1992) unter Verwendung der sogenannten erweiterten Parametrisierung (Penfield, Myers, & Wolfe, 2008). In der erweiterten Parametrisierung des GPCM werden als Schwierigkeitsparameter jedes K-stufigen Items ein Lokationsparameter sowie K-1 Schwellenparameter geschätzt. Da die einzelnen Antwortkategorien innerhalb von Likert-Items keine spezifische Information über ein mehr oder weniger hinaus tragen, modellieren wir klassenspezifische Lokationsparameter als Grundlage für die InSe von Likert-Items. Likert-Items können dann als a) insensitiv angesehen werden, wenn die mittlere Veränderung der Lokation nahe Null ist und nicht zwischen Klassen streut, b) global sensitiv, wenn sich die mittlere Lokation zwischen Messzeitpunkten verändert, c) differentiell sensitiv, wenn die Lokationsveränderung zwischen Klassen streut, und d) global und differentiell sensitiv, wenn sowohl b als auch c zutreffen.

Wir wenden diese Konzeptualisierung von InSe auf Items zur Erfassung motivational-affektiver Lernergebnisse an, die im IGEL-Projekt (Decristan et al., 2015) als Kriterien für Aussagen über die Effektivität einer quasi-experimentellen Unterrichtsintervention dienten. Der Datensatz umfasst Schülerantworten von 980 Drittklässlerinnen und Drittklässlern in 54 Klassen an hessischen Grundschulen. Exemplarisch analysieren wir Items zu intrinsischer Motivation, Selbstwirksamkeitserwartung sowie fachspezifischem Interesse. Alle Items zeigten einen guten Fit zum GPCM. Keines der Items war insensitiv. Insgesamt war die Sensitivität im Vergleich zu Leistungstestitems niedrig, jedoch mehrheitlich statistisch bedeutsam.

Neben Schülerleistung dienen Maße für nichtkognitive Lernergebnisse heutzutage häufig als Kriterien zur Beurteilung der Unterrichtseffektivität. Ähnlich wie bei Schülerleistung erfordert dieses Vorgehen empirische Evidenz dafür, inwieweit die verwendeten Instrumente sensitiv für Unterricht sind. Bisher ist dies wenig untersucht. Vor dem Hintergrund, dass ökologisch valide Studien (z.B. Yin et al., 2008) regelmäßig keine Wirkungen von Unterricht auf nichtkognitive Lernergebnisse finden, bleibt somit die Frage offen, ob der Unterricht nicht effektiv oder die Instrumente nicht sensitiv waren. Unser Beitrag schärft das Bewusstsein für dieses Thema und zeigt eine Methode, die InSe von Likert-Items zu messen. Wir hoffen, dass unsere Arbeit so dazu beiträgt, die Validität von Aussagen über Unterricht zu verbessern.

 

Detektion von Unterrichtseffekten – Entscheidung zwischen dem kovarianzanalytischen Ansatz und dem Change-Score-Ansatz in Paneldaten mit zwei Messzeitpunkten

Carmen Köhler, Johannes Hartig
DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation

Theoretischer Hintergrund

In der Unterrichtsforschung liegt ein Schwerpunkt auf der Identifizierung von Lehrerverhalten, das relevante Lernergebnisse auf Seiten der Schüler positiv beeinflusst. Modelle zur Messung solcher Unterrichtseffekte sind komplex, da (a) die nicht beobachtbare Konstrukte von Interesse meist mit mehreren Indikatoren gemessen werden, (b) Forschungsfragen auf Klassenebene die Anwendung von mehrstufigen Modellen erfordern und (c) die relevanten Lernergebnisse mindestens zu zwei Zeitpunkten erfasst werden sollten um feststellen zu können, ob sich Klassen hinsichtlich verschiedener Unterrichtsformen unterschiedlich entwickeln. Zwei prominente mehrstufige Modelle, welche bei der empirischen Analyse solcher Forschungsfragen häufig zur Anwendung kommen sind (1) kovarianzanalytische Ansätze, bei denen die Effekte der Prädiktoren auf das Lernergebnis zum zweiten Messzeitpunkt bei gleichzeitiger Kontrolle des ersten Messzeitpunktes erfolgt (durch die Hinzunahme als Prädiktor), und (2) latente Change-Score-Modelle, bei denen die Differenz des Lernergebnisses zwischen den beiden Messzeitpunkten als zusätzliche latente Variable modelliert wird und die Effekte von Prädiktoren auf diese Differenzvariable geschätzt werden. Beide Ansätze wurden für Anwendungen ohne mehrstufige Datenstruktur ausführlich diskutiert (Allison, 1990; Holland & Rubin, 1982; Lord, 1963; McArdle, 2009).

Fragestellung

In diesem Beitrag wenden wir die Ansätze auf den Bereich der Unterrichtsforschung an und zeigen auf, unter welchen Umständen welches Modell besser zur Messung des Unterrichtseffekts geeignet ist, und welche Schlussfolgerungen sie jeweils erlauben.

Methode

Der Beitrag fokussiert auf mehrstufige Daten mit zwei Messzeitpunkten und einem Prädiktor und entspricht somit einer Datenstruktur, die häufig in der Bildungs- und Unterrichtsforschung zur Analyse von Unterrichtseffekten auf Klassen- oder Schulebene verwendet wird. Mit Hilfe eines theoretischen datengenerierenden Modells identifizieren wir relevante Parameter, welche die Schätzung des Unterrichtseffekts beeinflussen. Durch Variation dieser relevanten Parameter untersuchen wir ihren Einfluss auf den geschätzten Unterrichtseffekt für jeweils den kovarianzanalytischen als auch den Change-Score- Ansatz. Dementsprechend können wir zeigen, unter welchen Annahmen bezüglich der relevanten datengenerierenden Parameter der Unterrichtseffekt ohne Bias geschätzt wird.

Ergebnisse

Die Ergebnisse zeigen, dass in realistischen Szenarien der Unterrichtsforschung kein Ansatz eine unverzerrte Schätzung des Unterrichtseffekts liefert. Unter bestimmten Annahmen zeigen entweder einer oder beide Ansätze unverzerrte Effekte. Forscher sollten daher für jede Konstellation an untersuchten Variablen separat erwägen, welche Annahmen gelten und mit welchem Ansatz sie unverzerrte Unterrichtseffekte erhalten. Anhand empirischer Beispiele aus der Unterrichtsforschung veranschaulichen wir Unterschiede zwischen den geschätzten Unterrichtseffekten. Basierend auf den Annahmen über die relevanten Parameter diskutieren wir für jedes der Beispiele, welches Modell besser geeignet ist. Die Ergebnisse aus dem Beitrag und die empirischen Illustrationen sollen Bildungs- und Unterrichtsforscher bei der Entscheidung über ihr Analysemodell unterstützen

 
9:00 - 10:45F9‒H04: Nutzung von Lerngelegenheiten im Unterricht: Ansätze zur empirischen Erforschung und deren Herausforderungen
H03/H04 
 

Nutzung von Lerngelegenheiten im Unterricht: Ansätze zur empirischen Erforschung und deren Herausforderungen

Chair(s): Anna-Katharina Praetorius (Universität Zürich, Schweiz)

DiskutantIn(nen): Svenja Vieluf (DIPF)

Angebots-Nutzungs-Modelle werden im deutschsprachigen Raum sehr häufig als Rahmen für die empirische Unterrichtsforschung herangezogen. Eine zentrale Annahme dieser Modelle ist, dass Unterricht eine Lerngelegenheit für Schüler*innen darstellt, die von ihnen genutzt werden muss, um zu positiven Wirkungen auf Seiten der Schülerinnen und Schüler zu führen (z.B. Fend, 2008). Während es zum unterrichtlichen Angebot eine Vielzahl an empirischen Studien gibt, existieren bislang kaum Studien im Kontext der Unterrichtsforschung, die auch die Nutzungskomponente empirisch in den Blick nehmen. Neben methodischen Herausforderungen bezüglich deren adäquater Erfassung ist dies auch darauf zurückzuführen, dass sich bislang kein einheitliches Verständnis etabliert hat, was unter dem Nutzungsbegriff zu verstehen ist (für einen Überblick siehe Vieluf, Praetorius, Rakoczy, Kleinknecht & Pietsch, in Druck). Neben Publikationen, in denen der verwendete Nutzungsbegriff nicht näher ausgeführt wird, unterscheiden sich diejenigen Publikationen, die eine Spezifikation enthalten, danach, ob neben kognitiven Lernprozessen (z.B. Klieme et al., 2006; Kunter & Trautwein, 2013; Seidel, 2014) auch Motivation und Emotionen (z.B. Klieme et al, 2006; Seidel, 2014) oder äußere Aktivitäten wie beispielsweise die Beteiligung an Gesprächen (z.B. Kunter & Trautwein, 2013; Seidel, 2014) als Nutzung gefasst wird. Diese Einordnungen lassen sich kritisch hinterfragen. So kann beispielsweise argumentiert werden, dass äußere Aktivitäten von Schüler*innen zum einen nicht unbedingt auf die Nutzung schließen lassen. Zum anderen stellen sie oftmals auch eine Lerngelegenheit für Mitschüler*innen dar und könnten somit zusätzlich als Teil des Angebots aufgefasst werden (siehe Vieluf et al., in Druck). Zeitgleich weisen äußere Lernaktivitäten aufgrund ihrer besseren Beobachtbarkeit bezüglich der empirischen Erfassung einen deutlichen Vorteil gegenüber inneren Aktivitäten auf.

Zusammenfassend lässt sich also festhalten, dass bezüglich einer Erforschung der Nutzung von Lerngelegenheiten durch Schüler*innen sowohl konzeptuell als auch methodisch Diskussionsbedarf besteht. Dies stellt daher den Fokus des Symposiums dar. In allen Vorträgen wird dazu auf konzeptueller Ebene Nutzung explizit definiert und vom Angebot abgegrenzt, eine mögliche empirische Herangehensweise an die Untersuchung der Nutzung vorgestellt sowie eine kritische Diskussion angeschlossen, die sich mit den Vor- und Nachteilen der jeweiligen konzeptuellen und methodischen Entscheidungen auseinandersetzt.

Im ersten Beitrag von Fauth et al. wird Nutzung als aktive Beteiligung am Klassengespräch (hier: Meldungen und Vorhandensein verbaler Beteiligung) gefasst. Im Fokus der Untersuchung im naturwissenschaftlichen Sachunterricht der Grundschule stehen die videobasierte Erfassung aktiver Beteiligung am Unterrichtsgespräch, die Bedeutung individueller Hintergrundmerkmale von Schüler*innen für die aktive Beteiligung sowie ihr Zusammenhang mit dem Lernerfolg. Auch der zweite Beitrag von Hess et al. nimmt die Beteiligung von Schüler*innen am Unterrichtsgespräch (hier: Meldungen und Art der geleisteten Beiträge) in den Blick. Mittels videobasierter Analysen von Kunstunterricht in der Grundschule wird im Beitrag auf die Häufigkeit und Art der Beteiligung von Schüler*innen eingegangen, welche in Zusammenhang mit dem unterrichtlichen Angebot gesetzt wird. Troll et al. fokussieren im dritten Beitrag die Aufmerksamkeit von Schüler*innen als Nutzungskomponente und untersuchen mittels multiperspektivischen Videoaufnahmen im Deutschunterricht der Grundschule mit einem methodischen Schwerpunkt die Frage danach, mit welchen Beobachtungsintervallen eine reliable Messung der Aufmerksamkeit möglich ist und wie das Aufmerksamkeitsverhalten innerhalb und zwischen Schüler*innen über den Verlauf einer Unterrichtsstunde variiert. Im vierten Beitrag nehmen Rakoczy et al. die Unterrichtswahrnehmung, das subjektive unterrichtliche Erleben und die Motivation von Sekundarstufenschüler*innen im Kunstunterricht in den Blick. Mittels eines auf Schülerwahrnehmungen bezogenen Experience-Sampling-Verfahrens untersuchen die Autor*innen deren intraindividuelle sowie klassenspezifische Verläufe im Rahmen von Unterrichtsstunden sowie den Zusammenhang zwischen Unterrichtswahrnehmung, subjektivem Erleben und Motivation.

 

Beiträge des Symposiums

 

Individuelle Beteiligung am Unterrichtsgespräch: Differenzielles Angebot und differenzielle Nutzung

Benjamin Fauth1, Jasmin Decristan2, Eva Lena Heide3, Franziska Maria Locher4, Bianca Troll5, Csaba Kurucz6, Mareike Kunter3
1Institut für Bildungsanalysen Baden-Württemberg (IBBW), 2Bergische Universität Wuppertal, 3Goethe-Universität Frankfurt, 4Universität Bamberg, 5Universität Lüneburg, 6Freie Universität Berlin

Theoretischer Hintergrund

Im vorliegenden Beitrag fokussieren wir die aktive Beteiligung von Schülerinnen und Schülern (SuS) am Klassengespräch als empirischen Indikator für die Nutzung des Unterrichts und Aufrufe durch die Lehrkräfte als Indikator für die Angebotsseite. Beides wird im Rahmen des Klassengesprächs untersucht und damit in einer Sozialform, die noch vielfach den Unterricht dominiert (Vieluf et al., in Druck).

Die Meldung eines Schülers oder einer Schülerin zeigt zum einen die eigene Bereitschaft, sich am Unterrichtsgespräch zu beteiligen und zum anderen, dass man selbst dem Unterrichtsgeschehen aufmerksam folgt, also „on task“ ist (Cobb, 1972; Fiedler et al., 2002). Sowohl die Meldung als auch das einfache Reinrufen sind einer schülergesteuerten Beteiligung zuzuordnen. Ebenso lässt sich das Aufrufen durch die Lehrkraft als lehrkraftgesteuerte Beteiligung charakterisieren (Lipowsky et al., 2007; Sacher, 1995). Je nach individuellem Hintergrund der SuS wird dieselbe Lehrerfrage unterschiedlich verarbeitet und in diesem Sinne differenziell genutzt werden. Jedoch kann auch das Angebot selbst für die Lernenden unterschiedlich aussehen – je nachdem ob ein Schüler oder eine Schülerin von der Lehrkraft aufgerufen wird oder nicht (differenzielles Unterrichtsangebot).

Fragestellung

1. Wie häufig treten die schüler- und lehrkraftgesteuerte Beteiligung (als differenzielle Nutzung und differenzielles Angebot) auf?

2. Welche Rolle spielen individuelle Hintergrundmerkmale der SuS für beide Beteiligungsformen?

3. Welche Zusammenhänge zeigen sich zwischen den Beteiligungsformen und dem Lernerfolg der SuS?

Methode

Die Daten stammen aus einer Längsschnittstudie im naturwissenschaftlichen Sachunterricht an Grundschulen. Einbezogen wurden 35 Klassen (35 Lehrkräfte mit 628 Kindern, im Mittel ca. 9 Jahre alt), in denen zwei Unterrichtseinheiten zum Thema Schwimmen und Sinken unterrichtet wurden. Bei den SuS wurden kognitive Grundfähigkeiten, Sprachverständnis, naturwissenschaftliche Kompetenz, Interesse, intrinsische Motivation, Migrationshintergrund, SÖS und Geschlecht sowie Prä- und Posttestleistungen im Fachinhalt erfasst.

Zwischen Prä- und Posttestleitungen wurde der Unterricht videographiert. Für die Studie wurde eine etwa zehnminütige Phase eines Unterrichtsgesprächs kodiert. Dabei wurden verbale Beteiligungen und Meldungen der Kinder erfasst. Immer, wenn ein Kind am Unterrichtsgespräch beteiligt war (d.h. aufgerufen wurde oder reinrief), wurde eine Beteiligung (ein Fall) kodiert (n=893 Fälle; Beurteilerübereinstimmung: 78%). Zu jedem Fall wurde kodiert, welche weiteren Kinder sich gemeldet hatten, aber nicht aufgerufen wurden. Zudem wurden 1,740 zusätzliche Meldungen (Beurteilerübereinstimmung: 78%) kodiert. N=182 (29.0%) der 628 Kinder waren in der Unterrichtssequenz nicht beteiligt.

Ergebnisse

Bei 416 Kindern wurde eine schülergesteuerte Beteiligung kodiert (mindestens einmal am Unterricht aktiv beteiligt), für 324 Kinder wurde eine lehrkraftgesteuerte Beteiligung kodieren. Schüler- und lehrkraftgesteuerte Beteiligung überschnitten sich bei 294 Kindern (Aufruf nach Meldung). In der Sequenz wurden damit nur 4.7% der SuS ausschließlich durch die Lehrkraft beteiligt (Aufruf ohne Meldung).

In logistischen Regressionsanalysen erwiesen sich Vorwissen und Sprachverständnis als entscheidend für die schülergesteuerte Beteiligung, für die lehrkraftgesteuerte Beteiligung waren es Vorwissen und Migrationshintergrund der Kinder. Es zeigt sich in den Daten also sowohl eine differenzielle Nutzung als auch ein differenzielles Angebot in Abhängigkeit des individuellen Hintergrunds der SuS.

In den Analysen zum Lernerfolg zeigt sich, dass jene SuS, die während der Sequenz mindestens einmal im Sinne der schülergesteuerten Beteiligung beteiligt waren, nach den Einheiten signifikant mehr gelernt hatten. Vergleicht man jedoch jene SuS, die nach Meldung aufgerufen wurden, mit jenen, die nach Meldung nicht aufgerufen wurden (lehrkraftgesteuerte Beteiligung nach Meldung), so zeigten sich keine signifikanten Unterschiede. Aspekte der differentiellen Nutzung scheinen also für den Lernerfolg entscheidender zu sein als Aspekte des differenziellen Angebots.

Während der hier untersuchten Sequenz wird es sicher Kinder gegeben haben, die nicht aktiv beteiligt waren (nach der verwendeten Operationalisierung also das Unterrichtsangebot nicht genutzt haben) und trotzdem hinzugelernt haben. Die Ergebnisse unserer Studie zeigen jedoch, dass es sich bei den nicht-beteiligten SuS um eine potenzielle Risikogruppe handelt, die in der pädagogischen Praxis besonders im Blick behalten werden sollte.

 

Guter Unterricht = gute Schülerbeiträge? Zum Zusammenspiel von Angebot und Nutzung im Kunstunterricht

Miriam Hess1, Ann-Katrin Denn2, Frank Lipowsky2
1Universität Erlangen-Nürnberg, 2Universität Kassel

Hintergrund

Angebots-Nutzungsmodelle erfreuen sich großer Beliebtheit, um Determinanten auf das Lernen von Schülerinnen und Schülern zu systematisieren. In Videostudien werden vorwiegend Aspekte des Angebots, seltener Aspekte der Nutzung dieses Unterrichtsangebots durch die Lernenden fokussiert. Auch theoretisch-konzeptionell ist nur unzureichend geklärt, welche Prozesse und Aktivitäten sich genau der Nutzung zuordnen lassen. Diskutiert wird beispielsweise, ob auch äußere, beobachtbare Aktivitäten – wie der soziale Austausch (Kunter & Trautwein, 2013) und die Beteiligung an Gesprächen (Seidel, 2014) – zur Nutzung gezählt werden sollten (Vieluf et al., in Druck). Die Beteiligung am Unterrichtsgespräch steht auch im Fokus des Vortrags.

Fragestellung und Forschungsstand

In dem Beitrag wird untersucht, inwiefern die Beteiligung von Lernenden im Kunstunterricht des zweiten Schuljahres sowie die Art ihrer verbalen Beiträge als ausgewählte Facetten der Nutzung mit individuellen Lernvoraussetzungen und dem Unterrichtsangebot in Beziehung stehen. In bisherigen videobasierten Studien zeigen sich beispielsweise positive Zusammenhänge zwischen dem unterstützendem Unterrichtsklima und effektiver Klassenführung einerseits und der Häufigkeit von Meldungen (Denn et al., 2018) und der gleichmäßigen Verteilung der Schülerbeiträge im öffentlichen Unterrichtsgespräch andererseits sowie zwischen der kognitiven Aktivierung und der Länge der Schüleräußerungen (Lipowsky et al., 2008). Die Art der Schülerbeiträge wurde noch nicht mit dem Unterrichtsangebot in Beziehung gesetzt. In der vorliegenden Studie wird die Sinnhaftigkeit, die Neuheit und die Elaboriertheit von Schülerbeiträgen fokussiert und analysiert, inwiefern die Basisdimensionen der Unterrichtsqualität einen Einfluss auf die Sinnhaftigkeit, die Neuheit und die Elaboriertheit von Schülerbeiträgen ausüben.

Methode

Die Datengrundlage bilden 33 im Kunstunterricht des zweiten Schuljahres unter standardisierten Bedingungen videografierte ca. 90-minütige Unterrichtseinheiten aus der Längsschnittstudie PERLE (Berner et al., 2013). In den Unterrichtsstunden fand zunächst eine Bildrezeption statt, anschließend eine Produktionsphase, in der die Kinder eigene Plastiken gestalten sollten, sowie eine abschließende Reflexion. Für alle öffentlichen Unterrichtsphasen wurden die Meldungen und Aufrufe der Lernenden niedrig inferent im Event-Sampling-Verfahren kodiert (Hess & Denn, 2019). Jeder Schülerbeitrag wurde anschließend mit den Kategorien „Sinnhaftigkeit“, „Neuheit“ und „Elaboriertheit“ genauer kodiert (Lomtatidse, Hess & Denn, 2019). Das Unterrichtsangebot wurde mit hoch inferenten Ratings eingeschätzt (Gabriel, 2014; Schmidt, 2016:). Alle Beobachtungsinstrumente erfüllen die Voraussetzungen an die Reliabilität und Objektivität von Kodierungen und Ratings (Lotz et al., 2013). Die Voraussetzungen der Schülerinnen und Schüler wurden mit standardisierten Tests erhoben (z.B. Intelligenz, Kreativität, Selbstkonzept; Greb et al., 2011).

Ergebnisse

In den videografierten Unterrichtsstunden kommen in den einzelnen Klassen im Schnitt 3.42 Meldungen pro Minute vor (SD=1.38). Durchschnittlich 1.77 Mal pro Minute wird ein Kind aufgerufen (Min=0.80; Max=3.29; SD=0.47). Der Anteil erfolgreicher Meldungen liegt in den Klassen zwischen 19.98% und 60.10% (M=39.51; SD=11.79). Mit durchschnittlich 94.49% (SD=3.80) ist der Anteil sinnhafter Beiträge sehr hoch, neue Beiträge kommen hingegen nur selten vor (M=10.92%; SD=6.15). 31.87% der Beiträge sind elaboriert (SD=15.87%). Beiträge, die sinnhaft, neu und elaboriert sind kommen in 6.80% der Fälle vor (SD=5.31%). Korrelative Analysen zwischen individuellen Schülervoraussetzungen und der Häufigkeit und Art der Beiträge ergeben keine (z.B. Intelligenz) oder nur geringe Zusammenhänge (z.B. Geschlecht). Zwischen den Basisdimensionen der Unterrichtsqualität auf der Angebotsseite und der reinen Häufigkeit der Beteiligung der Kinder am Unterricht ergeben sich ebenfalls kaum Zusammenhänge. Der prozentuale Anteil sinnhafter und neuer Beiträge ist aber höher, je positiver das Classroom Management und das Unterrichtsklima ausgeprägt sind. Einzelne Aspekte kognitiver Aktivierung hängen außerdem positiv mit sinnhaften, neuen und elaborierten Schülerbeiträgen zusammen.

Diskussion

Abschließend wird diskutiert, inwiefern die Häufigkeit und die Art der Schülerbeiträge tatsächlich Facetten der Nutzung des Unterrichtsangebots darstellen und inwiefern eine klare Trennung von Angebots- und Nutzungsseite überhaupt möglich ist. So ist zwar denkbar, dass ein positiv ausgeprägtes Classroom Management tatsächlich eine höhere Partizipation ermöglicht. Andererseits lässt sich nur schwer ausmachen, inwiefern das Beteiligungsverhalten der Lernenden umgekehrt auch Ratings zur Unterrichtsqualität beeinflusst.

 

Erfassung von Aufmerksamkeitsverhalten im Grundschulunterricht. Eine Analyse der Generalisierbarkeit und Zuverlässigkeit von Beobachtungsintervallen

Bianka Troll, Marcus Pietsch, Michael Besser
Leuphana Universität Lüneburg

Theoretischer Hintergrund und Fragestellung

In aktuellen Überlegungen zum Angebot-Nutzungs-Modell (Vieluf et al., in Druck) wird Unterricht als ein ko-konstuktiver Prozess konzeptualisiert, welcher durch die Interaktion von Lehrenden und Lernenden miteinander sowie einen fachlichen Inhalt gestaltet wird. Vieluf und Kolleg*innen nehmen eine reziproke Beziehung zwischen Lernangebot und Nutzung an, die durch die Wahrnehmung und Interpretation seitens der Schüler*innen geprägt ist. Nutzung wird als „ein komplexer Prozess verstanden, in dem sich Kognitionen, emotionales und motivationales Erleben ständig gegenseitig beeinflussen“ (Vieluf et al., in Druck). Um die Nutzung von Lernangeboten zu erfassen, kann auf das Konstrukt der Aufmerksamkeit verwiesen werden. Es ist eng mit Theorien der Informationsverarbeitung verbunden (Orphardt & Thiel, 2015) und unterliegt verschiedenen kognitiven und lernrelevanten Prozessen (wie Selektion und Fokussierung, Ablenkungsresistenz etc.). Aufmerksamkeit wird als zentrale Voraussetzung erfolgreichen Wissenserwerbs verstanden (Hommel, 2012a). Die Operationalisierung unterliegt der Problematik, dass diese nicht direkt beobachtbar ist. Es wird versucht, aus bestimmten äußeren Lernaktivitäten (verbale Beteiligung, Blickzuwendung etc.) Rückschlüsse auf die Aufmerksamkeit von Schüler*innen zu ziehen. Aufmerksamkeit wird in diesem Sinne „als Verhalten, das der didaktisch/inhaltlichen Thematik der jeweiligen Lehr-Lernsituation zuordenbar ist“, operationalisiert (Hommel, 2012a, S. 34) und häufig als Time-on-task bezeichnet. Sie zeichnet sich durch einen wellenförmigen Verlauf aus (Hommel, 2012a).

Zur Erfassung werden vielfältige Beobachtungsinstrumente eingesetzt (Sieber et al., 2019), denen jeweils unterschiedliche Sequenzierung zugrunde liegen (z. B. 5-Sekunden Intervall bei Ranger (2017), 30-Sekunden-Intervall bei Hommel (2012b)). Die vorliegende Videostudie untersucht daher, welche Sequenzierung von Beobachtungsintervallen angesetzt werden müsste, um das Aufmerksamkeitsverhalten reliabel messen zu können. Anhand einer geeigneten Sequenzierung wird ebenso analysiert, inwiefern Unterschiede im Aufmerksamkeitsverhalten innerhalb und zwischen den Schüler*innen über den Verlauf einer Unterrichtsstunde bestehen.

Methode

Die Grundlage der Analysen bildet eine multiperspektivische Unterrichtsstunde (17 Kameraperspektiven) einer dritten Grundschulklasse im Fach Deutsch (24 Schüler*innen – 25 Minuten aktive Lernphasen). Dies bietet den Vorteil, dass für alle Schüler*innen der Klasse zu jeder Zeit Informationen vorliegen. Die Aufmerksamkeit wurde über das für die vorliegende Stunde leicht adaptierte Münchner Aufmerksamkeitsinventar erfasst (Helmke & Renkl, 1992, in Anlehnung an Ranger, 2017; Hommel, 2012b). Die äußeren Lernaktivitäten gliedern sich in fünf Ausprägungen: Off-Task aktiv/störend; Off-Task passiv; On-Task passiv; On-task aktiv/fremd-initiiert; On-Task aktiv/selbst-initiiert. In Ein-Sekunden-Intervallen wurde das Aufmerksamkeitsverhalten von vier Kodiererinnen analysiert (moderate Beurteilerübereinstimmung Fleiss Kappa k = .60; Döring & Bortz, 2016). Zur Beantwortung der Fragestellungen wurde eine Generalisierbarkeitsstudie mit Entscheidungsstudie berechnet (Brennan, 2001).

Ergebnisse und Diskussion

Für das Ein-Sekunden-Intervall liegt der G-Koeffizient bei p² = .99, der D-Koeffizient ebenso bei 𝛷 =.99, was für eine sehr gute Reliabilität spricht. Die Ergebnisse hinsichtlich einer Variation innerhalb der Beobachtungsintervalle zeigen, dass die Generalisierbarkeit und Zuverlässigkeit der Daten mit der Intervallgröße sinkt, aber immer noch ausreichend hoch bleibt. Bei einem 10-Sekunden-Intervall liegt der G-Koeffizient bei p²=.92, der D-Koeffizient bei 𝛷=.91. Wenn ein 30-Sekunden-Intervall zugrunde gelegt wird sinkt der G-Koeffizient auf p²=.79, der D-Koeffizient auf 𝛷=.77, was noch immer ein gutes Ergebnis darstellt. Für die Beobachtung des Aufmerksamkeitsverhaltens kann demnach ein 30-Sekunden Intervall zugrunde gelegt werden. Dennoch bleibt es zu berücksichtigen, dass auch in diesem Intervall auf Einzelfallebene Interaktion stattfinden und sich Varianz finden kann. Interaktionsanalysen böten hier Möglichkeiten, dies genauer und kleinteiliger zu analysieren. So erscheint eine klare Trennung von Lernangebot und dessen Nutzung jedoch als schwierig, da in der Interaktion Angebote durch z. B. verbale Beteiligung geschaffen werden.

Die Ergebnisse der Varianzkomponentenschätzung zeigen, dass ein geringer Teil durch die Unterschiede zwischen den Schüler*innen aufgeklärt wird (10.4%). Das Aufmerksamkeitsverhalten wird demnach wenig über das situative Verhalten der Schüler*innen erklärt. Die Varianzaufklärung durch die Zeit liegt bei 5.8%. Die durch dieses Design nicht aufgeklärte Residualvarianz beträgt 83.7%. In weiterführenden Analysen wird daher untersucht, welche weiteren Einflussfaktoren (Lernvoraussetzungen, Unterrichtsphasen, Gruppenzusammensetzung) das Aufmerksamkeits-verhalten von Grundschüler*innen erklären können.

 

Einmal begeistert, immer begeistert? Eine Experience-Sampling-Studie zur Unterrichtswahrnehmung und Motivation im Kunstunterricht

Katrin Rakoczy1, Ulrich Frick2, Susanne Weiß1, Miles Tilon2, Ernst Wagner3
1Leibniz-institut für Bildungsforschung und Bildungsinformation, 2HSD Hochschule Döpfer, Köln, 3Akademie der Bildenden Künste, München

Theorie

In der quantitativ-empirischen Unterrichtsforschung ist die Angebots-Nutzungskonzeption von Unterricht weit verbreitet (z.B. Helmke, 2010). Fachspezifische Lerngelegenheiten, die im Unterricht angeboten werden, müssen demnach von den Lernenden auch wahrgenommen und genutzt werden, um Wirkung entfalten zu können. Daraus ableitbar genügt es nicht, Unterrichtsmerkmale über pro Klasse aggregierte, retrospektiv erhobene Schüler*innenwahrnehmungen zu erfassen und diese anschließend mit Lernerfolgskriterien zu korrelieren, wie in zahlreichen Studien realisiert (z.B. Fauth et al., 2014; Klieme et al., 2009). Um Aufschluss über das komplexe Wechselspiel zwischen Unterrichtsangebot, subjektiver Wahrnehmung und Lernerfolg zu bekommen, ist es notwendig, die Unterrichtswahrnehmung und das subjektive Erleben der Lernenden zu wiederholten Zeitpunkten während des Unterrichts zu betrachten und aufeinander zu beziehen. Zur Erfassung subjektiven Erlebens in konkreten Situationen und ohne Verzerrungen durch retrospektive Erinnerungsartefakte hat sich die Experience-Sampling-Methode bewährt (Hektner et al., 2007). Erste Erfahrungen mit der Erfassung von Unterrichtswahrnehmungen zeigen, dass diese Methode grundsätzlich im Unterricht anwendbar ist (Götz et al., 2013).

Ziel der vorliegenden Studie war es, ein Instrument zur Erfassung der Unterrichtswahrnehmung, des subjektiven Erlebens und der Motivation der Lernenden zu mehreren Zeitpunkten während des Kunstunterrichts zu entwickeln und einzusetzen. Die so gewonnenen Verlaufsdaten sollen Aufschluss darüber geben, ob es charakteristische Verlaufsformen der jeweiligen Konstrukte im Unterricht gibt (1), ob sich Klassen in diesen Verläufen unterscheiden (2) und wie stark ggf. intraindividuelle Schwankungen diese charakteristischen Verläufe überformen (3). Schließlich wurde untersucht, ob sich auf intraindividueller Ebene die auf interindividueller Ebene bereits nachgewiesenen Zusammenhänge zwischen Unterrichtswahrnehmung, subjektivem Erleben (hier exemplarisch: Autonomieerleben) und Motivation zeigen (4).

Methode

Die Fragestellungen wurden im Rahmen des BMBF-Verbundprojekts „Bildkompetenz in der Kulturellen Bildung (BKKB)“ untersucht, welches vom Leibniz-Institut für Bildungsforschung und Bildungsinformation gemeinsam mit der HSD Hochschule Döpfer durchgeführt wird. 222 Schüler*innen aus neun Klassen der 9. und 10. Jahrgangsstufe wurden tabletbasiert während zwei Doppelstunden Kunstunterricht zu jeweils fünf festgelegten Zeitpunkten zu 17 Items befragt. Jede*r Lernende gab also zu insgesamt zehn Zeitpunkten an, wie sie/er den Kunstunterricht wahrnimmt und erlebt und wie motiviert sie/er ist. Die Unterrichtswahrnehmungen (intendiertes Unterrichtshandeln, Unterstützung der Wissenskonstruktion, Autonomieunterstützung), das subjektive Erleben (ästhetisches Erleben, Kompetenzerleben, Autonomieerleben) und die selbstbestimmte Motivation wurden mittels Einzelitems oder anhand von Fragebogenskalen erfasst. Die internen Konsistenzen der Skalen reichten von α = .52 bis .88.

Ergebnisse

Fragestellung 1: Graphische Darstellungen der Unterrichtswahrnehmung, des subjektiven Erlebens und der Motivation über alle neun Klassen pro Zeitpunkt zeigen unterschiedliche Verläufe. Beispielsweise nehmen Lernende jeweils zu Beginn der Doppelstunden eine besonders hohe Ausprägung des intendierten Unterrichtshandelns wahr, während das ästhetische Erleben über die beiden Doppelstunden ansteigt. Es finden sich keine Hinweise auf Heteroskedaszidität.

Fragestellung 2: Graphische Darstellungen der Unterrichtswahrnehmung, des subjektiven Erlebens und der Motivation pro Zeitpunkt und Klasse zeigen erhebliche Unterschiede zwischen den Klassen. Die Intraklassenkorrelationen der über die Schüler*innen pro Klasse aggregierten Einschätzungen je Zeitpunkt liegen zwischen .12 (Autonomieunterstützung) und .48 (Motivation). D.h. der Anteil der Varianz zwischen den Zeitpunkten pro Klasse schwankt stark in Abhängigkeit des betrachteten Konstrukts.

Fragestellung 3: Die Intraklassenkorrelationen der über die Zeitpunkte pro Schüler*in aggregierten Einschätzungen liegen zwischen .32 (Unterstützung der Wissenskonstruktion) und .58 (ästhetisches Erleben) und zeigen damit, dass eine beträchtliche intraindividuelle Variabilität in den Einschätzungen vorliegt.

Fragestellung 4: Mehrebenenanalysen (L1=Zeitpunkt, L2=Schüler*in) zeigen, dass die pro Zeitpunkt wahrgenommene Unterstützung der Wissenskonstruktion und Autonomieunterstützung einen signifikanten direkten Beitrag zur selbstbestimmten Motivation leisten und alle drei Aspekte der Unterrichtswahrnehmung über das Autonomieerleben vermittelte indirekte Effekte aufweisen. Auf Lernendenebene zeigen sich für intendiertes Unterrichtshandeln und Autonomieunterstützung ebenfalls indirekte Effekte. Aufgrund fehlender (positiver) direkter Effekte zeigen sich jedoch keine totalen Effekte auf die selbstbestimmte Motivation auf L2.

In weiteren Analyseschritten wird geprüft, inwiefern Schwankungen der Mittelwerte über die Zeit sowie intraindividuelle Varianzen vom Unterrichtshandeln auf Klassenebene und von individuellen Voraussetzungen abhängen.

 
9:00 - 10:45F9‒H05: Lehren und Lernen mit Virtual und Augmented Reality
H05 
 

Lehren und Lernen mit Virtual und Augmented Reality

Chair(s): Sebastian Habig (Universität Duisburg-Essen), Sarah Malone (Universität des Saarlandes)

DiskutantIn(nen): Detlev Leutner (Universität Duisburg-Essen)

Die Begriffe Virtual und Augmented Reality (VR/AR) bezeichnen die Einbettung digitaler Inhalte in reale Umgebungen in Echtzeit (Azuma, 1997). Vor dem Hintergrund der rasanten technischen Entwicklung und der Digitalisierung von Lernangeboten wird VR und AR Lernszenarien großes Potential zugeschrieben, um innovative, lern- und motivationsförderliche Lerngelegenheiten für verschiedenste fachliche Domänen zu schaffen (Chen, 2016; Garzotto, Gelsomini, Occhiuto, Matarazzo, & Messina, 2017; Kesim & Ozarslan, 2012). Obwohl in den letzten Jahren zahlreiche VR/AR Lernsettings entwickelt wurden, ist bisher jedoch relativ wenig darüber bekannt, unter welchen konkreten Bedingungen diese eine lern- bzw. motivationsförderliche Wirkung haben und welche Rolle kognitive und affektive Lernvoraussetzungen in diesem Zusammenhang spielen (Bacca et al., 2014; Ibánez & Kloos, 2018; Radu, 2014).

Das Ziel dieses interdisziplinären Symposiums ist es, Ergebnisse bisheriger Forschung zum Einsatz von VR/AR Lernsettings zusammenzuführen und vor dem Hintergrund einer gemeinsamen theoretischen Basis zu diskutieren. Die fünf Beiträge dieses Symposiums beleuchten aus kognitionspsychologischer und fachdidaktischer Sicht bedeutende individuelle Faktoren und deren potentielle Bedeutung für das Lernen mit VR/AR an Schulen, Universitäten und beruflichen Ausbildungsstätten. Darüber hinaus werden, basierend auf den Ergebnissen der Studien, Implikationen für die Gestaltung von VR/AR Lernszenarien abgeleitet.

Im ersten Beitrag von Albus und Kolleginnen werden kognitionspsychologische Gestaltungsprinzipien des Lernens mit Medien (Mayer, 2005, 2009) bezüglich ihrer Gültigkeit innerhalb von Virtual Reality Lernsettings geprüft. Konkret wird mittels einer experimentellen Studie untersucht, welche Rolle Annotationen in virtuellen Lernsettings im Vergleich zu einer Kontrollgruppe spielen. Erste Ergebnisse zeigen differentielle Wirkungen der eingesetzten Lernsettings hinsichtlich des germane cognitive load.

Der zweite Beitrag von Tangocci und Bannert beleuchtet die Wirkung eines virtuellen Lernsettings für Berufsschülerinnen und -schüler hinsichtlich Lernleistungs- und motivationalen Variablen im Vergleich zu einem äquivalenten, Tablet-basierten Lernszenario. Darüber hinaus wird die Frage untersucht, inwieweit VR einen Einfluss auf die Akzeptanz dieser Technologie von Berufsschülerinnen und -schülern im Vergleich zum traditionellen Lernen hat. Auch in diesem Beitrag werden die Ergebnisse vor dem Hintergrund von Theorien zum Lernen mit Medien diskutiert.

Im dritten Beitrag von Keller et al. wird eine experimentelle Studie vorgestellt, in deren Rahmen vergleichend die Effekte einer Lernumgebung untersucht werden, die klassische textbasierte Information mit AR Repräsentationen verknüpft. Es wird dabei angenommen, dass durch die Visualisierung von dreidimensionalen Informationen mittels AR die extrinsische kognitive Belastung beim Lernen im Vergleich zu einer Kontrollgruppe, gesenkt werden kann. Der Beitrag fokussiert ebenso die wahrgenommene Benutzerfreundlichkeit der eingesetzten Lernanwendung, deren Zusammenhang zur kognitiven Belastung und die Rolle von räumlichen Fähigkeiten beim Lernen mit AR.

Der vierte Beitrag von Go & Zinn beschäftigt sich, ebenso wie Beitrag zwei, mit dem Einsatz von Virtual Reality in der beruflichen Bildung. Am Beispiel der Anwendung Virtual Physical Sensor Laboratory (VPSL) wird unter anderem der Zusammenhang zwischen dem Konstrukt spatial presence und dem flow-Erleben der Teilnehmenden untersucht. Darüber hinaus werden Implikationen für die Gestaltung von VR-Lernszenarien abgeleitet.

Im fünften Beitrag von Altmeyer et al. wird der Einsatz von AR beim Experimentieren zu Reihen- und Parallelschaltung im Physikunterricht untersucht. In einer AR-Bedingung werden Echtzeit-Messwerte genau über den korrespondierenden Bauteilen in Stromkreisen angezeigt und somit das Prinzip der räumlichen Kontiguität verwirklicht. Dieses besagt, dass durch integrierte statt Split-Source-Formate extrinsische Belastung reduziert und generatives Lernen und somit der Erwerb von Konzeptwissen gestützt werden kann. In einem Zwei-Gruppen-Pretest-Posttestdesign, werden sowohl kognitive Belastung als auch der Erwerb von Konzeptwissen in der AR-Bedingung mit einer Bedingung, bei der die Messwerte auf einer externen Anzeige präsentiert werden, vergleichen.

Abschließend wird Detlev Leutner die vorgestellten Beiträge kritisch beleuchten und die Frage thematisieren, inwieweit gängige Theorien zum Lernen mit Medien tragfähig erscheinen, um Ergebnisse zu VR/AR Lernszenarien zu interpretieren und Prinzipien zur Gestaltung von VR/AR Lernszenarien abzuleiten.

 

Beiträge des Symposiums

 

Lernen der Zukunft – Welchen Einfluss haben Gestaltungsprinzipen in Virtual Reality auf Lernerfolg und Cognitive Load

Patrick Albus, Andrea Vogt, Tina Seufert
Universität Ulm

Theoretischer Hintergrund

Mit der fortschreitenden technologischen Entwicklung und der immer umfassenderen technischen Infrastruktur an Schulen eröffnen sich neue Möglichkeiten Wissen zu vermitteln. Ob dabei der Einsatz neuer Medien wie Virtual-Reality-Brillen sinnvoll ist, wurde bisher kaum erforscht. Die marginal vorhandenen empirischen Befunde betrachten bisher die Lernprozesse wenig differenziert und zeigen eher oberflächliche beispielsweise motivationale Effekte (Merchant, Goetz, Cifuentes, Keeney-Kennicutt, & Davis, 2014). Um virtuelle Lernumgebungen lernförderlich zu gestalten, ist es wichtig, die kognitiven Prozesse, die durch das Design unterstützt werden sollen, zu verstehen. Dabei stellt sich die Frage, inwieweit sich die kognitiven Prozesse, die beim Lernen mit multimedialen Lernumgebungen angenommen werden auf das Lernen mit VR übertragen lassen. Die Cognitive Theory of Multimedia Learning (CTML) von Mayer (Mayer, 2005) beschreibt die Prozesse bei der Verarbeitung von Text und Bild als einander ergänzende Verarbeitungsstränge. Texte sollten deshalb mit Bildern ergänzt werden (multimedia principle), und das Design solcher Text-Bild-Kombinationen sollte dabei spezifischen Gestaltungsprinzipien folgen (Mayer, 2005). Ein Beispiel ist das räumliche Kontiguitätsprinzip, welches empfiehlt, dass Textteile möglichst nahe am oder im Bild platziert sein sollten, um Suchprozesse zu erleichtern und die Aufteilung der Aufmerksamkeit und damit auch den extraneous cognitive load zu reduzieren (Sweller, 2005). Konkret können in Bildern Textteile direkt an die korrespondierenden Bildelemente geschrieben werden, um die Integration der Informationen zu erleichtern. Dieses Annotationsprinzip wäre auch in virtuellen Lernumgebungen möglich.

Wenn Lernende weniger kognitive Anstrengung in unnötige Such- und Orientierungsprozesse investieren müssen, könnten sie die frei gewordene Kapazität auch für eine intensivere Verarbeitung einsetzen. Damit könnte der germane cognitive load durch Annotationen steigen. Eine solche Entlastung sollte vor allem bei Lernenden mit geringerem Vorwissen wirksam werden, während Experten eine solche Hilfe nicht benötigen (Seufert, 2003).

Fragestellung

In der vorliegenden Studie wird demnach untersucht, welche Effekte Annotationen in virtuellen Lernumgebungen im Vergleich zu einer Kontrollgruppe haben. Es wird erwartet, dass Annotationen den Lernerfolg steigern können (H1). Zudem wird eine Verringerung des extraneous load (H2) und ein höherer germane load erwartet (H3). Da Lernende mit geringem Vorwissen eher von Annotationen profitieren könnten als Lernende mit hohem Vorwissen, wird eine signifikante Interaktion zwischen der Experimentalbedingung und dem Vorwissen erwartet (H4).

Methode

Die Stichprobe setzte sich aus N = 107 Schülern einer bayerischen Schule der Klassenstufen 8 – 10 zusammen. Davon waren 57% männlich. Das mittlere Alter betrug M = 15.3 (SD = 0.95). Die Schüler wurden zufällig einer der beiden Experimentalgruppen zugewiesen: Die Experimentalgruppe erhielt in einer virtuellen Lernumgebung zusätzliche Annotationen während in der Kontrollgruppe diese nicht vorhanden war. Als abhängige Variablen wurden die Lernleistung der Schüler und die kognitive Belastung erfasst. Nach der Bearbeitung eines domänenspezifischen Vorwissenstests folgte die virtuelle Lerneinheit zum Thema Meerwasserentsalzung. Anschließend bearbeiteten die Schüler den Lernerfolgstest und einen Fragebogen zur differenzierten Messung der kognitiven Belastung (Klepsch, Schmitz, & Seufert, 2017).

Ergebnisse

In der vorliegenden Studie konnte ein signifikanter Haupteffekt der Annotationen auf die Lernleistung gefunden werden (H1: F(1, 105) = 22,93, p1 < 0.05). Bei der Analyse der unterschiedlichen Arten der kognitiven Belastung ergab sich ein komplexes Muster. Der extraneous load unterscheidet sich nicht signifikant zwischen den beiden Gruppen (H2: F(1, 105) = .36, n.s.). In der Gruppe mit Annotationen war jedoch der germane load höher im Vergleich zur Kontrollgruppe (H3: F(1, 105) = 3.37, p1 < 0.05). Es konnte keine signifikante Interaktion zwischen Vorwissen und Experimentalbedingung gefunden werden (H4: F(1, 105) = .10, n.s.).

Diskussion

Die Annotationen helfen den Lernern bei der Verarbeitung der Information, was sich in einem verbesserten Lernerfolg niederschlägt. Da dieser Effekt nicht auf eine Entlastung zurückzuführen ist, stellt sich die Frage, welche Effekte zur Erhöhung des germane load beitragen. In weiteren Studien soll deshalb die Motivation der Lernenden als möglicher Mediator miterfasst werden.

 

Effekte von Virtual Reality auf das Lernen von Berufsschülern

Elena Tangocci, Maria Bannert
Technische Universität München

Theoretischer Hintergrund

Erst in den letzten Jahren wurde ein Augenmerk auf Technologien wie Virtual Reality (VR) gelegt (z.B. Cheng & Tsai, 2013). Durch die verstärkte Entwicklung ihrer Applikationen kann eine größere Zielgruppe erreicht werden, wie zum Beispiel für Bildungszwecke (Freina & Ott, 2015). Erste Studien über VR zeigten erhöhte Aufmerksamkeit, Motivation und Zufriedenheit (z.B. Kesim & Ozarslan, 2012; Radu, 2014), Lernzuwachs und -transfer (Chen, 2016; Garzotto, Gelsomini, Occhiuto, Matarazzo, & Messina, 2017) und räumlich-visuelles Vorstellungsvermögen (Sorby & Baartmans, 1996, 2000) beim Lernprozess von Schülern.

Bacca und Kollegen (2014) fanden heraus, dass diese immersiven Technologien den Lernprozess von Berufsschülern während ihrer Ausbildung fördern und ihnen den Zugang zum Arbeitsmarkt erleichtern. Mit VR-Applikationen haben sie die Möglichkeit, dreidimensionale Objekte mehrmals und in originaler Größe zu sehen und zu erleben, was ermöglicht, räumliche Fähigkeiten zu entwickeln (Martín-Gutiérrez, Navarro, & González, 2011). Zudem können Auszubildende Situationen risikofrei erleben und üben, ohne sich selber in Gefahr zu bringen oder Sachen zu schädigen (Freina & Ott, 2015).

Fragestellung

Bislang wurden nur wenige Studien über die Effekte von VR auf das Lernen und die Entwicklung persönlicher Fähigkeiten bei Berufsschülern durchgeführt (z.B. Bacca et al., 2014). Es ist deshalb weitere Forschung erforderlich, vor allem bei der Anwendung und den Effekten von VR in der beruflichen Bildung. So ist das Ziel dieser Studie, die Effekte von VR- Lerntechnologien bei Berufsschülern hinsichtlich der drei Fragestellungen zu untersuchen: Inwieweit hat Virtual Reality Einfluss auf 1) den Lernerfolg, 2) die Motivation und 3) die Akzeptanz dieser Technologie von Berufsschülern im Vergleich zum traditionellen Lernen? Daraus leiten sich die Hypothesen ab, dass die VR-Bedingung sowohl im Wissenstest besser abschneidet als auch höhere Motivation und Akzeptanz aufweist.

Methode

In einem Experiment wurden Klassen einer deutschen Berufsschule mit N = 56 Auszubildenden im Alter von M = 19.2 (SD = 2.5) herangezogen. Sie wurden zufällig einer Kondition zugewiesen: entweder der VR-Lernbedingung (n = 30) oder der Kontrollgruppe (n = 29), bei der das Lernen mit Tablets erfolgte. Nach einem Pretest (α = .65) zur Erfassung von Vorwissen zum Umgang mit Leitern und einem Fragebogen über Erfahrungen mit VR und dem Lerninhalt Arbeitssicherheit, wurden die Schüler für die Lerneinheit mit der VR Brille einzeln vom Unterricht herausgezogen. In jeder Einzelsitzung sollten die Schüler, nach dem Durchlesen eines Informationsblattes und einer kurzen Einführung in die Technologie, Aufgaben zum Thema sicherer Umgang mit Leitern mit der VR-Brille bearbeiten. Anschließend wurde die Kurzskala Intrinsischer Motivation (KIM: Wilde et al., 2009) und Skalen des Technology Acceptance Model (TAM: Park, 2009) beantwortet und der gleiche Wissenstest erneut durchgeführt. Die Kontrollgruppe erhielt am Tablet ein vergleichbares Arbeitsblatt zum Lernthema Leitern, der weitere Ablauf blieb gleich.

Ergebnisse

Erste Befunde einer 2x2 Varianzanalyse mit dem between-Faktor Lernbedingung (VR und Tablet) und within-Faktor Zeit (Pre- und Posttest) ergaben, dass die Interaktion zwischen den Bedingungen nicht signifikant war (F(1, 57) = .27, p = .602). Es zeigte sich kein signifikanter Haupteffekt des Faktors Bedingung (F(1, 57) = 1.49, p = .23), jedoch ein signifikanter Haupteffekt für Zeit (F(1, 57) = 104.11, p < .0005). Die Bedingungen unterschieden sich nicht im Pretest. In der Varianzanalyse für die Motivationsskalen zeigte sich kein signifikanter Effekt (F(1, 57) = .213, p = .65). Auch in der Varianzanalyse für die Akzeptanzskalen zeigte sich kein signifikanter Effekt (F(1, 57) = 1.03, p = .31). Zusammenfassend unterschieden sich die Bedingungen in keiner der drei Variablen.

Die ersten Ergebnisse können anhand der Kognitiven Theorie des Multimedialen Lernens (Meyer, 2014) diskutiert werden. Weitere Analysen stehen aus, u.a. ergänzende Auswertungen des Wissenstests, der Lernprozesse der Schüler während der Interaktion mit VR, sowie der Inhalte und Länge der VR-Lernerfahrung.

 

Förderung internaler Modellbildung in Chemie durch Augmented Reality

Sebastian Keller, Sebastian Habig, Elke Sumfleth, Stefan Rumann
Universität Duisburg-Essen

Theoretischer Hintergrund

Die Nutzung kohärenter multipler externer Repräsentationen, wie Abbildungen und Texte, hat sich in vielen Fachdisziplinen als lernförderlich erwiesen – insbesondere in den Naturwissenschaften (Gilbert, 2008; Schnotz, 2014). Mit Hilfe kognitiver Lerntheorien, wie der Kognitiven Theorie des Lernens mit Medien (Mayer, 2009) und dem Integrierten Modell des Text- und Bildverstehens (Schnotz & Bannert, 2003), lässt sich diese Lernförderlichkeit erklären. Gelingt es, zunächst separat stattfindende Verarbeitungsprozesse von bildlichen und verbalen Informationen zu integrieren, steht am Ende dieses Prozesses ein integriertes mentales Modell, das mit Informationen aus dem Langzeitgedächtnis abgeglichen werden kann. Multiple externe Repräsentationen können sich inhaltlich ergänzen, was sich förderlich auf die Konstruktion mentaler Modelle auswirkt. Dennoch können Repräsentationen auch überfordern, falls Lernende nicht über entsprechende Repräsentationskompetenzen verfügen (Rau, 2017). Insbesondere in der Chemie sind Lernende mit vielfältigen Darstellungsformen in unterschiedlichen Abstraktionsebenen konfrontiert (Bille et al., 2019; Dickmann et al., 2019; Rau, 2017). Hierzu zählen auch dreidimensionale Darstellungen, die hohe Anforderungen an das räumliche Vorstellungsvermögen der Lernenden stellen, was die Konstruktion mentaler Modelle deutlich erschweren kann (Oliver-Hojo & Sloan, 2014).

Zur Unterstützung von Lernenden beim Erlernen chemischer Inhalte erscheint die Technologie der Augmented Reality (AR) vielversprechend. Erste empirische Untersuchungen, auch in den naturwissenschaftlichen Disziplinen, zur Wirksamkeit von AR-unterstütztem Lernmaterial deuten auf positive Effekte bezüglich kognitiver und affektiver Variablen hin (Ibáñez & Delgado-Kloos, 2018). Vor allem das aufgabenbezogene Interesse und die Lernmotivation können positiv durch AR-unterstützte Lernszenarios beeinflusst werden (Chen et al., 2011; Martin et al., 2012). Ebenso wird eine Förderung des räumlichen Vorstellungsvermögens durch AR berichtet (Lindgren & Moshell, 2011; Ibánez & Kloos, 2018).

Fragestellung

Bisher ist jedoch wenig über die konkreten Bedingungen bekannt, die zu den positiven Effekten von AR-unterstützten Lernsettings führen. Daher verfolgt das vorzustellende DFG-geförderte Forschungsprojekt u. a. die Forschungsfrage, ob sich AR-unterstützte Lernmaterialien zu Inhalten der organischen Chemie lernförderlicher auswirken, als äquivalentes Text-Bild-Material ohne AR-Unterstützung und ob ggf. das räumliche Vorstellen in diesem Zusammenhang moderierend wirkt. Im Rahmen experimenteller Studien mit Chemiestudierenden wird dabei auch untersucht, ob der Einsatz von AR einen Einfluss auf die kognitive Belastung beim Lernen hat und welche Rolle die wahrgenommene Benutzerfreundlichkeit der Lernanwendung spielt.

Methode

In einer ersten Studie mit 22 Chemiestudierenden (11 weiblich) wurden die kognitive Belastung beim Umgang mit der selbstentwickelten AR-App sowie die wahrgenommene Benutzerfreundlichkeit der App erhoben. Die drei Dimensionen kognitiver Belastung wurden mit Hilfe eines Fragebogens nach Klepsch et al. (2017) auf einer Skala von 1 (niedrig) bis 6 (hoch) gemessen. Für die Messung der Benutzerfreundlichkeit wurde auf die System Usability Scale (SUS: Brooke, 1996) zurückgegriffen.

Ergebnisse & Diskussion

Die mittlere intrinsische Belastung, die die Komplexität des Lerninhaltes selbst beschreibt, liegt im mittleren Bereich (M = 3,29; SD = 1,26). Hingegen wird die extrinsische Belastung beim Lernen mit AR als eher gering eingestuft (M = 2,05; SD = 0,90). Der gemessene germane load liegt im Vergleich eher hoch (M = 5,23; SD = 0,54). Der Befund der geringen extrinsischen Belastung wird auch durch die Bewertung der Benutzerfreundlichkeit der App gestützt. Über die 10 Items des SUS wurde für jeden Probanden bzw. jede Probandin ein Usability-Score berechnet. Für insgesamt 18 der 22 Teilnehmenden liegt der Usability-Score im höchstmöglichen Bereich. Tendenziell deutet sich eine negative Korrelation zwischen wahrgenommener Benutzerfreundlichkeit und extrinsischer kognitiver Belastung an, die im Rahmen der folgenden experimentellen Studie auf Signifikanz geprüft wird.

Die Ergebnisse dieser ersten Studie deuten darauf hin, dass das Lernen mit AR im Kontext der organischen Chemie aufgrund integrierter Informationsrepräsentation geeignet zu sein scheint, Lernprozesse zu unterstützen. Dies mag durch die hohe Benutzerfreundlichkeit der Technik begründet sein. Neben den dargestellten Ergebnissen sollen im Rahmen des Symposiums auch Erkenntnisse aus der sich anschließenden experimentellen Studie zur Wirksamkeit von AR-unterstützen Lernen präsentiert werden.

 

An Explorative Evaluation of a Virtual Physical Sensor Laboratory (VPSL) in the Context of School Teaching and Learning

Qi Guo, Bernd Zinn
Universität Stuttgart

Theoretical Background

Virtual Reality offers the possibilities of situational knowledge transfer and flexible learning, which are independent to the learning location and learning time (cf. Zinn, Guo & Sari 2016; Ariali & Zinn 2018). The simulation of a physical experiment enables not only the presentation of virtual objects and the information in VR but also the visualisation of the elements that are not visible in the real world, such as atoms, electrons and waves (cf. Blümel, Jenewein & Schenk 2010; Schuster et al. 2014). Virtual Reality gives a new perspective of user experience in learning, represented in the constructs of spatial presence, flow experience and learning motivation that can be assessed by the surveys with the students. Spatial presence, the state that one feels present in the virtual circumstances, may be related to the effective learning in a virtual environment (cf. Lombard et al. 2015). Flow experience describes an optimal mental state of being fully immersive in a highly engaging activity, which may also be relevant for learning outcome (cf. Csikszentmihalyi 1997; Engeser et al. 2005). The perceived usability has significant effects on the use intentions of the VR technology (cf. Pletz & Zinn 2018). Therefore, the constructs of spatial presence, learning motivation, flow experience and usability were surveyed to evaluate the application VPSL.

Research Questions

With the increasing development of the innovative technology in academic and economic fields, as well as in the context of the digitalisation in schools and “vocational education 4.0”, there is a rising tendency of the implementation of various modern technology into the school teaching and learning (cf. Van Ackeren et al. 2019; Zinn 2017). Despite the fast development of the technology, the delay of the implementation of the novel technology reveals the invisible hesitations of the schools, which are related to the shortage and the weakness of the technical infrastructures, the financial support, as well as the corresponding competence of teachers (cf. Zinn 2019). Therefore, it is critical whether the application offers an effective user interface and a functional user experience in the context of vocational learning (cf. Dörner et al. 2013). The interactive VR application of Virtual Physical Sensor Laboratory (VPSL), developed by Ditton (2018), is a learning aid in technical instruction. In this study, VPSL was implemented in vocational school classes, focusing on an evaluation of the systematic description of the application VPSL in vocational education and training (VET).

Methods

The study focuses mainly on a systematic evaluation of the developed virtual reality environment VPSL on the constructs of spatial presence, flow experience and motivation based on the theoretical foundations. The study was participated by the students in the majors of Automotive Mechatronics, Mechatronics as well as Technology and Management from VET schools (N = 145). Firstly, there was an introduction to VPSL and the following course. Then the students entered VPSL with VR headsets, where there were five physical sensor experiments with introductions and interactive experiment components. The students should follow the instructions, learn the theoretical knowledge, conduct the experiments and fill out the worksheets. After the experiment, all participants filled in the questionnaires regarding the learning experience with VPSL.

Results

The descriptive statistical analyses of spatial presence, flow experience and motivation indicate overall positive evaluations of VPSL. The structural equation model highlights that the spatial presence has a significant influence on the variance of flow experience. The model also explains the correlations between learning motivation, spatial presence and flow experience. This study also gives suggestions for the further implementation of VR learning environments in VET schools, in terms of the safety aspects, the usability improvement and the human-technology interactions.

 

Augmented Reality zur Förderung des Konzeptverständnisses beim Lernen durch Experimentieren in der Physik

Kristin Altmeyer1, Sebastian Kapp2, Michael Thees2, Sarah Malone1, Jochen Kuhn2, Roland Brünken1
1Universität des Saarlandes, 2Technische Universität Kaiserslautern

Theoretischer Hintergrund

In den Naturwissenschaften stellt das Experimentieren im Labor eine einzigartige Lernerfahrung dar. Positive Lernergebnisse sind dabei jedoch nicht garantiert (z.B. Husnaini & Chen, 2019). Es hat sich gezeigt, dass Lernprozesse beim Experimentieren dadurch unterstützt werden können, dass Lerninformationen virtuell dargeboten werden (Jones, 2019). Allerdings wird bei ausschließlich virtuellen Experimentierumgebungen bemängelt, dass keine praktische Experimentierfähigkeit (manuelle Fehlerbehebung, taktile Informationen) vermittelt werden kann (De Jong, Linn & Zacharia, 2013). Eine Möglichkeit zur Integration virtueller Informationen in reale Lernumgebungen und dadurch zur Verbindung der Vorteile beider Experimentierumgebungen stellt Augmented Reality (AR) dar. Überblicksartikel bezeichnen AR als hilfreiches instruktionales Werkzeug, das sich positiv auf den Lernerfolg auswirken kann (für eine Metaanalyse siehe Garzón & Acevedo, 2019). Damit solche Anwendungen die Lernenden nicht überfordern, sondern sich als lernförderlich erweisen, sollten sowohl ihr Mehrwert in einem bestimmten Lernkontext als auch ihre Gestaltung theoretisch und empirisch begründet werden. Laut Santos et al. (2014), verwandelt AR traditionelle Lernkontexte in Multimediasettings, was es erlaubt, empirisch gut erprobte theoretische Modelle zum Multimedialernen (z.B. Cognitive Theory of Multimedia Learning, CTML; Mayer 2005) zu nutzen, um Gestaltungsprinzipien für AR-Lernszenarien abzuleiten.

Fragestellung

Durch den Einsatz von AR beim Experimentieren kann insbesondere das auf der CTML basierende Prinzip der räumlichen Kontiguität verwirklicht werden. Dieses besagt, dass durch integrierte statt Split-Source-Formate extrinsische Belastung reduziert (Schroeder & Cenkci, 2018), generative Lernprozesse gefördert (Mayer, Moreno, Boire & Vagge, 1999) und letztlich auch z.B. konzeptuelles Lernen erleichtert wird (Vosniadou, 2007). Diese Annahmen sollten in der vorliegenden Studie überprüft werden.

Methode

In einem Zwei-Gruppen-Pretest-Posttest-Versuchsplan führten Studierende (N=50) Experimente zu Gesetzmäßigkeiten der Reihen- und Parallelschaltung durch, wobei ihnen die Messwerte in Echtzeit auf einem Tablet-PC präsentiert wurden. Anhand eines Arbeitsheftes wurden die Teilnehmer angeleitet, zunächst Schaltkreise aufzubauen, anschließend eine Spannung anzulegen, diese zu manipulieren, die Veränderung der Messwerte zu beobachten und Lernaufgaben dazu zu lösen. Die Hälfte der Lernenden wurde zufällig einer AR-Bedingung zugeteilt, bei der ihnen beim Betrachten der aufgebauten Schaltkreise durch die Tabletkamera Echtzeit-Messwerte direkt über den jeweiligen Bauteilen angezeigt wurden (integriertes Format). Die andere Hälfte der Lernenden experimentierte ohne AR. Ihnen wurden die gleichen Informationen ebenfalls auf einem Tablet angezeigt, allerdings in Form einer Übersicht (Split-Source-Format). Vor und nach der Laborarbeit bearbeiteten die Teilnehmer einen standardisierten Konzepttest zur Elektrizitätslehre (Urban-Woldron & Hopf, 2012). Außerdem erfolgte nach dem Experimentieren eine an die Lernsituation angepasste differenzierte Messung der subjektiven kognitiven Belastung (Leppink, Paas, Van Gog, Van der Vleuten & Van Merrienboer, 2014). Die erlebte Nutzbarkeit der verschiedenen Systeme wurde ebenfalls nach dem Experimentieren erfasst (System Usability Scale; Brooke, 1996).

Ergebnisse

Entgegen der Annahme zeigte sich zwischen den beiden Bedingungen kein signifikanter Unterschied in der wahrgenommenen extrinsischen Belastung (t(48) = 1.62, p = .112). Dies kann als Folge eines Bodeneffektes interpretiert werden, da die extrinsische Belastung insgesamt als sehr gering eingeschätzt und die Nutzbarkeit beider Systeme im Mittel als „exzellent“ klassifiziert wurde. Für den Lernerfolg im Konzepttest zeigte sich, dass während beide Gruppen vergleichbare Leistungen im Pretest zeigten, nur in der AR-Bedingung signifikante Leistungszuwächse von Pre- zu Posttest festgestellt werden konnten (F(1, 48) = 3.75, p = .029, ηp² = .075). Dieses Ergebnis weist darauf hin, dass das integrierte Format, das beim Experimentieren mit AR aus dem Experimentalaufbau und den virtuellen Messwerten gebildet wurde, auch die mentale Integration essentieller Informationen unterstützt und somit den Aufbau von Konzeptverständnis gefördert hat. Dass der Lernerfolg insgesamt gering und auch der Effekt von AR weniger deutlich als in vorangegangen Studien war (Garzón & Acevedo, 2019), könnte dadurch begründet sein, dass der Erwerb von Konzeptwissen ein relativ ambitioniertes Lernziel darstellt, das insbesondere durch Methoden des entdeckenden Lernens über einen kurzen Interventionszeitraum nur schwer zu erreichen ist (z.B. Kirschner, Sweller & Clark, 2006).

 
9:00 - 10:45F9‒H06: Person-Environment-Fit im Lehramt – berufsrelevante Voraussetzungen von Lehramtsstudierenden im Vergleich
H06 
 

Person-Environment-Fit im Lehramt – berufsrelevante Voraussetzungen von Lehramtsstudierenden im Vergleich

Chair(s): Birgit Ziegler (Technische Universität Darmstadt, Deutschland), Stephan Abele (Technische Universität Dresden), Svenja Ohlemann (Technische Universität Berlin)

DiskutantIn(nen): Sylvia Rahn (Universität Wuppertal)

Lehrer*innen sind maßgebliche Gestalter*innen von Bildungsprozessen. Kaum ein anderer Beruf präsentiert sich so früh und mit so hoher Intensität im Lebenslauf von Individuen, beeinflusst deren Partizipationsmöglichkeiten im Bildungssystem sowie berufswahlrelevante Selbstselektionsprozesse im Zugang zum Lehramt. Schon Grundschulkinder, besonders Mädchen, äußern häufig den Wunsch, einmal Lehrerin oder Lehrer werden zu wollen (Baumgart 2012). Daher ist das Lehramt auch aus berufswahltheoretischer Perspektive interessant. Zahlreiche berufswahltheoretische Ansätze folgen dem Person-Environment-Fit Modell, wonach Menschen sich vorzugsweise beruflichen Umwelten zuwenden, die sie als zu ihrer Person passend wahrnehmen. Prominent ist der Ansatz von J. L. Holland (1997), der tätigkeitsbezogene Interessen als zentralen Wirkfaktor im Berufswahlprozess unterstellt. Entwicklungstheoretisch wird dagegen sozialen Passungserwägungen hinsichtlich Geschlecht und Prestige eine frühere und höhere Wirksamkeit im Berufswahlprozess zugeschrieben, als Interessen und Wertorientierungen (L. S. Gottfredson 1981, 2005). Dies bekräftigend zeigt sich beispielhaft für Pflegeberufe, dass eine mangelnde soziale Passung die Neigung einen Beruf zu ergreifen, trotz vorhandener Interessenkongruenz mindert. Zudem erweisen sich mangelnde Urteilsicherheit, ungünstige Einschätzungen der Zugänglichkeit zum Berufsfeld sowie eine mangelnde Passung der Rahmenbedingungen als die Berufswahlneigung mindernde Faktoren (Matthes 2019). Die Interaktionsintensität von Jugendlichen mit Lehrenden hängt mit Ausnahme der Grundschule von der besuchten Schulart ab und Unterschiede in der sozialen Hierarchie der Bildungsgänge spiegeln sich im Berufsprestige der Lehrämter wider (Ziegler 2018). Studienberechtigte sind überwiegend gymnasial sozialisiert, weshalb Studierenden im LaG eine hohe Urteilssicherheit und soziale Passung unterstellt werden kann, was mitunter dazu beiträgt, dass die Studierendennachfrage im gymnasialen Lehramt von ungünstigen Einstellungsprognosen relativ unbeeinträchtigt bleibt (Ziegler 2009; Rothland 2014). Dem Lehramt an berufsbildenden Schulen begegnen Jugendliche, wenn überhaupt, recht spät im Lebenslauf. Auch das soziale Prestige liegt unterhalb des gymnasialen Lehramts. Aus berufswahltheoretischer Perspektive sind daher die anhaltenden Versorgungsprobleme beruflicher Schulen mit Lehrkräften erklärbar. Nun hat sich der Lehrerberuf von einem eher männlichen zu einem eher weiblichen Beruf gewandelt (Kemnitz 2014). Davon ausgenommen sind lediglich die MINT-Fächer, besonders Physik, Informatik und Technik. Diese Fächer sind nach wie vor stärker männlich besetzt, weisen aber gleichzeitig nachhaltige Versorgungsprobleme auf. Nachdem Kinder in der Phase der Herausbildung ihrer Geschlechtsidentität stärker zu Berufen tendierend, die von Erwachsenen des gleichen Geschlechts repräsentiert werden (Ratschinski 2013), könnte der frühe Ausschluss des Lehramts aus dem beruflichen Aspirationsfeld von Jugendlichen mit MINT-Interessen ursächlich dafür sein. Bei älteren Studierenden, die über andere berufliche Vorbildungen oder als Studiengangwechsler*innen in das Lehramtsstudium einmünden, könnten dagegen Gelegenheitsstrukturen höher wiegen als Passungserwägungen (Gottfredson & Becker 1981). Beispielsweise können die antizipierten Rahmenbedingungen im Lehramt die Berufswahlneigung erhöhen oder die hohe Nachfrage im berufsbildenden Lehramt kann die Zugänglichkeitseinschätzungen positiv beeinflussen. Mit Blick auf die zuletzt genannte Gruppe ist daher von Interesse, ob z. B. die Einmündung in das Lehramt an berufsbildenden Schulen ein Ergebnis des Person-Environment-Fit oder vielmehr ein Produkt von Gelegenheitsstrukturen ist und sich demzufolge Studierende im beruflichen Lehramt hinsichtlich ihrer berufsbezogenen Interessen, Motive und Überzeugungen von anderen Studierendengruppen, insbesondere Studierenden allgemeinbildender Lehrämter abheben. Angesichts des Lehrkräftemangels und der zunehmenden Deckung des Bedarfs über Quer- und Seiteneinstiege ist die Wirksamkeit der Person-Umweltpassung aber auch für die Lehrkräftegewinnung an allgemeinbildenden Schulen bedeutsam.

Ausgehend von der übergreifenden Frage, ob abhängig von bildungsbiografischen Zugängen zum jeweils angestrebten Lehramt sich Tätigkeitsinteressen, Fachinteresse, Motiven, Überzeugungen und Vorwissen von Lehramtsstudierenden binnenstrukturell sowie von anderen Studierendengruppen unterscheiden, werden im Symposium vergleichende Analysen präsentiert. Der erste Beitrag analysiert Interessenstrukturen von Studierenden des berufsbildenden Lehramts und der Ingenieurwissenschaften. Der zweite Beitrag vergleicht Studienanfänger*innen im gymnasialen Lehramt und im berufsbildenden Lehramt. Beitrag 3 präsentiert Analysen zu Studierenden des Sekundarschullehramts und des berufsbildenden Lehramts. Im vierten Beitrag werden Mathematikstudierende mit Lehramts-studierenden im Fach Mathematik unterschiedlicher Schularten verglichen.

Es ergibt sich ein hochdifferenziertes Bild. Insgesamt wird das Modell einer Person-Umwelt-Passung im Lehramt eher bekräftigt.

 

Beiträge des Symposiums

 

Berufliche Interessenprofile – ein Grund und eine Lösungsoption für das Rekrutierungsproblem im gewerblich-technischen Lehramtsstudium?

Andreas Leon1, Marcel Köhler1, Nelly Schmechtig1, Gabriel Nagy2, Stephan Abele1
1Technische Universität Dresden, 2Universität Kiel

Theoretischer Hintergrund

Der Lehrkräftemangel an beruflichen Schulen in gewerblich-technischen Fachrichtungen stellt seit langem bundesweit ein anhaltendes, empirisch aber nur unzureichend erforschtes Problem dar. Gemäß der Person-Umwelt-Theorie Hollands (1997) entscheiden sich Personen u. a. dann für das Studium des gewerblich-technischen Lehramts, wenn sie ein überdurchschnittlich hohes soziales (S) und praktisch-technisches (R) Interesse haben. Unter Annahme der starken Calculus-Hypothese (Holland, 1997) entspricht dies einem inkonsistenten Interessenprofil. Solche Profile treten in der Population selten auf (Gurtmann & Balakrishnan, 1998), was den erwähnten Lehrermangel zumindest partiell erklären könnte. Dementsprechend deuten erste Analysen darauf hin, dass ein inkonsistentes Interessenprofil für Lehramtsstudierende gewerblich-technischer Fachrichtungen typisch ist (Köhler, Schmechtig & Abele, 2019). Offen ist, inwiefern diese Inkonsistenz aus der erwähnten R-S-Konstellation resultiert. Zudem legen erste Erkenntnisse nahe, dass Lehramtsstudierende im gewerblich-technischen Bereich ein spezifisches Interessenprofil aufweisen, das in gewissem Umfang auch bei Studierenden von Ingenieurwissenschaften vorkommt (Leon et al. 2018).

Fragestellung

Im Beitrag werden die Konsistenz und Profile beruflicher Interessen von ingenieurwissenschaftlichen Studierenden sowie Studierenden des berufsbildenden Lehramts und folgende Hypothesen untersucht: Die Interessenprofile von Studierenden des gewerblich-technischen Lehramts sind inkonsistenter als die Interessenprofile von Studierenden anderer Fächer ohne bzw. mit vergleichsweise geringem Rekrutierungsproblem (H1). Die Inkonsistenz ist bei den Studierenden des gewerblich-technischen Lehramts v.a. auf die erwähnte R-S-Kombination zurückzuführen (H2). Exploratorisch wird ferner untersucht, wie viele Ingenieurstudierende ein für Studierende des gewerblich-technischen Lehramts typisches Interessenprofil aufweisen.

Methode

Für die Analysen wird ein Datensatz herangezogen, der sich aus Studierenden der Ingenieurwissenschaften der Universität Stuttgart (N=252) (Gräber, 2018) sowie Lehramtsstudierenden gewerblich-technischer und weiterer beruflicher Fachrichtungen der TU Dresden (N=339) zusammensetzt und bislang nur partiell ausgewertet wurde. Die Dresdner Daten stammen aus Erstsemesterbefragungen, die vom Zentrum für Lehrerbildung, Schul- und Berufsbildungsforschung (ZLSB) der TU Dresden durchgeführt wurden (2015-2018). Hier wurde als Instrument eine Kurzform des allgemeinen Interessenstrukturtest (AIST-R) nach Lörz, Quast & Woisch (2011) verwendet. Die Stuttgarter Daten wurden in Studienveranstaltungen der Studienjahre 2017/2018 erhoben. Als Instrument wurde der AIST-R nach Bergmann & Eder (2005) verwendet. Das Matching der Interessendaten wird im Vortrag erläutert. Die Interessenskalen erreichten mindestens eine zufriedenstellende Reliabilität (R: α=.72; I: α=.73; A: α=.80; S: α=.84; E: α=.74; C: α=.71). Die Bestimmung der Interessenskonsistenz der Studierenden erfolgte in Anlehnung an Nagy, Trautwein & Maaz (2012) sowie Gurtmann & Balakrishnan (1998) unter Annahme einer starken Calculushypothese (Holland, 1997) mithilfe eines regressionsanalytischen Ansatzes, wobei die entsprechenden Sinus- und Cosinuswerte als Prädiktoren und die individuellen Interessenprofile als Kriterien fungierten; das resultierende R² wurde als Konsistenzmaß interpretiert.

Ergebnisse

Die bisherigen Analysen zeigten, dass die Interessenprofile der angehenden Lehrkräfte mit gewerblich-technischen Fachrichtungen inkonsistenter (F(1, 248)=11.28, p<.01, d=.36) sind als die Interessenprofile der Ingenieurstudierenden (H1). Ziel der weiteren Analysen ist es, Interessenskonstellationen zu finden, welche insbesondere für die Inkonsistenz der Interessenprofile der Lehramtsstudierenden gewerblich-technischer Fachrichtungen verantwortlich sind (H2). Hierzu werden Regressionsresiduen mithilfe einer Latent-Class-Analyse (LCA) untersucht (Nagy, Köller, & Leucht, 2016). Es wird davon ausgegangen, dass sich Studierende des gewerblich-technischen Lehramts wegen ihres ausgeprägten sozialen und praktisch-technischen Interesses bevorzugt in einer Klasse befinden. Um die exploratorische Frage zu klären, wird mithilfe einer LCA untersucht, ob für Studierende des gewerblich-technischen Lehramts charakteristische Klassen von Interessenprofilen identifizierbar sind und wie viele Ingenieurstudierende diese Klassen enthalten. Abschließend wird diskutiert, ob es angesichts der Befunde angemessen ist, die Inkonsistenz beruflicher Interessenprofile weiterhin als einen zentralen Grund für das Rekrutierungsproblem im gewerblich-technischen Lehramt zu betrachten und ob affine ingenieurwissenschaftliche Studiengänge als Rekrutierungsressource für Gewerbelehrinnen und Gewerbelehrer betrachtet werden können. In diesem Fall wären Maßnahmen angebracht, die entsprechenden Studierenden gezielt anzusprechen und für das gewerblich-technische Lehramtsstudium zu gewinnen. Schließlich wird der Nutzen von Folgestudien ausgelotet, in denen untersucht wird, ob jene Studierende der Ingenieurwissenschaften, die lehramtsspezifische Interessenprofile aufweisen, auch eher dazu neigen, das ingenieurwissenschaftliche Studium abzubrechen.

 

Berufswahlmotive angehender Lehrkräfte: Vergleich der beruflichen und allgemeinbildenden Fachrichtungen

Anne Stellmacher, Svenja Ohlemann
Technische Universität Berlin

Theoretischer Hintergrund

Die Gewinnung und Ausbildung von Lehrkräften an Universitäten ist aufgrund des deutschlandweiten Lehrkräftemangels in allen Schultypen nach wie vor bildungs- und arbeitsmarktpolitisch hoch relevant. Im beruflichen Lehramt kommt erschwerend dazu, dass sich bereits zu wenige junge Menschen für das Studium entscheiden, was anhand von zu geringen Studierendenzahlen deutlich wird. Davon besonders betroffen sind die gewerblich-technischen Fachrichtungen (Monitor Lehrerbildung, 2017). Als mögliche Ursachen für die geringen Zahlen werden eine mangelnde Attraktivität sowie ein geringer Bekanntheitsgrad des beruflichen Lehramts im Vergleich zum allgemeinbildenden Lehramt genannt (Frommberger & Lange, 2018). In der Behebung des aktuellen Mangels spielt das Wissen über die Motive, warum sich Studierende für das berufliche Lehramtsstudium entschieden haben, eine bedeutsame Rolle (Driesel-Lange, Morgenstern & Keune, 2017). Denn diese Erkenntnisse können von den Hochschulen genutzt werden, um erfolgreiche, an die Zielgruppe angepasste Rekrutierungsstrategien zu entwickeln und den Nachwuchs zielgerichtet anzusprechen und zu beraten. Die bisherige Forschung zu Berufswahlmotiven konzentrierte sich vor allem auf allgemeinbildende Lehramtstypen (u.a. Retelsdorf & Möller, 2012; Rothland, 2014), für das berufliche Lehramt bedarf es weiterer Forschung (Frommberger & Lange, 2018). Vergleichsstudien mit dem allgemeinbildenden Lehramt können diese Erkenntnisse noch schärfen.

Fragestellung

Die vorliegende vom Bundeministerium für Bildung und Forschung geförderte Studie untersucht die Berufswahlmotive angehender Berufsschullehrkräfte und vergleicht sie mit den Motiven ihrer Kommiliton*innen der allgemeinbildenden Fächer.

Methode

Vorgestellt werden Ergebnisse aus einer Studie im Mixed-Method-Design: In einer quantitativen Studie wurden 30 Lehramtsstudierende aus den beruflichen Fachrichtungen sowie 50 Studierende des allgemeinbildenden Fachs der Sekundarstufe I „Arbeitslehre“, die sich zum Befragungszeitpunkt im Bachelor befanden, befragt. Die Berufswahlmotive wurden mit der Skala FEMOLA (Pohlmann & Möller, 2010) erhoben, welche nach dem Erwartung-x-Wert-Modell (Eccles et al., 1983) aus den folgenden sechs Subskalen besteht: pädagogisches Interesse, fachliches Interesse, Nützlichkeit, Fähigkeitsüberzeugung, geringe Schwierigkeit des Lehramtsstudiums sowie soziale Einflüsse. Die Auswertung erfolgte mittels einer multivariaten Kovarianzanalyse (MANCOVA), um die Effekte der beiden Lehramtsstudienrichtungen auf die sechs Motivationsausprägungen zeitgleich unter Berücksichtigung der Kovariaten Geschlecht, Alter, Fachsemester sowie Anzahl an pädagogischen Vorerfahrungen testen zu können. Da der FEMOLA-Fragebogen für das allgemeinbildende Lehramt entwickelt wurde, bleibt unklar, ob die darin enthaltenen Facetten alle Berufswahlmotive im beruflichen Lehramt abdecken. Deshalb wurden im Rahmen einer qualitativen Untersuchung fünf Master-Lehramtsstudierende der beruflichen Fachrichtungen zu ihren Gründen und Motiven für die Wahl des Studiums befragt. Die biografischen Interviews wurden nach der Grounded Theory (Strauss & Corbin, 1996) ausgewertet.

Ergebnisse

Die quantitativen Ergebnisse zeigen für die angehenden Berufsschullehrkräfte die höchste Ausprägung im fachlichen Interesse, während bei den Studierenden der Arbeitslehre das pädagogische Interesse das wichtigste Motiv war. Die Studierenden des beruflichen und allgemeinbildenden Lehramts unterscheiden sich signifikant in der Einschätzung des pädagogischen Interesses, der Nützlichkeit (im Sinne von Work-Life-Balance und finanzieller Sicherheit) sowie der sozialen Einflüsse (von Eltern oder Freund*innen) als Motivatoren. Auf den übrigen drei Motivskalen zeigen sich keine signifikanten Unterschiede. Die qualitativen Ergebnisse zeigen, dass FEMOLA die Berufswahlmotive von beruflichen Lehramtsstudierenden zum Teil abdeckt. Die Studierenden berichten bspw. von einem starken didaktischen Interesse und das fachliche Interesse ist vor allem durch vorhergehende berufliche Erfahrungen, wie einer Berufsausbildung oder einem Studium, geprägt. Die Wahrnehmung einer geringeren Schwierigkeit des Lehramtsstudiums wird nicht genannt. Die Ergebnisse sowie Konsequenzen für die Lehrkräfteakquise der beruflichen Bildung werden diskutiert und methodische Stärken und Schwächen der vorliegenden Untersuchungen kritisch reflektiert.

 

Berufswahlmotive und Vorwissen von Studienanfängerinnen und Studienanfängern im (Lehramts)Fach Mathematik. Ein Vergleich diverser Studiengänge

Florina Ștefănică, Reinhold Nickolaus
Universität Stuttgart

Theoretischer Hintergrund

Lehrkräfte haben einen großen Einfluss auf zukünftige Generationen: Sie vermitteln Wissen bei den Schülerinnen und Schülern, formen Charaktere, dienen als Verhaltensmodelle. Doch wer nimmt ein Lehramtsstudium auf? Welches Wissen und welche Eigenschaften bringen die angehenden Lehrkräfte in den unterschiedlichen Lehramtsstudiengängen zu Studienbeginn mit (vgl. z. B. Rothland 2014a, Rothland 2014b)? Unterscheiden sich die Lehramtsstudierenden von den Nicht-Lehramtsstudierenden, mit denen sie an vielen Hochschulstandorten gemeinsame Lehrveranstaltungen besuchen? Bisherige Untersuchungen zu Studienbeginn (vgl. Klusmann et al. 2009; Neugebauer 2013; Drahmann et al. 2016; Klusmann 2011; Blömeke et al. 2008; Pohlmann / Möller 2010) belegen: (1) keine Unterschiede hinsichtlich Abiturnoten, kognitiven Grundfähigkeiten, mathematischem Vorwissen oder der Englischleistung zwischen Nicht-Lehramtsstudierenden und Studienanfängern des gymnasialen Lehramts, jedoch Vorteile für die letztgenannte Gruppe im Vergleich zu Studienanfängern nichtgymnasialer Lehramtsstudiengänge; (2) Vorteile im pädagogischen Vorwissen für nichtgymnasiale Lehramtsstudierende im Vergleich zu gymnasialen Lehramtsstudierenden; (3) unterschiedliche Relevanz der Berufswahlmotive je nach gewähltem Lehramtsstudiengang. Im Rahmen der oben genannten Studien wurden keine fachspezifischen Ausdifferenzierungen der Lehramts- oder Nicht-Lehramtsgruppen durchgeführt. Spinath und Kollegen (2005) nahmen eine Ausdifferenzierung der Nicht-Lehramtsgruppe in Naturwissenschaften, Wirtschaftswissenschaften und Pädagogik vor und stellten fest, dass sich Lehramtsstudierende nicht grundsätzlich in negativer Weise von Studierenden in Diplomstudiengängen hinsichtlich der kognitiven Fähigkeiten oder der Lesekompetenz unterscheiden. Bei einer fachspezifischen Ausdifferenzierung der Lehramtsstudierenden fanden Kaub und Kollegen (2012) heraus, dass Studierende mit den Fächern Sport bzw. Naturwissenschaften höhere kognitive Fähigkeiten als Studierende anderer Lehramtsfächer aufweisen.

Fragestellung

Im Folgenden wird eine erste fachspezifische Untersuchung vorgestellt. Am Beispiel des Fachs Mathematik fokussiert der vorliegende Beitrag (1) Unterschiede zwischen Lehramts- und Nicht-Lehramtsstudierenden und (2) Unterschiede zwischen Lehramtsstudierenden verschiedener Studiengänge zu Studienbeginn.

Methode

Hierfür werden Daten von Studierenden der Universität Stuttgart (145 Nicht-Lehramt Mathematik, 129 gymnasiales Lehramt) und der Pädagogischen Hochschule Ludwigsburg (145 Sekundarstufen1-Lehramt, 30 Sonderpädagogik) untersucht. Die Unterschiedsanalysen beziehen sich auf (1) das mathematische und pädagogische Vorwissen sowie die kognitiven Grundfähigkeiten und (2) weichere Faktoren wie z. B. Berufswahlmotive, Geschlecht, Erfahrungen vor Studienbeginn. Zur Erfassung des mathematischen Vorwissens wurde eine Kurzversion des Tests aus TIMSS (Baumert et al. 1999) eingesetzt. Das pädagogische Vorwissen wurde mithilfe einer Kurzversion des Tests aus den Studien KiL / KeiLa (Hohenstein et al. 2017) erhoben. Der CFT3 (Weiß 1999, Cattell 1961) diente zur Ermittlung der kognitiven Grundfähigkeit. Schließlich wurde der FEMOLA-Fragebogen (Pohlmann / Möller 2010) zur Erfassung der Berufswahlmotive für das Lehramt verwendet.

Ergebnisse

Erste Analysen zeigen, dass zu Studienbeginn Nicht-Lehramtsstudierende über ein ausgeprägteres mathematisches Vorwissen, bessere kognitive Grundfähigkeiten und bessere Abiturnoten als Lehramtsstudierende verfügen. Zusätzlich finden sich hinsichtlich dieser Indikatoren Unterschiede zwischen den verschiedenen Lehramtsstudiengängen: Am besten schneiden die Sekundarstufen2-Lehramtsstudierenden ab, gefolgt von den Sonderpädagogen und den Sekundarstufen1-Lehramtsstudierenden. Hingegen konnten im pädagogischen Vorwissen keine signifikanten Unterschiede zwischen den Studiengängen gefunden werden. Ca. 40% der Nicht-Lehramtsstudierenden haben während ihrer Schulzeit einen Vertiefungskurs in Mathematik besucht, während es in den Lehramtsstudiengängen ca. 15% sind. Dabei zeigt dieser Vertiefungskurs einen erwartungskonformen Zusammenhang mit dem mathematischen Vorwissen auf. Für alle Studiengänge mit Ausnahme des Lehramts für Sonderpädagogik gilt: Studienanfänger, die bereits Nachhilfe gegeben haben, verfügen über ein ausgeprägteres pädagogisches Vorwissen als jene Studienanfänger, die noch keine Nachhilfe gegeben haben. Schließlich unterscheiden sich die Studienanfänger der unterschiedlichen Lehramtszugänge hinsichtlich der Berufswahlmotive; Zusammenhänge zwischen den Berufswahlmotiven und dem Vorwissen können dabei nicht festgestellt werden. Die Ergebnisse machen deutlich, dass für die Gewinnung kompetenter Studierenden eine Steigerung der Attraktivität der Lehramtsausbildung notwendig ist. Zusätzlich soll die gefundene Heterogenität zwischen den Eingangsvoraussetzungen in den unterschiedlichen Studiengängen auf Herausforderungen bei der Vorbereitung gemeinsamer Lehrveranstaltungen aufmerksam machen.

 

Bildungswege, Studien- und Berufswahlmotive, Überzeugungen und Interessen – Ein Vergleich von Studienanfänger*innen im Lehramt an Gymnasien (LaG) und im Lehramt an beruflichen Schulen (LaB)

Sevil Mutlu, Josephine Berger, Birgit Ziegler
Technische Universität Darmstadt

Theoretischer Hintergrund

Professionelle Lehrerkompetenz basiert auf einer analytisch-kognitiven sowie einer motivational-affektiven Facette (Baumert & Kunter, 2011). Letztere umfasst Überzeugungen und Werthaltungen, motivationale Orientierungen, darunter auch Studien- und Berufswahlmotive sowie selbstregulative Fähigkeiten. Beide Facetten gelten auch als Basis für eine erfolgreiche Professionalisierung bzw. eine erfolgreiche Bewältigung des Lehrberufs (Klieme & Leutner, 2006; Cramer 2016). Trotz einer Varianz der methodischen Zugänge zeigen die motivationalen-affektiven Voraussetzungen von Lehramtsstudierenden der allgemeinbildenden Schulämter ein erstaunlich einheitliches Muster. Schulartspezifisch finden sich allenfalls höhere Ausprägungen der pädagogischen Orientierungen im Lehramt an Grund- und Sekundarschulen gegenüber einer stärkeren fachlichen Orientierung im Lehramt an Gymnasien (Rothland 2014, Cramer 2016). Wenig Erkenntnisse liegen darüber vor, welche motivationalen Orientierungen und Überzeugungen im Vergleich dazu Lehramtsstudierende an berufsbildenden Schulen aufweisen (Ziegler 2019, Driesel-Lange et al. 2017). Auf der Ebene der dienstrechtlichen Rahmenbedingungen sind das Lehramt an Gymnasien und das Lehramt an berufsbildenden Schulen seit etwa Mitte der 1960er Jahre gleichgestellt. Dementsprechend stellen Gymnasiallehrkräfte auch ein Viertel des Lehrpersonals an berufsbildenden Schulen, während nicht einmal die Hälfte des Lehrpersonals über einen regulären Studienabschluss in einem beruflichen Lehramt verfügt (Destatis 2018). Mitunter ist dies ein Resultat der nachhaltigen Rekrutierungsproblematik an berufsbildenden Schulen, wovon besonders die Hochtechnologiefachrichtungen, Elektro-, Fahrzeug- Metalltechnik und Informationstechnik betroffen sind. Dagegen ist die Nachfrage nach Studienplätzen im Lehramt an Gymnasien vergleichsweise robust (Rothland 2014), lediglich in den MINT-Fächern, besonders in Physik, besteht ebenfalls ein Nachfragemangel. Hinsichtlich erfolgsversprechender Strategien der Lehrkräftegewinnung in den Mangelbereichen sind daher Studien- und Berufswahlmotive, Interessen und berufsbezogenen Überzeugungen bei Studierenden im Lehramt an beruflichen Schulen und an Gymnasien in den MINT-Fächern von Interesse. Bezogen auf die Gruppe der Studierenden im Lehramt an beruflichen Schulen, die häufig erst später und über berufliche Erfahrungen oder andere Studiengänge in das berufliche Lehramt einmünden (Ziegler & Berger 2019) ist zudem zu prüfen, ob sie als sogenannte „Spätentscheider“ (Bergmann & Eder 1994) im Vergleich zu Studierenden im Lehramt an Gymnasien mit eher ungünstigen Motivlagen und Überzeugungen in das Studium einmünden oder ob die Passungserwägungen (Person-Umwelt-Modell) – ähnlich wie in den Lehrämtern an allgemeinbildenden Schulen – eher zu einer Homogenisierung im Bereich der motivational-affektiven Facette beitragen.

Fragestellung

Unterscheiden sich Studienanfänger*innen im LaG und LaB aufgrund der unterschiedlichen bildungsbiografischen Zugangswege in ihren motivational-affektiven Voraussetzungen? Gibt es innerhalb der Fächergruppen (MINT oder NICHT-MINT) Ähnlichkeiten und Unterschiede in den affektiv-motivationalen Voraussetzungen?

Methode

Im Zeitraum vom Wintersemester 16/17 bis zum Wintersemester 19/20 wurden insgesamt vier Kohorten Lehramtsstudierender (LaB und LaG) im ersten Semester an der TU Darmstadt erhoben und hinsichtlich ihrer Studienzugangswege und der motivationalen Voraussetzung untersucht. Insgesamt konnten 468 Studierende befragt werden, davon studieren 132 im LaB und 336 im LaG. Neben der Art der Hochschulzugangsberechtigung, der Tätigkeiten vor Studienbeginn, wurden auch die Fächerkombinationen, Motivation zu einem Hochschulstudium (sensu Richter 1995), Berufswahlmotivation mit FEMOLA-Skalen (Pohlmann et. al. 2010), Reflexionsbereitschaft (sensu Niggli 2004) sowie Selbstwirksamkeitserwartung (Schwarzer & Schmitz 1999) erhoben.

Ergebnisse

Die bisherige Datenlage zeigt, dass sich die Studierendengruppen in Bezug auf ihr Alter, die Art der Zugangsberechtigung und der Tätigkeit vor dem Studium signifikant unterscheiden, sich aber lediglich geringe Unterschiede hinsichtlich der Berufswahlmotivation, Selbstwirksamkeitserwartungen und Reflexionsbereitschaft belegen lassen. Lediglich die Motivation für ein Hochschulstudium ist bei LaB-Studierenden signifikant geringer ausgeprägt (t(341) = 2.617, p = .009). In einem Teil der Stichproben zeigen sich in den über das erste Studienjahr längsschnittlich erhobenen Daten, dass sich die Erwartungen an Inhaltsbereich und Leistungsanforderungen des ersten Fachs, den zeitlichen Aufwand und die Studienbedingungen der LaB-Studierenden signifikant weniger erfüllen als die der LaG-Studierenden. Es zeigt sich gleichzeitig, dass die allgemeinen Studienzufriedenheit und die Zufriedenheit mit dem ersten Fach im hohen Maß (R² = 0,98) davon abhängt, inwieweit die sich die Erwartungen an die Studieninhalte und Leistungsanforderungen im ersten Fach erfüllen.

 
9:00 - 10:45F9‒H07: Internationale und nationale Perspektiven auf Fortbildungen von Lehrkräften: Zentrale Akteure im Fokus
H07 
 

Internationale und nationale Perspektiven auf Fortbildungen von Lehrkräften: Zentrale Akteure im Fokus

Chair(s): Tim Fütterer (Universität Tübingen, Deutschland)

DiskutantIn(nen): Colin Cramer (Universität Tübingen, Deutschland)

Gemeinsame Fragestellung. Die stetig wandelnden Herausforderungen im Berufsalltag von Lehrkräften erfordern fortlaufende Professionalisierung, wobei Lehrerfortbildungen eine zentrale Rolle einnehmen (Darling-Hammond, Hyler & Gardner, 2017; Kennedy, 2016; Lipowsky & Rzejak, 2015). Wichtig ist, dass Lehrkräfte Zugang zu qualitativ hochwertigen und lernwirksamen Lerngelegenheiten haben (Kelchtermans et al., 2018). Lernwirksamkeit von Lehrerfortbildungen lässt sich in einem komplexen Interaktionsgefüge individueller Personenmerkmale (z.B. Persönlichkeit, volitionale-motivationale Orientierungen), kontextueller Bedingungen (z.B. finanzielle Unterstützung, Kooperationsklima) und struktureller Charakteristika der Fortbildungen (z.B. Schlüsselmerkmale bezüglich Wirksamkeit) erklären, welches sich in Angebots-Nutzungsmodellen darstellen lässt (z.B. Lipowsky, 2010). Die fünf Symposiumsbeiträge greifen dieses Interaktionsgefüge auf und richten den Fokus insbesondere auf die beiden zentralen Akteure von Fortbildungsprozessen: Fortbildner*innen und Lehrkräfte. Durch das Zusammenführen internationaler und nationaler Perspektiven wird den Fragestellungen nachgegangen, wie Fortbildungen wirksam gestaltet werden können, welche professionellen Voraussetzungen Fortbildner*innen und Lehrkräfte für lernwirksame Fortbildungsprozesse mitbringen sollten und wie professionelle Voraussetzungen nachhaltig gefördert werden können. Der multiperspektivische Zugang spiegelt sich gleichermaßen in der Diversität der methodischen Ansätze wider, die von der Anwendung eher qualitativer Design Research Ansätze bis zu adjustierten Mehrgruppen-IRT-Modellen reichen.

Die Beiträge. Beitrag 1 befasst sich mit dem Fortbildungsverhalten von Lehrkräften im Rahmen der Advanced Placement (AP) Reform in den USA. Neben dem Nutzungsverhalten verschiedener Fortbildungsformen (z.B. online, face-to-face) wurden mögliche Erträge bei Lehrkräften und Schüler*innen untersucht. Dabei zeigten sich beispielsweise signifikante Unterschiede in den Leistungen von Schüler*innen, deren Lehrkräfte unterschiedliche Fortbildungsformen nutzten. Gleichzeitig fanden sich Hinweise, die Unterschiede in der Effektivität bestimmter Fortbildungsformen für bestimmte Inhaltsbereiche nahelegen.

Ebenfalls im Kontext der AP Reformen widmen sich die Autoren des Beitrags 2 neueren Ansätzen von Lehrerfortbildungen. Die Autoren untersuchten das Nutzerverhalten von Lehrkräften auf Twitter um zu untersuchen ob derartige soziale Netzwerke Kriterien für qualitativ hochwertigere Fortbildungen erfüllen können. Die Ergebnisse sozialer Netzwerkanalysen deuten beispielsweise an, dass Hierarchie- und Kommunikationsstrukturen auf Twitter weniger hierarchisch strukturiert sind und kollaborative sowie positive Interaktionen unterstützen und damit Qualitätskriterien erfüllen können.

Während diese beiden Beiträge Fortbildungsverhalten im internationalen Kontext fokussieren, widmen sich die folgenden Beiträge deutschen Fortbildungsaktivitäten. Die Autoren des Beitrags 3 nehmen im Unterschied zu dem Fortbildungsverhalten nach Veränderungsprozesse im System (siehe AP-Reform) das natürliche Fortbildungsverhalten von Lehrkräften in den Blick. Die Autoren untersuchten die Partizipationsmuster von unterschiedlichen Fortbildungsformaten und wie sich die Fortbildungsaktivität über die Zeit verändert. Die Ergebnisse verdeutlichen, dass sich Muster gewählter Fortbildungsformate von Lehrkräften differenzieren lassen. Erste Ergebnisse zur Veränderung des Fortbildungsverhaltens deuten an, dass ein substanzieller Teil der Lehrkräfte ihr Fortbildungsverhalten verändert, wofür u.a. das Ausmaß der Freistellung vom Unterricht prädiktiv zu sein scheint.

Während die ersten drei Beiträge Lehrkräfte als zentrale Akteure die Lehrkräfte fokussieren, konzentrieren sich die folgenden beiden Beiträge auf die Fortbildner*innen. Beitrag 4 nimmt hier insbesondere die subjektive Wahrnehmung professioneller Identität von Lehrerfortbildner*innen in den Blick. Die aus internationalen Studien abgeleitete Grundannahme ist, dass professionelle Identitäten mit beruflichem Verhalten assoziiert sind und sich somit Zusammenhänge zur Gestaltung von Fortbildungen zeigen. Konkret wird adressiert, ob sich verschiedene Sub-Identitäten von Lehrerfortbildner*innen empirisch unterscheiden lassen und wie diese mit berufsbezogenen Kompetenzen sowie der Gestaltung von Fortbildungsangeboten für Lehrkräfte zusammenhängen. Die Ergebnisse zeigen beispielsweise, dass Fortbildner*innen, die sich eher als Unterstützer und weniger als Wissensvermittler verstehen eher Zusammenhänge zu Merkmalen effektiver Lehrkräftefortbildung aufweisen.

Beitrag 5 widmet sich ebenfalls den Fortbildnern*innen, konzentrieren sich dabei jedoch auf die professionelle Wahrnehmung (PW) dieser. Im Zentrum steht die Frage, wie auf Fortbildungsebene PW bezüglich fachlichem und fachdidaktischem Wissen von Fortbildner*innen in einer Qualifizierung zum Thema sprachsensibler Mathematikunterricht durch Video-Clubs gefördert werden kann. Dafür wurde in zwei Design Research Zyklen ein Prototyp eines Video-Clubs (weiter-)entwickelt und auf seine Wirkungen auf die PW hin überprüft. Die zentrale Erkenntnis ist, dass die Ergebnisse die Übertragbarkeit des Konstrukts PW auf die Fortbildnerebene stützen.

 

Beiträge des Symposiums

 

Wer nutzt was mit welchem „Erfolg“? Unterschiedliche Erträge verschiedener Lehrerfortbildungsformen zur Advanced Placement Reform in den Naturwissenschaften

Nicolas Hübner1, Christian Fischer2, Richard Göllner1, Barry Fishman3, Frances Lawrenz4, Arthur Eisenkraft5
1Universität Tübingen, Deutschland, 2University of California, Irvine, USA, 3University of Michigan, Ann Arbor, USA, 4University of Minnesota, USA, 5University of Massachusetts at Boston, USA

Theoretischer Hintergrund. In Zeiten globaler bildungspolitischer Bestrebungen zur Verbesserung der Bildungssysteme ist Wissen zur erfolgreichen Implementation intendierter Reformprozesse von zentraler Bedeutung. In der Vergangenheit wurde immer wieder die besondere Bedeutung von Lehrkräften für erfolgreiche Veränderungsprozesse betont (z.B. Porter, Fusarelli & Fusarelli, 2015). Spezifischer weisen verschiedene Studien darauf hin, dass Lehrerfortbildungen zentrale Grundlagen zur Professionalisierung von Lehrkräften bereitstellen können, die für eine erfolgreiche Implementation von Innovationen notwendig sind (Darling-Hammond, Hyler & Gardner, 2017; Desimone, 2009). Bisher wurden Lehrerfortbildungen im Zuge von Bildungsreformen in den Naturwissenschaften nur unzureichend genau untersucht, sodass insgesamt wenig Wissen zu ihrer Nutzung und möglichen lehrer- und schülerseitigen Erträgen existiert. In der vorliegenden Studie wird daher unter Rückbezug auf Daten aus den USA sowohl das Nutzungsverhalten als auch mögliche Erträge verschiedener Fortbildungsformen bei Lehrkräften und Schülerinnen und Schülern untersucht. Hierzu wurden Daten eines Verbundforschungsprojekts verwendet, die im Zuge der Advanced Placement (AP) Lehrplanreform in den Naturwissenschaften erhoben wurden (z.B. Fischer et al., 2018; Frumin et al., 2018). AP Kurse bieten Schülerinnen und Schülern in amerikanischen High Schools die Möglichkeit, Lerninhalte auf Hochschulniveau zu erfahren und gegebenenfalls universitäre Kreditpunkte zu erwerben (Warne, 2017). Zentrale Inhalte der Reform waren die Überarbeitung der zu vermittelnden Konzepte, Theorien und Prozesse, die Identifikation und Definition zentraler naturwissenschaftlicher Fähigkeiten und Fertigkeiten von Schülerinnen und Schülern am Ende der Sekundarstufe II sowie die Implementation von forschenden Lernprojekten (College Board, 2012, 2014a, 2014b).

Fragestellungen. Im Fokus des vorliegenden Beitrags stehen zwei übergeordnete Fragestellungen, die lehrer- und schülerseitige Variablen fokussieren. Zunächst wurde die Nutzung und mögliche Unterschiede zwischen Lehrkräften in verschiedenen Fortbildungsformen untersucht. Anschließend standen die schülerseitigen Erträge im Fokus. Hierzu wurde untersucht, ob sich Unterschiede in den Leistungen von Schülerinnen und Schülern zeigten, deren Lehrkräfte unterschiedliche Fortbildungsformen nutzten bzw. inwieweit es Unterschiede in der Effektivität bestimmter Fortbildungsformen für bestimmte Inhaltsbereiche gab.

Methode. Zur Beantwortung der vorliegenden Fragestellung wurden Lehrerfortbildungsteilnahmen in Bezug auf die AP Reform für Biologie (2014, 2015), Chemie (2014, 2015) und Physik (2015) untersucht. Verwendet wurden Daten von insgesamt N = 9.096 Lehrkräften und N = 197.589 Schülerinnen und Schülern. Die Auswertung der Daten erfolgte in Anlehnung an die zwei übergeordneten Fragestellungen: Nach der Aufbereitung und Kategorisierung der Informationen zu belegten Fortbildungsformen wurden mittels multinomialer logistischer Regressionsmodelle Unterschiede auf Hintergrundmerkmalen von Lehrkräften (z.B. dem Geschlecht, dem Alter, der Lehrerfahrung oder Ethnizität, etc.) zwischen den Fortbildungsformen untersucht. Der dritte Analyseschritt zielte darauf ab, mit adjustierten Mehrgruppen-IRT-Modellen Unterschiede zwischen den Fortbildungsgruppen in ihren selbst berichteten Unterrichtsinhalten („AP practices“) und den wahrgenommenen reformbezogenen Herausforderungen zu bestimmen. Schließlich wurde anhand von Schülerleistungsdaten geprüft, ob sich Unterschiede zwischen Schülerinnen und Schülern von Lehrkräften mit unterschiedlichen Fortbildungsprofilen in den verschiedenen Themenbereichen der AP Prüfung finden ließen. Die Ergebnisse der beiden Jahre in Biologie und Chemie wurden aggregiert. Die Datennestung wurde durch Schätzung robuster Standardfehler berücksichtigt und fehlende Werte mit der Full Information Maximum Likelihood Methode behandelt.

Ergebnisse. Die Ergebnisse zeigen, dass Lehrkräfte sich in vier Fortbildungsgruppen unterteilen ließen: Die erste Gruppe verwendete nur Materialien, die zweite Gruppe verwendete Materialien und nahm an klassischen Fortbildungen teil. Die dritte Gruppe verwendete Materialien und nahm an Online Fortbildungen teil und die größte Gruppe verwendete alle Fortbildungsformen. Es zeigten sich teilweise deutliche Unterschiede zwischen den Lehrkräften in den unterschiedlichen Fortbildungsgruppen. So berichteten beispielsweise Lehrkräfte, die alle Fortbildungsformen durchgeführt hatten, insgesamt von mehr Herausforderungen bei der Umsetzung der Reforminhalte. Schließlich fanden sich statistisch signifikante Unterschiede in den Leistungen von Schülerinnen und Schülern, deren Lehrkräfte an unterschiedlichen Fortbildungsformen teilgenommen hatten. Insgesamt erzielten hierbei insbesondere Schülerinnen und Schüler hohe Leistungen, deren Lehrkräfte kombiniert Materialien und Online-Fortbildungen genutzt hatten. Gleichzeitig fanden sich erste Hinweise, die Unterschiede in der Effektivität bestimmter Fortbildungsformen für bestimmte Inhaltsbereiche nahelegen.

 

Soziale Netzwerke und Lehrerbildung: Twitter als Lehrerfortbildung?

Christian Fischer1, Barry Fishman2, Sarita Yardi Schoenebeck2
1University of California, Irvine, USA, 2University of Michigan, Ann Arbor, USA

Theoretischer Hintergrund. In Zeiten der rapiden technologischen Weiterentwicklung in sämtlichen Lebensbereichen ist es notwendig, die Potentiale der Digitalisierung ebenfalls im Bezug auf Lehrerausbildung und Lehrerweiterbildung zu untersuchen. Während Lehrerfortbildungen traditionell mit face-to-face Workshops und Seminaren angeboten werden, wächst die Bedeutung von online und hybriden Lehrerfortbildungsformaten und deren wissenschaftlicher Untersuchung (Borko, Jacobs, & Koellner, 2010; Dede, Ketelhut, Whitehouse, Breit, & McCloskey, 2008). Aktuelle Studien untersuchen die Wirksamkeit von Online-Lehrerfortbildungen zur Erweiterung des Lehrerwissens, der Verbesserung der Unterrichtsqualität und der Erhöhung von Schülerleistung (Frumin et al., 2018; Kennedy, Rodgers, Romig, Lloyd, & Brownell, 2017; Macià & García, 2016). Insbesondere werden Lehrerfortbildungen als qualitativ hochwertig angesehen wenn diese Qualitätsmerkmale des „active learning“, „content focus“, „coherence“, „collective participation“, und „duration“ aufweisen (Desimone, 2009). Die vorliegende Studie knüpft an bisherige Forschung zu effektiven Lehrerfortbildungen an und untersucht, ob Partizipation in sozialen Netzwerken, am Beispiel von Twitter, Kriterien von qualitativ hochwertigen Lehrerfortbildungen erfüllen kann.

Fragestellungen. Diese Studie betrachtet das Nutzerverhalten von Lehrkräften auf Twitter am Bespiel von drei ausgewählten Biologie-Communities. Zunächst werden die Teilnahmemuster in den ausgewählten Twitter-Communities untersucht (1). Anschließend wird analysiert, ob Twitter eine positive und unterstützende Lernumgebung für Lehrkräfte bieten kann (2). Abschließend werden temporale Partizipationsmuster von Lehrkräften evaluiert (3). Damit wird insbesondere untersucht ob Twitter die Qualitätsmerkmale von Lehrerfortbildungen der „collective participation“ und „duration“ erfüllen kann.

Methode. Diese Studie ist in den Kontext der Advanced Placement (AP) Reform in Biologie eingebettet (Fischer et al., 2016, 2018; The College Board, 2012). Dabei wurden die drei aktivsten Hashtag-gebundenen AP Biologie Twitter-Communities untersucht; #apbiochat, #apbioleaderacademy, #apbioleaderacad. Sämtlich Kommunikation vom Beginn der jeweiligen Hashtags bis zum 15.6.2016 (vier Wochen nach der AP Biologie Prüfung im Jahr 2016) wurde mit der Twitter API, dem R-Paket twitterR und selbstentwickelten Python-Skripten erfasst. Insgesamt wurden 2.259 Tweets von 121 Teilnehmern erhoben, wobei davon 2.040 Tweets von 93 Lehrkräften verfasst wurden. Mittels sozialer Netzwerkanalyse (SNA) wurden Lehrkräften in Gruppen je nach „eigenvector centrality“ (Wichtigkeit der Lehrkraft in der Community), „closeness centrality“ (Zentralität der Lehrkraft in der Community) und „betweenness centrality“ (Vernetzungsfähigkeit der Lehrkraft in der Community) zusammengefasst, um Hierarchie- und Kommunikationsstrukturen zu untersuchen. Jedem Tweet wurden mit einer zwei-zyklischen Kodierungsstrategie Merkmale bezüglich des Sentiments (positive, negativ, weder noch) und der Inhaltsebene (z.B. Biologie-Fachwissen, Teilen von Materialen, Organisation der Twitter-Chats) zugewiesen. Nach der Datenaufbereitung wurden logistische Regressionsmodelle verwendet, um Zusammenhänge im Tweet-Verhalten der Lehrkräfte mit den SNA-basierten Gruppenzugehörigkeiten zu untersuchen (1. Fragestellung). Mittels Hierarchischer Linearer Modellierung (HLM) wurden Zusammenhänge vom Tweet-Sentiment und der Reichweite von Tweets (Retweets/Likes) untersucht (2. Fragestellung). Abschließend wird die Häufigkeit und Dauer der Partizipation in den Twitter-Communities betrachtet (3. Fragestellung).

Ergebnisse. Die Ergebnisse zeigen, dass das Tweet-Verhalten von Lehrkräften die Gruppenzugehörigkeiten bezüglich Hierarchie- und Kommunikationsstrukturen beeinflussen kann. Interessanterweise sind Lehrkräfte, welche einen größeren Anteil an Tweets mit Biologie-Fachwissen aufweisen, eher in niedrigen Wichtigkeits-Gruppen. Ebenfalls sind Lehrkräfte mit größerem Anteil von Tweets in denen Materialien geteilt werden in niedrigeren Vernetzungsfähigkeit-Gruppen. Dabei haben Tweets mit positivem Tweet-Sentiment signifikant höhere Reichweiten in den Communities. Bezüglich der temporalen Partizipationsmuster zeigt sich, dass 16% der Lehrkräfte substantiell Zeit aufwenden (mindestens ein Tweet alle zwei Wochen für Zeitdauern von mehr als 100 Tage). Diese Ergebnisse deuten an, dass Hierarchie- und Kommunikationsstrukturen auf Twitter weniger hierarchisch strukturiert sind, kollaborative und positive Interaktionen unterstützen (collective participation), und flexible temporale Partizipationsmöglichkeiten bieten (duration). Damit können soziale Netzwerke Lehrkräfte zu größerer Selbstverantwortlichkeit im Fortbildungs- und Lernprozess anregen.

 

Welche Lehrkraft wählt welche Fortbildungsformate? Eine längsschnittliche Perspektive

Tim Fütterer1, Nicolas Hübner1, Christian Fischer2, Kathleen Stürmer1
1Universität Tübingen, Deutschland, 2University of California, Irvine, USA

Theoretischer Hintergrund. Die sich stetig wandelnden Herausforderungen im Berufsalltag von Lehrkräften (z.B. inklusiver Unterricht) erfordern eine fortlaufende Professionalisierung, wobei Lehrerfortbildungen eine zentrale Rolle einnehmen (Darling-Hammond, Hyler, & Gardner, 2017; Kennedy, 2016; Lipowsky & Rzejak, 2015). Die bisherige Forschung im deutschsprachigen Raum wird von der Frage dominiert, warum Lehrkräfte Lehrerfortbildungen besuchen oder nicht. Querschnittsstudien konnten zeigen, dass die Nutzung von Lehrerfortbildungen mit Personenmerkmalen (z.B. Selbstwirksamkeit) zusammenhängt (Cramer, Johannmeyer, & Drahmann, 2019; D. Richter, Engelbert, Weirich, & Anand Pant, 2013; E. Richter, Richter, & Marx, 2018). International werden insbesondere Schlüsselmerkmale (z.B. die Dauer) für nachhaltig lernwirksame Lehrerfortbildungen diskutiert (Darling-Hammond et al., 2017; Desimone, 2009; Fischer et al., 2020). Forschung zu Fortbildungsformaten ist oft beschränkt auf Fortbildungsmodalitäten (online vs. face-to-face, z.B. Fishman et al., 2013). Forschung zu Kontextmerkmalen (z.B. Freistellung vom Unterricht) und Personenmerkmalen als Prädiktoren der Wahl von Fortbildungsformaten ist unterrepräsentiert. Insbesondere fehlen Erkenntnisse, was Fortbildungsaktivitäten über die Zeit beeinflusst. Die vorliegende Studie greift diese Forschungsdesiderata auf, indem für Deutschland die Wahl von Fortbildungsformaten (z.B. Kurse/Workshops, Bildungskonferenzen) fokussiert wird, die sich mit Hilfe der Schlüsselmerkmale charakterisieren lassen. Zudem werden Personen- und Kontextvariablen simultan zur Vorhersage der Wahl von Fortbildungsformaten betrachtet und sowohl quer- als auch längsschnittlich untersucht. Die Identifikation von Präferenzen bestimmter Lehrkräfte für bestimmte Fortbildungsformate könnte langfristig helfen, Angebotsstrukturen zu optimieren und somit Fortbildungsaktivitäten zu fördern und besser zu steuern.

Fragestellungen. Folgende Fragestellungen wurden untersucht: (1) Welche Muster weisen Lehrkräfte hinsichtlich besuchter Fortbildungsformate auf? (2) Was charakterisiert Lehrkräfte, die ein spezifisches Muster besuchter Fortbildungsformate aufweisen? (3) Verändern Lehrkräfte ihre Fortbildungsaktivität über die Zeit? Falls ja, wie lassen sich diese Veränderungen beschreiben und welche Variablen auf Lehrer-, Klassen- und Schulebene stehen mit einem veränderten Fortbildungsverhalten in Zusammenhang?

Methode. Zur Beantwortung der Fragestellungen wurden die Daten von zwei Startkohorten und zwei Messzeitpunkten (t1:2010 und t2:2011) des Nationalen Bildungspanels (NEPS) verwendet (Blossfeld, Roßbach, & von Maurice, 2011). Insgesamt basieren die Analysen auf den Angaben von N=3.025 Lehrkräften. Bezüglich der ersten Forschungsfrage wurden explorative latente Klassenanalysen auf Grundlage der Informationen zu unterschiedlichen Fortbildungsformaten (u.a. Kurse/Workshops, Bildungskonferenzen) durchgeführt. Zur Beantwortung der zweiten Fragestellung wurden zunächst Mittelwerte und Varianzen zentraler Hintergrundvariablen der Lehrkräfte zwischen den Klassen verglichen (z.B. Geschlecht, Alter, Abschlussnoten, Berufserfahrung). Anschließend wurde die Wahrscheinlichkeit der Gruppenzugehörigkeit durch die verschiedenen Variablen im Rahmen eines multivariaten multiplen Regressionsmodells vorhergesagt und Unterschiede zwischen den Prädiktoren getestet. In diesen Modellen wurden Prädiktor- und Kontrollvariablen sowohl auf Ebene der Lehrkräfte als auch auf Klassen- (u.a. Disziplin, Leistungshomogenität) sowie Schulebene (u.a. schulisches Engagement, Zeit zum Austausch im Kollegium) berücksichtigt. Die dritte Fragestellung nach der Veränderung der Fortbildungsaktivität wurde schließlich mittels multipler logistischer Regressionsmodelle untersucht. Konkret wurde hierzu ein Wechsel der Klasse zwischen den Messzeitpunkten als dichotome abhängige Variable durch die in Fragestellung 2 genannten Prädiktoren vorhergesagt. Die Datennestung wurde durch Schätzung robuster Standardfehler berücksichtigt und fehlende Werte mit der Full Information Maximum Likelihood Methode behandelt.

Ergebnisse. Die Ergebnisse verdeutlichen, dass sich die Muster gewählter Fortbildungsformate von Lehrkräfte in drei Klassen (K1-K3) unterteilen lassen: Lehrkräfte in K1 belegen eine Kombination aus mehreren Fortbildungsformaten. Lehrkräfte in K2 belegen insbesondere Kurse/Workshops, Bildungskonferenzen und Arbeitsgruppen. Lehrkräfte in K3 sind bei der Wahl von Fortbildungsformaten sehr selektiv, sie nehmen überwiegend an Kursen/Workshops teil. Mittelwertvergleiche zeigen, dass Lehrkräfte in K1 und K2 statistisch signifikant zufriedener im Beruf sind und sich im Berufsalltag mehr mit Kollegen austauschen. Zudem investieren Lehrkräfte in K1 und K2 statistisch signifikant mehr Tage in Fortbildungsaktivitäten, sind generell engagierter und arbeiten in einem kooperativeren Kollegium. Erste Ergebnisse zur dritten Fragestellung deuten an, dass für eine Veränderung im Fortbildungsverhalten von t1 zu t2 (40% der Lehrkräfte wechseln Fortbildungsformate) insbesondere das Geschlecht (Frauen wechseln häufiger) und die Freistellung vom Unterricht prädiktiv sind.

 

Who you are, is how you teach. Professionelle Identität und professionelles Verhalten von Lehrerfortbildner/-innen

Eric Richter1, Martin Brunner2, Dirk Richter1
1Universität Potsdam, Deutschland, 2Universität PUniversität Potsdam, Deutschlandotsdam

Theoretischer Hintergrund und Fragestellungen. Lehrkräfte sollten auch während ihrer Berufsausübung Zugang zu qualitativ hochwertigen Lerngelegenheiten haben (Kelchtermans et al. 2018). Dieser Umstand richtet den Fokus der Lehrkräfteforschung vermehrt auf Lehrerfortbildner/-innen, welche Lehrkräfte in ihrer beruflichen Entwicklung durch das Bereitstellen geeigneter Fortbildungsangebote unterstützen sollen (Liston et al. 2008). Während für den deutschsprachigen Raum bisher kaum Untersuchungen zu Lehrerfortbildner/-innen existieren, liegt der Schwerpunkt internationaler Studien auf der Analyse beruflicher Identitäten von Lehrerfortbildner/-innen (Lunenberg et al. 2014). Verschiedene Untersuchungen konnten zeigen, dass sich Lehrerfortbildner/-innen in der Wahrnehmung ihrer professionellen Identität unterscheiden (Kelchtermans 2009). Im Rahmen inhaltsanalytischer Untersuchungen ließen sich zwei Gruppen von Lehrerfortbildner/-innen identifizieren: Unterstützer, die vorrangig einen lernerzentrierten Standpunkt einnehmen, und Wissensvermittler, die eher einen lehrendenzentrierten Standpunkt einnehmen (Jonker et al. 2018; Vanassche und Kelchtermans 2014). Diese Unterscheidung erscheint für die Fortbildungsforschung vielversprechend, da vor dem Hintergrund des Personal interpretative framework (Kelchtermans 2009) davon ausgegangen wird, dass die professionelle Identität eng mit dem beruflichen Verhalten assoziiert ist. Zumeist qualitative Studien weisen dabei auf Zusammenhänge zwischen der professionellen Identität von in der Lehrkräftebildung tätigen Personen und der Qualität ihrer Lernangebote hin (Jonker et al. 2018; Vanassche und Kelchtermans 2014). Dieser Beitrag geht deshalb der Frage nach, ob sich verschiedene Sub-Identitäten von Lehrerfortbildner/-innen empirisch unterscheiden lassen und wie diese mit berufsbezogenen Kompetenzen sowie der Gestaltung von Fortbildungsangeboten für Lehrkräfte zusammenhängen.

Methode. Die vorliegende Untersuchung wurde mit 70 Schulberater/-innen in Brandenburg durchgeführt. Schulberater/-innen sind reguläre Lehrkräfte, die im Rahmen einer Abordnung selbstständig Fortbildungsveranstaltungen planen und durchführen. Bis zur Tagung wird die Stichprobe noch vergrößert (erwartetes N=140). Im Fokus der Befragung stand die professionelle Identität der Schulberater/-innen. Hierzu wurden zwei Skalen eingesetzt. Die Skala Unterstützer bildet ab, wie sehr Schulberater/-innen ihre Hauptaufgabe darin sehen, Lehrkräfte in ihrer Entwicklung zu unterstützen und deren Selbstreflexion über ihr Unterrichten anzuregen (z.B. „Meine zentrale Aufgabe ist es, die Selbstreflexion der Lehrkräfte zu unterstützen.“; α=.65). Die Skala Wissensvermittler bildet ab, wie sehr Schulberater/-innen ihre Hauptaufgabe darin sehen, den Lehrkräften vorrangig professionelles Wissen zu vermitteln (z.B. „Kern meiner Arbeit ist die Vermittlung von Wissen an die Lehrkräfte.“; α=.68). Zur Untersuchung der Zusammenhänge zwischen der professionellen Identität und Aspekten professioneller Kompetenz sowie der Gestaltung von Fortbildungsangeboten wurden Überzeugungen zum schulischen Lehren und Lernen und die Selbstwirksamkeit als Schulberater/-in jeweils auf einer vierstufigen Likert-Skala eingeschätzt. Zusätzlich wurde erfasst, wie häufig Schulberater/-innen innerhalb ihrer Veranstaltungen Aktivitäten durchführen, die von der Fortbildungsforschung als lernwirksam identifiziert wurden (Darling-Hammond et al., 2017, z.B. Kollaboration, „Ich stelle sicher, dass sich die Teilnehmenden in Gruppen austauschen können“). Die Angaben der Schulberater/-innen zur Fortbildungspraxis wurden zu einem Summenscore zusammengefasst. Alle eingesetzten Skalen wiesen mindestens eine ausreichende Reliabilität auf (.68≤α≤.87). Zusammenhänge zwischen den Skalen wurden mithilfe bivariater Korrelationsanlaysen untersucht.

Ergebnisse. Eine positive Korrelation zeigt sich zwischen konstruktivistischen Lehr- und Lernüberzeugungen und der Skala Unterstützer (r=.39, p<.01), jedoch nicht für die Skala Wissensvermittler (r=.09, p=.44). Die Analysen zeigen weiterhin, dass die Kompetenzfacette Selbstwirksamkeit als Schulberater/-in nicht im Zusammenhang mit den Skalen Unterstützer (r=.16, p=.20) und Wissensvermittler (r=-.06, p=.61) steht. Die Analyse ergab zudem einen Zusammenhang zwischen dem Vorkommen von Merkmalen effektiver Lehrkräftefortbildung und der Skala Unterstützer (r=.50, p<.01). Dieser Zusammenhang zeigt sich hingegen nicht für die Skala Wissensvermittler (r=.17, p=.16). Die vorliegende Untersuchung ist eine der ersten, die zeigt, dass die professionelle Identität von Lehrerfortbildner/-innen differenziert erfasst werden kann. Es konnten ferner differenzielle Zusammenhänge zwischen den beiden Formen professioneller Identität sowie Aspekten der professionellen Kompetenz und der Gestaltung von Fortbildungsveranstaltungen festgestellt werden. Weitere Untersuchungen sollten sich deshalb der Frage widmen, wie die verschiedenen Identitäten entstehen und welche Bedeutung die subjektiven Identitäten für den Lernerfolg der Teilnehmenden besitzen.

 

Design eines Video-Clubs zur Unterstützung der professionellen Wahrnehmung von Fortbildenden für sprachsensiblen Mathematikunterricht

Christoph Look, Rebekka Stahnke, Christin Laschke, Bettina Roesken-Winter
Humboldt-Universität zu Berlin, Deutschland

Theoretischer Hintergrund. Die professionelle Wahrnehmung von Lehrpersonen beschreibt die Fähigkeit, selektiv wahrzunehmen, wissensbasiert zu interpretieren und Handlungsalternativen zu generieren (Jacobs, Lamb & Philipp, 2010). Sie ist ein Prädiktor für Unterrichtsqualität (Kersting, Givvin, Sotelo & Stigler, 2010) und kann durch videobasierte Interventionen gefördert werden (Stahnke, Schüler & Roesken-Winter, 2016). Die Bedeutung der professionellen Wahrnehmung rückt auch für Fortbildende zunehmend in den Fokus (Lesseig et al., 2017). Fortbildende von Mathematiklehrpersonen benötigen Wissen und professionelle Wahrnehmung auf zwei Ebenen: Einerseits ist der fachliche Fortbildungsgegenstand wesentlich (SCK=Specialized content knowlegde; Jacobs, Seago & Koellner, 2017) andererseits ist eine Fachdidaktik auf Fortbildungsebene gefordert (PD-PCK–Pedagocical content knowledge on the Professional Development level; Jacobs et al., 2017). Bei der Qualifizierung von Fortbildenden ist es wichtig, diese Aspekte in Bezug auf den jeweiligen fachlichen und/oder fachdidaktischen Gegenstand zu fördern. Wie die professionelle Wahrnehmung von (zukünftigen) Fortbildenden in einer Qualifizierung zum Thema sprachsensibler Mathematikunterricht durch Video-Clubs gefördert werden kann, ist Gegenstand dieses Beitrags. In zwei Design Research Zyklen wurde ein Prototyp eines Video-Clubs (weiter-) entwickelt und auf seine Wirkungen auf die professionelle Wahrnehmung hin überprüft.

Fragestellungen. Ziel war es, dass die Fortbildenden in Diskussionen über für diesen Zweck validierte Videosequenzen eher Fortbildungsgegenstand und Fortbildungsfachdidaktik als allgemeine Fortbildungsdidaktik (PD-PK) fokussieren und die Subprozesse der professionellen Wahrnehmung auftreten: Erkennen und Beschreiben von Schlüsselsituationen und Handlungsalternativen generieren. Folgende Fragestellungen wurden untersucht: (1) Zu welchen Anteilen fokussieren die Fortbildungsteilnehmenden in ihren Diskussionen SCK, PD-PCK und PK? (2) Zu welchen Anteilen werden die Fortbildungsteilnehmenden beschreibend oder interpretierend tätig bzw. generieren Handlungsalternativen?

Methode. Ein erstes Design eines Video-Clubs fokussierte die kontrastierende Diskussion zweier Videos aus Fortbildungen zu sprachsensiblem Mathematikunterricht anhand von Beobachtungsfragen, welche die Diskussion leiteten. Basierend auf den Ergebnissen des ersten Zyklus wurden die Fragestellungen so angepasst, dass zunächst eine lerngegenstandsbasierte Beschreibung der Videoszenen gefordert wurde, bevor Interpretation und Generierung von Handlungsalternativen fokussiert wurden. Die Gruppendiskussionen wurden videografiert und mit Hilfe eines Kodiersystems in MaxQDA hinsichtlich des inhaltlichen Fokus (SCK, PD-PCK oder PD-PK) und der Subprozesse (Beschreiben, Interpretieren und Handlungsalternativen generieren) ausgewertet. Im ersten Zyklus nahmen 14 Fortbildende teil, von denen 11 über Erfahrung als Fortbildner*in verfügen und 4 bereits Lehrkräfte zu Themen der Sprachbildung fortgebildet haben. Im zweiten Zyklus waren es 30 Fortbildende. Alle Teilnehmenden haben Erfahrung als Fortbildner*in, 27 verfügen über Erfahrung mit der Gestaltung von Fortbildungen zur Sprachbildung im Mathematikunterricht, 10 haben bereits Fortbildungen zu dem in der Qualifizierung behandelten Ausschnitt aus der Sprachbildung gegeben.

Ergebnisse. Im ersten Zyklus zeigte sich zwar eine leichte Fokussierung der Gruppendiskussion auf SCK und PD-PCK, jedoch nahm die Diskussion von PD-PK Aspekten viel Raum ein (40% der Zeit für PK; 60% der Zeit für SCK und PD-PCK). Die Äußerungen zu SCK und PD-PCK Aspekten waren dabei vor allem interpretierend (31% Beschreibung; 44% Interpretation; 25% Generieren von Handlungsalternativen). Nach Anpassung des Designs zeigte sich im zweiten Zyklus eine stärkere Fokussierung der Diskussion auf SCK und PD-PCK Aspekte (23% der Zeit für PK; 77 % der Zeit für SCK und PD-PCK). Weiterhin zeigte sich ein Rückgang des Anteils an Interpretationen zugunsten von Beschreibungen und der Generation von Handlungsalternativen (40% Beschreibung; 10% Interpretation; 50% Generieren von Handlungsalternativen). Die Ergebnisse zeigen am Gegenstand des sprachsensiblen Mathematikunterrichts die Übertragbarkeit des Konstrukts der professionellen Wahrnehmung auf die Fortbildenenebene auf. Es wird deutlich, dass einzelne Designelemente, hier die Fokussierung der diskussionsleitenden Fragen, gegenstandsspezifisch entwickelt und adaptiert werden müssen.

 
9:00 - 10:45F9‒H08: State-Maße zur Erfassung von Emotion und Motivation: Zusammenhänge, Prädiktivität für akademische Leistungen und Veränderbarkeit durch (gezielte) Interventionen
H08 
 

State-Maße zur Erfassung von Emotion und Motivation: Zusammenhänge, Prädiktivität für akademische Leistungen und Veränderbarkeit durch (gezielte) Interventionen

Chair(s): Daria K. Benden (TU Dortmund), Cora Parrisius (Universität Tübingen)

DiskutantIn(nen): Thomas Götz (Universität Wien)

Leistungsbezogene Emotionen und Motivationen spielen eine bedeutsame Rolle für Bildungsentscheidungen und Bildungserfolg. So prägen Emotionen und Motivationen nicht nur das momentane Lernverhalten von Individuen, sondern beeinflussen auch ihre Entscheidungen, sich für bestimmte Ziele zu engagieren, und in der Folge ihre akademischen Leistungen (z.B. Pekrun & Linnenbrink-Garcia, 2014; Wigfield & Cambria, 2010). Theorien der Leistungsemotion und -motivation beschreiben die Entstehung und Entwicklung von Emotionen und Motivationen als komplexe Prozesse, in denen sich verschiedene Facetten dieser Konstrukte innerhalb eines Lernprozesses gemeinsam entwickeln und auch mit Kontextfaktoren interagieren (z.B. Kontroll-Wert-Theorie, Pekrun, 2006; Erwartungs-Wert-Theorie, Eccles et al., 1983). Um diese Entwicklungsprozesse im Verlauf einer Lernsituation sowie zwischen verschiedenen Lernsituationen besser verstehen zu können, werden in der Emotions- und Motivationsforschung vermehrt Verfahren wie die Experience-Sampling Methode (Hektner et al., 2007) eingesetzt, mit denen situative Emotionen und Motivationen erfasst werden können.

Im Kontext der Emotionsforschung zeigten sich – insbesondere in der Gegenüberstellung zu Trait-Emotionen – nicht nur eine hohe intra-individuelle Variabilität von Emotionen, sondern darüber hinaus auch differenzielle Zusammenhänge von verschiedenen State-Emotionen (z.B. Goetz et al., 2016). Offen bleibt allerdings, inwiefern State-Emotionen über Lernsituationen hinweg miteinander zusammenhängen und ob es darüber hinaus beispielweise auch differenzielle Zusammenhänge mit akademischen Leistungen abhängig vom Zeitpunkt innerhalb eines Lernprozesses gibt.

Im Vergleich zur Emotionsforschung wurden Verfahren wie Experience-Sampling im Bereich der Motivationsforschung bislang eher selten eingesetzt. Bisherige Studien zeigten jedoch nicht nur inter-individuelle Unterschiede in motivationalen Überzeugungen, sondern auch intra-individuelle Varianz zwischen verschiedenen Lernsituationen sowie verschiedenen Lerninhalten (z.B. Dietrich et al., 2017). Erste Studien deuten auch darauf hin, dass motivationale Veränderungen innerhalb kurzer Zeitspannen Risikofaktoren für spätere Leistungsprobleme darstellen können (Kosovich et al., 2017). Nicht allein deswegen ist ein prominenter Fokus innerhalb der Motivationsforschung die Untersuchung von Interventionen zur Förderung der Motivation (für einen Überblick über STEM-Interventionen siehe bspw. Rosenzweig & Wigfield, 2016). Ihre Evaluierungen basieren bislang jedoch meist auf Selbstberichten Lernender über ihre dispositionelle Motivation, sodass keine Aussagen über durch eine Motivationsintervention angestoßene Prozesse getroffen werden können. Mehr Forschung ist daher nötig, um diese Zusammenhänge und Wirkmechanismen von Motivationsinterventionen besser zu verstehen.

Das vorliegende Symposium beschäftigt sich daher mit der Frage nach (1) intra-individuellen Zusammenhängen verschiedener situationsspezifischer Emotions- oder Motivationszustände, nach (2) prädiktiven Effekten von State-Emotionen und State-Motivationen für akademische Leistungen und nach (3) der Veränderbarkeit des Motivationsverlaufs durch (gezielte) Interventionsmaßnahmen.

Alle vier Beiträge nutzen längsschnittliche Designs über eine kurze Zeitspanne hinweg zur Untersuchung der Fragestellungen. Dazu verwenden die Autorinnen und Autoren der Beiträge die Experience-Sampling Methode (Beiträge 1, 2) oder tägliche bzw. wöchentliche Selbstberichte mittels Fragebögen (Beiträge 3, 4) zur Erfassung situativer Emotionen und Motivation im schulischen (Beitrag 4) und hochschulischen Kontext (Beiträge 1-3).

Die vier Artikel ergänzen bisherige Forschungsergebnisse, indem intra-individuelle Zusammenhänge innerhalb von State-Emotionen (Beitrag 1) und State-Motivationen (Beitrag 2) sowie Zusammenhänge zwischen State-Emotion und State-Motivation (Beitrag 2) beschrieben werden. Sie untersuchen darüber hinaus, wie State-Maße bzw. Veränderungen in diesen Maßen mit akademischen Leistungen (Beiträge 1, 3) und Studienzufriedenheit zusammenhängen (Beitrag 3) und nehmen die Rezeptivität von State-Motivation gegenüber Interventionen – wie beispielsweise gezielten Maßnahmen zur Motivationsförderung oder Leistungsfeedback – in den Blick (Beiträge 3, 4).

Das Symposium wird wie folgt gestaltet: Die Chairs werden zunächst das Thema des Symposiums und die präsentierenden Autorinnen und Autoren vorstellen. Die Vortragenden haben jeweils etwa 17 Minuten Zeit für die Vorstellung ihrer Beiträge, gefolgt von 2 Minuten für Verständnisfragen aus dem Publikum. Im Anschluss wird unser Diskutant mit Expertise im Bereich von State- und Trait-Maßen die einzelnen Beiträge diskutieren und seine Perspektive auf weitere Forschung mit State-Maßen in der Emotions- und Motivationsforschung darstellen (ca. 15 Minuten). In den übrigen 10 Minuten wird es die Gelegenheit zu einer offenen Diskussion und für weitere Fragen aus dem Publikum geben.

 

Beiträge des Symposiums

 

Studierender, ärgere dich nicht – Die dynamische Entwicklung von Emotionen während einer Klausurvorbereitung

Anna-Lena Rottweiler, Ulrike E. Nett
Universität Augsburg

Theoretischer Hintergrund und Fragestellung

Die Bedeutung von Lern- und Leistungsemotionen, auch für den Lernerfolg der Lernenden, wurde in den vergangenen Jahren in der bildungswissenschaftlichen Forschung wiederholt empirisch belegt (vgl. Pekrun & Linnenbrink-Garcia, 2014). Dabei wurden Lern- und Leistungsemotionen meist über Fragebogenstudien erhoben (vgl. Pekrun et al., 2011). Unberücksichtigt bleibt bei dieser Methode jedoch die große Variabilität von Emotionen (Fridja, 2007) ebenso wie die Annahme, dass intraindividuelle Prozesse bei der Entstehung und Verfestigung von Emotionen eine Rolle spielen (z.B. Goetz et al., 2016). Dies konnte in neueren Studien, die mit Hilfe der Experience Sampling Methode das aktuelle Erleben von Emotionen erfassen (z.B. Goetz et al., in press), berücksichtigt werden.

Diese Studien belegen eine hohe intraindividuelle Variabilität von Emotionen und zeigen, dass es unterschiedliche Zusammenhänge zwischen stabilen Trait- und variablen Stateemotionen gibt (z.B. Goetz et al., 2016; Nett et al., 2017). Auch konnte gezeigt werden, dass während eines Lernprozesses das aktuelle Erleben einen Einfluss auf das spätere Erleben einer Emotion hat, sich Emotionen also im Laufe eines Lernprozesses verfestigen können (z.B. Respondek et al., 2019). Ungeklärt bleibt jedoch, ob sich unterschiedliche Emotionen auch gegenseitig über verschiedene Zeitpunkte hinweg beeinflussen.

Ziel dieser explorativen Experience Sampling Studie war es, intraindividuelle Wechselwirkungen und Entwicklungen von Lern- und Leistungsemotionen sowie ihre Wirkung auf die Lernleistung zu analysieren.

Methode

An der Studie nahmen Studierende der Psychologie und Wirtschaftswissenschaften teil (N = 217; 76% weiblich, M_Alter= 21.4 Jahre, SD_Alter = 2.97 Jahre). Die Datenerhebung fand zu zwei Messzeiträumen (jeweils 7 Tage), während des ersten Semesters statt. Der erste Messzeitraum begann 35 Tage vor einer wichtigen Klausur der Studierenden, der zweite Messzeitraum 7 Tage vor dieser Klausur. Während eines Messzeitraums beantworteten die Studierenden auf Smartphones zu sechs semi-randomisierten Messzeitpunkten am Tag Kurzfragebögen zu ihrem aktuellen emotionalen Erleben. Klausurbezogene Lern- und Leistungsemotionen (Freude, Hoffnung, Ärger, Angst; vgl. Pekrun et al. (2011) wurden dann erhoben, wenn die Studierenden angaben, während der vergangenen Stunde an die Klausur gedacht zu haben. Abschließend wurde die Note in der Klausur erfasst.

Zur Beantwortung der Fragestellung wurden dynamische Strukturgleichungsmodelle (DSEM; Hamaker et al., 2018) durchgeführt (Software Mplus 8; Muthén & Muthén, 1998-2017). Mit Hilfe dieser Modelle werden Wechselwirkungen (cross-lagged) auf intraindividueller Ebene modelliert, somit wird analysiert, inwiefern sich das aktuelle Erleben einer Emotion auf das spätere Erleben einer anderen Emotion auswirkt. Die Modelle wurden getrennt für beide Messzeiträume und für jedes Emotionspaar aufgestellt (2*6=12).

Ergebnisse

Die autoregressiven Pfade (zwischen aufeinanderfolgenden Messzeitpunkten) sind für alle Emotionen bedeutsam. Kurz vor der Klausur sind diese, insbesondere für die Emotionen Angst und Ärger, signifikant stärker als zum zweiten Messzeitraum. Dieser Befund untermauert die Annahme, dass sich Lern- und Leistungsemotionen während eines Lernprozesses verfestigen. Signifikante cross-lagged Effekte zeigen sich überwiegend erst kurz vor der Klausur. Im ersten Messzeitraum haben lediglich Freude und Hoffnung eine negative Auswirkung auf später erlebten Ärger. Im zweiten Messzeitraum dagegen hat das Erleben der Emotion Freude einen Einfluss auf die spätere Hoffnung der Studierenden. Darüber hinaus zeigen sich sowohl für Freude als auch für Hoffnung negative Auswirkungen durch das Erleben von Angst und wechselseitige Effekte mit dem Erleben von Ärger. Für Angst und Ärger zeigen sich schwache Wechselwirkungen.

Im ersten Messzeitraum steht keine Emotion mit der Klausurnote in einem signifikanten Zusammenhang, zum zweiten Messzeitraum hängt Hoffnung signifikant mit der Klausurnote (r = .17*) zusammen. Dieser Befund kann als Hinweis interpretiert werden, dass auch die Bedeutung von Lern- und Leistungsemotionen für den Lernerfolg situationsspezifisch sein kann.

Abschließend wird diskutiert, inwiefern die Ergebnisse auf Wirkmechanismen zwischen Lern- und Leistungsemotionen hinweisen, die über Ergebnisse von Korrelationsstudien (z.B. Goetz et al., 2016) hinausgehen. Bei der Interpretation wird der explorative Charakter der Studie berücksichtigt.

 

Intra-individuelle Wertüberzeugungen, Erfolgserwartungen und Leistungsemotionen: Kombination zweier Erwartungs-Wert-Modelle

Belinda Berwerger, Sebastian Born, Julia Dietrich
Friedrich-Schiller-Universität Jena

Theoretischer Hintergrund und Fragestellung

Erwartungs-Wert-Theorien schreiben Erwartungen an die Kontrollierbarkeit von Lernaktivitäten und deren subjektivem Wert eine zentrale Rolle im Lernprozess zu. So bestimmt laut Kontroll-Wert-Theorie (KTW, Pekrun, 2006) die Kombination aus Kontrollerleben und Wertüberzeugungen, welche Emotion wie stark auftritt (z.B. Freude bei hohem Kontrollerleben und hohem Wert, Goetz et al., 2010). Der vorliegende Beitrag kombiniert die KWT mit der Erwartungs-Wert-Theorie von Eccles und Kolleg/innen (EWT, Eccles & Wigfield, 2002), um hinsichtlich der Rolle der Wertkomponente in der Vorhersage von Leistungsemotionen ein differenzierteres Bild als in bisherigen Studien zeichnen zu können (vgl. Lauermann et al., 2017, für Prüfungsangst). Die EWT differenziert den Wert einer Lernaktivität in vier Subkomponenten: intrinsischer Wert, Nützlichkeitswert, Wichtigkeitswert und wahrgenommene Kosten des Lernens. Die Erwartungskomponente wird in der EWT als Erfolgserwartung operationalisiert, die die Erwartung abbildet, in einer zukünftigen Lern- oder Leistungssituation erfolgreich zu sein.

Inter-individuell angelegte Studien haben Zusammenhänge zwischen dem generellen Ausmaß an Überzeugungen und Trait-Emotionen untersucht (Personenebene, z.B. Lauermann et al., 2017). Diese Studien lassen offen, ob gefundene Zusammenhänge auch intra-individuell für die in spezifischen Situationen erlebten State-Emotionen gelten (Situationsebene; vgl. Bieg et al., 2013). Befunde zu inter-individuellen Beziehungen liefern häufig ungenaue Informationen über intra-individuelle Funktionsweisen und lassen nicht zwingend Rückschlüsse auf intra-individuelle Beziehungen zu (Molenaar, 2004; Schmitz, 2006). Die Experience-Sampling Methode bietet die Möglichkeit, intra-individuelle Beziehungen zu untersuchen und situative Einflüsse auf intra-individuelle Dynamiken zu erfassen (Bolger & Laurenceau, 2013). Der zentrale Fokus der EWT und KWT ist die State-Ebene, welche konkrete Lernaktivitäten oder Leistungssituationen umfasst (z.B. Eccles & Wigfield, in press; Pekrun, 2006). Die vorliegende Studie basiert daher auf intra-individuell erhobenen intensiven Daten in einer Stichprobe von Studierenden und untersucht folgende Forschungsfrage:

Welchen Vorhersagebeitrag leisten intrinsischer Wert, Nützlichkeitswert, Wichtigkeitswert und wahrgenommene Kosten in Bezug auf State-Emotionen (Freude, Hoffnung, Langeweile, Ärger), in Relation zu und in Kombination mit der Erfolgserwartung?

Methode

N = 95 Studierende (75% weiblich) nahmen während des Semesterverlaufs an einer intensiven Datenerhebung teil. Wir nutzten ein Event-basiertes Sampling an bis zu 34 Messzeitpunkten während des Lernens mit dem Online-Lehrangebot der Vorlesung. In jeder Lernsituation (insgesamt 1'496 State-Messungen während der Bearbeitung von Lerntests) berichteten die Studierenden Erwartungs- und Wertüberzeugungen sowie Leistungsemotionen. Diese waren bezogen auf die Inhalte des jeweils bearbeiteten Lerntests (z.B. Nützlichkeitswert: „Diese Inhalte werden für meinen späteren Beruf nützlich sein“; 1 = stimmt gar nicht; 4 = stimmt genau; Emotionen: „Nachdem Sie den Lerntest bearbeitet haben, wie fühlen Sie sich? Ich fühle mich... Gelangweilt“; 1 = Gar nicht; 4 = Sehr stark).

Ergebnisse

Die Forschungsfrage wurde mittels Regressionsanalysen auf Situationsebene unter Berücksichtigung der Nestung der Daten beantwortet. Es zeigten sich erwartete positive lineare Zusammenhänge von situativer Erfolgserwartung (Kontrolle) mit Hoffnung und Freude, sowie unerwartet auch mit dem erlebten Ärger. Hinsichtlich der Wertkomponente gingen hoher intrinsischer und Nützlichkeitswert in einer Lernsituation mit positiven Emotionen (Hoffnung, Freude) einher; geringer intrinsischer und Wichtigkeitswert hingen mit negativen Emotionen (Ärger, Langeweile) zusammen. Hohe wahrgenommene Kosten korrelierten ebenfalls mit dem Auftreten der negativen Emotionen.

Darüber hinaus wurden erwartungsgemäß multiplikative Effekte von Erfolgserwartungen und Wertüberzeugungen auf Emotionen gefunden: Spezifisch zeigten sich Interaktionen zwischen Erfolgserwartung und Nützlichkeitswert für Hoffnung, und zwischen Erfolgserwartung und Kostenwert für negative Emotionen.

Die Ergebnisse werden im Hinblick auf die KWT und die EWT diskutiert. Zusätzlich werden daraus sich ergebende offene Fragen für die mögliche Weiterentwicklung beider Modelle skizziert. Zum Schluss wird die Frage der Generalisierbarkeit intra-individueller Ergebnisse im Hinblick auf die Formalisierung von theoretischen Annahmen zu Entwicklungsprozessen aufgegriffen.

 

Motivationsverläufe bei Studierenden innerhalb der ersten Semesterwochen in Mathematikvorlesungen: Zusammenhänge mit Leistungsfeedback und Studienleistungen

Daria K. Benden, Fani Lauermann
TU Dortmund

Theoretischer Hintergrund und Fragestellung

Studienmotivation spielt eine bedeutende Rolle für Engagement und Erfolg im Studium (Robbins et al., 2004). So legt die Erwartungs-Wert-Theorie (Eccles et al., 1983) nahe, dass der erwartete Erfolg und die subjektiven Werte von Studierenden bezüglich akademischer Aufgaben proximale Prädiktoren von leistungsbezogenen Entscheidungen sind, wie etwa dem Verfolgen akademischer Ziele oder dem Einsatz im Studium. Bisher haben nur wenige Studien Veränderungen der Erwartungs- und Wertüberzeugungen in der Studieneingangsphase erforscht, obwohl einzelne Studien zeigen, dass Motivationsveränderungen in dieser Phase Warnzeichen für Abbruchtendenzen und spätere akademische Schwierigkeiten sein können (Kosovich et al., 2017; Perez et al., 2014). Dabei könnten im Sinne einer Stage-Environment-Fit-Perspektive (vgl. Eccles et al., 1993) gerade die ersten Wochen des Semesters besonders entscheidend sein, da sich die Studierenden in einem neuen Umfeld mit hohen Leistungsanforderungen befinden; erste Misserfolgserlebnisse bei Leistungsrückmeldungen können in diesem Kontext zu Zweifeln an der eigenen Leistungsfähigkeit und somit zu Zweifeln am Studium führen.

Folglich untersucht die vorliegende Studie, wie sich Erwartungs- und Wertüberzeugungen von Studierenden in Mathematikvorlesungen innerhalb der ersten Semesterwochen verändern, ob es Zusammenhänge zwischen Veränderungen und Leistungsfeedback in den Mathematikkursen gibt und wie diese Veränderungen mit akademischen Leistungen und Studienzufriedenheit am Semesterende zusammenhängen.

Methode

Die Studie begleitete Studierende aus fünf Kohorten der Studiengänge Physik, Mathematik und Mathematik auf Lehramt innerhalb der ersten Semesterwochen in Mathematikveranstaltungen der Studieneingangsphase (N = 773, zwei Kohorten Physik und Mathematik-Lehramt und eine Kohorte Mathematik). Erwartungs- und Wertüberzeugungen (Interesse, Nützlichkeit, Anstrengungs- und psychologische Kosten) der Studierenden bezüglich der Inhalte der vergangenen Woche wurden in den Wochen zwei bis fünf des Semesters erfasst. Studierende erhielten wöchentlich Leistungsfeedback zu verpflichtenden Übungsblättern. In zwei Kohorten (N = 296, eine Kohorte Mathematik und Mathematik-Lehramt) erhielt ein Teil der Studierenden (34%) aufgrund der Zuordnung der Übungsgruppen das erste Leistungsfeedback zufällig erst eine Woche später im Vergleich zu den anderen Studierenden, sodass kausale Zusammenhänge zwischen der Feedbackgebung und Veränderungen der motivationalen Überzeugungen der Studierenden getestet werden konnten. Die Studierenden gaben außerdem ihre Abiturnoten (M = 1.9, SD = 0.65) und ihr Geschlecht (34% weiblich) an. In der letzten Semesterwoche wurde die Studienzufriedenheit erfasst und die Klausurleistungen der Studierenden wurden von den Dozierenden an das Forscherteam weitergegeben (54% der Studierenden gaben Zustimmung).

Ergebnisse

Change-Score Analysen zeigten, dass die Studierenden von Woche 2 zu Woche 3 einen Motivationsschock erleben, der durch eine Abnahme von Erfolgserwartung sowie Interesse und Nützlichkeit bezüglich der Studieninhalte (ΔM = [–0.92,–0.23]) und einen Anstieg von wahrgenommener Anstrengung und Stressempfinden (ΔM = 0.35 bzw. 0.68) gekennzeichnet ist. In den folgenden Wochen gab es im Durchschnitt keine signifikanten Veränderungen mit Ausnahme der wahrgenommenen Kosten, die auch nach dem initialen Motivationsschock variierten (ΔM = [–0.39,0.17]). Nach Kontrolle für schulische Leistungen, Kohorte, Geschlecht und Motivation zu Semesterbeginn zeigte sich der Motivationsschock als signifikanter negativer Prädiktor von Klausurleistungen und Studienzufriedenheit (R^2 = .42 bzw. .64), sodass diese kurzfristigen Veränderungen als Warnzeichen interpretiert werden können.

Darüber hinaus zeigte sich, dass Studierende, die zufällig in Woche zwei statt Woche drei das erste Leistungsfeedback erhielten, in dieser Woche eine größere Abnahme der Erfolgserwartung sowie einen größeren Anstieg der wahrgenommenen Kosten erlebten im Vergleich zu Studierenden, die ihr Leistungsfeedback noch nicht erhalten hatten. Somit hat das Leistungsfeedback einen kausalen Einfluss auf den Motivationsschock.

Die Analysen zeigen, dass sich die Erwartungs- und Wertüberzeugungen der Studierenden nicht in linearer Form verändern, sondern Studierende innerhalb der ersten Semesterwochen einen Motivationsschock empfinden, nachdem sie das erste Leistungsfeedback erhalten haben. Nicht nur die Motivation der Studierenden zu Semesterbeginn, sondern auch Veränderungen in den motivationalen Überzeugungen innerhalb der ersten Semesterwochen waren prädiktiv für Klausurleistungen und Studienzufriedenheit am Semesterende, sodass solche kurzzeitigen Veränderungen der Motivation bei der Identifikation von Abbruchtendenzen berücksichtigt werden sollten.

 

Effekte einer Nützlichkeitsintervention auf die situative Motivation von Schülerinnen und Schülern im Mathematikunterricht

Cora Parrisius, Hanna Gaspard, Sven Rieger, Benjamin Nagengast, Ulrich Trautwein
Universität Tübingen

Theoretischer Hintergrund und Fragestellung

Die Motivation von Schüler*innen nimmt im Laufe der Sekundarstufe insbesondere im Fach Mathematik im Mittel immer weiter ab (vgl. Scherrer et al., 2019; und Watt, 2004). Als Ansätze zur Förderung der Motivation wurden in der Vergangenheit erfolgreich verschiedene Interventionen entwickelt und auf ihre Wirksamkeit getestet (für einen Überblick siehe Lazowski & Hulleman, 2016). Aufschluss über ihre Wirksamkeit geben in der Regel Studien, die Motivation anhand dispositioneller Messungen untersuchen (z.B. Hulleman et al., 2010). Wenngleich zahlreiche Untersuchungen von Motivationsinterventionen positive Effekte auf die Ausprägung auf diesen dispositionellen Motivationsmaßen andeuten, gibt es kaum Untersuchungen, die einen detaillierten Blick auf durch eine Intervention angestoßene Veränderungsprozesse werfen. Eine Möglichkeit, sich detaillierten Veränderungsprozessen zu nähern, ist die mehrmalige Erfassung von situationsbezogener Motivation. Wiederholt auftretende situative Motivationszustände gelten als Voraussetzung für eine längerfristige Veränderung in der Motivation (siehe z.B. Vier-Phasen-Modell der Interessenentwicklung; Hidi & Renninger, 2006), weswegen ihre Untersuchung Aufschluss über Gründe für Veränderungen der dispositionellen Motivation liefern kann.

Der vorliegende Beitrag untersucht daher, ob sich Interventionseffekte einer Nützlichkeitsintervention (MoMa-Intervention; vgl. Gaspard et al., 2019) auf situative Motivationsmaße in fünf auf die Intervention folgenden Mathematikstunden finden und wie sich diese ggf. über die Zeit verändern. Prospektiv soll hiermit die Frage beantwortet werden, ob spezifische situative Entwicklungen womöglich sogar Voraussetzung für Interventionseffekte auf die dispositionelle Motivation zu einem späteren Zeitpunkt sind.

Methode

Der Untersuchung liegen Daten der MoMa 2.0-Studie (vgl. Gaspard et al., 2019) zugrunde, die auf die Förderung der wahrgenommenen Nützlichkeit der Mathematik durch Schüler*innen der neunten Jahrgangsstufe abzielt. N = 1.744 Schüler*innen aus 78 Klassen von 28 baden-württembergischen Gymnasien nahmen an der Studie teil. Die Klassen wurden randomisiert einer von zwei Interventionsbedingung (Durchführung der Intervention entweder durch die eigene Mathematiklehrkraft oder durch geschulte Masterstudierende) oder einer Wartekontrollbedingung zugewiesen. Die 90-minütige Intervention wurde im Klassenkontext durchgeführt. Die Schüler*innen machten zum Prätest und zum Posttest Angaben über ihre dispositionelle Motivation (bspw. „Mathe macht mir Spaß“), die basierend auf der Erwartungs-Wert-Theorie (Eccles et al., 1983) in den Dimensionen Nützlichkeit, intrinsischer Wert, Wichtigkeit und Kosten erfasst wurde. In den fünf auf die Intervention folgenden Mathematikstunden berichteten sie zudem ihre situative Wahrnehmung (d.h. bezogen auf die vergangene Mathematikstunde, bspw. „Die Beschäftigung mit den Inhalten hat mir Spaß gemacht“) der Nützlichkeit, ihres intrinsischen Werts, der Wichtigkeit und der Kosten.

Die Fragestellungen wurden regressionsanalytisch untersucht, d.h. die jeweiligen Statemaße der fünf Unterrichtsstunden wurden auf zwei Dummy-Variablen, die die Zugehörigkeit zur jeweiligen Interventions- im Vergleich zur Wartekontrollbedingung anzeigten, regrediert. Dabei wurden die Interventionseffekte simultan für alle fünf Statemaße der jeweiligen Wertüberzeugung geschätzt. Konsistent zur Untersuchung von Interventionseffekten auf die dispositionellen Wertüberzeugungen (vgl. Gaspard et al., 2019) wurde für verschiedene Kovariaten (u.a. Geschlecht, Vorjahresleistung in Mathematik, Wertüberzeugungen zum Prätest) kontrolliert. Der genesteten Datenstruktur wurde durch die Korrektur der Standardfehler Rechnung getragen (McNeish et al., 2017) und fehlende Werte durch das Full Information Maximum Likelihood-Verfahren in Mplus berücksichtigt (vgl. Graham, 2009).

Ergebnisse

Ebenso wie in einer früheren Untersuchung der dispositionellen Motivation (vgl. Gaspard et al., 2019) fanden sich sowohl auf die situative Nützlichkeits- als auch auf die situative Kostenwahrnehmung Effekte der MoMa-Intervention im Vergleich zur Wartekontrollgruppe. Dabei schienen die Effekte auf die Nützlichkeitswahrnehmung in Klassen, in denen die Lehrkraft eigenständig die Intervention durchführte, von Unterrichtsstunde zu Unterrichtsstunde abzunehmen. In Klassen hingegen, in denen geschulte Masterstudierende die Intervention durchführten, sowie in beiden Bedingungen bezüglich der wahrgenommenen Kosten zeigte sich eine eher unsystematische Entwicklung der Interventionseffekte. In einem nächsten Schritt sollen Interventionseffekte auf die Statemotivation der Schüler*innen mit bereits gefundenen Effekten auf die dispositionelle Motivation (vgl. Gaspard et al., 2019) in Verbindung gebracht werden, um die Veränderung der situativen Motivation als Voraussetzung für die Veränderung der relativ stabilen dispositionellen Motivation zu testen.

 
9:00 - 10:45F9‒S18: Wünschenswerte Erschwernisse beim Lernen: Der Einfluss von Abrufübungen und Selbsterklärungen auf Lern- und Transferleistungen
S18 
 

Wünschenswerte Erschwernisse beim Lernen: Der Einfluss von Abrufübungen und Selbsterklärungen auf Lern- und Transferleistungen

Chair(s): Veit Kubik (Martin Luther Universität Halle, Deutschland & FernUniversität in Hagen)

DiskutantIn(nen): Christof Kuhbandner (Universität Regensburg)

Forschung zu Lehr-Lern-Prozessen hat u.a. das Ziel, Bedingungen und Interventionen für gelingende Bildungsprozesse zu untersuchen. Die Instruktionspsychologie und empirische Bildungsforschung versucht hierbei, wie Lehr-Lern-Prozesse inner- und außerhalb von Bildungsinstitutionen bestmöglich gestaltet werden können. Vor diesem Hintergrund beleuchtet das Symposium aktuelle Forschung zu wünschenswerten Erschwernissen beim Lernen. Hierunter versteht man Maßnahmen, die kurzfristig Lernen erschweren, aber mittel- und langfristig das Behalten und den Transfer vom Gelernten verbessern können (Bjork & Bjork, 2011; Lipowski et al., 2015). Dieses kontraintuitive Wirkprinzip von wünschenswerten Erschwernissen ist noch wenig zur wirksamen Gestaltung von Lernen in Schule und Studium angewendet worden.

Zwei solcher wünschenswerten Erschwernisse stellen Gedächtnistests und Selbsterklärungen dar. Tests werden typischerweise in der (Hoch-)Schule zur Überprüfung und Bewertung von Lernleistungen verwendet. Über diesen diagnostischen Nutzen hinaus, können sie als effektive Lerngelegenheit genutzt werden: So führt die Abrufübung bei Tests („abruf-basiertes Lernen“) zu einer stärkeren Konsolidierung des Gelerntes und einer Verbesserung nachfolgenden Lernens (Dunlosky et al., 2013; Rowland, 2014). Eine zweite effektive Lernaktivität ist das Einbinden von Selbsterklärungen in den Lernprozess. Dabei werden zu lernende Inhalte aktiv durch Selbsterklärungen erzeugt (Fiorella & Mayer, 2016) und der Transfer von Wissen auf neue Probleme befördert.

Allerdings sind diese Lernaktivitäten nicht einfach umso effektiver, desto größere Lernschwierigkeiten sie bereiten. Im vorliegenden Symposium sollen die Anwendungs- und Randbedingungen dieser beiden Lernaktivitäten vorgestellt werden. Die Wirksamkeit wünschenswerter Erschwernisse hängt u.a. von der Komplexität des Lernmaterials, dem Anwendungskontext, Eigenschaften der Lernenden sowie der Art der Tests ab. Daher werden aktuelle Forschungsergebnisse zum Transfer von Wissen auf neue Probleme, die Kombination mit anderen effektiven Lernprinzipien, zugrundeliegende Mechanismen sowie die Übertragbarkeit dieser Instruktionsprinzipien auf den schulischen Kontext und auf komplexere Lernmaterialien beleuchtet. Diese praxisrelevanten Erkenntnisse stellen eine wichtige Grundlage für evidenzbasierte Entscheidungen in der Bildungspolitik und -praxis (Kultusministerkonferenz, 2015; Slavin, 2002) dar.

Der Beitrag von Barenberg et al. untersuchte in einem Quasi-Experiment den Einsatz von (Lern-)Tests bei 11. Klässlern im Schulunterricht. Hierbei wurde der Fokus auf das Erlernen von spanisch-deutschen Vokabelpaaren im Spanischunterricht gelegt. Die Autoren untersuchten, inwieweit Abrufübungen, im Vergleich zu erneutem Studieren, nicht nur das langfristige Behalten von gelernten Vokabeln fördert, sondern auch die Transferleistungen über veränderte Test- und Aufgabenformate.

Der Beitrag von Endres et al. beschäftigt sich in einem Laborexperiment mit dem Einfluss von (Lern-)Tests und der Anregung von organisationalen Prozessen (d.h. das Verknüpfen von Textinhalten) auf langfristiges Behalten von Texten im Hochschulkontext. Hierbei wird zusätzlich der Fokus auf die kombinierte Wirksamkeit von beiden Lernaktivitäten auf das Zusammenhangswissen sowie die metakognitive Genauigkeit gelegt, mit der Lernende ihre Lernleistung einschätzen können.

Der Beitrag von Kubik et al. fokussiert in zwei computergestützten Experimenten auf den Einfluss von Gedächtnistests auf das Erlernen neuer Informationen in zukünftigen Wissenserwerbsphasen. Neben diesem vorwärtsgerichteten Testeffekt wird untersucht, ob und inwiefern bereits das Treffen von Vorhersagen über die eigene Gedächtnisleistung das Erlernen von neuen Informationen befördert. Dabei wird die Komplexität der Lernmaterialien variiert.

Der Beitrag von Harders et al. beschäftigt sich mit dem Selbsterkläreffekt. Studierende sollten anhand vorgegebener Lernmaterialien mit Texten oder Schaubildern die inhaltlichen Zusammenhänge eines fiktiven politischen System selbstständig erarbeiten. Ein zentrales Ziel der computergestützten Studie war es zu untersuchen, ob nur das Bilden neuer Schlussfolgerungen oder auch das Umschreiben von bereits gelernten Zusammenhängen dem Selbsterkläreffekt zugrunde liegt.

Der Beitrag von Lachner et al. untersuchte, inwieweit das selbständige Erzeugen von schriftlichen Erklärungen zu besseren Lernleistungen beim Lernen von Texten führt. Dabei fokussierten die Autoren auf die zugrundeliegende Mechanismen des Erkläreffekts und zwar v.a. auf die Rolle von Gedächtnisabrufen, generativen Lernstrategien oder die entstandenen sozialen Situation beim Erklären zurückzuführen ist. Anhand eines Labor- und eines Feldexperiments wurden vier Gruppen miteinander verglichen: Abruf, Selbsterklärung, instruktionale Erklärung und Kontrollgruppe.

 

Beiträge des Symposiums

 

Der Einfluss des Testens auf den Transfer über Testformate in der Schule

Jonathan Barenberg, Jasmina Tilgner, Stephan Dutke
Westfälische Wilhelms-Universität Münster

Theoretischer Hintergrund und Fragestellung: In der Schule dienen Tests üblicherweise zur Leistungsabfrage und Leistungsbewertung. Der Einsatz von Tests als Lerninstrument findet deutlich seltener in der Schule statt. Dabei weisen Reviews und Meta-Analysen zum Testeffekt darauf hin, dass der Abruf von Lerninhalten (z. B. in einem Test) den erneuten Abruf dieser Inhalte zu einem späteren Zeitpunkt begünstigen kann (z. B. Dunlosky, Rawson, Marsh, Nathan & Willingham, 2013; Rowland, 2014). Ein Grund für die geringe Verbreitung des Tests als Lerninstrument liegt möglicherweise im Design vieler Studien zum Testeffekt. Häufig werden die Lerninhalte in Lern- und Prüfphase unter ähnlichen, vergleichbaren Testbedingungen abgerufen. Für die Anwendung von Tests als Lerninstrument in der Schule ist es aber von Bedeutung, ob dieser Testeffekt auch zum Tragen kommt, wenn die Testbedingungen sich verändern und einen Transfer erfordern. Erste Reviews und Meta-Analysen zu Testeffekten in Transferkontexten weisen zwar auf signifikante Effekte hin, aber auch auf erhebliche Varianz zwischen Studien und Transferbedingungen (Carpenter, 2012; Pan & Rickard, 2018). Ziel der vorliegenden Studie ist es, die aktuelle Befundlage zu ergänzen und insbesondere Bedingungen für den Transfer über verschiedene Test- bzw. Aufgabenformate zu untersuchen.

Methode: Dazu wurden Schüler und Schülerinnen aus acht Klassen der elften Jahrgangsstufe (N = 142) beim Lernen von Vokabelpaaren (Spanisch-Deutsch) in ihren Klassen untersucht. In einem quasi-experimentellen Design wurden jeweils vier Klassen einer Test- oder Kontrollbedingung zugeordnet. Die Untersuchung umfasste zwei Termine. An Termin 1 wurden zu Beginn einer Spanischstunde 30 spanisch-deutsche Vokabelpaare präsentiert. Am Ende der gleichen Schulstunde erfolgte die Intervention: In der Kontrollgruppe wurden alle Vokabeln noch einmal auf die gleiche Weise präsentiert, in der Testgruppe erfolgte ein Abruf mit Hinweisreiz (spanische Vokabel präsentiert, deutsche Vokabel abgefragt), der ein Feedback inkludierte (Präsentieren der korrekten deutschen Vokabel). Eine Woche später absolvierten alle Schüler und Schülerinnen einen Abschlusstest, der drei Aufgaben mit ansteigender Schwierigkeit umfasste: 10 Vokabeln wurden mit einem Wiedererkennenstest abgefragt, 10 Vokabeln über einen Abruf mit Hinweisreiz (spanische Vokabel präsentiert, deutsche Vokabel abgefragt) und 10 Vokabeln über einen Abruf mit umgekehrten Hinweisreiz (deutsche Vokabel präsentiert, spanische Vokabel abgefragt).

Ergebnisse: Deskriptiv zeigten die Schüler und Schülerinnen der Testbedingung in allen drei Aufgaben des Abschlusstests eine bessere Leistung als die Schüler und Schülerinnen der Kontrollbedingung. Ein signifikanter Vorteil des Testens zeigte sich in der Originalaufgabe (Abruf mit Hinweisreiz) und einer Transferaufgabe (Abruf mit umgekehrten Hinweisreiz). Ein Zusammenhang der Effektstärken des Testeffekts mit der Schwierigkeit der Aufgaben im Abschlusstest wurde nicht beobachtet. Es zeigte sich vielmehr eine Abnahme der Stärke des Testeffekts mit zunehmender Unähnlichkeit vom Originaltest. Dieses Befundmuster entspricht den Annahmen des Ansatzes zum transfer-appropriate processing (Morris, Bransford & Franks, 1977).

 

Organisation auf Abruf – Kann man das Organisieren von komplexen Inhalten mit abrufbasiertem Lernen verknüpfen?

Tino Endres, Helene Zeeb, Leon Finke, Alexander Renkl
Albert-Ludwigs-Universität Freiburg

Das Abrufen von Inhalten hilft uns, Inhalte langfristig zu behalten. Dieses als Testing-Effekt bekannte Phänomen wurde vielfach experimentell belegt (Rowland, 2014). Darüber hinaus verbessert der Abruf die metakognitive Genauigkeit mit der Lernende ihren aktuellen Lernstand beurteilen. Aufgrund dieser Evidenz haben viele Forscher Anwendungsempfehlungen für die Implementierung des abrufbasierten Lernens im schulischen Alltag ausgesprochen. Dabei zeigen einige Studien, dass die Verknüpfung von Abruf mit anderen Lernprozessen, wie zum Beispiel mit der Organisation des Lernmaterials, lediglich zu gleichwertigen Lernergebnissen führt. So konnte beispielsweise abrufbasiertes Mindmapping nicht zu verbesserten Lerneffekten beitragen (Blunt & Karpicke, 2014; Karpicke & Blunt, 2011; Lechuga, Ortega-Tudela, Gómez-Ariza, 2015). Diese Studien betrachteten jedoch besonders die Abrufleistung der Lernenden. Organisationprozesse zielen aber nicht nur auf die reine Abrufleistung, sondern vielmehr auf die Verbindung unterschiedlicher Inhalte ab. In dieser Studie wollten wir feststellen, ob abrufbasiertes Lernen tatsächlich die Anwendung organisationaler Prozesse überflüssig macht, oder ob die Verbindung beider Prozesse möglicherweise zu weiteren Vorteilen führt. Um dies zu überprüfen haben wir neben den klassischen abruforientierten Maßen zusätzlich das Zusammenhangswissen erhoben.

Abruf-Hypothese: Der Abruf von Lerninhalten verbessert die Behaltensleistung.

Organisationshypothese: Die Organisation von Lerninhalten verbessert das Wissen über Zusammenhänge.

Metakognitionshypothese: Der Abruf von Lerninhalten verbessert die metakognitive Korrektheit über den aktuellen Lernstand.

Methode: 111 Studierende lasen einen Text über Fähigkeitstheorien. Anschließend wurden sie randomisiert einer von vier Bedingungen in einem 2x2-Between-Subjects-Design zugeordnet. Wir variierten die Faktoren Organisation und abrufbasiertes Lernen. Organisation wurde dadurch umgesetzt, dass die Lernenden nach dem Lesen einen sogenannten „Matrix-Organizer“ bearbeiteten (Kauffman & Kiewra, 2010). Bei dieser Organisationsmethode werden Informationen eines Textes in einer Tabelle so dargestellt, dass die Zusammenhänge zwischen den Inhalten erkennbar werden. Dabei ist eine Unterscheidung zwischen lokalen Zusammenhängen (zwischen zwei benachbarten Spalten) und globalen Zusammenhängen (über alle Spalten hinweg) möglich. Abrufbasiertes Lernen wurde dadurch umgesetzt, dass die Lernenden nach dem Lesen entweder einen mit Kategorien versehenen Matrix-Organizer ausfüllen oder Kurzantworten zu den Spaltenkategorien des Matrix-Organizers aus dem Gedächtnis bearbeiteten. Die Kontrollgruppe lernte den Text erneut. Nach der Aufgabenbearbeitung schätzten die Versuchspersonen ihren Lernerfolg ein (Judgments of Learning, JOL). Zwei Wochen später beantworteten die Versuchspersonen Fragen zu den Texten (Behaltensleistung). Zur Einschätzung der metakognitiven Korrektheit wurde ein Bias Index mit Hilfe der JOLs und der tatsächlich erreichten Punktzahl berechnet. Zur Beurteilung des Zusammenhangswissens wurde das Wissen über unterschiedliche Verbindungen zwischen den Fähigkeitstheorien auf lokaler und globaler Ebene erhoben.

Ergebnisse: Wir verwendeten MANOVAs mit a priori-Kontrasten, um unsere Hypothesen zu überprüfen. Die Abruf-Hypothese konnte bestätigt werden (p =.029). Eine Bayessche Analyse zeigte Evidenz dafür, dass es keine Unterschiede zwischen den beiden Bedingungen des Abruf Faktors gab (BF01=5.53). Die Organisationshypothese konnte für lokale Zusammenhänge bestätigt werden (p=.031). Eine Bayessche Analyse zeigte starke Evidenz dafür, dass es keinen Unterschied zwischen den beiden Organisationbedingungen hinsichtlich der Organisation gab (B01=11.91). Bei globalen Zusammenhängen gab es keine signifikanten Unterschiede zwischen den Faktoren. Eine Bayessche Analyse zeigte starke Evidenz für die Nullhypothese (BF01=90.91). Die Metakognitionshypothese konnte für den Abruffaktor nicht bestätigt werden. Die kombinierte Bedingung war der reinen Organisationsbedingung jedoch überlegen (p=.018).

Diskussion: Unsere Studie konnte zeigen, dass abrufbasiertes Lernen Organisationsprozesse nicht überflüssig macht. Nur die Kombination der Lernprozesse führte zu einer Verbesserung beider Wissensarten. Die Verbesserung beider Lernprozesse in der kombinierten Bedingung führt dabei zu gleichwertigen Ergebnissen wie reines Abrufen bzw. Organisieren auf die adressierten Wissenskomponenten (Behaltensleistung oder Organisation). Die Organisationsprozesse, die in unserer Studie angeregt wurden, führten zu einer Verbesserung der lokalen Zusammenhänge. Auf globaler Ebene gab es keine Unterschiede. Die Methode des Matrix-Organizer konnte in unserer Studie diese breiteren Verknüpfungen nicht anregen. Besonders wertvoll scheint die Verbindung von Abruf und Organisation im Hinblick auf die metakognitive Korrektheit der Lernenden zu sein. Nur die kombinierte Bedingung zeigte eine Verbesserte der Metakognition.

 

Der Einfluss von metakognitiven Einschätzungen auf zukünftiges Lernen: Welche Rolle spielt die Komplexität des Lernmaterials

Veit Kubik1, Alp Aslan2, Torsten Schubert2
1Martin Luther Universität Halle, Deutschland & FernUniversität in Hagen, 2Martin-Luther-Universität Halle-Wittenberg

Forschungshintergrund

Bildungsprozesse erstrecken sich in Schule und Studium häufig über mehrere Stunden. Der Wissenserwerb nimmt dabei mit zunehmender Zeit ab. Gründe hierfür sind, dass die mentale Anstrengung der Lernenden sinkt und dass kürzlich erworbene Inhalte das Lernen neuer Informationen erschweren können (Yang et al., 2018). Eine Maßnahme nachfolgendes Lernen zu verbessern besteht darin, Zwischentests in Wissenserwerbsphasen einzubauen. Experimentalpsychologische Studien zeigten, dass testbasiertes Abrufen des Gelernten hilft, neue Informationen besser zu lernen im Vergleich zu anderen Lernaktivitäten und somit einen vorwärtsgerichteten Testeffekt erzeugen.

Selbsttests werden von Lernenden allerdings selten als Lernaktivität eingesetzt, da sie nicht als solche wahrgenommen werden und bei manchen sogar Ängste auslösen. Es wäre demnach günstig Lernaktivitäten zu vermitteln, die von Lernenden bevorzugt angewendet und dennoch abrufbasiertes Lernen indirekt evozieren (Sundkvist et al., 2018). Eine solche Lernaktivität könnte darin bestehen, Vorhersagen über die eigene Gedächtnisleistung zu machen (Tauber et al., 2015, 2018).

Fragestellung

Der Beitrag untersucht, inwieweit und unter welchen Umständen Judgements of Learning (JOLs) zukünftiges Lernen fördern können. Es wird angenommen, dass JOLs das zukünftige Lernen neuer Informationen verbessern können, wenn sie mentale Gedächtnisabrufe auslösen. Um diese Hypothese zu testen, wurde die Wahrscheinlichkeit manipuliert, dass Lernende mentale Abrufversuche bei JOLs vornehmen; diese treten am wahrscheinlichsten auf, wenn nur ein Teil des Lerninhalts, aber nicht der gesamte Lerninhalt, verfügbar ist .

Basierend auf der Zwei-Stadien-Theorie (Son & Metcalfe, 2005) kann allerdings angenommen werden, dass JOLs bei einfachen und schweren Items nur auf Bekanntheitsurteilen beruhen und nicht auf einem vollständigen Gedächtnisabruf. Daher wurde zudem untersucht, inwieweit JOLs ähnlich effektiv zukünftiges Lernen fördern wie Gedächtnistests.

Bislang ist der vorwärtsgerichtete Testeffekt mehrheitlich mit einfachem Wortmaterial untersucht worden (Yang et al., 2018). Deshalb wurde außerdem beleuchtet, inwieweit die potentiellen Lerneffekte von JOLs und Tests auch bei komplexeren Begriffsdefinitionen auftreten.

Experiment 1

Methode. Studierende (N = 161) lernten fünf neue Wortlisten mit der Instruktion, diese am Studienende alle zu erinnern. In der anschließenden Manipulationsphase wurde ihnen randomisiert vier unterschiedliche Aufgaben zugewiesen: Restudieren (der vollständigen Wörter, bspw. Banane), JOLsvollständig (basierend auf den vollständigen Wörtern), JOLsunvollständig (basierend auf Wortfragmenten, bspw Ba_____), oder Abruf (basierend auf einem Test mit Wortfragmenten). Nach dem Lernen der letzten Liste erfolgt für alle Gruppen unmittelbar ein Abruftest dieser letzten Liste. Abhängige Variablen waren die Abrufleistung im Gedächtnistest von Liste 5 und die Intrusionsanzahl.

Ergebnisse

Apriori-Kontraste zeigten, dass JOLsunvollständig, aber nicht JOLsvollständig, eine signifikant bessere Abrufleistung und eine geringe Intrusionsanzahl als Restudieren erbrachten. Testbasierter Abruf führt ebenfalls zu einer besseren Gedächtnisleistung und geringeren Intrusionsrate im Vergleich zum Restudieren. Allerdings zeigten sich keine bedeutsamen Unterschiede zwischen Abruf und JOLsunvollständig.

Experiment 2 replizierte die Ergebnisse mit komplexeren Lernmaterial und

untersuchte, inwieweit abrufbasiertes Lernen die mentale Anstrengung über die Lernphase aufrechterhält.

Experiment 2

Methode. Studierende (N = 120) lernten jeweils nacheinander drei neue Listen mit sechs Begriffsdefinitionen in einem zweifaktoriellen Zwischensubjekt-Design: 2 (Abrufformat: JOLunvollständig vs. Test) × 2 (Lernstrategie: Abruf vs. Restudieren). Abhängige Variablen waren die Gedächtnisleistung der letzten Liste und mentale Anstrengungseinschätzungen beim Lernen der drei Listen.

Ergebnisse. Apriori-Kontrastanalysen wiesen einen bedeutsamen Unterschied zwischen abrufbasiertem Lernen (Test bzw. JOLunvollständig) und Restudieren auf. Zudem führten testbasierter Abruf und JOLsunvollständig zu einer signifikant höheren mentalen Anstrengung als Restudieren. Die mentale Anstrengung wurde beim Lernen der drei Listen beim testbasierten Abruf und JOLsunvollständig außerdem länger aufrechterhalten (signifikanter Interaktionseffekt).

Diskussion

Tests könnten zukünftiges Lernen von einfachen Wortmaterial und komplexeren Begriffsdefinitionen verbessern. Positive Effekte auf zukünftiges Lernen ergeben sich bereits, wenn Lernende JOLs abgeben, aber nur wenn nicht alle Lerninhalte dargeboten werden und es zu mentalen Abrufversuchen kommt. JOLs erfüllen somit nicht nur eine diagnostische Funktion, sondern haben auch das Potential abruf-basiertes Lernen ohne Testcharakter anzuregen, die Motivation aufrecht zu erhalten und somit einen vorwärtsgerichteten Testeffekt zu erzeugen.

 

Der Einfluss des Formats des Lernmaterials auf die Wirkung des Selbsterklärungseffekts

Benjamin Harders, Mirjam Ebersbach
Universität Kassel

Theoretischer Hintergrund und Fragestellung: Inhaltliche Zusammenhänge anhand von präsentiertem Lernmaterial, das Texte oder auch Schaubilder enthält, selbstständig herauszuarbeiten, gilt als erfolgversprechende Lernstrategie, um neuen Lerninhalten Sinn zu geben (z.B. Ainsworth & Loizou, 2003). Bisherige Studien zu diesem Selbsterklärungseffekt, die Schaubilder oder Diagramme als Lernmaterial einsetzten, nutzten gleichzeitig jedoch auch noch Texte und kombinierten damit beide Materialformate (Aleven & Koedinger, 2002; Chi, Bassok, Lewis, Reimann, & Glaser, 1989; Chi, Leeuw, Chiu, & LaVancher, 1994; Gadgil, Nokes-Malach, & Chi, 2012). Damit bleibt die Frage offen, wie unterschiedliche Materialformate für sich genommen Einfluss auf den Selbsterklärungseffekt nehmen. Dies zu klären, ist ein Ziel der aktuellen Studie.

Zudem werden in Studien zum Selbsterklärungseffekt typischerweise nur neu gebildete Inferenzen als Selbsterklärungen gewertet und Paraphrasen des originalen Lernmaterials ausgeklammert (Chi et al., 1989; Chi et al., 1994). Allerdings wurde Paraphrasieren in verwandten Lernparadigmen zum Textverstehen auch als effektive Lernstrategie gewertet (Ainsworth & Burcham, 2007; McNamara, 2004). Die Wirksamkeit von Selbsterklärungen wird in der Literatur, ungeachtet dieser Unklarheit zum Umgang mit Paraphrasen, immer wieder mit der Generierung von neuen Inferenzen (Hausmann & VanLehn, 2007) oder mit der konstruktiven Tätigkeit beim Selbsterklären (Chi & Wylie, 2014) erklärt. Dies muss jedoch kein Widerspruch sein, wenn man Paraphrasieren ebenfalls als eine Form von Generierung beziehungsweise als eine konstruktive Tätigkeit ansieht. Ob Paraphrasieren ebenso wie das Bilden von neuen Inferenzen im Rahmen von Selbsterklärungen zur Leistung in einem finalen Wissenstest beiträgt, soll auch in der aktuellen Studie untersucht werden.

Methode: In einem computergestützten Laborexperiment mit Studierenden (N = 100) wurde je die Hälfte der Teilnehmenden instruiert, dreißig Minuten lang entweder auf Grundlage eines Schaubildes oder eines Textes über ein fiktives politisches System Zusammenhänge zwischen den präsentierten Fakten schriftlich herauszuarbeiten. Die Teilnehmenden wurden zuvor explizit darauf hingewiesen, dass sie dazu sowohl Paraphrasen bilden, also präsentierte Zusammenhänge in ihren eigenen Worten wiedergeben oder selbstständig Inferenzen bilden, also neue Zusammenhänge herleiten könnten. Eine Woche später wurden die in beiden Bedingungen gleichermaßen präsentierten Fakten in einem finalen Wissenstest (15 Fragen) im Multiple-Choice-Format abgefragt. Die Durchführung eines t-Tests für den Vergleich der beiden Bedingungen hinsichtlich der Leistung im finalen Wissenstest und einer linearen Regressionsanalyse zur Modellierung des Zusammenhangs zwischen der Anzahl an Selbsterklärungen verschiedener Kategorien und der Leistung im finalen Wissenstest war zuvor prä-registriert worden (#25238).

Ergebnisse: In der Schaubildbedingung wurden im Mittel 9,80 (SD = 2,74) und in der Textbedingung im Mittel 8,38 (SD = 2,66) von 15 Fragen richtig beantwortet. Ein t-Test für unabhängige Stichproben zeigte einen Unterschied hinsichtlich der Leistung im Wissenstest zugunsten der Schaubildbedingung, t(98) = 2.63, p = .010, d = .526. Weiterhin wurden die in der Lernphase schriftlich herausgearbeiteten Zusammenhänge kodiert und den Kategorien selbstgenerierte Inferenz, Paraphrase und unlogische Inferenz zugeordnet. Die Anzahl der selbstgenerierten Inferenzen sagte in beiden Bedingungen gleichermaßen die Leistung im finalen Wissenstest vorher (Schaubildbedingung: r = .38, p = .006; Textbedingung: r = .38, p = .007). Die beiden anderen Kategorien von Zusammenhängen stellten in keiner der Bedingungen einen Prädiktor für die Leistung im finalen Wissenstest dar. Eine zuvor nicht prä-registrierte und damit explorative Mediationsanalyse zeigte, dass sich der Vorteil der Schaubild- gegenüber der Textbedingung im finalen Wissenstest über die höhere Anzahl der selbstgenerierten Inferenzen in der Schaubildbedingung erklären lässt. Die Ergebnisse stärken die Annahme, dass der Selbsterklärungseffekt auf Grundlage der Generierung von neuen Inferenzen zustande kommt (vgl. Hausmann & VanLehn, 2007). Weitere Forschung könnte sich der Gestaltung von Lernmaterialien und Instruktionen widmen, die die Generierung von Inferenzen mittels Selbsterklären auch außerhalb des Labors begünstigt.

 

Lernen durch Schriftliches Erklären: Wann Lernen durch Erklären sogar hinderlich ist

Andreas Lachner1, Leonie Jacob2, Vincent Hoogerheide3
1Universität Tübingen; Leibniz-Institut für Wissensmedien, Tübingen, 2Leibniz-Institut für Wissensmedien, Tübingen, 3Universität Utrecht

Theoretischer Hintergrund: Das Generieren von Erklärungen wird als wirksame Lernaktivität angesehen. Bislang wurden Erklär-Effekte vorwiegend in Lehr-Lernsettings untersucht, in denen Lernende anderen Peers gelernte Sachverhalte erklärten, um deren Wissen zu konsolidieren. Diese Effekte konnten in jüngeren Studien jedoch auch mit Erklärungen für nicht-anwesende, fiktive Peers repliziert werden (Fiorella & Mayer, 2014; Hoogerheide, Renkl, Fiorella, Paas, & van Gog, 2019).

Fragestellung: Bislang ist jedoch offen, welche Mechanismen für den Effekt des Erklärens verantwortlich sind: Lassen sich Erkläreffekte auf den allgemeinen Gedächtnisabruf während des Erklärens zurückführen? Sind es die generativen Lernstrategien, welche beim Erklären genutzt werden? Oder ist es die evozierte soziale Situation beim Erklären für fiktive Andere? Wir testeten diese drei kontrastiven Hypothesen in zwei Experimenten im Kontext schriftlichen Erklärens.

Experiment 1: Methode. 147 Studierende aus nicht-medizinischen Studiengängen nahmen an der Studie teil. Nach einem Vorwissenstest und einer Lernphase, in welcher die Studierenden einen Text zum Thema Herzklappenentzündung bearbeiteten, wurden diese gebeten, entweder die gelesenen Inhalte wiederzugeben (Retrieval), sich selbst (Selbsterklärung) oder einem fiktiven Peer zu erklären (instruktionale Erklärung). Eine Kontrollgruppe erhielt keine weitere Lernaufgabe. Abschließend bearbeiteten die Studierenden einen Posttest. Die Lernleistungen wurden für das Vorwissen der Studierenden sowie für die Bearbeitungsdauer kontrolliert.

Ergebnisse. Es zeigten sich signifikante Unterschiede zwischen den Bedingungen (mittlerer Effekt). Geplante Kontrastanalysen zeigten keine signifikanten Effekte der Lernaktivitäten gegenüber der Kontrollbedingung (Kontrolle: -3; Retrieval: 1; Selbsterklärung: 1; instruktionale Erklärung: 1). Auch ergaben sich keine Effekte der Erkläraktivitäten gegenüber der Retrievalbedingung (Kontrollbedingung: 0; Retrieval: -2; Selbsterklärung: 1; instruktionale Erklärung: 1). Es zeigten sich jedoch signifikante Unterschiede zwischen den beiden Erklärbedingungen (Kontrollbedingung: 0; Abruf: 0; Selbsterklärung: 1; instruktionale Erklärung: -1). Jedoch hatten Studierende in der instruktionalen Erklärungsbedingung schlechtere Lernleistungen als Studierende der Selbsterklärungsbedingung. Somit war die Generierung instruktionaler Erklärungen sogar abträglich für die Lernleistung im Vergleich zu Selbsterklärungen.

Experiment 2: Methode. Die zunächst kontraintuitiven Befunde aus Experiment 1 wurden in einem authentischen Feldexperiment versucht zu replizieren. Innerhalb eines Within-Subjects-Designs wurden 50 Lehramtsstudierende in einem Hausaufgabensetting gebeten, vier verschiedene Lerntexte (Themengebiet: Unterrichten mit digitalen Medien), die sich nicht in ihrer subjektiven Textschwierigkeit unterschieden, zu lesen und eine der vier Lernaktivitäten durchzuführen (Retrieval, Selbsterklärung, instruktionale Erklärung, Kontrollgruppe). Within-Subjects-Design erlauben gegenüber Between-Subjects-Designs, eine höhere Testpower und gleichzeitig eine höhere Kontrolle über inter-individuelle Unterschiede. Nach jeder Lernaktivität beantworteten die Studierenden einen Posttest. Wie in Experiment 1 wurde für deren Vorwissen und die Bearbeitungsdauer kontrolliert.

Ergebnisse. Mehrebenenanalysen, welche für individuelle Unterschiede im Vorwissen und der Bearbeitungsdauer kontrollierten, zeigten analog zu Experiment 1 keine allgemeinen Effekte der Lernaktivitäten gegenüber der Kontrollbedingung. Es ergaben sich jedoch signifikante Effekte der beiden Erkläraktivitäten gegenüber der Retrievalbedingung. Ebenso war, wie in Studie 1, die Generierung von Selbsterklärungen effektiver als die Generierung von instruktionalen Erklärungen.

Diskussion: Die Ergebnisse der beiden experimentellen Studien deuten darauf hin, dass Erklären (für fiktive Andere) nicht zwangsläufig eine effektive Lernaktivität darstellt, sondern es in hohem Maße auf die Implementation der Lernaktivitäten ankommt. Insbesondere zeigten die Befunde aus Experiment 2, dass zumindest in authentischen Lehrkontexten generative Aktivitäten, wie das Generieren von Erklärungen, einen Vorteil gegenüber allgemeinem Retrieval haben können. Jedoch scheint der soziale Kontext beim Erklären für fiktive Andere sogar hinderlich zu sein, zumindest wenn Erklärungen schriftlich gegeben werden. Wir führen diese negativen Befunde schriftlichen Erklärens auf eine höhere kognitive Beanspruchung beim Erklären zurück, welche sich abträglich auf die Lernleistungen zeigen. Um diese These zu untermauern, werden neben den beiden beschriebenen Experimenten innerhalb des Vortrags eine Metaanalyse zur Effektivität des Erklärens vorgestellt wird, in der insbesondere die Modalität des Erklärens (schriftlich versus mündlich) als Moderatorvariable beim Lernen durch Erklären berücksichtigt wird.

 
9:00 - 10:45F9‒S19: Professionalisierung von (angehenden) Lehrkräften für den Umgang mit sprachlicher und zuwanderungsbezogener Heterogenität
S19 
 

Professionalisierung von (angehenden) Lehrkräften für den Umgang mit sprachlicher und zuwanderungsbezogener Heterogenität

Chair(s): Birgit Heppt (Humboldt-Universität zu Berlin, Deutschland), Jennifer Paetsch (Otto-Friedrich-Universität Bamberg)

DiskutantIn(nen): Sebastian Kempert (Universität Potsdam)

Schule verfolgt das Ziel, Schüler*innen möglichst unabhängig von ihren familiären Lebensbedingungen gleiche Chancen auf Bildung und gesellschaftliche Teilhabe zu ermöglichen und Unterschiede in ihren individuellen Lernvoraussetzungen auszugleichen. Angesichts zunehmend heterogener Schüler*innenschaften, etwa im Hinblick auf Merkmale wie Zuwanderungshintergrund oder familiären Sprachgebrauch (z.B. Rjosk, Haag, Heppt & Stanat, 2017), geht dies für Lehrkräfte mit enormen Herausforderungen einher: Sie müssen für mögliche sprachliche und kulturelle Unterschiede in Klassen sensibilisiert sein und dieses Wissen bei der Auswahl und Erstellung von Unterrichtsmaterialien berücksichtigen (vgl. BIM & SVR-Forschungsbereich, 2017); sie sollten Strategien kennen, um Mehrsprachigkeit produktiv für den Kompetenzerwerb möglichst aller Schüler*innen zu nutzen und sie sind für die Gestaltung eines kognitiv anregenden und zugleich sprachförderlichen Unterrichts verantwortlich, von dem Schüler*innen unterschiedlicher sprachlicher und fachlicher Kompetenzniveaus in der Entwicklung ihrer sprachlichen und fachlichen Fähigkeiten profitieren können (z.B. Hardy, Hettmannsperger & Gabler, 2019).

Um diese Aufgaben bewältigen zu können, ist eine adäquate Professionalisierung erforderlich. Laut einer Befragung des Mercator-Instituts für Deutsch als Zweitsprache und Sprachförderung aus dem Jahr 2012 fühlt sich allerdings nur etwa ein Drittel der befragten Lehrkräfte durch ihr Studium gut oder sehr gut auf den Umgang mit sprachlich und kulturell heterogenen Schulklassen vorbereitet (Becker-Mrotzek, Hentschel, Hippmann & Linnemann, 2012). Ausgehend von gesetzlichen Vorgaben in zehn Bundesländern wurden in den vergangenen Jahren an zahlreichen Standorten Inhalte zum Umgang mit sprachlicher und kultureller Vielfalt in die universitäre Lehramtsausbildung integriert (Baumann, 2017). Darüber hinaus wurden – etwa im Rahmen der Bund-Länder-Initiative Bildung durch Sprache und Schrift (BiSS) – Anstrengungen unternommen, Maßnahmen zur Lehrkräfteprofessionalisierung zu entwickeln, zu erproben und zu evaluieren (vgl. Becker-Mrotzek, Roth, Li & Socha, in Druck).

Vor diesem Hintergrund geht das geplante Symposium der Frage nach, inwieweit es in der Lehrkräfteaus- und weiterbildung gelingt, (angehende) Lehrkräfte für den Umgang mit sprachlicher und kultureller Heterogenität zu professionalisieren. Das Symposium umfasst drei empirische Beiträge, die Lerngelegenheiten in unterschiedlichen Phasen der Lehrer*innenbildung in den Blick nehmen. Als Outcomes werden Überzeugungen, subjektive Kompetenzeinschätzungen und das praktische Unterrichtshandeln betrachtet. Hierbei liegt der Fokus jeweils auf unterschiedlichen Aspekten der fachintegrierten Sprachförderung.

Beitrag 1 ist in der ersten Phase der Lehrer*innenbildung angesiedelt und untersucht die Überzeugungen von Lehramtsstudierenden zum Umgang mit einer sprachlich und kulturell heterogenen Schüler*innenschaft und ob sich diese Überzeugungen durch universitäre Lerngelegenheiten verändern. Hierzu werden Daten von 1233 Lehramtsstudierenden in unterschiedlichen Studienabschnitten herangezogen. Erste Analysen deuten darauf hin, dass sich die Überzeugungen zum Umgang mit sprachlicher Heterogenität im Fachunterricht (z. B. Fischer, 2018) zwischen Studienanfängerinnen und Studierenden am Ende ihres Studiums unterscheiden. Weitere Analysen werden über die Rolle individuell wahrgenommener Lerngelegenheiten Aufschluss geben.

In Beitrag 2 steht der Vorbereitungsdienst und damit die zweite Phase der Lehrer*innenbildung im Vordergrund. Es werden drei Akteursgruppen betrachtet, nämlich Lehramtsanwärter*innen, Fachleiter*innen und Ausbildungslehrkräfte, die bei der gemeinsamen Entwicklung und Erprobung sprachbildender Unterrichtskonzepte und -materialien unterstützt und begleitet wurden. Ziel des Beitrags ist es, zu untersuchen, inwieweit individuelle Eingangsvoraussetzungen der Teilnehmenden (z. B. Überzeugungen zu Sprachförderung im Fachunterricht) einen Beitrag leisten zur Vorhersage des selbsteingeschätzten Wissenszuwachses im Bereich Sprachförderung und zur Absicht, das neu erworbene Wissen im eigenen Unterricht anzuwenden.

Beitrag 3 bezieht sich auf die dritte Phase der Lehrer*innenbildung und überprüft die Wirksamkeit eines Professionalisierungsansatzes für Lehrkräfte im Bereich der fachintegrierten Sprachförderung. Um deren Umsetzung im Unterricht zu erfassen, wurden Unterrichtsvideos von 26 Grundschullehrkräften (davon 8 aus der Experimentalgruppe) nach verschiedenen Aspekten der Interaktions- und Sprachförderqualität kodiert (z.B. CLASS; Pianta, La Paro & Hamre, 2008). Die Ergebnisse sprechen für einen vermehrten Einsatz von Sprachförderstrategien in der Experimentalgruppe und liefern damit Hinweise auf die Effektivität der Professionalisierungsmaßnahme.

In der abschließenden Diskussion der drei Beiträge durch Sebastian Kempert werden Perspektiven der Aus- und Weiterbildung von Lehrkräften unter besonderer Berücksichtigung der Grundschulpädagogik und -didaktik aufgezeigt.

 

Beiträge des Symposiums

 

Überzeugungen von Lehramtsstudierenden im Umgang mit sprachlicher und kultureller Vielfalt und deren Veränderung durch universitäre Lerngelegenheiten

Jennifer Paetsch1, Birgit Heppt2
1Otto-Friedrich-Universität Bamberg, 2Humboldt-Universität zu Berlin

Die zunehmende sprachliche und zuwanderungsbezogene Heterogenität der Schülerinnen und Schüler stellt eine große Herausforderung für Lehrkräfte dar. In der bildungspolitischen Debatte der letzten Jahre herrscht weitgehender Konsens darüber, dass Lehrkräfte über Kompetenzen im Umgang mit einer sprachlich und kulturell heterogenen Klassenzusammensetzung verfügen müssen. An vielen Standorten bundesweit integrierten die lehrerbildenden Institutionen deshalb in den vergangenen Jahren in unterschiedlichem Ausmaß Lerngelegenheiten, die Lehrkräften den Erwerb von Kompetenzen zum Umgang mit sprachlicher und kultureller Heterogenität ermöglichen sollen (vgl. Baumann, 2017).

Kompetenzen zum Umgang mit Heterogenität umfassen dabei nicht nur das Wissen von (angehenden) Lehrkräften, sondern auch ihre Überzeugungen (Baumert & Kunter, 2006). Diesen wird für erfolgreiches Handeln im Unterricht im Allgemeinen eine hohe Bedeutung zugemessen (z. B. Trautwein, 2013). Da Studierende bereits zu Beginn ihrer Ausbildung über Überzeugungen zum Umgang mit sprachlicher und kultureller Vielfalt verfügen, steht die universitäre Lehrkräftebildung vor der Herausforderung, Lerngelegenheiten bereitzustellen, die eine Veränderung in Richtung professioneller Überzeugungen fördern. Aus der Unterrichtsforschung und Studien zu Hochschulangeboten in der Lehrkräftebildung ist bekannt, dass mit zunehmenden Lerngelegenheiten auch eine Zunahme der Kompetenzen verbunden ist (z. B. Blömeke, Kaiser & Lehmann, 2010).

In Bezug auf die Entwicklung und Veränderbarkeit von Überzeugungen von Lehramtsstudierenden im Umgang mit sprachlicher und kultureller Vielfalt liegen bislang wenig empirische Befunde vor. Ziel des geplanten Beitrages ist daher die Untersuchung von Überzeugungen von Lehramtsstudierenden im Umgang mit sprachlicher und kultureller Vielfalt und deren Zusammenhang mit der Studiendauer (studierte Semester) und den von den Studierenden wahrgenommen Lerngelegenheiten zum Umgang mit heterogenen Lerngruppen.

Die geplanten Analysen basieren auf Daten, die im Rahmen des WegE-Projektes an der Universität Bamberg im Zeitraum von 2016 bis 2018 erhoben wurden. An der Studie nahmen 1233 Lehramtsstudierende unterschiedlicher Fachrichtungen und Schulformen teil (629 Grundschule, 214 Mittelschule/Realschule, 284 Gymnasium, 104 Berufsschule). Der Anteil weiblicher Studierender beträgt 83 Prozent. Von den befragten Studierenden sind 35 Prozent StudienanfängerInnen (im 1. oder 2. Semester), 30 Prozent in der Mitte des Studiums (3.-5. Semester) und 43 Prozent im 6. Semester oder höher. Die durchschnittliche bisherige Studiendauer beträgt 4,7 Semester (SD = 3,7).

Erfasst wurden Überzeugungen über kulturelle Heterogenität mit der Teacher Cultural Beliefs Scale in deutscher Fassung (Hachfeld et al., 2011). Das Instrument besteht aus zwei Skalen, multikulturelle Überzeugungen und egalitäre Überzeugungen. Zur Bestimmung von Überzeugungen zum Umgang mit sprachlicher Heterogenität im Fachunterricht (Fischer, 2018; Fischer & Ehmke, 2019) wurden die Skalen Sprachsensibilität im Fachunterricht und Zuständigkeit für Sprachförderung eingesetzt. Überzeugungen zum Unterrichten in heterogenen Klassen wurde mit drei Skalen erhoben: Unterrichten in inklusiven Klassen, in kulturell heterogenen Klassen, in leistungsheterogenen Klassen (Dignath, Meschede, Kunter, Hardy, 2019; adaptiert nach Bosse & Spörer, 2014). Zur Erfassung der individuell wahrgenommenen Lerngelegenheiten diente ein neu entwickeltes Instrument, bei dem die Studierenden den Umfang der individuell genutzten Lerngelegenheiten zum Umgang mit Heterogenität anhand von vier Items auf einer 5-stufigen Ordinalskala einschätzen sollten.

Die Daten werden zurzeit noch ausgewertet. Anhand von Regressionen wird der Zusammenhang zwischen den Überzeugungen der Studierenden und ihrem Studienfortschritt unter Berücksichtigung der wahrgenommenen Lerngelegenheiten im Umgang mit heterogenen Lerngruppen analysiert. Ergebnisse erster Analysen zeigen signifikante Unterschiede zwischen StudienanfängerInnen und Studierenden am Ende ihres Studiums in den Überzeugungen zum Umgang mit sprachlicher Heterogenität im Fachunterricht und marginal signifikante Unterschiede bei der Skala Überzeugung zum Unterrichten in leistungsheterogenen Klassen. Keine Unterschiede zeigen sich bei den anderen erfassten Überzeugungen.

Da es sich um eine Querschnittsuntersuchung (mit mehreren Kohorten) handelt, lässt sich die Veränderung nicht direkt untersuchen. Die Ergebnisse werden Hinweise auf die Entwicklung und Veränderbarkeit von Überzeugungen von Lehramtsstudierenden im Umgang mit sprachlicher und kultureller Vielfalt liefern. Auf dieser Grundlage sollen mögliche Ansatzpunkte für die Weiterentwicklung bzw. Bereitstellung universitärer Lerngelegenheiten im Bereich sprachlicher und zuwanderungsbezogener Heterogenität diskutiert werden.

 

Prädiktoren für den Zuwachs des selbsteingeschätzten Wissens und die Transferabsicht von Lehrkräften im Rahmen einer Fortbildung im Bereich Sprachbildung

Simone Dubiel1, Jennifer Paetsch2, Beate Lütke3
1Institut zur Qualitätsentwicklung im Bildungswesen (IQB), 2Otto-Friedrich-Universität Bamberg, 3Humboldt-Universität zu Berlin

Einleitung

Die sichere Beherrschung der Unterrichtssprache Deutsch ist eine Voraussetzung für die gelungene Teilhabe am unterrichtlichen Geschehen (Hammer et al., 2015). Es wird daher vielfach gefordert die Schülerinnen und Schüler durch einen sprachsensiblen und sprachbildenden Fachunterricht zu unterstützen.

Lehrkräfte geben bei Befragungen jedoch an, dass sie sich auf diese Aufgabe nicht gut durch ihr Studium vorbereitet fühlen (Becker-Mrotzek et al., 2012). Die Fortbildung von Lehrkräf-ten im Bereich Sprachbildung stellt daher eine wichtige Aufgabe für die Lehrkräftebildung dar (Lipowsky & Rzejak, 2012). Bei Angeboten zur Professionalisierung von Lehrkräften sollten Fachwissen, fachdidaktisches Wissen und Überzeugungen als relevante Merkmale (z. B. Hachfeld et al., 2012) berücksichtigt werden. Wird das Erlernte von den Teilnehmenden in ihrer Wirkungspraxis nach der Fortbildung angewendet, kann von Transfer gesprochen werden; eine Voraussetzung für die Verbesserung des Unterrichts in Hinblick auf Sprachbildung (Gräsel, 2010).

Lehrkräfte nehmen mit sehr unterschiedlichen individuellen Eingangsvoraussetzungen – beispielsweise bezüglich ihrer Überzeugungen im Umgang mit Sprachsensibilität im Fachunterricht – an Fortbildungen teil. Es wird angenommen, dass sich hohe Überzeugungen und stark ausgeprägtes Interesse am Thema gewinnbringend auf den Zuwachs von Wissen im Verlauf von Fortbildungen auswirken können. Innerhalb des geplanten Beitrags wird daher die Fragestellung untersucht, welche individuellen Eingangsvoraussetzungen den Zuwachs des selbsteingeschätzten Professionswissens sowie die Transferabsicht von Lehrkräften im Bereich Sprachbildung vorhersagen.

Stichprobe

Die Daten entstammen der Evaluation der Fortbildung Sprachliche Bildung systemisch im Vorbereitungsdienst implementieren (2017-2019), welche zum Ziel hatte, Lehramtsanwär-ter*innen, Ausbildungslehrkräfte sowie Fach- und Seminarleiter*innen für Sprachbildung im Fach fortzubilden. Im Rahmen der Maßnahme entwickelten die Teilnehmenden in paritätisch besetzten Teams Ideen zur Umsetzung sprachbildenden Fachunterrichts und erprobten sie in ihren jeweiligen Handlungsfeldern. Die Fortbildung wurde in Nordrhein-Westfalen mit insgesamt ca. 206 Teilnehmenden durchgeführt. Die Datenerhebung erfolgte zu drei Messzeitpunkten.

Methode und Ergebnisse

Für die Erfassung des selbsteingeschätzten Professionswissens im Bereich Wissen über Sprachbildung (Cronbachs α .89. - .93) und der selbsteingeschätzten didaktischen Kompetenz (Cronbachs α = .84) zum Beginn und zum Ende der Fortbildung wurden Instrumente selbst entwickelt. Anhand von latenten Strukturgleichungsmodellen wurde die Dimensionalität überprüft (Modellfit Wissen x2 = 113.77, df = 84, p = .017; CFI/TLI = .99/.98; RMSEA = .04; SRMR = .05) (Dubiel, 2018). Die Erfassung der Transferabsicht (3 Items, Cronbachs α = .71) erfolgte zum letzten Messzeitpunkt. Als Eingangsvoraussetzungen wurden die Überzeugungen (Hammer, Fischer & Koch-Priewe, 2016) und das Interesse der Lehrkräfte in Bezug auf sprachbildenden Fachunterricht sowie die Einschätzung der Relevanz des Themas zum ersten Messzeitpunkt erfasst. Zur Beantwortung der Fragestellung werden Längsschnittanalysen unter Einbezug der genannten Prädiktoren mithilfe von Mplus und R berechnet. Vorläufige Analysen querschnittlicher Daten zeigen, dass (positive) Überzeugungen zu Sprache im Fach mit hohen (signifikanten) Wissenseinschätzungen in den Bereichen Diagnostik (r = .26), Scaffolding (r = .27) und Sprachregister (r = .21) einhergehen. Ebenso zeigte sich ein signifikanter Zusammenhang der Überzeugungen mit der selbsteingeschätzten didaktischen Kompetenz (r = .21). Am Ende der Fortbildung zeigte sich u. a. ein Wissenszuwachs in der Einschätzung des Wissens über Scaffolding (MW∆ MzP1 & MzP3 = 1.12; Wilcoxon-Test: W = -1.58, p = .00, Effektst. = .26) und der sprachbildenden didaktischen Kompetenz (MW∆ MzP1 & MzP3 = 1.16; Wilcoxon-Test: W = -1.16, p = .00, Effektst. = .20).

Diskussion

Die Ergebnisse der Studie können helfen, zukünftige Fortbildungen für Lehrkräfte im Bereich Sprachbildung zielgenauer auf die Bedürfnisse der Teilnehmenden anzupassen, indem zentrale Merkmale von Fortbildungsteilnehmenden berücksichtigt werden.

 

Professionalisierung von Lehrkräften zur fachintegrierten Sprachförderung im Sachunterricht: Wie gut gelingt die Umsetzung in der Praxis?

Christine Sontag1, Katrin Gabler1, Birgit Heppt1, Rosa Hettmannsperger2, Sofie Henschel3, Susanne Mannel2, Ilonca Hardy2, Petra Stanat3
1Humboldt-Universität zu Berlin, 2Goethe-Universität Frankfurt am Main, 3Institut zur Qualitätsentwicklung im Bildungswesen (IQB)

Die Förderung bildungssprachlicher Fähigkeiten ist als Aufgabe aller Fächer in aktuellen Rahmenlehrplänen der Grundschule verankert (z. B. Senatsverwaltung für Bildung, Jugend und Familie, 2017). Grundschullehrkräfte stehen somit vor der Herausforderung, ihren Unterricht sowohl fachlich anspruchsvoll als auch sprachförderlich zu gestalten (Hardy, Hettmannsperger & Gabler, 2019). Im deutschsprachigen Raum liegen jedoch kaum gut beschriebene und nachweislich wirksame Professionalisierungsmaßnahmen für die fachintegrierte Sprachförderung vor (Henschel, Stanat, Becker-Mrotzek, Hasselhorn & Roth, 2014). Vor diesem Hintergrund wurde ein Professionalisierungskonzept zur fachintegrierten Sprachförderung für Grundschullehrkräfte auf Basis des sprachlichen Scaffolding nach Gibbons (2002) entwickelt und dessen Wirksamkeit untersucht. Im Rahmen einer quasi-experimentellen Studie besuchten Lehrkräfte einer Experimentalgruppe (EG) und einer Kontrollgruppe (KG) zunächst eine Fachfortbildung zum Unterrichtsthema „Schwimmen und Sinken“ (adaptiert nach Jonen & Möller, 2005). Auf diese Weise sollte sichergestellt werden, dass die Lehrkräfte über das notwendige fachliche und fachdidaktische Wissen zu diesem anspruchsvollen Fachthema verfügen und mit dem handlungsorientierten, konstruktivistischen Unterrichtsprinzip vertraut sind, auf dem das in der Studie verwendete Curriculum basiert. Lehrkräfte der EG nahmen zusätzlich an einer Professionalisierungsmaßnahme zur fachintegrierten Sprachförderung teil, die sich exemplarisch auf das Unterrichtsthema „Schwimmen und Sinken“ bezog und Fortbildungen, Unterrichtserprobungen mit Hospitation und Video-Coaching sowie ein Reflexionstreffen umfasste. Die Lehrkräfte der EG sollten so in die Lage versetzt werden, im handlungsorientierten Sachunterricht der dritten Klasse Sprachfördergelegenheiten zu erkennen und geeignete Sprachfördertechniken (u. a. Sprache modellieren, sprachförderliches Feedback geben, sprachförderliche Fragen stellen) einzusetzen, um sowohl sprachliches Lernen als auch den fachlichen Konzeptaufbau zu unterstützen.

Der vorliegende Beitrag geht der Frage nach, wie gut den Lehrkräften diese Umsetzung nach der Teilnahme an der Professionalisierungsmaßnahme tatsächlich gelingt. Dazu unterrichteten Lehrkräfte beider Gruppen (nEG = 8, nKG = 18) im Anschluss an die Professionalisierungsphase das Thema „Schwimmen und Sinken“ (6 Doppelstunden) im regulären Sachunterricht der dritten Klasse, wobei jeweils die zweite Doppelstunde gefilmt wurde. Der fachliche Implementationscheck zeigte, dass die Sachunterrichtselemente des Curriculums in beiden Gruppen den Vorgaben entsprechend umgesetzt wurden. Um die Umsetzung der fachintegrierten Sprachförderung zu untersuchen, wurde pro Lehrkraft eine gesprächsintensive 20-minütige Sequenz zu Beginn der zweiten Doppelstunde von zwei unabhängigen Raterinnen eingeschätzt. Die Einschätzung erfolgte zum einen auf ausgewählten Dimensionen des Classroom Assessment Scoring System (CLASS; Pianta, La Paro & Hamre, 2008; .63 ≤ ICC ≤ .84), einem etablierten, hochinferenten Instrument. Wir erwarteten, dass Lehrkräfte der EG insgesamt sprachförderlicher agieren („Language Modeling“, LM) und dass sie tendenziell besser sprachlich vermitteltes Feedback geben („Quality of Feedback“, QF). Gleichzeitig sollten sie zumindest ebenso gut auf die Konzeptentwicklung achten („Concept Development“, CD) wie Lehrkräfte der KG. Zum anderen wurde die Umsetzung einer konkreten Sprachfördertechnik mithilfe eines neu entwickelten, niedriginferenten Kodierschemas zum sprachförderlichen Frageverhalten der Lehrkräfte (aufbauend auf Kammermeyer et al., 2017; kappa = .62, ICC pro Kategorie .67 ≤ ICC ≤ .99) untersucht. Die Umsetzung sollte Lehrkräften der EG besser gelingen als Lehrkräften der KG.

Bisherige Analysen weisen darauf hin, dass den Lehrkräften der EG die Umsetzung der Sprachförderung entsprechend der globalen Einschätzung nach CLASS erwartungsgemäß besser gelang als Lehrkräften der KG (dLM = 0.67) und sie zusätzlich auch besseres Feedback gaben (dQF = 0.96). Ebenfalls erwartungsgemäß konnten Lehrkräfte der EG den Konzeptaufbau zumindest ebenso gut unterstützen wie Lehrkräfte der KG (dCD = 0.28). Lehrkräfte der EG stellten zudem insgesamt mehr Fragen als Lehrkräfte der KG (d = 1.04), wobei der Effekt bei den besonders sprachförderlichen Fragen (= explizit sprachfokussierte Fragen, offen-repetitive Fragen und offen-konstruktive Fragen) erwartungsgemäß stärker ausgeprägt war (d = 1.45). Diese Befunde können als Hinweis auf die Wirksamkeit der Professionalisierungsmaßnahme zur fachintegrierten Sprachförderung gewertet werden und deuten darauf hin, dass die Verschränkung von Sprachanregung und inhaltlichem Lernen zusätzlich professionalisierten Lehrkräften besser als regulär ausgebildeten Lehrkräften gelingt.

 
9:00 - 10:45F9‒S21: Wettbewerbsstrukturen, horizontale Differenzierungsprozesse und ihr Beitrag zur Reproduktion sozialer Ungleichheiten im Bildungswesen
S21 
 

Wettbewerbsstrukturen, horizontale Differenzierungsprozesse und ihr Beitrag zur Reproduktion sozialer Ungleichheiten im Bildungswesen

Chair(s): Nicky Zunker (HU Berlin & DIPF | Leibniz-Institut für Bildungsforschung und BIldungsinformation), Sonja Nonte (Georg-August-Universität Göttingen)

DiskutantIn(nen): Herbert Altrichter (Johannes Kepler Universität Linz)

Die vergangene Dekade lässt einen deutlichen Trend zur Abkehr von der traditionellen Vielgliedrigkeit im deutschen Schulwesen erkennen. Aktuell unterhalten nur noch fünf Bundesländer ein drei- oder mehrgliedriges Sekundarschulsystem, während die übrigen auf zweigliedrige bzw. ein zwei-Wege-Modell umgestellt haben (Autorengruppe Bildungsberichterstattung, 2018). Eines der in der sozialwissenschaftlichen Bildungsforschung bisher wichtigsten Unterscheidungsmerkmale zwischen weiterführenden Schulen – die Schulform – verliert damit zunehmend an Bedeutung, zu Gunsten feinerer, horizontaler Differenzierungslinien zwischen (Einzel-)Schulen. Vor allem in großstädtischen Räumen mit einer hohen Schuldichte ist davon auszugehen, dass sich im Zuge dessen marktähnliche Strukturen in Form von „Quasi-Märkten“ verstärkt ausbilden, auf denen Schulen im Wettbewerb um Schülerinnen und Schüler und Familien im Wettbewerb um Schulplätze aufeinandertreffen. Durch diese intensivierte Wettbewerbsorientierung ist von einer Ausweitung des Einflusses der Eltern im Schulwahlprozess und einer Erhöhung der Angebotsvielfalt an Einzelschulen auszugehen (Weiß, 2001; Heinrich, 2009).

Die zu beobachtenden Ausdifferenzierungen, insbesondere zwischen Schulen derselben Schulform, führen zu einer Horizontalisierung der Bildungslandschaften, in der sowohl Öffnungs- aber auch Schließungsprozesse wirksam werden (Krüger & Helsper, 2014). Schulische Profilierungsprozesse können in diesem Zusammenhang als eine Differenzierungsmaßnahme verstanden werden, die es ermöglicht, Schülerinnen und Schüler mit vergleichbaren Voraussetzungen und ähnlichen Aspirationen in einer Organisationseinheit (Schule, Klasse) zu bündeln. Forschungsbefunde zur Wirksamkeit derartiger Homogenisierungsprozesse sind jedoch inkonsistent. Dass der Lernkontext und allen voran die Zusammensetzung der Schülerschaft aber einen Einfluss auf den individuellen Lernerfolg haben, steht außer Frage. Aktuellen Forschungsbefunden zufolge steht sowohl die Leistungsentwicklung, die Leistungsmotivation aber auch das Lehrer*innenhandeln in einem engen Zusammenhang mit der sozialen sowie leistungsbezogenen Zusammensetzung der Schülerschaft (u.a. Dumont et al, 2013; Scharenberg, 2012).

Auf der anderen Seite können sich durch selektive Klasseneinteilung und Übergangsreglungen aber auch inner- und zwischenschulische Segregationsprozesse entfalten, die unter Umständen dazu führen, dass ohnehin benachteiligten Schülerinnen und Schüler der Zugang zu besonders förderlichen Lernumwelten verwehrt wird. Somit können horizontale Differenzierungsprozesse, die sich in der Praxis vor allem durch Maßnahmen der Schul- und Klassenprofilierung manifestieren, auch unter der Perspektive der Reproduktion und Transformation sozialer Ungleichheit diskutiert werden (Krüger et al., 2015). An diese Perspektive schließt das Symposium an und adressiert übergeordnet die Frage, inwieweit horizontale Differenzierungsprozesse und dadurch angeregte Wettbewerbsmechanismen im Sekundarschulwesen zur Reproduktion sozialer Ungleichheiten beitragen (können).

Die vier Beiträge des Symposiums sind so ausgewählt, dass sie sich dem Phänomen auf verschiedenen Ebenen annähern, dabei unterschiedliche Akteure in den Blick nehmen und unter Verwendung vielfältiger methodischer Zugänge jeweils spezifische Aspekte der Ungleichheitsgenese durch horizontale Differenzierung ausleuchten.

Der erste Beitrag von Sebastian Leist und Kolleg*innen nimmt aus einer sozio-geografischen Makroperspektive die Quasi-Marktstrukturen im Stadtstaat Hamburg in den Blick und untersucht, inwieweit sich darin Segregationsprozesse zwischen den Schulen nachzeichnen lassen.

Im zweiten Beitrag von Nicky Zunker und Marko Neumann wird diese Perspektive weiterverfolgt und ebenso die Segregation zwischen Einzelschulen in den Blick genommen. Kontrastierend zum ersten Beitrag liegt der Fokus allerdings explizit auf der segregierenden Wirkung profilierter Schulen im Kontext des Berliner Schulsystems. Als mögliche Erklärung für potenzielle Segregationsprozesse gehen die Autoren außerdem der Frage nach, ob die Entscheidung für und der Übergang auf profilierte Schulen mit Merkmalen des familiären Hintergrundes assoziiert sind.

In Bezug auf die Wahl altsprachlicher Bildungsgänge setzen auch Jürgen Gerhards und Kollegen im dritten Beitrag am sozio-differenziellen Entscheidungsverhalten als ungleichheitsreproduzierendes Moment an, legen ihren Fokus allerdings auf Mechanismen, die diese Verhaltensunterschiede zu erklären vermögen. Als einen möglichen Erklärungsmechanismus stellen sie in ihrer Argumentation die kulturelle Distinktion heraus.

Der vierte Beitrag von Catharina I. Keßler und Sonja Nonte greift das Konzept der Distinktion erneut auf, wechselt dabei jedoch die Perspektive von den Bildungsnachfragenden auf die Bildungsanbietenden. Mit Hilfe eines Mixed Method-Designs gehen die Autorinnen der Frage nach, welche Bedeutung Schulleitungen der Schulprofilierung als mögliche Distinktionsstrategie im Kontext des Wettbewerbs zwischen Schulen beimessen.

 

Beiträge des Symposiums

 

Quasi-Märkte - Kleinräumige Segregation im Hamburger Schulsystem

Sebastian Leist1, Marcus Pietsch2, Laura Perry1, Christopher Lubienski3
1Murdoch University Perth, 2Leuphana Universität Lüneburg, 3Indiana University

Infolge der Implementierung sogenannter choice-policies als Hauptkomponente der globalen Merkantilisierungsbewegung hat die soziale und akademische Segregation zwischen Schulen in vielen Ländern zugenommen (van Zanten, 2005). Die ohnehin schon vorhandenen Zusammenhänge zwischen residentieller Segregation und Schuleffekten auf Schülerleistungen (OECD, 2018) scheinen durch choice policies verstärkt zu werden. Es besteht somit über die enge Verknüpfung zwischen der lokalen Schulqualität und dem Ausmaß an Wohlstand in einer Nachbarschaft hinaus offenbar auch ein Zusammenhang mit der Zugänglichkeit von Schulen.

Der Beitrag geht, räumlich differenziert, der Frage nach, wo in einem Regime freier Schulwahl soziale Segregationsprozesse beim Wechsel einer Schülerkohorte von der Grundschule zur weiterführenden Schule nachweisbar sind. Die zugrundeliegende räumliche Gliederung erfolgt anhand von Schulmärkten, die stochastisch mit Verfahren der sozialen Netzwerkanalyse aufgedeckt worden sind (Leist & Pietsch, 2017). Weiterhin werden Einflüsse von Schulform, Schülerkomposition und schulindividuellen Charakteristiken auf Segregationsmuster untersucht.

Methodische Grundlage der Schulmärkte bilden stochastische Netzwerkverfahren zur Ermittlung von Gruppen anhand der Akteursbeziehungen untereinander (Templin, 2008). Vorteilhaft ist dabei erstens, Gruppen mittels empirischer Daten anhand eines endogenen Merkmals definieren zu können und zweitens, latent modellieren zu können, so dass Messfehler keine Rolle spielen. Zur Modellierung der stochastischen Netzwerke fand das R-Paket ‚latentnet‘ (Krivitsky & Handcock, 2008) Anwendung. Weitergehende Analysen leuchten Segregationsprozesse zwischen und innerhalb von Schulmärkten aus. Darüber hinaus kommt ein „wahrer“ raumbezogener Segregationskoeffizient auf schulindividueller Ebene zum Einsatz. Der Local Index of Dissimilarity (LID; Harris, 2011) gibt für jede weiterführende Schule an, inwiefern sie in der Lage war, ihr soziales Potential auszuschöpfen. Der soziale Status der Familien an den zuliefernden Grundschulen wird dafür, gewichtet um die Anzahl wechselnder Schüler, mit dem sozialen Status der in Jahrgang 5 der weiterführenden Schule angetroffenen Schülern verglichen. So wird für jede weiterführende Schule ermittelt, ob sie segregierend wirkt, indem die Differenz zwischen dem sozialen Status der aktuellen und der potentiellen Schülerkohorte beziffert wird.

Das Beziehungsgeflecht zwischen den Schulen basiert auf den Übergängen sämtlicher Schüler (N=14.481) von der Grundschule zur weiterführenden Schule innerhalb der Freien und Hansestadt Hamburg im Schuljahr 2013/14. Die soziale Zusammensetzung der Schülerschaft wird anhand des RISE-Statusindex des Hamburger Sozialmonitorings abgebildet (Freie und Hansestadt Hamburg, 2015). Dieses ermöglicht für jeden einzelnen Schüler anhand kleinräumig bereitgestellter statistischer Kennzahlen zum Wohnort näherungsweise den sozio-ökonomischen Hintergrund zu ermitteln (Pohlan & Strote, 2017).

In Hamburg lassen sich mittels Übergängen zur weiterführenden Schule 14 Schulmärkte identifizieren, die zumeist von physischen Barrieren wie Bahnstrecken, der Elbe oder Autobahnen begrenzt sind. Nichtsdestotrotz finden zwischen Schulmärkten in unterschiedlichem Ausmaß auch Wechsel statt. Der Anteil Schüler, den einzelne Schulmärkte beibehalten schwankt daher. Daneben sind sowohl die Schülerkompositionen der Schulmärkte, als auch die Schülerkomposition der zwischen den Schulmärkten wechselnden Schüler mitunter signifikant unterschiedlich. Insbesondere die Schulmärkte an den beiden Enden der sozio-ökonomischen Skala weisen Charakteristiken auf, die auf eine Abschottung respektive Verinselung schließen lassen. Ein sozial homogener Schulmarkt im wohlhabendsten Milieu Hamburgs erscheint von außerhalb schwer zugänglich, während gleichzeitig Schüler weniger wohlhabender Haushalte auf Schulen in benachbarten Schulmärkten verdrängt werden. Am untersten Ende der sozio-ökonomischen Skala dagegen verlassen Schüler ausvergleichsweise wohlhabenden Haushalten den Schulmarkt, während Schüler aus homogen stark benachteiligten Haushalten zurückbleiben.

Folglich sind deutliche Hinweise vorhanden, dass choice policies soziale Segregation in Hamburg begünstigen. Dabei sind die Folgen je nach sozialer Lage der Nachbarschaften unterschiedlich. Während sich in wohlhabendsten Nachbarschaften Verdrängungsprozesse nachweisen lassen, kann man in den benachteiligsten Quartieren von einer Fluchtbewegung weniger benachteiligter Familien sprechen.

 

Stratifizierung durch Profilierung? Das Zusammenspiel von inhaltlichen Profilen und Merkmalen der Schülerkomposition an nicht-gymnasialen weiterführenden Schulen in Berlin

Nicky Zunker1, Marko Neumann2
1HU Berlin & DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation, 2DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation

Theoretischer Hintergrund

Mit der im Schuljahr 2010/11 umgesetzten Schulstrukturreform sieht sich die Berliner Schullandschaft mit einem tiefgreifenden Umbruch konfrontiert. Kern der Reform war die Neuordnung des Sekundarschulwesens, im Zuge derer alle nicht-gymnasialen Schulformen zu einer neuen Schulform – der Integrierten Sekundarschule (ISS) – zusammengefasst wurden. Das vormals prädominierende Differenzierungsmerkmal zwischen Schulen in Gestalt der Schulform verlor damit an Bedeutsamkeit. An dessen Stelle rückt eine stärkere horizontale Differenzierung durch individuelle Profilbildung und Schwerpunktsetzungen, zu der die Schulen seit der Schulstrukturreform in zunehmendem Maße angeregt werden (vgl. Neumann et al., 2013). Aus einer steuerungstheoretischen Perspektive ist anzunehmen, dass derlei Differenzierungsprozesse die Ausbildung von Wettbewerbsstrukturen im Bildungswesen befördern, gleichsam aber auch (soziale) Segregationsprozesse zwischen den Schulen begünstigen könnten (vgl. Bellmann & Weiß, 2009; Heinrich et al, 2011). Dies kann sowohl auf institutionelle als auch Selbstselektionsmechanismen zurückgeführt werden. Von einer Selbstselektion ist dann auszugehen, wenn bei der Schulwahl schichtspezifisch unterschiedliche Schulprofile präferiert werden. Dieser Prozess wird dadurch verstärkt, dass einige Schulen sich bewusst Profile geben, die explizit die Präferenzen spezifischer sozialer Schichten oder Milieus bedienen (vgl. Helsper et al., 2018; Flitner, 2007). Institutionelle Selektion tritt in erster Linie dann ein, wenn im Wettbewerb um Schülerinnen und Schüler besonders erfolgreiche Schulen mehr Anmeldungen generieren, als sie über Plätze verfügen und damit in die Lage versetzt werden, Schülerinnen und Schüler auswählen zu können. Je nachdem welche Auswahlkriterien angesetzt werden, kann dadurch ein selektiver Zugang zu profilierten Schulen entstehen, der unter Umständen einige Bevölkerungsgruppen in überproportionalem Ausmaß von diesen Angeboten ausschließt (Altrichter et al., 2016; Bellmann, 2008).

Fragestellung

In der deutschsprachigen Forschungslandschaft gibt es nur begrenzt Untersuchungen, die Auswirkungen horizontaler Differenzierungsmaßnahmen auf die Schülerkomposition beleuchten. An dieses Forschungsdesiderat möchte der vorliegende Beitrag anschließen und am Beispiel des Berliner Sekundarschulwesens prüfen, inwieweit Schulen entlang ihrer Schulprofile segregiert sind und ob sich Hinweise auf institutionelle und Selbstselektionsprozesse finden lassen. Folgende drei ineinandergreifende Forschungsfragen werden dazu adressiert:

(F1) Wie unterscheidet sich die Schülerkomposition zwischen weiterführenden Schulen mit unterschiedlichen Profilen?

(F2a) Wie unterscheiden sich Familien entlang ihrer soziokulturellen Herkunft in der Präferenz für unterschiedlich profilierte weiterführende Schulen?

(F2b) Wie unterscheiden sich Familien entlang ihrer soziokulturellen Herkunft hinsichtlich ihrer realisierten Übergänge an unterschiedlich profilierte Schulen?

Methode

Fragestellung 1 wurde mit Hilfe schulstatistischer Daten bearbeitet. Hierzu wurden einfache Mittelwertvergleiche verschiedener Kompositionsmerkmale zwischen ISS (N = 120) entlang fünf kategorisierter Schulprofile durchgeführt: kein Profil, berufliches, akademisches (= musisch-künstlerisches, MINT- oder sprachliches), sportbetontes oder gemischt/sonstiges Profil. Die Profilinformationen wurden dem Online-Schulverzeichnis der Berliner Senatsverwaltung entnommen. Eine zufallskritische Absicherung der Kompositionsunterschiede erfolgte mittels einfaktorieller Varianzanalysen.

Zur Beantwortung von Fragestellung 2a und 2b wurde auf repräsentative Stichprobendaten der BERLIN-Studie (Maaz et al., 2013) zurückgegriffen. Für die Substichprobe der Schülerinnen und Schüler, die nach der 6. Klassenstufe in eine ISS übergingen (N = 1930) wurden multinomiale logistische Regression der präferierten (F2a) und der realisierten (F2b) Schulprofile auf Merkmale des soziokulturellen Hintergrundes der Schülerinnen und Schüler geschätzt, wobei zusätzlich für schulische Leistungen kontrolliert wurde. Zur besseren Interpretier- und Vergleichbarkeit wurden multinomiale Average Marginal Effects berechnet.

Ergebnisse

Hinsichtlich Unterschieden in der Schülerkomposition nach Schulprofil (F1) zeichnete sich ab, dass vor allem ISS mit beruflichem Profil im Vergleich zu den anderen Profilkategorien eine ungünstigere Schülerkomposition aufweisen. Zwar deuteten sich auch zwischen den anderen Gruppen Unterschiede an, die sich aber nur teilweise zufallskritisch absichern ließen. Die multivariaten Analysen auf Stichprobenebene zeigten, dass soziokulturelle Hintergrundmerkmale tendenziell etwas besser zur Vorhersage des realisierten (F2b) als des präferierten Schulprofils (F2a) geeignet sind, Einflüsse des soziokulturellen Hintergrundes aber generell sehr klein und oftmals nicht statistisch signifikant ausfallen und zudem stark mit Leistungsmerkmalen konfundiert sind.

 

Tote Sprachen als lohnende Investition? Zur intergenerationalen Transmission von Privilegien durch die Wahl alter Sprachen

Jürgen Gerhards1, Ulrich Kohler2, Tim Sawert1
1Freie Universität Berlin, 2Universität Postdam

In Zeiten der Globalisierung werden Fremdsprachenkenntnisse immer wichtiger. Transnationales Sprachkapital erhöht die Beschäftigungsmöglichkeiten auf dem Arbeitsmarkt, ermöglicht es Menschen, in anderen Ländern zu studieren, und erleichtert die Bildung neuer transnationaler Netzwerke (Gerhards & Hans, 2013). Vor diesem Hintergrund ist bemerkenswert, dass ein Drittel aller Schüler des Deutschen Gymnasiums sich dafür entscheiden, keine moderne Sprache zu lernen und stattdessen Latein zu wählen (Statistisches Bundesamt, 2019). Dies ist umso überraschender, als die Schüler nicht nur keine zusätzliche moderne Fremdsprache lernen, sondern sich das Erlernen von Latein ab der fünften Klasse zudem zu Lasten der Entwicklung der Englischkenntnisse geht (Baumert et al., 2010).

Dementsprechend scheint das Erlernen der lateinischen Sprache eine unrentable Investition zu sein, da es mit Opportunitätskosten verbunden ist, ohne einen Kommunikationswert zu haben. Warum entscheiden Eltern dann, dass ihre Kinder Latein in der Schule lernen sollen?

Ausgehend von einer Analyse der Daten des Sozio-ökonomischen Panels zeigt Sawert (2018), dass die Entscheidung für ein stark klassisches Profil sozial selektiv ist: Während nur rund 2% der Kinder aus nicht-akademischen Haushalten ab der fünften Klasse Latein lernen, trifft dies auf 16% der Kinder aus akademischen Haushalten zu.

Bezugnehmend auf die Arbeit von Pierre Bourdieu und die Theorie der rationalen Wahl argumentieren wir, dass in Zeiten der Bildungsexpansion die Wahl von Latein in der Schule eine Strategie der sozialen Schließung für privilegierte Familien darstellt. Wir nehmen an, dass vier Mechanismen unterschieden werden können, die den Bildungshintergrund mit der Entscheidung über das Erlernen der lateinischen Sprache in der Schule verknüpfen: kulturelle Distinktion (1), selektive Lernumgebungen (2), Erwartungen an positive Transfereffekte (3) und Unterschiede in der strukturellen Opportunität (4). Um diese Mechanismen zu unterscheiden, haben wir Befragungen an Grundschulen und Gymnasien in Deutschland durchgeführt (siehe Gerhards et al. 2019). Anhand dieser Daten analysieren wir, inwieweit die Auswirkung des Bildungshintergrunds auf die Wahl von Latein auf die verschiedenen Mechanismen zurückgeführt werden kann. Dazu leiten wir testbare Implikationen aus theoretischen Modellen mithilfe von „Directed Acyclic Graphs“ (DAGs) ab. Für den Vergleich der Regressionskoeffizienten logistischer Regressionsmodelle und zur Zerlegung der verschiedenen Effekte verwenden wir die von Karlson und Kollegen (2012) vorgeschlagene KHB-Korrektur.

Die Ergebnisse zeigen, dass akademische Familien sich mit größerer Wahrscheinlichkeit für Latein entscheiden und dass der wichtigste Mechanismus zur Erklärung dieses Zusammenhangs die Bevorzugung eines sozial selektiven Lernumfelds ist. Es gibt jedoch auch Unterschiede in der Relevanz anderer Motive je nach Bildungshintergrund der Eltern.

 

Schulprofilierung als Distinktionsstrategie an Sekundarschulen

Catharina I. Keßler, Sonja Nonte
Georg-August-Universität Göttingen

Theoretischer Hintergrund

Im Zuge neuer Steuerungsmechanismen im Bildungssystem erhalten öffentliche Schulen seit den 1990er Jahren zunehmend mehr Gestaltungsspielräume. Die gewonnene Schulautonomie zeigt sich insbesondere im Bereich der Schulprofilbildung. So nimmt die Anzahl an Schulen mit spezifischen Profilen stetig zu. So werden vielerorts extracurriculare Angebote in den jeweiligen Schwerpunktbe-reichen etabliert oder Profilklassen eingerichtet.

Mit der Implementierung von Profilklassen und extracurricularen Angeboten können die Schulen auf einerseits in besonderem Maße auf die Bedarfe des regionalen Umfelds reagieren. Andererseits wählen Schüler*innen die zu ihren Interessen und ihrem Habitus passenden Schulen aus, so dass etwa Clausen (2006) von einer Überanpassung der Schülerschaft an ihre Schule spricht. Ausgehend vom „Theorem der Passung“ und habitustheoretischen Weiterentwicklungen rekonstruieren Helsper et al. (2014) Passungen zwischen primärem und sekundärem Schülerhabitus und gehen insgesamt von Passungsarbeit seitens der Schüler*innen sowie der Schule aus. Vor dem Hintergrund bildungs-systemischer Wandlungsprozesse mit einer Gleichzeitigkeit sozialer Öffnungs- und Schließungsten-denzen kann in diesem Zusammenhang besonders im Gymnasialen eine gesteigerte schulische Dis-tinktionsarbeit beobachtet werden. Insbesondere wenn Schulen für ihren Profilbereich mehr Anmel-dungen als freie Plätze zur Verfügung stehen, können neben privaten auch staatliche Schulen Aus-wahlverfahren implementieren. Über vermeintlich stärker formalisierbare Kriterien hinaus, können dabei auch implizitere Aspekte wie etwa eine milieuspezifische Passung wirkmächtig werden. Dieser Mechanismus kann als Selektionsprozess betrachtet werden, durch den spezifische gesellschaftliche Gruppierungen oder soziale Milieus keinen Zugang zu bestimmten Schulen erhalten (Heinrich, Alt-richter & Soukup-Altrichter, 2011; Maaz, Nagy, Jonkmann & Baumert, 2009). Eine positiv selektierte Schülerschaft wiederum führt dazu, dass solche Schulen bessere Ausgangsbedingungen beispielswei-se für die Einstellung von qualifiziertem Lehrpersonal haben, als andere Schulen in der Region. Mit der Einrichtung von Profilklassen kommt zudem ein weiterer Differenzierungsaspekt zum Tragen. Auch auf Jahrgangsebene kann es zu einer Homogenisierung der Schülerschaft kommen, wenn Pro-filklassen nur eine bestimmte Schülerschaft ansprechen. Die verbleibenden Parallelklassen werden dann gegebenenfalls zu sogenannten Restklassen (Specht, 2011).

Fragestellung

Nationale und internationale Forschungsbefunde zu Stratifizierungs- bzw. Segregationstendenzen im Bildungssystem deuten darauf hin, dass Zusatzangebote sowohl positiv (Beispiel Magnet Schools in den USA) als auch mit Blick auf Elitebildung und Ungleichheit kritisch diskutiert werden können (Wang, Schweig, Herman, 2017; Weiß, 1989). Bis heute liegen im deutschsprachigen Raum kaum Studien vor, die Schulprofilbildung in ihrer Umsetzung als Klassenprofilierung in einen Zusammen-hang mit Segregationsmechanismen im Bildungssystem bringen. Daher stellt sich uns die Frage, wel-che Bedeutung der Klassenprofilierung im Hinblick auf den Wettbewerb zwischen Schulen in der jeweiligen Region beigemessen wird.

Methoden

Um diesem Zusammenhang nachzugehen, haben wir im Kontext der Studie „ProfilBildung an Nieder-sächsischen Gymnasien und Integrierten Gesamtschulen“ (ProBiNi) neben den Schüler*innen (n ≤ 730), Eltern und Lehrkräften auch die Schulleitungen (n = 11) der teilnehmenden Schulen befragt. Zusätzlich wurden qualitative leitfadengestützte Interviews mit bislang vier Schulleitungen durchge-führt. Auf der Basis quantitativer deskriptiver Analysen sowie der qualitativ-rekonstruktiven Doku-mentarischen Methode werden implizite wie auch explizite Wissensbestände der Schulleitungen hinsichtlich Schulprofilierungsmaßnahmen mit dem Aspekt des schulischen Wettbewerbs in Verbin-dung gebracht. Die Relationierung der Befunde wird anhand eines Mixed Method-Designs im Sinne eines embedded designs (Creswell & Plano Clark, 2006) vorgenommen und unterschiedliche Fokusse mit den Vorteilen der jeweiligen Methodenparadigmen bearbeitet.

Ergebnisse

Die deskriptiven Ergebnisse der quantitativen Befragung der Schulleitungen deuten darauf hin, dass vielfältige Gründe für die Implementierung eines Klassenprofils angeführt werden, die jedoch zum Teil im Interview weniger präsent beziehungsweise unterschiedlich in den Orientierungsrahmen der Schulleitungen aufgehoben sind. Tatsächlich lassen sich in den Interviews unterschiedliche hand-lungsleitende Orientierungen auf Schulprofilierung rekonstruieren: Die qualitativen Fallstudien ver-weisen darauf, dass diese Rahmungen mit den konkreten schulischen Erfahrungsräumen korrespon-dieren und die schulische Profilierung sich als Teil der einzelschulischen Distinktionsarbeit deuten lässt. Aspekte, wie der Abbau sozialer Ungleichheit, sind darin nicht gleichermaßen aufgehoben. Die quantitativen und qualitativen Befunde werden in Beziehung gesetzt und zeichnen ein differenzier-tes Bild zu Distinktionsstrategien im Sekundarschulbereich.

 
9:00 - 10:45F9‒S22: Hate Speech als Schulproblem - Pädagogische Zugänge zu einer aktuellen Herausforderung
S22 
 

Hate Speech als Schulproblem – Pädagogische Zugänge zu einer aktuellen Herausforderung

Chair(s): Sebastian Wachs (Universität Potsdam, Deutschland), Wilfried Schubarth (Universität Potsdam)

DiskutantIn(nen): Fred Berger (Universität Innsbruck)

Hass und Hetze gegenüber einzelnen Bevölkerungsgruppen, z.B. wegen ihrer Herkunft, Religionszugehörigkeit oder sexuellen Orientierung, gefährdet den gesellschaftlichen Zusammenhalt in Demokratien (KMK, 2018). Obwohl Hass und Hetze ein Teil der Menschheitsgeschichte darstellen, ist die wissenschaftliche Erforschung dessen als Gegenstand unterschiedlicher, aber miteinander verbundener Forschungsbereiche, wie z. B. der Erforschung von Vorurteilen (u.a. Allport, 1954; Beelmann & Jonas, 2009), Gruppenbezogener Menschenfeindlichkeit (u.a. Heitmeyer, 2003) und Diskriminierung (u.a. Gomolla, 2015; Heinemann & Mecheril, 2017), relativ neu. Ein aktuell medial breit diskutiertes Phänomen, was sich in der Intersektion zwischen Diskriminierung und Gewalt verorten lässt, ist Hate Speech. Hate Speech kann als kommunikative Ausdrucksform in der Öffentlichkeit mit Botschaftscharakter definiert werden, die absichtlich Ausgrenzung und Abwertung bestimmter Bevölkerungsgruppen fördert oder verbreitet und durch die diese in ihrer Würde verletzt werden (Wachs, Schubarth & Bilz, in press).

In Bezug auf Hate Speech liegt bisher kaum pädagogische Forschung vor. Diese ist aber besonders gefragt, denn der Schule kommt bei dem Thema Hate Speech eine gewichtige Doppelrolle zu: Durch die Heterogenität der Schülerschaft stellt sie einen Ort für das Erleben sozialer Konflikte wie u.a. Hate Speech dar. Zugleich ist sie dafür prädestiniert, Hate Speech durch die Vermittlung von Demokratie-, Sozial- und Medienkompetenzen entgegenzuwirken. Für Lehrkräfte ergibt sich die Relevanz von Hate Speech aus dem Erziehungsauftrag der Schule und ist sowohl bildungstheoretisch als auch durch Schulgesetze begründet. Der Lehrerberuf als Profession zeichnet sich u.a. durch die Bearbeitung zentraler gesellschaftlicher Probleme wie Hate Speech und die Tradierung und Reproduktion gesellschaftlicher Wissensbestände, Werte und Normen aus (Fend, 2008). Inwiefern Lehrkräfte aller Fächer einen Zusammenhang zwischen ihrem allgemeinbildenden Auftrag und den Erscheinungen von Hate Speech sehen und ob bzw. inwiefern sie sich als (mit-)verantwortlich für die Zielsetzung einer antidiskriminierenden und demokratischen Bildung verstehen, ist derzeit kaum untersucht.

Im Rahmen von drei Vorträgen verfolgt das vorliegende Symposium das Ziel, einen ersten Einblick in aktuelle pädagogische Hate Speech-Forschung mit Bezug zur Lebenswelt Schule zu geben. In dem ersten Beitrag präsentieren Cindy Ballaschk und Kolleg*innen (Universität Potsdam) eine qualitative Vorstudie des DFG-Projekts „Hate Speech – ein Schulproblem?“. In dieser Studie werden Schüler*innen und Lehrkräfte erstmals im Rahmen von Fokusgruppeninterviews zu Formen und Modi von Hate Speech sowie zum Umgang mit Hate Speech an der Schule befragt. In dem zweiten Beitrag stellen Kansok-Dusche und Kolleg*innen (Brandenburgische Technische Universität Cottbus-Senftenberg) die Ergebnisse eines systematischen Literaturüberblicks (inter-)nationaler Studien zu u.a. den Fragen vor, wie Hate Speech in der Forschungsliteratur definiert wird und wie stark Hate Speech unter Schüler*Innen verbreitet ist. Beide Studien werden im Rahmen des DFG-Projekts genutzt, um quantitative Messinstrumente zu entwickeln. In dem dritten Beitrag gibt Alexander Wettstein (Pädagogische Hochschule Bern) einen Einblick in eine videobasierte Beobachtungsstudie zu Hate Speech in sonderpädagogischen Kontexten. Dabei greift der Autor die Fragen auf, gegen wen sich Hate Speech richtet, welche Inhalte und Darstellungsformen auftreten und wie Hate Speech in Abhängigkeit vom sozialen Status der Sprechenden sozial verstärkt wird. Die Ergebnisse deuten darauf hin, dass Hate Speech als identitätsstiftendes in-group Kriterium dient und mit sozialer Anerkennung assoziiert wird.

Die drei Beiträge verbindet die thematische Fokussierung auf Hate Speech in der Schule. Sie zeigen zudem existierende Forschungslücken auf. Darüber hinaus wollen die Beiträge dazu anregen, darüber nachzudenken, wie Schulen zukünftig durch Präventionsprogramme, Fortbildungen von Lehrkräften und Weiterentwicklung der Lehrer*innenausbildung besser unterstützt werden können, mit Hate Speech umzugehen. Im Anschluss an die Vorträge wird Fred Berger (Universität Innsbruck) die Beiträge kommentieren und eine Gesamtdiskussion leiten.

 

Beiträge des Symposiums

 

Eine qualitative Studie zu Formen und Arten von Hate Speech sowie zum Umgang damit aus der Sicht von Schüler*innen und Lehrkräften

Cindy Ballaschk, Sebastian Wachs, Wilfried Schubarth
Universität Potsdam

Hintergrund: Dieser Beitrag gibt einen ersten Einblick in die qualitative Vorstudie des DFG-Forschungsprojekts „Hate Speech – ein Schulproblem?“. Bisher liegen keine Studien vor, die explizit Hate Speech im Schulkontext untersuchen. Folglich ist unklar, welche Formen von Hate Speech unter Schüler*innen auftreten, in welcher Art Hate Speech ausgedrückt und wie Schüler*innen und Lehrkräfte auf Hate Speech reagieren. Allerdings liefern angrenzende Forschungsbereiche, wie z.B. Gewalt- oder Diskriminierungsforschung, erste Hinweise. So ist bekannt, dass sich bei Schüler*innen rechtsextreme, ausländerfeindliche, antisemitische und schwulenfeindliche Einstellungen feststellen lassen (Baier, Pfeiffer, Simonson & Rabold, 2009). Wenn Schüler*innen Diskriminierungen erfahren, zeigen sie unterschiedliche Reaktionen, wie z.B. Suche nach sozialer Unterstützung bei Freund*innen und Eltern, Ablenkung, Konfrontation, Vermeidung und Verzweiflung (Garnett, Masyn, Austin, Williams & Viswanath, 2015). Lehrkräfte nehmen häufig den Umgang mit gruppenbezogenen Anfeindungen unter Schüler*innen als eine große Herausforderung wahr und versuchen deshalb, Themen mit politischem Konfliktpotential im Unterricht zu vermeiden (AJCB, 2017; Wagner, von Dick, Petzel & Auernheimer, 2001). Während national kaum Studien vorliegen, finden sich in der internationalen Forschung mehr Hinweise, wie Lehrkräfte reagieren, wenn sie mit Diskriminierung und Vorurteilen zwischen Schüler*innen konfrontiert werden. Laut einer Studie gibt nur ein Drittel an, in solchen Situationen zu reagieren (Dragowski, McCabe & Rubinson, 2016). Wenn die Lehrkräfte intervenieren, umfassen Handlungen z.B. Thematisierung des Vorfalls in Gesprächen, Einbezug der Eltern, Kolleg*innen und Schulsozialarbeiter*innen und externen Akteur*innen (Wagner et al., 2001).

Fragestellungen: Um die bestehenden Forschungslücken in Bezug auf Hate Speech zu schließen, zielt die vorliegende Studie darauf ab, folgende Fragen zu beantworten: Welche verschiedenen Formen von Hate Speech gibt es unter Schüler*innen? Welche marginalisierten Gruppen werden durch Hate Speech am häufigsten adressiert? Welche verschiedenen Arten von Hate Speech werden Schüler*innen berichtet? Wird Hate Speech eher implizit oder explizit bis hin zu Gewalt(-androhungen) ausgeübt? Welche Reaktionsweisen im Umgang mit Hate Speech gibt es von Seiten der Schüler*innen und seitens der Lehrkräfte? Wie hängen Online und Offline Hate Speech zusammen und worin bestehen mögliche Unterschiede?

Methode: Um das komplexe Phänomen Hate Speech zu beleuchten, werden Schüler*innen und Lehrkräfte in Schulen in Berlin und Brandenburg in leitfadengestützten Fokusgruppeninterviews befragt. Da Teilnehmende in Gruppeninterviews in Interaktion miteinander gehen, kommen sie einer natürlichen alltäglichen Gesprächssituation sehr nahe (Vogl, 2014). Für die Fokusgruppeninterviews mit den Schüler*innen wurden die Klassenstufen sieben bis neun ausgewählt, weil vorliegenden Befunde eine erhöhte Verbreitung von Hate Speech insbesondere in der mittleren Adoleszenz vermuten lassen (Wachs et al., in press). Die Interviews finden in Realgruppen mit je sieben Teilnehmenden statt, um für das sensible Thema Hate Speech, insbesondere in den Schüler*inneninterviews eine möglichst vertrauensvolle Gesprächsatmosphäre zu erreichen (Vogl, 2015). In beiden Bundesländern (Berlin und Brandenburg) ist die Schulstruktur zweigliedrig organisiert. Um der Heterogenität des Untersuchungsfeldes in Bezug auf soziodemographische Merkmale gerecht zu werden, werden die Schultypen und Schulstandorte mittels eines kontrastierenden Samplingverfahrens ausgewählt. In Berlin werden drei Gymnasien in einem strukturstarken Stadtteil sowie drei Integrierte Sekundarschule in einem strukturschwachen Stadtteil ausgewählt. In Brandenburg werden drei Gymnasien in einer größeren Stadt sowie drei Oberschuleen in einer eher ländlichen Gegend in das Sample einbezogen. Ziel ist eine maximale strukturelle Variation.

Die Strukturierung und Analyse der Kommunikation unter den Schüler*innen, Lehrkräften und Schulsozialarbeiter*innen erfolgt inhaltsanalytisch Mayring, 2010). Um das Material im Hinblick auf die Forschungsfragen systematisch zu beschreiben, werden Kategorien anhand der Leitfragen der Interviews deduktiv festgelegt und aus dem Material heraus um weitere zentrale Themen induktiv ergänzt (Gläser & Laudel, 2013). Ziel ist es, subjektive Erfahrungen von Schüler*innen, Schulsozialarbeiter*innen und Lehrkräften zu Hate Speech aus ihrem Schulalltag zu rekonstruieren.

Ergebnisse: Da die Erhebungen erst Anfang Oktober beginnen, kann zum jetzigen Zeitpunkt keine Auskunft über Ergebnisse gegeben werden.

 

Hate-Speech als Schulproblem – Ein Literaturüberblick

Julia Kansok-Dusche, Julia Bastian, Ludwig Bilz
Brandenburgische Technische Universität Cottbus-Senftenberg

Eine aktuell medial und zivilgesellschaftlich breit diskutierte Form von Gewalt ist Hate Speech (Baldauf, Banaszczuk, Koreng, Schramm & Stefanowitsch, 2015). Anknüpfend an den bisherigen Kenntnisstand (Baldauf et al., 2015; Butler, 1998; Meibauer, 2013; Ministerkomitee des Europarats, 1997; Sponholz, 2018; Unger, 2013; Näsi, Räsänen, Howdon, Holkeri & Oksanen, 2015) definieren wir Hate Speech als kommunikative Ausdrucksform in der Öffentlichkeit mit Botschaftscharakter (z.B. Schrift, Sprache, Videos), die absichtlich Ausgrenzung, Verachtung und Abwertung bestimmter Bevölkerungsgruppen fördert, rechtfertigt oder verbreitet und durch die diese in diskriminierender Weise in ihrer Würde verletzt, herabgesetzt oder gedemütigt werden. Der Schule obliegt in Bezug auf Hate Speech eine Doppelrolle: aufgrund der Heterogenität der Schülerschaft und der potentiellen Krisendynamik insbesondere der Jugendzeit stellt sie einen Ort für das Erleben sozialer Konflikte wie u.a. Hate Speech dar. Zugleich ist sie dafür prädestiniert, Hate Speech durch die Vermittlung von Demokratie-, Sozial- und Medienkompetenzen entgegenzuwirken. Die schulbezogene Forschung hat Hate Speech hierzulande bisher allerdings kaum im Blick. Dass hier aber Handlungsbedarf besteht, ist evident. Denn in einer Studie des Landesinstituts für Medien Nordrhein-Westfalen (LfM) (N = 2.044; Alter: 14-60 Jahre) berichten 54% und 1 Jahr später bereits 59% der befragten 14- bis 24-Jährigen, häufig bis sehr häufig online Hate Speech beobachtet zu haben (LfM, 2016). In einer international vergleichenden Studie (N = 3.565; Alter: 15-30 Jahre) berichteten 30% der deutschen, 47% der finnischen, 38% der britischen und 53% der amerikanischen Studienteilnehmer*innen, online diskriminierende Inhalte gesehen zu haben (Hawdon, Oksanen & Räsänen, 2017). Welche Rolle Schulen in Deutschland als Austragungs- und Präventionsort von Hate Speech spielen, ist aktuell unklar. Die wissenschaftliche Auseinandersetzung mit Überlappungen von Hate Speech mit (Cyber-) Mobbing oder von Offline-HS mit verbaler Gewalt hat hierzulande erst begonnen (z.B. Wachs, Wright & Vazsonyi, 2019). Der geplante Beitrag will im Rahmen des DFG-geförderten Projektes „Hate Speech als Schulproblem?“ (Wachs, Bilz & Schubarth, 2019) an diesen Forschungslücken ansetzen und den (inter-)nationalen Forschungsstand zu folgenden Fragen systematisch aufarbeiten: (F1) Wie wird Hate Speech in Studien, die das Phänomen im Kontext Schule untersuchen, definiert und ob bzw. wie wird es von verwandten Formen der Gewalt (z.B. Mobbing) definitorisch abgegrenzt? (F2) Wie stark ist Hate Speech unter Schüler*Innen verbreitet und wie wurde die Überschneidung mit verwandten Formen der Gewalt (z.B. Mobbing) empirisch untersucht? Eine spezifische string-gesteuerte Suchstrategie in sozialwissenschaftlichen Datenbanken (ERIC, Open Dissertations, PsycINFO, Psyndex, Political Science Complete, SocINDEX, Web of Science) erbrachte über 80 Publikationen, aus denen mehr als 25 relevante (inter)-nationale Studien als fragestellungsrelevant eingestuft wurden (Rapid-Review-Methode nach Dobbins 2017). Nur sehr wenige Publikationen haben explizit die theoretische Abgrenzung von Hate Speech und verwandten Formen der Gewalt zum Gegenstand (F1). Die Mehrheit der Studien stammt aus dem anglo-amerikanischen Raum und thematisiert Prävalenzen von Hate Speech an Schulen (F2). Zwei unabhängige Kodiererinnen werten die identifizierten Studien aktuell unabhängig voneinander aus. Die Ergebnissynthese erfolgt kollaborativ. Der geplante Beitrag wird den Forschungsstand zu den zwei Fragestellungen darstellen und erörtern, welche Bedarfe und Ansatzpunkte sich für zukünftige Forschungsarbeiten zum Thema Hate Speech an Schulen in Deutschland und darüber hinaus ergeben.

 

Eine Beobachtungsstudie zu Hate Speech in face-to-face-Interaktionen in sonderpädagogischen Kontexten

Alexander Wettstein
Pädagogische Hochschule Bern

Theoretischer Hintergrund: Hate Speech ist eine Form gruppenbezogener Menschenfeindlichkeit, bei der Menschen aufgrund ihrer Gruppenzugehörigkeit angegriffen, herabgesetzt und gedemütigt werden (Sponholz, 2018; Wachs, Schubarth & Bilz, in press). Bisher wurde Hate Speech fast ausschließlich in medialen Kontexten untersucht. Über natürlich auftretende Hate Speech Episoden in face-to-face Interaktionen ist nahezu nichts bekannt. Diese Beobachtungsstudie untersucht die Dynamik von Hate Speech Episoden bei einer Stichprobe hoch aggressiver Jugendlicher in einem Erziehungsheim. In spezialisierten Institutionen kann es zu einer sogenannten Peer Contagion, kommen (Dishion & Dodge, 2005), in der sich das Problemverhalten durch ungünstige Sozialisationseffekte unter Peers weiter verstärkt (Wettstein, 2014).

Fragestellungen: Die Studie geht der Frage nach 1.) in welchen Kontexten Hate Speech besonders gehäuft auftritt 2.) gegen wen sich die Beiträge adressieren, 3.) welche Inhalte und Darstellungsformen auftreten und 4.) wie Hate Speech Beiträge in Abhängigkeit vom sozialen Status der Sprechenden sozial verstärkt werden.

Methode: In einer Studie zu aggressivem Verhalten in schulischen Settings (Wettstein, 2008) wurde der Unterricht an verschiedenen Regelklassen, Kleinklassen und Erziehungsheimen für verhaltensauffällige Kinder und Jugendliche jeweils über 20 Wochen videografiert. In einer Klasse eines Erziehungsheims war der Unterricht besonders stark gestört. Diese Klasse setzte sich aus zwei Mädchen und vier Jungen mit ausgeprägten Verhaltensauffälligkeiten im Alter von 12; 3 bis 14; 11 Jahren (M = 13; 7) zusammen. Die Klasse wurde von zwei Klassenlehrerinnen geführt. Durch den Ausfall der einen Klassenlehrerin mussten Lehrkräfte mit kleinen Teilzeitanstellungen und Vertretungen die ausgefallene Klassenlehrerin kurzfristig ersetzen. Dies führte zu einem starken Anstieg aggressiven Verhaltens. Für die vorliegende Studie unterzogen wir insgesamt sechzehn Unterrichtsstunden dieser Schulklasse einer Re-Analyse.

Das Geschehen im Schulzimmer wurde sowohl in Anwesenheit als auch während der Abwesenheit der Lehrkräfte mit Videokameras und einem Tonsystem aufgezeichnet. Mit dem Beobachtungssystem zur Analyse aggressiven Verhaltens BASYS (Wettstein, 2008) wurden zunächst sechs verschiedene Formen aggressiven Verhaltens erfasst. Aggressives Verhalten wird durch zwei zentrale Bestimmungsmerkmale definiert: 1.) Schädigung und 2.) Absicht, wobei die Schädigung des Opfers sowohl physisch als auch psychisch erfolgen kann. In der Re-Analyse wurde das Augenmerk auf Hate Speech gerichtet. Hate Speech ist ein Spezialfall aggressiven Verhaltens, wobei neben den bereits genannten Kriterien zusätzlich 3.) die Herabsetzung auf Grundlage einer zugeschriebenen Gruppenzugehörigkeit hinzukommt. Alle Hate Speech Beiträge wurden transkribiert und induktiv ein Beobachtungssystem zur Erfassung von Hate Speech entwickelt. Das finale Kategoriensystem umfasst vier Unterrichtskontexte, vier Adressatenkategorien, neun thematische Inhaltskategorien, drei Präsentationsformen sowie drei Formen sozialer Verstärkung. Zusätzlich wurde aufgrund systematischer Beobachtung und Lehrereinschätzungen mit dem Soziogrammverfahren des BASYS (Wettstein, 2008) der soziale Status der einzelnen Jugendlichen bestimmt. Die Daten wurden deskriptiv ausgewertet.

Ergebnisse: Hate Speech tritt in der untersuchten Stichprobe vor allem während der Abwesenheit der Klassenlehrkräfte und während des Unterrichts in Anwesenheit von Vertretungslehrkräften auf. Die Beiträge richten sich am häufigsten gegen kulturelle Minoritäten, gegen Mitarbeitende in ihrer Rolle als Vertreter der Institution, Frauen sowie Homosexuelle. Die Hate Speech Beiträge thematisierten am häufigsten die Inhalte Krieg und Terror, gefolgt von Tötung, Folterung, Waffen und sexualisierte Gewalt. Körperliche Angriffe, Leichenschändung und körperliche Ausscheidungen wurden seltener thematisiert. Die Hate Speech initiierenden Jugendlichen wurden in 81% der Fälle durch anerkennendes Beipflichten, Lachen oder Schulterklopfen bestärkt. In 11% der Fälle wurde das Thema weitergeführt oder das Thema variiert (5.9%). Statushöhere Heranwachsende werden in ihren Hate Speech Beiträgen häufiger verstärkt.

Schlussfolgerungen: Es kann vermutet werden, dass Hate Speech, insbesondere die Schilderungen imaginierter extremer Formen der Gewalt, bei den frühadoleszenten aggressiven Heimjugendlichen als identitätsstiftendes in-group Kriterium dient. Hate Speech ist in dieser Subgruppe mit sozialer Anerkennung assoziiert. Es ist entscheidend, in solchen Settings Situationen mit geringer Aufsicht der Jugendlichen zu vermeiden (Dishion, Dodge & Lansford, 2008) und mit Präsenz auf Hate Speech zu reagieren.

 
9:00 - 10:45F9‒S23: Professionelle Unterrichtswahrnehmung: Wie blicken Lehrpersonen auf ihre Schülerinnen und Schüler?
S23 
 

Professionelle Unterrichtswahrnehmung: Wie blicken Lehrpersonen auf ihre Schülerinnen und Schüler?

Chair(s): Katharina Schnitzler (Technische Universität München (TUM), Deutschland), Patricia Goldberg (Universität Tübingen, Deutschland)

DiskutantIn(nen): Jasmin Decristan (Bergische Universität Wuppertral, Deutschland)

Die professionelle Unterrichtswahrnehmung wird als zentraler Aspekt professioneller Kompetenz von von Lehrpersonen betrachtet (Seidel & Stürmer, 2014). Unter anderem beinhaltet sie die Fähigkeit die Aufmerksamkeit auf relevante Ereignisse im Unterrichtsgeschehen zu richten, um entsprechendes Lehrhandeln darufhin auszurichten (Wolff, Jarodzka, van den Bogert, & Boshuizen, 2016). Studien konnten zeigen, dass Blickbewegungsmessungen eine vielversprechende Methode darstellen, solche Aufmerksamkeitsprozesse bei Lehrpersonen näher zu untersuchen (Cortina et al., 2015). Das vorliegende Symposium präsentiert vier Beiträge, die mit Hilfe der Eye-Tracking Technologie neue Einblicke in die professionelle Unterrichtswahrnehmung von Lehrpersonen in komplexen schulischen Kontexten liefern und der Frage nachgehen, wie (unerfahrene) Lehrpersonen Informationen wahrnehmen und ihre Aufmerksamkeit auf das Klassengeschehen fokussieren.

Durch einen neuen methodischen Ansatz untersucht Studie 1, durch welches Verhalten der Lernenden der Aufmerksamkeitsfokus von angehenden Lehrkräften gelenkt wird. Ausgangspunkt bildet bereits existierende Forschung, die nahelegt, dass die Aufmerksamkeit von unerfahrenen Lehrpersonen durch auffällige Reize, also bottom-up gesteuert wird (Cortina, Miller, McKenzie, & Epstein, 2015; Wolff et al., 2016). Zeitreihenanalysen ermöglichen es, den Zusammenhang von Schülerverhalten und Aufmerksamkeitsfokus der Lehrperson zu analysieren und geben Einblick in die Entwicklung über den Unterrichtsverlauf hinweg.

Studie 2 untersucht die Aufmerksamkeitsverteilung von Lehrarmstudierenden im Rahmen der Diagnose von Schülerprofilen, in welchen kognitive und motivational-affektive Lernvoraussetzungen zusammenspielen. Lehrpersonen müssen Schülerinnen und Schüler beobachten, um beispielsweise aus wahrgenommenem Verhalten das zugrundeliegende Schülerprofil zu schlussfolgern (Förster & Böhmer, 2017). Die Studienergebnisse zeigen, dass Studierende konsistente Profile akkurater diagnostizieren können als inkonsistente. Zudem weisen Studierende mit einer hohen Diagnoseakkuratheit für das starke, schwache und überschätzende Profil ähnliche Blickbewegungsmuster wie erfahrene Lehrkräfte mit kürzeren Fixationszeiten auf.

Studie 3 baut darauf auf, dass Experten im Vergleich zu Lehramtstudierenden kritische Ereignisse bei der Wahrnehmung von Unterricht besser identifizieren können (Seidel & Prenzel, 2008; Meschede et al., 2017). Mit einem mixed-methods-Ansatz, der Interviewdaten und Eye-Tracking Daten kombiniert, wird daher die professionelle Unterrichtswahrnehmung durch einen Vergleich von Lehramtsstudierenden und Hochschullehrenden, als Experten für Unterrichtsanalyse, tiefgehend untersucht. Die Ergebnisse zeigen, dass die Methode des Eye-Tracking dazu genutzt werden kann, Unterschiede in der professionellen Unterrichtswahrnehmung nachzuzeichnen.

Inwiefern die Blickbewegungen von Lehramtsstudierenden, Mathematiklehrkräften und Schulleitungen in der Betrachtung sehr kurz präsentierter Unterrichtsaufnahmen differieren, wird in Studie 4 basierend auf dem Holistic Processing Account (Sheridan & Reingold, 2017) evaluiert. Fixationszahl und -dauer, sowie die Verweildauer auf entweder Schülerinnen, Schülern, der unterrichtenden Lehrperson oder dem Instruktionsmaterial unterscheiden sich entsprechend dem Expertisestand der Lehrperson. Durch den dreifach-Vergleich von Lehramtsstudierenden, Mathematiklehrkräften und Schulleitungen wird zudem die bereits existierende Expertiseforschung erweitert.

Alle Studien verwenden die Eye-Tracking Methode um die professionelle Unterrichtswahrnehmung von Lehrpersonen zu untersuchen. Während Studie 1 das Blickverhalten in-action, also während des Unterrichtens untersucht, beziehen sich die Ergebnisse der Studien 2 bis 4 auf das Blickverhalten bei der Beobachtung von Unterrichtsvideos oder Screenshots (on-action). Dabei ergänzen sich die Studien in ihren Forschungsfragen und adressieren verschiedene Aspekte der professionellen Unterrichtswahrnehmung. Einerseits wird die Rolle des Verhaltens und der Lernvoraussetzungen von Schülerinnen und Schüler für die Aufmerksamkeitsprozesse untersucht (Studie 1 und 2). Andererseits geben Vergleiche von Experten und Novizen Aufschluss über deren Unterschiede in der Aufmerksamkeitsverteilung (Studie 3 und 4). Die Ergebnisse aller Studien verdeutlichen das Potenzial der Eye-Tracking Methode für die Untersuchung der professionellen Unterrichtswahrnehmung und ergänzen sich in ihren tiefgehenden Befunden, so dass ein umfangreiches Bild über die Aufmerksamkeitsprozesse von Lehrpersonen gewonnen wird.

 

Beiträge des Symposiums

 

Wie wird die Aufmerksamkeit von Lehramtsstudierenden beim Unterrichten durch das Verhalten der Lernenden beeinflusst?

Patricia Goldberg1, Jakob Schwerter1, Tina Seidel2, Katharina Müller3, Kathleen Stürmer1
1Universität Tübingen, Deutschland, 2Technische Universität München (TUM), Deutschland, 3Leibniz Universität Hannover, Deutschland

Eine zentrale Aufgabe von Lehrkräften ist es, das Klassengeschehen kontinuierlich im Blick zu behalten und visuelle Hinweise im Verhalten ihrer Schülerinnen und Schüler zu identifizieren (Wolff et al., 2016). Wenn Lehrkräfte erkennen können, ob ihre Schüler*innen in aktive Lernprozesse involviert sind, haben sie die Möglichkeit, die zur Verfügung stehende Zeit optimal zu nutzen und erfolgreiche Lernprozesse anzuregen.

Bisherige Forschung zeigt allerdings, dass insbesondere unerfahrene Lehrkräfte Schwierigkeiten darin haben, das Klassengeschehen kontinuierlich zu beobachten und lehr-lernrelevante Situationen zu identifizieren (Berliner, 2001). So zeigen beispielsweisen Untersuchungen mit mobilen Eye-Trackern, dass Lehramtsstudierende während des Unterrichts kaum in der Lage sind, alle Lernenden gleichmäßig im Blick zu behalten (Cortina et al., 2015; Stürmer, Seidel, Müller, Häusler, & Cortina, 2017). Zudem demonstrieren Studien mit stationären Eye-Trackern, dass unerfahrene Lehrkräfte häufig auffällige Verhaltensweisen der Lernenden, wie beispielsweise Störungen, fokussieren (Wolff et al., 2016). Dies legt die Vermutung nahe, dass die Aufmerksamkeitsprozesse von unerfahreneren Lehrkräften eher bottom-up, durch auffällige Reize gelenkt werden, als durch die Intention die kognitive Prozesse der Lernenden zu diagnostizieren (top-down; Schütz, Braun, & Gegenfurtner, 2011). Lipowsky, Rakoczy, Pauli, Reusser, and Klieme (2007) konnten außerdem zeigen, dass Lehrkräfte generell dazu tendieren, mehr mit starken und sich aktiv beteiligenden Schüler*innen zu interagieren. Das behaviorale Spektrum von Schüler*innen während des Unterrichts ist jedoch sehr vielfältig und hängt mit ihren individuellen Charakteristika zusammen (Jurik, Gröschner, & Seidel, 2014). Es ist daher notwendig, dass Lehrkräfte nicht nur auf auffälliges Verhalten reagieren, sondern auch unauffällige Hinweise auf Probleme und Schwierigkeiten in eher passiven Verhaltensweisen frühzeitig als solche erkennen.

Bisher ist wenig darüber bekannt, welche Faktoren die Aufmerksamkeit unerfahrener Lehrkräfte während des Unterrichtens beeinflussen. Die vorliegende Studie untersucht daher, ob bestimmte Verhaltensweisen von Lernenden die Aufmerksamkeit von Lehramtsstudierenden auf sich ziehen. Des Weiteren zeigen Studien aus der psychologischen Aufmerksamkeitsforschung, dass auffällige Reize die visuelle Aufmerksamkeit lenken (bottom-up), bevor intentionale Prozesse in die Steuerung eingreifen (top-down; Theeuwes, Atchley, & Kramer, 2000). Daher berücksichtigt die vorliegende Studie zudem, ob sich der Aufmerksamkeitsfokus von Lehramtsstudierenden im Verlauf der Instruktionszeit verändert.

Zur Beantwortung der Fragestellungen wurden N = 4 Videos mit insgesamt 3646 Sekunden re-analysiert, in welchen Lehramtsstudierende vier simulierte Lernende unter standardisierten Bedingungen unterrichten (Stürmer et al., 2017).

Die vorliegende Studie implementiert einen neuen methodischen Ansatz, welcher die bereits existierenden Eye-Tracking Daten der Lehramtsstudierenden (wobei Lernende hier jeweils als Area of Interest, AOI, definiert sind) mit einem kontinuierlichen Verhaltensrating der Lernenden synchronisiert. Das Verhaltensrating kombiniert die Differenzierung in On- und Off-Task-Verhalten (Helmke & Renkl, 1992; Hommel, 2012) mit bestehenden Instrumenten der Engagement-Literatur und nutzt das ICAP-Framework (Chi & Wylie, 2014) als Ansatz, um das behaviorale Spektrum von Lernenden weiter aufzugliedern (passiv, aktiv, (un)konstruktiv, interaktiv). Das Verhalten der Lernenden wurde auf einer symmetrischen Skala von -2 bis +2 bewertet, wobei Werte am äußeren Ende der Skala interaktives Verhalten bedeuten und Werte nahe 0 unauffälliges, passives Verhalten indizieren.

Der resultierende Datensatz spezifiziert für jede Sekunde, wie sich die Lernenden verhalten, worauf die Lehramtsstudierenden ihre Aufmerksamkeit fokussieren und was die Lehramtsstudierenden machen (z.B. Anweisungen geben, Fragen stellen, usw.). Anschließend wurden Zeitreihenanalysen anhand Multinomialer Regressionen (Mixed Models: alternativ-spezifische und unspezifische Variablen; Regressor: AOI der nächsten Sekunde) durchgeführt.

Die Ergebnisse zeigen, dass Lehramtsstudierende ihre Aufmerksamkeit mit höherer Wahrscheinlichkeit auf die Lernenden fokussieren, die aktives beziehungsweise interaktives, lern-relevantes Verhalten aufweisen (z.B. Fragen stellen oder Sachverhalte erklären). Die Wahrscheinlichkeit fokussiert zu werden sinkt, je weniger sich Lernende am Unterricht beteiligen, und nimmt durch unkonzentriertes und störendes Verhalten weiter ab. Zudem deuten die Ergebnisse darauf hin, dass das Verhalten der Lernenden schon früh im Instruktionsverlauf einen Einfluss auf die Aufmerksamkeit der Lehramtsstudierenden nimmt und der Effekt über die Zeit hinweg stabil ist.

 

Schülervoraussetzungen im Blick: Wie Lehramtsstudierende Schülerprofile wahrnehmen und diagnostizieren

Christian Kosel, Katharina Schnitzler, Doris Holzberger, Tina Seidel
Technische Universität München (TUM), Deutschland

Theoretischer Hintergrund

Schüler und Schülerinnen unterscheiden sich bezüglich des Zusammenspiels kognitiver (z.B. Vorwissen) und motivational-affektiver (z.B. Interesse) Voraussetzungen, welche wichtige Prädiktoren für erfolgreiche Lernprozesse darstellen (Lau & Roeser, 2008). Mithilfe latenter Klassenanalysen konnten fünf Schülerprofile identifiziert werden, welche zwei konsistente, z.B. stark (hohe kognitive und motivational-affektive Voraussetzungen), sowie drei inkonsistente Profile, z.B. unterschätzend (hohe kognitive und niedrige motivational-affektive Voraussetzungen) umfassen (Seidel, 2006). Um erfolgreich zu unterrichten, ist es daher unverzichtbar, dass Lehrkräfte ihren Unterricht adäquat an die Schülerprofile anpassen (Schrader, 2013). Dafür, bedarf es einer genauen Diagnose der Voraussetzungen von einzelnen Schülerinnen und Schülern. Hierbei ist die professionelle Unterrichtswahrnehmung entscheidend: Um Schülerprofile zu diagnostizieren, müssen Lehrkräfte zunächst Hinweise (engl. cues), beispielsweise im Verhalten der Schülerinnen und Schüler, wahrnehmen, um daraus verknüpft mit ihrem professionellen Wissen, das jeweilige Schülerprofil zu schlussfolgern (siehe Linsenmodell; Brunswik, 1956; Förster & Böhmer, 2017).

Die Wahrnehmung von Lehrkräften kann mit Blickbewegungsanalysen untersucht werden (Seidel & Stürmer, 2014). Bisherige Forschungsergebnisse verdeutlichen, dass erfahrene Lehrkräfte ihre Aufmerksamkeit durch häufigere Fixationen mit einer kürzeren durchschnittlichen Dauer gleichmäßig über Schülerinnen und Schüler verteilen (Gegenfurtner, Lehtinen, & Saljo, 2011).

Für das Schlussfolgern zeigte sich, dass Lehrkräfte vor allem die Leistung von Schülerinnen und Schülern einschätzen können, dass sie allerdings Schwierigkeiten haben, die inkonsistente Ausprägung von kognitiven und motivational-affektiven Voraussetzungen zu diagnostizieren (Südkamp, Praetorius, & Spinath, 2017).

Ungeklärt ist bisher, einerseits wie erfolgreich Lehramtsstudierende Schülerprofile durch ihr bereits erworbenes Wissen diagnostizieren können und andererseits, ob innerhalb der Lehramtsstudierenden einige bereits Wahrnehmungsmuster von erfahrenen Lehrkräften aufzeigen.

Fragestellungen

1. Können Lehramtsstudierende konsistente Schülerprofile akkurater diagnostizieren als inkonsistente?

2. Zeigen Lehramtsstudierenden mit einer hohen Diagnoseakkuratheit

a. weniger Fixationen

b. und kürzere durchschnittliche Fixationszeiten

als Lehramtsstudierenden mit einer geringen Diagnoseakkuratheit?

Methode

An der Studie nahmen 33 MINT-Lehramtsstudierende (MAlter = 23.43, SD = 1.27; 54% weiblich) aus dem vierten Fachsemester teil. Den Probanden wurden die fünf Schülerprofile (Seidel 2006) vorgestellt, um anschließend fünf markierte Schülerinnen und Schüler, je Profil ein Schüler/eine Schülerin, in einem Unterrichtsvideo (11 min., 8. Klasse Gymnasium, Mathematik) zu beobachten. Währenddessen wurden die Blickbewegungen der Teilnehmenden mit dem SMI Red 500 Eye-Tracker aufgezeichnet. Anschließend, diagnostizierten die Lehramtsstudierenden die Profile der fünf markierten Schülerinnen und Schüler.

Die Auswertung der Fixationshäufigkeit und Fixationsdauer fand in BeGaze 3.7 mit dynamischen Areas of Interest für die fünf markierten Schülerinnen und Schüler satt.

Für die Diagnoseakkuratheit wurden die korrekten Profile in einer latenten Klassenanalyse identifiziert. Für die einzelnen Profile erhielten die Studierenden zwischen null (falsche Diagnose) und einem (korrekte Diagnose) Punkt, so dass insgesamt null bis fünf Punkte für die fünf Schüler und Schülerinnen erreicht werden konnten. Aufgrund dieser Gesamtdiagnoseleistung wurden zwei Subgruppen mit hoher Diagnoseleistung (n = 13; MGesamtdiagnose = 4.04 Punkte, SD = 0.69) und mit niedriger Diagnoseleistung (n= 12; MGesamtdiagnose = 1.50 Punkte, SD = 0.71) gebildet.

Ergebnisse

Die Diagnoseakkuratheit unterschied sich statistisch signifikant für die Schülerprofile (F(2,160) = 6.33, p < .001). Tukey-HSD post-hoc Vergleiche zeigten das, dass uninteressierte Profil signifikant akkurater zugewiesen wurde als alle anderen Profile (M = 0.77; alle p < .05). Es zeigten sich keine signifikanten Unterschiede für das schwache (M = 0.68), das starke (M = 0.58) und das unterschätzende Profil (M = 0.45). Das überschätzende Profil wurde signifikant weniger akkurat diagnostiziert als alle anderen Profile (M = 0.32, alle p < .05).

Eine Reihe von ungepaarten t-Tests zeigte, dass Studierende mit hoher Diagnoseakkuratheit kürzere Fixationen für das starke (t(23) = 2.32, p = .029), schwache (t(23) = 2.23, p = .036), und überschätzende Profil (t(23) = 2.24, p = .035) aufwiesen. Für das unterschätzende und uninteressierte Profil zeigten sich keine signifikanten Unterschiede. Ebenso unterschied sich die Anzahl der Fixationen nicht signifikant.

 

Mit Eye-Tracking die “professional vision” beim Betrachten von Unterricht erforschen: Ergebnisse aus einer Studie mit Lehramtsstudierenden und Hochschullehrenden

Corinne Wyss1, Wolfgang Bührer2, Katharina Rosenberger3
1Pädagogische Hochschule der FHNW, Schweiz, 2Pädagogische Hochschule Zürich, Schweiz, 3Kirchliche Pädagogische Hochschule Wien/Krems, Österreich

Das Unterrichten ist eine komplexe und anspruchsvolle Aufgabe, da sich Lehrpersonen mit vielschichtigen Herausforderungen auseinandersetzen und mehrdeutige Situationen, in aller Regel unter Zeitdruck, meistern müssen. Hierzu benötigen sie professionelles Wissen, das es angemessen anzuwenden gilt (Fairbanks et al., 2010). In diesem Sinne fokussierte die Forschung zur LehrerInnenprofessionalität in den vergangenen Jahren unter anderem darauf, unterschiedliche Domänen dieses professionellen Wissens zu definieren, theoretisch zu fassen und empirisch zu untersuchen. Aktuelle Forschungsansätze (beispielsweise aus der Expertiseforschung) richten dabei etwa ihr Augenmerk auf das Konzept der «professional vision» (Goodwin, 1994; van Es and Sherin 2010; Todorova, Sunder, Steffensky & Möller, 2017). Eine Reihe an Studien konnte in diesem Zusammenhang grundlegende Unterschiede zwischen erfahrenen und nicht bzw. wenig erfahrenen Lehrenden (z.B. Lehramtsstudierenden) aufzeigen. So können etwa erfahrene Lehrkräfte kritische Unterrichtssituationen besser identifizieren, diese kategorisieren und dementsprechend interpretieren. Im Vergleich dazu tendieren Lehramtsstudierende eher dazu, den Fokus auf Oberflächenaspekte zu richten (Seidel & Prenzel, 2008; Meschede et al., 2017). In den letzten Jahren wurden diese Befunde mit Studien, die Eye-Tracking als Erhebungsmethode einsetzen, ergänzt und erweitert, sodass bereits einige aufschlussreiche Ergebnisse vorliegen (vgl. etwa Wolff et al. 2016; Stürmer, Seidel, Müller, Häusler & Cortina, 2017). Das Potential von Eye-Tracking als vergleichsweise neue Methode ist allerdings für die dargestellte Thematik noch nicht ausgeschöpft.

Das derzeit noch laufende Forschungsprojekt widmet sich einerseits der Suche nach Anhaltspunkten für pädagogische «professional vision» und andererseits der Methode des Eye-Trackings selbst. Dazu werden mit einem mixed-methods-Ansatz Eye-Tracking-Daten und Interviewdaten kombiniert. In der explorativen Studie stehen folgende Forschungsfragen im Zentrum des Interesses:

1. Inwiefern können auf «professional vision» hinweisende Unterschiede zwischen Lehramtsstudierenden und Hochschullehrenden beim Betrachten einer videografierten Unterrichtsszene, die ein «kritisches Ereignis» enthält, festgestellt werden?

2. Inwiefern wird die im Videoclip gezeigte kritische Situation von den Befragten als pädagogisches «kritisches Ereignis» auch verbalisiert?

3. Inwiefern unterscheiden sich die Eye-Tracking-Daten bei jenen Befragten, die das «kritische Ereignis» erwähnen von jenen, die das nicht tun?

Den 56 Studienteilnehmenden (28 Lehramtsstudierende und als Referenzgruppe 28 Hochschullehrende an einer Pädagogischen Hochschule, die alle Schulunterrichtserfahrung und/oder Erfahrung in der Analyse mit Unterrichtsvideos haben) wurde jeweils ein einminütiger Videoausschnitt einer realen Unterrichtssituation gezeigt, in dem ein kritisches Ereignis (vgl. Tripp, 1993) zu beobachten ist. Die Videosequenz stammt aus einem früheren Forschungsprojekt, in dem im Rahmen einer Feldstudie zahlreiche Unterrichtssituationen aufgezeichnet und qualitativ analysiert wurden (Hammerer, Kromer, Rosenberger & Wachter, 2018).

Das Blickverhalten der Teilnehmenden während des Videoschauens auf einem Computerbildschirm wurde mit einem GazePoint GP3HD Desktop Eye-Tracking-Gerät aufgezeichnet. Anschliessend wurden die Teilnehmenden in einer audioaufgezeichneten Befragung gebeten, zu verbalisieren, was sie in dem Videoausschnitt beobachten konnten. Die Eye-Tracking Daten wurden mit der GazePoint Analysis Software Prof. Edition v. 4.1.0 (x64) sowie statistischen Berechnungen in Python in Bezug auf drei definierte AOIs hinsichtlich des kritischen Ereignisses ausgewertet. Die Audioaufzeichnungen wurden transkribiert und in MAXQDA mit Hilfe eines Kategorienrasters analysiert, wobei der Fokus der Analyse auch hier auf dem kritischen Ereignis lag.

Die Ergebnisse offenbaren Unterschiede zwischen den beiden untersuchten Gruppen – sowohl im Eye-Tracking als auch in den Interviewdaten. Die Aussagen der Hochschullehrenden in der mündlichen Befragung sind im Allgemeinen gehaltvoller und das kritische Ereignis wurde ausschliesslich von Personen aus dieser Gruppe explizit erwähnt. Die Analysen des Eye-Trackings zeigen, dass sich das Blickverhalten dieser Gruppe von Hochschullehrenden in Bezug auf die definierten AOIs signifikant von den anderen Studienteilnehmenden unterscheidet. Die Ergebnisse belegen jene Unterschiede der «professional vision» zwischen NovizInnenen und erfahrenem Lehrpersonal, die auch schon in ähnlich gelagerten Studien (z.B. Wolff et al., 2016) aufgezeigt werden konnten. Bezugnehmend auf die methodologische Fragestellung zum Einsatz von Eye-Tracking weisen die Ergebnisse darüber hinaus darauf hin, dass Eye-Tracking-Daten dabei helfen können, Hinweise auf «professional vision» nachzeichnen zu können.

 

Expertise in der Unterrichtswahrnehmung: Eine Eye-Tracking-Studie mit Lehramtsstudierenden, Mathematiklehrkräften und Schulleitungen

Andreas Gegenfurtner1, Hans Gruber2, Doris Lewalter3, Erno Lehtinen4, Kenneth Holmqvist2, Tetiana Khmelivska3, Florian Hauser5, Jan D. Vermunt6
1Universität Passau, Deutschland, 2Universität Regensburg, Deutschland, 3Technische Universität München (TUM), Deutschland, 4University of Turku, Finland, 5OTH Regensburg, Deutschland, 6Eindhoven University of Technology, the Netherlands

Theoretischer Hintergrund

Forschungen belegen, dass erfahrene Lehrkräfte Unterrichtssituationen im Klassenzimmer anders wahrnehmen als unerfahrene Lehrkräfte (Sherin, Jacobs, & Philipp, 2011). Diese Fähigkeit des teacher noticing—die schnelle, selektive Informationswahrnehmung in komplexen schulischen Situationen—ist eine essentielle Komponente professioneller Unterrichtswahrnehmung (Seidel & Stürmer, 2014) und ein Indikator für Lehrexpertise (McIntyre & Foulsham, 2018). Expertiseforschung in verschiedenen Domänen zeigt, dass sich Unterschiede in professioneller Wahrnehmung in Augenbewegungsmustern widerspiegeln (Gegenfurtner et al., 2011). Sheridan and Reingold (2017) postulieren in ihrem Holistic Processing Account entsprechend, dass Expertise zu holistischer, parafovealer, selektiver und daher sehr schneller Wahrnehmung führt. Allerdings ist Informationswahrnehmung von Lehrkräften noch wenig untersucht. Noch weniger weiß man über die Informationsverarbeitung von Schulleitungen, die im Rahmen ihrer Tätigkeiten fremden Unterricht beobachten und evaluieren.

Fragestellung

Diese Studie untersuchte daher die Fragestellung, wie die Augenbewegungen von Lehramtsstudierenden, Mathematiklehrkräften und Schulleitungen in der Betrachtung sehr kurz präsentierter Unterrichtsaufnahmen differieren. Basierend auf dem Holistic Processing Account wurde vermutet, dass Mathematiklehrkräfte und Schulleitungen verglichen zu Lehramtsstudierenden weniger Fixationen (Hypothese 1a) von kürzerer Dauer (Hypothese 1b), eine geringere Verweilzeit (Hypothese 2), sowie längere Sakkadenamplituden (Hypothese 3a) von kürzerer Dauer (Hypothese 3b) zeigen. Zusätzlich wurde angenommen (Hypothese 4), dass sich Augenbewegungsunterschiede nach Area of Interest (Lehrkräfte, Schüler, Instruktionsmaterial) zeigen.

Methode

Teilnehmende

An der Studie partizipierten 75 Personen (43 weiblich) auf drei Expertisestufen: 25 Lehramtsstudierende, 25 Mathematiklehrkräfte und 25 Schulleitungen. Die Lehramtsstudierenden (16 weiblich) waren durchschnittlich 23.84 Jahre alt (±1.95) und studierten Mathematik seit 6.64 Semestern (±2.34). Die Mathematiklehrkräfte (16 weiblich) waren durchschnittlich 48.80 Jahre alt (±8.47) und unterrichteten am Gymnasium seit 17.94 Jahren (±9.44). Die Schulleitungen (11 weiblich) waren durchschnittlich 47.96 Jahre alt (±8.84) und unterrichteten seit 20.38 Jahren (±9.08).

Material und Messungen

Den Teilnehmenden wurden 51 Screenshots von validiertem Videomaterial von Mathematikunterricht der achten Jahrgangstufe präsentiert (Hugener, Krammer, & Reusser, 2007). Das Material zeigte eine Lehrkraft, weibliche und männliche Schüler, sowie Instruktionsmaterial wie Bücher, Tafel und Hefte. Die Screenshots wurden in randomisierter Reihenfolge für je 3 Sekunden (ein fünfsekündiges Fixationskreuz separierte die einzelnen Screenshots) auf einem 22-Zoll-TFT-Monitor mit einer Auflösung von 1680×1050 Pixeln gezeigt. Die Augenbewegungen wurden mit einem SMI RED 500 Eye Tracker aufgezeichnet und mit SMI BeGaze 3.0 ausgewertet. Die Screenshots wurden in vier Areas of Interest (Lehrkraft, Schülerin, Schüler, Instruktionsmaterial) segmentiert.

Ergebnisse

Fixationszahl

Eine two-way ANOVA mit den Faktoren Area of Interest (AOI) und Expertise zeigte einen Haupteffekt von AOI, F(3,288)=20.02, p<0.001, η𝑝2=0.17. Der Haupteffekt von Expertise und der Interaktionseffekt waren nicht-signifikant. Post-hoc ANOVAs zeigten, dass die Fixationszahl je AOI differierte bei Lehramtsstudierenden, F(3,96)=7.96, p<0.001, η𝑝2=0.20, Mathematiklehrkräften, F(3,96)=5.64, p=0.001, η𝑝2=0.15, und Schulleitungen, F(3,96)=6.52, p<0.001, η𝑝2=0.17, mit mehr Fixationen auf die Lehrkraft und das Instruktionsmaterial als auf Schülerinnen und Schüler. Die Fixationszahl auf Schüler war höher als auf Schülerinnen, dStudierende=0.51, dLehrkräfte=0.45 und dSchulleitungen=0.29.

Fixationsdauer

Eine two-way ANOVA zeigte einen Haupteffekt von AOI, F(3,288)=8.34, p<0.001, η𝑝2=0.07. Der Haupteffekt von Expertise und der Interaktionseffekt waren nicht-signifikant. Post-hoc ANOVAs zeigten, dass die Fixationsdauer je AOI differierte bei Lehramtsstudierenden, F(3,96)=2.65, p=0.05, η𝑝2=0.08, und Mathematiklehrkräften, F(3,96)=3.47, p=0.019, η𝑝2=0.10, sowie beinahe signifikant bei Schulleitungen, F(3,96)=2.51, p=0.06, η𝑝2=0.07, mit längeren Fixationen auf die Lehrkraft und das Instruktionsmaterial als auf Schülerinnen und Schüler.

Verweildauer

Eine two-way ANOVA zeigte einen Haupteffekt von AOI, F 3,288)=20.18, p<0.001, η𝑝2=0.18. Der Haupteffekt von Expertise und der Interaktionseffekt waren nicht-signifikant. Post-hoc ANOVAs zeigten, dass die Verweildauer je AOI differierte bei Lehramtsstudierenden, F(3,96)=7.22, p<0.001, η𝑝2=0.18, Mathematiklehrkräften, F(3,96)=5.61, p=0.001, η𝑝2=0.15, sowie Schulleitungen, F(3,96)=8.92, p<0.001, η𝑝2=0.22, mit längeren Verweildauern auf die Lehrkraft und das Instruktionsmaterial als auf Schülerinnen und Schüler. Interessanterweise verweilte der Blick von Schulleitungen auf dem Instruktionsmaterial signikant kürzer als der von Lehramtsstudierenden, d=0.54 und Mathematiklehrkräften, d=0.47.

Sakkaden

Sakkdenamplitude und -dauer differierten nicht-signifikant.

 
9:00 - 10:45F9‒S24: Making video more than but a tool – Effektive Nutzung eigener, fremder und inszenierter Unterrichtsvideos in der Lehrkräfteausbildung
S24 
 

Making video more than but a tool – Effektive Nutzung eigener, fremder und inszenierter Unterrichtsvideos in der Lehrkräfteausbildung

Chair(s): Christopher Neil Prilop (Leuphana Universität Lüneburg, Deutschland), Kira Elena Weber (Leuphana Universität Lüneburg, Deutschland), Marc Kleinknecht (Leuphana Universität Lüneburg, Deutschland)

DiskutantIn(nen): Bernadette Gold (Universität Erfurt)

Ziele des Symposiums

Im Symposium werden Ergebnisse von vier videobasierten Studien im Kontext der Lehrkräfteausbildung präsentiert. In den Studien wurden authentische fremde und inszenierte Unterrichtsvideos zum Training und eigene Unterrichtsvideos zur Reflexion und zur Messung von professionellen Kompetenzen eingesetzt. Das Symposium bietet einen umfassenden Überblick über die effektive Implementierung von verschiedenen Unterrichtsvideotypen in der Lehrkräfteausbildung.

Theoretischer Hintergrund

Unterrichtsvideos werden weltweit zunehmend in der Lehrkräfteausbildung eingesetzt (Gaudin & Chaliès, 2015; Major & Watson, 2018), da sie die Komplexität von Unterrichtssituationen abbilden (Borko et al., 2009) und als situierter Stimulus dienen können, um die professionelle Kompetenz von Lehrkräften zu fördern (Seidel & Stürmer, 2014; Kersting, 2008). Des Weiteren ermöglichen sie eine eingehende Analyse, indem bestimmte Situationen wiederholt beobachtet und untersucht werden können (Sherin, 2007). In der Lehr-Lern-Forschung werden einerseits Videos des eigenen Unterrichts (eigene Videos) und andererseits Videos fremder Lehrpersonen (fremde Videos) eingesetzt um professionelle Kompetenzen von Lehrkräften zu fördern (z.B., Seidel et al., 2011; Hellermann et al., 2015; Weber et al., 2018). Fremde Videos können entweder authentischen Unterricht zeigen oder inszeniert sein (Piwowar et al., 2017). Neben videobasierten Interventionen zur Professionalisierung von Lehrkräften, werden Unterrichtsvideos zunehmend auch zur Kompetenzmessung eingesetzt (Seidel & Thiel, 2017).

Zusammenfassung der Einzelbeiträge

Im ersten Beitrag stellen Bönte, Gösch und Göbel Ergebnisse der kooperativen Videoreflexion von eigenen Unterrichtsvideos im Setting Reflective Team auf die Einstellungen in Bezug auf Feedback und den Nutzen videobasierter Reflexion auswirkt. Mit einem quasi-experimentellen Design konnten sie feststellen, dass Studierende, die eigene Unterrichtssequenzen während des Praxissemesters in Kleingruppen reflektierten, Feedback positiver einschätzten als die Experimentalgruppe ohne eigenes Video. In Bezug auf den Nutzen videobasierter Reflexion zeigten sich nur signifikant positive Entwicklungen für die Experimentalgruppe mit eigenem Video.

Im zweiten Beitrag befassen sich Prilop, Weber und Kleinknecht mit dem Effekt von Videoanalysen und ExpertInnenfeedback auf die professionelle Wahrnehmung von Klassenführung. Studierende analysierten authentische fremde Unterrichtsvideos auf einer Onlineplattform. Teilnehmende der Interventionsgruppe erhielten zusätzlich ExpertInnenfeedback im Anschluss an ihre Analysen. Mit einem Prä-Intervention-Post-Test Design konnten sie erfassen, dass ExpertInnenfeedback zu einer signifikant höheren Steigerung der professionellen Wahrnehmung bei Studierenden der Interventionsgruppe führte als bei Teilnehmenden der Kontrollgruppe ohne ExpertInnenfeedback.

Im dritten Beitrag präsentieren Wilkes, Stark, Trempler und Stark Ergebnisse einer Studie zur Förderung anwendbaren bildungswissenschaftlichen Wissens. In einem quasi-experimentellen Prä-Post-Design analysierten Lehramtsstudierende inszenierte fremde Videos, die entweder funktionale oder dysfunktionale Herangehensweisen zeigten. Studierende, die das dysfunktionale Video vor dem funktionalen analysierten, schnitten in den Anwendungsaufgaben besser ab als die funktional-dysfunktional Gruppe. Eine nicht-videobasierte Kontrollgruppe erreichte schlechtere Ergebnisse als beide Videogruppen.

Im letzten Beitrag befassen sich Weber, Greve, Brandes und Maier mit der Entwicklung der Unterrichtsqualität von Sportstudierenden während der Praxisphase. Eigene Unterrichtsvideos wurden mithilfe des CLASS K-3 geratet. Ihre Auswertungen zeigen, dass sich die Unterrichtsqualität nicht signifikant durch die Praxisphase verbesserte. Im Hinblick auf die Dimension Instructional Support stellte sich die Frage, inwiefern das CLASS K-3 Verfahren auch für die Analyse von Sportstunden anwendbar ist.

Struktur des Symposiums

Im Symposium werden Studien präsentiert, die authentische oder inszenierte fremde Videos zur Kompetenzförderung nutzten sowie Forschungsprojekte, die eigene Videos zur Professionalisierung oder Kompetenzmessung einsetzten. Während die Beiträge von Prilop et al., Weber et al. und Bönte et al. quantitative Verfahren verwendeten, wurden bei Wilkes et al. quantitative und qualitative Daten herangezogen. Bernadette Gold als Diskutantin weist umfassende Expertise im Bereich fremder und eigener Videos auf sowie bezogen auf die Entwicklung videobasierter Testinstrumente.

Wissenschaftliche Signifikanz des Symposiums

Die Studien zeigen, dass für die Einbindung von Videos in Lehrpläne, Interventionen und Testungen sorgfältig ausgewählte Kurs- und Studiendesigns erforderlich sind, um das volle Potenzial von Unterrichtsvideos auszuschöpfen. Daher ist die in diesem Symposium vorgestellte Forschung von hoher praktischer Relevanz und bietet Einblicke in die Implementierung von Unterrichtsvideos an verschiedenen Standorten.

 

Beiträge des Symposiums

 

Potentiale und Grenzen der kooperativen videogestützten Unterrichtsreflexion im Praxissemester der Lehrpersonenausbildung

Julia Bönte, Andreas Gösch, Kerstin Göbel
Universität Duisburg-Essen

Theoretischer und empirischer Hintergrund

Über die Vermittlung theoretischer Konzepte hinaus gehört die Schaffung von Möglichkeiten zur Erprobung und Weiterentwicklung von Kompetenzen zu den zentralen Zielen der Lehramtsausbildung (Oser, 2001). Dabei können „[…] Lernangebote […] zur theoriegeleiteten Reflexion von Praxisproblemen […]“ (Lersch, 2006, 175) die angehenden Lehrpersonen unterstützen, ein tieferes Verständnis der theoretischen Konzepte zu erlangen sowie gleichzeitig ihre Handlungskompetenzen zu erproben und zu festigen. Insbesondere die videogestützte Unterrichtsreflexion kann diesen Prozess vielfältig unterstützen (Göbel & Gösch, 2019).

Der Nutzen von Unterrichtsvideos in der Aus-, Fort- und Weiterbildung von Lehrkräften wurde bereits hinreichend empirisch bestätigt (u. a. Seidel & Thiel, 2017). Kooperative Reflexionsstrukturen haben sich zur Reflexionsunterstützung als besonders ertragreich erwiesen, da durch den Austausch neue Anregungen und Impulse entstehen können (Wyss, 2013). Relevant für die Ausübung professionellen Reflexionshandelns sind positive Einstellungen gegenüber der Unterrichtsreflexion (Ajzen, 1991). Da die Reflexion eigener Unterrichtsvideos mit einer hohen persönlichen Relevanz einhergeht (Kleinknecht & Schneider, 2013), scheint insbesondere in der Lehrpersonenausbildung ein sensibler Umgang mit der Reflexion von Videoaufzeichnungen wichtig. Das aus der systemischen Beratung entstammende Konzept des Reflecting Teams (Andersen, 1990) kann daher eine sinnvolle Grundlage für eine strukturierte Reflexion im kooperativen Setting bieten, um positive Einstellungen gegenüber Unterrichtsreflexion zu begünstigen (Göbel & Neuber, 2018) und die Reflexionskompetenzen der Studierenden zu entwickeln (Krieg & Kreis, 2014).

Fragestellung

Wird die kooperative Videoreflexion im Reflecting Team als ertragreich erlebt und hat sie einen Einfluss auf die Veränderung der Einstellung zum Feedback im Reflexionskontext?

Methode

In einem quasi-experimentellen Kontrollgruppendesign erhielten Praxissemesterstudierende (Experimentalgruppe mit eigenem Video: n=21, Experimentalgruppe ohne eigenes Video: n=36) Gelegenheit zur videogestützten Reflexion eigenständig durchgeführter Unterrichtsstunden. Die Reflexion über drei- bis fünfminütige Videoausschnitte, deren inhaltliche Ausrichtung eine von den Studierenden gewählte Facette von Unterrichtsqualität bildete (Helmke, 2015), erfolgte in Anlehnung an das Reflecting Team (Andersen, 1990) mit Unterstützung von Reflexionsprompts (Goeze, Hetfleisch & Schrader, 2013). Die Teilnehmenden wurden mittels Prä-Post-Fragebogenerhebung zu ihrer Einstellung zu Feedback (Behnke, 2016; Skala Feedbackkultur im Allgemeinen; α=.67) sowie zur Einschätzung des Ertrags videogestützter Reflexion (Kleinknecht, Ottinger & Schneider, 2014; Skala Ertrag von videobasierter Unterrichtsreflexion; α=.83) befragt. Die Kontrollgruppe (n=26) nahm an einem Seminar im gleichen Studienmodul mit anderem thematischen Fokus teil.

Ergebnisse

Bezüglich der Einstellung zu Feedback ergab die RM-ANOVA keine signifikanten Haupteffekte für Zeit (F(1.00, 65.00)=0.760, p=.386) und Gruppe (F(1.00, 65.00)=0.773, p=.466), jedoch einen signifikanten Interaktionseffekt zwischen Zeit und Gruppe (F(2.00, 65.00)=3.613, p=.033, partielles η²=.10). Die Einstellung zu Feedback stieg in der Experimentalgruppe mit eigenem Video deutlich stärker an als in den anderen beiden Gruppen (Mprä=3.40, SDprä=0.36; Mpost=3.57, SDpost=0.24). In der EG ohne eigenes Video sowie in der Kontrollgruppe fand keine signifikante Veränderung statt.

Für den empfundenen Ertrag von videobasierter Unterrichtsreflexion ergab die RM-ANOVA keinen signifikanten Haupteffekt für Zeit (F(1.00, 45.00)=1.295, p=.261), jedoch einen signifikanten Haupteffekt für die beiden Experimentalgruppen (F(1.00, 45.00)=19.163, p<.001, η²=.06) sowie einen signifikanten Interaktionseffekt (Signifikanz auf 10%-Niveau) zwischen Zeit und Gruppe (F(1.00, 45.00)=3.017, p=.087, η²=.07). In der EG mit eigenem Video veränderte sich die Bewertung des Ertrags von videobasierter Unterrichtsreflexion positiv, die Veränderungsanalyse zeigte signifikante Ergebnisse für diese Gruppe (Mprä=3.16, SDprä=0.42; Mpost=3.36, SDpost=0.39). In der EG ohne eigenes Video fand keine signifikante Veränderung statt.

Die Ergebnisse weisen insgesamt auf eine positivere Entwicklung der Reflexionseinstellung von Studierenden mit eigenem Unterrichtsvideo hin, gerade diese Gruppe profitiert von dem eingesetzten Reflexionssetting. Mittels größerer Stichproben sollen weitere Analysen zur Wirksamkeitsprüfung erfolgen. Zudem sollen weitere qualitative Analysen erfolgen, um die Reflexionsqualität im Reflexionsprozess vertiefend zu untersuchen.

 

Förderung der professionellen Wahrnehmung von Klassenführung von Lehramtsstudierenden durch online Videoanalyse und Expertenfeedback

Christopher Neil Prilop, Kira Elena Weber, Marc Kleinknecht
Leuphana Universität Lüneburg

Theoretischer Hintergrund

Effektive Klassenführung hat einen bedeutenden Einfluss auf die kognitiven, affektiven und motivationalen Ergebnisse von SchülerInnen (Hattie, 2009). Produktive Klassenführung zeichnet sich durch eine Lernumgebung aus, die einen hohen Anteil von time-on-task gewährleistet (Evertson & Emmer, 2012; Gold & Holodynski, 2017). Um solche Lernumgebungen aufrechtzuerhalten, benötigen Lehrkräfte professionelle Wahrnehmung von Klassenführung (PWKF; van Es & Sherin, 2002). PWKF umfasst die Fähigkeit, klassenführungsrelevante Ereignisse im Unterricht erkennen und interpretieren zu können (Hellermann et al., 2015). Bisherige Studien konnten zeigen, dass Lehramtsstudierende ihre PWKF durch die Analyse fremder und eigener Unterrichtsvideos im Rahmen universitärer Trainings verbessern können (Gold et al., 2013; Hellermann et al., 2015; Weber et al., 2018). Obwohl eine Kombination eigener und fremder Videos die PWKF von Lehramtsstudierenden am wirksamsten zu fördern scheint, wird der Einsatz eigener Videos durch strikten Datenschutz und hohen organisatorischen Aufwand eingeschränkt (Prilop et al., 2020). Fremde Videos können daher umfassender in Seminare und Fortbildungen eingebunden werden. Fadde und Sullivan (2013) und Weber et al. (2018) konnten aufzeigen, dass die Wirkung fremder und eigener Videos durch ExpertInnenfeedback erhöht werden konnte. Die vorliegende Studie untersucht daher in einem Prä-Post-Kontrollgruppendesign folgende Fragestellung:

Inwiefern verbessern Lehramtsstudierende ihre professionelle Wahrnehmung von Klassenführung durch Videoanalyse fremder Unterrichtsvideos in einer online Lernumgebung, die entweder ExpertInnenfeedback beinhaltet (Interventionsgruppe: IG) oder kein ExpertInnenfeedback bietet (Kontrollgruppe: KG)?

Methode

Die Intervention wurde mit 54 Lehramtsstudierenden im vierten Mastersemester durchgeführt. Die Studierenden nahmen an zwei identischen blended learning Seminaren zur Videobasierten Professionalisierung von Lehrkräften teil. Im Seminar analysieren die Studierenden Unterrichtssequenzen fremder Lehrpersonen in Bezug auf Facetten der Klassenführung (Monitoring/ Strukturierung/ Regeln und Routinen). Die Videoanalysen fanden auf der online Lernplattform Moodle während der Präsenzsitzungen statt. In beiden Seminaren wurden Studierende zufällig der IG bzw. KG zugeordnet. Auf die schriftlichen Analysen erhielten die Studierenden der IG (n=25) online Feedback von der Seminarleitung (Expertenfeedback), während die KG (n=29) kein Feedback erhielt.

Die PWKF wurde mithilfe eines standardisierten, videobasierten Tests gemessen (Gold & Holodynski, 2017). Neben einer allgemeinen PWKF wurden die Facetten Monitoring, Strukturierung und Regeln und Routinen erfasst.

Ergebnisse

Varianzanalysen und multivariate Varianzanalysen zeigten, dass die Kontrollgruppe sich nicht signifikant in Bezug auf die PWKF verbesserte, Wilks‘ Lambda: KG, F(3,26)=2.407, p=.09, ηp2=0.22, während die Interventionsgruppe signifikante Verbesserungen der PWKF, F(1,24)=19.247, p<.001, ηp2=0.45, und der Facetten Monitoring, F(1,24)=7.953, p=.009, ηp2=0.25, Strukturierung, F(1,24)=14.755, p<.001, ηp2=0.38, und Regeln und Routinen, F(1,24)=15.945, p<.001, ηp2=0.40, aufwies. Des Weiteren zeigte sich ein signifikanter Interaktionseffekt (Zeit x Gruppe) für die Facette Regeln und Routinen, F(1,52)=4.618, p=.036, ηp2=0.08. Demnach verbesserten sich Studierende, die ExpertInnenfeedback erhielten, signifikant mehr als Teilnehmende der KG.

Diskussion

Konträr zu vorherigen Studien (Gold et al., 2013) verbesserte sich die PWKF nicht in der Gruppe, die ohne ExpertInnenfeedback fremde Videos analysierte. Dies kann einerseits auf die kürzere Gesamtzeit an Videoanalysen zurückgeführt werden und andererseits den Videotyp. In der Studie von Gold et al. (2013) analysierten Studierende eine größere Anzahl an fremden Videos und auch Videos, die gesamte Stunden wiedergaben. Insbesondere die Analyse von gesamten Unterrichtsstunden könnte ein höheres Maß an Komplexität bieten, die für die Entwicklung von PWKF notwendig ist (Sherin et al., 2009). Des Weiteren zeigte sich, dass ExpertInnenfeedback zu einer höheren Steigerung von PWKF führte. Dies bestätigt die Ergebnisse von Fadde und Sullivan (2013) und Weber et al. (2018). Da ExpertInnen relevante Klassenführungssituationen effektiver wahrnehmen (Wolff et al., 2015), können sie Lehramtsstudierende gezielt auf entscheidende Situationen hinweisen. ExpertInnenfeedback kann somit als “specific lens for observing and analyzing” (Santagata & Angelici, 2010, S. 346) aufgefasst werden.

Insgesamt zeigte unsere Studie, dass ExpertInnenfeedback die Effektivität fremder Unterrichtsvideos steigern lässt. Unsere Studie deutet darauf hin, dass konkretes, personalisiertes Feedback verstärkt in die universitäre Lehre eingebunden werden sollte.

 

Videobasiertes advokatorisches Lernen aus Fehlern – ein Ansatz zur Förderung anwendbaren bildungswissenschaftlichen Wissens bei Lehramtsstudierenden

Theresa Wilkes1, Lisa Stark1, Kati Trempler2, Robin Stark1
1Universität des Saarlandes, 2Bergische Universität Wuppertal

Theoretischer Hintergrund

Der Begriff der Evidenzorientierung hat im bildungswissenschaftlichen Sektor an Bedeutung gewonnen (Stark, 2017). Die Fähigkeit von Lehrkräften, bildungswissenschaftliches Wissen anzuwenden, wird als wichtiger Teil ihrer professionellen Kompetenz angesehen (Baumert & Kunter, 2006; KMK, 2014). Allerdings zeigen Lehramtsstudierende und erfahrene Lehrkräfte Schwierigkeiten bei der Anwendung bildungswissenschaftlichen Wissens (z.B. Hetmanek et al., 2015): Sie besitzen träges Wissen (Renkl, 2018). Um dieser Problematik entgegenzuwirken bzw. die Wissensanwendung in diesem Feld zu fördern, sollten in der universitären Lehramtsausbildung instruktionale Ansätze herangezogen werden, die bildungswissenschaftliche Theorien und Forschungsergebnisse mit der Schulpraxis verknüpfen. Vielversprechend erscheint hier eine Integration von Konzepten wie dem advokatorischen Lernen aus Fehlern (Oser et al., 2012; Oser, Hascher & Spychiger, 1999) und situiertem, fallbasiertem Lernen mittels inszenierten Unterrichtsvideos (scripted videos; Piwowar et al., 2017). Inszenierte Unterrichtsvideos ermöglichen die Darstellung eines funktionalen und eines dysfunktionalen Verlaufs derselben Unterrichtssituation und dabei die exemplarische Anwendung bildungswissenschaftlicher Evidenz im konkreten Handlungskontext (ebd.). Beim videobasierten advokatorischen Lernen aus Fehlern lernen die Studierenden aus Fehlern einer Lehrkraft bzw. eines Videomodells, indem sie unter Berücksichtigung ihres bildungswissenschaftlichen Wissens (1) “Fehler”, das heißt für den Unterrichtsverlauf dysfunktionale Handlungsweisen erkennen, (2) diese durch die Kontrastierung mit funktionalen Handlungsweisen rekonstruieren und (3) Unterschiede zwischen beiden reflektieren (Oser, 2007; Oser & Spychiger, 2005). Ausgehend von der Kritik am Lernen aus Fehlern, dass dysfunktionale Handlungsmöglichkeiten elaboriert und nicht durch funktionale „überschrieben“ werden könnten (siehe Mecalfe, 2017), stellt sich die Frage, ob anstelle des dysfunktionalen zunächst der funktionale Verlauf präsentiert werden sollte. Diese Fragestellung steht im Zentrum der hier dargestellten Studie. Untersucht werden mögliche Reihenfolgeeffekte sowie Effekte videobasierten advokatorischen Lernens aus Fehlern generell auf die Anwendung bildungswissenschaftlichen Wissens.

Methode

In einer Interventionsstudie mit einem einfaktoriellen dreistufigen quasi-experimentellen Prä-Post-Design bearbeiteten N=153 Lehramtsstudierende eine Lernumgebung zum Classroom Management (CM), in der neben Lernmaterial zum CM ein dysfunktionales und ein funktionales Unterrichtsvideo (Freie Universität Berlin, 2018) eingesetzt wurden. Die Gruppe dys-fun (N=53) analysierte zunächst das dysfunktionale Video und kontrastierte dieses mit dem funktionalen. Bei der Gruppe fun-dys (N=55) war die Reihenfolge umgekehrt. Instruktionale Unterstützung der Videoanalysen (Barth et al., 2019) wurde in beiden Gruppen durch dieselben Reflexions- und Kontrastierungsprompts gewährleistet, welche auf der Theorie des Lernen aus Fehlern (Oser, 2007), dem Modell der Theorieanwendung (Beck & Krapp, 2006), den Schritten der professionellen Unterrichtswahrnehmung (Sherin & van Es, 2009) sowie der Skripttheorie (Fischer et al. 2013) basierten. Die Kontrollgruppe th (N=45) erhielt nur das Lernmaterial zum CM, aber keine Videopräsentation.

Ergebnisse

Entsprechend unserer Hypothese (dys-fun>fun-dys>th) ergab eine ANOVA signifikante Unterschiede (F(2,150)= 59.42, p<.001, η2p=.429) in der Wissensanwendung (6 Posttest-Aufgaben; max. 28 Punkte; α= .73). Bonferroni-korrigierte Post-hoc-Tests ergaben signifikante Unterschiede zwischen den einzelnen Gruppen (alle p<.001). Die Gruppe dys-fun (M=14.24, SD=3.41) schnitt in den Anwendungsaufgaben besser ab als fun-dys (M=10.69, SD=3.0); th (M=6.81, SD=3.69) zeigte eine schlechtere Leistung als dys-fun sowie fun-dys.

Diskussion

Die Überlegenheit von videobasiertem advokatorischen Lernen aus Fehlern gegenüber nicht videobasiertem, „traditionellem“ Lernen könnte dadurch erklärt werden, dass die Videos die theoretischen Konzepte anschaulich illustrierten sowie Anwendungsmöglichkeiten spezifizierten (Stark et al., 2002). Erste inhaltsanalytische Auswertungen der Prozessdaten weisen darauf hin, dass insbesondere das dysfunktionale Video und die Kontrastierung mit dem funktionalen zu Selbsterklärungen und einer tieferen Verarbeitung beitrugen (Durkin & Rittle-Johnson, 2012). Die Überlegenheit der Reihenfolge dys-fun gegenüber fun-dys könnte auf die Entstehung eines kognitiven Konflikts nach der Beschäftigung mit dem Lernmaterial hindeuten, der durch die Kontrastierung mit dem funktionalen Handeln aufgelöst wurde (Piaget, 1986). Bei fun-dys könnten im Gegenzug Verstehensillusionen verursacht worden sein (Glenberg, Wilkinson & Epstein, 1982). Insgesamt ließ die Studie keine Anhaltspunkte für eine Kritik am Lernen aus Fehlern erkennen. Speziell videobasiertes advokatorisches Lernen aus Fehlern scheint ein vielversprechender Ansatz im Kontext einer evidenzorientierten Lehramtsausbildung zu sein.

 

Wie entwickelt sich die Unterrichtsqualität von Lehramtsstudierenden während der Praxisphase – Eine videobasierte Analyse mit dem CLASS-PRE-K-3

Kira Elena Weber1, Steffen Greve1, Björn Brandes2, Jessica Maier3
1Leuphana Universität Lüneburg, 2Universität Osnabrück, 3Universität Hamburg

Theoretischer Hintergrund

Fächerübergreifend werden drei Basisdimensionen der Unterrichtsqualität unterschieden, die sich auf Klassenführung, kognitive Aktivierung und emotionale Unterstützung beziehen (Klieme & Rackoczy, 2008; Pianta & Hamre, 2009). In der universitären Lehramtsausbildung sollen insbesondere schulpraktische Phasen dazu beitragen, den Erwerb dieser unterrichtlichen Kompetenzen zu fördern (Gröschner et al., 2015). Bisherige Studien zur Wirksamkeit von Praxisphasen fokussieren jedoch zumeist selbsteingeschätzte Kompetenzen und professionelles Wissen. Entsprechend existieren bislang nur wenige empirische Befunde, die überprüfen, inwiefern Praxisphasen das konkrete unterrichtliche Handeln von Lehramtsstudierenden verbessern (Gröschner, Klaß & Dehne, 2018). Die vorliegende Studie begegnet diesem Forschungsdesiderat und analysiert, ob und in welchen Bereichen sich das Handeln von Lehramtsstudierenden im Fach Sport während der Praxisphase verändert. Um Unterrichtsqualität beurteilen zu können, bieten sich hoch-inferente videobasierte Analysen des Unterrichts an (Lotz, Gabriel & Lipowsky, 2013). Ein im internationalen Raum etabliertes Verfahren stellt das Classroom Assessment Scoring System (CLASS) von Pianta, La Paro und Hamre (2008) dar.

Methode

Die Stichprobe umfasste 11 Sportstudierende (Malter = 23.85, SDalter = 1.68) die eine 16wöchige Praxisphase im zweiten Mastersemester durchliefen. Die Studierenden erhielten drei Beratungsbesuche im Fach Sport. Es wurden je drei Unterrichtsstunden vor dem ersten Besuch und drei Unterrichtsstunden nach dem letzten Unterrichtsbesuch gefilmt und mit CLASS K-3 (Pianta, La Paro & Hamre, 2008) ausgewertet. CLASS bezieht sich auf die drei Basisdimensionen von Unterrichtsqualität und umfasst verschiedene Subdimensionen (siehe Tabelle 1). Die Videos wurden anhand einer 7-stufigen Ratingskala (1-2 = niedrig, 3-5 = mittlerer range, 6-7 = hoch; Pianta et al., 2008) von zwei lizensierten CLASS RaterInnen unabhängig voneinander geratet. Als Reliabilitätsindikator wurde der PWO (percent-within-one) verwendet (Pianta et al., 2008). Danach gelten Werte von +/- 1 als übereinstimmend. Ein Ratingcyle besteht aus zwanzigminütigen Beobachtungsphasen (live oder videobasiert) und einer zehnminütigen Rating Phase. Der PWO wurde für jeden Cycle einzeln berechnet: 82%-100% (Cycle 1),73%-100% (Cycle 2),91%-100% (Cycle 3),73%-100% (Cycle 4),82%-100% (Cycle 5) und 91%-100% (Cycle 6).

Ergebnisse

Unsere Ergebnisse zeigen, dass sich die Unterrichtsqualität der Studierenden nicht durch die Praxisphase verändert. Signifikante Verbesserungen zeigten sich nur in der Subdimension Negative Climate, t(10)=5.93, p <.001. Die Studierenden erreichen in ihrer Klassenführung und ihrer emotionalen Unterstützung bereits zu Beginn des Praktikums Werte im hohen mittleren Bereich (Klassenführung zu T1: M = 4.85, SD = .22 und zu T2: M = 4.90, SD = .47; Emotionale Unterstützung zu T1: M = 4.84, SD = .27 und zu T2: M = 4.97, SD = .47). Die Werte für kognitive Aktivierung liegen hingegen im niedrigen Bereich (T1: M = 1.85, SD = .38 und zu T2: M = 1.81, SD = .37).

Diskussion

Die Praktikumsbegleitung ist darauf ausgerichtet, insbesondere die Planungs- und Reflexionskompetenz der Lehramtsstudierenden zu fördern. Zudem handelt es sich bei der Praxisphase um ein Fachpraktikum, sodass in den Unterrichtsnachgesprächen vorranging fachliche Inhalte besprochen werden. Die nicht signifikanten Veränderungen ließen sich hierdurch erklären. Die signifikante Verbesserung bei Negative Climate könnte daran liegen, dass die Studierenden während ihrer ersten eigenen Unterrichtsstunden angespannter waren als am Ende des Praktikums. Im Vergleich zu Studien mit erfahrenen Lehrkräften (Pianta et al., 2008; Longobardi et al., 2018) sind die Ergebnisse in den Dimensionen Klassenführung und emotionale Unterstützung vergleichbar (Werte im oberen mittleren Bereich). Für die Dimension kognitive Aktivierung gibt es bislang keine Studien mit Sportlehrkräften, sodass die Ergebnisse unserer Studie nicht mit anderen vergleichbar sind. Obwohl CLASS fächerübergreifend einsetzbar ist, stellt sich die Frage, ob das Ratingverfahren auch im Hinblick auf diese Dimension für die Analyse von Sportunterricht geeignet ist. Auf der Konferenz werden diese Aspekte vertiefend diskutiert.

 
9:00 - 10:45F9‒S25: Struktur und Determinanten von fachspezifischem Engagement
S25 
 

Struktur und Determinanten von fachspezifischem Engagement

Chair(s): Franziska Templer (Pädagogische Hochschule Bern, Schweiz), Miriam Weich (Pädagogische Hochschule Bern, Schweiz)

DiskutantIn(nen): Diana Raufelder (Universität Greifswald)

Wie sehr sich Schülerinnen und Schüler in einem Schulfach engagieren, wirkt sich beträchtlich auf ihre fachspezifischen Leistungen und Laufbahnentscheidungen aus (Lent et al., 2008; Sinatra, Heddy, & Lombardi, 2015; Wang, Fredricks, Ye, Hofkens, & Linn, 2016). Da Engagement veränderbar ist und durch entsprechende Interventionen im Schulunterricht erhöht werden kann, rückt das Konstrukt zunehmend ins Blickfeld der Forschung (Appleton, Christenson, & Furlong, 2008; Kelly & Zhang, 2016; Wang & Degol, 2014). Verstanden wird es als multidimensionales Konstrukt, das aus einer emotionalen, verhaltensbezogenen und kognitiven Komponente besteht (Fredricks, Blumenfeld, & Paris, 2004). Die emotionale Komponente umfasst affektive Reaktionen, wie zum Beispiel Freude oder Interesse gegenüber einem Lerngegenstand bzw. Schulfach (Linnenbrink-Garcia & Pekrun, 2011). Die kognitive Dimension beinhaltet Selbstregulationsstrategien, wie zum Beispiel selbständige Zieldefinitionen oder das „Dranbleiben“ an herausfordernden Aufgaben (Zimmerman, 1990). Die verhaltensbezogene Dimension bezieht sich auf die aktive Teilhabe an Lernaufgaben, zum Beispiel durch Anstrengung, Persistenz und Aufmerksamkeit (Sinatra et al., 2015; Skinner, 2016). Schulfachbezogen wurden diese Dimensionen insbesondere für das Fach Mathematik nachgewiesen (Wang et al., 2016). Weniger weiss man hingegen über die Struktur von Engagement in anderen Fächern, keine Befunde gibt es zum strukturellen Zusammenspiel der Dimensionen, wenn man mehrere Fächer gleichzeitig betrachtet. Da fachspezifisches Engagement bislang immer nur auf ein Fach bezogen untersucht wurde, fehlen bislang zudem Erkenntnisse, ob das Engagement in Schulfächern eher durch fachspezifische oder fachunspezifische Faktoren determiniert ist. Ferner ist der empirische Zusammenhang zwischen Motivation und Engagement an vielen Stellen noch unklar (Sinatra et al., 2015; Wang & Degol, 2014).

Das geplante Symposium greift diese Forschungsdesiderate auf mit dem Ziel, Erkenntnisse zur Struktur und zur Fachspezifität von Engagement zu gewinnen und Zusammenhänge mit motivationalen Variablen zu analysieren. Die Beiträge setzen unterschiedliche, etablierte Instrumente zur Messung von Engagement ein. Im Fokus steht nicht nur Mathematik, sondern auch das Fach Deutsch, das im Hinblick auf Engagement noch kaum untersucht wurde.

Im ersten Beitrag („Fachspezifisches und Fachunspezifisches im Engagement von Schülerinnen und Schülern in Mathematik und Deutsch“) untersuchen Weich, Göllner, Trautwein und Stalder die faktorielle Struktur von Engagement in den Fächern Mathematik und Deutsch. Ferner trennen sie im emotionalen, kognitiven und verhaltensbezogenen Engagement beider Fächer jeweils fachspezifische und fachübergreifende Anteile voneinander und untersuchen die zeitliche Konsistenz der jeweiligen Anteile. Engagement wird mit dem Selbstberichtsinstrument von Wang et al. (2016) erhoben.

Im zweiten Beitrag („Fachspezifisches und fachunspezifisches Engagement von Schülerinnen und Schülern: Eine Analyse auf Schüler- und Klassenebene“) analysieren Göllner, Jaekel und Trautwein die faktorielle Struktur von Engagement in den Fächern Deutsch und Mathematik einerseits auf individueller, andererseits auf Klassenebene. Dabei separieren sie fachspezifische und fachunspezifische Anteile auf beiden Ebenen. Engagement wird mit dem Selbstberichtsinstrument von Fredricks et al. (2005) gemessen.

Im dritten Beitrag („Reziproke Effekte zwischen der selbstbestimmten Motivation im Mathematikunterricht und dem Lernverhalten“) untersuchen Augustin und Hascher die Wechselwirkung von motivationalen Variablen und Lernverhaltensindikatoren (Anstrengung, Unaufmerksamkeit und Prokrastination) im Fach Mathematik. Diese Indikatoren können als spezifische Ausprägungsformen von verhaltensbezogenem Engagement aufgefasst werden (Skinner, 2016).

Alle drei Beiträge untersuchen Determinanten von fachspezifischem Engagement. Beiträge 1 und 2 konzentrieren sich auf fachspezifische versus -unspezifische Anteile in den drei Engagementdimensionen. Darauf aufbauend untersuchen sie die zeitliche Konsistenz dieser Anteile (Beitrag 1) bzw. Unterschiede in der faktoriellen Struktur auf Schüler- und Klassenebene (Beitrag 2). Beitrag 3 fokussiert auf den reziproken Zusammenhang zwischen verhaltensbezogenem Engagement und motivationalen Variablen. Insgesamt leistet das Symposium einen Beitrag zur Schliessung wesentlicher Forschungslücken im Forschungsfeld zu Engagement. Daraus lassen sich neue Erkenntnisse ableiten, wie fachspezifische Leistungen im Schulunterricht verbessert werden können.

 

Beiträge des Symposiums

 

Fachspezifisches und Fachunspezifisches im Engagement von Schülerinnen und Schülern in Mathematik und Deutsch

Miriam Weich1, Richard Göllner2, Ulrich Trautwein2, Barbara Stalder1
1Pädagogische Hochschule Bern, Schweiz, 2Hector-Institut für Empirische Bildungsforschung, Eberhard Karls Universität Tübingen

Theorie und Fragestellung

Engagement gilt als Schlüsselvariable zur Erklärung von schulischem Erfolg (Fredricks, Blumenfeld, & Paris, 2004; Wang, Fredricks, Ye, Hofkens, & Linn, 2016): Engagierte Schülerinnen und Schüler haben eine positive Einstellung gegenüber dem Lerngegenstand (emotionale Dimension), regulieren ihr Lernen selbstständig, wollen komplexe Konzepte verstehen (kognitive Dimension), arbeiten konzentriert und beteiligen sich am Unterricht (verhaltensbezogene Dimension; Fredricks et al., 2004; Wang & Eccles, 2012). Ausgehend von Forschungen zum globalen schulbezogenen Engagement eines Schülers bzw. einer Schülerin (e.g. Fredricks et al., 2004; Li & Lerner, 2011) beschäftigen sich zunehmend mehr Studien mit fachspezifischem Engagement (e.g. Fredricks, Hofkens, Wang, Mortenson, & Scott, 2017; Kelly & Zhang, 2016; Wang et al., 2016). Allerdings wird hier zumeist nur ein Fach untersucht, sodass das Engagement per se als fachspezifisch gilt und fachübergreifende Komponenten nicht berücksichtigt werden. Man kann jedoch davon ausgehen, dass die einzelnen Dimensionen auch fachübergreifende Komponenten beinhalten. Metakognitionen als Teil von kognitivem Engagement (Fredricks & McColskey, 2012) oder Persistenz als Teil von verhaltensbezogenem Engagement (Skinner, 2016) sind beispielsweise nicht rein fachgebunden (Constantin, Holman, & Hojbotă, 2011; Sinatra, Heddy, & Lombardi, 2015). Sind also eher diese fachübergreifenden oder eher fachspezifische Faktoren für fachspezifisches Engagement konstitutiv? Existieren Unterschiede zwischen den Fächern? Bislang fehlen Befunde hierzu.

Ziel der Studie ist zu untersuchen, inwieweit sich das Engagement von Schülerinnen und Schülern (9. Klassenstufe) in Deutsch und Mathematik anhand der drei Engagementdimensionen beschreiben lässt und ob es zudem fachspezifische als auch fachunspezifische Anteile aufweist. Hierzu prüfen wir (1) die faktorielle Struktur eines bekannten Instrumentes zu Erfassung von fachspezifischem Engagement, (2) separieren für die resultierenden Dimensionen fachspezifische und fachunspezifische Anteile und (3) prüfen die zeitliche Konsistenz der Anteile über den Verlauf des Schuljahres.

Methode

Im Rahmen der Studie wurden Schülerinnen und Schüler aller deutschsprachigen Gymnasien im Kanton Bern zu Beginn und am Ende des 9. Schuljahres (= erstes Gymnasialjahr) 2017/18 vor Ort online befragt. Dafür standen reguläre Unterrichtslektionen zur Verfügung. Die Stichprobe bestand aus 1.482 Schülerinnen und Schülern (57% weiblich, 91% in der Schweiz geboren). Das fachspezifische Enga-gement in Mathematik und Deutsch wurde jeweils mit 5 (kognitiv), 4 (verhaltensbezogen) bzw. 3 (emo-tional) Items erfasst (vgl. Wang et al., 2016).

Zur Beantwortung unserer Fragestellungen berechneten wir zunächst für beide Messzeitpunkte kon-firmatorische Faktorenanalysen mit jeweils drei korrelierten latenten Faktoren (kognitives, verhaltens-bezogenes, emotionales Engagement) pro Fach. Anschließend wurden zur Trennung fachübergreifender und fachspezifischer Anteile zu beiden Messzeitpunkten jeweils bifaktorielle Modelle eingesetzt. Diese bestanden aus drei korrelierten fachunspezifischen latenten Faktoren (kognitive, verhaltensbezogene, emotionale Dimension) sowie pro Dimension aus zwei spezifisch unkorrelierten fachspezifischen latenten Faktoren (Mathematik, Deutsch). Die Analyse beider Messzeitpunkte erfolgte im Rahmen eines Analysemodells.

Ergebnisse

(1) Das Engagement weist erwartungsgemäss in Deutsch und Mathematik jeweils drei Dimensionen auf (Fit Modell dreidimensional: 𝜒² = 2601.763***; df = 973; RMSEA = .038; SRMR = .053; CFI = .924; TLI = .912; Fit Modell eindimensional: 𝜒² = 6498.439***; df = 1033; RMSEA = .067; SRMR = .088; CFI = .746; TLI = .722). Es besteht metrische Invarianz über die Zeit. (2) Alle Dimensionen besitzen fachspezifische und fachunspezifische Anteile (𝜒² = 2222.585***; df = 939; RMSEA = .036; SRMR = .051; CFI = .935; TLI = .922). Mittelt man die Anteile der Items pro Dimension, zeigt sich: Die verhaltensbezogene Dimension ist am fachunspezifischsten (MZP1 - Mathe/Deutsch unspezifisch: 33%/37%; spezifisch: 23%/17%), die emotionale am fachspezifischsten (MZP1 - Mathe/Deutsch unspezifisch: 7%/13%; spezifisch: 63%/48%), die Fachspezifität bei der kognitiven Dimension ist fachabhängig (MZP1 - Mathe/Deutsch unspezifisch: 13%/20%; spezifisch: 22%/6%). (3) Die Fachspezifität von Engagement nimmt während des ersten Gymnasialjahres zu (MZP2 - verhaltensbezogen Mathe/Deutsch unspezifisch: 27%/25%; spezifisch: 30%/30%; emotional Mathe/Deutsch unspezifisch: 7%/7%; spezifisch: 62%/50%), ausgenommen kognitives Engagement in Deutsch (MZP2 - Mathe/Deutsch unspezifisch: 12%/30%; spezifisch: 31%/2%).

 

Fachspezifisches und fachunspezifisches Engagement von Schülerinnen und Schülern: Eine Analyse auf Schüler- und Klassenebene

Richard Göllner, Ann-Kathrin Jaekel, Ulrich Trautwein
Hector-Institut für Empirische Bildungsforschung, Eberhard Karls Universität Tübingen

Theoretischer Hintergrund

Das schulische Engagement von Schülerinnen und Schülern gehört zu den zentralen Bestimmungsgrößen einer erfolgreichen Schullaufbahn (z.B. Wang & Eccles, 2012; Weich & Stalder, in press). Entsprechend gilt Engagement als eine wichtige Prozessgröße, um die relevanten Determinanten des Lernens auf Seiten des Fachunterrichts zu identifizieren sowie deren Konsequenzen für das Lernen von Schülerinnen und Schülern besser zu verstehen (z.B. Konold, Cornell, Jia & Malone, 2018). Allerdings sind zentrale Fragen zu Erfassung des schulischen Engagements und seiner Fachspezifität nach wie vor nur teilweise geklärt. Insbesondere ist offen, inwiefern sich die bereits bekannten Engagementdimensionen (verhaltensbezogen, emotional und kognitiv) nicht nur als individuelle Merkmale von Schülerinnen und Schülern manifestieren, sondern auch als Klassenmerkmale fungieren und inwieweit sich fachspezifische und fachunspezifische Anteile des Engagements nachweisen lassen.

Fragestellung

Folgende Fragestellungen sollen im Rahmen der Untersuchung beantwortet werden:

1. Erstens soll geprüft werden, inwieweit sich mit dem verhaltensbezogenen, kognitiven und emotionalen Engagement drei Dimensionen in Deutsch und Mathematik hinreichend gut unterscheiden lassen.

2. Zweitens wird untersucht, inwieweit das Engagement in beiden Fächern nicht nur ein individuelles Merkmal von Schülerinnen und Schülern ist, sondern ebenso zwischen Klassen variiert.

3. Schließlich soll geprüft werden, inwieweit auf Schüler-und Klassenebene sowohl fachspezifische als auch fachunspezifische Anteile des Engagements in beiden Fächern identifiziert werden können.

Methode

Grundlage der Untersuchung sind Daten des ersten Messzeitpunktes der Unterrichtsstudie „Unterricht aus Schülersicht“ (UNITAS), die im Frühjahr/Sommer 2018 und 2019 durchgeführt wurde. Im Rahmen der Untersuchung wurden N = 6.479 Schülerinnen und Schüler (K = 401 Klassen) der fünften bis zehnten Klassenstufe an 27 allgemeinbildenden Schulen in Baden-Württemberg zum Unterricht in Mathematik und Deutsch befragt. Zur Erfassung des schulischen Engagements von Schülerinnen und Schülern diente ein etabliertes Fragebogeninstrument von Fredricks und Kollegen (Fredricks, Phyllis, Friedel & Paris, 2005)), das mit dem verhaltensbezogenen (z.B. sich an Regeln halten), dem emotionalen (z.B. Aufgaben im Unterricht interessant finden) und dem kognitiven Engagement (z.B. Aufgaben im Unterricht auf Fehler überprüfen) drei bekannte Engagementdimensionen unterscheidet. Auf der Grundlage der Einzelitems wurden konfirmatorische Mehrebenenfaktoranalysen angewendet, um (a) die faktorielle Struktur in beiden Fächern auf Schülerebene, (b) die faktorielle Struktur in beiden Fächern auf Klassenebene und (c) fachspezifisches und fachunspezifisches Engagement auf beiden Analyseebenen zu untersuchen. Zur Analyse der Fachspezifität wurden Bi-Faktormodelle verwendet.

Ergebnisse und Diskussion

Die Ergebnisse der Faktorenanalysen zeigten, dass auf Schülerebene alle drei Engagementdimensionen in beiden Fächern empirisch trennbar sind (𝜒²(777) = 5,111.55, p < .001, CFI = .95, TLI = .95, RMSEA = .03, SRMRinnerhalb = .04). Die Faktorinterkorrelationen lagen zwischen .48 ≤ r ≤ .67 innerhalb beider Fächer und zwischen .17 ≤ r ≤ .65 zwischen beiden Fächern. Demgegenüber zeigte das Modell auf Klassenebene eine weniger gute Passung (SRMRzwischen = .12), wobei dies in erster Linie auf eine vergleichsweise geringe Variation des kognitiven Engagements (Mathematik: ICC(1) = .05; Deutsch: ICC(1) = .08) zurückzuführen war. Demgegenüber zeigte das verhaltensbezogene (Mathematik: ICC(1) = .14; Deutsch: ICC(1) = .14) und das emotionale Engagement (Mathematik: ICC(1) = .16; Deutsch: ICC(1) = .19) eine substantiellere Variation zwischen Klassen. Zudem konnten auf der Schülerebene für alle drei Dimensionen fachspezifische und fachunspezifische Anteile des schulischen Engagements gefunden werden, wobei sich für das emotionale Engagement die höchsten fachspezifischen Anteile ergaben. Schließlich konnten für das emotionale Engagement auch auf Klassenebene fachspezifische und geringe fachunspezifische Anteile gefunden werden. Für das verhaltensbezogene und kognitive Engagement waren lediglich fachunspezifische Anteile nachweisbar. Zusammenfassend zeigen die Ergebnisse, dass das schulische Engagement ein durchaus hohes Maß an Fachspezifität aufweist und mit Ausnahme des kognitiven Engagements auch in erheblicher Weise zwischen Klassen variiert.

 

Reziproke Effekte zwischen der selbstbestimmten Motivation im Mathematikunterricht und dem Lernverhalten

Tanja Augustin, Tina Hascher
Universität Bern

Mit Motivation wird «die aktivierende Ausrichtung des momentanen Lebensvollzugs auf einen positiv bewertenden Zielzustand» beschrieben (Rheinberg, 2008, S. 16). Motivation für ein Verhalten wird dabei von personen- und situationsbezogenen Einflüssen, den antizipierten Handlungsergebnissen und deren Folgen geprägt (Heckhausen & Heckhausen, 2006). Sie kann daher als die treibende Kraft für das Lernen gesehen werden, welche von situativen Anreizen, persönlichen Präferenzen und deren Wechselwirkungen abhängt (Dresel, 2004). Entsprechend beeinflusst die Motivation das Lernverhalten von Schülerinnen und Schüler und wirkt sich auf ihre Leistungen aus. Diese Wirkungskette wurde bereits in diversen Studien nachgewiesen (z.B. Baker & Wigfield, 1999; Reeve, Jang, Carrell, Jeon, & Barch, 2004; Vallerand & Bissonnette, 1992; Vansteenkiste, Timmermans, Lens, Soenens, & Van den Broeck, 2008).

Motivation kann jedoch unterschiedliche Formen annehmen. Die Selbstbestimmungstheorie sieht die drei Grundbedürfnisse nach Autonomie, Kompetenz und sozialer Eingebundenheit als zentrale Determinante für die Qualität der motivationalen Ausprägung (Deci & Ryan, 1993). Deshalb ist davon auszugehen, dass Erfolgserlebnisse im Unterricht und die Wahrnehmung der eigenen Kompetenzen einen positiven Einfluss auf die beiden selbstbestimmten Regulationsformen (intrinsische und identifizierte Motivation) haben (Deci & Ryan, 2000; Götz, 2017; Katz, Eilot, & Nevo, 2014; Kunter, 2005). Dies bedeutet, dass das Lernverhalten und die selbstbestimmte Motivation durch Wechselwirkungen in Form von reziproken Beziehungen miteinander verknüpft sind.

Im vorliegenden Beitrag wird deshalb der Frage nachgegangen, ob bei Sekundarschülerinnen und Sekundarschülern reziproke Effekte zwischen der selbstbestimmten Motivation und den Lernverhaltensindikatoren Anstrengung, Unaufmerksamkeit und Prokrastination im Mathematikunterricht festgestellt werden können. Es wird einerseits davon ausgegangen, dass Schülerinnen und Schüler mit einer höher ausgeprägten selbstbestimmten Motivation sich im Unterricht mehr anstrengen und andererseits eine höhere Anstrengung wiederum zu einer höheren selbstbestimmten Motivation führt. Für die Zusammenhänge mit Unaufmerksamkeit und Prokrastination wird angenommen, dass höhere Werte in der selbstbestimmten Motivation zu tieferen Werten bei Unaufmerksamkeit und Prokrastination sowie tiefere Werte in der Unaufmerksamkeit und Prokrastination zu höheren Werte in der selbstbestimmten Motivation führen.

Die Hypothesen wurden anhand längsschnittlicher Daten von 348 Schülerinnen und Schülern während der 7. und 8. Klassenstufe (3 Messzeitpunkte) zum Mathematikunterricht überprüft. Die verwendeten Daten stammen aus dem vom Schweizerischen Nationalfond geförderten Projekt «EMo-Math», dessen Ziel die Förderung von positiven Emotionen und der Motivation im Mathematikunterricht in der Adoleszenz war (z.B. Brandenberger, Hagenauer & Hascher, 2018). Die Analysen der bidirektionalen Beziehungen erfolgte anhand von insgesamt sechs latenten cross-lagged Strukturgleichungsmodellen.

Die Ergebnisse zeigen teilweise hypothesenkonforme Ergebnisse zwischen der selbstbestimmten Motivation und den Lernverhaltensindikatoren im Mathematikunterricht über die drei Messzeitpunkte. Die cross-lagged Effekte variieren in Abhängigkeit der Lernverhaltensindikatoren und in Bezug auf die Stärke der Zusammenhangsrichtung. Die Ergebnisse werden in Bezug auf den Zusammenhang von Lernmotivation und Lernverhalten diskutiert.

 
9:00 - 10:45F9‒S26: Cybermobbing und traditionelles Mobbing unter Jugendlichen im Kontext von Moralität – (k)ein Beziehungsgeflecht?
S26 
 

Cybermobbing und traditionelles Mobbing unter Jugendlichen im Kontext von Moralität – (k)ein Beziehungsgeflecht?

Chair(s): Arvid Nagel (Pädagogische Hochschule St.Gallen, Schweiz), Horst Biedermann (Pädagogische Hochschule St.Gallen, Schweiz)

DiskutantIn(nen): Fritz Oser (Universität Fribourg)

Ein Leben abseits von Informations- und Kommunikationstechnologien ist gerade für junge Menschen schwer vorstellbar. Das Aufwachsen im digitalen Zeitalter wird durch neue Medien immer einflussreicher, so dass Smartphones, Tablets und Internetzugang zu ständigen Begleitern geworden sind – kurz: Das Leben junger Menschen ist von interaktiven Medien durchdrungen. Aufgrund dieser technologischen Revolution finden soziale Interaktionen hauptsächlich in Chat-Foren statt. Diese Formen können jedoch auch dysfunktionale Dimensionen wie Ausgrenzung, digitalen Stress und Cybermobbing umfassen (Berne et al., 2013; Erdur-Baker, 2010; Erentaité et al., 2012; Katzer et al., 2009; Perren & Gutzwiller-Helfenfinger, 2012; Smith et al., 2008; Weinstein & Selman, 2014). Trotz des zunehmenden Problems des Missbrauchs sozialer Medien fehlen empirische Belege für die Erklärung von Cybermobbing und anderen dysfunktionalen Problemen bei der Nutzung interaktiver Medien. Cybermobbing ist im Sinne der gemeinsamen Definition von Mobbing eine vorsätzliche, wiederholte, aggressive und schädliche Handlung einer anderen Person durch Informations- und Kommunikationstechnologie (Fenaughty & Harré, 2013; Gradinger et al., 2009; Riebel et al., 2009). Diese spezifischen Merkmale ergeben sich aus der räumlichen und zeitlichen Entgrenzung der Kommunikationsmedien, wobei grundsätzlich verschiedene Formen von Cybermobbing unterschieden werden können (Willard, 2007). Cybermobbing – aber auch traditionelles Mobbing – ist vor allem ein unmoralisches Verhalten, weil es (a) die Intimität der Person verletzt, (b) mit gefühllosem Verhalten in Verbindung gebracht wird, (c) größtenteils ungerecht ist und (d) mit Aspekten der Unwahrheit funktioniert. Forscher, Pädagogen, Eltern und Lehrkräfte fragen sich, welchen Einfluss ein solches Medienverhalten auf den Einzelnen und die Gesellschaft hat. Obwohl in den letzten Jahren Forschungsanstrengungen in den Bereichen Mediennutzung und Medienwirksamkeit unternommen wurden, bestehen immer noch erhebliche Wissenslücken (Pieschl et al., 2013) – insbesondere auch im Zusammenhang mit moralischen Aspekten. Die vier Beiträge in diesem Symposium befassen sich mit solchen Lücken, indem sie den Einfluss und das Verständnis von (Cyber-) Mobbing aus verschiedenen Perspektiven empirisch untersuchen und im Kontext von Moralität betrachten. Der erste Beitrag stellt ein neu entwickeltes Messinstrument zur Eruierung von Einstellungen gegenüber Cybermobbing vor. In diesem Beitrag interessiert, (1) ob sich Einstellungen gegenüber Cybermobbing empirisch erfassen lassen und (2) welche Einstellungen SchülerInnen gegenüber Cybermobbing haben. Die Stichprobe der vorliegenden Untersuchung entstammt der IEA-Studie ICILS in der Schweiz und umfasst SchülerInnen der 8. Klassenstufe sowie einer zusätzlichen Jugendstudie Ostschweizer Jugendlicher. Die beiden Datengrundlagen bestätigen ein theoretisch begründetes g-Faktormodell. Der zweite Beitrag untersucht in einer experimentellen Studie die Wirkung von personalisiertem normativen Feedback auf die individuelle Anti-Cyberbullying-Norm. Dazu wurden 14-jährige Jugendliche zu ihrer individuellen und klassenbezogenen Anti-Cyberbullying-Norm befragt und eine Woche später über diese Einstellungen zu Cyberbullying (Experimentalgruppe) bzw. über ein anderes Thema informiert (Kontrollgruppe). Entsprechend dem Social Norms Ansatz zeigte sich, dass die Information über die Abweichung der eigenen gegenüber der klassenbezogenen Anti-Cyberbullying-Norm bei den Cyberbullies tatsächlich die Einstellung gegenüber Cyberbullying beeinflussen kann. Im dritten Beitrag wird der Zusammenhang zwischen der moralischen Entwicklung 14-jähriger Jugendlicher und ihrem selbstberichteten Zeugenverhalten (Unterstützung des Mobbers, Ignorieren, Unterstützung des Opfers) sowie Mobbing (offline und online) untersucht. Die moralische Entwicklung wird anhand der Beurteilung einer passiven moralischen Versuchungssituation erfasst (moralische Urteile, Emotionsattributionen). Diese zeichnen sich dadurch aus, dass ein Individuum keinen Regelübertritt plant, sondern ohne eigenes Zutun mit einer Versuchung konfrontiert wird und sind konzeptuell ähnlich zum Bystanding bei Mobbing. Der vierte Beitrag richtet den Blick auf Lehrkräfte, für die der Umgang mit Bullying aus moralischer Perspektive ihren Erziehungsauftrag betrifft. Hierfür wurden Interviews mit 48 Lehrkräften in ihrer Funktion als Klassenlehrer durchgeführt, in denen zunächst pädagogische Haltungen im Allgemeinen erfragt wurden. Anschließend wurden die Lehrkräfte mit Soziogrammen konfrontiert, die zuvor auf Grundlage einer Schülerbefragung für ihre eigene Klasse gewonnen worden waren und deren Bullying- bzw. Freundschaftsnetzwerke abbildeten. Fritz Oser wird das Symposium aus moralischer, (medien-) kritischer, kultureller und bildungsphilosophischer Sicht diskutieren.

 

Beiträge des Symposiums

 

Nicht jeder denkt, dass es schlimm ist: Ergebnisse aus der IEA-Studie ICILS sowie der Studie ,Lebenswelten Ostschweizer Jugendlicher’ zur Messung von Einstellung gegenüber Cybermobbing

Horst Biedermann1, Arvid Nagel1, Fritz Oser2
1Pädagogische Hochschule St.Gallen, Schweiz, 2Universität Fribourg

Cybermobbing ist die Aktualisierung einer negativen Kompetenz. Grundsätzlich kann darunter die Fähigkeit zu Tätigkeiten verstanden werden, die gesellschaftlich nicht erwünscht, vor dem Hintergrund ethischer Normen moralisch fragwürdig, vor dem Gesetz verboten und unter sozialen Standards diskriminierend sind. Um es enger zu fassen: Cybermobbing als negative Kompetenz besteht darin, andere (Opfer) zu schädigen oder zumindest in gesellschaftlich unerwünschter Weise zu beeinträchtigen ohne sich in das Leid dieser zu versetzen, wobei man meistens unerkannt bleiben möchte. Wir wissen noch wenig darüber, wie (junge) Menschen die Lust und den Drang entwickeln, diese Kompetenz immer wieder zu verfeinern (vgl. dazu die Bestandsaufnahme von Petermann & von Marées, 2013). Cybermobbing wird als eine absichtliche, wiederholte, aggressive und schädigende Handlung gegenüber einer anderen Person mithilfe von Informations- und Kommunikationstechnologien bestimmt (Kowalski, Morgan & Limber, 2012; Langos, 2012; Petermann & von Marées, 2013; Porsch & Pieschl, 2014). Diesem Tun liegt wohl die Einstellung zugrunde, dass man Macht (über eine andere Person) haben kann, dass man brutal schädigen kann und dabei ungeschoren bleibt, dass man andere verunsichern kann – Einstellungen, die auch beim heutigen Phänomen des Cybermobbings gefunden werden. Obwohl die Thematik Cybermobbing sowohl im nationalen als auch im internationalen Kontext zunehmend an öffentlichem und wissenschaftlichem Interesse gewinnt (Fenaughty & Harré, 2013; Festl, 2015; Perren et al., 2012; Pieschl & Porsch, 2014; Sticca et al., 2013), so fallen die empirischen Evidenzen bis dato dennoch eher dünn aus. Als ein zentrales Desiderat lässt sich diesbezüglich auch festhalten, dass es bis anhin an geeigneten Instrumenten zur empirisch-quantitativen Erfassung von Einstellungen gegenüber Cybermobbing fehlt.

Diese Forschungslücke bearbeitend liegt ein Ziel des vorliegenden Beitrags in der Präsentation eines eigenentwickelten Instrumentes zur Erfassung von Einstellungen gegenüber Cybermobbing. Konkret werden in einem ersten Schritt die Reliabilität und die Faktorenstruktur des entwickelten Instruments überprüft – basierend auf zwei schweizerischen Datengrundlagen. Daran anschließend wird den Fragestellungen nachgegangen, (1) wie verbreitet sich Einstel-lungen gegenüber Cybermobbing bei Schweizer Schülerinnen und Schülern (grundsätzlich und getrennt nach Geschlechtern) zeigen und (2) welche prädiktive Erklärungskraft Einstellungen auf das diesbezügliche Verhalten haben.

Im Rahmen der ICILS-Studie (International Computer and Information Literacy Study) der IEA konnten basierend auf einem nationalen Modul insgesamt 2915 Schweizer Schülerinnen und Schüler der achten Jahrgangsstufen aus 94 Schulen befragt werden. Die Einstellung gegenüber Cybermobbing (Skaleneigenkonstruktion; α = .84) wurde anhand von fünf Items erhoben. Das strukturüberprüfende Verfahren der konfirmatorischen Faktorenanalyse bestätigt das theoretisch begründete g-Faktormodell (Modell-Fit: χ² = 9.02; df = 5; p = .000; CFI = .981; RMSEA = .062; SRMR = .020). Gestützt werden diese Ergebnisse durch eine weitere aktuelle Daten-grundlage von 496 Jugendlichen (LeOJ: „Lebenswelten Ostschweizer Jugendlicher“; Modell-Fit: χ² = 7.83; df = 4; p = .10; CFI = .99; RMSEA = .04; SRMR = .01; hohe Faktorladungen von λ=.72 bis λ=.84 für die fünf Indikatoren; α = .87). Geschlechterunterschiede lassen sich bei der Einstellung gegenüber Cybermobbing identifizieren, indem sich die Mädchen bedeutsam ablehnender zeigen (ICILS: t(2896) = -9.55, p < .001 ; MMädchen = 1.67, SD = .69 ; MJungen = 1.94, SD = .79 | d = .36; LeOJ: t(472) = 5.02, p < .001; MMädchen = 1.26, SD = .50; MJungen = 1.52, SD = .62 | d = .46). Auch zwischen Täter/innen und Nicht-Täter/innen von Cybermobbing unterscheiden sich die diesbezüglichen Einstellungen signifikant (t(2913) = -5.99, p < .001 ; MTäter = 2.19, SD = .81 ; Mkein Täter = 1.79, SD = .75 | d = .51). Bedeutsame Prädiktoren zur Erklärung der Einstellung gegenüber Cybermobbing werden im Rahmen des Beitrags mittels multipler Regressionsanalysen präsentiert. Neben der Darlegung der theoretischen Grundlagen und empirischen Erkenntnisse werden die Befunde auch im Lichte des schulischen Auftrags, Lernende bezüglich eines produktiven Umgangs mit Informations- und Kommunikationstechnologien zu unterstützen, reflektiert und diskutiert.

 

Wirkung von personalisiertem normativen Feedback auf die individuelle Anti-Cyberbullying-Norm – Eine experimentelle Testung des Social Norms Ansatzes

Jan Pfetsch, Katrin Lietz
TU Berlin

Cyberbullying ist als wiederholte, beabsichtigte Schädigung anderer Personen mittels digitaler Kommunikationsmedien ein normativ negativ bewertetes Verhalten. Die meisten Schüler*innen lehnen Cyberbullying ab, wohingegen eine positive Einstellung zu Cyberbullying die Intention für Cyberbullying positiv vorhersagt (Heirman & Walrave, 2012). Sozialverhalten in festgefügten sozialen Gruppen wie Schulklassen wird durch Erwartungen und Normen beeinflusst. Insbesondere in der Adoleszenz, wenn der Einfluss der Peers zunimmt, spielen soziale Normen der Peers eine wichtige Rolle. Soziale Normen werden allgemein als eine Sammlung von (impliziten) Regeln und Richtlinien darüber verstanden, welches Verhalten akzeptabel erscheint und in einer Gruppe erwartet wird, wodurch das Verhalten geleitet und sanktioniert wird (Cialdini & Trost, 1998). Dabei kann sich die Wirkung sozialer Normen auf zwei Wegen entfalten: Die Wahrnehmung, was die meisten Mitglieder einer sozialen Gruppe tun, wird als deskriptive Norm bezeichnet, die Wahrnehmung, was die meisten Mitglieder einer sozialen Gruppe für richtig erachten, wird als injunktive Norm bezeichnet (Cialdini, Kallgren, & Reno, 1991). Interessanterweise stimmen die Wahrnehmung der gruppenbezogenen injunktiven Norm und die aggregierte gruppenbezogene deskriptive Norm häufig nicht überein. Nach dem Social Norms Ansatz (Berkowitz, 2004; Perkins, 2003) tendieren Jugendliche besonders bei negativem oder riskantem Verhalten, wie etwa Alkoholkonsum oder Bullying, dazu, die Gruppennorm zu überschätzen und das eigene Verhalten entsprechend anzupassen (Miller & Prentice, 2016). Folgende Strategien werden zur Korrektur der Fehlwahrnehmung und des nachfolgenden, unerwünschten Verhaltens diskutiert: 1. Rückmeldung der tatsächlichen Gruppennorm über Aufklärungsmaterialien (Social Norms Marketing), sowie 2. Individualisierte Information über die eigene Norm und die Gruppennorm (Personalisiertes Normatives Feedback, PNF). Diese Strategien haben sich – angewandt auf Problembereiche wie Drogenkonsum und umweltschützendes Verhalten – im Allgemeinen als effektiv erwiesen (Miller & Prentice, 2016), auch wenn die Schaffung eines realistischen Bildes der Gruppennorm und damit die Korrektur des Problemverhaltens theoretisch und praktisch herausfordernd bleibt (Cislaghi & Heise, 2018). Die Strategie des Social Norms Marketing konnte bereits erfolgreich auf Offline Bullying angewandt werden (Perkins, Craig, & Perkins, 2011). Für Cyberbullying liegen erste Ergebnisse einer experimentellen Studie vor, in denen die Schüler*innen über die Ablehnung von Cyberbullying in ihrer Klasse (Experimentalgruppe) oder über ein anderes Thema (Kontrollgruppe) informiert wurden (Pfetsch, Schultze-Krumbholz, & Füllgraf, 2018). Die Befragten wurden zur individuellen und klassenbezogenen Anti-Cyberbullying-Norm vor und nach dieser Information befragt. Anders als erwartet, hing die Anti-Cyberbullying-Norm zwar negativ mit selbstberichtetem Cyberbullying-Verhalten zusammen, allerdings änderte sich die individuelle Anti-Cyberbullying-Norm in der Experimentalgruppe nicht signifikant anders als in der Kontrollgruppe. Möglicherweise war der kurze Zeitabstand zwischen den Befragungen und die Simulation der Klassennorm Ursache für den ausbleibenden Effekt, weshalb eine Folgestudie die Wirksamkeit der Nutzung der tatsächlichen Klassennorm und einer Information über die individuelle Norm in Relation zur Klassennorm (PNF) untersucht werden sollte. Da sich PNF als wirksam in der Reduktion von Alkoholkonsum in amerikanischen Colleges erwiesen hat (Dotson, Dunn, & Bowers, 2015) zielt die Forschungsfrage der vorliegenden experimentellen Studie daher darauf, ob die Information zu eigenen und klassenbezogenen Anti-Cyberbullying-Norm die individuelle Anti-Cybermobbing-Norm verän-dern kann. Zunächst wurden N = 129 Jugendliche (M = 14.5, SD = 0.8 Jahre, 56% weiblich) zu ihrer individuellen und klassenbezogenen injunktiven Anti-Cyberbullying-Norm und eige-nem Cyberbullying-Verhalten in den letzten sechs Monaten befragt. Eine Woche später erhielt die Experimentalgruppe (n = 73) Informationen zur Einstellung gegenüber Cyberbullying in ihrer eigenen Klasse, die Kontrollgruppe (n = 56) hingegen Informationen zur Einstellung gegenüber Täuschungsversuchen in ihrer Klasse. Entsprechend des Social Norms Approach sollte sich nur in der Experimentalgruppe die individuelle Anti-Cyberbullying-Norm verändern, in der Kontrollgruppe hingegen nicht. In den Analysen zeigt sich dieser erwartete Befund nicht für die Gesamtstichprobe, wohl aber für diejenigen Jugendlichen, die selbst Cyberbullying ausgeübt haben (Cyberbullies). Die signifikante Dreifach-Interaktion weist darauf hin, dass die Rückmeldung einer klassenbezogenen Anti-Cyberbullying-Norm an die Cyberbullies einen hilfreichen Ansatz zur Prävention von Cybermobbing darstellen kann.

 

Mitmachen oder nicht? Moralische Versuchung und selbstberichtetes Verhalten in Mobbingsituationen

Eveline Gutzwiller-Helfenfinger1, Sonja Perren2
1Universität Duisburg-Essen, 2Universität Konstanz

Mobbing unter Kindern und Jugendlichen ist definiert als wiederholte, gezielte und absichtliche Schädigung einer Person unter Ausnutzung eines Macht-Ungleichgewichts (Olweus, 1993). Mobbing ist ein Gruppenprozess, an dem alle Mitglieder einer Gruppe oder Klasse beteiligt sind, auch diejenigen, die als Zeugen («bystanders») entweder den Mobber unterstützen, passiv zuschauen, weggehen oder – selten – das Opfer verteidigen. Bystanders beginnen nicht mit dem Mobbing, ihre Reaktionen beeinflussen jedoch dessen Auftreten und Aufrechterhaltung, sowohl offline als auch online (Palladino, Nocentini, & Menesini, 2016): Wird früh Position bezogen und das Opfer unterstützt, kann dies helfen, das Mobbing zu stoppen. Wird der Täter unterstützt, verstärkt dies die Aggression. Soziale Faktoren wie Gruppennormen, das Bedürfnis nach sozialem Status oder Verantwortungsdiffusion erschweren es den Bystanders, das Opfer zu verteidigen (Salmivalli, 2010). Eine breite Forschungsliteratur belegt den systematischen Zusammenhang zwischen Mobbing und moralischer Entwicklung, z.B. dem Gutheissen moralischer Distanzierungsstrategien bei Mobbern und deren Unterstützern (Gini, Pozzoli, & Bussey, 2015; Killer, Bussey, Hawes, & Hunt, 2019).

Während ein Grossteil der Forschung zu den moralischen Dimensionen von Mobbing Selbstberichtsskalen verwendet, werden zunehmend auch habstandardisierte Interviews und schriftliche Befragungen eingesetzt, welche auf hypothetischen Szenarien basieren. Solche Szenarien fokussieren auf die Evaluation von bereits begangenen Regelübertretungen (in Anlehnung an das Happy-Victimizer-Paradigma) und beinhalten selten Versuchungssituationen. Wenn sie es tun, handelt es sich um geplante, proaktive Regelübertritte, z.B. in der Garderobe Süssigkeiten aus der Tasche eines Peers entwenden, wenn niemand hinsieht (Nunner-Winkler & Sodian, 1988). Passive moralische Versuchungssituationen, bei denen ein Protagonist nicht beabsichtigt, eine Regel zu brechen, jedoch realisiert, dass dies aufgrund spezieller Umstände möglich wäre, wurden nicht untersucht. Solche eher offene, ambige Versuchungssituationen, wie z.B. in einem Laden zu viel Rückgeld erhalten, sind alltäglich und haben eine Gemeinsamkeit mit der Zeugenrolle bei Mobbing: Auch dort besteht keine Absicht zum Regelbruch, da der Mobber angefangen hat. Unsere Studie untersucht den Zusammenhang zwischen der moralischen Entwicklung Jugendlicher, spezifisch ihrer Konstruktion eines Regelübertritts (moralisches Urteil, Emotionsattribution) und Zeugenverhalten (Unterstützung des Mobbers, Ignorieren, Unterstützung des Opfers) sowie Mobbing (offline und online).

331 Schweizer Achtklässler nahmen im Rahmen einer prospektiven Längsschnittuntersuchung (4 MZP über 2 Jahre) zum Onlineverhalten Jugendlicher teil (Durchschnittsalter 14.9, 51% weiblich). Die moralische Entwicklung wurde im Kontext eines passiven moralischen Versuchungsszenarios anhand dreier moralischer Urteile und den entsprechenden Emotionsattributi-onen erhoben (deontisches Urteil und Selbst-Urteil in Teil 1 und Beurteilung des nachfolgenden Regelübertritts im 2. Teil) (schriftliche Antworten). Das Szenario beinhaltete den Erhalt von zu viel Rückgeld (10 Euros) beim Kauf eines Fahrradlichts. Zudem bearbeiteten die Teil-nehmenden einen online-Fragebogen zu Zeugenverhalten, Mobbing (offline, online), moralischer Distanzierung und Empathie. Für die Analysen wurde ein personenzentrierter Ansatz verfolgt. Auf der Basis des Versuchungsmasses identifizierten wir zwei Clusters: Im ersten Teil (freie Handlungsentscheidung) konnten wir Happy Transgressors, Happy Moralists, Ashamed Moralists und Unemotional Moralists unterscheiden. Im zweiten Teil des Szenarios (Be-urteilung des Regelübertritts) identifizierten wir zwei Clusters: Moralists und Happy Opportunists.

Die GEE-Analysen ergaben signifikante Zusammenhänge für moralische Entwicklung und Zeugenverhalten und Mobbing, besonders bei der freien Handlungsentscheidung: Happy Transgressors (Teil 1) berichteten mehr mobberunterstützendes Verhalten sowie online-Mobbing als die verschiedenen «Moralist»-Gruppen. Zudem sagte Empathie mehr Opferunter-stützung voraus und moralische Distanzierung mehr antisoziales Verhalten, was frühere Befunde bestätigt. Die Studie zeigt, dass Jugendliche, die das Nachgeben einer Versuchung positiv interpretieren, häufiger mobberunterstützendes Verhalten sowie online-Mobbing berichten, was die Notwendigkeit für den Einbau gezielter moralischer Förderung in der Mobbingprävention unterstreicht. Unsere Ergebnisse legen nahe, dass Jugendliche, die mobberunterstützendes Verhalten zeigen, lernen müssen, passiven Versuchungssituationen zu widerstehen und sich nicht hinter dem Argument, sie hätten nicht angefangen, zu verstecken.

 

Wie stehen Lehrkräfte zu Bullying in ihren eigenen Klassen? Ergebnisse einer Interviewstudie

Udo Käser
Rheinische Friedrich-Wilhelms-Universität Bonn

Bullying als Gruppenphänomen betrifft in moralischer Hinsicht nicht nur SchülerInnen, welche als Täter, Assistenten, Verstärker, Opfer, Helfer oder Außenstehende (Salmivalli et al., 1996) bzw. in Doppel- oder Mehrfachrollen wie zum Beispiel gleichzeitig als Täter und Opfer (Solberg et al., 2007) in den Bullying-Prozess eingebunden sind. Sondern immer sind hiervon auch Lehrkräfte betroffen angesichts ihrer Aufgabe zu unterrichten, zu erziehen, zu beraten, zu beurteilen, zu beaufsichtigen, zu betreuen und umfassend zu fördern, das Schulleben zu gestalten und die Qualität von Schule fortzuentwickeln sowie sich selbst kontinuierlich fortzubilden (vgl. etwa §57 im Schulgesetz für das Land Nordrhein-Westfalen). Wird Bullying aus moralischer Perspektive betrachtet, wird mit Bezug auf Lehrkräfte vor allem ihre Erziehungsaufgabe thematisiert, aber auch ihre Funktion als Berater, der Förderaspekt sowie ihre Aufgaben gegenüber der Schule, diese als einen Ort zu gestalten, der für alle Beteiligten durch eine Atmosphäre wechselseitigen Respekts gekennzeichnet ist.

Auch wenn (1.) Lehrkräfte aufgrund rechtlicher Vorgaben Maßnahmen ergreifen können und müssen, derartig verletzendem Verhalten entgegen zu treten (Wachs et al., 2016), (2.) ihre Möglichkeiten wesentlich weitergehen, als dies bei SchülerInnen der Fall ist, die Zeugen eines entsprechenden Schikaneverhaltens werden (Teuschel & Heuschen, 2013), und (3.) in der Zwischenzeit ein weitgehender Konsens besteht, dass Betroffene von (Cyber-) Bullying nicht alleingelassen werden dürfen und Lehrkräfte einzugreifen haben (Boulton, 1997; Sairanen & Pfeffer, 2011, Burger et a., 2015, Schöttker et al., 2018), so werden solche Möglichkeiten fak-tisch immer noch eher selten genutzt. Für den Fall einer Reaktion kann zwischen einem autoritätsbasierten Ansatz, der Arbeit mit den Tätern, die Arbeit mit dem Opfer und einem kooperativen Vorgehen unterschieden werden (Bilz et al., 2015, Burger et al., 2015). Bisherige Studien machen deutlich, dass Lehrkräfte häufig nicht auf effektive, kooperative Verfahren zurückgreifen, sondern ein autoritätsbasiertes Vorgehen bevorzugen (Bilz et al., 2017, Schöttker et al., 2018).

Zu der weitergehenden Frage, wie Lehrkräfte sich selbst und ihre Aufgaben im Umgang mit (Cyber-) Bullying verstehen sowie inwiefern ihr Selbstverständnis von sich als Lehrkraft mit ihrer Auffassung von einer (moralischen) Pflicht zum Einwirken auf Bullying-Prozesse zusammenhängt, liegen kaum Studien vor. Daher wurde eine Interviewstudie realisiert mit dem Ziel, den Zusammenhang zwischen dem Selbstverständnis von Lehrkräften und ihrem pädagogischem Handeln bei Bullying zu untersuchen. 48 Lehrkräfte von 14 weiterführenden Schulen nahmen teil: 32 Frauen und 16 Männer im Alter zwischen 27 und 60 Jahren (M = 42 Jahre) mit einer Berufserfahrung zwischen 2 und 35 Jahren (M = 15 Jahre). Alle Probanden waren zum Erhebungszeitpunkt mit der Leitung einer eigenen Klasse der Jahrgangsstufe 6 bzw. 9 betraut.

Die Studie wurde zweischrittig realisiert. Zuerst wurde mit Hilfe einer deutschsprachigen Version des PRQ (participant-role-questionnaire; vgl. Knauf et al., 2017) für die Klasse der Lehr-kraft erfasst, welche Freundschaftsnetzwerke bestehen und welche Rollen in etwaigen Bullying-Prozessen vorliegen. Anschließend wurde mit der Lehrkraft ein Leitfadeninterview geführt, in dem demographische Daten erfasst sowie schulische Rahmenbedingungen, fachliche und pädagogische Ziele für den Unterricht, die Lehrersicht auf Elternarbeit, der Umgang mit Konflikten im Allgemeinen und Belastungsempfinden vs. Zufriedenheit thematisiert wurden. Anschließend wurden der Lehrkraft die Ergebnisse der vorangegangenen Schülerbefragung in Form eines Soziogramms vorgestellt. Hierbei wurde problematisiert, welche Gründe für Bullying vorliegen, wie Täter und Opfer zu charakterisieren sind und wie die Lehrkraft mit dem Problem umgeht. Außerdem wurde erfragt, ob die Lehrkraft bereits Erfahrungen mit Bullying hatte und inwieweit sich ihr heutiges von früherem Vorgehen unterscheidet.

Im Klassenvergleich zeigen sich eine hohe Varianz für Bullying, der diagnostischen Kompetenz der Lehrkräfte sowie hinsichtlich der (moralischen) Bewertung der Situation und den Lehrerreaktionen. Übereinstimmend mit Klusmann et al. (2006) sehen sich hoch belastete Lehrkräfte nicht in der Lage, soziale Schwierigkeiten zu handhaben. Nur eine kleine Gruppe von Lehrkräften erweist sich als engagiert, primär Werte und Normen zu vermitteln.

 
9:00 - 10:45F9‒S27: Abbrüche in Ausbildung und Studium: Welche Arbeitsmarktfolgen haben sie und wie können sie verhindert werden?
S27 
 

Abbrüche in Ausbildung und Studium: Welche Arbeitsmarktfolgen haben sie und wie können sie verhindert werden?

Chair(s): Martin Neugebauer (Freie Universität Berlin), Annabell Daniel (Freie Universität Berlin)

DiskutantIn(nen): Marita Jacob (Universität zu Köln)

Jedes Jahr brechen tausende junge Menschen eine Ausbildung bzw. ein Studium ab – und versuchen ohne beruflichen Abschluss auf dem Arbeitsmarkt Fuß zu fassen. Während zahlreiche Studien zu den Bedingungsfaktoren von Abbrüchen vorliegen, existieren in Deutschland aber nur relativ wenige empirisch abgesicherte Erkenntnisse zu ihren Folgen. Zudem liegen kaum Untersuchungen zu wirksamen Präventionsmaßnahmen von Abbrüchen vor.

Vor diesem Hintergrund bringen wir im Symposium aktuelle Beiträge zusammen, die einerseits die Arbeitsmarktkonsequenzen von Abbruchentscheidungen in Ausbildung und Studium untersuchen. Andererseits werden Evaluationen von Maßnahmen präsentiert, die Ausbildungs- bzw. Studienabbrüche verhindern sollen. Durch die Verbindung der beiden oftmals separat diskutierten Ausbildungsbereiche – Ausbildung und Studium – erhoffen wir uns darüber hinaus einen inspirierenden Austausch zu theoretischen ebenso wie zu methodischen Ansätzen, der zukünftige Forschung in beiden Bereichen befruchten soll. Nicht zuletzt deshalb haben wir Beiträge ausgewählt, die auf ganz unterschiedliche Datengrundlagen setzen: Registerdaten, Panelbefragung, faktorieller Survey, Feldexperiment.

Die ersten beiden Beiträge des Symposiums widmen sich Abbrüchen in der Berufsausbildung. Zunächst untersuchen Alexander Patzina und Gabriele Wydra-Somaggio die Folgen einer abgebrochenen Berufsausausbildung auf dem Arbeitsmarkt. Basierend auf umfangreichen Registerdaten zeigen die Ergebnisse aus Wachstumskurvenmodellen, dass ein später Ausbildungsabbruch verglichen mit einem frühen Ausbildungsabbruch die Beschäftigungs- und Verdienstaussichten zwar positiv beeinflusst. Dennoch lassen sich auch zehn Jahre nach Ausbildungsabbruch deutliche Nachteile gegenüber Absolvent*innen beobachten. Im Beitrag diskutiert wird ebenfalls, welche Rolle den Ausbildungsbetrieben für den Arbeitsmarkterfolg zukommt.

Im zweiten Beitrag untersuchen Anne Christine Holtmann und Heike Solga auf Basis der NEPS-Daten, ob Ausbildungsabbrüche durch die Teilnahme an berufsvorbereitenden Maßnahmen verringert werden können. Unter Anwendung eines Matchingverfahrens zur Kontrolle von Selektionseffekten zeigen sie, dass sowohl der Erwerb schulischer Abschlüsse als auch die im Rahmen der Maßnahmen gesammelten Betriebserfahrungen die Wahrscheinlichkeit eines Ausbildungsabbruchs verringern können.

Im zweiten Teil des Symposiums beschäftigen wir uns mit Abbrüchen im Studium. Annabell Daniel und Martin Neugebauer widmen sich zunächst der Frage, wie sich ein Studienabbruch auf die Einstellungs- und Verdienstchancen auswirkt. Sie nutzen dazu Daten eines faktoriellen Surveys, bei dem Arbeitgeber*innen verschiedene Bewerberprofile von Studienabbrecher*innen und Hochschulabsolvent*innen vorgelegt wurden. Die Ergebnisse ihrer Mehrebenenanalysen zeigen, dass ein Studienabbruch je nach Ausgestaltung der Studienepisode zwar differenziert bewertet wird, aber insgesamt negative Folgen für die Integration auf dem Arbeitsmarkt hat.

Rafael Brade, Oliver Himmler und Robert Jäckle gehen im Anschluss der Frage nach, inwieweit Erinnerungen und freiwillige Selbstverpflichtungen die Studienabbruchquoten reduzieren können. Sie haben dazu ein randomisiertes Feldexperiment durchgeführt und zeigen unter Berücksichtigung administrativer Daten, dass Commitments einen positiven Effekt auf den langfristigen Studienerfolg haben. Diskutiert wird auch, welche Studierendengruppen von diesen Maßnahmen besonders profitieren.

Ein abschließender Diskussionsbeitrag von Marita Jacob ordnet die einzelnen Befunde in einen übergeordneten Zusammenhang ein.

 

Beiträge des Symposiums

 

Early careers of dropouts from vocational training: Signals, human capital formation, and training firms

Alexander Patzina, Gabriele Wydra-Somaggio
IAB Nürnberg

Motivation and theoretical background

Dropping out of upper secondary education has long-lasting negative pecuniary and non-pecuniary consequences in modern labour markets (e.g., Brekke 2014; Campbell 2015; Hällsten 2017). Research also reveals that investments in human capital pay off as dropouts with more years of education attain higher wages and find jobs with higher prestige scores (e.g., Kane & Rouse 1995; Matković & Kogan 2012; Reisel 2013; Schnepf 2017). To date, this research has not focused on occupational labour market settings in which returns to education strongly depend on the attainment of formal degrees (e.g., Bol & van de Werfhorst 2011; Shavit & Müller 1998). Therefore, for a large part of the European labour market, which is characterised by apprenticeship training systems and occupational labour markets, it remains unclear whether dropouts benefit from human capital investments. Theoretically, this study investigates whether human capital explanations can explain career progression of dropouts in a setting in which labour market prospects heavily depend on credentials (Bol & Weeden 2015; Solga & Konietzka 1999). Moreover, the study focuses on a particular feature in occupational labour markets: training firms. Such firms could provide apprenticeship dropouts links to first jobs thereby offsetting the theoretical mechanisms of signalling and credentialing.

Research questions

To date, research provides scarce evidence on labour market prospects of apprenticeship dropouts in occupational labour markets, on the development of labour market outcomes of apprenticeship dropouts, and no study directly addresses the differences in context moderators. Therefore, our study answers the following questions:

1. How do wages and employment experience of dropouts from apprenticeship training develop within the first ten years after termination of education?

2. Does the timing of dropping out (i.e., the length of training) matter for the development of wages and employment experience in an occupational labour market?

3. Do characteristics of training firms influence the development of wages and employment experience?

Data & methods

Our analyses rely on a linked panel data set that combines information from the Integrated Employment Biographies of the IAB and information from the Saarland Chamber of Industry and Commerce and Chamber of Trade. The register data include all apprentices in companies in Saarland who are enrolled for at least one day between the years of 1999 and 2002 (Wydra-Somaggio 2015). The analytic sample for the experience analysis comprises 2,760 dropouts and 11,334 graduates. The wage analysis relies on information from 1,594 dropouts and 9,237 graduates. Methodologically, the main aim of this study is to estimate unbiased growth curves of employment experience and wages in the first ten years after termination of education. In doing so, we estimate fixed effect growth curve models (Allison 2009; Brüderl 2015). To compare outcomes across different groups over time, we normalise our fixed effects estimates to the differences in employment experience and wages between dropouts and graduates in the school-to-work transition.

Results

The timing of dropping out structures the career progression as late dropouts have the highest employment rates and highest wages within the dropout population. However, in an occupational labour market setting credentials and signals are still highly important for career progression as the wage advantage of late dropouts within the dropout population is rather small and late dropouts suffer a wage penalty when we compare their wage profiles to those of graduates. Furthermore, our study emphasizes the importance of training firms as those firms impact the human capital development of individuals during the course of training and provide dropouts with links to first jobs. Thus, in occupational labour markets, the consequences of dropping out depend mainly on different mechanisms as in other settings.

 

Do pre-vocational programs in Germany help lowly educated youths complete an apprenticeship?

Anne Christine Holtmann, Heike Solga
Wissenschaftszentrum Berlin für Sozialforschung (WZB)

Introduction and research question

School leavers with low levels of education are at risk to remain without a vocational education because of difficulties to enter vocational education in the first place, and because of high dropout rates among those who entered vocational education in the second place (Rohrbach-Schmidt & Uhly 2015; Beicht & Walden 2013). To address these problems, Germany has implemented prevocational programs including classroom training, career guidance and internships (Beicht 2009). These remedial programs target school leavers who are unable to enter apprenticeship programs. Their educational goals are to combat individual shortcomings in cognitive and non-cognitive skills and to foster educational attainment, motivation, and career guidance. Thus, they are meant to prepare the participant for an apprenticeship. In this article, we investigate whether prevocational programs have longer-term effects and prevent low-achieving youth from later dropping out of apprenticeships.

Theoretical background

We differentiate performance-based factors and institutional-integration factors that might result in trainees’ decision to drop out of their apprenticeship (Tinto 1988; Tinto 1975). Prevocational programs might reduce later dropout of apprenticeships, first, if they prepare students for apprenticeships so that performance problems are reduced and, second, if they improve students’ career orientation and their application skills so that more of them manage to enter their preferred occupation. Prevocational programs can be mainly firm-based or focus on attaining school certificates. However, most participants neither spend much time in firms nor do they attain a higher school certificate. We expect that participants spending much time in firms during prevocational programs are less likely to later drop out of apprenticeships, because they already know what will be expected of them and employers have already screened them. For those who attain a higher certificate during prevocational programs, our expectations are ambivalent. On the one hand, with a higher school certificate they have the opportunity to enter more attractive occupations. On the other hand, these occupations might also be more demanding. For those who did not spend much time in firms and did not attain a higher certificate, we do not expect reduced dropout rates in vocational education.

Data and method

We use data from the German National Educational Panel Study (NEPS) on a cohort of students who attended grade nine at German secondary schools in fall 2010 and were surveyed once or twice each year since then (Blossfeld et al. 2011; Leuze et al. 2011). The data is particularly suited to address our research question because it includes measures of cognitive and non-cognitive skills which are often unobserved in other studies. To account for selectivity into (different) prevocational programs, we apply entropy balancing (Hainmüller 2012). Since we are interested in the average treatment effect on the treated (ATT) in this application, we reweight the control group so that it becomes similar to the respective treatment group. To control for potential variations in labour market conditions, we also include fine-grained regional information about youth unemployment at the local municipality level in the matching.

Results

When comparing dropout rates of vocational education among those who have done prevocational education before and those who did not, prevocational education participants always have higher dropout rates. This is because this is a negatively selected group. However, when taking selectivity into account, our preliminary results indicate that those who attained a higher certificate during prevocational education and those who spend much time in firms, afterwards have about 5 percentage points lower dropout rates of vocational education. Those who did not attain a higher certificate nor spent much time in firms do not have reduced dropout rates when doing vocational education.

 

Die Folgen eines Studienabbruchs für die Einstellungs- und Verdienstchancen. Eine (quasi-)experimentelle Studie mit Arbeitgeber*innen

Annabell Daniel, Martin Neugebauer
Freie Universität Berlin

Trotz hoher Studienabbruchquoten ist in Deutschland relativ wenig über die Berufsaussichten von Studienabbrecher*innen bekannt (Neugebauer et al. 2019). Untersuchungen zeigen zwar, dass Studienabbrecher*innen im Vergleich zu Hochschulabsolvent*innen längere Zeit für den Übergang in eine erste dauerhafte Berufstätigkeit benötigen und einen niedrigeren Berufsstatus erreichen (Heublein et al. 2017, Scholten & Tieben 2017), die Aussagekraft dieser Befunde ist allerdings begrenzt. Zentrale Drittvariablen, die sowohl den Studienabbruch als auch den Arbeitsmarkterfolg beeinflussen, wurden nur bedingt kontrolliert und auch die Sicht der Arbeitgeber*innen bei der Beurteilung des Studienabbruchs blieb unberücksichtigt. Noch weniger als zu den Einstellungschancen ist über die Verdienstaussichten von Studienabbrecher*innen in Deutschland bekannt. Dass Studienabbrecher*innen vermehrt in niedrigeren Berufspositionen tätig sind, schlägt sich auch in vergleichsweise niedrigeren Einkommen nieder (Becker et al. 2010). Wie groß die Einkommensnachteile gegenüber Personen mit Hochschulabschluss tatsächlich sind, ist jedoch unklar.

Unser Beitrag adressiert diese Forschungsdesiderata und untersucht, wie Arbeitgeber*innen die Einstellungs- und Verdienstchancen von Studienabbrecher*innen im direkten Vergleich zu Hochschulabsolvent*innen bewerten. Zusätzlich prüfen wir, inwiefern im Studium erworbene Kompetenzen (z.B. durch ein Auslandsstudium) die vermuteten Nachteile der Studienabbrecher*innen kompensieren können.

Signaltheoretischen Überlegungen folgend nehmen wir an, dass Arbeitgeber*innen im Auswahlprozess eine Entscheidung unter Unsicherheit treffen und einen Studienabschluss als Signal für inhärente Merkmale (z.B. kognitive Fähigkeiten) einer Person nutzen (Spence 1973). Studienabbrecher*innen können dieses Abschlusssignal nicht senden, ihre Einstellungs- und Verdienstchancen sollten daher geringer sein. Bei einem hohen Grad beruflicher Schließung, wenn Unternehmen also nur Personen mit formaler Qualifikation einstellen können, sollten die Nachteile gegenüber Hochschulabsolvent*innen noch stärker ausfallen (Bol & Weeden 2015). Im Studium erbrachte Leistungen, die Studiendauer oder gesammelte Auslands- und Praktikumserfahrungen hingegen sollten die Nachteile verringern. Sie können ebenfalls als Signale für das Leistungsvermögen der Bewerber*innen dienen und die Unsicherheit der Arbeitgeber*innen reduzieren.

Zur Prüfung unserer Fragestellung wurde ein faktorieller Survey mit N = 335 Arbeitgeber*innen durchgeführt, die Stellen für Hochschulabsolvent*innen im IT- und im kaufmännischen Bereich ausgeschrieben hatten. Sie bewerteten jeweils acht hypothetische Bewerberprofile (insgesamt N = 2680 Vignetten), in denen neben dem Merkmal des Studienabbruchs auch Studiendauer und -leistungen sowie Auslands- und Praktikumserfahrungen experimentell variiert wurden. Für jedes Profil gaben die Arbeitgeber*innen an, mit welcher Wahrscheinlichkeit sie den Bewerbenden zu einem Vorstellungsgespräch einladen und welches Einstiegsgehalt sie ihm/ihr zahlen würden. Das experimentelle Design erlaubt es, die Bildungserträge zentraler Studienmerkmale für Studienabbrecher*innen und Absolvent*innen direkt zu vergleichen und kausale Effekte zu prüfen. Ergänzend wurden in einer umfangreichen Arbeitgeberbefragung Informationen zur Personalpolitik der Unternehmen erfasst. Die Auswertung erfolgte unter Berücksichtigung der hierarchischen Datenstruktur in Mehrebenenanalysen.

Erwartungskonform zeigten sich sowohl bei der Einladungswahrscheinlichkeit als auch beim Einstiegsgehalt deutliche Nachteile für Studienabbrecher*innen. Unter Kontrolle aller anderen Vignettenmerkmale haben sie eine um 34 Prozentpunkte geringere Wahrscheinlichkeit, zum Vorstellungsgespräch eingeladen zu werden und erhalten ein um etwa 6.576 € geringeres Bruttojahresgehalt als ihre Mitbewerber*innen mit Hochschulabschluss. Cross-Level-Interaktionen mit Unternehmensmerkmalen ergaben, dass die Nachteile in der Einladungswahrscheinlichkeit wie auch beim Einstiegsgehalt noch deutlich stärker ausfallen, wenn das Vorliegen eines Hochschulabschlusses ein Einstellungskriterium darstellt. Zudem zeigte sich, dass gute Studienleistungen, ein später Studienabbruch sowie Auslands- und Praktikumserfahrungen zwar die Einladungswahrscheinlichkeit für Studienabbrecher begünstigten, das Einstiegsgehalt aber kaum beeinflussen. Insgesamt ergaben die Analysen, dass es Studienabbrecher*innen nicht gelingt, ihre Nachteile gegenüber Hochschulabsolvent*innen zu kompensieren, d.h. selbst für Abbrecher*innen mit guten Studienleistungen oder anderen begünstigenden Merkmalen sind die Einstellungs- und Verdienstchancen geringer als für Absolvent*innen, die weder gute Leistungen noch Auslands- oder Praktikumserfahrungen vorweisen können.

Durch die Berücksichtigung der Arbeitgeber*innenperspektive und den direkten Vergleich zu typischen Mitbewerbenden mit Hochschulabschluss liefert der Beitrag erstmals belastbare Erkenntnisse zu den individuellen Folgen eines Studienabbruchs. Angesichts der zentralen Bedeutsamkeit eines Bildungszertifikats und dem Befund, dass Erwerbs- und Einkommensnachteile gegenüber Absolvent*innen kaum auszugleichen sind, erscheint die Aufgabe der Hochschulen, Studierende beim erfolgreichen Studienabschluss unterstützen, umso wichtiger.

 

The Long-Run Effects of Soft Commitments and Reminders on Academic Success

Raphael Brade1, Oliver Himmler2, Robert Jäckle3
1Universität Göttingen, 2MPI for Research on Collective Goods und Universität Erfurt, 3Technische Hochschule Nürnberg Georg Simon Ohm

Viele Studierende verlassen die Hochschulen ohne Abschluss, und auch Absolvent*innen benötigen häufig länger als die Regelstudienzeit vorsieht. Laut OECD liegen die Abbruchquoten im Bachelorstudium über 15 Länder hinweg zwischen 20 und 50% einer Kohorte, zudem bleiben im Durchschnitt lediglich 41% der Bachelorstudierenden innerhalb der Regelstudienzeit (OECD 2016).

Studierende, die spät mit den Prüfungsvorbereitungen beginnen, erbringen häufig schlechtere Leistungen (Beattie et al. 2018). Hieraus können Studienabbrüche resultieren. Erkenntnisse der Psychologie und Verhaltensökonomik legen nahe, dass zu spätes Erledigen von Aufgaben Folge von Prokrastination oder Folge mangelnder Salienz der Studienplanung sein kann (vgl. z.B. Damgaard & Nielsen 2018).

Empirische Auswertungen zeigen, dass mehr als 80 % der Studierenden prokrastinieren (vgl. z.B. Steel 2007). Eine Erklärung für Prokrastination sind gegenwartsverzerrte Präferenzen (i.e. Individuen gewichten den unmittelbaren Nutzen im Vergleich zu zukünftigen Erträgen übermäßig stark; Laibson 1997). Fallen, wie im Studium, die Kosten einer Tätigkeit unmittelbar an, während Erträge erst in Zukunft realisiert werden, lösen gegenwartsverzerrte Präferenzen Prokrastination aus. Als Lösung bieten sich freiwillige Selbstverpflichtungen (Commitments) an (Bryan et al. 2010). Halten Personen ihre Vorsätze nicht ein, „ahnden“ Commitments dies mit physischen (meist monetären) oder psychologischen Konsequenzen. Damit verändern sich die Anreize, einmal getroffene Vorsätze einzuhalten.

Weiterhin können individuell gefasste Pläne bzgl. der Prüfungsvorbereitungen im Laufe des Semesters an Salienz verlieren (Ericson 2017). In diesen Fällen könnte es ausreichen, die Aufmerksamkeit der Studierenden mithilfe von Erinnerungsschreiben auf die anstehenden Aufgaben zu lenken. Reminder wurden im Bildungsbereich bereits erfolgreich eingesetzt, um Studierende bei Anträgen auf finanzielle Hilfe (Castleman & Page 2016) und bei der Bewerbung für das Studium (Castleman & Page 2015) zu unterstützen.

Auf Grundlage dieser Überlegungen testen wir, ob Erinnerungen und freiwillige Selbstverpflichtungen den Studienerfolg – gemessen an Abschlussquoten, Abbruchquoten, der durchschnittliche Studiendauer und den Abschlussnoten – erhöhen und ob hiervon insbesondere Studierende mit Prokrastinationstendenzen profitieren.

Hierzu wird eine Erstsemesterkohorte von 392 BWL-Bachelor Studierenden in drei randomisierte Gruppen unterteilt. Jede Gruppe wird zu Beginn des Studiums in einer Informationsveranstaltung über den idealen Aufbau des Studiums entlang des Studienplans informiert. Die Kontrollgruppe erhält kein weiteres Treatment. Die Studierenden der Gruppe „Erinnerungsschreiben“ erhalten während der Regelstudienzeit jedes Semester zwei postalische Briefe, die sie an die Anmeldung zu den Prüfungen und an den bevorstehenden Prüfungszeitraum erinnern. Die Commitment-Gruppe erhält in der Einführungsveranstaltung zusätzlich das Angebot, eine nicht-bindende Zielvereinbarung mit der Fakultät zu schließen. In dieser erklären die Studierenden, dass sie sich an den Studienplan halten werden und die Klausuren gemäß dem von der Hochschule empfohlenen Klausurenplan ablegen. Die Commitment-Gruppe erhält zudem dieselben Reminder wie die Gruppe Erinnerungsschreiben, und wird in diesen zusätzlich an die potentiell eingegangene Selbstverpflichtung erinnert.

Unter Zuhilfenahme von administrativen Daten der Hochschule untersuchen wir den kausalen Einfluss der Maßnahmen auf den Studienerfolg. Die Analysen zeigen, dass Commitments den langfristigen Studienerfolg (zumeist) signifikant erhöhen. Nach dem 10. Semester liegt der Anteil der Studierenden mit Bachelorabschluss um circa 15 Prozentpunkte höher als in der Kontrollgruppe (58%). Dieser Effekt entsteht durch eine um 8 Prozentpunkte niedrigere Abbruchquote und durch eine Verkürzung der durchschnittlichen Studiendauer um etwa 0,4 Semester. Gleichzeitig verändert sich der Notenschnitt am Ende des Studiums durch das Commitment-Treatment nicht, so dass die positiven Effekte nicht zu Lasten der Noten gehen. Für die Erinnerungsschreiben finden sich hinsichtlich der Vorzeichen ähnliche Ergebnisse, allerdings sind diese kleiner und meist nicht signifikant.

Da Studierende, die zu Prokrastination neigen, besonders von Commitments profitieren sollten, bilden wir hierzu eine Subgruppe. Als Indikator für Prokrastinationstendenzen dient der Bewerbungszeitpunkt. Zwar muss nicht jede Studierende, die sich spät bewirbt, zu Prokrastination neigen, jedoch ist davon ausgehen, dass „Aufschieber“ ihre Unterlagen später einsenden (vgl. Himmler et al. 2019, De Paola & Scoppa 2015). Unsere Ergebnisse zeigen, dass die Effekte der Commitments auf die Abschlussquoten von der Gruppe der sich spät bewerbenden Studierenden getrieben werden.

 
9:00 - 10:45F9‒S28: In search of cognitive factors in functional illiteracy
S28 
 

In search of cognitive factors in functional illiteracy

Chair(s): Irit Bar-Kochva (University of Cologne, Cologne, Germany; German Institute for Adult Education (DIE) - Leibniz Centre for Lifelong Learning, Bonn, Germany.)

DiskutantIn(nen): Hannes Schröter (German Institute for Adult Education – Leibniz Centre for Lifelong Learning, Bonn, Germany)

Insufficient reading ability in adulthood has consistently been reported in large-scale studies worldwide (e.g. Grotlüschen et al., 2019; OECD, 2016). According to a recent survey carried out in Germany, 12.1% of the working-age population is able to process written sentences but not continuous texts, even if they are brief (LEO 2018, Grotlüschen et al., 2019). Notably, more than half of the adults with low literacy skills in this survey spoke German as their native language. Thus, possible insufficient competence in the testing language due to a migratory background, may only explain part of these results. When adults with low literacy skills present poor functional use of printed information, they are referred to as functional illiterates. It has been suggested that this definition be operationalized by relating it to one’s ability to subtract meaning from reading and to express oneself in writing at a reasonable pace (Egloff et al., 2011).

Alongside social-cultural and/or emotional disadvantages, cognitive deficits have also been suggested to underlie functional illiteracy (Egeloff et al., 2011; Eme, 2011). The question which cognitive factors are associated with functional illiteracy is the focus of this symposium, and is common to its three presentations. Notably, while there is an extensive research on the cognitive factors of children with reading difficulties, studies exploring this subject in adults with low literacy skills are scarcer.

The first two presentations of this symposium address the relations between functional illiteracy and dyslexia –a developmental learning disability explained by cognitive deficits. The first presentation of Vágvölgyi and her colleagues, explores this subject by carrying out a systematic review of scientific quantitative studies, which include the two types of populations. While taking into account the extensive research on dyslexia, and the more rare research on functional illiteracy, the question at the center of this review is what knowledge is transferable from research on dyslexia to that of functional illiterate adults. The results of this review point to difficulties in a direct transfer based on the existing literature, as the studies differ, among others, in the inclusion criteria of the two populations. More research is needed then in order to understand to which extent functional illiteracy and dyslexia share common characteristics. This is the question at the center of the second presentation of Bar-Kochva and her colleagues. In their study of 54 functional illiterate adults, it was examined whether the diagnostic criteria of dyslexia apply to them. The vast majority of the sample (above 80%) presented the same deficits in the basic reading skills (word reading and decoding), which are the main deficits defining dyslexia. In addition, about 50% of the sample presented a deficit in the main reading-related cognitive skill thought to underlie dyslexia (phonological awareness). The third presentation of Bulajić and his colleagues extends the examination of the cognitive factors of functional illiterates to more general cognitive skills: memory systems and IQ, and examines the relations of these skills with the actual results achieved by these adults in a basic adult literacy program. In this study of 63 adults, the optimal model explaining progress in this program included two predictors: verbal intelligence and complex working memory. Considering the significant heterogeneity among functional illiterates (Vágvölgyi, 2018), a better understanding of this population is required both from a theoretical and a practical perspective. The results of the three presentations add in this respect by shedding some light on the cognitive profiles of functional illiterate adults and on the cognitive factors, which play a role in their ability to acquire literacy skills in adulthood.

 

Beiträge des Symposiums

 

Learning from the past: What knowledge is transferable from the research into dyslexia to that of low literate adults?

Réka Vágvölgyi1, Kirstin Bergström1, Maria Klatte1, Aleksandar Bulajić2, Tânia Fernandes3, Michael Grosche4, Falk Hüttig5, Jascha Rüsseler6, Thomas Lachmann7
1Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany, 2Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany; Faculty of Philosophy, University of Belgrade, Serbia, 3Faculdade de Psicologia, Universidade de Lisboa, Portugal, 4Rehabilitation Sciences – Special Learning Needs, Institute of Educational Research, University of Wuppertal, Germany, 5Max Planck Institute for Psycholinguistics, Nijmegen, Netherlands; Centre for Language Studies, Radboud University, Nijmegen, Netherlands, 6Department of Psychology, University of Bamberg, Germany; Bamberg Graduate School of Affective and Cognitive Sciences (BaGrACS), University of Bamberg, Germany, 7Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany; Facultad de Lenguas y Educación, Universidad Nebrija, Madrid, Spain

Theoretical background

Despite having average intelligence and adequate basic education, children diagnosed with developmental dyslexia still encounter considerable difficulties in the full acquisition of their reading and writing skills (WHO, 2015). Although their basic skills might improve with the support of different intervention programs, some difficulties persist into adulthood (e.g. Law et al., 2015).

Moreover, although being a well-known phenomenon for decades, developmental dyslexia may remain undiagnosed or untreated in childhood. Thus, certain studies assume that dyslexia can be one of the causes of becoming functionally illiterate (i.e. low literate) in adulthood (Greenberg et al., 1997). Recent surveys have shown that the high prevalence of developmental dyslexia among low literate adults in Germany is higher (7-15 %, Grotlüschen & Solga, 2019; Fickler-Stang, 2011) than in the general population (2.1%; Fischbach et al., 2013). Furthermore, low literate adults performed similarly in decoding, word recognition, and text reading tasks, as would be expected from dyslexic readers, thus indicating common difficulties of both groups (Bar-Kochva et al., under review). Although, there is a number of data suggesting commonalities between dyslexia and low literacy, the available evidence has not been systematically reviewed.

Research question

We aim to investigate in our ongoing project, whether the research findings regarding risk and protective factors, cognitive processing profile, prevention and intervention on developmental dyslexia are transferable to low literate adults.

Methods

In order to address the research question, a systematic literature review is being conducted. We searched 9 electronic databases to identify all the available evidence with original quantitative data, written in either English or German, including both low literate and dyslexic samples. The screening of the identified publications, the data extraction and the quality evaluation of the fitting studies were carried out by two independent coders. The quality of the included studies was assessed using the Quality Assessment Tool for Reviewing Studies with Diverse Design (QATSDD; Sirriyeh et al., 2012).

Results

Our search identified 6.973 publications, of which 5 met the inclusion criteria. Low literate adults are mostly investigated from an educational, while dyslexic individuals from a psychological point of view. The two disciplines have in general different research focus and are using different methodology, which can explain the low number of studies including both samples. Furthermore, the fitting studies point to the diversity of the topic: a variance has been found between the 5 studies in critical categories, such as in the applied criteria and definition for functional illiteracy, in the testing methods and in the quality of reporting. This variance indicates that more direct comparisons have to be made in order to understand to which extent functional illiteracy and dyslexia share common characteristics. Although these preliminary results impose a difficulty on comparing the two populations, some similarities and differences between the two concepts will be presented.

 

Do functional illiteracy in adulthood and dyslexia share common characteristics? An examination of readers of a transparent orthography

Irit Bar-Kochva1, Réka Vágvölgyi2, Thomas Dresler3, Benjamin Nagengast4, Hannes Schröter5, Josef Schrader6, Hans-Christoph Nuerk7
1University of Cologne, Cologne, Germany; German Institute for Adult Education (DIE) - Leibniz Centre for Lifelong Learning, Bonn, Germany., 2Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany, 3Department of Psychiatry and Psychotherapy, University of Tuebingen, Tuebingen, Germany; LEAD Graduate School & Research Network, University of Tuebingen, Tuebingen, Germany, 4Hector Research Institute of Education Sciences and Psychology, University of Tuebingen, Tuebingen, Germany; LEAD Graduate School & Research Network, University of Tuebingen, Tuebingen, Germany, 5German Institute for Adult Education (DIE) - Leibniz Centre for Lifelong Learning, Bonn, Germany., 6German Institute for Adult Education – Leibniz Centre for Lifelong Learning, Bonn, Germany; LEAD Graduate School & Research Network, University of Tuebingen, Tuebingen, Germany, 7Department of Psychology, University of Tuebingen, Tuebingen, Germany; LEAD Graduate School & Research Network, University of Tuebingen, Tuebingen, Germany; Knowledge Media Research Center – Leibniz Institut für Wissensmedien, Tuebingen, Germany

Theoretical Background

Functional illiteracy has been suggested to be caused by multiple factors (Rüsseler, Boltzmann, & Grosche, 2019). One of these is dyslexia, defined by difficulties in accurate and/or fluent word recognition and by poor spelling and decoding skills (Lyon et al., 2003). Deficits in phonological awareness and rapid-naming have also been shown to be related to dyslexia (Wolf & Bowers, 1999). While the definition of functional illiteracy puts an emphasis on insufficient reading comprehension (Egloff et al., 2011), reading comprehension is not considered a primary deficit in dyslexia (Lyon et al., 2003). Studies examining more basic skills of reading (e.g. word-reading and decoding) in functional illiterate adults were carried out mainly with readers of English (e.g. Greenberg et al., 1997; Mellard et al., 2010). However, due to its opaque spelling-sound relations, the English orthography has been shown to impose special demands of processing –and particularly on reading accuracy (Share, 2008).

This study set out to examine the relations between functional illiteracy and dyslexia among adults who read the more transparent German orthography. The study adds to the few previous studies on functional illiteracy among readers of German (e.g. Grosche, & Grünke, 2011) a separate analysis of reading accuracy and fluency. This study aims at contributing to the understanding of the cognitive factors involved in functional illiteracy in adults who struggle with reading a transparent orthography.

Research question

Three questions were addressed: (1) Do functional illiterate adults reading the German orthography present the same difficulties associated with dyslexia in a transparent orthography, i.e. in fluency in decoding and in word recognition, in addition to deficits in phonological awareness and rapid-naming? (2) Is accuracy in reading affected in these adults despite reading a transparent orthography? (3) To which extent the deficits associated with dyslexia explain the variance in reading comprehension?

Method

The sample included 54 participated recruited from vocational trainings and literacy classes (ages 16-63, 33 men). These participants presented a reading comprehension level below the level of 6th graders. Participants were born in Germany, had a normal non-verbal IQ score, and did not have a diagnosed hearing deficit, uncorrected sight problems or an attention and hyperactivity disorder. Standardizes tests were administered, including: reading comprehension, sentence reading, word reading and decoding (pseudoword reading), phonological awareness and rapid-naming.

Result

The first and second questions were examined by comparing performance of participants to the tests' norms. Participants showed on average significant deficits in measures of reading fluency (decoding, word recognition, and text reading), as well as in phonological awareness (but not in RAN). Frequency analyses confirmed that these averages represent the vast majority of the sample in the case of reading fluency, as 83%-89% of the sample presented insufficient performance in these measures. A smaller proportion of the sample –approximately 50%, showed an additional weakness in phonological awareness, while a deficit in rapid-naming was observed in only 25% of the participants.

The examination of the second question indicated deficits also in reading accuracy (when compared to the norms). In addition, an advantage in this measure was obtained in reading of single words compared to decoding and text reading.

The third question was examined using hierarchical regression. Measures of reading fluency and accuracy explained a considerable amount of variance (13%, p < .001 and 20% p < .001, respectively) in reading comprehension beyond age, IQ and phonological awareness.

Together, these results indicate common difficulties of functional illiterate adults and dyslexic readers. Despite reading a transparent orthography, difficulties in both accuracy and fluency in the basic skills of reading appear to impose an obstacle on the ability of functional illiterates to comprehend texts.

 

Which cognitive capacities best predict learning success of adults who are functionally illiterate?

Aleksandar Bulajić1, Miomir Despotović2, Thomas Lachmann3, Maria Klatte4
1Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany; Faculty of Philosophy, University of Belgrade, Serbia, 2Faculty of Philosophy, University of Belgrade, Belgrade, Serbia, 3Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany; Facultad de Lenguas y Educación, Universidad Nebrija, Madrid, Spain, 4Cognitive and Developmental Psychology Unit, Centre for Cognitive Science, University of Kaiserslautern, Kaiserslautern, Germany

Theoretical background

Previous research investigating the relationship between cognitive capacities and success in formal learning focused mainly on children (Alloway, 2006; Alloway, 2009; Gathercole et al., 2004a; Gathercole, 2004b) and university students with and without learning difficulties (Alloway & Gregory, 2013; Gropper & Tannock, 2009; Ishak et al., 2012; McKenzie & Schweitzer, 2001). Some studies showed that working memory (WM) predicts academic success as strong, or even stronger than intelligence in children with or without learning difficulties (Alloway, 2009; Alloway & Alloway, 2010). The contribution of IQ and WM to explaining the variance of learning success has further been found to decreases with age and educational level (Abraham et al. 2012). However, when it comes to university students with learning difficulties such as dyslexia, IQ and WM were found to be strong predictors of learning success (Alloway & Gregory, 2013). Not much is known about the cognitive profile of functional illiterate adults who have little educational experience. The aim of the present study was to investigate the role(s) played by basic cognitive capacities (short-term memory [STM], WM and IQ) in learning success in this population.

Research question

In this study, we examined whether and to which extent the cognitive capacities of STM, WM, general and verbal intelligence predict learning success in functional illiterate adults who attend an adult basic education program (ABE). An additional question raised was which of these capacities make up for a larger individual contribution to the variance in learning success.

Method

Sixty-three functionally illiterate adults (Age: 17-28, M=21.8, SD=3.19; Sex: M=32, F=31) participated in the study. All were students of six Serbian ABE institutions, attending a 3-year intensive functional adult basic education formal programme. Participants had little to no completed grades of elementary school in childhood. Cognitive capacities (predictor variables) were measured by different STM and WM tests/tasks: Digit forward, Digit backward (VITI – WAIS III Serbian standardization), Faces I, Family pictures I (WMS III), and two STM/WM tasks created for the purpose of this study (KI-A1, KI-A5). In addition, a nonverbal test, Raven’s SPM was administered as a measure of general intelligence, while the verbal intelligence assessment included the Vocabulary and Comprehension tests from the VITI.

Learning success (criterion variable) was represented by the overall ABE average grade, i.e. learning success in various subjects (grade point average GPA), including Serbian language (literacy) and Mathematics. In addition, average grades in following subjects were taken as learning success measures: Serbian language, Mathematics, English language, Digital literacy, Applied natural sciences. These were used as an ecologically more relevant alternative to the literacy and basic skills testing.

Results

Correlation analyses and backward elimination regression analyses were conducted to determine the relationship between cognitive capacities and learning success. All cognitive measures were significantly related to GPA and subject grades, except for recognition of faces STM (Faces I). Results of the regression analyses suggest that the optimal model of predicting ABE students’ GPA includes two predictors: verbal intelligence and complex working memory (CWM). These two conjointly explain 34% of the GPA’s variance, while there is a greater contribution of verbal intelligence (18.2%) than CWM (6.7%) to learning success variance. The same two predictors explain even more variance of learning success for average grades in subject of Serbian language (literacy): 37.6% (verbal intelligence 15.6%, CWM 11%).

These findings express the importance of verbal intelligence for learning success, and indicate that WM is a critical predictor of learning success in functional illiterate adults. Furthermore, it indicates potential similarities of the pattern of cognitive predictors of literacy skills of ABE students and university students with learning difficulties (Alloway & Gregory, 2013).

 
9:00 - 10:45F9–1.19: Digitale Medien und Unterricht
1.19 
 

Lernen mit multiplen Repräsentationen bei Physik-Experimenten mit mobiler Videoanalyse - Einfluss auf Konzeptverständnis, kognitive Belastung und Emotion

Sebastian Becker, Pascal Klein, Jochen Kuhn

TU Kaiserslautern, Deutschland

1 Theoretischer Hintergrund
Für das Lernen in den Naturwissenschaften wird multiplen, externen Repräsentationsformen (meR) eine lernwirksame Rolle zugeschrieben (Tytler, Prain, Hubber & Waldrip, 2013), ihr Einsatz kann jedoch auch die kognitive Belastung der Lernenden erhöhen (De Jong et al., 1998). Technologie-Unterstützung kann dazu beitragen, diese Belastung zu reduzieren und damit die lernförderliche Wirkung von meR zu fördern (z.B. Horz, Schnotz, Plass, Moreno & Brünken, 2009). Plass und Kalyuga (2019) sehen in der Verarbeitung von (negativen) Emotionen eine Quelle zusätzlicher kognitiver Belastung. Auf diesem Wege könnte der multimediale Einsatz eine zusätzliche Reduktion der kognitiven Belastung durch eine positive Beeinflussung des emotionalen Zustands bedingen.
2 Fragestellung
Obwohl Experimente beim naturwissenschaftlichen Lernen eine Schlüsselrolle einnehmen (z.B. Haury & Rillero, 1994), sind Wirksamkeitsstudien zur Integration multimedialer Lernwerkzeuge in Experiment-basierten Lernprozessen noch immer rar gesät (Oliveira et al., 2019). Hillmayr, Reinhold, Ziernwald und Reiss (2017) konnten in einer Metastudie nachweisen, dass der Einsatz digitaler Medien zu einer Steigerung der Motivation und einer positiveren Einstellung gegenüber dem jeweiligen Fach führt. Es ist somit naheliegend, dass Technologie-Unterstützung auch einen positiven Einfluss auf den emotionalen Zustand der Lernenden hat.
Diese Studie fokussiert dem folgend auf die Untersuchung der Wirkung eines speziellen digitalen Lernwerkzeugs, der Tablet-PC-gestützten Videoanalyse, in einem Experiment-basierten Unterrichtsszenario bezüglich der folgenden vier Fragestellungen:

Führt der Multimedia-Einsatz ...

1. ... zu einer signifikanten Reduzierung der kognitiven Belastung?
2. ... zu einem besseren Verständnis der adressierten physikalischen Konzepte?
3. ... zu einer positiven Beeinflussung des emotionalen Zustands?
4. Kann ein kausaler Zusammenhang zwischen emotionalem Zustand und kognitiver Belastung statistisch gestützt werden?
3 Methode
In einer quasi-experimentellen Feldstudie (N = 216 matched samples) wurden Physik-Kurse der Eingangsphase der Sekundarstufe 2 an verschiedenen Gymnasien randomisiert einer Interventionsgruppe (IG, N = 108) und einer Kontrollgruppe (KG, N = 105) zugeordnet. Während die Lernenden der IG einen Tablet-PC mit einer Videoanalyse-Applikation zur Erfassung und Visualisierung von Messdaten verwendeten, nutzten die Lernenden der KG traditionelle Experimentiermaterialien. Nach einem Prä-Leistungstest (Becker, Klein, Gößling & Kuhn, 2019; Becker, Klein & Kuhn, 2018) folgte die Unterrichtssequenz, welche auf die Förderung des physikalischen Konzeptverständnisses durch kooperatives Experimentieren in Kleingruppen fokussierte. Unmittelbar anschließend beantworteten die Lernenden Fragebögen zur kognitiven Belastung (Cognitive Load Scale, Leppink, Paas, van der Vleuten, van Gog & van Merriënboer, 2013) und dem emotionalen Zustand (Achievement Emotions Questionnaire, Pekrun, Frenzel, Barchfeld & Perry, 2011; Pekrun, Götz, Titz & Perry, 2002) und absolvierten den Post-Leistungstest.
4 Ergebnisse
Mittels einer linearen Mischeffektmodellierung mit dem between-Faktor Lernbedingung und within-Faktor Zeit (Prä- und Posttest) konnte ein signifikanter Interaktionseffekt identifiziert werden (F(1, 214) = 19.00, p < 10-3 , η2 = 0.082, 1−β = 0.992). Eine Varianzanalyse der kognitiven Belastungsskala zeigte einen signifikanten Effekt zu Gunsten der IG bezüglich der lernirrelevanten Belastung (F(1,208) = 21.43, p < 10-3, η2 = 0.093, 1 − β = 0.997). Auch in der Varianzanalyse der Emotionsskala zeigten sich signifikante Effekte zu Gunsten der IG, sowohl für positive Emotionen (F (1, 207) = 10.54, p = 0.001, η2 = 0.048, 1−β = 0.902) als auch für negative Emotionen (F(1,207) = 16.70, p < 10-3, η2 = 0.076, 1−β=0.985). Darüber hinaus konnte theoriekonform mittels einer Strukturgleichungsanalyse eine positive Wirkung von negativen Emotionen (b = 0.663, se = 0.102, z = 6.238, p < 10-3, β = 0.714) sowie eine negative Wirkung von positiven Emotionen (b = −0.268, se = 0.110, z = −2.439, p = 0.015, β = −0.389) auf die lernirrelevante kognitive Belastung statistisch nachgewiesen werden.

Die lernförderliche Wirkung der Tablet-PC-gestützten Videoanalyse von Bewegungen können rekurrierend auf fundamentale Lerntheorien (DeFT(Ainsworth, 2006), CLT(Sweller, van Merriënboer & Paas, 2019), CTML(Mayer, 2005)) diskutiert werden. Der Wirkzusammenhang zwischen Emotionen und kognitiver Belastung kann darüber hinaus auf das ICALM Modell (Plass & Kaplan, 2016) theoretisch gestützt werden.



Zur Erfassung freizeitlichen Leseverhaltens junger Erwachsener: Eignet sich hierfür der Titelrekognitionstest?

Maximilian Pfost, Verena Schnabel, Franziska Locher

Otto-Friedrich-Universität Bamberg, Deutschland

Zentraler Einflussfaktor für die Entwicklung der Fähigkeit zum verstehenden Lesen von Texten ist die Aktivität des Lesens an sich, insbesondere das Lesen von Büchern (Anderson, Wilson & Fielding, 1988; Pfost, Dörfler & Artelt, 2013). Für die Erfassung von Leseaktivitäten hat sich dabei ein breites Spektrum an Methoden mit jeweils entsprechenden Vor- und Nachteilen etabliert. Neben retrospektiven Globalurteilen und textspezifischen Urteilen (vgl. Locher & Pfost, 2019) sowie Lesetagebüchern (z.B. Anderson et al., 1988; Nieuwenboom, 2008) haben vor allem auch die indirekten Messverfahren wie Titel- und Autorenrekognitionstests (TRT & ART; z.B. Schroeder, Segbers & Schröter, 2016; Stanovich & West, 1989) Eingang in die Forschung gefunden. Dabei müssen bei Rekognitionsverfahren Teilnehmende aus einer vorgegebenen Liste von Buchtiteln (TRT) beziehungsweise Autoren (ART) diejenigen kennzeichnen, die sie (wieder-)erkennen. Angenommen wird, dass dies ein Indikator für das Lesevolumen der Personen ist. Den Stellenwert dieser Tests in der Forschung verdeutlicht besonders die meta-analytische Arbeit von Mol und Bus (2011), welche knapp einhundert Studien, in denen entsprechende Rekognitionstests verwendet wurden, analysierte. Im Mittel zeigten sich in dieser Studie deutlich positive Zusammenhänge mit sprachlichen und schriftsprachlichen Kompetenzen. Nichtsdestotrotz bleibt die Frage, was genau diese indirekten Testverfahren tatsächlich erfassen, größtenteils ungeklärt. Zwar wird aus theoretischer Perspektive häufig der Vorteil der Vermeidung von Effekten sozialer Erwünschtheit von Verfechtern dieser Methode angeführt, dafür werden jedoch zahlreiche andere Verzerrungen (zum Beispiel bedeutet das Kennen eines Buchtitels nicht zwangsweise, dass das Buch auch gelesen wurde) in Kauf genommen. Aus diagnostischer Perspektive stellt sich daher die Frage nach dem Zusammenhang zwischen Testergebnissen aus dem TRT mit anderen Verfahren zur Erfassung von Leseverhalten. Darüber hinaus soll exploriert werden, in wie fern sich auch vergleichbare Zusammenhänge zu Konstrukten wie der Lesemotivation über verschiedene Messverfahren zeigen.

Zur Untersuchung dieser Fragestellungen wurde unter Berücksichtigung gängiger Verfahrensbeschreibungen (z.B. Masterson & Hayes, 2007) ein Titelrekognitionstest zusammengestellt. Dabei wurde darauf geachtet, dass neben populären „Klassikern“ auch aktuelle Buchtitel mitaufgenommen werden. Zusätzlich wurden, in Anlehnung an existierende Buchtitel, falsche nicht existente Buchtitel dargeboten. Zusammen mit anderen Maßen zur Erfassung des Leseverhaltens sowie weiteren, für die Leseentwicklung zentralen Variablen (z.B. Lesemotivation und Selbstwirksamkeitserwartung, Schulnoten) wurde dieser Test von zwei Stichproben Studierender (N = 91 und N = 35) aus dem humanwissenschaftlichen Fächerkanon bearbeitet. Es sei angemerkt, dass der Test aus der ersten Erhebung für die zweite Erhebung überarbeitet wurde, sodass zwei ähnliche, jedoch nicht identische TRTs im Einsatz waren.

Im Hinblick auf die interne Konsistenz und Reliabilität erweisen sich die beiden eingesetzten TRTs als ausreichend reliabel (u.a. Cronbachs α = .70/.76, Studie 1/2). Eine positive Korrelation korrekt erkannter Buchtitel (hit-rate) mit fälschlich „erkannten“ nicht existenten Buchtiteln (false-rate) von r =.31/.35 könnte ein Hinweis auf Antworttendenzen im Sinne einer Ja-sage-Tendenz sein. Bezüglich anderer etablierter Instrumente zur Erfassung des Leseverhaltens zeigen sich vielfach nur geringe Zusammenhänge. Mit einer Globaleinschätzung zur täglichen Lesezeit ergab sich eine statistisch nicht bedeutsame Korrelation von r = .10/-.06. Mit einer Einschätzung zur Anzahl gelesener Bücher in den letzten 12 Monaten fiel die Korrelation höher aus (r = .27, Studie 1). Für Angaben zur Lesezeit gemessen mittels elektronischem Lesetagebuch, zeigte sich eine Korrelation von r = .22 (ns., Studie 2). Auch in Hinblick auf Zusammenhänge mit weiteren Maßen wie der Lesefreude (r = .29, Studie 1) fielen die gefunden Zusammenhänge eher, insbesondere im Vergleich mit den Korrelationen basierend auf den Globalratings (r = 57, Studie 1), gering aus.

Die gefunden (tendenziell geringen) Zusammenhänge des TRTs mit verschiedenen anderen Maßen zum Leseverhalten machen deutlich, dass exploriert werden sollte, was genau dieses Verfahren eigentlich erfasst. Eine in der Diskussion bislang wenig berücksichtigte Frage ist beispielsweise, welche Rolle die Tatsache spielt, ob bestimmte Buchtitel verfilmt wurden, oder welchem Genre ein Buchtitel angehört.



Das virtuelle Arbeitsmittel Prozentband – Ergebnisse zu Lernerfolgsmaßen und Strategiewahl bei einer Interventionsstudie im gymnasialen Mathematikunterricht der Klasse 6

Alexander Willms, Ufer Stefan

Ludwig-Maximilians-Universität München, Deutschland

Forschungsstand
Im Zuge der Diskussion über die Digitalisierung an den Schulen wird der Einsatz von virtuellen Arbeitsmitteln im Mathematikunterricht als eine effektive Technik zum Aufbau von konzeptuellem Verständnis vorgeschlagen (Moyer-Packenham et al., 2013). Als zugrunde liegender Wirkmechanismus wird hierbei häufig die Verknüpfung verschieden strukturierter Darstellungen (Bruner, 1966; Duval, 2006) und der daraus resultierende Aufbau einer zum Arbeitsmittel strukturähnlichen mentalen Repräsentation genannt (Schnotz & Bannert, 2003). Als potentiell hilfreich gesehen wird hier auch, verschieden strukturierte Darstellungen in eine gemeinsame Visualisierung zu integrieren (Ainsworth, 2006). Ein alternativer Erklärungsansatz besteht in der Verwendung graphischer Darstellungen als Visualisierungsstrategie bei der Lösung der vorgegebenen Aufgabe, ohne zwingend eine mentale Repräsentation aufzubauen (Schukajlow, 2011).

Das Forschungsprojekt ViPro („Visualisierungen und Arbeitsmittel in der Prozentrechnung“) untersucht die Auswirkungen virtueller Arbeitsmittel am Beispiel einer tablet-basierten Version der sogenannten double number line (DNL, Prozentband). Diese besteht aus zwei Skalen, einer für Prozentwerte und einer für Prozentsätze. Beide Skalen sind verknüpfbar und jeweils durch das Ziehen mit dem Finger skalierbar.

Zur Bearbeitung einfacher Anwendungsaufgaben aus dem Themenbereich Prozentrechnung wird häufig eine Dreisatztabelle als übliche Darstellung herangezogen. Die double number line bietet eine alternative Darstellung für solche Aufgaben, die die Verhältnisse zwischen den in der Aufgabe gegebenen Größen visualisiert. Offen ist, unter welchen Bedingungen eine zusätzliche dynamische Visualisierung durch die double number line lernförderliche Wirkungen entfaltet.
Fragestellung
1. Hat die getrennte bzw. mit der Dreisatztabelle integrierte dynamische Visualisierung durch eine DNL im Vergleich zu Unterricht ohne eine solche Visualisierung positive Auswirkungen auf den Lernerfolg im Prozentrechnen?
2. Zeigen Lernende, die die DNL als Visualisierungsstrategie übernehmen, eine stärkeren Lernzuwachs im Prozentrechnen als Lernende, die dies nicht tun?
Methode
An der Studie im Prä-Post-Test-Design nahmen N=338 Schülerinnen und Schüler der sechsten Jahrgangsstufe an 14 Gymnasien in München und Umgebung teil. Für den Prä-Test wurde eine Skala zum Vorwissen zur Prozentrechnung (6 Items, z.B. „Berechne 30 % von 170.“) entwickelt.

Während der anschließenden 90-minütigen tablet-gestützten Intervention zum Thema „Erhöhter bzw. Verminderter Grundwert“ wurde jede Klasse zufällig in drei Gruppen geteilt. In der Kontrollgruppe wurde nur der Dreisatz zur Lösung von Aufgaben der Prozentrechnung thematisiert. In der Experimentalgruppe 1 wurde zusätzlich die DNL als eigenständige Visualisierung eingeführt, in der Experimentalgruppe 2 wurden die DNL und die Dreisatzdarstellung in einer integrierten Visualisierung verwendet.

Im Post-Test wurden 9 Items zum Thema „erhöhter bzw. verminderter Grundwert“ entwickelt (z.B. „Der Preis einer CD wird um 14 % reduziert. Nun kostet die CD noch 12,90 €. Wie viel kostete die CD ursprünglich?“). Für jede Lösung wurde auch kodiert, ob eine double number line zur Visualisierung genutzt wurde.
Ergebnisse
Die entwickelten Skalen zeigen gute interne Konsistenzen (α=.76-.84). In die Analysen mit linearen Mischmodellen wurden neben dem Gruppenfaktor das Vorwissen als Kovariate einbezogen. Klassenunterschiede wurden mit einem Zufallsfaktor kontrolliert.

Im Prä-Test zeigten sich keine signifikanten Unterschiede zwischen den Gruppen (F(2;310,7)=0,09; p=.91). Im Post-Test zeigten sich ebenfalls keine signifikanten Unterschiede zwischen den Gruppen (F(2;275,9)=0,19; p=.82).

Nur eine Lernende der Kontrollgruppe nutzte die DNL im Post-Test als Visualisierung. Lernende der Experimentalgruppen, die die DNL im Post-Test mindestens einmal als Visualisierung einsetzten (39 % der Lernenden), zeigten einen stärkeren Lernzuwachs als Lernende, die die DNL nicht nutzen (B=0.065, p<.05), jedoch keine signifikant besseren Leistungen im Prä-Test (B=-0.042, p=.27).
Diskussion
Die Studie weist darauf hin, dass die Integration der double number line mit der Dreisatzdarstellung nicht per se relevant für einen Leistungszuwachs in der Prozentrechnung ist. Vielmehr scheint relevant zu sein, ob die Lernenden die Struktur der double number line für eigene Visualisierungsstrategien übernehmen oder nicht. Weitere Forschung sollte hier untersuchen, unter welchen instruktionalen Rahmenbedingungen die Lernenden zur Verwendung hilfreicher Visualisierungen angeregt werden können und was die Lernenden auszeichnet, die diese Visualisierungsstrategie nutzen.



Improving socio-emotional competencies for building productive teacher-student relationship. Results of two experimental studies on a video-based online training program

Michel Knigge, Karsten Krauskopf, Simon Wagner

Universität Potsdam, Deutschland

Relationship quality between teachers and their students are a critical aspect for wellbeing and effective learning in school. Accordingly, teacher training should promote competencies for creating and maintaining positive relationships in the classroom. There is theory and evidence that socio-emotional competencies (SEC) of teachers are crucial for the establishment of productive teacher-student relationships.

Jennings and Greenberg (2009) developed the prosocial classroom model that states with reference to a broad array of empirical evidence that teachers’ SEC and their well-being influence healthy teacher-student relationships alongside an effective classroom management, and an effective social and emotional learning environment for students. However, theoretically social aspects of SEC can be divided into cognitive and affective components. Such distinctions are rooted in social psychology (Davis, 1983a; Kanske et al., 2016) and two main facets can be described: (cognitive) perspective taking (PT) and (affective) empathic concern (EC). While PT describes the ability to assess situations from the perspective of that of another person, EC refers to a person’s tendency to experience similar emotions as an observed person. As research indicates, PT and EC can be quite powerful and they are distinct in their effects. For example, Vorauer & Quesnel (2016) showed in a study that if a member of a majority group shows high PT toward a member of a minority group, the latter reports more positive self-descriptions. But there is no such effect, if the majority group shows higher levels of EC. Also there is evidence for interactions between the constructs in such a way that higher EC can inhibit PT in affectively loaded situations (Kanske et al., 2016). Furthermore, there is initial evidence regarding teacher training that EC can be a positive predictor for developing higher teaching specific self-efficacy (Krauskopf & Knigge, in print). Accordingly, EC and PT seem to interact in rather complex ways in affective learning.

In Germany, corresponding affective learning objectives are rather underrepresented in the university based teacher training programs. Accordingly, there are attempts to fill this gap. However, explicitly intended socio-emotional learning in teacher education is scarce. The Helga-Breuninger-Foundation developed a video-based online training (Intus3) that intends to focus on student teachers’ interpersonal competencies. By reflecting on staged videos, participating (pre-service) teachers are supposed to increase their awareness of interpersonal cues by training perspective taking, empathy and reflection of intuitive responses. Although this training is well designed, there is only little empirical evidence in general and so far no experimental research investigating the effects of Intus3.

Accordingly, we investigated whether this program is able to improve the capacities of student teachers’ interpersonal competencies, affective well-being and affective attitudes towards challenging students.

We conducted two randomized experimental studies (n1=132, n2=242) within lectures in teacher education at the University of Potsdam introducing the basics of inclusive education in two consecutive semesters. We compared groups first working with Intus3 to waiting control groups that wrote an expository text based on empirical research discussing the relevance of teacher-student-relationships with a longitudinal design with four measurement points.

Latent change models showed that prior work with Intus3 showed few effects but complex effects in comparison the prior text work groups. In the larger and extended study 2 an increase of empathic concern was significant after the prior work with Intus3.

The results will be discussed with the perspective of the potential of further development of online training courses for affective learning for teachers and teacher students.

 
9:00 - 10:45F9–1.20: Lernstrategien und Lernen in der Grundschule
1.20 
 

Förderung der Variablenkontrollstrategie durch strukturierte und angeleitete Experimente bei 6- bis 7-Jährigen

Timo Reuter1, Anke Maria Weber1, Julia Flottmann2, Miriam Leuchter1

1University Koblenz-Landau, Deutschland; 2Westfälische Wilhelms-Universität, Münster, Deutschland

Theoretischer Hintergrund

Frühe naturwissenschaftliche Bildung zielt neben der Vermittlung von inhaltsbezogenem Wissen auf die Förderung von Prozesswissen (Dunbar & Klahr, 2012). Dazu zählt das Planen von Experimenten (Zimmerman & Klahr, 2018). Hierbei ist die Variablenkontrollstrategie (VKS) von zentraler Bedeutung (Chen & Klahr, 1999). Kinder verstehen bereits ab einem Alter von vier Jahren, dass sie für ein aussagekräftiges Experiment die interessierende Variable manipulieren müssen (van der Graaf, Segers & Verhoeven, 2015), jedoch haben sie über das Grundschulalter hinaus Schwierigkeiten, andere beteiligte Variablen zu kontrollieren (Bullock & Ziegler, 1999). Diese Fähigkeit zur Variablenkontrolle kann zum einen durch explizit auf die VKS zielende Trainings verbessert werden (Schwichow, Croker, Zimmerman, Höffler & Härtig, 2016). Zum anderen zeigen Schalk, Edelsbrunner, Deiglmayr, Schumacher und Stern (2019), dass 8- bis 11-Jährige die VKS auch implizit lernen können, wenn sie im Rahmen von guided-inquiry wiederholt und über einen längeren Zeitraum valide Experimente durchführen, ohne dabei aber gezielt auf die VKS hingewiesen zu werden. Bislang wurde noch nicht untersucht, ob auch jüngere Kinder die VKS durch wiederholtes Experimentieren im Rahmen von guided-inquiry lernen können, ohne dabei gezielt auf die VKS hingewiesen zu werden. Darüber hinaus stellt sich die Frage, ob ein solcher Lerneffekt bereits nach kurzer Interventionszeit auftritt.

Fragestellung

Verbessert ein 60-minütiger Unterricht mit strukturierten und angeleiteten Experimenten – jedoch ohne explizite Instruktion zur VKS – die Fähigkeit von 6- bis 7-Jährigen, die VKS anzuwenden?

Methode

An der Studie mit experimentellem Prä-Post-Follow-Up-Test-Design nahmen N=145 Kinder (51% männlich, MAlter=6.57 Jahre, SDAlter=.322) aus zehn ersten Klassen teil. Die Klassen wurden in Halbklassen geteilt und zufällig einer von drei experimentellen Bedingungen zugewiesen. Kinder der Experimentalgruppe (EG) 1 führten sechs strukturierte und angeleitete Experimente im Kontext der schiefen Ebene zur potentiellen Energie durch, während Kinder der EG 2 vergleichbare Experimente entweder im Kontext von Schubkarren (einseitige Hebel) oder Statik (Bauklötze) durchführten. Die Experimente regten die Kinder dazu an, Vermutungen aufzustellen, Versuchsanordnungen zu vergleichen, Ergebnisse zu beobachten und zu interpretieren. Eine Kontrollgruppe (KG) erhielt regulären Unterricht im nicht naturwissenschaftlichen Bereich. Die Fähigkeit der Kinder, die VKS anzuwenden, wurde mit elf Multiple-Choice-Items gemessen (ωposttest = .70). Die Items zeigten jeweils ein valides (2 Punkte), ein konfundiertes (1 Punkt) und kein Experiment (0 Punkte) und wurden für die Auswertung zu einem Score verrechnet. Fünf Items waren im Testkontext der schiefen Ebene (Gegenstand des Unterrichts in EG 1), sechs Items im Kontext von Schwimmen und Sinken (weder in EG 1 noch in EG 2 Gegenstand des Unterrichts). Die Durchführung erfolgte in den Klassenräumen durch geschulte Versuchsleiter/innen.

Ergebnisse

Kinder, die Unterricht mit strukturierten und angeleiteten Experimenten erhielten (EG 1 und EG 2), verbesserten sich in der VKS, wohingegen Kinder der KG keine Veränderung erkennen ließen. Ein Wachstumskurvenmodell zeigte für den Testkontext der schiefen Ebene einen signifikanten Effekt der Zeit (γ10=0.06, p=.044) und einen signifikanten Unterschied zwischen EG 1 und KG über die Zeit (γ11=−0.24, p < .001), nicht aber zwischen EG 1 und EG 2. Im Testkontext von Schwimmen und Sinken ergab ein Wachstumskurvenmodell einen signifikanten Effekt der Zeit (γ10=0.11, p =.003). Deskriptiv verbesserten sich auch hier beide EG, während die KG konstant blieb. Jedoch waren die Gruppenunterschiede zu klein, um statistisch signifikant zu sein. Diese Ergebnisse deuten darauf hin, dass eine 60-minütige Unterrichtsstunde, in der die Kinder strukturierte und angeleitete Experimente durchführten, zu einer Verbesserung der VKS-Fähigkeit führte. Offenbar gelang es den 6- bis 7-jährigen Kindern unabhängig vom Kontext der Experimente eine übergeordnete Repräsentation des Funktionsprinzips der Variablenkontrolle aufzubauen und dieses Prinzip unabhängig vom Testkontext anzuwenden. Limitationen der Studie sowie theoretische und praktische Implikationen werden diskutiert.



Förderung der adaptiven Strategiewahl durch verschachteltes Lernen im Mathematikunterricht der Grundschule

Lea Nemeth, Timo Flückiger, Katharina Werker, Julia Arend, Frank Lipowsky

Universität Kassel, Deutschland

Hintergrund

Forschungsergebnisse zeigen, dass Grundschüler*innen nach der Einführung der schriftlichen Subtraktion selten adaptiv rechnen, sondern das schriftliche Normalverfahren häufig als Universalstrategie nutzen (Selter, 2001). Ein vielversprechender Ansatz, den adaptiven Strategieeinsatz von Lernenden zu fördern, stellt das verschachtelte Lernen dar. Verschachteltes Lernen (interleaved pratice) – d.h. die abwechselnde Behandlung von Inhalten (abcdabcdabcdabcd) – kann im Vergleich zur häufig anzutreffenden geblockten Behandlung von Lerninhalten (aaaabbbbccccdddd) als wünschenswerte Erschwernis beim Lernen (Bjork & Bjork, 2011; Dunlosky et al., 2013) und damit als Strategie zur kognitiven Aktivierung von Lernenden begriffen werden (Lipowsky et al., 2019). Das Verschachteln der Lerninhalte geht mit kognitiv anspruchsvollen Diskriminations- und Vergleichsprozessen einher, wodurch der Erwerb nicht nur prozeduralen, sondern auch konditionalen Wissens unterstützt werden kann (Birnbaum et al., 2013; Brunmair & Richter, in press; Ziegler & Stern, 2014). Aufgrund der herausfordernden kognitiven Prozesse, die durch das verschachtelte Lernen evoziert werden, kann angenommen werden, dass insbesondere leistungsstärkere Schüler*innen sowie Lernende, die mehr Freude an der Auseinandersetzung mit kognitiv anspruchsvollen Aufgaben haben (Need for Cognition, NFC), profitieren.

Fragestellungen

Im vorliegenden Beitrag wird überprüft, ob durch das verschachtelte Behandeln von Subtraktionsstrategien die Adaptivität sowie die Korrektheit der Lösungen stärker gefördert werden können als durch ein geblocktes Vorgehen. Zudem wird geprüft, ob das Vorwissen und der NFC der Schüler*innen einen Einfluss auf die Lernzuwächse haben.

Methode

In der experimentellen Studie wurden die verschachtelte und die geblockte Lernumgebung im Mathematikunterricht von 12 Grundschulklassen (N = 236) des 3. Schuljahres implementiert. Hierbei wurden die Lernenden jeder Klasse randomisiert aufgeteilt, sodass eine Klassenhälfte die Subtraktionsstrategien geblockt erlernte und die andere verschachtelt. Die Intervention umfasste 14 Unterrichtsstunden und wurde von geschulten Mitarbeitern*innen durchgeführt. In der verschachtelten Lernbedingung wurden die behandelten Subtraktionsstrategien (vier halbschriftliche und das schriftliche Normalverfahren) abwechselnd behandelt und von den Schülern*innen hinsichtlich ihrer Adaptivität für bestimmte Aufgaben verglichen. In der geblockten Bedingung wurden die Subtraktionsstrategien nacheinander behandelt und die Charakteristika jeder Strategie erarbeitet, bevor die nächste Strategie thematisiert wurde.

Als abhängige Variablen wurden u.a. die Korrektheit und die Adaptivität untersucht. Diese wurden mit einem Rechenstrategietest zu vier Messzeitpunkten (T1: Prätest; T2: Posttest; T3: Follow-up-Test 1; T4: Follow-up-Test 2) erfasst. Geschulte Kodierer*innen schätzten für jede Aufgabe die Adaptivität der Strategien ein (κw ≥ .63). Als mögliche moderierende Variablen wurden das vor der Intervention erhobene arithmetische Vorwissen sowie der NFC einbezogen und deren Effekte auf den Ausgangswert und den Lernzuwachs untersucht.

Ergebnisse

Anhand von quadratischen Wachstumskurvenmodellen kann gezeigt werden, dass die Lernbedingung prädiktiv für die Lernzuwächse in der Korrektheit und in der Adaptivität ist: Die Schüler*innen der verschachtelten Lernbedingung weisen zu T2, T3 und T4 in beiden abhängigen Variablen höhere Werte auf.

Mehrgruppen-Wachstumskurvenmodelle (verschachtelt vs. geblockt) mit dem arithmetischen Vorwissen und dem NFC als Prädiktoren ergeben folgende Befunde: Für die abhängige Variable Korrektheit zeigt sich in beiden Lernbedingungen ein positiver Einfluss des arithmetischen Vorwissens auf den Ausgangswert, jedoch nicht für den NFC. Der Entwicklungsverlauf wird weder in der geblockten noch in der verschachtelten Bedingung durch das arithmetische Vorwissen und den NFC beeinflusst.

In Bezug auf die Adaptivität zeigt sich, dass der Ausgangswert sowohl in der geblockten als auch der verschachtelten Bedingung lediglich durch das arithmetische Vorwissen positiv beeinflusst wird. Zudem geht ein höherer NFC mit einem stärkeren Anstieg der adaptiven Strategiewahl in der verschachtelten Bedingung einher, während das arithmetische Vorwissen den Entwicklungsverlauf in der geblockten Bedingung positiv beeinflusst.

Diskussion

Die Studie zeigt, dass verschachteltes Lernen und die Anregung zum Vergleichen ein hohes Potential haben, prozedurales Wissen und die Wahl adaptiver Strategien von Drittklässlern zu fördern. Von diesem Vorgehen profitieren alle Lernende unabhängig ihres Vorwissens. Demgegenüber wirkt sich die Freude an der Auseinandersetzung mit kognitiv anspruchsvollen Aufgaben moderierend auf den Lernzuwachs in der Adaptivität beim verschachtelten Lernen aus.



Individualisierte Lerngelegenheiten im frühen naturwissenschaftlichen Sachunterricht der Grundschule. Ergebnisse einer experimentellen Interventionsstudie

Ann-Kathrin Laufs, Sebastian Kempert

Universität Potsdam, Deutschland

Theoretischer Hintergrund

Kindern mit unterschiedlichen Lern- und Entwicklungsvoraussetzungen die Teilhabe am Unterricht zu ermöglichen, ist ein zentrales Ziel bildungspolitischer und pädagogischer Bemühungen. Bei der Ausgestaltung von Lernprozessen im heterogenen Klassenzimmer haben sich verschiedene Strategien individueller Förderung etabliert (Dumont, 2019). Ein Vorgehen, welches das Potenzial hat adaptiv auf individuelle Voraussetzung einer heterogenen Schülerschaft einzugehen, ist die Kontextualisierung von Lernaufgaben anhand von individuellen Interessen der Kinder (Walkington & Hayata, 2017). Sowohl das mit den Interessengegenständen verbundene Vorwissen als auch die damit verbundene emotional-motivationale Orientierung stellen förderliche Bedingungen für Lernprozesse dar (Krapp & Prenzel, 2011) und können insbesondere für lernschwache Kinder den Zugang zum Lehrgegenstand erleichtern.

Der positive Zusammenhang von (Fach-)Interesse und Lernen wurde bisher insbesondere in den Bereichen Mathematik und Textlernen untersucht und empirisch belegt (z. B. Jansen, Lüdtke & Schroeders, 2016; Schiefele, Krapp & Schreyer, 1993; Walkington, 2013). Empirische Studien zu den zugrundliegenden kognitiven Mechanismen, z. B. zur Rolle des Arbeitsgedächtnisses, sind jedoch selten und in ihren Ergebnissen widersprüchlich (Krapp, 2010). Zudem fehlen Studien, welche das Potenzial des Einbezugs individueller Interessen in die Vermittlung von Lerninhalten im Bereich des frühen naturwissenschaftlichen Unterrichts der Grundschule betrachten.

Fragestellung

In einem aktuellen DFG-Forschungsprojekt gehen wir daher der Frage nach, inwieweit sich außerschulische Interessen von Grundschulkindern eignen, um Vermittlungs- und Lernvorgänge im Lernfeld Sachunterricht durch Kontextualisierung zu individualisieren und Lernerfolge positiv zu beeinflussen.

Methode

In einem experimentellen Pre-Post-Interventionsdesign erfassen wir die außerschulischen Interessen von N=158 Grundschulkindern der 3. und 4. Jahrgangsstufe. Im Anschluss erhalten die Kinder in Kleingruppen zwei Lerneinheiten zur Vermittlung einer naturwissenschaftlichen Experimentierstrategie (die sog. Variablenkontrollstrategie [VKS], Chen & Klahr, 1999). Die Experimentalgruppe (EG) erhält eine ihrer außerschulischen Interessen entsprechend kontextualisierte Lerneinheit, während die Kontrollgruppe (KG) eine Vermittlung in einem Standardsetting (Magnetismus) erhält. Eine unbehandelte Kontrollgruppe (uKG) erhält im relevanten Zeitraum keine Förderung.

Neben der Erfassung des Verständnisses der VKS werden in der Studie auch sprachliche und kognitive Variablen erhoben. Im vorliegenden Beitrag soll die Implementation einer interessensbasierten Intervention im frühen naturwissenschaftlichen Sachunterricht, sowie mögliche Effekte des Interesseneinbezugs auf den Lernerfolg berichtet werden. Weiterhin werden die sprachlichen und kognitiven Variablen der Kinder in ihrer Rolle als mögliche Moderatoren analysiert.

Ergebnisse

Erste Analysen zeigen, dass hinsichtlich des Interesses ein signifikanter Unterschied zwischen EG und KG besteht: Die EG weist ein durchschnittlich höheres Interesse an den Kontexten (d=1.5) und am Konzept der VKS (d=.86) auf. Darüber hinaus weist die EG sowohl beim Verständnis der Transferaufgaben (d=.40) als auch bei der Bewertung eines kontrollierten Experiments (d=.39) signifikant bessere Ergebnisse als die KG auf. Das höhere Interesse begünstigt vermutlich eine tiefergehende Auseinandersetzung mit dem Lerninhalt.

Die Relevanz der Ergebnisse für die Gestaltung individualisierter und inklusiver Unterrichtsangebote und mögliche Limitationen der Studie werden abschließend diskutiert.

 
9:00 - 10:45F9–S12: Effekte von Feedback auf Leistung
S12 
 

Der Effekt von Unterrichtsfeedback von Schulleitungen auf die von Schüler/-innen wahrgenommene Unterrichtsqualität – Ergebnisse einer Interventionsstudie

Christopher Kellermann1, Holger Gärtner2, Max Nachbauer1, Felicitas Thiel1

1Freie Universität Berlin; 2Institut für Schulqualität der Länder Berlin und Brandenburg e.V.

Theoretischer Hintergrund

Der Lernerfolg von Schüler/-innen hängt maßgeblich von der von Lehrpersonen gestalteten Lernumgebung und somit von der Qualität des angebotenen Unterrichts ab (Muijs et al., 2014). Unterrichtsfeedback von Schulleitungen wird als erfolgversprechende Maßnahme diskutiert, die zu einer Steigerung von Unterrichtsqualität beitragen kann (Kraft, Blazar & Hogan, 2018; Ovando & Ramirez, 2007; Taylor & Tyler, 2012). Dass Unterrichtsfeedback von Schulleitungen jedoch nicht per se einen positiven Effekt auf die Unterrichtsqualität haben muss, legen die Ergebnisse einer Meta-Analyse aus der arbeitspsychologischen Feedbackforschung nahe (Kluger & DeNisi, 1996). Die aus der Meta-Analyse abgeleitete Feedback Intervention Theory (FIT) postuliert, dass die Wirksamkeit von Feedback maßgeblich von der Gestaltung der Feedback-Intervention abhängt.

In der vorliegenden Studie wurde basierend auf der FIT und weiteren Befunden der arbeitspsychologischen Feedbackforschung eine Feedback-Intervention entwickelt, deren Ziel die Steigerung von Unterrichtsqualität ist. Schulleitungen beurteilten den Unterricht ihrer Lehrpersonen mit einem standardisierten Beobachtungsinstrument hinsichtlich der unterrichtlichen Anforderungen Unterstützung des Wissenserwerbs, Motivierung und Klassenmanagement. Insgesamt umfasst das Beobachtungsinstrument 14 Unterrichtsmerkmale (Nachbauer, Thiel, Gärtner & Kellermann, eingereicht). Ausgehend von den Unterrichtsbeobachtungen gaben die Schulleitungen den beobachteten Lehrpersonen ein strukturiertes Feedback, welches drei Phasen umfasste (Hattie & Timperley, 2007): In der Phase Feed-Up haben die Schulleitungen den Lehrpersonen die Bewertungskriterien der Unterrichtsbeurteilung beschrieben. In der Phase Feedback-Back wurden ausgewählte Stärken und Schwächen des Unterrichts zurückgemeldet. In der Phase Feed-Forward wurden schließlich konkrete Handlungsempfehlungen benannt. Die Schulleitungen wurden im Rahmen eines Rater- und Feedbacktrainings in der Unterrichtsbeurteilung und der Anwendung des Feedbackverfahrens geschult. Folgende Forschungsfrage soll untersucht werden: Hat ein Unterrichtsfeedback von Schulleitungen einen Effekt auf die von Schüler/-innen wahrgenommene Unterrichtsqualität.

Methode

Der Studie liegt ein quasi-experimentelles Prätest-Posttest-Design zugrunde. Während die Lehrpersonen der Interventionsgruppe (IG) ein Unterrichtsfeedback von ihrer Schulleitung erhalten haben, wurde den Lehrpersonen der Kontrollgruppe (KG) kein Unterrichtsfeedback gegeben. Die Stichprobe umfasst N = 53 Lehrpersonen (IG: N = 26, KG: N = 27 Lehrpersonen) und eine Klasse je Lehrperson (N = 1069 Schüler/-innen; IG: N = 518, N = 551). Mit einem Lehrerfragebogen wurden diverse Kontrollvariablen auf Klassenebene erhoben. Als abhängige Variable wurde mit einem Schülerfragebogen die Unterrichtsqualität hinsichtlich der im Beobachtungsinstrument operationalisierten 14 Unterrichtsmerkmale vor und nach der Intervention erfasst.

Die Effekte des Unterrichtsfeedbacks auf die von den Schülern/-innen wahrgenommene Unterrichtsqualität wurde mithilfe von Mehrebenen-Regressionsanalysen überprüft (Schüler/-innen in Klassen). Um mögliche Unterschiede in den Ausgangswerten der IG und KG auszugleichen und den Effekt weiterer Maßnahmen der Unterrichtsentwicklung (z. B. kollegiales Feedback, besuchte Fortbildungen) auf die von den Schülern/-innen wahrgenommene Unterrichtsqualität zu kontrollieren, wurden diverse Kovariate auf Schüler- und Klassenebene modelliert. Die Berechnungen erfolgten mit der Software Mplus (Muthén & Muthén, 2017). Fehlende Werte wurden mithilfe der Methode Full Information Maximum Likelihood (FIML) geschätzt (Enders, 2001).

Ergebnisse und Diskussion

Die Ergebnisse der Mehrebenen-Regressionsmodelle zeigen, dass die Feedback-Intervention bei Kontrolle diverser Kovariate auf Schüler- und Klassenebene bei 5 der 14 untersuchten Unterrichtsmerkmale signifikante positive Haupteffekte (p < .10) auf die von Schüler/-innen wahrgenommene Unterrichtsqualität hat (0.23 < β < 0.30). Schüler/-innen, die von Lehrpersonen der IG unterrichtet wurden, schätzten die Unterrichtsqualität bezogen auf diese fünf Unterrichtsmerkmale (Unterstützung von Verstehensprozessen, Förderung der Selbstwirksamkeit, Individualisierung, lerndienliches Unterrichtsklima und Gruppenaktivierung) nach der Intervention signifikant besser ein als Schüler/-innen von Lehrpersonen der KG (bei Kontrolle der Ausgangswerte). Ein weiterer für die Schulentwicklungsforschung interessanter Befund ist, dass neben dem Feedback der Schulleitungen auch ein Feedback von Kollegen/-innen einen Effekt auf einzelne Unterrichtsmerkmale hatte.

Abschließend werden Überlegungen zu möglichen Wirkmechanismen von positivem und negativem Feedback sowie zu den Vor- und Nachteile eines Schulleitungs- bzw. eines kollegialen Feedbacks angestellt. Als Limitationen werden das Fehlen weiterer Kontrollvariablen auf Schüler- und Klassenebene sowie die bei der relativ kleinen Stichprobe begrenzte statistische Power diskutiert.



Was bringen Probeklausuren? Effekte wiederholten Abrufs im Semesterverlauf und die Bedeutung von Feedback

Marion Händel, Nick Naujoks, Bettina Harder

Universität Erlangen-Nürnberg, Deutschland

Theoretischer Hintergrund

In universitären Lehrveranstaltungen wird das vermittelte Wissen in der Regel gegen Semesterende geprüft, in vielen Fächern anhand von multiple-choice Klausuren. Um Lernende bei der Vorbereitung auf diese Klausuren zu unterstützen, bieten sich Probeklausuren an. Probeklausuren lassen sich themenbezogen in den Semesterverlauf integrieren (Cogliano, Kardash & Bernacki, 2019) und erfordern einen Wissensabruf (Roediger & Karpicke, 2006). Wiederholter Abruf gilt als förderlich für die Behaltensleistung (vgl. die Metaanalyse von Adesope, Trevisan & Sundararajan, 2017) und wird unter dem sogenannten Testing Effekt beschrieben. Neben diesem leistungsförderlichen Effekt liefern aktuelle Arbeiten Hinweise darauf, dass wiederholter Abruf auch die metakognitive Urteilsgenauigkeit positiv beeinflusst (Cogliano et al., 2019; Tullis, Finley & Benjamin, 2013), d. h. Lernende erbringen nicht nur bessere Leistungen, sondern können ihre Leistungen anhand metakognitiver Urteile auch akkurater einschätzen. Bisherige Studien zum Testing Effekt untersuchten den Einfluss der wiederholten Bearbeitung (identischer) Testaufgaben auf die Testleistung meist in Laborsettings. Unklar bleibt neben der Übertragbarkeit der Befunde auf natürliche Lernsettings hierbei auch die Rolle von Feedback.

Fragestellung

Der aktuelle Beitrag beschäftigt sich mit dem Einfluss wiederholten Abrufs anhand variierender Aufgaben in authentischen Lernsituationen und nimmt darüber hinaus eine detaillierte Untersuchung hinsichtlich Selbsteinschätzungen anhand metakognitiver Urteile vor. Insgesamt werden drei Fragestellungen untersucht. Zunächst soll untersucht werden, ob sich der Testing Effekt in einem natürlichen universitären Lernsetting replizieren lässt, d. h. ob wiederholter Abruf sich förderlich auf die Klausurleistung auswirkt. Darüber hinaus soll geprüft werden, ob die Effekte wiederholten Abrufs auf die metakognitive Urteilsgenauigkeit transferieren, d. h. ob die Lernenden ihre Leistung auch akkurater einschätzen können. Schließlich soll geprüft werden, ob die Effekte durch die Gabe von fachlichem Feedback moderiert werden.

Methode

Zur Untersuchung der Fragestellungen wurden zwei Studien durchgeführt, die in zwei unterschiedliche Lehrveranstaltungen (Psychologie für Lehramtsstudierende I bzw. II) eingebettet waren. In der ersten Semesterwoche (Prätest) wurde jeweils das Vorwissen inklusive itemspezifischer metakognitiver Urteile erhoben. Anschließend wurden im Semesterverlauf jeweils vier Probeklausuren implementiert, die sich auf die Inhalte der vorausgehenden Wochen bezogen. In der Abschlussklausur wurden wie im Prätest itemspezifische metakognitive Urteile erfragt. Alle Tests sowie die Abschlussklausur waren im multiple-choice Format gestellt. In Studie 1 (N = 201) wurde kein fachliches Feedback dargeboten. Zur Replikation der Befunde in einer anderen Lehrveranstaltung wurde eine zweite Studie durchgeführt. Studie 2 diente darüber hinaus der Aufklärung eines potentiellen Moderatoreffekts von Feedback und wurde daher in zwei Semestern durchgeführt, einmal mit und einmal ohne fachliches Feedback. Die Effekte des wiederholten Abrufs auf die Klausurleistung und mehrere Maße der metakognitiven Urteilsgenauigkeit wurden anhand separater hierarchischer Regressionen analysiert. Dabei geht im ersten Schritt die jeweilige Prätestvariable ein und im zweiten Schritt die kontinuierlich erfasste Teilnahme an den Probeklausuren. Zur Prüfung eines Moderationseffekts wird das Feedback als Moderatorvariable untersucht.

Ergebnisse

Hierarchische Regressionen in Studie 1 zeigten, dass zusätzlich zum Vorwissen (β = .25, p < .01) die Teilnahme an den Probeklausuren einen signifikanten Prädiktor der Klausurleistung darstellt (β = .27, p < .01). Ebenfalls zeigten sich unter Kontrolle der jeweiligen Genauigkeitsmaße aus dem Prätest signifikante Effekte auf die metakognitive Urteilsgenauigkeit bezüglich der Klausurfragen (.16 ≤ β ≤ .18, p < .05), d. h. je häufiger sich die Studierenden selbst testeten, desto besser waren sie in der Abschlussklausur und desto genauer konnten sie ihre Klausurleistung einschätzen. Datenerhebung und -analyse zur Replikation des wiederholten Abrufs ohne Feedback (Studie 2) laufen aktuell. Die Ergebnisse zum wiederholten Abruf mit Feedback aus Studie liegen bereits vor – auch hier zeigen sich Effekte des wiederholten Abrufs, die jedoch bezüglich der verschiedenen Maße metakognitiver Urteilsgenauigkeit unterschiedlich ausfallen und darauf hindeuten, dass dem Testing Effekt auf Leistung und metakognitive Urteilsgenauigkeit möglicherweise unterschiedliche Mechanismen zugrunde liegen. Weiteren Aufschluss werden die geplanten Moderatoranalysen zur Feedbackwirkung geben.



Karriereorientierung oder Interesse? Eine empirische Prüfung des Erwartungs-Wert-Modells von Eccles et al. für den Bachelor-Master Übergang

Susanne Bergann, Irmela Blüthmann, Martin Neugebauer, Rainer Watermann

Freie Universität Berlin, Deutschland

Bildungsentscheidungen, wie der Übergang in ein Masterstudium, werden meist mit Hilfe von Erwartungs-Wert-Modellen erklärt (z.B. Eccles et al. 1983; Erikson & Jonsson 1996). Angesichts verschiedener Handlungsalternativen entscheiden sich Akteure für die Option, die unter Abwägung der subjektiv erwarteten Kosten und Erträge (Wertkomponente) sowie der individuellen Erfolgsaussichten (Erwartungskomponente) am vielversprechendsten erscheint. Die Wertzuschreibung kann dabei sowohl intrinsisch (z. B. Interesse) als auch instrumentell (z. B. Nutzen für die berufliche Zukunft) sein. Die Kosten können sowohl monetäre (Erikson & Jonsson 1996; Esser 1999) als auch psychologische Kosten (z.B. Aufwand/Anstrengung; Eccles et al. 1983; Wigfield & Eccles 2000) sein.

Erwartungs-Wert-Modelle sind auch für die Entscheidung am Bachelor-Master-Übergang tragfähig. Studien zeigen, dass sowohl die antizipierten instrumentellen Erträge und monetäre Kosten als auch insbesondere die Erfolgserwartung die Entscheidung, ein Masterstudium aufzunehmen, beeinflussen (Lörz et al. 2015; Neugebauer et al. 2016; Kretschmann et al. 2017; Bergann et al., 2019). Unklar ist aber bislang, welche Rolle die intrinsische Wertzuschreibung sowie psychologische Kosten spielen.

Zudem ist zu den Antezedenzien der Erwartungs- und Wertkomponenten wenig bekannt. In Anlehnung an das Erwartungs-Wert-Modell von Eccles konnten Bergann et al. (2019) zeigen, dass domänenspezifische Leistungsselbsteinschätzungen über Noten hinaus wichtige Prädiktoren der Erwartungskomponente sind. Neben allgemeinen fachlichen Leistungsselbsteinschätzungen scheinen hier insbesondere Selbsteinschätzungen in Bezug auf wissenschaftliches Arbeiten bedeutsam zu sein (Bergann et al., 2019). Unklar ist bislang, ob das Interesse an wissenschaftlichem Arbeiten entsprechend eine Rolle für die Wertzuschreibung eines Masterstudiums spielt.

Vor dem Hintergrund dieser theoretischen Überlegungen untersucht der Beitrag folgende Fragen:

(1) Welche Bedeutung hat das wissenschaftliche Interesse über Noten und Leistungsselbsteinschätzungen hinaus zur Vorhersage der Intention, ein Masterstudium aufzunehmen? Inwieweit sind die Effekte des Interesses auf die Intention über die intrinsischen Wertkomponenten (Intrinsic Value, Attainment Value) vermittelt?

(2) Welche Bedeutung haben die intrinsischen Wertkomponenten für die Übergangsintention im Vergleich zu Erwartungs- und Kostenüberlegungen sowie insbesondere im Vergleich zu den antizipierten instrumentellen Erträgen eines Masterstudiums (Karriere- und Verdienstmöglichkeiten)?

Datengrundlage bildet eine querschnittliche Online-Befragung von Bachelorstudierenden einer größeren deutschen Universität im Sommersemester 2019 (N=2861). Die Intention, ein Masterstudium aufzunehmen, sowie die Erfolgserwartung wurden jeweils über zwei selbstentwickelte Items operationalisiert. In Anlehnung an Trautwein et al. (2012) wurden vier Items zur Erfassung der intrinsischen Erträge und der psychologischen Kosten (Effort) eingesetzt. Für die Erhebung der antizipierten monetären Kosten sowie der instrumentellen Erträge eines Masterstudiums wurden Items aus Lörz et al. (2012) genutzt. Neben der allgemeinen Leistungsselbsteinschätzung (Köller et al. 2004) wurden Leistungsselbsteinschätzungen in Bezug auf das Arbeiten mit wissenschaftlichen Texten erfasst (Eigenentwicklung). Zusätzlich wurden in Anlehnung an Holland (1997) fünf adaptierte Items zur Erfassung des wissenschaftlichen Interesses eingesetzt. Als Kovariaten wurden soziodemographische und bildungsbiographische Merkmale berücksichtigt.

Die vorläufigen Regressionsergebnisse zeigen erstens, dass das wissenschaftliche Interesse über Leistungsselbsteinschätzungen und Noten hinaus einen signifikant positiven Effekt auf die Intention hat, ein Masterstudium aufzunehmen. Erwartungsgemäß sind die Effekte der leistungsbezogenen Indikatoren auf die Intention vor allem über Unterschiede in der Erfolgserwartung vermittelt, während der Effekt des wissenschaftlichen Interesses über die intrinsischen Erträge (Intrinsic and Attainment Value) vermittelt ist. Zweitens finden wir, dass die antizipierten intrinsischen Erträge einen deutlich stärkeren Effekt auf die Übergangsintention haben als die antizipierten instrumentellen Erträge. Ebenfalls bedeutsam sind die Erfolgserwartung sowie der wahrgenommene Aufwand, der mit einem Masterstudium verbunden ist.

Die Ergebnisse legen nahe, dass Studierende ein Masterstudium vor allem dann aufnehmen, wenn sie eine hohe intrinsische Motivation und eine hohe Erwartung an den erfolgreichen Abschluss des Masterstudiums haben. Der wahrgenommene Nutzen eines Masterstudiums im Hinblick auf Karriere- und Verdienstmöglichkeiten scheint demgegenüber eine geringere Rolle zu spielen. Anhand der differenzierten Erfassung der Erwartungs- und Wertkomponenten und der Berücksichtigung von Leistungsselbsteinschätzungen und des wissenschaftlichen Interesses können wertvolle Hinweise auf die Entstehung von interindividuellen und fachgruppenspezifischen Unterschieden am Bachelor-Master-Übergang gewonnen werden.



Die Bedeutung von Feedback für Selbstkonzept und Motivation bei Kindern im naturwissenschaftlichen Sachunterricht der Grundschule

Fabian Hoya, Eva Blumberg, Frank Hellmich

Universität Paderborn, Deutschland

Dem Feedback von Lehrkräften kommt eine große Bedeutung für die Lernprozesse von Kindern im Grundschulunterricht zu (vgl. Hattie, 2009). Dabei wird Feedback als Information verstanden, die Lehrkräfte Kindern zur Unterstützung ihrer Lernprozesse bereitstellen (vgl. Hattie & Timperley, 2007). Während positives Feedback dazu dient, Kinder in ihrem Verhalten oder ihren Leistungen zu bestärken, wird durch die Erteilung negativen Feedbacks auf Fehler, Probleme oder Schwierigkeiten bei der Bearbeitung von Aufgaben hingewiesen (Pintrich & Schunk, 2002). Gemäß dem Erwartungs-Mal-Wert-Modell von Eccles (2005) stellt das von Kindern wahrgenommene Feedback im Unterricht einen wichtigen Einflussfaktor für ihre fähigkeitsbezogenen Selbstkonzepte und ihre Motivation dar. Unter dem fähigkeitsbezogenen Selbstkonzept wird dabei die „Gesamtheit der Bewertungen der Merkmale, Eigenschaften und Fähigkeiten, die eine Person sich selbst zuschreibt“ (Moschner & Dickhäuser, 2018, S. 750), verstanden. Die intrinsische Motivation bezeichnet die Absicht, sich mit einer Lernaufgabe zu beschäftigen, weil sie für das Kind interessant ist oder herausfordernden Charakter besitzt (Schiefele, Köller & Schaffner, 2018), wohingegen die extrinsische Motivation auf die Absicht fokussiert, „eine Handlung durchzuführen, um damit positive Folgen herbeizuführen oder negative Folgen zu vermeiden“ (Schiefele et al., 2018, S. 309). Gegenwärtig liegen nur wenige Studien vor, die sich mit der Rolle der Wahrnehmung des von Lehrkräften erteilten Feedbacks durch Grundschulkinder für ihre Selbstkonzepte beschäftigen. So konnten Burnett (1999) sowie Chen, Thompson, Kromrey und Chang (2011) positive Effekte des wahrgenommenen positiven Feedbacks und negative Effekte des perzipierten negativen Feedbacks auf die fähigkeitsbezogenen Selbstkonzepte von Kindern belegen. Der Zusammenhang von Feedback und der Motivation von Kindern ist ebenfalls nur wenig untersucht. Ferguson und Houghton (2002) konnten allerdings aufzeigen, dass die Erteilung von positivem Feedback durch die Lehrkräfte mit einem gesteigerten Aufmerksamkeitsverhalten der Kinder einherging. Weiterhin belegt Morgan (2001), dass Kinder, die häufig positives Feedback erhielten, eine signifikant höhere Motivation aufwiesen als diejenigen, die oft negatives Feedback bekamen. Die Rolle des von Kindern wahrgenommenen Feedbacks in Bezug auf ihre intrinsische und extrinsische Motivation stellt dagegen – mit wenigen Ausnahmen (Wentzel, 2002) – ein Forschungsdesiderat dar.
Vor dem dargestellten Hintergrund nehmen wir in Anlehnung an Eccles (2005) an, dass Effekte des von Kindern wahrgenommenen positiven und negativen Feedbacks auf ihre intrinsische und extrinsische Motivation jeweils durch ihre fähigkeitsbezogenen Selbstkonzepte mediiert werden.
In unserer Studie wurden N=427 Kinder dritter und vierter Grundschulklassen (228 Mädchen, 199 Jungen) im naturwissenschaftlichen Sachunterricht anhand eines Fragebogens zu dem von ihnen perzipierten positiven und negativen Feedback ihrer Lehrkräfte, ihren Selbstkonzepten sowie zu ihrer intrinsischen und extrinsischen Motivation befragt.
Die Befunde verdeutlichen, dass die Kinder signifikant häufiger positives als negatives Feedback ihrer Lehrkräfte im Sachunterricht wahrnehmen. Ergebnisse aus einem in Mplus berechneten Strukturgleichungsmodell, bei dem sowohl das Geschlecht der Kinder als auch die Klassenstufe kontrolliert wurden, verdeutlichen zum einen, dass die fähigkeitsbezogenen Selbstkonzepte der Kinder signifikant über das von ihnen wahrgenommene positive und negative Feedback ihrer Lehrkräfte vorhergesagt werden können. Zum anderen werden Unterschiede in der intrinsischen Motivation der Kinder signifikant über das von ihnen perzipierte positive und negative Feedback sowie auch über ihre Selbstkonzepte erklärt. Im Detail zeigt sich, dass der Effekt des positiven Feedbacks auf die intrinsische Motivation der Kinder durch ihre auf den naturwissenschaftlichen Sachunterricht bezogenen Selbstkonzepte vermittelt wird. Das wahrgenommene negative Feedback sowie die Selbstkonzepte der Kinder stellen signifikante Prädiktoren für ihre extrinsische Motivation dar. Der Effekt des von den Kindern wahrgenommenen negativen Feedbacks auf ihre extrinsische Motivation wird dabei erwartungsgemäß signifikant durch ihre fähigkeitsbezogenen Selbstkonzepte mediiert.
Die Ergebnisse unserer Untersuchung geben zusammenfassend Hinweise darauf, dass das von Kindern perzipierte Feedback ihrer Lehrkräfte einen signifikanten Prädiktor für ihre Selbstkonzepte sowie für ihre intrinsische und extrinsische Motivation im naturwissenschaftlichen Sachunterricht der Grundschule darstellt. Diese Befunde müssten in weiterführenden Studien hinsichtlich konkreter Ursache-Wirkungs-Zusammenhänge in den Blick genommen werden.

 
9:00 - 10:45F9–S13: Selbstkonzept, Feedback und Integration
S13 
 

„Kinder mögen Kinder, von denen die meisten Kinder denken, dass die Lehrerin sie mag“ – Eine em-pirische Studie zum Zusammenhang zwischen der Wahrnehmung von Lehrkraftrückmeldungen durch Grundschulklassen und der sozialen Integration von Grundschüler*innen.

Christian Huber, Philipp Nicolay, Simone Schulze

Bergische Universität Wuppertal

Die schwache soziale Partizipation von Schüler*innen mit Lern- und Verhaltensproblemen ist ein häufig replizierter Befund der Inklusionspädagogik (Bless, 2007; Krawinkel, Südkamp, Lange & Troster, 2017). Diese Studie bezieht sich auf die soziale Akzeptanz als ein Teilaspekt der sozialen Partizipation (Koster, Nakken, Pijl & van Houten, 2009). Unklar ist bislang, wie man soziale Akzeptanz beeinflussen kann. Grundsätzlich wird in dieser Studie die Hypothese verfolgt, dass das Lehrkraftfeedback diesen Zusammenhang moderieren könnte. Theoretische Grundlage ist dabei die soziale Referenzierungstheorie (Feinman, 1992; Huber, 2019). Dabei wird angenommen, dass positives Lehrkraftfeedback die Chance auf eine positive soziale Akzeptanz in der Klasse erhöht und negatives Lehrkraftfeedback die Chance auf eine gute soziale Akzeptanz verringert. Entscheidend für die Wirkrichtung ist weniger die von den Lehrkräften intendierte Valenz ihres Feedbacks, sondern wie dieses von den Schüler*innen wahrgenommene wird. Erste Studien konnten moderate bis hohe Effekte der Valenz des Lehrkraftfeedbacks auf die soziale Akzeptanz zeigen (z.B. Huber, Gerullis, Gebhardt & Schwab, 2018; White & Jones, 2000). Die vorliegenden Studien beruhen jedoch bislang oft auf Experimentaldesigns und berücksichtigen mehrheitlich nicht die von den Schüler*innen wahrgenommene Valenz des Lehrkraftfeedbacks. In der hier eingereichten Studie zielt genau auf diese Forschungslücke ab.

Die Studie wurde als Querschnittsstudie an 45 Grundschulklassen in Nordrhein-Westfalen durchgeführt. Die Stichprobe besteht aus insgesamt N = 930 Kindern der Klassen 3 und 4. Als abhängige Variable (AV) wurde der individuelle soziometrische Status der Schüler*innen durch einen Wahl- (AV1: WST) und einen Ablehnungsstatus (AV2: AST) nach Moreno (1974) gemessen. Zusätzlich wurde für alle Schüler*innen der Förderbedarf im Bereich Lernen (UV1: LE) und Bereich Verhalten (UV2: VE) als Proxy erhoben. Als zentrale UV wurde das von den Schüler*innen wahrgenommene positive und negative Lehrkraftfeedback gegenüber jedem anderen Kind der Klasse erhoben (Skala 1-5: wie häufig lobt Deine Lehrerin Schüler*in X). Das wahrgenommene Feedback wurde für jedes Kind auf Klassenebene aggregiert, sodass sich daraus für alle Kinder ein Durchschnittswert für den Erhalt von positivem (UV3: FB+) und negativem Lehrkraftfeedback (UV4: FB-) ergab. Das Geschlecht und das Klassensystem (1,2, 3, 4 getrennt, 1+2 / 3+4 gemeinsam, 1-4 gemeinsam) flossen als Kontrollvariablen in die Auswertung ein. Die Datenanalyse erfolgte durch zwei Mehrebenen-Regressionsmodelle. Es wurde grundlegend angenommen, dass es (HYP1) einen signifikanten Effekt der beiden Förderbedarfe auf den Wahl- und den Ablehnungsstatus der Schüler*innen gibt. Im Rahmen der für die Studie zentralen Hypothesen wird vermutet, dass

  • es einen signifikanten Zusammenhang zwischen FB+/FB- und WST und AST gibt (HYP2).
  • einen Interaktionseffekt zwischen FB+/FB- und dem Einfluss des Förderbedarfs LE und VE auf den AST und den WST eines Kindes gibt (HYP3).
  • es einen Zusammenhang zwischen dem Niveau des von Schüler*innen wahrgenommenen Feedback auf Klassenebene auf das Ausmaß von sozialen Wahlen und sozialen Ablehnung gibt in der Klasse (HYP4).

Die Ergebnisse zeigen sich weitgehend in der vorhergesagten Weise. Der bereits häufig replizierte Zusammenhang zwischen Förderbedarf LE und VE und der sozialen Akzeptanz war replizierbar (HYP1). Weiter zeigte sich ein signifikanter Effekt von FB+ (b=-6.39, p<.001) und FB- (b=9.26, p<.001) auf den Ablehnungsstatus und von FE+ auf den Wahlstatus (b=9.55, p<.001) (HYP2). Ebenso zeigten sich signifikante Interaktionseffekte zwischen FB+ und FB- und dem Einfluss der Förderbedarfe LE und VE auf den AST in der vorhergesagten Richtung. Für den WST war hier lediglich ein abschwächender (Interaktions-) Effekt von FB+ auf die Wirkung von VE nachweisbar (HYP3). Ferner zeigte sich, dass Klassen, in denen die Schüler*innen auf Klassenebene viel positives Feedback ihrer Lehrkräfte wahrnahmen im Durchschnitt prozentual weniger Kinder abgelehnt wurden (r=.37; p=.02) (HYP 4). Im Beitrag sollen der theoretische Hintergrund sowie die Ergebnisse der Studie vor dem Hintergrund des Tagungsthemas diskutiert werden. Besonderen Stellenwert wird dabei die Frage erhalten, wie Lehrkräfte soziale Teilhabeprozesse und in der Schule beeinflussen können.



Wie Schulleistung und Lehrkraftfeedback die soziale Integration beeinflussen

Philipp Nicolay, Christian Huber

Bergische Universität Wuppertal, Deutschland

Nationale und internationale Befunde zeigen, dass die soziale Integration von Schülerinnen und Schülern mit sonderpädagogischem Förderbedarf im Gemeinsamen Unterricht ungünstiger verläuft als gewünscht (u.a. Kavale & Forness, 1996; Huber & Wilbert, 2012). Auf der Ebene der Variablen von Schülerinnen und Schülern ist besonders der Zusammenhang zwischen Schulleistung und sozialer Integration ein häufig replizierter Befund. Es ist bislang allerdings unklar, ob die schwächere soziometrische Stellung schulleistungsschwacher Kinder eine direkte Folge von schwachen Schulleistungen oder die ungünstigen Schulleistungen eine Folge der sozialen Position sind. Unklar ist bislang auch, wie die soziale Integration von Schülerinnen und Schülern mit Schulleistungsproblemen gefördert werden kann. Einige Forschungsgruppen verweisen in diesem Zusammenhang auf das öffentliche Feedbackverhalten einer Lehrkraft (White & Jones, 2000; McAuliffe, Hubbard & Romano, 2009; Chang, 2003; 2004). Grundlage für diese Vermutung ist die Theorie sozialer Referenzierungsprozesse (Feinman, 1992). Dabei wird angenommen, dass sich Schülerinnen und Schüler bei der Wahl ihrer Sozialkontakte an ihren Lehrkräften orientieren (Webster & Forchi, 1992; White & Jones, 2000). Schulkinder, die von ihrer Lehrkraft positives Feedback erhalten, hätten demnach eine höhere Chance auf eine günstige soziale Integration als Kinder, die negatives Feedback von der Lehrkraft erhalten. Bisherige Studien geben erste Hinweise auf diesen Effekt (u.a. Huber et al., 2018). Eine Limitation der bislang vorliegenden Studien ist allerdings ihre vergleichsweise schwache ökologische Validität und unklare Erkenntnisse zu Ursache und Wirkung des Effekts.

Die hier dargestellte Studie knüpft an diese Forschungslücken an und untersucht drei Forschungsfragen: 1.) Lässt sich die soziale Akzeptanz eines Kindes durch seine Schulleistung erklären? 2.) Lässt sich die soziale Akzeptanz eines Kindes durch die Valenz des Lehrkraftfeedbacks erklären? 3.) Wird der Effekt der Feedback-Valenz auf die soziale Akzeptanz durch den Feedback-Fokus moderiert?

Zur Beantwortung dieser Fragestellungen wurde ein Experiment mit N = 737 Grundschulkindern durchgeführt. Hierfür wurde den Kindern zunächst ein fiktives Grundschulkind in einem Experimentalvideo vorgestellt. In einem Pretest wurde die spontane soziale Akzeptanz gegenüber diesem Kind gemessen. Die Messung der sozialen Akzeptanz erfolgte mit einer an die Soziometrie angelehnten Skala (AV1; αpre = .78, αpost = .86) und der CATCH-Skala (AV2; Schwab, 2015). In der darauffolgenden experimentellen Manipulation sahen die teilnehmenden Kinder Szenen aus einem Schultag des fiktiven Grundschulkindes. Diese Szenen variierten dabei sowohl die gezeigte Schulleistung (UV1: dreifach gestuft, gut/ mittel/ schwach) als auch das Feedback der Lehrkraft (UV2 & UV3) als Between-Subjekt-Faktor variiert. Die Variation des Lehrkraftfeedbacks erfolgte in Anlehnung an Hattie und Timperly (2007) getrennt für Valenz (UV2: zweifach gestuft, postiv/ negativ) und Fokus (UV3: zweifach gestuft: Person/ Aufgabe). Am Ende des Experiments erfolgte jeweils eine Posttestmessung der sozialen Akzeptanz. Das Experiment entspricht damit einem 3x2x2 Versuchsplan.

Die Datenanaylse erfolgte mit einer 3x2x2x2 MANOVA mit Messwiederholung. Als Zwischensubjektfaktoren floßen Leistungstyp, Valenz und Fokus des Lehrkraftfeedbacks sowie Geschlecht in die Auswertung ein.

Die Ergebnisse zeigen einen signifikanten Effekt von Messzeitpunkt * Leistungstyp, F(4, 1222) = 17.34, p < .001**, η2p = .054 und Messzeitpunkt * Valenz des Lehrkraftfeedback, F(2, 610) = 22.73, p < .001**, η2p = .069 auf die soziale Akzeptanz des fiktiven Schulkindes. Univariate Tests bestätigen diese Effekte für beide abhängigen Variablen. Die soziale Akzeptanz gegenüber dem fiktiven Schulkind war bei einer schwachen Schulleistung signfikant geringer als bei einer guten oder mittleren Schulleistung. Negatives Lehrkraftfeedback führte zu einer signfikant negativeren Veränderung der sozialen Akzeptanz als ein positives Lehrkraft Feedback.

Ein signifikanter Effekt von Messzeitpunkt * Valenz des Lehrkraftfeedback * Fokus des Lehrkraftfeedbacks auf die soziale Akzeptanz des fiktiven Schulkindes konnte nicht gefunden werden, F(2, 610) = 1.87, p = .155, η2p = .006. Der Fokus des Lehrkraftfeedbacks scheint den Effekt der Valenz des Lehrkraftfeedback nicht zu moderieren. Die Befunde der Experimente sollen vorgestellt und diskutiert werden.



Das Zusammenspiel kognitiver Fähigkeiten und Gewissenhaftigkeit bei der Vorhersage von Schulleistungen

Jennifer Meyer1, Fabian T.C. Schmidt2, Johanna Fleckenstein1, Ulrich Trautwein3, Olaf Köller1

1IPN Kiel, Deutschland; 2Universität Hamburg; 3Universität Tübingen

Kognitive Fähigkeiten und Persönlichkeitseigenschaften, insbesondere Gewissenhaftigkeit, gehören zu den wichtigsten Prädiktoren von Schulleistungen. Bisher wurden diese Effekte hauptsächlich inkrementell untersucht (Poropat, 2009; Spengler et al., 2013; Meyer et al., 2019). Über diese additiven Effekte hinaus kann ein synergistischer Interaktionseffekt angenommen werden, der bereits in älteren Theorien im Kontext der Organisationspsychologie beschrieben wurde (siehe Campbell, 1976, Maier, 1965). Eine solche Interaktion bedeutet, dass durch Gewissenhaftigkeit der Effekt kognitiver Fähigkeiten auf die Leistung verstärkt werden kann, und umgekehrt. Diese Sichtweise umfasst ein potentielles Zusammenspiel kognitiver und nicht-kognitiver Fähigkeiten (z.B. Persönlichkeitseigenschaften), welches kritisch diskutiert wird (siehe DeYoung, 2011). Einige empirische Untersuchungen zu potentiellen Interaktionen dieser Konstrukte wurden im Kontext beruflicher Leistungen durchgeführt (Mount, et al., 1999; van Iddekinge et al., 2018; Perry et al., 2010), einige auch im Bereich von Schulleistungen (Di Dominenco & Fournier, 2015; Bergold & Steinmayr, 2018; Zhang & Ziegler, 2015; Ziegler et al., 2009). Diese empirischen Untersuchungen zeigten teilweise inkonsistente Befunde. Ein Grund für diese eher inkonsistenten Befunde ist die Schwierigkeit, Interaktionen aufgrund der geringen Effektstärke und der Messfehlerbehaftung der Instrumente aufzudecken (siehe Nagengast et al., 2011). Somit sind weitere systematische Untersuchen im Large-Scale notwendig. Im Hinblick auf domänenspezifische und leistungsmaßspezifische Befunde zu den Effekten von Gewissenhaftigkeit und kognitiven Fähigkeiten (Meyer et al., 2019; Spengler et al., 2013) sollten diese bei der Untersuchung potentieller Interaktionseffekte differenziert betrachtet werden. Es lässt sich annehmen, dass sich synergistische Interaktionen besonders in den Domänen und Leistungsmaßen zeigen, bei denen die Relevanz des Lernverhaltens hoch ist (d.h. schulbasierte Maße in lernintensiven Domänen, z.B. Mathe). Dasselbe gilt für kumulative Leistungen, wie beispielweise die Abiturdurchschnittsnote, die konsistentes Lernverhalten in besonderem Maße widerspiegelt.

Ziel dieser Studie war es, potentielle Interaktionseffekte von Gewissenhaftigkeit und kognitiven Fähigkeiten auf Schulleistungen in der Oberstufe sowohl für unterschiedliche Leistungsoutcomes domänenspezifisch zu untersuchen. Auch die Abiturdurchschnittsnote als domänenübergreifendes wichtiges Leistungsoutcomes mit hoher Relevanz für die akademische Laufbahn der Schülerinnen und Schüler wurde einbezogen.

Methode

Zur Untersuchung der Fragestellung wurden Sekundäranalysen auf Basis von vier Large-Scale Datensätze (TOSCA: N = 4709, Köller et al., 2004; TOSCA-R: N = 4912, Trautwein et al., 2007; LAU: N = 5241, Trautwein et al., 2007; LISA: N = 3775, Leucht et al., 2016) aus unterschiedlichen deutschen Bundesländern mit Schülerinnen und Schülern der 13. Klasse durchgeführt. Die Analysen wurden soweit möglich über die Stichproben konstant gehalten. Kovariaten waren die Schulform (allgemeines vs. berufliches Gymnasium), sozioökonomischer Status, und Geschlecht sowie die anderen vier Persönlichkeitseigenschaften. Zur Messung der kognitiven Fähigkeiten wurden Untertests des KFT4-12R (Heller & Perleth, 2004) eingesetzt. Die Modellierung des Interaktionseffekts erfolgte latent (LMS; Klein & Moosbrugger, 2001), um die Messfehler des Interaktionsterms zu reduzieren. Noten und Prüfungsergebnisse lagen in den Domänen Mathematik, Deutsch und Englisch vor. Standardisierte Testergebnisse waren für Mathematik und Englisch verfügbar.

Die Ergebnisse zeigen über alle vier Studien hinweg einen konsistenten synergistischen Interaktionseffekt kognitiver Fähigkeiten mit Gewissenhaftigkeit auf die Abiturdurchschnittsnote. Weiterhin zeigte sich der Interaktionseffekt konsistent für die Mathe-Domäne, mit tendenziell konsistenteren Effekten für die schulbasierten Leistungsmaße (Noten, Abiturprüfungen) im Vergleich mit standardisierten Leistungstests. Die Effekte für die sprachlichen Domänen (Deutsch, Englisch) waren inkonsistent über die Studien hinweg. Die gefundenen Effektstärken variierten zwischen β=.04 und β=.12 und lassen sich als klein bezeichnen. Die Größe des Interaktionseffekts lässt jedoch keine Schlüsse über dessen Bedeutung zu (Busemeyer & Jones, 1983).

Die Befunde werden im Hinblick auf mögliche Unterschiede zwischen den Studien diskutiert. Ein weiterer Diskussionspunkt sind Implikationen des Interaktionseffekts für die Bedeutung kognitiver und nicht-kognitiver Konstrukte bei der Vorhersage von Schulleistungen. Die Ergebnisse verdeutlichen weiterhin die Relevanz der domänenspezifischen Betrachtung von Schulleistungen und beleuchten die Rolle unterschiedlicher Leistungsmaße.

 
9:00 - 10:45F9–S14: Lehrerbildung
S14 
 

Der Einfluss regelmäßigen Lernens mit Videos auf den Lernerfolg und dessen Nachhaltigkeit in einem Flipped-Classroom-Design in der Hochschule.

Manuel Förster1, Andreas Maur2, Constantin Weiser2

1Technische Universität München, Deutschland; 2Johannes Gutenberg-Universität Mainz, Deutschland

1. Theoretischer Hintergrund und Fragestellung

In vielen Großveranstaltungen an deutschen Hochschulen ist aufgrund der hohen Studierendenzahlen und ausgefüllten Curricula der dozentenzentrierte PowerPoint-Vortrag die als effizient geltende Methode der Wahl. Aufgrund mangelnder Individualisierungsmöglichkeiten verfallen Studierende dabei jedoch oft in „stumpfes Abschreiben“, während die tiefere Auseinandersetzung mit den Lerninhalten bis kurz vor die Klausur prokrastiniert wird (Schmidt et al. 2015). In Anbetracht dieser herausfordernden Ausgangslage wurde ein Flipped-Classroom-Design in einer wirtschaftswissenschaftlichen Statistikgroßveranstaltung implementiert, um die Studierenden zu einem frühzeitigen und regelmäßigen Lernprozess anzuregen. Die vorliegende Studie widmet sich dabei der Fragestellung, inwieweit die vorbereitende Rezeption der für den Flipped-Classroom produzierten Lernvideos einen Einfluss auf 1) den kurzfristigen Lernerfolg (Klausurnote) und 2) dessen Nachhaltigkeit nach vier Monaten hat.

Bislang gibt es kaum Studien, welche die theoretischen Annahmen zu regelmäßigem Lernen und dessen Auswirkung auf (nachhaltige) Lernprozesse empirisch im Laufe eines Semesters anhand objektiver und in zeitlicher Relation zur Präsenzlehre gestellten Videonutzungsdaten untersuchten (Bouwmeester et al., 2019). Gemäß der konstruktivistischen sowie kognitivistischen Lerntheorien erfolgen Lern- und Behaltensprozesse insbesondere dann positiv, wenn neues Wissen in bestehende Wissensstrukturen integriert werden kann (Bandura, 2015; Thompson & Zamboanga, 2003). Dementsprechend ist anzunehmen, dass gerade in einem Flipped-Classroom vorbereitete Studierende stärker von der Teilnahme an der Präsenzveranstaltung profitieren, da sie aufbauend auf den Vorkenntnissen aus den Lernvideos komplexere Gruppenübungsaufgaben auf einer tieferen Verstehensebene bearbeiten und dabei eigene Fehlkonzeptionen frühzeitig erkennen sowie gezielter Hilfe von den Kommilitonen oder Lehrenden einfordern können (Neroni et al., 2019; Tolks et al., 2016).

Weitere Studien deuten darauf hin, dass Studierende, die in regelmäßigen Abständen Lerninhalte vor- und nachbereiten, bessere und nachhaltigere Lernerfolge erzielen (Péladeau, Forget, & Gagné, 2003; Bouwmeester et al., 2019). Aus diesem Forschungsstand werden folgende Forschungshypothesen abgeleitet:

Studierende, welche die relevanten Lernvideos vor den jeweiligen Präsenzveranstaltungen rezipieren, erzielen im Vergleich zu den nachträglich schauenden Studierenden

…ein besseres Klausurergebnis (kurzfristiger Lernerfolg; H1:).

…ein besseres Ergebnis in einem Posttest vier Monate nach der Klausur und unter Kontrolle dieser Klausurnote (mittelfristiger Lernerfolg; H2).

2. Methode und Stichprobe

Zur Analyse dieser Hypothesen wurden Logfiles der Videonutzung (u.a. Gesamtbetrachtungsdauer und Zeitstempel pro Video und pro Person) einer wirtschaftswissenschaftlichen Statistikgroßveranstaltung im Grundstudium erfasst und den Empfehlungen von Asarta und Schmidt (2013) folgend weiterverarbeitet. Somit gibt die pace-Variable an, welcher Anteil der Lernvideos über das Semester hinweg rechtzeitig vor den entsprechenden Präsenzveranstaltungen rezipiert wurde. Der Lernerfolg wurde anhand der erreichten Gesamtpunktzahl in der E-Klausur am Ende des Semesters operationalisiert. Insgesamt konnten im Sommersemester 2018 die Videonutzungsdaten von 497 Studierenden mit deren Klausurergebnissen gematcht werden. Vier Monate später, im Wintersemester 2018/2019, bearbeiteten 316 dieser Studierenden einige Aufgaben mit weitgehender Ähnlichkeit zu den E-Klausuraufgaben als Indikator für die Nachhaltigkeit des Lernerfolgs. Zusätzlich wurden im Rahmen von Paper-Pencil-Befragungen eine Vielzahl von Kontrollvariablen wie u.a. das Geschlecht, die generelle Neigung zu Prokrastination, die Note der Hochschulzugangsberechtigung und die der vorausgegangenen, universitären Mathematikveranstaltung erhoben.

3. Ergebnisse

Zur Analyse wurden zunächst die Scores aus der Klausur und schließlich jene aus dem Posttest auf die pace-Variable und die obengenannten Kontrollvariablen regressiert. Es zeigt sich, dass die pace-Variable einen signifikant positiven Einfluss auf die Klausurnote hat. In einem weiteren Modell weist trotz Kontrolle dieser Klausurnote die pace-Variable weiterhin einen signifikant positiven Effekt auf den Posttest-Score auf. Die Studie zeigt somit anhand objektiver Videonutzungsdaten, dass die oftmals theoretisch angenommenen positiven Effekte frühzeitigen, regelmäßigen Lernens auf den kurz- und mittelfristigen Wissenserwerb in einer Flippped-Classroom-Veranstaltung auch empirisch nachgewiesen werden können. Die Ergebnisse bestätigen sich auch dann, wenn der absolute Videokonsum kontrolliert wird. Dies deutet darauf hin, dass vor allem der Zeitpunkt der Videorezeption beim Flipped-Classroom bedeutungsvoll ist. Daher liegt eine Handlungsempfehlung in der Bereitstellung von Anreizen für rechtzeitiges und regelmäßiges Lernen (z.B. Zusatzpunkte, Gamification oder Nudging).



Bildungsprozesse in der praxisorientierten Lehrer*innenbildung. Epistemologische Überzeugungen von Hochschullehrenden zu Ursachen und Lösungen des Theorie-Praxis-Dilemmas

Michaela Artmann

Universität zu Köln, Deutschland

Die Forderung nach einer verstärkten Theorie-Praxis-Relationierung in der Lehrer*innenbildung ist bis heute aktuell. Vermieden werden soll eine zu wenig anwendungsbezogene Wissensvermittlung, die lediglich "träges Wissens" erzeuge (Gruber et al. 2000; Klieme et al. 2003; Neuweg 2007, 2016; Wahl 2008). Im Zuge der Modularisierung der Lehramtsstudiengänge und der Einführung universitär begleiteter Praxisphasen wurde die Gestaltung eines gelingenden Theorie-Praxis-Bezugs daher als zentrale didaktische Aufgabe durch die KMK (2004) markiert. Ziel der neuen, praxisorientierteren Lehrer*innenbildung soll die (spätere) Umsetzung des Gelernten in ein professionelles, d.h. theoriegestütztes und wissenschaftlich reflektiertes Lehrerhandeln sein. Unklar ist jedoch nach wie vor, wie welches (theoretische, empirische, praktische ...) Wissen in der universitären Ausbildung vermittelt werden sollte, um dieses Ziel zu erreichen.

In der aktuellen Hochschullandschaft wurden in den vergangenen Jahren vielfältige didaktische Konzepte als Lösungsansätze für eine (stärker) theorie-praxis-relationierte Lehrer*innenbildung entwickelt und implementiert. Die begleitende Forschung richtet sich zumeist entweder auf die Messung von studentischem Wissens- und Kompetenzerwerb (z.B. König et al. 2016; Kramer et al. 2017; Kunter et al. 2013) oder auf die Untersuchung von Praktiken der Relationierung von Theorie und Praxis in entsprechenden universitären Lehrformaten (z.B. Artmann et al. 2017; Kunze 2017; Schüpbach 2007). Die Perspektive der an der Lehrer*innenbildung beteiligten Akteure auf die Frage, wie universitäres Wissen und schulpraktisches Können sinnvoll und effektiv miteinander verschränkt werden können, bleibt jedoch nach wie vor weitestgehend unberücksichtigt.

Der Vortrag stellt die Perspektive der Hochschulehrenden in den Mittelpunkt und geht der Frage nach, welche Herausforderungen und Gelingensbedingungen die Dozierenden aufgrund ihrer eigenen Lehr-Lern-Erfahrungen bei der Relationierung von Theorie und Praxis sehen. Auf der Basis problemzentrierter Interviews (vgl. Witzel 2000), die mithilfe der Grounded Theory (vgl. Glaser & Strauss 1998) ausgewertet wurden, werden Ursachen und Lösungen des Theorie-Praxis-Problems aus der Sicht der Dozierenden rekonstruiert.

Dabei lassen sich grundlegende Überzeugungen der Hochschullehrenden bezüglich des Erwerbs theoretischen und praktischen Wissens in der Lehrer*innenbildung identifizieren. Diese epistemologischen Überzeugungen sind zum einen beeinflusst durch den jeweiligen fachdisziplinären Hintergrund bzw. fachspezifische "Wissenschaftsphilosophien" (Sodian et al. 2002); zum anderen schöpfen sie sich aus den Beobachtungen und Wahrnehmungen der Lehrenden, wie Studierende in theorie-praxis-relationierten Hochschulformaten lernen. Eingeschlossen in diese Überzeugungen sind zudem grundlegende Vorstellungen über Stellenwert und Funktion von Theoriewissen in der Theorie-Praxis-relationierten Lehrer*innenbildung sowie davon abgeleitete Vorstellungen, wie und in welcher

Reihenfolge theoretisches und praktisches Wissen vermittelt bzw. erworben werden sollte (vgl. Neuweg 2004).

Ausgehend von der Fragestellung „Aus welchen Gründen gelingt den Studierenden der Theorie-Praxis-Bezug nicht (ausreichend) und welche Unterstützung bräuchten sie?“ entwickeln die Dozierenden zunächst unterschiedliche Problemattributionen sowie spezifische Lehr-Lernüberzeugungen für die praxisorientierte Lehrer*innenbildung. Daraus leiten sie notwendige, aufeinander aufbauende Lehr- und Lernschritte ab, die dann in konkrete(re) didaktische Lösungsansätze zum Theorie-Praxis-Problem in der Lehrer*innenbildung münden.

Anhand exemplarischer Falldarstellungen sowie im fallübergreifenden Vergleich soll zunächst das mithilfe des paradigmatischen Modells (Strauss & Corbin 1996 [1990]) identifizierte Bedingungsgefüge zwischen ursächlichen Bedingungen, kontextuellen Voraussetzungen, Strategien und Konsequenzen des zentralen Phänomens der epistemologischen Überzeugungen von Hochschullehrenden bzgl. Theorie-Praxis-relationierter Lehrer*innenbildung beleuchtet werden. Der Vortrag konzentriert sich dann auf die aus diesem Bedingungsgefüge abgeleiteten unterschiedlichen didaktischen Lösungsansätze. Diese fokussieren, abhängig von den jeweiligen Problemzuschreibungen, spezifische Aspekte des Bildungsprozesses und setzen dabei an verschiedenen Ebenen der Lehrer*innenbildungsgestaltung an: 1.) an der personellen Ebene, hier insbesondere bezogen auf die studentischen Lerner*innen und die Notwendigkeit, ihnen die Bedeutung theoretischen und/oder empirischen Wissens für die Reflexion von Praxissituationen zu vermitteln, 2.) an der curricular-institutionellen Ebene mit Blick auf die Gestaltung geeigneter Lehr-Lern-Settings zum sukzessiven Wissens- und Reflexionskompetenzaufbau sowie 3.) an der bildungspolitischen Ebene und der Schaffung besserer Rahmenbedingungen an Universität und Ausbildungsschule.



Zusammenhang komplexen Problemlösens und fachdidaktischer Kompetenzen bei angehenden Lehrpersonen im Fach Wirtschaft

Jan-Peter Krstev, Christiane Kuhn, Olga Zlatkin-Troitschanskaia, Hannes Saas

Johannes Gutenberg-Universität Mainz, Deutschland

Die berufliche Praxis von Lehrpersonen (im Fach Wirtschaft) ist von Komplexität geprägt, und gerade die zentralen Merkmale der Situativität, Kontextualität, Mehrdimensionalität, Gleichzeitigkeit und Unmittelbarkeit von Unterrichtssituationen stellen hohe Anforderungen an deren fachdidaktische Kompetenzen (Kunter & Pohlmann, 2015; Oser et al., 2009). Aufgrund der dynamischen Entwicklung der Interaktion mit Lernenden müssen Lehr-Lernziele sowie das fachdidaktische Vorgehen flexibel und oft unter Zeitdruck angepasst werden (Baxter & Lederman, 1999). Auch die Vor- und Nachbereitung des Unterrichts wird als komplexer, dynamischer Prozess verstanden, in dem Ausgangs- (z.B. vorhandenes Vorwissen der Lernenden) und Zielzustand (z.B. zu fördernde Kompetenzziele) oft nur unscharf definiert sind (Lindmeier, 2011).

Fachdidaktische Kompetenzen können in aktionsbezogene (AK) und reflexive Kompetenz (RK) differenziert werden (Lindmeier, 2011; Autoren, 2019). AK dient zur Bewältigung von fachspezifischen Anforderungen in den instruktionalen Phasen des Unterrichts, oft unter zeitlichem Druck. RK ist zur Bewältigung von fachspezifischen Aufgaben in prä- und post-instruktionalen Phasen erforderlich (Autoren, 2018). Befunde zeigen, dass AK und RK von einer professionellen Wissensbasis (Fachwissen und fachdidaktisches Wissen) beeinflusst werden und auch mit affektiv-motivationalen sowie generischen Facetten (wie Intelligenz) zusammenhängen (Autoren, 2019a, 2019b). Das komplexe Problemlösen (complex problem solving; CPS) stellt dabei eine weitere relevante generische Facette bei der Modellierung von fachdidaktischen Kompetenzen dar (Autoren, 2019c). CPS wird als erfolgreiche Interaktion zwischen der problemlösenden Person und komplexen, dynamischen sowie partiell intransparenten Problemsituationen verstanden (Frensch & Funke, 1995; Greiff et al., 2013).

Erste Befunde aus der Lehrerbildung deuten auf einen Zusammenhang zwischen CPS und fachdidaktischer Kompetenz hin (für Biologie, s. Mathesius et al., 2019). Daher fokussieren wir auf die Frage, inwieweit die fachdidaktischen Kompetenzen angehender Lehrpersonen im Fach Wirtschaft (AK, RK) mit der Fähigkeit, komplexe Probleme zu lösen, zusammenhängen.

In einer deutschlandweiten Studie wurden die beiden Kompetenzfacetten AK und RK mittels eines videobasierten Instruments erfasst (Autoren, 2018, 2019). Die Antworten zu sieben AK-Aufgaben (α=.64; N=390) wurden mündlich mit einem Mikrofon aufgenommen, während die Probanden ihre Antworten zu sieben RK-Aufgaben (α=.61; N=384) über eine Computertastatur eingaben. Zusätzlich wurde bei einer Teilgruppe der Studienteilnehmenden (N=46 angehende Lehrpersonen im Fach Wirtschaft) ein computerbasierter CPS-Test eingesetzt (α=.89; Greiff & Wüstenberg, 2015). Die 22 CPS-Items erfassen die zwei kognitiven Subprozesse Wissenserwerb (WE; α=.82) und Wissensanwendung (WA; α=.81), welche sich empirisch voneinander trennen lassen (Greiff et al., 2013; Greiff & Wüstenberg, 2014).

Korrelationsanalysen zeigen einen schwachen signifikanten Zusammenhang zwischen CPS und RK (r=.250; p<.05) sowie zwischen der Teilfacette WE und RK (r=.307; p<.05); jedoch keinen signifikanten Zusammenhang zwischen WA und RK (r=.156). Weiterhin finden sich keine signifikanten Beziehungen zwischen CPS (r=.056) sowie den beiden Subprozessen WE (r=.160) und WA (r=-.062) und AK. Verglichen mit den Befunden aus den anderen Teilstudien, die bedeutsame Zusammenhänge der fachspezifischen Wissensbasis mit AK (.29<r<.30; p<.001) und RK (.21<r<.37; p<.001) zeigen, deutet dieser Befund auf eine insgesamt relativ geringe Bedeutung von CPS für die fachdidaktischen Kompetenzen hin. Damit wird die Annahme nicht unterstützt, wonach Handeln in instruktionalen Problemsituationen unter Zeitdruck, welches den spontanen und adaptiven Einsatz von Fallwissen (z.B. zum Umgang mit typischen Lernschwierigkeiten) erfordert (AK), durch CPS begünstigt wird (Autoren, 2019). Da gerade die WE-Facette den Prozess beschreibt, aktiv eine korrekte Vorstellung über bestimmte Aspekte oder Eigenschaften einer unbekannten Problemsituation zu entwickeln (mentales Modell), scheint diese Fähigkeit jedoch die RK, in der Unterrichtssituationen in Vor- und Nachbereitungsphasen analysiert und kritisch reflektiert werden sollen, zu begünstigen. Der fehlende Zusammenhang zwischen der WA-Facette und RK spricht dafür, dass je nach Anwendungssituation ein unterschiedliches Zusammenspiel der fachspezifischen Wissens- und generischen Fähigkeitskomponenten erforderlich ist.

Die hochkomplexe Interaktionsstruktur zwischen den verschiedenen Facetten der fachdidaktischen Kompetenz (wie AK, RK, Wissenskomponenten, generische Komponenten (wie CPS) und affektiv-motivationale Faktoren) soll im nächsten Schritt anhand einer größeren Stichprobe untersucht werden, welche die Analyse in einem Messmodell erlaubt.



Automatisches Adaptives Feedback in simulationsbasierten Lernumgebung zur Förderung von Diagnosekompetenzen in der Lehrerbildung

Michael Sailer1, Elisabeth Bauer1, Jan Kiesewetter2, Jonas Pfeiffer3, Claudia Schulz3, Iryna Gurevych3, Martin R. Fischer2, Frank Fischer1

1LMU München, Deutschland; 2Klinikum der Universität München, Deutschland; 3Technische Universität Darmstadt

Die zunehmende Digitalisierung der Hochschullehre eröffnet neue Möglichkeiten zur Gestaltung von Lernumgebungen, in denen sich Lernende aktiv, konstruktiv und interaktiv mit Lerninhalten auseinandersetzten können (Chi & Wylie, 2014; Persicke & Friedrich, 2016). Beispielsweise werden simulationsbasierte Lernumgeben in der Medizin bereits vermehrt und erfolgreich eingesetzt, um den Erwerb von Diagnosekompetenzen von Medizinstudierenden zu fördern (Berman et al., 2016). Positive Ergebnisse von Studien aus diesem Bereich legen nahe, simulationsbasiertes Lernen auch in anderen Fachbereichen zu erproben, in denen Diagnosekompetenzen ebenfalls eine Rolle spielen, wie beispielsweise der Lehrerbildung (Gartmeier et al., 2015). So ist es für eine Lehrkraft unabdingbar, den Grund für eine Leistungsschwäche bei einem Schüler zu identifizieren, um angemessen reagieren zu können. Um Studierende während des Prozesses der Kompetenzentwicklung zu unterstützen, ist prozessbezogenes Feedback eine der wirkungsvollsten instruktionalen Fördermaßnahmen (Hattie & Timperley, 2007).

Wesentliche Herausforderung bei der Feedbackgabe durch Lehrende ist die nicht unerhebliche Arbeitsbelastung sowie die zeitnahe Bereitstellung der Rückmeldungen. Maschinelles Feedback kann einen entscheidenden Mehrwert liefern, beschränkt sich bisher allerdings überwiegend auf geschlossene oder halb-offene Antwortformate. Die automatische Analyse und Bewertung von offenen Antwortformaten, bei denen sich Diagnosen in einem kohärenten Text realistisch und nachvollziehbar begründen lassen, ist dagegen ungleich schwieriger. Gerade für den Erwerb von Diagnosekompetenzen hat die automatische Analyse von Freitextantworten jedoch Potenzial, eine große Anzahl Studierender mit prozessbezogenem Feedback zu unterstützen. Es stellt sich im Rahmen dieses Beitrags die Frage, inwieweit mittels Methoden des natural language processing (NLP) Freitextantworten von Studierenden in simulationsbasierten Lernumgeben automatisch analysiert werden können.

Für den Einsatz von NLP Methoden zur automatischen Erkennung von Inhalten und Aktivitäten in Freitextantworten wurde zunächst ein NLP Modell mit bereits existierenden Daten trainiert. Hierzu wurden insgesamt 960 Freitextantworten von 120 Lehramtsstudierenden zu 8 Fallsimulationen im Themenspektrum Verhaltens- sowie Lern- und Leistungsstörungen händisch kodiert. Die Kodierung wurde in zwei Phasen durchgeführt, zum einen nach inhaltlichen Aspekten und zum anderen nach diagnostischen Aktivitäten. Hierdurch soll gewährleistet werden, sowohl inhaltliches als auch Feedback auf bestimmte diagnostische Aktivitäten, wie beispielsweise Hypothesen generieren oder Schlussfolgerungen ziehen, zu geben. Bei der inhaltlichen Kodierung wurden 15% der Daten doppelt kodiert. Bei den diagnostischen Aktivitäten wurden insgesamt 15% der Daten vierfach kodiert. Die Inter-Rater-Reliabilität bei den inhaltlichen Aspekten lag im Mittel bei Krippendorffs ɑU= .87; bei den diagnostischen Aktivitäten bei ɑU= .65.

Die 960 kodierten Freitexte wurden in 740 Trainings-, 110 Development- und 110 Test-Daten aufgeteilt. Die NLP Modelle werden in F1 Werten beurteilt. F1 stellt ein harmonisches Mittel zwischen der Sensitivität (Falsch-Negativ-Rate) und Spezifität (Falsch-Positiv-Rate) dar, wobei der Wert 0 bedeutet, dass alles falsch und der Wert 1 bedeutet, dass alles richtig vorhergesagt wurde. Die im Nachfolgenden beschriebenen F1-Werte beziehen sich nur auf die Ergebnisse des Test Sets, da die Trainings-Daten direkt und die Development-Daten indirekt zum Trainieren des Modells verwendet wurden.

Die Ergebnisse zeigen, dass das NLP Modell einen durchschnittlichen F1 Score von 0.54 für inhaltliche Aspekte und 0.69 für diagnostische Aktivitäten in neuen Freitexten erreicht (Schulz, Meyer & Gurevych, 2019, Pfeiffer et al., 2019). Die besseren Ergebnisse für diagnostische Aktivitäten (4 Kategorien) lassen sich darauf zurückführen, dass das Modell deutlich weniger Kategorien vorhersagen muss als für die inhaltlichen Aspekte (>90 Kategorien). Viele Kategorien bedeuten, dass diese in vielen Fällen selten vorkommen. Das Modell hat demnach nur wenige Beispiele, von denen es lernen kann, was zu einer schlechteren Generalisierung auf neue Daten führt.

Auf Basis dieser zufriedenstellenden Werte sind wir in der Lage je nach erkannter Aktivität den Studierenden eine entsprechende automatisierte Rückmeldung zu geben. Die Nutzung von NLP Methoden im Bereich des simulationsbasierten Lernens ist somit prinzipiell möglich. Das daraus entstandene automatische adaptive Feedback System wird momentan in einer experimentellen Studie mit 180 Lehramtsstudierenden erprobt.

 
9:00 - 10:45F9–S15: Bildung in der digitalen Welt
S15 
 

Analyse von Schulnetzwerken zur Schulentwicklung im Kontext von ‚Bildung in der digitalisierten Welt‘ und ‚Bildung für nachhaltige Entwicklung‘ im Vergleich

Marco Hasselkuß, Manuela Endberg, Isabell van Ackeren

Universität Duisburg-Essen, Deutschland

Damit Menschen befähigt werden können, aktuelle und künftige gesellschaftliche Veränderungsprozesse – etwa durch die zunehmend digitalisierte Welt und die Herausforderungen einer nachhaltigen Entwicklung – zu verstehen, aktiv an der Gesellschaft teilzuhaben und den Wandel mitzugestalten, gilt es, diese in (schulischen) Bildungsprozessen aufzugreifen. Um diese neuen Anforderungen von gesellschaftlicher und (bildungs-)politischer Seite aufzugreifen, werden in der Literatur überfachliche Querschnittsaufgaben (z.B. Bildung für nachhaltige Entwicklung (BNE), Buddeberg, 2016) bzw. – mit Blick auf eine digitalisierte Welt – Medienbildung als integraler Bestandteil aller Fächer (KMK, 2016) diskutiert. Um entsprechende Veränderungen auf unterrichtlicher und schulischer Ebene zu erwirken, sind (einzelschulische) Entwicklungsprozesse anzustoßen. Allerdings können diese Anforderungen für eine Schule allein auch überfordernd sein. Damit einzelschulische Entwicklungsprozesse unterstützt werden können, wird daher die Vernetzung von Schulen untereinander und mit weiteren Akteuren des Bildungssystems (Schuladministration, Ministerien, außerschulischen Bildungsanbietern, Stiftungen, Wissenschaft, ...) seit längerem in Deutschland und international als wichtige Strategie diskutiert und in entsprechenden Schulentwicklungsprojekten praktiziert (z.B. Rürup, Röbken, Emmerich & Dunkake, 2015; Jungermann, Pfänder & Berkemeyer, 2018; Hillebrand, Webs, Kamarianakis, Holtappels, Bremm & van Ackeren, 2017), denn Netzwerke können den Transfer von Wissen und Handlungsstrategien sowie die gemeinsame Lösungsentwicklung forcieren. Der vorgeschlagene Beitrag fokussiert auf zwei schulische Innovationsprozesse: Schulentwicklung im Kontext der Bildung in einer digitalisierten Welt und Schulentwicklungsprozesse im Kontext der BNE, die beide in Schulnetzwerken organisiert und adressiert werden. Aus theoretischer Sicht wird dazu die Zusammenarbeit innerhalb der Schulnetzwerke und die Transferarbeit in die Einzelschule hinein mit dem Modell der Kooperationsformen von Lehrkräften nach Gräsel, Fussangel & Pröbstel (2006) analysiert.

Die Analysen erfolgen im Rahmen des durch das BMBF geförderten Projekts „Digitale Schulentwicklung in Netzwerken“ (DigiSchulNet), das an der Universität Duisburg-Essen durchgeführt wird. Neugegründete Schulnetzwerke mit thematischem Fokus auf Digitalisierung bzw. BNE werden über einen Zeitraum von drei Jahren mittels Befragungen der im Netzwerk aktiven Lehrpersonen begleitet. Im Mittelpunkt stehen die Beziehungs- und Kommunikationsstrukturen der Lehrpersonen und die Frage, wie sich diese im Zeitverlauf entwickeln. Mit Blick auf Schulentwicklungsprozesse wird untersucht, was Akteure in den Netzwerken voneinander in Bezug auf Bildung in der digitalisierten Welt bzw. BNE lernen können und welche neuen Strategien sich entwickeln lassen. Wie verlaufen Transferprozesse von Wissen und Handlungsstrategien zu digitalen bzw. nicht-digitalen Innovationen im Netzwerk und vom Netzwerk in die Einzelschule? Welche Akteurs- und Beziehungskonstellationen zeigen sich?

Es werden drei Schulnetzwerke mit Fokus auf Schulentwicklung im Kontext der Digitalisierung und ein Schulnetzwerk mit Fokus auf BNE vergleichend mittels einer egozentrierten Netzwerkanalyse (z.B. Perry, Pescosolido & Borgatti, 2018) untersucht. Dabei werden pro Schulnetzwerk fünf Schulen befragt, aus denen mindestens eine Lehrkraft teilnimmt. Durch alle drei Monate wiederholte Online-Befragungen werden über drei Jahre die beruflichen Netzwerke der Netzwerklehrkräfte betrachtet, die im Netzwerk Wissen und Handlungsstrategien austauschen und das dort erworbene Innovationswissen in die Einzelschule tragen und Diffusionsprozesse initiieren sollen. Die beruflichen Netzwerke werden dabei entlang der Kooperationsformen erhoben, sodass sich inner- und interschulische Netzwerke des Austauschs, der arbeitsteiligen Zusammenarbeit und der Ko-Konstruktion unterscheiden lassen. Zur Befragung wird eine Software eingesetzt, die die beruflichen Netzwerke – angelehnt an die Idee von Netzwerkkarten (Straus, 2010) – in der Befragungssituation zur kognitiven Unterstützung der Befragten visualisiert (Stark & Krosnick, 2017).

Im Beitrag werden Zwischenergebnisse der ersten Erhebungswellen der Netzwerkanalysen vorgestellt und diskutiert. Es erfolgt eine längsschnittliche Auswertung der Daten hinsichtlich der Größe und Komposition der Ego-Netzwerke (bspw. Zugehörigkeit der Akteure zur eigenen Schule, anderen Netzwerkschulen, weiteren Bildungsakteuren; Bevorzugung gleichartiger Akteure in den Kooperationsnetzwerken sowie bezüglich der Themenschwerpunkte der Kooperationen). Dadurch werden Erkenntnisse über die Formen der Kooperation von Lehrkräften im Zeitverlauf und in Bezug auf Schulentwicklungsdimensionen bzw. Inhalte gewonnen. Des Weiteren können erste Aussagen über typische bzw. günstige Akteurskonstellationen für den Transfer in Schulnetzwerken und innerhalb der Einzelschulen getroffen werden.



Open Access in der Berufsbildungsforschung

Laura Getz, Karin Langenkamp, Bodo Rödel, Kerstin Taufenbach, Meike Weiland

Bundesinstitut für Berufsbildung, Deutschland

Der Beitrag führt kurz in die Thematik Open Access ein. Open Access meint den freien Zugang zu wissenschaftliche Fachpublikationen (kostenfrei, rechtlich abgesichert und mit einer einfachen Zugriffsmöglichkeit). Dabei ist herauszustellen, dass im STM-Bereich Open Access ein gut eingeführtes Publikationsmodell ist und dessen Vorteile weitestgehend anerkannt sind (vgl. Suber 2012). Im Gegensatz dazu scheinen die Geistes- und Sozialwissenschaften eine tendenziell größere Zurückhaltung an den Tag zu legen. Auch werden Open-Access-Bestrebungen in diesem Bereich immer wieder kritisch beurteilt.

Mit dieser Problematik setzt sich das Forschungsprojekt "Open Access in der Berufsbildungsforschung" (www.bibb.de/oabbf) des Bundesinstituts für Berufsbildungsfoschung (BIBB) auseinander. Das Projekt und seine Ergebnisse werden im Anschluss an die Einführung vorgestellt.

Das Forschungsprojekt untersucht die technisch-strukturellen, politisch-normativen und wissenschaftssystem-immanenten Bedingungen, die die Akzeptanz, Verbreitung und Nutzung von Open Access aus der Perspektive der Autorinnen und Autoren im Gegenstandsbereich der Berufsbildungsforschung beeinflussen. In den Blick genommen wird auch das Spannungsfeld von Autorenschaft und Nutzung wissenschaftlicher Publikationen. Das Forschungsprojekt stützt sich dabei auf einen wissenschaftssoziologischen und medientheoretischen Hintergrund (vgl. Willke 1998, Lyotard 2015, Taubert/Weingart 2016).

Die empirische Fundierung des Forschungsprojekts basiert auf einer qualitativen Exploration durch Gruppendiskussionen mit Wissenschaftlerinnen und Wissenschaftlern aus der Berufsbildungsforschung. Dafür wurden vier strukturierte Gruppendiskussionen in Form von Fokusgruppen in Bonn, Köln, Hamburg und Paderborn mit jeweils fünf bis acht Teilnehmenden im zweiten Quartal 2018 durchgeführt. Alle Befragten hatten einen berufsbildungswissenschaftlichen Hintergrund. Die Zusammensetzung der Gruppendiskussionen erfolgte mit Personen, die über unterschiedlichen Status im Wissenschaftssystem verfügen. Der Diskussionsverlauf wurde thematisch durch einen Leitfaden mit offenen Fragen gesteuert. Dies ermöglichte den Teilnehmenden, ihre Sichtweise und ihre Erfahrungen einzubringen, während gleichzeitig sichergestellt wurde, dass die für das Forschungsprojekt wichtigen Aspekte angesprochen werden konnten.

Im Vorfeld der Diskussionen wurden zur Erstellung des Leitfadens theoretische Vorannahmen zu möglichen Hypothesen verdichtet: Identifiziert wurden mögliche Einflussfaktoren (Wissen, Fachkultur und Status) sowie Aspekte, die den Merkmalsraum beschreiben (Qualitätssicherung, rechtliche Bedingungen, Finanzierung, Reputation, Zugriffsmöglichkeiten, Nützlichkeit).

Die Auswertung der transkribierten Interviews orientiert sich an der qualitativen Inhaltsanalyse nach Mayring (2015). Diese erlaubt es, im gewonnenen Datenmaterial verschiedene Schichten zu analysieren. Neben dem primären Inhalt können auch latente Inhalte durch Interpretationen erschlossen werden. Die Inhaltsanalyse ermöglicht zudem eine Quantifizierung, wie z. B. die Häufigkeit bestimmter Themen. Die Auswertung wurde mit Hilfe von MAXQDA durchgeführt.

Der Vortrag wird die Ergebnisse der qualitativen Inhaltsanalyse präsentieren, die bis Ende 2019 abgeschlossen sein soll. Da die Berufsbildungsforschung keine eigenständige Disziplin ist, sondern vielmehr eine Verbindung unterschiedlicher Bezugswissenschaften (vgl. Sloane 2006; Weiß 2008), ist zu vermuten, dass die Ergebnisse auch auf andere Wissenschaftsbereiche der Sozial- und Geisteswissenschaften zumindest partiell übertragbar sind und so zu einem Erkenntnisgewinn für die gesamten Sozial- und Geisteswissenschaften mit Blick auf Open Access beitragen.

Auf der Exploration des Forschungsfeldes durch die Gruppendiksussionen baut eine Onlinebefragung auf, die 2020 durchgeführt wird.



Offene Bildungsmaterialien für partizipatives Lehren und Lernen in der digitalen Welt: Cui bono?

Daniel Otto

Universität Disburg-Essen, Deutschland

Nicht erst seit dem UNESO-Bericht 2002 sind Open Educational Resources (OER), im deutschen als offene Bildungsmaterialien bezeichnet, ein prominenter Gegenstand der Bildungsdiskussion (UNESCO, 2002). OER sollen durch die „5 V-Freiheiten für Offenheit“ das Verwahren/Vervielfältigen, Verwenden, Verarbeiten, Vermischen und Verbreiten von Bildungsmaterialien ermöglichen (Wiley & Hilton, 2018). OER sind daher elementar, um partizipative und kollaborative Lernszenarien zu entwickeln und zu fördern. Besonders neuere Konzepte der Open Educational Practices (OEP) und einer Open Pedagogy (OP) sehen OER als eine notwendige Bedingung für das Lehren und Lernen in der digitalen Welt (Koseoglu & Bozkurt, 2018; Wiley & Hilton, 2018).

Der Zuschreibung eines pädagogischen Mehrwertes auf theoretisch-konzeptioneller Ebene steht das Paradox einer geringen OER-Permeabilität in die Bildungspraxis gegenüber. Dieser Befund trifft auch auf die deutsche Bildungslandschaft zu (Orr, Neumann, & Muuß-Merholz, 2017). Der Beitrag möchte diese Lücke zwischen theoretischer Erwartung und empirischer Absenz verringern. Folgende Forschungsfrage wird dafür untersucht: Wie kann die bisher geringe Nutzung von OER in der Bildungspraxis erklärt werden? Während sich bisher viele Studien auf die strukturellen Gründe für die mangelnde Nutzung konzentrieren, wie Zeitmangel, Rechtsunsicherheiten und institutionelle Barrieren (Bozkurt, Koseoglu, & Singh, 2019), fokussiert sich die vorliegende Untersuchung auf die Einstellungskomponente (attitudes) von Personen zu OER und den dahinter liegenden Werten und Überzeugungen. Kurz gesagt, beschreibt die Theorie der Einstellung eine positive oder negative Bewertung einer Person gegenüber einer anderen Person, einem Ort, einer Sache oder einem Ereignis. Eine in der Literatur weit verbreitete Definition konzipiert Einstellungen als “anything a person may hold in mind, ranging from the mundane to the abstract, including things, people, groups, and ideas” (Bohner & Dickel, 2010, S. 392). Hinsichtlich der verschiedenen Komponenten der Einstellung einer Person haben Rosenberg und Hovland (1960) eine Taxonomie identifiziert, die eine kognitive (Wissen), eine affektive (Gefühle und Emotionen) sowie eine verhaltensbezogene (Aktion) Komponente umfassen.

Methodisch wurde die Taxonomie für einen Fragebogen operationalisiert, um die Einstellung von Personen aus allen Bildungsbereichen bezüglich OER zu ermitteln. Dieser besteht aus drei Abschnitten, von denen jeder eine Komponente der Einstellungen erfasst. Darüber hinaus wurden die Personen zu den wichtigsten Hindernissen für die Nutzung von OER in der Praxis befragt. Für eine möglichst breite Datenerhebung wurde eine Online-Umfrage auf Veranstaltung, Workshops, Newslettern und weiteren digitalen Kommunikationsformen wie Twitter distribuiert.

Die Ergebnisse der Befragung (n=185) zeigen Bildungsbereich übergreifend, dass die Gründe für die mangelnde Nutzung von OER nicht in der Einstellungskomponente verortet sind. Vielmehr zeigt die Analyse besonders für die affektive und die verhaltensbezogene Komponente hohe Ausschläge. Salient ist die Existenz einer Art OER-Gemeinschaft, die starke Gefühle und Emotionen mit den Kernwerten Teilen und Zusammenarbeit, die für das Konzept der OER von zentraler Bedeutung sind, verbindet und die OER in ihre Bildungspraxis integriert. Die zentrale Herausforderung scheint nach wie vor darin zu bestehen, Menschen außerhalb dieser engagierten OER-Gemeinschaft anzuziehen und für die Partizipation an OER zu qualifizieren. Die Ergebnisse zeigen weiterhin, und nicht überraschend, dass der Wissensstand über OER ein Prädiktor für letzteres ist. Abschließend ist die Einführung von permanenten und umfassenden Ausbildungsprogrammen in Bildungseinrichtungen vielversprechend und sollte bestenfalls verpflichtend sein oder zumindest in irgendeiner Weise von den jeweiligen Institutionen akkreditiert werden, bevor sie sich auf den Abbau struktureller Barrieren konzentrieren. Auf struktureller Ebene muss in erster Linie der Grundgedanke des Teilens und der Partizipation in den Bildungseinrichtungen stärker verankert werden. Individuelle und strukturelle Maßnahmen dürfen sich allerdings nicht gegenseitig ausschließen, sondern sollten gleichzeitig verfolgt werden.

Für die zukünftige Forschung wäre es notwendig, die Ergebnisse zu verfestigen und weiter zu untersuchen, wie sie mit den Ergebnissen über die Einstellungen zur Erklärung von OER-Praktiken in anderen Ländern koinzidieren.



Zu den Einflüssen auf Niveau und Zuwachs von Computational Thinking

Josef Guggemos, Sabine Seufert

Universität St.Gallen, Schweiz

Die digitale Transformation hat weitreichende Auswirkungen auf das Bildungssystem (Blossfeld et al., 2018). Neben Technologieeinsatz im Unterricht, ist eine zentrale Frage, welche neuen Kompetenzen die Lernenden benötigen. Besonders im internationalen Kontext gilt Computational Thinking (CT) als ein 21st-century skill (Voogt, Fisser, Good, Mishra, & Yadav, 2015; Wing, 2006). CT zielt darauf ab, Methoden der Informatik zu nutzen, um Probleme in einer Vielzahl an Domänen zu lösen (Buitrago Flórez et al., 2017). Auch im deutschsprachigen Kontext wird CT zunehmend erforscht (Eickelmann, 2019; Repenning et al., 2018). Als Konstrukt steckt CT im Vergleich z.B. zur Mathematikleistung noch in den Kinderschuhen (Shute, Sun, & Asbell-Clarke, 2017). Die Einflussfaktoren auf Niveau und Entwicklung von CT sind wenig erforscht. Vornehmlich anzutreffen sind (quasi-)experimentelle Studien, die Effekte von Interventionen untersuchen, z.B. den Einsatz von Computerspielen (Zhao & Shute, 2019). Ein Forschungsdesiderat besteht hier in der Untersuchung von CT-Lernen in natürlichen Unterrichtssettings (Ilic, Haseski, & Tugtekin, 2018; Lye & Koh, 2014). Vorliegende Studien anhand von Strukturgleichungsmodellen haben den Nachteil einer querschnittlichen Betrachtungsweise, ausserdem greifen sie zur Erfassung von CT regelmässig auf Selbsteinschätzungen zurück (e.g. Durak & Saritepeci, 2018).

Die Forschungsfrage des vorliegenden Beitrags ist:

Welche Faktoren beeinflussen das CT-Niveau und den CT-Zuwachs bei Lernenden auf Sekundarstufe II?

Als Stichprobe fungieren Schweizer Kantonsschülerinnen und -schüler (= Gymnasium) der 11. Jahrgangsstufe aus 12 Schulklassen. Daten wurden zu Beginn, Mitte und am Ende des Schuljahrs 2018/19 jeweils in einem zweiwöchigen Slot erhoben: n(t1) = 202, n(t2) = 198, n(t3) = 175. Das Alter der Probanden betrug in t1 17.23 Jahre (SD = 0.85), der Frauenanteil 56%. Fehlende Werte und die Abnahme der Stichprobe gehen zurück auf Krankheitsfälle bzw. den Ausfall einer Klasse in t3 aus schulorganisatorischen Gründen. Zur Beantwortung der Forschungsfrage dient ein lineares Wachstumsmodell mit clusterrobusten Standardfehlern auf Klassenebene und ‘MLR-Schätzer’ (R-package lavaan 0.6-3). Fehlende Werte imputierten wir (R-packages semTools 0.5-1 [mi.growth] i.V.m. mice 3.4.0). Für die IRT-Skalierung des CT-Tests verwendeten wir das R-package TAM 3.1-45.

Auf Grundlage des CT-Forschungsstands (Durak & Saritepeci, 2018; Eickelmann, 2019; Ilic et al., 2018; Román-González, Pérez-González, Moreno-León, & Robles, 2018) vermuten wir hinsichtlich Achsenabschnitt und Steigung einen positiven Einfluss von ‘Geschlecht männlich’, ‘sozioökonomischer und kultureller Status der Eltern’, ‘Fehlen eines Migrationshintergrunds’, ‘Intelligenz (Reasoning)’, ‘Computer Literacy’, ‘Sprachfähigkeit’, ‘Mathematikfähigkeit’, Programmierkenntnisse’, vergangene Lerngelegenheiten’, ‘Lerngelegenheiten im Schuljahr’, ‘Dauer Computernutzung’, ‘Motivation’, ‘Selbstkonzept’ und ‘Anstreben eines naturwissenschaftlichen Berufs’.

CT erfassten wir in t1, t2 und t3 mit dem CTt (Román-González, Pérez-González, & Jiménez-Fernández, 2017), einem international anerkannten CT-Leistungstest (Shute et al., 2017). Evidenz für die Rasch-Skalierbarkeit liegen vor. Die WLE-Reliabilität beträgt für alle drei Zeitpunkte über 0.81. Die unabhängigen Variablen erhoben wir in t1. Die Kontextfragen stammen aus der PISA-Studie 2015 (Schweizer Eidgenossenschaft, 2018). Darüber hinaus kamen folgende Instrumente zum Einsatz: INCOBI-R zur Erfassung von ‘Computer Literacy’ (Richter, Naumann, & Horz, 2010), HMT-S zur Messung von Intelligenz (Reasoning) (Heydasch, Haubrich, & Renner, 2017), Selbstkonzept (Köller, Daniels, Schnabel, & Baumert, 2000), Motivation (Prenzel & Drechsel, 1996) sowie wahrgenommene Lerngelegenheiten (Byrne & Flood, 2003). Die erfassten Konstrukte weisen allesamt eine Reliabilität von grösser als 0.70 auf.

Der globale Fit des latenten Wachstumsmodells unter Aufnahme der genannten Variablen ist gut: Chi2(16) = 21.30, p = .17, CFI = 0.984, TLI = 0.955, RMSEA = 0.037, SRMR = 0.016.

Auf dem 5%-Niveau zeigten folgende Variablen signifikant positive Zusammenhänge mit dem Achsenabschnitt (CT-Niveau): ‘Geschlecht männlich’, ‘sozioökonomischer und kultureller Status der Eltern’, ‘Intelligenz (Reasoning)’, ‘Mathematikfähigkeit’, ‘vergangene Lerngelegenheiten’, ‘Dauer der Computernutzung’ und ‘Selbstkonzept’.

Für die Steigung (CT-Zuwachs) ergaben sich auf dem 5%-Niveau folgende signifikant positive Zusammenhänge: ‘Computer Literacy’, ‘sozioökonomischer und kultureller Status der Eltern’ und ‘Lerngelegenheiten im Schuljahr’.

Durch die Untersuchung von CT-Lernen in einem längsschnittlichen Design tragen wir zum Motto der Konferenz «Digitalisierung nutzen» bei.

 
9:00 - 10:45F9–S16: Multimediales Lernen
S16 
 

Lernen in der virtuellen Realität: Wie beeinflussen Motivation und Gestaltungsvarianten den Lernerfolg?

Andrea Vogt, Patrick Albus, Mareike Schüle, Tina Seufert

Universität Ulm, Deutschland

Theoretischer Hintergrund

Durch die technologische Entwicklung ergeben sich immer mehr neue Gestaltungsmöglichkeiten für Lernumgebungen. Ein Beispiel hierfür sind virtuelle Realitäten als Lernumgebung. Diese Form der Lernumgebung wurde wenig und kaum systematisch erforscht. Wichtige Faktoren, wie etwa das Design der Lernumgebung oder kritische Lernereigenschaften fanden bisher wenig Beachtung.

Das konkrete Design der Lernumgebung kann den Lernerfolg substanziell beeinflussen (Mayer, 2003). Beispielsweise das sogenannte signaling ist eine oft gebräuchliche Methode, um wichtige Lerninhalte zu betonen und Aufmerksamkeit zu lenken. Dies kann beispielsweise durch Annotationen erfolgen (Schneider, Beege, Nebel, & Rey, 2018). In virtuellen Lernumgebungen eröffnen sich neue Möglichkeiten Annotationen zu nutzen. Bei der Kombination verschiedener Darstellungsformen des Lerninhalts, beispielsweise durch Text und Bild, ist die Verknüpfung der Inhalte, auch Kohärenzbildung genannt, durch den Lernenden von zentraler Bedeutung (Seufert, 2003). Das Einfügen von Annotationen kann die Verknüpfung der verschiedenen Elemente erleichtern und somit eine Hilfestellung darstellen, die den Lernerfolg erhöhen kann (Schneider et al., 2018).

Damit Hilfen ihren positiven Effekt entfalten können, sind Eigenschaften des Lernenden von zentraler Bedeutung (Côté & Levine, 2000). Neben Vorwissen, dem am häufigsten untersuchten Lernermerkmal, spielen andere Faktoren wie beispielsweise Motivation eine entscheidende Rolle (Cordova & Lepper, 1996; Kalyuga, 2005). Besonders die intrinsische Motivation des Lernenden könnte kompensierend wirken, wenn die Lernumgebung nicht ideal gestaltet ist (Mayer & Sims, 1994).

Fragestellung

Aus den beschriebenen Befunden und Theorien ergeben sich folgende zentrale Fragen: Welchen Effekt hat das Einfügen von Annotationen in der virtuellen Lernumgebung und welche Rolle spielt dabei die Motivation der Lernenden?

Die erste Hypothese betrachtet daher Lernerfolg in Abhängigkeit des Vorhandenseins von Annotationen. Dabei wird für die Gruppe mit Annotationen ein signifikant höher Lernerfolg erwartet im Vergleich zu der Gruppe ohne Annotationen.

Außerdem wird auch ein bedeutsamer Effekt der Motivation angenommen. Generell ist zu erwarten, dass Lernende mit höherer Motivation bessere Lernergebnisse zeigen. Zudem ist eine Wechselwirkung mit dem Design der Lernumgebung zu erwarten. Da die Annotationen den Lernprozess erleichtern bedarf es möglicherweise keiner zusätzlichen Motivation, um ein gutes Lernergebnis zu erzielen. In der zweiten Hypothese wird daher eine signifikante Interaktion zwischen Annotationen und intrinsischer Motivation erwartet. In der Gruppe mit Annotationen wird ein geringerer Einfluss der Motivation auf den Lernerfolg angenommen. In der Gruppe ohne Annotationen und damit ohne Unterstützung sollte sich eine höhere Motivation jedoch auszahlen, d.h. in dieser Gruppe sollte die Motivationen kompensierend wirken und einen signifikant positiven Einfluss haben.

Methode

Die Stichprobe der vorliegenden Studie setzte sich aus N=44 Studierenden, davon 19 männlichen Teilnehmern, zusammen. Das mittlere Alter betrug M=23.73 (SD=6.00). Die Studierenden wurden zufällig einer der beiden Experimentalgruppen zugewiesen. Bei der Experimentalgruppe wurde in der virtuellen Lernumgebung Annotationen eingeblendet, welche bei der Kontrollgruppe nicht enthalten waren. Als abhängige Variable wurde die Lernleistung der Studierenden erfasst. Zudem wurden das domänenspezifische Vorwissen und die Motivation der Lernenden untersucht.

Ergebnisse

In der vorliegenden Studie konnte kein signifikanter Unterschied zwischen der Gruppe mit und ohne Annotation auf Lernerfolg gefunden werden (t(42)=0.78, p =.220). Basierend auf einer multiplen linearen Regression, unter Berücksichtigung des Vorwissens, zeigte sich die erwartete signifikante Interaktion zwischen dem Lernumgebungsdesign und der Motivation: In der Gruppe mit Annotationen konnte kein Effekt der Motivation auf den Lernerfolg gefunden werden. In der Gruppe ohne Annotationen zeigte sich hingegen ein positiver Effekt von Motivation auf den Lernerfolg (β =.58, p <.001).

Diskussion

In der vorliegenden Studie konnte die Bedeutung der Einbeziehung von Lernereigenschaften wie beispielsweise Motivation für den Effekt des Lernumgebungsdesigns auf den Lernerfolg gezeigt werden. In zukünftigen Studien könnten zusätzliche Faktoren wie beispielsweise eine differenzierte Messung von kognitiver Belastung weitere Aufschlüsse darüber geben, wie die Belastung und die Aktivierung der Lernenden durch die Gestaltung des Lernmaterials beeinflusst werden kann.



Ein narratives Review zum Redundanzeffekt beim multimedialen Lernen: Chaos in der Theorie erzeugt heterogene Ergebnisse.

Melanie Trypke1, Ferdinand Stebner1,2, Joachim Wirth1

1Ruhr-Universität Bochum, Deutschland; 2Universität Osnabrück

In der Multimediaforschung haben sich verschiedene Designprinzipien für Lernmaterialien empirisch bewährt. Einer der meist untersuchten Effekte ist der Redundanzeffekt, welcher eine verminderte Lernleistung durch die Mehrfachverarbeitung sich überschneidender Informationen beschreibt (Kalyuga & Sweller, 2014).

In der Cognitive Load Theory (CLT; Sweller & Chandler, 1991) beschreibt der Redundanzeffekt eine verminderte Lernleistung durch die simultane Darstellung identischer, ähnlicher oder unnötig ausgeführter Informationen in multiplen Modalitäten (Kalyuga & Sweller, 2014). Dadurch, dass die Arbeitsgedächtniskapazität begrenzt ist, führt das doppelte bzw. unnötige Verarbeiten von Informationen zu einer erhöhten lernirrelevanten kognitiven Belastung (Paas & Sweller, 2012).

Das Redundanzprinzip basierend auf der Cognitive Theory of Multimedia Learning (CTML; Mayer, 2014) fokussiert die Sinnesmodalitäten, mit denen Informationen verarbeitet werden. Danach werden schlechtere Lernergebnisse erzielt, wenn eine Grafik sowohl über geschriebenen als auch über gesprochenen Text erklärt wird. Da die Informationen simultan in dem gleichen Verarbeitungskanal eintreffen, kann es zu einer Überlastung des visuellen (Bild und geschriebener Text) oder des verbalen Kanals (Narration und geschriebener Text) kommen (z. B. Mayer, 2007). Entgegen dieser Annahme lassen sich aber auch positive Effekte der Redundanz auf die Lernleistung nachweisen (Mayer & Johnson, 2008).

Unter welchen Bedingungen Redundanz lernförderlich oder lernhinderlich ist, ist umstritten. Studien finden negative (z. B. Aldalalah, 2010), speziell bei der verbalen Redundanz aber auch positive Effekte, wenn eine Narration um geschriebene Stichworte ergänzt wird (z. B. Mayer & Johnson, 2008). Auch die Metaanalyse von Adesope und Nesbit (2012) zeigt einen durchschnittlich positiven Effekt g=0.15 (KI= 0.08, 0.22), allerdings auch eine hohe Heterogenität der Studien (I²= 81,6%).

Bisher wurden nur wenige Versuche unternommen, die verschiedene Arten von Redundanz, die sich unter anderem aus der verwendeten Bezugstheorie ergeben, systematisch zu konzeptualisieren (z. B. Dooley, 2015, Schroeder & Cenkci, 2018). Vielmehr nutzen empirische Studien oftmals sowohl die CLT als auch die CTML als theoretische Grundlage ohne zu berücksichtigen, dass diese beiden Theorien zu unterschiedlichen Definitionen von Redundanz kommen. Dies führt zu konfundierten Untersuchungsdesigns und schwer zu interpretierenden Ergebnissen.

Daher stellt sich die Frage, ob die gefundenen Effekte von der Definition und Operationalisierung von Redundanz abhängig sind und durch weitere Bedingungsfaktoren moderiert werden. In Form eines narrativen Reviews wird ein Klassifikationssystem vorgestellt, welches theoretische und empirische Unterschiede analysierbar macht, um verschiedene Facetten des Redundanzeffekts, ihre Wirkungsweisen und Bedingungsfaktoren zu vergleichen.

Methode

Nach einer Literaturrecherche in den Datenbanken Web of Science, Google Scholar, PsycInfo, ERIC, Science Direct, wurden Selektionskriterien festgelegt und 70 Studien extrahiert. Anschließend wurden die Studien anhand ihrer Bezugstheorie klassifiziert. Es wird angenommen, dass die unterschiedlichen Bezugstheorien auch zu Unterschieden in der Konstruktion von Experimentalgruppen, Lernmaterialien und Instrumenten führen, weshalb diese Dimensionen in dem vorgestellten Review analysiert werden.

Ergebnisse

Die Ergebnisse zeigen, dass die Definition der CTML dominiert n=26 (37,1%), wobei die größte Anzahl an Studien auf beide Definitionen zurückgreift n=28 (40%). Von den 70 Studien berichten n=15 (21,4 %) positive, n=26 (37,1%) negative und n=9 (12,9%) gemischte Effekte. Besonders auffällig ist die hohe Zahl an Studien, welche keinen Effekt nachweisen konnten (n=20; 28,6%). In Kombination mit der Definition von Redundanz sind die Befunde der Studien auf Basis der CTML deutlich heterogener als jene der CLT, bei denen Studien mit negativen Effekten überwiegen. Die Analyse der weiteren Dimensionen veranschaulicht die Heterogenität der Studien noch deutlicher. Je nachdem, welche Definition von Redundanz vorliegt, unterscheiden sich die Experimentalgruppen und das Lernmaterial. Auch in Bezug auf die Posttestformate zeigen sich Unterschiede.

Diskussion

Das Review verdeutlicht die Notwendigkeit, den Begriff der Redundanz detaillierter zu konzeptualisieren. Folglich wurden verschiedene Typen und Grade an Redundanz theoretisch ausgearbeitet und diskutiert. Theoretische, empirische sowie praktische Konsequenzen werden auf der Tagung diskutiert.



Die Bedeutung von Bildschirmmedien für Kinder mit einer Autismus-Spektrum-Störung – Medienkompetenzkonzepte erweitern

Anja Stiller

Kriminologisches Forschungsinstitut Niedersachsen e.V., Deutschland

Theoretischer Hintergrund – Bildschirmmedien sind ein fester Bestandteil im Alltag von Kindern und Jugendlichen mit und ohne Autismus-Spektrum-Störung (ASS; z.B. Mazurek & Wenstrup, 2013; Feierabend, Rathgeb & Reutter, 2018). So spielt Digitalisierung auch im Rahmen von Bildung eine immer wichtigere Rolle (z.B. Albrecht & Revermann, 2016). Auch für Kinder und Jugendliche mit ASS können Bildschirmmedien in diesem Kontext einen Mehrwert haben, z.B. bezogen auf soziale (z.B. Durkin, Boyle, Hunter & Conti-Ramsden, 2013) oder kognitive (z.B. Council on Communications and Media, 2013) Fähigkeiten. Neben einer Vielzahl positiver Nutzungsmöglichkeiten von Bildschirmedien, können hohe Nutzungszeiten jedoch auch zu einem Problem werden (z.B. Mößle, Kleimann, Rehbein & Pfeiffer, 2010; Beyens & Nathanson, 2018). So wird digitale Medienkompetenz im Zuge der kontinuierlich voranschreitenden Digitalisierung immer wichtiger (z.B. Calmbach, Borgstedt, Borchard, Thomas, & Flaig, 2016). Hinsichtlich der Unterscheidung zwischen problematischer und unproblematischer Mediennutzung postulieren Bleckmann & Mößle (2014), dass die drei Dimensionen Zeit, Inhalt und Funktion einbezogen werden müssen. Die funktionale Bedeutung von Bildschirmnutzung bei Kindern und Jugendlichen ohne ASS ist unterschiedlich; so werden Medien beispielsweise als Babysitter, Belohnung oder zur Entspannung eingesetzt (z.B. De Decker et al., 2012; Nabi & Kremar, 2016). Bezogen auf Kinder und Jugendliche mit ASS liegen allerdings nur vereinzelt Untersuchungen vor, die sich zumindest marginal mit der funktionalen Bedeutung von Fernsehen und Co. beschäftigen (Stiller & Mößle, 2018).

Fragestellung – Durch die vorliegende Untersuchung wurde versucht, diese Lücke zu schließen. Eine zentrale Fragestellung fokussierte dabei auf die Erfassung der Gründe, warum Kinder und Jugendliche mit ASS Bildschirmmedien nutzen. Diese Erkenntnisse können in die Entwicklung bzw. Ergänzung medienkompetenzspezifischer Ansätze für Kinder und Jugendliche mit ASS (und deren Eltern) einbezogen werden, um auch diesbezüglich eine gleichberechtigte Teilnahme an der Gesellschaft zu ermöglichen.

Methode – Die Untersuchung basiert auf einer Triangulation qualitativer und quantitativer Daten. Zum einen wurden 13 halbstruktierte Interviews mit Eltern von Kindern und Jugendlichen mit ASS durchgeführt. Der Fokus der Interviews lag auf dem Freizeitverhalten von Kindern und Jugendlichen mit ASS und hier insbesondere auf dem Mediennutzungsverhalten (z.B. Regeln, Verhalten während der Nutzung). Zum anderen wurden Eltern von Kindern und Jugendlichen mit ASS zum Freizeitverhalten ihrer Kinder online befragt (N = 327). In diesem Online-Survey wurden mittels offener Frage („Was denken Sie, warum Ihr Kind in diesen Situationen TV/DVD schaut/Computer spielt/das Smartphone benutzt/Internet nutzt?“) differenziertere Informationen hinsichtlich der unterschiedlichen Medientypen (TV, DVD, PC) gesammelt. Die Daten der Interviews sowie auch die Freitextangaben aus dem Online-Survey wurden in Anlehnung an die qualitative Inhaltsanalyse (Mayring, 2010) durch zwei unabhängige Beurteilerinnen analysiert. Cohen’s Kappa wurde berechnet und reichte von fair (κ = .401) bis substantiell (κ = .783); jede Nicht-Übereinstimmung wurde diskutiert bis eine 100 %-ige Übeeinstimmung erzielt wurde.

Ergebnisse – Kinder und Jugendliche mit ASS nutzen Bildschirmmedien (und hier insbesondere TV und Videospiele) überwiegend zur Entspannung. Im Rahmen der Interviews wurde ergänzend festgestellt, dass die Anwesenheit der Eltern bzw. eines Elternteils für Kinder und Jugendliche mit ASS während des Medienkonsums mitunter wichtig sein kann, damit diese vor allem bei Fragen zur Verfügung stehen und Medieninhalte ggf. in die Interpretation des Verhaltens des Kindes integriert werden können. Auch die Förderung spezifischer (z.B. sozialer) Fähigkeiten durch Bildschirmmedien wurde von den Eltern thematisiert. Diese Erkenntnisse können genutzt werden, um (bestehende) Konzepte hinsichtlich digitaler Medienkompetenz um Aspekte spezifisch bezogen auf Kinder und Jugendliche mit ASS zu ergänzen, bzw. um neue spezifische Konzepte zu entwickeln. Dabei sollten Eltern berücksichtigt werden, da diese bei der Mediennutzung wie auch allgemein bei der Freizeitgestaltung ihrer Kinder und Jugendlichen mit ASS eine wichtige Rolle spielen (siehe auch z.B. Xu, Wen & Rissel, 2015).



Der Einsatz von digitalen Medien im inklusiven naturwissenschaftlichen Unterricht

Lisa Stinken-Rösner, Simone Abels

Leuphana Universität Lüneburg, Deutschland

Das Angebot an digitalen Medien für den Unterricht ist in den letzten Jahrzehnten stets gewachsen. Insbesondere für die naturwissenschaftlichen Fächer werden dabei sehr spezifische Angebote wie z.B. Simulationen entwickelt. Durch den Einsatz digitaler Medien soll die Qualität des Fachunterrichts erhöht sowie eine digitale Medienkompetenz auf Seite der Schüler*innen entwickelt werden (KMK, 2016). Diverse Studien haben gezeigt, dass der Einsatz von Simulationen unter anderem dazu beitragen kann das Interesse und die Motivation der Schüler*innen zu steigern, ihr konzeptionelles Verständnis zu verbessern, sowie einen stärkeren und länger anhaltenden Lernzuwachs hervorzurufen (de Jong & von Joolingen, 1998; Baumann et al., 2013; Rutten et al. 2012; Vogel et al., 2006). Zusätzlich ermöglichen Simulationen durch ihre Interaktivität und Anpassungsfähigkeit an individuelle Lernvoraussetzungen eine höhere Partizipation der Schüler*innen im inklusiven Fachunterricht (Blake & Scanlon, 2007).

Ob diese Potenziale jedoch von Lehrkräften erkannt und im Unterrichtsalltag genutzt werden, ist bisher nicht nachgewiesen. Somit ergibt sich folgende Fragestellung:

In welchem Maße nutzen Lehrkräfte digitale Medien und insbesondere Simulationen im (inklusiven) naturwissenschaftlichen Unterrichtsalltag?

Der Einsatz von Simulationen im naturwissenschaftlichen Unterricht wird mit Hilfe eines Fragebogens untersucht. Dieser setzt sich aus vier Abschnitten zusammen: ‚Einsatz von Experimenten und Simulationen‘, ‚Auswahl von Simulationen‘, ‚Demographische Daten‘ und ‚Technische Ressourcen‘, die sowohl geschlossene, als auch offene Aufgabenstellungen enthalten. Alle Aufgabenstellungen wurden zunächst von Expert*innen (n=7), anschließend im Rahmen einer Pilotierung mit Lehramtsstudierenden (n=11) überprüft. Lehrkräfte, die keine Simulationen im Unterricht einsetzen, bearbeiten eine leicht abgewandelte Version, wodurch sich die Stichprobe in zwei Gruppen aufteilt.

Insgesamt haben 76 Lehrkräfte (37 Physik, 27 Chemie, 25 Biologie und 14 Naturwissenschaften) an der Befragung teilgenommen. Die befragten Lehrkräfte verfügen über mittelmäßige bis gute technische Ressourcen (60% Tablets, 70% Smartphones, 80% Computer, 60% Internet, 90% Beamer).

61% der befragten Lehrkräfte setzen Simulationen im Unterricht ein.

Im Schnitt wird alle vier Unterrichtsstunden eine Simulation zur Erarbeitung und/oder zur Vertiefung von Inhalten eingesetzt. Der Einsatz hängt weder mit dem Alter (M=42.51, SD=9.31, p=.735) oder der Erfahrung (M=12.24, SD=8.03, p=.578) der Lehrkraft, noch mit der Anzahl an Unterrichtsstunden pro Woche (4.20<M<8.61, .068<p<.699) zusammen. Signifikante Unterschiede bezüglich des Einsatzes existieren in Bezug auf das Geschlecht (X^2(1,N=76)=3.916, p=.048*), die Schulform (X^2(6,N=76)=15.759, p=.015*) und das Unterrichtsfach (X^2(4,N=103)=11.928, p=.018). Am häufigsten werden Simulationen der Internetportale planet schule (34%), LEIFI Physik (32%) und PhET (20%) eingesetzt, wobei die Bekanntheit sowie der Einsatz signifikant mit dem Unterrichtsfach zusammenhängt (.000<p<.037).

Wichtigste Gründe für den Einsatz von Simulationen sind die Veranschaulichung nicht sichtbarer Prozesse (26%), die Kompensation von fehlendem, defektem oder gefährlichem Experimentiermaterial (19%) sowie der geringere Aufwand (10%) und die verlässlicheren Ergebnisse (5%) im Vergleich zum Realexperiment.

Die wichtigsten Kriterien bei der Auswahl von Simulationen, beurteilt auf einer 4-stufigen Likert-Skala, sind die fachliche Korrektheit (M=3.9, SD=0.4), eine kostenlose Nutzungsmöglichkeit (M=3.6, SD=0.6) sowie die Nutzung von angemessener Fachsprache (M=3.5, SD=0.6). Von geringer Bedeutung ist hingegen die Berücksichtigung kultureller Vielfalt (M=2.1, SD=1.0), eine gendersensible Sprache (M=2.0, SD=0.9) oder die Möglichkeit zwischen verschiedenen Sprachen zu wählen (M=2.0, SD=0.8). Bei knapp der Hälfte aller Kriterien stellen Lehrkräfte, die keine Simulationen einsetzen, signifikant höhere Ansprüche an Simulationen (.000<p<.021). Insbesondere Kriterien, die bei einer diversen Schüler*innengruppe von Bedeutung sind, sind für Lehrkräfte, die an der Sekundarstufe I tätig sind, von größerer Bedeutung.

Gut die Hälfte der befragten Lehrkräfte setzt bereits Simulationen im Unterricht ein. Im Unterrichtsalltag überwiegen jedoch pragmatische Gründe bei der Auswahl und dem Einsatz von Simulationen. Ihr Potential für den inklusiven Unterricht wird nur von einem Teil der Lehrkräfte erkannt und nur in Einzelfällen genutzt. Die aktuelle Herausforderung besteht darin (angehende) Lehrkräfte so zu schulen, dass sie neben pragmatischen Gründen auch die Potentiale von Simulationen, wie z.B. Partizipation und Individualisierung, für den inklusiven Unterricht anhand konkreter Anwendungsbeispiele erkennen und bestmöglich nutzen können.

 
11:15 - 13:00F11-S17: Bildungsforschung goes Open Science: Einführung und Vernetzung
S17 
 

Bildungsforschung goes Open Science: Einführung und Vernetzung

Jürgen Schneider, Samuel Merk, Sibylle Meissner, Marion Spengler, Lena Brinkmann

Universität Tübingen, Deutschland

Zielstellung
Die Ergebnisse des “Reproducibility Project: Psychology” (Open Science Collaboration, 2015) und die damit einhergehende Diskussion um eine “Replikationskrise” werden im vorliegenden offenen Beitrag zum Anlass genommen die Frage nach dem Optimierungspotential der Forschungspraktiken und -prozesse in den quantitativ-empirischen Bildungswissenschaften zu stellen. In der Psychologie wurden Werte und Praktiken im Sinne der Open Science (z.B. Präregistrierung, Open Data, Reproducible Reporting) als eine Antwort auf die Replikationskrise stark gemacht (Geukes, Schönbrodt, Utesch, Geukes & Back, 2016). Entsprechend veröffentlichten auch zentrale Forschungsfördereinrichtungen Statements zu Open Data (z.B. DFG, 2015), Open Access (z.B. BMBF, 2016) oder zu beidem (z.B. European Commission, 2016a). Open Science Praktiken haben jedoch über die Optimierung empirischer Forschung hinaus weitere Ziele wie etwa eine erhöhte Chancengleichheit beim Zugang zu Wissen oder eine stärkere Partizipation der Gesellschaft am Forschungsprozess (European Commission, 2016b). In manchen Disziplinen (z.B. Medizin, Psychologie) hat die Open Science Bewegung bereits verstärkt Aufmerksamkeit erlangt und zur Etablierung entsprechender Praktiken (z.B. Kaplan & Irvin, 2015) sowie zur Gründung entsprechender Organisationen (z.B. Society for the Improvement of Psychological Science; Open Science Center LMU München) geführt. In den Bildungswissenschaften ist jedoch seit mehreren Jahren kein koordiniertes Engagement für Open Science zu beobachten.

Daher verfolgt der vorliegende Beitrag im offenen Format das Ziel: Notwendigkeit und Potentiale von Open Science in den Bildungswissenschaften zu diskutieren und aktuelle meta-scientifische Erkenntnisse vorzustellen. Als Zielgruppe werden hierbei besonders Forschende angesprochen, die bisher wenig Erfahrung mit Open Science Practices haben. Vernetzung anzubahnen und eine Plattform für den Austausch über Open Science in den Bildungswissenschaften zu initiieren. Dabei sollen Arbeitsgruppen (AGs) gebildet werden, um bedeutende Themen der Open Science in den Bildungswissenschaften zu diskutieren, zu bearbeiten und voranzubringen. Die AGs dienen als Anlaufstelle, das Engagement individuell Forschender zu bündeln, Austausch zu ermöglichen und Synergien zu schaffen. Hier sollen besonders Forschende angesprochen werden, die bereits Erfahrung mit Open Science Practices mitbringen und sich im Rahmen des Beitrags vernetzen wollen.

Inhalte
Der Beitrag gliedert sich inhaltlich in zwei Teile: Einer allgemeinen Einführung in Notwendigkeit und Potentiale von Open Science soll die Netzwerkarbeit in Fokusgruppen folgen. In der allgemeinen Einführung wird darauf eingegangen, welche Begründungslinien die Open Science Community anführt (Fecher & Friesike, 2014), welche Praktiken Open Science definieren (Rentier, 2019) und welche Tools dafür zur Verfügung stehen. Außerdem soll skizziert werden, welche Stakeholder und Anreizstrukturen für gelingende Open Science bedeutsam sind. Im zweiten Teil sollen thematische Fokusgruppen konkrete Aspekte bearbeiten und eine inhaltliche wie institutionelle Perspektive für diese entwickeln. Vorgeschlagene Themen für diese Fokusgruppen sind (der Beitrag soll jedoch offen für weitere Themenvorschläge sein):

- Reproducible Reporting in Educational Science: Möglichkeiten, Empfehlungen, Tools & Workflows

- Organisation eines Barcamps “Open Science in den Bildungswissenschaften”

- Spezifische Herausforderungen für Open Science in der Large Scale Forschung: Von präregistrierten Sekundäranalysen, balancierten α- und β-Fehlern und Co.

- Open Science in den Bildungswissenschaften voranbringen (Sichtbarkeit erhöhen, Commitment steigern, Open Science Initiative am eigenen Institut)

- Publikationssystem transformieren: Alternative Publikationswege, Open Peer Review, TOP-Principles

Ablauf
In einer Präsentation mit anschließender Gelegenheit zu Fragen und Diskussion, werden die Inhalte zur allgemeinen Einführung in Ziele und Praktiken der Open Science abgedeckt.

Danach finden sich die Teilnehmenden in den Fokusgruppen und legen zukünftige Kommunikationsstrukturen fest. Sowohl die Entstehung neuer Fokusgruppen als auch die Arbeit innerhalb dieser wird von den Autorinnen und Autoren des Beitrags moderiert.

 
11:15 - 13:00F11‐H04: Bildungsforschung und Bildungspraxis im Dialog: BMBF- Metavorhaben „Digitalisierung im Bildungsbereich"
H03/H04 
 

Bildungsforschung und Bildungspraxis im Dialog: BMBF- Metavorhaben „Digitalisierung im Bildungsbereich"

Chair(s): Michael Kerres (Universität Duisburg-Essen), Barbara Getto (Universität Duisburg-Essen, Deutschland)

DiskutantIn(nen): Dieter Euler (angefragt) (Universität St. Gallen)

<p align="left">Mit der Strategie "Bildungsoffensive f&uuml;r die digitale Wissensgesellschaft" f&ouml;rdert die Bundesregierung in mehreren Aktionslinien den Aufbau digitaler Kompetenz und das Lernen mit digitalen Medien. Im Rahmenprogramm &bdquo;Empirische Bildungsforschung&ldquo; verfolgt das Bundesministerium f&uuml;r Bildung und Forschung (BMBF) das Ziel, die Wirkung gef&ouml;rderter Projekte in der Bildungsforschung zu st&auml;rken, um aktuellen Herausforderungen im Bildungssektor besser begegnen zu k&ouml;nnen. Zu verschiedenen Handlungsfeldern des Rahmenprogramms wurden Metaprojekte (etwa im Bereich kulturelle Bildung, inklusive Bildung oder Digitalisierung) eingerichtet, um den Austausch zwischen den Forschungsprojekten sowie mit der Bildungspraxis zu verbessern und ihre Reichweite zu erh&ouml;hen. Es gilt den Dialog zwischen Bildungsforschung, -praxis, -politik und -verwaltung zu f&ouml;rdern, die Kommunikation und Sichtbarkeit der Bildungsforschung zu verbessern und damit die Wirksamkeit f&uuml;r die gesellschaftliche Entwicklung zu erh&ouml;hen. Dar&uuml;ber hinaus sollen die Metavorhaben auch zur methodischen Weiterentwicklung gestaltungsorientierter Ans&auml;tze der Bildungsforschung beitragen.</p>

<p align="left">Das Metavorhaben begleitet die Projekte der F&ouml;rderlinie &bdquo;Digitalisierung im Bildungsbereich&ldquo; im Rahmenprogramm empirische Bildungsforschung. Es werden Projektarbeiten und -ergebnisse der Projekte in der F&ouml;rderlinie erfasst und in Dialog- und Expertenforen zur Diskussion gestellt. Der &bdquo;Stand der Forschung&ldquo; zu zentralen Fragen des digitalen Lernens wird in <em>critical reviews</em> erarbeitet, &uuml;ber verschiedene Portale sektorenspezifisch (fr&uuml;he Bildung, allgemeinbildende Schulen, betriebliche/berufliche Bildung, Erwachsenen-/Weiterbildung, Lehrerbildung) kommuniziert und laufenden Fragestellungen und Ergebnissen der F&ouml;rderprojekte gegen&uuml;bergestellt. Im Rahmen des Metavorhabens wird insbesondere die Anlage einer gestaltungsorientierten Bildungsforschung und ihre Wissenskommunikation reflektiert, die gleicherma&szlig;en zu Theorie- und Erkenntnisbildung innerhalb der Wissenschaft wie auch zur Probleml&ouml;sung in Feldern der Bildungspraxis und -politik beitr&auml;gt.</p>

<p align="left">Die traditionelle Sicht von Projektarbeit beruht darauf, Projektergebnisse &ndash; nach Abschluss eines Vorhabens &ndash; in einer Transferphase &bdquo;der Praxis&ldquo; zur Verf&uuml;gung zu stellen. Die Transferproblematik im Kontext von Modellversuchen der BLK wurde bereits Ende der 1980er-Jahre diskutiert und war eine wesentliche Ursache, dass die Einzelmodellversuchsf&ouml;rderung zugunsten der Programmf&ouml;rderung aufgegeben wurde (vgl. Nickolaus, G&ouml;nnenwein, &amp; Petsch, 2010): Ans&auml;tze eines Transfers als unidirektionale Kommunikation (von der Forschung zur Praxis) greifen zu kurz und l&ouml;sen die benannten Forderungen nicht ein. Fischer u.a. (2005) forderten eine &bdquo;nutzeninspirierte Grundlagenforschung&ldquo;, wie sie auch in den &Uuml;berlegungen einer gestaltungs- oder entwicklungsorientierten Bildungsforschung formuliert sind: Reinmann (2005) f&uuml;hrte aus, dass in einem traditionellen Verst&auml;ndnis empirischer Forschung die Entwicklung eines <em>Designs</em> der Forschung <em>vorgeschaltet</em> ist und keine eigenst&auml;ndige wissenschaftliche Erkenntnis beinhaltet (s.a. Preussler, Schiefner-Rohs, &amp; Kerres, 2014; Tulodziecki, Grafe, &amp; Herzig, 2013). Unter dem Schlagwort <em>design based research</em> skizzierte eine Gruppe von Forschenden (The DBR Collective, 2003) ein Vorgehen, das Iterationen einer Optimierung von Interventionen und Artefakten vorsieht (vgl. Barab &amp; Squire, 2004). In dem Symposium steht die Anlage von Ans&auml;tzen zur Realisierung eines Dialogs zwischen Bildungsforschung und &ndash;praxis im Fokus.</p>

<p align="left">Im Metavorhaben wird deswegen das Anliegen verfolgt, eine auf Transfer ausgerichtete Forschungsmethodologie zu entwickeln, bei der &bdquo;Transfer&ldquo; nicht als <em>Folgeaktivit&auml;t</em> am Projektende verstanden wird, sondern integraler Bestandteil der Interaktion von Akteuren, der als Dialog zwischen Forschungsprojekten und Bildungspraxis /-politik organisiert ist. Im Rahmen des Symposiums wird diskutiert, wie die methodische Anlage einer gestaltungsorientierten Bildungsforschung im Kontext der Digitalisierung umgesetzt werden kann. Dazu werden Ans&auml;tze der Wissensverdichtung und -kommunikation sowie Methoden eines dialogbasierten Transferansatzes diskutiert und die Rolle der Metavorhaben er&ouml;rtert.</p>

 

Beiträge des Symposiums

 

Zur Anlage des Metavorhabens "Digitalisierung in der Bildung": Dialogische Formate des Wissenstransfers

Barbara Getto
Universität Duisburg-Essen

Das Metavorhaben "Digitalisierung im Bildungsbereich" begleitet die Projekte des Forschungsschwerpunktes und weitere Förderlinien im Bereich Digitalisierung im Rahmenprogramm "Empirische Bildungsforschung". Das Metavorhaben wird koordiniert am Learning Lab der Universität Duisburg-Essen und ist ein Verbundprojekt der Leibniz-Institute für Bildungsforschung (DIPF, Frankfurt), für Erwachsenenbildung (DIE, Bonn) und für Wissensmedien (IWM, Tübingen) sowie der Universität Duisburg-Essen. Die institutionellen Rahmenbedingungen, Konzepte, Erfolgsbedingungen und Implikationen der digitalen Bildung unterscheiden sich in den einzelnen Sektoren erheblich und die Schnittstellen zwischen formellem, non-formalem und informellem Lernwandel je nach Lebensabschnitt (auch unter den Bedingungen der Digitalisierung). Der Verbund bildet die Expertise in allen Bildungsbereichen der Projekte ab. Die rund 50 Projekte adressieren Fragestellungen in den Bereichen der frühen Förderung, Schule, Hochschule, Lehrerbildung und berufliche Bildung.

Zu den Hauptzielen des Metavorhabens gehört es, Projektergebnisse in einen übergreifenden wissenschaftlichen und sozialen Rahmen zu stellen, Entwicklungen im Forschungsbereich wissenschaftlich aufzubereiten und Forschungslücken zu identifizieren. Darüber hinaus ist ein wichtiger Teil des Vorhabens die Vernetzung der Wissenschaftlerinnen und Wissenschaftler untereinander zu unterstützen und den Austausch mit der Bildungspraxis zu fördern. Die Ergebnisse der geförderten und anderer Forschungsprojekte werden aufbereitet und zentrale Forschungsfragen aus einer Metaperspektive bearbeitet.

Für das Gelingen einer gestaltungsorientierten Bildungsforschung ist die Kommunikation wissenschaftlicher Befunde eine notwendige Voraussetzung. Das Metavorhaben geht daher der Frage nach, in welcher Form und mit welchen Inhalten die geförderten Projekte ihre wissenschaftlichen Befunde nicht nur in der Wissenschaft selbst veröffentlichen, sondern auch Praxis, Politik und Öffentlichkeit anbieten. Die Aktivitäten des Metaprojekts sind dabei ergänzend zu den in den Projekten verankerten Transferaktivitäten konzipiert. Das Metaprojekt unterstützt diese und schafft somit zusätzlich Aufmerksamkeit und Sichtbarkeit für die Projektarbeit.

Ein weiterer Schwerpunkt des Metavorhabens liegt auf der Reflexion und Weiterentwicklung einer gestaltungsorientierten Bildungsforschung und ihrer Wissensvermittlung. Damit soll ein Beitrag zur Theorie- und Wissensbildung in der Wissenschaft geleistet werden, sowie wiederum ein Bogen gespannt werden zur Problemlösung in der Bildungspraxis und -politik.

Die Bildungsforschung untersucht die Entwicklung und Implementierung digitaler Lern- und Bildungsmedien in Bildungseinrichtungen. Digitalen Medien wird ein hohes Potenzial für die Verbesserung pädagogischer Praxis zugeschrieben und die Entwicklung in diesem Bereich verläuft überaus dynamisch. Daher gibt es einerseits ein hohes Interesse an Innovationen und Forschungsergebnissen seitens der Akteure aus Bildungspolitik und -praxis. (Vgl. Scharnberg, Vonarx, Kerres & Wolff-Bendik, 2017, S. 05-3). Andererseits erfordert Bildungsforschung im Kontext der Digitalisierung eine Weiterentwicklung methodischer Ansätze, die den Dialog mit dem Feld als integralen Bestandteil des Forschungsprozesses sieht (Vgl. Fischer, F., Waibel, M., & Wecker, C., 2005). Der Transfer von Forschungsergebnissen ist damit nicht mehr als Folgeaktivität am Ende eines Projekts zu sehen, sondern Teil der Interaktion der Akteure, der als Dialog zwischen Forschungsprojekten und Bildungspraxis und -politik organisiert werden soll (vgl. Nickolaus, Gönnenwein & Petsch, 2010).

Während die traditionellen Ansichten der wissenschaftlichen Wissensverbreitung den "Transfer" als eine Aktivität wahrnehmen, die nach Abschluss der Forschung stattfindet, will das Metaprojekt den Transfer als eine kontinuierliche Aktivität fördern, die in allen Phasen der Forschung verwoben ist, von der Entwicklung von Forschungsfragen, der Gestaltung eines Forschungsprojekts, der Umsetzung und Interpretation der Ergebnisse bis hin zur Kommunikation in diesem Bereich (Vgl. Fischer, 2005, Reinmann, 2005)

Entsprechend müssen dafür Dialog-Formate entwickelt und als Teil des Forschungsprozesses implementiert werden. Das Metavorhaben organisiert dazu sektorspezifische Dialog- und Expertenforen in denen Forschungsergebnisse disseminiert, diskutiert und weiterentwickelt werden sollen. Es stellt sich die Frage, wie der Austausch zwischen den Akteuren aus der Bildungspraxis und der Bildungsforschung organisiert, umgesetzt und so dokumentiert werden kann, dass die Ergebnisse wiederum weiterverwendet werden können.

 

(Digitale) Transferformate: Forschungsergebnisse für die Praxis nutzbar machen

Anne Thillosen, Johannes Moskaliuk
IWM, Leibniz Institut für Wissensmedien

Die Vorstellung ihrer Forschungsergebnisse in wissenschaftlichen Publikationen oder auf Tagungen gehört für Wissenschaftlerinnen und Wissenschaftler zum Alltag. Eine Aufbereitung für die Praxis, aber auch für Expertinnen und Experten anderer Disziplinen ist dagegen oft noch ungewohnt. Auch deshalb ist es sinnvoll, dass Projektträger den „Praxistransfer“ inzwischen immer häufiger explizit zur Förderbedingung machen. Gerade im Bereich der empirischen Bildungsforschung können Forschungsergebnisse das praktische Handeln unterstützen und anregen, etwa wenn gängige Praktiken fundiert oder infrage gestellt werden oder neue Impulse gesetzt werden. Damit entstehen zugleich neue Möglichkeiten, Forschungs- und Erfahrungswissen miteinander in Verbindung zu bringen, Forschungsergebnisse in der Praxis zu erproben – und die damit gemachten Erfahrungen wiederum in die Forschung zurückzuspiegeln.

Für Leibniz-Institute gehört die Verbindung von „Forschung“ und „Transfer“ konstitutiv zum eigenen Selbstverständnis; nicht ohne Grund betreiben alle drei am Metavorhaben „Digitalisierung im Bildungsbereich“ beteiligten Institute Bildungsportale mit unterschiedlichen Ausrichtungen.

Das am Leibniz-Institut für Wissensmedien betriebene Portal e-teaching.org dient dem Transfer von Forschungs- und Erfahrungswissen im Kontext des Einsatzes digitaler Medien in der Hochschulbildung und arbeitet sowohl mit Personen aus der Bildungspraxis als auch mit Forschenden zusammen. Für das Portal wurden in den vergangenen Jahren unterschiedliche Transferformate insbesondere mit digitalen Medien entwickelt und erprobt. Ein Themenschwerpunkt im Wintersemester 2019 befasst sich explizit mit der Frage: „Praxistransfer – wie geht das eigentlich?“ Gleichzeitig wird im Rahmen des Metavorhabens Digi-EBF eine Erweiterung des Portals um spezielle Angebote für Lehrende in Lehramtsstudiengängen vorbereitet.

Im Vortrag werden zunächst zentrale Transferformate mit digitalen Medien vorgestellt. Dafür sollen sowohl Erfahrungen aus der eigenen Praxis als auch Erkenntnisse aus dem im Winter laufenden Themenschwerpunkt, dem Austausch mit externen Partnern sowie den Planungen im Rahmen des Digi-EBF-Vorhabens systematisch ausgewertet, reflektiert und in Beziehung zu wesentlichen Erkenntnissen unterschiedlich ausgerichteter „Transferwissenschaften“ gesetzt werden (Wichter & Antos 2001; Wichter & Busch 2006; Fraunhofer IAO 2019). Im Mittelpunkt stehen die folgenden Fragestellungen:

(1) Wie lassen sich (digitale) Transferformate systematisch beschreiben?

Anhand konkreter Beispiele – etwa Fallstudien, Pattern oder (Online-)Peer-Tutoring – soll gezeigt werden, wie spezifische Medieneigenschaften digitaler Darstellungsformate (z.B. Interaktivität, Adaptivität, Synchronizität, Selbststeuerung) genutzt werden können, um den Praxistransfer auf andere Weise zu unterstützen als mit analogen Medien oder Präsenzveranstaltungen.

(2) Wie kann die Nutzung von (digitalen) Transferformaten gefördert werden?

Vor- und Nachteile verschiedener Transferformate sollen darauf in den Blick genommen werden, welche Formate besonders unterstützend wirken und die konkrete Umsetzung anregen.

(3) Wie können (digitale) Transferformate erstellt werden?

Schließlich geht es darum, wie Wissenschaftlerinnen und Wissenschaftler motiviert werden können, ihre Forschungsergebnisse für die Praxis aufzubereiten und wie sie dabei unterstützt werden können, Transferformate – die häufig klassischen wissenschaftlichen Praktiken widersprechen – zu nutzen.

Diese drei Fragestellungen werden exemplarisch an Transferformaten des Forschungsprojekts Digital Learning Map 2020 konkretisiert. Dabei wird gezeigt, wie bei der Konzeption und Durchführung von Projekten Forschung und Transfer eng miteinander verknüpft werden und Forschungsergebnisse in unterschiedliche Transferformate überführt werden können. In dem vom BMBF finanzierten Projekt wurden drei wesentliche Transferideen umgesetzt: (I) Im Rahmen eines Themenschwerpunkts auf e teaching.org wurden Projektergebnisse frühzeitig dargestellt und diskutiert und gleichzeitig durch die Beteiligung anderer Wissenschaftlerinnen und Wissenschaftler eine themenbezogene Vernetzung angeregt (e-teaching.org 2017). (II) Mit der Digital Learning Map wurde Praktikern eine Datenbank zur Verfügung gestellt, in der sie Praxisbeispiele für die Lehre mit digitalen Medien anhand einer wissenschaftlich fundierten Patternstruktur praxisorientiert beschreiben können (e-teaching.org 2018). (III) Ein Benchmarking-Tool ermöglicht einen Vergleich von Projekten mit digitalen Medien als Grundlage für strategische Entscheidungen.

Solche Erfahrungen zeigen beispielhaft, dass es hilfreich ist, Wissen strukturiert zu externalisieren um wesentliche Aspekte zu fokussieren, aber auch, dass Nutzende dabei häufig Unterstützung benötigen (Moskaliuk et al. 2016). Im Beitrag wird u.a. danach gefragt, ob daraus Anknüpfungspunkte für die Erstellung und Nutzung anderer Transferformate abgeleitet werden können.

 

Der Reviewprozess unter dem Aspekt der Wissensverdichtung und des Wissenstransfers

Marc Rittberger, Annika Wilmers, Carolin Anda, Carolin Keller
DIPF, Leibniz Institut für Bildungsforschung und Bildungsinformation

Reviewverfahren in der Bildungsforschung leisten auf mehreren Ebenen einen Beitrag zur Wissensverdichtung und zum Wissenstransfer. Im Folgenden wird ein Reviewverfahren vorgestellt, welches im Rahmen des Metavorhabens Digitalisierung im Bildungsbereich entwickelt wurde und gleichermaßen der wissenschaftlichen Community wie der Politik und Praxis als Informationsquelle dienen kann.

Auf inhaltlicher Ebene gelten (Systematic) Reviews als “Instrument der Wissensverdichtung“ (Antes & Lang 2014). Dies trifft insbesondere auf Systematic Reviewverfahren zu, beschreibt aber auch weitere Reviewformate, wie sie beispielsweise von Booth und Grant kategorisiert werden (2009). Einerseits strukturieren Reviews die Forschungslandschaft mit Blick auf Erkenntnisprozesse und angewandte Methoden, andererseits geben sie Hinweise auf Forschungslücken und unterforschte Themenfelder. Durch letztere Funktion dienen sie nicht nur der Entwicklung der Wissenschaftscommunity selbst, sondern können auch eine Funktion im Steuerungsprozess der Wissenschaftslandschaft erhalten. Die in dem hier skizzierten Projekt unternommene Reviewserie ist an die Definition von Critical Reviews (Booth und Grant 2009) angelehnt und greift im jährlichen Rhythmus Forschungsfragen aus der Digitalisierung auf: In einem ersten Durchlauf wird der Forschungsstand zur Aus- und Fortbildung des pädagogischen Personals in Bezug auf Digitalisierung beleuchtet.

Die methodische Ebene spiegelt nicht nur die Komplexität des Reviewansatzes wider, sondern zeigt auch auf, wie sich entsprechende Verfahren bei gleichzeitiger Einbindung inhaltlicher Expertise infrastrukturell verankern lassen. Um die örtlich verteilte Expertise in den Arbeitsprozess einzubinden, erfolgt eine Aufteilung einzelner Arbeitsschritte zwischen den an verschiedenen Instituten mit inhaltlichen Experten besetzen Sektoren, der infrastrukturellen Tätigkeit am Leibniz-Institut für Bildungsforschung und Bildungsinformation durch Informationswissenschaft sowie der Koordination des gesamten Prozesses, wodurch ein ebenso kommunikationsintensiver wie produktiver Arbeitsprozess implementiert ist.

Auf Ebene des Wissenstransfers bieten sich mit dem beschriebenen Verfahren zahlreiche Gelegenheiten zu einem Transfer über die Wissenschaftscommunity hinaus: Zum einen durch im weiteren Projektverlauf zielgruppenspezifisch aufbereitete Publikationsformate für die Praxis, zum anderen durch eine Einbindung der Ergebnisse der Reviews in diverse Veranstaltungsformate und Formate der kontinuierlichen Öffentlichkeitsarbeit wie webbasierten Portalen zu Bildungsthemen.

 

Aktive Moderation: Verfahren für die Entwicklung und den Transfer von forschungsbasierten Gestaltungskonzepten im Kontext des Design-Based Research

Monique Ratermann, Sybille Stöbe-Blossey
Universität Duisburg-Essen

Digitalisierung im Bildungsbereich hat zwei Dimensionen: Einerseits müssen Lernende Kompetenzen erwerben, die sie für Arbeit und gesellschaftliche Teilhabe in der digitalisierten Welt brauchen, andererseits kann die Digitalisierung zur Gestaltung und Unterstützung von Bildungsangeboten genutzt werden. Es geht also um „Bildung für Digitalisierung“ und um „Digitalisierung für Bildung“.

Beide Dimensionen der Digitalisierung bergen sowohl Risiken als auch Chancen – Risiken in dem Sinne, dass insbesondere Menschen mit ungünstigen Bildungsvoraussetzungen mit einer beschleunigten Entwicklung nicht Schritt halten können, Chancen insofern, als ihnen Digitalisierungs- und Medienkompetenzen mit Hilfe von geeigneten Konzepten vermittelt und Potenziale der Digitalisierung für individuelle Förderung genutzt werden können.

Die Entwicklung und Implementierung von derartigen Konzepten stellt eine Herausforderung für Bildungsorganisation dar. Es reicht nicht aus, methodisch-didaktische Konzepte zu erarbeiten; vielmehr müssen diese Konzepte in die Bildungsorganisation eingebunden und von den dort tätigen pädagogischen Kräften umgesetzt werden. Digitalisierung erfordert somit eine Organisationsentwicklung in Bildungsorganisationen. Eine Bildungsforschung, die mit dem Anspruch gesellschaftlicher Relevanz verbunden ist, muss sich somit nicht nur mit methodisch-didaktischen, sondern auch mit organisationalen Themen auseinandersetzen und sich die Frage stellen, auf welchen Wegen wissenschaftliche Arbeit Impulse für die Weiterentwicklung des Bildungssystems und seiner Organisationen geben kann.

Angesichts des sowohl in der politischen Steuerung des Bildungssystems als auch in den einzelnen Organisationen wahrgenommenen Innovationsbedarfs wird von Forschungsprojekten erwartet, dass ein Transfer ihrer Ergebnisse in die Bildungspraxis angestrebt und gefördert wird. Die Erfolge eines so verstandenen, oft nachträglich oder für die Endphase von Projekten additiv konzipierten Transfers bleiben jedoch oft hinter den Erwartungen zurück. Dies ist zum einen dadurch zu erklären, dass dem Begriff des Transfers oft ein eindimensionales Verständnis der Wissensübertragung in eine Richtung zugrunde liegt; zum anderen handelt es sich bei Bildungsorganisationen um lose gekoppelte Systeme mit einer hohen Autonomie der einzelnen pädagogischen Kräfte, wodurch der Umsetzbarkeit von auf hierarchischem Wege eingespeisten Impulsen Grenzen gesetzt sind. Gleichzeitig müssen bei einem Ergebnistransfer in die Bildungspraxis neben den pädagogischen Akteuren mögliche weitere Akteure (z. B. Kammern, Unternehmen, Jugendhilfe) aus der direkten Umwelt der Bildungsorganisationen als Adressat/inn/en berücksichtigt werden. Denn sowohl bei der Entwicklung als auch beim Transfer von Gestaltungskonzepten spielen die unterschiedlichen Erwartungshaltungen sowie die differenten Handlungslogiken der Akteure, die geprägt sein können durch die Orientierung an verschiedenen administrativen, pädagogischen, wissenschaftlichen und/oder professionsbezogenen Maßstäben sowie unterschiedliche Teilsystembezüge und Kommunikationsarten, eine zentrale Rolle.

Vor diesem Hintergrund soll es in dem geplanten Beitrag um die Frage gehen, wie das Forschungsparadigma des Design-Based Research (DBR) für die Entwicklung und den Transfer von forschungsbasierten Gestaltungskonzepten genutzt werden kann, die den Umgang von Bildungsorganisationen mit Digitalisierung thematisieren. DBR basiert auf einem reflexiven Prozess, in dem Konzepte in Ko-Konstruktion zwischen Wissenschaft und Praxis entwickelt werden, verbunden mit der Gewinnung von theoretisch und methodisch fundierten generalisierbaren wissenschaftlichen Erkenntnissen. Das Wissenschaft-Praxis-Verhältnis ist gekennzeichnet durch Ko-Konstruktion und iterativ-zyklische Arbeit – basierend auf einer theoriegeleiteten, methodisch fundierten Forschung und dem Ziel, anhand der einzelnen Anwendungsfälle generalisierbare und transferierbare Erkenntnisse abzuleiten.

Für die Umsetzung eines solchen Designs wird in dem Beitrag das Verfahren der aktiven Moderation dargestellt, das im Kontext der Verwaltungsberatung in Abgrenzung zu allein durch die Wissenschaft erstellten Gutachten einerseits und der inhaltlich neutralen Moderation von Organisationsentwicklung andererseits entwickelt wurde. Es umfasst eine Verbindung von forschungsbasierten Impulsen mit partizipativ angelegten Prozessen der Konzeptentwicklung und ermöglicht über die Dokumentation und theoriegeleitete Evaluation von Ergebnissen weiterführende Erkenntnisse für die Forschung und für den Transfer. Der Transfer wird in einem solchen Design nicht nachgelagert betrachtet, sondern ist Teil des Forschungsdesigns und wird über dialogorientierte Formate integriert.

Ziel ist es, das Verfahren der aktiven Moderation vorzustellen, in den Kontext der Entwicklung des Design-Based Research (DBR) einzuordnen und anhand von Beispielen zur Diskussion zu stellen.

 
11:15 - 13:00F11‒H01: Erfassung und Förderung spezifischer Kompetenzen angehender Lehrpersonen für professionelles Handeln in einer digitalisierten Welt
H01 
 

Erfassung und Förderung spezifischer Kompetenzen angehender Lehrpersonen für professionelles Handeln in einer digitalisierten Welt

Chair(s): Anne Israel (Friedrich-Schiller-Universität Jena, Deutschland), Alexander Gröschner (Friedrich-Schiller-Universität Jena, Deutschland)

DiskutantIn(nen): Katharina Scheiter (Leibniz-Institut für Wissensmedien (IWM))

Bildung in einer digitalen Welt setzt die Förderung und systematische Integration digitaler Technologien in den entsprechenden Bildungsinstitutionen voraus (KMK, 2016). Im Kontext Schule resultiert aus diesem Anspruch, dass Lehrer/innen in der Lage sein müssen, digitale Medien hinsichtlich ihrer Potenziale für das Lehren und Lernen zu analysieren und gleichzeitig entsprechende Unterrichtsansätze (unter Einsatz innovativer Technologien) didaktisch zu konzipieren (Herzig & Martin, 2018; Voogt et al., 2014). Die ICT-Kompetenz von Lehrer/innen sowie das Technological Pedagogical And Content Knowledge (TPACK) (Mishra & Koehler, 2006) stellt demnach die Grundlage für die lernförderliche Integration digitaler Medien in Schule und Unterricht dar (Endberg & Lorenz, 2017).

TPACK stellt ein um technische Komponenten erweitertes Professionswissen dar (Shulman, 1986). Ergänzend zur bisherigen Professionsforschung und auf Basis eines Verständnisses von Kompetenz, welches sowohl kognitive als auch motivationale Aspekte aufgreift (Weinert, 2001), lässt sich feststellen, dass Wissen allein tatsächliches Handeln nicht vorhersagen kann (Blömeke, Gustaffson & Shavelson, 2015). Von entscheidender Bedeutung erweist sich in diesem Zusammenhang zugleich die Handlungsbereitschaft, welche nicht zuletzt auf der erwarteten Selbstwirksamkeit eines Individuums beruht (Hatlevik & Hatlevik, 2018). Beides, sowohl die kognitiven als auch die motivational-affektiven Komponenten des Wissens und Handelns gilt es im Zuge ansprechender Konzeptionen über alle drei Phasen der Lehrer/innebildung mittels authentischer Settings zu fördern (Tondeur et al., 2018; Valtonen et al., 2015).

Aktuelle Befunde verdeutlichen jedoch, dass es nach wie vor an entsprechenden Konzepten zur Förderung derartigen Professionswissens im Rahmen der Aus-, Fort- und Weiterbildung von Lehrer/innen mangelt (Endberg, 2019; Schiefner-Rohs & Hofhues, 2018). Zusätzlich fehlt es zudem an entsprechenden Instrumentarien, die in der Lage sind, dieses Spezifikum an Professionswissen valide und reliabel zu fassen.

Die in dem Symposium versammelten Beiträge adressieren aus unterschiedlichen Perspektiven die aufgezeigten Desiderata: Beitrag 1 fokussiert ein universitäres Ausbildungskonzept, das auf Basis des beispielbasierten Lernens die Förderung technologisch-fachdidaktisches Wissens (TPACK) angehender Lehrer/innen in den Blick nimmt. Der Beitrag geht der Frage nach, inwieweit ein mit dem Ausbildungskonzept in Zusammenhang stehendes Peerfeedback zugunsten erster Unterrichtsentwürfe durch entsprechende fachspezifische Prompts an Qualität gewinnt. Die Beiträge 2 und 3 stellen darüber hinaus einen Ansatz zur Erfassung des TPACK Konstrukts in Aussicht. Beitrag 2 thematisiert hierbei die Konstruktion eines Selbsteinschätzungsinventars, das mittels standardisiertem Onlinefragebogen das TPACK Modell in seiner Vollständigkeit erfasst. Besprochen werden im Beitrag vor allem die Zusammenhänge zwischen Wissen, Einstellungen und tatsächlichem Medieneinsatz, der über die Analyse studentischer Unterrichtsentwürfe erfasst wurde. Ergänzend dazu bezieht sich der dritte Beitrag auf die motivationalen-affektiven Komponenten, explizit die ICT-Selbstwirksamkeitserwartung angehender Lehrer/innen, die für das professionelle Handeln relevant sind. Hierzu wurde im Verlauf eines Praxissemesters untersucht, wie sich die ICT-Selbstwirksamkeitserwartung angehender Lehrer/innen u.a. in Abhängigkeit des wöchentlichen Einsatzes technischer Medien sowie der wahrgenommenen Mentoringqualität verändert.

In der abschließenden Diskussion der Beiträge durch eine Expertin mit medienpädagogischem Schwerpunkt werden Potenziale zur Förderung professionellen Handelns angehender Lehrkräfte im Umgang mit digitalen Medien aufgezeigt.

 

Beiträge des Symposiums

 

„Mit einem Wisch ist alles drin?“ – Förderung fachspezifischer mediendidaktischer Kompetenzen bei angehenden Lehrpersonen

Ulrike Franke1, Andreas Lachner2, Taiga Brahm1, Michelle Rudeloff1, Armin Fabian1, Judith Preiß1
1Universität Tübingen, 2Leibniz-Institut für Wissensmedien

Theoretischer Hintergrund

Dem Einsatz digitaler Medien wird eine hohe Priorität zugeschrieben (KMK, 2016; OECD, 2015). Das ist mit der Annahme verbunden, dass digitale Medien dabei unterstützen können, die Unterrichtsqualität – im Sinne der kognitiven Aktivierung, konstruktiver Unterstützung und des Classroom-Managements – zu erhöhen. Dies geht jedoch mit der Voraussetzung einher, dass die digitalen Medien didaktisch sinnvoll im Unterrichtsgeschehen integriert werden (OECD, 2015). Als Voraussetzung für eine didaktisch-sinnvolle Integration digitaler Medien wird angenommen, dass (angehende) Lehrpersonen über reichhaltiges Professionswissen verfügen sollten, welches unter dem Konzept technologisch-fachdidaktischen Wissens subsumiert wird (TPACK, siehe Mishra & Koehler, 2006). Bisherige Befunde zeigen jedoch, dass angehende Lehrpersonen nicht hinreichend über solches Professionswissen verfügen (Lachner, Backfisch, & Stürmer, 2019). Ein weiteres Forschungsdesiderat ergibt sich daraus, wie angehende Lehrpersonen beim Erwerb von anwendbarem TPACK unterstützt werden können.

Fragestellung

Im Rahmen des Projekts TPACK 4.0 wird ein fachspezifisches Ausbildungskonzept in einem Flipped-Classroom Format zur Förderung von TPACK bei angehenden Lehrpersonen entwickelt, welches auf dem Prinzip der Approximation an die Unterrichtspraxis (Grossman et al., 2009) beruht und in insgesamt sieben Fachdidaktiken implementiert wird. Zunächst erhalten Lehramtsstudierende, basierend auf dem Modell beispielbasierten Lernens (Renkl, 2014), evidenzbasierte Good-Practice Beispiele aus ihrem jeweiligen Fach, um mit digitalen Medien die Unterrichtsqualität zu erhöhen. Anschließend werden die Lehramtsstudierenden in Kleingruppen gebeten, eigene Unterrichtseinheiten – unterstützt durch formatives Feedback – zu planen und einzelne Unterrichtssequenzen in Microteachings zu erproben. Um distinkte Reflexionsphasen zu initiieren, werden die Microteachings videographiert und Kommiliton*innen werden gebeten, distinkte Rückmeldung zu geben. Hierzu wurden fachspezifische Prompts entwickelt, um die Feedbackqualität zu erhöhen.

Die Effektivität des Förderansatzes wird aktuell in einem quasi-experimentellen Prä-Posttest-Design mit einer Business-as-usual Bedingung und insgesamt zwei Kohorten pro Fach (n = 7) zum Wintersemester 2019/2020 untersucht. Somit kann auf bis zu N = 330 Studierende für die Hauptuntersuchung zurückgegriffen werden. Im vorliegenden Beitrag werden die Befunde der Vorstudie berichtet, in der untersucht wurde, ob durch die Zugabe von Prompts während der Peerfeedbackphase, welche auf Unterrichtsqualität und Medienintegration zielen, die Qualität des Peerfeedbacks optimiert werden kann.

Methode

Die Untersuchung wurde mit N = 19 Studierenden der Wirtschaftsdidaktik als Interrupted Time Series Design realisiert. Die Studierenden gaben in fünf aufeinander folgenden Sessions Feedback zu den videografierten Microteachings. In den ersten beiden Sessions erhielten die Studierenden keine Prompts während des Peerfeedback. Zu den letzten drei Sessions wurden zusätzlich Prompts gegeben, welche auf die Unterrichtsqualität (kognitive Aktivierung, instruktionale Unterstützung, Classroom-Management) sowie auf die didaktisch-sinnvolle Medienintegration rekurrierten. Die Feedback-Annotationen wurden nach Patchan et al. (2016) hinsichtlich der Unterrichtsqualität und der jeweiligen Feedbackarten analysiert (Lob, Problemdiagnose, Lösungsvorschlag; Cohen’s κ > .79).

Ergebnisse

Um Effekte der Prompts zu modellieren, wurden Growth-Curve Modelle mit den abhängigen Variablen Unterrichtsqualität (kognitive Aktivierung, konstruktive Unterstützung, Classroom-Management), Medienintegration und Art des Feedbacks berechnet. Als Prädiktoren wurden pro Modell jeweils die Zeit, sowie die Bedingung (Prompts: ja, nein) aufgenommen. Im Ergebnis zeigte sich, dass die Zugabe von Prompts zu mehr Feedbackkommentaren führte, welche die kognitive Aktivierung (B = 0.20, SE = .10, 95 % CI [0.006,0.396]) und die Medienintegration (B = 0.23, SE = .10, 95 % CI [0.030,0.430]) fokussierten. Allerdings führte die Zugabe von Prompts nicht zu einer kritischeren Haltung, da mehr Kommentare gegeben wurden, die Lob beinhalteten (B = 0.30, SE = .09, 95 % CI [0.133,0.467]), wenn diese zusätzlich Prompts erhielten.

Diskussion

Die Befunde deuten darauf hin, dass die Zugabe von Prompts Lehramtsstudierende unterstützt, die Tiefenstruktur medienbasierten Unterrichts zu fokussieren. Gleichwohl sollte stärker die Förderung kritischer Peerfeedbackkommentare gefördert werden. Darüber hinaus wird die Hauptuntersuchung zeigen, ob derartige Ausbildungskonzepte, welche auf eine Approximation an die Unterrichtspraxis beruhen, geeignet sind, das Professionswissen angehender Lehrpersonen zu stärken und damit Schüler*innen auf eine digitale Welt vorzubereiten.

 

Technologiebezogene Kompetenzen angehender Gymnasiallehrpersonen: Entwicklung und Validierung einer Kurzskala zur Messung von Technological Pedagogical Content Knowledge

Mirjam Schmid, Eliana Brianza, Dominik Petko
Universität Zürich

Theoretischer Hintergrund

Das Modell des Technologisch-Pädagogischen Inhaltswissens („Technological Pedagogical Content Knowledge“; TPACK) von Mishra und Koehler (2006) gehört heute zu den prominentesten Modellen des Lehrpersonenwissens zum Einsatz digitaler Medien. Gemäß diesem Modell benötigen Lehrpersonen nicht nur das bereits von Shulman (1986, 1987) beschriebene pädagogische Wissen („Pedagogical Knowledge“, PK), Inhaltswissen („Content Knowledge“, CK) sowie fachdidaktische Wissen („Pedagogical Content Knowledge“, PCK), sondern auch ein technologiebezogenes Wissen („Technological Knowledge“, TK), welches Schnittstellen zu den drei anderen Wissensbereichen besitzt: Das technologische Inhaltswissen umfasst nach diesem Modell dasjenige Wissen, welches inhaltliches und technologisches Wissen verbindet („Technological Content Knowledge“, TCK) und das technologisch-pädagogische Wissen („Technological Pedagogical Knowledge“, TPK) umfasst dasjenige Wissen, wie Technologien didaktisch sinnvoll im Lehr-Lernprozess eingesetzt werden können. Das technologisch-pädagogische Inhaltswissen integriert die drei verschiedenen Wissensbereiche CK, PK und TK und ihre Schnittbereiche („Technological Pedagogical Content Knowledge“, TPCK).

Zahlreiche empirische Untersuchungen haben versucht, diese Wissensbereiche bei (angehenden) Lehrpersonen einerseits anhand von Selbstberichten, andererseits durch objektivierbarere Daten wie Unterrichtsplanungen oder Unterrichtsbeobachtungen zu erheben (z.B. Koehler, Shin & Mishra, 2012). Zur Messung und Validierung des TPACK- Modells existieren heute jedoch immer noch eine Reihe von Schwierigkeiten. Dazu gehört die Problematik, dass bisherige Fragebogeninstrumente einerseits sehr umfangreich und andererseits in ihrer Faktorstruktur nicht reproduzierbar sind (Schmidt et al., 2009; Scherer, Tondeur, & Siddiq, 2017). Auch die genaue Kombination der einzelnen Wissensbereiche ist teilweise unklar (Kimmons, 2015). Zudem wird das Verhältnis von Selbsteinschätzungen und objektiveren Messungen von TPACK erst in jüngerer Zeit verstärkt untersucht.

Fragestellung

Der Studie geht es um eine Konstruktion eines kürzeren, reliableren und letztlich auch valideren Selbsteinschätzungsinventars zum TPACK-Modell. Bei der Validierung liegt ein besonderes Augenmerk darauf, wie die unterschiedlichen Facetten des selbstberichteten Lehrpersonenwissens zum Lehren mit digitalen Medien mit der tatsächlichen Berücksichtigung von digitalen Medien in Unterrichtsplanungen zusammenhängen.

Stichprobe und Methode

Die Pilotstudie untersucht 109 angehende Gymnasiallehrpersonen mithilfe einer standardisierten Onlinebefragung. Als Fragebogen diente eine Weiterentwicklung des Instruments von Schmidt et al. (2009), das einerseits reduziert und in einigen Dimensionen theoriegeleitet ergänzt wurde. Das Resultat ist ein 28-Item Fragebogen, mit je 4 Items in jedem der 7 Themenbereiche des TPACK-Modells. Zur Validierung wurden ausserdem Unterrichtsplanungen analysiert, die von den Studierenden als Teil ihrer Ausbildung im selben Semester zu erstellen waren. Diese Unterrichtsvorbereitungen wurden hinsichtlich des Einsatzes von digitalen Medien kodiert. Die Güteprüfung des Fragebogens erfolgte mit konfirmatorischen Faktoranalysen sowie mit Reliablitätsanalysen. Der weiterführenden Frage nach dem Zusammenhang von Selbsteinschätzungen und tatsächlichen Unterrichtsplanungen wurde mit logistischen Regressionen nachgegangen. Alle Analysen wurden mit R 3.6 und lavaan durchgeführt.

Ergebnisse und Ausblick

Die Auswertungen zeigen, dass das entwickelte Fragebogeninstrument «TPACK.xs» eine sehr gute Passung mit der theoretisch erwarteten Faktorenstruktur aufweist (Robust χ2 (324) = 388.44, CFI = .958, TLI = .951, RMSEA = .043, SRMR = .072). Auch die Reliabilitäten sind über alle Teilskalen gut bis sehr gut, mit Cronbach’s Alphas zwischen .76 und .91. Die ersten Analysen zu den Zusammenhängen zwischen Wissen, Einstellungen und Einsatz deuten darauf hin, dass nur der Wissensbereich TPCK ein deutlicher und signifikanter Prädiktor für den Einsatz digitaler Medien ist (β = .77, p < .05). Die weiteren TPACK-Bereiche zeigen hingegen keine direkten, sondern lediglich mittelbare Einflüsse. Die Studie bestätigt damit die erwarteten Zusammenhänge und kann als Schritt zur weiteren Konsolidierung und Messbarmachung des TPACK-Modells angesehen werden.

 

Cross-Level-Interaktionen zwischen dem Verlauf der ICT-Selbstwirksamkeitserwartung im Praxissemester und der Mentoringqualität

Mathias Dehne, Susi Klaß, Alexander Gröschner, Anne Israel
Friedrich-Schiller-Universität Jena

Theoretischer Hintergrund

Im Rahmen zunehmender ICT-Nutzung an Schulen ist eine Anforderung an zukünftige Lehrkräfte, kompetent mit technischen Medien umgehen zu können. Studien hinsichtlich der Motivation von Lehrkräften unterstreichen den Einfluss der Selbstwirksamkeitserwartung für erfolgreiches unterrichtliches Handeln von Lehrkräften (Klassen, Durksen & Tze, 2014). Dabei kann unter Selbstwirksamkeit die Vorstellung einer Lehrperson verstanden werden, bestimmte berufsbezogene Tätigkeiten erfolgreich auszuüben (Bandura, 1997). Selbstwirksamkeitserwartungen hinsichtlich ICT stehen in einem gerichteten Zusammenhang zum Einsatz im Klassenraum (Alt, 2018). Grundlagen für den späteren Medieneinsatz in der unterrichtlichen Praxis können durch die universitäre Lehrer/innenbildung auch im Rahmen der Lernbegleitung in schulpraktischen Abschnitten (bspw. Praxissemester) gelegt werden, in denen Mentor/innen bzw. Betreuungslehrkräfte als Rollenmodell für die unterrichtliche Praxis fungieren (Matsko et al., in press). Bislang existieren keine Befunde hinsichtlich der Veränderungen von ICT-Selbstwirksamkeitserwartungen sowie zum Medieneinsatz über den Verlauf von Praxisphasen. Zudem wurde der Zusammenhang zwischen wahrgenommener Mentoringqualität und ICT-Selbstwirksamkeitserwartung der Studierenden im Praktikum noch nicht untersucht. Im Rahmen der vorliegenden Studie standen die folgenden Forschungsfragen im Mittelpunkt:

1. Wie verändert sich die ICT-Selbstwirksamkeitserwartung über den Verlauf des Praxissemesters?

2. Was sind Prädiktoren der Veränderung?

3. Inwiefern hängen hohe vs. niedrige ICT-Selbstwirksamkeitserwartung mit der wahrgenommenen Mentoringqualität sowie dem Einsatz technischer Medien im Praxissemester differenziell zusammen?

Methode

N=102 Lehramtsstudierende (M Alter=22.22, 50.5% weiblich) wurden zweiwöchentlich während ihres fünfmonatigen Praxissemesters mit einem Onlinefragebogen an der Universität (anonymisiert für Review) befragt. Als Erhebungsinstrumente dienten die ICT-Selbstwirksamkeitserwartung (ρ=.95; 10-stufig; Gerick et al., 2018), die Mentoringqualität (α=.94; 5-stufig; Ronfeldt et al., 2013) und eine Einschätzung der Studierenden, wie viele technische Medien (nominale Auswahl aus sechs Optionen) sie in der vergangenen Woche in Vorbereitung auf den Unterricht sowie im Unterricht eingesetzt haben. Auf Basis der genesteten Datenstruktur (Messsituationen in Individuen) wurde auf Mehrebenenmodellierungen zurückgegriffen, bei denen in intraindividuelle (zwischen den Messungen innerhalb einer Person) und interindividuelle Varianzquelle (zwischen den Personen) differenziert wird. Hinsichtlich der dritten Forschungsfrage wurde auf einen personenzentrierten Ansatz (latente Profilanalyse) zurückgegriffen.

Ergebnisse

Die Mittelwerte indizieren eine kurvenförmige Veränderung der ICT-Selbstwirksamkeitserwartung (Mt1=4.94, SD=1.95; Mt2=5.97, SD=1.79; Mt3=6.17, SD=1.55; Mt4=5.91, SD=1.60; Mt5=5.27, SD=2.07). Hinsichtlich Fragestellung 1 wurden lineare (β=.09, p=n.s.) und quadratische Trends (βlinear=.06, p=n.s.; βquadratisch=–.27, p<.001) überprüft. Zur Vorhersage dieser über Kontraste ermittelten mittleren Slopes wurde die Mentoringqualität als Prädiktor aufgenommen (Fragestellung 2). Es zeigte sich ein signifikanter Cross-Level-Interaktionseffekt der eingeschätzten Mentoringqualität auf den linearen (B=0.18, p<.05) sowie quadratischen Slope (B=0.16, p<.05). Im Rahmen personenzentrierter Analysen (Forschungsfrage 3) wurde zudem der Medieneinsatz der Studierenden in ihren Unterrichtsstunden (M Semester=1.24) sowie in Vorbereitung auf die Unterrichtsstunden (M Semester=1.41) betrachtet. Eine Drei-Klassen-Lösung zeigte den besten Modell-Fit (BIC=993.65). Dabei lässt sich ein Profil von Studierenden mit hoher wahrgenommener Mentoringqualität, hohem Einsatz digitaler Medien in Vorbereitung auf Unterricht sowie in Anwendung in den Unterrichtsstunden und hoher ICT-Selbstwirksamkeitserwartung identifizieren (25.6%). Demgegenüber zeigt sich ein Profil mit niedrigen Werten in allen drei Dimensionen (17.8%) sowie ein Misch-Profil mit mittlerer ICT-Selbstwirksamkeitserwartung, geringem Medieneinsatz und hoher Mentoringqualität (56.6%).

Diskussion

Die Studie untersucht erstmals intra- und interindividuelle Unterschiede in der ICT-Selbstwirksamkeitserwartung über den Verlauf des Praxissemesters. Dabei konnte ein quadratischer Trend aufgezeigt werden, bei dem die höchste ICT-Selbstwirksamkeitserwartung der Studierenden in der Mitte des Praxissemesters erreicht wird. Am Ende des Praxissemesters ist die ICT-Selbstwirksamkeitserwartung vergleichbar zum Beginn ausgeprägt. Dabei moderiert die eingeschätzte Mentoringqualität den Verlauf der ICT-Selbstwirksamkeitserwartung während des Praxissemesters. Diese Befunde sind deckungsgleich mit Befunden zum Einfluss der Betreuungslehrpersonen auf die Performanz zukünftiger Lehrkräfte (Ronfeldt et al., 2018). Die differenziellen Ergebnisse betonen überdies die Bedeutung der Mentoringqualität im Schulkontext (Gröschner & Häusler, 2014). Im Rahmen des Vortrages wird vertiefend auf die Relevanz der Mentoringqualität zu unterschiedlichen Testzeitpunkten Bezug genommen.

 
11:15 - 13:00F11‒H02: Schülerurteile zur Unterrichtsqualität – Die Bedeutung von Itemformulierungen und ihr Einsatz in der Forschungspraxis
H02 
 

Schülerurteile zur Unterrichtsqualität – Die Bedeutung von Itemformulierungen und ihr Einsatz in der Forschungspraxis

Chair(s): Ann-Kathrin Jaekel (Universität Tübingen, Deutschland), Richard Göllner (Universität Tübingen, Deutschland), Ulrich Trautwein (Universität Tübingen, Deutschland)

DiskutantIn(nen): Holger Gärtner (Institut für Schulqualität der Länder Berlin und Brandenburg e.V.)

Schülerurteile bieten einen zeit- und kostengünstigen Weg, um Unterrichtsqualität zu erfassen. Aus diesem Grund werden Schülerurteile vielfach verwendet, um die Unterrichtsqualität einer Lehrkraft entlang unterschiedlicher Qualitätsmerkmale (z.B. Monitoring, Unterstützung, Motivierung) zu beschreiben und mit verschiedenen Zielgrößen des Unterrichts (z.B. Leistung, Motivation und Wohlbefinden) zu verknüpfen (Kunter, Baumert & Koller, 2007; Wagner et al., 2016). Die Verwendung von Schülerurteilen kann dabei aus unterschiedlichen Perspektiven betrachtet werden: Zum einen können sie eingesetzt werden, um das Unterrichtserleben von Seiten der Lernenden zu erfassen (z.B. Wahrnehmung der Unterrichtssprache der Lehrkraft) und mögliche Veränderungen der Unterrichtsqualität abzubilden. Zum anderen spielen bei der Verwendung von Schülerurteilen auch sprachliche Komponenten eine wichtige Rolle. Items enthalten einerseits eine bestimmte Referenz („Der Lehrperson gelingt es…“ vs. „Schülerinnen und Schüler reden oft im Unterricht.“), können sich aber auch hinsichtlich des Adressaten unterscheiden („Die Lehrkraft unterstützt mich zusätzlich, wenn ich Hilfe brauche.“ vs. „Unsere Lehrkraft unterstützt uns zusätzlich, wenn wir Hilfe brauchen.“). Dies ist insofern von Bedeutung, als dass je nach Referenz bzw. Adressat eine andere theoretische Annahme zugrunde liegt. So könnte man etwa davon ausgehen, dass Schülerurteile zur Erfassung des individuellen Lernens von Schülerinnen und Schülern bei einer Lehrkraft eher geeignet sind, wenn die Referenzperson die betreffende Lehrkraft und der Adressat der individuelle Schüler ist, da auf diese Weise Einflussgrößen, die beispielsweise aus der Klassenkomposition resultieren, nicht thematisiert werden. Beide Schwerpunkte, die Abbildung des Unterrichtsgeschehens durch Schülerurteile und die Referenzperson/ der Adressat der Items sind für die Bildungsforschung und -praxis grundlegende Bestandteile, um Unterrichtsqualität adäquat zu erfassen und ggf. passende Schlussfolgerungen zu ziehen.

Eine systematische Untersuchung solcher Unterschiede vor dem Hintergrund des forschungspraktischen Einsatzes von Schülerurteilen ist nach wie vor nicht zufriedenstellend gelungen und soll daher Gegenstand des Symposiums sein. Die Beiträge nehmen zwei wesentliche Schwerpunkte zum Einsatz von Schülerurteilen in den Blick: Sie zeigen einerseits auf, wie Schülerurteile genutzt werden können, um das Unterrichtsgeschehen aus Sicht der Lernenden abzubilden. Zudem wird deutlich, ob und wie Schülerinnen und Schüler zwischen den Referenzpersonen und den Adressaten in Items differenzieren können.

G. Pham, B. Eckstein & F. Locher

Unterrichtsqualität: Was messen unterschiedliche Itemformulierungen?

Der erste Beitrag beschäftigt sich mit der Frage, welche Rolle die Referenzperson in Items (Lehrkraft oder Schülerschaft) für die Schülerurteile der Qualitätsdimensionen Unterstützung, Schulklima und Leistungsdruck spielt und ob die Schülerurteile mit verschiedenen Referenzpersonen unterschiedlich stark mit der wahrgenommenen Unterrichtsqualität zusammenhängen.

A. Jaekel, R. Göllner & U. Trautwein

Ich oder Wir: Welchen Unterschied macht die Adressatenbezug in Schülerbefragungen zur Unterrichtsqualität?

Im zweiten Beitrag geht es um die Frage, ob und wie stark Schülerinnen und Schüler zwischen ihrer individuellen Wahrnehmung der Unterrichtsqualität (Ich-Formulierung) und der Sicht bezogen auf die gesamte Klasse (Wir-Formulierung) unterscheiden. Zur Beantwortung der Fragestellungen wurden Schülerurteile mit beiden Formulierungen auf Individual- und Klassenebene und in zwei Fächern analysiert.

J. Decristan, D. Rauch, V. Kramer & V. Reitenbach

Unterrichtsqualität im Kontext des mehrsprachigkeitssensiblen Reziproken Lehrens im Grundschulunterricht.

Im dritten Beitrag werden Schülerurteile genutzt, um mögliche Veränderungen des Unterrichtsgeschehens abzubilden. Im Rahmen einer Interventionsstudie wird der Frage nachgegangen, ob sich durch die Durchführung eines Unterrichts, in dem mehrsprachige Kinder ihr gesamtes Sprachrepertoire nutzen können, das wahrgenommene Klassenklima und Classroom Managements verbessern und ob sich diese Einschätzungen bei mehrsprachigen und monolingualen Schülerinnen und Schülern unterschiedlich stark verändern.

R. Göllner, D. Meurers, Z. Weiß & A. Lindmeier

Lehrersprache: Ein sprachwissenschaftlicher Zugang zum Verständnis von Unterricht

Der vierte Beitrag nimmt linguistische Merkmale der Lehrersprache in den Blick und untersucht, welche Rolle diese für die Wahrnehmung der Unterrichtsqualität von Schülerinnen und Schülern spielt. Hierfür wurde die Sprache der Lehrkraft in einer vorgegebenen Unterrichtseinheit (Quadratische Gleichungen) und in einer frei wählbaren Unterrichtseinheit mittels computerlinguistischen Verfahren analysiert und mit Schülerurteilen zur Unterrichtsqualität in Verbindung gebracht.

 

Beiträge des Symposiums

 

Unterrichtsqualität: Was messen unterschiedliche Itemformulierungen?

Giang Pham, Boris Eckstein, Franziska Maria Locher
Pädagogische Hochschule St. Gallen, Schweiz

Theorie und Fragestellung

Spätestens seit der Veröffentlichung der Arbeit von Clausen (2002) ziehen die Unterschiede in der Bewertung von Unterrichtsqualität zwischen verschiedenen Beurteilenden (z.B. Lernende und Lehrpersonen) die Aufmerksamkeit der Unterrichtsforschung auf sich. Fauth et al. (eingereicht) präsentieren dafür einen plausiblen Erklärungsansatz. Bei der Beantwortung von Fragebogenitems zum Unterricht spielen kognitive wie affektive Prozesse eine Rolle. Für die kognitiven Prozesse sind Faktoren wie die Zugänglichkeit und Beobachtbarkeit von Indikatoren relevant. Bezüglich der affektiven Komponente kann die Formulierung der Items, mit Blick auf die gewählte Referenzperson (z.B. Lehrperson: «Der Lehrperson gelingt es…» vs. Lernende: «Schülerinnen und Schüler reden oft im Unterricht») entscheidend sein. Je nachdem, ob eine Selbst- oder Fremdbeurteilung gefordert ist, werden affektive Prozesse mehr oder weniger bei der Einschätzung miteinbezogen (Vazire, 2010).

Vier Forschungsfragen werden untersucht: (1) Inwieweit unterscheiden sich Antworten von Beurteilenden je nach gewählter Referenzperson (Verhalten der Lehrperson vs. Verhalten der Lernenden)? (2) Wie viel Varianzanteil eines Items kann durch die Referenzperson (Methodenfaktor) erklärt werden. (3) Sind die Methodenfaktoren konstruktübergreifend, d.h. Items verschiedener theoretischer Konstrukte - jedoch mit derselben Referenzperson – laden auf einen gemeinsamen (Methoden-)Faktor? (4) Variiert die Vorhersagekraft für die Schulleistung je nach Referenzperson und verfügen die Methodenfaktoren auch nach Bereinigung der Effekte von den inhaltlichen Konstrukten über Vorhersagevalidität für die Schulleistung? In diesem Beitrag beschränken wir uns auf die Perspektive der Lernenden.

Methode

Voraussetzung für die Beantwortung der Forschungsfrage ist die Erfassung von Unterrichtsqualität mittels mehrerer Items, die bezüglich der Referenzperson unterschiedlich formuliert sind. Datengrundlage bietet im vorliegenden Beitrag PISA 2000. Der PISA 2000 Datensatz enthält Informationen von 7950 Schweizer 15-Jährigen (national repräsentative Stichprobe, 49.7% weiblich). Für die Analysen sind Leistungsdaten (Leseverstehen) sowie Fragebogendaten der Schülerinnen und Schüler über drei fächerübergreifende Qualitätsmerkmale des Deutschunterrichts vorhanden (Unterstützung durch Lehrperson– 6 Items, Schulklima in Bezug auf Disziplin – 6 Items, Leistungsdruck – 4 Items). Während sich alle Items der ersten Skala ausschließlich auf Verhaltensweisen der Lehrperson beziehen, referenzieren die Items der anderen Skalen auf Verhaltensweisen der Lehrperson sowie der Jugendlichen. Einschränkend ist anzumerken, dass in PISA 2000 keine Möglichkeit besteht, die 15-Jährigen ihren Schulklassen zuzuordnen. Eine Mehrebenenanalyse mit den Unterrichtsqualitätsmerkmalen auf Ebene 2 ist daher nicht möglich.

Zur Beantwortung der ersten Fragestellung werden Korrelationen zwischen den Items eines jeden theoretischen Konstrukts sowie die Reliabilität der Summenscores (Cronbachs α und McDonalds ω_t) berechnet (Zinbarg et al., 2005). Zur Beantwortung der zweiten Fragestellung wird pro theoretisches Konstrukt eine konfirmatorische Faktorenanalyse mit dem inhaltlichen Konstrukt und den nicht mit dem inhaltlichen Konstrukt korrelierten Methodenfaktoren modelliert. Darauf basierend wird der Varianzanteil jedes Items durch den entsprechenden Methodenfaktor bestimmt. Mittels Multitrait-Multimethod-Analyse (Eid et al., 2016), unter Verwendung von Items aller Konstrukte wird die dritte Fragestellung beantwortet. Zur Beantwortung der letzten Fragestellung werden Korrelationen zwischen dem Leseverstehen und den Faktorenscores aller Konstrukte sowie den Methodenfaktoren berechnet.

Ergebnisse

Vorläufige Ergebnisse weisen darauf hin, dass die Items eines theoretischen Konstrukts mit derselben Referenzperson nicht immer stärker miteinander, als mit Items desselben Konstrukts mit einer anderen Referenzperson korrelieren. Von allen drei Unterrichtsqualitätsskalen verfügt die Skala Leistungsdruck über die geringste Reliabilität (α=.55; ω_t=.56); jedoch korrelieren die einzelnen Items sowie der Mittelwert dieser Skala nicht geringer mit dem Leseverstehen. Der Anteil aufgeklärter Varianz der Items, der auf den Methodenfaktor zurückzuführen ist, variiert zwischen 5% und 56%. Das MTMM-Modell mit drei inhaltlichen Konstrukten und zwei Methodenfaktoren weist akzeptable Modellfits auf (CFI = 0.95, TLI = 0.94, RMSEA = 0.05, SRMR = 0.05). Die Methodenfaktoren lassen sich durch Items verschiedener Konstrukte bilden. Die Faktorenscores beider Methodenfaktoren korrelieren nicht schwächer mit dem Leseverstehen als die Faktorenscores der drei theoretischen Konstrukte. Die Bedeutung der Ergebnisse für die Messung von Unterrichtsqualität werden im Beitrag vor dem theoretischen Hintergrund diskutiert.

 

Ich oder Wir: Welchen Unterschied macht die Adressatenbezug in Schülerbefragungen zur Unterrichtsqualität?

Ann-Kathrin Jaekel, Richard Göllner, Ulrich Trautwein
Universität Tübingen

Theoretischer Hintergrund

Schülerurteile werden häufig zur Erfassung von Unterrichtsqualität genutzt. Sie sind zeit- und kosteneffizient, zuverlässig und prädiktiv für die Leistung von Schülerinnen und Schülern, weshalb sie häufig in der Bildungsforschung und -praxis eingesetzt werden (Spooren, Brockx, & Mortelmans, 2013; Wagner et al., 2016). Unterrichtsqualität wird dabei meist entlang der drei Basisdomänen er-fasst (Klassenführung, konstruktive Unterstützung, kognitive Aktivierung; Fauth et al., 2014). Trotz der häufigen Nutzung von Schülerurteilen ist wenig darüber bekannt, welchen Einfluss die Item-formulierung von Befragungsinstrumenten auf die Erfassung der Unterrichtsqualität aus Schülersicht hat. In Studien sind meist unterschiedliche Formulierungen zu finden und die Items sind teils in Wir- und teils in Ich-Perspektive formuliert (z.B. PISA 2009, TIMSS 2015). Die theoretische Annahme ist, dass sich die jeweiligen Formulierungen entweder auf die individuelle Wahrnehmung des Unterrichts der einzelnen Schülerinnen und Schüler („Die Lehrkraft unterstützt mich zusätzlich, wenn ich Hilfe brauche.“) oder auf die Sicht der Schülerinnen und Schüler auf die gesamte Klasse als Kollektiv beziehen („Unsere Lehrkraft unterstützt uns zusätzlich, wenn wir Hilfe brauchen.“) und damit zwei unterschiedliche Sichtweisen auf Unterrichtsqualität adressieren. Welche Bedeutung diese unterschiedlichen Adressatenbezüge für die Erfassung der Unterrichtsqualität aus Schülersicht hat und inwieweit hierdurch unterschiedliche Aspekte des Unterrichtserlebens angesprochen wer-den, ist aufgrund fehlender Untersuchungen nach wie vor offen.

Fragestellung

In diesem Beitrag wird der Frage nachgegangen, welchen Einfluss unterschiedliche Adressatenbezüge (Ich vs. Wir) auf die Erfassung der Unterrichtsqualität aus Schülersicht ausüben. Folgende Fragestellungen werden dafür untersucht:

a) Welche Unterschiede lassen sich in der Raterübereinstimmung (ICCs) für die Ich- und Wir-Formulierung von unterschiedlichen Qualitätsmerkmalen in Deutsch und Mathematik finden?

b) Korrelieren die Schülerurteile zur Unterrichtsqualität zwischen Deutsch und Mathematik je nach Adressatenbezug unterschiedlich stark?

c) Wie stark korrelieren die Schülerurteile mit unterschiedlichen Adressatenbezug für eine Qualitätsdimension in einem Fach?

Methode

Grundlage der Untersuchung ist die Unterrichtsstudie UNITAS, im Rahmen derer Daten an 27 allgemeinbildenden weiterführenden Schulen erhoben wurden (6.479 Schülerinnen und Schüler, 401 Klassen der fünften bis zehnten Klassenstufe). Befragt wurden die Schülerinnen und Schüler anhand von 61 Items zu insgesamt 16 unterschiedlichen Qualitätsdimensionen des Unterrichts, die sich den drei Basisdomänen zuordnen lassen. Schülerurteile wurden sowohl für den Mathematik- als auch den Deutschunterricht erhoben. Mittels eines Rotationsdesigns wurden Items mit unterschied-lichen Adressatenbezügen durch die Schülerinnen und Schüler einer Klasse bearbeitet. Insgesamt konnten 13 von 16 Qualitätsdimensionen für die Analyse genutzt werden. Zur Beantwortung der Fragestellungen wurden der Intraklassenkorrelationskoeffizient (ICC) und latenten Korrelationen auf Schüler und Klasseneben sowohl innerhalb als auch zwischen Fächern berichtet.

Ergebnisse

Die Analysen zeigen folgende Ergebnisse: a) Die ICCs für die Ich- und Wir-Formulierungen zeigen sowohl für Deutsch als auch für Mathematik ein homogenes Bild (Mathematik: 0.11 ≤ ICC ≥ 0.37; Deutsch: 0.11 ≤ ICC ≥ 0.36). b) Die Korrelationen der Schülerurteile für die Ich- bzw. Wir-Formulierung zwischen Deutsch und Mathematik liegen im mittleren bis hohen Bereich und zeigen sowohl auf der Individualebene (-.44 bis .50, ps ≤ .001) als auch auf der Klassenebene (.19 bis .77, ps ≤ .001) ein ähnliches Bild. c) Die Korrelationen der Ich- und Wir-Formulierungen für eine Quali-tätsdimension innerhalb eines Faches zeigen auf Individual- und Klassenebene ausgesprochen hohe Zusammenhänge (rs‘ ≥ .92).

Die Ergebnisse deuten darauf hin, dass der Adressatenbezug der verwendeten Items eine weniger starke Rolle spielt als erwartet werden konnte und Schülerinnen und Schüler somit weniger stark als vermutet zwischen ihrer individuellen Wahrnehmung und der Sicht der gesamten Klasse differenzieren. In zukünftiger Forschung sollte daher der Frage nachgegangen werden, ob sich Unterschiede ergeben, wenn Schülerinnen und Schüler explizit dazu aufgefordert werden, zwischen beiden Perspektiven zu differenzieren.

 

Unterrichtsqualität im Kontext des mehrsprachigkeitssensiblen Reziproken Lehrens im Grundschulunterricht

Jasmin Decristan1, Dominique Rauch2, Victoria Kramer3, Valentina Reitenbach1
1Bergische Universität Wuppertal, 2Pädagogische Hochschule Ludwigsburg, 3DIPF Frankfurt

Ein anerkennender Umgang mit Mehrsprachigkeit im Unterricht stellt eine Facette eines gelungenen Umgangs mit Vielfalt dar (Grosjean, 2001). Jedoch ist der schulische Kontext nach wie vor durch einen „monolingualen Habitus“ (Gogolin, 1994) geprägt und es mangelt an empirisch erprobten didaktischen Konzepten zum Einbezug von Mehrsprachigkeit in den Unterricht. Damit geht einher, dass Mehrsprachigkeit von Lehrkräften zwar prinzipiell als Bereicherung gesehen wird, in der Praxis aber kaum Beachtung findet und Befürchtungen bestehen, dass sich durch mehrsprachige Interaktionen das Klassenklima verschlechtert, weniger Lernzeit zur Verfügung steht und Lehrkräfte an Autorität verlieren (zusammenfassend: Bredthauer & Engfer, 2018). Zudem befürchten Lehrkräfte, dass sich monolingual deutschsprachige Kinder oder solche, die zwar mehrsprachig sind, aber aus unterschiedlichen Gründen im Unterricht nur deutsch sprechen, in mehrsprachigen Lehr-Lernsettings ausgegrenzt fühlen (Bredthauer & Engfer, 2018) und mehrsprachige Interaktionen als für das Lernen störend empfinden.

Fragestellungen

1. Welche Effekte hat eine Intervention, in dem Grundschülerinnen und -schüler ihre verschiedenen Sprachen nutzen dürfen auf das Klassenklima und die Klassenführung im Vergleich zu Klassen mit regulärem Deutschunterricht?

2. Nehmen monolingual deutschsprachige Lernende während der Intervention ein negativeres Klassenklima und eine geringere Klassenführung wahr als ihre mehrsprachigen Mitschülerinnen und Mitschüler?

3. Nehmen mehrsprachige Lernende, die ihre Sprache während der Intervention nicht genutzt haben im Vergleich zu denjenigen, die andere Sprachen als Deutsch genutzt haben, ein negativeres Klassenklima und eine geringere Klassenführung wahr?

Methode

Die Daten stammen aus einer quasi-experimentellen Interventionsstudie (Treatmentgruppe: 23 Lehrkräfte, 428 Kinder) mit Warte-Kontrollgruppe (15 Lehrkräfte, 265 Kinder) in der 4. Jahrgangsstufe im Jahr 2019. Die Lehrkräfte beider Gruppen nahmen an zeitversetzten Fortbildungen (3 Nachmittage; 01/2019 und 03/2019) zu einer 12-stündigen Unterrichtsreihe zur Förderung der Deutsch-Lesekompetenz teil und unterrichteten diese anschließend in ihren Klassen (02-03/2019 sowie 04-05/2019). Dabei wurde das Reziproke Lehren (Palincsar & Brown, 1984) eingesetzt und um Angebote zur Nutzung von Mehrsprachigkeit erweitert. Den Lernenden war es erlaubt, ihr gesamtes Sprachrepertoire zu nutzen. Vor und nach der Unterrichtsreihe fanden begleitende Erhebungen statt. Das von den Schülerinnen und Schülern wahrgenommene Klassenklima (4 Items, α>.73, ICC1 >.08, ICC2>.59) sowie die Klassenführung (5 Items, α>.83, ICC1 >.15, ICC2>.75) wurden von Fauth et al. (2014) adaptiert. In den Analysen wurde stets für die Prä-Werte der Unterrichtswahrnehmung kontrolliert. Die Schülerinnen und Schüler wurden zudem gefragt, welche Sprachen sie sprechen (610 gültige Antworten, 434 (71%) nannten (min.) eine andere Sprache als Deutsch) und ob sie während der Unterrichtsreihe auch eine andere Sprache als Deutsch gesprochen haben (von den 434 mehrsprachigen Kindern lagen 399 Antworten vor, davon antworteten 255 (64%) mit ja).

Ergebnisse und Implikationen

Mehrebenen-Regressionsanalysen zeigen positive Effekte der Unterrichtsreihe im Vergleich zur Wartekontrollgruppe auf das Klassenklima (βtreat=.74, p<.01) und die Klassenführung (βtreat=.47, p<.01). Diese positiven Effekte durch die Unterrichtsreihe fanden sich zeitversetzt in beiden Interventionsgruppen (βKlassenklima=.59, p<.01; βKlassenführung=.64, p<.01). Um die statistische Power zu erhöhen wurden für die weiteren Fragestellungen beide Gruppen zusammengefasst. Die Unterrichtswahrnehmung der nur deutschsprachigen Kinder im Vergleich zu ihren Mitschülerinnen und Mitschülern war weder niedriger mit Bezug auf das Klassenklima (Individual Level: βmehrsprachig=–.04, p=.34; Class Level: βmehrsprachig=.10, p=.69) noch hinsichtlich der Klassenführung (Individual Level: βmehrsprachig=.02, p=.55; Class Level: βmehrsprachig=–.06, p=.75). Ebenso gab es keine Unterschiede zwischen mehrsprachigen Kindern, die während der Unterrichtsreihe angaben, eine andere Sprache als das Deutsche genutzt oder nicht genutzt zu haben (Klassenklima: Individual Level: βSprachnutzung=–.02, p=.67; Class Level: βSprachnutzung=–.12, p=.47; Klassenführung: Individual Level: βSprachnutzung=.04, p=.32; Class Level: βSprachnutzung=–.07, p=.58).

Die Ergebnisse deuten darauf hin, dass kooperative Lernformen gewinnbringend für den Einbezug von Mehrsprachigkeit genutzt werden können (vgl. auch Adesope et al., 2011). Gleichzeitig nehmen Lernende unabhängig von ihrer Mehrsprachigkeit oder Sprachnutzung den Unterricht positiver wahr. Die Befunde können dazu beitragen, Befürchtungen zur Nutzung von Mehrsprachigkeit im Unterricht zu begegnen.

 

Lehrersprache: Ein sprachwissenschaftlicher Zugang zum Verständnis von Unterricht

Richard Göllner1, Detmar Meurers1, Zarah-Leonie Weiss1, Anke Lindmeier2
1Universität Tübingen, 2Universität zu Kiel

Theoretischer Hintergrund

Empirische Untersuchungen zur Sprache von Lehrkräften bilden ein gut etabliertes Forschungsfeld. Vielfach werden dabei kommunikative Merkmale der Lehrersprache betrachtet und ihre Bedeutung für das Lernen von Schülerinnen und Schülern im Unterricht beleuchtet. Beispielsweise untersuchten Kobarg und Kollegen (2009) die Anzahl von offenen versus geschlossenen Fragen im Unterricht, während Lüders (2003) stärker Kommunikationssequenzen zwischen Lehrkräften und Schülerinnen und Schülern während des Unterrichtsgespräches betrachtete (siehe auch Kibler et al., 2018). Interessanterweise sind linguistische Merkmale der Lehrersprache weitaus weniger stark beleuchtet. Das ist insofern überraschend, als dass vermutlich kein Aspekt der professionellen Handlungskompetenz ohne das Medium Sprache denkbar ist (Baumert & Kunter, 2006; Hamre & Pianta, 2010). Fachwissen, fachdidaktisches Wissen oder auch fachübergreifende Kompetenzfacetten finden ihre Realisierung notwendigerweise über die Sprache einer Lehrkraft. Gleichzeitig stehen inzwischen leistungsstarke computerlinguistische Verfahren für die Analyse einer großen Bandbreite von Sprachmerkmalen zur Verfügung (z.B. Hancke, Vajjala & Meurers, 2012). Diese reichen von vergleichsweise einfachen Sprachmerkmalen (z.B. Satzlänge) bis zur Analyse komplexerer Sprachkomponenten (z.B. Kohärenz).

Fragestellung

Im Rahmen des Beitrages soll die Lehrkraftsprache sprachanalytisch untersucht und mit der Unterrichtsqualität in Zusammenhang gebracht werden. Folgende Fragestellungen sollen konkret beantwortet werden:

1. Inwieweit finden sich Unterschiede im Hinblick auf fachspezifische Begriffe sowie bildungssprachliche Komplexitätsmerkmale zwischen Lehrkräften?

2. Inwiefern sind sprachliche Merkmale von Lehrkräften über mehrere Unterrichtsstunden hinweg stabil?

3. In welchem Ausmaß sind Sprachmerkmale von Lehrkräften mit der Unterrichtsqualitätsbeurteilung von Schülerinnen und Schülern assoziiert?

Methode

Grundlage der Analyse sind Daten der TALIS-Videostudie, welche am DIPF seit 2017 in Deutschland durchführt wird. Hierin wurden Lehrkräfte während einer Unterrichtseinheit zum Thema „quadratische Gleichungen“ (zwei Unterrichtsstunden) sowie einer weiteren, frei wählbaren Unterrichtseinheit videographiert (N = 80). Für die Analyse der Lehrkraftsprache wurden computerlinguistische Verfahren angewendet, um einerseits die Verwendung mathematischer Fachbegriffe und andrerseits das Ausmaß an bildungssprachlichen Sprachmerkmerkmalen (z.B. Nominalphrasen, Konnektoren oder Passivkonstruktionen) zu ermitteln. Die zeitliche Konsistenz aller Merkmale über verschiedene Unterrichtsstunden und der Zusammenhang der Merkmale mit Schülerbeurteilungen des Unterrichts werden anhand von bivariaten Korrelationsanalysen unter Nutzung von unterschiedlichen Qualitätsindikatoren bestimmt.

Ergebnisse und Diskussion

Die Ergebnisse der computerlinguistischen Analysen zeigen, dass sich Lehrkräfte während der Durchführung einer Unterrichtsstunde zur Einführung quadratischer Gleichungen im Hinblick auf die Verwendung fachspezifischer Begriffe und einer Reihe sprachlicher Komplexitätsmerkmale substantiell unterscheiden. Erwartungsgemäß reduzieren sich für eine frei wählbare Unterrichtseinheit die Unterschiede im Hinblick auf die Verwendung fachspezifischer Begriffe zum Thema „Quadratische Gleichungen“. Demgegenüber bleiben für allgemeinere Sprachmerkmale die Unterschiede bleiben. Zudem weisen alle Merkmale zwischen den einzelnen Unterrichtsstunden eine deutliche Stabilität auf (r ≥ .80). Im Rahmen aktueller Analysen werden Zusammenhänge der Sprachmerkmale mit Schülereinschätzungen sowie Selbsteinschätzungen der Lehrkräfte zur Unterrichtsqualität ermittelt. Die vollständige Auswertung der Daten wird bis Anfang nächsten Jahres abgeschlossen sein. Insgesamt verspricht die linguistische Analyse von Lehrersprache einen vielversprechenden Ansatz zur Erfassung des professionellen Handelns von Lehrkräften im Feld und betont gleichfalls einen weitgehend vernachlässigten Aspekt der Unterrichtsqualitätsforschung.

 
11:15 - 13:00F11‒H05: Sprach- und Leseförderung im schulischen Fachunterricht – Was lernen wir aus der BiSS-Evaluationsforschung?
H05 
 

Sprach- und Leseförderung im schulischen Fachunterricht – Was lernen wir aus der BiSS-Evaluationsforschung?

Chair(s): Dominik Leiss (Leuphana Universität Lüneburg, Deutschland), Nele McElvany (Technische Universität Dortmund), Elmar Souvignier (Universität Münster)

DiskutantIn(nen): Marcus Hasselhorn (DIPF - Leibniz Institut für Bildungsforschung und Bildungsinformation)

Seit einigen Jahren erhält die Berücksichtigung von Sprachsensibilität in allen Unterrichtsfächern erhöhte Aufmerksamkeit (vgl. u.a. Schmölzer-Eibinger et al. 2013.), sei es in der universitären Aus- und Fortbildung von Lehrkräften oder im Rahmen wissenschaftlicher Forschung (Becker-Mrotzek, Schramm, Thürmann & Vollmer, 2013; Leiss, Hagene, Neumann & Schwippert, 2017; Koch-Priewe & Krüger-Potratz, 2016; Michalak, 2014). Dies hängt insbesondere mit den Ergebnissen (inter-)national vergleichender Schulleistungsstudien wie PISA oder DESI zusammen. Hierbei zeigten sich für bestimmte Gruppen im Mittel deutlich geringere sprachliche Kompetenzen, die wiederum Bildungsbenachteiligung in den Fachleistungen mitbedingen. Auffallend waren die geringeren sprachlichen Leistungen von Schülerinnen und Schülern mit Migrationshintergrund (z. B. Stanat, Rauch & Segeritz, 2010), aber auch die diesbezüglichen Defizite einer relativ großen Gruppe von Schülerinnen und Schülern mit Deutsch als Muttersprache (Naumann, Artelt, Schneider, & Stanat, 2010).

Darüber hinaus weisen zahlreiche Forschungsergebnisse darauf hin, dass der Erwerb von fachlichen Kompetenzen und schulischer Erfolg eng mit sprachlichen Fähigkeiten verknüpft sind und Sprachförderung zur Ermöglichung bildungssprachlich gestützten Lernens als Schlüssel zum Erwerb solcher Kompetenzen dienen kann (Becker-Mrotzek et al., 2013). Entsprechend sind in den letzten Jahren zwar mittels Konzepten durchgängiger Sprachbildung (z. B. Gogolin & Lange, 2011) oder sprachsensiblen Fachunterrichts (z. B. Michalak, Lemke, & Goeke, 2015) erste Ansätze entstanden, um den reflexiven und produktiven Umgang mit Texten, aber auch die Entwicklung und Übung von Lesestrategien im Fachunterricht zu konkretisieren. Diese werden jedoch erst in Grundzügen in den Schulen umgesetzt (Becker-Mrotzek, Hentschel, Hippmann, & Linnemann, 2012).

Hieran knüpften die vom Trägerkonsortium der Bund-Länder-Initiative „Bildung durch Sprache und Schrift“ (BISS) initiierten Evaluationsprojekte an, deren Aufgabe es war, die verschiedenen, im Rahmen von BISS durchgeführten Sprachförderprojekte (ca. 100 Kindertageseinrichtungen und 200 Schulen) zu evaluieren. Dabei sollten im Rahmen eines formativen Assessments die Sprach- und Leseförderverbünde prozessbegleitend durch Bereitstellung entsprechender Informationen/ Daten unterstützt und anhand summativer Analysen Erfolgsbedingungen einer fachlichen Sprach- und Leseförderung in den Bereichen Professionalisierung, Diagnostik und Förderung empirisch identifiziert werden, um so letztlich zukünftige Maßnahmen zur sprachbasierten Teilhabe aller Schülerinnen und Schüler an schulischen Lernprozessen zu entwickeln.

Das Symposium zielt darauf ab, aus interdisziplinärer Forschungsperspektive zentrale Befunde aus BiSS-Evaluationsvorhaben darzustellen, organisatorische und methodische Herausforderungen derartiger externer Evaluationsprojekte zu beschreiben und für die Primar- und die Sekundarstufe I empirische Erkenntnisse zur schulischen Sprach- und Leseförderung zu präsentieren.

Im ersten Beitrag wird in einer Stichprobe von 451 mehrsprachigen Schülerinnen und Schülern (Klasse 1-4) geprüft, ob die Kontaktdauer zur Umgebungssprache sowie das Alter mehrsprachiger Kinder jeweils isoliert bedeutsame Einflussfaktoren für den Aufbau des expressiven Wortschatzes darstellen. Im zweiten Beitrag wird in einer Stichprobe von 59 vierten Klassen untersucht, ob in den BiSS-Klassen positive Effekte im Hinblick auf Lesekompetenz, Lesemotivation und die Unterrichtsqualität in vierten Klassenstufen erzielt wurden. Hieran anknüpfend wird in dem dritten Beitrag die Entwicklung unterschiedlicher Aspekte der Lesekompetenz über die Jahrgangsstufen 5 und 6 in 53 Klassen analysiert. Der vierte Beitrag beschreibt schließlich anhand eines Sprachförderverbunds (N = 133), inwiefern die Implementation spezifischer Sprachförderelemente im Mathematikunterricht der Sekundarstufe I mit Veränderungen der Unterrichtswahrnehmung und der sprachbezogenen Einstellungen und Fachleistungen einhergeht.

Die Zusammenstellung der vier Beiträge folgt dem Ziel, die oben genannten Aspekte sprachlicher Förderung in Primar- und Sekundarstufe umfassend abzudecken. Mit den unterschiedlichen disziplinären Perspektiven aus Empirischer Bildungsforschung, Fachdidaktik und Psychologie sowie den Schwerpunkten auf Wortschatz, Lesekompetenz und fachsprachlichen Kompetenzen werden zentrale Aspekte sprachlicher Förderung adressiert – und in der Diskussion hinsichtlich der Einordung der Befunde und Implikationen für weitere Forschung und die Bildungspraxis aufeinander bezogen.

 

Beiträge des Symposiums

 

Welche Einflussfaktoren sollen bei der Auswertung des expressiven Wortschatzes mehrsprachiger Kinder berücksichtigt werden?

Birgit Ehl, Michael Grosche
Bergische Universität Wuppertal

Theoretischer Hintergrund

Sprachkompetenzen sind zentral für den Bildungserfolg. Besonders ein differenzierter Wortschatz ist bedeutsam für schulisches Lernen (Torppa et al., 2007). Um für alle Kinder adäquate Ziele für die Sprachförderung ableiten zu können und, um festzustellen, für welche Kinder eine besondere Sprachförderung empfohlen werden sollte, ist die Diagnostik der Wortschatzkompetenzen sehr wichtig. Daher befasste sich das Evaluationsprojekt BiSS-EOS (Evaluation, Optimierung und Standardisierung von Tools zur Sprachdiagnostik, Sprachförderung und Professionalisierung von Lehrkräften) u.a. mit der Sprachdiagnostik bei mehrsprachigen Kindern, die eine besondere Herausforderung darstellt. Dies liegt u. a. daran, dass der Spracherwerb mehrsprachiger Kinder sehr heterogenen Bedingungen unterworfen ist. Hierzu zählt v. a. die unterschiedlich lange und intensive Kontaktdauer mit der Umgebungssprache. Um zu validen diagnostischen Aussagen zu kommen, wird empfohlen, die Spracherwerbsbedingungen mehrsprachiger Kinder in der Auswertung ihrer Sprachkompetenzen zu berücksichtigen (Grosjean, 2016). In Deutschland existiert jedoch bisher nur ein einziges Verfahren, das spracherwerbstypengerechte Normen für den Sprachbereich Satzbau und Grammatik bereithält (Schulz & Tracy, 2011). Diese Normen berücksichtigen die Kontaktdauer und das Alter mehrsprachiger Kinder in Kombination. Für den Wortschatz existiert kein vergleichbares Verfahren mit spracherwerbstypengerechten Normen (Geist, 2017). Daher besteht das Ziel dieser Studie darin, zu untersuchen, wie solche Normen in anerkannten Wortschatztests grundsätzlich zu entwickeln wären.

Fragestellung

Die Studie untersucht, ob die Kontaktdauer zur Umgebungssprache sowie das Alter mehrsprachiger Kinder jeweils isoliert bedeutsame Einflussfaktoren auf den expressiven Wortschatz mehrsprachiger Kinder darstellen. Daraufhin wird untersucht, ob die Vorhersage des expressiven Wortschatzes durch die Kombination von Kontaktdauer zur Umgebungssprache und Alter erhöht werden kann. Langfristig sollen die Ergebnisse helfen, geeignete Normen für mehrsprachige Kinder zu entwickeln.

Methode

Die Stichprobe bestand aus 451 mehrsprachigen Schülerinnen und Schülern (214 Mädchen) aus ersten bis vierten Klassen aus elf Grundschulen in Wuppertal im Alter von 5;8 bis 10;9 Jahren (M = 8;0 Jahre, SD = 1;3 Jahre). 271 Schülerinnen und Schüler waren simultan mehrsprachig, d.h. ihr Erwerbsbeginn zur Umgebungssprache lag vor dem Alter von 3 Jahren, und 180 waren sukzessiv mehrsprachig, d.h. ihr Erwerbsbeginn zur Umgebungssprache lag nach dem Alter von 3 Jahren.

Zur Erfassung des expressiven Wortschatzes in Deutsch wurden zwei anerkannte Wortschatztests zu einem testübergreifenden Rohwertscore zusammengefasst, der AWST-R (Kiese-Himmel, 2005) mit 75 Items und der WWT 6-10 (Glück, 2011) mit 95 Items (Maximaler testübergreifende Rohwertscore 167, aufgrund drei doppelter Items).

Das Alter und die Kontaktdauer zu Deutsch wurden mit Hilfe eines Elternfragebogens erhoben. Die Kontaktdauer zu Deutsch wurde als Differenz aus Alter und Beginn des regelmäßigen Kontakts zu Deutsch berechnet.

Ergebnisse

Die Kontaktdauer isoliert erwies sich als signifikanter Prädiktor und sagte 29% der Varianz in der Benennleistung voraus (R2 = .291, F(1,449) = 184.16, p < .001, f2 = .41). Ebenso war das Alter isoliert ein signifikanter Prädiktor und sagte 32% der Varianz in der Benennleistung voraus (R2 = .315, F(1,449) = 206.73, p < .001, f2 = .46). Die Kombination aus Kontaktdauer und Alter erhöhte die Vorhersage der Benennleistung signifikant um 8% (R2 = .075, p < .001, F(1,448) = 54.79, p < .001) und klärte 39% der Varianz in der Benennleistung auf, was einem starken Effekt entsprach (korrigiertes R2 = .387, F(2,448) = 143.14, p < .001, f2 = .63).

Mit dieser Studie konnten wir einen empirischen Beleg dafür erbringen, dass sich die Kombination aus Kontaktdauer zur Umgebungssprache und Alter in spracherwerbstypengerechten Normen für mehrsprachige Kinder auch für den expressiven Wortschatz eignet. Implikationen für die Normierung von Sprachtests für mehrsprachige Kinder werden diskutiert.

 

Leseförderung im Rahmen von BiSS in der Grundschule – Wirksamkeit für Leistung, Motivation und Unterrichtsqualität

Nele McElvany1, Franziska Schwabe1, Inga ten Hagen1, Annika Ohle-Peters1, Jennifer Igler1, Theresa Schlitter1, Annika Teerling2, Olaf Köller2
1Technische Universität Dortmund, 2Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik an der Universität Kiel

Theoretischer Hintergrund

Vor dem Hintergrund der Bedeutung von Lesekompetenzen für Bildungsprozesse und Bildungsergebnisse sowie der Förderbedarfe von Lernenden in Deutschland sind empirische Befunde zur wirksamen Förderung der entsprechenden Schülerkompetenzen von hoher Priorität. Neben Lesekompetenz und relevanten Voraussetzungen wie Wortschatz und Leseflüssigkeit sind auch die günstige motivationale und verhaltensbezogene Schülermerkmale, wie intrinsische Lesemotivation, lesebezogenes Selbstkonzept und Leseverhalten, eigenständiges Ziel schulischen Unterrichts (Berendes et al., 2019; Guthrie et al., 2004). Die Grundschulzeit, in der das Lesenlernen im Fokus steht und gleichzeitig eine Abnahme motivationaler Merkmale beobachtet wird, ist ein sinnvoller Zeitpunkt für Fördermaßnahmen. Ein spezifischer Ansatz war in den letzten Jahren die Bund-Länder-Initiative „Bildung durch Sprache und Schrift“ (BiSS), in der mit unterschiedlichen Maßnahmen Schule und Unterricht in Bezug auf Lese- und Sprachförderung weiterentwickelt werden sollten (Schneider et al., 2012). Dem Modell von Dalehefte et al. (2014) folgend, sollten solche Maßnahmen nicht nur auf Ebene der Schülerschaft wirken, sondern bereits vorgelagert unter anderem auf der Ebene der Unterrichtsqualität wie Klassenführung, konstruktiver Unterstützung und kognitiver Aktivierung. Die Frage, ob die gewünschten Wirkungen durch ein umfassendes Bottom-up-gestaltetes, aber durch Fortbildungen und andere Angebote Top-down-angereichertes Programm erreicht werden können, war Gegenstand der Studie EvalLesen.

Fragestellungen

Die Wirksamkeit der strukturierten Leseförderung im Rahmen von BiSS wurde entlang folgender übergeordneter Forschungsfragen (FF) untersucht:

Zeigen sich am Ende der vierten Klassenstufe positive Effekte der schulischen BiSS-Teilnahme unter Kontrolle der Ausgangswerte zu Schuljahresbeginn auf…

… Lesekompetenz, Wortschatz und Leseflüssigkeit? (FF1)

… Lesemotivation, Leseselbstkonzept und Leseverhalten? (FF2)

… Unterrichtsqualität in den Bereichen Klassenführung (Störungen), konstruktive Unterstützung (Kompetenzerleben) und kognitive Aktivierung (Bereich Differenzierung)? (FF3)

Methode

Die Wirksamkeit wurde mit einem längsschnittlichen quasiexperimentellen Kontrollgruppendesign anhand von Strukturgleichungsmodellen für N = 1.032 Schülerinnen und Schüler aus 59 vierten Klassen (37 BiSS-, 22 Kontrollklassen ohne strukturiertes zusätzliches Leseförderprogramm; 47.9 % Mädchen; MAlter = 9.70 Jahre, SD = 0.50) analysiert. In den BiSS-Klassen wurden im Rahmen u.a. des BiSS-Moduls „Diagnose und Förderung des Leseverständnisses“ Maßnahmen durchgeführt, welche aufgrund des Bottom-up-Ansatzes von BiSS stark variierten. Alle Kinder bearbeiteten zu Beginn und am Ende der vierten Klassenstufe standardisierte Testverfahren (FF1) sowie Skalen im Schülerfragebogen (FF2, FF3). Alle Testverfahren und Skalen wiesen für beide Gruppen mindestens befriedigende Reliabilitäten auf. Die Analysen in MPlus wurden unter Kontrolle zentraler Schülermerkmale (u.a. sozioökonomischer Hintergrund, Geschlecht, sonderpädagogischer Förderbedarf) und der Ausgangswerte zu Schuljahresbeginn durchgeführt und ergaben mindestens akzeptable Modellfits.

Ergebnisse und Diskussion

Die Modelle zeigten keinen statistisch signifikanten Effekt der schulischen BiSS-Teilnahme auf Lesekompetenz, kompetenten Umgang mit Wortschatz und Leseflüssigkeit am Ende der vierten Klasse (vgl. Schlitter et al., in Vorb.). Für Leseselbstkonzept wurde ein kleiner negativer Effekt auf das Niveau am Schuljahresende sichtbar (MZPII: β = -.077; SE = .035; p < .05). Eine vergleichbare Tendenz zeichnete sich für das Leseverhalten ab (MZPII: β = -.048, SE = .028; p < .10; vgl. Schwabe et al., in Revision). Hinsichtlich der Unterrichtsqualität auf Klassenebene zeigten sich für Klassenführung sowie konstruktive Unterstützung zu Schuljahresende keine Effekte der schulischen BiSS-Teilnahme. Für kognitive Aktivierung im Bereich Differenzierung ergab sich hingegen ein marginal signifikanter positiver Effekt (MZPII: β = .256; SE = .141; p < .10). Dieser Befund ging auf eine negative Entwicklung der Differenzierung von MZPI zu MZPII in der Kontrollgruppe zurück (dKontrollklassen = -0.52; dBiSS-Klassen = -0.08).

Ein Erklärungsansatz für die ausbleibenden Effekte könnte sein, dass die Maßnahmen aufgrund der BiSS-Konzeption von großer Heterogenität in Fokus, Umsetzung, Intensität und weiteren Merkmalen geprägt waren und somit möglicherweise wirksame von nicht wirksamen Ansätzen überlagert wurden (vgl. McElvany et al., 2018). Dieser und weitere Erklärungsansätze sowie Implikationen für zukünftige Programmgestaltungen werden im Rahmen des Symposiums diskutiert.

 

Leseförderung in den Schulalltag implementieren – Ergebnisse der Längsschnittuntersuchungen im Projekt BiSS-EILe

Elmar Souvignier1, Nina Zeuch1, Anke Schmitz2, Jörg Jost2
1Universität Münster, 2Universität zu Köln

Theoretischer Hintergrund

Das Verstehen von Texten ist eine zentrale Voraussetzung für den Wissenserwerb in unterschiedlichen fachlichen Kontexten (OECD, 2016). Während Übersichtsarbeiten konsistent darauf hinweisen, dass die explizite Vermittlung von Lesestrategien den Kern wirksamer Förderprogramme bildet (z.B. Baye, Inns, Lake & Slavin, 2019), erweist sich die Implementation von Leseförderkonzepten als eine zentrale Herausforderung (Souvignier & Philipp, 2016).

Das BiSS-Evaluationsprojekt EILe hat von 2016 bis 2018 untersucht, welche Faktoren eine nachhaltige Implementation von Förderkonzepten im Bereich des strategieorientierten Lesens beeinflussen und welche Effekte sich bei Schülerinnen und Schülern nachweisen lassen.

Fragestellung

Im vorliegenden Beitrag werden unter anderem Ergebnisse aus Längsschnittdaten präsentiert, die in den teilnehmenden BiSS-Verbünden Schleswig-Holstein (SH) und Oberfranken (OF) sowie in Kontrollklassen in Nordrhein-Westfalen (KG) erhoben wurden. Die BiSS-Verbünde SH und OF haben das Ziel, diagnosebasierte Leseförderung in unterschiedlichen fachlichen Kontext umzusetzen und verfolgen dabei unterschiedliche Implementationsstrategien (SH: Top-Down, OF: Bottom-Up). Mit Lesen macht stark (SH) sowie dem Lesefächer (OF) wird dabei unterschiedliches Fördermaterial eingesetzt. Geprüft wird, ob die Entwicklung der Lesekompetenz in den BiSS-Verbünden höher ausfällt als in den Vergleichsklassen.

Methode

Im vorliegenden Beitrag wird ein Ausschnitt der Ergebnisse vorgestellt, die aus insgesamt drei Kompetenztestungen der Schülerinnen und Schüler (zu Beginn und Ende der fünften sowie zum Ende der sechsten Klassenstufe) stammen. Eingesetzt wurden für die Kompetenztestungen standardisierte Testverfahren und Fragebögen (u.a. SLS 2-9; FLVT 5-6; WLST 7-12, Lesefreude) sowie neu konstruierte Skalen (Lesestrategieanwendung). Zusätzlich wurden weitere soziodemographische Variablen (Geschlecht, Sprachlichkeit, Buchbesitz als SES-Proxy) erhoben. Insgesamt wurden 954 Schülerinnen und Schüler aus 53 Klassen an 16 Schulen getestet. Fehlende Werte wurden durch FIML kompensiert (Graham, 2009). Ergänzt werden die Befunde durch schriftliche Befragungen von 70 Lehrkräften, z.B. zum Einsatz des Fördermaterials und zu persönlichen und schulischen Rahmenbedingungen sowie durch Unterrichtsbeobachtungen.

Ergebnisse

Latent Growth Curve Modelle (Mplus 8, Muthén & Muthén, 1998-2017) unter Einbeziehung der Mehrebenenstruktur der Daten (Schülerinnen und Schüler in Klassen) weisen für den Verbund OF im Vergleich zur KG signifikant höhere Zuwächse bei der Leseflüssigkeit, dem Leseverständnis und dem Lesestrategiewissen aus (p<.01). Im Verbund SH sind ausschließlich im Hinblick auf die Leseflüssigkeit höhere Zuwächse im Vergleich zur KG festzustellen (p<.01). Mit Blick auf die einbezogenen Drittvariablen lassen sich die Befunde folgendermaßen ergänzen: Insgesamt sind höhere Zuwächse für die Schülerinnen im Vergleich zu den Schülern (Leseflüssigkeit, Lesestrategiewissen, Lesestrategieanwendung, Lesefreude; p<.01) und für Gymnasialklassen (Leseflüssigkeit, Leseverständnis, Lesestrategieanwendung, p<.01) feststellbar. Ebenso haben Wortschatz und Buchbesitz einen signifikanten Einfluss auf die Zuwächse von Leseflüssigkeit, Leseverständnis und Lesefreude (p<.01 – p<.05). Insgesamt ergibt sich ein uneinheitlicher Befund: Es lassen sich keine eindeutigen Vorteile für die Vorgehensweise in einem der Verbünde feststellen. Mögliche Ursachen dafür liegen in der Nutzung der Förderinstrumente: Die Materialnutzung erfolgt laut Selbstauskünften der Lehrkräfte in den Verbünden auf eher niedrigem Niveau (M = 2.43 in SH und 2.08 in OF auf einer siebenstufigen Skala von 1 = nie bis 7 = mehrmals pro Woche) mit großer Spannbreite (SH: SD = 1.45; OF: SD = 1.06). Daten aus Unterrichtsbeobachtungen stützen diesen Befund einer eher zurückhaltenden Implementation der Födertools. Als mögliche Gründe für den seltenen Einsatz weisen die Lehrkräfte u.a. auf Zeitmangel und fehlende Unterstützung im Kollegium hin, in OF spielen zudem fehlende Fortbildungsangebote und die Anschaffungskosten für das Material eine Rolle.

Die Ergebnisse der zwei Schuljahre umfassenden Evaluation deuten darauf hin, dass positive Effekte durch den Einsatz strategieorientierter Materialien langfristig möglich sind. Gleichzeitig wird deutlich, dass die konkrete Umsetzung der Förderkonzepte eine zentrale Herausforderung – und gleichzeitig eine Bedingung für den Erfolg von Förderkonzepten ist. Diskutiert werden zudem die Befunde zur differenziellen Wirksamkeit der Förderkonzepte. Neben ausgearbeiteten Materialien scheint entsprechend eine intensivere Begleitung von Lehrkräften über Fortbildungen, als Ergänzung zu ausgearbeitetem Material, zu einer erfolgreicheren Implementation beizutragen.

 

Sprachförderung im Mathematikunterricht – Von erwünschten und unerwünschten Effekten auf sprachbezogenen Einstellungen und Leistungen

Dominik Leiss1, Knut Schwippert2, Jennifer Plath3
1Leuphana Universität Lüneburg, 2Universität Hamburg, 3Joachim Herz Stiftung Hamburg

Theoretischer Hintergrund

Für den Mathematikunterricht besteht empirische Evidenz dafür, dass Fachleistungen signifikant mit der allgemeinen Sprachkompetenz zusammenhängen (Paetsch, Radmann, Felbrich, Lehmann, & Stanat, 2016; Plath & Leiss, 2018; Prediger, Wilhelm, Büchter, Gürsoy, & Benholz, 2015; Vukovic & Lesaux, 2013). Gründe hierfür liegen in den bildungs- und fachsprachlichen Anforderungen des Fachs Mathematik, etwa mit Blick auf das Lesen und Verstehen mathematischer Textaufgaben (Leiss, Schukajlow, Blum, Messner & Pekrun 2010). Sprachliche Fähigkeiten sind aber auch für den diskursiven Aufbau von Mathematikkompetenz von Bedeutung: Einerseits dient Sprache in ihrer kommunikativen Funktion als zentrales mündliches und schriftliches Lernmedium und andererseits in ihrer kognitiven Funktion als Werkzeug des Verstehens und Denkens (Maier & Schweiger, 1999; Morek, 2012). Zusätzlich ist Sprache nicht nur Lernmedium, sondern auch Lerngegenstand, da eine Vielzahl an fachspezifischen Sprachmitteln die Voraussetzung zum Aufbau mathematischen Wissens bildet (Pimm, 1987).

Trotz dieser Relevanz von Sprache fehlen mit wenigen Ausnahmen (vgl. u.a. Prediger & Wessel, 2018 oder Hagena, Leiss & Schwippert, 2017) empirische Studien, die zeigen, inwiefern sprachliche Fördermaßnahmen zu einer Kompetenzsteigerung führen (Schilcher, Röhrl, & Krauss, 2017).

An diese Forschungslücke knüpft das Forschungsprojekt „Evaluation der Sprachförderung im Fachunterricht der Sekundarstufe I“ (EvaFa) an, das im Rahmen des BiSS-Projekts Sprachfördermaßnahmen von sieben Sprachförderverbünden für den Mathematikunterricht der Sekundarstufe I begleitet und evaluiert. Der Vortrag fokussiert auf die exemplarische Analyse der Daten eines inhaltlich konsistent arbeitenden Sprachverbundes mit 133 SuS aus acht Klassen des 5. und 6. Jahrgangs. Inhaltliche Schwerpunkte der Sprachförderung waren die Vermittlung eines adäquaten Fachwortschatzes sowie die Implementation unterrichtlicher Sprachhandlungen. Für die Analysen wurden im Rahmen von paper-pencil-Tests (u.a. DEMAT, C-Test) mathematische und sprachliche Fähigkeiten, relevante Hintergrundmerkmale (u.a. SES, Noten, Muttersprache) sowie die Einschätzungen der Schülerinnen und Schüler in Bezug auf unterrichtliche Aspekte der Sprachförderung über den Verlauf eines Sprachförderjahres erhoben.

Fragestellungen

Dabei verfolgte das Projekt u.a. folgende Forschungsfragen:

FF I Wie verändert sich die Unterrichtswahrnehmung der Lernenden nach einem Jahr Sprachförderung bezüglich zentraler Kriterien wie z.B. sprachliche Verständlichkeit oder Haltungen Sprachhandlungen gegenüber?

FF II Inwiefern können nach der Fördermaßnahme Veränderungen in sprachlich-fachlichen Leistungen festgestellt werden?

FF III Inwiefern hängt die sprachbasierte Fachleistung am Ende der Förderung mit der Bewertung unterrichtlicher Aspekte bzw. personenbezogener Hintergrundvariablen der Schülerinnen und Schüler (z.B. Migrationshintergrund, SES ...) zusammen?

Ergebnisse

FF1: Für den Großteil der unterrichtlichen Aspekte zeigen sich keine signifikanten Unterschiede zwischen MZP 1 und MZP 2. Allerdings besteht bezüglich der Wertschätzung der SuS gegenüber mathematischen Sprachhandlungen ein hochsignifikanter Rückgang (Effektstärke Cohen’s d = .37). Die Wertschätzung derartiger Handlungen nimmt demnach bei gleichzeitiger Zunahme derartiger Handlungen im Verlauf der Sprachförderung signifikant ab.

FF2: Die Fähigkeit der SuS mathematische Textaufgaben zu verstehen nimmt zwischen den beiden Messzeitpunkten signifikant zu (Cohen’s d = .37). Bezüglich des Fachwortschatzes zeigt sich zwar ein signifikanter Zuwachs (Cohen’s d = .32), allerdings sind die erzielten Leistungen normativ betrachtet als Verfehlung der curricularen Ziele anzusehen.

FF3: Regressionsanalysen zeigen, dass Vorwissen, Geschlecht, math. Leistungsstärke, sprachhandlungsbezogene Einstellungen mit einem höheren Fachwortschatz (AV) am Ende der Sprachförderung einhergehen (R2 = .46). Die Fähigkeit Textaufgaben am MZP 2 zu verstehen (AV), wird dagegen lediglich durch das Vorwissen und die Lesefähigkeit beeinfluss (R2 = .40). Andere Aspekte wie z.B. die Unterrichtswahrnehmung, Geschlecht oder die Muttersprache scheinen dabei keine Rolle zu spielen.

Der Beitrag schließt mit einer Diskussion über Grenzen der Studie und über mögliche Konsequenzen für die Sprachförderung im Fachunterricht.

 
11:15 - 13:00F11‒H06: Diagnostische Urteilsprozesse als Informationsverarbeitung und die Bedeutung von Personen- und Situationsmerkmalen
H06 
 

Diagnostische Urteilsprozesse als Informationsverarbeitung und die Bedeutung von Personen- und Situationsmerkmalen

Chair(s): Katharina Loibl (PH Freiburg), Timo Leuders (PH Freiburg), Tobias Dörfler (PH Heidelberg)

DiskutantIn(nen): Detlev Leutner (Universität Duisburg-Essen, Deutschland)

Diagnostizieren gilt als eine wesentliche Tätigkeit von Lehrkräften: Eine zutreffende Einschätzung über das Wissen, die Motivation oder das Denken der Schülerinnen und Schüler ist Voraussetzung für das Feedback an Lernende oder Eltern, für Übergangsentscheidungen und für die Anpassung des Unterrichts (z. B. Artelt & Gräsel, 2009; Baumert & Kunter, 2013; Glock, Krolak-Schwerdt & Pit-Ten Cate, 2015; Helmke, 2010; Hobfoll, Halbesleben, Neveu & Westman 2018; Praetorius, Berner, Zeinz, Scheunpflug & Dresel, 2013). Das Wissen und die Fähigkeiten der Lehrkräfte, die für die Vorbereitung, Durchführung und Reflexion von Beurteilungen – ob formal oder informell, formativ oder summativ – erforderlich sind, werden unter dem Oberbegriff diagnostische Kompetenz zusammengefasst (Herppich et al., 2018; Popham, 2009; Schrader, 2009; Weinert, Schrader & Helmke, 1990). Die meisten Forschungsarbeiten zur diagnostischen Kompetenz von Lehrkräften zielen darauf ab, den Einfluss verschiedener situativer Faktoren (z. B. der untersuchten Lerngruppe, des Leistungsniveaus der Schüler(innen) oder der Aufgabenschwierigkeiten) einerseits oder der Eigenschaften von Lehrpersonen (z. B. Alter der Lehrkraft, Berufserfahrung oder Fachwissen) andererseits auf die Urteilsgenauigkeit zu analysieren (für einen Überblick siehe Südkamp Kaiser & Möller, 2012). Andere Ansätze sind an der Untersuchung des breiten Spektrums von Lehrkräfteaktivitäten im Zusammenhang mit der Diagnose interessiert (z. B. Black & Wiliam, 2003; Herppich et al., 2018). Der Forschungsstand zum diagnostischen Urteilen wird in den Bildungs­wissen­schaften jedoch als unbefriedigend angesehen, da bisher noch keine überzeugenden Theorien über die kognitiven Prozesse beim Diagnostizieren aufgestellt wurden (Schrader, 2009; Spinath, 2005; Leuders, Dörfler, Leuders & Philipp, 2018; Herppich et al., 2018). Für das Verständnis der Genese eines Urteils scheint es entscheidend zu sein, welche Informationen in der Diagnosesituation von einer Lehrkraft wahrgenommen werden und wie diese Informationen (mehr oder weniger wissensbasiert) verarbeitet werden. Überraschen­derweise ist bislang nur wenig über den Informationsverarbeitungsprozess von Lehrkräften bekannt.

Als theoretische Basis für Forschungsansätze, die Informationsverarbeitung von Lehrkräften als kognitive Erklärung untersucht, wurde ein Rahmenmodell entwickelt, genannt DiaCoM (Explaining Teachers’ Diagnostic Judgements by Cognitive Modeling;). Das DiaCoM-Rahmenmodell konzeptualisiert diagnostisches Urteilen in Bildungskontexten als Schlussfolgern einer Lehrkraft über Schüler(innen) (z. B. deren Fähigkeit) oder über Anforderungen (z. B. Aufgabenschwierigkeiten) auf der Grundlage der Informationen, die durch eine diagnostische Situation definiert werden. Es bezieht sich somit auf Theorien der kognitiven Informationsverarbeitung. Dabei bietet das DiaCoM-Rahmenmodell einen theoretischen und forschungsstrategischen Rahmen für die Spezifikation von Situationscharakteristika (SC), Personencharakteristika der Lehrpersonen (PC), Prozessen der Informationsverarbeitung als diagnostisches Denken (DD) und diagnostischem Verhalten (DV). Diese Spezifikationen ermöglichen die experimentelle Überprüfung von Annahmen zur Genese diagnostischer Urteile. Im Symposium beziehen sich alle Beiträge auf das Rahmenmodell. Die Beiträge zeigen auf, wie die Spezifikation des diagnostischen Denkens als konkrete kognitive Prozesse der Verarbeitung von Informationen (DD), der Diagnosesituation hinsichtlich wahrnehmbarer Informationen (SC) und der diagnoserelevanten Personeneigenschaften über konkrete Wissenselemente und psychische Zustände(PC) erlaubt, Vorhersage des diagnostischen Verhaltens (DV) in Form überprüfbarer Hypothesen aufzustellen und zu untersuchen.

Der erste Beitrag testet den Prozess der Wahrnehmung schwierigkeitsgenerierender Merkmale (DD) als Voraussetzung für genaue Urteile (DV) mittels Eyetracking. Als Situationscharakteristik (SC) wurden Aufgaben generiert, die sich in ihren schwierigkeitsgenerierenden, visuell wahrnehmbaren Merkmalen unterscheiden.

Der zweite Beitrag untersucht in einem Experiment den Einfluss von Stress (PC) auf Blickbewegungen bei der Wahrnehmung (DD) und Einschätzung (DV) von Aufgabenschwierigkeiten (SC).

Der dritte Beitrag unterscheidet die Wahrnehmung und Gewichtung (DD) von relevanten und irrelevanten Merkmalen (SC) bei der Einschätzung von Aufgabenschwierigkeiten (DV) mit und ohne spezifischem fachdidaktischem Wissen (PC).

Der vierte Beitrag untersucht die unterschiedliche Wahrnehmung und Interpretationen (DD) von fachlichen und instruktionalen Merkmalen (SC) in einem within-subject Design. Spezifische Aspekte des fachdidaktischen Wissens (PC) werden bei Lehrkräften mit und ohne Berufserfahrung (PC) als potentiell moderierende Faktoren berücksichtigt.

 

Beiträge des Symposiums

 

Diagnoseprozesse der Schwierigkeitseinschätzung von Mathematikaufgaben – eine Analyse von Blickbewegungen

Kirsten Brunner, Andreas Obersteiner, Timo Leuders
PH Freiburg

Theoretischer Hintergrund und Ziel der Studie

Eine für die Unterrichtsgestaltung wesentliche Facette diagnostischer Kompetenz ist die Fähigkeit, fachdidaktisches Wissen zu nutzen, um die Schwierigkeiten von (Mathematik-)Aufgaben korrekt einzuschätzen. Bisherige Studien fokussierten dabei zumeist auf die Qualität diagnostischer Urteile (Karst, 2012; McElvany et al., 2009; Schrader, 1989). Hingegen ist über die zugrundeliegenden Diagnoseprozesse und insbesondere über die Rolle der Wahrnehmung relevanter Aufgabenmerkmale bislang wenig bekannt. Ostermann, Leuders, and Nückles (2017) konnten zeigen, dass sich Einschätzungen von Aufgabenschwierigkeiten nach einer fachdidaktischen Intervention verbessern. Unbekannt ist jedoch, ob tatsächlich das verstärkte Wahrnehmen der relevanten Aufgabenmerkmale für die verbesserten Einschätzungen verantwortlich war.

Hier setzt die vorliegende Studie an. Sie hat zum Ziel, den Prozess der diagnostischen Urteilsfindung (vgl. diagnostisches Denken DD im DiaCoM-Rhamenmodell) im Fach Mathematik, insbesondere Prozesse des Wahrnehmens und Interpretierens, in Abhängigkeit von der Urteilsgenauigkeit zu beschreiben. Ausgehend von der Eye-Mind-Hypothese (Just & Carpenter, 1976), welche besagt, dass Menschen hauptsächlich die Informationen verarbeiten, die sie gerade mit dem Auge fixieren, gehen wir davon aus, dass sich die Qualität der Wahrnehmung und Interpretation relevanter Aufgabenmerkmale in den Augenbewegungen widerspiegelt (vgl. diagnostisches Denken DV im DiaCoM-Rahmenmodell). In diesem Beitrag gehen wir der Frage nach, ob es gelingt konsistente Muster im Blickverhalten angehender Mathematiklehrkräfte zu identifizieren. Wir erwarten, dass genauere Einschätzungen mit längeren Blickzeiten auf relevante Merkmale einhergehen.

Methode

Es wurden 20 Aufgaben zu Funktionsgraphen konzipiert, deren Schwierigkeitsgrade sich auf Grund visuell wahrnehmbarer Merkmale unterscheiden. „Schwierige“ Aufgaben adressieren hierbei jeweils einen typischen und in der mathematikdidaktischen Literatur gut dokumentierten Schülerfehler (Hattikudur et al., 2012; Nitsch, 2015). „Leichte“ Aufgaben sind inhaltlich vollständig parallel konzipiert, enthalten aber nicht das für den jeweiligen Schülerfehler relevante Merkmal. Die zunächst theoretisch begründete Unterscheidung in „schwierige“ und „leichte“ Aufgaben wurde an einer Stichprobe von N = 110 Schüler*innen validiert. Erwartungskonform waren die mittleren Lösungsraten für schwierige Aufgaben signifikant niedriger (M = 34%, SD = 14) als die der leichten Aufgaben (M = 98%, SD = 2), t(18) = -8.55, p < 0.001, d = 0.81. Die Aufgaben wurden Studierenden des Lehramts Mathematik zur Einschätzung des Schwierigkeitsgrades vorgelegt. Zum gegenwärtigen Zeitpunkt liegen Daten von N = 48 Proband*innen vor. Die Aufgabe der Teilnehmenden war es, nacheinander den Schwierigkeitsgrad der Aufgaben auf einer Skala von 1 (sehr leicht) bis 4 (sehr schwer) zu beurteilen. Die Aufgaben wurden auf einem Bildschirm gezeigt. Während der Einschätzung wurden die Blickbewegungen mit einem Eyetracker aufgezeichnet. Nach jeder Einschätzung wurden die Teilnehmenden gebeten, ihre Urteile zu begründen.

Ergebnisse

Die bisherigen Analysen zeigen, dass der Schwierigkeitsgrad der „schwierigen“ Aufgaben auch signifikant höher eingeschätzt wurde (M = 2.4, SD = .41) als der der „leichten“ Aufgaben (M = 1.44, SD = .43), t(18) = -4.07, p = .001. In den Begründungen nannten allerdings lediglich 5% der Teilnehmenden den jeweils relevanten Fehlertyp, was auf unzureichendes fachdidaktisches Wissen hindeutet. In den Blickbewegungen zeigte sich, dass Aufgaben, welche den Fehlertyp „Steigung-Höhe-Verwechslung“ provozierten signifikant länger betrachtet wurden, als Aufgaben welche keinen der typischen Schülerfehler provozierten t(7) = -2.074, p = 0,039. Dies sehen wir als ersten Hinweis dafür, dass sich die Wahrnehmung der schwierigkeitsgenerierenden Merkmale in den Blickbewegungen widerspiegelt. In weiteren Analysen soll geprüft werden, ob genauere Urteile und bessere Begründungen für die Urteile mit längeren Fixationszeiten auf relevante Aufgabenmerkmale einhergehen. Hierbei soll die Qualität des Wahrnehmens als die relative Länge der Fixationszeiten auf den relevanten Aufgabenmerkmalen operationalisiert werden. Die Ergebnisse dieser Analysen werden auf der Tagung vorgestellt. Die Identifizierung dieser Muster ist ein erster Schritt zu einem besseren Verständnis dafür, wie (angehende) Lehrpersonen ihr fachdidaktisches Wissen zu typischen Schülerfehlern nutzen, um die Schwierigkeit von Mathematikaufgaben richtig einzuschätzen und somit passgenaue Aufgaben für Schüler*innen auszuwählen.

 

Der Einfluss von Stress auf Blickbewegungen bei der Wahrnehmung und Einschätzung von Aufgabenschwierigkeiten

Sara Becker1, Birgit Spinath2, Beate Ditzen3, Tobias Dörfler1
1PH Heidelberg, 2Universität Heidelberg, 3Universitätsklinikum Heidelberg

Theoretischer Hintergrund

Zentrales Anliegen der Studie war es, den situativen Einfluss von Stress auf Blickbewegungen sowie damit einhergehende diagnostische Urteilsprozesse während des Wahrnehmens und Beurteilens von Mathematikaufgaben zu untersuchen. Akkurate Schwierigkeitseinschätzungen von Aufgaben, als Teil situativ tragfähiger Diagnosen einer Lehrperson, finden nicht nur in der Unterrichtsvorbereitung, sondern auch in realen Unterrichtssituationen statt. In realen Unterrichtssituationen diagnostizieren Lehrkräfte jedoch oftmals unter Zeitdruck oder aufgrund der hohen Arbeitsbelastung unter psychischer Anspannung (Fidler, 2004). Dennoch besteht wenig empirische Evidenz zum möglicherweise verzerrenden Effekt situationsabhängiger Zustände, wie Stress, auf das diagnostische Denken sowie die Urteilsbildung.

Zahlreiche Befunde legen nahe, dass insbesondere psychische Anspannungen, wie Stress, kognitive Kapazitäten binden, die aufgrund der begrenzten Arbeitsgedächtniskapazität nicht mehr für die analytische Urteilsbildung zur Verfügung stehen (Chen & Chaiken, 1999). Es wird angenommen, dass die Lehrkräfte unter Stresserleben daher offensichtliche Aufgabenmerkmale für ihre Urteilsbildung fokussieren. Der Einfluss von Stress auf die Urteilsbildung kann anhand von Eyetracking-Daten nachvollzogen werden. Es wird angenommen, dass insbesondere Blickbewegungsdaten, die als Maß für kognitive Verarbeitung angesehen werden können, unter Stresserleben Veränderungen aufzeigen. Unter anderem wird daher für die Teilnehmenden unter Stresseinfluss eine kürzere Fixationsdauer, als Maß für die kognitive Verarbeitung, sowie eine geringere Anzahl von Fixationen ab einer Länge von 250 ms, die einen tiefergehenden und analytischeren Prozess widerspiegeln (Deubel, 2008), erwartet.

Retrospektive Verbalprotokolle helfen, die Eyetracking-Daten stringenter auszuwerten (Philipp, 2018). Sie ermöglichen Rückschlüsse auf das diagnostische Denken (König et al., 2016). Es wird erwartet, dass Teilnehmende unter Stresseinfluss insgesamt weniger diagnoserelevante Aufgabenmerkmale für ihr diagnostisches Urteil berücksichtigen, sowie mehr oberflächlich erkennbare Aufgabenmerkmale nennen. Die in Untersuchungen durchgeführten Messungen des Stresshormons Cortisol können als objektiver Indikator für eine zugrundeliegende Stressreaktion des Individuums angesehen werden (Kirschbaum & Hellhammer, 1999).

Methode

Eine experimentelle Eyetracking-Studie, basierend auf einem fachdidaktischen Mathematiktest, wurde mit 64 Mathematiklehramtsstudierenden (Alter: M=22.72, SD=4.16, 73 % Frauen) der Pädagogischen Hochschule Heidelberg durchgeführt. Die Teilnehmenden der Experimentalgruppe (n=33) wurden im Gegensatz zur Kontrollgruppe vor der Diagnoseaufgabe zusätzlich mithilfe des Sozialevaluativen Kaltwasserstresstests (engl. 'social evaluated cold-pressor test', SECPT) künstlich gestresst (Schwabe, Haddad & Schachinger, 2008). Anhand der Analyse von insgesamt vier Speichelproben wurde das Stressniveau der Teilnehmenden objektiv mithilfe des Stresshormons Cortisol erfasst. Der so erfasste Stress fungierte als Moderator der Diagnosegüte.

Das diagnostische Verhalten der Teilnehmenden bestand in der Einschätzung von Textaufgaben im Bereich der Bruchrechnung hinsichtlich der Schwierigkeit für Realschülerinnen und schüler Ende Klassenstufe 6 beziehungsweise Anfang Klassenstufe 7. Die Aufgaben variierten in der Auffälligkeit der schwierigkeitsgenerierenden Aufgabenmerkmale. Die Blickbewegungen während der Diagnosetätigkeit wurden mithilfe des Eyetrackings dokumentiert und anhand globaler Maße analysiert. Die Blickbewegungen dienten als Indikatoren des zugrundeliegenden diagnostischen Denkens. Retrospektive Verbalprotokolle gaben Auskunft über die Interpretation der wahrgenommenen Aufgabenmerkmale während des diagnostischen Denkens und über die Interpretation der Relevanz für das diagnostische Urteil.

Ergebnisse und Diskussion

Die Ergebnisse der Blickbewegungsanalysen zeigten unter anderem signifikant kürzere Fixationsdauern bei der Experimentalgruppe, als Maß für die kognitive Verarbeitung, (t(62)=1.79, p=.038) mit einer mittleren Effektstärke d=.45 (Cohen, 1988). Eine signifikant geringere mittlere Anzahl an Fixationen ab einer Dauer von 250 ms, ab der eine metakognitive Verarbeitung möglich ist (Deubel, 2008), konnte innerhalb der Experimentalgruppe im Vergleich zur Kontrollgruppe aufgezeigt werden (t(62)=1.86, p=.033). Die Effektstärke lag bei d=.46. Die Auswertung der Verbalprotokolle ergab, dass insbesondere mathematische Aspekte, im Vergleich zu sprachlichen Aspekten als schwierigkeitsgenerierend eingestuft wurden. Über alle Aufgaben hinweg wurden sowohl mathematisch als auch sprachlich schwierigkeitsgenerierende Aufgabenmerkmale signifikant häufiger von der Kontrollgruppe als von der Experimentalgruppe genannt und in ihrem diagnostischen Verhalten berücksichtigt.

Anhand der Eyetracking-Daten konnte zusammenfassend festgestellt werden, dass die Stressinduktion Einfluss auf Wahrnehmungsprozesse einer Aufgabe ausübt. Die Auswertung der Verbalprotokolle zeigte, dass insbesondere die Interpretation der wahrgenommenen Aufgabenmerkmale sowie das diagnostische Denken durch die Stressinduktion negativ beeinflusst wurden.

 

Kognitive Prozesse bei der Einschätzung von Aufgabenschwierigkeit - Einflüsse von Wissen und Zeitdruck

Andreas Rieu, Katharina Loibl, Timo Leuders
PH Freiburg

Theoretischer Hintergrund

Das Auswählen von Aufgaben ist eine zentrale Aktivität von Lehrkräften im Rahmen der adaptiven Anpassung des Unterrichts auf die Lernvoraussetzungen einer Lerngruppe (Beck, E., Baer, M., Guldimann, T., Bischoff, S., Brühwiler, C., Müller, P., & Vogt, F., 2008). Dabei stellt die Aufgabenschwierigkeit neben anderen ein Kriterium für die Auswahl dar (Neubrand, Jordan, Krauss, Blum, & Löwen, 2011).

Um die Aufgabenschwierigkeit einzuschätzen, kann in Anlehnung an Prozessmodelle des diagnostischen Urteilens (Loibl, Leuders, & Dörfler, subm.) angenommen werden, dass die Lehrkraft bei dieser Tätigkeit Aufgabenmerkmale zunächst identifiziert und anschließend entscheidet, ob diese relevanten Einfluss auf die Lösungshäufigkeit haben. Für diese Entscheidung benötigen sie fachdidaktisches Wissen über gegenstandsspezifische Schülerkognitionen (knowledge about content and students, Ball, Thames, & Phelps, 2008), konkret über den Einfluss von Aufgabenmerkmalen auf Schülerschwierigkeiten bei der Aufgabenbearbeitung.

Fragestellung

In der vorliegenden Studie sollen durch die systematische Variation von Faktoren in der Diagnosesituation (Aufgabenmerkmale, verfügbare Zeit) und der diagnostizierenden Person (spezifisches fachdidaktisches Wissen) die Einflüsse der situativen und der personalen Charakteristika auf das diagnostische Denken untersucht werden.

Anhand der Urteile der befragten Personen sollen die Annahmen über die kognitiven Prozesse der Identifizierung und der Gewichtung der Aufgabenmerkmale empirisch geprüft werden. Dies geschieht anhand der Fragestellungen: Erhöht die Vermittlung von fachdidaktischem Wissen durch die verbesserte Identifizierung und Gewichtung die Urteilsakkuratheit? Wirkt sich eine Zeitrestriktion vor allem negativ auf die (komplexere) Gewichtung von Aufgabenmerkmalen aus?

Methode

Die Grundlage für die Aufgabeneinschätzung bildet ein Pool mit Additions- und Subtraktionsaufgaben aus der Bruchrechnung, die die Aufgabenmerkmale der Bruchbeziehung, der Bruchdarstellung und des Operationsverständnisses variieren und welche für die empirische Lösungshäufigkeit von Lernenden der 6. und 7. Klasse (N=203) im Vorfeld gelöst wurden. Diese Aufgaben wurden in einer experimentellen Versuchsanordnung angehenden Mathematiklehrkräften (N=212) in paarweisen Vergleichen zur Einschätzung der Aufgabenschwierigkeit vorgelegt. Zur Untersuchung des Einflusses der personalen Charakteristika auf das Urteilsverhalten wurde eine Gruppe zufällig zur Experimentalgruppe definiert und erhielt eine domänenspezifische fachdidaktische Kurzintervention im Bereich der schwierigkeitsgenerierenden Merkmale. Hinsichtlich des Einflusses der situativen Merkmale wurden die Einschätzungen beider Gruppen anschließend an zwei Messzeitpunkten (unter Zeitdruck und ohne Zeitdruck) erhoben. Zur Unterscheidung der angenommenen kognitiven Prozesse wurden die sich gegenüberstehenden Aufgaben entweder in nur einem (zur Identifizierung der Merkmale) oder in zwei gegenläufig ausgeprägten Merkmalen (zu deren Gewichtung) unterschieden.

Ergebnisse

Der Einfluss von spezifischem fachdidaktischen Wissen auf die Urteilsprozesse zeigt sich in einem Gruppenvergleich der Experimentalgruppe mit der Kontrollgruppe. Die Varianzanalyse mit Messwiederholung bezüglich der allgemeinen mittleren Urteilsgüte zeigt, dass die Urteile unter Verwendung des spezifischen Wissens signifikant besser sind (F(1,148)=59.463, p≤.001).

Der situative Einfluss durch die Zeitrestriktion der einzelnen Gruppen unterteilt nach den Messzeitpunkten zeigt, dass die Kontrollgruppe selbst unter Bereitstellung von ausreichend Zeit ihr Urteilverhalten nicht signifikant verbessern kann (F(1,64)=.633, p=.429 ƞ²=.010). Die Experimentalgruppe konnte ihre mittlere Urteilsakkuratheit ohne Zeitdruck noch steigern (F(1,84)=5.659, p=.020, ƞ²=.063). Die Interaktion der beiden Einflussfaktoren Wissen und Zeit ist damit signifikant (F(1,148)=4.701, p=.032, ƞ²=.031) und bedeutet, dass die Anwendung des vermittelten Wissens unter Verwendung von ausreichend Zeit die Urteilsakkuratheit zusätzlich steigert.

Die Trennung der kognitiven Prozesse konnte über die beschriebene Verwendung von unterschiedlich konzeptionierten Aufgabenvergleichen operationalisiert werden. Eine Varianzanalyse mit Messwiederholung zeigt, dass sich die Wissensvermittlung signifikant auf die Verbesserung der Identifizierung (F(1,226)=4.120, p=.044, ƞ²=.018) und Gewichtung (F(1,119)=12.127, p=.001, ƞ²=.092) von Aufgabenmerkmalen auswirkt. Bei der Bestimmung des Einflusses von Zeitrestriktion zeigt sich, dass nur der Gewichtungsprozess ausreichend Zeit benötigt (F(1,119)=3.917, p=.050, ƞ²=.032), die Identifizierung von Aufgabenmerkmalen aber nicht anfällig auf Zeitdruck ist (F(1,226)=1.923, p=.679, ƞ²=.001). Dieses Ergebnis unterstützt die Annahme, dass diagnostische Urteile durch zwei unterscheidbare informationsverarbeitende Prozesse zustande kommen.

Die vorliegende Studie generiert sowohl einen empirischen Beitrag zur Beforschung der kognitiven Urteilsprozesse als auch Kenntnisse über wirksame Inhalte der Lehrerausbildung im Bereich der diagnostischen Kompetenzen.

 

Diagnostische Urteile zur Schwierigkeit von Mathematikaufgaben: Einfluss von fachlichen und instruktionalen Aufgabenmerkmalen auf die kognitiven Prozesse der Urteilsfindung

Saskia Schreiter, Markus Vogel, Markus Rehm, Tobias Dörfler
PH Heidelberg

Theoretischer Hintergrund und Fragestellung

Die Auswahl und Modifikation von Mathematikaufgaben setzen bei Lehrkräften eine adä-quate Einschätzung von Aufgabenschwierigkeiten voraus. Neben der Komplexität des ma-thematischen Inhalts (z. B. Addition gleichnamiger vs. ungleichnamiger Brüche) wird die Schwierigkeit von Aufgaben unter anderem auch von instruktionalen Merkmalen bestimmt, die gemäß der Cognitive Load Theorie (CLT) die kognitive Belastung von Lernenden beim Lösen der Aufgabe beeinflussen (z. B. split-attention vs. integrated format; Sweller, Ayres, & Kalyuga, 2011). Studien zur Urteilsgenauigkeit belegen, dass Lehrkräfte sich bei der Einschätzung der Aufgabenschwierigkeit insensitiv gegenüber dem Instruktionsdesign zei-gen (Hellmann & Nückles, 2013). Weiterhin weisen Studien darauf hin, dass die Genauig-keit des Urteils von bestimmten Personencharakteristika (z. B. fachdidaktisches Wissen) beeinflusst wird (Ostermann, Leuders, & Nückles, 2017). Wenig bekannt ist bisher über die kognitiven Prozesse, die diagnostischen Urteilen zugrunde liegen (Leuders, Dörfler, Leuders, & Philipp, 2018). Aufbauend auf den Ergebnissen und dem methodischen Design der Studie von Hellmann & Nückles (2013), fokussiert der vorliegende Beitrag die Wahr-nehmung und Verarbeitung (Loibl, Leuders, & Dörfler, subm.) von fachlichen und instruk-tionalen Aufgabenmerkmalen beim Diagnostizieren der Aufgabenschwierigkeit. Konkret werden die folgenden drei Forschungsfragen gestellt: 1. Welche schwierigkeitsgenerieren-den Aufgabenmerkmale (fachliche vs. instruktionale) werden von Lehrkräften beim Diag-nostizieren der Aufgabenschwierigkeit wahrgenommen und verarbeitet? 2. Besteht ein Zu-sammenhang zwischen spezifischen Aspekten des Pedagogical Content Knowledge (PCK)/Pedagogical Knowledge (PK) und der Wahrnehmung und Verarbeitung von Aufga-benmerkmalen? 3. Unterscheiden sich Lehrkräfte mit Berufserfahrung von Lehramtsstu-dierenden bezüglich der Wahrnehmung und Verarbeitung von Aufgabenmerkmalen?

Methode

Im Diagnosetest werden sechs Aufgaben aus dem Bereich der Bruchrechnung hintereinan-der präsentiert. In einem within-subject Design sind schwierigkeitsgenerierende Merkmale systematisch variiert: Im Bereich der Bruchrechnung durch Adaption des Schwierigkeits-grades (Padberg & Wartha 2017) und im Bereich des Instruktionsdesigns gemäß ausge-wählter Gestaltungsempfehlungen der CLT. Zu jeder Aufgabe werden drei Arten des diag-nostischen Verhaltens erfasst: Einschätzung der Lösungshäufigkeit (DV1), Begründung, was die Aufgabe leicht oder schwer macht (DV2) und Modifikation der Aufgabe zur Än-derung der Schwierigkeit (DV3). Die systematische Variation der Aufgabenmerkmale er-möglicht, von dem konkret erhobenen diagnostischen Verhalten Rückschlüsse auf die wahrgenommenen und verarbeiteten Aufgabenmerkmale zu ziehen. Im anschließenden PCK/PK Test wird die spezifische Wissensausprägung zu schwierigkeitsgenerierenden Aufgabenmerkmalen (Bruchrechnung und Instruktionsdesign) erfasst. Hierfür werden zwei Aufgaben, die sich nur in einem schwierigkeitsgenerierenden Merkmal unterscheiden, di-rekt nebeneinander präsentiert und die Einschätzung der schwierigeren Aufgabe erhoben. Um einen potentiellen Einfluss der Berufserfahrung zu untersuchen, wurde die Studie mit 35 praktizierenden Lehrkräften (Gymnasien, Real- und Gemeinschaftsschulen) und 55 Lehramtsstudierenden durchgeführt.

Ergebnisse

Die Ergebnisse zeigen, dass sowohl Lehrkräfte als auch Studierende überwiegend die Schwierigkeit des mathematischen Inhalts wahrnehmen, jedoch kaum die Schwierigkeit, die vom Instruktionsdesign ausgeht. Die drei erhobenen diagnostischen Verhaltensweisen lassen darauf schließen, dass die Teilnehmenden beim Diagnostizieren stets signifikant mehr fachliche als instruktionale Aufgabenmerkmale wahrgenommen und verarbeitet ha-ben (DV1: t(89) = 10.76, p < .001, d = 1.62 ; DV2: t(89) = 12.60, p < .001, d = 1.74; DV3: t(89) = 8.64, p < .001, d = 1.45). Unterschiede zwischen Studierenden und Lehrkräften konnten bei bei der Begründung der Aufgabenschwierigkeit (DV2) in Form eines Interakti-onseffektes festgestellt werden (F(1,88) = 4.46, p < .05, partielles η2 = .048). Entgegen der Erwartung zeigen die Ergebnisse, dass die Teilnehmenden über ein vergleichbar hohes PCK/PK bzgl. schwierigkeitsgenerierender Aufgabenmerkmale im Bereich der Bruchrech-nung (M = .74, SD = .33) und des Instruktionsdesigns (M = .73, SD = .28) verfügen. Diese Ergebnisse werfen die Frage auf, warum (angehende) Lehrkräfte bei der Schwierigkeitsein-schätzung von Aufgaben kaum instruktionale Merkmale wahrnehmen, obwohl sie über ein ausgeprägtes PK in diesem Bereich verfügen? Ausgehend von den vorliegenden Ergebnis-sen wird eine weitere Studie zur Untersuchung möglicher Erklärungsansätze geplant.

 
11:15 - 13:00F11‒H07: MINT (ist nichts) für mich? Affektiv-motivationale und verhaltensbezogene Mechanismen der Beteiligung von Frauen in MINT-Bereichen
H07 
 

MINT (ist nichts) für mich? Affektiv-motivationale und verhaltensbezogene Mechanismen der Beteiligung von Frauen in MINT-Bereichen

Chair(s): Ilka Wolter (Leibniz-Institut für Bildungsverläufe (LIfBi)), Lysann Zander (Leibniz Universität Hannover)

DiskutantIn(nen): Rebecca Lazarides (Universität Potsdam)

Aktuelle Studierendenzahlen bestätigen die anhaltende asymmetrische Verteilung von Frauen und Männern in MINT Studiengängen (d. h., Mathematik, Informatik, Naturwissenschaft, Technik): Frauen sind demnach in MINT-Bereichen insgesamt unterrepräsentiert, allerdings trifft das nicht auf alle MINT-Fächern gleichermaßen zu (vgl., Gisler et al., 2018). Die Studierendenzahlen für das Wintersemester 2017/2018 zeigen für Deutschland, dass Frauen in Physik (28.7%), Ingenieurwissenschaften (22.3%) oder Informatik (21.1%) deutlich unterrepräsentiert sind, hingegen in anderen MINT-Bereichen, z. B. Biologie (62.0%), Pharmazie (68.6%) oder Architektur (57.9%), stärker vertreten sind als Männer (Statistisches Bundesamt, 2018).

Diese deutlichen Präferenzen und Geschlechterdifferenzen in MINT-Bereichen zeigen sich bereits im Grund- und Sekundarschulbereich (vgl. TIMSS, PISA). Die PISA 2015 Studie hat beispielsweise gezeigt, dass sich 27% der Jungen vorstellen können, mit 30 Jahren einen Beruf im Bereich der Naturwissenschaften anzustreben, jedoch wählten nur 18% der Mädchen diese Option (Schiepe-Tiska et al., 2016). Diese Befunde sind besonders relevant, da empirische Studien zeigen, dass Mädchen, die in ihrer Jugend MINT-Berufe anstreben, diese später auch häufiger ergreifen (Schoon, 2001). Weitergehende Analysen mit den PISA 2015 Daten zeigen allerdings auch, dass für die berufliche Aspiration in den Naturwissenschaften nicht die naturwissenschaftliche Kompetenz bedeutsam ist, sondern die instrumentelle Motivation und die Freude an den Naturwissenschaften (Schiepe-Tiska et al., 2016). Nicht nur im aktuellen MINT Nachwuchsbarometer wird daher darauf hingewiesen, dass entsprechende Angebote nicht nur im Jugend- oder Erwachsenenalter ansetzen sollten, sondern bereits in der frühen Bildung ein Fokus auf Interessen und Aktivitäten in diesen Bereichen gelegt werden sollte (MINT Nachwuchsbarometer, 2019; vgl. auch Luttenberger, Steinlechner, Ertl & Paechter, 2019). Obwohl insbesondere in MINT-Studiengängen besonders hohe Abbruchraten zu verzeichnen sind, legen aktuelle empirische Studien nahe, dass Frauen nicht mehr wahrscheinlich als Männer ihr Studium abbrechen. Dies ist bemerkenswert, da verschiedene Studien zeigen, dass sich ihre Situation als Minorität psychologisch besonders herausfordernd darstellt (Lewis et al., 2018). Bereits Seymour (1992) stellte dar, dass Gründe für einen Studienabbruch im MINT-Bereich im sinkenden Interesse am Fach und in mangelhaften Studienbedingungen liegen, dass aber insbesondere für Minoritäten, wie beispielsweise Frauen, die fehlende erlebte Zugehörigkeit zur Gruppe der Studierenden eine Rolle spielen kann.

Vor diesem empirischen Hintergrund betrachten die Beiträge des Symposiums affektiv-motivationale und verhaltensbezogene Mechanismen in verschiedenen Bildungsphasen, beginnend im Vor- und Grundschulalter bis in die tertiäre Bildung in der Universität, zur Erklärung der Aufnahme und des Abbruchs eines MINT-Studiums.

Im ersten Beitrag gehen die Autorinnen der Frage nach, ob sich bei Kindern im Vorschulalter bereits geschlechtsspezifische Medienaktivitäten aufzeigen lassen. Dazu untersuchen die Autorinnen, ob die Mediennutzung durch Merkmale der Familie erklärt werden kann und ob es langfristige Effekte der Nutzungsdauer von digitalen Medien auf Kompetenzen im naturwissenschaftlichen und sprachlichen Bereich im Grundschulalter gibt.

Der zweite Beitrag thematisiert geschlechtstypisierte Interessensprofile in akademischen und beruflichen Interessensbereichen in der Sekundarstufe I. Die Autorinnen untersuchen, ob sich die Zugehörigkeit von Mädchen und Jungen zu einem stereotyp männlichen oder stereotyp weiblichen Interessensprofil über die normative Geschlechtsrollenorientierung erklären lässt.

In einer ähnlichen Weise betrachten die Autoren des dritten Beitrags berufliche Interessensprofile, allerdings bei Studierenden in MINT-Fächern im Vergleich zu Lehramtsstudierenden. In der Studie wird untersucht, inwiefern sich für diese Studierendengruppen eine Kongruenz zwischen ihren beruflichen Interessen und den Interessenprofilen der angestrebten Berufe aufzeigen lässt.

Im vierten Beitrag untersuchen die Autorinnen bei Studierenden der Informatik die erlebte Unsicherheit in der Zugehörigkeit zum Studienfach. Sie betrachten unter anderem Effekte der wahrgenommenen Exklusion durch andere Studierende und der akademischen Selbstwirksamkeitserwartung auf die wahrgenommene Zugehörigkeit zum Studiengang.

Die Beiträge werden abschließend diskutiert mit der Frage, inwiefern affektiv-motivationale und verhaltensbezogene Determinanten der Studienfach- und Berufswahl in verschiedenen Bildungsphasen für eine ausgewogene Beteiligung von Frauen in MINT-Berufen thematisiert werden müssen.

 

Beiträge des Symposiums

 

Mediennutzung im Kindergarten- und Grundschulalter – Unterschiede zwischen Mädchen und Jungen

Susanne Kuger1, Katharina Loos2
1Deutsches Jugendinstitut München (DJI), 2Leibniz-Institut für Bildungsverläufe (LIfBi)

Theoretischer Hintergrund

Aktuelle Studien im höheren Kindes- und im Jugendalter belegen Unterschiede zwischen Jungen und Mädchen sowohl hinsichtlich des absoluten Umfangs ihrer Mediennutzung als auch in Bezug auf die spezifischen Aktivitäten, die mit digitalen Medien und Geräten durchgeführt werden. Während Jungen viel Zeit mit Bildschirmmedien (z. B. Computer, Spielekonsole) verbringen, nutzen Mädchen in ihrer Freizeit vor allem auditive und narrative Medien (z. B. Hörspiele aber auch Videos bzw. DVDs) (Feierabend u. a. 2015). Zugleich zeigen Längsschnittuntersuchungen, dass der Umgang mit digitalen Medien bereits im Grundschulalter mit der Schulleistung der Kinder sowie mit ihrer weiteren schulischen und sozial-emotionalen Entwicklung zusammenhängt (Mößle 2012). Es lassen sich zwei potenzielle Mechanismen unterscheiden: Nach der Anregungshypothese sollten z. B. Kinder, die mehr Zeit mit auditiven und narrativen Medien verbringen, in ihrer sprachlichen Entwicklung von deren Anregungsgehalt profitieren, Kinder, die mehr Zeit in aktiver Interaktion mit digitalen Geräten verbringen, dagegen möglicherweise mehr hinsichtlich ihrer ICT-Literacy. Allerdings kann nach der Konkurrenzhypothese auch angenommen werden, dass zu viel Zeit im Umgang mit (digitalen) Medien die potenzielle Lernzeit reduziert sowie die vertiefte Verarbeitung von tagsüber oder in der Schule Gelerntem behindert.

Fragestellung

Es stellt sich die Frage zu welchem Zeitpunkt in der kindlichen Entwicklung die aus der Literatur bekannten geschlechtsspezifischen Differenzen in der Mediennutzung besonders zum Tragen kommen. Weiterhin ist bislang offen, ab wann bedeutsame Beziehungen zwischen Mediennutzung und Kompetenzentwicklung festgestellt werden können und wie sich das Wechselspiel der beiden Entwicklungsdomänen mittelfristig verändert. Wichtig ist es vor allem zu untersuchen, welche Rolle in dieser Wechselwirkung familiale Struktur- und Prozessmerkmale einnehmen.

Methode

Als Datengrundlage dient die Startkohorte 2 des Nationalen Bildungspanels (NEPS) (Blossfeld u. a. 2011) (doi:10.5157/NEPS:SC2:8.0.0). Es werden Daten vom 2. Kindergartenjahr bis zum Ende der Grundschulzeit (Erhebungswellen 1-3 und 6) einbezogen. Ausgehend von einfachen regressionsanalytischen Ergebnissen werden mit Hilfe von Strukturgleichungsmodellen die Veränderungen in den Kompetenz und in den Mediennutzungsgewohnheiten beschrieben, wobei autoregressive Modelle zur Analyse der wechselseitigen Einflüsse und Wachstumskurvenmodelle zur Untersuchung der Entwicklungslinien herangezogen werden. Die beiden angenommenen Mechanismen (Anregungs- oder Konkurrenzhypothese) werden unter Hinzuziehung von im Längsschnitt verfügbaren Kompetenzmaßen des NEPS untersucht. Zur Abbildung familialer Prozessmerkmale werden die häusliche Lernumwelt sowie das elterliche Medienerziehungsverhalten herangezogen.

Ergebnisse

Erste Analysen mit den Daten der Startkohorte 2 „Frühe Bildung in Kindergarten und Grundschule“ des NEPS replizieren die in anderen Studien gefundenen Geschlechterunterschiede in den Medienaktivitäten von Kindern im Vorschulalter. Allerdings zeigen die Auswertungen darüber hinaus, dass Familienmerkmale deutlich stärker auf unterschiedliche Nutzungsmuster hinweisen als das kindliche Geschlecht. Im Gegensatz zur Kompetenzentwicklung im Bereich Wortschatz steht die Entwicklung der naturwissenschaftlichen Kompetenz mit der Nutzungsdauer eines spezifischen Mediums – der Spielekonsole – in Verbindung. Detailanalysen, differenziert nach Geschlecht, weisen zudem nach, dass dieser Zusammenhang nur bei Jungen signifikant ist (β = -.146; SE =0,018; Mädchen: β = -,003; SE= 0,086). Geschlechtsunterschiede zeigen sich auch noch in der Mediennutzung am Ende der Grundschulzeit sowie in der Kompetenzentwicklung der Kinder. Weitere Analysen sollen die wechselseitigen Abhängigkeiten sowie mögliche (differenzielle) Bedingtheiten der Entwicklungslinien der Kinder aufzeigen.

 

Geschlechterstereotype Interessensprofile zu Beginn der Sekundarstufe I: Zum Zusammenhang von akademischen und beruflichen Interessen mit der Geschlechterrolleneinstellungen und der kognitiven Grundfähigkeit von Schülerinnen und Schülern

Lisa Ehrtmann1, Ilka Wolter1, Bettina Hannover2
1Leibniz-Institut für Bildungsverläufe (LIfBi), 2Freie Universität Berlin

Theoretischer Hintergrund

Frauen sind im Vergleich zu Männern im Beruf und Studium immer noch unterrepräsentiert in den MINT-Fächern (z.B. Hausmann & Kleinert, 2014). Die Grundsteine für die spätere Berufswahl liegen unter anderem in den Interessen von Schülerinnen und Schülern, die sich häufig bereits sehr früh in ihren Bildungsverläufen an Geschlechterstereotypen (vgl. Eagly et al., 2000) ausrichten. Studien haben gezeigt, dass Geschlechterunterschiede in akademischen und beruflichen Interessen und Interessensprofilen bestehen (z.B. Chow & Salmela-Aro, 2011). Diese Interessen sind wiederum prädiktiv für spätere Bildungs- und Berufsaspirationen (Lent et al., 2010; Volodina & Nagy, 2016). Das Ziel dieser Studie ist, die Interessensprofile von Schülerinnen und Schülern in der Sekundarstufe I in Bezug auf akademische und berufliche Gegenstandsbereiche zu betrachten.

Während sich akademische Interessen auf die Schulfächer beziehen, werden berufliche Interessen in empirischen Forschungsarbeiten häufig nach Hollands RIASEC-Modell (realistische/praktische, investigative/forschende, künstlerische, soziale, unternehmerische, konventionelle Interessen; Holland, 1997) eingeteilt. Es gibt zudem Zusammenhänge zwischen akademischen und beruflichen Interessen und schulischen Leistungen und kognitiven Fähigkeiten (z.B. Korhonen et al., 2016; Päßler et al., 2015). Bisherige Studien zeigen, dass traditionell eingestellte SchülerInnen im allgemeinen niedrigere Komptenzen aufweisen als egalitär eingestellte Schülerinnen und Schüler (Ehrtmann & Wolter, 2018; Hadjar et al., 2012), daher wird die Relevanz der normativen Geschlechtsrollenorientierung von Schülerinnen und Schülern für ihre Interessensprofile analysiert.

Fragestellung

Vor diesem empirischen Hintergrund wird angenommen, dass Schülerinnen und Schüler zu Beginn der Sekundarstufe I bereits geschlechterstereotype Interessensprofile aufweisen. Wir erwarteten daher, vier Interessensprofile aus akademischen und beruflichen Interessen zu finden. Einerseits sollten ein generell hohes und ein generell niedriges Interessensprofil gefunden werden, die vor allem durch die kognitiven Grundfähigkeiten der Schülerinnen und Schüler charakterisiert sein sollten. Außerdem erwarteten wir ein stereotyp männliches Interessensprofil zu finden, das gekennzeichnet ist durch hohe mathematische, realistische, investigative und unternehmerische Interessensausprägungen zusammen mit niedrigen Interessen in stereotyp weiblichen Bereichen, also im Bereich Deutsch sowie in künstlerischen, sozialen und konventionellen Interessen. Analog erwarten wir, ein stereotyp weibliches Interessensprofil mit hohen stereotyp weiblichen und niedrigen stereotyp männlichen Interessensbereichen zu finden. Wir nehmen an, dass Mädchen wahrscheinlicher ein stereotyp weibliches Interessensprofil aufweisen, wohingegen Jungen häufiger stereotyp männliche Interessensprofile zeigen sollten. Weiterhin wird erwartet, dass eine traditionellere Einstellung mit allgemein niedrigen Interessen einhergeht. Für Mädchen sollte eine egalitäre Einstellung mit einem männlichen Interessensprofil zusammenhängen.

Methode

In dieser Studie wurden N = 4457 Schülerinnen und Schüler (49,2% weiblich) der sechsten Klasse mittels Daten der Startkohorte 3 des Nationalen Bildungspanels (NEPS, Blossfeld et al., 2011) untersucht (Durchschnittsalter M = 11,88 Jahre, SD = 0,50). In der sechsten Klasse wurden akademische Interessen (Deutsch und Mathe) mit jeweils vier Items, berufliche Interessen (sechs RIASEC-Faktoren) mit jeweils 3 Items sowie die normative Geschlechterrollenorientierung mit vier Items erfasst. Die kognitive Grundfähigkeit wurde in der fünften Klasse mit einem Matrizentest erfasst.

Ergebnisse

Die Ergebnisse der latenten Profilanalyse zeigten, dass die erwartete 4-Profillösung angemessen war. Es zeigte sich ein allgemein hohes Interessensprofil, ein allgemein niedriges Interessensprofil, ein stereotyp weibliches und ein stereotyp männliches Interessensprofil. Die meisten Mädchen waren im stereotyp weiblichen Profil vertreten, die meisten Jungen im stereotyp männlichen Profil. In den hohen und niedrigen Profilen gab es keine Geschlechterunterschiede. Es waren signifikant mehr Jungen im weiblichen Profil vertreten als Mädchen im männlichen Profil.

In einer logistischen Regression zeigte sich, dass Schülerinnen und Schüler mit traditionellen Geschlechterrolleneinstellungen eher ein niedriges Interessensprofil aufweisen, wohingegen Schülerinnen und Schüler mit einer egalitären Geschlechterrollenorientierung wahrscheinlicher hohe oder stereotyp weibliche Interessen zeigten. Es zeigte sich aber keine Interaktion mit der Geschlechterrollenorientierung in der Zugehörigkeit von Mädchen und Jungen zu bestimmten Interessensprofilen.

Darüber hinaus zeigten sich die kognitiven Grundfähigkeiten relevant für die Interessensprofile: Schülerinnen und Schüler mit hohen kognitiven Grundfähigkeiten (Reasoning) zeigten weniger wahrscheinlich ein niedriges Interessensprofil und wahrscheinlicher stereotyp männliche Interessen.

 

Interessenprofile bei Studierenden in MINT-Fächern

Bernhard Ertl, Florian G. Hartmann, Divan Mouton
Universität der Bundeswehr München

Theoretischer Hintergrund

Einen Beruf anzustreben, der zu den persönlichen Interessen passt, gilt als wichtige Grundlage für die Arbeitszufriedenheit und berufliche Kontinuität (Nye et al., 2012). Ein wichtiger Aspekt dafür ist, die Passung zwischen Beruf und Interessen operationalisieren zu können. Holland (1997) postuliert hierzu ein Modell mit sechs Dimensionen beruflicher Interessen (praktisch-technische, intellektuell-forschende, künstlerisch-sprachliche, soziale, unternehmerische, konventionelle), an Hand dessen die beruflichen Interessen sowohl des Individuums als auch beruflicher Umgebungen dargestellt und analysiert werden können. Stimmen diese stark überein spricht man von einer hohen Kongruenz (z. B. Brown & Gore, 1994). Studien haben jedoch gezeigt, dass sich diese Kongruenz zwischen den Geschlechtern sowie zwischen verschiedenen Fächergruppen unterscheidet (Autor, 2019) und besonders für Studierende im MINT-Bereich niedriger ist. Studierende der Lehrämter in den MINT- Fächern können dabei jedoch eine besondere Position einnehmen, da sie zwar fachlich ein MINT-Studium absolvieren, der Lehrberuf später aber deutlich mehr durch soziale und unternehmerische Interessen ausgezeichnet ist als MINT-Berufe in vergleichbaren Fächern (siehe Jörin Fux et al., 2003).

Fragestellung

Im Rahmen dieses Beitrags soll die Fragestellung untersucht werden, inwieweit sich Studierende der MINT-Fächer von Studierenden der MINT-Lehrämter hinsichtlich der Kongruenz zwischen ihren beruflichen Interessen und den angestrebten Berufen unterscheiden.

Methode

Die Studie greift auf Daten des nationalen Bildungspanel NEPS (Blossfeld et al., 2011) zurück und fokussiert die Kohorte der StudienanfängerInnen (SC5:10.0.0). Dabei wurden 2169 Studierende der Fächer Mathematik (1093), Physik (205), Chemie (306) und Biologie (565) ausgewählt und bezüglich ihres Studiengangs als Lehrämtler (1446) oder Fachstudierende (723) klassifiziert. Die beruflichen Interessen wurden an Hand des IILS-II (Wohlkinger et al., 2011) erhoben und die Kongruenz mit dem Profil der Interessen ihrer beruflichen Aspiration an Hand der Differenz der Interessenvektoren (Eder, 1998) berechnet. Dafür wurden für jede individuelle Aspiration jeweils die Profile der beruflichen Interessen aus dem O*Net (2018) zugeordnet.

Ergebnisse

Die Ergebnisse weisen auf signifikante Unterschiede zwischen den Fächern (F(3,2153) = 2.690; p < .05; η² = .004), den Geschlechtern (F(1,2153) = 25.938; p < .001; η² = .012) sowie dem Lehramt (F(1,2153) = 40.877; p < .001; η² = .019) hin. Zudem gab es Interaktionseffekte zwischen Fach und Geschlecht (F(3,2153) = 3.392; p < .05; η² = .005) sowie zwischen Lehramt und Geschlecht (F(1,2153) = 18.681; p < .001; η² = .009). Ein Vergleich der Konfidenzintervalle zeigt, dass Frauen grundsätzlich eine höhere und Lehrämtler eine grundsätzlich niedrigere Kongruenz aufwiesen. Betrachtet man die Fächer genauer, zeigten sich für Chemie keine signifikanten Unterschiede. Für die anderen Fächer gab es bezüglich der Fachstudierenden keine signifikanten Unterschiede zwischen den Geschlechtern, während bei den Lehrämtlern männliche Studierende eine signifikant niedrigere Kongruenz aufwiesen. Insgesamt zeigte sich, dass die Kongruenz weiblicher Lehrämtler vergleichbar zu denen weiblicher und männlicher Fachstudierender war, während die Kongruenz der männlichen Lehrämtler mit Ausnahme der Chemie immer deutlich niedriger war. Im Vergleich zwischen weiblichen und männlichen Lehrämtlern weisen die Ergebnisse auf mittlere bis große Effekte hin (Mathematik: Cohen’s d = 0.561; Physik: Cohen’s d = 0.866; Chemie: Cohen’s d = 0.941).

Diskussion

Vor dem Hintergrund der Meta-Studie von Nye et al. (2012) sowie dem Modell beruflicher Interessen von Holland (1997), weisen männliche Studierende der MINT-Lehrämter (mit Ausnahme Chemie) eine deutlich geringere Passung zwischen den eigenen Interessen und ihrer beruflichen Aspiration auf und haben damit ein höheres Risiko für eine geringere Arbeitszufriedenheit. Um die Ursachen dieses Phänomens genauer zu ergründen, können Aspekte aus Gottfredsons (2005) Theorie zu circumscription and compromise weitere Anhaltspunkte ergeben. Weitere Studien sollten hier ergründen, inwieweit der Aspekt des effort, also des Aufwands eines MINT-Fachstudiums, für die männlichen Lehrämtler eine Rolle bei der Studienentscheidung gespielt hat und dadurch ggf. die Wahl auf ein Lehramtsstudium mit einer geringeren Kongruenz gefallen ist.

 

What does it take to (not) belong? Quellen der Unsicherheit über die Zugehörigkeit zum Studienfach Informatik

Elisabeth Höhne, Lysann Zander
Leibniz Universität Hannover

Theoretischer Hintergrund

In Bezug auf die in einem jeweiligen Studienfach numerisch unterrepräsentierten Minderheiten ist die erlebte Unsicherheit über die Zugehörigkeit als Prädiktor von motivationalen Defiziten, leistungsbezogenen Nachteilen sowie der Studienpersistenz zunehmend in den Blick der Forschung geraten (Höhne et al., in press; Walton et al., 2015; Woodcock et al., 2013). Im universitären Kontext stellen weibliche MINT-Studierende eine solche Minderheit in den in Deutschland traditionell männlich dominierten naturwissenschaftlich-technischen Fächern dar, wobei das Studienfach Informatik mit 18.35% aktuell zu den Fächern mit dem niedrigsten Anteil an weiblichen Studierenden zählt (Statistisches Bundesamt, 2018) und die Anzahl von Studienanfängerinnen zuletzt sogar rückläufig war (Statistisches Bundesamt, 2017).

Trotz der steigenden Anzahl von Studien, die die Auswirkungen dieser Zugehörigkeitsunsicherheit untersuchen, gibt es bislang jedoch kaum empirische Erkenntnisse über die Quellen dieser. Die Ergebnisse bisheriger Studien verdeutlichen, dass numerisch unterrepräsentierte und negativ stereotypisierte Individuen in leistungsbezogenen und kompetitiven akademischen Umgebungen besonders sensitiv in Bezug auf die Qualität ihrer sozialen Beziehungen sind (Walton et al., 2007) sowie in überdurchschnittlichem Maße vulnerabel gegenüber situationalen Reizen, die einen Mangel an sozialen Bindungen signalisieren (Murphy et al., 2007). Neben der Unsicherheit über die soziale Zugehörigkeit legen weitere Studien nahe, dass weibliche MINT-Studierende stärker auf Reize aus ihrer Umwelt reagieren, die eine fähigkeitsbezogene Limitation in ihrem Studienfach signalisieren (Walton et al., 2007) und es einen negativen Zusammenhang zwischen dem sozialen Zugehörigkeitsgefühl und der Unsicherheit über die eigenen Fähigkeiten gibt (Lewis et al., 2015).

Fragestellung

In diesem Beitrag sollen die psychologischen Faktoren, die die erlebte Unsicherheit über die Zugehörigkeit zum Studienfach Informatik von weiblichen und männlichen Studierenden erklären, untersucht werden, wobei (a) die wahrgenommene affektive sowie akademische Exklusion durch Mitstudierende, (b) domänenspezifische akademische Selbstwirksamkeitserwartungen sowie (c) das wahrgenommene individuelle Potential im Vergleich zu Mitstudierenden genauer betrachtet werden sollen.

Methode

Anhand einer Stichprobe von 449 Informatikstudierenden (345 männlich, 104 weiblich) mit einem durchschnittlichen Alter von 22.03 Jahren (SD = 4.36) wurden die Hypothesen geprüft, dass die wahrgenommene Exklusion durch Mitstudierende, akademische Selbstwirksamkeitserwartungen im Fach Informatik sowie das wahrgenommene eigene Potential im Vergleich zu Mitstudierenden zu Beginn des ersten Studiensemesters (T1) die Unsicherheit über die Zugehörigkeit zur Mitte des Semesters (T2) vorhersagen und dass dieser Zusammenhang stärker für weibliche als für männliche Studierende ist.

Ergebnisse

In einer multiplen linearen Regressionsanalyse, unter Kontrolle der Abiturnote sowie der berichteten Unsicherheit über die Zugehörigkeit zum Zeitpunkt T1, zeigte sich in der Vorhersage der Zugehörigkeitsunsicherheit zu T2 erwartungskonform eine signifikante Interaktion zwischen der wahrgenommenen affektiven und akademischen Exklusion durch Mitstudierende und dem Geschlecht (β = .087, p ≤ .05). Weibliche Studierende, die sich stärker von Lerngruppen und sozialen Aktivitäten mit Mitstudierenden ausgeschlossen fühlten, berichteten somit eine größere Unsicherheit in Bezug auf ihre Zugehörigkeit zum Studienfach Informatik. Gemäß unseren Erwartungen war die Interaktion zwischen domänenspezifischen akademischen Selbstwirksamkeitserwartungen und dem Geschlecht ebenfalls prädiktiv für die Zugehörigkeitsunsicherheit zu T2 (β = -.0133, p ≤ .05), sodass Informatikstudentinnen mit einer niedrigeren Selbstwirksamkeitserwartung eine größere Unsicherheit berichteten. Entgegen unserer Erwartungen zeigte sich in Bezug auf den dritten Prädiktor, das wahrgenommene individuelle Potential im Vergleich zu Mitstudierenden, keine signifikante Interaktion mit dem Geschlecht. Die relationale Einschätzung des eigenen Potentials im Fach Informatik war vielmehr sowohl für männliche als auch weibliche Studierende relevanter Prädiktor der Zugehörigkeitsunsicherheit zu T2 (β = -.147, p ≤ .01).

 
11:15 - 13:00F11‒H08: Pädagogisches Wissen in der Lehramtsausbildung
H08 
 

Pädagogisches Wissen in der Lehramtsausbildung

Chair(s): Sarah Schönleber (Justus-Liebig-Universität Gießen/ ZfL, Deutschland), Sophie Galeski (Justus-Liebig-Universität Gießen/ ZfL, Deutschland)

DiskutantIn(nen): Claudia von Aufschnaiter (Justus-Liebig-Universität Gießen/ Institut für Physikdidaktik)

Seit einiger Zeit kann eine Zunahme der Forschung zur standardisierten Erfassung von pädagogischem Wissen beobachtet werden (z.B. TEDS-M) (König & Klemenz 2015). Das pädagogische Wissen von (angehenden) Lehrkräften ist ein zentraler Bestanteil der professionellen Kompetenz von Lehrkräften (Loewenberg et al. 2008; Voss et al. 2011). Die universitäre Lehramtsausbildung verfolgt das Ziel, pädagogisches Wissen als Teil einer „Trias“ aus Fachwissen, fachdidaktischen Wissen und pädagogischem Wissen, in der Literatur als „professionelles Wissen“ bezeichnet (Shulman 1986), zu vermitteln und herzustellen (König et al. 2018). So kann dieses Wissen in drei Topologien unterschieden werden, zum einen in das Fachwissen (CK: Content Knowledge), in das fachdidaktische Wissen (PCK: Pedagogical Content Knowledge) und allgemeinem pädagogischem Wissen (GPK: General Pedagogical Knowledge) (Merk et al. 2016). „Während sich fachliches und fachdidaktisches Wissen eindeutig auf das zu unterrichtende Fach beziehen, ist pädagogisches Wissen losgelöst vom jeweiligen Fach“ (König & Klemenz 2015). Welche Faktoren letztendlich zum Gelingen des beruflichen Lehreralltags führen, beforschen u.a. Baumert und Kunter (2006) mit einem Kompetenzansatz. Das Konzept der professionellen Kompetenz von Lehrkräften beschreibt dabei die verschiedenen erlernbaren berufsspezifischen kognitiven und motivational-affektiven Merkmale, die als Voraussetzung erfolgreichen Lehrerhandelns gelten (Voss et al. 2015). Vor dem Hintergrund individueller Unterschiede von (angehenden) Lehrkräften in ihrem fachlichen sowie überfachlichen Wissen thematisieren in diesem Symposium drei Beiträge das pädagogische Wissen in der Lehramtsausbildung.

Der erste Beitrag von Stefan Klemenz und Johannes König untersucht Effekte von Karriereaspirationen als Teil beruflicher Ziele auf den Erwerb von pädagogischen Wissen, besonders im Hinblick auf motivationale Merkmale von Lehramtsstudierenden.

Olga Kunina-Habenicht erforscht im zweiten Beitrag des Symposiums, auf Grundlage des bereits veröffentlichten BilWiss-2.0-Wissenstests, in welchem Maße eine empirische Abgrenzung von fachunspezifischem bildungswissenschaftlichem Wissen und fluider sowie kristalliner Intelligenz möglich ist.

Im darauffolgenden dritten Beitrag untersuchen Ulrike Schwabe und Edith Braun den Zusammenhang von Unterrichtswissen (PUW von König) und kommunikativen Handlungskompetenzen, erfasst mit in vivo Rollenspielen, die Gesprächssituationen simulieren.

Abschließend werden die Beiträge im Spannungsfeld von pädagogischem und fachdidaktischem Wissen, als Teil des professionellen Wissens, durch Claudia von Aufschnaiter aus der Perspektive einer Fachdidaktik diskutiert.

 

Beiträge des Symposiums

 

Karriereaspirationen und Kompetenzniveaus im pädagogischen Wissen von (angehenden) Lehrkräften: Zur Wirkung motivationaler Merkmale auf den Erwerb professionellen Wissens

Stefan Klemenz, Johannes König
Universität zu Köln, Humanwissenschaftliche Fakultät, Department Erziehungs- und Sozialwissenschaften, Empirische Schulforschung, quantitative Methoden

Theoretischer Hintergrund

Inwiefern der Erwerb pädagogischen Wissens von (angehenden) Lehrer*innen, das als grundlegend für einen effektiven Unterricht bewertet wird (Bromme, 1992; Berliner, 2001; Baumert & Kunter, 2006), von motivationalen Merkmalen beeinflusst wird, stellt eine äußerst relevante, aber bislang noch wenig beantwortete Fragestellung in der aktuellen Lehrer*innenforschung dar (vgl. Zlatkin-Troitschanskaia & Preuße, 2011; Kunter, 2014). Die vorliegenden Analysen begegnen diesem Desiderat, indem die Effekte von Karriereaspirationen als Teil beruflicher Ziele auf den Erwerb pädagogischen Wissens untersucht werden. Neben der Verwendung eines kontinuierlichen Testwerts für das pädagogische Wissen werden zusätzlich Analysen auf Basis eines Kompetenzniveaumodells (Klemenz & König, 2019) durchgeführt, um eine kriteriale Beschreibung von Kompetenz zu ermöglichen und differenzielle Effekte der Karriereaspirationen auf die Erreichung verschiedener Niveaus zu testen.

Fragestellung

1. Erweisen sich Karriereaspirationen als bedeutsame Prädiktoren für den Erwerb von pädagogischem Wissen?

2. Erweisen sich Karriereaspirationen insbesondere effektstark für die Erreichung des höchsten Kompetenzniveaus?

Methode

Verwendet wird eine Stichprobe von 321 angehenden sowie bereits berufstätigen Lehrkräften aus Deutschland und Österreich, deren pädagogisches Wissen über drei Messzeitpunkte im Turnus von zwei Jahren längsschnittlich mit dem anonymisierte Studie Testinstrument erfasst wurde. Die Erfassung der Karriereaspirationen erfolgte anhand des PECDA Instruments (Watt & Richardson, 2008). Das pädagogische Wissen wurde mit dem TEDS-M Test erhoben (König & Blömeke, 2009).

Ergebnisse

Während sich für Karriereaspirationen mit Bezug zu professioneller Entwicklung und Weiterbildung positive Effekte zeigen, weisen Führungsaspirationen und der anvisierte Verbleib im Lehrer*innenberuf keinen Wirkungszusammenhang auf. Die Analyse auf Basis des Kompetenzniveaumodells verdeutlicht, dass sich die Effekte insbesondere auf dem höchsten Niveau verorten lassen, das komplexe kognitive Bearbeitungsprozesse erfordert.

 

Zusammenhang zwischen bildungswissenschaftlichem Wissen und fluider und kristalliner Intelligenz bei Lehramtsstudierenden

Olga Kunina-Habenicht
Pädagogische Hochschule Karlsruhe

THEORETISCHER HINTERGRUND: Professionsspezifisches Wissen stellt einen wichtigen Aspekt der professionellen Lehrerkompetenz dar (Baumert & Kunter, 2006). In Anlehnung an Shulman (1986) hat sich die Unterscheidung zwischen Fachwissen, fachdidaktischem Wissen und pädagogischem Wissen durchgesetzt. In diesem Beitrag liegt der Fokus auf fachunspezifischem bildungswissenschaftlichem Wissen. In Anlehnung an Shulman (1986) umfasst bildungswissenschaftliches Wissen neben schulnahen Inhalten auch unterrichtsfernere theoretische fachunspezifische Kenntnisse bspw. über Bildungstheorie, Schulorganisation oder Wissen über den Lehrerberuf (Kunina-Habenicht et al., in press; Linninger et al., 2015). Während die empirische Struktur des bildungswissenschaftlichen Wissens gut untersucht ist (Kunina-Habenicht et al., in press; Voss, Kunina-Habenicht, Hoehne, & Kunter, 2015), gibt es vergleichsweise wenig Forschung dazu, inwieweit das bildungswissenschaftliche Wissen sich von Allgemeinwissen abgrenzen lässt, was jedoch einen wichtigen Hinweis für die Professionsspezifität dieses Wissens darstellt.

Cattell (1971) führte die Unterscheidung zwischen fluider und kristalliner Intelligenz ein. Fluide Intelligenz stellt einen durch genetische Anlagen bestimmten und von Umwelteinflüssen weitgehend unabhängigen Aspekt der kognitiven Leistungsfähigkeit dar und umfasst die Anpassungsfähigkeit an neue Probleme und Situationen, ohne dass ein Rückgriff auf frühere Erfahrungen erforderlich ist. Unter kristalliner Intelligenz wird hingegen eine umweltbedingte Komponente der Intelligenz verstanden, die durch die individuellen Lernmöglichkeiten sowie die familiäre und schulische Umgebung maßgeblich beeinflusst wird. Dieses Intelligenzmodell wurde aufgegriffen und weiterentwickelt durch Horn (1985) und Carroll (1993). Voss, Kunter und Baumert (2011) berichten einen signifikanten Zusammenhang zwischen pädagogisch-psychologischem Wissen und fluider Intelligenz (rlatent = .58).

FRAGESTELLUNG: In diesem Beitrag wird auf der Grundlage des bereits publizierten BilWiss-2.0-Wissenstests (Kunina-Habenicht et al., in press) untersucht, inwieweit das bildungswissenschaftliche Wissen von fluider und kristalliner Intelligenz empirisch abgegrenzt werden kann. Erwartet wurden mittlere Zusammenhänge mit beiden Intelligenzaspekten.

METHODEN: Die Kurzform des BilWiss-2.0-Tests beinhaltet 65 Items aus sechs Inhaltsbereichen Unterrichtsgestaltung, Lernen und Entwicklung, Diagnostik und Evaluation, Bildungstheorie, Schule als Bildungsinstitution und Lehrerberuf als Profession. Der BilWiss-Test wurde als Online-Test an vier Universitäten in Essen, Frankfurt, München und Tübingen eingesetzt. Zusätzlich zum Test wurde zur Erfassung der kristallinen und fluiden Intelligent die Kurzfassung des BEFKI Tests (Wilhelm, Schroeders, & Schipolowski, 2014) eingesetzt, der 16 Items zur Erfassung der fluiden und 12 Items der kristallinen Intelligenz beinhaltet.

Es liegen insgesamt Daten von 400 Personen vor. An der Studie nahmen 298 Frauen (74.5 %) und 101 Männer teil. Das durchschnittliche Alter betrug 22.56 Jahre (SD=2.79; Range:19–35). Das durchschnittliche Fachsemester betrug 4.88 (SD=2.32; Range:2–14).

Manifeste Korrelations- und Reliabilitätsanalysen wurden in SPSS durchgeführt, während die latente Modellierung in Strukturgleichungsmodellen in Mplus (Muthén & Muthén, 1998–2017) erfolgte. Für manifeste Analysen wurde als Indikator für die Wissensleistung ein Summenwert über alle Items im Kurztest gebildet. Im Messmodell für bildungswissenschaftliches Wissen wurden die Summenscores in den einzelnen Inhaltsbereichen als Indikatoren verwendet. In den Messmodellen für fluide und kristalline Intelligenz wurden Einzelitems als Indikatoren herangezogen.

ERGEBNISSE: Die interne Konsistenz Reliabilität des Wissenstests ist hoch (α=.82), während die internen Konsistenzen für den BEFKI-Kurztest moderat bis zufriedenstellend sind (α=.74 für fluide und α=.54 für kristalline Intelligenz). Manifeste Analysen zeigen moderate Zusammenhänge zwischen dem Gesamtscore im BilWiss-Kurztest und fluider (r=0.42, p < .001) und kristalliner Intelligenz (r=0.33, p<.001). Die Messmodelle für den BilWiss-Test (Chi-Quadrat=9.96; df=9; p=.35; RMSEA=.017; CFI=.999) und den BEFKI-Test (Chi-Quadrat=377.40; df=349; p=.14; RMSEA=.014; CFI=.975) weisen eine sehr gute Modellpassung auf. Das Strukturgleichungsmodell weist ebenfalls einen sehr guten Modellfit auf (Chi-Quadrat=558.47; df=524; p=.14; RMSEA=.013; CFI=.982) und zeigt mittlere latente Zusammenhänge mit fluider (r=0.53, p<.001) und kristalliner Intelligenz (r=0.52, p<.001). Da die Korrelationen deutlich niedriger als eins sind, sprechen die Ergebnisse dafür, dass es sich beim bildungswissenschaftlichen Wissen erwartungskonform um professionsspezifisches Wissen von angehenden Lehrkräften handelt, welches sich theoretisch und empirisch deutlich von Allgemeinwissen und allgemeinen kognitiven Fähigkeiten abgrenzen lässt. Diese Ergebnisse werden diskutiert in Bezug auf Implikationen für die Lehrerbildung.

 

Kompetenzvermittlung im Lehramtsstudium – Empirische Befunde zum Verhältnis kommunikativer Handlungsfähigkeiten und Pädagogischen Unterrichtswissens

Ulrike Schwabe1, Edith Braun2
1Deutsches Zentrum für Hochschul- und Wissenschaftsforschung GmbH, 2Justus-Liebig-Universität Gießen/ Professur für Hochschuldidaktik mit dem Schwerpunkt Lehrerbildung Institut für Erziehungswissenschaft

Als Facetten professioneller Lehrkompetenz werden unter anderem zwei Kompetenzbereiche genannt: sowohl kommunikative Handlungsfähigkeiten als auch Pädagogisches Unterrichtswissen (Baumert & Kunter, 2006; König & Klemenz, 2015). Obwohl beide als Lernergebnisse hochschulischer Bildung verstanden werden (KMK 2004, KMK 2017), liegen bislang jedoch kaum empirische Erkenntnisse zum Verhältnis von generischen Handlungsfähigkeiten in authentischen Situationen und erworbenem Fachwissen vor. Daher zielt dieser Beitrag darauf ab, eben diesen Zusammenhang empirisch zu überprüfen.

Im Rahmen der “KomPrü“-Nachwuchsforschungsgruppe wurde ein performanzbasierter Test zur Erfassung kommunikativer Handlungsfähigkeiten bei Lehramtsstudierenden, basierend auf in vivo-Rollenspielen, entwickelt (Braun et al. 2018a). Dieses Instrument unterscheidet theoretisch und empirisch zwischen zwei Dimensionen von Kommunikation: strategischer und verständigungsorientierter (Braun et al. 2018b). An dieser performanzbasierten Testung haben Studierende auf Lehramt unterschiedlicher Bildungsstufen an 5 verschiedenen Universitäten und Pädagogischen Hochschulen in Deutschland teilgenommen, und rund 110 Studierende haben im Anschluss an die Rollenspiele zusätzlich einen schriftlichen Leistungstest zum „Pädagogischen Unterrichtswissen (PUW als Kurzinstrument, König & Blömeke 2010) bearbeitet. Zudem wurden Informationen zu bisherigen Lerngelegenheiten sowie sozio-demografischen Merkmalen in einem Fragebogen erfasst.

Im Sinne eines nomologischen Netzwerks (Kane, 2013) postulieren wir für die beiden erlernbaren Kompetenzbereiche „kommunikative Fähigkeiten“ (mit den beiden Dimensionen strategische und verständigungsorientierte Kommunikation) sowie „Pädagogischem Unterrichtswissen“ (eindimensional in der Kurzversion des PUW) einen mittleren, positiven Zusammenhang . Zudem gehen wir davon aus, dass insbesondere Studierende, die über Erfahrungen in unterschiedlichen Lerngelegenheiten verfügen sowohl mit nachweisbar höheren Handlungsfähigkeiten als auch größerem Fachwissen ausgestattet sind. Empirisch zeigt sich jedoch zunächst, dass entgegensetzt unserer ersten Hypothese keine Korrelation zwischen den beiden Kompetenzbereichen besteht (r=.03 für strategische Kommunikation und PUW respektive r=-.03 für verständigungsorientierte Kommunikation und PUW). Wir deuten dies als Hinweis darauf, dass möglicherweise die Lehramtsausbildung zu wenig auf tatsächliche Anforderungen des Berufsalltags von Lehrkräften ausgerichtet ist (Terhart 2005, Weyland & Wittmann 2011). Diese Interpretation der Befunde wird dadurch gestützt, dass ein ebensolcher Zusammenhang zwischen Handlungsfähigkeiten und Fachwissen für Studierende der Wirtschaftswissenschaften die vermuteten mittleren positiven Korrelationen zeigt (Braun et al. 2018b). Mit Blick auf Gelegenheitsstrukturen des Kompetenzerwerbs inner- und außerhalb der Hochschule zeigen sich dagegen erwartungskonform mittlere positive Zusammenhänge für beide Kompetenzbereiche mit der Semesterzahl und dem angestrebten Abschluss sowie unterschiedlichen Merkmalen des Praxisbezugs und der Studienorganisation. Die vorliegenden empirischen Ergebnisse werden abschließend als Validierungshinweise kritisch diskutiert.

 
11:15 - 13:00F11‒S12: Digitalisierung in der frühkindlichen Bildung – Zur Rolle der Überzeugungen pädagogischer Fachkräfte für die Implementation von digitalen Medien in der Praxis
S12 
 

Digitalisierung in der frühkindlichen Bildung – Zur Rolle der Überzeugungen pädagogischer Fachkräfte für die Implementation von digitalen Medien in der Praxis

Chair(s): Franziska Cohen (Otto-Friedrich-Universität Bamberg), Poldi Kuhl (Leuphana Universität Lüneburg)

DiskutantIn(nen): Eva Reichert-Garschhammer (Staatsinstitut für Frühpädagogik Bayern)

Digitale Medien gehören mittlerweile zur Lebensrealität von fast allen Familien und Kindern in Deutschland. Neben dem häuslichen Umfeld spielen bis zum Schuleintritt auch Kindertageseinrichtungen (Kitas) in Bezug auf die Bildung, Erziehung und Betreuung eine zentrale Rolle im Leben von nahezu allen Kindern. Kitas sind dementsprechend zum einen ein weiteres Umfeld, das Erfahrungen und Lerngelegenheiten im Umgang mit „Information and Communication Technology“ (ICT) und ICT-unterstützten Lernprozessen bieten kann. Zum anderen sind Kitas auch ein Arbeitsumfeld, in dem zunehmend digitale Technologien als Werkzeuge für die pädagogische Arbeit relevant werden. Dass digitale Medien bereits selbstverständlich zum häuslichen Lebensumfeld und damit zur Lebensrealität der Kinder und Fachkräfte gehören, bedeutet jedoch nicht, dass diese in den vorschulischen Bildungseinrichtungen bereits einen entsprechenden Platz gefunden hätten (Feierabend, Plankenhorn & Rathgeb, 2015). Professionelle Kompetenzen von pädagogischen Fachkräften gelten als wichtige Voraussetzungen für die Bereitstellung qualitativ hochwertiger Lerngelegenheiten in frühkindlichen Bildungseinrichtungen (Fröhlich-Gildhoff et al. 2011) u.a. auch im Hinblick auf den Einsatz von ICT im pädagogischen Alltag (Caena, Redecker, 2019). Studien weisen darauf hin, dass die Nutzung von digitalen Technologien in pädagogischen Kontexten von zwei Aspekten abhängt: der Ausstattung und den professionellen Kompetenzen pädagogischer Fachkräfte (Knezek et al. 2013),die auch ihre Einstellungen gegenüber der Nutzung digitaler Medien in der pädagogischen Praxis umfassen (Christensen & Knezek, 2008; Teo, 2010). Auf letztere soll im Rahmen des Symposiums besonders eingegangen werden.

Die Einstellungen und Überzeugungen sind, neben den Wissenskomponenten und motivationalen Aspekten, Teil der professionellen Handlungskompetenz von pädagogischen Fachkräften (Fröhlich-Gildhoff, Nentwig-Gesemann & Pietsch, 2014, Kunter et al., 2011). Brüggemann (2013) zeigte, dass Kitafachkräfte dem Einsatz digitaler Medien in der Kita insgesamt eher kritisch gegenüber eingestellt sind. Digitale Technologien werden vor allem dann in Kitas positiv bewertet und genutzt, wenn sie als Werkzeuge zweckrational eingesetzt werden, z.B. um Vorbereitungen zu erleichtern. Auch wenn damit erste Ansatzpunkte zur Implementation von digitalen Medien in Kitas vorliegen; mangelt es derzeit noch an umfassenden und belastbaren empirischen Befunden zu den Vorerfahrungen und Überzeugungen der pädagogischen Fachkräfte zur Nutzung von ICT im pädagogischen Alltag in Kitas .

An diesem Forschungsdesiderat setzt das vorliegende Symposium an und trägt quantitative und qualitative Beiträge zur Professionalisierung der Fachkräfte und insbesondere deren Haltungen, Einstellungen und Erfahrungen mit der Implementation von ICT in Kitas zusammen. Mit diesem Fokus fügt sich das Symposium sehr gut in den thematischen Kontext der GEBF-Tagung mit dem Schwerpunkt im Bereich Digitalisierung ein.

Der erste Beitrag untersucht unter Anwendung einer qualitativen Inhaltsanalyse von Kitafachzeitschriften, welche geteilten Überzeugungen die Fachdisziplin „Frühpädagogische Fachkräfte“ zur Implementierung von digitalen Medien in Kitas aufweist. Hierbei werden sowohl negative als auch positive Haltungen gegenüber digitalen Medien herausgearbeitet und in ihrer Begründung diskutiert.

Der zweite Beitrag bezieht sich auf die individuellen Einstellungen frühpädagogischer Fachkräfte und Eltern zur Nutzung von digitalen Medien in Kindertageseinrichtungen. In dieser quantitativen Studie werden das Nutzungsverhalten und die Einstellungen von Eltern und Fachkräften kontrastiert und im Hinblick auf Implikationen für die pädagogische Praxis diskutiert.

Der dritte Beitrag geht der Frage nach, wie die Nutzung von Dokumentationsapps die Arbeit der Erzieher/-innen beeinflusst. In leitfadengestützten Interviews wurden digitale Technologien als Werkzeug für den Beobachtungs- und Dokumentationsauftrag von Kitas reflektiert. Mit Hilfe der qualitativen Inhaltsanalyse werden die Beweggründe der Nutzung bzw. Nicht-Nutzung von Dokumentationsapps eruiert. Zudem werden die von Kita-Leitungen sowie Erzieher/-innen wahrgenommenen Chancen und Risiken digitaler Dokumentationsapps für die Verbesserung von Arbeitsabläufen diskutiert.

Die Beiträge werden in einer abschließenden Diskussion aufeinander bezogen und im Hinblick auf ihren Beitrag für die (Weiter)Entwicklung digitalisierungsbezogener professioneller Handlungskompetenzen von pädagogischen Fachkräften in der frühkindlichen Bildung eingeordnet.

 

Beiträge des Symposiums

 

Geteilte Überzeugungen frühpädagogischer Fachkräfte zu digitalen Medien in Kindertagesstätten - eine Dokumentenanalyse

Stefanie Pietz, Franziska Cohen, Yvonne Anders
Otto-Friedrich-Universität Bamberg

Theoretischer Hintergrund

In Folge des digitalen Wandels ist sowohl auf gesellschaftlicher als auch auf wissenschaftlicher Ebene eine kontroverse Debatte über die Implementierung von digitalen Medien im frühpädagogischen Bereich, insbesondere zum Einsatz in Kindertagesstätten (Kita) entstanden. Zum einen werden negative Auswirkungen auf die kindliche Entwicklung sowie eine Verdrängung analoger Spielformen befürchtet (Bolstad, 2004). Zum anderen wachsen Kinder in einer digital geprägten Welt auf und nutzen ICT ganz selbstverständlich in ihrem Alltag (Aufenanger, 2014). Die Kita bildet -neben der Institution Familie- in der Entwicklung des Kindes einen unmittelbaren Lebensbereich, der Einfluss auf diese nimmt (Bronfenbrenner, 1981). Die Qualität der pädagogischen Arbeit in Kitas, insbesondere die Struktur-, Orientierungs- und Prozessqualität, ist ein entscheidendes Kriterium für positive Zusammenhänge zwischen der Kindertagesbetreuung und kindlicher Entwicklung (Kluczniok & Roßbach, 2014). Einstellungen und Überzeugungen von frühpädagogischen Fachkräften werden der Orientierungsqualität zugeordnet und sind eine elementare Voraussetzung für professionelles Handeln in frühpädagogischen Alltagssituationen. Sie prägen im Wesentlichen die Handlungsplanung und -bereitschaft bzgl. Bildungsprozessen im allgemeinen und den Einsatz digitaler Medien im Besonderen und bilden damit eine zentrale Voraussetzung für die Bewältigung der beruflichen Anforderungen (Fröhlich-Gildhoff et al. 2011) und qualitativ hochwertige pädagogischen Prozesse (Anders, Roßbach 2015). Es ist davon auszugehen, dass sich Überzeugungen je nach Bildungsbereich unterscheiden können (Steffensky, Anders, Barenthien et al. 2017). Zum Aufbau von Überzeugungen greifen Fachkräfte auf unterschiedliche Strategien zurück (z.B. Praxiserfahrungen, Kollegen). Praxisfachzeitschriften stellen eine weitere Quelle für die Ausbildung von Überzeugungen dar. Sie repräsentieren in diesem Sinne das kollektive Selbstverständnis der Profession. Bisher gibt es jedoch nur wenig Forschung zu den geteilten Überzeugungen der Fachkräfte im Umgang mit digitalen Medien.

Fragestellung

Diese theoretischen Konzeptionen bilden die Ausgangslage für folgende Fragestellung: Welche geteilten Überzeugungen hat die Fachdisziplin zur Implementierung von digitalen Medien in Kitas? Hierbei werden sowohl negativ geprägte Haltungen als auch positive Haltungen gegenüber digitalen Medien herausgearbeitet. Mithilfe einer Dokumentenanalyse soll ein vertiefender Einblick in den Diskurs der geteilten Überzeugungen gewonnen werden.

Methode

In den acht auflagenstärksten deutschsprachigen praxisorientierten Fachzeitschriften wurden zwischen 2013 und 2019 234 Texte identifiziert, die den Einsatz digitaler Medien im Kontext Kita thematisieren. Die Artikel umfassen verschiedene Arten von Texten, die von medienpädagogischen Praxisberichte über Hinweise zum Thema Datenschutz im Kindergarten bis hin zu Positionsartikeln und argumentativen Artikeln bezüglich des Einsatzes von digitale Medien in Kitas reichen. Die Auswertung erfolgt nach einem Mixed-Method-Ansatz. Mithilfe der Inhaltsanalyse (Mayring, 2015) wurde das gesamte Textmaterial in MAXQDA mittels deduktiver und induktiver Kodierung anschließend sowohl qualitativ als auch quantitativ analysiert. Die quantitative Analyse gibt unter anderem Einblick in die zeitliche Entwicklung der Debatte. Die qualitative Analyse sieht die geteilten Überzeugungen der Fachcommunity im Fokus. Hierbei werden unter anderem wertende Aussagen zu Digitalisierung in der Kindheit sowie Kita, die Rolle der Fachkraft in Interaktionen mit Kindern, Emotionen und Motivationen von Fachkräften sowie an sie gerichtete Erwartungen und Aussagen zum Stellenwert digitaler Medien untersucht. Um eine hohe Auswertungsqualität sicherzustellen erfolgte der Kodierprozess durch mehrere Kodierer*innen. Es kann eine Intercoderreliabilität von Kappa (BP) =.91 berichtet werden, die als ausgezeichnet einzuschätzen ist (Bortz & Döring, 2006).

Ergebnisse

Mit Blick auf die geteilten Überzeugungen wird deutlich, dass sich negativ konnotierte Aussagen stark auf den Verdrängungsaspekt analoger Erlebnisse und deren negative Folgen auf die kindliche Entwicklung, fokussieren. Darüber hinaus wird die Kindertagesstätte als Schonraum verstanden, in dem Kinder vor digitalen Medien und deren Einflüsse bewahrt werden sollen. Positive Haltungen sehen im Einsatz digitaler Medien eine Erweiterung bzw. Unterstützung der kindlichen Bildungs-und Lernprozesse. Dabei wird von Fachkräften erwartet, dass sie in der Lage sind digitale Medien situations- und altersangemessen einzusetzen und eine stets begleitende und regulierende Rolle einzunehmen. Die erzielten Ergebnisse werden im Hinblick auf eine gelingende Implementierung im pädagogischen Alltag und professionelle Entwicklung von Kompetenzen frühpädagogischer Fachkräfte diskutiert.

 

Nutzung digitaler Medien in Familien und Kinderkrippen

Karoline Rettenbacher1, Lars Eichen1, Sigrid Wimmer1, Helmut Karl Lackner2, Manuela Paechter1, Catherine Walter-Laager1
1Karl-Franzens-Universität Graz, 2Medizinische Universität Graz

Theoretischer Hintergrund

Der alltägliche Gebrauch digitaler Medien ist in allen gesellschaftlichen Bereichen stark verbreitet. Kinder kommen schon sehr früh mit digitalen Medien in Berührung (Marsh et al., 2015; Ofcom, 2014; Livingstone, 2014). Es kann sowohl für den deutschsprachigen als auch den anglo-amerikanischen Raum zusammengefasst werden, dass Bildschirmmedien, insbesondere Fernsehgeräte, bereits in den ersten Lebensjahren intensiv genutzt werden (Feierabend et al., 2015; Kabali et al., 2015). Die Auswirkungen der Nutzung digitaler Medien auf die Entwicklung und Gesundheit von Kleinkindern ist jedoch bisher kaum erforscht.

Der Umgang mit digitalen Medien stellt Eltern und elementarpädagogische Fachpersonen vor spezifische Aufgaben. Dies gilt auch, weil die elterliche Nutzung von digitalen Medien das Medienverhalten junger Kinder beeinflusst (Plowman et al., 2012).

Die Fünf-Länder-Studie von Palaiologou (2016) zeigt, dass elementarpädagogische Fachpersonen (N = 920) sich zwar insgesamt kompetent im Umgang mit digitalen Medien fühlen, jedoch finden 65,4 % nicht ausreichend vorbereitet zu sein, um digitale Medien in die tägliche Praxis zu integrieren. Nur 32 % der elementarpädagogischen Fachpersonen (N = 203) fühlen sich sicher genug, um digitale Medien mit Kindern unter drei Jahren zu nutzen. Die Gründe dafür sind unter anderem die persönlichen Einstellungen der elementarpädagogischen Fachpersonen, dass Kleinkinder keine digitalen Medien verwenden sollten (51 %) und die Sorge den Kindern damit zu schaden (39 %) (Hatzigianni & Kalaitzidis, 2018). Weitere Ergebnisse legen nahe, dass das Alter der Kinder und der Zugang der Kinder zu digitalen Medien zu Hause die Einstellungen der elementarpädagogischen Fachpersonen zur Nutzung digitaler Medien im pädagogischen Alltag beeinflussen (Mertala, 2019).

Entsprechend kann unter anderem vermutet werden, dass die Mediennutzung in der Familie mit jener in den elementarpädagogischen Einrichtungen zusammenhängt.

Fragestellung

Im Gesamtprojekt „Kinder in der digitalen Welt“ wird untersucht, wie sich die Nutzung digitaler Medien auf die Entwicklung und Gesundheit von Kleinkindern auswirkt. Zudem wird die Mediennutzung und -erziehung in Familien und Kinderkrippen untersucht.

Im Symposiumsbeitrag werden explorativ Ergebnisse zu folgenden Forschungsfragen präsentiert:

1. Wie häufig und aus welchen Gründen werden digitale Medien durch die elementarpädagogischen Fachpersonen genutzt?

2. Wie bewerten Eltern im Vergleich zu elementarpädagogischen Fachpersonen die Nutzung digitaler Medien durch Kinder?

Methode

Zur Beantwortung der Forschungsfragen wurden mittels Fragebogen von N = 126 teilnehmenden Personen Daten erfasst. Diese teilen sich in zwei verbundene Stichproben österreichischer Familien (N = 69; Alter: M = 35 Jahre; SD = 5,9) und elementarpädagogischen Fachpersonen (N = 57; Alter: M = 31 Jahre, SD = 10,1; Berufserfahrung: M = 10,5, SD = 9,9) auf.

Für Fragestellung 1 gaben die Fachpersonen für eine Liste von digitalen Medien an, wie häufig sie diese mit den Kindern nutzen (Skala sechsfach abgestuft von nie bis täglich). Weitere standardisierte Fragen erfassten die Verankerung und den Einsatz digitaler Medien in der Kinderkrippe.

Für Fragestellung 2 wurden dieselben Medien von Eltern und Fachpersonen in Bezug auf die Nutzung durch ihre Kinder bewertet (sechsstufige Skala von 1 = sehr negativ bis 6 = sehr positiv) (Six & Gimmler, 2007).

Ergebnisse

Fragestellung 1: Rund die Hälfte der befragten Fachpersonen (49,1 %) gab an, das Radio täglich mit den Kindern zu nutzen, um mit Kindern Musik anzuhören. 3,5 % der Fachpersonen gaben an, dass die Medienerziehung in der Konzeption der Einrichtung verankert ist. Etwas über die Hälfte der Fachpersonen (50,9 %) lehnen den Einsatz von digitalen Medien in der Kinderkrippe vollständig ab. Deckungsgleich mit bisherigen Ergebnissen (Palaiologou, 2016) beschreiben Fachpersonen (57,2 %), dass es ihnen an digitalen Medien fehlt.

Fragestellung 2: Die elementarpädagogischen Fachpersonen (M = 2.32, SD = .68) bewerten den Einfluss von digitalen Medien auf das Kind signifikant negativer als die Eltern (M = 2.81, SD = .68) (t122 = 3.99, p < .001). Die Effektstärke liegt bei r = .34 im mittleren Bereich.

 

Chancen und Risiken der Nutzung von Dokumentationsapps in Kindertagesstätten

Herrad Schönborn, Poldi Kuhl
Leuphana Universität Lüneburg

Theoretischer Hintergrund

Die Dokumentation der kindlichen Entwicklung und des kindlichen Lernens, gilt als ein grundlegender Bestandteil professionellen pädagogischen Handelns von Erzieher/-innen und soll dazu beitragen, die Qualität der Arbeit in Kitas zu sichern (Knauf 2019). Die Dokumentation qualitativ hochwertig durchzuführen, stellt die Kitas vor große Herausforderungen. Sie bedeutet einen hohen Zeitaufwand, der für einen Großteil der pädagogischen Fachkräfte im Rahmen der regulären Arbeitszeit nur schwer zu bewältigen ist (Viernickel et al. 2013). Inzwischen werden für die Dokumentation auch Dokumentationsapps verwendet, was kontrovers diskutiert wird. Einerseits besteht die Annahme, dass die Nutzung dieser Apps Unterstützung bietet, da die Dokumentation besser in den Kitaalltag integriert und zeitsparender durchgeführt werden könne (Bostelmann et al. 2017; Lepold & Ullmann 2018). Andererseits werden die Verflachung der Dokumentation, die Verletzung ethischer Aspekte und Verstöße gegen Datenschutzrichtlinien befürchtet (Knauf 2019; Lepold & Ullmann 2018). Zu den primär theoretisch geführten Kontroversen liegen bislang nur wenige Forschungsergebnisse vor (Knauf 2015; Burghardt & Knauf 2015). So gibt es kaum Forschung dazu, in welchem Umfang Dokumentationsapps genutzt werden und welche Chancen und Risiken pädagogische Fachkräfte mit ihrer Nutzung verbinden. Eine Online-Befragung zu digitaler Dokumentation in Kitas weist darauf hin, dass Dokumentationsapps in der Mehrheit der Kitas wenig bekannt sind und nur selten genutzt werden (Schönborn & Kuhl, 2018). Die genauen Beweggründe der Nutzung bzw. Nicht-Nutzung sind jedoch bislang kaum erforscht. Hier setzt der vorliegende Beitrag an und geht folgenden Fragen nach:

Fragestellungen

1. Wie begründen Kita-Leitungen und Erzieher/-innen die derzeit genutzte Dokumentationsform?

2. Was sind, aus Sicht von Kita-Leitungen und Erzieher/-innen, wahrgenommene Chancen und Risiken der Nutzung von Dokumentationsapps?

Methode

Die Datengrundlage für die Untersuchung bilden leitfadengestützte Interviews, die mit einer Auswahl der Kitas geführt wurden, die an der o.g. Online-Befragung teilgenommen haben (Schönborn & Kuhl, 2018). Im Sinne einer kontrastierenden Fallauswahl wurden gezielt Kitas kontaktiert, die ausschließlich digital mit einer App oder in Mischform (analog/digital) dokumentieren. Die Fragen des Leitfadens für die Kita-Leitungen (n=7) sowie je zwei Erzieher/-innen der Kitas (n=14) greifen kita-spezifisch Aspekte aus der Online-Befragung auf und gehen vertiefend auf diese ein. Die Interviews wurden von Dezember 2018 bis März 2019 durchgeführt und mithilfe der qualitativen Inhaltsanalyse nach Kuckartz (2016) in MAXQDA ausgewertet.

Ergebnisse

Im Hinblick auf die erste Forschungsfrage nach den Begründungen der derzeit verwendeten Dokumentationsform zeigte sich, dass Kita-Leitungen nicht alleine entscheiden können, ob in ihrer Kita Dokumentationsapps verwendet werden. Der Träger spielt bei dieser Entscheidung eine wichtige Rolle. Solange dieser die App nicht zulässt bzw. finanziert, scheitert die Implementierung, auch wenn viele der Befragten an sich motiviert sind, mit Dokumentationsapps zu arbeiten und dies als zeitgemäß betrachten. Andere Befragte sehen keinen Mehrwert in der Verwendung von Dokumentationsapps oder äußerten die Sorge, mit diesen nicht umgehen zu können.

In Bezug auf die zweite Fragestellung nach den wahrgenommenen Chancen und Risiken der Nutzung von Dokumentationsapps unterschieden sich Kitas, die mit oder ohne App dokumentierten. Beide nannten sowohl Vor- als auch Nachteile, allerdings überwogen bei den Kitas, die bereits mit Apps dokumentieren, die Vorteile. Insbesondere betont wurde die Beschleunigung bestimmter Arbeitsschritte, besonders kritisiert hingegen die Abhängigkeit von der Technik.

Im Vortrag sollen die Ergebnisse vertiefend dargestellt und ausblickend diskutiert werden, wie weitere Forschung einen Beitrag dazu leisten kann, Prozesse der Etablierung digitaler Dokumentationsapps zu evaluieren und evidenzbasiert zu ihrem Gelingen beizutragen.

 
11:15 - 13:00F11‒S15: Kooperative Lehr-Lernprozesse im (Hoch-)Schulkontext
S15 
 

Kooperative Lehr-Lernprozesse im (Hoch-)Schulkontext

Chair(s): Christin Siegfried (Goethe-Universität Frankfurt, Deutschland), Henrik Bellhäuser (Johannes Gutenberg Universität Mainz)

DiskutantIn(nen): Nikol Rummel (Ruhr-Uni­ver­si­tät Bo­chum)

Unterrichtsprozesse lassen sich als Interaktionsdynamiken modellieren. Damit liegt der Fokus nicht mehr nur auf pädagogischem Handeln als elementare Kategorie, sondern vielmehr sind es Lehr-Lern-Interaktionen, die als Elementareinheiten pädagogischer Forschung bedeutsam werden. Die Relevanz solcher Forschung zeigt nicht zuletzt anhand der positiven Effekte von kooperativem Lernen auf subjektive und objektive Outcome-Maße, die eine Vielzahl von empirischen Studien belegen konnten (Ginsburg-Block et al., 2006; Johnson, Johnson, & Smith, 2014).

Das Symposium widmet sich den Gelingensbedingungen und der prozessbezogenen Erhebung und Analyse von Lehr-Lern-Interaktionen in Gruppenarbeiten. Hierfür ist entweder die videographische Aufzeichnung der Lehr-Lernprozesse und/oder ihre Begleitung durch Tests und Fragebögen zentral.

Vor dem gemeinsamen Hintergrund von Gruppenarbeiten werden in verschiedenen Sachkontexten drei Perspektiven der Gruppenarbeit in den Blick genommen. Es wird untersucht, inwiefern und welche Gruppenkomposition und Gruppenformation auf Leistungsmaße und Erlebensgrößen Einfluss nehmen, welche Klassifikationen individueller Beiträge und Gruppendiskussionsstrukturen in Gruppenarbeiten identifiziert werden können und unter welchen Bedingungen signifikante Einflüsse auf Lernoutcomes resultieren.

Der erste Beitrag beschäftigt sich mit dem Einfluss von Gruppenkomposition auf die Lernleistung und das emotionale Erleben in der Gruppenarbeit in computer- bzw. online-gestützte Lernszenarien. Auf Basis eines Literaturreview werden verschiedene Studienergebnisse zu entsprechenden Effekten zusammengetragen und systematisiert. Ein Ergebnis dieses Reviews ist die Feststellung, dass es an experimentellen Feldstudien mangelt, die kausale Effekte der Gruppenformation auf Zufriedenheit und Leistung untersuchen. Dieses Forschungsdesiderat wird durch die Vorstellung eigener empirischer Feldexperimente eingelöst.

Der zweite Beitrag richten seinen Blick auf die Untersuchung homogener und heterogener Gruppenkompositionen, einerseits in einem online-basierten Mathematikvorkurs und andererseits in traditionelleren Hochschulseminaren. Im Rahmen zweier Feldexperimente steht die systematische Variation der Extraversion und Vorwissen der einzelnen Gruppenmitglieder im besonderen Fokus. Damit wird die Grundlage geschaffen, Effekte auf Zufriedenheit und Gruppenleistung analysieren zu können.

Der dritte Beitrag betrachtet Peer-Interaktionen von Grundschülern im Mathematikunterricht. Während in den ersten Unterrichtsstunden Rechenstrategien für Plus- und Minusaufgaben erlernt und diese gemeinsam nach dem Prinzip des reziproken Peer-Tutorings eingeübt wurden, waren die Lernenden im Anschluss angehalten diese Aufgaben in Peers selbstständig zu lösen. Es wird untersucht inwiefern die Elaboriertheit der individuellen Äußerungen, die Struktur der Interaktion und die Charakteristika der Lernenden einen bedeutsamen Einfluss auf das Lernergebnis haben.

Der vierte Beitrag untersucht Gruppendiskussionen im Rahmen problemorientierten Wirtschaftsunterrichts. Diesem Unterrichtssetting liegt die Annahme zugrunde die Mehrperspektivität und verschiedenen Kompetenzanforderungen der ökonomischen Kompetenz im Rahmen von Gruppendiskussionen zu begünstigt. In einem ersten Schritt werden deshalb die mit den individuellen Beiträgen assoziierten kognitiven Prozesse der einzelnen Gruppenmitglieder, die inhaltliche Vielfalt der individuellen Beiträge und die Struktur der Gruppendiskussionen untersucht. In einem zweiten Schritt werden die Ausprägungen dieser Größen und die individuellen Lernoutcomes der Schüler und Schülerinnen gegenübergestellt und die Wirkungsbeziehung untersucht.

Das verbindende Element der Beiträge ist die Suche nach Gelingensbedingungen kooperativen Lernens. Dabei werden jeweils empirische Feldstudie in realistischen Settings durchgeführt und sowohl subjektive (Fragebögen) als auch objektive (Leistungstest, Videographie) Maße für Lernerfolg herangezogen. Die Beiträge bedienen sich aber in interdisziplinärer Weise unterschiedlicher methodischer Herangehensweisen, die einen breiteren Blick auf den Forschungsgegenstand erlauben. So werden Zielgruppen von der Grundschule über die Sekundarstufe 2 bis hin zum Studium betrachtet, die Gruppengrößen variieren (von Dyaden bis hin zu sechs Personen), es finden sich deskriptive wie auch intervenierende Ansätze.

Die anschließende Diskussion beschäftigt sich mit den Gemeinsamkeiten und Unterschieden der präsentierten Arbeiten und gibt einen Ausblick auf zukünftige Forschungsdesiderata.

 

Beiträge des Symposiums

 

Gruppenformation und Gruppenkomposition als wichtige Prädiktoren von Lernerfolg und Zufriedenheit beim kooperativen Lernen in der Hochschullehre

Henrik Bellhäuser1, Johannes Konert2, René Röpke3, Adrienne Müller1
1Johannes Gutenberg Universität Mainz, 2Beuth Hochschule für Technik, 3RWTH Aachen University

Kooperatives Lernen ist eine effektive Lernstrategie und wird in der online-gestützten Hochschullehre vielfach eingesetzt. Vorteile zeigen sich sowohl in Leistungsmaßen (Johnson, Johnson, & Smith, 2014) als auch im emotional-motivationalen Bereich (Bernard et al., 2009). Dies gilt insbesondere für computer- bzw. online-gestützte Lernszenarien (computer-supported collaborative learning, CSCL). Allerdings zeigen empirische Studien immer wieder, dass produktive Interaktion zwischen Lernenden oft nicht spontan auftritt (z.B. Rummel & Spada, 2005), sodass Lehrende diverse didaktische Maßnahmen ergreifen sollten, um den Erfolg von Gruppenlernen sicherzustellen.

Wenig Beachtung findet dabei üblicherweise die Gruppenkomposition, also die Zusammensetzung der Lerngruppen, obwohl diese maßgeblich zum Erfolg von Lerngruppen beiträgt (Bell, 2007; Halfhill, Sundstrom, Lahner, Calderone, & Nielsen, 2005). Diverse Eigenschaften der Gruppenmitglieder werden in der Literatur als relevante Kriterien für die Gruppenkomposition diskutiert, darunter demografische Aspekte (z.B. Alter, Geschlecht oder Herkunft), Persönlichkeitseigenschaften (z.B. Extraversion oder Gewissenhaftigkeit), Einstellungen (z.B. Teamorientierung oder Motivation) und kognitive Voraussetzungen (z.B. Intelligenz oder Vorwissen). Je nach Kriterium wird entweder eine homogene oder heterogene Verteilung innerhalb von Lerngruppen als vorteilhaft angenommen.

Gruppenformation bezeichnet den Prozess der Zusammenstellung einer Lerngruppe, d.h. die Auswahl der Gruppenmitglieder. In der Hochschullehre kommen dabei typischerweise insbesondere zwei Verfahren zum Einsatz: Selbstselektion durch die Studierenden oder Zufallsselektion durch die Dozierenden. Beide Möglichkeiten haben wesentliche Nachteile und optimieren in keiner Weise die Zusammenstellung für das angestrebte Lernziel. Kriterien-basierte Gruppenformation, bei der versucht wird die Gruppenmitglieder so auszuwählen, dass diese möglichst optimal zueinander passen, findet hingegen in der Praxis kaum statt und auch empirische Studien dazu sind selten.

Der vorliegende Beitrag gibt einen Überblick über die Forschungsliteratur zu Effekten von Gruppenkomposition und Gruppenformation. Dabei zeigt sich, dass demografische Merkmale eher von untergeordneter Bedeutung sind (Bell, 2007). Bezüglich Persönlichkeitseigenschaften als Gruppenformationskriterien findet sich in der Literatur die Annahme, dass Extraversion innerhalb einer Gruppe heterogen verteilt sein sollte (Kramer, Bhave, & Johnson, 2014), da damit Führungsverhalten einhergeht, welches nicht bei allen Gruppenmitgliedern gleichermaßen hoch ausgeprägt sein sollte. Für Gewissenhaftigkeit hingegen wird postuliert, dass diese innerhalb einer Gruppe homogen verteilt sein sollte (Prewett, Walvoord, Stilson, Rossi, & Brannick, 2009), damit Einigkeit über die Zielsetzung erreicht werden kann und Konflikte vermieden werden. Kritisch anzumerken ist allerdings, dass diese Annahmen nur auf korrelativen Studien basieren. Experimentelle Studien, die Rückschlüsse auf kausale Zusammenhänge erlauben, fehlen bislang weitgehend.

Die Literaturrecherche zeigt, dass neuere Forschung zu Gruppenformation insbesondere im Forschungsgebiet Informatik betrieben wird (z.B. Bekele, 2006; Konert, 2014). Dies scheint insbesondere durch die zunehmende Verbreitung online-gestützter Lernangebote mit großen Nutzerzahlen (z.B. MOOCs) begründet zu sein, die es notwendig macht, algorithmische Unterstützung bei der Gruppenformation einzusetzen. Bei der kritischen Betrachtung dieser Forschungsliteratur aus psychologischer Sicht fällt jedoch auf, dass die dabei verwendeten Messinstrumente oftmals nicht gängigen psychometrischen Anforderungen genügen (z.B. MMPI oder Lernstile nach Kolb) und die eingesetzten Forschungsdesigns in vielen Fällen keine kausalen Rückschlüsse zulassen.

Als Forschungsdesiderat lässt sich aus dem vorliegenden Literaturreview ableiten, dass interdisziplinäre Ansätze erforderlich sind, um der Herausforderung einer möglichst optimalen Gruppenformation zu begegnen. Dabei ist es zunächst erforderlich, theoretisch und empirisch begründete relevante Kriterien für die Gruppenformation zu identifizieren. Im zweiten Schritt müssen geeignete Messinstrumente für diese Kriterien ausgewählt werden, die eine reliable und valide Diagnostik erlauben. Zuletzt wird ein Algorithmus benötigt, der die vorhandenen Personen auf Lerngruppen verteilt, sodass einerseits innerhalb jeder einzelnen Gruppe die gewünschte Verteilung der Eigenschaften möglichst optimal umgesetzt wird, andererseits aber auch über die verschiedenen Gruppen hinweg möglichst ähnliche Voraussetzungen geschaffen werden.

Im Ausblick des Vortrags wird ein Überblick über mehrere empirische Feldexperimente der Autoren präsentiert (Bellhäuser, Konert, Müller, & Röpke, 2018; Bellhäuser, Konert, Röpke, & Rensing, 2017; Konert, Bellhäuser, Röpke, Gallwas, & Zucik, 2016), die mit der Open-Source-Software MoodlePeers (moodlepeers.de) durchgeführt wurden.

 

Eine experimentelle Studie über die Effekte von Gruppenformation auf Zufriedenheit und Leistungserfolg

Adrienne Müller1, Henrik Bellhäuser1, Johannes Konert2, René Röpke3
1Johannes Gutenberg Universität Mainz, 2Beuth Hochschule für Technik, 3RWTH Aachen University

Lernen in Gruppen zeigt deutliche Vorteile Wissen zu etablieren und erweist sich als wirkungsvolle didaktische Strategie, um Leistung zu steigern, da sie Lern- als auch Sozialisationsprozesse anstößt (Fernández-Breis, Castellanos-Nieves & Valencia-García, 2009).

Aufgrund der hohen Relevanz von Gruppenarbeit für die universitäre Lehre ergibt sich als Forschungsdesiderat, die Gruppenkomposition als wichtige Einflussgröße zu untersuchen, um die zugrundeliegenden Wirkmechanismen besser zu verstehen. Die Open-Source-Software MoodlePeers bietet dafür durch ihren offenen Quellcode ein geeignetes Instrument, das bereits in Lehrveranstaltungen und empirischen Feldexperimenten Einsatz gefunden hat (Konert et al., 2016).

Der vorliegende Beitrag beschäftigt sich mit mehreren Gruppenformationskriterien, die sich positiv auf Lernerfolg und Zufriedenheit in Lerngruppen auswirken sollen.

Bisherige Forschung zu Effekten von homogener oder heterogener Gruppenkomposition fand größere Effekte für die Persönlichkeitseigenschaft Extraversion als für demografische Eigenschaften wie Geschlecht oder Bildungsniveau (Martin & Paredes, 2004). Dabei wurden Vorteile für heterogene Verteilungen gefunden (Bell, 2007). Vorwissen scheint zusätzlich ein entscheidender Prädiktor für Gruppenerfolg zu sein (Nieto-Isidro, et al., 2012).

Im Vortrag werden Ergebnisse zu zwei empirischen Feldstudien dargestellt, bei denen die Verteilung von Extraversion und Vorwissen experimentell manipuliert wurde.

Die Hypothesen der Studien ergaben sich wie folgt:

H1: Gruppen, in denen durch den Algorithmus Extraversion heterogen verteilt wird, sind zufriedener mit der Gruppenzusammenstellung und erbringen bessere Ergebnisse, als Gruppen mit homogener Verteilung von Extraversion.

H2: Gruppen, in denen durch den Algorithmus Vorwissen heterogen verteilt wird, sind zufriedener mit der Gruppenzusammenstellung und erbringen bessere Ergebnisse, als Gruppen mit homogener Verteilung von Vorwissen.

Die erste Studie fand im Wintersemester 2018 in sechs parallelen Seminargruppen (N = 179) im Rahmen des bildungswissenschaftlichen Studium statt und untersuchte den Einfluss der Verteilung von Extraversion (nur H1) auf die Gruppenleistung in verschiedenen Aufgaben über ein Semester hinweg.

Das zweite Projekt fand im Sommer 2019 im Kontext eines Online-Mathematikvorkurses mit angehenden Studierenden (NEntscheidungGruppe = 280; NGruppe = 93) statt, die durch den Kurs innerhalb von vier Wochen ihr mathematisches Schulwissen wiederholen konnten. Dabei wurden Extraversion und Vorwissen (H1 und H2) mit Hinblick auf ihren Effekt auf Zufriedenheit und Gruppenleistung untersucht.

MoodlePeers erlaubt eine Gruppenformation auf Basis vordefinierter Kriterien. Nachdem die gewählten Kriterien in einem Fragebogen für jede Person diagnostiziert wurden, bildet der Algorithmus Gruppen, die entweder homogen oder heterogen in Bezug auf die gewählten Kriterien waren. In beiden Studien wurden jeweils Lerngruppen aus n=3 Personen gebildet, die gemeinsam wöchentliche Hausaufgaben bearbeiteten und zum Abschluss individuell einen Leistungstest durchführten. Zudem berichteten die Versuchspersonen in Evaluationen über ihre Zufriedenheit und ihr Zeitinvestment.

Zur statistischen Auswertung wurden hierarchisch lineare Modelle berechnet, um die genestete Struktur der Daten abzubilden. Erste vorläufige Ergebnisse weisen darauf hin, dass die Hypothesen teilweise nicht bestätigt werden konnten. So scheint kein positiver Effekt einer heterogenen Verteilung von Extraversion auf Gruppenleistung und Zufriedenheit vorzuliegen. Dies steht im Widerspruch zu bisherigen Befunden in der Literatur, welche allerdings zu großen Teilen aus korrelativen, nicht-experimentellen Studien stammen.

Diskutieren lässt sich auf der Basis der vorliegenden Ergebnisse, ob es innerhalb einer Gruppe Eigenschaften einer einzelnen Person ermöglichen, diese Gruppe zufriedener bzw. erfolgreicher werden zu lassen im Vergleich zu Gruppen, die diese Art von Mitglied nicht haben. Auf welche Art von Persönlichkeitsstrukturierung es hierbei ankommt bzw. welche anderen Eigenschaften hier von Relevanz sind, muss noch erforscht werden.

Limitationen auf Grund von Lernumgebung, Aufgabe, Dropout, sowie bessere Bedingungen zur Entfaltung der Persönlichkeitseigenschaften innerhalb der Gruppe werden diskutiert. Die Auswahl und Gewichtung relevanter Kriterien stellt weiterhin eine interdisziplinäre Herausforderung dar.

 

Zur Bedeutung von Schüler*innen-Merkmalen und Peer-Interaktion für den Lernerfolg beim Peer-Learning

Valentina Reitenbach
Bergische Universität Wuppertal

Peer-Learning ist eine Methode, die sich empirisch in der Förderung sozialer und akademischer Kompetenzen über diverse Inhaltsbereiche hinweg bewährt hat (z.B. Ginsburg-Block et al. 2006; Miller et al. 2010; Robinson et al. 2005). Gleichzeitig hat sich gezeigt, dass verschiedene Subgruppen unterschiedlich stark von Peer-Learning-Programmen profitieren (z.B. Rohrbeck et al. 2003). Der Vortrag geht der Frage nach, wie sich die Befunde zu den Zusammenhängen zwischen diesen drei Komponenten erklären lassen und ob diese Erklärung einer empirischen Prüfung standhält.

Warum ist Peer-Learning (für unterschiedliche Subgruppen) wirksam? Aus einer lerntheoretischen Perspektive, die an kognitive und sozial-behavioristische Prinzipen anknüpft (z.B. Asterhan und Schwarz 2016; Chi und Menekse 2015; Helmke und Schrader 2008; Hertz-Lazarowitz 1989; Slavin 2014), werden folgende Annahmen getroffen: 1) Die Peer-Interaktion steht in unmittelbarer Beziehung zum Lernen. 2) Die Elaboration von Äußerungen stellt ein wichtiges Potenzial für Lernprozesse dar. 3) Sowohl die Äußerungen des Peers (kognitive Konflikte), die eigenen Äußerungen (kognitive Elaboration) sowie die gemeinsamen Äußerungen (Ko-Konstruktion) sind von Bedeutung, um Lernprozesse anzuregen. 4) Die Peer-Interaktion kann als Angebot verstanden werden, das von den Individuen in unterschiedlichem Maße genutzt wird. 5) Faktoren wie Schüler*innen-Merkmale können vermittelt über die Peer-Interaktion auf Lernerfolg wirken oder aber die Beziehung zwischen Peer-Interaktion und Lernerfolg moderieren.

Empirisch konnten in diversen Studien Beziehungen zwischen unterschiedlichen Typen von Peer-Interaktion und Lernerfolg (z.B. Littleton und Mercer 2010) gezeigt werden. Außerdem legen Meta-Analysen nahe, dass der Lernerfolg im Peer-Learning von individuellen Faktoren sowie Faktoren der Gruppenzusammensetzung abhängt (z.B. Rohrbeck et al. 2003). Es ist allerdings nicht bekannt, ob in den Zusammenhängen zwischen individueller und Gruppenebene unterschieden wurde. Da darüber hinaus keine Erkenntnisse zur mediierenden oder moderierenden Beziehung unter Berücksichtigung von Individual- und Gruppen- oder Partnerebene bekannt sind, wird ihre Analyse zum Gegenstand des Beitrags gemacht.

Es wird erwartet, dass die Merkmale Jahrgangsstufe, Sprachkompetenz und Motivation eine positive Beziehung auf zur Peer-Interaktion sowie zum Lernerfolg im Peer-Learning haben. Diese positive Beziehung sollte sich sowohl auf Individualebene als auch auf Gruppenebene zeigen. Für das Geschlecht legen rollentheoretische Annahmen sowie empirische Befunde (Ausführungen z.B. in Böhnisch 1996) für die Gruppenebene nahe, dass sich eine heterogene Lernpartnerschaft negativ auf Peer-Interaktion sowie den Lernerfolg auswirkt. Darüber hinaus sollen für alle Merkmale mediierende und moderierende Beziehungen explorativ geprüft werden.

Die Analysen erfolgen mit Daten aus einer Peer-Learning Intervention mit 45 Dyaden. Die Dritt- und Viertklässler haben in 12 Sitzungen Rechenstrategien für Plus- und Minusaufgaben erlernt und diese gemeinsam nach dem Prinzip des reziproken Peer-Tutorings eingeübt. Die ersten sechs Sitzungen wurden von einer geschulten Übungsleitung instruiert, während die Peers in der zweiten Hälfte selbstständig geübt haben.

Die Interaktion wurde auf Basis von transkribierten Audiodaten mit einem selbst entwickelten Kategoriensystem (κn = .72 - .95 nach Brennan und Prediger 1981) im Hinblick auf die Elaboration der Äußerungen bewertet. Als Leistungsmaß wird ein adaptierter Strategietest angewandt. Die Sprachkompetenz wurde mit einem Wortschatztest (WWT; Glück 2011) erhoben. Die Motivation wurde mithilfe unterschiedlicher adaptierter Skalen über einen Fragebogen erfasst. Die Auswertung erfolgt mithilfe von Korrelationen in SPSS® und einer Mehrebenenmodellierung (Preacher et al. 2010) sowie dem Actor-Partner-Interaction-Model (Kenny et al. 2006) in Mplus 7.4.

Die vorläufigen Ergebnisse deuten darauf hin, dass für die Beziehung zwischen Peer-Interaktion und Lernerfolg die Äußerungen des Peers sowie die Ko-Konstruktion bedeutsam sind, nicht jedoch die eigenen Äußerungen im Sinne einer kognitiven Elaboration. Komplexere Zusammenhänge unter Einbezug der Schüler*innen-Merkmale auf Individual- und Gruppenebene sind zum derzeitigen Stand der Analysen schwer zu fassen. Es zeichnet sich jedoch ab, dass die Beziehungen zwischen den drei Komponenten Schüler*innen-Merkmale, Peer-Interaktion & Lernerfolg insbesondere auf Gruppenebene bedeutsam sind. Weiterführende Analysen zu mediierenden und moderierenden Beziehungen stehen noch aus.

 

Fachinhaltliche Interaktionen in Gruppenarbeiten und ihr Einfluss auf den Lernerfolg – Eine Videostudie im problemorientierten Wirtschaftsunterricht

Christin Siegfried
Goethe-Universität Frankfurt

Ökonomische Kompetenz ist als anerkannter Teil der Allgemeinbildung in den letzten Jahren im Schulcurriculum verstärkt verankert worden, um den Lernenden als mündigen Bürger, der sich privaten und beruflichen Wirtschaftsfragen des alltäglichen Lebens stellen kann, zu qualifizieren (Schumann & Eberle, 2014). Lernenden sollen im Unterricht dementsprechend u.a. dazu befähigt werden „Ansätze zur Lösung nationaler, europäischer und globaler Herausforderungen … (zu) verstehen und sich mit unterschiedlichen Lösungsperspektiven auseinander(zu)setzen“ (Hessisches Kultusministerium, 2016, S. 10).

Ein geeigneter Ansatz die beschriebene Mehrperspektivität (individuelle, interindividuelle, transindividuelle Perspektive) und verschiedenen Kompetenzanforderungen (Analysieren, Beurteilen, Handeln) (Acar et al., 2010, Dubs, 2001, Retzmann et al., 2012) im Unterricht zu adressieren, stellt der problemorientierte Unterricht (Reusser, 2005) mithilfe seiner kooperativen Lernformen dar. Durch den Austausch mit anderen, erfahren die Schüler andere Sichtweisen zu einem Inhalt, was für die Realisierung multipler Kontexte von Bedeutung ist (Mandl, Reinmann-Rothmeier & Gräsel, 1998). Die Art der Kommunikation in Gruppenarbeiten scheint dabei aber für den Lernerfolg eine entscheidende Rolle zu spielen. So verweisen Studien darauf, dass der Grad des kognitiven Engagements des Individuums im Gruppengespräch, der Bezug der individuellen Beiträge aufeinander und die inhaltliche Vielfalt der Beiträge einen Einfluss auf das Lernen zu haben scheinen (e.g. Chi & Menekse, 2015, Maloney, 2007, Kopp & Mandl, 2006, Barron, 2003 ). Demnach profitieren die SchülerInnen von den zusätzlichen Informationen sowie den neuen Perspektiven ihrer LernpartnerInnen und können so Wissen ko-konstruieren, was nur schwer von einem einzelnen Lernenden erreicht werden kann (Chi et al., 2009; Hinsz et al., 1997). Der Vorteil von Gruppengesprächen gegenüber Einzelarbeiten würde allerdings bei einem additiven Gesprächsaufbau verschwinden (Chi et al., 2009). Darüber hinaus zeigt Barron (2003) in ihrer Studie, dass das Vorwissen der Gruppenmitglieder kein Prädiktor für das Lernergebniss zu sein scheint.

Im Vortrag werden Ergebnisse einer empirischen Feldstudie, die die Analyse lernförderlicher Interaktionen in Gruppenarbeiten im Rahmen einer problembasierten Lernumgebung im Fach Politik und Wirtschaft zum Ziel hat, vorgestellt. Hierbei werden vor allem die mit den individuellen Diskussionsbeiträgen korrespondierenden kognitiven Prozesse (nicht elaboriert, aktiv, konstruktiv), die Struktur des Diskussionsformates (cummulativ, interactiv, ko-konstruktiv) sowie der Grad der inhaltlichen Vielfalt in der Gruppendiskussion in den Blick genommen. Hierfür werde folgende Forschungsfragen adressiert:

1. Welche Klassifikation der individuellen Beiträge, der inhaltliche Vielfalt und der Struktur der Gruppendiskussion zeigt sich in den Gruppengesprächen?

2. Welche Zusammenhänge ergeben sich aus der Klassifikation der individuellen Beiträge, der inhaltliche Vielfalt und der Struktur der Gruppendiskussion mit der individuellen Lernleistung?

Für die Beantwortung der Fragestellung wurde eine problemorientierte Unterrichtseinheit zum Thema Energieknappheit entwickelt und der gesamte Lehr- und Lernprozess jeder Gruppe (90 Minuten) mit Videos aufgezeichnet und mit Fragebögen (demografische Daten, aktuelle Motivation, Fachinteresse) und Wissenstests vor, direkt nach dem Unterricht und 6 Wochen nach dem Unterricht begleitet. Während das Video explizit über den Kommunikationsprozess in der Gruppenarbeit informiert, ermöglichen die Fragebogen- und Testdaten die Analyse von Wissenszuwächsen unter der Kontrolle von Einflussgrößen wie Interesse oder Motivation.

Insgesamt wurden der Unterricht von März 2017 bis Juni 2017 mit 5 Klassen der hessischen Oberstufe mit 90 Lernenden (in 16 Gruppen) durchgeführt. Alle Videos wurden transkribiert und nach der Durchführung einer Kodierschulung kodiert (Interrater-Realibiltät:.72-.83)

Die vorläufigen Ergebnisse verweisen auf einen signifikanten Lernzuwachs über die Unterrichtseinheit, der auch 6 Wochen danach noch anhält (F(2,62)=5.362, p=.007, η2=0.15). Die genestete Struktur der Daten verlangt allerdings die Berücksichtigung zweier Ebenen in Form der Personen - und Gruppenebene. Es zeigt sich, dass vor allem Lernenden mit einem geringen Vorwissen von dem Unterrichts profitieren. Auf das Testergebnis nach dem Unterricht scheint weniger das Fachinteresse, das Geschlecht oder die aktuelle Motivation der Lernenden relevant, sondern die Mathematiknote und der Anteil konstruktiver Beiträge. Als Gruppenebene gewinnt die Struktur der Diskussionsbeiträge an Bedeutung.

 
11:15 - 13:00F11‒S18: Die Schattenseiten von Motivation: Bedeutung von Zielen für maladaptives Verhalten und Erleben in Bildungskontexten
S18 
 

Die Schattenseiten von Motivation: Bedeutung von Zielen für maladaptives Verhalten und Erleben in Bildungskontexten

Chair(s): Stefan Janke (Universität Mannheim), Martin Daumiller (Universität Augsburg, Deutschland)

DiskutantIn(nen): Jens Möller (Christian-Albrechts-Universität zu Kiel)

Für gelingendes Lernen in Bildungskontexten nehmen die Ziele der Lernenden eine wichtige Rolle ein (Zimmermann, Bandura & Martinez-Pons, 1992). So sind selbstgesetzte Ziele sowohl für die Anstrengungsbereitschaft (Guan, Xiang, McBride & Bruene, 2006) als auch für die Leistungsfähigkeit (Huang, 2012) von Schüler*innen und Studierenden ein bedeutsamer motivationaler Faktor. Zielsetzungsprozesse können jedoch auch maladaptive Folgen haben. Forschungsarbeiten indizieren hierzu etwa, dass Ziele mit Vermeidungsvalenz (d.h. Streben nach Abwendung unangenehm eingeschätzter Endzustände) mit eher ungünstigen (z.B. eher oberflächlichen) Lernprozessen (u.a. Elliot, McGregor & Gable, 1999) und negativen Emotionen wie Prüfungsangst einhergehen (z.B. Eum & Rice, 2011). In dem vorliegenden Symposium sollen entsprechende Schattenseiten von Zielsetzungsprozessen in den Vordergrund gerückt werden. Wir möchten dabei die Risiken betrachten, die sich aus dem Verfolgen bestimmter Zielinhalte ergeben können sowie Probleme adressieren, die bei der Verfolgung multipler Ziele entstehen können.

Die ersten beiden Beiträge fokussieren hierbei auf die Rolle verschiedener Zielinhalte. So wird in dem ersten Beitrag betrachtet, wie soziale Ziele von Schüler*innen damit zusammenhängen, ob diese Schüler*innen Bullying ausüben. Hierbei zeigen sich unter anderem positive Zusammenhänge zwischen sozialen Demonstrationszielen (Streben danach, beliebt zu sein und positiv wahrgenommen zu werden) und selbstberichtetem Bullyingverhalten. Diese Zusammenhänge waren zumindest anteilig durch Inklusionsnormen und das Zugehörigkeitsgefühl vermittelt. In dem zweiten Beitrag wird die Bedeutung der Leistungssituation für negative Auswirkungen von Leistungszielen (Streben nach Kompetenzdemonstration) genauer betrachtet. Ein dazu durchgeführtes Experiment zeigt, dass Studierende insbesondere dann in Testsituationen betrügen (unerlaubtes Abschreiben; Falschangaben über gelöste Aufgaben) wenn Leistungsziele induziert wurden und die Studierenden glaubten, dass ihre Leistung ergebnis- und nicht prozessorientiert bewertet werden würde. Diese Befunde legen nahe, dass bestimmte Zielklassen nicht automatisch maladaptives Verhalten evozieren, sondern auch situative Rahmenbedingungen für die ungünstigen Auswirkungen relevant sind.

Die letzten beiden Beiträge fokussieren auf das Verfolgen multipler Ziele. Im dritten Beitrag wird ein personenzentrierter Ansatz verwendet, um verschiedene motivationale Profile zu identifizieren und genauer zu explorieren, wie bestimmte Profile längsschnittlich mit einem maladaptiven Erleben der Unterrichtsqualität einhergehen. Die Ergebnisse zeigen, dass sich Schüler*innen abhängig von ihrer Profilzugehörigkeit dahingehend unterscheiden, wie sie die Unterrichtsqualität wahrnehmen. Interessant ist insbesondere, dass von einer geringeren Unterrichtsqualität berichtet wird, wenn Profile durch Leistungszielorientierungen gekennzeichnet sind. Insbesondere verdeutlicht der Beitrag, dass die Zielkomposition eine relevante Rolle dafür spielt, ob Ziele in Zusammenhang mit ungünstigem Erleben der Lernumwelt stehen. Im vierten Beitrag wird schlussendlich genauer beleuchtet, wie ressourcenbezogene Zielkonflikte bedingt durch starke Leistungsmotivation in verschiedenen Lebenskontexten (hier: Schule/Universität, Leistungssport, Freizeit) in Zusammenhang mit Belastungserleben stehen. So zeigt sich, dass insbesondere motivationale Zielkonflikte zwischen Schule/Universität und Leistungssport in Zusammenhang mit erhöhtem akademischem Belastungserleben stehen. Dies spricht dafür, dass ein stärkeres Ausmaß an Leistungsmotivation nicht immer positiv ist, insbesondere wenn es in Folge zu Ressourcenkonflikten kommt.

Die Beiträge umfassen ein breites Muster möglicher maladaptiver Effekte von Zielsetzungsprozessen in Bezug auf Erleben (Unterrichtswahrnehmung: Beitrag 3; Belastung: Beitrag 4) und Verhalten (Bullying: Beitrag 1; Betrug: Beitrag 2) von Lernenden in verschiedenen Bildungs- und Leistungskontexten (Universität: Beitrag 1+4; Schule: Beiträge 2, 3 und 4; Sport: Beitrag 4). Dabei haben die einzelnen Studien eine hohe Diversität der Forschungsansätze und der verwendeten Analysestrategien. In der Gesamtschau wird klar, dass Zielsetzungsprozesse in Bildungskontexten nicht nur positive Effekte haben, sondern auch Risiken bergen. Dabei wird jedoch auch deutlich, dass eine Reihe von Randbedingungen wie die Leistungssituation (Beitrag 2), die Zielkomposition (Beitrag 3) und die Zielkonflikte (Beitrag 4) von hoher Bedeutung für die Betrachtung dieser negativen Effekte sind. Praktische wie theoretische Implikationen der Beiträge sowie das Potential für weiterführende Forschung werden durch den Diskutanten thematisiert.

 

Beiträge des Symposiums

 

„Cool“ sein, Freundschaften pflegen, nicht sozial unbeholfen wirken – Soziale Ziele von Jugendlichen als Prädiktoren von Bullying

Lisa Bardach1, Marko Lüftenegger2, Daniel Graf2, Takuya Yanagida2, Christiane Spiel2, Marlene Kollmayer2
1University of York, 2Universität Wien

Bullying ist ein komplexes soziales Phänomen, bei dem ein/e Täter/in ein Opfer bewusst und über einen längeren Zeitraum hinweg beispielsweise durch physische Gewalt oder verbale Angriffe verletzt (Simon & Nail, 2013). Vor dem Hintergrund der negativen Konsequenzen von Bullying (z.B. Depression, suizidales Verhalten; Holt et al., 2015), stellt die Identifikation von Faktoren, die Bullying-Verhalten beeinflussen, ein wichtiges Forschungsziel mit bedeutsamen Implikationen für die (Bildungs-)Praxis dar. Die vorliegende Studie befasste sich daher mit der Frage, inwiefern soziale Ziele, die Jugendliche in ihren Beziehungen mit Klassenkolleg*innen verfolgen, mit deren Bullying-Verhalten zusammenhängen (Forschungsfrage 1). Nach Ryan und Shim (2006, 2008) können soziale Ziele als „social achievement goals“ konzeptualisiert werden und bilden Unterschiede im Streben nach sozialer Kompetenz ab: Während Jugendliche mit sozialen Entwicklungszielen danach trachten, die Qualität ihrer Freundschaften stetig zu verbessern, zielen Jugendliche mit sozialen Demonstrationszielen mit Annäherungsfokus darauf ab, beliebt zu sein und als „cool“ wahrgenommen zu werden. Für Jugendliche, die sich durch ausgeprägte soziale Demonstrationsziele mit Vermeidungsfokus auszeichnen, steht es im Vordergrund zu vermeiden durch soziale Unbeholfenheit aufzufallen. Empirische Befunde deuten darauf hin, dass aggressives Verhalten in einem negativen Zusammenhang zu sozialen Entwicklungszielen, in positivem Zusammenhang zu sozialen Demonstrationszielen mit Annäherungsfokus und nicht in statistisch signifikantem Zusammenhang zu Demonstrationszielen mit Vermeidungsfokus steht (Ryan & Shim, 2008). Um zu einem besseren Verständnis möglicher Wirkmechanismen beizutragen, untersuchten wir des Weiteren, inwiefern zwei Faktoren, die bereits mit Bullying und sozialen Zielen in Verbindung gebracht wurden (Gefühl der Zugehörigkeit zur Klasse, nicht-inklusive Klassennormen) Zusammenhänge zwischen diesen mediieren (Forschungsfrage 2). Da Studien zudem auf Geschlechterunterschiede in den Zusammenhängen zwischen sozialen Einflussfaktoren und Bullying hinweisen (z.B. Salmivalli & Voeten, 2004) und um ggf. geschlechtersensitive Empfehlungen für Anti-Bullying-Interventionen abzuleiten, adressierten wir die Frage, inwiefern sich die Zusammenhänge zwischen Jungen und Mädchen unterscheiden (Forschungsfrage 3).

Die teilnehmenden 788 Schüler*innen (55.3% weiblichen Geschlechts, durchschnittliches Alter: 15.67 Jahre, SD = 0.98) aus 42 Klassen in österreichischen Gymnasien bearbeiteten Skalen zur Erfassung aller Konstrukte. Die Skala für Bullying fragte ab, wie oft die Schüler*innen in den vergangenen zwei Monaten unterschiedliche Formen von Bullying (verbal, physisch, sozial, cyber-bullying) ausgeübt hatten.

Die Analysen, die mit Mplus 8.2. durchgeführt wurden, beinhalteten Zwei-Gruppen konfirmatorische Faktorenanalysen mit Messinvarianz-Testungen zwischen den Geschlechtern sowie ein Zwei-Gruppen Strukturgleichungsmodell unter Verwendung der type = complex Option und des robusten Maximum Likelihood-Schätzers. Zum Umgang mit fehlenden Werten (zwischen 0.3% bis 1% auf Item-Ebene) bedienten wir uns des Full information maximum likelihood-Ansatzes.

Für Mädchen sagten soziale Entwicklungsziele Bullying signifikant und negativ vorher (unstandardisiertes 𝛽= -0.08, p< .01), während kein statistisch signifikanter Effekt für Jungen vorlag (𝛽 = -0.04 p= .336). Soziale Demonstrationsziele mit Vermeidungsfokus hingen für Mädchen nicht statistisch signifikant (𝛽= -0.04 p=.183) und für Jungen statistisch signifikant und negativ (𝛽= -.17, p < .05) mit Bullying zusammen. Positive Zusammenhänge zwischen sozialen Demonstrationsziele mit Annäherungsfokus und Bullying fanden sich für beide Geschlechter (Mädchen: 𝛽= 17, p< .05, Jungen: 𝛽= .26, p< .01). Für Mädchen erreichte nur ein indirekter Effekt (Zusammenhang zwischen Demonstrationsziele mit Vermeidungssfokus, mediiert von nicht-inklusiven Gruppennormen) statistische Signifikanz (𝛽 = 0.03, p< .05). In der Gruppe der Jungen mediierten non-inklusive Gruppennormen die Zusammenhänge zwischen allen sozialen Zielen und Bullying (𝛽’s zwischen 0.09 und .14, alle p’s < .05) und das Zugehörigkeitsgefühl in der Klasse mediierte den Zusammenhang zwischen Entwicklungszielen und Bullying (𝛽= 0.07, p < .05).

Die Ergebnisse dieser Studie deuten auf die Relevanz sozialer Ziele im Kontext des Bullying-Verhaltens von Jugendlichem hin und liefern Hinweise auf mögliche geschlechterübergreifende (Effekt von sozialen Demonstrationszielen mit Annäherungsfokus), als auch geschlechterspezifische (Effekte der zwei anderen Ziele, Mediationen) Muster. Unsere Studie erweitert die Bullying-Forschung somit um eine Auseinandersetzung mit sozialen Zielen und identifiziert mögliche Ansatzpunkte, die in der Gestaltung (geschlechtersensitiver) Anti-Bullying-Interventionen aufgegriffen werden könnten.

 

Prozess oder Ergebnis: Der Effekt von Leistungszielen auf Betrugsverhalten hängt von der Art der Leistungsbewertung ab

Stefan Janke1, Martin Daumiller2
1Universität Mannheim, 2Universität Augsburg

Akademisches Betrugsverhalten ist keine Seltenheit an (Hoch-)Schulen: Zwischen der Hälfte und zwei Dritteln aller Studierenden zeigen während ihres Studiums Betrugsverhalten, etwa in Form von Plagiatsversuchen beim Anfertigen von Seminararbeiten oder Verwendung unerlaubter Hilfsmittel bei der Bearbeitung von Klausuren (McCabe, 2005; Teixeira & Rocha, 2010). Der Erwartungs-Wert-Theorie der Motivation (Wigfield & Eccles, 2000) folgend, ist anzunehmen, dass Studierende insbesondere dann Betrugsverhalten zeigen, wenn sie der Demonstration von Leistung hohen Wert beimessen und zudem die Erwartung haben, dass Betrugsverhalten wahrscheinlich auch zu diesem erwünschten Ergebnis führt. Das Ausmaß, in dem Studierende nach Leistungsdemonstration streben, wird auch als Leistungsziele (mit Erscheinungsfokus; Senko, Hulleman & Harackiewicz, 2011) bezeichnet. Bisherige Forschung zu den Zusammenhängen zwischen Leistungszielen und akademischem Betrugsverhalten ist allerdings stark heterogen, was indiziert, dass der Effekt von Leistungszielen auf Betrugsverhalten von moderierende Faktoren bedingt sein könnte (Daumiller & Janke, 2019). In Einklang mit der Erwartungs-Wert-Theorie ist anzunehmen, dass solche Moderatoren in Bezug zu der eingeschätzten Erfolgserwartung stehen. In dieser Hinsicht sollte insbesondere die Art der Leistungsevaluation eine wichtige Rolle spielen. Wir unterscheiden hierzu zwischen ergebnisorientierter versus prozessorientierter Leistungsevaluation. Bei der ergebnisorientierten Leistungsevaluation wird die richtige Lösung durch die Prüfenden belohnt, während bei der prozessorientierten Leistungsevaluation der korrekte Lösungsweg bewertet wird. Wir gehen davon aus, dass Leistungsziele nur dann Betrugsverhalten evozieren, wenn die Leistung ergebnisorientiert evaluiert wird, da bereits niederschwellige und leicht einzusetzende Betrugsmöglichkeiten (z.Bsp. Abschreiben der richtigen Lösung) zum Erfolg führen können. Wird hingegen eine prozessorientierte Leistungsevaluation eingesetzt, ist der Erfolg von Betrugsverhalten fraglich, da komplexere Betrugsformen nötig sind.

Um den postulierten Interaktionseffekt zu prüfen, entwickelten und bestätigen wir ein experimentelles Paradigma, das es ermöglicht, Leistungsziele zu induzieren und Betrugsverhalten zu messen (2 Vorstudien: n=59+72 Studierende). In der präregistrierten Hauptstudie (n=169 Studierende) manipulierten wir in einem zweifaktoriellen Experiment die Leistungsziele und die Form der Leistungsevaluation. Die teilnehmenden Studierenden bearbeiteten in Gruppen einen computerbasierten Test, der als „neuer Fähigkeits- und Persönlichkeitstest” beschrieben wurde. Randomisiert wurde eine Hälfte der Versuchspersonen darauf hingewiesen, dass es besonders wichtig sei, im Test gut abzuschneiden (Induktion von Leistungszielen), während für die andere Hälfte kein entsprechender Leistungsfokus gesetzt wurde. Zusätzlich zu der Manipulation der Ziele wurde einer Hälfte der Stichprobe erklärt, dass vor allem der Lösungsweg für die Leistungsbewertung herangezogen würde (ergebnisorientierte Leistungsevaluation), die andere Hälfte erfuhr, dass es primär auf die Richtigkeit der Lösungen ankäme (prozessorientierte Leistungsevaluation). Als abhängige Variable erfassten wir sowohl durch eine eingeweihte Studentin beobachtetes Betrugsverhalten, als auch Betrugsverhalten bei unlösbaren Aufgaben (Anzahl als „gelöst“ berichtete unlösbarer Aufgaben). Um die Gelegenheit für Betrugsverhalten zu geben, verließ die Versuchsleitung für kurze Zeit unter einem Vorwand den Raum.

Der Manipulationscheck zeigte, dass Studierende in der Zielinduktionsbedingung tatsächlich in stärkerem Ausmaß Leistungsziele schilderten als wenn die Induktion nicht erfolgt war (p<.001, d=.71). In Einklang mit unseren Hypothesen zeigte sich ein signifikanter Interaktionseffekt: Studierende betrogen doppelt so häufig, wenn im Vorfeld Leistungsziele induziert worden waren und vorgeblich eine ergebnisorientierte Leistungsevaluationsprozedur Verwendung fand (41% versus 4–17%). Es zeigten sich darüber hinaus weder Haupteffekte für die Zielinduktion noch für die Art der Leistungsevaluation.

Die aufgezeigten Befunde legen nahe, dass Leistungsziele in Testsituationen nur dann Betrugsverhalten bahnen, wenn die Testbedingung solches Verhalten erfolgsversprechend erscheinen lassen. In unserem Experiment war dies der Fall, wenn die Leistung vorgeblich ergebnisbasiert evaluiert wurde und entsprechend schon das Abschreiben von Ergebnissen den gewünschten Effekt erzielte. Dies hat wichtige Implikationen für die Gestaltung von Testsituation mit hoher persönlicher Bedeutsamkeit (beispielsweise Abschlussprüfungen). Da anzunehmen ist, dass in solchen Testsituationen verstärkt Leistungsziele auftreten (und diese auch adaptiv seien können; Anderman & Koenka, 2017), sollte die Prüfungssituation so gestaltet sein, dass Betrugsverhalten wenig zielführend erscheint. Der Einsatz prozessorientierter Bewertungsschema könnte in dieser Hinsicht eine wichtige Maßnahme zur Verminderung von Betrugsverhalten darstellen.

 

Fachinteresse, Selbstkonzept und Zielorientierungen – günstige motivationale Lernvoraussetzungen für die Wahrnehmung von Unterricht? Eine Untersuchung motivationaler Profile bei Schüler*innen der Oberstufe

Katharina Dreiling, Ariane Willems
Georg-August-Universität Göttingen

Ziel des Beitrags ist es, motivationale Profile von Schüler*innen zu identifizieren, die durch unterschiedliche Ausprägungen in den motivationalen Lernvoraussetzungen Fachinteresse, Selbstkonzept sowie Zielorientierungen charakterisiert sind. Darüber hinaus soll untersucht werden, wie sich die individuelle Profilzugehörigkeit auf das Unterrichtserleben auswirkt. Als theoretische Grundlage dient dabei ein Angebots-Nutzungs-Modell, demzufolge Unterschiede in den Lernvoraussetzungen von Schüler*innen die Wahrnehmung und Nutzung der Angebotsstrukturen im Unterricht beeinflussen (und umgekehrt) (Seidel, 2014). In diesem Zusammenhang konnte – auf der Basis variablenzentrierter Untersuchungen – bereits nachgewiesen werden, dass motivationale Lernvoraussetzungen von eher intrinsischem Charakter (z.B. Lernzielorientierung) mit einer positiven Unterrichtswahrnehmung einhergehen (Willems, 2018). Weit weniger erforscht ist bislang, inwiefern unterschiedliche motivationale Lernvoraussetzungen innerhalb von Lernenden interagieren und somit Kombinationen – oder Profile – von motivationalen Merkmalen entstehen, die sich auch ungünstig auf die Wahrnehmung von Lernbedingungen auswirken können. Um solche Wechselwirkungen zu untersuchen, kommen aktuell zunehmend personenzentrierte Profilanalysen zum Einsatz (Linnenbrink-Garcia & Wormington, 2018). Studien weisen beispielsweise nach, dass bestimmte Muster von Zielorientierungen (z.B. hohe Lern- und Leistungsziele) zwar leistungsförderlich sind, aber auch mit negativen Emotionen (z.B. Prüfungsangst, Belastung) zusammenhängen (Jang & Liu, 2012; Tuominen-Soini et al., 2012). Aufbauend auf diesen Forschungsbefunden sollen die folgenden Fragestellungen untersucht werden: 1) Welche motivationalen Profile lassen sich identifizieren, die durch unterschiedliche Ausprägungen im Fachinteresse, Selbstkonzept und in der Leistungs- und Lernzielorientierung charakterisiert werden können? 2) In welchem Zusammenhänge stehen diese Motivationsprofile mit der Unterrichtswahrnehmung? 3) Wie stabil sind diese Profile im Verlauf eines Schulhalbjahres?

Grundlage der Analysen bilden Daten des Projekts FeeHe („Feedback im Kontext von Heterogenität“), in dem zu Beginn eines Schulhalbjahres 807 Schüler*innen in 49 Deutschkursen der Oberstufe standardisiert befragt wurden. An der Folgeerhebung nach einem Schulhalbjahr nahmen 696 Schüler*innen in 43 Kursen teil. Individuelle motivationale Lernvoraussetzungen wurden über ausgewählte Items zum Fachinteresse, Selbstkonzept und zu den Annäherungskompetenten der Lern- und Leistungszielorientierung sowie zur Vermeidungs-Leistungszielorientierung erfasst. Unterrichtsprozessmerkmale wurden über Skalen zur wahrgenommenen Feedbackqualität (Dreiling, Flierl & Willems, 2018) und zu den Basisdimensionen der Unterrichtsqualität (Klieme & Rakoczy, 2008) erfasst. Auf Basis der individuellen Schülerangaben wurden zu beiden Messzeitpunkten mittels Multilevel-Latent-Profile Analysen Motivationsprofile bestimmt und der Einfluss der Profilzugehörigkeit (t1) auf die Wahrnehmung der Unterrichts- und Feedbackqualität (t2) untersucht (Vermunt, 2008). Anschließend wurde mittels Latent-Transition Analysen geprüft, inwiefern Schüler*innen ihre Profilzugehörigkeit über den Zeitraum eines Schulhalbjahres beibehalten bzw. verändern.

Die Ergebnisse der Profilanalysen weisen für beide Messzeitpunkte zunächst auf vier unterschiedliche Motivationsprofile hin. Das erste Motivationsprofil (P1, n=197, 24.4%) ist durch eine überdurchschnittlich hohe Ausprägung in allen Motivationsmerkmalen charakterisiert. Demgegenüber lässt sich eine Schülergruppe (P2, n=285, 35.3%) identifizieren, die eine geringe Leistungszielorientierung bei gleichzeitig hohen Ausprägungen auf der Lernzielorientierung ebenso wie dem Fachinteresse und dem Selbstkonzept aufweist. Ein weiteres Profil (P3, n=277, 34.3%) ist durch eine mittlere bis hohe Lernzielorientierung und Vermeidungs-Leistungszielorientierung bei gleichzeitig geringen Ausprägungen in Annäherungs-Leistungszielorientierung, Fachinteresse und Selbstkonzept gekennzeichnet. Das vierte Profil (P4, n=48, 6.0%) zeichnet sich durch vergleichsweise geringe Ausprägungen in allen Merkmalen aus. Im Hinblick auf die zweite Forschungsfrage zeigen sich signifikante Unterschiede in der Unterrichtswahrnehmung in Abhängigkeit der Profilzugehörigkeit. Insbesondere stellt sich hierbei heraus, dass Schüler*innen in Profilen mit ausgeprägten Vermeidung-Leistungszielen (P3) sowie einer insgesamt geringen Motivation (P4) von einer geringeren Unterrichtsqualität berichten als in Profilen, die durch geringe Leistungszielorientierungen (P2) oder hohe Ausprägungen in allen Motivationsmerkmalen (P1) gekennzeichnet sind. Paarweise Mittelwertsvergleiche zeigen zudem, dass die wahrgenommene Unterrichtsqualität für P1 tendenziell geringer ausfällt als für P2. Zwischen P3 und P4 fallen die Unterschiede nicht signifikant aus. Beide Befunde lassen vermuten, dass hoch ausgeprägte Leistungsziele nicht mit einer höheren Unterrichtsqualität einhergehen – bei Vergleich mit Profilen, die hohe intrinsische Motivationsqualitäten bzw. eine insgesamt geringe Motivation aufweisen. Erste Analysen deuten außerdem auf eine relative Stabilität der Motivationsprofile über ein Schulhalbjahr hin (88.3% ‚stayer‘, 12.6% ‚mover‘).

 

Zielkonflikte zwischen Schule, Freizeit und Leistungssport und ihre Relevanz für Belastungserleben

Robert Grassinger
PH Weingarten

Theoretischer Hintergrund

Gemäß der Theorie motivationaler Handlungskonflikte (Hofer, 2004) verfolgen Lernende sowohl Wohlbefindenswerte als auch Leistungswerte als differierende Werteklassen. Sind verschiedene Werte zwischen diesen Werteklassen oder innerhalb einer Werteklasse ähnlich hoch ausgeprägt und können weder zeitgleich durch eine identische Handlung noch aufgrund zeitlicher Ressourcen sequentiell adressiert werden, kommt es zu einem Zielkonflikt. Im diesem Falle müssen sich Lernende für eine Handlung und den damit assoziierten Werten entscheiden. Die Theorie besagt weiterhin, dass die nicht ausgeführte Intention aktiviert bleibt und ungünstig das Erleben und die Ausführung der gewählten Handlung beeinflussen kann (motivationale Interferenz). In ihrem Übersichtsartikel berichten Hofer, Fries und Grund (2017), dass verschiedene Studien zur motivationalen Interferenz wiederholt zeigen konnten, dass bei Schule-Freizeit-Konflikten das Erleben (z.B. beeinträchtigte Stimmung) und Verhalten (z.B. erhöhte Ablenkbarkeit, niedrigere Persistenz) der gewählten Handlung durch die nicht ausgeführte Intention negativ beeinflusst ist (vgl. Fries, Dietz & Schmid, 2008; Grund, Schmid & Fries, 2015; Grund & Fries, 2012; Hofer et al., 2007).

Fragestellung

Bisherige Arbeiten fokussieren vorwiegend Schule-Freizeit-Konflikte und damit Zielkonflikte zwischen Wohlbefindens- versus Leistungswerten. Weniger untersucht sind Zielkonflikte innerhalb einer Werteklasse (hier Leistungswerte). Untersucht wird, inwieweit auch hier motivationale Interferenz zu beobachten ist und Lernende ein erhöhtes Belastungserleben berichten, wenn sie Zielkonflikte erleben und sich für eine Handlung entscheiden.

Methode

Lernende der Jahrgangsstufen 5 bis 13 (N = 137; Alter: 13.85, SD: 2.12; 67.2% weiblich), die neben der Schule intensiv (M = 5.19 Stunden pro Woche, SD = 2.34) Handball spielen (67%) oder turnen (33%) wurden in einer querschnittlich angelegten Studie nach dem Erleben von Zielkonflikten zwischen Schule-Freizeit, Schule-Leistungssport und Leistungssport-Freizeit befragt. Das Erleben von Zielkonflikten wurde operationalisiert mit dem Item „Wie häufig kommt es vor, dass du dich zwischen Schule und Freizeit [Schule und Leistungssport respektive Leistungssport und Freizeit] entscheiden musst“. Die gewählte Handlung wurde operationalisiert durch das Item „Mit welcher Wahrscheinlichkeit entscheidest du dich für die Schule [den Leistungssport respektive die Freizeit]“. Das Produkt aus diesen beiden Items repräsentiert die gewählte Handlung bei bestehendem Zielkonflikt und damit die Richtung der erwarteten motivationalen Interferenz. Das Belastungserleben in der Schule respektive im Leistungssport oder in der Freizeit wurde mit jeweils fünf Items gemessen (αSchule = .95; αLeistungssport = .89; αFreizeit = .90). Ein Beispielitem lautet „Schule [Turnen respektive Handball; Meine Freizeit] ermüdet mich so stark, dass ich kaum noch Energie für andere Dinge habe“. Die Zusammenhänge zwischen der Richtung der erwarteten motivationalen Interferenz und dem Belastungserleben wurden mit einem Strukturgleichungsmodell modelliert, in dem das jeweilige Belastungserleben auf das Produkt aus dem Erleben von Zielkonflikten und der gewählten Handlung regressiert wurde.

Ergebnisse

Vorab sei berichtet, dass Belastungserleben in der Schule, beim Leistungssport und in der Freizeit moderat miteinander korrelierten (r ϵ [.31-.47], p < .001) und damit nicht unabhängig voneinander ist, jedoch auch ein lebensbereichspezifisches Belastungserleben angenommen werden kann. Im Strukturgleichungsmodell (Χ² = 39.83, df = 36; CFI = .994; TLI = .992; RMSEA = .029; SRMR = .034) zeigte sich konsistent zur Theorie, dass Schülerinnen und Schüler von einem erhöhten Belastungserleben in der Schule berichten, wenn bei bestehenden Zielkonflikten zwischen Schule- Leistungssport und Schule Freizeit sie sich für den Leistungssport und für die Freizeit entscheiden. Im Leistungssport war das Belastungserleben erhöht, wenn bei bestehenden Zielkonflikten zwischen Leistungssport-Freizeit und Leistungssport-Schule die Schülerinnen und Schüler sich für die Freizeit entscheiden. Eine Entscheidung für die Schule war hingegen nicht mit erhöhtem Belastungserleben im Leistungssport assoziiert. Belastungserleben in der Freizeit schließlich war erhöht, wenn Schülerinnen und Schüler sich bei Zielkonflikten zwischen Freizeit-Leistungssport und Freizeit-Schule für den Leistungssport entschieden. Eine Entscheidung für die Schule war auch hier nicht mit erhöhtem Belastungserleben in der Freizeit assoziiert.

 
11:15 - 13:00F11‒S24: Computergestütztes Lehren und Lernen in der beruflichen Bildung
S24 
 

Computergestütztes Lehren und Lernen in der beruflichen Bildung

Chair(s): Stephan Abele (TU Dresden), Stephan Schumann (Universität Konstanz)

DiskutantIn(nen): Dirk Ifenthaler (Universität Mannheim)

Aufgrund des dynamischen Wandels der Arbeitswelt spielt Digitalisierung in der beruflichen Bildung im Vergleich zu anderen Bildungsbereichen eine besonders wichtige Rolle. Vor diesem Hintergrund adressiert das Symposium auf einer generellen Ebene die Digitalisierung von Lehr-Lern-Prozessen in der beruflichen Bildung. Angesichts der vergleichsweise geringen wissenschaftlichen Erschließung der berufsbildenden Domäne sind die Ziele des Symposiums bewusst breit angelegt: Erstens werden Effekte computerbasierter Lehr-Lern-Umgebungen in der kaufmännischen und gewerblich-technischen Ausbildung mithilfe zweier quasi-experimenteller Studien untersucht und damit zwei zentrale Berufsfelder adressiert (Beiträge von Spener & Schumann sowie von Leon & Abele). Zweitens widmet sich das Symposium der theoriegestützten Entwicklung und Evaluation digitaler Umgebungen (Tools), die eine valide Diagnostik individueller Lernstände und Lernverläufe sowie eine bedarfsgerechte Unterstützung ermöglichen sollen (Beiträge von Warwas & Kärner sowie von Rausch et al.). Im Zentrum stehen somit Fragen, ob und unter welchen Bedingungen digitale Lehr-Lern-Umgebungen effektives Lernen in der beruflichen Ausbildung ermöglichen, und wie Computerumgebungen für individuelles Lernen und adaptives Lehren genutzt werden können, womit angesichts der äußerst heterogenen Schülerschaft an berufsbildenden Schulen zentrale Herausforderungen aufgegriffen werden.

(1) Spener und Schumann präsentieren in ihrem Beitrag die Befunde einer quasi-experimentelle Studie mit kaufmännischen Auszubildenden (n≈400). Im Mittelpunkt steht die Frage, ob mit dem Einsatz einer integrierten Unternehmenssoftware im berufsschulischen Unterricht das Geschäftsprozesswissen in der kaufmännischen Ausbildung effektiv gefördert werden kann. Vorgestellt werden die Effekte von vier Interventionsbedingungen. Die aktuell vorliegenden Ergebnisse zeigen zwar einen erwartbaren Anstieg des Geschäftsprozesswissens, jedoch keine substanzielle Überlegenheit einer der verglichenen Gruppen. Jedoch deutet sich an, dass v.a. leistungsstärkere Auszubildende vom Einsatz der Unternehmenssoftware profitieren.

(2) Leon und Abele untersuchen bei gewerblich-technischen Auszubildenden in einer ebenfalls quasi-experimentellen Studie (n≈300), welche Wirkungen computerbasiertes Feedback vs. Lehrpersonenfeedback auf den Erwerb von problemlöserelevantem Wissen und der Problemlösefähigkeit im Bereich der Elektrotechnik haben. Das Treatment wurde jeweils in einer nach dem Four-Component-Instructional-Design-Ansatz (van Merriënboer & Kirschner, 2017) gestalteten Lernumgebung umgesetzt. Die bislang zur Verfügung stehenden Daten legen nahe, dass das Lehrerfeedback effektiver ist als das Computerfeedback. Differenzielle Analysen deuten an, dass motivierte Lernende in beiden Bedingungen ähnlich viel lernen, wogegen weniger Motivierte beim Computerfeedback weniger lernen als beim Lehrerfeedback.

(3) Im Mittelpunkt der Studie von Warwas und Kärner stehen das didaktische Potential und erste Befunde zur Qualität eines Teachers' Diagnostic Support Systems (TDSS). TDSS ist eine von den Autoren entwickelte digitale Umgebung für die kontinuierliche Diagnose von Lernständen und Erlebensqualitäten, die Echtzeiteingaben und -analysen erlaubt und damit Lehrpersonen dabei unterstützen kann, Lernende im Unterricht trotz Zeitdruck auf der Basis einer validen Diagnostik bedarfsgerecht einzuschätzen und zu fördern. Die befragten Lehrkräfte beruflicher Schulen attestierten TDSS eine hohe Bedienerfreundlichkeit und Nützlichkeit.

(4) Rausch et al. diskutieren die Potenziale und Konzeption einer computerbasierten Arbeitsplatzsimulation zur Förderung der Problemlösekompetenz kaufmännischer Auszubildender. Vorgestellt werden die Konzeption der Software-Architektur sowie die Anforderungen an die Definition von Problemszenarien und sogenannter Scoring Rubrics. Der Fokus liegt auf der Implementierung einer logdatenbasierten Echtzeitanalytik, anhand derer sowohl den Lehrerinnen und Lehrern als auch den Lernenden valide Rückmeldungen zum Lernprozess gegeben und Lernhilfen während der Problembearbeitung bedarfsgerecht zur Verfügung gestellt werden können.

Die Interventionsstudien (Beiträge 1 und 2) legen nahe, dass berufliche Kompetenzen mit computerbasierten Lehr-Lern-Umgebungen effektiv gefördert werden können, wobei das nur unter spezifischen Bedingungen zu gelten scheint. Die Ergebnisse beider Interventionsstudien deuten an, dass derartige Lern- und Feedbackumgebungen mit Nachteilen für lernschwächere Auszubildende einhergehen können, was u.a. dafür sensibilisiert, bei der Gestaltung solcher Umgebungen v.a. auch die Bedarfe lernschwacher Auszubildender zu berücksichtigen. Diese Befunde machen darauf aufmerksam, dass die „Digitalisierung“ von Bildungsprozessen „Matthäus-Effekte“ verschärfen kann. Die Beiträge zu den Computerumgebungen mit Echtzeitanalyse zeigen Wege auf, wie die individuellen Bedürfnisse im Lernprozess systematisch beachtet und damit die Lernpotentiale in heterogenen Lerngruppen optimal genutzt werden können.

 

Beiträge des Symposiums

 

Der Einsatz von integrierter Unternehmenssoftware und expliziter Modellierung zur Förderung des Geschäftsprozesswissens kaufmännischer Auszubildender

Claudio Spener, Stephan Schumann
Universität Konstanz

Ausgehend von ihrer Rolle als betriebswirtschaftliches Organisationsprinzip hat sich die Geschäftsprozessorientierung zu einem immer bedeutsamer werdenden Gestaltungsprinzip in der kaufmännischen Bildung entwickelt (Busian, 2006; Schlicht, 2019; Tramm, 2009). Der Einsatz von integrierter Unternehmenssoftware, den sogenannten ERP-(Enterprise-Ressource-Planning)-Systemen, ist heute in der Mehrzahl der mittelständischen und großen Unternehmen zentraler Bestandteil der Planung, Steuerung und Kontrolle betrieblicher Abläufe (Gadatsch, 2012; Mertens et al., 2017; Zimmermann, 2016). Dem ERP-Einsatz wird im kaufmännischen Unterricht in der beruflichen Schule als Ausgestaltung einer geschäftsprozessorientierten Didaktik das Potential zur Förderung des Geschäftsprozesswissens zugesprochen, insbesondere bei dem begleitenden Einsatz von Modellierungstechniken wie den Ereignisgesteuerten Prozessketten [EPKs] (Arndt, 2006; Frötschl, 2015; Häuber, 2009). EPKs beschreiben den Ablauf des Prozesses mithilfe von Ereignissen (z. B. „Ware ist eingetroffen“), die im Unternehmen Aktivitäten (z. B. „Wareneingang prüfen“) auslösen, die wiederum Ereignisse zur Folge haben (z. B. „Wareneingang ist geprüft“). Theoretisch lässt sich die Förderung des Geschäftsprozesswissens durch das Lernhandeln in und an den im ERP-System abgebildeten bzw. explizit modellierten Geschäftsprozessen in der Tradition der Handlungsorientierung (Aebli, 1980, 1981; Hacker, 1978; Resch, 1988; Volpert, 1983; vgl. Tramm, 2009) und der Sensory Semantic Theory (Achtenhagen & Getsch, 2000; Arndt, 2006; Getsch & Preiß, 2003; Nelson, 1979) bzw. der Cognitive Theory of Multimedia Learning (Mayer, 1989, 2005; Soffer, Kaner & Wand, 2012) begründen. Empirisch sind die Annahmen zur Wirksamkeit des ERP- und/oder EPK-Einsatzes bislang jedoch kaum geprüft (Frötschl, 2015; Schlicht, 2019). Für den berufsschulischen Einsatzbereich liegt nur eine Studie mit Kontrollgruppendesign vor: Im Querschnitt vergleicht Zardini (2012) die Employability (Beschäftigungsfähigkeit) angehender Bürokaufleute (n=120) in der dualen und der vollzeitschulischen Ausbildung mit und ohne den Einsatz von ERP und der Prozessmodellierung (EPK). Vorteile für die Versuchsgruppe (ERP+EPK) zeigen sich nur für das Konstrukt der analytischen Problemlösefähigkeit, hier könnte (bei Annahme vergleichbarer Eingangsvoraussetzungen) der Einsatz der Prozessmodellierung zu einem verbesserten Geschäftsprozessverständnis geführt haben. Sonstige Studien haben, wenn überhaupt, evaluativen Charakter.

Als Forschungsdesiderat wird neben der generellen Frage nach dem Stellenwert des ERP-Einsatzes im Unterricht (Busian, 2011; Schlicht, 2019) auf den vermuteten Effekt des kombinierten Einsatzes von ERP-Systemen und der Prozessmodellierung hingewiesen (Getsch & Preiß, 2003). Die Studie untersucht vor diesem Hintergrund diese Effekte mittels eines quasiexperimentellen Pre-/Posttest-Designs mit Industriekaufleuten (n≈240) und Einzelhandelskaufleuten (n≈160) im 2. Ausbildungsjahr an 12 Beruflichen Schulen in Baden-Württemberg. In der neun Einzelstunden umfassenden Intervention wird der Basis-Geschäftsprozess thematisiert. Dabei werden bei den Industriekaufleuten mit 2x2 Interventionsbedingungen die verbreiteten Materialien (ERP ohne Prozessmodellierung mittels EPK, vgl. Hahn & Häuber, 2014), deren Ergänzung um die Prozessmodellierung (ERP+EPK), die alleinige Modellierung (EPK) sowie als weitere Gruppe die „übliche“ schulische Praxis (no Treatment) verglichen. Die Einzelhandelskaufleute werden in zwei Gruppen (ERP vs. no-Treatment) aufgeteilt.

In den beiden ERP-Versuchsgruppen der Industriekaufleute (mit/ohne EPK) liegen die Daten zum gegenwärtigen Zeitpunkt vollständig vor. Die IRT-skalierten Leistungsdaten des Geschäftsprozesswissens zeigen für die Entwicklung des WLE-Schätzers keinen signifikanten Interaktionseffekt zwischen dem Messwiederholungsfaktor und der Gruppenzugehörigkeit (F(1, 114) = 2.79, p = .098, partielles η2 = .024). Der Haupteffekt der Intervention ist signifikant (F(1, 114) = 10.66, p = .001, partielles η2 = .086). Moderiert wird der Anstieg des Geschäftsprozesswissens durch die BWL-Note des 1. Lehrjahrs (F(1, 114) = 4.55, p = .035, partielles η2 = .038): Vor der Intervention unterschieden sich nur die Mittelwerte der WLE-Schätzer der Auszubildenden, die als BWL-Note eine 3 oder schlechter angaben (M3+ = .265), signifikant von denjenigen mit einer 2 (M2 = .641) und einer 1 (M1 = .894); nach der Intervention alle drei voneinander (M3+ = .398; M2 = .827; M1 = 1.435; p < .05). Diese Ergebnisse deuten darauf hin, dass von dem Einsatz von ERP-Systemen vor allem leistungsstärkere Auszubildende profitieren – unabhängig davon, ob der ERP-Einsatz von der Prozessmodellierung flankiert wurde oder nicht (Leistung über Fachnote erfasst). Folgeanalysen werden derartigen ATI-Effekten verstärkt nachgehen.

 

Computerbasiertes Erlernen beruflichen Problemlösens – unterschiedliche Feedbackformen, unterschiedliche Lerneffekte?

Andreas Leon, Stephan Abele
TU Dresden

Angesichts des Forschungsstands (z.B. Hattie & Wollenschläger, 2014) wird unterstellt, dass Feedback das computergestützte Erlernen beruflichen Problemlösens substantiell beeinflusst. Wenig untersucht ist die Frage, die sich Lehrkräften im Kontext digitalen Lernens stellt: Wie sollte Feedback im computerbasierten Unterricht aussehen? Möglich ist es, Feedback im Klassenkontext und ähnlich wie im traditionellen Unterricht zu geben. Im Vergleich dazu ist ein Feedback via Computer eher aufwändig, aber potentiell individueller und mit Blick auf den digitalen Wandel der Berufs- und Lebenswelt wohl auch mit einer höheren Akzeptanz verbunden. Aus Forschungssicht wäre ein intelligentes, adaptives computerbasiertes Feedback wünschenswert (Narciss, 2008), aus praktischer Sicht ist ein solches Feedback gegenwärtig aber eher unrealistisch, weil es kaum entsprechende Softwarelösungen gibt. Unter gleichzeitiger Berücksichtigung des Forschungsstands und der Unterrichtspraxis beschäftigt sich der Beitrag mit den Effekten eines Lehrer- und Computerfeedbacks in einer digitalen Lernumgebung zur Förderung beruflichen Problemlösens in der Domäne „Elektrotechnik“. Untersucht wird, ob sich die Effekte beider Feedbackformen unterscheiden und inwiefern die Effekte von Lernendenvoraussetzungen abhängen.

Die Lernumgebung wurde in Orientierung am Four-Component-Instructional-Design-Ansatz (van Merriënboer & Kirschner, 2017) entwickelt und beinhaltet 12 Lernprobleme (entwerfen und analysieren authentischer elektrischer Schaltungen), die sich auf drei nach aufsteigender Komplexität angeordneten Lernklassen verteilen. Die Umgebung enthält Links zu Erklärvideos (Strategieerwerb) und berufstypischen Informationsmaterialien (Wissenserwerb) sowie Übungsaufgaben zu häufig wiederkehrenden Anforderungen (Fertigkeitserwerb). Beim Computerfeedback konnten die Lernenden direkt nach der Bearbeitung eines Lernproblems eigenständig auf das Feedback bzw. digitale Musterlösung sowie erläuternde Informationen zugreifen. Beim Lehrerfeedback erhielt die gesamte Klasse nach Bearbeitung mehrerer Lernprobleme zu definierten Zeitpunkten eine strukturierte Rückmeldung anhand eines vorgefertigten Skripts sowie Antworten auf individuelle Fragen. Es wurde jeweils ein erklärendes Feedback (Musterlösung mit kommentiertem Lösungsweg) nach Butler et al. (2013) gegeben.

Angenommen wurde, dass die Wirkung beider Feedbackformen vom Lernpotential, d.h. den kognitiven (Vorwissen, IQ) und motivationalen Voraussetzungen der Lernenden abhängt: Bei „Lernschwächeren“ sollte das Lehrerfeedback wirksamer sein als das Computerfeedback, da die Lehrkraft die Lernenden durch das Feedback „führt“, was die Selbstregulierungsanforderung, das Überforderungsrisiko und die kognitive Belastung (Sweller et al., 2011) minimiert. „Lernstärkere“ sollten dagegen eher vom Computerfeedback profitieren, da es ein individuelles Lerntempo und Autonomieerleben ermöglicht (Deci & Ryan, 1985). Da beide Feedbackformen lernbezogene Vor- und Nachteile aufweisen, wurde keine Hypothese zum generellen Effekt formuliert, sondern exploratorisch untersucht, ob eine Feedbackform effektiver ist.

Es wurde eine quasi-experimentelle Studie in einem Prä-Post-Test-Design mit zwei Gruppen (Lehrkraft- vs. Computerfeedback) durchgeführt und eine Gelegenheits- sowie Klumpenstichprobe (N=300, 9 Klassen, 1. Ausbildungsjahr, Elektro- und Metallberufe) gezogen. Erfasst wurden der Lernerfolg (Wissen, Problemlösen), Intelligenz, Motivation und Vorwissen (α>.74). Die Intervention dauerte inklusive Feedback 210 min.

Aufgrund einer zeitlich gestuften Erhebung wurden bislang Daten von 213 Probanden ausgewertet. Bezogen auf die Lernvoraussetzungen unterschieden sich die Gruppen nicht. Nach der Intervention schnitt die Lehrerfeedback-Gruppe besser ab als die Computerfeedback-Gruppe (F(1, 199)=8.09, p<.01, dcorr=.28). Bezogen auf die kognitiven Voraussetzungen offenbarten die Moderatoranalysen keine, bezogen auf die Motivation schwache differenzielle Effekte (F(1, 194)=5.10, p<.05, R²change=.02): Wenig Motivierte profitierten demnach stärker vom Lehrerfeedback als Motivierte. Die Analyse der region of significance (Hayes, 2014, S. 238 ff.) belegte, dass sich die Effekte der Feedbackformen im oberen Motivationsbereich nicht mehr unterscheiden. Allerdings kehrte sich der Effekt nicht um, d.h. das Computerfeedback war bei sehr Motivierten nicht effektiver als das Lehrerfeedback.

Die Studie zeigt, dass sich die Effekte erklärenden Feedbacks bereits bei einer relativ kurzen Interventionszeit abhängig von der Darbietungsform substantiell unterscheiden können und computerbasiertes Feedback für wenig Motivierte lernhinderlich sein kann. Es werden Implikationen für die Feedbackgestaltung, Unterschiede beider Feedbackformen und daran anknüpfend potentielle Gründe der Effektunterschiede diskutiert. Denkbar ist z.B., dass Motivation die Nutzungsintensität des Computerfeedbacks beeinflusst und wenig Motivierte deshalb beim Computerfeedback weniger lernen als beim Lehrerfeedback, was in einer Replikationsstudie mit Logfileanalysen untersucht wird.

 

Unterrichtsbegleitende Erfassung von Lernständen und Erlebensqualitäten: Evaluation eines Client-Server-basierten Unterstützungssystems für Lehrkräfte

Julia Warwas1, Tobias Kärner2
1Universität Göttingen, 2Universität Konstanz

Um didaktischen Gestaltungsaufgaben wie der Schaffung adaptiver Lernumgebungen (z. B. Brühwiler & Blatchford, 2011) oder der Gewährung individueller Rückmeldungen und konstruktiver Hilfestellungen (z. B. Hattie & Wollenschläger, 2014; Minnameier et al., 2015) gerecht zu werden, bedarf es formativer Assessments (im Überblick z.B. Schütze et al., 2018). Digitale Systeme, die Lehrkräfte bei der Erfüllung dieser Aufgaben unterstützen, sind gegenwärtig jedoch an deutschen Schulen lediglich ansatzweise in Gebrauch (vgl. die Beiträge in Hasselhorn et al., 2014). Dies unterstreicht auch eine systematische Sichtung der Funktionsumfänge marktgängiger digitaler Anwendungen (Kärner et al., 2019). Sie lässt erkennen, dass Systemfunktionen zur gezielten Analyse, Integration und Darstellung verschiedener unterrichts- und schülerbezogener Informationen aktuell unterrepräsentiert sind. Im Regelfall sammeln Lehrkräfte diagnostische Informationen, die unmittelbar für didaktische Maßnahmen der Lernbegleitung und -unterstützung verwertet werden könnten, nach wie vor nur beiläufig und routinebasiert durch subjektive Spontaneindrücke. Unterstützungsbedürftig scheint diese gängige Praxis jedoch angesichts empirischer Hinweise auf unzureichende diagnostische Kompetenzen von Lehrpersonen bzgl. nicht-kognitiver Merkmale ihrer Schüler/innen (z.B. Südkamp, Praetorius & Spinath, 2017; Stang & Urhahne, 2016) sowie auf eine erhöhte Fehleranfälligkeit diagnostischer Urteile in laufenden Unterrichtsprozessen, in denen u.a. Zeit- und Handlungsdrücke sowie die beschränkte Beobachtbarkeit lernrelevanter Erlebensqualitäten (bspw. situative Interessiertheit) die Informationsverarbeitung der Lehrkräfte erheblich erschwert (Warwas et al., 2015).

Vor diesem Hintergrund berichten wir Konstruktionsprinzipien und Evaluationsbefunde eines digitalen Unterstützungssystems für kontinuierliche Diagnosen von Lernständen und Erlebensqualitäten, das unter der Zielstellung entwickelt wurde, bei einem unterrichtsbegleitenden Einsatz sowohl informatorisch reichhaltig als auch flexibel und ökonomisch handhabbar zu sein. Das als Client-Server-Modell implementierte Teachers' Diagnostic Support System (TDSS; Kärner et al., eingereicht) erlaubt die Erfassung schüler- sowie lernkontextbezogener Informationen und bietet verschiedene Analyse- und Darstellungsoptionen in Echtzeit, um die erhobenen Daten zu verdichten und aufeinander zu beziehen. Hierzu gehören etwa schülerindividuelle Entwicklungsverläufe oder unterrichtliche Erlebensqualitäten in Abhängigkeit von unterrichtlichen Sozialformen.

Im Frühjahr 2019 wurde die Bedienerfreundlichkeit und Nützlichkeit einer Prototyp-Version des TDSS durch praktizierende Lehrkräfte an beruflichen Schulen in Bayern und Niedersachsen einer ersten Prüfung unterzogen (14 Teilnehmer/innen; 4 männlich, 10 weiblich; Ø 34 Jahre alt; Ø 6 Jahre Berufserfahrung). Alle Lehrkräfte füllten einen für Anwendungszweck und -kontext des TDSS adaptierten Fragebogen aus, der mittels geschlossener und offener Fragekategorien zentrale Design-Standards der ISO (International Organization for Standardization, 9241 Teil 10) für Softwareprogramme mit grafischen Benutzeroberflächen widerspiegelt. Im Einzelnen sind die Kriterien Aufgabenangemessenheit, Selbstbeschreibungsfähigkeit, Steuerbarkeit, Erwartungskonformität, Fehlerrobustheit, Individualisierbarkeit sowie Erlernbarkeit einzuschätzen (Hamborg & Gediga, 2002). Im Ergebnis zeigen sich überwiegend positive Beurteilungen des TDSS, die sich auf einer fünfstufigen Antwortskala im Bereich von 3.73 für die Aufgabenangemessenheit bis 4.55 für die Fehlerrobustheit bewegen. Eine Sichtung der offenen Antworten lässt Wünsche u. a. bzgl. einer Optimierung der Menüführung, zusätzlicher Speicher- und Abrufmöglichkeiten für hinterlegte Dokumente (z. B. Sitzpläne, Notenlisten) sowie mehr Freiheiten für lehrpersonenindividuelle Systemkonfigurationen erkennen.

Der Beitrag erörtert zum einen, welche Konsequenzen aus der Evaluationsstudie für die Weiterentwicklung des Diagnoseunterstützungssystems gezogen werden können. Zum anderen setzt er sich mit unterrichtspraktischen Implikationen der Systemnutzung unter organisatorischen und didaktischen Gesichtspunkten auseinander.

 

Problem Solving Analytics (PSA) – Konzeption einer logdatenbasierten Echtzeitrückmeldung beim Lernen in einer computerbasierten Bürosimulation

Andreas Rausch1, Jürgen Seifried1, Viola Deutscher1, Esther Winther2, Steffen Brandt3
1Universität Mannheim, 2Universität Duisburg-Essen, 3opencampus.sh, Kiel

Der Beitrag diskutiert die Potenziale und Konzeption einer computerbasierten Bürosimulation zur Förderung der Problemlösekompetenz kaufmännischer Auszubildender. Der Fokus liegt auf der Implementierung einer logdatenbasierten Echtzeitanalytik, die unter anderem automatisierte Hilfestellungen während der Problembearbeitung ermöglicht.

Kaufmännische Arbeitsplätze wiesen lange Zeit hohe Anteile repetitiver Routinetätigkeiten auf, die jedoch zunehmend automatisiert oder ausgelagert werden. Daher rückt die Bewältigung komplexer Problemstellungen stärker in den Fokus kaufmännischen Handelns (Autor, Levy & Murnane, 2003; Bonin, Gregory & Zierahn, 2015; Brötz et al., 2014; Frey & Osborne, 2017; Zehnhäusern & Vaterlaus, 2017; Zobrist & Brandes, 2017). Problemstellungen im kaufmännischen Kontext sind i. d. R. analytische Probleme (Leutner et al., 2005) und üblicherweise Metaprobleme (Jonassen, 2000), die sich als Bündel verschiedener Problemtypen (z. B. algorithmische Probleme, Diagnoseprobleme, Entscheidungsprobleme etc.) darstellen. Diese authentischen, analytischen Metaprobleme variierender Komplexität (Dörner, 1996; Funke, 2003) bezeichnen wir als Problemszenarien. In der Berufsausbildung gibt es allerdings nur wenige Möglichkeiten, solche Problemszenarien selbstständig zu bearbeiten. Ziel des durch das BMBF geförderten Projekts „Problemlöseanalytik in Bürosimulationen (PSA-Sim)“ ist es daher, authentische Problemszenarien für die kaufmännische Ausbildung zu entwickeln, die in einer computerbasierten Bürosimulation bearbeitet werden. Eine logdatenbasierte Echtzeitanalyse ermöglicht die Identifikation individueller Strategien, Fortschritte und Fehler im Problemlöseprozess (Rausch et al., 2017). Auf Basis dieser Analytik werden individualisierte und automatisierte Hilfestellungen i. S. e. Scaffolding ermöglicht (z. B. Informationen zu Fachtermini, Rechenalgorithmen etc.), die den Problemlöseprozess fördern sollen. Der Beitrag geht der Frage nach, wie diese logdatenbasierten Hilfestellungen aus technischer und fachdidaktischer Sicht zu konzipieren sind.

Die dem Projekt PSA zugrundeliegende Software-Architektur weist vier Komponenten auf. (1) Die Bearbeitung der Problemszenarien durch die Lernenden erfolgt in einer simulierten Büroumgebung („PSA-Office“), die typische Werkzeuge wie E-Mail-Client, Ordnerstruktur, Tabellenkalkulationsprogramm, Taschenrechner, Notizblock sowie ein rudimentäres ERP-System (Enterprise-Ressource-Planning) bereitstellt. (2) Der PSA-Editor erlaubt das Einpflegen neuer Problemszenarien, die aus einem Bündel relevanter und irrelevanter Dokumente (Geschäftsbriefe, Rechnungen, Berechnungsschemata etc.) sowie szenarienspezifischen Scoring Rubrics bestehen. (3) Im PSA-Manager werden aus einer Szenariendatenbank ein oder mehrere Szenarien für ein Lernprojekt ausgewählt und konfiguriert. (4) Während des Einsatzes wird den Lehrenden im so genannten „PSA-Cockpit“ (Dashboard) eine visuell aufbereitete Echtzeitanalytik der Problembearbeitung ihrer Lernenden auf Basis von Logdaten bereitgestellt. Lehrende haben dann die Möglichkeit, über verschiedene Kommunikationskanäle individualisierte Hilfestellungen und Rückmeldungen bereitzustellen.

Auch die Konzeption automatisierter Hilfestellungen basiert auf einer automatisierten und prozessbegleitenden Logdaten-Analyse. Hierbei sind verschiedene konzeptionelle Ansätze unterscheidbar. Die Analyse orientiert sich inhaltlich zum einen an den szenariospezifischen Scoring Rubrics. Werden bspw. definierte Teilziele (Meilensteine) bis zu einem bestimmten Zeitpunkt nicht erreicht, können vordefinierte Hilfen (z. B. die vorbereitete E-Mail einer hilfsbereiten Kollegin) ausgelöst werden. Ferner kann bei der Anwendung von domänenspezifischen Algorithmen (z. B. Berechnung eines Einstandspreises im Rahmen der Lieferantenauswahl) anhand der Logdaten leicht überprüft werden, ob die Berechnung korrekt ist, da eine bestimmte Zelle der Tabellenkalkulation einen bestimmten Wert aufweisen muss. Außerdem können auf Basis fachdidaktischer Erfahrungen typische Fehler anhand der Logdaten identifiziert werden und Hilfen auslösen. Typische Fehler bei der Berechnung von Einstandspreisen sind die Verwendung des Bruttopreises oder die falsche oder fehlende Berücksichtigung von Skonti, Rabatten etc. Die aus den typischen Fehlern resultierenden Logdaten (d. h. die entsprechenden Werte) können dann entsprechende Hilfen auslösen. Darüber hinaus können allgemeine, szenarioübergreifende Verhaltensweisen wie bspw. „Gaming“ identifiziert werden und spezifische Hilfen auslösen. Schwieriger gestaltet sich die Identifikation von Lösungsprozessen und Fehlern im Bereich des Abwägens qualitativer Argumente wie bspw. der Berücksichtigung von Lieferzeiten, Qualitätsunterschieden oder ökologischen Aspekten bei der Lieferantenauswahl. Mit Hilfe von Pilotstudien mit Think-Aloud-Protokollen werden die Interpretationen der Logdaten auf ihre kognitive Validität hin überprüft. Von der einsatzreifen Software wird erwartet, dass sie das Lernen aus der Bearbeitung domänenspezifischer Problemszenarien fördert, weil Rückmeldungen automatisiert, zeitnah und zielgerichtet erfolgen.

 
11:15 - 13:00F11‒S25: „Sind die Beziehungen gut, stimmt auch das Klima“: Die Rolle der Lehrkraft bei der Förderung positiver Sozialbeziehungen und eines positiven Sozialklimas in der Klasse
S25 
 

„Sind die Beziehungen gut, stimmt auch das Klima“: Die Rolle der Lehrkraft bei der Förderung positiver Sozialbeziehungen und eines positiven Sozialklimas in der Klasse

Chair(s): Eveline Gutzwiller-Helfenfinger (Universität Duisburg-Essen, Schweiz), Katrin Hahn-Laudenberg (Universität Wuppertal)

DiskutantIn(nen): Eveline Gutzwiller-Helfenfinger (Universität Duisburg-Essen)

Stabile Beziehungen zwischen Kindern/Jugendlichen und Erwachsenen, insbesondere Lehrkräften, sind bedeutsam für deren positive akademische, soziale und persönliche Entwicklung (Sabol & Pianta, 2012). Jennings & Greenberg (2009) schreiben der Lehrkraft in ihrem Modell des „prosocial classroom“ eine zentrale Rolle bei der Gestaltung und Förderung eines positiven Klassenklimas sowie positiver Sozialbeziehungen zwischen Schüler*innen zu. Neben grundlegenden sozio-emotionalen Kompetenzen wie z.B. „relationship skills“ (Jennings & Greenberg, 2009) spielen auch Haltungen und Verhalten von Lehrkräften eine wichtige Rolle, da diese die Qualität der Sozialbeziehungen unter den Schüler*innen beeinflussen (vgl. Johnson, 1981). Zudem tragen Lehrkräfte eine Mitverantwortung für deren Ausgestaltung, was bedingt, dass sie willens und fähig sein müssen, den Aufbau positiver Sozialbeziehungen zwischen ihren Schüler*innen und somit ein positives Sozialklima zu befördern (Gutzwiller-Helfenfinger, in Vorb.). In Anlehnung an einschlägige Forschung definieren wir im vorliegenden Symposium ein positives Sozial- resp. Klassenklima als positive Sozialbeziehungen zwischen Schüler*innen, zwischen Schüler*innen und Lehrkräften (vgl. Jennings & Greenberg, 2009) sowie als das Vorhandensein von Respekt und Toleranz (Gutzwiller-Helfenfinger & Ziemes, 2017).

Um auch die negative Ausprägung schulischer Sozialbeziehungen zu berücksichtigen, wird im Symposium ein besonderes Augenmerk auf Bullying gelegt. In der Schule wird von Bullying gesprochen, wenn in einer Gruppe von Schüler*innen einzelne Kinder/Jugendliche unter Ausnutzung eines Machtgefälles wiederholt absichtlich geschädigt werden (vgl. Olweus, 1993). Während die frühe Bullyingforschung auf die Täter-Opfer-Dyade fokussierte, wird heutzutage auch der soziale Kontext betrachtet. In der Schule betrifft dies zunächst die Schulklasse. Dabei wird deutlich, dass die Möglichkeit zu Bullying einerseits eng verknüpft ist mit den Sozialbeziehungen in der Klasse, andererseits Bullying als sozialer Gruppenprozess durch Prozesse der Viktimisierung auch enorme Auswirkungen auf die soziale Gruppe hat. Entsprechend kommt Lehrkräften eine entscheidende Funktion zu. Gelingt es ihnen, in ihren Schulklassen dauerhaft eine Atmosphäre von Respekt und Toleranz zu etablieren, wirken sie so auch Bullying-Prozessen entgegen (vgl. Guerra, Williams & Sadek, 2012). Zeigen sie sich dieser Aufgabe gleichgültig gegenüber, wird das Tor für Prozesse wie Bullying, Viktimisierung oder Ausgrenzung geöffnet. Dabei zeigt sich konsistent, dass sich Bullying negativ auf akademische und psychosoziale Outcomes bei Schüler*innen auswirkt (vgl. Gini & Pozzoli, 2013) und die Haltungen und das Verhalten der Lehrpersonen gegenüber Bullying dessen Entstehen und Aufrechterhaltung beeinflussen (vgl. Veenstra et al., 2014).

Im Symposium wird die Rolle von Lehrkräften bei der Förderung positiver Sozialbeziehungen und eines positiven Sozialklimas in der Klasse näher beleuchtet. Die ersten beiden Beiträge widmen sich der diagnostischen Kompetenzen von Lehrkräften im Umgang mit Bullying. Beitrag 1 untersucht, wie gut es Lehrkräften (n = 210) gelingt, Schüler*innen (n = 5768) in verschiedenen Rollen des Bullying-Prozesses zu erkennen und welche Merkmale der Lehrkraft bzw. der Klassenkomposition mit diagnostischer Kompetenz in Zusammenhang stehen. Beitrag 2 untersucht anhand der Daten von 172 Jugendlichen der 7.-10. Klasse und ihren Lehrkräfte, wie gut letztere Täter und Opfer von Bullying (online, offline) diagnostizieren und ob Merkmale der Lehrkräfte und Lernenden diese Urteile vorhersagen können. In Studie 3 wird der Zusammenhang zwischen Schulklima und dem Entscheidungsmodell für Hilfeverhalten bei Bullying an einer Stichprobe von 417 Schüler*innen zwischen 12 und 16 Jahren untersucht. Beitrag 4 untersucht an den nordrhein-westfälischen Daten der International Civic and Citizenship Education Study 2016 (Abs & Hahn-Laudenberg, 2017; Schulz et al., 2017) den spezifischen Beitrag des schulischen Sozialklimas für die Vorhersage von Toleranz bei 1.451 Achtklässler*innen an 59 Schulen.

Unter Einbezug qualitativer und quantitativer methodischer Zugänge, unterschiedlicher Stichproben und Informant*innen zeigen die Befunde insgesamt, dass die Kompetenzen der Lehrkräfte bezüglich Diagnostik und Förderung von Sozialbeziehungen deren Qualität beeinflusst. Daraus ergeben sich wichtige Implikationen für die Aus- und Weiterbildung von Lehrkräften sowie die Gestaltung des schulischen (Sozial-)Lebens.

 

Beiträge des Symposiums

 

„Was geht in meiner Klasse ab?“ Zur diagnostischen Kompetenz von Lehrkräften bei Bullying-Prozessen

Sarah Körtge, Andreas Durban, Udo Käser
Rheinische Friedrich-Wilhelms-Universität Bonn

Im Sinne des participant-role-Ansatzes (Salmivalli et al., 1996) genügt es bei Bullying nicht, nur zwischen Tätern und Opfern zu unterscheiden. Vielmehr liegt ein komplexes soziales System vor, bei dem zwischen Tätern, Assistenten, Verstärkern, Opfern, Verteidigern und Außenstehenden differenziert werden muss und Mehrfachrollen möglich sind. Die Übernahme der verschiedenen Rollen ist funktional und befriedigt unterschiedliche Motive der beteiligten Schülerinnen und Schüler. So liegt z. B. dem Verhalten von Außenstehenden, die sich aktiv von Bullying-Situation fernhalten, oft das Ziel zugrunde, nicht unbeliebt zu sein, während Täterverhalten in aller Regel ein Machtmotiv befriedigt (Slee, 2017).

Bullying-Prozessen entgegen zu wirken, ein gemeinsames Miteinander zu etablieren, das durch Respekt gekennzeichnet ist, soziale Fähigkeiten von Schülerinnen und Schülern zu verbessern – all dies ist integraler Bestandteil jedweder Arbeit von Lehrkräften im Rahmen ihrer Aufgabe, Schülerinnen und Schüler zu erziehen, zu beraten, zu betreuen und umfassend zu fördern (vgl. z. B. Ministerium für Schule und Bildung NRW, 2019). Zur Intervention bei Bullying im Speziellen liegen verschiedene, z. T. gut evaluierte Programme vor (z. B. OBPP, NoTrap!, ViSC oder KiVa; vgl. Gaffney, Farrington & Ttofi, 2019), für die ein Einblick in die Sozialstruktur einer Klasse letztlich immer wichtig und hilfreich ist. Dies gilt umso mehr, wenn – wie es in Deutschland die Regel ist – Lehrkräfte in ihrem pädagogischen Alltag ohne externe Unterstützung gegen Bullying vorgehen müssen.

Wie ist es aber um die diagnostische Kompetenz von Lehrkräften bei Bullying-Prozessen bestellt? Diese Frage wurde im Rahmen einer Studie analysiert, an der 5768 Schülerinnen und Schüler aus 210 Schulkassen der Jahrgangsstufen 6 und 9 verschiedener Schulformen sowie ihre Klassenlehrerinnen bzw. -lehrer teilnahmen (vgl. Knauf, Eschenbeck & Käser, 2017). Neben demographischen Daten und Angaben zu bestehenden Freundschaft innerhalb der jeweiligen Klassen wurde Bullying mit Hilfe des participant-role-questionnaire (PRQ) erhoben, bei dem rollenspezifisches Verhalten durch peer nomination von den Schülerinnen und Schülern eine Klasse einander zugeschrieben wird, so dass eine Zuweisung von Rollen im Bullying-Prozess möglich ist (vgl. Sutton & Smith, 1999). Des Weiteren wurden biographische Angaben der Lehrkräfte erfasst und es wurde analog zum Einsatz der PRQ in der Schülerstichprobe erhoben, welche für Bullying-Prozesse typischen Verhaltensweisen aus Sicht der Lehrkraft bei ihren Schülerinnen und Schülern vorliegen. Hierdurch wird erfasst, in welchen Rollen Lehrkräfte die Kinder bzw. Jugendlichen sehen, und es war möglich zu analysieren, inwieweit Lehrkräfte Einblick in das Sozialgefüge ihrer Klasse nehmen. Darüber hinaus wurden für eine Teilstichprobe von 28 Lehrkräften qualitative Interviews realisiert, in denen das Selbstverständnis der Untersuchungsteilnehmer von sich als Lehrerin bzw. Lehrer thematisiert wurde.

Anhand der erhobenen Daten werden folgende Fragen auf der Grundlage von Mehr-Ebenen-Analysen untersucht:

1. Wie gut fällt die diagnostische Kompetenz von Lehrkräften aus?

2. Inwieweit unterscheidet sich die diagnostische Kompetenz von Lehrkräften in Abhängigkeit von den Rollen im Bullying-Prozess?

3. Welche Zusammenhänge liegen zwischen Merkmalen der Klassenkomposition und der diagnostischen Kompetenz von Lehrkräften vor?

4. Inwieweit erweisen sich Lehrermerkmale als relevant für eine niedrige bzw. hohe diagnostische Kompetenz?

Hierbei zeigt sich, dass zwar signifikante Zusammenhänge zwischen der Lehrereinschätzung und der Verteilung von Bullying-Rollen in Schulklassen vorliegen, die Varianzaufklärung für die verschiedenen Rollen aber nur niedrig bis mittelmäßig ausfällt und zum Teil differiert je nachdem, ob sich die Einschätzungen auf Schülerinnen oder Schüler beziehen. Während etwa Opfer unabhängig von ihrem Geschlecht in der Regel gut identifiziert werden können, gelingt es Lehrkräften kaum, männliche Verteidiger richtig zu identifizieren. Hingegen werden weibliche Verteidiger zumeist sicher erkannt. Berufsbiographische Angaben der Lehrkräfte wie Alter oder Geschlecht stehen mit ihrer diagnostischen Fähigkeit hinsichtlich Bullying nicht überzufällig in Zusammenhang. Die qualitativen Daten weisen jedoch auf die Bedeutung des Lehrerselbstkonzepts hin.

Die Befunde werden diskutiert vor dem Hintergrund der Lehrerausbildung sowie der Anforderungen an Lehrkräfte in ihrem pädagogischen Alltag.

 

Prädiktoren der Genauigkeit von Lehrkräften bei der Erkennung von Bullying und Cyberbullying

Anja Schultze-Krumbholz, Alexander Wedel, Jan Pfetsch
TU Berlin

Um die Sicherheit und das Wohlbefinden von Schüler*innen gewährleisten zu können, und da Lehrkräfte zentral sind für die Intervention bei und Prävention von Bullying (Yoon & Bauman, 2014), ist ein zuverlässiges Erkennen für eine adäquate Intervention notwendig (Bilz, Steger, & Fischer, 2016). In der Vergangenheit zeigte sich, dass Lehrkräfte Täterschaft über- und Opferschaft unterschätzen. Dies ist insofern problematisch, als dass nicht erkannte Schüler*innen mit dem Problem allein gelassen werden und das Risiko für zukünftige Fehlanpassungen steigt (Wienke Totura, Green, Karver, & Gesten, 2009). Wissen über die Genauigkeit von Lehrkräfteeinschätzungen und Prädiktoren ihres Urteils ist daher von hoher theoretischer und praktischer Relevanz. Ungerechtigkeitssensibilität zeigt beispielsweise einen langfristigen Zusammenhang mit Bullying (Bondü, Rothmund, & Gollwitzer, 2016). Zudem steht Ungerechtigkeitssensibilität aus der Opferperspektive mit erhöhter Aggression, aus Täter- und Zeugenperspektive mit verminderter Aggression in Zusammenhang (Bondü & Krahé, 2015). Es ist zudem anzunehmen, dass Schüler*innen mit höher ausgeprägtem allgemeinen Vertrauen für Lehrkräfte einfacher zu „deuten“ sind bzw. offener kommunizieren. Die Fragestellung der vorliegenden Studie war daher: (a) wie gut erkennen Lehrkräfte Opfer und Täter von Bullying und Cyberbullying in ihrer Klasse und (b) können Merkmale der Lehrkräfte und der Lernenden diese Urteile vorhersagen? Den deskriptiven Analysen lag die Signalentdeckungstheorie zugrunde, die angewendet werden kann, wenn zwei Arten von Signalen voneinander unterschieden werden müssen (Stanislaw & Todorov, 1999). Der Beitrag der Prädiktoren wurde mittels manifester multivariater logistischer Regressionen für korrekte und inkorrekte Urteile ermittelt. Insgesamt nahmen 172 Schüler*innen (M = 14.37 Jahre, SD = 1.21; 49.4% weiblich) der Klassenstufen 7 bis 10 und ihre Lehrkräfte (n = 10, M = 37.38, SD = 7.99; 40% weiblich, 50% männlich, 10% keine Angabe) an dieser Pilotstudie teil. Lehrkräfte lasen eine Definition von Bullying und Cyberbullying und beurteilten jede*n Schüler*in global bzgl. Viktimisierung, Bullying, Cyberviktimisierung und Cyberbullying. Die Schüler*innen berichteten ihre Beteiligung auf einer 8-Item-Skala, die konkrete Verhaltensweisen erfragte. Prädiktoren, die in die Analysen einbezogen wurden, waren Geschlecht, Alter, Sprache Zuhause, Ungerechtigkeitssensibilität, Vertrauen, Lehrkräfteintervention und Lehrkräfteeinschätzung der Auftretenshäufigkeit von Bullying bzw. Cyberbullying an der Schule. Die Ergebnisse der Sensitivitätsanalysen zeigten, dass Lehrkräfte eine hohe Rate richtiger Ablehnungen (correct rejections) erzielten, aber niederige Raten korrekter Identifizierung von (Cyber)Bullies und (Cyber)Victims. Im Durchschnitt zeigten Lehrkräfte eine sehr geringe Sensitivität (Md’ = -0.01, SDd’ = 0.59) bei gleichzeitig hohem Erkennungsschwellenwert (Mc = 1.46, SDc = 0.61). Korrekte Lehrkräfteurteile wurden vor allem durch das Ausmaß des jeweiligen Zielverhaltens vorhergesagt. Cyberbullying und Bullying wurden darüber hinaus häufiger richtig klassifiziert, wenn Lehrkräfte angaben, dass (Cyber)Bullying an ihrer Schule ein Problem ist. Ein höheres Maß an allgemeinem Vertrauen der Schüler*innen sagte die richtige Einschätzung von Betroffenheit durch Cyberviktimisierung vorher. Fehlurteile wurden vor allem durch das Ausmaß des Zielverhaltens vorhergesagt. Fehleinschätzung des Cyberbullyingverhaltens wurden darüber hinaus durch das Geschlecht vorhergesagt und Fehleinschätzungen der Cyberviktimisierung durch die Ansicht, dass Cyberbullying an der Schule ein Problem darstellt. Für Viktimisierung waren geringe Bullyingausprägungen ein zusätzlicher signifikanter Prädiktor. Die Ergebnisse implizieren, dass Lehrkräfte besser in der Erkennung von Bullying und Cyberbullying ausgebildet werden müssen und dass die Suche nach zuverlässigen Indikatoren korrekter Einschätzungen fortgeführt werden muss.

 

Associations between the Bystander Intervention Model and School Climate

Sebastian Wachs
Universität Potsdam

Background: Bystanders have received a lot of attention by scholars, because research has shown that the most common way that students experience bullying is observing it as bystanders and that bullying prevention and intervention programs that encourage bystanders to defend victims result an increase in the success of bullying interventions (Salmivalli, 2014; Wachs et al., 2019). Addressing bystanders might also be important because there is some evidence that witnessing bullying can affect the bystanders’ mental health, school satisfaction, and increase their levels of stress (Rivers et al., 2009).

Latané & Darley's (1970) developed a bystander intervention model which describes five steps when deciding whether or not to intervene: (1.) notice the event, (2.) interpret the event as an emergency that requires help, (3.) accept responsibility for intervening, (4.) know how to intervene or provide help, and (5.) intervening. And yet, no study tested these five steps in respect to bullying in a sample of German students. Although there is some knowledge on correlates of being bystanders of bullying (i.e., negative school climate; Wachs et al., 2018), existing research does not capture the complexity of the process of intervening, due in part to the lack of considering all of the five steps of the bystander model. To this end, the present study’s aims were to: (a) develop and validate through confirmatory factor analysis a measure of bystander intervention model and (b) examine the extent to which the steps are related to school climate

Method: The sample included 417 participants (48% male; age: 12–16 years old; M=13.8; SD=1.3). The five steps of the bystander model were measured by developing three items for each step based on the theory of bystander intervention and adapted from previous studies (e.g., Nickerson et al., 2014). School climate was measured with a six-item scale for teacher-student relationships (Cronbach’s α=.92) and a six-item scale for student-student relationships (Cronbach’s α=.88) developed by Resnick et al. (1997). All items could be answered on a scale from strongly disagree (=0) to strongly agree (=4). All analyses were conducted using Mplus 8.3 software. Missing data were dealt with using FIML.

Results: A CFA confirmed a five-factor structure representing the five steps outlined above. The model fit was good, χ2 = 106, df = 80, p = .024, CFI = .99, TLI = 0.98, RMSEA = 0.02, SRMR = 0.04; standardized factor loadings ranged from 0.53 to 0.85. In a next step, the relationships between teacher-student relationships, student-student relationships, and the bystander intervention model were investigated, while controlling for student’s age, sex, and ethnical background. The model fit was good, χ2 = 510, df = 288, p < .001, CFI = .95, TLI = 0.94, RMSEA = 0.03, SRMR = 0.05; standardized factor loadings ranged from 0.53 to 0.89. There were significant effects of student-teacher relationships on noticing (β ̂=.36, p<.001), emergency (β ̂=.28, p<.001), and intervening (β ̂=.20, p<.001). In addition, there were significant effects of student-student relationships on emergency (β ̂=.19, p=.007), knowing (β ̂=.16, p<.001), and intervening (β ̂=.20, p<.001).

Conclusion: Results supports the five-steps intervention model. Thus, the analysis confirms the general assumptions of Latané and Darley’s (1970) well-established theoretical framework for bullying. This study also fills gaps in the literature by providing a measure that can be used by schools to design future prevention strategies to provide bystanders with information and skills they need to intervene in bullying. Finally, the present study indicates that school climate is related to a student’s decision-making about bystander intervention. Therefore, the relationships with teachers and students needs to be addressed to motivate students to intervene in bullying.

 

Schulische Prädiktoren von Toleranz bei 14-jährigen Schüler*innen

Johanna Ziemes, Hermann Josef Abs
Universität Duisburg-Essen

Theoretischer Hintergrund. Toleranz ist in Demokratien mit heterogenen Bevölkerungen ein wichtiger Aspekt für die Persistenz des politischen Systems. Persistenz bedeutet hier, dass das System auf bestimmte Werte und Verhaltensweisen von Bürger*innen angewiesen ist um sich weiter entwickeln zu können (Easton, 1957; Norris, 2017). Daher ist es aus einer strukturfunktionalistischen Perspektive folgerichtig, dass Schulen in Deutschland nach den Landesschulgesetzen zur Förderung von Toleranz verpflichtet sind. Das Landesschulgesetz von Nordrhein-Westfalen (NRW) fordert beispielsweise, dass Schüler*innen lernen sollen „Verständnis und Toleranz gegenüber den Entscheidungen anderer zu entwickeln“ (§2,6).

Der Beitrag unterscheidet verschiedene schulisch relevante Prädiktoren von Toleranz. Dabei werden neben Hintergrundvariablen, die Unterrichtsgestaltung, das schulische Sozialklima und das politische Wissen der Schüler*innen berücksichtigt. Als Hintergrundvariablen verstanden werden Geschlecht, sozioökonomischer Status und Migrationshintergrund. Hinsichtlich der Unterrichtsgestaltung wird die Diskursivität untersucht. Ein Diskursiver Unterricht sollte Schüler*innen dabei unterstützen, verschiedene Perspektiven einzunehmen und damit toleranter zu werden (Watermann, 2003). Das schulische Sozialklima kann ein Indikator einer Kultur der Toleranz an einer Schule sein (Cobia & Carney, 2002). Die Aneignung von Wissen wird der Zunahme von Toleranz in Verbindung gebracht (Carrasco & Irrabarra, 2018), die Wirkmechanismen sind jedoch noch nicht empirisch befriedigend geklärt.

Fragestellung. Welche differentielle Vorhersagekraft haben die verschiedenen schulisch relevanten Variablen für die statistische Vorhersage von Toleranz? Hier werden die Hintergrundvariablen als nicht schulisch formbar, aber als relevant für die pädagogische Gestaltung von Schule, betrachtet. Die Diskursivität des Unterrichtes, das schulische Sozialklima und das politische Wissen werden als durch pädagogische Interventionen beeinflussbar angesehen.

Methode. Grundlage der Analysen sind die nordrhein-westfälischen Daten der International Civic and Citizenship Education Study 2016 (Abs & Hahn-Laudenberg, 2017; Schulz et al., 2017). Hier nahmen 1.451 Schüler*innen der achten Klasse an 59 Schulen teil. Toleranz wird erfasst über die Einstellungen zu gleichen Rechten für Frauen und Männer, Migrant*innen und Menschen verschiedener Herkunftsgruppen. Für die Diskursivität des Unterrichts, die Beziehung zwischen den Schüler*innen und Lehrkräften sowie die Beziehung der Schüler*innen mit anderen Schüler*innen stand je eine Rasch-Skala zur Verfügung. Aus den beiden Beziehungsskalen und den drei Toleranzskalen wurde jeweils ein Faktor zweiter Ordnung gebildet („Sozialklima“, respektive „Toleranz“). Politisches Wissen wurde anhand eines 45-minütigen Testes gemessen und unter Anwendung der Item Response Theory skaliert. Zu Details der Skalierung vgl. Schulz, Geberhardt, Friedman und Fraillon (2018). Mit Mplus 8.2 wurden gewichtete Analysen (type=complex) durchgeführt.

Ergebnisse. Die Fitindizes des berechneten Modells sind gut. (CFI=.954; TLI=.929; SRMR=.040; RMSEA=.044). Mädchen sind toleranter (β=.297***), der sozioökonomische Status trägt schwach zur Vorhersage von Toleranz bei (β=.080*), und der Migrationshintergrund hat in diesem Modell keine Vorhersagekraft auf Toleranz. Die Diskursivität der Unterrichtsgestaltung sagt Toleranz positiv vorher (β=.117***), jedoch schwächer als das schulische Sozialklima (β=.261***). Politisches Wissen hat die stärkste prädiktive Kraft (β=.479***). Insgesamt klärt das Modell einen großen Anteil der Varianz in der latenten Toleranzvariable auf (52,4%).

Diskussion. Jungs sind eher gefährdet eine geringere Menge an Toleranz zu entwickeln. Die anderen Hintergrundvariablen ermöglichen keine bedeutsame eigenständige Varianzaufklärung. Die Diskursivität des Unterrichts, wie sie hier operationalisiert wurde, kann Toleranz entgegen den Erwartungen kaum vorhersagen. Das schulische Sozialklima erweist sich als deutlich relevanter. Das politische Wissen ist der stärkste Prädiktor, hier könnten jedoch Drittvariablen, die die Testbearbeitung erleichtern, eine Rolle spielen, wie die allgemeine Fähigkeit zur Perspektivenübernahme, die hier nicht mit erfasst werden konnten. Da die Daten querschnittlich sind, können hier keine Aussagen über Kausalitäten getroffen werden. Weitere Forschung kann untersuchen, wie die Geschlechterdifferenz pädagogische Interventionen informieren kann, und ob andere Formen und Operationalisierungen der diskursiven Unterrichtsgestaltung geeigneter sein können, um Toleranz zu fördern und statistisch vorherzusagen. Die Verbesserung des schulischen Sozialklimas scheint nützlich für die Förderung von Toleranz zu sein.

 
11:15 - 13:00F11‒S26: Reviews als Forschungsmethode zur Identifikation von Gelingensbedingungen für didaktische Innovation mit digitalen Medien
S26 
 

Reviews als Forschungsmethode zur Identifikation von Gelingensbedingungen für didaktische Innovation mit digitalen Medien

Chair(s): Josef Buchner (Universität Duisburg-Essen, Deutschland)

DiskutantIn(nen): Ines Deibl (Universität Salzburg)

"Digitalisierung" im Kontext des Lehrens und Lernens beschäftigt die Forschung seit mehr als 40 Jahren (vgl. Tamim, Bernard, Borokhovski, Abrami, & Schmid, 2011). Metaanalysen von Bangert-Drowns, Kulik und Kulik (1985), Fletcher-Finn und Gravatt (1995) sowie Kulik und Kulik (1986, 1991) zeigen, dass die Effektstärken beim Lernen mit Computerunterstützung im Vergleich zu traditionellen Lernangeboten eher gering ausfallen (auch Hattie, 2008; Schmid et al., 2009). Die den Metaanalysen zugrunde liegenden Studien können zusammengefasst als „horse race“ bezeichnet werden, da sie meist „neue“ Medien traditionellen Verfahren gegenüberstellen und sich von der Frage „Was ist besser?“ leiten ließen. Diese Frage wird in der mediendidaktischen Diskussion jedoch zunehmend problematisiert und als nicht mehr zielführend erachtet (e.g. Ross, Morrison, & Lowther, 2010). Anstatt “besser”, schlägt Kerres (2018) vor, die Möglichkeiten für ein „anderes Lernen“ mit Medien in den Vordergrund einer "gestaltungsorientierten Bildungsforschung" zu stellen und zu untersuchen, welchen Beitrag digitale Medien leisten können, um Bildungsanliegen zu bearbeiten. Um Befunde aus solchen Entwicklungs- und Erprobungsprojekten zu aggregieren, erscheinen - anders als Metaanalysen - Verfahren des Reviews zielführend (vgl. Grant & Booth, 2009), die vorliegende Studien zusammenführen, um festzustellen, welche Variablen und Konstellationen unterschiedliche Dimensionen des Lernens wie unterstützen können.

Die Beitragenden dieses Symposiums haben unterschiedliche Review-Verfahren genutzt, um ebensolche Variablen sichtbar zu machen:

Bettina Waffner präsentiert die Ergebnisse eines Critical Review als eine Forschungssynthese internationaler und deutscher Literatur mit Blick auf die Implikationen der Digitalisierung in der Bildung für Lehrkräfte in Schulen. In dem Kontext von Forschungssynthesen rückt die Frage in den Blick, wie der Wissenstransfer in die schulische Bildungspraxis erfolgen kann.

Josef Buchner nutzt die Methode des Systematic Review, um der Frage nachzugehen, welche Lernarrangements mithilfe von Augmented-Reality-Technologien vorrangig realisiert werden und wie ausgeprägt die kognitive Belastung der Lernenden bei diesen Umsetzungen ist.

Melissa Bond untersucht in ihrem Systematic Review das Konstrukt student engagement und wie es in der Forschung zu Flipped Learning definiert wird. Weiters berichtet sie, welche Technologien mit Lern-Engagement bzw. Nicht-Engagement gemeinsam auftreten.

Anne Vonarx und Katja Buntins diskutieren wie Forschungssynthesen mit der Erfahrung der Praxis validiert werden können, aber auch Forschungslücken und Publication Bias sichtbar machen.

Buntins et al. runden das Symposium schließlich ab, indem sie einen kritischen Blick auf Messinstrumente für das Umbrellakonstrukt student engagement werfen. Die Ergebnisse ihres Systematic Review zeigen, dass behaviorale Facetten meist mit ähnlichen Ansätzen erfasst werden, z.B. aufgebrachte Zeit für eine Lernaufgabe, hingegen bei emotionalen und kognitiven Facetten einmalige, zuvor nicht validierte, Erhebungsinstrumente verwendet werden.

 

Beiträge des Symposiums

 

Ein critical review aktueller internationaler Forschungsliteratur und die Frage des Wissenstransfers in die schulische Bildungspraxis

Bettina Waffner
Universität Duisburg-Essen

Im Zuge der digitalen Transformation stehen Schulen vor der Herausforderung, die Potenziale mobiler digitaler Medien für die unterschiedlichen Bereiche schulischen Lebens wie Unterricht, Schulorganisation und Aus- und Fortbildungen zu erproben und zu bewerten. Das hat zum einen Wirkungen auf das pädagogische Personal und wird zum anderen ebenso durch das pädagogische Personal gestaltet. Insofern werden in diesem Beitrag Lehrkräfte in Schulen in den Mittelpunkt gestellt und die Ergebnisse des critical review (Booth und Grant 2009) internationaler Forschungsliteratur über die Implikationen der Medienintegration an Schulen für das pädagogische Personal vorgestellt. Aus einer konstruktivistischen Perspektive werden insbesondere die persönliche Haltung und Annahmen von Lehrkräften zur Nutzung digitaler Medien im Unterricht und deren Entwicklung in den Blick genommen. Dabei wird auch auf die Kompetenzen abgehoben, die Lehrkräfte benötigen, um digitale Medien in der pädagogischen Arbeit zu nutzen, sowie auf deren Bedeutung für die Fortbildung von Lehrkräften.

Interessant ist diese Forschungssynthese, da sie eine valide Methode darstellt, um Verbindungen und Beziehungen zwischen einzelnen Studien explizit zu machen, die in Einzelstudien nicht sichtbar sind (Cohen et al. 2018). Sie ist stärker interpretativ als aggregierend angelegt und wird in einer ersten Betrachtung nach einer systematischen Recherche von 3380 Titeln die Themen und Konzepte meistbeachteter Literatur im internationalen Kontext von 2010 bis 2017 (aus 1803 Zeitschriftenbeiträge) verdichten und mit der neuesten Literatur 2018 und 2019 (277 Zeitschriftenbeiträge) in Beziehung setzen. Das ermöglicht, neu entstehende Themenfelder zu identifizieren. In einem weiteren Analyseschritt wird jene Literatur gesondert betrachtet, die aus Deutschland stammt, um spezifisch deutsche Diskursstränge auf die internationale Forschungsdebatte zu beziehen.

Das Ziel eines solchen Vorhabens liegt zum einen darin, weitere Forschung in dem Feld anzuregen, indem Forschungsdesiderata identifiziert werden. Eine wichtige weitere Rolle der Forschungssynthese ist der Wissenstransfer über die Wissenschaftscommunity hinaus in die schulische Bildungspraxis und die Bildungspolitik. Der Beitrag wird Überlegungen darüber anregen, Praxis, Forschung und wissenschaftliche Evidenz miteinander in Beziehung zu setzen, um verschiedene Dialogformate und Kommunikationsstrategien zu diskutieren.

 

Flipped learning and student engagement in K-12: A systematic review

Melissa Bond
Universität Oldenburg

Flipped learning is a student-centered approach that has “great promise” (OECD, 2018, p. 77) to bring technology more into the classroom, help develop students’ digital competencies (Kostaris, Sergis, Sampson, Giannakos, & Pelliccione, 2017), increase higher order thinking skills and active learning time (Gough, DeJong, Grundmayer, & Baron, 2017), promote problem solving, teamwork and collaboration skills (Lo & Hew, 2017), and has the potential to enhance both parent and student engagement (Aycicek & Yelken, 2018; Bond, 2019). With theoretical foundations in collaborative learning theory and constructivism (Bishop & Verleger, 2013), flipped learning inverts traditional lessons that would normal be taught by the teacher at school, such as lectures or teacher explanations, by providing content to students outside of the classroom (St.Clair Smith, 2018). This frees up class time for active collaborative activities within the group space, and increased time with the teacher (Lo & Hew, 2017).

Whilst there is a growing body of literature, including systematic reviews, endeavouring to synthesise this body of evidence, there remains a paucity of research undertaken within school (K-12) contexts (Akçayır & Akçayır, 2018; Lundin, Bergviken Rensfeldt, Hillman, Lantz-Andersson, & Peterson, 2018). Furthermore, previous reviews have included small sample sizes, and their treatment of the concept and effect of student engagement has been limited. Whilst student engagement is a complex, multifaceted construct (Appleton, Christenson, & Furlong, 2008; Reschly & Christenson, 2012), resulting in inconsistent definitions across the field (Henrie, Halverson, & Graham, 2015), greater understanding of the role that educational technology plays in (dis)engagement, and stronger evidence of the outcomes that flipped learning promotes, is vital to ensure improved outcomes for students (O'Flaherty & Phillips, 2015). This presentation, therefore, presents a systematic review synthesising 107 studies, investigating how the flipped learning approach affects student engagement in K-12 across all three dimensions of student engagement (Fredricks, Blumenfeld, & Paris, 2004; Fredricks, Filsecker, & Lawson, 2016).

The presentation will briefly cover the methodology used, as well as discuss the study characteristics, including where and how studies are predominantly being undertaken. It will then explore how the studies defined student engagement and were grounded in theory, which facets of engagement and disengagement were present, as well as which particular educational technologies co-occurred with those facets. The presentation will then conclude with practical suggestions for future studies on student engagement and flipped learning, as well as implications for practice against a bioecological student engagement framework (Bond & Bedenlier, 2019).

 

Ein Systematic Review zum Einfluss von Technologie in der Hochschullehre

Anne-Cathrin Vonarx, Katja Buntins
Universität Duisburg-Essen

In den Bildungswissenschaften ist Wissen aus der Praxis oft nicht für die Forschung sichtbar. Wenn man versucht, bestehendes Wissen zusammenzufassen und zu synthetisieren, dann kann man dies oft nur anhand bestehender Studien und empirischer Berichte machen. Hierdurch entsteht eine systematische Lücke in der empirischen Evidenz.

Wir gehen in dem vom BMBF-geförderten Projekt „ActiveLeaRn“ der Frage nach, wie es möglich ist, Ergebnisse eines empirischen Literaturreviews mit dem Erfahrungswissen von Akteuren aus der Praxis zu spiegeln. Das Forschungsprojekt beschäftigt sich in einem Systematic Review mit der Frage, unter welchen Bedingungen der Einsatz von Technologie einen Einfluss auf das Lern-Engagement in der Hochschullehre hat (Bond, Bedenlier, Buntins, Kerres, Zawacki-Richter, submitted; Bond, Bedenlier, Buntins, Kerres, Zawacki-Richter, 2019).

Dieses Systematic Review wird von uns als Grundlage genommen, um mit Akteuren aus der E-Learningpraxis (z.B. Lehrende, die digitale Medien einsetzen oder E-Learning Berater*innen) über ihre eigenen Erfahrungen zu reflektieren. Hierbei wählen wir einen Mixed-Method Ansatz.

Einerseits nutzen wir fachspezifische E-Learning Workshops, um zentrale Ergebnisse des Systematic Reviews mit den Akteuren in Fokusgruppen kritisch zu diskutieren und zu gewichten. Zunächst erhalten die Teilnehmenden die Möglichkeit, das eigene Erfahrungswissen in Bezug auf die Forschungsergebnisse mitzuteilen, indem Sie individuell einschätzen und rückmelden, welche studentischen Reaktionen sie beim Einsatz digitaler Medien in der Lehre beobachtet haben. Des Weiteren werden die Forschungsergebnisse mit der Praxiserfahrung gespiegelt, indem die Teilnehmenden eine Einschätzung darüber geben, welche der identifizierten Lerntechnologien ihnen am geeignetsten erscheinen, um studentisches Lern-Engagement zu fördern sowie fehlendes Lern-Engagement zu reduzieren. Im Anschluss daran erhalten die Teilnehmenden einen Einblick in die Ergebnisse des Systematic Reviews und diskutieren in Fokusgruppen, inwieweit die Rückmeldung der Teilnehmenden mit den Forschungsergebnissen übereinstimmen und wie sie etwaige Unterschiede interpretieren.

Andererseits führen wir eine Onlineumfrage mit E-Learning Akteuren durch, in der wir die Teilnehmenden bitten, die Ergebnisse aus der Überblicksstudie mit ihren eigenen Erfahrungen zu vergleichen.

Die Ergebnisse aus dieser Mixed-Method Studie werden im Rahmen des Symposiums vorgestellt und kritisch reflektiert. Darüber hinaus wird anhand dieses Beispiels die Möglichkeiten einer Validierung bildungswissenschaftlicher Erkenntnisse mit Akteuren aus der Bildungspraxis und -politik diskutiert.

 

Wie beeinflusst die kognitive Belastung das Lernen mit Augmented Reality Bildungsmedien: Ein Systematic Review

Josef Buchner
Universität Duisburg-Essen

Forschungsbeiträge rund um den Einsatz von Augmented Reality für das Lehren und Lernen haben sich in den letzten Jahren vervielfacht, was unter anderem an der Zahl der internationalen Publikationen ersichtlich wird. Neben zahlreichen Einzelstudien liegen mittlerweile auch Metaanalysen vor, die Lernarrangements mit Augmented Reality mittlere Effektstärken zwischen d = .51 bis d = .68 attestieren (Garzón & Acevedo, 2019; Garzón, Pavón, & Baldiris, 2019; Ozdemir, Sahin, Arcagok, & Demir, 2018; Santos et al., 2014; Tekedere & Göker, 2016). Diesen Analysen ist gemein, dass sie den Lernerfolg anhand quantitativer Daten aggregieren und als Moderatorvariablen den Bildungsstand (level of education, basierend auf UNESCO) sowie die Bildungsfelder (fields of education, basierend auf UNESCO) berücksichtigen. Andere Faktoren wie das didaktische Setting, z.B. selbstgesteuertes oder kooperatives Lernen; verwendete multimediale Artefakte, z.B. 3D-Modelle, Bild-Text-Kombinationen und die dabei möglicherweise auftretende kognitive Belastung (van Merriënboer & Sweller, 2005) werden nicht berücksichtigt.

Dieser Beitrag widmet sich diesem Forschungsdesiderat und versucht nun folgende Forschungsfragen zu beantworten:

1. Welchen Einfluss hat die kognitive Belastung beim Lernen mit Augmented Reality auf den Lernerfolg?

2. Wie sehen die multimedialen Artefakte aus, die als Augmented-Reality-Elemente verwendet werden?

3. Werden bei der Erstellung, Auswahl und Implementierung der multimedialen Artefakte in Augmented-Reality-Bildungsmedien die Prinzipien der Kognitiven Theorie multimedialen Lernens (für eine Übersicht Mayer, 2014) beachtet?

a. Wenn ja, lassen sich Unterschiede feststellen zu jenen Artefakten, die dies nicht tun?

4. Welche didaktischen Settings (selbstgesteuert, kollaborativ, …) werden in der Forschungsliteratur mit Augmented Reality realisiert?

Um diese Fragen zu beantworten wird auf die Methode des Systematic Review zurückgegriffen. Für die Suche nach der entsprechenden Literatur wurden die Datenbanken ERIC, Scopus und Web of Science durchsucht sowie Inklusions- und Exklusionskriterien festgelegt.

Insgesamt wurden etwas mehr als 2.000 Zeitschriftenartikel, Konferenzbeiträge und Buchkapitel gefunden und für die erste Review-Phase, das Lesen der Abstracts, berücksichtigt.

Die vorläufigen Ergebnisse (Stand: 15.10.2019) zeigen, dass die kognitive Belastung in Forschungsdesigns zum Lernen mit Augmented Reality bisher eine untergeordnete Rolle spielte und als „side-effect“ wenig Beachtung erfuhr (e.g. Sommerauer & Müller, 2018). Die Gestaltung der Augmented-Reality-Artefakte kann nur schwer nachvollzogen werden, da exakte Beschreibung dieser in den Studien nicht mitgeliefert wird. Dieses Problem der Intransparenz bei Forschungsarbeiten zu Lerntechnologien beschreibt auch Ainsworth (2014).

Die weiteren Ergebnisse aus diesem Forschungsvorhaben werden im Rahmen des Symposiums präsentiert und mit den Teilnehmenden diskutiert.

 

Womit messen wir eigentlich Student Engagement? – Eine Untersuchung der Messinstrumente in einem Systematic Review

Katja Buntins1, Melissa Bond2, Svenja Bedenlier3
1Universität Duisburg-Essen, 2Universität Oldenburg, 3Fernuniversität Hagen

Student Engagement ist ein Umbrellakonstrukt für Lernqualität und Lernenden Engagement, das auf kognitiver, affektiver und behavioralen Ebene (Kahu, 2013) vorkommt. Student Engagement beinhaltet unter anderem Facetten, wie verbrachte Zeit, Selbstregulation oder Begeisterung (Kahu & Nelson, 2018). Um das gesamte Konstrukt zu messen, gibt es eine Reihe von standardisierten Fragebögen, wie z.B den NSSE (Kuh, 2001) für den amerikanischen Sprachraum. Neben diesen Umbrellafragebögen gibt es eine große Menge an Fragebögen, die versuchen die Einzelfacetten zu erheben.

Im Rahmen eines Systematic Reviews zu der Frage: „Unter welchen Bedingungen hat der Einsatz von Lerntechnologie in der Hochschullehre einen Einfluss auf das Student Engagement“ berücksichtigten wir sowohl Studien, die einzelne Facetten von Student Engagement erhoben haben, als auch solche, die versuchen das gesamte Konstrukt zu messen. Dies liegt darin, dass Student Engagement als schwer zu entdeckendes Phänomen beschrieben wird (O’Mara-Eves et al., 2013), welches sich oft nicht ganzheitlich zeigt.

Insgesamt fassten wir so 231 Artikel mit 243 unabhängigen Einzelstudien zusammen (z.B. Bond, Bedenlier, Buntins, Kerres, Zawacki-Richter, submitted; Bond, Bedenlier, Buntins, Kerres, Zawacki-Richter, 2019). In nur 18 der 231 Studien (7,8%) wurden Student Engagement definiert und nur 14 der 243 Studien (5,8%) erhoben Student Engagement als Gesamtkonzept. Alle anderen Studien erhoben eine oder mehrere Einzelfacetten, wobei Teilnahme und Involvierung in 49 % der Studien vorkam, gefolgt von Lernzuwachs (44%, Positive Interaktion zwischen Studierenden und Lernenden (41%) und Spaß beim Lernen.

In diesem Symposium wollen wir uns mit der Frage beschäftigen wie die verschiedenen Facetten gemessen wurden. Wir werden sehen, dass bei behavioralen Facetten oft ein ähnlicher Ansatz gewählt wird (z.B. die verbrachte Zeit in einer Lernaufgabe oder die Anzahl der Forumsbeiträge), aber bei kognitiven und emotionalen Facetten sehr unterschiedliche Fragen und Fragebögen verwendet werden. Diese Fragen und Fragebögen kommen in den meisten Fällen nur einmal vor und sind in vielen Fällen nicht vorher validiert worden.

In dem Symposium werden wir die genauen Befunde anschauen und diskutieren, was dies für Systematic Reviews oder Metaanalysen im Bereich eines Umbrellakonzeptes bedeutet.

 
11:15 - 13:00F11‒S27: Evidenzorientiertes Denken und Argumentieren als zu fördernde Kernkompetenz in der Ausbildung angehender Lehrkräfte
S27 
 

Evidenzorientiertes Denken und Argumentieren als zu fördernde Kernkompetenz in der Ausbildung angehender Lehrkräfte

Chair(s): Matthias Nückles (Universität Freiburg, Deutschland)

DiskutantIn(nen): Johannes Bauer (Universität Erfurt)

Ein zentrales Ziel der Ausbildung von Lehrkräften ist die Fähigkeit, das eigene unterrichtliche Handeln begründen und reflektieren zu können. Diese Fähigkeit wird vor allem in den praktischen Anteilen der Lehrkraftausbildung wie dem Praxissemester und Referendariat eingeübt, etwa wenn angehende Lehrkräfte eigenständig Unterricht planen und nach der Durchführung bewerten lernen sollen. Im Zusammenhang mit pädagogisch-didaktischer Begründungskompetenz wurde im Zuge der Reform der Lehrkraftausbildung (Bauer & Prenzel, 2012; KMK, 2004) in den vergangenen Jahren verstärkt die Forderung nach evidenzorientiertem Denken als Lernziel angehender Lehrkräfte von Bildungsforscher(inne)n und Bildungspolitiker(inne)n formuliert und bereits 2004 in den KMK-Standards für die Lehramtsausbildung verankert. Nach den KMK-Standards (2004) sollten angehende Lehrkräfte lernen, (bildungs-) wissenschaftliche Forschungsbefunde zu rezipieren, zu interpretieren und für ihre Unterrichtspraxis nutzbar zu machen.

Mit dem Ziel, evidenzorientiertes Denken und Argumentieren in der Ausbildung von Lehrkräften systematisch zu fördern, wird letztlich ein Verständnis pädagogischer Professionalität angestrebt, wie es bereits seit Jahrzehnten in der Ausbildung von Ärzten und auch psychologischen Psychotherapeuten etabliert ist, nämlich, dass Lehrkräfte sich bei der Planung und Reflexion ihres unterrichtlichen Handelns – ähnlich wie Ärzte oder Psychotherapeuten bei der Behandlung von Patienten (vgl. Perrez, 1998) – „Rationalitätsgesichtspunkten und der Orientierung am besten verfügbaren (wissenschaftlichen) Wissen verpflichtet sehen“ (Bauer, Prenzel & Renkl, 2015). Es darf erwartet werden, dass in dem Maße, wie es gelingt, die Förderung evidenzorientierten Denkens in der Lehramtsausbildung zu realisieren, letztlich auch eine Steigerung der Qualität von Unterricht erreicht werden kann. Zugleich ist mit dieser Zielsetzung jedoch auch ein enormer Forschungsbedarf verbunden in Hinblick auf Fragen, welche kognitiven Prozesse evidenzorientiertem Denken zugrunde liegen, und wie geeignete Lehr-Lern-Formate zur Förderung evidenzorientierten Denkens gestaltet sein sollten.

Entsprechend nehmen die in diesem Symposium versammelten Beiträge von fünf verschiedenen Standorten (Augsburg und Saarbrücken, Wuppertal, Berlin, Freiburg) die mit evidenzorientiertem Denken und Argumentieren assoziierten kognitiven Prozesse angehender Lehrkräfte in den Fokus. So kann herausgearbeitet werden, mit welchen Anforderungen angehende Lehrkräfte konfrontiert sind und welche Schwierigkeiten sie erleben beim Versuch, bildungswissenschaftliche und/oder fachdidaktische Prinzipien und Befunde für die Planung und Reflexion eigenen unterrichtlichen Handelns und das Treffen pädagogischer Entscheidungen zu nutzen. Diese Analyse der kognitiven Prozesse bildet die Grundlage, um Maßnahmen zur Förderung evidenzorientierten Denkens zu gestalten und empirisch auf ihre Effektivität hin zu überprüfen.

Theoretischer Ausgangspunkt des Symposiums ist die Annahme, dass Unterrichten als komplexes Problemlösen zu konzeptualisieren sei (Lampert, 1985; Wegner, Anders & Nückles, 2014). Die komplexe Problemstruktur von Unterrichten zeigt sich u.a. darin, dass ein bestimmtes Unterrichtsziel grundsätzlich durch sehr unterschiedliche didaktische Vorgehensweisen erreicht werden (Renkl, 2015), so dass die Lehrkraft abwägen muss, welche didaktische Strategie unter den gegebenen Umständen vermutlich am ehesten zum Ziel führen wird. Zur komplexen Problemstruktur von Unterrichten zählt außerdem das Vorhandensein multipler Perspektiven, insofern Fachwissenschaft, Fachdidaktik und Bildungswissenschaft jeweils komplementäre Perspektiven auf Unterricht bieten, die es bei der Unterrichtsplanung zu integrieren gilt (Graichen, Wegner & Nückles, 2019; Harr, Eichler & Renkl, 2015).

Vor diesem Hintergrund beleuchten die empirischen Studien des Symposiums, wie angehende Lehrkräfte unterschiedliche didaktisch oder pädagogisch relevante Informationen bewerten und in Hinblick auf die Gestaltung von Unterricht und das Treffen pädagogischer Entscheidungen integrieren. Zur Modellierung der kognitiven Prozesse evidenzorientierten Denkens und Argumentierens beziehen sich die Autorinnen und Autoren u.a. auf aktuelle Theorien zum Verstehen und zur Bewertung multipler Quellen (z.B. Bråten, Britt, Strømsø & Rouet, 2011), das Argumentationsmodell von Toulmin (1958, 2003) sowie auf wissenschaftstheoretische Konzeptionen zum Theorie-Praxis-Problem in der Lehramtsausbildung (Schellenbach-Zell, Wittwer & Nückles, 2019). Neben der Analyse kognitiver Prozesse werden außerdem vielversprechende experimentelle Befunde zur Förderung evidenzorientierten Denkens vorgestellt. Die Symposiumsbeiträge werden von Johannes Bauer (Erfurt) diskutiert, der durch seine Arbeiten entscheidend dazu beigetragen hat, dass evidenzorientiertes Denken in der Lehramtsausbildung zu einem Emerging Field in der empirischen Bildungsforschung geworden ist.

 

Beiträge des Symposiums

 

Evidenzorientiertes Denken von Lehramtsstudierenden, erfahrenen Lehrkräften und Bildungswissenschaftler(inne)n im Kontext unterrichtlicher Problemsituationen - eine vergleichende Analyse

Christina Wekerle1, Kati Trempler2, Katharina Kiemer1, Kai Wagner3, Sven Clanzett1, Robin Stark3, Ingo Kollar1
1Universität Augsburg, 2Universität Wuppertal, 3Universität Saarbrücken

Theoretischer Hintergrund

Zunehmend wird von Lehrkräften gefordert, evidenzorientiert zu denken und handeln (Bauer, Prenzel & Renkl, 2015). Es spricht einiges dafür, bereits Lehramtsstudierende im Aufbau entsprechender Fähigkeiten zu unterstützen. Die bisherige Forschung hat sich zuvorderst dafür interessiert, auf welche Wissensbestände Lehramtsstudierende bei der Reflexion über unterrichtliche Problemsituationen zurückgreifen. Dabei zeigte sich, dass angehende Lehrkräfte (bildungs-)wissenschaftliches Wissen kaum auf pädagogische Situationen übertragen (Wagner, Klein, Klopp & Stark, 2014). Im vorliegenden Beitrag wird diese Perspektive als „Inhaltsaspekt“ evidenzorientierten Denkens bezeichnet und um einen „Formaspekt“ erweitert: Hierbei steht die Frage im Mittelpunkt, welche kognitiven Prozesse während der Reflexion unterrichtlicher Problemsituationen ablaufen. Unter Bezugnahme auf die Forschung zu professional vision (Sherin & van Es, 2009) sowie zum wissenschaftlichen Denken (Fischer et al., 2014) werden fünf Prozesse unterschieden: (1) Problemidentifikation, (2) Problemrekonstruktion, (3) Problemerklärung, (4) Ableitung von Zielen und (5) Erwägen von Handlungsoptionen.

Fragestellung

Durch einen Vergleich des evidenzorientierten Denkens von Lehramtsstudierenden, erfahrenen Lehrkräften und Bildungswissenschaftler(inne)n sollen Anhaltspunkte für die Gestaltung von Fördermaßnahmen zum Erwerb von Fähigkeiten zum evidenzorientierten Denken gewonnen werden. Konkret wird gefragt: Inwiefern unterscheiden sich Lehramtsstudierende, erfahrene Lehrkräfte sowie Bildungswissenschaftler(innen) hinsichtlich (1) des Ausmaßes des Rekurrierens auf Alltags- und bildungswissenschaftliches Wissen (Inhaltsaspekt) und der (2) von ihnen gezeigten kognitiven Prozesse (Formaspekt) beim Reflektieren über unterrichtliche Problemsituationen?

Methode

Der Studie lag ein 1x3-faktorielles Design (Lehramtsstudierende vs. erfahrene Lehrkräfte vs. Bildungswissenschaftler(innen)) zugrunde. Den Teilnehmer(inne)n (N = 55) wurde eine Fallvignette vorgelegt, in der der Versuch einer Lehrkraft beschrieben war, unterrichtliche Problemsituationen zu bewältigen. Die Proband(inn)en wurden gebeten, über die Fallvignette laut zu reflektieren, woran sich ein strukturiertes Leitfaden-Interview anschloss. Der Inhaltsaspekt evidenzorientierten Denkens wurde über die Interviewdaten erfasst. Diese wurden in Sinneinheiten segmentiert, die daraufhin eingeschätzt wurden, inwieweit sie Erfahrungs- und bildungswissenschaftliches Wissen enthielten. Die Übereinstimmung von vier unabhängigen Beobachtern auf Basis von 5% der Daten war für beide Kategorien gut (ICC=.73/.81). Zur Messung des Formaspekts wurden die Laut-Denk-Protokolle herangezogen, segmentiert und daraufhin kodiert, welchem der genannten kognitiven Prozesse sie zugeordnet werden können. Die Beobachterübereinstimmung auf Basis von 11% der Daten lag über alle Kategorien hinweg bei 88%. Als Kovariate wurde die durchschnittliche Wortanzahl der Interviews und Laut-Denk-Protokolle berücksichtigt.

Ergebnisse und Diskussion

Bezüglich des Inhaltsaspekts zeigte sich ein signifikanter Effekt der Gruppenzugehörigkeit (Wilks Lambda F(4, 100) = 10.74, p < .001, part. Eta² = .30). Bildungswissenschaftler(innen) nutzten signifikant mehr bildungswissenschaftliches Wissen als Lehramtsstudierende (p < .001) und als erfahrene Lehrkräfte (p < .001). Umgekehrt zogen Bildungswissenschaftlicher(innen) signifikant seltener Alltagswissen heran als Lehramtsstudierende (p < .001) und als erfahrene Lehrkräfte (p < .001). Lehramtsstudierende und erfahrene Lehrkräfte unterschieden sich weder hinsichtlich der Nutzung bildungswissenschaftlichen noch alltagsbezogenen Wissens voneinander (p > .05). Bezüglich des Formaspekts zeigte sich ebenfalls ein signifikanter Effekt der Gruppenzugehörigkeit (Wilks-Lambda F(16, 88) = 2.34, p < .01, part. Eta² = .30). Dieser war insbesondere auf den kognitiven Prozess „Problemrekonstruktion“ zurückzuführen, welchen Bildungswissenschaftler(innen) signifikant häufiger zeigten als Lehramtsstudierende (p < .05) und erfahrene Lehrkräfte (p < .05). Letztere unterschieden sich nicht voneinander (p < .05).

Die Unterschiede zwischen Bildungswissenschaftler(innen) auf der einen und Lehramtsstudierenden sowie erfahrenen Lehrkräften auf der anderen Seite fügen sich in die einschlägigen Befundmuster. Überraschend ist jedoch, dass sich Lehramtsstudierende beim Denken über unterrichtliche Problemsituationen nicht von erfahrenen Lehrkräften unterschieden. Dies mag an den fehlenden Lerngelegenheiten im Studium und Referendariat liegen (Bauer, Diercks, Rösler, Möller & Prenzel, 2012). Insofern ist fraglich, inwiefern ein Vergleich des evidenzorientierten Denkens von Lehramtsstudierenden und erfahrenen Lehrkräften hilfreiche Anhaltspunkte für die Förderung evidenzorientierten Denkens von Lehramtsstudierenden liefern kann. Eher sollte sich die Gestaltung entsprechender Maßnahmen an den Denkprozessen von Bildungswissenschaftler(inne)n orientieren. Zur Förderung bieten sich Ansätze fehlerbasierten Lernens (Oser, 2007) in Kombination mit speziellen Prompting-Prozeduren an, die auf die Kontrastierung bildungswissenschaftlichen Wissens und Alltagswissens abzielen.

 

Informationsintegration bei der Erklärung realer pädagogischer Situationen im Praxissemester: Analysen zu den Integrationstypen nach dem Documents Model Framework und zur Situationsauswahl

Kati Trempler1, Ulrike Hartmann2
1Universität Wuppertal, 2Universität Wuppertal und DIPF Leibniz-Institut für Bildungsforschung und Bildungsinformation

Theoretischer Hintergrund

Von Lehrkräften wird erwartet, dass sie im Sinne einer evidenzorientierten Praxis verschiedene Informationen nutzen, um pädagogische Entscheidungen zu begründen (Bauer et al., 2015). Dieses Vorgehen setzt ein Bündel an Fähigkeiten voraus, das die Identifikation relevanter, pädagogischer Situationen, die Suche adäquater Informationen, die Nutzung dieser für die Erklärung der Situation sowie die Ableitung alternativer Handlungsoptionen für künftige Situationen umfasst (Lunn-Brownlee et al., 2017). In der Regel stehen verschiedene Informationen zur Verfügung (bspw. wissenschaftliche Literatur, Expertenaussagen), die nicht direkt auf die Situation übertragbar sind (Hartmann et al., 2016). Vielmehr ist es notwendig, die Informationen zu einer spezifischen Situation miteinander zu verbinden, um eine umfassende, integrierte mentale Repräsentation zu entwickeln und die Situation auf diese Weise besser zu verstehen. Diese Integration verschiedener Informationen für die Erklärung einer pädagogischen Situation kann anhand des Documents Model Framework (Britt et al., 1999; Perfetti et al., 1999) beschrieben werden, das vier kognitive Modelle der Textintegration unterscheidet: Separate Representations Model (Texte werden isoliert voneinander dargestellt), Mush Model (Textinhalte werden integriert, ohne korrekte Referenzierung der Informationen), Documents Model (genutzte Texte werden integriert und korrekt referenziert) und Tag-all Model (Expertenversion des Documents Model mit Integration aller verfügbaren Informationen) (List et al., 2019).

Bisherige Studien zur Informationsnutzung und -integration zur Erklärung pädagogischer Situationen bewegen sich vorwiegend im Bereich experimenteller Settings (unter Vorgabe von Informationen und Standardisierung der Situation; u.a. Trempler/Hetmanek et al., 2015; Klein et al., 2015), wodurch kaum Aussagen über die Anwendung in naturalistischen Settings möglich sind. Es ist allerdings anzunehmen, dass real erlebte pädagogische Situationen verschiedene Inhaltsbereiche adressieren (u.a. Feedback, Classroom Management), für die in Anzahl und Qualität jeweils unterschiedliche Informationen existieren. Dementsprechend könnten die Situationsauswahl und die dadurch implizierte Variabilität von Informationen die Informationsintegration beeinflussen.

Fragestellungen

Unsere Fragestellungen lauten: (1) Wie häufig findet in Reflexionen angehender Lehrkräfte eine Informationsintegration im Sinne des Documents Model Frameworks statt? (2) Welche Informationen werden zur Erklärung der verschiedenen Situationen herangezogen und (3) Gibt es Unterschiede in den Verteilungen der Integrationsmodelle in Abhängigkeit von der Situation?

Methode

Zur Beantwortung der Fragestellungen wurden 87 Essays angehender Lehrkräfte (63% weiblich, MAge = 26.41 Jahre) inhaltsanalytisch kodiert und ausgewertet (Chi, 1997). Die Studierenden verfassten die Essays während einer halbjährigen Praxisphase an der Schule. Folgende Kodieraspekte wurden berücksichtigt:

Die Informationsintegration wurde anhand des Documents Model Framework zur Informationsintegration (Perfetti et al., 1999) sowie der Typologie von List et al. (2019) kodiert (mush, documents, tag all, separate representations, sonstige). Die Modelle lassen eine Aussage darüber zu, inwieweit Informationen integriert und korrekt referenziert werden.

Situationen und Inhaltsbereiche wurden nach Seidel und Shavelson (2007) in distale (z.B. Classroom Management, Schulorganisation) und proximale (z.B. konkrete Lernaktivitäten, Feedback) Komponenten schulischen Lehrens und Lernens kodiert. Da in den meisten Situationen verschiedene Inhaltsbereiche vorkommen, wurden Mehrfachkategorisierungen je Essay vorgenommen. Neben der Unterteilung in proximal/distal wurden konkrete Inhaltsbereiche für eine feinere Differenzierung kodiert.

Weiterhin wurden unterschiedliche Informationsarten (Lehrbuch/Handbuch/Sammelband, wissenschaftliche Zeitschriftenartikel, Ratgeberliteratur, Expertenaussagen, sonstige) kodiert und mit den Inhaltsbereichen in Verbindung gebracht, so dass eine Aussage zu Art und Anzahl der verwendeten Informationen je Inhaltsbereich möglich ist.

Ergebnisse

Die Analysen zeigten, dass 36% der Studierenden in ihren Essays verschiedene Informationsarten integrierten und korrekt belegten (Documents Model), während 52% keine Integration (Separate Representations, Sonstige) und 13% eine fehlerhafte Referenzierung (Mush Model) in ihren Essays vornahmen. Weiterhin zeigte sich eine starke Präferenz zur Nutzung von Ratgeberliteratur (69% der Essays) sowie wissenschaftlicher Literatur in Form von Hand- und Lehrbüchern (67% der Essays). Inwieweit die Nutzung verschiedener Informationen oder die Art der gewählten Situation in Zusammenhang mit der Fähigkeit zur Integration von Informationen steht, wird aktuell durch weitere Analysen exploriert. Die Ergebnisse werden hinsichtlich der Erfassung der Informationsintegration in realen pädagogischen Settings sowie in Hinblick auf Lehramtsausbildungsaspekte diskutiert.

 

„Teachers as Informed Pragmatists“: Förderung didaktischer Argumentationskompetenz von angehenden Lehrkräften durch Schreiben von Lerntagebüchern

Christina Schuba, Matthias Nückles
Universität Freiburg

Theoretischer Hintergrund

Unterricht evidenzorientiert planen und begründen zu können, zählt zu den Kernaufgaben von Lehrkräften. Sowohl von Bildungswissenschaftler*innen als auch Praktiker*innen wird solches didaktisches Argumentieren als zentral erachtet, insofern die Planung von Unterricht als komplexes Problemlösen aufgefasst werden kann (Lampert, 1985). Fachwissenschaft, Fachdidaktik und Bildungswissenschaft bieten hierbei komplementäre wissenschaftliche Perspektiven auf Unterricht (Shulman 1986).

Weitgehend unerforscht ist, wie die Fähigkeit, das eigene didaktische Handeln unter Rückgriff auf wissenschaftliches Wissen zu begründen, angehenden Lehrkräften vermittelt werden kann. Daher haben wir ein theoretisches Modell entwickelt, welches die Prozesse didaktischer Argumentationskompetenz spezifiziert. Das Modell basiert auf der Argumentationstheorie von Toulmin (1958, 2003) und greift wissenschaftstheoretische Überlegungen zum Theorie-Praxis-Problem in der Psychotherapieforschung auf, insbesondere die Unterscheidung epistemologischer Aussagentypen nach Bunge (1966; vgl. Perrez, 1998). Auf dieser Basis verfolgen wir das Ziel, angehenden Lehrkräften didaktisches Argumentieren zu vermitteln.

Fragestellung

In einer experimentellen Interventionsstudie haben wir untersucht, inwiefern didaktische Argumentationskompetenz durch das Schreiben von Lerntagebucheinträgen gefördert werden kann. Systematisch variiert wurde dabei die verfügbare instruktionale Unterstützung zum Schreiben des Lerntagebucheintrags: ein Tutorial über didaktisches Argumentieren und ein beispielhafter Lerntagebucheintrag (Graichen, Wegner & Nückles, 2019), der didaktisches Argumentieren in idealtypischer Weise veranschaulichte. Wir vermuteten, dass sowohl das Tutorial als auch der beispielhafte Lerntagebucheintrag sich positiv auf die Qualität der in den Lerntagebucheinträgen realisierten didaktischen Argumente auswirken würden.

Methode

Es haben N = 89 fortgeschrittene Studierende mit Lehramt Geschichte teilgenommen. Die Studierenden wurden randomisiert den Gruppen eines 2x2-Versuchsplans zugeteilt. Sie erhielten also entweder (a) das Tutorial, (b) den Beispiellerntagebucheintrag, (c) beide Unterstützungsarten oder (d) keinerlei Anleitung (Kontrollgruppe).

Die Lernumgebung verlangte von den Studierenden im Sinne des Multiple Documents Comprehension Paradigmas (Britt et al., 1999) die Auseinandersetzung mit einem fachwissenschaftlichen (FW), einem fachdidaktischen (FD) und einem bildungswissenschaftlichen Text (BW) in Hinblick auf deren Nutzen für die Planung von Geschichtsunterricht. Am Trainingstermin lasen die Teilnehmenden entsprechend einen fachwissenschaftlichen Text zum Thema Holocaust, einen fachdidaktischen Text zum Thema „den Holocaust unterrichten“ und einen bildungswissenschaftlichen Text zu instruktionspsychologischen Unterrichtsmodellen. In Versuchsbedingung (a) und (d) schrieben die Studierenden nach dem Lesen einen Lerntagebucheintrag. In Bedingung (b) und (c) studierten sie stattdessen den Beispiellerntagebucheitrag. In (a) und (c) studierten die Teilnehmenden vor dem Lesen zusätzlich das Tutorial. Am Transfertermin (7 Tage später) lasen die Teilnehmenden erneut drei Texte (FW: Haftbedingungen in der DDR, FD: Umgang mit Zeitzeugen im Unterricht, BW: Fehlkonzepte bei SuS). Dieses Mal verfassten alle Studierenden nach dem Lesen einen Lerntagebucheintrag und entwarfen als Anwendungsaufgabe einen Unterrichtsplan. Um die didaktischen Argumente in den Lerntagebucheinträgen zu analysieren, haben wir ein umfassendes Kodiersystem entwickelt (u.a. Kategorien zur Formulierung didaktischer Ziele, Strategien, Rechtfertigungen durch bildungswissenschaftliche und/oder fachdidaktische Prinzipien). Die Qualität der Anwendungsaufgabe wurde mit einer adaptierten Version von Biggs SOLO Taxonomie (Biggs & Collis, 1982) beurteilt.

Ergebnisse und Diskussion

Wie vorhergesagt zeigte die Analyse der Lerntagebucheinträge, dass das Tutorial die Anzahl der aus den Texten abgeleiteten didaktische Ziele und Strategien erhöhte, F(1, 85) = 19.81, p < .001, η2 = .19. Entgegen früherer Studien (Hübner, Nückles & Renkl, 2010) erwies sich der Beispiellerntagebucheintrag jedoch als nicht effektiv, F(1, 85) = 1.16, ns, woraus wir die Schlussfolgerung ableiten, dessen Gestaltung nochmals grundlegend zu überarbeiten. Hinsichtlich der Anwendungsaufgabe resultierte ebenfalls ein signifikanter Haupteffekt des Tutorials, d.h. die Qualität der Unterrichtsplanung war in den beiden Tutorial-Gruppen höher als in den anderen Gruppen, F(1, 85) = 24.77, p < .001, η2 = .23. Dessen ungeachtet fiel es den Studierenden in allen Bedingungen schwer, die formulierten didaktischen Ziele und Strategien durch Rückgriff auf in den gelesenen Texten beschriebenen wissenschaftlichen Prinzipien zu rechtfertigen. In zukünftigen Studien sollte also auf diesen zentralen Aspekt bei der Einführung in die Teilprozesse didaktischen Argumentierens und deren Modellierung durch Beispiele noch stärker geachtet werden.

 

Kollaboratives Argumentieren von Lehramtsstudierenden beim kritisch-reflektierten Umgang mit Online-Informationen

Maria Zimmermann1, Elisabeth Mayweg-Paus1, Miriam Lampe2, Regina Jucks2
1Humboldt Universität Berlin, 2Westfälische Wilhelms-Universität Münster

Theoretischer Hintergrund und Fragestellung

Um in ihrem professionellen Alltag evidenzbasiert zu handeln, müssen (angehende) Lehrkräfte bildungswissenschaftliche Informationen und Materialien aus dem Internet finden, bewerten und nutzen können. So ist die Förderung der Fähigkeit zu einem kritisch-reflektierten Umgang mit Online-Informationen ein zentrales Bildungsziel in der Lehramtsausbildung. Neben der instruktionalen Unterstützung, z.B. durch Trainings (z.B., Niu, Behar-Horenstein & Garvan, 2013), bieten insbesondere computer-mediierte Online-Diskurse einen vielversprechenden Ansatz zur Förderung der Fähigkeit zum kritischen Hinterfragen von Informationen und Argumenten (z.B., Chinn & Clark, 2013). Derartige Lernarrangements können Lernende zu einer elaborierten Auseinandersetzung mit der wissenschaftlichen Fundierung eines handlungsrelevanten Themenfelds anregen (Mayweg-Paus, Thiebach & Jucks, 2016; Thiebach, Mayweg-Paus & Jucks, 2016). In einem 1x2 Design haben wir untersucht, ob der zusätzliche argumentative Austausch über jeweils individuell verfügbare Informationen zwischen angehenden Lehrkräften die Wirksamkeit eines Trainings zum kritischen Hinterfragen erhöht.

Methode

Die Teilnehmenden waren 69 Lehramtsstudierende (53 weiblich) mit einem Durchschnittsalter von 23.41 Jahren (SD = 2.95), die ein Training zum kritischen Hinterfragen von wissenschaftlichen Informationen erhielten. Folgend der Definition von kritischem Denken (e.g., Browne & Keeley, 2007) orientierte sich das Training an fünf Kriterien für die Güte von Argumenten (Klarheit, Exaktheit, Korrektheit, Logik und Multiperspektivität, e.g. Jahn, 2012) und enthielt entsprechende Beispielfragen (skill level). Zudem wurde für die Relevanz des kritischen Hinterfragens von Informationen sensibilisiert (willigness level). Im Anschluss hat die eine Hälfte der Teilnehmenden zwei journalistische Online-Texte zum Thema Computernutzung in der Kindheit erhalten, welche sie individuell bearbeiteten. Die andere Hälfte bearbeitete die gleichen Texte im Diskurs mit einem Lernpartner, wobei jeweils nur ein Text pro Proband vorbereitet wurde.

Die Qualität des Argumentationsverhaltens wurde mittels einer qualitativen Inhaltsanalyse auf Grundlage von schriftlichen Stellungnahmen, die die Teilnehmenden im Anschluss an die Bearbeitung der Textinformationen verfassten, erhoben. Die relevanten Kategorien bezogen sich auf kritische Fragen, kritisch-hinterfragende, elaborierte und nicht-elaborierte Aussagen (Cohen’s Kappa κ = .91). Die Fähigkeit zum kritischen Umgang mit Argumenten wurde mit der Subskala “evaluating arguments” des WGCTA (Watson & Glaser, 2007), einem Instrument zur Erfassung der Fähigkeit zum kritischen Denken, gemessen.

Ergebnisse und Diskussion

Die Teilnehmenden, die sich in einem argumentativen Online-Diskurs austauschten, zeigten insgesamt ein elaborierteres Argumentationsverhalten in Antworten auf die zentralen Argumente, als die Teilnehmenden, die das Training ohne Diskurs durchliefen, F(3, 65) = 4.25, p = .008, ηp2 = 0.16. Insbesondere stellten sie tendenziell mehr kritische Fragen, F(1, 67) = 3.60, p = .06, ηp2 = 0.06, und formulierten mehr elaborierte Aussagen, F(1, 67) = 3.93, p = .05, ηp2 = 0.06. Zusätzlich hatte der Diskurs einen positiven Effekt auf die Fähigkeit der Teilnehmenden kritisch mit Argumenten umzugehen, F(1, 67) = 11.91, p = .001, ηp2 = 0.15. Im Gegensatz formulierten Teilnehmende, die die Informationen individuell bearbeiteten, mehr unelaborierte Aussagen (z.B. Behauptungen, die nicht auf wissenschaftlichen Evidenzen gestützt wurden) in ihren Antworten, F(1, 67) = 6.00, p = .02, ηp2 = 0.08.

Die Ergebnisse der Studie betonen die Relevanz des sozialen Austauschs beim kritisch-reflektierten Umgang mit Online-Informationen. Während die individuelle Informationsverarbeitung in den Trainings es eher erlaubte, potenziell gegensätzliche Evidenzen zu ignorieren, hat der kollaborative Diskurs die Lernenden zu einer tieferen Auseinandersetzung mit den bildungswissenschaftlichen Informationen und deren wissenschaftlicher Fundierung angeregt. In weiterführender Forschung gilt zu klären, welche Rolle der Ressourceninterdependenz zwischen den Lernpartnern zur Erklärung dieser Effekte zukommt. Aus praktischer Perspektive empfiehlt es sich, argumentative Online-Diskurse als lernwirksames Element in die Lehramtsausbildung zu integrieren.

 
11:15 - 13:00F11–S13: Lernprozesse zum Lesen und Schreiben
S13 
 

The Power of Intrinsic Reading Motivation – Eye Movement Analyses

Anja Rettig, Ulrich Schiefele

Universität Potsdam, Deutschland

Reading motivation is conceptualized as a multidimensional construct (Wigfield & Guthrie, 1997). This conceptualiation is based on the idea that various motives may initiate reading activities (Wigfield, 1997). Intrinsic reading motivation refers to motives that are closely related to the reading activity or object of reading itself; extrinsic reading motivation refers to motives that are more external and not reading specific. Reading motivation, especially intrinsic reading motivation, plays an important role in reading acquisition as it determines the amount and breath of reading which affect in turn reading comprehension (for a review, Schiefele, Schaffner, Möller, Wigfield, 2012).

Despite numerous research in this domain, there are still some blind spots that demand our attention. First,we know pretty little about the importance of reading motivation in early elementary grades (i.e., below grade 4). Second, the analysis of causal relations demands longitudinal studies, but most results are based on cross-sectional data. Third, while we know a lot about effects on higher-level cognitive processes like comprehension, very little is known about effects on basic reading processes. It is assumable that reading motivation not only affects reading comprehension via an increase of reading amount, but that it also facilitates basic text processing by increasing students’ readiness for reading.

We aim to fill in this gap of research by presenting longitudinal reading-motivation and eye-movement data that inform us about the development of basics reading processes. These data were collected for German elementary-school students in grades 1-4 in two successive years (n= 141). Data on self-reported habitual intrinsic and extrinsic reading motivation were collected at school by means of the Reading Motivation Questionnaire for Elementary Students (RMQ-E; Stutz, Schaffner, & Schiefele, 2017). The instruction as well as all items were read aloud by the researcher. For supporting children with the four-point rating format, in addition to verbal labels differently sized circles were presented. Furthermore, items were expressed as questions for first and second graders to increase comprehensibility. Eye movements were recorded in a separate individual experimental session. Children read a corpus of single age-appropriate as well as first-grade-level (n= 24) sentences on a computer screen. The number of age-appropriate sentences was smaller in grade one (n = 32) than in grades 2–4 (n= 48) to avoid exhaustion of beginning readers. The here presented results are based on age-appropriate material only as comparability of reading difficulty weights higher than comparability of text characteristics when examining effects of reading motivation on text processing.

In both years, intrinsic but not extrinsic reading motivation was significantly related to various eye-movement measures. Higher scores of intrinsic reading motivation were related to shorter fixations, longer saccades, fewer refixations, and larger perceptual spans. This resulted in an increased reading rate (words per minute). While the correlations between extrinsic reading motivation and different eye-movement measures were close to zero in year one, the pattern of correlations was consistently reverse to the one of intrinsic reading motivati