Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
 
Sitzungsübersicht
Ort: 1.19
Datum: Mittwoch, 25.03.2020
11:15 - 13:00M11–1.19: Eltern & Berufswahl
1.19 
 

Berufswahl und Passung beim Übergang von der Sekundarstufe I in die Berufsbildung bei hoher/tiefer Elternunterstützung

Markus P. Neuenschwander, Jan Hofmann

Pädagogische Hochschule Nordwestschweiz, Schweiz

Einleitung

Der Übergang von der Schule in die Berufsbildung ist eine wichtige und anspruchsvolle Aufgabe. Jugendliche müssen einerseits einen Beruf wählen und sich andererseits an die neuen Anforderungen in der beruflichen Ausbildung anpassen. Eine hohe Passung zwischen Person und Ausbildungsplatz korreliert mit hoher Leistung, hoher Zufriedenheit, geringem Berufswechselrisiko und geringem Arbeitslosigkeitsrisiko (Kristof-Brown, Zimmermann & Johnson, 2005; Neuenschwander et al., 2012). Bisher wurde kaum längsschnittlich untersucht, wie die erste Berufswahl die Anpassungsprozesse nach dem Übertritt in die Berufsbildung beeinflusst. Die Berufswahlforschung und die Forschung zu den Anpassungsprozessen bei Eintritt in die Berufsbildung beziehen sich kaum aufeinander. Überdies wissen wir wenig, wie Bezugspersonen (z.B. Eltern) diese Prozesse steuern.

Fragestellung

In diesem Beitrag wird den Fragen nachgegangen, (a) wie Bedingungen und Ergebnisse der Berufswahl die Anpassungsprozesse nach dem Eintritt in die Berufsbildung bestimmen und (b) wie Eltern den Übergang von der Schule in die Berufsbildung unterstützen.

Theoretischer Hintergrund

Ausgehend von der sozial-kognitiven Laufbahntheorie von Lent, Brown und Hackett (1994) nehmen wir an, dass der Berufswahlprozess durch Zielcommitment, Selbstwirksamkeitserwartungen und Erwartungen an den Ausbildungsbetrieb (Ergebniserwartungen) gesteuert wird (sog. Selbstmanagement der Laufbahnentscheidung nach Brown & Lent, 2019). Diese drei Konzepte erklären die Entscheidungssicherheit der getroffenen Wahl (Entscheidungsergebnis, Ireland & Lent, 2018). Zudem nehmen wir mit Lent und Brown (2008) an, dass die Ergebniserwartung und die Entscheidungssicherheit die wahrgenommene Passung zwischen Person und Ausbildungsplatz nach dem Übergang vorhersagen.

Unabhängig davon wird die Passung zwischen Person und Ausbildungsplatz ausgehend von der Forschung zur Sozialisation am Arbeitsplatz auch durch betriebliche Ressourcen (Lent & Brown, 2008) wie zum Beispiel betriebliche Sozialisationstaktiken bestimmt (Kammeyer-Mueller & Wanberg, 2003). Wenn diese die Rollenambiguität und Unsicherheit der neu eingetretenen Mitarbeitenden reduzieren, nimmt die wahrgenommene Passung von Person und Ausbildungsplatz zu (Jones, 1986). Entsprechend können Ausbildungsbetriebe neu eintretende Lernende durch geeignete Strategien unterstützen, sich zu integrieren (Saks & Gruman, 2018).

Zudem wird ausgehend von Lent und Brown (2008) angenommen, dass die Elternunterstützung den Berufswahlprozess beeinflusst (Bryant, Zvonkovic & Reynolds, 2006). Eine hohe Elternunterstützung trägt bei, dass Jugendliche ihre beruflichen Ziele eher realisieren können und dass sich geringe Selbstwirksamkeitserwartungen von Jugendlichen nicht negativ auf den Entscheidungsprozess auswirken.

Methode

Diese Annahmen wurden anhand von Längsschnittdaten des Schweizer Forschungsprojekts Wirkungen der Selektion (WiSel) überprüft. Es wurde eine Teilstichprobe von 620 Jugendlichen verwendet, die im 7. Schuljahr (t1), im 9. Schuljahr (t2) und im 1. Jahr nach Schulaustritt (t3, Durchschnittsalter zu t3: 16.8 Jahre) befragt wurden. Wir fanden keine relevanten Rücklaufverzerrungen zwischen den Erhebungswellen. Es wurden standardisierte, reliable Fragebogenskalen verwendet. Mit Ausnahme von Zielcommitment wurden alle Konzept mit mehreren Items latent geschätzt.

Ergebnisse

Messinvarianzanalysen belegten metrische Invarianz aller latenter Konzept zwischen den Gruppen. In einem Strukturgleichungsmodell (SEM) mit akzeptabler Modellpassung zeigten sich signifikante Pfade zwischen Zielcommitment (t1) bzw. Selbstwirksamkeitserwartung (t1) und Ergebniserwartung (t2) bzw. Entscheidungssicherheit (t2). Letztere erklärten die wahrgenommene Passung Person-Ausbildungsplatz (t3) signifikant, zusammen mit den betrieblichen Sozialisationstaktiken (t3). Das gleiche SEM im Gruppenvergleich (hohe vs. tiefe Elternunterstützung) erreichte eine akzeptable Modellpassung und belegte einen Moderatoreffekt. Die Effekte je von Zielcommitment und Selbstwirksamkeit auf Ergebniserwartung und Entscheidungssicherheit unterschieden sich zwischen den Gruppen. Einzig einer dieser vier Pfade (von Zielcommitment auf Entscheidungssicherheit) unterschied sich nicht zwischen den Gruppen. Bei hoher Elternunterstützung ist der Pfad von Zielcommitment je auf Ergebniserwartung und Entscheidungssicherheit höher als bei tiefer Elternunterstützung. Bei tiefer Elternunterstützung ist der Pfad von der Selbstwirksamkeitserwartung je auf Ergebniserwartung und Entscheidungssicherheit grösser als bei hoher Elternunterstützung.

Schlussfolgerungen

Die Ergebnisse bestätigen die Annahmen der sozial-kognitiven Laufbahntheorie zu Berufswahl und Anpassungsprozessen in der Berufsbildung. Bedingungen und Ergebnisse der Berufswahl sagen die Person-Umwelt-Passung in der Berufsbildung vorher, zusammen mit den betrieblichen Sozialisationstaktiken. Die Elternunterstützung moderiert den Berufswahlprozess. Die Ergebnisse belegen die hohe Bedeutung von sozialen Kontextfaktoren auf die Berufswahl.



Die prädiktive Rolle von Berufswünschen, erreichtem Bildungsniveau, elterlichen Bildungserwartungen und sozioökonomischem Hintergrund für die Wahl des sozialen Status von Berufswahlpraktikaberufen

Jan Hofmann, Markus Neuenschwander

PH Fachhochschule Nordwestschweiz, Schweiz

Der soziale Status eines Berufes ist eines der zentralen beruflichen Merkmale. Im Prozess der ersten Berufswahl kommen die Jugendlichen in Praktika zum ersten Mal in persönlichen Kontakt mit den verschiedenen Ausprägungen sozialer Status von Berufen. Mit der Wahl eines Berufswahlpraktikumberufes treffen Jugendliche eine erste Vorentscheidung, welchen beruflichen sozialen Status sie anstreben möchten und anstreben können. Zwar untersuchten Studien die Bedingungen des sozialen Status der ersten Berufswahl (Lee & Byun, 2019). Forschungsarbeiten zum sozialen Status von Berufswahlpraktikaberufen existieren aber nach unserem Wissen bislang keine. Dieser Beitrag geht deshalb den Fragen nach, (1) wie der soziale Status der Berufswahlpraktikaberufe mit dem sozialen Status des später gewählten Lehrberufes zusammenhängt, (2) welche individuellen und kontextuellen Bedingungen den sozialen Status der Berufswahlpraktikaberufe vorhersagen und (3) ob und wie sich der berufliche soziale Status über den Berufswahlprozess hinweg verändert.

Wir untersuchten diese Forschungsfragen in Anlehnung an das sozio-kognitive Laufbahnmodell (Lent, Brown, & Hackett, 1994). Das Modell besagt, dass Berufswahlpraktika als Form von explorativer Berufswahlhandlungen spätere inhaltliche und leistungsbezogene berufliche Entscheidungen vorbestimmen. Gemäss dem Modell hängt der soziale Status der Berufswahlpraktikaberufe einerseits vom sozialen Status der beruflichen Ziele der Jugendlichen ab (Schoon & Parsons, 2002). Andererseits wird er durch kontextuelle Gegebenheiten prädeterminiert (Schindler, 2017). Nahe Bezugspersonen aus dem sozialen Kontext (z. B. die Eltern) nehmen auf den sozialen Status der Berufswahlpraktikaberufe der Jugendlichen indirekt Einfluss, indem sie über ihre Bildungserwartungen den sozialen Status der beruflichen Ziele ihrer Kinder mitbestimmen. Der sozioökonomische Hintergrund der Familie beeinflusst die elterlichen Bildungserwartungen und wirkt so indirekt auf den sozialen Status der Berufswahlpraktikaberufe ein (Howard et al., 2011).

Zur Analyse der Fragestellungen benutzten wir Daten der Schweizer Längsschnittstudie Wirkungen der Selektion. Wir verwendeten ein Längsschnittsample aus 550 Jugendlichen, die im siebten und neunten Schuljahr standardisierte Fragebögen ausfüllten (MAlter 7. Schuljahr: 13.21 Jahre, weiblich: 52.2%). Der soziale Status der Berufe wurde über den International Socio-Economic Index of Occupational Status (ISEI-08; Ganzeboom, 2010) operationalisiert. Die Jugendlichen nannten maximal acht Berufswahlpraktikaberufe, die hinsichtlich ihres sozialen Status zu einem Medianwert zusammengefasst wurden. Der soziale Status der beruflichen Ziele wurde über die Berufswünsche gemessen. Die kontextuellen Gegebenheiten wurden über das besuchte Schulniveau operationalisiert. Die elterlichen Bildungserwartungen an ihr Kind wurden dichotom behandelt (0: Abschluss auf Sekundarstufe I/II, 1: Abschluss auf Tertiärniveau). Der sozioökonomische Hintergrund der Familie wurde über den höchsten sozialen Status der Elternberufe gemessen.

Die bivariate Korrelationsanalyse zwischen dem sozialen Status der Berufswahlpraktikaberufe und der Lehrberufe ergab einen signifikant positiven Zusammenhang (r = .78, p < .001, n = 338). Das Pfadmodell mit guter Modellpassung zeigte, dass der soziale Status der Berufswünsche einen signifikant positiven Effekt auf den sozialen Status der Berufswahlpraktikaberufe hatte. Je höher das besuchte Schulniveau der Jugendlichen war, desto höher fiel der soziale Status der Berufswahlpraktikaberufe aus. Die Bildungserwartungen der Eltern hatten einen signifikant positiven indirekten Effekt auf den sozialen Status der Berufswahlpraktikaberufe der Jugendlichen, vermittelt über den sozialen Status der Berufswünsche. Der sozioökonomische Hintergrund der Jugendlichen hatte ebenfalls einen signifikant positiven indirekten Effekt auf den sozialen Status der Berufswahlpraktikaberufe, vermittelt über die elterlichen Bildungserwartungen und den sozialen Status der Berufswünsche. Die Varianzanalyse mit Messwiederholung zeigte, dass der soziale Status der Berufswünsche signifikant höher war als der soziale Status der Schnupperlehr- und Lehrberufe. Zwischen letzteren beiden gab es keinen signifikanten Unterschied.

Die Ergebnisse des Pfadmodells zeigen erstmals, welche Faktoren den sozialen Status explorativer Berufswahlhandlungen vorhersagen. Dass die Wahl des sozialen Status der Berufswünsche nicht nur den Bedürfnissen der Jugendlichen entsprach, sondern auch die Vorstellungen ihrer Eltern enthielt, verdeutlicht den bedeutsamen Einfluss des sozialen Kontextes im Berufswahlprozess. Die hohe Korrelation zwischen dem sozialen Status der Berufswahlpraktikaberufe und den Lehrberufen verweist auf die prädisponierende Rolle des sozialen Status der Berufswahlpraktikaberufe für den weiteren beruflichen Verlauf.



Wer studiert Wirtschaft? Einflüsse ökonomischer Kompetenzen auf die Studienfachwahl beim Übergang von der Schule zur Hochschule

Michael Jüttler1, Stephan Schumann1, Nicolas Hübner2, Benjamin Nagengast2

1Universität Konstanz, Deutschland; 2Hector-Institut für Empirische Bildungsforschung, Universität Tübingen

Theoretischer Hintergrund

Die Bedeutung der Förderung ökonomischer Kompetenzen wird in zahlreichen Ländern kontrovers diskutiert. So wird den ökonomischen Kompetenzen vor allem hinsichtlich einer sozialen Teilhabe in modernen Wirtschaftsgesellschaften eine substantielle Bedeutung zugesprochen (Dubs, 2001, 2011; Eberle & Schumann, 2011; Schumann & Jüttler, 2015; Jüttler et al., 2016). Betrachtet man diese Debatte vor dem Hintergrund von Studienfachwahlen, zeigt sich, dass wirtschaftswissenschaftliche Studiengänge weltweit zu der meistgewählten Fächergruppe zählen (OECD, 2017). In diesem Zusammenhang rückt auch die Frage einer ökonomischen Bildung als Teil der schulischen Allgemeinbildung in den Mittelpunkt. Ausgehend von theoretischen Überlegungen zur Studienfachwahl können, neben Merkmalen wie den schulischen Leistungen, den Interessen, dem sozioökonomischen Hintergrund, etc., besonders auch den individuellen domänenspezifischen Fähigkeiten eine bedeutsame Rolle zugesprochen werden (Eccles et al., 1983; Eccles & Wigfield, 2002). Jedoch liegen bisher keine Befunde zu den Effekten der am Ende der Schulzeit vorliegenden ökonomischen Kompetenzen auf die Studienfachwahl vor. Dieses Desiderat wird mit der vorgestellten Studie aufgegriffen.

Den ökonomischen Kompetenzen wird in der Studie dabei in Anlehnung an Weinert (2001) und Beck (1989) ein umfassendes Begriffsverständnis zugrunde gelegt, welches neben dem ökonomischen Wissen und Können auch weitere Kompetenzfacetten (intrinsische Motivation, Interesse, Einstellung und Werthaltung) berücksichtigt.

Fragestellung

Vor diesem Hintergrund wird der Fragestellung nachgegangen, welche Vorhersagekraft die am Ende der Schulzeit verfügbaren ökonomischen Kompetenzen im Hinblick auf die Studienfachwahl haben.

Methode

Die Datengrundlage bildet eine Längsschnittstichprobe mit N = 1.397 Lernenden mit gymnasialer Maturität der Deutschschweiz. Der erste Messzeitpunkt lag am Ende des letzten Schulbesuchsjahres (Schuljahr 2010/11, vgl. Schumann & Eberle, 2014). Die Folgeuntersuchung wurde ca. fünf Jahre später im Frühjahr/Sommer 2016 durchgeführt. Das Instrumentarium des ersten Messzeitpunktes setzt sich aus Leistungstests zu den Domänen „Wirtschaft“, „Mathematik“ und „Deutsch“, einem kognitiven Fähigkeitstest und einem Fragebogen (u.a. zur Erfassung weiterer Kompetenzdimensionen) zusammen. Im Rahmen der Folgeuntersuchung wurden mit Hilfe eines Online-Fragebogens sowie computergestützten Telefoninterviews die Bildungsverlaufsdaten (insbesondere gewählte Studienfächer) der letzten fünf Jahre erfasst. Auf Grundlage des „Inverse Probability“-Verfahrens wurden die Daten in einem weiteren Schritt gewichtet, um den Ausfall zum zweiten Messzeitpunkt zu kompensieren (siehe Brick & Montaquila, 2009). Fehlende Werte in den Leistungsvariablen wurden mittels Mehrebenenimputation auf Grundlage von „chained equations“ unter Verwendung des R-Pakets mice geschätzt (siehe Van Buuren & Groothuis-Oudshoorn, 2011).

Ergebnisse

Die Analysen zeigen deutliche Unterschiede zwischen Studierenden mit unterschiedlichem Studienprofil und den am Ende der Schulzeit verfügbaren individuellen Kompetenzen. Dabei zeigt sich, dass Lernende, die im Anschluss an das Gymnasium ein wirtschaftswissenschaftliches Studium gewählt haben, in allen Dimensionen ökonomischer Kompetenz über die höchsten Ausprägungen verfügen, wobei die stärksten Unterschiede im ökonomischen Wissen und Können sowie im Interesse in Wirtschaft zu finden sind. Bzgl. der Mathematik- und Deutschleistung zeigen sich umgekehrte Ergebnisse: Hier weisen Lernende, die sich für ein wirtschaftswissenschaftliches Studium entschieden haben, unterdurchschnittliche Leistungen auf. Für die kognitiven Grundfähigkeiten finden sich keine signifikanten Unterschiede. Differenziert nach den einzelnen Fächergruppen lassen sich die obigen Ergebnisse im Rahmen einer multinomial-logistischen Regression weitestgehend bestätigen. Diesbezüglich weisen sich insbesondere das ökonomische Wissen und Können und das Interesse in Wirtschaft als die stärksten Prädiktoren aus. Dagegen wählen Lernende mit höheren mathematischen Fähigkeiten eher ein technisches oder naturwissenschaftliches und Lernende mit höheren sprachlichen Fähigkeiten ein geistes- oder sozialwissenschaftliches anstatt ein wirtschaftswissenschaftliches Studium. Darüber hinaus zeigen sich erwartungsgemäß starke Effekte durch das Schulprofil, wobei Lernende, die das Fach „Wirtschaft und Recht“ als Schwerpunktfach gewählt hatten deutlich häufiger ein wirtschaftswissenschaftliches Studium wählen als Lernende mit anderem Schwerpunktfach. Insgesamt wird durch die Ergebnisse die Bedeutsamkeit einer ökonomischen (Schul-)Bildung für den weiteren Bildungsverlauf unterstrichen, wodurch den ökonomischen Kompetenzen am Ende der Schulzeit eine tragende Rolle beim Übergang von der Schule zur Hochschule beigemessen werden kann.

 
14:30 - 16:15M14–1.19: Einflussfaktoren auf das Lernen
1.19 
 

Lernpausen als integrierte Lernphase: Akute Effekte einer Bewegungspause und eines Achtsamkeitstrainings auf Befindlichkeit, Aufmerksamkeit und exekutive Funktionen

Christian Müller1,2, Alexandra Popkova1, Qian Li1, Daniel Mennekes1, Lucie Lilienthal1, Frank Hänsel1

1TU Darmstadt, Deutschland; 2IDeA-Zentrum, Frankfurt

Um Aufmerksamkeit und Motivation in Lehr-Settings zu erhalten, werden positive Effekte körperlicher Aktivierung (Donnelly et al., 2016) sowie zunehmend auch von Achtsamkeitstrainings (Mak, Whittingham, Cunnington, & Boyd, 2017) untersucht. Die Studienergebnisse hierzu sind jedoch heterogen, wenig standardisiert und innerhalb universitärer Lehr-Settings bisher kaum untersucht worden (Singh et al., 2019; van Dam et al., 2018). In zwei Studien wurde daher untersucht, inwieweit sich akute Effekte einer Bewegungspause (Studie 1) oder einer Achtsamkeitsintervention (Studie 2) auf die Befindlichkeit und Aufmerksamkeit innerhalb eines universitären Lernsettings nachweisen lassen.

Design:

In beiden Studien wurde ein within-subject-cross-over-design in eine wöchentliche Vorlesung über zwei Folgetermine implementiert. Die TeilnehmerInnen wurden, kontrolliert nach Geschlecht, randomisiert in Interventions- oder Kontrollgruppe eingeteilt, um Stichprobenunterschiede zu berücksichtigen. In der Folgewoche wurden die Bedingungen getauscht. In Studie 1 (Bewegungspause) nahmen 47 Personen (Alter M = 21.83 Jahre, SD = 3,87, weiblich = 89 %) und in Studie 2 (Achtsamkeitstraining) nahmen bisher 23 Personen (Alter M = 23,65 Jahre, SD = 4.54, weiblich = 68 %) teil. Interventions- und Kontrollgruppe der beiden Studien unterschieden sich zu Beginn der Messung nicht signifikant hinsichtlich der abhängigen Variablen und der Geschlechterverteilung (p stets > .05). An jedem Termin wurden vor und nach jeder Pause folgende Instrumente verwendet:

Befindlichkeit:

Zur Messung der psychischen Befindlichkeit wurde der mehrdimensionale Befindlichkeitsfragebogen (MDBF) gewählt. Dabei wird die aktuelle Befindlichkeit bezüglich guter-schlechter Stimmung, Wachheit-Müdigkeit und Ruhe-Unruhe erfasst (Steyer, Schwenkmezger, Notz, & Eid, 1997).

Aufmerksamkeit:

Zur Erfassung selektiver Aufmerksamkeit wurde der d2-R eingesetzt, der die Diskrimination visuell ähnlicher Zeichen erfasst. Als Ergebnis werden bearbeitete Zielobjekte (BZO), Fehlerprozent (Anteil Fehler) und ein kombinierter Wert aus BZO und Fehlerprozent angegeben (Brickenkamp, Schmidt-Atzert, & Liepmann, 2010).

Exekutive Funktionen:

Zur Erfassung eines Teilaspekts exekutiver Funktionen wurde der Trail Making Test (TMT) verwendet (Tombaugh, 2004), bei dem Informationen trotz proaktiver Interferenz und negativem Priming verarbeitet werden sollen. Als Ergebnis werden die Gesamtzahl der bearbeiteten Zeichen, die Fehleranzahl und die Differenz aus bearbeiteten Zeichen und Fehlern berechnet. Zur Vermeidung von Übungseffekten wurden Parallelversionen für jeden Messzeitpunkt mit jeweils exakt gleicher Gesamtlinienlänge verwendet.

Bewegungspause/Achtsamkeitstraining:

Die in Kooperation mit Sportwissenschaftlern entwickelte Bewegungspause bestand aus verschiedenen Phasen: Warm-up, Stretching, mittlere kardiovaskuläre Aktivierung und Cool-down. Das Achtsamkeitstraining bestand aus einer Atemübung, gelenkter sensorischer Wahrnehmung und einem Body-scan.
Die Interventionen dauerten jeweils 10 Minuten und wurden zur standardisierten und korrekten Durchführung jeweils von einem/r erfahrenen Trainer/in geleitet. In den Kontrollgruppen wurde ebenfalls pausiert, jedoch pausierten die TeilnehmerInnen ohne Vorgabe außerhalb des Vorlesungsraums nach persönlicher Vorliebe z. B. essen, trinken, unterhalten oder Handy nutzen.

Als Kontrollvariablen wurden Items mit Likert-Skala zur Motivation und Vorerfahrung bezüglich sportlicher Aktivität (Studie 1) oder Achtsamkeit (Studie 2) erhoben.

Ergebnis:

In Studie 1 (Bewegungspause) ergaben sich signifikante Interaktionseffekte bezüglich Befindlichkeit sowie selektiver Aufmerksamkeit. TeilnehmerInnen der Bewegungspause schätzten sich nach der Pause stets wacher ein (F(1,46) = 18.342, p = .000, d = 1.26) und bearbeiteten mehr Zielobjekte (BZO) beim d2-R (F(1,46) = 4.463, p = .040, d = 0.62) als in der Kontrollgruppe. Bezüglich der anderen Skalen inklusive TMT (exekutive Funktionen) ergaben sich keine signifikanten Interaktionseffekte.
In Studie 2 schätzten sich die TeilnehmerInnen der Achtsamkeitspause nach der Intervention als ruhiger ein als in der Kontrollgruppe (F(1,22) = 4.855, p = .038, d = 0.58). Weitere Interaktionseffekte liegen bisher nicht vor, aber vorliegende Befunde verweisen darauf, dass bei der geplanten Stichprobenerhöhung auf n = 47 (wie in Studie 1), signifikante Interaktionseffekte beim TMT zu erwarten sind. In beiden Studien waren Motivation und Vorerfahrung jeweils nicht bedeutsam.

Diskussion:

Die vorliegenden Ergebnisse belegen akute positive Effekte von Lernpausen auf motivationale sowie kognitive Lernbedingungen, die jedoch von der jeweiligen Pausengestaltung abhängen. Im Vortrag werden weitere Ergebnisse der laufenden Studie vorgestellt und Implikationen weiter diskutiert.



Bedeutung lesebezogener Leistungsprofile für die schülerseitige Wahrnehmung des selbstregulierten Lesens im Deutschunterricht

Fabiana Karstens

Universität zu Köln, Deutschland

Die Vermittlung des selbstregulierten Lesens durch kognitive Lesestrategien und selbstregulatorische Techniken hat sich als aussichtsreicher Ansatzpunkt zur Förderung des Leseverstehens erwiesen (u.a. Dignath-van Ewijk & Büttner, 2008). Da sich selbstreguliertes Lesen in der Regel jedoch nicht automatisch entwickelt (Dole, Nokes, & Drits, 2009), sollten Lehrkräfte mit ihrem Unterrichtsangebot Möglichkeiten zur Anwendung, Übung und Reflexion über Lesestrategien schaffen (Pressley, 2002; Kintsch, 2009). Studien zur Umsetzung des selbstregulierten Lesens im Deutschunterricht beziehen sich zumeist auf die Angaben von Lehrkräften (u.a. Bremerich-Vos et al., 2017; Schmitz & Jost, 2019) und/oder externer Beobachter (u.a. Anmarkrud & Braten, 2012; Kleinbub, 2016). Obwohl der Perspektive der Schüler/-innen im Rahmen unterrichtlicher Wirkungsprozesse eine besondere Rolle zukommt und eine entscheidende Schlüsselstelle zwischen Unterrichtsangebot und Lernerfolg darstellt (Helmke, 2015), wurde diese bezogen auf den strategieorientierten Leseunterricht bislang jedoch vernachlässigt. Dabei weisen schülerseitige Wahrnehmungen eine hohe prädiktive Validität (Clausen, 2002; De Jong & Westerhof, 2001) und Reliabilität auf (Wagner et al., 2013) und können Ansatzpunkte für eine passgenaue Förderung des selbstregulierten Lesens bieten. Zudem haben Studien aus dem Mathematik- (u.a. Ditton, 2002; Jurik et al., 2015; Willems, 2018) oder Physikunterricht (Seidel, 2016) nachgewiesen, dass schülerseitige Wahrnehmungen des Unterrichts durch individuelle Lernvoraussetzungen beeinflusst werden.

An diesen Forschungsdiskurs anknüpfend untersucht der vorliegende Beitrag, inwieweit schülerseitigen Wahrnehmungen des selbstregulierten Lesens im Deutschunterricht durch individuelle lesebezogene Lernvoraussetzungen beeinflusst werden. Dazu werden differenzielle Ausprägungen unterschiedlicher Lernvoraussetzungen der Schüler/-innen durch die Betrachtung latenter Leistungsprofile berücksichtigt und somit eine personenzentrierte Sichtweise eingenommen.

745 Schüler/-innen aus fünften Klassen wurden dazu befragt, wie sie das Unterrichtsangebot im Hinblick auf das selbstregulierte Lesen im Deutschunterricht wahrnehmen. Auf einer 4-stufigen Likert-Skala sollten sie Angaben zur Häufigkeit des Einsatzes ausgewählter kognitiven Lesestrategien (9 Items, = .70), der Häufigkeit des Einsatzes metakognitiver Lesestrategien (5 Items, = .76) und der Adressierung ressourcenbezogener Unterstützung durch die Lehrkraft (6 Items, = .76) machen. Zusätzlich wurden die lesebezogenen Lernvoraussetzungen der Schüler/-innen in Form standardisierter Testverfahren und Skalen (FLVT 5-6, WLST 7-12, Lesefreude aus PISA 2009) erhoben. Zur Identifikation der Leistungsprofile wurden latente Profilanalysen auf Grundlage der drei leistungsbezogenen Subskalen durchgeführt. Dabei wurde die hierarchische Datenstruktur durch die Korrektur des Standardfehlers berücksichtigt und fehlende Werte über die FIML-Prozedur geschätzt. Anschließend wurden die Unterschiede in den schülerseitigen Wahrnehmungen in Anhängigkeit der Leistungsprofile varianzstatistisch überprüft.

Die latente Profilanalyse ergibt vier latente Leistungsprofile. Schüler/-innen im ersten Profil besitzen hohe kognitive und motivationale Voraussetzungen. Demgegenüber lässt sich eine Gruppe von Schüler/-innen mit niedrigen kognitiven und motivationalen Leistungswerten identifizieren. Die beiden weiteren Profile bilden einerseits eine Gruppe von Schüler/-innen mit niedrigen kognitiven und durchschnittlichen motivationalen Voraussetzungen sowie eine Gruppe mit durchschnittlichen kognitiven und niedrigen motivationalen Leistungswerten ab. Die Varianzanalysen verdeutlichen, dass sich die schülerseitigen Wahrnehmungen nur hinsichtlich der metakognitiven Strategien (F(3, 739) = 3.361, p < .05, = .013) und der ressourcenbezogenen Unterstützung (F(3, 738) = 3.997, p < .01, = .016) unterscheiden. Post-Hoc-Analysen zeigen, dass Schüler/-innen des Leistungsprofils mit hohen kognitiven und motivationalen Voraussetzungen die Anleitung metakognitiver Strategien signifikant seltener wahrnehmen, als Schüler/-innen mit niedrigen kognitiven und motivationalen Voraussetzungen (p < .05). Die Lernenden des Profils mit hohen Ausprägungen in den kognitiven und motivationalen Voraussetzungen nehmen hingegen eine ressourcenbezogene Unterstützung durch die Lehrkraft eher wahr als Schüler/-innen mit durchschnittlichen kognitiven und niedrigen motivationalen Leistungswerten (p < .05).

Die Befunde legen somit einerseits differenzielle, andererseits geteilte Wahrnehmungen zwischen den Profilen offen (vergleichbare Befunde in Seidel, 2016; Stahns, Rieser & Lankes, 2017) und können aus didaktischer Perspektive für die Entwicklung differenzieller Förderangebote für unterschiedliche Schülergruppen genutzt werden. Mit dem Einschluss weiterer personenbezogener Hintergrundvariablen (z.B. Erstsprache/n, Geschlecht, sozioökonomischer Status) sind die Wahrnehmungsmuster weiter aufzuklären.



Wie einfach sind vereinfachte Texte für ihre Leser/innen? Qualitative Fallstudie zum Lesen von Menschen mit Beeinträchtigung

Bettina M. Bock

Universität Köln, Deutschland

„Leichte Sprache“ wurde intuitiv in der Praxis entwickelt; Erkenntnisse der empirischen Lese- und Verständlichkeitsforschung wurden bei ihrer Entwicklung nicht berücksichtigt. Durch maximale sprachliche Vereinfachung versucht diese Form barrierefreier Kommunikation Partizipation von Zielgruppen, u.a. am Bildungssystem, zu erreichen, denen Teilhabe bisher verwehrt war. „Leichte Sprache“ richtet sich dem Selbstverständnis nach an eine Reihe von – höchst unterschiedlichen – Zielgruppen mit Schwierigkeiten beim Lesen, wobei Menschen mit sog. geistiger Behinderung als Hauptzielgruppe gelten können. Zu diesem Personenkreis liegen bisher wenige empirische Studien vor, die sich auf das Leseverstehen von Texten beziehen (di Blasi et al. 2018). Auch zu „Leichter Sprache“ liegen bisher erst wenige empirische Studien vor (zum Spanischen: Fajardo et al. 2014; Studien zum Englischen: Chinn/Homeyard 2017, Sutherland/Isherwood 2016). Ein Desiderat ist die Erforschung der Textverständlichkeit derzeitiger „Leichte Sprache“-Texte: Führen die angewandten sprachlichen und typografischen Prinzipien, die auf die Vereinfachung von Texten zielen, tatsächlich zu Texten, die für die Adressaten leichter verständlich sind? Wird insbesondere für die Adressaten verständlich, welche kommunikative Funktion die Texte haben?

Um diese Frage zu klären, wurde eine qualitative Studie mit zwei Personenkreisen durchgeführt: Erwachsene mit sog. geistiger Behinderung sowie sog. funktionale Analphabeten (N=50) lesen authentische „Leichte Sprache“-Texte mit unterschiedlicher Textfunktion (nach Brinker et al. 2014). Die Untersuchungsgruppe wurde kriteriengeleitet ausgewählt: Außer der Zugehörigkeit zu einer der beiden Gruppen wurde das Kriterium der Leseverstehenskompetenz genutzt, um eine möglichst heterogene Untersuchungsgruppe mit stärkeren und schwächeren Leser/innen zu sampeln. Die Leseverstehenskompetenz wurde mittels lea.-Diagnostik (Subtest Lesen) erhoben (Kretschmann/Wieken 2010). In qualitativen leitfadengestützten Interviews wurden die Testpersonen nach der Lektüre zu ihrem individuellen Textverständnis befragt. Zudem wurden sie gebeten, die Texte laut zu lesen und ihre Lektüre laut denkend zu kommentieren. Ziel der retrospektiven Befragung ist eine empirische Rekonstruktion des probandenseitigen Situationsmodells vom Text (van Dijk/Kintsch 1983, ähnlich „mentales Modell“ bei Johnson-Laird 1983). Die Interviews zielen dabei weniger auf das Abfragen von Propositionen. Vielmehr wird die pragmatische Dimension des Textverständnisses in den Mittelpunkt gestellt: D.h. außer dem inhaltlichen Textverständnis wird rekonstruiert, welche Funktion/welcher (Verwendungs-)Zweck, welche Adressaten, welche Verwendungssituation, welcher Sender den gelesenen Texten im individuellen Verständnis zugeschrieben werden. Theoretisch leitend ist hier die pragmatisch-textlinguistisch begründete Annahme, dass insbesondere der funktionalen Seite von Texten eine zentrale Bedeutung für das Textverständnis zukommt (vgl. Adamzik 2016: 173ff.; van Dijk 2006). Ausgewertet wurden die Interviewdaten mittels eines hermeneutisch-rekonstruktiven Verfahrens (Kruse 2015); Intersubjektivität wurde im Rahmen des Interpretationsprozesses durch den Einbezug von zwei bzw. drei Auswerter/inne/n hergestellt. Teil des Auswertungsprozesses war zudem ein kontinuierlicher Vergleich von Interviewäußerungen (inter- und intraindividuell, intertextuell). Da sowohl die Aufforderung zur Kommentierung des Lektüreprozesses wie auch die retrospektive Befragung zu einer intensiven Beschäftigung mit dem Text auffordern, kann in der Studie zwar nicht natürliches Leseverhalten beobachtet werden, das Vorgehen gibt aber einen Einblick in maximale individuelle Leseverstehensleistungen und Strategien des Umgangs mit Verständnisschwierigkeiten.

Die Ergebnisse der Studie zeigen fallbasiert, dass auch Testpersonen mit sehr geringen diagnostizierten Lesekompetenzen ein vergleichsweise adäquates Textverständnis erreichen können. Auf der anderen Seite waren Lektüren mit nur teilweise adäquatem Situationsmodell oder gänzlich inadäquatem Situationsmodell auf allen Lesekompetenzstufen zu finden. Gegenstand der Rekonstruktion waren die genutzten Strategien zur Erschließung des Textes (Lesestrategien, allgemein Kompensationsstrategien) sowie das herangezogene Wissen (insbes. Weltwissen, Wortschatzwissen, Textsortenwissen). Die Interviews zeigen zudem, dass Menschen mit sog. geistiger Behinderung teilweise ein differenziertes Textsortenwissen besitzen. „Leichte Sprache“ geht in ihren Gestaltungsprinzipien darauf bisher noch nicht ein (vgl. Bock/Lange 2017).

Im Beitrag sollen ausgewählte Fälle vorgestellt werden. Dabei soll auch darauf eingegangen werden, inwiefern Verständnishürden in den Texten durch die Prinzipien „Leichter Sprache“ gesenkt oder sogar neu geschaffen wurden.



Macht Ähnlichkeit den Unterschied? Wenn Lehrkräfte mit nichtakademischer Herkunft Schülerinnen und Schüler nichtakademischer Herkunft unterrichten

Charlotte Ostermann, Martin Neugebauer

Freie Universität Berlin, Deutschland

Wenngleich der Einfluss der sozialen Herkunft auf den Bildungserfolg in den letzten Jahren geringer geworden ist, sind Bildungschancen von Kindern und Jugendlichen in Deutschland nach wie vor ungleich verteilt und stark vom Bildungshintergrund der Eltern abhängig. Trotz vielfältiger theoretischer Ansätze und empirischer Befunde, sind die zugrundeliegenden Mechanismen noch nicht ausreichend geklärt. Da Lehrkräfte als zentrale Akteure des Schulsystems auf vielfältige Weise den Schulerfolg ihrer Schüler*innen mit beeinflussen, sollte ihre Rolle in dem Diskurs um Bildungsungleichheit stärker berücksichtigt werden. Vor diesem Hintergrund stellt sich die Frage nach dem Einfluss soziodemographischer Passungsverhältnisse von Lehrkräften und Schüler*innen auf den Schulerfolg. So wird vermutet, dass Ähnlichkeit dazu führt, dass Schüler*innen und Lehrkräfte besser zueinander passen und sich solche Passungsverhältnisse günstig auf Schulleistungen auswirken. Während im Hinblick auf die kulturelle Herkunft oder das Geschlecht von Lehrkräften und Schüler*innen zahlreiche empirische Untersuchungen vorliegen, erfährt der Einfluss der sozialen Herkunft von Lehrkräften auf die Schulleistung ihrer Schüler*innen bisher wenig Aufmerksamkeit. Neben einer Studie von Alexander, Entwisle und Thompson (1987), liegen bis auf eine Untersuchung von Westphal et al. (2016) keine aktuellen sowie auf Deutschland bezogenen Befunde vor. Um diesem Forschungsdesiderat zu begegnen, verbindet der Beitrag die empirische Untersuchung sozialer Passungsverhältnisse in der Schule mit den habitustheoretischen Überlegungen Bourdieus (2018). Davon ausgehend, dass ein ähnlicher sozialer Hintergrund ähnliche Habitusmuster erzeugt und für die Entstehung des Habitus insbesondere der Bildungshintergrund der Eltern entscheidend ist, wird untersucht, ob Schüler*innen nichtakademischer Herkunft bessere Schulleistungen zeigen, wenn sie von einer Lehrkraft mit nichtakademischer Herkunft unterrichtet werden.

Dazu wurden Längsschnittdaten der Studie PISA-I-Plus 2003, 2004 von N = 2727 Schüler*innen (davon n = 1885 nichtakademischer Herkunft) sowie der zugehörigen Mathematiklehrkräfte N = 159 (davon n = 104 nichtakademischer Herkunft) aufbereitet. Als abhängige Variable diente die Mathematiknote in Klasse 10. Zur Prüfung der Fragestellung wurde ein Propensity score matching durchgeführt. Dadurch konnten die Gruppen der Schüler*innen nichtakademischer Herkunft unterrichtet von Lehrkräften nichtakademischer Herkunft (Treatmentbedingung, n = 1260) und Schüler*innen nichtakademischer Herkunft unterrichtet von Lehrkräften akademischer Herkunft (Kontrollgruppe, n = 477) hinsichtlich zentraler Hintergrundmerkmale (z.B. der mathematischen Kompetenz und der Schulformzugehörigkeit) soweit ausbalanciert werden, dass sie sich nur noch im Hinblick auf den familiären Bildungshintergrund der unterrichteten Lehrkraft unterschieden. Im Ergebnis zeigte sich, dass Schüler*innen nichtakademischer Herkunft hinsichtlich der Mathematiknote nicht von einer Lehrkraft mit einem ähnlichen Bildungshintergrund profitierten. Darüber hinaus wurde mit dem gleichen Vorgehen geprüft, ob Schüler*innen akademischer Herkunft von einer Lehrkraft mit nichtakademischer Herkunft benachteiligt werden. Auch hier zeigte sich, dass diese Schüler*innen keine schlechteren Zeugnisnoten in Mathematik erhielten, wenn sie eine Lehrkraft mit nichtakademischer Herkunft unterrichtete. Insgesamt deuten die Ergebnisse darauf hin, dass der familiäre Bildungshintergrund der Lehrkraft die Schulleistung sowohl von Schüler*innen nichtakademischer als auch akademischer Herkunft nicht beeinflusst. Die soziale Ähnlichkeit von Schüler*innen und Lehrer*innen macht für die Reduzierung sozialer Disparitäten folglich nicht den Unterschied.

Die gewonnenen empirischen Befunde liefern einen Beitrag für den Diskurs um Bildungsungleichheit, der die soziale Herkunft von Lehrkräften in den Mittelpunkt stellt und die Wirksamkeit von Passungsverhältnissen in der Schule hinterfragt. Darüber hinaus erweitert er den theoretischen Rahmen der bisherigen Forschung zum Einfluss des sozialen Hintergrundes von Lehrkräften auf die Schulleistung ihrer Schüler*innen, indem die Befunde mit den Überlegungen Bourdieus zu gelingender Passung in der Schule und seinem Konzept vom Habitus verbunden werden.

 
16:45 - 18:30M16–1.19: Betrachtung von Messinstrumenten
1.19 
 

Vergleich von unterschiedlichen Antwortformaten zur Erfassung von Lernstrategien

Ana Tupac-Yupanqui1, Jörg-Henrik Heine1, Anja Schiepe-Tiska1, Dave Zes2, Kristina Reiss1

1Zentrum für Internationale Bildungsvergleichsstudien, TUM School of Education, Technische Universität München, Deutschland; 2Long Beach, California, USA

Theorie

In internationalen Schulleistungsstudien werden neben Leistungstests auch non-kognitive Kontextvariablen der Schülerinnen und Schüler über Selbstberichte mit Ratingskalenformaten erfasst (Wetzel & Greiff, 2018). Insbesondere im internationalen Vergleich (van Herk, Poortinga & Verhallen, 2004) wird dieses Antwortformat aufgrund von unterschiedlichen Verzerrungen kritisiert (z. B. Häcker, 2014), welche die Validität negativ beeinflussen (Cronbach, 1946). Zur Umgehung dieser Problematik wird alternativ das Forced-Choice Antwortformat vorgeschlagen (Brown & Maydeu-Olivares, 2013). Bei diesem Antwortformat müssen sich die antwortenden Personen entscheiden, einer von verschiedenen Aussagen zuzustimmen, die jeweils Indikatoren für unterschiedliche Dimensionen darstellen. Die Intention dabei besteht darin allgemein die Datenqualität, Validität sowie Testfairness zu erhöhen und damit die Invarianz der Messung zu gewährleisten (Schultze & Eid, 2018). Ziel dieser Studie ist es die Zusammenhänge zwischen mathematikbezogenen Lernstrategien und kognitive sowie non-kognitive Kontextvariablen zu untersuchen. Die Lernstrategien werden dabei mit den beiden Antwortformaten erfasst.

Nach Boekaerts (1999) Drei-Schichten-Modell des selbstregulierten Lernens werden drei übergeordnete Lernstrategien beschrieben: Memorisationsstrategien (Auswendiglernen), Elaborationsstrategien (tieferes Verstehen durch Verknüpfungen mit Vorwissen und Alltagsbezug) und metakognitive Kontrollstrategien (Überprüfen des Lernprozesses). Als kognitive Kontextvariable zu den Lernstrategien wird die in der Programme for International Student Assessment (PISA) Studie erreichte Mathematikkompetenz betrachtet. Als non-kognitive Kontextvariablen werden Motivation, Interesse sowie Selbstwirksamkeit in Mathematik aus dem PISA Schülerfragebogen in die Untersuchung mit einbezogen (vgl. OECD, 2013).

Fragestellung

In der vorliegenden Studie soll der Frage nachgegangen werden, ob sich der Zusammenhang zwischen den Lernstrategien und den anderen Variablen in Abhängigkeit der beiden unterschiedlichen Antwortformate unterscheidet. Betrachtet wird dies getrennt für gymnasiale versus nicht gymnasiale Schularten.

Methode

Die Stichprobe umfasst n = 5739 deutsche Neuntklässlerinnen und Neuntklässlern, die an der PISA Hauptstudie in 2012 teilgenommen haben. Davon waren n = 2338 auf dem Gymnasium und n = 3401 in anderen Schularten. In PISA wurden mathematikbezogene Lernstrategien mit beiden Antwortformaten im Schülerfragebogen erhoben (Mang et al., 2018). Die Forced-Choice Items wurden mit dem R-Paket kcirt (Zes, Lewis & Landis, 2014) im Rahmen der Thurstonian Item Response Theory (IRT) skaliert. Die Ratingskalen Items wurden mit dem Partial Credit IRT Modell (Masters, 1982) skaliert. Die non-kognitiven Kontextvariablen (Motivation, Interesse und Selbstwirksamkeit in Mathematik) wurden als Skalen aus den öffentlich verfügbaren PISA Daten (Prenzel et al., 2015) übernommen. Für die Mathematikkompetenz wurden fünf Plausible Values berücksichtigt (vgl. Lüdtke & Robitzsch, 2017). Zur Darstellung des Zusammenhanges wurden jeweils Pearson Korrelationen zwischen den drei Dimensionen der Lernstrategien und den Kontextvariablen berechnet.

Ergebnisse

Erste Ergebnisse weisen darauf hin, dass die Stärke der Zusammenhänge zwischen den Lernstrategien und kognitiven sowie non-kognitiven Kontextvariablen unterschiedlich ausfallen. Neben diesen auch inhaltlich zu erklärenden Korrelationsmustern, zeigt sich, dass das jeweils gewählte Antwortformat zur Operationalisierung einen Einfluss auf die gefundenen Zusammenhänge nimmt. Ferner zeigt sich, dass die Zusammenhänge zwischen den Lernstrategien und den Kontextvariablen für die gymnasialen und nicht gymnasialen Schularten unterschiedlich ausfallen.

So zeigt sich ein signifikanter positiver Zusammenhang zwischen Lernstrategien im Ratingskalenformat und Motivation, Interesse und Selbstwirksamkeit in Mathematik für nicht gymnasiale Schularten, nicht aber für Lernstrategien im Forced-Choice Antwortformat, bei dem geringe negative bis keine Zusammenhänge vorliegen.

Für die Elaborationsstrategien zeigen sich beispielsweise folgende Unterschiede: Für das Gymnasium liegt ein positiver signifikanter Zusammenhang mit Mathematikkompetenz und allen non-kognitiven Kontextvariablen vor, was zwar auch für den Zusammenhang mit non-kognitiven Kontextvariablen nicht gymnasialer Schularten zutrifft, nicht aber für den Zusammenhang mit Mathematikkompetenz. Hier zeigt sich ein negativer geringer Zusammenhang zwischen Elaborationsstrategien und Mathematikkompetenz im Ratingskalenformat und ein geringer Zusammenhang im Forced-Choice Antwortformat.

Insgesamt weisen die Ergebnisse darauf hin, dass das Forced-Choice Antwortformat keine universelle Lösung zur verzerrungsfreien Erfassung von Lernstrategien darstellt. So weisen insbesondere die differentiellen Befunde für die beiden Schularten darauf hin, dass beim Forced-Choice wie auch beim Ratingskalen Antwortformat bedeutsame Unterschiede in der Interpretation beider Antwortformate bestehen.



Entwicklung und Validierung eines Messinstruments zur Erhebung epistemologischer Überzeugungen von Lehrkräften geisteswissenschaftlicher Fächer

Caroline Rau, Jana Costa

Otto-Friedrich-Universität Bamberg, Deutschland

Theoretischer Hintergrund:

Epistemologische Überzeugungen sind in der internationalen sowie nationalen Forschungslandschaft als Forschungsgegenstand zunehmend präsent (vgl. Bernholt et al. 2017; Barzilai und Zohar 2016; Brownlee et al. 2011). Hierbei liegt ein Schwerpunkt u.a. auf dem Überzeugungssystem von (angehenden) Lehrkräften, das die Bereiche Mathematik, Naturwissenschaften, Erziehungswissenschaften/Pädagogik betrifft (vgl. Blömeke et al. 2014; Gläser 2015; Dunekacke et al. 2016; Merk et al. 2017). Auch wenn die Forschungsaktivitäten in Bezug auf epistemologische Überzeugungen zahlreich sind, besteht darüber hinaus hinsichtlich folgender Fragen kein (weitgehender) Konsens: beispielsweise im Hinblick auf die Dimensionalisierung, Konzeptualisierung, Entwicklung und Ausbildung sowie Domänenabhängigkeit bzw. -unabhängigkeit sowie der Einschätzung sophistizierter und naiver epistemologischer Überzeugungen und deren Einfluss auf den Wissenserwerb (vgl. hierzu u.a. Uslu 2018). Vor diesem Hintergrund mangelt es bisher an reliablen und validen Testinstrumenten, die sowohl die epistemologischen Überzeugungen von Lehrkräften, die ein geisteswissenschaftliches Fach unterrichten, angemessen erheben, als auch die Vergleichbarkeit und Übertragbarkeit der Forschungsergebnisse erlauben würden (vgl. hierzu auch Priemer 2006). Auf diese Forschungsdesiderate wurde mit einem Mixed-Method-Verfahren – im Speziellen mit einem explorativen Design – reagiert: In einem ersten Schritt wurden mittels einer qualitativ-rekonstruktiven Studie die epistemologischen Überzeugungen von Lehrkräften, die ein geisteswissenschaftliches Fach unterrichten, erhoben (vgl. Rau im Druck). In einem zweiten Schritt wurden die Ergebnisse dieser qualitativ-rekonstruktiven Studie als Grundlage für die Entwicklung eines quantitativen Messinstruments genutzt: Auf Basis des qualitativ-rekonstruktiven Materials wurden für die Entwicklung des quantitativen Messinstruments Items entwickelt und deren Güte in einem Pretest näher untersucht.

Fragestellung

In dem Beitrag wird auf Basis der Ergebnisse der qualitativ-rekonstruktiven Forschungsarbeit (vgl. Rau im Druck) ein Messinstrument zur Erhebung epistemologischen Überzeugungen von Lehrkräften geisteswissenschaftlicher Fächer vorgestellt und diskutiert. Dabei stehen folgende Fragen im Fokus:

  • Wie lassen sich die qualitativ-rekonstruierten Typen in ein empirisch-quantitatives Messinstrument übersetzen?
  • Inwiefern bilden sich die qualitativ-rekonstruierten Typen in einem empirisch-quantitativen Pretest ab?

Methode

Die qualitative Studie ist im qualitativ-rekonstruktiven Paradigma verortet: Mittels Gruppendiskussionsverfahren (vgl. hierzu auch Loos und Schäffer 2001) wurden Lehrkräfte, die ein geisteswissenschaftliches Fach unterrichten, über Gesprächsimpulse aufgefordert, sich über folgende Aspekte auszutauschen: Wie wird ‚Nature of Knowledge‘ und ‚Nature of Knowing‘ (vgl. Hofer und Pintrich 1997) in der unterrichtlichen Handlungspraxis gestaltet? Also: Wie generieren Lehrkräfte mit ihren Schülerinnen und Schülern Wissen über kulturelle Objektivationen? Wie wird Wissen über kulturelle Objektivationen seitens der Lehrkräfte vermittelt? Auf Basis von ‚theoretical Sampling‘-Strategien (vgl. Glaser und Strauss 1978) wurden Daten aus 19 Gruppendiskussionen interpretiert. Insgesamt sind die Äußerungen von 78 Befragten in diese Untersuchung eingeflossen. Als Auswertungsmethode diente die Dokumentarische Methode: Die hiermit rekonstruierten impliziten sowie handlungsleitenden epistemologischen Überzeugungen wurden zu einer sinngenetischen Typenbildung verdichtet (vgl. hierzu auch Bohnsack 2014, 2017; Nentwig-Gesemann 2013). Die interpretierten Daten wurden fortwährend in zwei Forschungswerkstätten intersubjektiv und konsensuell-kommunikativ validiert. Auf Basis der sinngenetischen Typenbildung bzw. der diese konstituierenden, drei sinngenetisch-verdichteten Idealtypen wurde ein empirisch-quantitatives Messinstrument entwickelt und an einer ausgewählten Stichprobe von Lehramtsstudierenden (n=100) validiert. Die aus dem qualitativen Material generierten Items werden unter anderem in Bezug auf ihre Roherwertverteilung, Trennschärfe, Reliabilität und Homogenität analysiert. Mittels der konfirmatorischen Faktorenanalyse wird nach der Dimensionalität des Messinstruments gefragt und die theoretisch angenommenen Zusammenhänge überprüft.

Ergebnisse

In der qualitativ-rekonstruktiven Studie zeigte sich, dass die epistemologischen Überzeugungen der Lehrkräfte, die ein geisteswissenschaftliches Fach unterrichten, an Geltungsfragen der im geisteswissenschaftlichen Unterricht generierten und vermittelten Wissensbestände orientiert sind. Darüber hinaus wird deutlich, dass Lehrkräfte unterschiedliche epistemische bzw. erkenntnislogische Handlungsmodi inkorporiert haben, um Geltung von geisteswissenschaftlichen Wissensbeständen sicherzustellen. So zeigt sich z.B., dass Idealtyp 1 ‚Kontingenzstopp‘ darin orientiert ist, die kulturellen Objektivationen vor dem Hintergrund seines Entstehungskontextes zu interpretieren. Idealtyp 1 wurde dementsprechend in Einzelitems, wie bspw. „Gedichte müssen vor dem Hintergrund ihres jeweiligen Entstehungskontextes interpretiert werden“ oder „Bei der Interpretation von Gedichten ist die Intention des Autors von zentraler Bedeutung“, überführt.



Schätzung von Bathtub-Mediationsmodellen auf Basis von Expected a Posteriori Faktorwerten

Steffen Zitzmann1, Christoph Helm2

1Institut für pädagogisch-psychologische Lehr- und Lernforschung, Deutschland; 2Johannes Kepler Universität Linz

Theoretischer Hintergrund

In der empirischen Bildungsforschung sind auch Zusammenhänge zwischen Variablen, die auf der Klassenebene angesiedelt sind aber nicht notwendigerweise auch auf dieser Ebene erfasst (d.h. erfragt) werden, sowie Wirkmechanismen, die diese Zusammenhänge vermitteln, von Interesse. Ein denkbares Szenario ist, dass der Einfluss der unterrichtsmethodischen Grundeinstellung der Lehrkraft auf die Lehrerbelastung durch den Mediator Schülerorientierung vermittelt wird. So zeigen Studien, dass Lehrpersonen mit einer konstruktivistischen unterrichtsmethodischen Grundeinstellung ein höheres Ausmaß an Schülerorientierung, Lernunterstützung und kognitive Aktivierung im Unterricht anbieten (z.B. Braun & Hannover 2008; Dubberke et al., 2008; Pauli et al., 2007; Staub & Stern, 2002; Voss et al., 2013). Schülerorientierung, Lernunterstützung und kognitive Aktivierung wiederum stehen im Zusammenhang mit erhöhten, erlebten Belastungen bei Lehrpersonen (z.B. Klusmann et al., 2006).
Die Datensätze, die zur Untersuchung derartiger Fragestellungen herangezogen werden, haben nicht selten eine Mehrebenenstruktur, in der Schüler*innen in Schulklassen geschachtelt sind. Zum Beispiel entsteht die Mehrebenstruktur dadurch, dass zur Erfassung der oben genannten Unterrichtsmerkmale die Schüler*innen einer Schulklasse gebeten werden, ihren Lehrer oder ihre Lehrerin auf diesen Dimensionen einzuschätzen, um die Einschätzungen anschließend über die Schüler*innen der Schulklasse zu Skalenwerten zu aggregieren (vgl. Lüdtke, Robitzsch, Trautwein, & Kunter, 2009).
Zur Analyse der Datensätze werden in der empirischen Bildungsforschung schon seit längerem latente Mehrebenmodelle eingesetzt, die es erlauben, für den Bias, der durch die Aggregation entsteht, zu korrigieren (für eine tiefergehende Diskussion vgl. Lüdtke et al., 2008).

Fragestellung

Der Beitrag diskutiert wie ein alternatives auf der Idee der Faktorwerteregression basierendes konsistentes Verfahren zur Messfehlerkorrektur eingesetzt werden kann, um unverzerrte Koeffizienten zu erhalten. Das Verfahren nutzt den sogenannten Expected a Posteriori (EAP) Schätzer für Faktorwerte, dessen Berechnung im Beitrag anhand des sogenannten „Bathtub-Modells“ (Coleman, 1990; vgl. auch Croon, van Veldhoven, Peccei, & Wood, 2014) illustriert wird. Das Bathtub-Modell stellt ein Mehrebenenmediationsmodell dar, das davon ausgeht, dass ein Prädiktor, der auf Klassenebene erfasst wurde (z.B. unterrichtsmethodische Grundeinstellung), vermittelt über einen auf Individualebene erfassten und auf Klassenebene hochaggregierten Mediator (z.B. Schülerorientierung) einen Einfluss auf eine auf Klassenebene erfasste relevante Outcome-Variable (z.B. Lehrerbelastung) ausübt.
Die populärsten Ansätze zur Schätzung dieses Modells sind Maximum Likelihood (ML) und seit kurzem Bayes. Im Beitrag wird das neue EAP-basierte Verfahren deshalb hinsichtlich der üblichen Kriterien (Konvergenz, Bias, RMSE, Coverage) in einer Simulationsstudie mit ML und Bayes verglichen.

Methode

In der Studie wurden die Anzahl der Schulklassen, ihre durchschnittliche Größe und die Intraklassenkorrelation der Schülervariablen variiert. Für jede Zelle im Simulationsdesign wurden 1000 Datensätze generiert. Jeder Datensatz wurde mit den drei Schätzansätzen analysiert.

Ergebnisse

Mit Blick auf die Bias, RMSE und Coverage zeigt sich, dass das EAP-basierte Verfahren im Vergleich zu den anderen Verfahren ähnlich abschnitt. Zudem konnten Bedingungen identifiziert werden, unter denen die Schätzung mittels ML zu Konvergenzproblemen führte und die Bayes-Schätzung nur mit erheblichem Rechenaufwand konvergierte, während das EAP-basierte Verfahren nach vergleichsweise kurzer Rechendauer zuverlässige Lösungen lieferte.

Diskussion

Uns ist noch keine Anwendung des Bathtub-Modells in der empirischen Bildungsforschung bekannt. Das eingangs genannte Beispiel macht aber deutlich, dass mit diesem und ähnlichen Mehrebenenmediationsmodellen durchaus interessante bildungswissenschaftliche Fragestellungen adressiert werden können. Die Einführung des Modells in die empirische Bildungsforschung stellt deshalb an sich schon einen wichtigen Beitrag dar. Außerdem deuten die Befunde darauf hin, dass das EAP-basierten Verfahren eine vielversprechende Alternative für die Schätzung des Bathtub-Modells sein kann, falls die populären Verfahren (ML, Bayes) versagen oder Probleme bereiten.

 

Datum: Donnerstag, 26.03.2020
9:00 - 10:45D9–1.19: Analyse von Messinstrumenten
1.19 
 

Computergeneriertes Scoring von fachdidaktischem Wissen (angehender) Lehrkräfte im kaufmännisch-verwaltenden Bereich – Ein Performanzvergleich zwischen Mensch und Maschine

Andreas Wahlen1, Christiane Kuhn1, Olga Zlatkin-Troitschanskaia1, Aoife Cahill2, Christian Gold3, Torsten Zesch3, Andrea Horbach3

1Johannes Gutenberg-Universität Mainz, Deutschland; 2Educational Testing Service, Princeton, USA; 3Universität Duisburg-Essen, Deutschland

Das Unterrichten eines Fachs ist eine komplexe Tätigkeit, die von (angehenden) Lehrkräften verlangt, die Struktur und Bedeutung eines Lerninhalts den Lernenden unter Berücksichtigung ihrer Lernvoraussetzungen und -bedürfnisse zugänglich zu machen (Wilson et al., 2018; Kersting et al., 2014). Hierfür benötigen Lehrkräfte u.a. fachdidaktisches Wissen, als Teil ihres Professionswissens. Um handlungsnahes Wissen valide zu erfassen, sind Aufgaben mit offenem Antwortformat ein wichtiges Instrument (Alonzo et al., 2012). Das Scoring offener Antworten durch geschulte Rater stellt jedoch einen ressourcenintensiven Prozess dar, was ihren Einsatz in der Praxis erschwert (Resnik & Lin, 2013). Zudem besteht die Gefahr, dass in den Test-Scores, auf Basis des Scorings, Inkonsistenzen aufgrund von systematischen Beurteilungsfehlern bzw. Verzerrungen auftreten, was eine objektive, reliable und valide Erfassung einschränkt (Bejar, 2012; Liu et al., 2014).

In der Lehr-Lern-Forschung wird seit einigen Jahren der Einsatz computergenerierter Scoring-Systeme bei offenen Aufgaben diskutiert (Shermis et al., 2013). Einerseits haben sie das Potential, den Ressourcenaufwand bei der Bewertung von Probandenantworten zu verringern und im Vergleich zu menschlichen Ratern konsistentere Scoringergebnisse zu erzielen (Zhang, 2013), was eine Verbesserung der Datenqualität in Bezug auf Objektivität, Zuverlässigkeit und Gültigkeit zur Folge hat (Zehner et al., 2016). Andererseits zeigen bisherige Untersuchungen, dass durch den Einfluss von personen- und datensatzbezogener Faktoren (z.B. Geschlecht, Antwortlänge) Unterschiede in den Scoringergebnissen zwischen Mensch und Computer bestehen (Bridgeman et al., 2012; Ramineni et al., 2012a, 2012b; Perleman, 2014; Zehner et al., 2018; Autoren, 2019). In ersten wenigen Studien, welche ein computergeneriertes Scoring des fachdidaktischen Wissens von (angehenden) Lehrkräften untersuchen, konnte für die Domäne Mathematik und den (M)INT-Bereich eine moderate bis substanzielle Scoring-Übereinstimmung zwischen Mensch und Computer festgestellt werden (κw=.51-.55; κ=.77) (Kersting et al., 2014; Wilson et al., 2017). Zudem konnte Kersting et al. (2014) zeigen, dass das Scoring von mathematikdidaktischem Wissen zwischen Mensch und Computer mit dem Scoring von zwei menschlichen Ratern positiv korreliert (r=.77-.91). Vergleichbare Studien liegen für das wirtschaftsdidaktische Wissen nicht vor. Dieser Vortrag fokussiert die Frage, wie vergleichbar das computergenerierte und menschliche Scoring von wirtschaftsdidaktischem Wissen (angehender) Lehrkräfte ist und welche Implikationen sich für den Einsatz computergenerierter Scoring-Systeme in Forschung und Praxis ergeben.

Das Forschungsvorhaben wurde in Kooperation mit einem internationalen Testinstitut sowie einem nationalen Language Technology Lab durchgeführt. Für das computergenerierte Scoring des wirtschaftsdidaktischen Wissens wurden die von zuvor zwei geschulten Ratern unabhängig bewerteten Antworten von (Lehramts)Studierenden, Referendaren und Lehrpersonen (N=852) herangezogen (κw=.87). Die Antworten wurden mittels sechs offener Items eines standardisierten Testinstruments mit Text-Vignetten erfasst (Autoren 2014; Autoren et al., 2016). Das computergenerierte Scoring erfolgte mithilfe der Scoring Programme „Educational SCoRIng Toolkit“ (ESCRITO, Autoren, 2018) und „Concept-Rater“ (C-Rater, Sukkarieh & Blackmore, 2009).

Die Interrateranalysen verweisen auf eine im Schnitt substanzielle Übereinstimmung zwischen Mensch und Computer (κw=.66). Sowohl ESCRITO als auch C-RATER erzielten entlang der Antworten zu den sechs Testaufgaben moderate bis substanzielle Übereinstimmungswerte (ESCRITO: κw=.53-.75; C-RATER: κw=.58-.77). Dies lässt auf eine konvergente Validität der Scoringergebnisse zwischen Mensch und Computer schließen. Ausgehend von aktuellen Untersuchungen (Autoren, 2019) wurde zudem, mittels ESCRITO, der Einfluss von Trainingsantworten homogener Subgruppen (NStudierende=460; NReferendare=230; NLehrkräfte=162) untersucht. Die Ergebnisse der einfaktoriellen Varianzanalyse zeigen zu jeder Subgruppe (Studierende, Referendare, Lehrkräfte) einen signifikanten Einfluss auf das computergenerierte Scoring der Antworten (pStudierende=.00; pReferendare=.00; pLehrkräfte=.00; p<.05). Um möglichst genaue Scoringergebnissse zu erzielen, ist beim Trainieren von Scoring-Systemen demnach der mögliche Einfluss jenes Varianzfaktors mit zu berücksichtigen. Im Vortrag werden diese sowie weitere Befunde zu Varianzfaktoren und Übereinstimmungen innerhalb der Subgruppen präsentiert und hinsichtlich der Implikationen zum Einsatz von computergenerierten Scoring-Systemen in der Lehrerbildungsforschung und –praxis und seine Potentiale und Limitationen kritisch diskutiert.



Contrasting classical and machine learning approaches in the estimation of value-added scores in large-scale educational data.

Jessica Levy1, Dominic Mussack2, Martin Brunner3, Ulrich Keller1, Pedro Cardoso-Leite2, Antoine Fischbach1

1LUCET, University of Luxembourg, Luxembourg; 2ECCS, University of Luxembourg, Luxembourg; 3University of Potsdam, Germany

Value-added (VA) models intend to estimate the “value” specific teachers or schools add to students’ achievement, independently of students’ backgrounds (e.g., Amrein-Beardsley, Collins, Polasky, & Sloat, 2013) and are fundamental for accountability and high-stakes decisions. Yet, there is currently no consensus on how to best estimate VA scores (Everson, 2017; Levy, Brunner, Keller, & Fischbach, 2019), and VA scores may vary greatly depending on the method used (e.g., Sloat, Amrein-Beardsley, & Holloway, 2018). There are currently two main classical models to compute VA scores: linear regression and multilevel models (Kurtz, 2018; Levy et al., 2019). These models are interpretable for most researchers and practitioners. However, they make strong assumptions (e.g., linearity), which may limit their accuracy. At least in some cases, nonlinear models fit the data better than linear models, implying that the typical linearity assumption might not be warranted (Lopez-Martin, Kuosmanen, & Gaviria, 2014).

An alternative approach to these classical models involves machine learning methods, which have yielded spectacular results in numerous fields. While these modern methods may provide higher prediction accuracies, they typically require large datasets and involve models that are difficult or even impossible to interpret (i.e., black boxes). In educational research, as in many other domains, the amount of available data is consistently growing (as reflected in the development of the new domain of “educational data mining”; see, e.g., Baker, 2019; Romero & Ventura, 2010) and it is becoming feasible to apply machine learning methods to estimate VA scores. The fruitfulness of these methods is supported by recent research reporting higher accuracy and more reliable estimates of school VA scores when comparing “random forests” regression to a classical linear regression (Schiltz, Sestito, Agasisti, & De Witte, 2018). Random forests methods can capture complex nonlinear relationships between dependent and independent variables and are far more flexible than linear regression models; if the data deviates from linearity and the dataset is large enough, techniques like “random forests” can grasp patterns that classical linear models cannot. However, as they are difficult to interpret, the question occurs in how far the resulting VA scores differ from those of classical nonlinear models.

The aim of the present study is to contrast various classical and machine learning models to estimate school VA scores. We will use representative data of 3600 students in 153 schools who took part in the Luxembourg School Monitoring Programme (LUCET, 2019) in grades 1 and 3. These standardized tests take place at the beginning of grade levels 1, 3, 5, 7, and 9 and assess students’ academic competencies (e.g., math, language), background variables (e.g., SES), and learning motivation (Fischbach, Ugen, & Martin, 2014).

All models tested here share the same underlying structure (Equation 1): Achievement of student i in school j at time point t (Aijt) is described as a function f of prior achievement at a previous time point t-1 (Aijt-1), other covariates (cijt-1), and a residual (rij), which will be averaged across all students within one school to build the school VA scores.

(Eq.1) Aijt=f(Aijt-1,cijt-1)+rij

The same sets of covariates are included in all models for fair model comparison. The different models include linear and nonlinear methods and extend classical models by machine learning methods (e.g., regression trees). All analyses are conducted using the caret package (Kuhn, 2019) in R version 3.6.1 (R Core Team, 2019).

Expected outcomes are that more precision in VA models (e.g., a higher amount of explained variance) will lead to more accurate school VA measures (i.e., less variability).We will interpret the implications of these results and discuss possible ethical concerns regarding the use of machine learning methods for decision-making in education.



Evaluation gängiger Diagnosekriterien für Rechenschwäche im Grundschulalter

David Bräuning1,2,3,5, Katharina Lambert1,2,3, Stefa Hirsch5, Trudie Schils2,4, Lex Borghans2,4, Benjamin Nagengast1,2,3, Korbinian Moeller1,2,5

1Universität Tübingen, Deutschland; 2LEAD Graduate School & Research Network, Tübingen, Deutschland; 3Hector-Institut für empirische Bildungsforschung, Tübingen, Deutschland; 4School of Business and Economics, Maastricht University, Niederlande; 5Leibniz-Institut für Wissensmedien, Tübingen, Deutschland

Hintergrund: Kinder mit einer Rechenschwäche zeigen erhebliche Defizite im Erlernen basisnumerischer Fähigkeiten, die oftmals überdauernd bestehen (z.B. Krajewski & Schneider, 2009). Zur Diagnose einer Rechenschwäche werden hauptsächlich zwei Arten von Kriterien herangezogen: das Cut-Off oder das Diskrepanzkriterium. Cut-Off Werte beziehen sich auf den Prozentrang der Mathematikleistung, während das Diskrepanzkriterium eine bedeutsame Abweichung zwischen allgemeiner kognitiver und Mathematikleistung voraussetzt. Die Anwendung dieser Kriterien variiert in Forschung und Praxis jedoch stark: So schwanken Cut-Off Werte zwischen PR<10 und PR<35, für das Diskrepanzkriterium werden Abweichungen zwischen 1-2 Standardabweichungen berichtet. Bisherige Studien zeigen, dass je nach Kriterium unterschiedliche Gruppen mit unterschiedlichen kognitiven Profilen identifiziert werden (Murphy et al., 2007), was die Ursachenforschung erheblich erschwert. Ebenso variiert die Stabilität der Diagnose deutlich in Abhängigkeit vom Kriterium (z.B. Mazzocco & Myers, 2003).

Fragestellung: Bisher wurden die Kriterien kaum empirisch validiert, insbesondere mangelt es an großen längsschnittlichen Stichproben. Das Ziel der vorliegenden Studie ist die Überprüfung der Vergleichbarkeit, Reliabilität und Validität bestehender Kriterien anhand eines repräsentativen Large-Scale Datensatzes.

Methode: Die Datengrundlage bildet ein niederländisches Bildungsmonitoring, in dem Kinder über den Verlauf der Primarstufe auf verschiedenen Leistungsvariablen regelmäßig getestet wurden. Im Querschnitt der Klassen 2-4 (Klasse 2: N=6674; Klasse 3: N=7304; Klasse 4: N=7866) wurden die Kinder sowohl nach einem dreistufigen Cut-Off-Kriterium (PR<10, PR11-25, PR>25) als auch einem dreistufigen Diskrepanzkriterium (Differenz IQ-Mathematikleistung von 2 SD, 1.5 SD, <1.5 SD) gruppiert. Mittels latenter Profilanalyse (LPA) wurde überprüft, inwieweit sich ein Profil „Rechenschwäche“ statistisch identifizieren lässt und inwieweit die identifizierte Gruppe mit den mittels konventioneller Kriterien bestimmten übereinstimmt. Schließlich wurden im Längsschnitt die Mathematikleistung am Ende der Primarstufe (Klasse 6) und die Übergangsempfehlung in Abhängigkeit der Diagnosekriterien evaluiert.

Ergebnisse: In jeder Klassenstufe wurde aus verschiedenen Modellen der LPA nach statistischen und inhaltlichen Kriterien eine Lösung mit vier Profilen ausgewählt. In jeder Klassenstufe wurde ein spezifisches Profil „Rechenschwäche“ identifiziert. Dieses Profil zeigte deutliche Schnittmengen mit dem Cut-Off Kriterium: In Klasse 2 wurden diesem Profil 99% der Gruppe PR<10 und 53% der Gruppe PR11-25 zugeordnet. In Klasse 3 beinhaltete dieses Profil ausschließlich Kinder der Gruppe PR<10 (davon 65%). In Klasse 4 wurden 92% der Kinder der Gruppe PR<10 und 6% der Gruppe PR11-25 zugeordnet. Das Diskrepanzkriterium zeigte hingegen geringe Übereinstimmung mit der LPA: In jeder Klassenstufe wurden nur 20-30 % der Kinder mit einer Diskrepanz von 1.5 SD dem rechenschwachen Profil zugeordnet und 40-50% der Gruppe mit einer Diskrepanz von 2 SD. Zudem erfüllte ein Großteil der Kinder, die durch die LPA als rechenschwach klassifiziert wurden, das Diskrepanzkriterium gar nicht.

Im Längsschnitt zeigte unter allen Diagnosekriterien der Cut-Off PR<10 die höchste Stabilität: Bei etwa 30 % der Kinder, die mindestens einmal dieses Kriterium erfüllten, lag die Mathematikleistung auch in Klasse 6 im Bereich PR<10, bei weiteren 30% im Bereich PR11-25. Die meisten Kinder (60-80%), die mindestens einmal eines der Diskrepanzkriterien erfüllten, zeigten hingegen in Klasse 6 eine Mathematikleistung im unauffälligen Bereich (PR>25).

Darüber hinaus zeigte sich eine deutliche Tendenz, dass Kinder die mindestens einmal das PR<10 oder PR11-25 Kriterium erfüllten, eine Übergangsempfehlung für den nicht-akademischen Bildungsweg erhielten. Diese Tendenz zeigte sich auch für das 2 SD Diskrepanzkriterium. Von den Kindern, die das 1.5 SD Kriterium erfüllten erhielt hingegen die Hälfte eine Empfehlung für den akademischen Bildungsweg.

Schlussfolgerung: Die Analysen legen die Verwendung eines strengeren Cut-Off Kriteriums zur Diagnose von Rechenschwäche nahe, als dies bisher üblich war. Dieses scheint im Querschnitt valide zu differenzieren, allerdings ist die Stabilität der Diagnose eingeschränkt, sodass in jedem Fall eine wiederholte Messung bzw. der Einbezug weiterer Informationen erforderlich ist. Das Diskrepanzkriterium erscheint auf Basis der vorliegenden Ergebnisse nicht für die Diagnostik geeignet. Die Ergebnisse werden detailliert aufbereitet und im Hinblick auf ihre praktische Relevanz in Bildungskontexten diskutiert.

 
11:15 - 13:00D11–1.19: Studienfähigkeit & Studienerfolg
1.19 
 

Eingangsprofile von Lehramtsstudierenden und Erfolgsmerkmale zum Studienende

Antje Biermann1, Julia Karbach2, Frank M. Spinath1, Roland Brünken1

1Universität des Saarlandes, Deutschland; 2Universität Koblenz-Landau

Theorie

Sowohl in der allgemeinen als auch lehramtsspezifischen Forschung zu Studienerfolg werden als wesentliche individuelle Voraussetzungen die kognitive Leistungsfähigkeit, allgemeine Persönlichkeitsmerkmale wie Gewissenhaftigkeit oder Neurotizismus sowie lehramtsspezifische Eigenschaften wie die Berufswahlmotivation genannt (z.B. Blömeke, 2009). Im Rahmen der Person-Environment-Fit (P-E-Fit)-Theorie spielt darüber hinaus auch die Passung an die Anforderungen der Lernumwelt eine Rolle, die neben den genannten Eigenschaften im Zusammenhang mit Studienerfolgsmerkmalen wie Noten, der Studienzufriedenheit sowie der empfundenen emotionalen Belastung stehen können (Holland, 1997; Kaub et al., 2014). Im Bereich der Lehrerforschung existieren bisher wenig längsschnittliche Studien zur Prognose des Studienerfolgs; häufig werden variablenzentrierte Ansätze zur Berechnung der eigenständigen Validität bzw. zur inkrementellen Validität einzelner Variablen genutzt. Die vorliegende Studie nutzt demgegenüber einen personenzentrierten Ansatz. Hiermit können erstens Gruppen von Studierenden mit spezifischen Merkmalskombinationen zu Beginn des Studiums identifiziert werden (König et al., 2018). Mit der sich daran anschließenden Analyse auf Gruppenunterschiede in Hinblick auf Merkmale des Studienerfolgs können (un-)günstige Merkmalskombinationen identifiziert und für die Studieneingangs- und Verlaufsberatung nutzbar gemacht werden.

Methode

Bei N=624 Lehramtsstudierenden (62.7 % weiblich, 69 % LAG, Alter: M=20.33; SD=2.56) wurden im ersten Semester mehrere Eingangsmerkmale erfasst: Abiturnote, Persönlichkeit (NEO-FFI, Borkenau & Ostendorf, 2008), Berufswahlmotivation (FEMOLA, Pohlmann & Möller, 2010, sowie die Passung der allgemeinen Interessensorientierung an die Lernumwelt (Kaub et al., 2014). Von n=224 Studierenden liegen als Studienerfolgsmerkmale zum Ende des Studiums die Studienzufriedenheit (Westermann et al., 1996) und das Belastungserleben (Wahrscheinlichkeit der Musterzuordnung, AVEM, Schaarschmidt & Fischer, 2017) vor; von n=450 Studierenden konnte die Note des 1. Staatsexamens aus dem Prüfungsverwaltungssystem abgerufen werden.

In einem ersten Schritt wurden mit Hilfe einer Latenten Profilanalyse (LPA) unter Einbezug der zu MZP 1 erfassten Eingangsmerkmale Profile gebildet; in einem zweiten Schritt wurden diese Profile hinsichtlich der Studienerfolgsmerkmale auf Unterschiede geprüft.

Ergebnisse

Im ersten Schritt konnten 3 Gruppen identifiziert werden: Die erste Gruppe (Profil 1, 13.5%) zeichnet sich durch niedrige Werte im Bereich der intrinsischen Motive (z.B. pädagogisches Interesse) und einer hohen Ausprägung der vermeintlich geringen Schwierigkeit des Studiums aus. Darüber hinaus hat diese Gruppe deutlich höhere Neurotizismuswerte und die niedrigsten Werten in Gewissenhaftigkeit und Verträglichkeit. Diese Gruppe hat weiterhin die geringsten Passungswerte: Die Interessen passen am wenigsten zu den Anforderungen des Studiums. Demgegenüber zeichnet sich Profil 2 (n=35.6%) durch hohe intrinsische und niedrigere extrinsische Motivationsaspekte aus. Diese Gruppe hat die niedrigsten Neurotizismuswerte und die höchsten Werte in allen anderen NEO-Dimensionen. Außerdem ist die Passung der Interessen an die Anforderungen am höchsten. Profil 3 (50.9%) bewegt sich in allen erfassten Merkmalen eher zwischen den beiden anderen Profilen, die Werte für die Passung sowie die Offenheit für Erfahrungen und Gewissenhaftigkeit liegen jedoch unter dem Durchschnitt.

Die Gruppen zeigen statistisch signifikante Unterschiede hinsichtlich der Studienzufriedenheit am Ende des Studiums mit der günstigsten Ausprägung für Profil 2 und der niedrigsten für Profil 1. Desweiteren ist die Wahrscheinlichkeit, zum Studienende dem Gesundheitsmuster zugeordnet zu werden, für Profil 2 am höchsten und Profil 1 am geringsten. Ein gegensätzliches Muster zeigt sich für das Risikomuster B: Die Wahrscheinlichkeit, diesem Muster zuzugehören, ist für Profil 1 gegenüber den beiden anderen Profilen deutlich erhöht. Auch hinsichtlich der Staatsexamensnote zeigen sich signifikante Unterschiede zugunsten des Profils 2 und mit den schlechtesten Noten für Profil 1.

Mit Hilfe von in der Studieneingangsphase erfassten Merkmalen lassen sich drei Gruppen von Studierenden identifizieren, wobei eine Gruppe bereits zu Studienbeginn eine ungünstige Merkmalskombination aufweist (Profil 1). Diese Gruppe von Studierenden ist am wenigsten zufrieden, weist einen ungünstigen Umgang mit Belastungen auf und hat am Ende des Studiums die schlechteren Abschlussnoten. Die Ergebnisse bestätigen und erweitern damit die bisherige Forschung zu Eingangsvoraussetzungen im Lehramt um eine profilanalytische Längsschnittanalyse und sind insbesondere für die Studieneingangs- und Verlaufsberatung von hohem Interesse.



Welches Wissen brauchen Mathematikstudierende für einen erfolgreichen Studieneinstieg? Entwicklung eines Niveaumodells basierend auf einer Reanalyse von Daten

Stefanie Rach1, Stefan Ufer2

1Otto-von-Guericke-Universität Magdeburg, Deutschland; 2Ludwig-Maximilians-Universität München, Deutschland

Theoretischer Hintergrund

Studienabbruchquoten weisen darauf hin, dass vor allem der Studienbeginn im Bereich Mathematik viele Studierende vor große Probleme stellt (z. B. Heublein et al., 2014). Als Ursachen werden spezifische Anforderungen eines solchen Studiums benannt, für deren Bewältigung Studierende spezifische Voraussetzungen benötigen. Empirische Studien belegen, dass mathematisches Vorwissen Studienerfolg über allgemeine Leistungsindikatoren wie die Abiturnote hinaus vorhersagt (Hailikari et al., 2008; Rach & Heinze, 2017). Vor allem aus fachdidaktischer Sicht ist jedoch bisher unklar, welche Art bzw. Qualität von Vorwissen für die erfolgreiche Bewältigung mathematischer Lernprozesse an der Hochschule relevant ist.

Fachliches Wissen wird in der Literatur beispielsweise nach konzeptuellem und prozeduralem Wissen unterschieden (Rittle-Johnson et al., 2015). Während prozedurales Wissen häufig mit routinisierten Fähigkeiten in Verbindung gebracht wird, wird ein flexibles Netzwerk unterschiedlich strukturierter, bedeutungshaltiger Repräsentationen als eine wichtige Qualität konzeptuellen Wissens zur Mathematik angesehen (z. B. Gagatsis et al., 2006). Das Mathematikstudium ist von zunehmend intensiverer Nutzung symbolischer und formaler Notationen, z. B. in formalen Begriffsdefinition und Beweisen (Gueudet, 2008), geprägt. Da mathematische Konzepte dabei auch ohne bedeutungshaltige Repräsentanten dargestellt werden, wird im Hochschulkontext auch der flexible Wechsel zwischen Bedeutungsinhalten und formal-symbolischen Repräsentationen als wesentliche Voraussetzung für erfolgreiches Lernen diskutiert (Tall, 2008).

Fragestellungen

Um zu klären, welches Vorwissen ausschlaggebend für den Studienerfolg in Studiengängen mit hohem Mathematikanteil ist, werden die folgenden Fragestellungen fokussiert:

  • Lassen sich anhand der bisher verwendeten Vorwissenstests Niveaus von Vorwissen modellhaft differenzieren?
  • Welches Niveau fachspezifischen Vorwissens erreichen (im ersten Studiensemester) erfolgreiche Studierende im Vergleich zu nicht erfolgreichen Studierenden?

Methode

Bei dieser Studie handelt es sich um eine Reanalyse von Daten aus fünf längsschnittlich angelegten Studien aus den Jahren 2010 bis 2015 (vgl. Autoren, 2015, 2017). Insgesamt wurden 1533 Studierende (Bachelor Fachmathematik, Wirtschaftsmathematik, gymnasiales Lehramt) im ersten Semester befragt. Die Studierenden bearbeiteten zu Studienbeginn einen mathematischen Vorwissenstest zur Analysis mit 8 bis 10 Items aus einem Pool von 17 Items. Die Bearbeitungen wurden dichotom kodiert. Zusätzlich ist von 705 Studierenden bekannt, ob sie das Erstsemestermodul „Analysis 1“ bestanden haben.

Ergebnisse

In den verwendeten Tests ließen sich auf der Basis von IRT-Modellierungen und der Bookmark-Methode (Mitzel et al., 2001), validiert durch ein Expertenrating, vier Niveaus von Vorwissen identifizieren:

  1. Darlegen von Faktenwissen und Ausführen von Routineverfahren
  2. Nutzung von vertrauten Vorstellungen zu mathematischen Konzepten
  3. Flexible Nutzung mathematischer Konzepte mit eigenständigem Darstellungswechsel
  4. Flexible Nutzung formaler Schreibweisen von Konzepten

Erwartungsgemäß zeigt sich das mathematische Vorwissen auch unter Kontrolle der Gesamt-Abiturnote als starker Prädiktor für den Studienerfolg (Strukturgleichungsmodell: χ²(150) = 202.822 (p < .01); CFI = .940, TLI = .939, RMSEA = .022; Vorwissen Regressionskoeffizient: β = .752, p < .001). Deskriptive Ergebnisse sowie logistische Regressionsanalysen mit abhängiger Variable „Modulerfolg in Analysis 1“ zeigen zusätzlich, dass bereits Studierende, die sich auf Niveau 3 oder höher befinden, hohe Chancen haben, das Modul erfolgreich zu absolvieren. Damit scheint insbesondere Wissen mit einer guten Vernetzung verschiedener, bedeutungshaltiger Darstellungen für den Erfolg im ersten Studiensemester relevant zu sein. Besonders im Bereich der Niveaus 1 und 4 variiert die Erfolgswahrscheinlichkeit kaum.

Zusammenfassend gibt diese Reanalyse nicht nur Hinweise darüber, dass mathematisches Vorwissen relevant für einen erfolgreichen Studienbeginn im Bereich Mathematik ist, sondern auch welches Vorwissen Studierende mit hohen und niedrigen Erfolgschancen unterscheidet. Besonders relevant scheint schulisches Wissen zu sein, das über vertraute Vorstellungen hinausgeht und sich durch flexible Vernetzung unterschiedlich strukturierter Darstellungsformen auszeichnet. Wissen zu symbolischen Darstellungen und formalen Notationen scheint die Chancen, das Erstsemestermodul zur Analysis erfolgreich zu absolvieren, darüber hinaus nur wenig zu erhöhen. Aufgrund der hohen Stichprobenmortalität und der Fokussierung auf den Bereich der Analysis ist die Reichweite der Ergebnisse eingeschränkt. Es könnte jedoch beispielsweise als Grundlage für ein differenziertes, adaptives Online-Self-Assessment als Beratungsinstrument vor Studienbeginn dienen.



Der Einfluss des Beantwortens und Generierens von MC-Fragen auf den Lernerfolg im Studium

Natalie Enders1, Sandra Rothenbusch2

1Universität Hildesheim, Deutschland; 2TU Braunschweig, Deutschland

Die evidenzbasierten Gestaltung von Bildungsangeboten erfordert Erkenntnisse zu Prüfungsformaten sowie korrespondierenden Lehr- und Prüfungsvorbereitungsstrategien. An Hochschulen kommen aus ökonomischen Gründen häufig geschlossene Frageformate zum Einsatz, auf die sich Studierende mit Altklausuren und/oder Fragekatalogen vorbereiten (Schulz, Zehner, Schindler & Prenzel, 2014). Da ein Großteil der Lösungsstrategien für das Beantworten von Single-Choice-(SC-)Fragen auf Wiedererkennungsprozessen beruht (Kubinger, 2014), wird das Fragenbeantworten als Oberflächenstrategien eingeordnet (Scouller, 1998). Eine alternative Lernstrategie stellt das Generieren von SC-Fragen dar, das durch die Elaboration der Lerninhalte eine Tiefenverarbeitung anregen soll (Levin & Arnold, 2008; Yu & Wu, 2012).

Zur vergleichenden Betrachtung der Lernstrategien des Fragenbeantwortens und -generierens werden folgende Fragestellungen untersucht:

  1. Erzielen Studierende, die semesterbegleitende Frageaktivitäten (Fragenbeantworten und -generieren) ausführen, höhere Lernleistungen als Studierende, die keine Fragen beantworten und/oder generieren?
  2. Ist das Generieren oder das Beantworten von SC-Fragen die effektivere Lernstrategie?
  3. Beeinflusst die Qualität der Lernstrategieausführung die Lernleistung?

Die Frageaktivitäten wurden im Wintersemester 2017/18 in zwei inhaltlich identische Psychologievorlesungen integriert. Zu Semesterbeginn wurde Grundlagenwissen über Funktion und Einsatzbereiche der beiden Lernstrategien erläutert sowie Qualitätskriterien für SC-Fragen vermittelt. Anschließend wurden interessierte Studierende randomisiert zwei Interventionsgruppen zugeteilt: Zu einem dreiwöchigen Vorlesungsblock Gedächtnis (Interventionsphase 1) generierten die Studierenden in Interventionsgruppe 1 drei SC-Fragen, während die Studierenden in Interventionsgruppe 2 drei SC-Fragen beantworteten. Diese Frageaktivitäten der Interventionsgruppen wurden zum nachfolgenden dreiwöchigen Vorlesungsblock Lerntheorien (Interventionsphase 2) getauscht. Die Lernleistung aller Vorlesungsteilnehmer/innen wurde am Semesterende mit Hilfe einer SC-Klausur (30 Fragen, davon 7 Fragen zu Gedächtnis und 7 Fragen zu Lerntheorien) erfasst.

Die beiden Vorlesungen wurden von insgesamt N=566 Studierende besucht, von denen zu Interventionsphase 1 N=104 und zu Interventionsphase 2 N=92 an den freiwilligen Frageaktivitäten teilnahmen. Die Datenauswertung erfolgte mit SPSS 25 und R 3.5.3. Aufgrund des geringen Stichprobenumfangs sowie Verletzungen der Normalverteilungsannahme wurden zur Beantwortung der ersten beiden Fragestellungen robuste varianzanalytische Verfahren und zur Beantwortung der dritten Fragestellung robuste lineare Regressionsmodelle mit MLR-Schätzer verwendet (Field & Wilcox, 2017).

Zur Beantwortung von Fragestellung 1 wurden die Klausurpunkte der Studienteilnehmer/innen an den Klausurpunkten aller Vorlesungsteilnehmer/innen standardisiert. Studierende in Interventionsgruppe 1, MDifferenz=0.473, p=.006, und Interventionsgruppe 2, MDifferenz=0.484, p=.004, erzielten statistisch signifikant bessere Klausurergebnisse als Vorlesungsteilnehmer/innen, die an keinen Frageaktivitäten teilnahmen. Zudem zeigte der Vergleich zu den restlichen Vorlesungsteilnehmer/inne/n, dass die Teilnahme an beiden Frageaktivitäten, MDifferenz=0.479, p=.001, jedoch nicht die Teilnahme an nur einer Frageaktivität, MDifferenz=0.206, p=.216, mit besseren Klausurergebnissen zusammenhing.

Hinsichtlich Fragestellung 2 zeigt sich, dass die Interventionsgruppenzugehörigkeit nicht mit unterschiedlichen Klausurergebnissen einhergeht, MDifferenz=-0.002, Yt=-0.007, p=.993. Die Ergebnisse im Klausurteil Gedächtnis unterscheiden sich nicht danach, ob zu Interventionsphase 1 Fragen zum Gedächtnis generiert oder beantwortet wurden, MDifferenz=-0.058, Yt=-0.253, p=.805. Ebenfalls ergeben sich zu Interventionsphase 2 keine unterschiedlichen Ergebnisse im Klausurteil Lerntheorien in Abhängigkeit von der Fragengenerierung oder -beantwortung, MDifferenz=-0.223, Yt=-0.994, p=.334.

Zur Beantwortung von Fragestellung 3 wurde die Qualität der selbstgenerierten SC-Fragen anhand der Indikatoren „fachliche Korrektheit“, „Anspruchsniveau in der kognitiven Lernzieltaxonomie“ (Anderson & Krathwohl, 2001) sowie „Abstraktionsniveau“ bestimmt, während der prozentuale Anteil an korrekt gelösten SC-Fragen als Indikator für die Qualität der Fragenbeantwortung verwendet wurde. In den zugehörigen Regressionsanalysen zeigt sich, dass nur das kognitive Anspruchsniveau der selbstgenerierten SC-Fragen die Klausurergebnisse statistisch signifikant (b=.341, p≤.009) beeinflusst: Studierende, die Fragen auf einem höheren kognitiven Niveau entwickeln, erzielten mehr Punkte. Das Modell klärt 10,7% der Gesamtvarianz auf.

Zusammenfassend weisen die Ergebnisse darauf hin, dass semesterbegleitende Frageaktivitäten die studentische Prüfungsvorbereitung nur dann positiv unterstützen, wenn sie kombiniert eingesetzt werden. Während die Sequenzierung der Frageaktivitäten keinen Einfluss auf das Lernergebnis hat, erweist sich das Generieren qualitativ hochwertiger SC-Fragen als bedeutsame Einflussvariable. Die methodischen Einschränkungen durch das relativ hohe Dropout sowie der Einfluss potenzieller Selektionseffekte auf die Ergebnisinterpretation werden unter Berücksichtigung weiterer Ergebnisse zu relevanten Kontrollvariablen (z.B. studentisches Vorwissen, Selbstwirksamkeit und Einsatz zusätzlicher Lernstrategien) diskutiert.



Teilnahmeanreize und Testmotivation in einem Low-Stakes-Studierfähigkeitstest

Laura Schmidberger1, Kristina Kögler1, Brigitte Schönberger1, Steffen Brandt2

1Universität Hohenheim, Deutschland; 2opencampus.sh

Theoretischer Hintergrund

Eine verhältnismäßig geringe Testmotivation und hohe Abbruchquoten sind häufige Problemlagen in Low-Stakes-Assessments (Finn, 2015). Dabei können insbesondere fehlendes Interesse sowie eine nicht wahrgenommene Nützlichkeit oder Wichtigkeit einen negativen Effekt auf die Testleistung und die Validität der Fähigkeitsschätzer haben (Cole, Bergin & Whittaker, 2008). Insbesondere in onlinebasierten Low-Stakes-Studierfähigkeitstests mit dem Ziel der frühzeitigen Identifikation von Förderbedarfen in Massenstudiengängen wie den Wirtschaftswissenschaften wäre aber eine möglichst flächendeckende Teilnahme und genaue Fähigkeitsschätzung von großer Bedeutung zur Vermeidung hoher Studienabbruchquoten. Bisher weitgehend unklar ist in diesem Zusammenhang die Frage nach der Wirkung verschiedener Teilnahmeanreize wie etwa unterschiedlicher Teilnahmeansprachen oder der Integration von Gamification-Elementen. Ein Verfahren, das sich zur Überprüfung der Effekte variierender Testdesigns bewährt hat, sind A/B-Tests mit zufälliger Gruppenzuordnung (Kohavi & Longbotham, 2017).

Fragestellungen

Im Zuge der Entwicklung eines onlinebasierten Low-Stakes-Studierfähigkeitstests für den Bereich Wirtschaftswissenschaften werden folgende Fragen untersucht:

(1) Welchen Einfluss hat die Gestaltung der Teilnahmeansprache auf die Teilnahme- und Abbruchquoten in einem Low-Stakes-Studierfähigkeitstest?

(2) Lassen sich mittels der Integration von Gamification-Elementen die Teilnahme- und Abbruchquoten optimieren?

(3) Welchen Einfluss hat die Integration von Gamification-Elementen auf Testmotivation und Testergebnisse der Teilnehmenden?

Methode

Im Rahmen einer Pilotstudie wurden ca. 680 Studienanfangende der Studiengänge Wirtschaftswissenschaften und Wirtschaftspädagogik an der Universität Hohenheim unmittelbar nach der Einführungswoche aufgefordert an einem onlinebasierten Low-Stakes-Studierfähigkeitstest von ca. 45 Minuten teilzunehmen. Die Testung wird über die abwechselnde Integration entsprechender Teilnahmelinks als A/B-Test angelegt, bei dem sich die Gruppen zum einen in der Ausführlichkeit der Teilnahmeaufforderung und zudem hinsichtlich unterschiedlicher Testvarianten mit und ohne Gamification unterscheiden. Die Gamification-Elemente bestehen aus graphisch ansprechend aufbereiteten unterhaltsamen und nützlichen Informationen rund um die Universität Hohenheim und das Studium, die nach jedem dritten bis viertem Item eingeblendet werden (bspw. Informationen über Sportangebote, berühmte Hohenheimer Absolventen, studentische Feste, wichtige Daten und Fakten zur Universität oder humoristische Memes zum Studienalltag). Während der Testung werden Logdaten aufgezeichnet (Verweildauer, Lösungszeiten, Überspringen, etc.). Die Testmotivation wird auf Basis der Student Opinion Scale (SOS; Sundre & Thelk, 2007) gegen Ende der Testung erhoben. Mit etwas zeitlichem Abstand zur Testung erhalten die Studierenden per Email ein individualisiertes Feedback, das ihnen modulspezifische Schwächen und Stärken und entsprechende Fördermöglichkeiten aufzeigt.

Erwartete Ergebnisse

Es wird angenommen, dass die unterschiedlichen Teilnahmeaufforderungen zu Unterschieden hinsichtlich der Teilnahme- und Abbruchquoten führen. Angesichts der mehrdeutigen Befundlage im Zusammenhang mit der Ausführlichkeit von Teilnahmeansprachen bleibt zu klären, welche Variante sich für die vorliegende Zielgruppe als vorteilhaft erweist. Es ist ferner davon auszugehen, dass die Integration von Gamification-Elementen zu erhöhter Testmotivation führt, da diese durch ihre Unterhaltsamkeit und subjektive Relevanz einen Anreiz bieten können, den Test bis zum Ende gewissenhaft durchzuführen. Offen bleibt indes die Frage, ob sich auch die Testleistung durch die Integration von Gamification-Elementen steigern lässt oder ob diese eher ablenkend wirken. Erste Ergebnisse werden im Vortrag berichtet.

Diskussion und Relevanz

Low-Stakes-Studierfähigkeitstests dienen weniger der universitären Eignungsfeststellung im Rahmen der Auswahl und Zulassung von Studierenden, sondern eher der frühzeitigen Identifikation von fehlenden fachspezifischen Vorkenntnissen und Fertigkeiten sowie der entsprechenden Rückmeldung von Förderbedarfen. Sie bieten als solche wichtige Informationen für die Gestaltung von universitären Förderangeboten und entfalten bildungspolitische Relevanz bei der Verringerung von Studienabbruchquoten, insbesondere in Massenfächern wie den Wirtschaftswissenschaften. Die Freiwilligkeit der Teilnahme führt dabei häufig zu einem Vermeidungsverhalten der Hauptzielgruppe universitärer Förder- und Stützangebote und damit zu einer Gefährdung des eigentlichen Testzwecks. Angesichts des weitgehenden Fehlens von Befunden zur differenziellen Wirkung von Teilnahmeanreizen können die Ergebnisse der vorliegenden Pilotstudie insofern einen Beitrag zur Entwicklung valider Low-Stakes-Studierfähigkeitstests leisten.

 

Datum: Freitag, 27.03.2020
9:00 - 10:45F9–1.19: Digitale Medien und Unterricht
1.19 
 

Lernen mit multiplen Repräsentationen bei Physik-Experimenten mit mobiler Videoanalyse - Einfluss auf Konzeptverständnis, kognitive Belastung und Emotion

Sebastian Becker, Pascal Klein, Jochen Kuhn

TU Kaiserslautern, Deutschland

1 Theoretischer Hintergrund
Für das Lernen in den Naturwissenschaften wird multiplen, externen Repräsentationsformen (meR) eine lernwirksame Rolle zugeschrieben (Tytler, Prain, Hubber & Waldrip, 2013), ihr Einsatz kann jedoch auch die kognitive Belastung der Lernenden erhöhen (De Jong et al., 1998). Technologie-Unterstützung kann dazu beitragen, diese Belastung zu reduzieren und damit die lernförderliche Wirkung von meR zu fördern (z.B. Horz, Schnotz, Plass, Moreno & Brünken, 2009). Plass und Kalyuga (2019) sehen in der Verarbeitung von (negativen) Emotionen eine Quelle zusätzlicher kognitiver Belastung. Auf diesem Wege könnte der multimediale Einsatz eine zusätzliche Reduktion der kognitiven Belastung durch eine positive Beeinflussung des emotionalen Zustands bedingen.
2 Fragestellung
Obwohl Experimente beim naturwissenschaftlichen Lernen eine Schlüsselrolle einnehmen (z.B. Haury & Rillero, 1994), sind Wirksamkeitsstudien zur Integration multimedialer Lernwerkzeuge in Experiment-basierten Lernprozessen noch immer rar gesät (Oliveira et al., 2019). Hillmayr, Reinhold, Ziernwald und Reiss (2017) konnten in einer Metastudie nachweisen, dass der Einsatz digitaler Medien zu einer Steigerung der Motivation und einer positiveren Einstellung gegenüber dem jeweiligen Fach führt. Es ist somit naheliegend, dass Technologie-Unterstützung auch einen positiven Einfluss auf den emotionalen Zustand der Lernenden hat.
Diese Studie fokussiert dem folgend auf die Untersuchung der Wirkung eines speziellen digitalen Lernwerkzeugs, der Tablet-PC-gestützten Videoanalyse, in einem Experiment-basierten Unterrichtsszenario bezüglich der folgenden vier Fragestellungen:

Führt der Multimedia-Einsatz ...

1. ... zu einer signifikanten Reduzierung der kognitiven Belastung?
2. ... zu einem besseren Verständnis der adressierten physikalischen Konzepte?
3. ... zu einer positiven Beeinflussung des emotionalen Zustands?
4. Kann ein kausaler Zusammenhang zwischen emotionalem Zustand und kognitiver Belastung statistisch gestützt werden?
3 Methode
In einer quasi-experimentellen Feldstudie (N = 216 matched samples) wurden Physik-Kurse der Eingangsphase der Sekundarstufe 2 an verschiedenen Gymnasien randomisiert einer Interventionsgruppe (IG, N = 108) und einer Kontrollgruppe (KG, N = 105) zugeordnet. Während die Lernenden der IG einen Tablet-PC mit einer Videoanalyse-Applikation zur Erfassung und Visualisierung von Messdaten verwendeten, nutzten die Lernenden der KG traditionelle Experimentiermaterialien. Nach einem Prä-Leistungstest (Becker, Klein, Gößling & Kuhn, 2019; Becker, Klein & Kuhn, 2018) folgte die Unterrichtssequenz, welche auf die Förderung des physikalischen Konzeptverständnisses durch kooperatives Experimentieren in Kleingruppen fokussierte. Unmittelbar anschließend beantworteten die Lernenden Fragebögen zur kognitiven Belastung (Cognitive Load Scale, Leppink, Paas, van der Vleuten, van Gog & van Merriënboer, 2013) und dem emotionalen Zustand (Achievement Emotions Questionnaire, Pekrun, Frenzel, Barchfeld & Perry, 2011; Pekrun, Götz, Titz & Perry, 2002) und absolvierten den Post-Leistungstest.
4 Ergebnisse
Mittels einer linearen Mischeffektmodellierung mit dem between-Faktor Lernbedingung und within-Faktor Zeit (Prä- und Posttest) konnte ein signifikanter Interaktionseffekt identifiziert werden (F(1, 214) = 19.00, p < 10-3 , η2 = 0.082, 1−β = 0.992). Eine Varianzanalyse der kognitiven Belastungsskala zeigte einen signifikanten Effekt zu Gunsten der IG bezüglich der lernirrelevanten Belastung (F(1,208) = 21.43, p < 10-3, η2 = 0.093, 1 − β = 0.997). Auch in der Varianzanalyse der Emotionsskala zeigten sich signifikante Effekte zu Gunsten der IG, sowohl für positive Emotionen (F (1, 207) = 10.54, p = 0.001, η2 = 0.048, 1−β = 0.902) als auch für negative Emotionen (F(1,207) = 16.70, p < 10-3, η2 = 0.076, 1−β=0.985). Darüber hinaus konnte theoriekonform mittels einer Strukturgleichungsanalyse eine positive Wirkung von negativen Emotionen (b = 0.663, se = 0.102, z = 6.238, p < 10-3, β = 0.714) sowie eine negative Wirkung von positiven Emotionen (b = −0.268, se = 0.110, z = −2.439, p = 0.015, β = −0.389) auf die lernirrelevante kognitive Belastung statistisch nachgewiesen werden.

Die lernförderliche Wirkung der Tablet-PC-gestützten Videoanalyse von Bewegungen können rekurrierend auf fundamentale Lerntheorien (DeFT(Ainsworth, 2006), CLT(Sweller, van Merriënboer & Paas, 2019), CTML(Mayer, 2005)) diskutiert werden. Der Wirkzusammenhang zwischen Emotionen und kognitiver Belastung kann darüber hinaus auf das ICALM Modell (Plass & Kaplan, 2016) theoretisch gestützt werden.



Zur Erfassung freizeitlichen Leseverhaltens junger Erwachsener: Eignet sich hierfür der Titelrekognitionstest?

Maximilian Pfost, Verena Schnabel, Franziska Locher

Otto-Friedrich-Universität Bamberg, Deutschland

Zentraler Einflussfaktor für die Entwicklung der Fähigkeit zum verstehenden Lesen von Texten ist die Aktivität des Lesens an sich, insbesondere das Lesen von Büchern (Anderson, Wilson & Fielding, 1988; Pfost, Dörfler & Artelt, 2013). Für die Erfassung von Leseaktivitäten hat sich dabei ein breites Spektrum an Methoden mit jeweils entsprechenden Vor- und Nachteilen etabliert. Neben retrospektiven Globalurteilen und textspezifischen Urteilen (vgl. Locher & Pfost, 2019) sowie Lesetagebüchern (z.B. Anderson et al., 1988; Nieuwenboom, 2008) haben vor allem auch die indirekten Messverfahren wie Titel- und Autorenrekognitionstests (TRT & ART; z.B. Schroeder, Segbers & Schröter, 2016; Stanovich & West, 1989) Eingang in die Forschung gefunden. Dabei müssen bei Rekognitionsverfahren Teilnehmende aus einer vorgegebenen Liste von Buchtiteln (TRT) beziehungsweise Autoren (ART) diejenigen kennzeichnen, die sie (wieder-)erkennen. Angenommen wird, dass dies ein Indikator für das Lesevolumen der Personen ist. Den Stellenwert dieser Tests in der Forschung verdeutlicht besonders die meta-analytische Arbeit von Mol und Bus (2011), welche knapp einhundert Studien, in denen entsprechende Rekognitionstests verwendet wurden, analysierte. Im Mittel zeigten sich in dieser Studie deutlich positive Zusammenhänge mit sprachlichen und schriftsprachlichen Kompetenzen. Nichtsdestotrotz bleibt die Frage, was genau diese indirekten Testverfahren tatsächlich erfassen, größtenteils ungeklärt. Zwar wird aus theoretischer Perspektive häufig der Vorteil der Vermeidung von Effekten sozialer Erwünschtheit von Verfechtern dieser Methode angeführt, dafür werden jedoch zahlreiche andere Verzerrungen (zum Beispiel bedeutet das Kennen eines Buchtitels nicht zwangsweise, dass das Buch auch gelesen wurde) in Kauf genommen. Aus diagnostischer Perspektive stellt sich daher die Frage nach dem Zusammenhang zwischen Testergebnissen aus dem TRT mit anderen Verfahren zur Erfassung von Leseverhalten. Darüber hinaus soll exploriert werden, in wie fern sich auch vergleichbare Zusammenhänge zu Konstrukten wie der Lesemotivation über verschiedene Messverfahren zeigen.

Zur Untersuchung dieser Fragestellungen wurde unter Berücksichtigung gängiger Verfahrensbeschreibungen (z.B. Masterson & Hayes, 2007) ein Titelrekognitionstest zusammengestellt. Dabei wurde darauf geachtet, dass neben populären „Klassikern“ auch aktuelle Buchtitel mitaufgenommen werden. Zusätzlich wurden, in Anlehnung an existierende Buchtitel, falsche nicht existente Buchtitel dargeboten. Zusammen mit anderen Maßen zur Erfassung des Leseverhaltens sowie weiteren, für die Leseentwicklung zentralen Variablen (z.B. Lesemotivation und Selbstwirksamkeitserwartung, Schulnoten) wurde dieser Test von zwei Stichproben Studierender (N = 91 und N = 35) aus dem humanwissenschaftlichen Fächerkanon bearbeitet. Es sei angemerkt, dass der Test aus der ersten Erhebung für die zweite Erhebung überarbeitet wurde, sodass zwei ähnliche, jedoch nicht identische TRTs im Einsatz waren.

Im Hinblick auf die interne Konsistenz und Reliabilität erweisen sich die beiden eingesetzten TRTs als ausreichend reliabel (u.a. Cronbachs α = .70/.76, Studie 1/2). Eine positive Korrelation korrekt erkannter Buchtitel (hit-rate) mit fälschlich „erkannten“ nicht existenten Buchtiteln (false-rate) von r =.31/.35 könnte ein Hinweis auf Antworttendenzen im Sinne einer Ja-sage-Tendenz sein. Bezüglich anderer etablierter Instrumente zur Erfassung des Leseverhaltens zeigen sich vielfach nur geringe Zusammenhänge. Mit einer Globaleinschätzung zur täglichen Lesezeit ergab sich eine statistisch nicht bedeutsame Korrelation von r = .10/-.06. Mit einer Einschätzung zur Anzahl gelesener Bücher in den letzten 12 Monaten fiel die Korrelation höher aus (r = .27, Studie 1). Für Angaben zur Lesezeit gemessen mittels elektronischem Lesetagebuch, zeigte sich eine Korrelation von r = .22 (ns., Studie 2). Auch in Hinblick auf Zusammenhänge mit weiteren Maßen wie der Lesefreude (r = .29, Studie 1) fielen die gefunden Zusammenhänge eher, insbesondere im Vergleich mit den Korrelationen basierend auf den Globalratings (r = 57, Studie 1), gering aus.

Die gefunden (tendenziell geringen) Zusammenhänge des TRTs mit verschiedenen anderen Maßen zum Leseverhalten machen deutlich, dass exploriert werden sollte, was genau dieses Verfahren eigentlich erfasst. Eine in der Diskussion bislang wenig berücksichtigte Frage ist beispielsweise, welche Rolle die Tatsache spielt, ob bestimmte Buchtitel verfilmt wurden, oder welchem Genre ein Buchtitel angehört.



Das virtuelle Arbeitsmittel Prozentband – Ergebnisse zu Lernerfolgsmaßen und Strategiewahl bei einer Interventionsstudie im gymnasialen Mathematikunterricht der Klasse 6

Alexander Willms, Ufer Stefan

Ludwig-Maximilians-Universität München, Deutschland

Forschungsstand
Im Zuge der Diskussion über die Digitalisierung an den Schulen wird der Einsatz von virtuellen Arbeitsmitteln im Mathematikunterricht als eine effektive Technik zum Aufbau von konzeptuellem Verständnis vorgeschlagen (Moyer-Packenham et al., 2013). Als zugrunde liegender Wirkmechanismus wird hierbei häufig die Verknüpfung verschieden strukturierter Darstellungen (Bruner, 1966; Duval, 2006) und der daraus resultierende Aufbau einer zum Arbeitsmittel strukturähnlichen mentalen Repräsentation genannt (Schnotz & Bannert, 2003). Als potentiell hilfreich gesehen wird hier auch, verschieden strukturierte Darstellungen in eine gemeinsame Visualisierung zu integrieren (Ainsworth, 2006). Ein alternativer Erklärungsansatz besteht in der Verwendung graphischer Darstellungen als Visualisierungsstrategie bei der Lösung der vorgegebenen Aufgabe, ohne zwingend eine mentale Repräsentation aufzubauen (Schukajlow, 2011).

Das Forschungsprojekt ViPro („Visualisierungen und Arbeitsmittel in der Prozentrechnung“) untersucht die Auswirkungen virtueller Arbeitsmittel am Beispiel einer tablet-basierten Version der sogenannten double number line (DNL, Prozentband). Diese besteht aus zwei Skalen, einer für Prozentwerte und einer für Prozentsätze. Beide Skalen sind verknüpfbar und jeweils durch das Ziehen mit dem Finger skalierbar.

Zur Bearbeitung einfacher Anwendungsaufgaben aus dem Themenbereich Prozentrechnung wird häufig eine Dreisatztabelle als übliche Darstellung herangezogen. Die double number line bietet eine alternative Darstellung für solche Aufgaben, die die Verhältnisse zwischen den in der Aufgabe gegebenen Größen visualisiert. Offen ist, unter welchen Bedingungen eine zusätzliche dynamische Visualisierung durch die double number line lernförderliche Wirkungen entfaltet.
Fragestellung
1. Hat die getrennte bzw. mit der Dreisatztabelle integrierte dynamische Visualisierung durch eine DNL im Vergleich zu Unterricht ohne eine solche Visualisierung positive Auswirkungen auf den Lernerfolg im Prozentrechnen?
2. Zeigen Lernende, die die DNL als Visualisierungsstrategie übernehmen, eine stärkeren Lernzuwachs im Prozentrechnen als Lernende, die dies nicht tun?
Methode
An der Studie im Prä-Post-Test-Design nahmen N=338 Schülerinnen und Schüler der sechsten Jahrgangsstufe an 14 Gymnasien in München und Umgebung teil. Für den Prä-Test wurde eine Skala zum Vorwissen zur Prozentrechnung (6 Items, z.B. „Berechne 30 % von 170.“) entwickelt.

Während der anschließenden 90-minütigen tablet-gestützten Intervention zum Thema „Erhöhter bzw. Verminderter Grundwert“ wurde jede Klasse zufällig in drei Gruppen geteilt. In der Kontrollgruppe wurde nur der Dreisatz zur Lösung von Aufgaben der Prozentrechnung thematisiert. In der Experimentalgruppe 1 wurde zusätzlich die DNL als eigenständige Visualisierung eingeführt, in der Experimentalgruppe 2 wurden die DNL und die Dreisatzdarstellung in einer integrierten Visualisierung verwendet.

Im Post-Test wurden 9 Items zum Thema „erhöhter bzw. verminderter Grundwert“ entwickelt (z.B. „Der Preis einer CD wird um 14 % reduziert. Nun kostet die CD noch 12,90 €. Wie viel kostete die CD ursprünglich?“). Für jede Lösung wurde auch kodiert, ob eine double number line zur Visualisierung genutzt wurde.
Ergebnisse
Die entwickelten Skalen zeigen gute interne Konsistenzen (α=.76-.84). In die Analysen mit linearen Mischmodellen wurden neben dem Gruppenfaktor das Vorwissen als Kovariate einbezogen. Klassenunterschiede wurden mit einem Zufallsfaktor kontrolliert.

Im Prä-Test zeigten sich keine signifikanten Unterschiede zwischen den Gruppen (F(2;310,7)=0,09; p=.91). Im Post-Test zeigten sich ebenfalls keine signifikanten Unterschiede zwischen den Gruppen (F(2;275,9)=0,19; p=.82).

Nur eine Lernende der Kontrollgruppe nutzte die DNL im Post-Test als Visualisierung. Lernende der Experimentalgruppen, die die DNL im Post-Test mindestens einmal als Visualisierung einsetzten (39 % der Lernenden), zeigten einen stärkeren Lernzuwachs als Lernende, die die DNL nicht nutzen (B=0.065, p<.05), jedoch keine signifikant besseren Leistungen im Prä-Test (B=-0.042, p=.27).
Diskussion
Die Studie weist darauf hin, dass die Integration der double number line mit der Dreisatzdarstellung nicht per se relevant für einen Leistungszuwachs in der Prozentrechnung ist. Vielmehr scheint relevant zu sein, ob die Lernenden die Struktur der double number line für eigene Visualisierungsstrategien übernehmen oder nicht. Weitere Forschung sollte hier untersuchen, unter welchen instruktionalen Rahmenbedingungen die Lernenden zur Verwendung hilfreicher Visualisierungen angeregt werden können und was die Lernenden auszeichnet, die diese Visualisierungsstrategie nutzen.



Improving socio-emotional competencies for building productive teacher-student relationship. Results of two experimental studies on a video-based online training program

Michel Knigge, Karsten Krauskopf, Simon Wagner

Universität Potsdam, Deutschland

Relationship quality between teachers and their students are a critical aspect for wellbeing and effective learning in school. Accordingly, teacher training should promote competencies for creating and maintaining positive relationships in the classroom. There is theory and evidence that socio-emotional competencies (SEC) of teachers are crucial for the establishment of productive teacher-student relationships.

Jennings and Greenberg (2009) developed the prosocial classroom model that states with reference to a broad array of empirical evidence that teachers’ SEC and their well-being influence healthy teacher-student relationships alongside an effective classroom management, and an effective social and emotional learning environment for students. However, theoretically social aspects of SEC can be divided into cognitive and affective components. Such distinctions are rooted in social psychology (Davis, 1983a; Kanske et al., 2016) and two main facets can be described: (cognitive) perspective taking (PT) and (affective) empathic concern (EC). While PT describes the ability to assess situations from the perspective of that of another person, EC refers to a person’s tendency to experience similar emotions as an observed person. As research indicates, PT and EC can be quite powerful and they are distinct in their effects. For example, Vorauer & Quesnel (2016) showed in a study that if a member of a majority group shows high PT toward a member of a minority group, the latter reports more positive self-descriptions. But there is no such effect, if the majority group shows higher levels of EC. Also there is evidence for interactions between the constructs in such a way that higher EC can inhibit PT in affectively loaded situations (Kanske et al., 2016). Furthermore, there is initial evidence regarding teacher training that EC can be a positive predictor for developing higher teaching specific self-efficacy (Krauskopf & Knigge, in print). Accordingly, EC and PT seem to interact in rather complex ways in affective learning.

In Germany, corresponding affective learning objectives are rather underrepresented in the university based teacher training programs. Accordingly, there are attempts to fill this gap. However, explicitly intended socio-emotional learning in teacher education is scarce. The Helga-Breuninger-Foundation developed a video-based online training (Intus3) that intends to focus on student teachers’ interpersonal competencies. By reflecting on staged videos, participating (pre-service) teachers are supposed to increase their awareness of interpersonal cues by training perspective taking, empathy and reflection of intuitive responses. Although this training is well designed, there is only little empirical evidence in general and so far no experimental research investigating the effects of Intus3.

Accordingly, we investigated whether this program is able to improve the capacities of student teachers’ interpersonal competencies, affective well-being and affective attitudes towards challenging students.

We conducted two randomized experimental studies (n1=132, n2=242) within lectures in teacher education at the University of Potsdam introducing the basics of inclusive education in two consecutive semesters. We compared groups first working with Intus3 to waiting control groups that wrote an expository text based on empirical research discussing the relevance of teacher-student-relationships with a longitudinal design with four measurement points.

Latent change models showed that prior work with Intus3 showed few effects but complex effects in comparison the prior text work groups. In the larger and extended study 2 an increase of empathic concern was significant after the prior work with Intus3.

The results will be discussed with the perspective of the potential of further development of online training courses for affective learning for teachers and teacher students.