Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Sitzungsübersicht
Sitzung
Poster-S28: Einflüsse auf Lernen und Leisten im Studium
Zeit:
Donnerstag, 26.03.2020:
15:45 - 17:00

Ort: S28

Präsentationen

Erfassung des wahrgenommenen Werts des Bildungswissenschaftsstudiums bei Lehramtsstudierenden

Lisa Stark, Eric Klopp, Robin Stark

Universität des Saarlandes, Deutschland

Nach der Erwartungs-Wert-Theorie (Eccles & Wigfield, 2002) ist die Nutzung bildungswissenschaftlicher Lerngelegenheiten im Studium u.a. abhängig vom wahrgenommenen Wert (WW) der Studieninhalte bzw. des Studienfachs. Der WW bezieht sich allgemein auf die persönlich gewertete Wichtigkeit von Lerninhalten, wobei vier Wertkomponenten theoretisch unterschieden werden: Die Auseinandersetzung mit Lerninhalten kann a) wichtig zur Bestätigung des Selbstkonzepts (attainment value), b) nützlich für das Erreichen aktueller oder späterer Ziele sein (utility value), c) zu subjektiven Interessen passen (intrinsic value) aber auch d) hohe Opportunitätskosten verursachen (cost). In der vorliegenden Studie wurde untersucht, inwiefern sich die theoretisch angenommene Mehrdimensionalität des Konstruktes WW bezogen auf das Bildungswissenschaftsstudium bei Lehramtsstudierenden auch empirisch mithilfe eines neu entwickelten Fragebogens zeigt. Zudem wurden Korrelationen zu weiteren Variablen geprüft, um erste Hinweise zur konvergenten Validität zu erhalten. Der WW des Bildungswissenschaftsstudiums wurde anhand eines domänenspezifisch formulierten Fragebogens (Biwi-WW) erfasst, der die vier Wertkomponenten mit jeweils drei Items abdeckte (angelehnt an Pintrich et al., 1993; Stark et al., 2018). Zur Untersuchung der Faktorenstruktur des Biwi-WW wurde ein eindimensionales Modell (M1) mit einem vierdimensionalen Modell (M2) anhand des stichprobenadjustierten BIC (sBIC, Sclove, 1987) verglichen (Klopp, 2019). Das vierdimensionale Modell wurde als exploratives Strukturgleichungsmodell mit Target-Rotation umgesetzt (Asparouhov & Muthen, 2009), wobei Korrelation mit den Variablen Studienzufriedenheit und Studieninteresse im Modell berücksichtigt wurden. Sowohl in einer ersten Stichprobe (S1) mit N=223 StudienanfängerInnen im Lehramt (64.6% weiblich; Alter: M=20.6, SD=4.3; Semester: M=1.20, SD=0.77) als auch in einer zweiten Stichprobe (S2) mit N=206 im Studienverlauf weiter fortgeschrittenen Lehramtsstudierenden (68% weiblich; Alter: M=22.2, SD=4.7; Semester: M=3.8, SD=2.0) fiel der Modellvergleich zugunsten des vierdimensionalen Modells aus (S1: sBICM1=7211, sBICM2=7141; S2: sBICM1=7234, sBICM2=7078), welches einen guten Modellfit aufwies (S1: χ2(31)=43.62, p=.066, CFI=0.993, RMSEA=0.043, pclose=.663, SRMR=0.016; S2: χ2(39)=51.94, p=.080, CFI=0.994, RMSEA=0.040, pclose=.699, SRMR=0.013). Die vier Skalen des Biwi-WW zeigten hohe interne Konsistenz (S1: α=.81/.83/.86/.86; S2: α=.88/.89/.89/.83) und hohe Interkorrelationen (S1: .59<|r|<.79, S2: .64<|r|<.73). Zudem ergaben sich erwartungskonforme Korrelationen der vier Dimensionen u.a. mit Studieninteresse (Schiefele et al., 1993; S1: r=.64/.63/.76/-.75; S2: r=.75/.66/.78/-.80; alle p<.001). Bei S2 ergaben sich erwartungskonforme Korrelationen mit Studienzufriedenheit (Westermann et al., 1996; r=.56/.67/.69/-.75, alle p<.001). Die Ergebnisse sprechen in Übereinstimmung mit theoretischen Annahmen für eine vierdimensionale Struktur des WW des Bildungswissenschaftsstudiums, also für eine Differenzierung der Wertkomponenten, und für die konvergente Validität des Fragebogens. Der Fragebogen könnte in Studien zum Einsatz kommen, in denen beispielsweise Interventionen zur Steigerung des WW des Studienfaches Bildungswissenschaften und damit auch des Studienerfolgs untersucht werden.



Beispielbasiertes Lernen zur Förderung des symbolisch-mathematischen Modellverständnisses in der Physikalischen Chemie

Ines Komor1, Helena van Vorst2, Elke Sumfleth1, Maria Opfermann3, Julian Roelle3, Eckart Hasselbrink1

1Universität Duisburg-Essen, Deutschland; 2Universität zu Köln, Deutschland; 3Ruhr-Universität Bochum, Deutschland

Theoretischer Hintergrund

Im Chemiestudium kommt dem mathematischen Modellieren vor allem in der Physikalischen Chemie eine entscheidende Bedeutung zu (z.B. Atkins & de Paula, 2010). Der Prozess des mathematischen Modellierens kann durch ein Kreislaufmodell (adaptiert nach Goldhausen, 2015) dargestellt werden und umfasst im Wesentlichen drei Schritte: das Erfassen des chemischen Problems, das Mathematisieren (Übersetzen des Problems in ein mathematisches Gleichungssystem) und das mathematische Arbeiten (z.B. Formeln umformen und Rechnen). Die hierzu benötigten Fähigkeiten werden in diesem Projekt als symbolisch-mathematisches Modellverständnis zusammengefasst. Dazu zählt auch das Metawissen über den Modellierungsprozess.

Die Untersuchung der Modellierungsschritte im Rahmen einer Vorstudie zeigte, dass Studierende vor allem beim Schritt der Mathematisierung Schwierigkeiten haben und große Defizite in Bezug auf die mathematischen Fähigkeiten aufweisen (Autoren, 2018). Deshalb ist das Ziel dieser Studie die Förderung der als besonders schwierig erkannten Schritte des Mathematisierens und des Mathematischen Arbeitens sowie des übergeordneten Metawissens. Dazu wird ein Training mit für Novizen geeigneten Lösungsbeispielen entwickelt und evaluiert (Renkl, 2014; Autoren, 2014).

Fragestellung

Ziel der Studie ist die Entwicklung eines Trainings zur Förderung des symbolisch-mathematischen Modellverständnisses und damit einhergehend eines Diagnoseinstruments zur Messung der Effektivität des Trainings. Die zughörigen Forschungsfragen lauten:

1. Eignet sich das entwickelte Diagnoseinstrument zur Erfassung des symbolisch-mathematischen Modellverständnisses?

2. Lässt sich das symbolisch-mathematische Modellverständnis mit Hilfe des entwickelten beispielbasierten Trainings fördern?

Methode

Die Studie wurde mithilfe eines prä-post-Kontrollgruppen-Designs mit der Gesamtkohorte von Chemie-Studierenden des zweiten Fachsemesters (N = 58) einer deutschen Universität realisiert. Das Testinstrument besteht aus 39 Multiple-Choice-Single-Select-Items. Dabei wurden die Items folgenden Skalen zugeordnet: Metawissen über den Modellierungskreislauf, Mathematisieren und Mathematisches Arbeiten. Auch das Training wurde unter Berücksichtigung dieser Schwerpunkte entwickelt und umfasst zunächst zwei Sitzungen á 90 Minuten, in denen neben dem symbolisch-mathematischen Modellverständnis auch Fachwissen der Physikalischen Chemie vermittelt wird. Die Lernenden erhalten mehrere Lösungsbeispiele, bestehend aus schrittweise dargebotenen Expertenlösungen und angereichert durch Selbsterklärungsprompts. Die Anzahl und die Tiefe der vorgegebenen Expertenlösungen wird dabei zunehmend verringert, um das eigenständige Lernen zunehmend zu fördern.

Ergebnisse

Zur Beantwortung der ersten Forschungsfrage wurde die Testgüte mit Hilfe eines Raschmodells überprüft. Die Testdaten passen gemäß CAIC, AIC und BIC am besten zu einem zweidimensionalen Modell, in welchem die Skalen Mathematisieren und Mathematisches Arbeiten zu einer Skala zusammengefasst werden (2-dim vs. 1-dim : χ²[2] = 20.6, p < .001; 2-dim vs. 3-dim: χ²[3] = 4.7, p = .197). Die drei ursprünglich angenommenen Dimensionen lassen sich somit nicht bestätigen. Damit ergeben sich die Dimensionen Metawissen (Dimension 1, 10 Items) und Mathematisches Modellieren (Dimension 2, 29 Items). Während die Skala zum Mathematischen Modellieren eine zufriedenstellende Reliabilität aufweist, ist die Reliabilität der Skala zum Metawissen noch verbesserungswürdig (EAP/PV Reliabilität: .594 (Dimension 1) und .791 (Dimension 2); Personenreliabilität: .488 (Dimension 1) und .772 (Dimension 2)). Der Vergleich der durchschnittlichen Personenfähigkeiten [WLE] in der Interventionsgruppe vor und nach der Intervention zur Untersuchung von Forschungsfrage 2 zeigt, dass das sehr kurze Training bereits einen positiven Effekt auf das Metawissen hat (Prä: M = -1.30, Post: M = 0.46; t(35) = -8.35, p < .000. d = 1.875), für dessen erfolgreiche Nutzung beim Mathematischen Modellieren müssen aber noch mehr Lösungsbeispiele entwickelt werden (Prä: M = 0.07, Post: M = 0.03; t(35) = -0.32, p = .751).

Diskussion

Da die Skala zum Metawissen noch keine ausreichende Reliabilität aufweist, sollen die Items überarbeitet und neue Items entwickelt werden. Um den Test zeitlich ökonomisch zu gestalten, wird die Skala zum Mathematischen Modellieren gekürzt. Zudem wird in einem nächsten Schritt das Training erweitert, um einen Effekt zum mathematischen Modellieren zu erreichen und die Inhalte der Vorlesung zur Physikalischen Chemie vollständig abzudecken. Diese Erweiterung sowie das optimierte Diagnoseinstrument werden aktuell entwickelt und auf der Tagung ausführlicher vorgestellt werden.



Soziale Unterstützung und Studienerleben bei Fernstudierenden

Ina Pumpe, Kathrin Jonkmann

Fernuniversität in Hagen, Deutschland

Hintergrund

Das in der arbeitspsychologischen Forschung etablierte Job-Demands-Resources Modell (Demerouti et al., 2001) geht davon aus, dass Burnout durch zwei Prozesse entstehen kann: Hohe arbeitsbezogene Anforderungen können zu herabgesetzter Gesundheit und Erschöpfung führen und ein Mangel an Ressourcen (z.B. Belohnungen, Feedback oder soziale Unterstützung) lässt das Engagement sinken.

Aufgrund der Parallelen zwischen Arbeitswelt und Studium (z.B. zeitlicher Aufwand, Zeitdruck und externe Bewertung der Ergebnisse), wurde das Modell bereits mehrfach auf den Studienkontext übertragen (Cotton et al., 2002; Gusy et al., 2016; Pluut et al., 2015). Mit der vorliegenden Studie soll es auf ein universitäres Fernstudium angewendet werden. Ein Fernstudium wird vielfach von sogenannten nicht-traditionellen Studierenden verfolgt, die das Studium mit weiteren beruflichen und familiären Anforderungen vereinbaren müssen und das vor diesem Hintergrund besonders belastend sein kann.

Fragestellungen

Es wird erwartet, dass hohe Anforderungen zu herabgesetzter Gesundheit und mehr Ressourcen zu mehr Motivation im Fernstudium führen (Fragestellung 1). Weiter wird untersucht, ob Anforderungen auch in negativem Zusammenhang zur Motivation und Ressourcen gemäß der Direkt-These (Diewald, 1991) in positivem Zusammenhang zur Gesundheit stehen (Fragestellung 2). Schließlich wird geprüft, ob Ressourcen im Sinne der Puffer-These (Diewald, 1991) den Zusammenhang zwischen Anforderungen und Gesundheit moderieren und ob Anforderungen den Zusammenhang zwischen Ressourcen und Motivation moderieren (Fragestellung 3).

Methode

An der Onlinefragebogenstudie nahmen 231 Studierende unterschiedlicher Fakultäten der Fernuniversität in Hagen im Alter zwischen 19 und 56 Jahren teil. 177 Teilnehmende waren berufstätig, 195 weiblich.

Typische zeitliche, organisatorische und lernbezogene Anforderungen des Fernstudiums sollten hinsichtlich ihres Anspruchs bewertet werden.

Als Ressource wurde die soziale Unterstützung durch Lehrende (in Anlehnung an das Berliner Anforderungs-Ressourcen Inventar für Studierende BARI-S, Gusy & Lohmann, 2011), Kommilitonen (in Anlehnung an Schulz & Schwarzer, 2003) und das private Umfeld (in Anlehnung an Fydrich et al., 2009) betrachtet.

Gesundheit wurde operationalisiert durch emotionale Erschöpfung (Adaption des Maslach Burnout Inventory für Studierende von Schaufeli et al., 2002), Stresserleben (Stress- und Coping-Inventar von Satow, 2012) und Prüfungsangst (Wacker et al., 2008).

Die Studienmotivation wurde operationalisiert durch Zufriedenheit mit Studieninhalten und Studienbedingungen (Westermann et al., 1996) sowie die Abbruchintention.

Ergebnisse

Die Fragestellungen 1 und 2 wurden weitgehend bestätigt. Alle Anforderungsbereiche standen erwartungsgemäß in einem positiven Zusammenhang zu Erschöpfung und Stresserleben. Höhere Lernanforderungen gingen außerdem mit mehr Prüfungsangst, höherer Abbruchneigung und geringerer Zufriedenheit mit den Studienbedingungen einher. Organisatorische Anforderungen waren negativ mit der Zufriedenheit mit den Studieninhalten assoziiert.

Höhere emotionale Unterstützung aus dem privaten Umfeld ging mit weniger Stress, geringerer Abbruchintention und mehr Zufriedenheit mit Studieninhalten und –bedingungen einher. Unterstützung durch Kommilitonen war hingegen mit mehr Erschöpfung und geringerer Zufriedenheit mit den Studienbedingungen assoziiert, während Unterstützung durch Lehrende mit weniger Prüfungsangst, weniger Erschöpfung und höherer Zufriedenheit mit Studienbedingungen und -inhalten einherging.

Für die Puffer-These (Fragestellung 3) gab es gemischte Befunde. Bei hohen Lernanforderungen führte Unterstützung durch Kommilitonen zu größerer Zufriedenheit mit den Studieninhalten, allerdings auch zu höherer Unzufriedenheit mit den Studienbedingungen, während wenig Unterstützung zu erhöhter Abbruchintention führte. Hohe zeitliche Anforderungen führten bei wenig Unterstützung ebenfalls zu verstärkter Abbruchintention. Bei hohen organisatorischen und bei hohen Lernanforderungen führte wenig Unterstützung durch Lehrende zu mehr Unzufriedenheit mit den Studienbedingungen.

Zusammenfassend hatte die Unterstützung durch Lehrende und emotionale Unterstützung aus dem privaten Umfeld durchweg positive Auswirkungen. Für die Unterstützung durch Kommilitonen hingegen zeichnete sich ein uneinheitliches Bild, teilweise zeigte die Unterstützung eine negative Wirkung, die sich möglicherweise durch malfunktionale Prozesse wie z.B. das Phänomen der Co-Rumination (vgl. Boren, 2013) erklären lässt. Die Befunde müssen durch längsschnittliche Untersuchungen untermauert werden.



Potenzialanalyse für (angehende) Studierende – Entwicklung, Erprobung und Evaluation in der MINT-Studieneingangsphase

Olena Kryshko, Jens Fleischer, Detlev Leutner

Universität Duisburg-Essen, Deutschland

Vor dem Hintergrund hoher Studienabbruchquoten, die sich am stärksten in den ersten beiden Semestern und insbesondere im MINT-Bereich zeigen (Heublein, 2017), gewinnen Maßnahmen zur Gestaltung einer gelungenen Studieneingangsphase generell und speziell in naturwissenschaftlich-technischen Studiengängen zunehmend an Bedeutung (Schubarth et al., 2019). Der Studieneingang umfasst den Übergang von der Schule zur Hochschule inklusive des ersten Studienjahres und gilt als Phase, in der mithilfe gezielter Unterstützungsangebote die Weichen für zukünftigen Studienerfolg gestellt werden können (Key & Hill, 2018). Studienerfolg, verstanden als multidimensionales Konstrukt (York et al., 2015), wird auf individueller Ebene sowohl durch fachliches Vorwissen als auch durch eine Reihe fächerübergreifender, motivationaler, persönlichkeits- und lernverhaltensbezogener Merkmale bedingt (Richardson et al., 2012; Robbins et al., 2004; Trapmann et al., 2007). Da Unterstützungsangebote zum Defizitausgleich von Fachkompetenzen (z. B. Vorkurse) bereits flächendeckend etabliert sind, wird zur Optimierung der Studieneingangsphase eine stärkere Mitberücksichtigung oben genannter fächerübergreifender Faktoren empfohlen (Hochschulrektorenkonferenz, 2018). Im Rahmen des Projekts TalentKollegRuhr wurde ein Selbstreflexionstool entwickelt, das den StudienanfängerInnen einen Überblick über solche studienerfolgsrelevanten Faktoren sowie eine Auseinandersetzung mit ihren eigenen Stärken und Entwicklungspotenzialen ermöglicht. Die Entwicklung der Potenzialanalyse umfasste die Konstrukt- und Skalenauswahl für den diagnostischen Teil sowie die Konzeption der Ergebnisrückmeldungen. Die Erprobung erfolgte im Paper-Pencil-Format an drei Kohorten von MINT-StudienanfängerInnen (2016/17, 2017/18, 2018/19) einer Universität im Rahmen von Mathematikvorkursen. Insgesamt wurden für 814 TeilnehmerInnen persönliche, passwortgeschützt abrufbare Ergebnisrückmeldungen zu den getesteten Merkmalen erstellt. Vor Beginn ihres zweiten Semesters nahmen 237 dieser Studierenden an einer Online-Befragung teil. Dabei wurde anhand folgender Forschungsfragen die prognostische Validität untersucht sowie die Nutzerakzeptanz (Kirkpatrick, 1994) des Selbstreflexionstools evaluiert:

• Hängen die mithilfe der Potenzialanalyse erfassten Merkmale der MINT-StudienanfängerInnen mit ihrem späteren Studienerfolg zusammen?

• Wie wird die Potenzialanalyse von den MINT-StudienanfängerInnen angenommen und bewertet?

Basierend auf früherer Forschung zu individuellen Studienerfolgsprädiktoren (z. B. Richardson et al., 2012) sowie den Pilotierungsergebnissen der ersten Kohorte wurden für die Potenzialanalyse 17 Konstrukte aus vier Bereichen ausgewählt. Den Bereich Persönlichkeit deckten Gewissenhaftigkeit, emotionale Stabilität, Offenheit für Erfahrungen, Verträglichkeit und Extraversion ab (NEO-FFI, 60 Items; Borkenau & Ostendorf, 1993). Der Bereich Motivation (SELLMO, 31 Items; Spinath et al., 2012) umfasste Lernzielorientierung, Annäherungs-Leistungszielorientierung, Vermeidungs-Leistungszielorientierung und Arbeitsvermeidung. Allgemeine Selbstwirksamkeitserwartung (10 Items; Schwarzer & Jerusalem, 1999) sowie studienbezogene Selbstwirksamkeitserwartung (6 Items; adaptiert aus Abele et al., 2000) bildeten den Bereich Selbstwirksamkeit. Der Bereich Lernstrategien (LIST, 46 Items; Wild & Schiefele, 1994) beinhaltete Wiederholungsstrategien, Elaborationsstrategien, Organisationsstrategien, metakognitive Strategien, Zeitmanagement und Anstrengungsmanagement.

In der Online-Befragung wurden Studienzufriedenheit (9 Items; Westermann et al., 1996), Studienabbruchneigung (6 Items; Dresel & Grassinger, 2013; Ströhlein, 1983) und Studienleistung als Indikatoren des Studienerfolgs herangezogen. Die Studienleistung wurde anhand des Mittelwerts der drei letzten, selbstberichteten Klausurnoten operationalisiert. Die Nutzerakzeptanz wurde mit acht Einzelitems beispielsweise zur Verständlichkeit sowie Nützlichkeit der Ergebnisrückmeldungen erfasst. Zudem wurde in den zwei letzten Kohorten die Anzahl abgerufener Ergebnisrückmeldungen erfasst.

Alle Skalenreliabilitäten waren mindestens akzeptabel (Chronbach’s α = .69 bis α = .92). Korrelationsanalysen zeigten, dass mehrere durch die Potenzialanalyse erfasste Merkmale mit unterschiedlichen Studienerfolgsindikatoren zusammenhängen. So geht zum Beispiel eine höhere studienbezogene Selbstwirksamkeitserwartung mit besseren Noten einher (r = -.18, p = .046), während die Persönlichkeitsfaktoren Gewissenhaftigkeit (r = .26, p < .001), emotionale Stabilität (r = .38, p < .001) und Verträglichkeit (r = .19, p = .020) positiv mit der Studienzufriedenheit korrelieren und die Lernzielorientierung (r = -.20, p = .011) sowie Annäherungs-Leistungszielorientierung (r = -.16, p = .044) negativ mit der Studienabbruchneigung zusammenhängen. Deskriptive Statistiken zeigten unter anderem, dass die Mehrheit der befragten MINT-Studierenden, die ihre Ergebnisrückmeldung abgerufen hatten, deren Gestaltung (81,7%), Verständlichkeit (89,5%) sowie Nützlichkeit zu Selbstreflexionszwecken (64,8%) positiv bewertete. Die Abrufquote der Ergebnisrückmeldungen betrug 44,5%.

Diese und weitere Ergebnisse werden hinsichtlich der Modifizierung des Selbstreflexionstools sowie dessen Einsatzmöglichkeiten zur Optimierung der Studieneingangsangebote diskutiert.



Kontrastiert statt isoliert? Aufbau konzeptuellen Wissens bei angehenden Lehrkräften.

Julia Kienzler, Prof. Dr. Thamar Voss, Prof. Dr. Jörg Wittwer

Universität Freiburg, Deutschland

Theoretischer Hintergrund und Fragestellung

Konzeptuelles Wissen ist für angehende Lehrkräfte von großer Bedeutung, da es die Grundlage für die theoretisch-konzeptuelle Analyse berufsrelevanter Situationen und den systematischen Erwerb komplexer Fertigkeiten darstellt (Darling-Hammond, 2006). Jedoch greifen Lehrkräfte häufig auf ihre eigenen Überzeugungen und selten auf an der Hochschule erworbenes Konzeptwissen zurück (Neuweg, 2007). Gerade beginnende Lehrkräfte fühlen sich beispielsweise im Bereich der Prävention und Intervention unerwünschten Schüler*innenverhaltens (im Sinne Operanten Konditionierens) unzureichend vorbereitet. Eine fundierte Wissensbasis erweist sich jedoch als präventiv für ein hohes Beanspruchungserleben beginnender Lehrkräfte (McCarthy, Lineback & Reiser, 2015).

Eine Möglichkeit, Konzeptwissen aufzubauen, stellt beispielbasiertes Lernen dar (Renkl, 2014). Beim beispielbasierten Lernen werden oft mehrere Beispiele einzeln oder sequentiell mit zunehmend unvollständiger Lösung dargeboten (Renkl, 2011). Nach dem case comparison Ansatz werden zwei gleichzeitig dargebotene Beispiele kontrastierend verglichen. Metaanalysen zeigen eine Überlegenheit von kontrastierenden Beispielen gegenüber einzeln vorgegebenen Beispielen, jedoch ist bislang unklar, ob die zugrundeliegenden Konzepte und Prinzipien vor dem Vergleich der Beispiele präsentiert oder selbst generiert werden sollten (Alfieri, Nokes-Malach & Schunn, 2013). In der Forschung zum Lernen mit verzögerter Instruktion (Productive Failure) wird die Phase individuellen Problemlösens ohne vorherige inhaltliche Auseinandersetzung als eine Möglichkeit der tiefen kognitiven Verarbeitung verstanden (Loibl, Roll & Rummel, 2016). Jedoch kann bei fehlender Bereitstellung der Konzepte und Prinzipien die kognitive Belastung höher sein (Cognitive Load Theorie, Cooper & Sweller, 1987).

In der vorliegenden Studie wird daher ein Lernsetting mit case comparison zum Aufbau des Konzept- und Prinzipienwissen von Lehramtsstudierenden im Bereich Operanten Konditionierens entwickelt und evaluiert. Wir untersuchen, (1) ob die Bearbeitung kontrastierender Beispiele der Darbietung einzelner Beispiele überlegen ist. Weiterhin gehen wir (2) der Frage nach, ob ein vorangestellter Input und strukturierende Leitfragen während der Fallbearbeitung von Vorteil für den Aufbau konzeptuellen Wissens und die wahrgenommene kognitive Belastung sind.

Methode

Das Lernsetting besteht einerseits aus einer E-Learning Einheit zu den Konzepten und Prinzipien Operanten Konditionierens und andererseits aus Fallbeispielen zur Erarbeitung der Konzepte und Prinzipien. In der Studie wird ein einfaktorielles Design mit drei Experimentalbedingungen realisiert, die sich in der Implementierung des fallbasierten Lernens unterscheiden: Teilnehmende der EG 1 (guided) erhalten zunächst die E-Learning Einheit zu den Konzepten und Prinzipien und bearbeiten im Anschluss drei Paare kontrastierender Fallbeispiele. Sie werden durch Leitfragen aufgefordert, die Fallbeispiele im Hinblick auf die zuvor eingeführten Prinzipien miteinander zu vergleichen.

Teilnehmende der EG 2 (prompted) bearbeiten zuerst die drei Paare kontrastierender Fallbeispiele mit einem allgemeinen Prompt, der auffordert, die Beispiele miteinander zu vergleichen. Im Anschluss werden die Prinzipien des Operanten Konditionierens im Rahmen der E-Learning Einheit erarbeitet.

Teilnehmende der dritten Gruppe (Kontrollgruppe) bearbeiten die E-Learning-Einheit, in der einzelne Fallbeispiele aufeinanderfolgend ohne eine Aufforderung zum Vergleich dargeboten werden.

In allen drei Gruppen wird zu Beginn ein kurzer Vorwissenstest eingesetzt. Im Anschluss an die Lerneinheit bearbeiten die Teilnehmenden aller drei Gruppen einen Test zu den Konzepten und Prinzipien Operanten Konditionierens sowie einen Fragebogen zum wahrgenommenen cognitive load während der Bearbeitung der Fallbeispiele. Ein Follow-up Wissenstest wird nach ca. 8 Wochen eingesetzt.

Das erarbeitete Lernsetting wird derzeit mit N = 70 Teilnehmenden pilotiert. Die Hauptstudie mit optimiertem Setting findet im Dezember 2019 statt. An dieser Studie werden N = 350 Studierende des polyvalenten Zwei-Hauptfächer-Bachelors mit dem Optionsbereich Lehramt Gymnasium (Universität Freiburg) teilnehmen, die randomisiert auf die drei Bedingungen zugewiesen werden.

Erwartete Ergebnisse

Erwartet wird, dass sich case comparison (guided- und prompted-Gruppe) als lernförderlicher erweist als die Darbietung aufeinanderfolgender Beispiele (Kontrollgruppe). Auf der Grundlage der Literatur zum Productive Failure wird in Hinblick auf den Erwerb des Konzept- und Prinzipienwissens eine Überlegenheit der prompted-Gruppe gegenüber der guided-Gruppe erwartet, wohingegen auf der Grundlage der Cognitive Load Theorie die guided-Gruppe eine geringere kognitive Belastung als die prompted-Gruppe berichten sollte.



Ausprägungen kognitiver und motivationaler Variablen für Studierendenprofile im Fach Chemie und ihr Zusammenhang mit dem Erfolg in den Modulabschlussklausuren

Salome Janke, Sebastian Habig, Elke Sumfleth, Maik Walpuski

Universität Duisburg-Essen, Deutschland

Theoretischer Hintergrund:

Im Fach Chemie liegt die Studienabbruchquote bei aktuell 45 % (Heublein et al., 2018). Aufgrund der hohen Abbruchquoten ist die Identifikation von chemiespezifischen Studienerfolgsprädiktoren von Bedeutung. Die DFG-Forschergruppe ALSTER erforschte seit dem WS16/17 den Studienerfolg Chemiestudierender anhand eines Studienerfolgsmodells ähnlich dem von Thiel et al. (2008). Es wurden affektive, motivationale sowie fachspezifische Studienerfolgsvariablen für die unterschiedlichen Teilbereiche der Chemie (z. B. Vorwissen und Fachwissen der Allgemeinen, Physikalischen und Analytischen Chemie) des ersten Fachsemesters untersucht (Averbeck et al. 2017). Ergänzend zu bereits erfolgten korrelativen und regressionsanalytischen Beschreibungen von Prädiktoren auf den Studienerfolg im Allgemeinen fehlen bisher Daten, die die heterogene Studierendenschaft (Busker et al., 2010) im Fach Chemie genauer beschreiben, indem voneinander trennbare Profile Chemiestudierender hinsichtlich ihrer kognitiven und motivationalen Eingangsvoraussetzungen identifiziert werden.

Forschungsfragen:

1) Welche Studierendenprofile ergeben sich aus den kognitiven und motivationalen Eingangsvoraussetzungen Chemiestudierender des ersten Fachsemesters?

2) Welche Zusammenhänge bestehen zwischen den Studierendenprofilen und den kumulierten Klausurnoten am Ende des ersten Fachsemesters?

Methode:

Die Stichprobe besteht aus 221 Erstsemesterstudierenden der Fächer Chemie und Water Science der Universität Duisburg-Essen (UDE, n = 104) und der Fächer Chemie und Biochemie an der Ruhr-Universität Bochum (RUB, n = 117) der ALSTER-Hauptstudie des Wintersemesters 16/17 (durchschnittlich 20 Jahre; 40 % weiblich, 59 %männlich, 1 % divers). Innerhalb der Übungen des Studienmoduls „Allgemeine Chemie“ wurden folgende kognitive und motivationale Merkmale im Rahmen von Online- und Präsenzveranstaltungen erhoben: Die Abiturnote, das Vorwissen in der Allgemeinen Chemie (adaptiert und verändert nach: Freyer et al., 2014) und die Rechenfähigkeit (Müller et al., 2018) zu Studienbeginn, die kognitiven Fähigkeiten (Heller & Perleth, 2000), die Abbruchs- und Wechselintention (Fellberg & Hannover, 2006; Blüthmann et al., 2011) sowie das Studieninteresse (Schiefele et al., 1993). Die kumulierten Klausurnoten am Ende des ersten Fachsemesters setzen sich aus den folgenden Modulabschlussnoten zusammen: Allgemeine Chemie, Mathematik, Physik (nur UDE), Analytische (nur RUB) bzw. Physikalische Chemie (nur UDE).

Ergebnisse:

Es wurde eine hierarchische Clusteranalyse mit den z-standardisierten Merkmalen durchgeführt. Mit Hilfe des Single-Linkage-Verfahrens wurden 3 Ausreißer identifiziert und von den weiteren Analysen ausgeschlossen. Mit dem Ward-Verfahren und mit Hilfe des Elbow Kriteriums und dem Test von Mojena wurden acht Cluster (Studierendenprofile) identifiziert (Norusis, 1993; Backhaus et al., 2016):

(1) Leistungsschwach & interessiert (n = 42)

(2) Durchschnittlich leistungsstark mit schlechter Abiturnote (n = 47)

(3) Leistungsschwach, aber gute Abiturgesamtnote (n = 11)

(4) Leistungsschwach & uninteressiert (n = 29)

(5) Durchschnittlich leistungsstark mit guter Abiturnote (n = 31)

(6) Leistungsstark & interessiert (n = 25)

(7) Leistungsstark mit Abbruchsintention (n = 8)

(8) Rechenfähig & interessiert (n = 28).

Die Verwendung des Ward-Verfahrens konnte durch den Vergleich mit dem alternativen k-Means-Verfahren validiert werden (K* = .824, p < .001). Cluster 6 wurde als das Cluster der leistungsstärksten Studierenden identifiziert. Dies spiegelt sich auch in den Daten wider: 24 von 25 Studierende des Clusters 6 haben die Klausuren am Ende des Fachsemesters mit Erfolg absolviert. Die Cluster 1, 2, 3 und 4 wurden als die Cluster der allgemein leistungsschwächeren Studierenden (niedrige Ausprägungen der kognitiven Clustervariablen) identifiziert. Innerhalb des Clusters 3 zeigte sich, dass nur einer der anfangs 11 Studierenden die Klausuren, mit zudem wenig Erfolg, absolviert hat. Außerdem ergab eine univariate Varianzanalyse (Bonferroni-Korrektur) für die kumulierten Klausurnoten (AV) signifikante Unterschiede zwischen den fünf Clustern 1, 2, 4, 5 & 8 und dem Cluster 6 (F(6,88) = 9.12, p < .001, ƞp2 = .38). Die kumulierten Klausurnoten der als leistungsschwächer identifizierten Studierendenprofile unterschieden sich tatsächlich signifikant von denen der leistungsstarken Studierenden. Weitere Ergebnisse der Analysen sollen im Rahmen der Jahrestagung vorgestellt werden. Das Ziel ist es „Riskostudierende“ frühzeitig zu erkennen und ggf. gezielte Unterstützungsmaßnahmen anbieten zu können.



Evaluation automatisch generierten formativen Feedbacks in Online-Lernaufgaben zur Allgemeinen Chemie Vorlesung

Florian Trauten, Maik Walpuski, Carolin Eitemüller

Universität Duisburg-Essen, Deutschland

Theoretischer Hintergrund:

Der Übergang von der Schule zur Hochschule stellt die Studierenden vor eine Vielzahl von Herausforderungen (Inaltun et al., 2013). Die Distanz zur Lehrperson wächst, es muss sich in ein neues Sozialgefüge eingeordnet und neue Lerngruppen gebildet werden. Hilfestellung bzw. Feedback – sei es von der Lehrperson oder von anderen Studierenden – muss aktiv eingefordert werden (Rost, 2012). Probleme müssen hierzu selbstständig erkannt und in Fragen gefasst werden, was ein adäquates Maß an Vorwissen voraussetzt (Jacobs, 1998). Die hohen Abbruchquoten in Chemiestudiengängen an deutschen Universitäten von ca. 42 % seit 2006 lassen jedoch darauf schließen, dass dies nur einem Teil der Studierenden gelingt. So wird Feedback an Hochschulen besonders selten von Studierenden aus der Gruppe der Studienabbrechende in Anspruch genommen (Heublein et al., 2017). Zudem begünstigen fachliche Defizite, die nicht in der Studieneingangsphase aufgearbeitet werden, den Studienabbruch. Defizite im Vorwissen, bedingt durch die Kurswahl in der Oberstufe, werden auch durch bestehende Lernangebote Universitäten (belegt am Beispiel der Universität Duisburg-Essen und der Ruhr-Universität Bochum) zurzeit nicht kompensiert (Averbeck et al., 2017).

Feedback gilt jedoch als einer der effektivsten Einflussfaktoren auf Lernprozesse (Hattie & Timperley, 2007) und besonders vorwissensschwache Studierende weisen laut Heublein et al. (2017) einen akuten Feedbackbedarf auf. Besonders wenn der Wissensstand nicht ausreicht, um Fehler in Lösungen der Übungsaufgaben eigenständig zu finden (Jacobs, 1998), kann über informatives tutorielles Feedback (ITF), z. B. in einer Online-Lernumgebung, effektiv Hilfestellung gegeben werden (Narciss & Huth, 2006). ITF Komponenten schließen dabei unter anderem detaillierte Information über gemachte Fehler und prozedurale Hilfestellung zum Lösungsprozess mit ein. Durch unmittelbares Feedback im Lösungsprozess erhalten auch vorwissensschwache und zurückhaltende Studierende die Möglichkeit aus ihren Fehlern zu lernen und Lücken im Vorwissen zu schließen. Im Rahmen der Hochschullehre konnten Studien den Einfluss von Vorwissen auf die Wirksamkeit von ITF bislang nicht klären (Stark & Mandl, 2009; Smits et al., 2008). Forschung in chemienahen Fächern deutet jedoch auf einen solchen Zusammenhang hin (Albacete & VanLehn, 2000, Narciss et al., 2006). Detailliertes ITF soll demnach besonders vorwissensschwachen Lernenden helfen. Narciss (2006) hat einen Bug-Related-Tutoring (BRT) Feedback-Algorithmus entwickelt, der reich an ITF Komponenten ist. Korrektives Feedback wird hingegen besonders bei vorwissensstarken Lernenden als effektiv eingeschätzt. Berichtet wird hier nur, dass es Fehler gibt und letztlich das korrekte Ergebnis.

Fragestellung:

Diese Arbeit behandelt die Frage, ob es in Abhängigkeit vom Vorwissen Feedback-Typen gibt, die sich besonders effizient zur Förderung des Lernprozesses eignen. Durch einen Vergleich des ITF-reichen BRT-Algorithmus mit einem Algorithmus, der lediglich korrektives (KOR) Feedback zur Verfügung stellt, wird überprüft, ob vorwissensschwache Studierende einen höheren Lernzuwachs durch Arbeit mit dem BRT-Algorithmus als durch die Arbeit mit dem KOR-Algorithmus erzielen. Fraglich ist zudem, ob sich im Vergleich zum BRT-Algorithmus die Arbeit mit dem KOR-Algorithmus für vorwissensstarke Studierende als vorteilhaft erweist.

Methode:

In einem 2x2-Design (hohes/ niedriges Vorwissen) wurden die Studierenden über die Kurswahl in der Oberstufe, als guter Prädiktor für Vorwissen (Averbeck et al. 2017), im Wintersemester 18/19 (N = 104) gleichmäßig den beiden Algorithmen zugeordnet. Zu Beginn des Semesters wurde neben verschiedenen psychometrischen Kontrollvariablen ein Chemie Fachwissenstest durchgeführt (Freyer et al., 2013), um am Ende des Semesters den Lernfortschritt erheben zu können. Mit dieser Stichprobe wurden die ersten Aufgaben der Lernumgebung zu insgesamt 13 Lernzielen evaluiert.

Ergebnisse:

Über die gesamte Stichprobe gibt es zwar im Prä-Post-Vergleich einen signifikanten Wissenszuwachs (b[KOR]=b[BRT] = 0.81, t(39.17) = 5.55, p <.001), jedoch konnte kein Vorteil eines Algorithmus gefunden werden. Ein Mehrebenen-Regressionsmodell für die Teilstichprobe früherer Grundkursler (n = 19) zeigte jedoch einen signifikanten Vorteil für den BRT-Algorithmus auf (b[BRT]-b[KOR] = 0.83, t(14.65) = 3.12, p < .01). Für frühere Leistungskursler (n = 17) ließ sich, entgegen der Erwartungen, kein Vorteil für den KOR-Algorithmus aufzeigen (b[KOR]≈b[BRT] = 1.15, t(15.72) = 6.05, p <.001).



Müder Geist studiert nicht gern. Zusammenhänge zwischen Chronotyp, Studienzufriedenheit und Studienabbruch

Peter Sillaro, Juan Serrano-Sánchez, Kathrin Jonkmann

FernUniversität in Hagen, Deutschland

Theoretischer Hintergrund

Neben klassischen Prädiktoren akademischen Erfolgs, wie Intelligenz und Gewissen­haftig­keit, sind inzwischen weitere Merkmale in den Forschungsfokus gerückt. Wachsendes Interesse wurde in diesem Zusammenhang dem Tag-Nacht-Rhythmus zuteil (Preckel et al., 2013; Vollmer, Pötsch, & Randler, 2013). Üblicherweise werden Personen dabei einem von drei Chronotypen zugeordnet: Morgentyp, Abendtyp oder Misch-Chronotyp.

Ergebnisse neuerer Studien weisen darauf hin, dass sich mittels des Chronotyps Leistungsunterschiede zuverlässiger prädizieren lassen als anhand anderer diesbzgl. häufig herangezogener individueller Merkmale, wie z. B. Extraversion (Adan, 2015). Da Abendtypen größere Schwierigkeiten haben, ihren Tag-Nacht-Rhythmus mit Alltagsanforderungen zu synchronisieren, leiden sie häufiger unter Schlafmangel, der zu geringeren Studienleistungen, geringerer Studienzufriedenheit und infolgedessen höherer Studienabbruchneigung führen kann.

Fragestellung

In bisherigen Untersuchungen zum Zusammenhang von Chronotyp und Studienerfolg wurden als Erfolgskriterium zumeist Noten betrachtet (Arbabi, Vollmer, Dorfler, & Randler, 2015; Enright & Refinetti, 2017). Gegenstand dieser Studie sind demgegenüber die Auswirkungen des Chronotyps auf Studienzufriedenheit und Studienabbruchintention.

Somit ergeben sich folgende Hypothesen:

1. Morningness steht in einem negativen Zusammenhang mit wahrgenommenem Schlafmangel im Alltag (WSIA).

2. Eveningness steht in einem positiven Zusammenhang mit WSIA.

3. (a) Morningness steht in einem negativen Zusammenhang mit der Studienabbruchintention.

(b) Dieser Zusammenhang wird partiell mediiert durch WSIA und Studienzufriedenheit.

4. (a) Eveningness steht in einem positiven Zusammenhang mit der Studienabbruchintention.

(b) Dieser Zusammenhang wird partiell mediiert durch WSIA und Studienzufriedenheit.

Methode

Die Hypothesenprüfung erfolgte mittels einer Stichprobe von 469 Studierenden (18–66 Jahre alt, 368 = 78,5 % weiblich) an Hochschulen in Deutschland, Österreich und der Schweiz. Die Datenerhebung erfolgte per Onlinefragebogen auf der Plattform Formr.

Morningness, Eveningness und WSIA wurden anhand des LOCI (Roberts, 1998), die Studienabbruchintention durch Nagy (2006) und die Studienzufriedenheit mit Westermann, Heise, Spies, & Trautwein (1996) ermittelt. Die Stichprobenrekrutierung erfolgte über das Virtuelle Labor der FernUniversität, kooperierende Universitäten, Moodle und Facebook. Deskriptive Statistiken wurden in SPSS berechnet. Die Regressions- und Mediationshypothesen wurden durch ein AMOS-Pfadmodell überprüft.

Ergebnisse

Die Stichprobenmittelwerte lagen für Morningness (M = 3.37, SD = 1.01), Eveningness (M = 3.15, SD = 1.04) und WSIA (M = 3.25, SD = 0.90) im mittleren Skalenbereich. Der Stichprobenmittelwert für Studienzufriedenheit lag mit M = 3.81, SD = 0.82 oberhalb, jener für Studienabbruchintention mit M = 1.63, SD = 0.91 unterhalb des Skalenmittelpunkts.

Für das Pfadmodell wurde ein Modell-Fit von χ2 = 6.217, p = .102 (RMSEA = .048, SRMR = .0279, CFI = .994) ermittelt. Morningness und Eveningness korrelierten substantiell miteinander (r = -.53). Für die meisten Hypothesen fand sich empirische Evidenz. Erwartungs­gemäß wurde zwischen Morningness und WSIA ein negativer (H1: β = -.40, p = .003) sowie zwischen Eveningness und WSIA ein positiver Zusammenhang (H2: β = .27, p = .002) festgestellt. Erwartungskonform zeigten sich zudem ein positiver direkter Effekt von Eveningness auf Studienabbruchintention (H4a: β = .13, p = .008), ein negativer indirekter Effekt von Morningness auf Studienabbruchintention, vermittelt über WSIA und Studienzufriedenheit (H3b: β = -.03, p = .004), sowie ein positiver indirekter Effekt von Eveningness auf Studienabbruchintention, vermittelt über WSIA und Studienzufriedenheit (H4b: β = .02, p = .004). Für H3a wurde hingegen kein Beleg gefunden. Vielmehr wurde nach dem Herausrechnen des via WSIA und Studienzufriedenheit vermittelten indirekten Effekts ein positiver direkter Zusammenhang zwischen Morningness und Studienabbruchintention (β = .09, p = .047) ermittelt. Die Bedeutung der empirischen Befunde für Forschung und Praxis wird diskutiert.



Mass Cheating Among Newcomers: An Unprecedented Issue in Higher Education

Perry P. Gao2, Arvid Nagel1

1Pädagogische Hochschule St.Gallen, Schweiz; 2Education Bridge Institute, USA

Theoretical Framework and Research Questions

Higher education has faced unprecedented challenges in an age where the number of international students has spiked in developed countries, especially in the U.S., Germany, and the U.K.; in U.S. institutions of higher education has increased by 85% over the last 10 years, reaching about 1.1 million registered during the 2017–2018 academic year; The increase is driven largely by a spike in the number of students from mainland China, who represent 62% of the 85% increase (IIE, 2018). Along with the rise in international admission, cheating among international students has become a prominent issue in public discourse. Cheating. There have been widespread media reports on massive cheating scandals involving international students (e.g. Jordan & Belkin, 2016). These reports have normally presented appalling incidents without much detailed statistics or systemic investigation. In addition, very little empirical research has been done in relation to international students. Most of cheating research focus on personality of students and social influences (e.g. DiPietro 2010; McCabe, Butterfield, & Trevino, 2012; Megehee & Spake, 2008; Molnar & Kletke, 2012; Smyth & Davis, 2003).

In response to the lack of empirical research and statistics on cheating among international students, we address the following questions:

1) Are international students in college more likely to cheat?

2) Which group cheats the most, controlling for college entrance examinations and other personal and academic records?

4) Can college entrance tests or other institutional data can predict such behavior?

Research Methods and Data Sources

The study consists of quantitative research using statistical models to reveal factual results on the pattern of cheating with minimal subjective bias. The main analysis of this study employed binary logistic regression to examine the occurrence of cheating in relation to other selected variables stemming from student records. To our knowledge, this is the first study to examine the prevalence of cheating among different international student groups in relation to students’ admission records.

We collected a vast number of available institutional records of every international student registered in a major public university (“the University”) from the fall term of 2009 to the fall term of 2015. In total, there were 5,821 international students. In the binary logistic analysis, the dependent variable is whether the student has record of cheating. Independent variables are Nationality; Length (number of school terms enrolled); Gender; Freshman (first entered as freshman or first entered as transfer student); AEI (whether a student has enrolled in an academic language learning program), SAT and ACT (whether a student has taken SAT or ACT); English Score (score of English proficiency tests. Scores from different tests such as TOEFL and IETLS have all been converted in a standardized scoring system).

Findings

The result shows that students with higher English proficiency test scores were less likely to have cheating records—although the relationship is significant, it is very weak with a low coefficient (OR =.99, p < .01). Increased residence time in college (OR = 1.1, p < .001), being a male student (OR = 1.3, p < .05), being an international student from China (OR = 3.3, p < .001), and enrollment in the AEI program (OR = 1.4, p < .05) are significantly more likely to predict cheating. Being an international student from Japan (OR = .13, p < .01) and having taken and submitted the SAT in their college applications (OR = .47, p < .01) are correlated with a student being less likely to have academic cheating records. Our model predicts approximately 14% of the variance of recorded cheating among international students who have taken language-proficiency tests (Nagelkerkes R2=.135, p < .001).



„J’aime le foot et [hmm] le musique classique“ – Kognitive Urteilsprozesse von Lehramtsstudierenden beim Beurteilen mündlicher Sprachproduktion im Französischen

Stéfanie Witzigmann, Steffi Sachse, Christian Minuth

Pädagogische Hochschule Heidelberg, Deutschland

Theoretischer Hintergrund

Dem Sprechen wird im schulischen Fremdsprachenunterricht ein besonderer Stellenwert zugeschrieben. In der gegenwärtigen Ära des kommunikativen Fremdsprachenunterrichts wird dieser durch die vorgegebenen Bildungsstandards zunehmend aufgewertet. Dies setzt zugleich aber voraus, dass Lehrpersonen ihre Schüler*innen diesbezüglich entsprechend beurteilen und fördern können.

Mündliche Produktionen sind aufgrund ihrer Komplexität (Hu & Leupold, 2008; Porsch, Tesch, & Köller, 2010) schwierig zu beurteilen, da das Sprechen an sich ein sehr schnell ablaufender Prozess ist (Müller-Hartmann & Schocker-von Ditfurth, 2011)und gesprochene Wörter kurzlebig sind (Luoma, 2004; Nieweler, 2010). Mündliche Produktionen lassen sich auf inhaltlichen und sprachlichen Ebenen beschreiben (z. B. hinsichtlich Aussprache, grammatikalischer Korrektheit oder pragmatischer Elemente). Diese Merkmale (sog. Hinweisreize) können in unterschiedlichem Maße in die Beurteilung mündlicher Sprachproben einfließen. Zudem können beim Beurteilen eine Reihe von distalen Faktoren wie Merkmale der Lernenden oder der beurteilenden Personen das Urteil mit beeinflussen (Eckes, 2010; Tesch & Grotjahn, 2010). Aus den vereinzelten Studien, die diagnostische Kompetenzen von Lehrpersonen bei der Beurteilung mündlicher Sprachproben in den Blick nehmen (z.B. Drese, 2008; Hochstetter, 2011; Weh, 2013), geht kaum hervor, auf welche Kriterien die Lehrpersonen ihre Beurteilungen stützen.

Ziel der vorliegenden Studie ist es, entscheidende kognitive Urteilsprozesse bei der Genese diagnostischer Urteile mündlicher Sprachproben zu untersuchen und durch die Einbettung einer theoretischen Rahmung, die sich verschiedener Ansätze bedient wie des Linsenmodells (Brunswik, 1955), des Kompetenzmodells (Blömeke, Gustafsson, & Shavelson, 2015) und der Entscheidungsprozessmodelle (u. a. Croskerry, 2009) dabei entstehende Urteilsprozesse zu erklären versuchen.

Fragestellung

Folgende Forschungsfragen liegen der Studie zugrunde: (a) Inwiefern stimmen die Beurteilungen bei Lehramtsstudierenden für dieselben mündlichen Sprachproben überein? (b) Führen unterschiedliche Herangehensweisen an die Bewertung der Sprachproben (holistisch vs. analytisch) zu unterschiedlichen Beurteilungsergebnissen? (c) Welche Merkmale von Lehramtsstudierenden (u. a. Lehramtswahl, Fachwissen, Einstellungen) beeinflussen das Urteil?

Methode

Da mündliche Produktionen nur der direkten Beobachtung unterliegen, dienten als Material videografierte Sprachproben (N=9) in der Zielsprache Französisch. Im ersten Teil stellen sich die Lernenden kurz vor und im zweiten Teil versuchen sie einen Comic zu beschreiben. In einem ersten Urteilsmodus (holistische Beurteilung) wurden die Probanden instruiert, die einzelnen Videovignetten anzuschauen und direkt im Anschluss jede Vignette auf einer Skala von 0-100% (100% = perfekte Leistung) zu bewerten (T1). Im zweiten Urteilsmodus wurden dieselben Videovignetten erneut beurteilt, jedoch erhielten die Probanden hierfür zunächst ein Beurteilungsraster mit acht sprachlichen Merkmalen (u. a. Aussprache, Wortschatz…) mit 10-stufigen Ratingskalen. Anschließend wurden die Videos erneut auf der 0-100% Skala eingestuft (T2).

Zusätzlich wurde mittels Fragebogen u. a. Fachwissen und Einstellungen zur Beurteilung mündlicher Sprachleistungen erfragt. Die Stichprobe besteht aus 60 Lehramtsstudierenden der Primarstufe (N=30) und des Gymnasiums (N=30).

Ergebnisse

In einer ersten Studie wurden die Videovignetten von Fachdidaktiker*innen der Zielsprache Französisch beurteilt. Die Ergebnisse dieser Studie zeigen, dass trotz unterschiedlicher Bewertungsmaßstäbe die Videovignetten zuverlässig beurteilt und in eine einheitliche Reihenfolge (vom schwächsten bis zum stärksten Lernenden) gebracht werden können. Die hohe Interrater-Reliabilität der Fachdidaktiker*innen (T1: ICC2,1= 0.954 (F = 32.95; p < 0.001); T2: ICC2,1= 0.946 (F = 23.25; p < 0.001)) spricht für die Validität des Beurteilungsverfahrens. Aufgrund der vorliegenden Multikollinearität in Bezug auf die sprachlichen Merkmale wurden Dominanzanalysen (Budescu, 1993) durchgeführt. Dieses Verfahren ermöglichte es die Gewichtung der Hinweisreize bei den einzelnen Probanden zu bestimmen. Schließlich deuten die Ergebnisse darauf hin, dass der externe Fokus auf bestimmte Hinweisreize (mit Beurteilungsraster) die Gewichtung der einzelnen sprachlichen Merkmale verändert und zu einer größeren Homogenität führt. Analoge Auswertungen werden nun im Hinblick auf die untersuchte Gruppe der Lehramtsstudierenden präsentiert. Es wird erwartet, dass im Vergleich zu den Fachdidaktiker*innen, deren Erstbeurteilungen (holistisch) wesentlich heterogener ausfallen. Es wird außerdem dargestellt, welche sprachlichen Hinweisreize bei beiden Beurteilungen einen Beitrag zur Erklärung der diagnostischen Urteile erlauben.



Kompensiert Gewissenhaftigkeit für niedriges Interesse im Laborsetting?

Anna Bareis1, Marion Spengler1, Sven Rieger1, Maike Tibus1, Tobias Appel2, Peter Gerjets3, Brent Roberts1,4, Benjamin Nagengast1, Ulrich Trautwein1

1Hector Institut für Empirische Bildungsforschung, Universität Tübingen, Deutschland; 2LEAD Graduate School & Research Network, Universität Tübingen, Deutschland; 3Leibniz Institut für Wissensmedien, Tübingen, Deutschland; 4University of Illinois, Urbana-Champaign, USA

Gewissenhaftigkeit und Interesse haben sich als wichtige Determinanten für Schulerfolg und damit zusammenhängende Konstrukte wie z.B. Anstrengungsbereitschaft erwiesen (Noftle & Robins, 2007). Aufgrund ihrer unterschiedlichen Forschungstraditionen wurden sie in der Vergangenheit jedoch meist getrennt voneinander untersucht (Gewissenhaftigkeit in der Persönlichkeitspsychologie und Interesse in der Motivationspsychologie). Trautwein et al. (2015) untersuchten basierend auf vier verschiedenen Datensätzen diese zwei Konstrukte gemeinsam. Die Ergebnisse zeigen einen kompensatorischen Zusammenhang zwischen Gewissenhaftigkeit und Interesse in der Vorhersage von Anstrengungsbereitschaft im Schulsetting. Konkret bedeutet dies: Wenn das Fachinteresse von Schülerinnen und Schülern niedrig ist, dann kann dies durch eine hohe Ausprägung von Gewissenhaftigkeit kompensiert werden bzw. waren Schülerinnen und Schüler wenig gewissenhaft, so konnte ein hohes Interesse dies ausgleichen.

Auf Basis dieser Befunde postulierten Trautwein et al. (2019) das CONIC (Conscientiousness x Interest Compensation) Modell.

Das CONIC-Modell führt theoretisches Wissen verschiedener Disziplinen zusammen und entspricht damit aktuellen Forderungen der Community (Boekaerts & Corno, 2005; Schunk & Greene, 2018). Es bietet einen integrativen Ansatz, der aufzeigt, wie Leistung von mehreren Determinanten beeinflusst wird, die bisher nicht gemeinsam untersucht wurden.

Hinsichtlich des zugrundeliegenden Mechanismus wird davon ausgegangen, dass sowohl Gewissenhaftigkeit als auch Interesse „antreibende Kräfte“ darstellen, die zu selbstregulativen Prozessen führen – aber auf unterschiedlichen Wegen: Interesse als kraftvoller, energetisierender "Pull-Faktor" und Gewissenhaftigkeit als innerer „Push-Faktor" (Trautwein et al., 2015; Song et al., in Druck).

Kürzlich erweiterten Song et al. (in Druck) das Modell, indem sie den kompensatorischen Effekt auch für empfundene Nützlichkeit als Prädiktor (anstatt Interesse) und für Leistung als weitere Zielvariable (anstatt Anstrengungsbereitschaft) empirisch zeigen konnten. Rieger et al. (2019) untersuchten das Modell im Längsschnitt und konnten mit den Ergebnissen die Annahmen des CONIC-Modells ebenfalls bestätigen.

Ob die Annahmen des CONIC-Modells auch für selbstreguliertes Verhalten und Anstrengungsbereitschaft in kontrollierten Lernumgebungen abseits des Schulsettings gelten, ist jedoch nach wie vor eine offene Frage. Hier knüpft die vorliegende Studie an und untersucht die Gültigkeit des CONIC Modells unter kontrollierten Bedingungen im Laborsetting.

Zu diesem Zweck bearbeiteten 317 Studierende der Universität Tübingen fünf digitale Lernaufgaben zu unterschiedlichen Themenbereichen (Entstehung des Mondes, außergewöhnliche Tierarten, Eigenschaften des Wassers, Wahrscheinlichkeitsrechnen und Kunstgeschichte). Zu Beginn wurde Gewissenhaftigkeit mit dem NEO PI-R (Ostendorf & Angleitner, 2004) erhoben. Vor jeder Lernaufgabe gaben die Studierenden an, wie sehr sie das jeweilige Thema interessiert, und nach jeder Aufgabe wurde die Lernleistung mithilfe eines Wissenstests erhoben.

Die Datenauswertung erfolgte mithilfe von Regressionsanalysen. Alter, Geschlecht, Intelligenz und Studienhauptfach wurden als Kontrollvariablen berücksichtigt. Als Prädiktoren für Leistung wurden Gewissenhaftigkeit, aufgabenspezifisches Interesse und der Interaktionsterm (Gewissenhaftigkeit × Interesse) eingeschlossen.

Die Ergebnisse zeigen konsistent einen positiven Zusammenhang von Interesse und Leistung (β = .17 bis .37; Wasseraufgabe nicht signifikant), während Gewissenhaftigkeit keinen signifikanten Zusammenhang aufwies. Die Interaktionsterme waren konsistent negativ und erreichten für vier der Lerntasks statistische Signifikanz (β = -.13 bis -.21; Aufgabe zum Wahrscheinlichkeitsrechnen nicht signifikant).

Die negativen Interaktionseffekte bestätigen die Annahmen des CONIC-Modells: Hohes Interesse kompensierte für niedrige Gewissenhaftigkeit in der Vorhersage der Leistung in den Lernaufgaben. Die Ergebnisse weisen aber auch auf die eingeschränkte prädiktive Validität von Gewissenhaftigkeit in hochstrukturierten Lernumgebungen hin.