Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Sitzungsübersicht
Sitzung
F11‒H06: Diagnostische Urteilsprozesse als Informationsverarbeitung und die Bedeutung von Personen- und Situationsmerkmalen
Zeit:
Freitag, 27.03.2020:
11:15 - 13:00

Ort: H06

Präsentationen

Diagnostische Urteilsprozesse als Informationsverarbeitung und die Bedeutung von Personen- und Situationsmerkmalen

Chair(s): Katharina Loibl (PH Freiburg), Timo Leuders (PH Freiburg), Tobias Dörfler (PH Heidelberg)

DiskutantIn(nen): Detlev Leutner (Universität Duisburg-Essen, Deutschland)

Diagnostizieren gilt als eine wesentliche Tätigkeit von Lehrkräften: Eine zutreffende Einschätzung über das Wissen, die Motivation oder das Denken der Schülerinnen und Schüler ist Voraussetzung für das Feedback an Lernende oder Eltern, für Übergangsentscheidungen und für die Anpassung des Unterrichts (z. B. Artelt & Gräsel, 2009; Baumert & Kunter, 2013; Glock, Krolak-Schwerdt & Pit-Ten Cate, 2015; Helmke, 2010; Hobfoll, Halbesleben, Neveu & Westman 2018; Praetorius, Berner, Zeinz, Scheunpflug & Dresel, 2013). Das Wissen und die Fähigkeiten der Lehrkräfte, die für die Vorbereitung, Durchführung und Reflexion von Beurteilungen – ob formal oder informell, formativ oder summativ – erforderlich sind, werden unter dem Oberbegriff diagnostische Kompetenz zusammengefasst (Herppich et al., 2018; Popham, 2009; Schrader, 2009; Weinert, Schrader & Helmke, 1990). Die meisten Forschungsarbeiten zur diagnostischen Kompetenz von Lehrkräften zielen darauf ab, den Einfluss verschiedener situativer Faktoren (z. B. der untersuchten Lerngruppe, des Leistungsniveaus der Schüler(innen) oder der Aufgabenschwierigkeiten) einerseits oder der Eigenschaften von Lehrpersonen (z. B. Alter der Lehrkraft, Berufserfahrung oder Fachwissen) andererseits auf die Urteilsgenauigkeit zu analysieren (für einen Überblick siehe Südkamp Kaiser & Möller, 2012). Andere Ansätze sind an der Untersuchung des breiten Spektrums von Lehrkräfteaktivitäten im Zusammenhang mit der Diagnose interessiert (z. B. Black & Wiliam, 2003; Herppich et al., 2018). Der Forschungsstand zum diagnostischen Urteilen wird in den Bildungs­wissen­schaften jedoch als unbefriedigend angesehen, da bisher noch keine überzeugenden Theorien über die kognitiven Prozesse beim Diagnostizieren aufgestellt wurden (Schrader, 2009; Spinath, 2005; Leuders, Dörfler, Leuders & Philipp, 2018; Herppich et al., 2018). Für das Verständnis der Genese eines Urteils scheint es entscheidend zu sein, welche Informationen in der Diagnosesituation von einer Lehrkraft wahrgenommen werden und wie diese Informationen (mehr oder weniger wissensbasiert) verarbeitet werden. Überraschen­derweise ist bislang nur wenig über den Informationsverarbeitungsprozess von Lehrkräften bekannt.

Als theoretische Basis für Forschungsansätze, die Informationsverarbeitung von Lehrkräften als kognitive Erklärung untersucht, wurde ein Rahmenmodell entwickelt, genannt DiaCoM (Explaining Teachers’ Diagnostic Judgements by Cognitive Modeling;). Das DiaCoM-Rahmenmodell konzeptualisiert diagnostisches Urteilen in Bildungskontexten als Schlussfolgern einer Lehrkraft über Schüler(innen) (z. B. deren Fähigkeit) oder über Anforderungen (z. B. Aufgabenschwierigkeiten) auf der Grundlage der Informationen, die durch eine diagnostische Situation definiert werden. Es bezieht sich somit auf Theorien der kognitiven Informationsverarbeitung. Dabei bietet das DiaCoM-Rahmenmodell einen theoretischen und forschungsstrategischen Rahmen für die Spezifikation von Situationscharakteristika (SC), Personencharakteristika der Lehrpersonen (PC), Prozessen der Informationsverarbeitung als diagnostisches Denken (DD) und diagnostischem Verhalten (DV). Diese Spezifikationen ermöglichen die experimentelle Überprüfung von Annahmen zur Genese diagnostischer Urteile. Im Symposium beziehen sich alle Beiträge auf das Rahmenmodell. Die Beiträge zeigen auf, wie die Spezifikation des diagnostischen Denkens als konkrete kognitive Prozesse der Verarbeitung von Informationen (DD), der Diagnosesituation hinsichtlich wahrnehmbarer Informationen (SC) und der diagnoserelevanten Personeneigenschaften über konkrete Wissenselemente und psychische Zustände(PC) erlaubt, Vorhersage des diagnostischen Verhaltens (DV) in Form überprüfbarer Hypothesen aufzustellen und zu untersuchen.

Der erste Beitrag testet den Prozess der Wahrnehmung schwierigkeitsgenerierender Merkmale (DD) als Voraussetzung für genaue Urteile (DV) mittels Eyetracking. Als Situationscharakteristik (SC) wurden Aufgaben generiert, die sich in ihren schwierigkeitsgenerierenden, visuell wahrnehmbaren Merkmalen unterscheiden.

Der zweite Beitrag untersucht in einem Experiment den Einfluss von Stress (PC) auf Blickbewegungen bei der Wahrnehmung (DD) und Einschätzung (DV) von Aufgabenschwierigkeiten (SC).

Der dritte Beitrag unterscheidet die Wahrnehmung und Gewichtung (DD) von relevanten und irrelevanten Merkmalen (SC) bei der Einschätzung von Aufgabenschwierigkeiten (DV) mit und ohne spezifischem fachdidaktischem Wissen (PC).

Der vierte Beitrag untersucht die unterschiedliche Wahrnehmung und Interpretationen (DD) von fachlichen und instruktionalen Merkmalen (SC) in einem within-subject Design. Spezifische Aspekte des fachdidaktischen Wissens (PC) werden bei Lehrkräften mit und ohne Berufserfahrung (PC) als potentiell moderierende Faktoren berücksichtigt.

 

Beiträge des Symposiums

 

Diagnoseprozesse der Schwierigkeitseinschätzung von Mathematikaufgaben – eine Analyse von Blickbewegungen

Kirsten Brunner, Andreas Obersteiner, Timo Leuders
PH Freiburg

Theoretischer Hintergrund und Ziel der Studie

Eine für die Unterrichtsgestaltung wesentliche Facette diagnostischer Kompetenz ist die Fähigkeit, fachdidaktisches Wissen zu nutzen, um die Schwierigkeiten von (Mathematik-)Aufgaben korrekt einzuschätzen. Bisherige Studien fokussierten dabei zumeist auf die Qualität diagnostischer Urteile (Karst, 2012; McElvany et al., 2009; Schrader, 1989). Hingegen ist über die zugrundeliegenden Diagnoseprozesse und insbesondere über die Rolle der Wahrnehmung relevanter Aufgabenmerkmale bislang wenig bekannt. Ostermann, Leuders, and Nückles (2017) konnten zeigen, dass sich Einschätzungen von Aufgabenschwierigkeiten nach einer fachdidaktischen Intervention verbessern. Unbekannt ist jedoch, ob tatsächlich das verstärkte Wahrnehmen der relevanten Aufgabenmerkmale für die verbesserten Einschätzungen verantwortlich war.

Hier setzt die vorliegende Studie an. Sie hat zum Ziel, den Prozess der diagnostischen Urteilsfindung (vgl. diagnostisches Denken DD im DiaCoM-Rhamenmodell) im Fach Mathematik, insbesondere Prozesse des Wahrnehmens und Interpretierens, in Abhängigkeit von der Urteilsgenauigkeit zu beschreiben. Ausgehend von der Eye-Mind-Hypothese (Just & Carpenter, 1976), welche besagt, dass Menschen hauptsächlich die Informationen verarbeiten, die sie gerade mit dem Auge fixieren, gehen wir davon aus, dass sich die Qualität der Wahrnehmung und Interpretation relevanter Aufgabenmerkmale in den Augenbewegungen widerspiegelt (vgl. diagnostisches Denken DV im DiaCoM-Rahmenmodell). In diesem Beitrag gehen wir der Frage nach, ob es gelingt konsistente Muster im Blickverhalten angehender Mathematiklehrkräfte zu identifizieren. Wir erwarten, dass genauere Einschätzungen mit längeren Blickzeiten auf relevante Merkmale einhergehen.

Methode

Es wurden 20 Aufgaben zu Funktionsgraphen konzipiert, deren Schwierigkeitsgrade sich auf Grund visuell wahrnehmbarer Merkmale unterscheiden. „Schwierige“ Aufgaben adressieren hierbei jeweils einen typischen und in der mathematikdidaktischen Literatur gut dokumentierten Schülerfehler (Hattikudur et al., 2012; Nitsch, 2015). „Leichte“ Aufgaben sind inhaltlich vollständig parallel konzipiert, enthalten aber nicht das für den jeweiligen Schülerfehler relevante Merkmal. Die zunächst theoretisch begründete Unterscheidung in „schwierige“ und „leichte“ Aufgaben wurde an einer Stichprobe von N = 110 Schüler*innen validiert. Erwartungskonform waren die mittleren Lösungsraten für schwierige Aufgaben signifikant niedriger (M = 34%, SD = 14) als die der leichten Aufgaben (M = 98%, SD = 2), t(18) = -8.55, p < 0.001, d = 0.81. Die Aufgaben wurden Studierenden des Lehramts Mathematik zur Einschätzung des Schwierigkeitsgrades vorgelegt. Zum gegenwärtigen Zeitpunkt liegen Daten von N = 48 Proband*innen vor. Die Aufgabe der Teilnehmenden war es, nacheinander den Schwierigkeitsgrad der Aufgaben auf einer Skala von 1 (sehr leicht) bis 4 (sehr schwer) zu beurteilen. Die Aufgaben wurden auf einem Bildschirm gezeigt. Während der Einschätzung wurden die Blickbewegungen mit einem Eyetracker aufgezeichnet. Nach jeder Einschätzung wurden die Teilnehmenden gebeten, ihre Urteile zu begründen.

Ergebnisse

Die bisherigen Analysen zeigen, dass der Schwierigkeitsgrad der „schwierigen“ Aufgaben auch signifikant höher eingeschätzt wurde (M = 2.4, SD = .41) als der der „leichten“ Aufgaben (M = 1.44, SD = .43), t(18) = -4.07, p = .001. In den Begründungen nannten allerdings lediglich 5% der Teilnehmenden den jeweils relevanten Fehlertyp, was auf unzureichendes fachdidaktisches Wissen hindeutet. In den Blickbewegungen zeigte sich, dass Aufgaben, welche den Fehlertyp „Steigung-Höhe-Verwechslung“ provozierten signifikant länger betrachtet wurden, als Aufgaben welche keinen der typischen Schülerfehler provozierten t(7) = -2.074, p = 0,039. Dies sehen wir als ersten Hinweis dafür, dass sich die Wahrnehmung der schwierigkeitsgenerierenden Merkmale in den Blickbewegungen widerspiegelt. In weiteren Analysen soll geprüft werden, ob genauere Urteile und bessere Begründungen für die Urteile mit längeren Fixationszeiten auf relevante Aufgabenmerkmale einhergehen. Hierbei soll die Qualität des Wahrnehmens als die relative Länge der Fixationszeiten auf den relevanten Aufgabenmerkmalen operationalisiert werden. Die Ergebnisse dieser Analysen werden auf der Tagung vorgestellt. Die Identifizierung dieser Muster ist ein erster Schritt zu einem besseren Verständnis dafür, wie (angehende) Lehrpersonen ihr fachdidaktisches Wissen zu typischen Schülerfehlern nutzen, um die Schwierigkeit von Mathematikaufgaben richtig einzuschätzen und somit passgenaue Aufgaben für Schüler*innen auszuwählen.

 

Der Einfluss von Stress auf Blickbewegungen bei der Wahrnehmung und Einschätzung von Aufgabenschwierigkeiten

Sara Becker1, Birgit Spinath2, Beate Ditzen3, Tobias Dörfler1
1PH Heidelberg, 2Universität Heidelberg, 3Universitätsklinikum Heidelberg

Theoretischer Hintergrund

Zentrales Anliegen der Studie war es, den situativen Einfluss von Stress auf Blickbewegungen sowie damit einhergehende diagnostische Urteilsprozesse während des Wahrnehmens und Beurteilens von Mathematikaufgaben zu untersuchen. Akkurate Schwierigkeitseinschätzungen von Aufgaben, als Teil situativ tragfähiger Diagnosen einer Lehrperson, finden nicht nur in der Unterrichtsvorbereitung, sondern auch in realen Unterrichtssituationen statt. In realen Unterrichtssituationen diagnostizieren Lehrkräfte jedoch oftmals unter Zeitdruck oder aufgrund der hohen Arbeitsbelastung unter psychischer Anspannung (Fidler, 2004). Dennoch besteht wenig empirische Evidenz zum möglicherweise verzerrenden Effekt situationsabhängiger Zustände, wie Stress, auf das diagnostische Denken sowie die Urteilsbildung.

Zahlreiche Befunde legen nahe, dass insbesondere psychische Anspannungen, wie Stress, kognitive Kapazitäten binden, die aufgrund der begrenzten Arbeitsgedächtniskapazität nicht mehr für die analytische Urteilsbildung zur Verfügung stehen (Chen & Chaiken, 1999). Es wird angenommen, dass die Lehrkräfte unter Stresserleben daher offensichtliche Aufgabenmerkmale für ihre Urteilsbildung fokussieren. Der Einfluss von Stress auf die Urteilsbildung kann anhand von Eyetracking-Daten nachvollzogen werden. Es wird angenommen, dass insbesondere Blickbewegungsdaten, die als Maß für kognitive Verarbeitung angesehen werden können, unter Stresserleben Veränderungen aufzeigen. Unter anderem wird daher für die Teilnehmenden unter Stresseinfluss eine kürzere Fixationsdauer, als Maß für die kognitive Verarbeitung, sowie eine geringere Anzahl von Fixationen ab einer Länge von 250 ms, die einen tiefergehenden und analytischeren Prozess widerspiegeln (Deubel, 2008), erwartet.

Retrospektive Verbalprotokolle helfen, die Eyetracking-Daten stringenter auszuwerten (Philipp, 2018). Sie ermöglichen Rückschlüsse auf das diagnostische Denken (König et al., 2016). Es wird erwartet, dass Teilnehmende unter Stresseinfluss insgesamt weniger diagnoserelevante Aufgabenmerkmale für ihr diagnostisches Urteil berücksichtigen, sowie mehr oberflächlich erkennbare Aufgabenmerkmale nennen. Die in Untersuchungen durchgeführten Messungen des Stresshormons Cortisol können als objektiver Indikator für eine zugrundeliegende Stressreaktion des Individuums angesehen werden (Kirschbaum & Hellhammer, 1999).

Methode

Eine experimentelle Eyetracking-Studie, basierend auf einem fachdidaktischen Mathematiktest, wurde mit 64 Mathematiklehramtsstudierenden (Alter: M=22.72, SD=4.16, 73 % Frauen) der Pädagogischen Hochschule Heidelberg durchgeführt. Die Teilnehmenden der Experimentalgruppe (n=33) wurden im Gegensatz zur Kontrollgruppe vor der Diagnoseaufgabe zusätzlich mithilfe des Sozialevaluativen Kaltwasserstresstests (engl. 'social evaluated cold-pressor test', SECPT) künstlich gestresst (Schwabe, Haddad & Schachinger, 2008). Anhand der Analyse von insgesamt vier Speichelproben wurde das Stressniveau der Teilnehmenden objektiv mithilfe des Stresshormons Cortisol erfasst. Der so erfasste Stress fungierte als Moderator der Diagnosegüte.

Das diagnostische Verhalten der Teilnehmenden bestand in der Einschätzung von Textaufgaben im Bereich der Bruchrechnung hinsichtlich der Schwierigkeit für Realschülerinnen und schüler Ende Klassenstufe 6 beziehungsweise Anfang Klassenstufe 7. Die Aufgaben variierten in der Auffälligkeit der schwierigkeitsgenerierenden Aufgabenmerkmale. Die Blickbewegungen während der Diagnosetätigkeit wurden mithilfe des Eyetrackings dokumentiert und anhand globaler Maße analysiert. Die Blickbewegungen dienten als Indikatoren des zugrundeliegenden diagnostischen Denkens. Retrospektive Verbalprotokolle gaben Auskunft über die Interpretation der wahrgenommenen Aufgabenmerkmale während des diagnostischen Denkens und über die Interpretation der Relevanz für das diagnostische Urteil.

Ergebnisse und Diskussion

Die Ergebnisse der Blickbewegungsanalysen zeigten unter anderem signifikant kürzere Fixationsdauern bei der Experimentalgruppe, als Maß für die kognitive Verarbeitung, (t(62)=1.79, p=.038) mit einer mittleren Effektstärke d=.45 (Cohen, 1988). Eine signifikant geringere mittlere Anzahl an Fixationen ab einer Dauer von 250 ms, ab der eine metakognitive Verarbeitung möglich ist (Deubel, 2008), konnte innerhalb der Experimentalgruppe im Vergleich zur Kontrollgruppe aufgezeigt werden (t(62)=1.86, p=.033). Die Effektstärke lag bei d=.46. Die Auswertung der Verbalprotokolle ergab, dass insbesondere mathematische Aspekte, im Vergleich zu sprachlichen Aspekten als schwierigkeitsgenerierend eingestuft wurden. Über alle Aufgaben hinweg wurden sowohl mathematisch als auch sprachlich schwierigkeitsgenerierende Aufgabenmerkmale signifikant häufiger von der Kontrollgruppe als von der Experimentalgruppe genannt und in ihrem diagnostischen Verhalten berücksichtigt.

Anhand der Eyetracking-Daten konnte zusammenfassend festgestellt werden, dass die Stressinduktion Einfluss auf Wahrnehmungsprozesse einer Aufgabe ausübt. Die Auswertung der Verbalprotokolle zeigte, dass insbesondere die Interpretation der wahrgenommenen Aufgabenmerkmale sowie das diagnostische Denken durch die Stressinduktion negativ beeinflusst wurden.

 

Kognitive Prozesse bei der Einschätzung von Aufgabenschwierigkeit - Einflüsse von Wissen und Zeitdruck

Andreas Rieu, Katharina Loibl, Timo Leuders
PH Freiburg

Theoretischer Hintergrund

Das Auswählen von Aufgaben ist eine zentrale Aktivität von Lehrkräften im Rahmen der adaptiven Anpassung des Unterrichts auf die Lernvoraussetzungen einer Lerngruppe (Beck, E., Baer, M., Guldimann, T., Bischoff, S., Brühwiler, C., Müller, P., & Vogt, F., 2008). Dabei stellt die Aufgabenschwierigkeit neben anderen ein Kriterium für die Auswahl dar (Neubrand, Jordan, Krauss, Blum, & Löwen, 2011).

Um die Aufgabenschwierigkeit einzuschätzen, kann in Anlehnung an Prozessmodelle des diagnostischen Urteilens (Loibl, Leuders, & Dörfler, subm.) angenommen werden, dass die Lehrkraft bei dieser Tätigkeit Aufgabenmerkmale zunächst identifiziert und anschließend entscheidet, ob diese relevanten Einfluss auf die Lösungshäufigkeit haben. Für diese Entscheidung benötigen sie fachdidaktisches Wissen über gegenstandsspezifische Schülerkognitionen (knowledge about content and students, Ball, Thames, & Phelps, 2008), konkret über den Einfluss von Aufgabenmerkmalen auf Schülerschwierigkeiten bei der Aufgabenbearbeitung.

Fragestellung

In der vorliegenden Studie sollen durch die systematische Variation von Faktoren in der Diagnosesituation (Aufgabenmerkmale, verfügbare Zeit) und der diagnostizierenden Person (spezifisches fachdidaktisches Wissen) die Einflüsse der situativen und der personalen Charakteristika auf das diagnostische Denken untersucht werden.

Anhand der Urteile der befragten Personen sollen die Annahmen über die kognitiven Prozesse der Identifizierung und der Gewichtung der Aufgabenmerkmale empirisch geprüft werden. Dies geschieht anhand der Fragestellungen: Erhöht die Vermittlung von fachdidaktischem Wissen durch die verbesserte Identifizierung und Gewichtung die Urteilsakkuratheit? Wirkt sich eine Zeitrestriktion vor allem negativ auf die (komplexere) Gewichtung von Aufgabenmerkmalen aus?

Methode

Die Grundlage für die Aufgabeneinschätzung bildet ein Pool mit Additions- und Subtraktionsaufgaben aus der Bruchrechnung, die die Aufgabenmerkmale der Bruchbeziehung, der Bruchdarstellung und des Operationsverständnisses variieren und welche für die empirische Lösungshäufigkeit von Lernenden der 6. und 7. Klasse (N=203) im Vorfeld gelöst wurden. Diese Aufgaben wurden in einer experimentellen Versuchsanordnung angehenden Mathematiklehrkräften (N=212) in paarweisen Vergleichen zur Einschätzung der Aufgabenschwierigkeit vorgelegt. Zur Untersuchung des Einflusses der personalen Charakteristika auf das Urteilsverhalten wurde eine Gruppe zufällig zur Experimentalgruppe definiert und erhielt eine domänenspezifische fachdidaktische Kurzintervention im Bereich der schwierigkeitsgenerierenden Merkmale. Hinsichtlich des Einflusses der situativen Merkmale wurden die Einschätzungen beider Gruppen anschließend an zwei Messzeitpunkten (unter Zeitdruck und ohne Zeitdruck) erhoben. Zur Unterscheidung der angenommenen kognitiven Prozesse wurden die sich gegenüberstehenden Aufgaben entweder in nur einem (zur Identifizierung der Merkmale) oder in zwei gegenläufig ausgeprägten Merkmalen (zu deren Gewichtung) unterschieden.

Ergebnisse

Der Einfluss von spezifischem fachdidaktischen Wissen auf die Urteilsprozesse zeigt sich in einem Gruppenvergleich der Experimentalgruppe mit der Kontrollgruppe. Die Varianzanalyse mit Messwiederholung bezüglich der allgemeinen mittleren Urteilsgüte zeigt, dass die Urteile unter Verwendung des spezifischen Wissens signifikant besser sind (F(1,148)=59.463, p≤.001).

Der situative Einfluss durch die Zeitrestriktion der einzelnen Gruppen unterteilt nach den Messzeitpunkten zeigt, dass die Kontrollgruppe selbst unter Bereitstellung von ausreichend Zeit ihr Urteilverhalten nicht signifikant verbessern kann (F(1,64)=.633, p=.429 ƞ²=.010). Die Experimentalgruppe konnte ihre mittlere Urteilsakkuratheit ohne Zeitdruck noch steigern (F(1,84)=5.659, p=.020, ƞ²=.063). Die Interaktion der beiden Einflussfaktoren Wissen und Zeit ist damit signifikant (F(1,148)=4.701, p=.032, ƞ²=.031) und bedeutet, dass die Anwendung des vermittelten Wissens unter Verwendung von ausreichend Zeit die Urteilsakkuratheit zusätzlich steigert.

Die Trennung der kognitiven Prozesse konnte über die beschriebene Verwendung von unterschiedlich konzeptionierten Aufgabenvergleichen operationalisiert werden. Eine Varianzanalyse mit Messwiederholung zeigt, dass sich die Wissensvermittlung signifikant auf die Verbesserung der Identifizierung (F(1,226)=4.120, p=.044, ƞ²=.018) und Gewichtung (F(1,119)=12.127, p=.001, ƞ²=.092) von Aufgabenmerkmalen auswirkt. Bei der Bestimmung des Einflusses von Zeitrestriktion zeigt sich, dass nur der Gewichtungsprozess ausreichend Zeit benötigt (F(1,119)=3.917, p=.050, ƞ²=.032), die Identifizierung von Aufgabenmerkmalen aber nicht anfällig auf Zeitdruck ist (F(1,226)=1.923, p=.679, ƞ²=.001). Dieses Ergebnis unterstützt die Annahme, dass diagnostische Urteile durch zwei unterscheidbare informationsverarbeitende Prozesse zustande kommen.

Die vorliegende Studie generiert sowohl einen empirischen Beitrag zur Beforschung der kognitiven Urteilsprozesse als auch Kenntnisse über wirksame Inhalte der Lehrerausbildung im Bereich der diagnostischen Kompetenzen.

 

Diagnostische Urteile zur Schwierigkeit von Mathematikaufgaben: Einfluss von fachlichen und instruktionalen Aufgabenmerkmalen auf die kognitiven Prozesse der Urteilsfindung

Saskia Schreiter, Markus Vogel, Markus Rehm, Tobias Dörfler
PH Heidelberg

Theoretischer Hintergrund und Fragestellung

Die Auswahl und Modifikation von Mathematikaufgaben setzen bei Lehrkräften eine adä-quate Einschätzung von Aufgabenschwierigkeiten voraus. Neben der Komplexität des ma-thematischen Inhalts (z. B. Addition gleichnamiger vs. ungleichnamiger Brüche) wird die Schwierigkeit von Aufgaben unter anderem auch von instruktionalen Merkmalen bestimmt, die gemäß der Cognitive Load Theorie (CLT) die kognitive Belastung von Lernenden beim Lösen der Aufgabe beeinflussen (z. B. split-attention vs. integrated format; Sweller, Ayres, & Kalyuga, 2011). Studien zur Urteilsgenauigkeit belegen, dass Lehrkräfte sich bei der Einschätzung der Aufgabenschwierigkeit insensitiv gegenüber dem Instruktionsdesign zei-gen (Hellmann & Nückles, 2013). Weiterhin weisen Studien darauf hin, dass die Genauig-keit des Urteils von bestimmten Personencharakteristika (z. B. fachdidaktisches Wissen) beeinflusst wird (Ostermann, Leuders, & Nückles, 2017). Wenig bekannt ist bisher über die kognitiven Prozesse, die diagnostischen Urteilen zugrunde liegen (Leuders, Dörfler, Leuders, & Philipp, 2018). Aufbauend auf den Ergebnissen und dem methodischen Design der Studie von Hellmann & Nückles (2013), fokussiert der vorliegende Beitrag die Wahr-nehmung und Verarbeitung (Loibl, Leuders, & Dörfler, subm.) von fachlichen und instruk-tionalen Aufgabenmerkmalen beim Diagnostizieren der Aufgabenschwierigkeit. Konkret werden die folgenden drei Forschungsfragen gestellt: 1. Welche schwierigkeitsgenerieren-den Aufgabenmerkmale (fachliche vs. instruktionale) werden von Lehrkräften beim Diag-nostizieren der Aufgabenschwierigkeit wahrgenommen und verarbeitet? 2. Besteht ein Zu-sammenhang zwischen spezifischen Aspekten des Pedagogical Content Knowledge (PCK)/Pedagogical Knowledge (PK) und der Wahrnehmung und Verarbeitung von Aufga-benmerkmalen? 3. Unterscheiden sich Lehrkräfte mit Berufserfahrung von Lehramtsstu-dierenden bezüglich der Wahrnehmung und Verarbeitung von Aufgabenmerkmalen?

Methode

Im Diagnosetest werden sechs Aufgaben aus dem Bereich der Bruchrechnung hintereinan-der präsentiert. In einem within-subject Design sind schwierigkeitsgenerierende Merkmale systematisch variiert: Im Bereich der Bruchrechnung durch Adaption des Schwierigkeits-grades (Padberg & Wartha 2017) und im Bereich des Instruktionsdesigns gemäß ausge-wählter Gestaltungsempfehlungen der CLT. Zu jeder Aufgabe werden drei Arten des diag-nostischen Verhaltens erfasst: Einschätzung der Lösungshäufigkeit (DV1), Begründung, was die Aufgabe leicht oder schwer macht (DV2) und Modifikation der Aufgabe zur Än-derung der Schwierigkeit (DV3). Die systematische Variation der Aufgabenmerkmale er-möglicht, von dem konkret erhobenen diagnostischen Verhalten Rückschlüsse auf die wahrgenommenen und verarbeiteten Aufgabenmerkmale zu ziehen. Im anschließenden PCK/PK Test wird die spezifische Wissensausprägung zu schwierigkeitsgenerierenden Aufgabenmerkmalen (Bruchrechnung und Instruktionsdesign) erfasst. Hierfür werden zwei Aufgaben, die sich nur in einem schwierigkeitsgenerierenden Merkmal unterscheiden, di-rekt nebeneinander präsentiert und die Einschätzung der schwierigeren Aufgabe erhoben. Um einen potentiellen Einfluss der Berufserfahrung zu untersuchen, wurde die Studie mit 35 praktizierenden Lehrkräften (Gymnasien, Real- und Gemeinschaftsschulen) und 55 Lehramtsstudierenden durchgeführt.

Ergebnisse

Die Ergebnisse zeigen, dass sowohl Lehrkräfte als auch Studierende überwiegend die Schwierigkeit des mathematischen Inhalts wahrnehmen, jedoch kaum die Schwierigkeit, die vom Instruktionsdesign ausgeht. Die drei erhobenen diagnostischen Verhaltensweisen lassen darauf schließen, dass die Teilnehmenden beim Diagnostizieren stets signifikant mehr fachliche als instruktionale Aufgabenmerkmale wahrgenommen und verarbeitet ha-ben (DV1: t(89) = 10.76, p < .001, d = 1.62 ; DV2: t(89) = 12.60, p < .001, d = 1.74; DV3: t(89) = 8.64, p < .001, d = 1.45). Unterschiede zwischen Studierenden und Lehrkräften konnten bei bei der Begründung der Aufgabenschwierigkeit (DV2) in Form eines Interakti-onseffektes festgestellt werden (F(1,88) = 4.46, p < .05, partielles η2 = .048). Entgegen der Erwartung zeigen die Ergebnisse, dass die Teilnehmenden über ein vergleichbar hohes PCK/PK bzgl. schwierigkeitsgenerierender Aufgabenmerkmale im Bereich der Bruchrech-nung (M = .74, SD = .33) und des Instruktionsdesigns (M = .73, SD = .28) verfügen. Diese Ergebnisse werfen die Frage auf, warum (angehende) Lehrkräfte bei der Schwierigkeitsein-schätzung von Aufgaben kaum instruktionale Merkmale wahrnehmen, obwohl sie über ein ausgeprägtes PK in diesem Bereich verfügen? Ausgehend von den vorliegenden Ergebnis-sen wird eine weitere Studie zur Untersuchung möglicher Erklärungsansätze geplant.