SSRE-SSFE-congrès annuel 2026
17-19 Juin 2026
Haute école pédagogique de Saint-Gall
Programme de la conférence
Vue d’ensemble et détails des sessions pour cette conférence. Veuillez sélectionner une date ou un lieu afin d’afficher uniquement les sessions correspondant à cette date ou à ce lieu. Cliquez sur une des sessions pour obtenir des détails sur celle-ci (avec résumés et téléchargement si disponibles).
|
Daily Overview |
| Session | ||
SES_23: L'évaluation formative dans l'enseignement des mathématiques
| ||
| Présentations | ||
10:00 - 10:30
Wirkungen einer Weiterbildung zu Peer- und Self-Assessment: Die vermittelnde Rolle des mathematischen Professionswissens auf das mathematische Lernen der Schüler:innen 1Pädagogische Hochschule Zürich, Schweiz; 2Pädagogische Hochschule Luzern, Schweiz Theoretischer Hintergrund Formatives Assessment dient der fortlaufenden Erhebung des Lernstandes, um Lehr- und Lernprozesse gezielt zu optimieren. Es ergänzt das summative Assessment, das Lernen am Ende eines Lernprozesses bilanziert. Peer- und Self-Assessment gelten dabei als zwei Kernstrategien des formativen Assessments, denen ein hohes Potenzial für das Lernen zugeschrieben wird. Beide Strategien betonen die aktive Rolle der Lernenden als (Ko-)Konstrukteur:innen ihres Lernens, indem sie anhand transparenter, inhaltsbezogener Lernziele und Erfolgskriterien Arbeiten beurteilen, Feedback geben und den eigenen Lernstand reflektieren. Empirische Übersichtsarbeiten zeigen, dass belastbare Studien zur Wirksamkeit des Peer- und Self-Assessments im Fach Mathematik fehlen. Zudem zeigen videobasierte Beobachtungsstudien, dass Peer- und Self-Assessment im Mathematikunterricht mit geringer Qualität umgesetzt werden. Lehrpersonen regen Reflexion selten an und fördern den Austausch über Lernprozesse nur eingeschränkt. Dies verdeutlicht den hohen Professionalisierungsbedarf zur Unterstützung von Peer- und Self-Assessment, da dessen lernwirksame Umsetzung maßgeblich von der Lehrperson abhängt. Sie konzeptualisiert Lernziele und Kriterien, plant den formativen Beurteilungsprozess, leitet Lernende an und unterstützt deren Reflexion. Dazu benötigt sie neben pädagogischem Fachwissen auch fachliches und fachdidaktisches Professionswissen zum Lerngegenstand, der formativ beurteilt wird. Fragestellung Im Forschungsprojekt FORMA („Formatives Assessment im Mathematikunterricht der Primarschule“, SNF Nr. 212762) wird die Umsetzung von Peer- und Self-Assessment am Lerngegenstand der Multiplikations- und Divisionsstrategien untersucht, einem zentralen Lernziel der 4. und 5. Primarstufe nach Lehrplan 21. Der vorliegende Beitrag fokussiert auf folgende Fragen:
Forschungsdesign und -methode Ausgehend von der Erkenntnis, dass die lernwirksame Umsetzung von Peer- und Self-Assessment maßgeblich vom Professionswissen der Lehrperson abhängt, entwickelte das FORMA-Projekt eine achtstündige Weiterbildung, die unter anderem auf den Aufbau mathematikdidaktischen Professionswissens fokussiert. Thematisiert wurde fachliches und fachdidaktisches Professionswissen zu Multiplikations- und Divisionsstrategien, typischen Fehlern sowie zur Gestaltung und Begleitung von Peer- und Self-Assessment im Mathematikunterricht. Die Weiterbildung kombiniert Videoanalysen, Fallbeispiele und kollegiale Unterrichtsplanung. Zur empirischen Untersuchung wurden in einer randomisierten Kontrollstudie N = 96 Lehrpersonen mit je einer Klasse der Interventionsgruppe Peer-Assessment (n = 28), Interventionsgruppe Self-Assessment (n = 29) oder der Wartekontrollgruppe (n = 39) zugeteilt. Alle Lehrpersonen führten eine Unterrichtseinheit zu Multiplikation und Division durch (M = 12 Lektionen). Lehrpersonen der Interventionsgruppen setzten Peer- bzw. Self-Assessment randomisiert gemäß Zuteilung um; die Kontrollgruppe gestaltete das Assessment frei. Das Professionswissen der Lehrpersonen wurde im Prä-Post-Design erhoben. Es umfasste im mathematischen Teil fachliches und fachdidaktisches Wissen zu Rechenstrategien und Fehlern der Multiplikation und Division sowie damit einhergehendes prognostisches Wissen zur eigenen Klasse. Die Leistung der Schüler:innen (N = 1’525) wurde mittels Prä-, Post- und Follow-Up-Tests erfasst. Der mathematische Lernzuwachs der Schüler:innen und das mathematische Professionswissen der Lehrpersonen wurde über die Anzahl unterschiedlicher Rechenstrategien beim Lösen von Multiplikations- und Divisionsaufgaben operationalisiert. Geplante Resultate und Bedeutung Im Referat werden Effekte der Weiterbildung auf das mathematikdidaktische Professionswissen der Lehrpersonen und auf das mathematische Lernen der Schüler:innen unter Berücksichtigung der Mehrebenenstruktur vorgestellt. Zudem wird gezeigt, ob das Professionswissen die Wirkung der Weiterbildung auf das Lernen der Schüler:innen vermittelt (Mediationseffekt). Damit wird die Wirkungskette von der Lehrpersonenweiterbildung über das Professionswissen bis zum Lernzuwachs empirisch in den Blick genommen. Die vorgestellte Studie leistet demnach einen Beitrag zur Professionalisierungsforschung und ihren Wirkmechanismen auf Schüler:innenlernen im Bereich des formativen Assessments und der mathematischen Kompetenzentwicklung. 10:30 - 11:00
Veränderungen der Qualität formativem Peer- und Self-Assessments nach einer Intervention: Ergebnisse einer randomisierten Kontrollstudie 1Pädagogische Hochschule Luezern, Switzerland; 2Pädagogische Hochschule Zürich Theoretischer Hintergrund Formatives Assessment (FA) gilt als zentraler Bestandteil lernwirksamen Unterrichts, da es diagnostische Informationen zum Lernen und den Lernergebnissen erfasst, mit dem Ziel, Lehr- und Lernprozesse zu optimieren (Schütze et al., 2018). Zahlreiche (Meta-)Studien belegen substanzielle positive Effekte von FA auf fachliches wie überfachliches Lernen (z.B. Bellido-García et al., 2024). Gleichzeitig verweisen Beobachtungsstudien auf erhebliche Herausforderungen bei der Umsetzung von formativem Peer- und Self-Assessment (PASA) im Unterricht (Buholzer et al., 2020; Gotwals & Birmingham, 2016). Als zentrale Ursache werden gering ausgeprägte Assessment Literacy der Lehrpersonen diskutiert, also ihr professionelles Wissen und Können, lernförderliche Beurteilungsprozesse umzusetzen (Pastore & Andrade, 2019). Unsere Studie setzt an dieser Forschungslücke an und untersucht, inwiefern ein gezieltes Weiterbildungsprogramm die Assessment Literacy und dadurch die Qualität der PASA-Umsetzung verbessern kann. Trotz theoretisch vielversprechender Ansätze bleibt offen, inwiefern erweitertes Wissen tatsächlich zu nachhaltig höherer PASA-Qualität führt. Entsprechend zielte die Weiterbildung darauf ab, das Wissen zu PASA gezielt zu erweitern, sodass sich dieses in einer höheren Umsetzungsqualität im Unterricht zeigt. Fragestellung Die vorliegende Teilstudie untersucht:
Forschungsdesign und -methode Beim vorliegenden Projekt handelt es sich um eine Teilstudie des SNF-Projekts FORMA «Formatives Assessment in Mathematikunterricht» (Nr. 100019_212762). Die Interventionsstudie umfasst N=96 Mathematiklehrpersonen, die zufällig zwei Interventionsgruppen (Peer- bzw. Self-Assessment) und einer Wartekontrollgruppe zugewiesen wurden. Die Weiterbildung bestand aus drei zweistündigen Veranstaltungen mit Vor- und Nachbereitungsaufträgen und kombinierte pädagogisch-psychologische Grundlageninputs zu Gelingensbedingungen formativer PASA mit praxisnahen Umsetzungsbeispielen für den Mathematikunterricht. Zunächst wurden durch das Forschungsteam 96 Mathematiklektionen (zum halbschriftlichen Multiplizieren und Dividieren) systematisch codiert, um den videografierten Unterricht den drei beobachtbaren Phasen formativer Assessmentpraxis «Anleiten», «Begleiten» und «Nutzen» zuzuordnen. Darauf aufbauend wurden unter Einbezug einschlägiger Literatur und empirischer Beispiele ein Itempool sowie abgestufte Niveaubeschreibungen für das Ratinginstrument entwickelt und in Pilotierungs- und Konsensusrunden empirisch geschärft. Die Ratings zeigten exzellente Interraterreliabilitäten (ICC(2,1) = .83–.85; ICC(2,k) = .91–.92). Das finale Ratinginstrument umfasst sieben Dimensionen mit insgesamt 15 Items. Die Items weisen eine vierstufige Skala (0–3) auf. Das assessmentspezifische professionellen Wissen (Assessment Literacy) der Lehrpersonen wurde mit zwei Vignettentests, gemessen (Oeksuez et al., under review). Die Analysen zur Beantwortung der beiden Fragestellungen erfolgen mittels ANOVAs, ANCOVAs und Mediationsanalysen. Resultate und Bedeutung Die vertiefte Auswertung der Videodaten befindet sich derzeit in Bearbeitung. Erste Befunde weisen auf deutliche Qualitätsunterschiede zwischen Interventions- und Wartekontrollgruppe hin. Hinweise zeigen, dass Lehrpersonen der Interventionsgruppen PASA systematischer und als integralen Bestandteil ihres Unterrichts umsetzen, Beurteilungsprozesse expliziter anleiten und die Lernenden kognitiv wie metakognitiv besser begleiten. Zum Zeitpunkt des Kongresses liegen weiterführende Mediationsanalysen vor, die eine statistische Einschätzung der Wirksamkeit des Weiterbildungsprogramms ermöglichen und die bisherigen Trends empirisch fundieren. Die Studie leistet einen wichtigen Beitrag zur empirischen Fundierung formativer Beurteilung in der Primarstufe und zur Schliessung bestehender Forschungslücken. 11:00 - 11:30
Entwicklung und Validierung eines feingranularen Kompetenzmodells für die linearen Funktionen als Grundlage für formatives Assessment Pädagogische Hochschule St.Gallen, Schweiz Theoretischer Hintergrund Die zunehmende Bedeutung von individualisierter Förderung im Unterricht stellt hohe Anforderungen an diagnostische Modelle schulischer Kompetenzentwicklung. Um Lernprozesse gezielt unterstützen zu können, müssen sowohl der aktuelle Lernstand von Schüler:innen als auch mögliche nächste Lernschritte valide bestimmt werden. Ein etablierter Ansatz in diesem Kontext ist die kompetenzbasierte Wissensraumtheorie (CbKST; Albert & Lucas, 1999). CbKST erlaubt die Repräsentation eines Lehrstandes als Menge von beherrschten Kompetenzen innerhalb eines Kompetenzmodells. Da die möglichen Lernstände durch eine sogenannte Vorläuferrelation geordnet werden, können nächste mögliche Lernschritte direkt aus dem Modell identifiziert werden. Das der CbKST-Diagnostik zugrundeliegende Kompetenzmodell bildet den zentralen Bezugsrahmen. In der Literatur werden hierfür zwei zentrale Charakteristika hervorgehoben: Einerseits sollte ein Kompetenzmodell den betrachteten Themenbereich vollständig abdecken (Cosyn et al., 2013). Andererseits hängt der Differenziertheitsgrad der diagnostischen Aussagen von der Feingranularität des zugrunde liegenden Kompetenzmodells ab (Steiner et al., 2026). In dem vom Schweizerischen Nationalfonds geförderten Projekt «Investigating the Spaces and Trajectories in Mathematics Learning» wird eine CbKST-basierte Diagnoseplattform für die linearen Funktionen entwickelt. Ein besonderer Fokus liegt dabei auf der Feingranularität der Diagnostik. Diese soll alle wesentlichen kognitiven Arbeitsschritte abdecken, die Schüler:innen bei dem Arbeiten mit linearen Funktionen durchlaufen. In dem folgenden Beitrag werden sowohl Einblicke in die Entwicklung als auch in die Validierung des zugrundeliegenden Kompetenzmodells gegeben. Dabei werden die folgenden Forschungsfragen adressiert:
Forschungsdesign und -methode Die Identifikation des Kompetenzmodells erfolgte iterativ und kombinierte top-down- und bottom-up-basierte Vorgehensweisen. In einem ersten Schritt wurde auf Grundlage einer Literaturrecherche ein initialer Satz zentraler Kompetenzen im Bereich der linearen Funktionen identifiziert. Diese zunächst breit gefassten Kompetenzbeschreibungen wurden entlang literaturbasierter Kategorien (z. B. kognitive Prozesse, mathematische Darstellungsformen) ausdifferenziert. Anschliessend wurde eine detaillierte Aufgabenanalyse basierend auf einem umfangreichen Itempool zu linearen Funktionen durchgeführt. Die Aufgaben wurden hinsichtlich ihrer kognitiven Arbeitsschritte analysiert und den initialen Kompetenzen zugeordnet, um die inhaltliche Abdeckung, Trennschärfe und Konsistenz des Kompetenzmodells zu prüfen. Basierend darauf wurden Kompetenzen weiter ausdifferenziert, konkretisiert oder neu hinzugefügt. Um die kognitiven Prozesse der Schüler:innen empirisch sichtbar zu machen, wurden Think-aloud Interviews (N=60) mit Schüler:innen durchgeführt, in denen sie drei Aufgaben zu linearen Funktionen bearbeiteten. Die verbalen Protokolle wurden inhaltsanalytisch entlang eines deduktiv entwickelten Kategoriensystems ausgewertet (Kukartz & Rädiker, 2024), um zu untersuchen, welche kognitiven Prozesse bei der Bearbeitung von Aufgaben tatsächlich aktiviert wurden, und inwiefern diese mit den im Modell angenommenen Kompetenzen übereinstimmen. Das dafür verwendete Kategoriensystem setzt sich aus Kompetenzcodes (jede identifizierte Kompetenz wurde als Code definiert), Sondercodes (z. B. «Nicht codierbar») und dem Code «Lücke im Kompetenzmodell» zusammen. Alle Interviews wurden von zwei unabhängigen und speziell geschulten Kodierer:innen mit mathematikdidaktischem Hintergrund kodiert. Resultate Als Ergebnis des Entwicklungsprozesses liegt ein feingranulares Kompetenzmodell für den Themenbereich der linearen Funktionen vor, das 125 Einzelkompetenzen umfasst. Es kann in zehn inhaltliche Subdimensionen (z. B. Steigung, y-Achsenabschnitt), vier Darstellungsformen (z. B. tabellarisch, grafisch) und sechs mathematikbezogene kognitive Prozesse (z. B. Mathematisieren und Modellieren; Linneweber-Lammerskitten & Wälti, 2008) unterteilt werden. Die Auswertung der Think-aloud-Interviews liefert substanzielle Hinweise darauf, dass zentrale Bestandteile des Kompetenzmodells mit den beobachteten kognitiven Prozessen der Schüler:innen übereinstimmen. Im Mittel wurden einer Aufgabe 4,15 Kompetenzen aus dem Kompetenzmodell zugeordnet. Der Code «Lücke im Kompetenzmodell» wurde insgesamt 17-mal vergeben. Dies deutet darauf hin, dass in weniger als 10 Prozent der Aufgabenbearbeitung (es wurden insgesamt 60 mal 3 Aufgaben bearbeitet) kognitive Prozesse auftraten, die nicht durch das Kompetenzmodell abbildbar waren. Diese werden aktuell genauer untersucht. Ausblick In dem Vortrag werden neben den identifizierten Kompetenzen und der Validierungsstrategie auch mögliche Diagnoseanwendungen anhand von simulierten Datensätzen diskutiert. 11:30 - 12:00
Formative Beurteilungspraktiken von Lehrpersonen - Empirische Überprüfung einer Teildimension von «Assessment Literacy» Pädagogische Hochschule St. Gallen, Schweiz Theoretischer Hintergrund Die formative Beurteilung ist eine zentrale Dimension von Unterrichtsqualität (Hattie, 2023; Praetorius et al., 2023). Während summative Beurteilungen gezeigte Leistungen bilanzieren, werden die Schlussfolgerungen bei formativen Beurteilungen für das weitere Lernen der Schüler:innen genutzt (Black & Wiliam, 2018). Diskussionen über formative Beurteilungen gewinnen zunehmend an Bedeutung (Buholzer & Brovelli, 2023). Assessment Literacy (AL) beschreibt die Beurteilungskompetenz von Lehrpersonen als mehrdimensionales, kontextspezifisches und dynamisches Konstrukt (DeLuca et al., 2019; Pastore & Andrade, 2019; Xu & Brown, 2016). Die AL umfasst Wissen, Überzeugungen, Praktiken, sozial-emotionales Management sowie ethische Prinzipien zur Beurteilung. Die Praktiken beinhalten u.a. die fünf formativen Beurteilungsstrategien nach William und Thompson (2008, zit. n. Lötscher et al., 2023, S. 32f):
Diese Strategien ermöglichen die Einbettung formativer Beurteilung in Lehr- und Lernprozesse (Lötscher et al., 2023). Studien weisen jedoch auf Defizite in der Umsetzung der formativen Beurteilungsstrategien (Buholzer et al., 2020) resp. des Feedbacks (Van Der Kleij, 2019) hin. Buholzer et al. (2020) leisten mit einer Videostudie einen zentralen Beitrag zur Erfassung der formativen Beurteilungspraktiken. Für Fragebogen liegen Skalen zur Erfassung der diagnostischen Kompetenz von Lehrpersonen vor (Baumert et al., 2008; Smit, 2009). Auch gibt es Skalen, welche die formativen Beurteilungspraktiken (Lysaght et al., 2017; Veugen et al., 2022) oder mit Feedback einen Teilbereich erfassen (Van Der Kleij, 2019). Derzeit steht jedoch kein geeignetes Messinstrument für die Erhebung formativer Beurteilungspraktiken in Lehrpersonenbefragungen zur Verfügung. In der präsentierten Studie wird ein Messinstrument vorgestellt, welches sich inhaltlich an Wiliam und Thompson (2008) orientiert und die Qualität der einzelnen formativen Beurteilungspraktiken fokussiert (Buholzer et al., 2020; Van Der Kleij, 2019; Veugen et al., 2022; Wemmer-Rogh et al., 2023). Fragestellung Die Studie hat zum Ziel, eine Skala zur Erfassung der formativen Beurteilungspraktiken für Lehrpersonenbefragungen zu entwickeln. Folgende Fragestellung leitet das Vorhaben: Inwiefern erfassen die entwickelten Skalenitems die formativen Beurteilungspraktiken valide und reliabel? Forschungsdesign und -methode Als erster Schritt der Skalenkonstruktion wurde das Konstrukt AL und insbesondere die Beurteilungspraktiken theoretisch geklärt (Hartmann & Reinecke, 2013). Für das Konstrukt Beurteilungspraktiken wurde ein Itempool aus bestehenden und eigenkonstruierten Items generiert. Der Itempool wurde qualitativ pilotiert: Zum einen wurden die Items durch Expert:innen (n=3) aussortiert resp. umformuliert. Anschliessend wurden die Items mithilfe der Think-Aloud-Methode (n=5) auf ihre Verständlichkeit hin getestet (Willis, 2005). Es folgte die quantitative Pilotierung des verbleibenden Itempools: Mit den fünf Strategien der formativen Beurteilung (Wiliam & Thompson, 2008) liegt eine Struktur vor, welche als Faktoren für eine konfirmatorische Faktorenanalyse genutzt werden kann (Floyd & Widaman, 1995; Kopp & Lois, 2014). Die Erprobungsstichprobe bildeten Bachelorstudierende im 5. Semester einer Pädagogischen Hochschule. Die Stichprobe (n=217) entspricht der geforderten Grösse bei einem Itempool von n=37 (Nunnally & Bernstein, 1994). Resultate und deren Bedeutung Die qualitative Pilotierung führte zu einem optimierten Itempool: Einzelne Items wurden gekürzt, präzisiert (z.B. «Lernjournal oder Ähnliches») und aus fach- und allgemeindidaktischer Sicht angepasst (z.B. Unterscheidung von Rückmeldung und Feedbackgespräche). Die Datenanalyse der quantitativen Pilotierung erfolgt zu Beginn des Jahres 2026. Die Überprüfung der Skala «Formative Beurteilungspraktiken» wird die inhaltliche Validität und Reliabilität der Hauptstudie, welche ab Herbst 2026 stattfinden wird, sicherstellen. Die Skalenentwicklung leistet auch einen Beitrag zur Weiterentwicklung des Konstrukts AL. Die Förderung der AL ist ein zentrales Anliegen aktueller Bildungsdiskurse (Becker et al., 2025; Buholzer et al., 2020; Hock, 2021; Südkamp & Praetorius, 2017). In Anlehnung an die Agenda 2023 für Nachhaltige Entwicklung (United Nations, 2015) sollen Beurteilungen verstärkt als Schlüssel für hochwertige Bildung genutzt werden. | ||
