JavaScript désactivé
La fonction JavaScript de votre navigateur est désactivée. Elle doit être activée pour pouvoir utiliser cette fonction du système ConfTool.
Vous trouverez ici la procédure à suivre pour activer JavaScript.
En cas de problème, n’hésitez pas à contacter les organisateurs à l’adresse sgbf2026@phsg.ch.

Programme de la conférence

Vue d’ensemble et détails des sessions pour cette conférence. Veuillez sélectionner une date ou un lieu afin d’afficher uniquement les sessions correspondant à cette date ou à ce lieu. Cliquez sur une des sessions pour obtenir des détails sur celle-ci (avec résumés et téléchargement si disponibles).

Seulement sessions ayant lieu dans la salle

Daily Overview

Session

SES_23: L'évaluation formative dans l'enseignement des mathématiques

Heure:

Vendredi, 19.06.2026:

10:00 - 12:00

Salle: Hadwig - H201

Bâtiment universitaire PHSG, Notkerstrasse 27, St.Gallen

Présentations

10:00 - 10:30

Wirkungen einer Weiterbildung zu Peer- und Self-Assessment: Die vermittelnde Rolle des mathematischen Professionswissens auf das mathematische Lernen der Schüler:innen

Karolin Maskos¹, Andreas Schulz¹, Ladina Brawand¹, Selin S. Oeksuez², Alois Buholzer²

¹Pädagogische Hochschule Zürich, Schweiz; ²Pädagogische Hochschule Luzern, Schweiz

Theoretischer Hintergrund

Formatives Assessment dient der fortlaufenden Erhebung des Lernstandes, um Lehr- und Lernprozesse gezielt zu optimieren. Es ergänzt das summative Assessment, das Lernen am Ende eines Lernprozesses bilanziert. Peer- und Self-Assessment gelten dabei als zwei Kernstrategien des formativen Assessments, denen ein hohes Potenzial für das Lernen zugeschrieben wird. Beide Strategien betonen die aktive Rolle der Lernenden als (Ko-)Konstrukteur:innen ihres Lernens, indem sie anhand transparenter, inhaltsbezogener Lernziele und Erfolgskriterien Arbeiten beurteilen, Feedback geben und den eigenen Lernstand reflektieren.

Empirische Übersichtsarbeiten zeigen, dass belastbare Studien zur Wirksamkeit des Peer- und Self-Assessments im Fach Mathematik fehlen. Zudem zeigen videobasierte Beobachtungsstudien, dass Peer- und Self-Assessment im Mathematikunterricht mit geringer Qualität umgesetzt werden. Lehrpersonen regen Reflexion selten an und fördern den Austausch über Lernprozesse nur eingeschränkt. Dies verdeutlicht den hohen Professionalisierungsbedarf zur Unterstützung von Peer- und Self-Assessment, da dessen lernwirksame Umsetzung maßgeblich von der Lehrperson abhängt. Sie konzeptualisiert Lernziele und Kriterien, plant den formativen Beurteilungsprozess, leitet Lernende an und unterstützt deren Reflexion. Dazu benötigt sie neben pädagogischem Fachwissen auch fachliches und fachdidaktisches Professionswissen zum Lerngegenstand, der formativ beurteilt wird.

Fragestellung

Im Forschungsprojekt FORMA („Formatives Assessment im Mathematikunterricht der Primarschule“, SNF Nr. 212762) wird die Umsetzung von Peer- und Self-Assessment am Lerngegenstand der Multiplikations- und Divisionsstrategien untersucht, einem zentralen Lernziel der 4. und 5. Primarstufe nach Lehrplan 21. Der vorliegende Beitrag fokussiert auf folgende Fragen:

Inwiefern beeinflusst die Teilnahme an der FORMA-Weiterbildung zu Peer- bzw. Self-Assessment das mathematische Professionswissens der Lehrpersonen?
Inwiefern beeinflusst das mathematische Professionswissen das mathematische Lernen der Schüler:innen?
Inwiefern beeinflusst die Teilnahme an der FORMA-Weiterbildung das mathematische Lernen der Schüler:innen?
Vermittelt das mathematische Professionswissen der Lehrpersonen die Wirkung der Weiterbildung auf das mathematische Lernen der Schüler:innen?

Forschungsdesign und -methode

Ausgehend von der Erkenntnis, dass die lernwirksame Umsetzung von Peer- und Self-Assessment maßgeblich vom Professionswissen der Lehrperson abhängt, entwickelte das FORMA-Projekt eine achtstündige Weiterbildung, die unter anderem auf den Aufbau mathematikdidaktischen Professionswissens fokussiert. Thematisiert wurde fachliches und fachdidaktisches Professionswissen zu Multiplikations- und Divisionsstrategien, typischen Fehlern sowie zur Gestaltung und Begleitung von Peer- und Self-Assessment im Mathematikunterricht. Die Weiterbildung kombiniert Videoanalysen, Fallbeispiele und kollegiale Unterrichtsplanung.

Zur empirischen Untersuchung wurden in einer randomisierten Kontrollstudie N = 96 Lehrpersonen mit je einer Klasse der Interventionsgruppe Peer-Assessment (n = 28), Interventionsgruppe Self-Assessment (n = 29) oder der Wartekontrollgruppe (n = 39) zugeteilt. Alle Lehrpersonen führten eine Unterrichtseinheit zu Multiplikation und Division durch (M = 12 Lektionen). Lehrpersonen der Interventionsgruppen setzten Peer- bzw. Self-Assessment randomisiert gemäß Zuteilung um; die Kontrollgruppe gestaltete das Assessment frei.

Das Professionswissen der Lehrpersonen wurde im Prä-Post-Design erhoben. Es umfasste im mathematischen Teil fachliches und fachdidaktisches Wissen zu Rechenstrategien und Fehlern der Multiplikation und Division sowie damit einhergehendes prognostisches Wissen zur eigenen Klasse. Die Leistung der Schüler:innen (N = 1’525) wurde mittels Prä-, Post- und Follow-Up-Tests erfasst. Der mathematische Lernzuwachs der Schüler:innen und das mathematische Professionswissen der Lehrpersonen wurde über die Anzahl unterschiedlicher Rechenstrategien beim Lösen von Multiplikations- und Divisionsaufgaben operationalisiert.

Geplante Resultate und Bedeutung

Im Referat werden Effekte der Weiterbildung auf das mathematikdidaktische Professionswissen der Lehrpersonen und auf das mathematische Lernen der Schüler:innen unter Berücksichtigung der Mehrebenenstruktur vorgestellt. Zudem wird gezeigt, ob das Professionswissen die Wirkung der Weiterbildung auf das Lernen der Schüler:innen vermittelt (Mediationseffekt). Damit wird die Wirkungskette von der Lehrpersonenweiterbildung über das Professionswissen bis zum Lernzuwachs empirisch in den Blick genommen. Die vorgestellte Studie leistet demnach einen Beitrag zur Professionalisierungsforschung und ihren Wirkmechanismen auf Schüler:innenlernen im Bereich des formativen Assessments und der mathematischen Kompetenzentwicklung.

10:30 - 11:00

Veränderungen der Qualität formativem Peer- und Self-Assessments nach einer Intervention: Ergebnisse einer randomisierten Kontrollstudie

Selin S. Oeksuez¹, Alois Buholzer¹, Sandra Zulliger¹, Marco Messina¹, Karolin Maskos², Andreas Schulz²

¹Pädagogische Hochschule Luezern, Switzerland; ²Pädagogische Hochschule Zürich

Theoretischer Hintergrund

Formatives Assessment (FA) gilt als zentraler Bestandteil lernwirksamen Unterrichts, da es diagnostische Informationen zum Lernen und den Lernergebnissen erfasst, mit dem Ziel, Lehr- und Lernprozesse zu optimieren (Schütze et al., 2018). Zahlreiche (Meta-)Studien belegen substanzielle positive Effekte von FA auf fachliches wie überfachliches Lernen (z.B. Bellido-García et al., 2024). Gleichzeitig verweisen Beobachtungsstudien auf erhebliche Herausforderungen bei der Umsetzung von formativem Peer- und Self-Assessment (PASA) im Unterricht (Buholzer et al., 2020; Gotwals & Birmingham, 2016). Als zentrale Ursache werden gering ausgeprägte Assessment Literacy der Lehrpersonen diskutiert, also ihr professionelles Wissen und Können, lernförderliche Beurteilungsprozesse umzusetzen (Pastore & Andrade, 2019). Unsere Studie setzt an dieser Forschungslücke an und untersucht, inwiefern ein gezieltes Weiterbildungsprogramm die Assessment Literacy und dadurch die Qualität der PASA-Umsetzung verbessern kann. Trotz theoretisch vielversprechender Ansätze bleibt offen, inwiefern erweitertes Wissen tatsächlich zu nachhaltig höherer PASA-Qualität führt. Entsprechend zielte die Weiterbildung darauf ab, das Wissen zu PASA gezielt zu erweitern, sodass sich dieses in einer höheren Umsetzungsqualität im Unterricht zeigt.

Fragestellung

Die vorliegende Teilstudie untersucht:

Lehrpersonen, die an der Kurzweiterbildung zu formativem Peer- und Self-Assessment teilnehmen, zeigen nach der Intervention eine signifikant höhere Qualität der Umsetzung von formativem Peer- und Self-Assessment im Unterricht als Lehrpersonen der Wartekontrollgruppe.
Der Effekt der Kurzweiterbildung auf die Qualität des formativen Peer- und Self-Assessment im Unterricht wird teilweise durch das assessmentspezifische professionelle Wissen der Lehrpersonen vermittelt (Mediation durch Assessment Literacy).

Forschungsdesign und -methode

Beim vorliegenden Projekt handelt es sich um eine Teilstudie des SNF-Projekts FORMA «Formatives Assessment in Mathematikunterricht» (Nr. 100019_212762). Die Interventionsstudie umfasst N=96 Mathematiklehrpersonen, die zufällig zwei Interventionsgruppen (Peer- bzw. Self-Assessment) und einer Wartekontrollgruppe zugewiesen wurden. Die Weiterbildung bestand aus drei zweistündigen Veranstaltungen mit Vor- und Nachbereitungsaufträgen und kombinierte pädagogisch-psychologische Grundlageninputs zu Gelingensbedingungen formativer PASA mit praxisnahen Umsetzungsbeispielen für den Mathematikunterricht.

Zunächst wurden durch das Forschungsteam 96 Mathematiklektionen (zum halbschriftlichen Multiplizieren und Dividieren) systematisch codiert, um den videografierten Unterricht den drei beobachtbaren Phasen formativer Assessmentpraxis «Anleiten», «Begleiten» und «Nutzen» zuzuordnen. Darauf aufbauend wurden unter Einbezug einschlägiger Literatur und empirischer Beispiele ein Itempool sowie abgestufte Niveaubeschreibungen für das Ratinginstrument entwickelt und in Pilotierungs- und Konsensusrunden empirisch geschärft. Die Ratings zeigten exzellente Interraterreliabilitäten (ICC(2,1) = .83–.85; ICC(2,k) = .91–.92).

Das finale Ratinginstrument umfasst sieben Dimensionen mit insgesamt 15 Items. Die Items weisen eine vierstufige Skala (0–3) auf. Das assessmentspezifische professionellen Wissen (Assessment Literacy) der Lehrpersonen wurde mit zwei Vignettentests, gemessen (Oeksuez et al., under review). Die Analysen zur Beantwortung der beiden Fragestellungen erfolgen mittels ANOVAs, ANCOVAs und Mediationsanalysen.

Resultate und Bedeutung

Die vertiefte Auswertung der Videodaten befindet sich derzeit in Bearbeitung. Erste Befunde weisen auf deutliche Qualitätsunterschiede zwischen Interventions- und Wartekontrollgruppe hin. Hinweise zeigen, dass Lehrpersonen der Interventionsgruppen PASA systematischer und als integralen Bestandteil ihres Unterrichts umsetzen, Beurteilungsprozesse expliziter anleiten und die Lernenden kognitiv wie metakognitiv besser begleiten.

Zum Zeitpunkt des Kongresses liegen weiterführende Mediationsanalysen vor, die eine statistische Einschätzung der Wirksamkeit des Weiterbildungsprogramms ermöglichen und die bisherigen Trends empirisch fundieren. Die Studie leistet einen wichtigen Beitrag zur empirischen Fundierung formativer Beurteilung in der Primarstufe und zur Schliessung bestehender Forschungslücken.

11:00 - 11:30

Entwicklung und Validierung eines feingranularen Kompetenzmodells für die linearen Funktionen als Grundlage für formatives Assessment

Peter Steiner, Stephanie Leininger, Jan Hochweber, Fabian Grünig, Stephan Schönenberger, Michael Kickmeier-Rust

Pädagogische Hochschule St.Gallen, Schweiz

Theoretischer Hintergrund

Die zunehmende Bedeutung von individualisierter Förderung im Unterricht stellt hohe Anforderungen an diagnostische Modelle schulischer Kompetenzentwicklung. Um Lernprozesse gezielt unterstützen zu können, müssen sowohl der aktuelle Lernstand von Schüler:innen als auch mögliche nächste Lernschritte valide bestimmt werden.

Ein etablierter Ansatz in diesem Kontext ist die kompetenzbasierte Wissensraumtheorie (CbKST; Albert & Lucas, 1999). CbKST erlaubt die Repräsentation eines Lehrstandes als Menge von beherrschten Kompetenzen innerhalb eines Kompetenzmodells. Da die möglichen Lernstände durch eine sogenannte Vorläuferrelation geordnet werden, können nächste mögliche Lernschritte direkt aus dem Modell identifiziert werden.

Das der CbKST-Diagnostik zugrundeliegende Kompetenzmodell bildet den zentralen Bezugsrahmen. In der Literatur werden hierfür zwei zentrale Charakteristika hervorgehoben: Einerseits sollte ein Kompetenzmodell den betrachteten Themenbereich vollständig abdecken (Cosyn et al., 2013). Andererseits hängt der Differenziertheitsgrad der diagnostischen Aussagen von der Feingranularität des zugrunde liegenden Kompetenzmodells ab (Steiner et al., 2026).

In dem vom Schweizerischen Nationalfonds geförderten Projekt «Investigating the Spaces and Trajectories in Mathematics Learning» wird eine CbKST-basierte Diagnoseplattform für die linearen Funktionen entwickelt. Ein besonderer Fokus liegt dabei auf der Feingranularität der Diagnostik. Diese soll alle wesentlichen kognitiven Arbeitsschritte abdecken, die Schüler:innen bei dem Arbeiten mit linearen Funktionen durchlaufen.

In dem folgenden Beitrag werden sowohl Einblicke in die Entwicklung als auch in die Validierung des zugrundeliegenden Kompetenzmodells gegeben. Dabei werden die folgenden Forschungsfragen adressiert:

Welche spezifischen Kompetenzen lassen sich im Themenbereich der linearen Funktionen identifizieren?
Inwieweit stimmen die im Kompetenzmodell auf Basis theoretischer Annahmen postulierten Kompetenzen mit den empirisch beobachtbaren kognitiven Prozessen von Schüler:innen überein?

Forschungsdesign und -methode

Die Identifikation des Kompetenzmodells erfolgte iterativ und kombinierte top-down- und bottom-up-basierte Vorgehensweisen. In einem ersten Schritt wurde auf Grundlage einer Literaturrecherche ein initialer Satz zentraler Kompetenzen im Bereich der linearen Funktionen identifiziert. Diese zunächst breit gefassten Kompetenzbeschreibungen wurden entlang literaturbasierter Kategorien (z. B. kognitive Prozesse, mathematische Darstellungsformen) ausdifferenziert.

Anschliessend wurde eine detaillierte Aufgabenanalyse basierend auf einem umfangreichen Itempool zu linearen Funktionen durchgeführt. Die Aufgaben wurden hinsichtlich ihrer kognitiven Arbeitsschritte analysiert und den initialen Kompetenzen zugeordnet, um die inhaltliche Abdeckung, Trennschärfe und Konsistenz des Kompetenzmodells zu prüfen. Basierend darauf wurden Kompetenzen weiter ausdifferenziert, konkretisiert oder neu hinzugefügt.

Um die kognitiven Prozesse der Schüler:innen empirisch sichtbar zu machen, wurden Think-aloud Interviews (N=60) mit Schüler:innen durchgeführt, in denen sie drei Aufgaben zu linearen Funktionen bearbeiteten. Die verbalen Protokolle wurden inhaltsanalytisch entlang eines deduktiv entwickelten Kategoriensystems ausgewertet (Kukartz & Rädiker, 2024), um zu untersuchen, welche kognitiven Prozesse bei der Bearbeitung von Aufgaben tatsächlich aktiviert wurden, und inwiefern diese mit den im Modell angenommenen Kompetenzen übereinstimmen. Das dafür verwendete Kategoriensystem setzt sich aus Kompetenzcodes (jede identifizierte Kompetenz wurde als Code definiert), Sondercodes (z. B. «Nicht codierbar») und dem Code «Lücke im Kompetenzmodell» zusammen. Alle Interviews wurden von zwei unabhängigen und speziell geschulten Kodierer:innen mit mathematikdidaktischem Hintergrund kodiert.

Resultate

Als Ergebnis des Entwicklungsprozesses liegt ein feingranulares Kompetenzmodell für den Themenbereich der linearen Funktionen vor, das 125 Einzelkompetenzen umfasst. Es kann in zehn inhaltliche Subdimensionen (z. B. Steigung, y-Achsenabschnitt), vier Darstellungsformen (z. B. tabellarisch, grafisch) und sechs mathematikbezogene kognitive Prozesse (z. B. Mathematisieren und Modellieren; Linneweber-Lammerskitten & Wälti, 2008) unterteilt werden.

Die Auswertung der Think-aloud-Interviews liefert substanzielle Hinweise darauf, dass zentrale Bestandteile des Kompetenzmodells mit den beobachteten kognitiven Prozessen der Schüler:innen übereinstimmen. Im Mittel wurden einer Aufgabe 4,15 Kompetenzen aus dem Kompetenzmodell zugeordnet. Der Code «Lücke im Kompetenzmodell» wurde insgesamt 17-mal vergeben. Dies deutet darauf hin, dass in weniger als 10 Prozent der Aufgabenbearbeitung (es wurden insgesamt 60 mal 3 Aufgaben bearbeitet) kognitive Prozesse auftraten, die nicht durch das Kompetenzmodell abbildbar waren. Diese werden aktuell genauer untersucht.

Ausblick

In dem Vortrag werden neben den identifizierten Kompetenzen und der Validierungsstrategie auch mögliche Diagnoseanwendungen anhand von simulierten Datensätzen diskutiert.

11:30 - 12:00

Formative Beurteilungspraktiken von Lehrpersonen - Empirische Überprüfung einer Teildimension von «Assessment Literacy»

Karin Portmann, Robbert Smit, Anna-Lena Ullrich, Rahel Schmid, Felix Kruse

Pädagogische Hochschule St. Gallen, Schweiz

Theoretischer Hintergrund

Die formative Beurteilung ist eine zentrale Dimension von Unterrichtsqualität (Hattie, 2023; Praetorius et al., 2023). Während summative Beurteilungen gezeigte Leistungen bilanzieren, werden die Schlussfolgerungen bei formativen Beurteilungen für das weitere Lernen der Schüler:innen genutzt (Black & Wiliam, 2018). Diskussionen über formative Beurteilungen gewinnen zunehmend an Bedeutung (Buholzer & Brovelli, 2023).

Assessment Literacy (AL) beschreibt die Beurteilungskompetenz von Lehrpersonen als mehrdimensionales, kontextspezifisches und dynamisches Konstrukt (DeLuca et al., 2019; Pastore & Andrade, 2019; Xu & Brown, 2016). Die AL umfasst Wissen, Überzeugungen, Praktiken, sozial-emotionales Management sowie ethische Prinzipien zur Beurteilung. Die Praktiken beinhalten u.a. die fünf formativen Beurteilungsstrategien nach William und Thompson (2008, zit. n. Lötscher et al., 2023, S. 32f):

«Lernziele und Erfolgskriterien klären»
«Mithilfe von Aufgaben, Fragen und Diskussionen Informationen zum Lernstand erheben»
«Die Schülerinnen und Schüler als Zuständige ihres eigenen Lernens aktivieren»,
«Die Schülerinnen und Schüler als lehrreiche Ressourcen füreinander aktivieren»
«Lernförderliches Feedback erteilen»

Diese Strategien ermöglichen die Einbettung formativer Beurteilung in Lehr- und Lernprozesse (Lötscher et al., 2023). Studien weisen jedoch auf Defizite in der Umsetzung der formativen Beurteilungsstrategien (Buholzer et al., 2020) resp. des Feedbacks (Van Der Kleij, 2019) hin.

Buholzer et al. (2020) leisten mit einer Videostudie einen zentralen Beitrag zur Erfassung der formativen Beurteilungspraktiken. Für Fragebogen liegen Skalen zur Erfassung der diagnostischen Kompetenz von Lehrpersonen vor (Baumert et al., 2008; Smit, 2009). Auch gibt es Skalen, welche die formativen Beurteilungspraktiken (Lysaght et al., 2017; Veugen et al., 2022) oder mit Feedback einen Teilbereich erfassen (Van Der Kleij, 2019). Derzeit steht jedoch kein geeignetes Messinstrument für die Erhebung formativer Beurteilungspraktiken in Lehrpersonenbefragungen zur Verfügung. In der präsentierten Studie wird ein Messinstrument vorgestellt, welches sich inhaltlich an Wiliam und Thompson (2008) orientiert und die Qualität der einzelnen formativen Beurteilungspraktiken fokussiert (Buholzer et al., 2020; Van Der Kleij, 2019; Veugen et al., 2022; Wemmer-Rogh et al., 2023).

Fragestellung

Die Studie hat zum Ziel, eine Skala zur Erfassung der formativen Beurteilungspraktiken für Lehrpersonenbefragungen zu entwickeln. Folgende Fragestellung leitet das Vorhaben: Inwiefern erfassen die entwickelten Skalenitems die formativen Beurteilungspraktiken valide und reliabel?

Forschungsdesign und -methode

Als erster Schritt der Skalenkonstruktion wurde das Konstrukt AL und insbesondere die Beurteilungspraktiken theoretisch geklärt (Hartmann & Reinecke, 2013). Für das Konstrukt Beurteilungspraktiken wurde ein Itempool aus bestehenden und eigenkonstruierten Items generiert. Der Itempool wurde qualitativ pilotiert: Zum einen wurden die Items durch Expert:innen (n=3) aussortiert resp. umformuliert. Anschliessend wurden die Items mithilfe der Think-Aloud-Methode (n=5) auf ihre Verständlichkeit hin getestet (Willis, 2005). Es folgte die quantitative Pilotierung des verbleibenden Itempools: Mit den fünf Strategien der formativen Beurteilung (Wiliam & Thompson, 2008) liegt eine Struktur vor, welche als Faktoren für eine konfirmatorische Faktorenanalyse genutzt werden kann (Floyd & Widaman, 1995; Kopp & Lois, 2014). Die Erprobungsstichprobe bildeten Bachelorstudierende im 5. Semester einer Pädagogischen Hochschule. Die Stichprobe (n=217) entspricht der geforderten Grösse bei einem Itempool von n=37 (Nunnally & Bernstein, 1994).

Resultate und deren Bedeutung

Die qualitative Pilotierung führte zu einem optimierten Itempool: Einzelne Items wurden gekürzt, präzisiert (z.B. «Lernjournal oder Ähnliches») und aus fach- und allgemeindidaktischer Sicht angepasst (z.B. Unterscheidung von Rückmeldung und Feedbackgespräche). Die Datenanalyse der quantitativen Pilotierung erfolgt zu Beginn des Jahres 2026.

Die Überprüfung der Skala «Formative Beurteilungspraktiken» wird die inhaltliche Validität und Reliabilität der Hauptstudie, welche ab Herbst 2026 stattfinden wird, sicherstellen. Die Skalenentwicklung leistet auch einen Beitrag zur Weiterentwicklung des Konstrukts AL. Die Förderung der AL ist ein zentrales Anliegen aktueller Bildungsdiskurse (Becker et al., 2025; Buholzer et al., 2020; Hock, 2021; Südkamp & Praetorius, 2017). In Anlehnung an die Agenda 2023 für Nachhaltige Entwicklung (United Nations, 2015) sollen Beurteilungen verstärkt als Schlüssel für hochwertige Bildung genutzt werden.

SSRE-SSFE-congrès annuel 2026

17-19 Juin 2026
Haute école pédagogique de Saint-Gall

Programme de la conférence