Veranstaltungsprogramm

Eine Übersicht aller Sessions/Sitzungen dieser Tagung.
Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.

 
Sitzungsübersicht
Sitzung
D11–S13: Unterrichtsqualität
Zeit:
Donnerstag, 26.03.2020:
11:15 - 13:00

Ort: S13

Präsentationen

Zum Rückgang des Interesses an Physik in der Sekundarstufe: Welche Rolle spielt der Unterricht?

Lena Steidtmann1, Thilo Kleickmann2, Mirjam Steffensky1

1IPN - Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik, Deutschland; 2CAU - Christian-Albrechts-Universität zu Kiel

Theoretischer Hintergrund

Interesse an schulischen Inhalten zu steigern oder zumindest zu erhalten ist ein wichtiges Bildungsziel, zumal es die Qualität des Lernens verbessert und im Zusammenhang mit Berufswahlentscheidungen steht (z.B. Frenzel et al., 2012). Allerdings sinkt das Interesse an schulischen Inhalten im Verlauf der Schulzeit deutlich ab (z.B. Anderhag et al., 2016). Dieser Trend ist in den mathematisch-naturwissenschaftlichen Fächern besonders stark ausgeprägt, insbesondere in den Fächern Physik und Chemie (Cheung, 2018; Krapp & Prenzel, 2011). Mädchen scheinen insbesondere ab der Sekundarstufe ein geringeres naturwissenschaftliches Interesse aufzuweisen als Jungen (Jocz et al., 2014).

Weitgehend unklar ist die Rolle des naturwissenschaftlichen Unterrichts für den Rückgang des Interesses an Physik in der Phase nach dem Schulübergang. Einige Befunde deuten darauf hin, dass die Qualität des Physikunterrichts in der Übergangsphase eine Rolle spielt (z.B. Tröbst et al., 2016). Gemäß des (fachübergreifenden) Ansatzes der Basisdimensionen von Unterrichtsqualität ist davon auszugehen, dass Schülerorientierung und Klassenführung positive Effekte auf die Entwicklung von Interessen haben sollten (Praetorius et al., 2018). Die Befundlage ist allerdings nicht konsistent (z.B. Fauth et al., 2014; Förtsch et al., 2017). Zudem fehlen Studien zum Physikunterricht, die mit längsschnittlichen Designs die Phase nach dem Schulübergang untersuchen.

Fragestellungen

Vor diesem Hintergrund untersuchten wir drei Fragestellungen: (1.) Wie entwickelt sich das Interesse an Physik bei Schüler*innen von der fünften bis siebten Jahrgangsstufe und gibt es unterschiedliche Verläufe bei Jungen und Mädchen? (2.) Welche Rolle spielt die Teilnahme am Physikunterricht für die Entwicklung des Interesses? (3.) Welche Rolle spielt die Unterrichtsqualität (Basisdimensionen) für die Interessensentwicklung?

Methoden

An der Studie nahmen 4.692 Sekundarschüler*innen teil (50 % weiblich, 55 % Gymnasium, 171 Schulklassen). Die Schüler*innen wurden am Ende der Jahrgangsstufen 5, 6 und 7 u.a. zu ihrem Interesse an Physik und zur Unterrichtsqualität befragt. Das Interesse an Physik wurde mit einer Skala aus fünf Items, die Unterrichtsqualität entlang von vier Basisdimensionen (kognitive Aktivierung, kognitive Unterstützung, motivationale Unterstützung, Klassenführung) mit insgesamt 20 Items erfasst (Kleickmann, Steffensky, & Praetorius, in press).

Die Entwicklung des Interesses sowie die Einflüsse des Unterrichts wurden mit latenten Differenzwert-Modellen auf within- und between-Ebene untersucht. Dieser Beitrag fokussiert die between-Ebene (Unterschiede zwischen Klassen). Zur Untersuchung der Fragestellung 2 nutzten wir ein natürliches quasi-experimentelles Design: Die 171 Klassen unterschieden sich darin, ob sie in den Jahrgangsstufen 6 und 7 jeweils Physikunterricht erhielten oder nicht.

Ergebnisse

Bezüglich Fragestellung 1 zeigte sich, dass das Interesse am Ende von Jahrgangsstufe 5 (Ausgangsniveau) bei durchschnittlich 1.84 Punkten (Skala von 1 bis 4 Punkten) lag. Vom Ende der Jahrgangsstufe 5 bis zum Ende der Jahrgangsstufe 6 sank das Interesse um 0.23 Punkte (0.31 SD), vom Ende der Jahrgangsstufe 6 bis zum Ende der Jahrgangsstufe 7 um weitere 0.11 Punkte (0.15 SD). Mädchen zeigten ein signifikant niedrigeres Ausgangsniveau im Interesse und tendenziell stärkeren Interessenrückgang als Jungen (allerdings nur von Jgst. 5 nach 6).

Hinsichtlich Fragestellung 2 zeigte sich, dass Klassen, die in Jahrgngsstufe 6 Physikunterricht erhielten, einen stärkeren Rückgang des Interesses von Jahrgangsstufe 5 nach 6 hatten als Klassen ohne Physikunterricht. Von Jgst. 6 nach 7 zeigte sich kein entsprechender Effekt.

Bezüglich Fragestellung 3 zeigte sich, dass die Unterrichtsqualität in den Jahrgangsstufen 6 und 7 im Zusammenhang mit der Entwicklung des Interesses im jeweiligen Schuljahr stand. Wie erwartet zeigten sich positive Effekte von kognitiver und emotionaler Unterstützung auf die Interessensentwicklung. Klassenführung hatte nur einen kleinen positiven Effekt in Jahrgangsstufe 6. Anders als erwartet zeigte sich in beiden Jahrgangsstufen ein positiver Effekt von kognitiver Aktivierung. Die Befunde geben somit Hinweise, wie der Rückgang des Interesses an Physik in der Sekundarstufe verringert werden kann.



Wer sieht am meisten? Unterschiede zwischen intuitiven Einschätzungen der Unterrichtsqualität von Studierenden, Schüler*innen und Bildungsexpert*innen

Lukas Begrich

Goethe Universität Frankfurt am Main, Deutschland

Im vorliegenden Beitrag werden Thin-Slices-Ratings für die videobasierte Erfassung der Unterrichtsqualität validiert. Thin-Slices Ratings sind Einschätzungen hinsichtlich persönlicher Eigenschaften, Verhaltenstendenzen oder Interaktionsmerkmalen von Zielpersonen, die auf ersten Eindrücken ungeschulter Beobachter*innen beruhen (Ambady, Bernieri, & Richeson, 2000). Zahlreiche Studien belegen sowohl die Reliabilität solcher Einschätzungen im Sinne hoher Übereinstimmungen zwischen verschiedenen Beobachter*innen als auch ihre Validität im Sinne bedeutsamer Zusammenhänge mit Kriterien wie etwa Selbstberichten der eingeschätzten Zielpersonen (z.B. Ambady et al., 2000; Wood, 2014). In vorangegangenen Studien konnte bereits nachgewiesen werden, dass sich auch die Qualität von Unterricht anhand von Einschätzungen ungeschulter Beobachter*innen, die auf Grundlage 30-sekündiger, zufällig ausgewählter Ausschnitte aus vollständigen Unterrichtsvideos abgegeben wurden, reliabel und valide erfassen lässt (Begrich, Fauth, Kunter, & Klieme, 2017; Begrich, Kuger, Klieme, & Kunter, 2019). Dabei zeigten sich durchweg sowohl hohe Übereinstimmungen zwischen den Einschätzungen verschiedener Beobachter*innen als auch signifikante Zusammenhänge mit Einschätzungen, die von geschulten Ratern auf Grundlage vollständiger Unterrichtsvideos abgegeben worden waren. Zudem konnte gezeigt werden, dass die Thin-Slices Ratings eine Differenzierung zwischen verschiedenen grundlegenden Dimensionen der Unterrichtsqualität erlauben (Begrich et al., 2019). Schließlich deuten erste Befunde darauf hin, dass sich Thin-Slices Ratings der Unterrichtsqualität auch als Prädiktoren des Lernerfolgs von Schülerinnen und Schülern eignen (Begrich et al., 2017). Somit scheinen sich Thin-Slices Ratings bei der Erfassung der Unterrichtsqualität als eine ökonomische Alternative zu den klassischen, zeit- und kostenintensiven Videoratings anzubieten.

Die Frage stellt sich jedoch, ob mit Hilfe von Thin-Slices-Ratings etwas erfasst werden kann, das spezifisch für die Unterrichtsqualität ist oder ob ihnen eher globale Persönlichkeitsurteile zugrunde liegen. Aus der Forschung ist bekannt, dass die Akkuratheit intuitiver Urteile, zu denen auch Thin-Slices-Ratings gerechnet werden können (Ambady, 2010), sowohl von einer gewissen Einstimmung auf relevante Hinweisreize aufgrund emotionaler Involviertheit (Ambady, 2010; Ambady et al., 2000) als auch von bereichsspezifischem Wissen auf Seiten der Beurteiler*innen (z.B. Dane & Pratt, 2007; Dane, Rockmann, & Pratt, 2012) profitieren. Aus diesem Grund sollten Thin-Slices Ratings der Unterrichtsqualität – sofern sie etwas erfassen können, dass spezifisch für die Unterrichtsqualität ist – eine inkrementelle Validität (vgl. Sechrest, 1963) aufweisen, wenn sie von Beurteiler*innen abgegeben werden, die über ein hohes Maß an bereichsspezifischen Wissen verfügen oder besonders auf das Decodieren unterrichtsbezogene Hinweisreize eingestimmt sind. Die hier vorgestellte Studie prüft daher, inwieweit sich Thin-Slices Ratings der Unterrichtsqualität von Psychologiestudierenden, Mittelstufenschüler*innen und Bildungsexpert*innen hinsichtlich ihrer prädiktiven Kraft bei der Vorhersage des Lernerfolgs von Schüler*innen unterscheiden.

Als Datengrundlage dienten Unterrichtsvideos und Schülerdaten aus der IGEL-Studie (Hardy et al., 2011). Als Rater nahmen 8 Psychologiestudierende, eine neunte Klasse eines Gymnasiums (n =24) sowie 8 Unterrichtsforscher an der Untersuchung teil. Alle Versuchspersonen schätzten auf Grundlage 30-sekündiger Ausschnitte aus den IGEL-Unterrichtsvideos die Unterrichtsqualität der gezeigten Lehrkräfte entlang der Basisdimensionen der Unterrichtsqualität auf je zwei Items ein (vgl. z.B. Praetorius, Klieme, Herbert, & Pinger, 2018). Diese Einschätzungen stimmten innerhalb Stichproben in hohem Maße überein und können damit als hoch reliabel gelten. In Mehrebenen-Regressionsanalysen konnte ferner festgestellt werden, dass die Thin-Slices Ratings der Unterrichtsqualität in allen Stichproben den Lernerfolg der Schüler*innen signifikant vorhersagen. Um eine mögliche inkrementelle Validität der Thin-Slices Ratings aus den einzelnen Stichproben zu prüfen, wurden in drei weiteren Mehrebenen-Regressionsmodellen die Ratings jeweils einer Basisdimension aus allen drei Stichproben simultan als Prädiktoren auf Klassenebene eingeführt. Dabei zeigte sich, dass die Thin-Slices Ratings der konstruktiven Unterstützung, die von Mittelstufenschüler*innen abgegeben worden waren, einen zusätzlichen Varianzanteil in den Testwerten der Schüler*innen erklären. Das gleiche gilt für Thin-Slices Ratings der Klassenführung, die von den Bildungsexpert*innen abgegeben worden waren. Dieser Befund deutet darauf hin, dass eine Einstimmung auf relevante Hinweisreize sowie reichhaltiges Wissen über relevante Aspekte des Unterrichtens zu genaueren intuitiven Einschätzungen der Unterrichtsqualität führen.



Wie (komplex) rezipieren Lehrkräfte Rückmeldungen von Vergleichsarbeiten?

Sarah Bez, Samuel Merk, Thorsten Bohl

Eberhard Karls Universität Tübingen

Im Zuge der Neuen Steuerung wurden länderübergreifend Vergleichsarbeiten (VERA) eingeführt, die unter anderem zu evidenzbasierter Schul- und Unterrichtsentwicklung führen sollen (KMK, 2006). Helmke und Hosenfeld (Helmke & Hosenfeld, 2005) beschreiben hierfür in ihrem Modell zur Nutzung von Evaluationsdaten in der Schule die Schritte Rezeption, Reflexion und Aktion, welche jeweils durch schulische und individuelle Faktoren beeinflusst werden. Dabei kommt der Rezeption der Ergebnisse besondere Bedeutung zu: Das adäquate Rezipieren, d.h. Verstehen der statistischen Informationen, ist eine notwendige Voraussetzung für die korrekte Reflexion der Ergebnisse unter Berücksichtigung von Kontextinformationen und für die Ableitung geeigneter Unterrichtsmaßnahmen.

Bisherige Studien zu VERA untersuchten hauptsächlich in retrospektiven Selbstauskünften von Lehrkräften die wahrgenommene Nützlichkeit, die Verständlichkeit, die Informativität der und den Umgang mit den Ergebnissen (Dedering, 2011; Altrichter, Moosbrugger, & Zuber, 2016). Alternative Datenquellen und Forschungsdesigns wie Beobachtungen und Prozessdaten gelten hingegen als Desiderat (Dedering, 2011; Altrichter et al., 2016). Einige Ergebnisse der seltenen Studien zur Datenkompetenz bei Lehrkräften und zum Verstehen der Rückmeldedaten von VERA weisen darauf hin, dass es Lehrpersonen eher schwerfällt, statistische Informationen korrekt zu rezipieren, obwohl sie sie als verständlich einschätzen (Koch, 2013; Zimmer-Müller, Hosenfeld, & Koch, 2014).

Der vorliegende Beitrag fokussiert vor diesem Hintergrund Rezeptionsprozesse von Rückmeldedaten nach VERA auf der Ebene einzelner Lehrkräfte mit folgenden leitenden Forschungsfragen:

  1. Welche Komplexität zeigen Lehrkräfte bei der Rezeption und Reflexion von Rückmeldungen zu Vergleichsarbeiten?
  2. Welche Bezugsnormen adressieren Lehrpersonen bei der Rezeption und Reflexion der Rückmeldungen?
  3. Inwiefern zeigen datenkompetente Lehrpersonen komplexere Elaborationen bei der Rezeption der Rückmeldungen von Vergleichsarbeiten?

Dazu wurde bei einer Gelegenheitsstichprobe von 25 Lehrpersonen eine Think-Aloud-Studie durchgeführt, um mündliche verbale Daten bezüglich der Rezeptionsprozesse zu generieren (van Someren, Barnard, & Sandberg, 1994). Zunächst wurden die Lehrkräfte gebeten, ihre Gedanken beim Betrachten zweier Grafiken ihrer VERA-Rückmeldungen laut zu äußern und dabei auf die adressierten Stellen in den Grafiken zu zeigen. Danach bearbeiteten sie einen Datenkompetenztest (adaptiert nach Koch, 2011). Die aufgezeichneten Äußerungen der Lehrkräfte wurden sekundengenau anhand der Think-Aloud-Protokolle hinsichtlich verschiedener Niveaustufen von Datenkompetenz (reading the data, reading between the data, reading beyond the data; Friel, Curcio, & Bright, 2001) sowie der verwendeten Bezugsnorm (sozial, kriterial, individuell) mithilfe eines deduktiv-induktiv entwickelten Schemas unabhängig von zwei geschulten Raterinnen geratet. Die Interraterreliabilität wurde mit Krippendorffs α (Hayes & Krippendorff, 2007) geschätzt und ergab befriedigende bis sehr gute Werte (.65 ≤ α ≤ .96). Alle Nicht-Übereinstimmungen wurden in Konsensurteile überführt. Die Länge der Think-Aloud-Protokolle betrug im Mittel 6.0 Minuten (Min = 2.4, Max = 14.0 min).

Zur Beantwortung der beiden ersten Forschungsfragen wurden die zeitlichen Anteile der Datenkompetenzstufen und der Bezugsnormen in den Think-Aloud-Protokollen berechnet (summierte Ratings im Verhältnis zur Gesamtdauer pro Think-Aloud-Protokoll). Hierbei zeigten sich für die Stufen der Datenkompetenz folgende deskriptive Werte: reading the data: Md= 1.94% (IQR[.00%-5.26%]), reading beetween the data: Md = 32.69% (IQR[17.54%-39.10%]), reading beyond the data: Md = 6.76% (IQR[1.09%-10.41%]), sowie für die Bezugsnormen kriterial: Md = 15.6% (IQR[4.82%-24.14%]), sozial: Md = 26.91% (IQR[15.47%-39.32%]), ipsativ: Md = 0.00% (IQR[0.00%-3.82%]). Damit weisen die Lehrkräfte in der Tendenz eine mittlere Komplexität bei der Rezeption auf und adressieren hauptsächlich die soziale Bezugsnorm. Zur Beantwortung der dritten Forschungsfrage wurden die Ratings mit den Ergebnissen der Datenkompetenztests korreliert. Hierbei ergab sich entgegen den Erwartungen keine signifikante positive Korrelation zwischen dem Anteil reading beyond the data und den Datenkompetenzscores (Kendalls τ = -0.01; p = 0.955) sowie keine negative Korrelation zwischen dem Anteil reading the data und den Datenkompetenzscores (Kendalls τ= 0.18; p = 0.296). Allerdings weisen datenkompetentere Lehrpersonen deskriptiv erwartungsgemäß höhere Anteile an Datenkompetenzstufen im Verhältnis zur Gesamtzeit der Think-Aloud-Protokolle auf (Kendalls τ = 0.22; p = 0.173).



Prädiktoren für gelungenen inklusiven Naturwissenschaftsunterricht – ein systematisches Literaturreview

Sarah Brauns, Daniela Egger, Simone Abels

Leuphana Universität Lüneburg, Deutschland

Ziel des inklusiven naturwissenschaftlichen Unterrichts ist es, allen Schüler*innen Partizipation an fachspezifischen Lernprozessen und die Entwicklung einer naturwissenschaftlichen Grundbildung zu ermöglichen (Menthe et al., 2017). Um inklusiven Unterricht auch wirklich fachbezogen gestalten zu können, müssen die spezifischen Aspekte naturwissenschaftlichen Unterrichts (z.B. Experimente, Phänomene, Schüler*innenvorstellungen, …) mit den Gelingensbedingungen inklusiven Unterrichts (Wertschätzung von Diversität, Minimierung von Barrieren, Ermöglichung von Partizipation) zusammengedacht werden (Stinken-Rösner et al., submitted).

Das BMBF Projekt Nawi-In (Naturwissenschaftlichen Unterricht inklusiv gestalten) geht zunächst einmal der Frage nach, entlang welcher lehrer*innenbezogenen Prädiktoren sich das Gelingen inklusiven naturwissenschaftlichen Unterrichts beschreiben lässt, um daraus ein Analyseraster für das weitere Forschungsvorgehen aufzustellen. In der weiterführenden Forschung soll die professionelle Kompetenzentwicklung von Studierenden bzgl. inklusivem naturwissenschaftlichen Unterrichts mithilfe des Rasters analysiert werden. Die professionelle Kompetenzentwicklung wird erhoben, indem Masterstudierende inklusiv naturwissenschaftliche Momente in Videoausschnitten zu drei Messzeitpunkten reflektieren, Unterricht in diesem Sinne zu zwei Zeitpunkten, zu Beginn und am Ende eines Langzeitpraktikums, selbst gestalten und videographieren. Um die audiographierten Reflexionen und die Videos zu analysieren, werden Kategorien inklusiven naturwissenschaftlichen Unterrichts benötigt. Diese Kategorien werden mithilfe eines systematischen Literaturreviews (SLR) aus theoretischen und empirischen Arbeiten aus dem Bereich des inklusiven naturwissenschaftlichen Unterrichts mit der Qualitativen Inhaltsanalyse induktiv ermittelt (Kuckartz, 2016). Die Auswahl der Literatur wurde in deutschen sowie internationalen Datenbanken, die jeweils einschlägig für bildungswissenschaftliche und fachdidaktische Publikationen sind, durchgeführt. Die an die Datenbanken angepassten Suchstränge wurden aus einer Kombination von Begriffsgruppen der inklusiven Pädagogik und des naturwissenschaftlichen Unterrichts gebildet (Bsp.: inklusiv* UND naturwissenschaftlich* UND Unterricht). Die Stichprobe von n=10787 Titeln wurde in einem Titel-Abstract-Screening auf eine finale Stichprobe von n=265 reduziert. Gesucht wurden Publikationen, die peer-reviewed sind, sich inhaltlich konkret auf den inklusiven naturwissenschaftlichen Unterricht fokussieren, auf Deutsch oder Englisch verfasst wurden, sich auf die Primar- oder Sekundarstufe I beziehen und bis Dezember 2018 veröffentlicht wurden.

Die deskriptive Darstellung der Stichprobe zeigt, dass zwei Drittel der Arbeiten theoretisch und nur ein Drittel empirisch erstellt wurden. Besonders seit dem Jahr 2010 ist die Anzahl der Publikationen im Bereich des inklusiv naturwissenschaftlichen Unterrichts stark gestiegen. Der Schwerpunkt der Stichprobe liegt mit 72% auf Literatur, die sich mit der Sekundarstufe I auseinandersetzt, 28% der Titel kommen aus dem naturwissenschaftlichen Sachunterricht. Besonders prägnant ist, dass in nur 5% der Arbeiten die Studierenden im Fokus liegen, der andere Teil bezieht sich auf Schüler*innen, Lehrkräfte oder sonstiges, wie Unterrichtsmaterialien.

Die inhaltsanalytische Auswertung der Stichprobe führte zu Kategorien, die von den Charakteristika des naturwissenschaftlichen Unterrichts ausgehen und mit Inklusion zusammendenken. Wie das Kategoriensystem aufgebaut ist, wird hier an einem Beispiel aufgezeigt. Für Experimente inklusiv gestalten wurden in der Stichprobe Codes zu folgenden Subkategorien zusammengefasst: Verschiedene Zugänge zu Experimenten anbieten, für Experimente verschiedene Niveaus berücksichtigen, für Experimente verschiedene Grade der Offenheit anbieten, für Experimente eine variable Lernzeit zur Verfügung stellen, verschiedene Ziele für Experimente planen, verschiedene Hilfen für Experimente anbieten, Experimente in Fachteams planen. Das Heranziehen der textnahen Ebene der Codes spezifiziert die Subkategorien, sodass Fragen, auf welche Weise z.B. verschiedene Zugänge zu Experimenten geschaffen werden, dargestellt und genauer erläutert werden können.

Insgesamt zeigt die Auswertung der Stichprobe diverse Forschungslücken im Bereich des inklusiven naturwissenschaftlichen Unterrichts auf und fasst zum ersten Mal Prädiktoren inklusivem naturwissenschaftlichen Unterrichts zusammen. Dieses bietet die Grundlage zur Erstellung eines Analyserasters, um im oben genannten Forschungsvorhaben die in der Literatur normativ formulierten und zum Teil empirisch belegten Prädiktoren inklusiven naturwissenschaftlichen Unterrichts auf Audio- und Videodaten sowie auf die Praxis anzuwenden.