Toon de sessies

 
Only Sessions at Date / Time 
 
 
Sessie overzicht
Sessie
S30: Multimedia in assessment: op weg naar theoretisch onderbouwde richtlijnen voor de praktijk
Tijd:
Thursday, 05.06.2025:
10:00 - 12:00

Plaats: SW - 02.07


Show help for 'Increase or decrease the abstract text size'
Presentations

Multimedia in assessment: op weg naar theoretisch onderbouwde richtlijnen voor de praktijk

Chair(s): Kelly Beekman (Fontys, Netherlands, The)

Discussant(en): Desirée Joosten-ten Brinke (Maastricht University)

Multimedia, zoals tekst-plaatjescombinaties en games, worden steeds vaker gebruikt bij toetsing, maar er ontbreken theoretisch onderbouwde ontwerprichtlijnen. Onderzoek naar de effecten van multimedia bij toetsing, dat zich richt op het ophalen van informatie uit het lange termijngeheugen, verschilt van leren, waarbij informatie wordt opgeslagen. Er is behoefte aan een theoretisch kader dat specifiek gericht is op de effecten van multimedia binnen de context van toetsing om meer duidelijkheid te verschaffen over de invloed op prestaties en validiteit. Dit symposium combineert drie bijdragen die theorie en empirisch onderzoek integreren om inzicht te bieden in de rol van multimedia bij toetsing.

Bijdrage 1 introduceert het LAMMP-model voor multimedia in toetsing.

Bijdrage 2 onderzoekt de effecten van afbeeldingen in toetsitems op prestatie, mentale inspanning en tijdsbesteding.

Bijdrage 3 onderzoekt de invloed van realistische contexten in game-based assessment op de meetvaliditeit van generieke vaardigheden, met aandacht voor gezichtsvaliditeit en perceptie van studenten.

 

Presentaties van het symposium

 

Een Gelaagd Model voor Multimedia-assessment: LAMMP

Andrienne Kerckhoffs, José Janssen, Ron Pat-El, Halszka Jarodzka
Open Universiteit, Netherlands, The

Inleiding

De digitalisering van toetsing heeft het gebruik van multimedia in assessments vereenvoudigd. Dit kan positief zijn, omdat multimedia onder andere kan bijdragen aan een hogere authenticiteit en betere toegankelijkheid (Dirkx et al., 2021). Tegelijkertijd ontbreken duidelijke richtlijnen voor het ontwerp van multimedia-assessment, wat zowel onderzoekers als de professionals uit de praktijk voor uitdagingen stelt (Dirkx et al., 2021; Kirschner et al., 2017). Empirisch onderzoek naar de effecten van multimedia op testprestaties en cognitieve verwerking levert wisselende resultaten op (bijv. Arts et al., 2024; Jarodzka et al., 2015; Lindner, 2022). Dit komt voornamelijk door verschillen in doel, ontwerpeigenschappen en contextuele factoren van multimedia, evenals het gebrek aan overeenstemming over definities en operationalisering (Hu et al., 2021; Lindner, 2022). Hierdoor wordt het generaliseren van onderzoeksresultaten bemoeilijkt, wat de ontwikkeling van richtlijnen voor multimedia-assessment in de weg staat (Dirkx et al., 2021; Imhof et al., 2009; Kirschner et al., 2017).

Onderzoeksvragen

Om deze uitdagingen het hoofd te bieden, hebben wij een gelaagd model voor multimedia-assessment ontwikkeld, gebaseerd op de volgende onderzoeksvragen:

  1. Welke aspecten van multimedia-assessment beïnvloeden cognitieve verwerking en probleemoplossing?
  2. Hoe kunnen deze aspecten op een gestructureerde manier worden geordend en beschreven, met aandacht voor hun onderlinge samenhang, om de kwaliteit en toepasbaarheid van onderzoek naar en ontwerp van multimedia-assessments te verbeteren?

Methodologie

Het model is ontwikkeld op basis van een uitgebreide literatuurstudie en combineert bevindingen uit onderzoek naar multimedialeren, toetsontwerp, visueel ontwerp en cognitieve psychologie.

Resultaten

Het LAMMP-model identificeert, beschrijft en definieert de aspecten die van invloed zijn op de cognitieve processen die nodig zijn voor het begrijpen en oplossen van assessmentitems. Daarnaast besteedt het aandacht aan de onderlinge samenhang van deze aspecten. Het model verdeelt multimedia-assessment in vier lagen om structuur aan te brengen en samenhang te verduidelijken: de leer- en assessmentcontext (met contextuele factoren zoals de achtergrond van deelnemers en de toetsomgeving), het assessmentitem (waarbij aspecten zoals cognitieve processen en tekstcomplexiteit centraal staan), multimedia (met ontwerpaspecten zoals coherentie en signalisatie), en afbeelding (met ontwerpaspecten zoals dynamiek en realisme). Een onderscheidend kenmerk van LAMMP is de expliciete aandacht voor het doel van multimedia in assessments, een aspect dat vaak over het hoofd gezien wordt in multimedia-assessment onderzoek. Het model onderscheidt vier mogelijke doelen die het ontwerp van multimedia sturen: efficiëntie, effectiviteit, gebruikersbeleving en toegankelijkheid.

Discussie

LAMMP biedt zowel theoretische als praktische bijdragen aan multimedia-assessments. Het model biedt een gestructureerd raamwerk voor het systematisch ontwerpen van multimedia-assessments, met nadruk op de rol van multimedia en de onderlinge samenhang van diverse aspecten. Daarnaast biedt het model helderheid over aspecten die eerder niet of slechts fragmentarisch werden gedefinieerd, zoals de doelen van multimedia in assessments. Het wijst op onderzoekslacunes en ondersteunt de ontwikkeling van evidence-based richtlijnen. Praktisch kan LAMMP ontwerpers ondersteunen bij het ontwikkelen van multimedia-assessmentitems die aansluiten bij specifieke behoeften van deelnemers en bijdragen aan verbeterde toegankelijkheid. LAMMP biedt een eerste theoretisch raamwerk voor multimedia-assessment dat, met inbreng uit het onderzoeksveld, verder kan groeien tot een flexibel en robuust model voor innovatieve toetsing en praktisch toepasbare, theoretisch onderbouwde multimedia-assessments.

Referenties

Arts, J., Emons, W., Dirkx, K., Joosten-ten Brinke, D., & Jarodzka, H. (2024). Exploring the multimedia effect in testing: The role of coherence and item-level analysis. Frontiers in Education, 9:1344012. https://doi.org/10.3389/feduc.2024.1344012

Dirkx, K. J. H., Skuballa, I. T, Manastirean-Zijlstra, C. S., & Jarodzka, H. (2021). Designing computer-based tests: Design guidelines from multimedia learning studied with eye tracking. Instructional Science, 49(5), 589–605. https://doi.org/10.1007/s11251-021-09542-9

Imhof, B., Jarodzka, H., & Gerjets, P. (2009). Classifying instructional visualizations: A psychological approach. IMAGE Zeitschrift für Interdisziplinäre Bildwissenschaft / Journal of Interdisciplinary Image Science, 10, 99-123.

Jarodzka, H., Janssen, N., Kirschner, P. A., & Erkens, G. (2015). Avoiding split attention in computer-based testing: Is neglecting additional information facilitative? British Journal of Educational Technology, 46(4), 803–817. https://doi.org/10.1111/bjet.12174

Kirschner, P. A., Park, B., Malone, S., & Jarodzka, H. (2017). Toward a cognitive theory of multimedia assessment (CTMMA). In M. J. Spector, B. B. Lockee, & M. D. Childress (Eds.), Learning, Design, and Technology. An International Compendium of Theory, Research, Practice, and Policy (pp. 1-23). Springer. https://doi.org/10.1007/978-3-319-17727-4_53-1

Lindner, M.A. (2022). Principles for educational assessment with multimedia. In R. E. Mayer & L. Fiorella (Eds). The Cambridge Handbook of Multimedia Learning (3rd ed., pp. 552-565). Cambridge University Press. https://doi.org/10.1017/9781108894333

 

Invloed van Essentiële Afbeeldingen in Toetsitems op Prestatie en Kijkgedrag

Jorik Arts1, Wilco Emons2, Desirée Joosten-ten Brinke3, Halszka Jarodzka4
1Fontys, 2Tilburg University, 3Maastricht University, 4Open Universiteit, Netherlands, The

Inleiding: Onderzoek toont aan dat representatieve afbeeldingen in toetsitems de prestatie kunnen verhogen en de ervaren moeilijkheid kunnen verlagen zonder dat dit deelnemers extra tijd kost (Lindner, 2020; Lindner et al., 2018; Saß et al., 2012). Tegenover de onderzoeken die positieve effecten laten zien voor deelnemers, zijn er ook onderzoeken waarbij er geen effect is gevonden (Berends & van Lieshout, 2009; Dewolf, et al., 2015), Dit laatste zou veroorzaakt kunnen worden doordat er bij sommige items wel een effect is van het gebruik van afbeeldingen en bij andere items in dezelfde toets niet. Bij een analyse op item-niveau bleken effecten inderdaad uiteenlopend (Arts et al., 2024).

Naast representatieve afbeeldingen worden in toetsen ook vaak afbeeldingen gebruikt die essentiële informatie bevatten. Het gaat daarbij dan om afbeeldingen die iets zichtbaar maken wat niet in de tekst is weergegeven, maar wat wel essentieel is voor het beantwoorden van de toetsitem. Hoe afbeeldingen met deze functionaliteit de prestatie van deelnemers beïnvloeden is nog onbekend.

Onderzoeksvraag: Hoe beïnvloeden afbeeldingen met essentiële informatie de prestatie en het kijkgedrag van deelnemers?

Methode: We voerden een digitale toets uit met 124 deelnemers, waarbij elk toetsitem in twee versies werd getest: alleen-tekst en multimedia. We vergeleken de p-waarde, time-on-task (seconden) en subjectief ervaren moeilijkheid (Paas-schaal, 1992). Daarnaast volgden we het kijkgedrag van 28 deelnemers met eye-tracking (Tobii Pro Fusion).

Resultaten en discussie: Resultaten tonen wisselende effecten van essentiële afbeeldingen op prestatie, time-on-task en ervaren moeilijkheid. Voor enkele, maar lang niet alle items was het effect van de afbeeldingen op de genoemde variabelen significant. Voorlopige analyses van het eye-tracking onderzoek toont aan dat essentiële afbeeldingen het kijkgedrag beïnvloeden, waarbij relatief gezien minder tijd wordt besteed aan de vraagstelling.

Essentiële afbeeldingen hebben voor sommige items een significant effect op prestatie, time-on-task en ervaren moeilijkheid. Eye-tracking biedt gedeeltelijke verklaringen. Het gebruik van LAMMP, zoals gepresenteerd in de eerste bijdrage van dit symposium biedt mogelijkheden om te komen tot duidelijkere verklaringen van de resultaten.

Referenties

Arts, J., Emons, W., Dirkx, K., Joosten-ten Brinke, D. and Jarodzka, H. (2024) Exploring the multimedia effect in testing: the role of coherence and item-level analysis. Front. Educ. 9:1344012. doi: https://10.3389/feduc.2024.1344012

Berends, I. E., & van Lieshout, E. C. D. M. (2009). The effect of illustrations in arithmetic problem-solving: Effects of increased cognitive load. Learning and Instruction, 19(4), 345-353. doi:https://doi.org/10.1016/j.learninstruc.2008.06.012

Dewolf, T., Van Dooren, W., Hermens, F., & Verschaffel, L. (2015). Do students attend to representational illustrations of non-standard mathematical word problems, and, if so, how helpful are they? Instructional Science, 43(1), 147-171. doi:10.1007/s11251-014-9332-7

Lindner, M. A. (2020). Representational and decorative pictures in science and mathematics tests: Do they make a difference? Learning and Instruction, 68, 101345. doi:https://doi.org/10.1016/j.learninstruc.2020.101345

Lindner, M. A., Ihme, J. M., Saß, S., & Köller, O. (2018). How representational pictures enhance students’ performance and test-taking pleasure in low-stakes assessment. European Journal of Psychological Assessment, 34(6), 376.

Paas, F. G. (1992). Training strategies for attaining transfer of problem-solving skill in statistics: a cognitive-load approach. Journal of Educational Psychology, 84(4), 429.

Saß, S., Wittwer, J., Senkbeil, M., & Köller, O. (2012). Pictures in test items: Effects on response time and response correctness. Applied Cognitive Psychology, 26(1), 70-81. doi:https://doi.org/10.1002/acp.1798

 

De invloed van een realistische context op de meetvaliditeit van game-based assessment

Aranka Bijl1, Bernard P. Veldkamp2, Sebastiaan De Klerk1, Saskia Wools1
1Cito, 2University of Twente

Inleiding

De inzet van games als multimediavorm wordt steeds populairder in de onderwijspraktijk, met name voor het verhogen van de motivatie en de betrokkenheid bij leerlingen. Gezien het feit dat games ook data kunnen verzamelen over het vaardigheidsniveau van studenten kan verzamelen, zijn ze ook een veelbelovende methode voor summatieve toetsing, oftewel game-based assesment. Games weerspiegelen vaak een alternatieve realiteit. Echter is er weinig bekend over de noodzaak van het nabootsen van een realistische context in game-based assessment. Dit onderzoek beoogt hierover duidelijkheid te geven, met name met betrekking tot generieke vaardigheden die in meer contexten kunnen worden getoetst.

Theoretisch kader

De inzet van games bij toetsing zorgt voor een meer plezierige toetsbeleving (Boyle et al., 2012), vrijheid om (praktijk)situaties na te bootsen (Bell et al., 2008; Dörner et al., 2016) en het verzamelen van rijke maar ook gestandaardiseerde data over de vaardigheid van studenten (Schwartz & Arena, 2013; Shaffer & Gee, 2012). Games worden onder andere geassocieerd met het bieden van een alternatieve realiteit (Charsky, 2010). Bij het toetsen van vaardigheden wordt normaliter gestreefd naar een toets die authentiek is op verschillende vlakken, waaronder taak en context (Gulikers et al., 2004). Bij generieke vaardigheden gaat het echter ook om een te volgen proces. In dit onderzoek wordt gekeken naar de noodzaak van een realistische simulatie van taak en context voor een valide meting van informatie-gestuurd probleem oplossen.

Onderzoeksvragen

Voor dit onderzoek zijn drie gameversies ontwikkeld om de vaardigheid informatie-gestuurd probleem oplossen van boa-studenten te meten (Brand-Gruwel et al., 2005; Frerejean et al., 2019). De gameversies variëren in de mate van realistische taak- en contextsimulatie. In Kruispunt plannen studenten surveillanceroute, in Kruistocht plannen studenten een excursie en in Kruisverhoor onderzoeken studenten een moord. Aan de hand van de studentresponses en een vragenlijst, zijn de volgende onderzoeksvragen beantwoord:

1) Wat is de invloed van de authenticiteit van de taak en de context op de meting van de vaardigheid informatie-gestuurd probleem oplossen?

2) Hoe beoordelen de studenten de drie gameversies in termen van bruikbaarheid en gezichtsvaliditeit?

Methode

Ruim 100 boa-studenten speelden Kruispunt en een van de andere gameversies in een gerandomiseerd design. Gezichtsvaliditeit en bruikbaarheid zijn gemeten met een vragenlijst.

Resultaten en discussie

De voorlopige analyses wijzen uit dat de prestaties op Kruispunt geen verband houden met prestaties op de andere game-versies. Dit betekent dat ze niet hetzelfde construct lijken te meten. Studenten waren overwegend positief over de bruikbaarheid van de drie gameversies; Kruisverhoor werd als het meest spelachtig ervaren. Hoe lager de mate van realistische taak- en contextsimulatie, hoe lager de beoordeling op gezichtsvaliditeit. Studenten geloofden minder dat met Kruistocht en Kruisverhoor dezelfde vaardigheid werd gemeten als met Kruispunt. De verwachting is dat een gebrek aan gezichtsvaliditeit ook invloed heeft gehad op de prestatie. Bij het meten van een generieke vaardigheid bij een specifieke doelgroep lijkt een ‘generieke’ game-based assessment niet de juiste weg. Een potentiële onderzoeksrichting voor generieke games is het gebruik ervan bij omscholingen en studiekeuzebegeleiding, waar een dergelijke game duurzaam en breed ingezet kan worden.

Referenties

Bell, B. S., Kanar, A. M., & Kozlowski, S. W. J. (2008). Current issues and future directions in simulation-based training in North America. The International Journal of Human Resource Management, 19(8), 1416-1434. https://doi.org/10.1080/09585190802200173

Boyle, E. A., Connolly, T. M., Hainey, T., & Boyle, J. M. (2012). Engagement in digital entertainment games: A systematic review. Computers in Human Behavior, 28(3), 771-780. https://doi.org/10.1016/j.chb.2011.11.020

Brand-Gruwel, S., Wopereis, I., & Vermetten, Y. (2005). Information problem solving by experts and novices: Analysis of a complex cognitive skill. Computers in Human Behavior, 21(3), 487–508. https://doi.org/10.1016/j.chb.2004.10.005

Charsky, D. (2010). From Edutainment to Serious Games: A Change in the Use of Game Characteristics. Games and Culture, 5(2), 177-198. https://doi.org/10.1177/1555412009354727

Dörner, R., Göbel, S., Effelsberg, W., & Wiemeyer, J. (2016). Introduction. In R. Dörner, S. Göbel, W. Effelsberg, & J. Wiemeyer (Eds.), Serious Games: Foundations, Concepts and Practice (pp. 1-34). Springer International Publishing. https://doi.org/10.1007/978-3-319-40612-1_1

Frerejean, J., Velthorst, G. J., van Strien, J. L. H., Kirschner, P. A., & Brand-Gruwel, S. (2019). Embedded instruction to learn information problem solving: Effects of a whole task approach. Computers in Human Behavior, 90, 117–130 https://doi.org/10.1016/j.chb.2018.08.043

Gulikers, J. T. M., Bastiaens, T. J., & Kirschner, P. A. (2004). A five-dimensional framework for authentic assessment. Educational Technology Research and Development, 52(3), 67-86. https://doi.org/10.1007/BF02504676

Schwartz, D. L., & Arena, D. (2013). Measuring what matters most: Choice-based assessment for the digital age. The MIT Press.

Shaffer, D. W., & Gee, J. P. (2012). The right kind of GATE: Computer games and the future of assessment. In M. C. Mayrath, J. Clarke-Midura, & D. H. Robinson (Eds.), Technology-based assessments for 21st century skills: Theoretical and practical implications from modern research (pp. 211-228). Information Age Publishing.

Kerckhoffs-Multimedia in assessment-329_a.pdf
Kerckhoffs-Multimedia in assessment-329_b.pdf