Francisco del Moral Manzanares
La presente investigación se centra en una experiencia docente desarrollada en el Centro Lingüístico de la Universidad de Verona, en el ámbito de la evaluación de la expresión e interacción orales de nivel C2. Más concretamente, se trató de averiguar si, teniendo en cuenta el propio contexto de enseñanza, podría ser útil para aumentar la fiabilidad de la prueba, el uso de escalas de descriptores, que hasta ese momento no se habían utilizado. Se crearon para ello una serie de escalas, partiendo de las analíticas que el Instituto Cervantes aplica en los DELE.
El estudio empírico se realizó en colaboración con otra profesora del centro, durante la sesión oficial de exámenes de julio de 2012. Una vez grabados, se seleccionó una muestra representativa y se procedió a calificarlos sucesivas veces con un lapso de tiempo de varios días, hasta conseguir cuatro calificaciones de cada examen. Dos se realizaron con ayuda de escalas de descriptores y las otras dos, sin ella.
Los resultados permitieron comprobar que el uso de las escalas de descriptores aumentó significativamente la fiabilidad externa de la prueba (interevaluadora, entre los dos evaluadores) y, en menor medida, la interna (intraevaluadora, de cada evaluador consigo mismo).
This piece of research was carried out by teaching staff at the University of Verona Language Centre and regards the evaluation of oral production and interaction skills at a C2 level. In particular, the research aimed to find out whether, within this teaching context, the use of a rating scale, which up until that point was not being used, could lead to an increase in test reliability.
The empirical study was carried out in collaboration with a fellow teacher from the Language Centre, and began during the July 2012 exam session. A representative sample was chosen from recordings of the test sessions and each test was rated a total of four times with an interval of a few days between each evaluation. Two of the evaluations were carried out using the rating scale and two without.
The results showed that the use of the rating scale increased the inter-rater reliability of the test and, to a lesser extent, the intra-rater reliability.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados