Nuevas Perspectivas sobre Evaluación en Educación Física

New Topics About Assessment in Physical Education

Víctor Manuel López-Pastor

E.U. Magisterio de Segovia- Universidad de Valladolid..

Artículo publicado en el journal Revista de Educación Física, Volumen 29, Número 3 del año .

Resumen

El objetivo del estudio es realizar una revisión de la temática de la evaluación en Educación Física (EF) en la literatura internacional especializada. La búsqueda ha cubierto las revistas de mayor difusión internacional y los principales libros especializados en lengua inglesa. Se ha generado un sistema de cuatro categorías para poder organizar todos los datos encontrados. Los resultados indican que en los últimos años se está investigando en torno a cuatro líneas: 1-la evaluación de la condición física en EF; 2-la evaluación en la iniciación deportiva desde el modelo comprensivo; 3-la evaluación alternativa, auténtica e integrada en EF y la implicación del alumnado en el proceso; 4-la Evaluación en la formación del profesorado de EF (FPEF). En las conclusiones se revisan el estado de la cuestión en estas cuatro temáticas, así como las nuevas líneas de investigación y práctica educativa que parece necesario generar.

Palabras clave: evaluación, educación física, formación del profesorado de educación física, evaluación alternativa, evaluación auténtica.

Abstract

The aim of this study is to review the international literature on the subject of assessment in Physical Education (PE). The search has covered the highest impact journals and international diffusion levels in the area, and the main books on the subject in English. A system of four categories has been generated to organize all the data found. The results indicate that in recent years there have been works around four lines of research in the field: 1-the assessment of Physical Fitness in PE; 2-Assessment in the Sport Education from Games for Understanding Model, 3-Alternative, Authentic and Integrated Assessment in PE and the involvement of students in the process; 4-The Assessment in PE Teacher Education. The conclusions review the state of these topics and the new lines of research and educational practice that seems to be generated.

Keywords: assessment, physical education, physical education teacher education, alternative assessment, authentic assessment.

1-INTRODUCCIÓN: LOS NUEVOS TIPOS DE EVALUACIÓN EDUCATIVA Y SUAPLICACIÓN EN EDUCACIÓN FÍSICA

Cuando se trata el tema de los diferentes tipos de evaluación en Educación Física (EF), la mayoría de los trabajos publicados en los últimos años en nuestro país siguen haciendo referencia a los conceptos más clásicos: evaluación inicial, continua, final, diagnóstica, formativa, sumativa, cuantitativa, cualitativa, observacional, experimental, objetiva, subjetiva, calificativa, autoevaluación, coevaluación, etc. (Blázquez, 1990; Hernández y Velázquez, 2004; López, 2006; López et al, 2008; Lorente y Joven, 2009). En cambio, desde hace una década y media, en la literatura internacional pueden encontrarse nuevos tipos de evaluación en EF sumamente interesantes desde un punto de vista pedagógico: Evaluación Alternativa, Evaluación Formadora, Evaluación para el Aprendizaje, Evaluación Auténtica, Evaluación Integrada, Evaluación orientada al aprendizaje. Cada uno de estos términos aporta matices interesantes a la forma de entender la evaluación educativa, aunque, desde nuestro punto de vista, la mayor parte de sus planteamientos ya están recogidos en el concepto de “evaluación formativa”, entendido en un sentido amplio.

Estos nuevos conceptos surgen con la intención de marcar diferencias con las prácticas evaluativas más tradicionales. También aportan matices nuevos a los términos ya existentes e intentar explicar formas diferentes de entender y llevar a cabo la evaluación en EF. A continuación vamos a intentar explicar el significado principal de cada uno de ellos, incorporando las referencias de los principales autores que han generado y difundido estos términos en la literatura internacional especializada.

1.1-La evaluación formativa

La “Evaluación Formativa” (Formative Assessment) hace referencia a todo proceso de evaluación cuya finalidad principal es mejorar los procesos de enseñanza-aprendizaje que tienen lugar. Richard y Godbout (2000) defienden la realización de una evaluación formativa como parte integral del proceso de enseñanza-aprendizaje en EF y desarrollan una serie de principios pedagógicos para llevarla a cabo.

1.2- La evaluación orientada al aprendizaje y la evaluación para el aprendizaje

Zhu (2007) hace referencia a la ”Evaluación Centrada en el Aprendizaje” (“Learning-Centered Assessment”) como un sistema de evaluación propio de los sistemas de enseñanza de EF centrados en el aprendizaje del alumnado. Cita diferentes estudios cuyos resultados muestran que los estudiantes logran un mayor rendimiento cuando se utiliza una evaluación centrada en el aprendizaje. Este término guarda una estrecha relación con el de “Evaluación para el Aprendizaje” (“Assessment for learning”) (Casbon y Spackman, 2005; Hay, 2006; Robinson, 1992), el cual hace referencia a que la evaluación educativa esté claramente orientada a mejorar el aprendizaje del alumnado, en vez de estarlo al mero control de éste y su calificación (Hopple, 1995). Este planteamiento guarda una estrecha relación con lo señalado por Desrosiers, Genet-Volet y Godbout (1997) sobre la necesidad de pasar de la “Cultura de los test” a la “Cultura de la evaluación”. Casbon y Spackman (2005) desarrollan un amplio trabajo sobre esta temática, profundizando en el concepto de Evaluación para el Aprendizaje en EF, así como analizando las posibilidades y ventajas de su uso. Aporta numerosos ejemplos concretos (13 estudios de caso) de cómo llevarla a cabo en cada ciclo de la educación obligatoria y en diferentes contenidos de aprendizaje. Hay (2006) realiza una amplia revisión sobre la temática, mientras que el trabajo de Robinson (1992) puede situarse en una línea similar, al relacionar de forma clara la evaluación y la mejora del aprendizaje del alumnado, aunque no utiliza de forma específica este concepto.

En nuestra opinión, el concepto de Evaluación para el Aprendizaje es una concreción muy específica y parcial del concepto de “Evaluación Formativa”, dado que se centra exclusivamente en el aprendizaje del alumnado. Aunque supone un paso importante, al poner el énfasis en que la finalidad principal de la evaluación debe ser la mejora del aprendizaje.

1.3-La evaluación auténtica

El concepto de “Evaluación Auténtica(“Authentic Assessment”) es utilizado con mayor frecuencia en EF (Desrosiers, Genet-Volet y Godbout, 1997; Gréhaigne, Godbout y Bouthier, 1997; Melograno, 1997, 1998, 2000; Mintah, 2003; Oslin, Mitchell y Griffin, 1998; Richard, Godbout, Tousignant y Gréhaigne, 1999; Richard y Goudbout, 2000; Veal, 1988). Hace referencia al hecho de que las técnicas, instrumentos y actividades de evaluación estén claramente aplicados en situaciones, actividades y contenidos reales del aprendizaje. Se opone, por tanto, a las situaciones puntuales y artificiales de evaluación, alejadas de la práctica real o de la aplicación real de dichos conocimientos. Desrosiers, Genet-Volet y Godbout (1997) consideran que la Evaluación Auténtica cumple tres tipos de características: (a) está integrada en el proceso de enseñanza-aprendizaje; (b) comparte el proceso de evaluación con el alumnado y (c) da más importancia a una evaluación con una clara orientación formativa. Según Mintah (2003) la evaluación auténtica hace referencia a la utilización de múltiples técnicas e instrumentos para poder evalúan diferentes capacidades y competencias en situaciones más reales o que tengan trasferencia con la vida real fuera del aula. Para Zhu (2007) la evaluación auténtica se centra en la evaluación de aprendizajes aplicables en la vida real. No se limita al simple control del conocimiento adquirido, sino también a como es comprendido y utilizado en situaciones reales. Para Richard y Godbout (2000) lo esencial de la evaluación auténtica es el uso regular y sistemático de la evaluación formativa en el proceso de enseñanza-aprendizaje. Por su parte, Mintah (2003) considera que la evaluación auténtica evalúa tanto el producto como la calidad del proceso, logrando que el alumnado se implique más en el proceso de aprendizaje. El alumnado sabe cómo va a ser evaluado y mejora su interés y motivación. En cambio, los sistemas de evaluación más tradicionales en EF muestran una influencia negativa en la motivación, interés y autoconcepto de los estudiantes de secundaria. Este autor defiende que se trata de un sistema de evaluación coherente con los planteamientos constructivistas y que genera una mayor interconexión entre la enseñanza, la evaluación y el aprendizaje. Por tanto, coincide con Desrosiers, Genet-Volet y Godbout (1997) cuando consideran que la evaluación auténtica valora tanto el proceso como el resultado de aprendizaje y proporciona la posibilidad de compartir la responsabilidad de la evaluación con el alumnado. Eso sí, es necesario emplear más tiempo para planificarla y llevarla a cabo. Esta característica hace que algunos profesores de EF piensen que se trata de una labor excesiva (Desrosiers, Genet-Volet y Godbout, 1997; Mintah, 2003).

1.4-La evaluación integrada

El concepto de “Evaluación integrada” (“Integrated Assessment”) guarda una estrecha relación con el de “Evaluación Auténtica”, hasta el punto de ser una de sus características. Desrosiers, Genet-Volet y Godbout (1997) plantean que la evaluación debe estar integrada en el proceso de enseñanza-aprendizaje, formando parte del mismo.

Melograno (1997) también defiende la necesidad de integrar la evaluación en EF y la estrecha relación que este tipo de evaluación guarda con la realización de una evaluación auténtica, el uso del portafolio y la implicación del alumnado en el proceso, mediante técnicas de auto y coevaluación.

1.5-La evaluación alternativa.

El concepto “Evaluación Alternativa” (Alternative Assessment) hace referencia a todas las técnicas y métodos de evaluación que intentan superar a la metodología tradicional de evaluación, basada en la simple realización de pruebas y exámenes, con la finalidad única o principal de calificar. En este sentido, agrupa el resto de conceptos que acaban de ser revisados. También hace referencia al esfuerzo por desarrollar nuevos sistemas e instrumentos de evaluación de mayor valor educativo. En EF pueden encontrarse algunas referencias sobre este tipo de evaluación en Hensley (1997), Hopple (1995, 2005), Mintah (2003), Melograno (1998, 2000) y Zhu (1997).

Hopple (1995, 2005) desarrolla en profundidad esta temática en un libro específico sobre la enseñanza y la evaluación en EF, junto al trabajo con estándares en EF y abundantes ejemplos concretos de instrumentos y técnicas para poder desarrollar este tipo de evaluación en los diferentes contenidos de aprendizaje. Considera que la evaluación alternativa en EF tiene 4 grandes tipos de instrumentos: (a) los productos concretos y variados; (b) las explicaciones sobre realizaciones o resoluciones; (c) el portafolio como recopilación de demostraciones del proceso de aprendizaje; y (d) los comportamientos observables de habilidades y capacidades.

Se trata de un concepto sobre el que todavía existe cierto debate; Mintah (2003) explica que algunos autores consideran como sinónimos los términos de “Evaluación Auténtica” y “Evaluación Alternativa”, mientras que otros los consideran diferentes.

2-Metodología

La finalidad de este estudio es realizar una revisión del estado de la cuestión sobre el tema de la evaluación en EF en la literatura internacional especializada. Para ello, se ha llevado a cabo una primera revisión de las cuatro revistas internacionales de EF de mayor difusión: Sport, Education and Society; Journal of Teaching in Physical Education, QUEST; Physical Education and Sport Pedagogy. El segundo paso fue la realización de búsquedas específicas en bases de datos, que nos llevaron a revisar otras revistas internacionales: Physical Educator; Measurement in Physical Education and Exercise Science; Journal of Physical Education, Recreation and Dance; Physical and Health Education Journal. En tercer lugar se revisaron los principales libros sobre la temática en lengua inglesa. Tras realizar un análisis de contenido de todos los documentos encontrados establecimos el sistema de categorías, en función de criterios de significatividad y saturación estadística, para organizar y analizar los datos recogidos. Las categorías establecidas son las siguientes: (1) la evaluación de la condición física en EF; (2) la evaluación de la iniciación deportiva y el modelo comprensivo; (3) prácticas de evaluación alternativa, auténtica e integrada en EF y la implicación del alumnado en los procesos de evaluación; (4) la evaluación en la formación del profesorado de EF y en la evaluación de programas.

En lo referente a los aspectos metodológicos, hemos encontrado dos trabajos que guardan algunas similitudes metodológicas con el presente estudio. En Ward y Lee (2005) puede encontrarse una revisión de investigaciones y trabajos sobre enseñanza recíproca en EF, en la que también aparecen numerosos trabajos de coevaluación. En Wallhead y O`Sullivan (2005) puede encontrarse un estudio de revisión de artículos sobre educación deportiva en revistas con sistema de revisión por pares.

3-Resultados

En éste apartado vamos a presentar los resultados encontrados, organizados en las cuatro categorías establecidas.

3.1-La Evaluación de la Condición Física en Educación Física

Según Carroll (1994), aproximadamente el 90% del profesorado de EF utilizaba los “Test de Condición Física” (TCF) en sus programaciones. Este autor recopila las diferentes críticas que se han realizado sobre el uso de los TCF en la literatura anglosajona, haciendo especial énfasis en las que se señalan la fuerte influencia de las variables extrañas en los resultados del alumnado (genética, crecimiento, motivación, habilidad, etc.). También explica que pueden tener efectos negativos en la motivación si no se utilizan las tablas y referencias apropiadas para cada grupo y contexto. El autor considera que el uso de TCF puede ser apropiados si se utilizan con una finalidad diagnóstica o en procesos de autoevaluación, para que el alumnado pueda observar su progreso; pero el rendimiento obtenido en los TCF nunca debería ser calificable.

Hopple y Graham (1995) critican que la aplicación de TCF ha sido la forma más común de evaluar en EF desde los años 60. También critican que a pesar de los numerosos estudios realizados sobre dichos test, casi nadie se ha interesado por investigar el punto de vista del alumnado sobre la realización de los mismos. Estos autores realizan un estudio sobre que piensan, sienten y saben los alumnos de primaria sobre los TCF, centrándose en uno de ellos: la carrera de una milla, así como las diferencias entre los que obtienen buenas puntuaciones y los que las obtienen malas. Para ello realizan entrevistas semiestructuradas y una prueba corta de conocimiento a una muestra de 52 alumnos de dos centros de primaria en los que se aplica la misma batería de test. Los resultados encontrados parecen indicar que la mayoría de los estudiantes no comprenden con claridad para qué hacen el test, mientras que a muchos estudiantes no les gusta realizarlo, hasta el punto de que desarrollan diferentes estrategias para evitarlo. Este sentimiento es común entre todo el alumnado que obtiene malos resultados en el test, pero también lo manifiesta parte del alumnado que obtiene buenos resultados. Muchos estudiantes cambiarían el test por otro tipo de prueba si se les diera dicha oportunidad. La mayoría del alumnado no vive la aplicación de los test como una experiencia significativa ni positiva; de hecho algunos lo viven como una experiencia tan negativa que desarrollan estrategias para evitar su realización. Esta vivencia durante la infancia puede condicionar negativamente la realización de actividad física fuera de la escuela, así como en años posteriores. Los autores consideran que es importante explorar nuevos TCF orientada a la salud que sean más relevantes y apropiados para el alumnado de estas etapas, como una pieza más a la hora de conseguir que los jóvenes realicen actividad física de forma regular.

Por su parte, Hill y Miller (1997) realizan un análisis de correlación estadística entre la coevaluación y la evaluación del profesor sobre el rendimiento en condición física. Encuentran valores altos en los cinco test realizados (entre 0.87 y 1.00). Posteriormente, Placek et al (2001) estudian las concepciones del alumnado de secundaria de EF sobre la condición física, desde la perspectiva de que este tipo de trabajo en EF debería estar enfocado hacía el desarrollo de estilos de vida saludables. Cuando investigan lo que el alumnado de secundaria sabe sobre condición física, los resultados son considerablemente negativos: sus conocimientos sobre esta cuestión son mínimos y cada vez se obtienen peores resultados en los TCF, así como en los estilos de vida de esta franja de población. Los autores hacen algunas interpretaciones sobre las posibles causas de esta situación: (a) los programas de EF no se centran en la condición física o lo hacen de forma inadecuada; (b) las escuelas no tienen suficiente equipamiento para proporcionar un buen trabajo de la condición física; (c) el profesorado de EF no tiene conocimientos didácticos suficientes para ofrecer una buena enseñanza de la condición física; (d) la marginación de la EF en los centros; (e) la tradición de centrar la EF en lo deportivo; y (f) la dificultad de que profesorado, padres y alumnos valoren los aprendizajes conceptuales en EF. También influyen notablemente las resistencias y falta de motivación del alumnado con todo lo que tenga que ver con la condición física.

Keating (2003) realiza una revisión de los programas nacionales de TCF aplicados en Estados Unidos en el área de EF en primaria y secundaria. Afirma que los TCF se han aplicado en los programas de EF desde hace más de un siglo Las principales críticas que recoge son las siguientes: (1) pone en duda la eficacia de los mismos, dado que cada vez se obtienen peores resultados, así como mayores índices de sobrepeso y menores de actividad física regular; (2) con los TCF no se evalúa lo que se enseña en la programación; (3) no hay evidencias de que exista relación entre los resultados en los test y la realización de actividad física; (4) varios autores recomiendan que los resultados de los test no sean utilizados para calificar al alumnado, a pesar de la extensión de su uso; (5) no son relevantes en la enseñanza de la EF; (6) hay un olvido en la utilización de TCF orientados a la salud; (7) existe una grave carencia de componentes cognitivos en los TCF orientados a la salud, de forma que el alumnado no conoce lo que hace ni para qué sirve; (8) existen evidencias de actitudes negativas del alumnado hacía los TCF y les resultan aburridos y repetitivos; (9) la validez y fiabilidad de algunos test es cuestionable; (10) muchos test no son aplicables en condiciones reales de enseñanza o requieren demasiado tiempo para su aplicación; consumen mucho tiempo del horario de EF. Termina el trabajo aportando algunas posibles soluciones para la aplicación de TCF en los programas de EF: (a) no utilizarlos para calificar al alumnado, sino con otras finalidades formativas y de aprendizaje; (b) generar conocimiento en el alumnado sobre los test, e incluir en las baterías de test pruebas escritas sobre los mismos, para evaluar dicho conocimiento; (c) desarrollar nuevos test que estén orientados de forma clara a la salud y que sean adecuados para las edades del alumnado; (d) poner el énfasis en la salud; (e) evaluar para mejorar, para promover la mejora en la condición física del alumnado. Un año después, Keating y Silverman (2004) publican un trabajo sobre el proceso de validación del Cuestionario para la Medición de las Actitudes del Profesorado de EF hacía la utilización de TCF en la escuela (PETAFTS). El artículo recoge algunas informaciones relevantes, como que no se ha recogido ningún tipo de evidencia de que la aplicación de TCF incremente el nivel de actividad física.

Jackson (2006) explica que en las últimas décadas en EF se está pasando de la realización de TCF como sistema de evaluación-calificación, a realizarlos más orientados a la salud. También analiza como en estos momentos ya existe un buen número de pruebas validadas, tanto de laboratorio como de campo, para la valoración de la condición física orientada a la salud. Por su parte, Halas y Gannon (2006a) realizan una revisión de la evolución de la aplicación de los TCF en los programas de EF, los errores cometidos y las consecuencias que ello ha tenido en el rechazo por parte del alumnado de este tipo de actividad física. Su propuesta es que el alumnado aprenda los principios básicos para el trabajo de la condición física, de modo que comprenda que miden los TCF y que utilidades pueden tener. Para ello, hay que poner el énfasis en el proceso de ser activos, de modo que las prácticas de evaluación de la condición física puedan ser más apropiadas y significativas para el alumnado. En un segundo artículo (Halas y Gannon, 2006b) presentan algunas indicaciones y propuestas prácticas sobre como cambiar la forma de trabajar la enseñanza de la condición física.

3.2- La evaluación de la Iniciación Deportiva y el Modelo Comprensivo

Hemos encontrado varios artículos que tratan la temática de la evaluación en los contenidos de iniciación deportiva, la mayor parte de ellos pertenecen al enfoque conocido en nuestro país como “modelo comprensivo” y están muy ligados a la evaluación alternativa, auténtica e integrada. Gréhaigne, Godbout y Bouthier (1997) desarrollan un instrumento para evaluar los resultados individuales en los deportes de equipo que sea útil como evaluación inicial y formativa dentro de las unidades didácticas de enseñanza deportiva, con un enfoque de evaluación auténtica y en la que el alumnado participa de forma activa en el proceso de evaluación. En este trabajo muestran el estudio de validación del instrumento TSAP (Team Sport Assessment Procedure), con alumnado de secundaria de 13-14 años. Los autores consideran que se trata de una evaluación integrada, dado que cumple el principio de validez ecológica (la utilización del instrumento no altera el funcionamiento normal del proceso de aprendizaje) y el principio de participación activa del alumnado (se aplica como evaluación entre iguales). Los resultados muestran que se trata de un procedimiento de evaluación muy adecuado para el trabajo de iniciación deportiva por el modelo comprensivo. El artículo contiene ejemplos de las fichas de observación utilizadas, así como de las escalas gráficas asociadas para la obtención de la puntuación y la representación gráfica de los índices de eficacia y el volumen de juego. Es muy importante que el alumnado aprenda previamente como utilizar la ficha y realizar las observaciones de forma correcta. Al utilizarlo como evaluación entre iguales la evaluación se convierte en una actividad de aprendizaje, tanto para los observadores como para los jugadores, cuando ven los resultados reflejados en la ficha y se les induce a reflexionar sobre puntos débiles y como mejorarlos en próximas situaciones de juego. Destacan que se trata de un instrumento de evaluación auténtica, formativa e integrada para la evaluación individual de resultados en deportes de equipo. Afirman que los estudiantes son el centro del proceso de aprendizaje y participantes activos del proceso de evaluación. Poco después, Oslin, Mitchell y Griffin (1998) desarrollan un instrumento para la Evaluación de los Juegos Deportivos, que denominan GPAI (Game Performance Assessment Instrument). Desarrollan un protocolo amplio para poder evaluar siete componentes en cualquier tipo de juego deportivo y realizan un estudio de validación del mismo. Los resultados encontrados sugieren que el GPAI es un método válido y fiable para evaluar los resultados individuales en los juegos deportivos colectivos. Los autores entienden que se trata de una buena alternativa ante los test de habilidad deportiva que se venían utilizando mayoritariamente hasta entonces, especialmente porque es mucho más coherente con el contenido de aprendizaje y con el modelo de enseñanza comprensiva de los juegos deportivos. Está diseñado para utilizarse como instrumento de evaluación auténtica e integrada. En un artículo posterior, Richard, Godbout, Tousignant y Gréhaigne (1999) vuelven a presentan un nuevo desarrollo y experimentación del TSAP con 6 profesores de primaria y secundaria, para la evaluación integrada del trabajo sobre iniciación deportiva basado en el modelo comprensivo de juegos deportivos, obteniendo buenos resultados.

Posteriormente, Blomquist, Vanttimen y Luhtanen (2005) llevan a cabo un estudio sobre la utilización de la evaluación basada en el uso del vídeo en EF, en unidades didácticas de juegos modificados con estudiantes de secundaria, basados en el modelo de enseñanza comprensiva. Pretenden analizar si esta metodología guarda relación con la comprensión del juego y la toma de decisiones en situación real de juego. Los resultados parecen indicar que existe una fuerte relación entre los resultados en el examen basado en el uso del vídeo y los resultados de decisiones en situación de juego real. El alumnado muestra tener conocimientos básicos de ataque y defensa y que las mejores decisiones las toman en situación de atacante con balón.

3.3- Prácticas de Evaluación Alternativa, Auténtica e Integrada en EF y la implicación del alumnado en los procesos de evaluación

La primera referencia es el trabajo de Hopple (1995, 2005), que desarrolla el concepto de evaluación alternativa dentro de un manual sobre la enseñanza y la evaluación en EF. Considera que la evaluación alternativa en EF tiene 4 grandes tipos de instrumentos: producciones del alumnado, explicaciones sobre realizaciones o resoluciones, el portafolio y los comportamientos observables de habilidades y capacidades. Posteriormente Desrosiers, Genet-Volet y Godbout (1997) publican un estudio para analizar hasta qué punto los profesores de EF con experiencia llevan a cabo una evaluación integrada en el proceso de enseñanza-aprendizaje, que tipo de instrumentos de evaluación utilizan y que aspectos del aprendizaje consideran dichos instrumentos. Para ello desarrollan un proyecto de tres años, con 13 profesores de EF con experiencia. El primer año llevan a cabo un estudio descriptivo en diez centros de la ciudad de Quebec (Canadá), con un total de 183 sesiones observadas. Los resultados encontrados muestran que el 71% de los instrumentos de evaluación fueron utilizados para realizar una evaluación diagnóstica o formativa; el 70% de los instrumentos consistían en listas de control o escalas graduadas de aplicación individual y el 77% del tiempo los instrumentos fueron utilizados para evaluar habilidades técnicas y tácticas. También encuentran que los instrumentos de evaluación utilizados son coherentes con los contenidos de aprendizaje, lo cual es un aspecto importante de la evaluación auténtica; oponen esta característica a la costumbre de centrarse en criterios como participación, esfuerzo o actitud. Los otros dos años llevan a cabo un proyecto de investigación-acción, en el que encuentran un avance muy importante en la utilización de técnicas e instrumentos de evaluación auténtica por parte del profesorado participante. El estudio demuestra que es posible llevar a cabo una evaluación integrada en el proceso de enseñanza-aprendizaje, utilizando diversos tipos de instrumentos e implicando al alumnado en el proceso de evaluación.

En el mismo año, Melograno (1997) defiende la necesidad de llevar a cabo una evaluación integrada en EF, que se aproxime a las características de una evaluación auténtica, utilizando técnicas de auto y coevaluación y el portafolio. En trabajos posteriores (Melograno, 1998, 2000) plantea la utilización del portafolio como instrumento útil y adecuado de recopilación de evidencias sobre el aprendizaje del alumnado en los sistemas de evaluación alternativa y auténtica; también considera que ofrece grandes ventajas a la hora de llevar a cabo una evaluación naturalista y auténtica del aprendizaje del alumnado. Mintah (2003) realiza un estudio con 210 profesores en el que comprueba que la evaluación auténtica está siendo muy utilizada por el profesorado de EF en las escuelas públicas. Según los resultados encontrados, el 75,2 % del profesorado utiliza instrumentos propios de este tipo de evaluación. Es más utilizado en primaria que en secundaria, y más en los primeros cursos de la secundaria que en los últimos. Entre las razones que da el profesorado que no la utiliza, las principales son: (1) requiere una mayor disposición de tiempo; (2) no pueden llevarla a cabo en centros con mayor carga docente y menos horas semanales de EF con su alumnado; (3) no tienen formación suficiente para llevarla a cabo, ni inicial ni permanente. En este mismo sentido, dos años después Chen (2005) publica un estudio realizado con 15 profesores de EF de primaria, respecto al cumplimiento de los estándares nacionales en las prácticas evaluativas. Encuentra que sólo 5 profesores llevan a cabo una evaluación integrada y auténtica, utilizando, fundamentalmente, técnicas de coevaluación y escalas descriptivas.

Por su parte, Butler y Hodge (2001) realizan una revisión de los estudios sobre el uso de la coevaluación en EF. Los resultados encuentran varias ventajas: se aporta más feedback, mejora el aprendizaje, genera más sociabilidad y unas relaciones más positivas con sus compañeros, también indicados en el trabajo de Melograno (1997). Butler y Hodge (2001) aportan un par de aspectos clave para el profesorado que quiera utilizar la coevaluación: (a) dar las consignas necesarias antes de comenzar las clases; (b) informar al alumnado de lo que se espera de ellos y de cómo llevar a cabo la coevaluación.

Cassady, Clarke y Latham (2004) también publican un trabajo sobre participación del alumnado en la evaluación en EF, pero con un enfoque muy diferente. Evalúan las sensaciones y sentimientos de las estudiantes de secundaria sobre la evaluación, al evaluar y ser evaluadas, cuando se enfrentan a un sistema de auto y co-evaluación en una unidad didáctica de danza. Las alumnas reconocen que el sistema de evaluación las ayuda a mejorar y progresar y que sería beneficioso ver grabaciones en video de las ejecuciones más a menudo, para aprender más. También consideran positivo realizar co-evaluaciones porque ayuda a ver otras ideas, para mejorar la propia ejecución, además de poder comparar con su propio trabajo. Pero el alumnado indica también algunos aspectos negativos, pues surgen dos tipos de dificultades: (a) la dificultad técnica de evaluar con precisión el trabajo de otras compañeras y de dar feedback a las compañeras con las palabras precisas y sin ofenderlas; (b) los sentimientos negativos sobre el hecho de evaluar a las compañeras y ser evaluada por ellas, que generan ansiedad y tensión. Las autoras consideran que sería interesante lograr generar un sistema de evaluación que permita evaluar de forma confidencial y competente y usar la información para mejorar la ejecución en unidades didácticas de danza. Por su parte, Ward y Lee (2005) publican una revisión de ocho trabajos sobre co-evaluación en EF publicados en revistas internacionales. En 4 trabajos la co-evaluación forma parte de un trabajo de tutorización entre iguales en EF, 2 trabajos la utilizan para la realización de TCF y otros dos en la enseñanza de deportes, en línea a lo revisando en los apartados anteriores. Comprueban que los análisis de correlación que han realizado algunos de estos estudios encuentran valores altos con alumnado de secundaria cuando han sido bien entrenados para ello (correlaciones de 0.70-0.96 entre alumnado e investigadores), que indican un alto grado de fiabilidad.

Casbon y Spackman (2005) trabajan sobre el desarrollo de una evaluación para el aprendizaje en EF, aportando ejemplos y vídeos específicos sobre cómo llevarla a cabo en diferentes etapas y contextos educativos, recogidos en 13 estudios de caso llevados a cabo. También analizan las ventajas e inconvenientes de este tipo de evaluación en EF. En esta misma línea de trabajo, Hay (2006) publica un ensayo sobre el desarrollo de la evaluación para el aprendizaje como un nuevo paradigma de evaluación en EF, explicando sus orígenes, propósitos y fundamentos pedagógicos. También revisa las aplicaciones prácticas desarrolladas hasta ese momento así como su conexión con otros modelos y corrientes de EF.

Por su parte, Van Vuuren-Casar y Lamprianou (2006) publican un estudio sobre la evaluación sumativa del aprendizaje del alumnado en unidades didácticas de atletismo en secundaria, mediante exámenes escritos y exámenes basados en el visionado puntual de vídeos antes de responder a algunos ítems. Encuentran fuertes diferencias en el examen con vídeo entre el grupo que había trabajado con instrucción asistida por vídeo y computadora y el que no. Posteriormente, MacPhail y Halbert (2010) publican un estudio sobre el desarrollo de sistemas de evaluación auténtica en EF y su experimentación práctica y mejora por un grupo de profesores de EF que colaboraban con el mismo, dentro de enfoques de EF dirigidos al aprendizaje del alumnado. En una línea de trabajo similar, López, Manrique y Monjas (2011) muestran el trabajo realizado por un grupo de investigación-acción para desarrollar sistemas de evaluación formativa y orientada al aprendizaje en primaria y secundaria, en el área de EF. Los resultados encontrados muestran que mejora el aprendizaje, así como la implicación del alumnado en el proceso de aprendizaje y la auto-regulación del mismo, de modo que genera altos niveles de satisfacción en el alumnado y buenos resultados académicos.

3.4- La Evaluación en la Formación del Profesorado de Educación Física (FPEF)

Hemos encontrado pocos estudios que correspondan con esta categoría. Los resultados parecen mostrar que actualmente la FPEF no aprueba el uso de TCF como forma tradicional de evaluar en EF. Hopple (1995) explica que durante su formación inicial el término evaluación significaba “test de condición física”. Posteriormente, Keating, Silverman y Kulinna (2002) llevan a cabo un estudio sobre las actitudes del profesorado de EF en formación inicial hacía los TCF en la escuela, con una muestra de 613 estudiantes de 10 universidades diferentes. Los resultados parecen indicar que no creen mucho en la utilización de TCF en los programas de EF, a pesar de mostrar una actitud ligeramente positiva hacia los mismos, aunque con notables diferencias internas y una actitud más negativa cuantos más años de formación tiene el alumnado. Encuentran una serie de críticas sobre el uso de los TCF en el aula de EF. Según los autores, algunas posibles razones de estos resultados son: (1) la influencia de su experiencia con los TCF como estudiantes de secundaria; (2) la falta de formación sobre la utilización de TCF en EF; (3) una serie de críticas sobre la utilización de TCF en la escuela; (4) mayor preocupación por avanzar hacía sistemas de evaluación de la condición física orientada a la salud y la actividad física regular; (5) la utilización de los TCF para calificar; (6) la realización de TCF genera actitudes negativas del alumnado de primaria y secundaria hacia la EF y para la realización de actividades físicas. Por último, aboga por el desarrollo de procesos de autoevaluación en la aplicación de los TCF al alumnado, preferentemente relacionado con la aplicación de programas de planificación y realización de estilos de vida activos y saludables.

Por su parte, Senne y Rikard (2002) presentan un estudio sobre dos modelos de utilización del portafolio en la FPEF, durante el periodo de prácticas. Se centran, fundamentalmente, en el tipo de reflexión que genera. Posteriormente, Zhu (2007) critica que la forma tradicional de evaluar el aprendizaje del alumnado siga siendo la predominante en los estudios de ciencias de la actividad motriz y FPEF y defiende la necesidad de desarrollar sistemas y propuestas de evaluación alternativa, revisando las diferentes propuestas que han ido surgiendo en los últimos años.

Goc-Karp and Woods (2008) investigan las percepciones de los estudiantes de FPEF sobre la evaluación y su aplicación en la práctica docente, ya que consideran que influirán en el modo en que ellos utilizaran la evaluación cuando sean profesores. Los resultados muestran que si queremos generar cambios en dichas aplicaciones futuras, es muy importante generar análisis críticos durante la formación inicial del profesorado, así como experiencias específicas de evaluación auténtica bien planificadas. Por su parte, Lund and Veal (2008) investigan la evaluación utilizada por los profesores de EF durante su formación inicial. La revisión inicial muestra errores de coherencia interna entre la evaluación y los objetivos de aprendizaje establecidos, así como que las concepciones de evaluación de los profesores noveles son diferentes de las del profesorado con experiencia. También analiza proyectos de intervención llevados a cabo durante la formación inicial, como vía para comprender y explicar las concepciones erróneas que tienen sobre el uso de la evaluación. Estos autores consideran que si tenemos intención de cambiar dichas concepciones erróneas sobre la evaluación, es importante entender las concepciones con que los estudiantes acceden a la FPEF. Por otra parte, en los últimos años también aparecen algunos trabajos sobre el uso de la autoevaluación en la FPEF (Fernández-Balboa, 2006; López et al, 2011), que muestran razones para desarrollarla, así como estudios sobre su validez y resultados conseguidos.

En cuanto a la evaluación de programas en la FPEF, tanto Metzler y Tjeerdsma (1998) como Rink y Stewart (2003) publican estudios de evaluación de programas en la FPEF. El trabajo de Rink y Stewart (2003) es especialmente interesante porque presenta como anexo una información detallada de los cuatro indicadores que utilizan para llevar a cabo la evaluación en los programas de EF de secundaria, así como numerosos ejemplos de instrumentos de evaluación.

Como síntesis, este apartado parece mostrar que se está produciendo un avance en los tipos de evaluación que se utilizan actualmente en la FPEF. Algunos autores defienden el uso de sistemas de evaluación alternativa, auténtica e integrada en la FPEF, pero no parecen existir muchos trabajos sobre su desarrollo práctico. Hemos encontrado poca investigación sobre el uso de la evaluación alternativa en la FPEF, así como de la importancia de vivir este tipo de sistemas de evaluación durante su formación inicial si queremos que luego sean capaces de ponerlo en práctica en las escuelas, como profesores de EF. Parece necesario desarrollar más investigación sobre la implantación de evaluaciones alternativas en la FPEF, así como de su efecto a medio y largo plazo en el tipo de evaluación que dicho profesorado de EF lleva a cabo en las escuelas.

CONCLUSIONES

En este artículo se ha establecido un marco conceptual actual y novedoso en nuestro país sobre evaluación en EF, comprobando las estrechas relaciones existentes entre diferentes conceptos de evaluación formativa y alternativa en EF: Evaluación Auténtica, Evaluación Integrada, Evaluación para el Aprendizaje y Evaluación Centrada en el Aprendizaje. El análisis de la literatura internacional sobre evaluación en EF nos indica que las temáticas en que se está trabajando de forma principal son las siguientes: (a) la evaluación de la condición física en EF; (b) la evaluación alternativa en la iniciación deportiva por el modelo comprensivo; (c) la evaluación alternativa, auténtica e integrada en EF y la implicación del alumnado en los procesos de evaluación; y (d) la evaluación en la FPEF.

Existen numerosos estudios que critican el uso de los TCF como modo tradicional de evaluación y calificación en EF y plantean otras formas de utilizarlos, más orientados al desarrollo de estilos de vida saludables; pero sería necesaria una mayor realización de estudios sobre el desarrollo experimental de dichas propuestas en la escuela. Parece que en la educación física escolar se está produciendo un avance hacia sistemas evaluación alternativa, más orientados al aprendizaje del alumnado, especialmente desarrollada dentro del contenido de iniciación deportiva por el modelo comprensivo. Se recogen razones para avanzar hacía este tipo de evaluación, pero también razones que dificultan su uso en la escuela. Parece que es más fácil avanzar hacía sistemas de evaluación alternativa a través de grupos colaborativos de investigación-acción en EF y que es necesario desarrollar más investigación sobre experiencias globales de evaluación alternativa en toda la programación anual de EF. Algunos autores defienden el uso de sistemas de evaluación alternativa, auténtica e integrada en FPEF, pero no parecen existir muchos trabajos sobre su desarrollo práctico. Por tanto, parece urgente y necesario realizar una mayor investigación sobre el uso de estos tipos de evaluación en FPEF, así como de la importancia de vivir este tipo de sistemas de evaluación durante su formación inicial si queremos el profesorado de EF sea luego capaz de ponerlo en práctica en las escuelas. Sería interesante comprobar si la implantación de sistemas de evaluación alternativa en la FPEF tiene efectos positivos a medio y largo plazo en el tipo de evaluación que dicho profesorado lleve a cabo posteriormente en las escuelas.

Este artículo puede ser de utilidad a diferentes audiencias interesadas en la temática de la evaluación en EF, dado que revisa el estado de la cuestión en la literatura internacional y propone nuevas líneas de investigación presentes y futuras. Se aportan y explican conceptos poco conocidos en nuestro país o, cuanto menos, poco utilizado en la literatura especializada en EF en español. Parece necesaria una mayor investigación sobre evaluación en EF; abrir nuevas vías de práctica pedagógica en términos de evaluación alternativa en EF e investigar sus resultados, tanto en la EF que se lleva a cabo en primaria y secundaria, como en la FPEF.

Referencias

1. Blázquez, D. (1990). Evaluar en Educación Física. Barcelona: Inde.

2. Blomqvist, M., Vänttinen, T., & Luhtanen, P. (2005). Assessment of secondary school students’ decision-making and game-play ability in soccer. Physical Education and Sport Pedagogy, 10 (2), 107-119.

3. Butler, S. A., & Hodge, S. R. (2001). Enhacing student trust through peer-assessment in Physical Education. The Physical Educator, 58 (1), 30-39.

4. Carroll, B. (1994). Assessment in Physical Education. Ataccher´s guide to the Issues. London: Falmer Press.

5. Casbon, C., & Spackman, L. S. (2005). Assessment for learning in Physical Education . Leeds: BAALPE.

6. Cassady, H., Clarke, G., & Latham, A-M. (2004). Experiencing evaluation: a case study of girls’ dance. Physical Education and Sport Pedagogy, 9(1), 23-36.

7. Chen, W. (2005). Examination of curricula, teaching practices, and assessment through National Standards. Physical Education and Sport Pedagogy, 10(2), 159-180.

8. Desrosiers, P., Genet-Volet, Y., & Godbout, P. (1997). Teachers’ Assessment Practices Viewed Through the Instruments Used in Physical Education Classes. Journal of Teaching in Physical Education, 16(2), 211-228.

9. Fernández-Balboa, J.M. (2006). Dignity and democracy in the college classroom: The practice of self- evaluation, in: R. A. Goldstein, ed. Useful Theory: Making Critical Education Practical. New York: Peter Lang Publishing.

10. Goc-Karp, G., & Woods, M. (2008). Preservice teacher´s perceptions about assessment and it´s implementation. Journal of Teaching in Physical Education, 27(3), 327-346.

11. Gréhaigne, J. F., Wallian, N., Godbout, P. (2005). Tactical-decision learning model and students’ practices. Physical Education and Sport Pedagogy, 10(3), 255-269.

12. Halas, J. & Gannon, G. (2006). The Challenges of Teaching Fitness in an Era of Physical Inactivity: Examples of Effective Practice. Physical and Health Education Journal, 72 (1), 4-9.

13. Halas, J. & Gannon, G. (2006). Principles of Physical Fitness Development: Implications for Fitness Assessment. Physical and Health Education Journal, 71(4), 4-9.

14. Hay, P. J. (2006). Assessment for learning in Physical Education. In D. Kirk, D. MacDonald & M. O´Sullivan (Eds.). The handbook of Physical Education, 312-325. London: Sage.

15. Hensley, L. (1997). Alternative assessment for physical education. Alternative assessment for physical education

16. Hernández, J. L. & Velázquez, R. (2004). La evaluación en educación física. Investigación y práctica en el ámbito escolar. Barcelona: Graó.

17. Hill, C. & Miller, T. (1997). A Comparision of Peer and Teacher Assessment of Students´ Physical Fitness Performance. Physical Educator, 54(1), 40-46.

18. Hopple, C. J. (2005). Elementary Physical Education Teaching and Assessment. A practical guide. Champaign: Human Kinetics (1ª ed en 1995).

19. Hopple, L. & Graham, G. (1995). Hopple, L. & Graham, G. . Journal of Teaching in Physical Education, 14(4), 408-417.

20. Jackson, A.S. (2006). The Evolution and Validity of Health-Related Fitness. Quest, 58(1), 160-175.

21. Keating, X. D. (2003). The Current Often Implemented Fitness Tests in Physical Education Programs: Problems and Future Directions. Quest, 55(2), 141-160.

22. Keating, X. D.; Silverman, S & Kulinna, Ph. (2002). Preservice Physical Education Teachers Attitudes Toward Fitness Tests and the Factors Influencing their Attitudes. Journal of Teaching in Physical Education, 21, 193-207.

23. Keating, X. D. & Silverman, S. (2004). Teachers' Use of Fitness Tests in School-Based Physical Education Programs. Measurement in Physical Education and Exercise Science, 8(3), 145-165.

24. López, V. M., Monjas, R., Manrique, J. C., Barba, J. J.; González, M. (2008). Implicaciones de la evaluación en los enfoques de educación física cooperativa. El papel de la evaluación formativa y compartida en la necesaria búsqueda de coherencia. Cultura y Educación, 20(4), 457-477.

25. López, V. M.; Fernández-Balboa, J. M.; Santos, M.L.; Fraile, A. (2011). Students' self-grading, professor's grading and negotiated final grading at three university programmes: analysis of reliability and grade difference ranges and tendencies.. Assessment & Evaluation in Higher Education, (e-first).

26. López-Pastor, V. M. (2006). La Evaluación en Educación Física: Revisión de los modelos tradicionales y planteamiento de una alternativa: La evaluación formativa y compartida.. Buenos Aires: Miño y Dávila.

27. López-Pastor, V. M., Monjas, R., Manrique, J. C. (2011). Fifteen years of action-research as professional development. Searching more collaborative, useful and democratic systems for teachers. Educational Action-Research,19(2), 153-170.

28. Lorente, E. y Joven, A. (2009). Autogestión: Una investigación Etnográfica. Autogestión: Una investigación Etnográfica

29. Lund, J.L. & Veal, M.L. (2008). Measuring pupil learning. How do student teachers assess within intructional models?. Journal of Teaching in Physical Education, 27, 487-511.

30. MacPhail, A. & Halbert, J. (2010). We had to do intelligent thinking during recent PE’: Students’ and teachers’ experiences of assessment for learning in post-primary physical education. Assessment in Education, 17(1), 23-39.

31. Melograno, V. J. (1998). Professional and student Portfolio for Physical Education. Champaign: Human Kinetics.

32. Melograno, V. J. (2000). Designing a Portfolio System for K-12 Physical Education: A Step-by-Step Process. Measurement in Physical Education and Exercise Science, 4(2), 97-115.

33. Melograno, V. J. (1997). Integrating assessment into Physical Education teaching. Journal of Physical Education, Recreation and Dance, 68 (7), 34-37.

34. Metzler, M. W. Y Tjeerdsma, B.L. (1998). PETE Program Assessment Within a Development, Research and Improvement Framework. Journal of Teaching in Physical Education, 17(4), 468-492.

35. Mintah, J. K. (2003). Authentic Assessment in Physical Education: Prevalence of Use and Perceived Impact on Students’ Self-Concept, Motivation, and Skill Achievement. Measurement in physical education and exercise science, 7(3), 161-174.

36. Oslin, J. L., Mitchell. S. A. & Griffin, L. L. (1998). The game performance assessment instrument (GAPI): development and preliminary validation. Journal of Teaching in Physical Education, 17(2), 231–243.

37. Placek, Jh.; Griffin, Ll.; Dodds, P.; Raymond, C.; Tremino, F & James, A. (2001). Middle School Students´Conceptions of Fitness: the long road to a Healthy Lifestyle. Journal of Teaching in Physical Education, 20(4), 314-323.

38. Richard, J. F. & Godbout, P. (2000). Formative Assessment as an integral part of the teaching-learning process. Physical and Health Education Journal, 66(3), 4-9.

39. Richard, J. F., Godbout, P., Tousignant, M. & Grehaigne, J. F. (1999). The try-out of a team sport performance assessment procedure in elementary and junior high school physical education classes.. Journal of Teaching in Physical Education, 18, 336–356.

40. Rink, J. Stewart, S. (2003). Insights and Reflections on a State Assessment Program. Journal of Teaching in Physical Education, 22, 573-588.

41. Robinson, S. (1992). Assessment in Physical Education: A development programme. Naffarton: BAALPE.

42. Senne, T.A. & Rikard, G.L. (2002). Experiencing the Portfolio Process During the Internship: A Comparative Analysis of Two PETE Portfolio Models. Journal of Teaching in Physical Education, 21(3), 309-336.

43. Van Vuuren-Cassara, G., Lamprianou, I. (2006). The assessment of athletics ‘knowledge’ with written and video tests. Physical Education and Sport Pedagogy, 11(2), 119-140.

44. Veal, M. L (1998). Pupil Assessment Perceptions and Practices. Journal of Teaching in Physical Education, 7(4), 327-342.

45. Wallhead, T., O´Sullivan, M. (2005). Sport Education: physical education for the new millennium?. Physical Education and Sport Pedagogy, 10(2), 181-210.

46. Ward, P. & Lee, M-A. (2005). Peer-Assisted Learning in Physical Education: A Review of Theory and Research. Journal of Teaching in Physical Education, 24, 205-225.

47. Zhu, W. (1997). Alternative assessment: What, why, how. Journal of Physical Education, Recreation,and Dance, 68(7), 17–18.

48. Zhu, W. (2007). Assessing Kinesiology Students´ Learning in Higher Education. Quest, 59(1), 124-142.

Cita en Rev Edu Fís

Víctor Manuel López-Pastor (2013). Nuevas Perspectivas sobre Evaluación en Educación Física . Rev Edu Fís. 29 (3).
https://g-se.com/nuevas-perspectivas-sobre-evaluacion-en-educacion-fisica--1639-sa-m57cfb2723cf44

COMPARTIR