¿Qué es el entrenamiento (práctica) basado en la evidencia?

Desde el IEWG presentamos la traducción de un artículo reciente de Michael Rosenblat, donde se expone de manera sencilla y clara, a qué deberíamos referirnos al hablar de "práctica basada en la evidencia".

INTRODUCCIÓN

La práctica basada en la evidencia (EBP de Evidence-based practice) es el método que permite incorporar la mejor evidencia disponible para apoyar una intervención (ejercicio, nutricional, equipamiento, etc). Consiste en utilizar la literatura científica así como la experiencia obtenida en la clínica o en el campo. Sin embargo, esto no sugiere que debamos incorporar la literatura ciegamente. Debemos analizar la literatura de manera crítica evaluando su validez interna y externa.

La validez interna refleja la calidad del diseño del estudio, implementación y análisis de los datos con el objetivo de minimizar el nivel de sesgo y determinar una verdadera relación “causa y efecto” entre una intervención y un resultado (1). La validez externa describe las circunstancias bajo las cuales es posible generalizar los resultados de la investigación.

NIVELES DE EVIDENCIA

Nivel 1: Revisiones sistemáticas de ensayos controlados y aleatorizados

Nivel 2: Ensayos controlados y aleatorizados

Nivel 3: Estudios de casos y controles

Nivel 4: Series de casos, informes de casos.

Nivel 5: Editoriales, opinión de expertos.

METODOLOGÍA DE ESTUDIO

*Es importante tener en cuenta que la mayoría de las secciones que enumeramos a continuación están presentes en la Escala PEDro. Existen secciones adicionales descriptas mas abajo que pueden agregar calidad a una apreciación crítica. De ninguna manera la lista está completa debido a que cuando se analiza la literatura críticamente, existen muchos factores para considerar.

Revisión de la literatura

Una adecuada revisión de la literatura brinda un panorama completo del tema en la introducción. Debe incluir investigaciones previas realizadas sobre el tema y el motivo por el cual se realiza el estudio actual.

Selección de participantes

Los participantes que se incluyen en un estudio se consideran una muestra de la población de interés. Pueden utilizarse dos formas de muestreo para seleccionar a los participantes; el muestreo probabilístico y muestreo no probabilístico (2). El tipo de muestreo puede influir en las características de la muestra que a su vez, puede influir en la posibilidad de generalización y en la validez externa (2).

Criterio de elegibilidad

Es una lista de condiciones que se utiliza para establecer quienes son elegibles para participar en el estudio (6). Esto afecta la validez externa, pero no la validez interna o estadística (6). Mientras mayor sea la homogeneidad de la muestra en función del criterio de inclusión/exclusión, menor será la validez externa (6)

Tamaño de la muestra

Es el número de sujetos de una población dada que participan en el estudio. Los tamaños de muestra más grandes tienden a ser más representativos de la población

Aleatorización

Los participantes son asignados al azar a uno de dos o más intervenciones. La aleatorización minimiza el riesgo de variables de confusión, reduce el riesgo de sesgo y permite el análisis de relaciones directas. Una limitación importante del uso de pruebas controladas aleatorias (RCT) es que es imposible de obtener una verdadera muestra aleatoria de la población (2). Esto puede dificultar la generalización de los resultados.

Ocultamiento de la asignación

La persona responsable de determinar si un sujeto era elegible para ser incluído en una prueba desconoce a cual grupo será asignado el sujeto (6). Si la asignación no es oculta, la decisión sobre si incluir o no a una persona en una prueba podría estar influenciada por el conocimiento de si el sujeto debe recibir el tratamiento o no. Esto podría producir sesgos sistemáticos diferentes a los de la asignación aleatoria (6).

Cegamiento

Esto es un método que evita que los participantes y quienes recolectan y analizan los datos del estudio sepan quiénes integran el grupo de intervención y quiénes integran el grupo control. (1). Cuando los sujetos no conocen bajo cual tratamiento están, es menos probable que los resultados del tratamiento se deban a un efecto placebo (6). El cegamiento de los asesores asegura que el sesgo personal no afecte los resultados (6).

Posibilidad de comparar los valores al inicio del estudio (línea de base)

La comparación en la línea de base consiste en la comparación de los valores de grupos (intervención y control) al inicio del estudio. No debe existir ninguna diferencia estadísticamente significativa entre los grupos. Una aleatorización adecuada debe asegurar que los grupos sean similares en la línea de base. Esto puede aportar una indicación de sesgo potencial que se produce por casualidad con la asignación aleatoria (6). Una diferencia significativa entre los grupos puede indicar un problema con los procedimientos de aleatorización (6).

Variables (Parámetros)

La medición de las variables es el método utilizado para evaluar el efecto de la intervención. El propósito de la medición de variables es diferenciar entre los sujetos en un momento dado, predecir un evento o resultado subsecuente y evaluar el cambio a lo largo del tiempo.

Variables de medición estandarizadas:

1. Tener instrucciones explícitas de administración, puntajes e interpretación de los resultados.

2. Están validadas en la medida que la información concerniente a sus propiedades de medición haya sido estimada, informada y defendida en la literatura que ha sido revisada por pares

3. Las variables de medición son válidas, confiables, sensibles y específicas

Mediciones de validez

1. La variable de medición mide lo que se piensa que mide (validez aparente)

2. La variable de medición es apropiada para la población de interés (validez de contenido)

3. Las variables de medición proporcionan resultados que son consistentes con la metodología estándar o gold standard (validez de criterio)

Mediciones de confiabilidad

1. Las múltiples mediciones en un individuo proporcionarán resultados consistentes (test-re-test/confiabilidad absoluta), entre supervisores (confiabilidad inter-operador) y en un mismo supervisor (confiabilidad intra-operador)

2. La variable de medición puede determinar el grado en que existe la condición (confiabilidad relativa)

La sensibilidad es la capacidad de una prueba de detectar la presencia de una condición de manera confiable (3). Por consiguiente, si la prueba es negativa, el sujeto no tiene la condición (verdadero positivo/total los resultados positivos; SNOUT= SeNsitivity-rule out).

La especificidad es la capacidad de una prueba para detectar la ausencia de una condición de manea confiable (3). Por consiguiente, si la prueba es positiva, el sujeto tiene la condición (verdaderos negativos/total de resultados negativos; SPIN=SPecificity-rule in).

Intervención

La intervención debe ser descripta de forma tal que pueda ser reproducida. Una descripción inadecuada disminuye la validez interna porque no queda claro cual es el mecanismo exacto que provocó el cambio en los resultados.

Seguimiento adecuado

El número de sujetos que completaron la prueba y aportaron los datos de seguimiento para el análisis estadístico debe ser suficiente. El grupo PEDro establece que los datos provenientes de un mínimo de 85% de sujetos aumenta la validez interna (6). Es importante que las mediciones de las variables se realicen en todos los sujetos asignados al azar en los diferentes grupos. Los sujetos que no pueden ser seguidos pueden diferir sistemáticamente de los que sí fueron seguidos, y esto introduce potencialmente un sesgo. La magnitud del sesgo potencial aumenta en proporción a los sujetos que no pueden ser seguidos (6).

Análisis de intención de tratar

Ésta es una estrategia que asegura que sean analizados todos los pacientes asignados ya sea al grupo que recibió un tratamiento o al grupo control, hayan recibido o no el tratamiento prescripto y hayan completado o no el estudio (1). Cuando se excluyen pacientes del análisis, se destruye la razón principal de la aleatorización, lo que conduce a sesgo potencial (6).

Comparaciones entre-grupos

Esta comparación es una comparación estadística de un grupo con otro. Se realiza para determinar si la diferencia entre los grupos es mayor a la que puede ser atribuida al azar (6).

Estimaciones puntuales (tamaño de efecto) y variabilidad

Una estimación puntual o tamaño de efecto es un valor que representa la estimación más probable de la verdadera población (4). Algunos ejemplos incluyen la diferencia entre medias, el coeficiente de regresión, la d de Cohen y el coeficiente de correlación.

Es importante considerar la variabilidad del tamaño del efecto (estimación puntual). Algunos ejemplos de variabilidad incluyen: Desviación estándar, error estándar y los intervalos de valores. La desviación estándar (SD) es una estimación del grado de dispersión (variabilidad) de los puntos correspondientes a datos de los individuos de la muestra con respecto a la media muestral (3). El error estándar (SEM) es la desviación estándar de los estadísticos de la prueba (estimación puntual) obtenidos a partir de todas las muestras obtenidas al azar de la población (3). Se usa como cuantificación de la variabilidad de los valores medios que se calculan para construir los intervalos de confianza. Debido a que la desviación estándar siempre es mayor que el error estándar, los autores a veces presentan los datos en forma de “Media±SEM" en lugar de “Media±SD". Esto subestima la verdadera variabilidad y puede confundir al lector.

Es frecuente presentar la variabilidad en forma de intervalo de confianza (CI). Un intervalo de confianza es el intervalo de valores que abarca la población, con una probabilidad dada (4). El ancho del CI depende del SEM y del grado de confianza que nosotros escogemos arbitrariamente (normalmente 90%, 95%, o 99%). Utilizando un CI de 95% nosotros estamos 95% seguros que la verdadera media de la población se ubicará en el rango de valores dentro del intervalo. Si un CI de 95% incluye un cero, indicaría que existe la posibilidad que el cambio medio de una intervención en una población dada sea cero. Por consiguiente, el resultado no será estadísticamente significativo.

Limitaciones del estudio

Una descripción de las limitaciones del diseño y metodología del estudio aporta transparencia porque debe describir los potenciales sesgos. Esto incluye una explicación de los posibles errores en la validez interna y externa.

REFERENCIAS

1.Akobeng A. Understanding randomized controlled trials. Arch Dis Child 2005;90:840-844.

2.Carter R, Lubinsky J, Domholdt E. Rehabilitation Research. 4th ed. 2010. Elsvier; St. Louis, Missouri.

3.Gaddis G, Gaddis M. Introduction to biostatistics: part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med 1990;19:145-151.

4.Nakagawa S, Cuthill I. Effect size, confidence interval and statistical significance: a practical guide for biologists. Biol Rev 2007;82(4):591-605.

5.Pannucci C, Wilkins E. Identifying and avoiding bias in research. Plast Reconstr Surg 2010;126(2):619-625.

6.Physiotherapy Evidence Database. PEDro Scale (1999). http://www.pedro.org.au/english/downloads/pedro-scale/. Accessed on January 27, 2015.

Publicación original:

COMPARTIR