Rangos de referencia adaptativos: de A a Z

Resumen

Los rangos de referencia clínicos son fundamentales en el diagnóstico médico, que ofrecen puntos de referencia críticos para interpretar los resultados de las pruebas de laboratorio. Los rangos de referencia adaptativos, en particular, son esenciales para el monitoreo personalizado, ya que permiten la detección de valores anormales al contabilizar la variabilidad individual a lo largo del tiempo. Este documento compara dos enfoques clave para generar rangos de referencia adaptativos: el método de puntaje Z y el marco de modelado de efectos mixtos lineales. A través de estudios de simulación y aplicaciones de datos reales, proporcionamos información práctica para seleccionar los métodos más apropiados para el monitoreo adaptativo en medicina personalizada y ciencias del deporte. Nuestros hallazgos resaltan las compensaciones entre estos enfoques, con el método de puntaje Z favoreciendo la especificidad, mientras que el modelo lineal de efectos mixtos prioriza la sensibilidad y ofrece una mayor flexibilidad al incorporar datos a nivel de población, acomodar covariables y manejar efectivamente los datos faltantes.

Introducción

Los rangos de referencia clínicos son herramientas críticas en el diagnóstico médico, que sirven como puntos de referencia para interpretar los resultados de las pruebas de laboratorio. Tradicionalmente, estos rangos se calculan utilizando datos basados ​​en la población e intervalos de tolerancia, cuyo objetivo es capturar una cierta proporción de los valores de la población (por ejemplo, 95%) con un nivel específico de confianza (p. Ej., 90%) para un biomarcador particular (1). Si bien es ampliamente utilizado, este método a menudo no tiene en cuenta la variabilidad individual y los cambios temporales dentro de un solo paciente, especialmente en el contexto del monitoreo longitudinal, lo que lleva a posibles falsos positivos o falsos negativos en el diagnóstico.

Esta limitación es particularmente evidente en la ciencia del deporte, donde los avances en tecnologías portátiles, como monitores de frecuencia cardíaca, rastreadores GPS y acelerómetros, a menudo utilizan rangos de referencia basados ​​en la población para monitorear el rendimiento y el estado fisiológico de los atletas a lo largo del tiempo. Si bien estos rangos pueden ser útiles cuando solo hay una sola medida disponible, no reflejan con precisión el rendimiento de un atleta o el estado fisiológico cuando el seguimiento de los cambios con el tiempo, lo que puede conducir a decisiones de entrenamiento inapropiadas y un mayor riesgo de lesiones (2).

Sin embargo, un enfoque más significativo considera los datos actuales de un individuo con la población y sus propios datos históricos. Tal enfoque son los rangos de referencia adaptativos, es decir, los rangos de referencia que se adaptan sucesivamente a medida que se registran los nuevos datos para un individuo, lo que permite una atención médica más personalizada y efectiva (2, 3).

El trabajo temprano en rangos de referencia adaptativos se remonta a Sharpe et al.’s (4) Estudio sobre la detección de abuso de eritropoyetina en atletas. Afilado et al. introdujo un enfoque de puntaje Z que se basó en la distribución normal y las estimaciones imparciales de la media y la varianza de las observaciones previas para generar rangos de referencia adaptativos. Sin embargo, este enfoque podría ser limitado cuando el número de observaciones de un sujeto dado es pequeño, es decir, menos de seis (4). Para abordar este problema, Sharpe et al. propuesto para asumir una variabilidad fija dentro del sujeto en todas las personas para que el método aún pueda aplicarse a individuos con observaciones limitadas. Sotas et al. (3) Más tarde argumentó que el método de puntaje Z de Sharpe es inadecuado ya que la suposición de una variabilidad fija dentro del sujeto puede no ser realista para muchos biomarcadores. Además, en un estudio más reciente, Sauliere et al. (5) destacó que la distribución correcta para usar para el puntaje Z en tamaños de muestra pequeños es la distribución t. Entre los tres métodos existentes basados ​​en la puntuación Z para generar rangos de referencia adaptativos, el método de puntaje Z junto con la distribución T parece ser más ampliamente aplicable en varios escenarios y, por lo tanto, se considera con mayor detalle en este artículo. Sin embargo, debe tenerse en cuenta que este método se basa únicamente en la variabilidad dentro del sujeto y no tiene en cuenta la variabilidad entre sujetos o cualquier otra información basada en la población, lo que también puede limitar su efectividad.

Estudios recientes de Roshan et al. (2) y sotas et al. (3) han desarrollado métodos para generar rangos de referencia adaptativos que no solo explican la variabilidad dentro de las mediciones de un individuo al incorporar sus lecturas anteriores, sino que también consideran la variabilidad entre los sujetos utilizando información basada en la población. Para este fin, Sottas et al. (3) propuso un marco bayesiano que combina mediciones individuales con datos de población previos. Este enfoque no solo proporciona una cuantificación más precisa de las características de un individuo, sino que también permite que los rangos de referencia se adapten a medida que se recopilan datos adicionales para el individuo.

Roshan et al. (2) se expandió en el trabajo de Sottas proponiendo un marco bayesiano que explique las diferentes variabilidades dentro de individuos, una suposición más realista que mejora su aplicabilidad práctica. Además, Roshan et al. (2) introdujo un marco lineal de modelado de efectos mixtos (LMM), que, al mantener la precisión del enfoque bayesiano, es computacionalmente más eficiente y práctico para las aplicaciones del mundo real. Este enfoque se basa en algunas estadísticas resumidas a nivel individual, combinando toda la información necesaria de observaciones anteriores para crear rangos de referencia.

El método de puntaje Z junto con la distribución T, aunque muy simple, puede sacrificar cierta sensibilidad o especificidad en comparación con los enfoques que incorporan datos más amplios basados ​​en la población. A pesar de esto, el uso del enfoque de puntaje Z sigue siendo frecuente debido a su simplicidad y familiaridad generalizada en diversas aplicaciones. Sotas et al. (3) demostrado a través de un estudio de caso real cómo el enfoque bayesiano supera el método de puntaje Z con la distribución normal en términos de tasa de falsos positivos al detectar valores anormales en los datos de la relación de testosterona/epitestosterona longitudinal (T/E) utilizados en las pruebas antidopado. Además, Roshan et al. (2) Mostraron a través de un estudio de simulación que, a pesar de una diferencia insignificante en el rendimiento entre el marco LMM y el enfoque bayesiano, el primero supera al segundo en términos de tiempo computacional.

Sin embargo, a pesar de estas comparaciones, no se ha explorado a fondo una evaluación directa del marco LMM contra el método de puntuación Z junto con la distribución T, en adelante como método de puntuación Z, no se ha explorado a fondo. Esta comparación es crucial, ya que proporcionaría una evaluación integral de estos métodos, ayudando a determinar el enfoque más adecuado para diversas aplicaciones prácticas. Esto es particularmente importante en escenarios en los que la precisión y la eficiencia computacional (un desafío a menudo enfrentado por el método bayesiano) son críticos.

Por lo tanto, este documento tiene como objetivo comparar el rendimiento del marco de modelado de efectos mixtos con el enfoque de puntaje Z, proporcionando pautas para cuándo cada método se puede utilizar de manera segura en la práctica. Al evaluar estos métodos, esperamos ofrecer una comprensión más clara de sus aplicaciones y limitaciones, mejorando en última instancia la precisión y confiabilidad de los rangos de referencia clínica en la medicina personalizada. Para lograr esto, se proporcionará un estudio de simulación exhaustivo junto con la aplicación de datos del mundo real para evaluar la efectividad de cada método para identificar valores anormales durante el monitoreo longitudinal. La comparación se centrará principalmente en la sensibilidad y la especificidad como métricas de rendimiento, donde la sensibilidad se refiere al porcentaje de observaciones anormales identificadas correctamente, mientras que la especificidad indica el porcentaje de observaciones normales identificadas correctamente.

El resto del documento procede de la siguiente manera: en la sección Métodos, se revisarán los métodos para generar rangos de referencia adaptativos utilizando los marcos de modelado de puntaje Z y de efectos mixtos. La sección Estudio de simulación presenta los resultados de un estudio de simulación para evaluar el rendimiento de estos métodos. En la sección de aplicación de datos reales, aplicamos los métodos a los datos reales recopilados de los atletas en los deportes de élite, y finalmente, las secciones de discusión y conclusión ofrecen ideas y comentarios de cierre.

Métodos

Dejar son norte Mediciones independientes de un biomarcador del mismo sujeto, donde . La nueva observación, Ynorte + 1recolectado del mismo sujeto se considera anormal si cae fuera del rango de percentil de la distribución de la condición dónde es el nivel de importancia y . Este rango de percentil se llama rango de referencia adaptativo, ya que los rangos de referencia se adaptan al tener en cuenta las lecturas anteriores para aprender progresivamente las características del individuo (2). En el resto de esta sección, se dará una breve discusión sobre la generación de rangos de referencia adaptativos utilizando el método Z-Score y el marco LMM. El método de la puntuación Z se introducirá en el Método 1 sección, mientras que el marco LMM se discutirá en el Método 2 sección.

Método 1

Para una nueva observación Ynorte+ 1 recolectado de un sujeto, se puede calcular la siguiente cantidad (5)

(1)

dónde Tnorte+ 1 es la puntuación z obtenida para la medición y son la media de la muestra y la desviación estándar, respectivamente, obtenidas de la primera norteMedidas del mismo tema, es una distribución de Student T con norte –1 grados de libertad.

Ecuación 1 asume que todos los son independientes entre sí. Si Tnorte+ 1 cae fuera del rango de una distribución de estudiante con T con norte –1 grados de libertad, entonces la observación Ynorte + 1 será considerado como anormal.

Un rango de referencia adaptativo para la observación Ynorte + 1 basado en la ecuación ( 1) se puede obtener de la siguiente manera:

(2)

dónde, es el (1-α/2)thcuantil de una distribución t con (norte–1) Grados de libertad.

Método 2

El método de puntaje Z discutido en la sección anterior solo tiene en cuenta la variabilidad dentro del sujeto del individuo y no considera la variabilidad del sujeto o ninguna otra información basada en la población. Se puede definir un LMM, que tiene en cuenta las variabilidades entre y dentro del sujeto en los valores de biomarcador, para generar rangos de referencia adaptativos de la siguiente manera (2, 6)

(3)

dónde YIJ es el medición del sujeto que sigue dónde, son los términos de intercepción aleatorios para el sujeto que sigue . Aquí es la media promedio de la población del biomarcador, es la variabilidad entre el sujeto, y ¿Es la variabilidad del sujeto dentro de la sujeto.

Medición jde sujeto i, YIJse considerará atípico si cae más allá del rango de percentiles de ; dónde Yse refiere a ambos sujetos iMedidas antes del tiempo j(es decir, ) y otra información histórica de otras personas (es decir, ; y ). Un algoritmo de maximización de expectativa aproximada (EM) (7, 8) se ha propuesto estimar los parámetros del modelo para calcular lo siguiente rango de percentil de la distribución de la observación futura, es decir :

(4)

En esta sección, se introdujeron dos métodos para generar rangos de referencia adaptativos. Las secciones posteriores explorarán la efectividad de estos métodos comparando su sensibilidad y especificidad, utilizando tanto un estudio de simulación como un ejemplo de datos real. Todos los análisis se realizaron utilizando el lenguaje de programación R (versión 4.3.1).

Estudio de simulación

En esta sección se llevará a cabo un estudio de simulación para comparar la especificidad (tasa negativa verdadera) del método de puntaje Z y el marco LMM para generar rangos de referencia adaptativos. La evaluación del rendimiento de estos métodos se basará en la tasa de falsos positivos (1 especificidad).

El conjunto de datos se generará simulando valores de una distribución normal, adherida al siguiente modelo estadístico.

(5)

dónde YIJ es el medición del biomarcador del sujeto, es la media específica del sujeto para el sujeto, es el error de medición para la medición YIJ, ¿Es la población media? es el entre la variabilidad del sujeto y ¿Es la variabilidad del sujeto dentro de la sujeto.

Basado en el modelo de generación de datos …

(Tagstotranslate) Simulación y modelado (T) Biomarcadores (T) Distribución normal (T) Proteínas C reactivas (T) Ciencia deportiva (T) Medicina de diagnóstico (T) Factores de riesgo médico (T) Sports
Truncado en 12000 caracteresTraducido automáticamente
Publicación Original

¿Quieres recibir semanalmente todos los contenidos de G-SE?