¿Cuáles son los métodos estadísticos comúnmente utilizados en la investigación médica?
Lenguaje de edición
Para los métodos estadísticos básicos de uso común, en términos generales, la prueba T, el análisis de varianza unidireccional y la prueba de chi-cuadrado son lo que las personas suelen encontrar al escribir y leer artículos. Métodos estadísticos (casi todos los artículos incluirán uno o más de estos métodos), entonces, ¿qué tipo de métodos estadísticos se deben utilizar? Hablemos de ello hoy.
En primer lugar, antes de obtener los datos y comenzar a analizarlos, debes dividir los tipos de datos (Figura 1), porque los diferentes tipos de datos se describen de diferentes maneras y tienen diferentes métodos estadísticos.
Figura 1 Tipo de estadística
Por ejemplo (Tabla 1):
Tabla 1 Registros de exámenes de salud de 735 personas mayores de 65 años en un determinado lugar de 2002
2. Análisis estadístico de varios tipos de datos (descripción e inferencia estadística)
1 Datos de medición
Características: Existen diferencias cuantitativas entre las observaciones. valores de cada unidad de observación La diferencia tiene una unidad;
Forma de descripción: "X S" es la más utilizada (común en la literatura general), su nivel promedio se describe mediante la media aritmética y su El grado de dispersión se describe mediante la desviación estándar. Si los datos son "particularmente anormales" (especialmente si la desviación estándar es mayor que la media aritmética), entonces se usa Md(P25, P75) (Md es la mediana, P25 y P75 son los cuartiles) (Tabla 2). Revise la prueba de distribución normal: Estadísticas de investigación médica (3): Pruebas de normalidad y homogeneidad de varianzas que debe conocer.
Tabla 2 Características y ocasiones de aplicación de indicadores estadísticos de datos de medición de uso común
Métodos de inferencia estadística: generalmente divididos en factores individuales y multifactoriales.
Los puntos clave del método de análisis unifactorial son: primero, aclarar el tipo de datos (datos medidos); segundo, definir el tipo de diseño experimental (¿diseño completamente aleatorio? ¿Cuántos grupos de muestras?) En tercer lugar, preste atención al método utilizado. Condiciones de aplicación; el cuarto es utilizar la prueba t (¡tenga en cuenta que hay tres formas de prueba t!) o ANOVA unidireccional cuando se cumple la homogeneidad normal de varianzas. prueba de suma de rangos cuando no se cumple (Figura 2).
Figura 2 La elección correcta de los métodos estadísticos de medición de datos
Dos puntos para recordar:
① Si los datos de la muestra no obedecen a la distribución normal, solo no -Se pueden utilizar pruebas paramétricas (prueba de suma de rangos), pero su eficiencia de prueba es menor que la prueba paramétrica (prueba t o análisis de varianza). La llamada baja eficiencia de inspección significa que existen diferencias en la inspección en sí, pero no hay capacidad para detectar las diferencias.
(2) Si los datos provienen de dos o más grupos de muestras, no se puede utilizar la prueba T (aumentará la probabilidad de errores falsos positivos) y se debe utilizar el análisis de varianza. Si p
En dos clases, aprendimos la prueba T (estadísticas de investigación médica) (2): ¿Hiciste la prueba T correctamente? ) y análisis de varianza (Estadísticas de investigación médica (IV): El alma de los métodos estadísticos: análisis de varianza). En cuanto a la prueba de suma de rangos, la presentaremos paso a paso más adelante.
El análisis múltiple generalmente utiliza análisis de regresión, principalmente análisis de regresión lineal. Les presentaré este método más adelante.
2. Conteo de datos
Características: clasificación desordenada, no hay diferencia cuantitativa entre unidades de observación dentro de una misma categoría, pero sí diferencias cualitativas entre categorías. Entre ellos, la segunda categoría debe ser datos de recuento (por ejemplo, el género es solo masculino/femenino, si una enfermedad es secundaria o no es solo secundaria), mientras que la categoría múltiple son datos de recuento (por ejemplo, el estado civil incluye soltero, casados, divorciados, viudos y categorías múltiples). Clasificación, pero no hay diferencia en grado o grado en cada clasificación, por lo que son datos de recuento y los resultados cualitativos de la prueba de glucosa en orina incluyen -, +, ++).
Forma de descripción: "Número de ejemplos (%)" es el más comúnmente utilizado (común en la literatura general), principalmente para distinguir la diferencia entre relación de composición (número relativo de estructura) y relación (número relativo de intensidad) (Tabla 3). Además, en la aplicación, el denominador (es decir, el tamaño de la muestra) no puede ser demasiado pequeño. Si el denominador es demasiado pequeño, no puede reflejar los hechos objetivos de los datos y es inestable.
Tabla 3 Características y aplicaciones de indicadores estadísticos comúnmente utilizados para datos de conteo
Por ejemplo:
1. , el sexo de los pacientes locales con cáncer de pulmón La proporción es A/B.
2. Cierto estudio * * * detectó tres bacterias patógenas, el número total de cepas es A+B+C, y el número de cepas detectadas para una bacteria patógena es A, luego A/(A+). B+C) es la relación de composición, es decir, la proporción o distribución de este tipo de bacterias patógenas en el total de bacterias patógenas.
3. Un estudio trata a pacientes (el número total de casos es B) y el número de pacientes curados es A, entonces A/B es la tasa (puede entenderse como la tasa de curación).
Métodos de inferencia estadística: generalmente se dividen en factores únicos y factores múltiples.
Los puntos clave del método de análisis unifactorial son: primero, aclarar el tipo de datos (contar datos); segundo, definir el tipo de diseño experimental (¿diseño completamente aleatorio? ¿Cuántos grupos de muestras?) tercero, preste atención a las condiciones de aplicación del método utilizado; cuarto, comparación de frecuencia de muestreo múltiple, como la prueba de chi-cuadrado de P
Figura 3 Elección correcta del método estadístico de recuento de datos
Dos puntos para recordar:
①La proporción de composición se basa en 100 y la suma de las proporciones de cada componente debe ser 100%, por lo que el aumento o disminución en la proporción de un componente afectará las proporciones. de otros componentes;
②La relación de suma de la relación de composición es fácil en aplicaciones prácticas. Confusamente, la principal diferencia radica en el denominador, que debe elegirse correctamente.
El análisis multivariado generalmente utiliza análisis de regresión, principalmente análisis de regresión logística, que le presentaremos más adelante.
3. Información jerárquica
Características: pertenece a datos de clasificación múltiple y cumple con los requisitos de clasificación múltiple de diferentes grados y niveles en la naturaleza. cierto orden (ordenado), es decir, datos de nivel.
Forma de descripción: "Número de casos (%)" es la más utilizada (común en la literatura general), que es básicamente la misma que la descripción de los datos de recuento. La principal diferencia es que se deben organizar varias categorías en orden (de menor a mayor o de más débil a más fuerte).
Método de inferencia estadística: la prueba no paramétrica (prueba de suma de rangos) es un método de análisis estadístico utilizado para clasificar datos en análisis univariados. Por supuesto, para datos R × C ordenados de dos vías, es decir, cuando las variables de agrupación y las variables finales están ordenadas (rango), se usa la prueba de chi-cuadrado para comparar la relación de composición, la prueba de suma de rangos se utiliza para comparar el grado y la correlación de tendencias se compara mediante la correlación de rango (también llamada correlación de rango). El análisis multivariado utilizó regresión logística ordenada.
Nota: Las variables categóricas (datos de conteo y datos de calificaciones) deben cuantificarse (asignarse) adecuadamente durante las operaciones de análisis del software. La tarea afectará directamente la interpretación de los resultados del análisis estadístico.
Finalmente, la siguiente figura se utiliza para resumir la elección de métodos estadísticos básicos (Figura 4).
Figura 4 La elección correcta de los métodos estadísticos básicos comúnmente utilizados
Eso es todo por hoy. Los estudiantes deberían revisar más. Si tiene alguna pregunta o no comprende, deje un mensaje a continuación. Le pediremos al profesor Liu Ling que responda estas preguntas una por una. Bueno, ¡esperemos con ansias el próximo número!
Escritor: Liu Ling Editor del contrato: Liu Qin
Composición tipográfica: Bi Li Reseña: Wang Dong
Introducción del experto
Liu Ling: Profesor asociado del Departamento de Estadísticas de Salud de la Universidad Médica del Ejército, dedicado principalmente a la enseñanza e investigación de estadísticas de salud. Alguna vez se desempeñó como octavo miembro del Comité Profesional de Métodos y Teoría Estadística de la Sociedad China de Información de Salud, subdirector del Comité Profesional de Estadísticas de Salud y Medicina Preventiva de Chongqing, y se desempeñó como miembro del consejo editorial y revisor estadístico de muchas revistas. como por ejemplo “Revista de la Tercera Universidad Médica Militar”.
Recomendaciones históricas
Hablar de estadística en las clases de investigación médica (Parte 4): El alma de los métodos estadísticos: análisis de varianza
Hablar de estadística en la investigación médica Clases (Parte 3): Lo que debes saber sobre las pruebas de normalidad y homogeneidad de varianza
Estadística de investigación médica (2): ¿Se realiza correctamente la prueba T?
Estadísticas de Investigación Médica (1): ¿Qué es la estimación del tamaño de la muestra?