La Red de Conocimientos Pedagógicos - Conocimientos sobre estudiar en el extranjero - ¿Qué significa confiabilidad?

¿Qué significa confiabilidad?

Pregunta 1: ¿Qué quiere decir con confiabilidad y validez? La confiabilidad y la validez se pueden resumir simplemente como "dos libras de azúcar". Las dos libras son confiabilidad y el azúcar es validez. Si pesa un kilo y medio o dos centímetros, significa que hay un problema de fiabilidad. Si la sal o el arroz medidos no son el azúcar que queremos, es una cuestión de validez.

Clasificación de la confiabilidad:

1. Fiabilidad test-retest: la consistencia de los resultados de medición de una misma escala en diferentes momentos. Si un producto pesa dos kilogramos hoy y un kilo y medio mañana, significa que no es fiable.

2. Fiabilidad media. Utilice un método determinado para dividir los elementos de medición en dos mitades y medirlos por separado para obtener la correlación de los resultados. Divida dos kilogramos en dos kilogramos. Si son 1 kilogramo y un kilogramo y medio, significa que hay un problema con la confiabilidad del plegado.

3. Fiabilidad entre evaluadores: La consistencia de los resultados obtenidos por diferentes evaluadores utilizando la misma herramienta. Varias personas utilizan la misma báscula para pesarse por separado. Si todos pesan dos kilogramos o cerca de dos kilogramos, significa que el evaluador es altamente confiable.

4. Fiabilidad de copia. Correlación entre múltiples herramientas de medición. Si utiliza esta marca para pesar dos kilogramos y otra marca de la misma marca pesa dos kilogramos, significa que la confiabilidad de la redacción publicitaria es alta.

Clasificación de validez:

1. Periodo de validez del valor nominal. Los resultados de las observaciones y mediciones empíricas son los indicadores que se deben medir. Parece azúcar blanco, pero subjetivamente pensamos que es azúcar blanco. Por supuesto, también podría ser detergente en polvo o sal.

2. Validez del contenido. Resultados de pruebas de industrias y profesiones relevantes. Solicite a los expertos autorizados pertinentes que evalúen si se trata de azúcar blanca.

3.Validez de constructo. ¿Cuáles son las propiedades de medición de un calibre? Realizar mediciones, evaluaciones y demostraciones integrales del sabor, color, estructura química y otros aspectos del azúcar.

¿Está bien?

Pregunta 2: ¿Qué son la confiabilidad y la validez? La confiabilidad se refiere a la consistencia, estabilidad y confiabilidad de los resultados de las pruebas. En términos generales, la consistencia interna se utiliza para indicar la confiabilidad de una prueba. Cuanto mayor sea el coeficiente de confiabilidad, más consistentes, estables y confiables serán los resultados de la prueba. Los errores sistemáticos tienen poco efecto sobre la confiabilidad porque siempre afectan el valor medido de la misma manera y por lo tanto no causan inconsistencias. Por el contrario, los errores aleatorios pueden generar incertidumbre y, por tanto, reducir la confiabilidad. La confiabilidad se puede definir como el grado en que el error aleatorio r afecta el valor medido. Si R=0, la medición se considera completamente confiable y tiene la mayor confiabilidad.

La validez, o eficacia, se refiere al grado en que una herramienta o medio de medición puede medir con precisión lo que se necesita medir. La validez se refiere al grado en que los resultados de la medición reflejan lo que se está investigando. Cuanto más consistentes sean los resultados de la medición con el contenido que se investiga, mayor será la validez. Por el contrario, la validez es menor. La validez se puede dividir en tres tipos: validez de contenido, validez de criterio y validez de constructo.

Pregunta 3: Coeficiente de confiabilidad R=0.85, P

Si se expresa como R, es más probable probar la confiabilidad, porque R representa correlación y la confiabilidad test-retest es dos Coeficiente de correlación entre pruebas.

A continuación se ofrece una breve explicación del significado de los símbolos.

R=0,85 significa que el valor del coeficiente de correlación es 0,85, lo que también puede entenderse como que el valor del índice de confiabilidad es 0,85. Generalmente, la confiabilidad es buena cuando está por encima de 0,8. y P Pregunta 4: ¿Qué son el análisis de confiabilidad y el análisis de validez? El cuestionario de 20 puntos es un método de encuesta ampliamente utilizado en la investigación educativa. El cuestionario diseñado según el propósito de la encuesta es una herramienta para la obtención de información, y su calidad juega un papel decisivo en la autenticidad y aplicabilidad de los resultados de la encuesta. Para garantizar que el cuestionario tenga una alta confiabilidad y validez, el cuestionario debe probarse antes de que se forme el cuestionario formal, y los resultados de la prueba deben analizarse para determinar su confiabilidad y validez. Con base en los resultados del análisis, se seleccionaron los elementos del cuestionario y se ajustó la estructura del cuestionario para mejorar la confiabilidad y validez del cuestionario. Los métodos de análisis de confiabilidad y validez incluyen el análisis lógico y el análisis estadístico, y este artículo analiza principalmente este último.

Primero, análisis de confiabilidad

La confiabilidad es confiabilidad, que se refiere a la consistencia de los resultados cuando el mismo objeto se mide repetidamente usando el mismo método. Los indicadores de confiabilidad están representados principalmente por coeficientes de correlación, que se pueden dividir aproximadamente en tres categorías: coeficiente de estabilidad (consistencia en el tiempo), coeficiente de equivalencia (consistencia entre formas) y coeficiente de consistencia interna (consistencia entre elementos).

Hay cuatro métodos principales de análisis de confiabilidad:

1. Método de confiabilidad test-retest

Este método utiliza el mismo cuestionario y evalúa repetidamente al mismo grupo de encuestados en ciertos intervalos. el coeficiente de correlación de los dos resultados de la prueba. Obviamente, la confiabilidad test-retest es un coeficiente estable. El método de fiabilidad test-retest es especialmente adecuado para cuestionarios factuales, como sexo, fecha de nacimiento, etc. No debería haber diferencias entre las dos pruebas. Los intereses, pasatiempos y hábitos de la mayoría de los encuestados no cambiarán significativamente en un corto período de tiempo. Este método también es adecuado para cuestionarios de actitudes y opiniones si no hay cambios repentinos en las actitudes y opiniones de los encuestados. Dado que el método de confiabilidad test-retest requiere que la misma muestra sea analizada dos veces, los sujetos de la encuesta se ven fácilmente afectados por diversos eventos, actividades, etc., y el intervalo es limitado, lo que dificulta su implementación.

2. Método de confiabilidad de replicación

El método de confiabilidad de replicación consiste en pedir al mismo grupo de encuestados que completen dos cuestionarios a la vez y calcular el coeficiente de correlación de los dos cuestionarios. La confiabilidad de la réplica pertenece al coeficiente de equivalencia. El método de confiabilidad de la redacción requiere que los dos escritos sean completamente consistentes en términos de contenido, formato, dificultad y dirección de los tipos de preguntas correspondientes, excepto por diferentes expresiones. Sin embargo, en las encuestas reales, es difícil hacer que el cuestionario cumpla con este requisito, por lo que pocas personas utilizan este método.

3. Método de semiconfiabilidad

El método de semiconfiabilidad consiste en dividir los ítems de la encuesta en dos mitades, calcular el coeficiente de correlación de las puntuaciones de las dos mitades y luego estimar. la confiabilidad de toda la escala. La media confiabilidad es un coeficiente de consistencia interna que mide la consistencia de las puntuaciones en las dos mitades de una pregunta. Este método generalmente no es adecuado para cuestionarios basados ​​en hechos (por ejemplo, la edad y el género no se pueden comparar) y, a menudo, se utiliza para el análisis de confiabilidad de cuestionarios de actitud y opinión. En las encuestas por cuestionario, la forma más común de medir la actitud es la escala Likert de 5 puntos. Durante el análisis de confiabilidad dividida por mitades, si la escala contiene ítems negativos, las puntuaciones de los ítems negativos deben invertirse para garantizar la coherencia de la dirección de puntuación de cada ítem, y luego todos los ítems deben dividirse en partes iguales según pares e impares. o antes y después tanto como sea posible. Dos mitades, calcule el coeficiente de correlación entre ellas (rhh, el coeficiente de confiabilidad de la mitad de la escala). Finalmente, utilice la fórmula de Spearman-Brown:

Calcule el coeficiente de confiabilidad (ru) de toda la escala.

4. Método del coeficiente de confiabilidad alfa

El coeficiente de confiabilidad alfa de Cronbach es actualmente el coeficiente de confiabilidad más utilizado y su fórmula es:

Entre ellos, k es el número total de ítems en la escala, la varianza dentro del ítem de la puntuación de la primera pregunta y la varianza de las puntuaciones totales de todos los ítems. Se puede ver en la fórmula que el coeficiente α evalúa la coherencia entre las puntuaciones de cada ítem de la escala y es un coeficiente de coherencia interna. Este método es adecuado para el análisis de confiabilidad de cuestionarios (escalas) de actitud y opinión.

2. Análisis de validez

La validez, es decir, la validez, se refiere al grado en que una herramienta o método de medición puede medir con precisión lo que se necesita medir. La validez se puede dividir en tres tipos: validez de contenido, validez de criterio y validez de constructo. Existen muchos métodos de análisis de validez y los resultados de la medición reflejan diferentes aspectos de la validez. Los métodos comúnmente utilizados para analizar la validez de los cuestionarios incluyen principalmente los siguientes.

1. Análisis de validez de correlación de ítems individuales y sumatoria.

Este método se utiliza para medir la validez de contenido de la escala. La validez de contenido, también conocida como validez aparente o validez lógica, se refiere a si los elementos diseñados representan el contenido o tema a medir. La evaluación de la validez de contenido suele utilizar una combinación de análisis lógico y análisis estadístico. El análisis lógico generalmente implica que investigadores o expertos juzguen si los elementos seleccionados "parecen" cumplir con el propósito y los requisitos de la medición. El análisis estadístico utiliza principalmente métodos de análisis de correlación de suma y de un solo ítem para obtener resultados de evaluación, es decir, en función de si la correlación es significativa, se calcula el coeficiente de correlación entre la puntuación de cada ítem y la puntuación total de cada ítem...>; gt

Pregunta 5: ¿Qué es la confiabilidad? La confiabilidad de cualquier dispositivo de medición representa el grado en que los resultados pueden medirse repetidamente. Simple y conveniente, la confiabilidad se refiere a la consistencia de los resultados de las mediciones en diferentes condiciones. Una regla de 20 cm, ya sea que la uses hoy o mañana, en Beijing o Tokio, o la use yo, el resultado será el mismo.

Pregunta 6: Explicación popular de validez y confiabilidad. La confiabilidad y validez de 20 puntos se pueden resumir simplemente como "dos libras de azúcar". Las dos libras son confiabilidad y el azúcar es validez. Si pesa un kilo y medio o dos centímetros, la fiabilidad es cuestionable.

Si la sal o el arroz medidos no son el azúcar que queremos, es una cuestión de validez.

Clasificación de la confiabilidad:

1. Fiabilidad test-retest: la consistencia de los resultados de medición de una misma escala en diferentes momentos. Si un producto pesa dos kilogramos hoy y un kilo y medio mañana, significa que no es fiable.

2. Fiabilidad media. Utilice un método determinado para dividir los elementos de medición en dos mitades y medirlos por separado para obtener la correlación de los resultados. Divida dos kilogramos en dos kilogramos. Si son 1 kilogramo y un kilogramo y medio, significa que hay un problema con la confiabilidad del plegado.

3. Fiabilidad entre evaluadores: La consistencia de los resultados obtenidos por diferentes evaluadores utilizando la misma herramienta. Varias personas utilizan la misma báscula para pesarse por separado. Si todos pesan dos kilogramos o cerca de dos kilogramos, significa que el evaluador es altamente confiable.

4. Fiabilidad de copia. Correlación entre múltiples herramientas de medición. Si utiliza esta marca para pesar dos kilogramos y otra marca de la misma marca pesa dos kilogramos, significa que la confiabilidad de la redacción publicitaria es alta.

Clasificación de validez:

1. Periodo de validez del valor nominal. Los resultados de las observaciones y mediciones empíricas son los indicadores que se deben medir. Parece azúcar blanco, pero subjetivamente pensamos que es azúcar blanco. Por supuesto, también podría ser detergente en polvo o sal.

2. Validez del contenido. Resultados de pruebas de industrias y profesiones relevantes. Solicite a los expertos autorizados pertinentes que evalúen si se trata de azúcar blanca.

3.Validez de constructo. ¿Cuáles son las propiedades de medición de un calibre? Realizar mediciones, evaluaciones y demostraciones integrales del sabor, color, estructura química y otros aspectos del azúcar.

Para ser específico, es más sencillo encontrar un periódico profesional para elaborar el cuestionario usted mismo.

Pregunta 7: ¿Qué significa confiabilidad dividida por la mitad en la escala? El término estándar es confiabilidad dividida por la mitad.

Es uno de los métodos de prueba de confiabilidad más utilizados. Refleja el grado de consistencia interna de los ítems de la prueba, es decir, el grado en que la prueba mide el mismo contenido o características. El análisis específico consiste en dividir los elementos de la prueba en dos grupos iguales (dos mitades) después de la prueba. Generalmente se utiliza el método de agrupación par-impar, es decir, los elementos de la prueba se dividen en dos mitades de acuerdo con los números pares e impares de los números de serie, y luego se calcula la correlación entre los dos elementos. Cuanto mayor sea la correlación, mayor será la confiabilidad o consistencia interna.

Cuando las varianzas de las dos partes son iguales (cuando la prueba de homogeneidad de varianzas es homogénea), se puede utilizar la fórmula de Spearman-Brown para corregir: r = 2r'/(1 r') r' es el valor de las dos mitades del coeficiente de correlación, r es el valor de confiabilidad de toda la prueba.

Si la prueba de homogeneidad de la varianza es desigual, se puede utilizar la siguiente fórmula:

(1) Fórmula de Flanagan: r=2(1-(S1 S2)/S)

S1 y S2 representan respectivamente la varianza de las puntuaciones de cada sujeto en la mitad de la prueba, y S representa la varianza de la puntuación total de cada asignatura en la prueba completa.

(2) Fórmula Lulen: SD/S.

r es el valor de confiabilidad de toda la prueba, Sd es la varianza de la diferencia entre las puntuaciones del mismo grupo de sujetos en la segunda subprueba y S representa la varianza de la puntuación total de todos los sujetos. en toda la prueba.