La Red de Conocimientos Pedagógicos - Conocimientos universitarios - 1.6 Fórmula de probabilidad total y fórmula bayesiana

1.6 Fórmula de probabilidad total y fórmula bayesiana

Por ejemplo: Una escuela tiene 60 niños y 40 niñas. Los niños siempre usan pantalones y las niñas usan medio pantalón y media falda. Con esta información, podemos calcular fácilmente "cuál es la probabilidad de seleccionar aleatoriamente a un estudiante para que use pantalones o falda", que es el cálculo de la "probabilidad positiva" mencionada anteriormente. Sin embargo, si estás caminando por el campus y te encuentras con un estudiante que usa pantalones (desafortunadamente, son muy similares, solo puedes ver si él o ella usa pantalones, pero no puedes determinar su género), ¿puedes inferir que él o ella ella lleva pantalones? ¿Cuál es la probabilidad de que (ella) sea un niño?

Por ejemplo, supongamos que la probabilidad de que las mujeres padezcan una determinada enfermedad es , y la probabilidad de que los hombres padezcan esta enfermedad es , Dado que la proporción entre hombres y mujeres en el país es , encuentre la. probabilidad de que alguna persona padezca esta enfermedad.

Análisis: Nótese que el evento es una enfermedad, el evento es una mujer que padece una enfermedad y el evento es un hombre que padece una enfermedad.

Teorema: Sea un espacio muestral, si el evento lo satisface.

Se llama división del espacio muestral y luego se puede obtener

Es decir,

Esta fórmula se llama ley de probabilidad total.

Hay una bola roja y una bola blanca en la mochila. Primero, saca cualquier bola de la bolsa, escribe el color y vuelve a colocarla. Al mismo tiempo, mete una bola del mismo color en la bolsa y saca otra bola de la bolsa. Calcula la probabilidad de sacar la bola blanca por segunda vez.

Solución: Recuerda, obviamente es una división de , dada por la fórmula de probabilidad total.

Piensa: ¿Qué pasará si metes la bola del mismo color en la bolsa por segunda vez?

Respuesta: El resultado sigue siendo el mismo.

Ejemplo: Hay 10 bolsas, de las cuales A tiene dos bolsas, cada bolsa tiene dos bolas rojas y dos blancas; hay tres bolsas B, cada bolsa tiene allí tres bolas rojas y dos blancas; Hay cinco bolsas C, cada bolsa contiene dos bolas rojas y tres bolas blancas. Tome cualquiera de las diez bolsas y luego saque cualquier bola de la bolsa y encuentre la probabilidad de obtener una bola blanca.

Solución: El comentario significa obtener las bolsas A, B y C respectivamente, lo que significa obtener la bola blanca. Según la fórmula de probabilidad total

Pregunta: Si se mezclan las bolas de tres bolsas y luego se toma cualquier bola, ¿es la misma probabilidad de obtener una bola blanca?

Respuesta: ¡Es diferente! La fórmula para la probabilidad total es el promedio ponderado de probabilidades.

Ejemplo: La tasa de primer acierto del Tanque A y del Tanque B es 0,8, y la tasa de segundo acierto corregida es 0,9. La probabilidad de que un objetivo enemigo sea alcanzado por un proyectil y destruido es de 0,2, y la probabilidad de ser alcanzado por dos proyectiles y destruido es de 0,5. Si lo alcanzan tres balas de cañón, será destruido. Durante la batalla, el Tanque A y el Tanque B dispararon dos proyectiles al mismo objetivo enemigo respectivamente. Encuentre la probabilidad de que el objetivo enemigo haya sido destruido.

Solución: Supongamos que el objetivo es destruido y el objetivo es alcanzado por una bala de cañón.

Según la fórmula de probabilidad total

Establecer como una partición del espacio muestral y

Luego combinar con la fórmula de probabilidad total mediante la fórmula de multiplicación

p>

Podemos obtener

Esta fórmula se llama fórmula bayesiana.

La fórmula bayesiana incorpora una relación entre "causa" y "efecto". En muchos casos, no solo el efecto se puede inferir de la causa, sino que también el efecto se puede inferir del resultado.

Ejemplo (prueba de abuso de drogas): Supongamos que la sensibilidad y confiabilidad de un resultado de prueba convencional son 0, es decir, la probabilidad de que un drogadicto salga positivo ( ) cada vez es 0. La probabilidad de una prueba negativa (-) para un no consumidor de drogas es. A juzgar por la probabilidad de los resultados de la detección, los resultados de la detección son relativamente precisos, pero el teorema de Bayes puede revelar un problema potencial. Supongamos que una empresa examina a todos sus empleados para detectar el consumo de drogas y se sabe que los empleados están consumiendo drogas. ¿Cuál es la probabilidad de que cada empleado que da positivo esté consumiendo drogas?

Análisis: Es un incidente de consumo de drogas por parte de un empleado. Es un incidente de consumo de drogas por parte de un empleado. Disponible

Con base en la descripción anterior, podemos calcular la probabilidad condicional de que alguien esté efectivamente consumiendo drogas cuando la prueba da positivo:

Conclusión: Aunque la precisión de la detección del abuso de drogas es tan alta como 99%, pero el teorema de Bayes nos dice que si alguien es positivo, la probabilidad de que consuma drogas es sólo de aproximadamente 33, y la probabilidad de no consumir drogas es relativamente alta.

Si los falsos positivos son altos, los resultados de la prueba no son confiables.

Situaciones similares:

Ejemplo: El primer, segundo y tercer taller de una fábrica producen todos el mismo producto, y la producción representa el 15, 80 y 5 de la producción total respectivamente. . Las tasas de defectos de los tres talleres son 2, 1 y 3 respectivamente. Ahora bien, si alguno de los productos resumidos resulta defectuoso después de la inspección, ¿qué taller tiene más probabilidades de ser considerado defectuoso?

Análisis: Este es un problema de análisis "causal", por lo que se aplica la fórmula de Bayes.

Solución: El registro indica que se obtienen productos defectuosos, indicando que los productos se producen en el taller La fórmula de probabilidad total

Luego mediante la fórmula bayesiana

se puede ver que hay más productos defectuosos Probablemente producidos en el segundo taller.

El proceso de análisis anterior también se denomina inferencia bayesiana.

Inferencia bayesiana

La suposición de que es la "causa" del resultado de la prueba se denomina probabilidad previa.

Si el experimento produce un evento, se debe discutir la "causa" del evento, lo que se llama probabilidad posterior y probabilidad causal.

Ejemplo: Suponiendo diversas enfermedades, se pueden utilizar métodos estadísticos para determinar la probabilidad de enfermedad (probabilidad previa).

Utilice conocimientos médicos para determinar la probabilidad (probabilidad de causa) del indicador (como temperatura corporal, pulso, imagen sanguínea, etc.). Bajo cada enfermedad, utilizando la fórmula bayesiana, la probabilidad de que el indicador represente una Se puede calcular cierta enfermedad (probabilidad posterior).

Este es el principio de la aplicación del big data en el sistema médico.

Preguntas para pensar después de clase: Ejercicio 1: 20, 265, 438 0, 22, 23, 24.

Vea la belleza de las matemáticas: métodos bayesianos mágicos y triviales

Ejemplo (corrección ortográfica)

Primero, nuestro problema es que vemos que el usuario ingresa una palabra que no está en el diccionario, debemos adivinar: "¿Cuál es la palabra que este tipo realmente quiere ingresar?" Usando la descripción del idioma que acabamos de formalizar, debemos preguntar:

Esta probabilidad y descubrirla. Adivina la palabra que maximiza esta probabilidad.

Obviamente, nuestra suposición no es necesariamente única. Por ejemplo, si el usuario ingresa: thew, ¿quiere ingresar o descongelar? ¿Qué suposición es más probable? Afortunadamente, podemos calcular directamente sus respectivas probabilidades utilizando la fórmula de Bayes. También podríamos registrar nuestras múltiples conjeturas como (que representan hipótesis), todas las cuales pertenecen a un espacio de conjeturas discreto y limitado (hay un número limitado de palabras * * *), y registrar las palabras realmente ingresadas por el usuario como (que representan datos, es decir, datos de observación), entonces podemos registrarlos de manera abstracta como:, de manera similar, para nuestra suposición 2, lo es. Unifiquémoslo de la siguiente manera:

Usando la fórmula de Bayes una vez, obtenemos:

Para diferentes conjeturas específicas, son iguales, por lo que puedes ignorar esta constante al comparar sumas. Es decir, sólo necesitamos saber:

El significado abstracto de esta fórmula es: para datos de observación dados, la calidad de una suposición depende de "la probabilidad independiente de esta suposición (anterior)" y "Esta suposición produce el producto de la probabilidad (verilidad) de los datos observados. En nuestro ejemplo, esto significa que la probabilidad de que el usuario realmente quiera escribirlo depende de la probabilidad (frecuencia) de que el propio usuario sea utilizado en el vocabulario (probabilidad previa) y el usuario quiere escribirlo pero escribe el producto. de posibilidades (probabilidades).

Lo que sigue es sencillo. Para nuestra suposición, calcule este valor para cada palabra posible y luego tome la más grande para obtener la suposición más confiable.

Se pueden utilizar métodos similares para abordar ambigüedades en el lenguaje natural, como

¿Es la estructura gramatical de una niña que usa un telescopio para ver a un niño o de una niña que usa un telescopio para ver? ver un chico? Ambas estructuras gramaticales tienen casi el mismo grado de similitud (se podría pensar que la última estructura gramatical tiene menos en común, lo cual es un sesgo en retrospectiva. Solo hay que pensar en la niña que ve al niño sosteniendo un libro). A juzgar por los resultados estadísticos de corpus a gran escala, la última estructura gramatical es de hecho un poco inusual, pero definitivamente no es suficiente para explicar nuestra fuerte tendencia hacia la primera estructura.

Entonces ¿por qué?

Una explicación razonable para la comparación de precios es: si la estructura gramatical es que la niña vio al niño con el telescopio, ¿por qué el niño tenía un telescopio en la mano, una perilla que se puede usar para ver? ? Esta probabilidad es demasiado pequeña. ¿Por qué no consigue un libro? Toma lo que quieras. ¿Por qué cogiste el telescopio? Así que la única explicación es que debe haber alguna inevitabilidad detrás de esta "coincidencia". Esta inevitabilidad es que si interpretamos la estructura gramatical como una niña usando un telescopio para ver a un niño, es completamente consistente con los datos: dado que la niña usó algo para ver al niño, puede explicar completamente que esta cosa es un telescopio ( ya no es un evento de pequeña probabilidad).

También existe el problema de la segmentación de palabras chinas, por ejemplo

Dada una oración (cadena), como por ejemplo:

Cómo dividir esta oración en palabras (cadena de palabras) ) es el más confiable. Por ejemplo:

¿Cuál de estos dos participios es más fiable?

Evidentemente, esta idea también se puede extender al campo de la traducción automática, o incluso al reconocimiento de imágenes y al filtrado de spam.