El dilema del prisionero
El dilema del prisionero es un modelo de juego.
1. Introducción al dilema del prisionero
El dilema del prisionero es un ejemplo representativo de un juego de suma distinta de cero en la teoría de juegos, que refleja que la mejor opción para un individuo no es la mejor opción para el grupo.
En otras palabras, en un grupo, los individuos que toman decisiones racionales a menudo conducen a la irracionalidad colectiva. Aunque el dilema en sí es sólo de carácter modélico, en la realidad se dan con frecuencia situaciones similares en términos de competencia de precios, protección del medio ambiente, etc.
2. El origen del Dilema del Prisionero
El “Dilema del Prisionero” fue formulado por Merrill Flood y Melvin Drescher de la Rand Corporation en Estados Unidos en 1950. La teoría del El dilema fue elaborado más tarde en términos de prisioneros por el consultor Albert Tucker y lo denominó "Dilema del prisionero". Dos personas que conspiraron para cometer un delito fueron encarceladas y no podían comunicarse entre sí.
Si dos personas no denuncian a la otra, cada uno irá a prisión por un año porque las pruebas son inciertas; si una persona denuncia y la otra guarda silencio, el denunciante será liberado inmediatamente por mérito; servicio, y el silencioso será liberado inmediatamente por servicio meritorio, si cooperan, serán encarcelados durante diez años, si se exponen, ambas partes serán condenadas a ocho años de prisión porque las pruebas son sólidas;
Debido a que los prisioneros no pueden confiar unos en otros, tienden a exponerse mutuamente en lugar de permanecer juntos en silencio. Un modelo de juego que, en última instancia, conduce a que el equilibrio de Nash caiga sólo en el punto no cooperativo.
3. La historia del dilema del prisionero
La historia del dilema del prisionero es que dos sospechosos fueron capturados por la policía después de cometer un crimen y encerrados en diferentes habitaciones para ser interrogados. La policía sabía que los dos hombres eran culpables pero carecía de pruebas suficientes.
El policía les dijo a todos: Si ambos niegan, cada uno será condenado a un año; si ambos confiesan, cada uno será condenado a ocho años si uno de los dos confiesa y el otro niega, el el que confiese será puesto en libertad. Los que lo nieguen serán condenados a diez años. Por tanto, cada prisionero se enfrenta a dos opciones: confesar o negar.
Sin embargo, no importa lo que elija el cómplice, la mejor opción para cada preso es confesar: si el cómplice niega, será puesto en libertad; si confiesa, será condenado a diez años. . Es mejor confesar que no confesar; si el cómplice confiesa, si confiesa será condenado a ocho años, frente a diez años si lo niega.
Como resultado, ambos sospechosos optaron por confesar y fueron sentenciados a ocho años de prisión cada uno. Si ambos lo niegan, cada uno será sentenciado a un año, lo que obviamente es un buen resultado. El profundo problema reflejado en el dilema del prisionero es que la racionalidad individual de los seres humanos a veces puede conducir a la irracionalidad colectiva: los humanos inteligentes quedarán atrapados en un capullo debido a su propia inteligencia o dañarán los intereses del colectivo.
El contenido principal del Dilema del Prisionero
1. El Dilema del Prisionero de una sola vez y de varias veces
Los resultados del Dilema del Prisionero de una sola vez y de varias veces. El dilema no será el mismo. En un dilema del prisionero repetido, el juego se juega una y otra vez. Cada jugador tiene así la oportunidad de "castigar" al otro jugador por su comportamiento poco cooperativo en la ronda anterior.
En este punto, la cooperación puede surgir como un resultado equilibrado.
La motivación para hacer trampa puede entonces ser superada por la amenaza de castigo, lo que puede conducir a un resultado mejor y cooperativo. Cuando el número de repeticiones es cercano a infinito, el equilibrio de Nash tiende al óptimo de Pareto, de la traición mutua a la lealtad mutua.
2. Finalidad Teórica
Aunque los presos cooperan entre sí y pueden lograr el mejor interés para todos, cuando se desconoce la actuación de la otra parte, por traicionar a sus cómplices. puede traer beneficios a uno mismo, y debido a que reclutarse a uno mismo puede traer beneficios a sus cómplices, traicionarse unos a otros va en contra de los mejores intereses comunes, pero es en el propio interés.
Pero, de hecho, es imposible que las fuerzas del orden creen una situación de este tipo para inducir a todos los presos a confesar, porque los presos deben considerar otros factores además de la pena de prisión (represalias por traicionar a sus cómplices, etc.). .), y no pueden confiar plenamente en los organismos encargados de hacer cumplir la ley para hacerlo. Los intereses del establecimiento (duración de la sentencia) son factores que deben tenerse en cuenta.