El problema de los Tres Prisioneros apareció en la columna " Juegos Matemáticos " de Martin Gardner en Scientific American en 1959. [1] [2] Es matemáticamente equivalente al problema de Monty Hall con coche y cabra reemplazados por libertad y ejecución, respectivamente.
Problema
Tres presos, A, B y C, se encuentran en celdas separadas y están condenados a muerte. El gobernador ha seleccionado a uno de ellos al azar para ser indultado. El alcaide sabe cuál está indultado, pero no se le permite decirlo. El prisionero A le ruega al alcaide que le haga saber la identidad de uno de los dos que van a ser ejecutados. "Si va a perdonar a B, dame el nombre de C. Si va a perdonar a C, dame el nombre de B. Y si me perdonan, lanza una moneda en secreto para decidir si nombrar a B o C."
El alcaide le dice a A que B debe ser ejecutado. El prisionero A está complacido porque cree que su probabilidad de sobrevivir ha aumentado de 1/3 a 1/2, como ocurre ahora entre él y C. El prisionero A le cuenta en secreto a C la noticia, quien razona que la posibilidad de que A sea perdonado es sin cambios en 1/3, pero está contento porque su propia oportunidad ha subido a 2/3. ¿Qué prisionero tiene razón?
Solución
La respuesta es que el prisionero A no obtuvo ninguna información sobre su propio destino, ya que sabía que el alcaide le daría el nombre de otra persona. El prisionero A, antes de escuchar al alcaide, estima sus posibilidades de ser perdonado en 1/3, lo mismo que B y C. Como el alcaide dice que B será ejecutado, es porque C será indultado (1/3 oportunidad), o A será perdonado (1/3 de probabilidad) y la moneda B / C que lanzó el alcaide resultó B (1/2 probabilidad; para una probabilidad general 1/2 * 1/3 = 1/6 de probabilidad B fue nombrada porque A será perdonado). Por lo tanto, después de escuchar que B será ejecutado, la estimación de la probabilidad de que A sea perdonado es la mitad que la de C. Esto significa que sus posibilidades de ser perdonado, ahora sabiendo que B no lo es, nuevamente son 1/3, pero C tiene un 2 /. 3 posibilidades de ser perdonado.
Mesa
La explicación anterior se puede resumir en la siguiente tabla. Cuando A le pregunta al alcaide, solo puede responder B o C para ser ejecutado (o "no perdonado").
Ser perdonado Guardián: "no B" Guardián: "no C" Suma A 1/6 1/6 1/3 B 0 1/3 1/3 C 1/3 0 1/3
Como el alcaide ha respondido que B no será perdonado, la solución viene de la segunda columna "no B". Parece que las probabilidades de que A contra C sea perdonado son 1: 2.
Formulación matemática
Llamada , y los hechos que el detenido correspondiente será indultado, y En el caso de que el alcaide le diga a A que el prisionero B será ejecutado, entonces, usando el teorema de Bayes , la probabilidad posterior de que A sea perdonado es:
La probabilidad de que C sea perdonado, por otro lado, es:
La diferencia crucial que hace que A y C sean desiguales es que pero . Si A será indultado, el alcaide puede decirle a A que se ejecutará B o C, y por lo tanto; mientras que si C será indultado, el alcaide solo puede decirle a A que B está ejecutado, por lo que.
Una explicación intuitiva
El prisionero A solo tiene 1/3 de posibilidades de perdón. Saber si se ejecutará "B" o "C" no cambia sus posibilidades. Después de saber que B será ejecutado, el prisionero A se da cuenta de que si él mismo no obtiene el perdón, solo debe ir a C. Eso significa que hay 2/3 de posibilidades de que C obtenga un perdón. Esto es comparable al problema de Monty Hall .
Enumeración de posibles casos
Pueden surgir los siguientes escenarios:
- A es indultado y el alcaide menciona que B será ejecutado: 1/3 × 1/2 = 1/6 de los casos
- A es indultado y el alcaide menciona que C debe ser ejecutado: 1/3 × 1/2 = 1/6 de los casos
- B es indultado y el alcaide menciona a C para ser ejecutado: 1/3 de los casos
- C es indultado y el alcaide menciona a B para ser ejecutado: 1/3 de los casos
Con la estipulación de que el alcaide elegirá al azar, en el 1/3 del tiempo que A debe ser perdonado, hay 1/2 probabilidad de que diga B y 1/2 de probabilidad de que diga C. Esto significa que tomado en general, 1/6 de las veces (1/3 [que A es perdonado] × 1/2 [que el alcaide dice B]), el alcaide dirá B porque A será perdonado, y 1/6 de las veces (1 / 3 [que A es perdonado] × 1/2 [que el alcaide dice C]) dirá C porque A está siendo perdonado. Esto se suma al total de 1/3 del tiempo (1/6 + 1/6) que A está siendo indultado, lo cual es exacto.
Ahora está claro que si el alcaide responde B a A (1/2 del tiempo del caso 1 y caso 4), entonces 1/3 del tiempo C es perdonado y A aún será ejecutado (caso 4), y solo 1/6 de las veces A es indultado (caso 1). Por lo tanto, las posibilidades de C son (1/3) / (1/2) = 2/3 y las de A son (1/6) / (1/2) = 1/3.
La clave de este problema es que el alcaide no puede revelar el nombre de un prisionero que será indultado. Si eliminamos este requisito, puede demostrar el problema original de otra manera. El único cambio en este ejemplo es que el prisionero A le pide al alcaide que le revele el destino de uno de los otros prisioneros (sin especificar uno que será ejecutado). En este caso, el alcaide lanza una moneda y elige uno de B y C para revelar el destino de. Los casos son los siguientes:
- A indultado, alcaide dice: B ejecutado (1/6)
- Un alcaide indultado dice: C ejecutado (1/6)
- B perdonado, alcaide dice: B perdonado (1/6)
- B perdonado, alcaide dice: C ejecutado (1/6)
- C indultado, alcaide dice: B ejecutado (1/6)
- C indultado, alcaide dice: C indultado (1/6)
Cada escenario tiene una probabilidad de 1/6. El problema original de los Tres Prisioneros puede verse bajo esta luz: el alcaide en ese problema todavía tiene estos seis casos, cada uno con una probabilidad de 1/6 de que ocurran. Sin embargo, el alcaide en ese caso no puede revelar el destino de un prisionero indultado. Por lo tanto, en 1/6 de las veces que ocurre el caso 3, dado que decir B no es una opción, el alcaide dice C en su lugar (lo que hace que sea lo mismo que en el caso 4). De manera similar, en el caso 6, el alcaide debe decir B en lugar de C (lo mismo que en el caso 5). Eso deja a los casos 4 y 5 con 1/3 de probabilidad de ocurrir y nos deja con la misma probabilidad que la anterior.
¿Por qué la paradoja?
La tendencia de la gente a dar la respuesta 1/2 no toma en cuenta que el alcaide puede haber arrojado una moneda antes de dar su respuesta. El alcaide puede haber respondido porque va a ser liberado y lanzó una moneda. O,va a ser liberado. Pero las probabilidades de los dos eventos no son iguales.
Judea Pearl (1988) utilizó una variante de este ejemplo para demostrar que las actualizaciones de creencias deben depender no sólo de los hechos observados sino también del experimento (es decir, la consulta) que condujo a esos hechos. [3]
Problemas y aplicaciones relacionados
- Paradoja de niño o niña
- Principio de elección restringida , una aplicación en el puente del juego de cartas.
- El dilema del prisionero , un problema de teoría de juegos
- Problema de la bella durmiente
- Problema de dos sobres
Notas
- ^ Gardner, Martin (octubre de 1959). "Juegos matemáticos: problemas relacionados con cuestiones de probabilidad y ambigüedad". Scientific American . 201 (4): 174-182. doi : 10.1038 / scientificamerican1059-174 .
- ^ Gardner, Martin (1959). "Juegos matemáticos: cómo tres matemáticos modernos refutaron una célebre conjetura de Leonhard Euler". Scientific American . 201 (5): 188. doi : 10.1038 / scientificamerican1159-181 .
- ^ Pearl, J. (1988). Razonamiento probabilístico en sistemas inteligentes: redes de inferencia plausible (Primera ed.). San Mateo, CA: Morgan Kaufmann.
Referencias
- Frederick Mosteller : Cincuenta problemas desafiantes de probabilidad . Dover 1987 (reimpresión), ISBN 0-486-65355-2 , pág. 28-29 ( versión en línea restringida , p. 28, en Google Books )
- Richard Isaac: placeres de la probabilidad . Springer 1995, ISBN 978-0-387-94415-9 , pág. 24-27 ( versión en línea restringida , p. 24, en Google Books )