Problème de Monty Hall

Problème de Monty Hall

Defence

Il s'agit de l'épreuve finale d'un jeu télévisé. Le candidat est face à 3 coffrets. Il sait que dans un coffret il y a un lingot d'or d'une valeur de 10.000 euros et que dans les 2 autres il n'y a qu'une pièce d'un centime d'euro.

Le candidat désigne un des 3 coffrets mais ne l'ouvre pas. Le présentateur pose un carton devant le coffret choisi. Puis l'animateur (qui sait très bien où se trouve le lingot) prend l'un des deux autres coffrets restants, l'ouvre et lui montre que le coffret ouvert contient un centime d'euros. Le lingot est donc soit dans le coffret désigné par le candidat, soit dans l'autre coffret, celui qui n'a pas été ouvert par l'animateur.

L'animateur pose la question au candidat : "est-ce que vous gardez votre choix initial ou est-ce que vous voulez changer ?"

Sous les encouragements du public dont la moitié crie "garde" et l'autre moitié crie "change", que doit faire le candidat ?

- Laisser le carton devant le premier coffret qu'il avait choisi et confirmer son choix ?

- Ou changer son choix et demander que le carton soit posé devant l'autre coffret pas encore ouvert ?



Solution :

On pourrait penser que le choix importe peu : le candidat est face à deux coffrets, l’un des deux contient 1 lingot. Il a donc 50% de chance de choisir l’un des deux, donc peu importe qu’il garde celui qu’il avait choisi ou qu’il change son choix.

En fait, c’est faux. Ce qui est difficile à comprendre, c'est que c'est un problème différent de « il y a deux coffrets, l’un contient un lingot, l’autre contient un centime » en faisant abstraction de la première partie du jeu. Il n'y a pas de reset : c'est bien un jeu en trois étapes : Le candidat choisit un coffret, l'animateur donne une indication en ouvrant un coffret contenant un centime, le candidat (re)choisit un coffret. Avec en plus le fait que l'action de l'animateur n'est pas probabiliste puisque lui, sait où se trouve le lingot, et peut donc ouvrir un coffret de manière sûre.

Le dessin ci-dessous permet de détailler les étapes. Voir les explications en dessous du dessin.

1) Le candidat choisit 1 des 3 coffret avec donc une probabilité de P1 = 1/3

2) l’animateur va ouvrir un des coffrets contenant un centime.

Si le candidat a choisi le coffret contenant la 1ère pièce (euro1), l’animateur va ouvrir le coffret contenant la 2e pièce (euro2) avec une probabilité de P2 = 1 (il est certain d'ouvrir l'autre coffret). Idem si le candidat à choisi euro2, l’animateur ouvre le coffret euro1 avec une probabilité de P2 = 1. Mais si le candidat a choisi le coffret avec le lingot, l’animateur ouvrira soit le coffret euro1, soit le coffret euro2, avec une probabilité de P2 = ½ chacun.

3) Le candidat peut maintenant soit changer son choix (trait vert), soit garder son choix trait rouge.

Par exemple sur la branche la plus à gauche de l'arbre de décision

  • Premier choix le candidat a choisi le coffret euro1
  • L’animateur ouvre le coffret euro2
  • - Le candidat décide de changer et gagne le lingot (trait vert)
  • - Le candidat décide de ne pas changer et gagne la pièce d’un centime (trait rouge)

4) on calcule la probabilité finale de chaque choix. Loi combinée de P2 et P1 vaut P = P1 x P2

5) il reste maintenant a additionné les probabilités de trouver le lingot si le candidat a changé et de trouver le lingot si le candidat n’a pas changé son choix.

 Les probabilités sont sans appel : il a 2 chances sur 3 de trouver le lingot s’il change son choix et seulement 1 chance sur 3 s’il reste sur son choix initial.


Et finalement, pour ceux qui doutent encore : des simulations informatiques ont été effectuées sur un très grand nombre de tirages aléatoires. Au bout de quelques centaines de tirages, on arrive à environ 66% de chances de gagner si on change et 33% si on ne change pas.

Vérifiez vous même

http://lmrs.univ-rouen.fr/Vulgarisation/Hall/hall.html


Report Page