En théorie de la décision, le paradoxe des deux enveloppes est un raisonnement probabiliste aboutissant à un résultat absurde. Inspiré d'un problème posé en 1930 par le mathématicien belge M. Kraïtchik[1], ce paradoxe a été formulé par Martin Gardner[2] en 1982. Il en existe plusieurs réfutations, certaines[3] ne faisant d'ailleurs pas appel au calcul des probabilités.
Énoncé
Il existe plusieurs variantes du paradoxe. Le plus souvent, il est proposé la situation de décision suivante[4],[5] : deux enveloppes contiennent chacune un chèque. On sait que l'un des chèques porte un montant double de l'autre, mais on n'a aucune information sur la façon dont les montants ont été déterminés. Un animateur propose à un candidat de choisir une des enveloppes, le montant du chèque contenu dans l'enveloppe choisie lui sera acquis.
Le paradoxe proprement dit réside dans l'argument qui va suivre : avant que le candidat n'ouvre l'enveloppe choisie, l'animateur lui conseille de changer son choix avec le raisonnement suivant.
Soit la valeur du chèque dans l'enveloppe choisie. Il y a deux cas possibles :
une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus important (donc de valeur ) ;
une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus petit (donc de valeur ).
L'espérance du montant obtenu en changeant d'enveloppe serait alors qui est supérieur à .
Le candidat aurait donc intérêt à changer d'enveloppe, ce qui est absurde puisque les deux enveloppes jouent le même rôle, et que le candidat, n'ayant pas encore ouvert la première, n'a aucun moyen de les distinguer.
Espérance mathématique associée à chaque enveloppe
Afin de déterminer le gain moyen obtenu par le choix d’une enveloppe, on associe à la première enveloppe (resp. la seconde) la variable aléatoire (resp. ).
La loi de probabilité de la variable aléatoire est l’ensemble des 2 solutions possibles proposées par le jeu (noté sous la forme {valeur ; probabilité d’apparition}) :
et ,
où et sont les deux montants possibles proposés par le jeu.
Pour la variable aléatoire , l’ensemble est constitué de façon similaire :
et [6].
L’espérance du contenu de l’enveloppe 1 est par définition :
.
Pour l’enveloppe 2, on a de façon similaire :
.
On constate que , ce qui est logique car les deux enveloppes ont un rôle identique.
Espérance mathématique associée à chaque changement
Si l'on change d’enveloppe, par exemple de l’enveloppe 1 à l’enveloppe 2, on obtient l’espérance d’obtenir le gain de l’enveloppe 2 moins celui obtenu avec l’enveloppe 1 :
Ceci est dû à la propriété de linéarité des calculs d’espérance.
On conclut .
De façon similaire .
Sur un grand nombre d’épreuves, on ne peut pas espérer de gain en permutant les choix des enveloppes.
Espérance mathématique associée à chaque changement (variante)
Si l’on considère les 2 changements possibles[5] :
passer d’un montant à un montant ;
passer d’un montant à un montant .
On obtient resp. deux gains possibles :
le premier est positif de valeur avec une probabilité d’apparition de 50% ;
le second est négatif de valeur avec une probabilité d’apparition de 50%.
Ceci définit une seconde loi de probabilité avec deux issues possibles (noté {valeur ; probabilité}) :
et .
Cette seconde loi de probabilité a pour espérance :
.
Ce calcul aboutit lui aussi à un gain moyen nul, il s'agit simplement d'une alternative au calcul détaille de ou de .
Espérance mathématique calculée par le présentateur
Il est intéressant de voir en quoi le raisonnement de l’animateur aurait un défaut. Celui-ci propose la formule suivante :
où est le montant de l’enveloppe choisie. On note que l’on ne connait pas qui vaut soit , soit .
Par définition de l’espérance mathématique d’une loi de probabilité, on obtient de cette formule les deux solutions (noté {valeur ; probabilité d’apparition}) :
et .
Pour chacune de ces deux solutions, il faut envisager les deux cas possibles et :
dans le premier cas, on obtient et ;
dans le second : et .
On constate que les solutions possibles ) et ) sont contraires aux hypothèses et invalident le raisonnement du présentateur.
En examinant de plus près la formule du présentateur, les deux solutions et définissent une autre loi de probabilité. Ainsi correspond à un autre protocole :
ouvrir l’enveloppe choisie,
lire son contenu ,
puis remplacer (avec des probabilités égales) le contenu de la seconde par ou .
Le présentateur a commis une confusion entre deux lois de probabilité distinctes.
Pour résumer, le présentateur raisonne sur l'Univers correspondant au protocole juste ci-dessus, alors que l'Univers du paradoxe des deux enveloppes est .
Remarques
Supposons que . Que se passerait-il si l’on permutait plusieurs fois ? Il faudrait détailler les calculs de , , etc. On pourrait conjecturer une impossibilité, par exemple obtenir les deux relations incompatibles et .
Variables aléatoires
Il est cependant possible, en fonction de la modélisation exacte du raisonnement de l'animateur, de considérer que l'erreur réside dans l'interprétation des espérances et non dans leur calcul : David Madore fait ainsi remarquer[3] que si l'on considère qu'il y a deux variables aléatoires, , valant ou , et correspondant (avec probabilités ) au contenu de la première enveloppe, et , valant ou , et correspondant au contenu de la seconde enveloppe, alors l'espérance de est bien égale à celle de et vaut . Cependant l'espérance du rapport vaut ; l'erreur de raisonnement consiste alors à interpréter ce dernier résultat comme signifiant que est plus intéressant que (et donc qu'il faut changer d'enveloppe), alors que la seule conclusion à en tirer est le résultat surprenant, mais nullement paradoxal, que :
.
Modifications de l'énoncé
Si le candidat est autorisé à consulter le contenu de la première enveloppe, une approche probabiliste à ce problème de décision redevient possible : Keith Devlin (suivant une analyse de Amos Storkey) fait ainsi remarquer que si l'animateur a choisi le contenu des enveloppes selon une règle (probabiliste ou non) connue du joueur, il devient possible de prendre une décision rationnelle d'échange en fonction du contenu de la première enveloppe (par exemple, si la règle propose un choix aléatoire uniforme de valeurs d'enveloppes, de choisir d'échanger si le contenu découvert est inférieur à la moyenne des choix offerts par la règle), et David Madore montre même qu'on peut (si peu vraisemblable que cela paraisse) obtenir une probabilité strictement supérieure à 1/2 de choisir la bonne enveloppe quelle que soit la règle utilisée par l'animateur, et ce sans connaitre celle-ci[3]. Avec une information supplémentaire, l'échange peut procurer un gain.
John Broome, repris par d'autres auteurs, propose le protocole suivant[7] : l'animateur place dans les enveloppes les montants et avec une probabilité pour positif ou nul[8]. Il remarque d'abord que lorsque l'enveloppe choisie contient on a intérêt à échanger puisque l'autre enveloppe contient puis il montre que lorsque avec il y a un gain de espéré dans l'échange. Il en conclut que dans tous les cas le candidat a intérêt à changer même s'il n'ouvre pas l'enveloppe. Ce qui est paradoxal puisque, si le candidat n'ouvre pas les enveloppes, on a déjà montré qu'il n'y a aucun gain à espérer dans l'échange. Déduire un avantage lorsqu'on n'ouvre pas l'enveloppe de l'avantage espéré en prenant connaissance du contenu de l'enveloppe semble donc abusif ; l'explication vient de ce qu'avec cette distribution, l'espérance (que l'on change ou non d'enveloppe) est infinie[7].
Références
↑M. Kraïtchik, La mathématique des jeux ou Récréations mathématiques, Paris, Vuibert, , 566 p.
↑M. Gardner, La magie des paradoxes [« Aha! Gotcha: Paradoxes to Puzzle and Delight »], éd. Belin, (réimpr. 1985 pour l'édition française), p. 106.
↑ a et bJean-Paul Delahaye, Paradoxes. Rubrique de divertissements mathématiques pour ceux qui aiment se prendre la tête. Paradoxe des deux enveloppes. (lire en ligne)
↑Stricto sensu, il est abusif de considérer ces probabilités comme toutes deux de 50% : l'organisateur du jeu ne disposant pas d'un budget infini, la distribution de probabilité de la somme maximale doit être supposée avoir une valeur moyenne estimable, par exemple 100 000 €. Cette estimation faite, la distribution de probabilité la moins prévenue, c'est-à-dire celle d'entropie maximale est une exponentielle décroissante. En ce cas, l'autre enveloppe a davantage de chances de spécifier un montant plus petit que plus grand. Voir Inférence bayésienne
↑Cette distribution est bien une loi, puisque l'on a (voir série géométrique) ; on peut cependant remarquer que la variable aléatoire ainsi définie n'a pas d'espérance, puisque