La loi multinomiale
Les expériences de J.B. Rhine sur le paranormal
En 1934, le psychologue américain J.B. Rhine défraya la chronique en lançant une série d'expérience à l'Université de Caroline du Sud sur les phénomènes dits « paranormaux » (télépathie, clairvoyance, télékinésie...).
Le sujet est resté très controversé et 85 ans plus tard, n'a toujours pas emporté la conviction de la communauté scientifique, en dépit de quelques tentatives récentes de relancer ces recherches. Il est vrai que depuis, on a montré que beaucoup des résultats de Rhine avaient été obtenus par fraude, souvent à son insu (Broch, 2001).
L'une des expériences type de Rhine consistait à demander à des sujets d'essayer d'influencer par la pensée le résultat d'un lancer de dé mécanique, pour qu'il tombe sur une valeur choisie (le 6 par exemple).
Imaginons qu'une personne se livre à cette expérience et cherche à infléchir le hasard en faisant apparaître plus souvent la face 6. Les nombres d'apparition de chaque face sont rapportés dans le tableau ci-dessous.
Faces | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Apparitions | 2 | 2 | 2 | 3 | 4 | 5 |
Le sujet se déclare satisfait du résultat et pense avoir infléchi le hasard. Pour en juger, il nous faudrait établir la distribution de probabilité, dans le cas où aucun pouvoir psychique n'est en jeu. Cela nous permettrait de calculer la probabilité d'obtenir n'importe quelle distribution empirique $\boldsymbol{n}=(n_{1},n_{2},n_{3},n_{4},n_{5},n_{6})$ (et pas simplement celle observée ci-dessus), selon ce scénario. En d'autres termes, cela nous permettrait de calculer une vraisemblanceLa vraisemblance d'un modèle est la probabilité des données observées, d'après ce modèle..
Construction de la loi multinomiale
On note $\boldsymbol{\pi}=(\pi_{1},\pi_{2},\pi_{3},\pi_{4},\pi_{5},\pi_{6})$ l'ensemble des probabilités vraies d'apparition de chaque face. On note que : $$\pi_{1}+\pi_{2}+\pi_{3}+\pi_{4}+\pi_{5}+\pi_{6}=1$$ ou encore que $\pi_6=1-(\pi_{1}+\pi_{2}+\pi_{3}+\pi_{4}+\pi_{5})$. Cette situation généralise donc le cas binomial (où $\pi_2=1-\pi_1$) au cas de figure où la variable de résultats a plus que deux modalités.
Imaginons pour l'instant que les réponses à cette enquête soient apparues exactement dans l'ordre du tableau : les deux 1 d'abord, puis les deux 2, puis les 3 et ainsi de suite.
Résultats | 1 | 1 | 2 | 2 | 3 | 3 | 4 | ... | 5 | ... | 6 |
---|---|---|---|---|---|---|---|---|---|---|---|
Probabilités | $\pi_1$ | $\pi_1$ | $\pi_2$ | $\pi_2$ | $\pi_3$ | $\pi_3$ | $\pi_4$ | ... | $\pi_5$ | ... | $\pi_6$ |
Pour cette configuration particulière, en supposant l'indépendance des lancers, et une probabilité identique d'apparition d'une face donnée pour tous les sujets, la probabilité de cette séquence $S$ de résultats est simplement, par application de la loi du produit : $$P(S)=\pi_{1}^{2}\pi_{2}^{2}\pi_{3}^{2}\pi_{4}^{3}\pi_{5}^{4}\pi_{6}^{5}$$
Naturellement, dans la mesure où ce calcul est une multiplication, toute permutation de la séquence précédente aurait la même probabilité d'apparition, et ferait apparaître la même distribution observée. Pour obtenir une probabilité complète de cette répartition, tous scénarios confondus, on peut dénombrer le nombre de manières qu'il y a d'y arriver, case par case :
Faces | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Apparitions | 2 | 2 | 2 | 3 | 4 | 5 |
Manières | $C_{18}^{2}$ | $C_{16}^{2}$ | $C_{14}^{2}$ | $C_{12}^{3}$ | $C_{9}^{4}$ | $C_{5}^{5}$ |
On note que dans ce dénombrement par case, le total dans lequel on prend (nombre en bas) est diminué des observations qu'on a placées dans la case précédente, donnant la suite des totaux décroissante : 18, 16, 14 ,12, 9 et 5. Au final, il y a pour l'ensemble de la distribution (voir section 4.4.4 du manuel de cours, p. 72) : $$\dbinom{18}{2,2,2,3,4,5}=C_{18}^{2}C_{16}^{2}C_{14}^{2}C_{12}^{3}C_{9}^{4}C_{5}^{5}=46\ 313\ 467\ 200$$ séquences de réponse différentes qui peuvent amener cette distribution ! Notez que vous pouvez obtenir cette valeur automatiquement à l'aide du calculateur combinatoire sur la page des calculateurs.
En les prenant toutes en compte, la probabilité totale de cette distribution particulière est donc $$P(\mathbf{n}|\boldsymbol{\pi})=\dbinom{18}{2,2,2,3,4,5}\times\pi_{1}^{2}\pi_{2}^{2}\pi_{3}^{2}\pi_{4}^{3}\pi_{5}^{4}\pi_{6}^{5}$$
Loi multinomiale
D'une façon générale, dans ce type de situation, les données sont des comptages bornés des $m$ modalités d'une variable catégorisée. Si les conditions suivantes sont réunies :
- les résultats des lancers sont indépendants,
- la probabilité de tomber sur une face donnée est toujours la même,
alors la probabilité d'un ensemble particuliers d'effectifs prend la forme suivante, dite loi multinomiale : $$P(\mathbf{n}|\boldsymbol{\pi})=\dbinom{N}{n_{1},n_{2},\ldots,n_{m}}\pi_{1}^{n_{1}}\pi_{2}^{n_{2}}...\pi_{m}^{n_{m}}$$ avec l'effectif total $N=n_{1}+n_{2}+...+n_{m}$ et la probabilité totale $\pi_{1}+\pi_{2}+...+\pi_{m}=1$.
Vraisemblance multinomiale intégrée
Dans une certain nombre de situations, nous ne connaîtrons pas les valeurs de probabilités vraies. Dans ces cas, comme dans les modèles multinomiaux, on calcule une vraisemblance moyennée sur l'ensemble des vraisemblances possibles quand on fait varier les paramètres de probabilités sur l'ensemble de leurs valeurs possibles de 0 à 1. Dans le cas multinomial, on a la vraisemblance intégrée sur le modèle sans contraintes (voir manuel de cours, section 8.2.1 p. 171) : $$L_{s}=\frac{1}{C_{N+m-1}^{m-1}}$$ où $m$ est le nombre de catégories (ici $m=6$) et $N$ le nombre total d'observations (ici $N=18$).
Atelier 1 : calcul de vraisemblance multinomiale
Pour utiliser le calculateur ci-dessous, saisissez les comptages observés sur la première ligne, et les probabilités d'un modèle théorique quelconque sur la seconde ligne.
Le calculateur, outre la vraisemblance du modèle cible $M_t$, donne aussi par défaut la vraisemblance du modèle de l'équiprobabilité $M_0$ (modèle uniforme) et la vraisemblance intégrée du modèle saturé ou sans contraintes $M_s$.
Chaque modèle testé peut donc être comparé à ces deux modèles « extrêmes » que sont le modèle d'absence de différences de probabilité et le modèle supposant au contraire qu'elles sont toutes différentes.
-
expand_moreEn résumé
- La loi multinomiale généralise la loi binomiale. La loi binomiale s'applique sur des comptages dans une variable binaire (comptage des succès et des échecs par exemple), tandis que la loi multinomiale s'applique sur des comptages de plus de deux modalités (par exemple les apparitions des 6 faces d'un dé).
- Sur des événements binaires, il est possible de raisonner sur la seule probabilité du succès car la probabilité de l'échec n'est que son complément à 1. Sur des comptages multinomiaux, on doit poser les hypothèses sur plusieurs probabilités simultanément (même si l'une des probabilités peut toujours se déduire des autres par complément à 1).
- La somme des probabilités théoriques dans une loi multinomiale fait toujours 1. Cette situation ne doit donc pas être confondue avec la situation où nous comparons plusieurs probabilités de succès binomiales (dont la somme ne fait pas nécessairement 1).
Tricherie dans un jeu d'argent
Lewis et coll. (2012) proposent à des sujets de jouer à un jeu de dé qui rapporte de l'argent. Le sujet gagne 1 euro par point affiché sur la face du dé.
On place devant les sujets, sur une table, un gobelet renversé sous lequel se trouve un dé. Les sujets doivent secouer le gobelet et annoncer à l'expérimentateur (qui ne la voit pas) la face du dé sortie.
Dans une variante, Shalvi et coll. (2011) demandent aux sujets, avant qu'ils ne donnent leur réponse, de secouer une deuxième fois, puis une troisième fois le dé « pour vérifier qu'il est normal ». Les auteurs font l'hypothèse qu'avec cette possibilité de plusieurs tirages, les sujets peuvent être tentés de rapporter non pas le premier résultat, mais leur plus haut score sur les 3 lancers.
Naturellement, s'il y a tricherie, les sujets ne l'avoueront pas facilement et nous essayons ici de l'établir par des moyens statistiques, sans avoir besoin d'interroger directement les sujets. Des résultats sont rapportés dans le tableau ci-dessous, pour deux échantillons : l'un en condition 3 lancers (Shalvi et al., 2011), l'autre en condition un seul lancer (Lewis et al., 2012).
Faces | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Trois lancers | 5 | 4 | 6 | 11 | 15 | 21 |
Un seul lancer | 6 | 7 | 11 | 15 | 15 | 13 |
L'objectif pour nous est de construire un modèle du comportement des sujets dans cette situation. Nous allons mettre à l'épreuve la théorie des auteurs, mais aussi des théories alternatives.
La théorie des auteurs
Si la théorie des auteurs est juste, on s'attend à ce que les sujets rapportent leur plus haut score sur trois lancers de dé. Quelles sont les probabilités théoriques associées au maximum de points sur 3 lancers ?
Il y a $6\times6\times6=216$ triplets de points possibles. Par exemple $(1,1,2)$ ou $(3,4,6)$. Parmi eux, on peut compter que les triplets à maximum 1, 2, 3, 4, 5 ou 6 sont au nombre de 1, 7, 19, 37, 61 et 91 respectivement. Sans détailler ce dénombrement, on peut noter par exemple que le seul triplet à maximum 1 est le triplet $(1,1,1)$. Mais les 7 manières d'avoir un maximum de 2 sont les triplets $(2,2,2)$, $(2,2,1)$, $(1,2,2)$, $(2,1,2)$, $(2,1,1)$, $(1,2,1)$ et $(1,1,2)$.
Les probabilités théoriques selon ce mécanisme hypothétique de réponse mensongère sont donc :
Faces | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Probabilités | 1/216 | 7/216 | 19/216 | 37/216 | 61/216 | 91/216 |
L'hypothèse du gain proportionnel
Une autre hypothèse possible, en lien avec la littérature comportementaliste, est de supposer que le sujet donne un score d'autant plus souvent que celui-ci rapporte plus financièrement. Selon cette théorie, on devrait rapporter le 2 deux fois plus souvent que le 1, le 3 trois fois plus souvent que le 1, etc.
Cette théorie correspond à ce qu'on appelle la loi de la correspondance (matching law) en analyse expérimentale du comportement (Hernstein, 1962), qui prévoit que la fréquence d'un comportement est proportionnelle à la quantité de renforçateur reçu pour ce comportement.
Appelons $\pi_{1}$ la probabilité de rapporter le 1, qui sera la probabilité de référence dans notre raisonnement. Selon la théorie, on devrait avoir $\pi_{2}=2\pi_{1}$, $\pi_{3}=3\pi_{1}$, $\pi_{4}=4\pi_{1}$, $\pi_{5}=5\pi_{1}$ et $\pi_{6}=6\pi_{1}$. Les probabilités théoriques doivent en outre respecter : $$\pi_{1}+\pi_{2}+\pi_{3}+\pi_{4}+\pi_{5}+\pi_{6}=1$$ c'est-à-dire : $$\pi_{1}+2\pi_{1}+3\pi_{1}+4\pi_{1}+5\pi_{1}+6\pi_{1}=1$$
La contrainte $21\pi_1=1$ permet d'identifier $\pi_1=\frac{1}{21}$ et les autres probabilités théoriques s'en déduisent :
Faces | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Probabilités | 1/21 | 2/21 | 3/21 | 4/21 | 5/21 | 6/21 |
Atelier 2 : mise à l'épreuve des théories
Dans cet atelier, on met à l'épreuve ces deux théories, en les comparant entre elles, mais aussi en les comparant au modèle de l'absence de tricherie, ainsi qu'au modèle saturé (permettant de rendre compte de tout autre scénario potentiel non envisagé par les théories ci-dessus).
-
expand_moreEn résumé
Dans cet exercice, on voit :
- que l'approche par comparaison de modèle permet la confrontation directe de plusieurs théories alternatives, pour conserver la meilleure.
- que le fait de trouver un meilleur modèle que celui des auteurs permet d'invalider leur hypothèse.
- que le fait de trouver un meilleur modèle que celui de l'équiprobabilité permet d'affirmer qu'il y a bien eu tricherie.
- que le fait d'inclure dans la comparaison le modèle saturé permet de découvrir le cas échéant qu'un autre mécanisme de tricherie, non envisagé, aurait pu être présent.
Exercices d'entraînement
Une personne affirme être capable, au lancer d'un dé, de faire apparaître chaque chiffre pair deux fois plus souvent (en moyenne) que n'importe quel chiffre impair, par le seul pouvoir de sa pensée. Elle entreprend de le montrer en lançant le dé 200 fois, et obtient les résultats suivants (en nombres d'apparitions par face) :
Faces | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Effectifs | 28 | 40 | 28 | 41 | 28 | 35 |
On admettra dans la modélisation que le résultat d'un lancer donné n'est pas influencé par sa position dans la série des essais (pas de phénomène d'apprentissage, ou de fatigue, etc.), ou par les résultats des lancers précédents.
- Quel modèle de distribution allez-vous choisir pour ces données ? A quelles conditions ?
-
Calculez les probabilités théoriques des modèles qui correspondent :
- à l'hypothèse que cette personne n'a pas le pouvoir qu'elle prétend,
- à l'hypothèse qu'elle a exactement le pouvoir qu'elle prétend.
- Testez dans le calculateur de l'exercice précédent le modèle correspondant à l'affirmation de cette personne. Ces résultats vous paraissent-ils compatibles avec l'affirmation de cette personne ?
-
expand_moreCorrection
Les données sont des comptages bornés, répartis dans un nombre fini de catégories de résultats. La loi multinomiale est donc un candidat naturel comme distribution d'échantillonnage. Nous pouvons l'utiliser à condition que les résultats aux lancers soient indépendants, et que chaque catégorie de résultat a la même probabilité d'apparition au cours des essais. L'énoncé nous dit que ces conditions sont acceptables.
On trouve $B_{10}=0.5026060198$. Le modèle n'est donc pas meilleur que le modèle de l'équiprobabilité. Par ailleurs, le facteur de Bayes du modèle saturé ($B_{s0}=0.001506067$) ne suggère pas non plus qu'un autre mécanisme doive être envisagé.