Modèles binomiaux généraux

Psychothérapie de l'anorexie

Un psychologue clinicien étudie l'efficacité de 2 protocoles de psychothérapie pour le traitement de l'anorexie. Il constitue trois groupes de patientes de poids moyens équivalents :

  • le premier groupe ($n_{1}=26$ sujets) ne suit aucune psychothérapie pendant les 3 mois de l'étude (groupe contrôle),
  • le deuxième ($n_{2}=29$ sujets) suit un protocole cognitivo-comportemental,
  • le troisième ($n_{3}=17$ sujets) est suivi en thérapie familiale systémique.

Au bout de 3 mois, on dénombre les patientes ayant effectivement repris du poids (événement considéré comme « succès ») :

Condition Succès Total Fréquence
Contrôle $k_1=11$ $n_1=26$ $f_1=\frac{11}{26}\approx{0.42}$
Thérapie cognitive-comportementale (TCC) $k_2=19$ $n_2=29$ $f_2=\frac{19}{29}\approx{0.65}$
Thérapie familiale (TF) $k_3=15$ $n_3=17$ $f_3=\frac{15}{17}\approx{0.88}$

Nous nous posons deux questions à l'issue de cette étude :

  1. Peut-on dire que les psychothérapies sont efficaces ?
  2. Peut-on dire que les deux formes de thérapie se distinguent l'une de l'autre en termes d'effet sur le poids ?

D'un point de vue statistique, ces deux questions renvoient à deux comparaisons différentes de conditions : la première question revient à comparer la condition sans psychothérapie (contrôle) aux deux autres, et la deuxième question revient à comparer les deux types de psychothérapies (TCC et TF) entre elles.

Le type de problème statistique posé est celui de la comparaison de plus de deux probabilités inconnues sur échantillons indépendants.

Atelier 1 : écriture d'hypothèses spécifiques

Dans cet atelier, on apprend à définir une hypothèse d'égalités ou de différences entre probabilités à l'aide d'une écriture par indices.

On donne à une probabilité un indice qui correspond aux numéros de groupes qu'elle décrit. Si on pose $\pi_1=\pi_2$ par exemple (avec $\pi_3$ différente), la probabilité unique des groupes 1 et 2 sera notée par l'unique symbole $\pi_{12}$ (lire « pi-un-deux »).

Quand deux probabilités sont supposées différentes dans un modèle, on les écrit avec des symboles différents.

Le tableau ci-dessous représente les 5 modèles possibles quand on compare 3 groupes.

Condition $M_0$ $M_1$ $M_2$ $M_3$ $M_s$
Contrôle $\pi_{123}$ $\pi_1$ $\pi_{12}$ $\pi_{13}$ $\pi_1$
Thérapie cognitive-comportementale (TCC) $\pi_{123}$ $\pi_{23}$ $\pi_{12}$ $\pi_2$ $\pi_2$
Thérapie familiale (TF) $\pi_{123}$ $\pi_{23}$ $\pi_3$ $\pi_{13}$ $\pi_{3}$
  • expand_moreEn résumé

    Dans cet exercice, on voit comment écrire ce que l'on appelle des contraintes d'égalité dans un modèle de groupe.

    • On appelle modèle saturé (noté $M_s$) le modèle qui n'a aucune contraintes. Il compte autant de paramètres (3 probabilités) que de données (3 comptages ou fréquences observées). En affirmant la différence entre les trois probabilités, il affirme que la TCC est efficace ($\pi_1\neq\pi_2$), que la TF l'est aussi ($\pi_1\neq\pi_3$), mais que leur efficacité n'est pas la même ($\pi_2\neq\pi_3$).
    • On appelle modèle nul (noté $M_0$) le modèle de l'absence de différence entre les 3 probabilités. C'est le modèle le plus contraint. L'égalité $\pi_1=\pi_2$ implique que les TCC ne sont pas efficaces (elles ont la même probabilité de rémission que le groupe contrôle). La contrainte $\pi_1=\pi_3$ énonce l'absence d'efficacité de la TF. Au final, on a donc dans ce modèle $\pi_1=\pi_2=\pi_3$. On note que l'absence d'efficacité d'une thérapie est établie par comparaison au groupe contrôle. C'est une éventuelle différence au groupe contrôle qui permettrait d'affirmer l'efficacité. Une thérapie est jugée inefficace si son taux de rémission est égal à celui du groupe contrôle (ce qui ne veut pas dire qu'il est nul).
    • Les modèles $M_1$, $M_2$ et $M_3$ posent une seule contrainte d'égalité, pour affirmer tour à tour l'efficacité équivalentes des deux thérapies, ou l'efficacité seulement des TF, ou celle uniquement des TCC.

Calcul des vraisemblances avec contraintes

Par un calcul très semblable à celui du cas à deux groupes, on trouve que la vraisemblance intégrée du modèle nul est :

$$L_{0}=\left[\frac{C_{n_{1}}^{k_{1}}C_{n_{2}}^{k_{2}}C_{n_{3}}^{k_{3}}}{C_{N}^{K}}\right]\left[\frac{1}{N+1}\right]$$

La vraisemblance intégrée du modèle saturé est :

$$L_{s}=\left[\frac{1}{n_{1}+1}\right]\left[\frac{1}{n_{2}+1}\right]\left[\frac{1}{n_{3}+1}\right]$$

Dans sa forme générale, le rapport des vraisemblances intégrées pour le modèle saturé est donc (voir manuel de cours, p. 306) :

$$B_{s0}=\frac{L_{s}}{L_{0}}=\frac{C_{N}^{K}(N+1)}{C_{n_{1}}^{k_{1}}(n_{1}+1)C_{n_{2}}^{k_{2}}(n_{2}+1)C_{n_{3}}^{k_{3}}(n_{3}+1)}$$

Si l'on veut tester un modèle contraint particulier, par exemple un modèle $M_1$ qui dirait $\pi_2=\pi_3$, la forme prise par le rapport de vraisemblance est identique, mais en fusionnant les effectifs des deux groupes supposés équivalents :

$$B_{10}=\frac{L_{1}}{L_{0}}=\frac{C_{N}^{K}(N+1)}{C_{n_{1}}^{k_{1}}(n_{1}+1)C_{n_{23}}^{k_{23}}(n_{23}+1)}$$

avec $k_{23}=k_{2}+k_{3}$ et $n_{23}=n_{2}+n_{3}$.

On note qu'il est suffisant, pour hiérarchiser tous les les modèles, de tous les comparer avec l'unique modèle $M_0$ (arbitrairement choisi comme modèle de référence), car si on montre par exemple qu'un modèle $M_1$ est deux fois plus vraisemblable que $M_0$, et qu'un modèle $M_2$ est 4 fois plus vraisemblable que $M_0$, alors cela signifie que $M_2$ est 2 fois plus vraisemblable que $M_1$. Les trois modèles sont donc automatiquement hiérarchisés par cette comparaison au seul $M_0$.

Atelier 2 : comparaison des modèles par vraisemblance

Dans cet atelier, on calcule les rapports de vraisemblances entre tous les modèles. En pratique, il est suffisant de calculer les rapports de vraisemblances de chaque modèle au modèle $M_0$, arbitrairement pris comme modèle de référence.

Pour tester un modèle cible en particulier, on doit, après avoir saisi les données dans les colonnes « Succès » et « Echecs », saisir dans la colonne « Modèle » du calculateur des symboles identiques (par exemple des nombres entiers identiques, ou des chaînes de caractères identiques comme "pi12" et "pi12") ou différents entre eux (par exemple 1 et 2, ou bien "pi1" et "pi2"), selon les contraintes qu'on veut fixer ou non sur les probabilités de chaque groupe.

Pour trouver automatiquement le meilleur modèle, on sélectionne l'option « Meilleur modèle ». Remarque : la colonne « Fréquences » n'est pas éditable car elle sera calculée automatiquement.

  • expand_moreEn résumé

    Dans cet exercice, les notions suivantes ont été illustrées :

    • la manipulation des contraintes d'égalité sur les paramètres des 3 lois binomiales implicitement construites. Selon que la contrainte est pertinente ou non pour les différences de fréquences observées, le rapport de vraisemblance augmente ou diminue. Les modèles les moins bons ($M_0$ et $M_3$) sont ceux qui imposent une contrainte d'égalité ($\pi_1=\pi_3$) sur la plus grande différence de fréquence observée.
    • la comparaison de tous les modèles au modèle de référence $M_0$ permet de les hiérarchiser tous entre eux. Dans cette procédure, on a nécessairement pour $M_0$ : $$B_{00}=\frac{L_0}{L_0}=1$$
    • pour tirer une conclusion, on doit d'abord avoir testé tous les modèles possibles. La conclusion finale est celle qui formule le sens même du meilleur modèle retenu.
    • Pour guider cette conclusion, on peut s'aider, une fois la validité du modèle établie, des fréquences estimées dans ce modèle. On note que selon le modèle, les fréquences estimées sont différentes car leur calcul intègre toutes les contraintes du modèle retenu. Sous $M_1$ par exemple (si nous avions dû retenir ce modèle), affirmant une efficacité identique des deux formes de thérapie ($\pi_2=\pi_3$), la fréquence de réussite des traitements (indifférenciés dans ce modèle) aurait été calculée comme : $$f_{23}=\frac{k_2+k_3}{n_2+n_3}=\frac{19+15}{29+17}\approx{0.7391}$$ Cette valeur est fournie automatiquement pour chaque modèle, dans l'interface, à la colonne « Fréquences ».

Atelier 3 : les expériences de Milgram sur la soumission à l'autorité

Dans une réplication de la célèbre expérience de Milgram (1974), un expérimentateur demande à un sujet d'envoyer des chocs électriques à un « élève » (compère de l'expérimentateur qui feint la douleur) quand celui-ci se trompe dans la réalisation d'une tâche.

Quatre conditions sont comparées :

  • la condition « feedback à distance » (le sujet n'entend pas la victime, mais seulement ses coups sur le mur),
  • la condition « feedback vocal » (le sujet entend les supplications de la victime dans la pièce à côté),
  • la condition « proximité » (l'élève-victime est dans la même pièce que le sujet),
  • la condition « contact » (le sujet doit toucher la main de la victime pour que les chocs soient délivrés).
On compte dans chaque condition les nombres de sujets (sur 40) qui acceptent de délivrer des chocs jusqu'à 450 volts (comportement dit « d'obéissance »). On en trouve respectivement $k_1=26$, $k_2=25$, $k_3=16$ et $k_4=12$ dans les quatre conditions. Saisissez ces données dans le calculateur et répondez aux questions à partir de votre meilleur modèle.

  • expand_moreEn résumé

    Cet exercice illustre la situation de comparaison de 4 probabilités inconnues sur groupes indépendants. Dans cette situation, il y a 15 modèles possibles et l'option Meilleur modèle permet de tous les tester et de rapporter le plus vraisemblable. Si on les teste un à un, on trouve (les noms de modèles sont arbitraires)  :

    Nom du modèle Structure de groupe Facteur de Bayes
    M0 1 1 1 1 1.0000
    M1 1 1 2 3 58.6608
    M2 1 1 2 2 146.8856
    M3 1 1 1 2 12.3076
    M4 1 1 2 1 0.5638
    M5 1 2 1 1 1.3777
    M6 1 2 1 2 0.2661
    M7 1 2 1 3 4.9111
    M8 1 2 2 1 0.2184
    M9 1 2 2 2 2.9629
    M10 1 2 2 3 7.9046
    M11 1 2 3 1 0.4365
    M12 1 2 3 2 0.8562
    M13 1 2 3 3 39.5661
    Ms 1 2 3 4 15.8013

    Le meilleur modèle est $M_2$ qui est presque 147 fois plus vraisemblable que $M_0$. L'évidence en faveur de ce modèle est forte.

    Ce modèle ne retient pas comme pertinentes la distinction entre voix et coup sourds quand la victime est à distance, ou celle entre absence et présence d'un contact avec la victime, quand celle-ci est dans la même pièce.

    Seule la distinction entre distance (ou non-visibilité) et présence a un impact significatif sur la proportion de cas où l'on donne la décharge maximale : elle est de 0.6375 quand on ne voit pas la victime, et tombe à 0.35 quand elle est en présence. L'effet de la présence de l'autre est donc massif.

Exercices d'application

La théorie du marquage social

Goldman et al. (1982) demandent à des étudiants se rendant à la bibliothèque universitaire d’indiquer à l’expérimentateur la direction d’un bâtiment officiel, ce que tous les sujets font. Selon les conditions, l’expérimentateur les remercie alors :

  • soit de manière usuelle (condition contrôle),
  • soit leur disait d’une voix très enjouée « merci beaucoup, vous avez été très serviable et j’ai apprécié que vous preniez de votre temps pour m’aider » (condition marquage social positif),
  • soit leur disait d’une voix ennuyée « vous n’êtes pas très serviable ; d’habitude je comprends toujours quand on m’explique, mais là, je vais devoir trouver quelqu’un d’autre de plus serviable » (condition marquage social négatif).

Un peu plus tard, les sujets se faisaient accoster par un second expérimentateur qui leur proposait de participer à un téléthon en répondant pendant deux heures au téléphone. On étudie les taux d'acceptation de cette requête dans les trois conditions, et on note $\pi_{j}$ ($j=1,2,3$) les probabilités correspondantes.

  1. Ecriture de modèles :

    1. Ecrivez le modèle théorique qui affirme qu'il existe un effet de marquage positif mais pas négatif.
    2. Ecrivez le modèle théorique qui affirme qu'il existe un effet de marquage négatif mais pas positif.
    3. Ecrivez le modèle théorique qui affirme que les deux effets existent.
    4. Ecrivez le modèle théorique qui affirme que les deux effets existent, qu'ils vont dans le même sens et qu'ils sont de même amplitude. Discutez la pertinence de ce modèle au regard de la théorie du marquage social.
    5. Ecrivez le modèle théorique qui affirme qu'aucun des effets n'existent.

  2. Analyse :

    Goldman et al. (1982) ont observé que $k_{1}=24$, $k_{2}=40$ et $k_{3}=12$ personnes ont accepté de participer au téléthon. Sachant qu'il y avait 60 sujets par condition, dites si à partir de ces résultats (et en utilisant le calculateur de l'atelier précédent) on peut conclure :

    1. à un effet de marquage positif,
    2. à un effet de marquage négatif,
    3. ou les deux.

Efficacité des méthodes d'apprentissage de la lecture

Un psychologue étudie les efficacités relatives de 3 méthodes d'apprentissage de la lecture. Il répartit 66 sujets en 3 groupes d'effectifs égaux : un groupe soumis à une méthode traditionnelle, un groupe soumis à une nouvelle méthode A et un groupe soumis à une nouvelle méthode B. Ces 3 groupes sont soumis d'abord à une évaluation de leur niveau de lecture avant l'entrée dans le protocole (pré-test), puis à une évaluation à l'issue du programme d'apprentissage (post-test). On admet dans cette étude que les progrès éventuels sont indépendants du niveau initial en lecture.

Dans chacun des 3 groupes, on observe que $k_1=10$, $k_2=12$ et $k_3=19$ enfants ont réalisé des progrès entre le pré-test et le post-test. A partir du meilleur modèle, répondez aux questions suivantes :

  1. Peut-on dire que la méthode A est plus efficace que la méthode traditionnelle ?
  2. Peut-on dire que les trois méthodes ont une efficacité identique ?


  • expand_moreCorrections

    1. La théorie du marquage social .
      1. Ecriture de modèles :

        1. $\pi_{13},\ \pi_{2},\ \pi_{13}$
        2. $\pi_{12},\ \pi_{12},\ \pi_{3}$
        3. $\pi_{1},\ \pi_{2},\ \pi_{3}$
        4. $\pi_{1},\ \pi_{23},\ \pi_{23}$
        5. $\pi_{123},\ \pi_{123},\ \pi_{123}$

      2. Analyse :
        1. Le type de problème posé est la comparaison de 3 probabilités inconnues sur groupes indépendants. On rappelle que cette comparaison ne se réduit pas au simple examen des fréquences empiriques car celles-ci changeraient d'une réplication à l'autre de la même expérience, et ce sont bien les quantités stables que sont les probabilités d'acceptation que nous manipulons dans le raisonnement.
        2. Modèle de distribution et hypothèses. Les données disponibles sont des comptages bornés dans chaque groupe sur [0;60]. On peut dans ce contexte utiliser la loi binomiale pour calculer la vraisemblance des modèles (c'est-à-dire la probabilité des données), à condition que : i) les comportements des sujets soient indépendants (ce sera le cas si les sujets ne se connaissent pas, ont été démarchés séparément, et n'ont pas pu se parler de l'expérience entre eux) , ii) la probabilité d'acceptation soit bien la même pour tous les sujets à l'intérieur d'un même groupe (pas nécessairement d'un groupe à l'autre puisque c'est ce qu'on cherche à tester).

          On admettra que c'est bien le cas et on suppose donc que les variables aléatoires de comptage dans les groupes ($j=1,2,3$) sont telles que, pour chaque groupe $j$ : $$X_{j}\sim B(n_{j},\pi_{j})$$ Les différentes hypothèses possibles sur les paramètres de ces trois distributions binomiales sont détaillées dans la question précédente.

        3. Procédure de décision. Pour répondre à ces questions, on doit tester tous les modèles possibles pour identifier le plus vraisemblable. On sait qu'il y a toujours 5 modèles possibles dans une situation à 3 groupes (ce sont les modèles définis ci-dessus). Il est équivalent de calculer tous les facteurs de Bayes des 4 premiers modèles au modèle nul, et de choisir le modèle qui a le facteur de Bayes le plus élevé, par rapport à $M_{0}$.
        4. Conclusion statistique. A l'aide du calculateur, on identifie $M_s$ comme meilleur modèle ($B_{s0}=39009.56634$) et nous le retenons.
        5. Conclusion psychologique. Les conclusions psychologiques se déduisent immédiatement des caractéristiques du modèle retenu.

          Le modèle saturé affirme trois choses : i) qu'il y a un effet du marquage positif (car $\pi_{1}\neq\pi_{2}$), ii) qu'il y a un effet du marquage négatif (car $\pi_{1}\neq\pi_{3}$), iii) que ces deux effets ne sont pas identiques (car $\pi_{2}\neq\pi_{3}$).

          Pour interpréter la direction de ces effets, une fois qu'on a argumenté que les trois probabilités sont différentes, on étudie leurs estimations sur les données. Celles-ci se calculent comme de simples fréquences sur les données. On trouve $\hat{\pi}_{1}=0.40$, $\hat{\pi}_{2}=0.66$ et $\hat{\pi}_{3}=0.2$. On voit que l'effet du marquage social positif est d'augmenter la probabilité d'acceptation de la requête, par rapport à la situation contrôle, tandis que le marquage négatif la diminue, ce qui est conforme aux attentes de la théorie du marquage social.

          Remarque : attention de bien distinguer les probabilités vraies (inconnues) $\pi_{1}$, $\pi_{2}$ et $\pi_{3}$ de leurs estimations sur les données $\hat{\pi}_{1}$, $\hat{\pi}_{2}$ et $\hat{\pi}_{3}$ (le chapeau sert à désigner une estimation, c'est-à-dire une valeur soumise à erreur d'échantillonnage).

    2. Efficacité des méthodes d'apprentissage de la lecture.
      1. Type de problème. Il s'agit d'une comparaison de 3 probabilités sur groupes indépendants. On compare les probabilités $\pi_{1}$, $\pi_{2}$ et $\pi_{3}$ de progrès en lecture quand on utilise 3 méthodes d'apprentissage différentes. On note qu'il ne s'agit pas d'une comparaison de 3 fréquences, car nous réservons le mot fréquence aux estimations $\hat{\pi}_{1}$, $\hat{\pi}_{2}$ et $\hat{\pi}_{3}$ des probabilités inconnues (paramètres dans la population) $\pi_{1}$, $\pi_{2}$ et $\pi_{3}$.
      2. Modèle de distribution et hypothèses sur les paramètres. Les données observées sont des comptages bornés sur $[0;n_{j}]$ dans chaque condition $j$ ($j=1,2,3$). La vraisemblance de telles données peut être calculée dans chaque groupe par une loi binomiale si : 1. les progrès des enfants peuvent être considérés comme indépendants (ce qui est plus facile à argumenter si les enfants n'appartiennent pas aux mêmes classes ou aux mêmes écoles, ce que l'énoncé ne précise pas), et 2. la probabilité de progresser est considérée comme identique pour tous les enfants apprenant avec une même méthode (si on a des raisons d'en douter, il existe des modèles de réponse individuels, mais on ne les étudie que plus tard).

        Nous admettrons que ces deux conditions sont remplies (mais on prend le temps de les discuter dans chaque contexte pour pouvoir s'interdire d'utiliser le modèle s'il est franchement inapproprié).

        Les hypothèses sur les paramètres des 3 lois binomiales s'écrivent comme dans l'exercice précédent.

      3. Procédure de décision. On suit la même démarche qu'à l'exercice précédent. On calcule tous les rapports de vraisemblance de chaque modèle au modèle de l'absence d'effet $M_0$, et on garde le modèle ayant le plus fort rapport.
      4. Conclusion statistique. La recherche automatique avec le calculateur montre que le meilleur modèle distingue les probabilités selon : $M_1:\ \pi_{12},\ \pi_{12},\ \pi_{3}$ ($B_{10}=20.9579$).
      5. Conclusion psychologique. Les conclusions psychologiques se déduisent des caractéristiques du modèle retenu. Pour interpréter le sens des effets, on calcule les probabilités estimées selon le modèle (c'est-à-dire en tenant compte de la contrainte $\pi_{1}=\pi_{2}$). On trouve : $$\hat{\pi}_{12} = \frac{10+12}{22+22}=0.50$$ $$\hat{\pi}_{3} = \frac{19}{22}\approx0.864$$ On peut donc dire deux choses : i) la méthode nouvelle A ne fait pas mieux que la méthode traditionnelle en termes de probabilité de progresser, ii) la méthode nouvelle B se traduit par une probabilité de progresser plus élevée. Si l'on doit choisir une méthode pour l'apprentissage de la lecture, la méthode nouvelle B est donc préférable.