Modèles multinomiaux de groupe

Accompagnement des fumeurs à l'arrêt

Contexte

Cooper & al. (2004) comparent 3 modes d'accompagnement de fumeurs qui essaient d'arrêter de fumer avec des patches à la nicotine :

  • dans la condition A (patches), les fumeurs reçoivent un message général d'encouragement à l'arrêt, et un traitement par patches de six semaines,
  • dans la condition B (patches + suivi personnalisé), les sujets reçoivent, outre l'accompagnement de type A, 12 appels téléphoniques et 6 courriers personnalisés pendant un an,
  • dans la condition C (patches + suivi personnalisé + entretiens), les sujets se voient proposer, en plus de l'accompagnement de type B, quatre entretiens de face à face avec un éducateur de santé.

On mesure le degré d'adhésion des patients au traitement en distinguant 3 niveaux : adhésion complète, adhésion partielle, non-adhésion, sur la base du nombre de patches effectivement utilisés au bout de 7 semaines de traitement.

La répartition des sujets par condition et leurs niveaux d'adhésion au traitement sont reportés dans le tableau ci-dessous :

Condition / Adhésion Complète Partielle Aucune
Patches 46 93 42
Patches + Suivi 53 82 28
Patches + Suivi + Entretiens 46 86 9
Question

Sans hypothèse particulière, on cherche dans cette étude clinique à identifier les éléments de l'accompagnement qui se traduisent par une meilleure adhésion au traitement.

Atelier 1 : identification des variables de l'expérience
La théorie des niveaux de mesures de Stevens (1946)

On distingue quatre grands types de niveaux de mesure en science :

  • Le niveau nominal : il concerne les variables purement catégorielles (ex. le genre).
  • Le niveau ordinal : il concerne les variables catégorielles ordonnées (ex. une performance faible, moyenne, élevée).
  • Le niveau d'intervalle : il concerne les variables numériques ou seuls les différences ont du sens (pas de zéro naturel, par exemple le QI).
  • Le niveau de rapport : il concerne les variables numériques où les intervalles et les rapports ont du sens (par exemple, un temps de réaction).

A ces distinctions classiques, on peut ajouter celles de la nature discrète ou continue d'une variable numérique, la présence d'une borne inférieure ou supérieure, et le nombre fini ou infini de modalités. Ces distinctions permettent de choisir un modèle de distribution approprié pour les VD.

  • expand_moreEn résumé

    Cette expérience étudie l'impact du type de traitement sur la variable dépendante niveau d'adhésion au traitement. Ses particularités sont que :

    • La variable condition de traitement est aménagée en 3 conditions qui ne varient que par l'addition d'un élément thérapeutique supplémentaire à chaque fois. L'évaluation de l'impact de chaque ingrédient pourra donc être réalisée par comparaison avec des conditions successives.
    • Elle inclut une mesure de l'adhésion (VD) qui est catégorielle par nature (ce qui est plus fréquent pour les VI). Elle ne doit cependant pas être confondue pour autant avec une VI.
    • C'est la nature catégorielle de la VD qui légitime l'usage de la loi multinomiale pour modéliser la distribution des réponses dans les différents niveaux d'adhésion.

Construction de modèles multinomiaux

Notations

Les données sur chaque ligne $i$ du tableau sont un vecteur de comptages $\boldsymbol{n}_{i}=(n_{i1},n_{i2},n_{i3})$. Ce sont des données numériques, discrètes, bornées à gauche et à droite, représentant une distribution empirique dans 3 catégories de réponse.

Dans cette situation, chaque groupe $i$ ($i=1,2,3$) est caractérisé non plus par une simple probabilité, mais par une distribution de probabilités $\boldsymbol{\pi_i}=(\pi_{1|i},\pi_{2|i},\pi_{3|i})$. Par exemple, $\pi_{1|1}$ est la probabilité d'avoir une adhésion complète au traitement sachant qu'on est dans le groupe 1.

On cherche à savoir si la distribution empirique des comptages observée dans chaque groupe aurait pu être engendrée par une même distribution de probabilité, ou bien s'il faut, compte tenu de leur différences observées, considérer qu'il y a des distribution de l'adhésion qui sont distinctes d'un groupe à l'autre.

Si l'on pense que les conditions 1 et 2 (par exemple) ont la même distribution de probabilités des niveaux d'adhésion, on écrira ce vecteur commun comme $\boldsymbol{\pi_{12}}=(\pi_{1|12},\pi_{2|12},\pi_{3|12})$, ou $\pi_{1|12}$ par exemple représente la probabilité d'une adhésion complète sachant qu'on appartient à la condition 1 ou à la condition 2. Le tableau des distributions modèles sera présenté comme suit :

Condition / Adhésion Complète Partielle Aucune
Patches $\pi_{1|12}$ $\pi_{2|12}$ $\pi_{3|12}$
Patches + Suivi $\pi_{1|12}$ $\pi_{2|12}$ $\pi_{3|12}$
Patches + Suivi + Entretiens $\pi_{1|3}$ $\pi_{2|3}$ $\pi_{3|3}$
On peut en abrégé représenter cette hypothèse en l'écrivant $(\boldsymbol{\pi_{12}},\boldsymbol{\pi_{12}},\boldsymbol{\pi_{3}})$, à condition de se souvenir que chaque symbole en gras représente un vecteur de 3 probabilités simultanées.

Les données observées sont des comptages à total fixé, distribués dans une variable catégorisée. Le modèle de l'échantillonnage sur ces comptages est multinomial} si :

  • les réponses des sujets sont indépendantes (sujets testés séparément),
  • la probabilité de choisir une réponse donnée est la même pour tous les sujets d'un groupe.

Mis à part les effectifs totaux de groupe (sous le contrôle de l'expérimentateur), les paramètres psychologiquement signifiants dans une loi multinomiale sont les probabilités par catégorie de réponse. Si on note $\boldsymbol{X}_{i}$ le vecteur aléatoire des comptages de réponse dans la condition i, on écrit : $$\boldsymbol{X}_{i}\sim M(N_{i},\boldsymbol{\pi}_{i})$$ avec $\boldsymbol{\pi}_{i}=(\pi_{1|i},\pi_{2|i},\pi_{3|i})$ la distribution théorique de probabilités pour ce groupe.

Le problème statistique peut donc être défini comme une comparaison de plusieurs distributions de probabilités inconnues sur groupes indépendants.

On note que dans cette situation, il n'y a pas de modèle nul à proprement parler, c'est-à-dire de modèle où toutes les probabilités seraient égales dans le tableau. Le modèle de référence (par rapport auquel tous les facteurs de Bayes seront calculés) est le modèle de l'homogénéité, affirmant l'équivalence des distributions dans les groupes. Ce modèle impose une égalité de chaque probabilité de réponse entre les groupes, mais pas l'égalité des probabilité à l'intérieur d'un groupe :

Condition / Adhésion Complète Partielle Aucune
Patches $\pi_{1|123}$ $\pi_{2|123}$ $\pi_{3|123}$
Patches + Suivi $\pi_{1|123}$ $\pi_{2|123}$ $\pi_{3|123}$
Patches + Suivi + Entretiens $\pi_{1|123}$ $\pi_{2|123}$ $\pi_{3|123}$

Atelier 2 : construction des modèles

Dans le calculateur ci-dessous, la colonne Modèle permet de saisir une hypothèse sur l'homogénéité de certaines distributions de groupes.

On dit que deux distributions sont homogènes quand leur ensemble de probabilités théoriques sont exactement les mêmes d'un groupe à l'autre (les probabilités à l'intérieur d'un groupe peuvent elles être différentes).

Pour saisir une hypothèse d'homogénéité, il suffit d'entrer le même symbole dans la colonne Modèle pour les groupes correspondants.

  • expand_moreEn résumé

    Cet exercice amène les éléments généraux suivants sur l'identification et l'interprétation des modèles :

    • Compte tenu de la construction des groupes, on note que leur comparaison ne permet pas de tester l'impact du traitement par patches en tant que tel, car il n'y a pas de condition contrôle (condition placebo par exemple). Seuls les effets éventuels du suivi personnalisé et des entretiens, pour lesquels des comparaisons avec/sans sont disponibles, peuvent être testés.
    • Les deux seuls effets qui peuvent être testés sont ceux du suivi personnalisé, évalué par comparaison avec la condition patches seuls, et les entretiens, évalués par rapport à la condition 2. Un effet expérimental est en effet toujours évalué par une comparaison entre au moins deux conditions, dont l'une contient et l'autre ne contient pas l'ingrédient testé.
    • Dans l'interprétation du sens d'un effet avec une variable multinomiale, on examine comment le poids fréquentiel des réponses se déplace, d'une condition à l'autre, vers certaines réponses quand on passe d'un groupe à l'autre. Quand la variable dépendante est ordinale, on cherche à voir si ce poids fréquentiel se déplace vers les hautes ou basses valeurs de l'échelle ordinale.

Tricherie, genre et filière

Contexte

Lewis et coll. (2012) reprennent le paradigme du dé dans le gobelet, mais cette fois-ci, les trois résultats de lancer de dé (le lancer rémunéré, et les deux lancers de « vérification du dé »), étaient fournis aux sujets par un ordinateur.

On pouvait donc vérifier qu'ils rapportaient :

  • le premier résultat sorti (réponse « honnête »),
  • ou le résultat le plus élevé de la triade (réponse dite de « mensonge justifié »),
  • ou une réponse (le 6 par exemple) pas du tout sortie (réponse dite « mensonge non justifié »).
Les sujets étaient des étudiants en psychologie ou en économie des deux sexes.

Données

Les données obtenues à l'issue de l'expérience sont les suivantes :

Filière Genre Réponse honnête Mensonge justifié Mensonge non justifié
Economie hommes 16 10 8
femmes 41 16 3
Psychologie hommes 31 1 2
femmes 49 7 4

Atelier 3 : modélisation
Questions

On se pose 3 questions dans cette étude :

  1. Les hommes et les femmes diffèrent-ils dans la nature de leur réponse dans cette situation ?
  2. Cela fait-il une différence que les étudiants soient en économie ou en psychologie ?
  3. Y a-t-il une interaction entre les facteurs « Cursus poursuivi » et « Sexe » ? Comment interpréter cette interaction ?

  • expand_moreEn résumé

    L'examen des fréquences estimées sous le meilleur modèle :

    Filière Genre Réponse honnête Mensonge justifié Mensonge non justifié
    Economie hommes 0.4706 0.2941 0.2353
    femmes 0.6833 0.2667 0.0500
    Psychologie hommes 0.8511 0.0851 0.0638
    femmes 0.8511 0.0851 0.0638
    permet de conclure :
    • Que les distributions de probabilités de réponses chez les étudiants en psychologie sont identiques, qu'on soit homme ou femme. La réponse majoritaire est celle d'une réponse honnête.
    • Qu'en économie, la distribution de probabilité de réponses est différente selon qu'on est homme ou femme. Le poids fréquentiel des réponses est chez les femmes déplacé vers les réponses plus honnêtes.
    • Que les distributions ne sont pas les mêmes en économie et en psychologie : le poids fréquentiel des réponses est chez les étudiants en psychologie davantage massé dans les réponses plus honnêtes.

    On note que pour pouvoir interpréter les différences de distribution, il ne faut pas simplement regarder une fréquence (par exemple celle de la réponse honnête) mais bien la totalité des fréquences d'une ligne.

Exercices d'entraînement

Attitude envers la maladie et évolution du cancer

Rindskopf (1990) analyse les données suivantes, initialement publiées par Goleman (1985) dans le New York Times. Cinquante-sept patients atteints d'un cancer ont été classés selon 4 types d'attitude à l'égard de la maladie : i) déni, ii) esprit combattant, iii) acceptation stoïque et iv) désespoir.

Dix ans plus tard, on note ceux qui ont survécu sans résurgence de la maladie, ceux qui sont vivants mais toujours atteints de la maladie, et ceux qui sont morts. Une analyse théorique psychologique conduit l'auteur de l'étude initiale à faire l'hypothèse que les patients dans le déni ou dans un esprit combatif devraient mieux s'en sortir que les patients stoïques ou désespérés.

Les résultats sont les suivants :

Attitude Vivant Malade Décédé
Déni 5 0 5
Combatif 6 1 3
Stoïque 7 1 24
Désespéré 1 0 4

Questions

  • Testez le modèle de l'homogénéité sur ces données. Naturellement on trouve $B_{00}=1$. Mais examinez les fréquences estimées sous ce modèle, pour percevoir la distribution marginale de la variable Statut du patient à 10 ans. Commentez.
  • A partir de votre meilleur modèle pour ces données, obtenu à l'aide du calculateur de l'atelier précédent, dites si la théorie vous paraît soutenue par les données.
  • Commentez néanmoins le poids de l'évidence.


Les déterminants du mensonge dans un jeu de dé

On reprend ici les données de l'expérience de Shalvi et al. (2011) :

Faces 1 2 3 4 5 6
Trois lancers 5 4 6 11 15 21
Un seul lancer 6 7 11 15 15 13

Questions

  • En utilisant le calculateur multinomial pour la comparaison de groupes, dites s'il vous paraît qu'en demandant aux sujets de lancer le dé 3 fois, ils ont bien augmenté l'importance du mensonge dans les réponses des sujets.
  • Si ce n'est pas le cas, les données des deux groupes peuvent être fusionnées (additionnées), pour constituer une distribution empirique de réponses plus informative. Sur cette distribution agrégée, re-testez à l'aide du calculateur multinomial de test d'une distribution théorique (voir fiche précédente) les deux théories concurrentes du mécanisme de réponse des sujets (théorie du maximum des 3 lancers et théorie du matching). Concluez.