Calcul de McNemar
Calculez instantanément le test de McNemar pour des données appariées en tableau 2×2. Cet outil est adapté à l’évaluation avant-après, aux comparaisons de tests diagnostiques sur les mêmes sujets et aux études cliniques avec variables binaires.
Résultats
Renseignez les cellules du tableau apparié puis cliquez sur le bouton de calcul.
Tableau 2×2 apparié
Le test de McNemar se concentre sur les cellules discordantes b et c. Les cellules a et d sont utiles pour décrire l’échantillon, mais n’entrent pas directement dans la statistique du test.
| Après Oui | Après Non | |
|---|---|---|
| Avant Oui | 46 | 12 |
| Avant Non | 28 | 54 |
Guide expert du calcul de McNemar
Le calcul de McNemar est une méthode statistique de référence lorsqu’on souhaite comparer deux mesures binaires prises sur les mêmes sujets. Il s’agit d’un test non paramétrique appliqué à un tableau de contingence apparié 2×2. En pratique, il sert très souvent à répondre à une question simple mais importante: la proportion de réponses positives change-t-elle entre deux temps de mesure ou entre deux méthodes appliquées à la même personne ? Si vous travaillez en santé, en psychologie, en marketing expérimental, en sciences sociales ou en data science appliquée à des résultats dichotomiques, ce test est l’un des outils les plus utiles pour éviter les erreurs d’interprétation.
L’idée centrale est la suivante: lorsque les observations sont appariées, on ne peut pas utiliser un simple test du chi-deux d’indépendance comme si les groupes étaient séparés. Le test de McNemar tient compte de la dépendance entre les deux mesures et concentre l’analyse sur les cas qui changent réellement d’état. C’est pour cette raison que les cellules discordantes, notées b et c, constituent le coeur du calcul. Les cellules concordantes a et d décrivent l’échantillon, mais elles ne déterminent pas la statistique de test.
Quand utiliser le test de McNemar ?
On utilise ce test dans toutes les situations où une variable binaire est observée deux fois sur les mêmes unités statistiques. Cela peut correspondre à:
- une étude avant-après avec une réponse Oui ou Non;
- la comparaison de deux tests diagnostiques appliqués aux mêmes patients;
- une évaluation de performance d’un algorithme de classification sur les mêmes cas;
- une enquête où les répondants changent ou non d’avis après une intervention;
- des audits qualité avec conformité ou non-conformité mesurée à deux moments.
Par exemple, si 100 patients sont testés avant et après une nouvelle procédure de dépistage, le test de McNemar permet de déterminer si le nombre de patients basculant de négatif à positif est significativement différent du nombre de patients basculant de positif à négatif. Cette logique est essentielle, car la simple comparaison de deux pourcentages agrégés peut masquer la structure appariée des données.
Structure du tableau 2×2
Le tableau apparié est généralement présenté ainsi:
- a: Oui avant et Oui après
- b: Oui avant et Non après
- c: Non avant et Oui après
- d: Non avant et Non après
Le calcul de McNemar repose sur l’hypothèse nulle d’égalité des discordances, c’est-à-dire b = c en espérance. Si b et c diffèrent nettement, on conclut qu’il existe un changement systématique entre les deux mesures.
Formule du calcul de McNemar
Dans sa version asymptotique classique sans correction, la statistique est:
X² = (b – c)² / (b + c)
Dans la version avec correction de continuité de Yates, souvent recommandée lorsque le nombre de discordances est limité, la statistique devient:
X² = (|b – c| – 1)² / (b + c)
Cette statistique suit approximativement une loi du chi-deux à 1 degré de liberté. Plus la valeur de X² est élevée, plus la p-valeur diminue, ce qui renforce l’évidence contre l’hypothèse nulle. Lorsque le nombre de discordances est faible, de nombreux biostatisticiens recommandent en complément ou à la place une version exacte basée sur la loi binomiale, car elle est plus fiable.
| Seuil alpha | Valeur critique chi-deux à 1 ddl | Interprétation pratique |
|---|---|---|
| 0,10 | 2,706 | Indication exploratoire d’une différence entre b et c. |
| 0,05 | 3,841 | Seuil le plus utilisé pour conclure à une différence significative. |
| 0,01 | 6,635 | Exige une asymétrie plus forte des discordances. |
Exemple concret de lecture
Supposons un audit sur 140 dossiers, avec 46 cas conformes aux deux temps, 54 cas non conformes aux deux temps, 12 cas passant de conforme à non conforme et 28 cas passant de non conforme à conforme. Ici, les discordances sont b = 12 et c = 28. L’intuition suggère déjà une amélioration, car le flux vers la conformité est plus important que le flux inverse. Le calcul de McNemar permet de déterminer si cette asymétrie est suffisamment forte pour dépasser la variabilité attendue par hasard.
Si la p-valeur est inférieure à 0,05, on conclut qu’il existe une modification statistiquement significative des réponses entre les deux temps. En revanche, si la p-valeur reste supérieure au seuil choisi, l’écart observé peut être compatible avec des fluctuations aléatoires, même si les pourcentages bruts semblent différents.
Pourquoi les cellules concordantes n’entrent-elles pas dans la statistique ?
C’est une question fréquente. Les paires concordantes a et d représentent des sujets n’ayant pas changé de statut entre les deux mesures. Elles n’apportent donc pas d’information sur la direction du changement. Le test de McNemar cherche précisément à savoir si la probabilité d’un changement dans un sens diffère de la probabilité d’un changement dans l’autre sens. Seules les paires discordantes portent cette information.
En d’autres termes, si 1 000 sujets restent identiques entre les deux temps, cela ne renseigne pas sur la symétrie ou l’asymétrie des changements. Ce sont b et c qui déterminent la dynamique réelle.
Version asymptotique ou version exacte ?
Dans la pratique, deux approches coexistent. La première est la version asymptotique, rapide et très utilisée. La seconde est la version exacte binomiale, plus prudente lorsque le nombre total de discordances est faible. Une règle pédagogique fréquente consiste à considérer l’approche exacte lorsque b + c < 25, même si certains auteurs retiennent d’autres seuils selon le contexte.
| Nombre de discordances b + c | Méthode généralement privilégiée | Commentaire |
|---|---|---|
| Moins de 10 | Version exacte binomiale | La loi asymptotique peut être instable avec si peu de changements. |
| 10 à 24 | Version exacte ou asymptotique corrigée | Zone intermédiaire où la prudence méthodologique est recommandée. |
| 25 et plus | Asymptotique avec ou sans correction | L’approximation par le chi-deux est généralement satisfaisante. |
Interprétation correcte des résultats
Une erreur classique consiste à confondre significativité statistique et importance pratique. Le test de McNemar vous dit si l’asymétrie observée entre b et c est compatible ou non avec l’hypothèse d’absence de changement systématique. Il ne mesure pas à lui seul l’ampleur clinique, économique ou opérationnelle de cet effet. Il faut donc toujours compléter l’interprétation par les effectifs bruts, le rapport c/b, le contexte métier et, si possible, un intervalle de confiance adapté.
- Vérifiez que les données sont bien appariées.
- Confirmez que la variable est binaire.
- Examinez b et c avant toute conclusion.
- Choisissez la version asymptotique ou exacte selon le volume de discordances.
- Interprétez la p-valeur avec votre seuil alpha et votre contexte applicatif.
Différence entre McNemar et un chi-deux d’indépendance
Le test du chi-deux d’indépendance suppose que les observations des deux groupes sont indépendantes. Ce n’est pas le cas dans un plan avant-après ou lorsqu’on compare deux instruments sur les mêmes sujets. Employer un test pour groupes indépendants dans un contexte apparié peut conduire à des conclusions erronées. Le test de McNemar corrige précisément ce problème en exploitant la structure des paires.
Limites du test
Le test de McNemar est puissant pour une question précise, mais il a aussi des limites:
- il ne s’applique qu’aux variables binaires;
- il ne fournit pas à lui seul une mesure détaillée de taille d’effet;
- il devient moins informatif si les discordances sont extrêmement rares;
- il ne remplace pas une modélisation plus complète lorsque plusieurs covariables interviennent.
Pour des variables ordinales ou multinomiales, on peut envisager d’autres approches, comme les extensions de Stuart-Maxwell ou des modèles pour données appariées plus riches. Néanmoins, pour un tableau binaire apparié simple, le calcul de McNemar reste une référence incontournable.
Bonnes pratiques méthodologiques
Pour produire une analyse solide, il est recommandé de rapporter le tableau complet 2×2, le nombre total de paires, le nombre de discordances, la statistique de McNemar, la p-valeur, la présence ou non d’une correction de continuité, ainsi que la justification du recours éventuel à la version exacte. Cette transparence facilite la relecture scientifique et permet à d’autres chercheurs de reproduire votre raisonnement.
Dans un article, un mémoire ou un rapport, une formulation claire pourrait être: « Un test de McNemar a été réalisé sur les réponses appariées. Les discordances étaient de b = 12 et c = 28. La différence était statistiquement significative au seuil de 5 %, indiquant une augmentation nette de la proportion de réponses positives après intervention. » Bien entendu, les chiffres exacts doivent être adaptés à vos résultats.
Ressources institutionnelles pour approfondir
Pour aller plus loin, vous pouvez consulter des sources académiques et institutionnelles fiables sur les tests pour données catégorielles:
- NIST.gov: handbook sur les procédures statistiques et tests de comparaison
- Penn State University: cours avancé sur les méthodes pour données catégorielles
- UCLA.edu: ressources appliquées en analyse statistique
En résumé
Le calcul de McNemar est la bonne réponse statistique dès lors que vous comparez deux mesures binaires appariées. Sa logique est élégante: plutôt que de regarder les proportions globales, il analyse la dissymétrie des changements observés chez les mêmes individus. Les cellules discordantes b et c portent donc toute l’information utile pour le test. Si leur déséquilibre est important, la statistique augmente et la p-valeur diminue. En contexte de faibles effectifs discordants, la version exacte binomiale apporte une sécurité supplémentaire. Utilisé correctement, ce test permet de tirer des conclusions robustes, transparentes et adaptées aux données réelles.