Calcul de l’espérance du test de Mann-Whitney
Calculez rapidement l’espérance théorique de la statistique U, sa variance, son écart-type, et une approximation normale du score z à partir des tailles d’échantillons. Cet outil est conçu pour les étudiants, chercheurs, analystes cliniques et professionnels de la data qui souhaitent interpréter le test de Mann-Whitney avec rigueur.
Calculateur interactif
Nombre d’observations dans le premier groupe.
Nombre d’observations dans le second groupe.
Optionnel pour calculer l’écart à l’espérance et le score z.
Utilisée pour l’approximation normale du test.
Comprendre le calcul de l’espérance du test de Mann-Whitney
Le test de Mann-Whitney, aussi appelé test de Wilcoxon rank-sum pour deux échantillons indépendants, est l’un des outils non paramétriques les plus utilisés en statistique appliquée. Il sert à comparer deux groupes lorsque l’on ne souhaite pas supposer que les données suivent une distribution normale, ou lorsque l’échelle de mesure est ordinale. Dans le contexte du calcul de l’espérance du test de Mann-Whitney, la notion centrale est la statistique U, qui résume la position relative des valeurs d’un groupe par rapport à l’autre.
L’espérance de U sous l’hypothèse nulle H0 est particulièrement importante parce qu’elle fournit le point d’équilibre théorique attendu si les deux groupes proviennent de la même distribution. En pratique, cela signifie que si les rangs sont mélangés de manière aléatoire entre les deux groupes, la valeur moyenne attendue de U vaut simplement n1 × n2 / 2. Cette formule est élégante, mais elle est aussi utile au quotidien, car elle permet de situer immédiatement une statistique observée par rapport à ce que l’on attendrait en absence d’effet.
Pourquoi l’espérance de U est-elle si utile ?
L’espérance n’est pas seulement un résultat théorique. Elle intervient dans plusieurs tâches concrètes :
- interpréter la direction de l’effet entre deux groupes ;
- construire une approximation normale du test lorsque les tailles d’échantillon sont modérées ou grandes ;
- calculer un score z standardisé ;
- mieux comprendre l’écart entre le résultat observé et le hasard attendu ;
- vérifier la cohérence d’un calcul de logiciel statistique.
Supposons par exemple que vous compariez le délai de récupération de deux traitements sur 12 et 15 patients. Si H0 est vraie, l’espérance de U vaut 12 × 15 / 2 = 90. Une valeur très éloignée de 90 peut suggérer que les rangs ne sont pas répartis au hasard entre les groupes, et donc qu’une différence existe probablement.
Rappel sur la statistique U
Le test de Mann-Whitney repose sur le classement conjoint des observations des deux groupes. Après avoir attribué un rang à chaque observation dans l’échantillon combiné, on calcule la somme des rangs d’un groupe, puis on la transforme en statistique U. Si l’on note R1 la somme des rangs du groupe 1, alors :
- U1 = R1 – n1 × (n1 + 1) / 2
- U2 = n1 × n2 – U1
Les deux statistiques U1 et U2 contiennent la même information. De nombreux logiciels rapportent la plus petite des deux, tandis que d’autres affichent la statistique associée au premier groupe. Pour l’interprétation de l’espérance, l’idée essentielle reste la même : sous H0, on s’attend à ce que la statistique soit centrée autour de n1 × n2 / 2.
Formule de l’espérance et de la variance
Dans le cas sans correction pour ex aequo, les formules classiques sont :
- Espérance : E(U) = n1 × n2 / 2
- Variance : Var(U) = n1 × n2 × (n1 + n2 + 1) / 12
- Écart-type : SD(U) = √Var(U)
Ces expressions sont valables sous l’hypothèse nulle lorsque les observations sont indépendantes et que les distributions sont identiques. Elles sont très utilisées pour produire une approximation normale, notamment dans les publications biomédicales, en psychologie, en économie expérimentale et en sciences de l’éducation.
| n1 | n2 | E(U) | Var(U) | Écart-type | U maximum |
|---|---|---|---|---|---|
| 10 | 10 | 50 | 175 | 13.23 | 100 |
| 12 | 15 | 90 | 420 | 20.49 | 180 |
| 20 | 25 | 250 | 958.33 | 30.96 | 500 |
| 30 | 30 | 450 | 4575 | 67.64 | 900 |
Interprétation intuitive de l’espérance
Une façon très intuitive de comprendre U consiste à le voir comme un compteur de victoires de comparaison paire à paire. Pour chaque observation du groupe 1, on regarde combien d’observations du groupe 2 elle dépasse. Si les deux groupes sont comparables, alors chaque confrontation a environ une chance sur deux d’aller dans un sens ou dans l’autre. C’est précisément ce qui explique la formule de l’espérance : sur n1 × n2 comparaisons possibles, la moitié contribue en moyenne à U.
Ainsi, si vous avez 20 observations dans le groupe A et 25 dans le groupe B, le nombre total de comparaisons potentielles est de 500. Sous H0, l’espérance de U est de 250. Une statistique observée de 340 se situe nettement au-dessus de cette valeur et peut signaler que les observations du groupe A tendent à avoir des rangs plus élevés que celles du groupe B.
Comment passer de l’espérance au score z
Pour des échantillons suffisamment grands, la distribution de U peut être approximée par une loi normale. On construit alors :
z = (U – E(U) – correction) / SD(U)
La correction de continuité vaut souvent 0,5 en valeur absolue et s’applique selon le sens de l’écart entre U et E(U). Cette approche est très fréquente lorsque les effectifs dépassent environ 10 observations par groupe, même si les pratiques varient selon les disciplines et les logiciels.
Le calculateur ci-dessus vous fournit justement :
- l’espérance E(U),
- la variance,
- l’écart-type,
- l’écart entre U observé et l’espérance,
- un score z approximatif,
- une p-valeur approximative selon le type d’hypothèse choisi.
Exemple détaillé pas à pas
Prenons un cas simple avec n1 = 12 et n2 = 15. On calcule d’abord l’espérance :
- n1 × n2 = 180
- E(U) = 180 / 2 = 90
- Var(U) = 12 × 15 × (12 + 15 + 1) / 12 = 420
- SD(U) = √420 = 20,49
Si la statistique observée vaut U = 62, l’écart par rapport à l’espérance est de -28. Avec correction de continuité, le z sera légèrement plus modéré qu’en absence de correction. Cet écart négatif suggère que le groupe 1 tend à produire des rangs plus faibles que le groupe 2, sous réserve bien sûr du codage exact de U.
Quand faut-il être prudent ?
Le test de Mann-Whitney est robuste et pratique, mais son interprétation peut devenir délicate dans certains cas :
- présence de nombreux ex aequo ;
- distributions de formes très différentes entre les groupes ;
- échantillons très petits, où une approche exacte est préférable ;
- données non indépendantes ;
- confusion entre différence de médianes et différence plus générale de distributions.
En présence d’ex aequo, la variance théorique simple peut être ajustée. Notre calculateur fournit la version standard sans correction des ex aequo, ce qui convient très bien pour l’apprentissage, la vérification manuelle et de nombreuses situations courantes. Pour une analyse de publication, il est recommandé de confirmer les résultats avec un logiciel statistique spécialisé si les ties sont fréquents.
| Aspect | Test t indépendant | Test de Mann-Whitney | Usage typique |
|---|---|---|---|
| Hypothèse sur la forme des données | Normalité souvent supposée | Non paramétrique | Données asymétriques ou ordinales |
| Statistique centrale | Différence de moyennes | Rangs et statistique U | Comparaison robuste des positions |
| Espérance sous H0 | Différence attendue proche de 0 | E(U) = n1 × n2 / 2 | Repère clé pour standardiser U |
| Sensibilité aux valeurs extrêmes | Plus élevée | Plus faible | Petits échantillons irréguliers |
Bonnes pratiques d’interprétation
Pour utiliser correctement le calcul de l’espérance du test de Mann-Whitney, voici une méthode fiable :
- vérifiez les tailles d’échantillons n1 et n2 ;
- calculez E(U) = n1 × n2 / 2 ;
- calculez la variance et l’écart-type ;
- situez la statistique observée U par rapport à l’espérance ;
- standardisez avec z si vous utilisez une approximation normale ;
- rapprochez enfin ce résultat de votre hypothèse de recherche et du contexte métier.
Dans une étude clinique, par exemple, une différence statistiquement significative n’est pas automatiquement synonyme d’importance clinique. De la même manière, une statistique U éloignée de son espérance peut signaler une différence, mais cette différence doit être interprétée à la lumière de l’effet réel, de la qualité de mesure, et de la plausibilité scientifique.
Références institutionnelles et ressources d’autorité
En résumé
Le calcul de l’espérance du test de Mann-Whitney est l’un des points d’entrée les plus importants pour comprendre ce test. L’idée est simple : sous l’hypothèse nulle, la statistique U doit se situer en moyenne à la moitié de son intervalle possible, soit n1 × n2 / 2. À partir de là, on peut quantifier l’écart observé, calculer une variance théorique, puis standardiser le résultat avec un score z. Cette logique rend le test à la fois accessible et puissant. Que vous soyez étudiant en biostatistique, chercheur en sciences sociales ou analyste qualité, maîtriser cette espérance vous permet de mieux contrôler vos analyses et de vérifier la cohérence de vos résultats.
Conseil pratique : si vos effectifs sont petits ou si les ex aequo sont nombreux, comparez toujours le résultat simplifié à la sortie d’un logiciel spécialisé. Le calcul manuel de l’espérance reste néanmoins indispensable pour comprendre la mécanique du test et interpréter correctement la statistique U.