Calcul de l’espérance du test de Mann-Whitney

Calculez rapidement l’espérance théorique de la statistique U, sa variance, son écart-type, et une approximation normale du score z à partir des tailles d’échantillons. Cet outil est conçu pour les étudiants, chercheurs, analystes cliniques et professionnels de la data qui souhaitent interpréter le test de Mann-Whitney avec rigueur.

Calculateur interactif

Taille de l’échantillon 1 (n1)

Nombre d’observations dans le premier groupe.

Taille de l’échantillon 2 (n2)

Nombre d’observations dans le second groupe.

Statistique U observée

Optionnel pour calculer l’écart à l’espérance et le score z.

Correction de continuité

Utilisée pour l’approximation normale du test.

Type d’hypothèse pour la p-valeur approximative

Formules sous H0 : E(U) = n1 × n2 / 2, Var(U) = n1 × n2 × (n1 + n2 + 1) / 12

Saisissez les valeurs puis cliquez sur « Calculer » pour afficher l’espérance du test de Mann-Whitney.

Comprendre le calcul de l’espérance du test de Mann-Whitney

Le test de Mann-Whitney, aussi appelé test de Wilcoxon rank-sum pour deux échantillons indépendants, est l’un des outils non paramétriques les plus utilisés en statistique appliquée. Il sert à comparer deux groupes lorsque l’on ne souhaite pas supposer que les données suivent une distribution normale, ou lorsque l’échelle de mesure est ordinale. Dans le contexte du calcul de l’espérance du test de Mann-Whitney, la notion centrale est la statistique U, qui résume la position relative des valeurs d’un groupe par rapport à l’autre.

L’espérance de U sous l’hypothèse nulle H0 est particulièrement importante parce qu’elle fournit le point d’équilibre théorique attendu si les deux groupes proviennent de la même distribution. En pratique, cela signifie que si les rangs sont mélangés de manière aléatoire entre les deux groupes, la valeur moyenne attendue de U vaut simplement n1 × n2 / 2. Cette formule est élégante, mais elle est aussi utile au quotidien, car elle permet de situer immédiatement une statistique observée par rapport à ce que l’on attendrait en absence d’effet.

Pourquoi l’espérance de U est-elle si utile ?

L’espérance n’est pas seulement un résultat théorique. Elle intervient dans plusieurs tâches concrètes :

interpréter la direction de l’effet entre deux groupes ;
construire une approximation normale du test lorsque les tailles d’échantillon sont modérées ou grandes ;
calculer un score z standardisé ;
mieux comprendre l’écart entre le résultat observé et le hasard attendu ;
vérifier la cohérence d’un calcul de logiciel statistique.

Supposons par exemple que vous compariez le délai de récupération de deux traitements sur 12 et 15 patients. Si H0 est vraie, l’espérance de U vaut 12 × 15 / 2 = 90. Une valeur très éloignée de 90 peut suggérer que les rangs ne sont pas répartis au hasard entre les groupes, et donc qu’une différence existe probablement.

Rappel sur la statistique U

Le test de Mann-Whitney repose sur le classement conjoint des observations des deux groupes. Après avoir attribué un rang à chaque observation dans l’échantillon combiné, on calcule la somme des rangs d’un groupe, puis on la transforme en statistique U. Si l’on note R1 la somme des rangs du groupe 1, alors :

U1 = R1 – n1 × (n1 + 1) / 2
U2 = n1 × n2 – U1

Les deux statistiques U1 et U2 contiennent la même information. De nombreux logiciels rapportent la plus petite des deux, tandis que d’autres affichent la statistique associée au premier groupe. Pour l’interprétation de l’espérance, l’idée essentielle reste la même : sous H0, on s’attend à ce que la statistique soit centrée autour de n1 × n2 / 2.

Formule de l’espérance et de la variance

Dans le cas sans correction pour ex aequo, les formules classiques sont :

Espérance : E(U) = n1 × n2 / 2
Variance : Var(U) = n1 × n2 × (n1 + n2 + 1) / 12
Écart-type : SD(U) = √Var(U)

Ces expressions sont valables sous l’hypothèse nulle lorsque les observations sont indépendantes et que les distributions sont identiques. Elles sont très utilisées pour produire une approximation normale, notamment dans les publications biomédicales, en psychologie, en économie expérimentale et en sciences de l’éducation.

n1	n2	E(U)	Var(U)	Écart-type	U maximum
10	10	50	175	13.23	100
12	15	90	420	20.49	180
20	25	250	958.33	30.96	500
30	30	450	4575	67.64	900

Interprétation intuitive de l’espérance

Une façon très intuitive de comprendre U consiste à le voir comme un compteur de victoires de comparaison paire à paire. Pour chaque observation du groupe 1, on regarde combien d’observations du groupe 2 elle dépasse. Si les deux groupes sont comparables, alors chaque confrontation a environ une chance sur deux d’aller dans un sens ou dans l’autre. C’est précisément ce qui explique la formule de l’espérance : sur n1 × n2 comparaisons possibles, la moitié contribue en moyenne à U.

Ainsi, si vous avez 20 observations dans le groupe A et 25 dans le groupe B, le nombre total de comparaisons potentielles est de 500. Sous H0, l’espérance de U est de 250. Une statistique observée de 340 se situe nettement au-dessus de cette valeur et peut signaler que les observations du groupe A tendent à avoir des rangs plus élevés que celles du groupe B.

Comment passer de l’espérance au score z

Pour des échantillons suffisamment grands, la distribution de U peut être approximée par une loi normale. On construit alors :

z = (U – E(U) – correction) / SD(U)

La correction de continuité vaut souvent 0,5 en valeur absolue et s’applique selon le sens de l’écart entre U et E(U). Cette approche est très fréquente lorsque les effectifs dépassent environ 10 observations par groupe, même si les pratiques varient selon les disciplines et les logiciels.

Le calculateur ci-dessus vous fournit justement :

l’espérance E(U),
la variance,
l’écart-type,
l’écart entre U observé et l’espérance,
un score z approximatif,
une p-valeur approximative selon le type d’hypothèse choisi.

Exemple détaillé pas à pas

Prenons un cas simple avec n1 = 12 et n2 = 15. On calcule d’abord l’espérance :

n1 × n2 = 180
E(U) = 180 / 2 = 90
Var(U) = 12 × 15 × (12 + 15 + 1) / 12 = 420
SD(U) = √420 = 20,49

Si la statistique observée vaut U = 62, l’écart par rapport à l’espérance est de -28. Avec correction de continuité, le z sera légèrement plus modéré qu’en absence de correction. Cet écart négatif suggère que le groupe 1 tend à produire des rangs plus faibles que le groupe 2, sous réserve bien sûr du codage exact de U.

Quand faut-il être prudent ?

Le test de Mann-Whitney est robuste et pratique, mais son interprétation peut devenir délicate dans certains cas :

présence de nombreux ex aequo ;
distributions de formes très différentes entre les groupes ;
échantillons très petits, où une approche exacte est préférable ;
données non indépendantes ;
confusion entre différence de médianes et différence plus générale de distributions.

En présence d’ex aequo, la variance théorique simple peut être ajustée. Notre calculateur fournit la version standard sans correction des ex aequo, ce qui convient très bien pour l’apprentissage, la vérification manuelle et de nombreuses situations courantes. Pour une analyse de publication, il est recommandé de confirmer les résultats avec un logiciel statistique spécialisé si les ties sont fréquents.

Aspect	Test t indépendant	Test de Mann-Whitney	Usage typique
Hypothèse sur la forme des données	Normalité souvent supposée	Non paramétrique	Données asymétriques ou ordinales
Statistique centrale	Différence de moyennes	Rangs et statistique U	Comparaison robuste des positions
Espérance sous H0	Différence attendue proche de 0	E(U) = n1 × n2 / 2	Repère clé pour standardiser U
Sensibilité aux valeurs extrêmes	Plus élevée	Plus faible	Petits échantillons irréguliers

Bonnes pratiques d’interprétation

Pour utiliser correctement le calcul de l’espérance du test de Mann-Whitney, voici une méthode fiable :

vérifiez les tailles d’échantillons n1 et n2 ;
calculez E(U) = n1 × n2 / 2 ;
calculez la variance et l’écart-type ;
situez la statistique observée U par rapport à l’espérance ;
standardisez avec z si vous utilisez une approximation normale ;
rapprochez enfin ce résultat de votre hypothèse de recherche et du contexte métier.

Dans une étude clinique, par exemple, une différence statistiquement significative n’est pas automatiquement synonyme d’importance clinique. De la même manière, une statistique U éloignée de son espérance peut signaler une différence, mais cette différence doit être interprétée à la lumière de l’effet réel, de la qualité de mesure, et de la plausibilité scientifique.

Références institutionnelles et ressources d’autorité

En résumé

Le calcul de l’espérance du test de Mann-Whitney est l’un des points d’entrée les plus importants pour comprendre ce test. L’idée est simple : sous l’hypothèse nulle, la statistique U doit se situer en moyenne à la moitié de son intervalle possible, soit n1 × n2 / 2. À partir de là, on peut quantifier l’écart observé, calculer une variance théorique, puis standardiser le résultat avec un score z. Cette logique rend le test à la fois accessible et puissant. Que vous soyez étudiant en biostatistique, chercheur en sciences sociales ou analyste qualité, maîtriser cette espérance vous permet de mieux contrôler vos analyses et de vérifier la cohérence de vos résultats.

Conseil pratique : si vos effectifs sont petits ou si les ex aequo sont nombreux, comparez toujours le résultat simplifié à la sortie d’un logiciel spécialisé. Le calcul manuel de l’espérance reste néanmoins indispensable pour comprendre la mécanique du test et interpréter correctement la statistique U.

Calcul De L Esp Rance Test De Mann Withney