Calcul du z dans le U de Mann Whitney

Calculez rapidement la statistique z à partir de la statistique U du test de Mann Whitney, avec ou sans correction de continuité, et avec une prise en compte simple des ex aequo via la somme des termes de correction.

Formule U vers z Correction de continuité Option ex aequo Graphique interactif

Taille de l’échantillon 1 (n1)

Nombre d’observations dans le premier groupe.

Taille de l’échantillon 2 (n2)

Nombre d’observations dans le second groupe.

Statistique U observée

Entrez U observée. Vous pouvez saisir U1 ou la plus petite valeur U selon l’option ci-dessous.

Type de U saisi

Si vous saisissez U1, le calcul affichera aussi U2 et U min.

Correction de continuité

Recommandée pour l’approximation normale quand les tailles d’échantillon sont modérées.

Type de p-value

Choisissez le sens du test pour la p-value approximative basée sur z.

Somme de correction des ex aequo Σ(t³ – t)

Mettez 0 s’il n’y a pas d’ex aequo. Exemple: un groupe d’ex aequo de taille 3 apporte 24, car 3³ – 3 = 24.

Décimales d’affichage

Nombre de décimales pour les résultats.

Résultats

Renseignez les champs puis cliquez sur Calculer z.

Comprendre le calcul du z dans le U de Mann Whitney

Le test de Mann Whitney, également appelé test de Wilcoxon rank-sum dans de nombreux manuels, sert à comparer deux groupes indépendants lorsque l’on ne souhaite pas supposer une distribution normale des données. Il est particulièrement utile en biostatistique, en sciences sociales, en psychologie, en qualité industrielle et dans l’analyse de données ordinales. En pratique, beaucoup d’utilisateurs disposent d’une statistique U obtenue à la main, dans un logiciel ou à partir des rangs, puis souhaitent convertir cette statistique en score z afin d’obtenir une p-value approchée à partir de la loi normale standard.

Le principe est simple. Sous l’hypothèse nulle, la statistique U possède une moyenne théorique et un écart-type théorique. Lorsque les tailles d’échantillon sont suffisamment grandes, la distribution de U peut être approximée par une loi normale. On standardise alors U pour obtenir z. Cette transformation permet d’évaluer à quelle distance l’observation se trouve du centre attendu sous l’hypothèse nulle.

Quand utiliser cette transformation de U vers z

Lorsque vous comparez deux échantillons indépendants.
Lorsque la variable mesurée est ordinale, asymétrique, ou contient des valeurs extrêmes qui rendent le test t moins approprié.
Lorsque vous disposez de tailles d’échantillon modérées à grandes, ce qui rend l’approximation normale plus acceptable.
Lorsque vous avez besoin d’une p-value rapide à partir de la statistique U.

Formule du calcul de z à partir de U

Dans la version classique sans correction des ex aequo, la moyenne et l’écart-type de U sous l’hypothèse nulle sont :

μ_U = n1 × n2 / 2
σ_U = √[ n1 × n2 × (n1 + n2 + 1) / 12 ]

Le score z s’obtient ensuite par :

z = (U – μ_U) / σ_U

Lorsque l’on applique la correction de continuité, on rapproche la statistique discrète U de l’approximation continue de la loi normale. Dans ce cas, on ajoute ou on retranche 0,5 selon la position de U par rapport à la moyenne théorique. Si U est inférieur à la moyenne, on utilise généralement U + 0,5. Si U est supérieur à la moyenne, on utilise U – 0,5. Cette correction a un effet surtout visible lorsque les échantillons ne sont pas très grands.

Correction des ex aequo

Dans les données réelles, il est fréquent que plusieurs observations aient la même valeur. Ces ex aequo modifient la variance de la statistique U. Une formule pratique pour la variance corrigée est :

σ_U = √{ n1 × n2 / 12 × [ (N + 1) – Σ(t³ – t) / (N × (N – 1)) ] }
avec N = n1 + n2

Ici, t désigne la taille de chaque groupe d’ex aequo dans l’échantillon total combiné. Par exemple, si vous avez un ensemble de 3 observations identiques et un autre ensemble de 4 observations identiques, la somme de correction vaut :

Pour t = 3 : 3³ – 3 = 24
Pour t = 4 : 4³ – 4 = 60
Somme totale : 24 + 60 = 84

Le calculateur ci-dessus vous permet d’entrer directement cette somme, ce qui est très pratique si votre logiciel vous la fournit déjà ou si vous l’avez calculée manuellement.

Étapes complètes du calcul

Déterminer les tailles des groupes n1 et n2.
Obtenir la statistique U, soit U1, soit le plus petit U.
Calculer la moyenne théorique de U sous H0.
Calculer l’écart-type de U, avec ou sans correction des ex aequo.
Appliquer éventuellement la correction de continuité.
Standardiser pour obtenir z.
Convertir z en p-value selon un test bilatéral ou unilatéral.

Exemple simple

Supposons deux groupes indépendants avec n1 = 12 et n2 = 15. Vous obtenez une statistique U = 52, sans ex aequo. Alors :

μ_U = 12 × 15 / 2 = 90
σ_U = √[12 × 15 × (12 + 15 + 1) / 12] = √420 ≈ 20,494
Sans correction de continuité : z ≈ (52 – 90) / 20,494 ≈ -1,854
Avec correction de continuité : z ≈ (52 + 0,5 – 90) / 20,494 ≈ -1,830

On voit que la correction de continuité rapproche légèrement la valeur de z de zéro. Cette différence peut paraître modeste, mais elle peut influencer la p-value autour des seuils classiques tels que 0,05.

Interprétation du score z

Le score z mesure la distance entre votre statistique U observée et sa valeur moyenne attendue sous l’hypothèse nulle, exprimée en nombre d’écarts-types. Plus la valeur absolue de z est grande, plus l’écart à l’hypothèse nulle est fort. Un z proche de 0 signifie que la statistique observée est très compatible avec une absence de différence entre les groupes. Un z négatif indique que U est plus faible que prévu, et un z positif qu’il est plus élevé que prévu.

Attention toutefois : dans le contexte de Mann Whitney, le signe de z dépend de la convention utilisée pour définir U1, l’ordre des groupes, et parfois du logiciel. Ce qui compte le plus pour un test bilatéral est souvent la valeur absolue de z et la p-value correspondante. Pour un test unilatéral, il faut s’assurer que le sens du z est cohérent avec votre hypothèse de recherche.

Repères usuels sur la loi normale standard

Valeur de z	p bilatérale approximative	Interprétation courante
±1,645	0,100	Seuil proche d’un test unilatéral à 5 %
±1,960	0,050	Référence classique pour un test bilatéral à 5 %
±2,576	0,010	Preuve plus forte contre l’hypothèse nulle
±3,291	0,001	Écart très marqué

Ces valeurs sont des repères statistiques classiques issus de la loi normale standard. Elles sont utiles pour interpréter rapidement le score z calculé à partir de U.

Comparaison de quelques tailles d’échantillon et dispersion théorique de U

Le tableau suivant illustre la moyenne théorique et l’écart-type de U sans ex aequo pour différents couples de tailles d’échantillon. Ces statistiques sont calculées directement à partir des formules standards du test de Mann Whitney.

n1	n2	μ_U	σ_U sans ex aequo
10	10	50,0	13,229
12	15	90,0	20,494
20	20	200,0	36,968
25	30	375,0	58,095

On remarque que l’écart-type augmente avec la taille des groupes. Cela signifie qu’une même différence brute de U peut produire un z plus ou moins grand selon le contexte d’échantillonnage. C’est précisément la raison pour laquelle la standardisation est indispensable si l’on veut comparer les résultats entre études ou interpréter rigoureusement la significativité.

Points d’attention méthodologiques

1. U1, U2 et le plus petit U

Pour deux groupes, on peut calculer deux statistiques : U1 et U2. Elles sont liées par la relation :

U1 + U2 = n1 × n2

Beaucoup de tableaux anciens utilisent le plus petit des deux U pour les comparaisons exactes. En revanche, certains logiciels affichent seulement U1. Le calculateur ci-dessus accepte les deux approches. Si vous entrez U1, il calcule également U2 et U min pour clarifier l’interprétation.

2. Approximation normale ou test exact

Lorsque les échantillons sont petits, le test exact est souvent préférable à l’approximation normale. Le score z reste cependant très utilisé dans la littérature, surtout pour les tailles modérées ou grandes. Si vous êtes proche d’un seuil critique, il peut être prudent de comparer la p-value approchée à une p-value exacte produite par un logiciel statistique.

3. Sens du test

Une p-value bilatérale répond à la question : les deux distributions diffèrent-elles, sans préciser la direction ? Une p-value unilatérale répond à une question directionnelle, par exemple savoir si le groupe 1 tend à présenter des rangs plus élevés que le groupe 2. Dans un test unilatéral, le signe du z devient crucial.

4. Ex aequo et qualité des données

Les données avec beaucoup d’ex aequo peuvent apparaître lorsque l’échelle est discrète, par exemple sur une note de satisfaction de 1 à 5 ou 1 à 10. Dans ces situations, la correction de variance n’est pas un détail, elle améliore la fidélité du calcul. Si vous négligez les ex aequo, vous risquez de sous-estimer ou surestimer légèrement la dispersion théorique.

Comment lire le graphique du calculateur

Le graphique compare plusieurs quantités clés : la valeur observée de U utilisée pour le calcul, la moyenne théorique de U sous l’hypothèse nulle, l’écart-type théorique, ainsi que la valeur absolue de z. Visuellement, cela vous permet de voir si U se situe près du centre attendu ou dans une zone plus éloignée. Quand la barre correspondant à U observée s’écarte nettement de la moyenne théorique, le z a tendance à grandir en valeur absolue.

Erreurs fréquentes à éviter

Entrer une statistique U impossible, par exemple supérieure à n1 × n2.
Confondre U observée avec une somme de rangs W.
Interpréter le signe de z sans tenir compte de l’ordre des groupes.
Oublier la correction des ex aequo lorsque les données comportent de nombreuses répétitions.
Utiliser l’approximation normale sur des très petits échantillons sans vérifier la pertinence d’un calcul exact.

Références institutionnelles utiles

Pour approfondir la théorie du test, la standardisation et les bonnes pratiques d’interprétation, vous pouvez consulter ces sources reconnues :

En résumé

Le calcul du z dans le U de Mann Whitney repose sur une idée fondamentale : transformer une statistique de rangs en une valeur standardisée comparable à la loi normale. Pour y parvenir, on utilise la moyenne théorique de U, son écart-type, une éventuelle correction de continuité et, si nécessaire, une correction des ex aequo. Le résultat final, z, permet d’obtenir une p-value approximative et de juger si l’écart observé entre les deux groupes est compatible ou non avec l’hypothèse nulle.

Si vous utilisez souvent le test de Mann Whitney, mémoriser la mécanique du calcul est très utile : vérifier n1 et n2, identifier correctement U, distinguer test exact et approximation normale, et traiter les ex aequo avec soin. Le calculateur de cette page vous donne une façon rapide, claire et visuelle d’effectuer ces étapes sans perdre de vue les principes statistiques sous-jacents.

Ce calculateur fournit une approximation normale du test de Mann Whitney à partir de U. Pour des petits échantillons, des situations avec nombreux ex aequo, ou des décisions importantes en recherche, il est recommandé de confirmer le résultat avec un logiciel statistique réalisant le calcul exact.

Calcul Du Z Dans Le U De Mann Whitney