Calcul du z dans le U de Mann Whitney
Calculez rapidement la statistique z à partir de la statistique U du test de Mann Whitney, avec ou sans correction de continuité, et avec une prise en compte simple des ex aequo via la somme des termes de correction.
Nombre d’observations dans le premier groupe.
Nombre d’observations dans le second groupe.
Entrez U observée. Vous pouvez saisir U1 ou la plus petite valeur U selon l’option ci-dessous.
Si vous saisissez U1, le calcul affichera aussi U2 et U min.
Recommandée pour l’approximation normale quand les tailles d’échantillon sont modérées.
Choisissez le sens du test pour la p-value approximative basée sur z.
Mettez 0 s’il n’y a pas d’ex aequo. Exemple: un groupe d’ex aequo de taille 3 apporte 24, car 3³ – 3 = 24.
Nombre de décimales pour les résultats.
Résultats
Renseignez les champs puis cliquez sur Calculer z.
Comprendre le calcul du z dans le U de Mann Whitney
Le test de Mann Whitney, également appelé test de Wilcoxon rank-sum dans de nombreux manuels, sert à comparer deux groupes indépendants lorsque l’on ne souhaite pas supposer une distribution normale des données. Il est particulièrement utile en biostatistique, en sciences sociales, en psychologie, en qualité industrielle et dans l’analyse de données ordinales. En pratique, beaucoup d’utilisateurs disposent d’une statistique U obtenue à la main, dans un logiciel ou à partir des rangs, puis souhaitent convertir cette statistique en score z afin d’obtenir une p-value approchée à partir de la loi normale standard.
Le principe est simple. Sous l’hypothèse nulle, la statistique U possède une moyenne théorique et un écart-type théorique. Lorsque les tailles d’échantillon sont suffisamment grandes, la distribution de U peut être approximée par une loi normale. On standardise alors U pour obtenir z. Cette transformation permet d’évaluer à quelle distance l’observation se trouve du centre attendu sous l’hypothèse nulle.
Quand utiliser cette transformation de U vers z
- Lorsque vous comparez deux échantillons indépendants.
- Lorsque la variable mesurée est ordinale, asymétrique, ou contient des valeurs extrêmes qui rendent le test t moins approprié.
- Lorsque vous disposez de tailles d’échantillon modérées à grandes, ce qui rend l’approximation normale plus acceptable.
- Lorsque vous avez besoin d’une p-value rapide à partir de la statistique U.
Formule du calcul de z à partir de U
Dans la version classique sans correction des ex aequo, la moyenne et l’écart-type de U sous l’hypothèse nulle sont :
σU = √[ n1 × n2 × (n1 + n2 + 1) / 12 ]
Le score z s’obtient ensuite par :
Lorsque l’on applique la correction de continuité, on rapproche la statistique discrète U de l’approximation continue de la loi normale. Dans ce cas, on ajoute ou on retranche 0,5 selon la position de U par rapport à la moyenne théorique. Si U est inférieur à la moyenne, on utilise généralement U + 0,5. Si U est supérieur à la moyenne, on utilise U – 0,5. Cette correction a un effet surtout visible lorsque les échantillons ne sont pas très grands.
Correction des ex aequo
Dans les données réelles, il est fréquent que plusieurs observations aient la même valeur. Ces ex aequo modifient la variance de la statistique U. Une formule pratique pour la variance corrigée est :
avec N = n1 + n2
Ici, t désigne la taille de chaque groupe d’ex aequo dans l’échantillon total combiné. Par exemple, si vous avez un ensemble de 3 observations identiques et un autre ensemble de 4 observations identiques, la somme de correction vaut :
- Pour t = 3 : 3³ – 3 = 24
- Pour t = 4 : 4³ – 4 = 60
- Somme totale : 24 + 60 = 84
Le calculateur ci-dessus vous permet d’entrer directement cette somme, ce qui est très pratique si votre logiciel vous la fournit déjà ou si vous l’avez calculée manuellement.
Étapes complètes du calcul
- Déterminer les tailles des groupes n1 et n2.
- Obtenir la statistique U, soit U1, soit le plus petit U.
- Calculer la moyenne théorique de U sous H0.
- Calculer l’écart-type de U, avec ou sans correction des ex aequo.
- Appliquer éventuellement la correction de continuité.
- Standardiser pour obtenir z.
- Convertir z en p-value selon un test bilatéral ou unilatéral.
Exemple simple
Supposons deux groupes indépendants avec n1 = 12 et n2 = 15. Vous obtenez une statistique U = 52, sans ex aequo. Alors :
- μU = 12 × 15 / 2 = 90
- σU = √[12 × 15 × (12 + 15 + 1) / 12] = √420 ≈ 20,494
- Sans correction de continuité : z ≈ (52 – 90) / 20,494 ≈ -1,854
- Avec correction de continuité : z ≈ (52 + 0,5 – 90) / 20,494 ≈ -1,830
On voit que la correction de continuité rapproche légèrement la valeur de z de zéro. Cette différence peut paraître modeste, mais elle peut influencer la p-value autour des seuils classiques tels que 0,05.
Interprétation du score z
Le score z mesure la distance entre votre statistique U observée et sa valeur moyenne attendue sous l’hypothèse nulle, exprimée en nombre d’écarts-types. Plus la valeur absolue de z est grande, plus l’écart à l’hypothèse nulle est fort. Un z proche de 0 signifie que la statistique observée est très compatible avec une absence de différence entre les groupes. Un z négatif indique que U est plus faible que prévu, et un z positif qu’il est plus élevé que prévu.
Attention toutefois : dans le contexte de Mann Whitney, le signe de z dépend de la convention utilisée pour définir U1, l’ordre des groupes, et parfois du logiciel. Ce qui compte le plus pour un test bilatéral est souvent la valeur absolue de z et la p-value correspondante. Pour un test unilatéral, il faut s’assurer que le sens du z est cohérent avec votre hypothèse de recherche.
Repères usuels sur la loi normale standard
| Valeur de z | p bilatérale approximative | Interprétation courante |
|---|---|---|
| ±1,645 | 0,100 | Seuil proche d’un test unilatéral à 5 % |
| ±1,960 | 0,050 | Référence classique pour un test bilatéral à 5 % |
| ±2,576 | 0,010 | Preuve plus forte contre l’hypothèse nulle |
| ±3,291 | 0,001 | Écart très marqué |
Ces valeurs sont des repères statistiques classiques issus de la loi normale standard. Elles sont utiles pour interpréter rapidement le score z calculé à partir de U.
Comparaison de quelques tailles d’échantillon et dispersion théorique de U
Le tableau suivant illustre la moyenne théorique et l’écart-type de U sans ex aequo pour différents couples de tailles d’échantillon. Ces statistiques sont calculées directement à partir des formules standards du test de Mann Whitney.
| n1 | n2 | μU | σU sans ex aequo |
|---|---|---|---|
| 10 | 10 | 50,0 | 13,229 |
| 12 | 15 | 90,0 | 20,494 |
| 20 | 20 | 200,0 | 36,968 |
| 25 | 30 | 375,0 | 58,095 |
On remarque que l’écart-type augmente avec la taille des groupes. Cela signifie qu’une même différence brute de U peut produire un z plus ou moins grand selon le contexte d’échantillonnage. C’est précisément la raison pour laquelle la standardisation est indispensable si l’on veut comparer les résultats entre études ou interpréter rigoureusement la significativité.
Points d’attention méthodologiques
1. U1, U2 et le plus petit U
Pour deux groupes, on peut calculer deux statistiques : U1 et U2. Elles sont liées par la relation :
Beaucoup de tableaux anciens utilisent le plus petit des deux U pour les comparaisons exactes. En revanche, certains logiciels affichent seulement U1. Le calculateur ci-dessus accepte les deux approches. Si vous entrez U1, il calcule également U2 et U min pour clarifier l’interprétation.
2. Approximation normale ou test exact
Lorsque les échantillons sont petits, le test exact est souvent préférable à l’approximation normale. Le score z reste cependant très utilisé dans la littérature, surtout pour les tailles modérées ou grandes. Si vous êtes proche d’un seuil critique, il peut être prudent de comparer la p-value approchée à une p-value exacte produite par un logiciel statistique.
3. Sens du test
Une p-value bilatérale répond à la question : les deux distributions diffèrent-elles, sans préciser la direction ? Une p-value unilatérale répond à une question directionnelle, par exemple savoir si le groupe 1 tend à présenter des rangs plus élevés que le groupe 2. Dans un test unilatéral, le signe du z devient crucial.
4. Ex aequo et qualité des données
Les données avec beaucoup d’ex aequo peuvent apparaître lorsque l’échelle est discrète, par exemple sur une note de satisfaction de 1 à 5 ou 1 à 10. Dans ces situations, la correction de variance n’est pas un détail, elle améliore la fidélité du calcul. Si vous négligez les ex aequo, vous risquez de sous-estimer ou surestimer légèrement la dispersion théorique.
Comment lire le graphique du calculateur
Le graphique compare plusieurs quantités clés : la valeur observée de U utilisée pour le calcul, la moyenne théorique de U sous l’hypothèse nulle, l’écart-type théorique, ainsi que la valeur absolue de z. Visuellement, cela vous permet de voir si U se situe près du centre attendu ou dans une zone plus éloignée. Quand la barre correspondant à U observée s’écarte nettement de la moyenne théorique, le z a tendance à grandir en valeur absolue.
Erreurs fréquentes à éviter
- Entrer une statistique U impossible, par exemple supérieure à n1 × n2.
- Confondre U observée avec une somme de rangs W.
- Interpréter le signe de z sans tenir compte de l’ordre des groupes.
- Oublier la correction des ex aequo lorsque les données comportent de nombreuses répétitions.
- Utiliser l’approximation normale sur des très petits échantillons sans vérifier la pertinence d’un calcul exact.
Références institutionnelles utiles
Pour approfondir la théorie du test, la standardisation et les bonnes pratiques d’interprétation, vous pouvez consulter ces sources reconnues :
- Penn State University, explication du Wilcoxon rank-sum et du Mann Whitney
- UCLA, présentation du test de Mann Whitney
- NIST, e-Handbook of Statistical Methods
En résumé
Le calcul du z dans le U de Mann Whitney repose sur une idée fondamentale : transformer une statistique de rangs en une valeur standardisée comparable à la loi normale. Pour y parvenir, on utilise la moyenne théorique de U, son écart-type, une éventuelle correction de continuité et, si nécessaire, une correction des ex aequo. Le résultat final, z, permet d’obtenir une p-value approximative et de juger si l’écart observé entre les deux groupes est compatible ou non avec l’hypothèse nulle.
Si vous utilisez souvent le test de Mann Whitney, mémoriser la mécanique du calcul est très utile : vérifier n1 et n2, identifier correctement U, distinguer test exact et approximation normale, et traiter les ex aequo avec soin. Le calculateur de cette page vous donne une façon rapide, claire et visuelle d’effectuer ces étapes sans perdre de vue les principes statistiques sous-jacents.