Calcul H0 avec sn : test de Student sur une moyenne
Calculez rapidement la statistique de test, la p-valeur, l’intervalle de confiance et la décision statistique lorsque l’écart-type de population est inconnu et qu’on utilise l’écart-type d’échantillon sn.
Calculateur interactif
Renseignez les statistiques de votre échantillon pour tester l’hypothèse nulle H0 : μ = μ0 avec un test t à un échantillon.
Les résultats du test s’afficheront ici.
Le calcul repose sur la statistique t de Student : (x̄ – μ0) / (sn / √n).
Guide expert : comment faire un calcul H0 avec sn correctement
Le sujet du calcul H0 avec sn revient très souvent en statistique inférentielle, notamment en lycée, à l’université, en école d’ingénieurs, en santé publique, en contrôle qualité ou en sciences sociales. Dans ce contexte, H0 désigne l’hypothèse nulle, c’est-à-dire l’affirmation que l’on souhaite tester, tandis que sn représente l’écart-type mesuré sur l’échantillon lorsque l’écart-type réel de la population n’est pas connu. C’est précisément cette situation qui conduit à utiliser le test t de Student à un échantillon au lieu d’un test z.
Concrètement, on cherche souvent à répondre à une question comme : la moyenne observée dans mon échantillon est-elle compatible avec une moyenne théorique μ0 ? Par exemple, une machine remplit-elle bien des flacons de 500 ml en moyenne ? Un temps moyen de traitement est-il égal à 10 minutes ? Une note moyenne observée est-elle différente de 12 ? Si l’écart-type de population σ est inconnu, ce qui est le cas le plus fréquent sur le terrain, on remplace σ par l’écart-type estimé sn, puis on travaille avec la loi de Student.
Définition de l’hypothèse nulle H0
L’hypothèse nulle est la position de référence. Dans un test de moyenne à un échantillon, elle prend en général la forme :
L’hypothèse alternative dépend du problème posé :
- Test bilatéral : H1 : μ ≠ μ0
- Test unilatéral à droite : H1 : μ > μ0
- Test unilatéral à gauche : H1 : μ < μ0
Le choix entre ces trois options est fondamental. Un test bilatéral vérifie toute différence, tandis qu’un test unilatéral cherche une différence dans un seul sens. Il faut toujours définir ce choix avant d’observer les résultats pour éviter un biais d’interprétation.
Pourquoi utilise-t-on sn ?
Dans les problèmes réels, l’écart-type de la population complète est rarement connu. On dispose seulement d’un échantillon. L’écart-type empirique sn sert alors d’estimation de la dispersion réelle. Cette substitution ajoute de l’incertitude. C’est précisément cette incertitude supplémentaire qui justifie l’usage de la loi t de Student, plus large que la loi normale standard lorsque l’échantillon est petit.
La formule du calcul H0 avec sn
Le calcul central s’écrit :
où :
- x̄ est la moyenne de l’échantillon,
- μ0 est la moyenne supposée sous H0,
- sn est l’écart-type d’échantillon,
- n est la taille de l’échantillon.
On compare ensuite cette statistique t à la loi de Student avec n – 1 degrés de liberté. Si la statistique observée est trop éloignée de ce que H0 autorise habituellement, on conclut à un rejet de H0. Sinon, on ne rejette pas H0. Il est très important de dire ne pas rejeter plutôt que accepter définitivement, car un test ne prouve pas une hypothèse, il mesure seulement si les données sont compatibles avec elle à un niveau de risque fixé.
Étapes pratiques pour effectuer le test
- Formuler H0 et H1.
- Choisir le niveau de signification α, souvent 5 %.
- Calculer la moyenne x̄, l’écart-type sn et la taille n.
- Calculer la statistique t.
- Déterminer la p-valeur ou la valeur critique t.
- Comparer le résultat avec α.
- Conclure en langage statistique puis en langage métier.
Cette méthode est standard dans les analyses de moyenne lorsque la variance est inconnue. Elle est aussi la base d’une grande partie de l’inférence classique.
Interprétation de la p-valeur
La p-valeur représente la probabilité d’observer un résultat au moins aussi extrême que celui mesuré si H0 était vraie. Une p-valeur faible indique que les données sont peu compatibles avec H0. En pratique :
- si p ≤ α, on rejette H0 ;
- si p > α, on ne rejette pas H0.
Attention cependant : une p-valeur n’est pas la probabilité que H0 soit vraie. Ce point est source de nombreuses erreurs. Elle ne mesure pas non plus l’importance pratique d’un effet. Une différence peut être statistiquement significative mais sans impact opérationnel si elle est très faible.
Exemple concret de calcul
Supposons qu’une entreprise affirme qu’un composant a une durée de vie moyenne de 50 heures. On prélève 25 pièces, on observe une moyenne de 52,4 heures et un écart-type sn de 6,2 heures. On veut tester H0 : μ = 50 contre H1 : μ ≠ 50 au seuil de 5 %.
On calcule :
Avec 24 degrés de liberté, on compare cette valeur à la loi t de Student. La décision dépend alors de la valeur critique ou de la p-valeur. Cet exemple illustre parfaitement l’idée de calcul H0 avec sn : on évalue la différence entre la moyenne observée et la moyenne théorique relativement à la variabilité estimée de l’échantillon.
Tableau de comparaison des valeurs critiques t bilatérales à 95 %
Le tableau suivant présente des valeurs réelles classiques de la loi t de Student pour un intervalle de confiance bilatéral à 95 % ou un test bilatéral au seuil de 5 %.
| Degrés de liberté | Valeur critique t* | Interprétation |
|---|---|---|
| 5 | 2,571 | Échantillon très petit, seuil de rejet plus exigeant qu’avec la loi normale. |
| 10 | 2,228 | La distribution reste plus étalée que la loi normale. |
| 20 | 2,086 | La loi t commence à se rapprocher nettement de la loi normale. |
| 30 | 2,042 | Valeur courante dans les exercices avec échantillon moyen. |
| 60 | 2,000 | Écart faible par rapport à la valeur normale 1,960. |
| ∞ | 1,960 | Cas limite correspondant à la loi normale standard. |
Comparaison t de Student versus z normale
Beaucoup d’étudiants confondent le test t et le test z. La distinction est pourtant simple : utilisez z si l’écart-type de population σ est connu ; utilisez t si σ est inconnu et remplacé par sn. Dans les applications professionnelles, le second cas est largement le plus fréquent.
| Situation | Distribution utilisée | Statistique | Valeur critique bilatérale à 5 % |
|---|---|---|---|
| σ connu | Loi normale standard | z = (x̄ – μ0) / (σ / √n) | 1,960 |
| σ inconnu, n = 10 | Loi t de Student, 9 ddl | t = (x̄ – μ0) / (s_n / √n) | 2,262 |
| σ inconnu, n = 30 | Loi t de Student, 29 ddl | t = (x̄ – μ0) / (s_n / √n) | 2,045 |
Conditions de validité du test
Pour qu’un calcul H0 avec sn soit fiable, certaines conditions doivent être raisonnablement remplies :
- l’échantillon doit être indépendant ou à peu près indépendant ;
- les observations doivent représenter la population étudiée ;
- la distribution doit être approximativement normale si l’échantillon est petit ;
- si n est plus grand, le théorème central limite rend le test plus robuste.
En présence d’asymétries très fortes, de valeurs extrêmes ou de dépendances importantes, les conclusions d’un test t peuvent devenir discutables. Dans ces cas, il faut éventuellement envisager des méthodes robustes, une transformation des données ou des tests non paramétriques.
Erreurs fréquentes dans le calcul de H0 avec sn
- Confondre l’écart-type d’échantillon avec l’erreur standard.
- Oublier de diviser par √n dans le dénominateur.
- Utiliser la loi normale au lieu de la loi t alors que σ est inconnu.
- Choisir un test unilatéral après avoir regardé les données.
- Interpréter une absence de rejet comme une preuve absolue de H0.
- Négliger l’effet de la taille d’échantillon sur la puissance du test.
Intervalle de confiance et test d’hypothèse
Le calcul de H0 avec sn est étroitement lié à l’intervalle de confiance de la moyenne. Un intervalle de confiance à 95 % s’écrit :
Si la valeur μ0 appartient à cet intervalle, alors, dans le cas bilatéral au seuil de 5 %, on ne rejette généralement pas H0. Si μ0 est en dehors de l’intervalle, on rejette H0. Cette équivalence est très utile pour expliquer les résultats à des non-spécialistes, car l’intervalle donne une idée visuelle de la zone plausible pour la moyenne réelle.
Applications concrètes
Le test de moyenne avec sn intervient dans de nombreux domaines :
- Industrie : contrôle d’un poids moyen, d’un volume ou d’une résistance.
- Santé : comparaison à une valeur de référence clinique.
- Éducation : évaluation d’une moyenne de performance.
- Marketing : mesure d’un score moyen de satisfaction.
- Recherche scientifique : validation d’un effet moyen dans un protocole expérimental.
Dans toutes ces situations, le vocabulaire statistique peut sembler technique, mais l’idée reste simple : mesurer si l’écart observé entre la moyenne d’un échantillon et une valeur de référence est trop grand pour être attribué au hasard d’échantillonnage.
Sources académiques et institutionnelles recommandées
Pour approfondir le sujet, vous pouvez consulter des ressources reconnues :
- NIST Engineering Statistics Handbook (.gov)
- Penn State Online Statistics Program (.edu)
- UCLA Statistical Methods and Data Analytics (.edu)
En résumé
Le calcul H0 avec sn correspond le plus souvent au test t de Student à un échantillon utilisé lorsque l’écart-type de la population est inconnu. On calcule une statistique t à partir de la différence entre la moyenne observée x̄ et la moyenne théorique μ0, rapportée à l’erreur standard fondée sur sn. On obtient ensuite une p-valeur ou une valeur critique pour prendre une décision sur H0. Ce cadre est fondamental en statistique appliquée, car il permet de transformer des observations d’échantillon en une conclusion mesurée, rigoureuse et reproductible.
Le plus important n’est pas seulement d’appliquer une formule, mais de comprendre le sens de chaque composant : la moyenne pour la position, sn pour la dispersion, √n pour l’effet de la taille d’échantillon, la loi de Student pour l’incertitude supplémentaire et α pour le risque d’erreur accepté. Une fois ces éléments maîtrisés, le calcul de H0 avec sn devient un outil puissant pour analyser des données de façon fiable.