Calcul du khi 2 formule
Utilisez ce calculateur premium pour appliquer la formule du khi carré à un test d’ajustement. Saisissez vos effectifs observés et attendus, calculez la statistique χ², les degrés de liberté, la valeur critique et la p-value, puis visualisez immédiatement la contribution de chaque catégorie.
Formule utilisée : χ² = Σ ((O – E)² / E). Chaque effectif attendu doit être strictement positif.
| Catégorie | Observé (O) | Attendu (E) |
|---|
Conseil statistique : pour un test d’ajustement, on recommande souvent des effectifs attendus d’au moins 5 par catégorie pour renforcer la validité de l’approximation du khi carré.
Comprendre le calcul du khi 2 formule : guide expert complet
Le calcul du khi 2, souvent noté χ² ou khi carré, est l’un des outils statistiques les plus utilisés pour comparer des données observées à des données théoriquement attendues. En pratique, la formule du khi 2 permet de répondre à une question simple mais essentielle : l’écart entre ce que l’on observe et ce que l’on attend est-il dû au hasard, ou révèle-t-il une différence statistiquement significative ? Cette logique se retrouve dans de nombreux domaines : contrôle qualité, biostatistique, sciences sociales, marketing, génétique, pédagogie et analyse de questionnaires.
La formule de base du khi 2 est la suivante : χ² = Σ ((O – E)² / E), où O représente l’effectif observé et E l’effectif attendu. On calcule cette quantité pour chaque catégorie, puis on additionne les contributions. Plus la statistique χ² est grande, plus l’écart entre observations et attentes est important. Ensuite, on compare cette valeur à une distribution du khi carré en fonction des degrés de liberté. C’est cette étape qui permet d’estimer la p-value et de conclure si l’écart est statistiquement significatif.
Idée clé : le test du khi 2 ne mesure pas seulement un écart brut. Il pondère l’écart par l’effectif attendu. Un même écart absolu est donc plus sérieux lorsque l’effectif attendu est faible que lorsqu’il est élevé.
À quoi sert exactement la formule du khi 2 ?
Le khi 2 peut être utilisé dans plusieurs contextes, mais deux usages dominent. Le premier est le test d’ajustement, où l’on vérifie si une distribution observée correspond à une distribution théorique. Par exemple, un dé est-il équilibré ? Une loi de répartition en génétique est-elle respectée ? Les préférences clients se répartissent-elles comme prévu ? Le second usage est le test d’indépendance, qui évalue si deux variables qualitatives sont liées dans un tableau de contingence.
Dans cette page, le calculateur est centré sur la version la plus intuitive : le test d’ajustement. Vous entrez les catégories, les fréquences observées et les fréquences attendues, puis l’outil applique automatiquement la formule. Cela permet d’éviter les erreurs de calcul manuel et d’interpréter immédiatement les contributions individuelles, les degrés de liberté et la décision statistique.
La formule du khi carré expliquée simplement
Décomposons la formule χ² = Σ ((O – E)² / E) :
- O est la valeur observée dans une catégorie.
- E est la valeur attendue selon l’hypothèse nulle.
- (O – E) mesure l’écart brut.
- (O – E)² évite que les écarts positifs et négatifs s’annulent.
- ((O – E)² / E) standardise l’écart par la taille attendue.
- Σ signifie qu’on additionne toutes les catégories.
Imaginons quatre catégories avec les valeurs observées 18, 22, 31 et 29, et des valeurs attendues 25, 25, 25 et 25. Les contributions sont respectivement 1,96 ; 0,36 ; 1,44 ; 0,64. La somme vaut 4,40. Cette valeur sera ensuite comparée à une distribution χ² avec un nombre de degrés de liberté adapté. Si les degrés de liberté sont de 3, la valeur critique au seuil de 5 % est de 7,815. Comme 4,40 est inférieur à 7,815, l’écart n’est pas statistiquement significatif au niveau 5 %.
Étapes complètes pour faire un calcul du khi 2
- Définir l’hypothèse nulle H0. Exemple : la distribution observée suit la distribution attendue.
- Établir les effectifs attendus pour chaque catégorie.
- Mesurer les effectifs observés à partir des données réelles.
- Calculer, pour chaque ligne, le terme ((O – E)² / E).
- Faire la somme des contributions afin d’obtenir χ².
- Déterminer les degrés de liberté, souvent k – 1 – m, où k est le nombre de catégories et m le nombre de paramètres estimés.
- Comparer la valeur obtenue à la table du khi carré ou calculer la p-value.
- Conclure : rejet ou non-rejet de l’hypothèse nulle.
Pourquoi les degrés de liberté sont-ils si importants ?
Deux calculs de khi 2 ayant la même valeur brute ne conduisent pas forcément à la même conclusion. Tout dépend du nombre de degrés de liberté. Plus ce nombre augmente, plus la distribution χ² s’étale. Concrètement, une statistique de 6 peut être significative dans un cas et non significative dans un autre. En test d’ajustement simple, la règle la plus fréquente est :
degrés de liberté = nombre de catégories – 1 – nombre de paramètres estimés
Si vous testez une loi parfaitement définie à l’avance, sans estimer de paramètre à partir de l’échantillon, le terme des paramètres estimés vaut zéro. En revanche, si vous estimez certains paramètres avant de calculer les effectifs attendus, il faut les retrancher.
Tableau de comparaison : valeurs critiques réelles du khi carré
Voici quelques valeurs critiques très utilisées dans les cours et les analyses appliquées. Elles servent à comparer votre χ² calculé au seuil alpha choisi.
| Degrés de liberté | Seuil 10 % | Seuil 5 % | Seuil 1 % |
|---|---|---|---|
| 1 | 2,706 | 3,841 | 6,635 |
| 2 | 4,605 | 5,991 | 9,210 |
| 3 | 6,251 | 7,815 | 11,345 |
| 4 | 7,779 | 9,488 | 13,277 |
| 5 | 9,236 | 11,070 | 15,086 |
| 10 | 15,987 | 18,307 | 23,209 |
Ce tableau montre un point essentiel : lorsque les degrés de liberté augmentent, il faut une valeur χ² plus élevée pour atteindre la significativité. Cela explique pourquoi il est indispensable de ne jamais interpréter la statistique seule, sans son contexte.
Exemple concret : test d’un dé équilibré
Supposons que vous lanciez un dé 60 fois. Si le dé est équilibré, chaque face est attendue 10 fois. Imaginons les observations suivantes : 7, 9, 11, 14, 8, 11. Les contributions sont :
- Face 1 : (7 – 10)² / 10 = 0,9
- Face 2 : (9 – 10)² / 10 = 0,1
- Face 3 : (11 – 10)² / 10 = 0,1
- Face 4 : (14 – 10)² / 10 = 1,6
- Face 5 : (8 – 10)² / 10 = 0,4
- Face 6 : (11 – 10)² / 10 = 0,1
La somme vaut χ² = 3,2. Les degrés de liberté sont 6 – 1 = 5. Au seuil de 5 %, la valeur critique est 11,070. Comme 3,2 est bien inférieur à cette valeur, on ne rejette pas l’hypothèse qu’il s’agit d’un dé équilibré. Cela ne prouve pas qu’il est parfait, mais indique que les écarts observés restent compatibles avec le hasard d’échantillonnage.
Exemple en sciences sociales : préférences de réponse
Le test du khi 2 est également omniprésent dans les enquêtes. Si une entreprise s’attend à ce que quatre options de service soient choisies à parts égales, mais observe une distribution très déséquilibrée, le khi carré quantifie cet écart. Ce type d’analyse intervient souvent en étude de satisfaction, segmentation marketing, recherche académique ou audit de comportement utilisateur.
| Contexte | Nombre de catégories | Exemple d’attendus | Usage du χ² |
|---|---|---|---|
| Dé équilibré | 6 | 10 par face sur 60 lancers | Vérifier l’équité |
| Questionnaire marketing | 4 | 25 % par option | Comparer aux objectifs de répartition |
| Génétique mendélienne | 4 | 9:3:3:1 | Tester une loi théorique |
| Contrôle qualité | 3 | Taux de défaut normatifs | Détecter une dérive du procédé |
Comment interpréter la p-value du khi 2 ?
La p-value mesure la probabilité d’obtenir une statistique χ² au moins aussi extrême que celle observée si l’hypothèse nulle est vraie. Une petite p-value signifie donc que le résultat observé est peu compatible avec H0. Si la p-value est inférieure à alpha, on rejette H0. Si elle est supérieure à alpha, on ne rejette pas H0.
Attention cependant à un point méthodologique important : ne pas rejeter H0 ne signifie pas prouver H0. Cela indique simplement que les données ne fournissent pas une preuve suffisante contre elle. La distinction est essentielle dans l’interprétation scientifique.
Quelles sont les conditions de validité du test ?
Le khi 2 est robuste, mais il n’est pas magique. Pour l’utiliser correctement, il faut respecter certaines conditions :
- Les observations doivent être indépendantes.
- Les catégories doivent être mutuellement exclusives.
- Les effectifs attendus doivent généralement être suffisamment grands, souvent au moins 5.
- Les données doivent être des effectifs, pas des pourcentages seuls.
- Les attendus doivent être définis avant l’interprétation finale.
Quand ces conditions ne sont pas remplies, d’autres méthodes peuvent être plus adaptées, comme les tests exacts ou le regroupement de catégories. Cette précaution est particulièrement importante dans les petits échantillons.
Erreurs fréquentes lors d’un calcul du khi 2
- Confondre pourcentage et effectif : la formule utilise des effectifs attendus, pas seulement des parts relatives.
- Oublier les degrés de liberté : une valeur χ² seule ne suffit pas pour conclure.
- Utiliser des attendus nuls : le dénominateur E doit être strictement positif.
- Négliger les paramètres estimés : ils réduisent les degrés de liberté.
- Interpréter un résultat significatif comme un effet énorme : significatif ne veut pas forcément dire important sur le plan pratique.
Calcul manuel versus calculateur en ligne
Le calcul manuel est utile pour comprendre la logique de la statistique. Toutefois, dès que le nombre de catégories augmente, les risques d’erreur s’accroissent : erreur de saisie, somme inexacte, mauvaise détermination des degrés de liberté, oubli d’une contribution ou mauvaise lecture d’une table. Un calculateur en ligne fiable apporte plusieurs avantages :
- automatisation de la formule du khi 2 ;
- affichage des contributions catégorie par catégorie ;
- calcul de la p-value ;
- comparaison à la valeur critique ;
- visualisation graphique des écarts dominants.
Dans un contexte professionnel, ces éléments améliorent la traçabilité des analyses et facilitent la communication des résultats auprès d’un manager, d’une équipe qualité, d’un comité scientifique ou d’un client.
Que faire si le test est significatif ?
Si votre calcul du khi 2 est significatif, la prochaine étape consiste à comprendre où se situent les écarts. La statistique globale dit qu’il existe une différence, mais elle ne précise pas immédiatement quelles catégories la portent. C’est pourquoi l’analyse des contributions individuelles est si utile. Une ou deux catégories peuvent à elles seules expliquer l’essentiel du χ² total.
En pratique, on peut alors :
- examiner les résidus ou contributions individuelles ;
- vérifier la qualité des données collectées ;
- revoir l’hypothèse théorique initiale ;
- compléter l’analyse par des indicateurs d’effet selon le contexte.
Références fiables pour approfondir
Pour compléter votre compréhension du test du khi carré, vous pouvez consulter des ressources de grande autorité :
- NIST.gov : guide de référence sur le chi square et les tests statistiques
- Penn State University : cours de statistique sur les tests du chi square
- UCLA.edu : présentation pédagogique du test du chi square
Conclusion
Le calcul du khi 2 formule est une compétence essentielle dès qu’il faut comparer des effectifs observés à des effectifs attendus. La formule χ² = Σ ((O – E)² / E) est simple dans son principe, mais sa bonne interprétation exige une attention réelle aux degrés de liberté, au niveau alpha, aux conditions de validité et à la p-value. Bien maîtrisé, le khi carré devient un outil extrêmement puissant pour décider si un écart apparent relève d’un simple bruit aléatoire ou d’un signal statistiquement crédible.
Avec le calculateur ci-dessus, vous pouvez réaliser ce travail en quelques secondes, tout en conservant une lecture experte de la décomposition du résultat. C’est exactement ce qu’on attend d’un outil moderne : rapidité, fiabilité, visualisation claire et interprétation rigoureuse.