Calcul de khi deux au carrée observation moins effectifs théoriques
Calculez rapidement la statistique du khi-deux à partir des effectifs observés et des effectifs théoriques avec détail des contributions par catégorie, degré de liberté et interprétation immédiate.
| Catégorie | Observé (O) | Théorique (E) | Contribution (O-E)²/E |
|---|
Conseil: pour un test de qualité, les effectifs théoriques doivent généralement être suffisants dans chaque case. En pratique, une valeur attendue d’au moins 5 est souvent recommandée.
Guide expert du calcul de khi deux au carrée observation moins effectifs théoriques
Le calcul de khi deux au carrée observation moins effectifs théoriques correspond à l’une des méthodes les plus utilisées en statistique appliquée lorsqu’on souhaite comparer des données observées à des données attendues. Cette statistique, notée χ², sert notamment à vérifier si la distribution réelle d’un échantillon est compatible avec une hypothèse théorique. On l’emploie dans l’enseignement, la recherche, le contrôle qualité, l’épidémiologie, le marketing, les sciences sociales et l’analyse de données catégorielles.
La formule centrale est simple :
χ² = Σ (O – E)² / E
où O représente l’effectif observé et E l’effectif théorique attendu pour chaque catégorie.
Le principe est intuitif. Si les observations sont très proches des effectifs théoriques, la valeur de χ² reste faible. En revanche, si les écarts sont importants, chaque terme (O – E)² / E augmente et la somme totale devient plus grande. Cette valeur est ensuite comparée à une loi du khi-deux avec un certain nombre de degrés de liberté, afin d’évaluer si l’écart constaté peut raisonnablement être attribué au hasard.
À quoi sert exactement ce calcul ?
Le test du khi-deux intervient principalement dans deux situations :
- Le test d’ajustement : on compare une distribution observée à une distribution théorique attendue.
- Le test d’indépendance : on vérifie si deux variables qualitatives sont liées dans un tableau de contingence.
La calculatrice ci-dessus est centrée sur la version la plus pédagogique, à savoir le calcul à partir d’observations et d’effectifs théoriques. C’est le cas typique d’un exercice où l’on dispose de plusieurs catégories et où l’on doit appliquer la somme des quotients (observé moins théorique) au carré divisé par théorique.
Comprendre la logique de la formule χ²
Chaque catégorie apporte une contribution au résultat final. Supposons qu’une catégorie ait un effectif observé de 30 et un effectif théorique de 25. L’écart vaut 5. Si l’on applique la formule, la contribution est :
(30 – 25)² / 25 = 25 / 25 = 1
Le fait de mettre l’écart au carré a deux avantages majeurs :
- Les écarts positifs et négatifs ne se compensent pas.
- Les écarts plus grands sont davantage pénalisés.
La division par l’effectif théorique est tout aussi importante. Elle permet de relativiser la taille de l’écart. Une différence de 5 unités n’a pas la même signification si l’effectif attendu est de 10 ou de 500. Le rapport rend donc la mesure comparable entre catégories.
Étapes du calcul de khi deux
- Définir les catégories étudiées.
- Relever les effectifs observés dans chaque catégorie.
- Déterminer les effectifs théoriques selon l’hypothèse nulle.
- Calculer, pour chaque catégorie, le terme (O – E)² / E.
- Faire la somme de toutes les contributions.
- Déterminer les degrés de liberté.
- Comparer la statistique obtenue à une valeur critique ou calculer une p-valeur.
Exemple concret 1 : dé équilibré
Imaginons 120 lancers d’un dé. Si le dé est équilibré, chaque face doit apparaître en moyenne 20 fois. Voici un exemple d’observations :
| Face | Observé (O) | Théorique (E) | (O-E)²/E |
|---|---|---|---|
| 1 | 18 | 20 | 0,20 |
| 2 | 23 | 20 | 0,45 |
| 3 | 16 | 20 | 0,80 |
| 4 | 21 | 20 | 0,05 |
| 5 | 19 | 20 | 0,05 |
| 6 | 23 | 20 | 0,45 |
La somme des contributions vaut 2,00. Avec 6 catégories, les degrés de liberté pour un test d’ajustement sont k – 1 = 5. À un seuil de 5 %, la valeur critique est environ 11,07. Comme 2,00 est bien inférieur à 11,07, on ne rejette pas l’hypothèse d’un dé équilibré.
Exemple concret 2 : données génétiques de Mendel
Un des exemples historiques les plus célèbres du khi-deux concerne les travaux de Gregor Mendel. Dans une expérience sur la couleur des graines, un modèle théorique peut prédire une répartition de 3:1. Sur 556 graines, on peut observer par exemple :
| Catégorie | Observé (O) | Théorique (E) | (O-E)²/E |
|---|---|---|---|
| Jaunes | 423 | 417,0 | 0,09 |
| Vertes | 133 | 139,0 | 0,26 |
La statistique χ² vaut ici environ 0,35, ce qui est très faible. Cela signifie que l’écart entre les observations et le modèle 3:1 est petit relativement à ce que l’on attendrait sous l’hypothèse théorique. Dans ce type d’analyse, le test du khi-deux est précieux pour juger si les différences observées sont compatibles avec les fluctuations d’échantillonnage.
Comment interpréter le résultat obtenu
La valeur brute de χ² ne suffit pas à elle seule. Il faut la relier à :
- au nombre de catégories,
- aux degrés de liberté,
- au seuil alpha choisi, souvent 0,05.
Pour un test d’ajustement simple, les degrés de liberté valent généralement :
ddl = nombre de catégories – 1
Une fois la valeur calculée, deux approches sont possibles :
- Comparer χ² à une valeur critique tirée d’une table du khi-deux.
- Calculer une p-valeur et la comparer à alpha.
Si χ² est supérieur à la valeur critique, ou si la p-valeur est inférieure à alpha, on rejette l’hypothèse nulle. Sinon, on considère que les écarts observés restent plausibles sous le modèle théorique.
Quelques valeurs critiques utiles à 5 %
| Degrés de liberté | Valeur critique à 5 % | Valeur critique à 1 % |
|---|---|---|
| 1 | 3,84 | 6,63 |
| 2 | 5,99 | 9,21 |
| 3 | 7,81 | 11,34 |
| 4 | 9,49 | 13,28 |
| 5 | 11,07 | 15,09 |
| 6 | 12,59 | 16,81 |
| 7 | 14,07 | 18,48 |
Conditions d’utilisation du test du khi-deux
Le test du khi-deux est puissant, mais il demande quelques précautions. Pour obtenir une interprétation fiable, il faut respecter plusieurs conditions :
- Les observations doivent être indépendantes.
- Les catégories doivent être mutuellement exclusives.
- Les effectifs théoriques ne doivent pas être trop faibles.
- Les données doivent être des effectifs, pas des pourcentages bruts sans base d’échantillon.
Une règle pratique souvent citée est que chaque effectif théorique doit être au moins égal à 5. Il existe des nuances selon le contexte et la taille d’échantillon, mais cette recommandation reste très courante en apprentissage statistique et en pratique générale.
Erreurs fréquentes à éviter
- Utiliser des proportions au lieu d’effectifs réels.
- Oublier de vérifier que la somme des effectifs théoriques correspond bien à la somme observée.
- Confondre test d’ajustement et test d’indépendance.
- Interpréter un résultat non significatif comme une preuve absolue que le modèle est vrai.
- Négliger les catégories avec effectifs attendus très faibles.
Pourquoi ce calcul reste central en analyse statistique
Le succès du khi-deux tient à sa simplicité et à sa polyvalence. Il permet de synthétiser en une seule statistique l’ensemble des écarts entre une réalité observée et un modèle attendu. Dans de nombreuses disciplines, on travaille avec des variables qualitatives : sexe, modalité de réponse, couleur, classe, catégorie clinique, groupe d’âge, type de comportement d’achat, issue d’un test, etc. Le khi-deux répond précisément à ce besoin d’évaluer si une répartition est compatible avec une hypothèse.
En santé publique, par exemple, on compare des répartitions observées à des modèles attendus pour détecter des anomalies. En génétique, on examine la conformité à des ratios mendéliens. En industrie, on vérifie si une production suit une distribution cible. En recherche utilisateur ou marketing, on compare la fréquence réelle de réponses à un scénario prévu. Le test se retrouve donc dans des contextes très variés, ce qui en fait un outil fondamental de la statistique inférentielle.
Utiliser efficacement la calculatrice ci-dessus
Pour exploiter l’outil :
- Sélectionnez le nombre de catégories.
- Saisissez les effectifs observés et théoriques pour chaque ligne.
- Cliquez sur Calculer le khi-deux.
- Consultez la statistique totale, les degrés de liberté, la valeur critique approximative et la décision.
- Analysez le graphique pour voir quelles catégories contribuent le plus à l’écart global.
Le graphique est particulièrement utile. Une valeur de χ² élevée n’indique pas immédiatement quelle catégorie pose problème. En affichant les observations et les attentes côte à côte, on repère rapidement les écarts dominants. C’est un excellent complément visuel au résultat numérique.
Sources fiables pour approfondir
Pour aller plus loin sur le test du khi-deux, vous pouvez consulter ces ressources de référence :
- NIST Engineering Statistics Handbook
- Penn State University – Chi-Square Procedures
- University of California, Berkeley – Chi-Square
Conclusion
Le calcul de khi deux au carrée observation moins effectifs théoriques est une méthode incontournable pour mesurer objectivement l’écart entre une distribution constatée et une distribution attendue. Sa formule, Σ (O – E)² / E, permet d’agréger des différences catégorie par catégorie tout en tenant compte de la taille attendue de chacune. Bien utilisé, ce test donne un cadre rigoureux pour décider si des écarts sont simplement dus au hasard ou s’ils sont suffisamment marqués pour remettre en cause l’hypothèse initiale.
Que vous prépariez un exercice de statistiques, un rapport d’étude, une analyse académique ou un audit de données catégorielles, comprendre ce mécanisme vous aidera à interpréter correctement vos résultats. La calculatrice présente sur cette page vous fait gagner du temps, réduit les erreurs de calcul et fournit une lecture plus visuelle des écarts entre observations et effectifs théoriques.