Calculateur statistique premium

Calcul de khi deux

Utilisez ce calculateur interactif pour réaliser un test du khi deux d’adéquation ou un test du khi deux d’indépendance 2×2. Entrez vos données observées, choisissez le niveau de signification, puis obtenez la statistique, les degrés de liberté, la p-valeur et une visualisation claire.

Saisir les données

Type de test

Niveau de signification

Effectifs observés

Séparez les catégories par des virgules. Les valeurs doivent être positives.

Effectifs attendus

Le nombre de valeurs attendues doit correspondre au nombre de valeurs observées.

Cellule A1

Cellule A2

Cellule B1

Cellule B2

Pour un tableau 2×2, les effectifs attendus seront calculés automatiquement à partir des totaux de lignes et de colonnes.

Résultats

Entrez vos données puis cliquez sur Calculer le khi deux pour afficher l’analyse.

Guide expert du calcul de khi deux

Le calcul de khi deux, souvent noté χ², est l’un des outils les plus utilisés en statistique inférentielle lorsque l’on travaille avec des données catégorielles. Il sert à comparer des effectifs observés à des effectifs attendus et à déterminer si les écarts constatés peuvent être expliqués par le hasard ou s’ils suggèrent un phénomène statistiquement significatif. Dans la pratique, ce test intervient dans des domaines très variés : études marketing, contrôle qualité, sciences sociales, médecine, épidémiologie, biostatistique, recherche universitaire ou encore analyse de sondages.

Il existe deux grands cas d’usage. Le premier est le test du khi deux d’adéquation, qui vérifie si une distribution observée correspond à une distribution théorique. Par exemple, on peut tester si les ventes d’un produit sont uniformément réparties entre quatre régions, ou si les résultats observés d’un dé suivent la répartition attendue. Le second est le test du khi deux d’indépendance, qui étudie si deux variables qualitatives sont liées. Par exemple, on peut vérifier s’il existe une association entre le genre et la préférence de marque, ou entre le statut tabagique et la présence d’une maladie.

Formule du test du khi deux

Dans sa forme la plus classique, la statistique de test s’écrit :

χ² = Σ ((O – E)² / E)

où O représente l’effectif observé dans chaque catégorie et E l’effectif attendu. On additionne cette quantité pour toutes les catégories du tableau. Plus la valeur de χ² est élevée, plus l’écart entre observation et théorie est important. Une valeur faible indique que les différences sont compatibles avec les fluctuations aléatoires.

Interprétation générale

L’interprétation repose ensuite sur trois éléments :

la statistique χ² calculée,
les degrés de liberté,
la p-valeur.

Si la p-valeur est inférieure au niveau de signification choisi, souvent 0,05, on rejette l’hypothèse nulle. Dans un test d’adéquation, l’hypothèse nulle affirme que la distribution observée suit la distribution attendue. Dans un test d’indépendance, elle affirme que les variables sont indépendantes.

Comment faire un calcul de khi deux d’adéquation

Définir les catégories et relever les effectifs observés.
Déterminer les effectifs attendus selon l’hypothèse nulle.
Calculer, pour chaque catégorie, le terme (O – E)² / E.
Faire la somme de tous les termes afin d’obtenir χ².
Calculer les degrés de liberté, souvent k – 1 pour k catégories.
Comparer la statistique à la loi du khi deux ou utiliser la p-valeur.

Supposons un exemple simple avec quatre catégories. Si les effectifs observés sont 25, 30, 20 et 25 et que les effectifs attendus sont 25, 25, 25 et 25, alors la statistique vaut :

catégorie 1 : (25 – 25)² / 25 = 0
catégorie 2 : (30 – 25)² / 25 = 1
catégorie 3 : (20 – 25)² / 25 = 1
catégorie 4 : (25 – 25)² / 25 = 0

On obtient donc χ² = 2. Avec 3 degrés de liberté, cette valeur n’est généralement pas suffisante pour conclure à une différence significative au seuil de 5 %.

Comment faire un calcul de khi deux d’indépendance

Dans un tableau de contingence, les effectifs attendus ne sont pas saisis directement. Ils sont calculés à partir des marges :

E = (total ligne × total colonne) / total général

Prenons un tableau 2×2 fictif mais réaliste sur 100 personnes :

Statut	Maladie présente	Maladie absente	Total ligne
Fumeurs	30	20	50
Non fumeurs	15	35	50
Total colonne	45	55	100

Les effectifs attendus sont alors :

Fumeurs et maladie présente : 50 × 45 / 100 = 22,5
Fumeurs et maladie absente : 50 × 55 / 100 = 27,5
Non fumeurs et maladie présente : 50 × 45 / 100 = 22,5
Non fumeurs et maladie absente : 50 × 55 / 100 = 27,5

En appliquant la formule du χ² à chaque cellule, on obtient une statistique d’environ 9,09. Avec 1 degré de liberté, la p-valeur est inférieure à 0,01, ce qui suggère une association significative entre le statut tabagique et la maladie dans cet exemple.

Degrés de liberté et seuils critiques

Les degrés de liberté dépendent de la structure du tableau :

adéquation avec k catégories : ddl = k – 1
indépendance dans un tableau r × c : ddl = (r – 1) × (c – 1)

Le tableau ci dessous présente des valeurs critiques usuelles de la loi du khi deux. Ces statistiques sont très utilisées en recherche et en contrôle de qualité.

Degrés de liberté	Seuil 10 %	Seuil 5 %	Seuil 1 %
1	2,706	3,841	6,635
2	4,605	5,991	9,210
3	6,251	7,815	11,345
4	7,779	9,488	13,277
5	9,236	11,070	15,086

Ces valeurs critiques permettent une lecture rapide. Si votre statistique calculée dépasse la valeur critique au seuil choisi, vous rejetez l’hypothèse nulle. Aujourd’hui, la plupart des analystes préfèrent cependant la p-valeur car elle donne une mesure plus précise du niveau de preuve contre l’hypothèse nulle.

Conditions d’application du test

Un calcul de khi deux fiable suppose plusieurs conditions :

les observations doivent être indépendantes,
les catégories doivent être mutuellement exclusives,
les effectifs attendus ne doivent pas être trop faibles.

La règle empirique souvent citée est qu’aucun effectif attendu ne doit être inférieur à 1 et qu’au moins 80 % des effectifs attendus doivent être supérieurs ou égaux à 5. Si ce n’est pas le cas, il peut être nécessaire de regrouper des catégories ou d’utiliser un test exact, comme le test exact de Fisher dans un tableau 2×2.

Pourquoi les effectifs attendus sont essentiels

Le cœur du calcul de khi deux réside dans la comparaison entre ce qui est vu dans l’échantillon et ce qui serait attendu si l’hypothèse nulle était vraie. Sans effectifs attendus cohérents, la statistique perd son sens. Dans un test d’adéquation, les effectifs attendus découlent d’un modèle théorique. Dans un test d’indépendance, ils sont déduits des marges du tableau. Dans les deux cas, l’idée est la même : mesurer l’écart relatif entre réalité observée et structure attendue.

Différence entre significativité statistique et importance pratique

Un résultat significatif n’implique pas automatiquement un effet important sur le plan pratique. Avec de très grands échantillons, de faibles écarts peuvent devenir statistiquement significatifs. A l’inverse, un petit échantillon peut masquer un effet réel faute de puissance statistique. Pour cette raison, il est souvent recommandé de compléter le calcul de khi deux par une mesure de taille d’effet, comme le coefficient phi pour un tableau 2×2 ou le V de Cramer pour les tableaux plus grands.

Exemple de lecture comparative

Situation	χ²	ddl	p-valeur approximative	Conclusion au seuil de 5 %
Adéquation sur 4 catégories équilibrées	2,00	3	0,57	Non significatif
Indépendance 2×2 tabagisme et maladie	9,09	1	0,0026	Significatif
Adéquation avec écart modéré sur 5 classes	11,50	4	0,021	Significatif

Erreurs fréquentes lors d’un calcul de khi deux

Confondre variables qualitatives et quantitatives. Le test du khi deux s’applique à des fréquences par catégories.
Utiliser des pourcentages bruts à la place d’effectifs sans reconstituer les nombres attendus.
Ignorer les faibles effectifs attendus.
Interpréter un résultat non significatif comme preuve d’absence totale d’effet.
Oublier de vérifier la cohérence des totaux de lignes et de colonnes dans les tableaux de contingence.

Quand utiliser une correction ou un autre test

Dans les tableaux 2×2 avec des effectifs modestes, certains praticiens utilisent la correction de continuité de Yates. Cette correction tend à rendre le test plus conservateur. Toutefois, dans de nombreux contextes modernes, on préfère plutôt signaler les effectifs attendus faibles et, si nécessaire, passer à un test exact. Le choix doit dépendre du contexte, de la taille de l’échantillon et des recommandations méthodologiques de votre domaine.

Sources de référence et approfondissement

Pour approfondir la théorie et la pratique du calcul de khi deux, consultez les ressources de référence suivantes :

En résumé

Le calcul de khi deux est un outil central pour analyser des données catégorielles. Il permet de tester une adéquation à une distribution théorique ou l’indépendance entre deux variables qualitatives. Pour bien l’utiliser, il faut préparer correctement les effectifs, vérifier les hypothèses, calculer la statistique et interpréter la p-valeur avec discernement. Le calculateur ci dessus vous aide à obtenir immédiatement ces éléments, mais la qualité de la conclusion dépend toujours de la qualité des données et du cadre d’analyse.

Calcul De Khi Deux