Calcul du ki 2, test du chi carré
Utilisez ce calculateur interactif pour estimer la statistique du ki 2, aussi appelée chi carré, comparer les fréquences observées et attendues, obtenir les degrés de liberté, la valeur critique, la p-value et une visualisation graphique claire.
| Catégorie | Libellé | Effectif observé | Effectif attendu | Contribution au ki 2 |
|---|
Résultats du calcul
Guide expert du calcul du ki 2
Le calcul du ki 2, souvent écrit chi carré, est une méthode statistique incontournable pour comparer des fréquences observées à des fréquences attendues. En français, on parle souvent de test du ki 2 pour désigner le test du chi carré d’ajustement ou le test d’indépendance. Dans les deux cas, l’idée fondamentale reste la même : mesurer si les écarts entre ce que l’on observe dans un échantillon et ce que l’on attend théoriquement sont plausibles, ou au contraire trop importants pour être attribués au hasard. Cette page se concentre sur le calcul direct du ki 2 à partir d’effectifs observés et attendus, ce qui correspond à la forme la plus pédagogique du test.
Le principe de base est simple. Pour chaque catégorie, on calcule la quantité suivante : effectif observé moins effectif attendu, le tout au carré, puis divisé par l’effectif attendu. On additionne ensuite ces contributions pour obtenir la statistique totale du ki 2. Plus cette statistique est élevée, plus la différence globale entre observation et théorie est forte. Une fois cette valeur obtenue, on la compare à une distribution de référence, la loi du chi carré, en tenant compte des degrés de liberté. C’est cette comparaison qui permet de conclure si l’hypothèse nulle doit être rejetée ou non.
Formule du calcul du ki 2 : χ² = Σ ((O – E)² / E), où O désigne l’effectif observé et E l’effectif attendu.
Pourquoi le calcul du ki 2 est-il si utilisé ?
Le test du ki 2 est apprécié pour trois raisons majeures. Premièrement, il s’applique à des données catégorielles, très fréquentes en sciences sociales, marketing, santé publique, biologie et contrôle qualité. Deuxièmement, il est relativement simple à calculer, même à la main pour de petits tableaux. Troisièmement, son interprétation repose sur un cadre théorique bien établi, documenté par des institutions reconnues comme le NIST.gov, la Penn State University et UCLA.
Dans la pratique, on l’utilise notamment pour vérifier si une répartition observée suit une distribution théorique, par exemple des préférences de consommateurs réparties entre plusieurs marques, des résultats de tirage, des groupes sanguins, ou encore des réponses à un questionnaire. Le calcul du ki 2 permet alors de répondre à une question clé : les écarts observés sont-ils statistiquement compatibles avec l’hypothèse de départ ?
Comment fonctionne le calcul étape par étape
- Définir les catégories à analyser.
- Saisir les effectifs observés dans chaque catégorie.
- Déterminer les effectifs attendus selon l’hypothèse nulle.
- Calculer pour chaque catégorie la contribution ((O – E)² / E).
- Faire la somme de toutes les contributions pour obtenir χ².
- Calculer les degrés de liberté, souvent k – 1 pour un test d’ajustement, où k est le nombre de catégories.
- Comparer la statistique obtenue à une valeur critique ou utiliser la p-value pour prendre une décision.
Supposons un exemple très simple avec trois catégories. Une entreprise attend théoriquement une répartition des ventes de 50, 30 et 20 unités. Elle observe finalement 60, 22 et 18. Le calcul du ki 2 se fait catégorie par catégorie. Pour la première catégorie : (60 – 50)² / 50 = 2. Pour la deuxième : (22 – 30)² / 30 = 2,1333. Pour la troisième : (18 – 20)² / 20 = 0,2. La somme donne χ² = 4,3333. Si les degrés de liberté valent 2, on compare alors cette valeur à la loi du chi carré pour conclure.
Tableau comparatif des valeurs critiques du chi carré
Le tableau ci-dessous présente des valeurs critiques couramment utilisées. Ces valeurs sont standard en statistique inférentielle et se retrouvent dans de nombreuses tables académiques. Elles aident à savoir si la statistique calculée est suffisamment élevée pour rejeter l’hypothèse nulle.
| Degrés de liberté | Valeur critique à 10 % | Valeur critique à 5 % | Valeur critique à 1 % |
|---|---|---|---|
| 1 | 2,706 | 3,841 | 6,635 |
| 2 | 4,605 | 5,991 | 9,210 |
| 3 | 6,251 | 7,815 | 11,345 |
| 4 | 7,779 | 9,488 | 13,277 |
| 5 | 9,236 | 11,070 | 15,086 |
| 6 | 10,645 | 12,592 | 16,812 |
Lecture de la p-value et prise de décision
Deux approches sont possibles. La première consiste à comparer la statistique à la valeur critique. Si χ² calculé est supérieur à la valeur critique au seuil choisi, on rejette l’hypothèse nulle. La deuxième repose sur la p-value. Si la p-value est inférieure à alpha, par exemple 0,05, on conclut également à un rejet de l’hypothèse nulle. Dans le calculateur ci-dessus, les deux informations sont affichées afin de faciliter la lecture.
- Si p-value < 0,05 : les écarts observés sont peu compatibles avec l’hypothèse nulle.
- Si p-value ≥ 0,05 : les écarts observés peuvent s’expliquer par le hasard d’échantillonnage.
- Si χ² > valeur critique : rejet de l’hypothèse nulle au seuil choisi.
- Si χ² ≤ valeur critique : absence de preuve suffisante pour rejeter l’hypothèse nulle.
Exemple détaillé avec contributions par catégorie
Le tableau suivant illustre un exemple pédagogique complet, avec des données réalistes de répartition de réponses à un sondage en trois options. On y voit comment chaque catégorie contribue à la statistique totale. Ce type de décomposition est utile pour repérer les catégories qui expliquent le plus l’écart global.
| Catégorie | Observé | Attendu | Écart | Contribution χ² |
|---|---|---|---|---|
| Option A | 60 | 50 | +10 | 2,000 |
| Option B | 22 | 30 | -8 | 2,133 |
| Option C | 18 | 20 | -2 | 0,200 |
| Total | 100 | 100 | 0 | 4,333 |
Différence entre test d’ajustement et test d’indépendance
Quand on parle de calcul du ki 2, il est utile de distinguer deux usages courants. Le premier est le test d’ajustement, qui vérifie si une distribution observée suit une distribution théorique. C’est exactement ce que fait le calculateur de cette page. Le second est le test d’indépendance, utilisé dans un tableau croisé à deux variables, par exemple sexe et préférence d’achat. Dans ce second cas, les effectifs attendus ne sont pas fournis directement : ils sont calculés à partir des marges du tableau.
Le cadre mathématique reste très proche. Dans les deux cas, on somme les contributions ((O – E)² / E). En revanche, la manière d’obtenir les effectifs attendus change. Pour un test d’ajustement, vous les définissez selon votre hypothèse. Pour un test d’indépendance, ils proviennent de la formule : total ligne multiplié par total colonne, puis divisé par le total général.
Conditions de validité du test du ki 2
Un bon calcul du ki 2 ne suffit pas si les conditions d’utilisation ne sont pas respectées. Plusieurs points doivent être vérifiés :
- Les observations doivent être indépendantes.
- Les catégories doivent être mutuellement exclusives.
- Les effectifs attendus ne doivent pas être trop faibles.
- L’échantillon doit être défini de manière cohérente avec la question étudiée.
La règle pratique souvent citée est qu’un effectif attendu de 5 ou plus par case est souhaitable. Il existe des nuances selon le contexte et le type précis de test, mais ce repère reste utile pour une première vérification. Si plusieurs catégories ont des effectifs attendus très faibles, il peut être préférable de regrouper des classes ou d’utiliser un test exact plus approprié.
Erreurs fréquentes à éviter
- Confondre pourcentages et effectifs. Le calcul du ki 2 utilise des effectifs, pas seulement des proportions.
- Oublier les degrés de liberté. Une même statistique χ² ne s’interprète pas de la même façon selon le nombre de catégories.
- Utiliser des attentes mal définies. Les effectifs attendus doivent être justifiés par une hypothèse claire.
- Conclure trop vite à une causalité. Le test du chi carré montre une incompatibilité statistique avec une hypothèse, pas une relation causale à lui seul.
- Négliger la taille de l’échantillon. Avec un très grand échantillon, de petits écarts peuvent devenir significatifs.
Comment interpréter un résultat dans un contexte réel
Imaginons une enseigne qui pense que ses trois gammes de produits représentent respectivement 50 %, 30 % et 20 % des ventes. Après collecte de 100 ventes, elle observe 60, 22 et 18. Le ki 2 permet de savoir si cette structure théorique reste crédible. Si la p-value est supérieure à 0,05, l’entreprise peut considérer que les écarts observés ne suffisent pas à remettre en cause son modèle de répartition. Si la p-value est inférieure à 0,05, elle devra probablement revoir son hypothèse de marché, ses stocks ou sa segmentation.
Dans un cadre académique, on formulerait l’hypothèse nulle ainsi : les effectifs observés suivent la distribution théorique annoncée. L’hypothèse alternative serait : les effectifs observés ne suivent pas cette distribution. Le calcul du ki 2 ne dit pas quelle catégorie est “bonne” ou “mauvaise”, mais il quantifie l’écart global entre théorie et réalité. Le détail des contributions permet ensuite d’identifier les catégories les plus déterminantes.
Pourquoi utiliser un calculateur interactif
Un calculateur interactif de ki 2 permet de gagner du temps, d’éviter les erreurs de saisie et d’obtenir immédiatement une représentation visuelle. Le graphique de cette page compare les effectifs observés et attendus, ce qui aide à comprendre intuitivement les écarts. Cette visualisation est particulièrement utile dans un cadre pédagogique, en réunion d’analyse ou pour préparer un rapport. En plus du calcul de la statistique, l’outil affiche la p-value, la valeur critique et une interprétation textuelle automatique.
Pour un usage professionnel, l’idéal est de conserver une démarche rigoureuse : expliciter l’hypothèse nulle, vérifier les conditions, reporter la statistique χ², les degrés de liberté, la p-value et la conclusion. Par exemple : “Test du chi carré d’ajustement : χ²(2) = 4,33, p = 0,115. L’hypothèse nulle n’est pas rejetée au seuil de 5 %.” Cette forme de restitution est claire, standardisée et reconnue dans la plupart des disciplines.
Résumé opérationnel
Le calcul du ki 2 consiste donc à comparer une distribution observée à une distribution attendue en mesurant l’écart pondéré entre les deux. Plus les contributions individuelles sont importantes, plus la statistique finale augmente. L’interprétation dépend ensuite des degrés de liberté et du seuil de signification choisi. Cet outil vous permet d’effectuer ce calcul rapidement, tout en gardant une lecture statistique sérieuse et exploitable.