Calcul du F de Hartley
Utilisez ce calculateur premium pour estimer le Fmax de Hartley, comparer des variances de groupes et visualiser immédiatement l’écart de dispersion. Cet outil est utile en statistique appliquée lorsque vous souhaitez vérifier l’homogénéité des variances avant une ANOVA classique.
Calculateur interactif
Visualisation des variances
Le graphique compare chaque variance de groupe. Plus le ratio entre la plus grande et la plus petite variance est élevé, plus l’hypothèse d’homogénéité est fragile.
Guide expert du calcul du F de Hartley
Le calcul du F de Hartley, souvent appelé Fmax de Hartley, est une méthode classique destinée à évaluer si plusieurs groupes présentent des variances comparables. En statistique inférentielle, cette question est essentielle, car de nombreux tests paramétriques, notamment l’analyse de variance à un facteur, reposent sur l’idée que les dispersions des groupes sont suffisamment proches. Lorsque cette hypothèse n’est pas raisonnable, l’interprétation des résultats peut devenir moins fiable.
Le principe du test est simple : on prend la plus grande variance observée parmi les groupes et on la divise par la plus petite variance observée. Le ratio obtenu mesure directement le niveau d’inégalité des dispersions. Plus ce ratio est proche de 1, plus les variances sont homogènes. Plus il est élevé, plus le doute grandit quant au respect de l’hypothèse d’égalité.
Définition et formule du F de Hartley
La formule est particulièrement accessible :
Fmax = variance la plus élevée / variance la plus faible
Si vous disposez de 4 groupes dont les variances sont 9,7 ; 10,8 ; 12,4 ; et 15,1, alors :
Fmax = 15,1 / 9,7 = 1,56 environ.
Une valeur de 1,56 indique une dispersion maximale d’environ 56 % au-dessus de la plus faible dispersion. Cela ne signifie pas automatiquement que l’hypothèse d’homogénéité est violée. L’interprétation dépend aussi du nombre de groupes, de la taille d’échantillon de chaque groupe et du niveau de signification choisi.
À quoi sert concrètement ce calcul ?
- Vérifier l’hypothèse d’homoscédasticité avant une ANOVA.
- Repérer des groupes nettement plus dispersés que d’autres.
- Détecter rapidement des problèmes de stabilité de mesure dans un protocole expérimental.
- Fournir un contrôle préliminaire avant de choisir un test plus robuste comme Levene ou Brown-Forsythe.
Dans la pratique, le F de Hartley est surtout pertinent lorsque les tailles d’échantillon sont égales entre les groupes et que la normalité des données est raisonnable. C’est un point fondamental. Si ces conditions sont mal respectées, le test devient sensible et peut conduire à une conclusion trompeuse.
Conditions de validité
- Indépendance des observations : les données de chaque groupe doivent être indépendantes.
- Normalité approximative : le test de Hartley fonctionne mieux avec des distributions proches de la normale.
- Tailles de groupe égales : c’est l’hypothèse classique du Fmax.
- Variances issues d’un calcul cohérent : assurez-vous que toutes les variances ont été calculées avec la même convention.
Si vos groupes n’ont pas la même taille, l’usage du F de Hartley devient moins recommandé. Dans ce cas, il vaut souvent mieux se tourner vers le test de Levene, plus robuste, ou vers des procédures d’ANOVA adaptées à l’hétéroscédasticité.
Comment interpréter le résultat
Un Fmax très proche de 1 est rassurant. À l’inverse, un Fmax élevé suggère une forte hétérogénéité. Mais l’idée importante est qu’il n’existe pas un seuil universel unique du type “au-dessus de 2 c’est mauvais”. Le seuil dépend du nombre de groupes, du degré de liberté dans chaque groupe et du niveau alpha. C’est pour cela que le calculateur ci-dessus ne se contente pas d’afficher le ratio : il estime aussi, par simulation, un seuil critique et une p-valeur approximative.
Cette approche de simulation est très utile dans un environnement web. Elle reproduit un grand nombre de scénarios dans lesquels les groupes auraient réellement la même variance, puis compare votre F observé à cette distribution de référence. Si votre F observé dépasse fréquemment les valeurs simulées, l’hypothèse d’égalité des variances devient peu crédible.
Exemple pas à pas
Supposons 5 groupes, chacun de taille 12. Leurs variances sont les suivantes :
- Groupe 1 : 8,4
- Groupe 2 : 9,1
- Groupe 3 : 7,8
- Groupe 4 : 12,6
- Groupe 5 : 10,2
Le calcul suit trois étapes très simples :
- Identifier la variance maximale : 12,6.
- Identifier la variance minimale : 7,8.
- Calculer le ratio : 12,6 / 7,8 = 1,62.
Le Fmax vaut donc 1,62. En soi, cette valeur n’est pas extrême. Si la taille d’échantillon est suffisante et les groupes équilibrés, elle sera souvent compatible avec une hypothèse de variances homogènes. En revanche, si vous obtenez un Fmax de 4, 5 ou davantage, il faut examiner la situation avec beaucoup plus d’attention.
| Jeu de variances | Variance min | Variance max | Fmax calculé | Lecture pratique |
|---|---|---|---|---|
| 9,7 ; 10,8 ; 12,4 ; 15,1 | 9,7 | 15,1 | 1,56 | Écart modéré, souvent compatible avec l’homogénéité |
| 4,2 ; 4,9 ; 5,1 ; 4,6 | 4,2 | 5,1 | 1,21 | Variances très proches |
| 3,8 ; 7,5 ; 11,4 ; 18,6 | 3,8 | 18,6 | 4,89 | Hétérogénéité forte, prudence avant ANOVA classique |
| 6,1 ; 6,0 ; 5,7 ; 6,4 ; 6,2 | 5,7 | 6,4 | 1,12 | Dispersion très homogène |
Pourquoi le F de Hartley reste utile
Malgré l’existence de méthodes plus modernes, Hartley conserve un intérêt pédagogique et opérationnel. Son grand avantage est sa lisibilité. En un seul nombre, vous visualisez immédiatement l’ampleur de l’écart entre la dispersion la plus élevée et la plus faible. Dans les environnements industriels, éducatifs ou expérimentaux, ce ratio peut servir de premier filtre avant une analyse plus complète.
Il est également précieux pour documenter la qualité des données. Par exemple, si un seul groupe présente une variance très supérieure aux autres, cela peut révéler :
- une erreur de saisie,
- un changement de protocole dans une sous-population,
- une mesure instrumentale moins stable,
- ou simplement une distribution plus dispersée pour des raisons réelles de terrain.
Limites du test de Hartley
Le principal défaut du Fmax est sa sensibilité à la non-normalité. Des données asymétriques, avec valeurs extrêmes, peuvent gonfler artificiellement les variances et conduire à un ratio exagéré. De plus, le test est historiquement conçu pour des groupes de même taille. Si cette condition n’est pas remplie, le ratio seul reste descriptif, mais sa portée inférentielle diminue.
Autre point important : le F de Hartley ne “voit” que les extrêmes, c’est-à-dire la plus grande et la plus petite variance. Si vos groupes intermédiaires présentent des structures complexes, le test ne les exploite pas vraiment. C’est pourquoi beaucoup de praticiens le complètent avec d’autres diagnostics graphiques ou avec un test de Levene.
| Méthode | Statistique principale | Sensibilité à la non-normalité | Besoin de groupes équilibrés | Usage conseillé |
|---|---|---|---|---|
| Hartley Fmax | Variance max / variance min | Élevée | Oui, de préférence | Contrôle rapide et pédagogique |
| Levene | Écart absolu à une tendance centrale | Plus faible | Non strictement | Analyse robuste en pratique |
| Bartlett | Combinaison logarithmique des variances | Très élevée | Non, mais normalité importante | Contexte très paramétrique |
| Brown-Forsythe | Version robuste proche de Levene | Faible à modérée | Non strictement | Présence possible d’outliers |
Bonnes pratiques avant d’utiliser le F de Hartley
- Inspectez vos données avec un boxplot ou un histogramme.
- Vérifiez que les groupes ont des tailles comparables.
- Calculez correctement les variances sur la même base.
- Interprétez le ratio avec un seuil adapté au nombre de groupes et aux degrés de liberté.
- En cas de doute, confirmez avec Levene ou une méthode robuste.
Quelle différence avec l’ANOVA ?
Il est courant de confondre les deux parce que tous deux utilisent la lettre F. Pourtant, il s’agit de deux objets statistiques distincts. Le F de Hartley mesure un ratio entre la plus grande et la plus petite variance observée. Le F de l’ANOVA, lui, compare une variabilité inter-groupes à une variabilité intra-groupes pour tester l’égalité des moyennes. Le premier s’intéresse à l’homogénéité des dispersions ; le second à la différence des moyennes.
Quand faut-il renoncer au test de Hartley ?
Évitez de vous appuyer uniquement sur ce test lorsque :
- les tailles de groupe sont très inégales,
- les distributions sont fortement asymétriques,
- des valeurs extrêmes sont présentes,
- ou la décision analytique a des implications importantes et exige une méthode plus robuste.
Dans ces contextes, Hartley peut rester un indicateur descriptif rapide, mais il ne devrait pas être votre unique base de décision.
Ressources de référence
Pour approfondir la question de l’homogénéité des variances et des méthodes de diagnostic, vous pouvez consulter ces sources de haute autorité :
- NIST Engineering Statistics Handbook (.gov)
- Penn State STAT 500 course materials (.edu)
- UCLA Statistical Consulting Resources (.edu)
En résumé
Le calcul du F de Hartley est une méthode simple, rapide et visuelle pour juger de l’homogénéité des variances. Sa formule est élémentaire, mais son interprétation doit rester disciplinée : normalité, équilibre des tailles et usage d’un seuil adapté sont essentiels. En pratique, il constitue un excellent point de départ pour évaluer la cohérence des dispersions, à condition de compléter l’analyse lorsque les données sont complexes ou lorsque l’enjeu méthodologique est élevé.