ACP: calculer l’angle entre une variable et un axe factoriel
Calculez instantanément l’angle d’une variable dans le plan factoriel d’une analyse en composantes principales. Entrez ses corrélations ou coordonnées sur F1 et F2, choisissez l’axe de référence, puis visualisez l’interprétation géométrique et statistique.
Calculateur interactif
Résultats
Saisissez les coordonnées de la variable sur le plan factoriel puis cliquez sur Calculer l’angle.
Comprendre l’ACP et l’angle entre une variable et un axe factoriel
L’analyse en composantes principales, ou ACP, est une méthode fondamentale de statistique multivariée. Son objectif est de résumer l’information contenue dans un ensemble de variables quantitatives souvent corrélées, en un plus petit nombre d’axes appelés axes factoriels. Dans la pratique, l’ACP est utilisée en économétrie, biostatistique, marketing, psychologie, data science et contrôle qualité. Lorsqu’on projette les variables sur un cercle des corrélations ou sur un plan factoriel, la question revient souvent: comment calculer l’angle entre une variable et un axe factoriel ?
Cet angle a une vraie signification. Il permet de juger la proximité d’une variable avec un axe, donc son niveau d’association avec la dimension portée par cet axe. Plus l’angle est faible avec F1, plus la variable est alignée sur l’axe 1. Si l’angle est proche de 90°, la variable contribue peu à l’interprétation de cet axe dans le plan considéré. Si l’on travaille sur le cercle des corrélations, les coordonnées d’une variable sur F1 et F2 sont généralement les corrélations entre cette variable standardisée et les composantes principales.
Sur un plan factoriel bidimensionnel, une variable est représentée par un vecteur partant de l’origine vers le point de coordonnées (x, y), où x = corr(variable, F1) et y = corr(variable, F2). L’angle avec l’axe F1 dépend alors de la direction du vecteur dans le plan. Géométriquement, vous pouvez le calculer par la fonction trigonométrique appropriée. En pratique, la fonction atan2(y, x) est la plus robuste, car elle tient compte du signe des coordonnées et du bon quadrant.
Pourquoi cet angle est-il utile ?
- Il aide à interpréter le sens d’un axe factoriel.
- Il permet de comparer visuellement plusieurs variables.
- Il clarifie si une variable est surtout liée à F1, à F2, ou à une combinaison des deux.
- Il complète l’analyse des contributions, cos² et valeurs propres.
Formules de base
Si une variable a pour coordonnées (x, y) dans le plan F1-F2 :
- Norme du vecteur: r = √(x² + y²)
- Angle orienté par rapport à F1: θ = atan2(y, x)
- Angle minimal avec F1: arccos(|x| / r)
- Angle orienté par rapport à F2: φ = atan2(x, y)
- Angle minimal avec F2: arccos(|y| / r)
Le calculateur ci-dessus donne à la fois une lecture géométrique simple et une visualisation, ce qui est particulièrement utile pour des rapports d’étude, des mémoires ou des tableaux de bord décisionnels.
Méthode experte pour calculer correctement l’angle
Il existe deux façons principales de raisonner. La première est la vision orientée : on mesure la rotation exacte entre l’axe positif et la variable. Cette mesure peut être négative ou positive selon le sens de rotation. La seconde est la vision minimale : on s’intéresse seulement à l’écart le plus court entre la variable et l’axe, ce qui est souvent plus simple pour l’interprétation. Dans de nombreux cours et logiciels, c’est cette seconde lecture qui est retenue lorsqu’on parle d’angle entre une variable et un axe.
Étape 1: vérifier le type de coordonnées
Avant de calculer l’angle, il faut savoir si les valeurs entrées sont des corrélations variables-composantes, des loadings, ou des coordonnées issues d’une autre normalisation. Dans un cercle des corrélations classique, les coordonnées restent comprises entre -1 et 1. Cette configuration est idéale pour interpréter l’angle comme une orientation factorielle.
Étape 2: calculer la norme du vecteur
La norme r mesure la longueur du vecteur dans le plan. Si la norme est proche de 0, la variable est très mal représentée dans le plan F1-F2 et l’angle devient peu informatif. En d’autres termes, même si l’angle peut être calculé mathématiquement, il ne faut pas lui donner trop de poids si le cos² cumulé sur F1 et F2 est faible.
Étape 3: choisir le bon angle
Pour l’axe F1, on utilise de préférence atan2(y, x). Pour l’axe F2, on peut utiliser atan2(x, y). Cela évite les erreurs de quadrant que l’on rencontre avec une simple tangente inverse. Par exemple, une variable de coordonnées (-0.7, 0.2) n’a pas le même sens qu’une variable (0.7, 0.2), même si le rapport y/x peut conduire à une ambiguïté si l’on ne tient pas compte du signe.
Étape 4: interpréter dans le contexte de l’ACP
Un angle faible avec F1 suggère que la variable structure principalement la première composante. Si plusieurs variables présentent des angles voisins et des directions proches, elles sont cohérentes avec le même axe d’interprétation. À l’inverse, des variables presque orthogonales renvoient souvent à des dimensions distinctes dans le plan factoriel.
| Coordonnées (F1, F2) | Angle minimal avec F1 | Interprétation pratique | Qualité de représentation probable |
|---|---|---|---|
| (0.95, 0.10) | 6.01° | Très fortement alignée sur F1 | Élevée dans le plan |
| (0.70, 0.70) | 45.00° | Partagée entre F1 et F2 | Très élevée dans le plan |
| (0.12, 0.98) | 83.02° | Presque portée par F2 plutôt que F1 | Élevée dans le plan |
| (-0.80, 0.20) | 14.04° | Proche de l’axe F1 mais dans le sens négatif | Bonne dans le plan |
Remarquez un point essentiel: l’angle minimal avec l’axe ne dit pas tout sur le sens de la relation. Une variable très proche de F1 peut être orientée vers le côté positif ou vers le côté négatif. C’est précisément pour cela que le mode angle orienté du calculateur est utile.
Rôle des cos², contributions et variance expliquée
En ACP, il ne faut jamais interpréter l’angle isolément. L’angle doit être mis en relation avec la qualité de représentation de la variable et avec le poids des axes. Les statistiques les plus utiles sont les suivantes :
- Cos² : mesure la qualité de représentation de la variable sur l’axe ou le plan.
- Contribution : mesure la participation de la variable à la construction de l’axe.
- Valeur propre et variance expliquée : indiquent l’importance globale de chaque composante.
Dans un cercle des corrélations, si une variable a des coordonnées fortes sur F1 et F2, alors sa projection est proche du cercle unité et son angle est en général interprétable avec confiance. Si ses coordonnées sont faibles, l’angle peut être numériquement exact, mais statistiquement peu stable. C’est la raison pour laquelle de nombreux analystes filtrent les variables mal représentées avant d’interpréter les directions dans le plan.
| Indicateur | Seuil usuel | Lecture analytique | Décision |
|---|---|---|---|
| Cos² sur le plan F1-F2 | > 0.50 | Variable plutôt bien représentée | Angle généralement exploitable |
| Cos² sur le plan F1-F2 | 0.20 à 0.50 | Représentation moyenne | Interprétation prudente |
| Cos² sur le plan F1-F2 | < 0.20 | Faible représentation | Angle peu robuste pour conclure |
| Variance expliquée cumulée F1+F2 | > 60% | Plan souvent riche en information | Analyse graphique plus fiable |
Données de référence et repères réels
Dans de nombreux jeux de données appliqués, les deux premières composantes expliquent souvent entre 45% et 75% de la variance totale, selon le domaine, la redondance des variables et la présence de structures latentes. En biologie, en agronomie ou en comportement consommateur, un plan F1-F2 autour de 55% à 70% de variance expliquée est courant pour un premier niveau d’exploration. Ce ne sont pas des seuils absolus, mais des repères pratiques de terrain.
Exemple complet d’interprétation
Supposons qu’une variable de satisfaction client ait pour coordonnées (0.82, 0.28). Sa norme dans le plan vaut environ 0.8665. L’angle orienté avec F1 est proche de 18.87°. L’angle minimal avec F1 est lui aussi faible, ce qui signifie que la variable suit largement la première dimension. Si F1 résume un gradient de performance globale, on peut conclure que cette variable participe fortement à cette notion.
Prenons maintenant une variable de prix avec les coordonnées (-0.76, 0.18). L’angle minimal avec F1 reste faible, mais l’orientation est du côté négatif de F1. Cela signifie qu’elle est bien alignée sur la composante 1, tout en exprimant la polarité opposée aux variables situées du côté positif. C’est un cas classique de variables antagonistes dans l’interprétation factorielle.
Enfin, une variable de fidélité placée en (0.12, 0.91) aura un angle très faible avec F2 et très fort avec F1. On dira alors qu’elle structure prioritairement le deuxième axe. Si F2 correspond à une dimension d’engagement ou d’attachement à la marque, cette variable est un excellent marqueur de cette composante.
Erreurs fréquentes à éviter
- Confondre angle entre une variable et un axe avec angle entre deux variables.
- Interpréter l’angle sans vérifier la qualité de représentation.
- Utiliser uniquement arctan(y/x) sans gérer les quadrants.
- Oublier le signe des coordonnées, surtout quand on commente la polarité d’un axe.
- Comparer des angles issus de normalisations différentes sans précaution.
Quand utiliser F1, F2 ou un autre axe ?
En première lecture, les analystes s’intéressent surtout à F1 puis F2, car ce sont les axes qui expliquent le plus de variance. Toutefois, si la variable d’intérêt est mal représentée sur le plan F1-F2, il peut être plus pertinent d’examiner F1-F3, F2-F3 ou des dimensions supplémentaires. Le même principe de calcul reste valable: on prend les coordonnées de la variable dans le plan choisi puis on mesure son angle avec l’axe de référence.
Sources d’autorité à consulter
Pour aller plus loin sur l’ACP, la géométrie des composantes principales et l’interprétation statistique, vous pouvez consulter ces ressources institutionnelles :
- NIST Engineering Statistics Handbook (.gov)
- Penn State STAT 505: Multivariate Data Analysis (.edu)
- Carnegie Mellon University Department of Statistics & Data Science (.edu)
Ces références sont particulièrement utiles pour vérifier les définitions des composantes principales, la lecture des loadings, les corrélations variables-axes, ainsi que les bonnes pratiques d’interprétation des projections factorielles.
Conclusion
Calculer l’angle entre une variable et un axe factoriel en ACP est une opération simple sur le plan mathématique, mais extrêmement riche sur le plan interprétatif. La clé est de relier la géométrie du vecteur à la statistique de représentation. En résumé: utilisez les coordonnées de la variable dans le plan, calculez la norme, déduisez l’angle avec l’axe choisi via une formule robuste, puis interprétez cet angle avec les cos², contributions et pourcentages de variance expliquée. Le calculateur interactif de cette page vous aide précisément à passer de la formule à l’analyse métier, avec une visualisation claire et exploitable.