Comment calculer la variance d’une variable aléatoire
Entrez les valeurs possibles de la variable aléatoire et leurs probabilités. Le calculateur détermine automatiquement l’espérance, la variance et l’écart-type, puis affiche un graphique clair de la distribution.
Calculateur interactif de variance
Utilisez ce module pour une variable aléatoire discrète. Saisissez les valeurs de X et les probabilités associées dans le même ordre.
Résultats
Renseignez les données, puis cliquez sur Calculer la variance.
Visualisation de la distribution
Comprendre comment calculer la variance d’une variable aléatoire
La variance est l’une des mesures les plus importantes en statistique et en probabilités. Quand on cherche à savoir non seulement quelle est la valeur moyenne d’un phénomène aléatoire, mais aussi à quel point les résultats s’écartent de cette moyenne, la variance devient indispensable. En pratique, elle sert à évaluer la dispersion d’une distribution, à mesurer le risque en finance, à comparer la régularité de processus industriels, à quantifier l’incertitude d’un modèle et à interpréter les fluctuations dans des données expérimentales.
Dire qu’une variable aléatoire a une moyenne de 10 ne suffit pas toujours. Deux variables peuvent partager la même espérance tout en ayant des comportements très différents. L’une peut être concentrée autour de 10 avec peu d’écarts, tandis qu’une autre peut prendre des valeurs très éloignées de 10. La variance permet précisément de distinguer ces situations.
Dans cette page, vous allez voir la formule de la variance, les étapes concrètes de calcul, les erreurs fréquentes, la différence entre variance théorique et variance d’échantillon, ainsi que des exemples numériques simples. Le calculateur situé plus haut vous aide à automatiser les opérations pour une variable aléatoire discrète.
Définition de la variance
Pour une variable aléatoire discrète X, la variance mesure l’écart moyen quadratique entre les valeurs prises par X et son espérance mathématique. Formellement, on note :
Cette écriture signifie que l’on prend chaque valeur possible de la variable, on mesure son écart à la moyenne, on élève cet écart au carré, puis on fait la moyenne pondérée de ces carrés à l’aide des probabilités. Le carré est essentiel, car il empêche les écarts négatifs et positifs de s’annuler entre eux.
Une autre formule très utilisée, souvent plus pratique pour calculer, est :
Cette seconde formule est particulièrement efficace lorsque l’on connaît déjà la distribution de probabilité. On calcule d’abord l’espérance de X, puis l’espérance de X², et on effectue la différence. Les deux formules donnent exactement le même résultat.
Les étapes pour calculer la variance d’une variable aléatoire discrète
- Lister les valeurs possibles de la variable aléatoire X.
- Associer à chaque valeur sa probabilité P(X = x).
- Vérifier que la somme des probabilités vaut 1.
- Calculer l’espérance E(X) = Σ x × P(X = x).
- Calculer E(X²) = Σ x² × P(X = x).
- Appliquer la formule Var(X) = E(X²) – [E(X)]².
- Prendre la racine carrée si vous souhaitez aussi l’écart-type.
Exemple simple
Supposons qu’une variable aléatoire X puisse prendre les valeurs 1, 2 et 3 avec les probabilités respectives 0,2 ; 0,5 ; 0,3.
- E(X) = 1 × 0,2 + 2 × 0,5 + 3 × 0,3 = 2,1
- E(X²) = 1² × 0,2 + 2² × 0,5 + 3² × 0,3 = 4,9
- Var(X) = 4,9 – 2,1² = 4,9 – 4,41 = 0,49
- Écart-type = √0,49 = 0,7
On en déduit que la variable est centrée en moyenne autour de 2,1 avec une dispersion modérée. Une variance faible indique que les résultats restent relativement proches de la moyenne. À l’inverse, une variance élevée signale une variabilité plus importante.
Pourquoi la variance est-elle si utile ?
La variance intervient dans de très nombreux domaines. En économie, elle aide à mesurer le risque d’un rendement. En assurance, elle permet d’étudier la fluctuation des sinistres. En ingénierie, elle sert à contrôler la stabilité d’un processus de fabrication. En biostatistique, elle aide à comparer la variabilité des réponses à un traitement. En apprentissage automatique, elle est liée à la dispersion des erreurs et à la notion de biais-variance dans les modèles prédictifs.
Une moyenne seule peut être trompeuse. Par exemple, deux jeux de données peuvent avoir la même moyenne de 50, mais l’un peut être constitué de valeurs proches de 50 et l’autre d’extrêmes comme 10 et 90. La variance apporte alors la profondeur d’analyse qui manque à la simple moyenne.
Variance, écart-type et coefficient de variation
La variance est exprimée dans l’unité au carré. Si X est mesurée en euros, alors la variance est en euros carrés, ce qui n’est pas toujours intuitif. Pour cette raison, on utilise souvent l’écart-type :
L’écart-type ramène la mesure de dispersion dans l’unité d’origine. Plus il est grand, plus les valeurs s’éloignent de la moyenne. Le coefficient de variation, quant à lui, rapporte l’écart-type à la moyenne et permet des comparaisons relatives entre séries de tailles différentes.
| Mesure | Formule | Interprétation | Unité |
|---|---|---|---|
| Moyenne | E(X) | Centre de la distribution | Même unité que X |
| Variance | E[(X – E(X))²] | Dispersion quadratique autour de la moyenne | Unité au carré |
| Écart-type | √Var(X) | Dispersion moyenne exprimée dans l’unité initiale | Même unité que X |
| Coefficient de variation | σ / μ | Dispersion relative par rapport à la moyenne | Sans unité ou en % |
Différence entre variance d’une variable aléatoire et variance d’échantillon
Il est fondamental de ne pas confondre deux contextes :
- La variance théorique d’une variable aléatoire se calcule à partir de toutes les valeurs possibles et de leurs probabilités.
- La variance d’échantillon se calcule à partir de données observées, lorsque l’on ne connaît pas la loi exacte sous-jacente.
Pour un échantillon de taille n, on utilise souvent :
Le terme n – 1 est la correction de Bessel, largement utilisée pour obtenir un estimateur non biaisé de la variance de la population lorsque la moyenne est estimée à partir de l’échantillon lui-même. Dans le calculateur, vous pouvez choisir le mode variance d’échantillon simple pour travailler directement sur une liste de données.
Exemple comparatif avec données concrètes
Le tableau ci-dessous compare deux distributions simples ayant la même moyenne, mais une dispersion différente. Cette comparaison montre pourquoi la variance est essentielle pour interpréter correctement une situation statistique.
| Distribution | Valeurs | Probabilités | Moyenne | Variance | Écart-type |
|---|---|---|---|---|---|
| Distribution A | 4, 5, 6 | 0,25 ; 0,50 ; 0,25 | 5,00 | 0,50 | 0,707 |
| Distribution B | 1, 5, 9 | 0,25 ; 0,50 ; 0,25 | 5,00 | 8,00 | 2,828 |
Les deux variables ont une moyenne identique de 5, mais la distribution B est beaucoup plus étalée. C’est exactement ce que la variance révèle. Sans cette mesure, on passerait à côté de l’information la plus importante sur la stabilité ou l’instabilité de la variable étudiée.
Données réelles et ordre de grandeur statistique
Dans les statistiques publiques, les notions de moyenne et de dispersion sont omniprésentes. Les grandes institutions utilisent régulièrement la variance et l’écart-type pour décrire l’hétérogénéité des populations, les fluctuations de revenus, les résultats d’évaluation ou les erreurs de mesure. Le tableau suivant illustre quelques ordres de grandeur fréquemment rencontrés dans des jeux de données réels ou pédagogiques issus de contextes institutionnels.
| Contexte d’analyse | Moyenne observée | Écart-type typique | Lecture pratique |
|---|---|---|---|
| Scores standardisés d’un test éducatif | 500 points | 100 points | Une grande dispersion implique des écarts importants entre individus ou groupes. |
| Température quotidienne moyenne dans une ville tempérée sur un mois | 18 °C | 3 à 5 °C | Faible à moyenne variabilité autour de la moyenne mensuelle. |
| Rendements journaliers d’un actif financier liquide | Proche de 0 % | 1 % à 2 % | Une faible moyenne peut masquer une variabilité significative, donc du risque. |
| Temps de réponse d’un serveur web | 250 ms | 40 à 120 ms | Une variance élevée signale souvent des problèmes de stabilité ou de charge. |
Erreurs fréquentes dans le calcul de la variance
- Oublier de vérifier la somme des probabilités. Pour une variable aléatoire discrète, les probabilités doivent totaliser 1.
- Confondre E(X²) avec [E(X)]². Ce sont deux quantités différentes.
- Utiliser la mauvaise formule entre variance théorique et variance d’échantillon.
- Oublier le carré dans les écarts à la moyenne.
- Mal interpréter l’unité. La variance est en unité au carré, pas dans l’unité d’origine.
- Lire une variance isolément sans comparer la moyenne, l’écart-type ou le contexte métier.
Comment interpréter le résultat obtenu avec ce calculateur
Une fois les résultats affichés, vous verrez généralement quatre indicateurs : la somme des probabilités, l’espérance, la variance et l’écart-type. Si la somme des probabilités vaut exactement 1 ou très proche de 1 après arrondi, la saisie est cohérente pour une variable aléatoire discrète. L’espérance vous donne la valeur moyenne attendue à long terme. La variance quantifie l’étalement des résultats autour de cette moyenne. Enfin, l’écart-type fournit une mesure plus intuitive de la dispersion.
Le graphique complète cette lecture. Si la masse de probabilité est concentrée autour de quelques valeurs centrales, la variance tend à être plus faible. Si au contraire les probabilités se répartissent sur des valeurs éloignées, la variance augmente.
Cas particuliers à connaître
Variance nulle
La variance est nulle si et seulement si la variable aléatoire est constante avec probabilité 1. Cela signifie qu’il n’y a aucune incertitude : la variable prend toujours la même valeur.
Transformation linéaire
Si Y = aX + b, alors :
Le terme b n’affecte pas la variance, car ajouter une constante déplace toute la distribution sans modifier sa dispersion. En revanche, multiplier par a change la dispersion, et comme on parle de carrés d’écarts, l’effet est en a².
Somme de variables indépendantes
Si X et Y sont indépendantes, alors :
Cette propriété est fondamentale en probabilités, notamment pour les lois binomiales, les modèles de files d’attente, l’évaluation du risque global et le traitement des erreurs indépendantes.
Ressources fiables pour approfondir
Si vous souhaitez aller plus loin avec des sources institutionnelles et universitaires fiables, voici quelques références utiles :
- NIST Engineering Statistics Handbook
- UCLA Statistical Methods and Data Analytics
- U.S. Census Bureau statistical working papers
En résumé
Calculer la variance d’une variable aléatoire consiste à mesurer la dispersion des valeurs possibles autour de leur moyenne, en tenant compte de leurs probabilités. La méthode la plus pratique est souvent : calculer l’espérance E(X), calculer E(X²), puis utiliser la relation Var(X) = E(X²) – [E(X)]². Cette mesure est indispensable dès que l’on veut analyser la stabilité, l’incertitude ou le risque d’un phénomène.
Grâce au calculateur interactif présent sur cette page, vous pouvez vérifier rapidement vos calculs, visualiser la distribution et obtenir des résultats clairs en quelques secondes. Que vous soyez étudiant, enseignant, analyste ou simplement en train de réviser un cours de probabilités, disposer d’un outil fiable pour calculer la variance permet de gagner du temps et d’éviter les erreurs classiques.