Calcul De L Esp Rance D Une Loi Binomiale Tronqu E

Calcul de l’espérance d’une loi binomiale tronquée

Estimez rapidement l’espérance conditionnelle d’une variable binomiale après troncature sur un intervalle. Cet outil calcule E[X | a ≤ X ≤ b], la probabilité de rester dans l’intervalle retenu, ainsi que l’espérance non tronquée classique np.

Loi binomiale Espérance tronquée Graphique interactif

Entier positif. Exemple : 20 essais.

Nombre compris entre 0 et 1.

Valeur minimale retenue dans la troncature.

Valeur maximale retenue dans la troncature.

Résultats

Saisissez vos paramètres puis cliquez sur Calculer pour afficher l’espérance de la loi binomiale tronquée.

Le graphique compare la distribution binomiale initiale et la zone conservée après troncature.

Comprendre le calcul de l’espérance d’une loi binomiale tronquée

La loi binomiale est l’un des modèles les plus utilisés en statistique appliquée. Elle intervient dès qu’on observe un nombre fixe d’essais indépendants, chacun ayant deux issues possibles, souvent appelées succès et échec. Si l’on note X ~ Bin(n, p), alors la variable aléatoire X compte le nombre de succès obtenus sur n essais, lorsque la probabilité de succès à chaque essai vaut p. Son espérance classique est simple : E[X] = np.

Pourtant, dans de nombreuses situations réelles, on ne conserve pas toute la distribution. On impose un filtre, une contrainte, un seuil d’acceptation ou une plage d’observation. On travaille alors avec une loi binomiale tronquée. En pratique, cela signifie que l’on ne s’intéresse qu’aux valeurs de X comprises entre deux bornes, par exemple a ≤ X ≤ b. L’objectif devient alors de calculer l’espérance conditionnelle de X sachant que l’événement de troncature s’est produit.

Cette quantité est fondamentale dans les domaines où des règles de sélection existent : assurance qualité, analyses cliniques, finance du risque, épidémiologie, tests industriels, contrôle d’anomalies, sélection de dossiers, procédures de tri algorithmique et analyse de données censurées. Une moyenne tronquée n’est pas une simple moyenne classique recalculée à la main ; c’est une moyenne conditionnelle qui dépend à la fois de la distribution initiale et de la probabilité d’entrer dans la zone retenue.

Définition mathématique de l’espérance tronquée

Si X ~ Bin(n, p) et si l’on tronque la distribution à l’intervalle [a, b], l’espérance de la loi binomiale tronquée s’écrit :

E[X | a ≤ X ≤ b] = \(\dfrac{\sum_{k=a}^{b} k \cdot P(X = k)}{\sum_{k=a}^{b} P(X = k)}\)

Cette formule contient deux parties essentielles :

  • Le numérateur additionne les valeurs possibles, pondérées par leur probabilité binomiale.
  • Le dénominateur représente la probabilité totale que la variable appartienne à l’intervalle de troncature.

Sans ce dénominateur, on obtiendrait une somme partielle, mais pas une espérance conditionnelle correcte. C’est la renormalisation qui transforme la partie conservée de la loi en une nouvelle distribution valide, de masse totale égale à 1 sur l’intervalle retenu.

Rappel de la probabilité binomiale

Pour tout entier k entre 0 et n, la probabilité binomiale vaut :

P(X = k) = C(n, k) pk(1-p)n-k

C(n, k) est le coefficient binomial. Le calcul pratique exige donc de savoir évaluer les combinaisons et d’éviter les erreurs d’arrondi quand n est élevé. Le calculateur ci-dessus prend en charge cette partie automatiquement.

Pourquoi tronquer une loi binomiale ?

La troncature ne relève pas uniquement d’un exercice théorique. Elle correspond souvent à une décision opérationnelle. Imaginons un contrôle qualité où l’on retient seulement les lots présentant entre 2 et 6 défauts, ou bien une analyse de questionnaires où l’on exclut les réponses extrêmes parce qu’elles ne satisfont pas le protocole de validation. Dans chacun de ces cas, la moyenne observée sur les dossiers retenus ne suit plus l’espérance binomiale brute np.

Voici quelques contextes concrets :

  1. Industrie : seuls les lots avec un nombre de défauts dans une plage acceptable sont étudiés plus finement.
  2. Santé publique : on analyse uniquement les patients qui dépassent un seuil de réponses positives à un test.
  3. Finance : on conditionne les scénarios à l’occurrence d’un nombre minimal ou maximal de défauts de paiement.
  4. Data science : on filtre les observations aberrantes avant modélisation.
  5. Recherche expérimentale : les essais partiellement conformes sont retirés de l’analyse principale.

Dans ces situations, la loi tronquée reflète mieux la population effectivement observée ou retenue pour la décision.

Différence entre espérance binomiale classique et espérance binomiale tronquée

L’espérance classique np est calculée sur l’ensemble des valeurs possibles de 0 à n. L’espérance tronquée, elle, dépend fortement des bornes choisies. Si l’on élimine les faibles valeurs, la moyenne conditionnelle augmente mécaniquement. Si l’on élimine les grandes valeurs, elle diminue. Si l’on ne conserve qu’une bande étroite autour du mode, l’espérance tronquée se rapproche du centre de cette bande, parfois avec un écart visible par rapport à np.

Paramètres Espérance classique Intervalle tronqué Probabilité de l’intervalle Espérance tronquée approximative
n = 20, p = 0.35 7.00 [4, 10] Environ 0.88 Environ 6.77
n = 20, p = 0.35 7.00 [8, 20] Environ 0.42 Environ 9.00
n = 30, p = 0.10 3.00 [0, 2] Environ 0.59 Environ 1.47
n = 50, p = 0.60 30.00 [28, 35] Environ 0.63 Environ 30.82

Ces ordres de grandeur montrent bien qu’une troncature peut déplacer sensiblement la moyenne. Ce déplacement est d’autant plus marqué que la plage retenue est étroite ou asymétrique par rapport au centre de la distribution.

Méthode de calcul pas à pas

1. Définir la loi de départ

On commence par identifier n, le nombre d’essais, et p, la probabilité de succès à chaque essai. La variable de référence est alors X ~ Bin(n, p).

2. Choisir la règle de troncature

On fixe ensuite les bornes a et b. La loi tronquée conserve uniquement les valeurs entières comprises dans cet intervalle. Les valeurs extérieures sont exclues.

3. Calculer les probabilités binomiales sur l’intervalle

Il faut évaluer P(X = k) pour tous les entiers k allant de a à b. C’est cette suite de probabilités qui constitue la base du calcul.

4. Calculer la probabilité totale conservée

On somme toutes les probabilités de l’intervalle : P(a ≤ X ≤ b) = Σ P(X = k). Cette quantité mesure la part de la distribution originale qui survit à la troncature.

5. Calculer la moyenne conditionnelle

On forme enfin le ratio entre la somme pondérée Σ kP(X = k) sur l’intervalle et la probabilité totale conservée. Le résultat est l’espérance de la loi binomiale tronquée.

Exemple détaillé avec chiffres

Prenons un exemple simple mais réaliste : un organisme suit 20 essais indépendants et considère qu’un succès apparaît avec une probabilité p = 0.35. La variable suit donc X ~ Bin(20, 0.35), et son espérance non tronquée vaut : 20 × 0.35 = 7.

Supposons maintenant que l’on ne retienne que les cas où le nombre de succès est compris entre 4 et 10. Les valeurs 0, 1, 2, 3 et 11 à 20 sont exclues. Pour obtenir l’espérance tronquée, on calcule toutes les probabilités binomiales de 4 à 10, on en fait la somme, puis on renormalise. Le résultat est une moyenne conditionnelle inférieure à 7, car la troncature retire davantage de masse dans la queue supérieure que dans la zone centrale. Selon le calcul précis, on obtient une espérance d’environ 6.77.

Cet exemple montre une idée importante : même quand l’intervalle de troncature contient la valeur moyenne initiale, l’espérance tronquée n’est pas obligatoirement égale à l’espérance classique. Elle dépend de la forme de la distribution et de la symétrie, ou non, des bornes choisies autour du centre probabiliste.

Tableau comparatif de scénarios fréquents

Contexte Modèle binomial plausible Troncature utilisée Lecture statistique
Contrôle qualité sur 50 pièces n = 50, p = 0.04 pour un défaut [0, 3] On observe la moyenne des défauts seulement parmi les lots considérés acceptables.
Campagne e-mail sur 100 envois n = 100, p = 0.12 pour un clic [8, 20] On retient les campagnes au rendement intermédiaire pour évaluer la performance typique des cas exploitables.
Essai clinique avec 30 réponses positives n = 30, p = 0.55 [15, 25] On conditionne l’analyse aux profils cliniquement pertinents retenus par le protocole.
Défauts de remboursement sur 12 échéances n = 12, p = 0.08 [1, 4] On mesure le nombre moyen de retards parmi les dossiers non nuls mais non extrêmes.

Points d’attention méthodologiques

Ne pas confondre troncature et censure

En statistique, la troncature signifie que certaines observations n’entrent pas du tout dans l’échantillon analysé. La censure, elle, conserve l’observation mais de façon incomplète. Cette différence est cruciale : la formule de l’espérance d’une loi binomiale tronquée est bien une formule conditionnelle sur l’appartenance à une plage de valeurs.

Vérifier la cohérence des bornes

Les bornes doivent satisfaire 0 ≤ a ≤ b ≤ n. Si la plage ne contient aucune valeur valide, la probabilité de troncature est nulle et l’espérance tronquée n’est pas définie. Le calculateur contrôle cette cohérence avant d’afficher un résultat.

Tenir compte de la masse conservée

Une moyenne tronquée n’a de sens pratique que si la probabilité de l’intervalle est suffisamment importante pour le problème étudié. Si cette probabilité est minuscule, l’espérance conditionnelle peut être mathématiquement correcte mais peu stable ou peu représentative d’une situation opérationnelle fréquente.

Applications concrètes de la loi binomiale tronquée

  • Biostatistique : estimation moyenne du nombre de réponses thérapeutiques parmi les profils admissibles.
  • Assurance : modélisation du nombre moyen de sinistres seulement sur les contrats entrant dans une classe de gestion ciblée.
  • Production industrielle : suivi de la qualité moyenne des lots après filtrage par seuils d’acceptation.
  • Éducation : analyse des scores de réussite quand on étudie uniquement les élèves dans une plage de sélection donnée.
  • Marketing analytique : nombre moyen de conversions parmi les campagnes retenues par score de performance.

Sources fiables pour aller plus loin

Pour approfondir la théorie des probabilités, la loi binomiale et le raisonnement conditionnel, vous pouvez consulter des ressources institutionnelles de grande qualité :

Comment interpréter le graphique du calculateur

Le graphique présente les probabilités associées aux différentes valeurs possibles de X. En mode standard, toute la distribution binomiale est visible, tandis que la zone tronquée est surlignée. Vous voyez immédiatement si la troncature coupe surtout la queue gauche, la queue droite ou les deux. En mode renormalisé, seules les probabilités conditionnelles de l’intervalle sont affichées ; leur somme vaut alors 1.

Cette visualisation a un intérêt fort pour l’analyse décisionnelle. Deux jeux de paramètres peuvent conduire à des espérances tronquées proches, tout en reposant sur des structures de probabilité très différentes. Le graphique évite cette perte d’information.

Questions fréquentes

L’espérance tronquée est-elle toujours comprise entre a et b ?

Oui. Puisqu’il s’agit d’une moyenne conditionnelle calculée uniquement à partir des valeurs conservées dans l’intervalle, elle doit se situer entre les bornes de troncature.

Quand l’espérance tronquée est-elle égale à l’espérance classique ?

Cela n’arrive pas en général, sauf cas particuliers. Il faut soit ne pas tronquer réellement la distribution, soit choisir une troncature dont l’effet moyen se compense exactement, ce qui reste rare.

Peut-on utiliser une approximation normale ?

Pour des valeurs élevées de n et des probabilités ni trop proches de 0 ni trop proches de 1, une approximation normale peut être utilisée pour raisonner grossièrement. Mais pour un calcul précis de l’espérance d’une loi binomiale tronquée, surtout avec des bornes entières spécifiques, il est préférable de conserver la formule binomiale exacte.

Conclusion

Le calcul de l’espérance d’une loi binomiale tronquée est un outil indispensable dès que l’on travaille sur une population filtrée par un seuil, un critère d’acceptation ou une plage d’intérêt. L’idée centrale est simple : on part d’une loi binomiale classique, on conserve uniquement une partie de ses valeurs, puis on renormalise pour obtenir une vraie moyenne conditionnelle. Cette moyenne peut s’écarter sensiblement de np, parfois de façon très marquée, selon les bornes et la forme de la distribution.

Le calculateur interactif présenté sur cette page vous permet d’obtenir immédiatement le résultat numérique et de visualiser l’effet exact de la troncature. Pour une analyse robuste, pensez toujours à examiner en même temps l’espérance classique, la probabilité de l’intervalle conservé et la forme globale de la distribution.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top