Calcul grand nombre tirage successif sans remise
Calculez une probabilité hypergéométrique de façon fiable même avec de grands effectifs. Cet outil estime la probabilité d’obtenir exactement, au moins ou au plus un certain nombre de succès lors de tirages successifs sans remise dans une population finie.
Modèle
Hypergéométrique
Séquences ordonnées
Prêt à calculer
Usage typique
Cartes, audits, contrôle qualité
Guide expert du calcul grand nombre tirage successif sans remise
Le calcul de tirages successifs sans remise intervient dès qu’un élément déjà sélectionné ne peut plus être repris dans les tirages suivants. C’est le cas d’un prélèvement de cartes dans un jeu, d’un contrôle qualité où l’on retire les pièces inspectées, d’un audit de dossiers, d’un échantillonnage dans une petite population ou encore d’un test de conformité sur un lot de produits. Dès que la taille de la population augmente, les calculs deviennent rapidement difficiles à la main car les combinaisons et arrangements prennent des valeurs gigantesques. C’est précisément pour cette raison qu’un calcul grand nombre tirage successif sans remise doit utiliser des méthodes numériques stables.
L’idée centrale est simple. On part d’une population de taille N, contenant K éléments favorables. On réalise n tirages sans remise et l’on cherche la probabilité d’observer x succès. Le modèle exact est la loi hypergéométrique. Elle donne une réponse rigoureuse lorsque les tirages se font sans remplacement, contrairement à la loi binomiale qui suppose une probabilité constante à chaque essai. Dans le monde réel, cette différence compte beaucoup. Si votre échantillon représente une part non négligeable de la population, utiliser la binomiale peut conduire à une sous estimation ou une surestimation sensible du risque.
Pourquoi la notion de sans remise change tout
Quand on tire avec remise, la probabilité de succès reste la même à chaque étape. Par exemple, si 12 % des éléments sont favorables, chaque tirage a encore 12 % de chance d’être favorable. Mais sans remise, la composition de la population change après chaque tirage. Si un succès a déjà été prélevé, il reste un succès de moins dans la population. Les événements ne sont donc plus indépendants. Ce point est fondamental dans les calculs industriels, financiers et scientifiques.
- Dans un lot de production, retirer une pièce défectueuse diminue la proportion de défauts restants.
- Dans un jeu de cartes, tirer un coeur modifie la composition du paquet.
- Dans un audit, inspecter un dossier le retire du stock des dossiers encore sélectionnables.
- Dans les sondages sur petite base, la probabilité d’inclure certains profils évolue au fur et à mesure des sélections.
La formule exacte à connaître
La probabilité d’obtenir exactement x succès dans n tirages sans remise à partir d’une population de taille N contenant K succès vaut :
P(X = x) = C(K, x) × C(N – K, n – x) / C(N, n)
Ici, C(a, b) représente le nombre de combinaisons de b éléments choisis parmi a. Cette formule compte toutes les façons de choisir x éléments favorables et n – x éléments non favorables, puis divise par toutes les façons de former un échantillon de taille n.
Comprendre les bornes possibles pour x
Le nombre de succès observables x ne peut pas prendre n’importe quelle valeur. Il est forcément compris entre :
- max(0, n – (N – K)) pour la borne basse
- min(n, K) pour la borne haute
Exemple simple : si l’on a seulement 3 éléments favorables dans toute la population, il est impossible d’observer 4 succès. De même, si l’on tire presque toute la population, un certain nombre de succès devient inévitable. Ces bornes sont très utiles pour vérifier les paramètres et pour construire un graphique pertinent de la distribution.
Exemples concrets de calculs sans remise
Exemple 1 : contrôle qualité dans un lot de 1000 pièces
Supposons un lot de 1000 pièces, dont 120 sont non conformes. Un inspecteur prélève 25 pièces sans remise. Quelle est la probabilité d’observer exactement 3 pièces non conformes ? La bonne méthode consiste à appliquer la loi hypergéométrique. Ce type de question est typique des plans d’échantillonnage industriels, où l’on veut décider rapidement si un lot semble conforme ou non. Plus l’échantillon grandit, plus les calculs explosent en taille numérique.
Exemple 2 : tirage de cartes dans un jeu standard
Dans un jeu de 52 cartes, il y a 13 coeurs. Si l’on tire 5 cartes sans remise, la probabilité d’obtenir exactement 2 coeurs est :
C(13, 2) × C(39, 3) / C(52, 5) ≈ 0,2743, soit environ 27,43 %.
Ce calcul est un classique de la combinatoire. Il montre bien que le modèle à utiliser n’est pas la binomiale, car chaque carte tirée modifie le paquet restant.
| Scénario | Population N | Favorables K | Tirages n | Succès x | Probabilité exacte |
|---|---|---|---|---|---|
| Jeu de cartes, exactement 2 coeurs en 5 cartes | 52 | 13 | 5 | 2 | 27,43 % |
| Jeu de cartes, exactement 1 as en 5 cartes | 52 | 4 | 5 | 1 | 29,94 % |
| Lot industriel, exactement 3 défauts sur 25 pièces tirées | 1000 | 120 | 25 | 3 | 21,81 % environ |
| Audit, exactement 0 dossier litigieux dans 20 dossiers | 500 | 18 | 20 | 0 | 47,36 % environ |
Grand nombre : pourquoi les méthodes naïves échouent
Quand on parle de grand nombre, on pense souvent à des populations de plusieurs milliers, dizaines de milliers ou davantage. Dans ces cas, les quantités intermédiaires telles que C(10000, 300) sont astronomiques. Un calcul direct avec factorielles provoque vite des débordements numériques, même si le résultat final est une probabilité comprise entre 0 et 1. Pour contourner ce problème, les calculateurs robustes utilisent généralement :
- Le calcul des logarithmes de combinaisons plutôt que les combinaisons brutes.
- Des approximations stables de type Lanczos pour la fonction gamma logarithmique.
- Des sommes cumulées calculées sur des valeurs logarithmiques ou très petites.
- Des contrôles de cohérence sur les bornes minimales et maximales de x.
C’est ce que fait l’outil ci dessus. Il peut ainsi gérer proprement des jeux de paramètres bien plus ambitieux qu’un calcul à la main ou qu’une simple feuille de calcul mal configurée.
Espérance et variance
Au delà de la probabilité exacte, deux indicateurs résument efficacement la distribution :
- Espérance : E(X) = n × K / N
- Variance : Var(X) = n × (K / N) × (1 – K / N) × ((N – n) / (N – 1))
Le facteur (N – n) / (N – 1) est la correction de population finie. Il montre qu’en sans remise, la dispersion est plus faible qu’en binomial. Plus l’échantillon représente une grande part de la population, plus cette correction est importante.
| Cas | Paramètres | Espérance hypergéométrique | Variance hypergéométrique | Lecture pratique |
|---|---|---|---|---|
| Lot industriel | N = 1000, K = 120, n = 25 | 3,00 | 2,56 | On s’attend en moyenne à 3 défauts observés. |
| Jeu de cartes, coeurs | N = 52, K = 13, n = 5 | 1,25 | 0,86 | La plupart des mains auront entre 0 et 2 coeurs. |
| Audit de dossiers | N = 500, K = 18, n = 20 | 0,72 | 0,62 | Obtenir 0 ou 1 dossier litigieux est le cas le plus courant. |
Différence entre probabilité exacte, au moins, et au plus
Dans la pratique, on ne cherche pas toujours une valeur exacte. Très souvent, on veut savoir si le nombre de succès dépasse un seuil critique ou reste sous une limite acceptable.
- Probabilité exacte P(X = x) : utile pour l’analyse détaillée de scénarios précis.
- Probabilité cumulée P(X ≥ x) : utile pour mesurer le risque d’atteindre ou dépasser un seuil d’alerte.
- Probabilité cumulée P(X ≤ x) : utile pour vérifier qu’un résultat reste dans une zone acceptable.
En contrôle qualité, un responsable peut vouloir la probabilité d’observer au moins 5 défauts dans un échantillon. En audit, on peut chercher la probabilité d’observer au plus 1 anomalie. Dans les jeux de hasard ou les études de cartes, on s’intéresse plus souvent à une probabilité exacte.
Quand peut on approcher par une binomiale ?
Une approximation binomiale peut parfois être acceptable si l’échantillon n est très petit devant la population N. Une règle pratique courante consiste à considérer que si n / N est inférieur à 5 %, l’erreur reste souvent modérée. En revanche, au delà, la correction de population finie devient trop importante pour être ignorée. Dans les audits, dans les petits lots ou lorsque les décisions sont sensibles, il vaut mieux rester sur la loi hypergéométrique exacte.
Méthode de lecture du graphique
Le graphique produit par le calculateur représente la distribution des probabilités selon le nombre de succès observés. Le pic se situe généralement autour de l’espérance n × K / N. Si la distribution est resserrée, les résultats sont assez prévisibles. Si elle est plus étalée, l’incertitude est plus forte. Pour des valeurs extrêmes de x, les probabilités chutent rapidement, ce qui rend les événements rares faciles à visualiser.
- Repérez la moyenne théorique pour savoir où se concentre la masse de probabilité.
- Observez l’asymétrie éventuelle lorsque K est très faible ou très élevé.
- Comparez votre seuil cible au coeur de la distribution.
- Interprétez ensuite la probabilité cumulée si la décision dépend d’un seuil minimal ou maximal.
Erreurs fréquentes dans les calculs de tirages successifs sans remise
- Confondre combinaison et arrangement ordonné.
- Utiliser une binomiale alors que les tirages sont sans remise.
- Choisir une valeur de x impossible au regard des bornes théoriques.
- Calculer des factorielles géantes sans passer par des logarithmes.
- Oublier qu’un même ensemble de cartes ou de pièces peut être compté différemment selon que l’ordre importe ou non.
Combinaisons versus séquences ordonnées
Le calculateur affiche aussi le nombre de séquences ordonnées possibles, c’est à dire le nombre d’arrangements de n tirages distincts parmi N éléments. Cette grandeur vaut N! / (N – n)!. Elle est utile pour comprendre l’ampleur du problème combinatoire. Attention toutefois : pour la loi hypergéométrique, l’ordre des tirages n’intervient pas dans la formule finale de probabilité. On travaille donc avec des combinaisons d’échantillons et non avec toutes les séquences ordonnées.
Applications concrètes à forte valeur métier
Le calcul grand nombre tirage successif sans remise est très utilisé dans des domaines où les décisions doivent être justifiées mathématiquement :
- Industrie : plans de contrôle de lots, acceptation ou rejet de production.
- Santé publique : échantillonnage de dossiers, revues de conformité, analyses de stocks limités.
- Banque et assurance : audits de dossiers de crédit ou de sinistres.
- Jeux de cartes et loteries : calculs exacts d’événements sur population finie.
- Recherche : sélection d’unités dans de petites bases de données ou études expérimentales fermées.
Sources d’autorité pour aller plus loin
Pour approfondir le sujet avec des références reconnues, consultez notamment :
- NIST Engineering Statistics Handbook pour les méthodes statistiques et l’échantillonnage.
- Penn State University, STAT 414 pour un cours clair sur les distributions discrètes dont l’hypergéométrique.
- U.S. Census Bureau pour des ressources sur les principes d’échantillonnage et de population finie.
Conclusion
Dès qu’il y a tirage successif sans remise, le bon réflexe est d’utiliser la loi hypergéométrique. Si les effectifs sont petits, on peut parfois effectuer quelques calculs à la main. Mais pour des grands nombres, une méthode numérique stable devient indispensable. Le calculateur présenté ici répond précisément à cet enjeu : il vérifie les bornes, calcule la probabilité exacte ou cumulée, affiche des indicateurs de synthèse, et visualise la distribution complète. Vous pouvez ainsi passer d’un raisonnement théorique à une décision opérationnelle rapide, solide et interprétable.