Outil statistique premium

Calcul de l’inverse du ratio de Mills

Calculez instantanément l’inverse du ratio de Mills à partir d’un score z, comparez la queue supérieure et la queue inférieure de la loi normale standard, et visualisez la sensibilité du résultat sur un graphique interactif.

Calculatrice

Entrez vos paramètres ci-dessous. L’outil calcule la densité normale standard, la fonction de répartition, puis l’inverse du ratio de Mills selon la queue choisie.

Score z

Exemple: 0, 1.96, -0.75

Type de queue

Choix fréquent dans les modèles de sélection et de censures

Décimales

Format d’affichage des résultats

Plage du graphique

Ajuste la fenêtre d’observation du graphique

Contexte d’interprétation

Ce choix n’affecte pas la formule, mais enrichit l’explication affichée.

φ(z) = densité de la loi normale standard
Φ(z) = probabilité cumulée jusqu’à z
IMR supérieur = φ(z) / (1 – Φ(z))
IMR inférieur = φ(z) / Φ(z)

Résultats

Après calcul, vous verrez ici la valeur de l’inverse du ratio de Mills, les composantes intermédiaires et une interprétation appliquée.

Guide expert du calcul de l’inverse du ratio de Mills

Le calcul de l’inverse du ratio de Mills occupe une place importante dans l’économétrie appliquée, la statistique des données tronquées et les modèles de sélection. Même si l’expression paraît technique, son principe est simple: on combine la densité de la loi normale standard, notée φ(z), et sa fonction de répartition cumulée, notée Φ(z), pour corriger ou interpréter des phénomènes où l’observation des données dépend d’un seuil. Dans la pratique, cette quantité est souvent utilisée dans les modèles de Heckman, dans certaines variantes de probit, dans l’étude des variables censurées et dans des problèmes de sélection non aléatoire des observations.

En français, on parle souvent d’inverse du ratio de Mills pour désigner une fonction qui prend la forme φ(z) / Φ(z) ou φ(z) / (1 – Φ(z)) selon la convention adoptée. Les deux formes apparaissent dans la littérature. La différence dépend de la façon dont on définit la sélection, la queue de distribution et le seuil de coupure. Pour cette raison, une bonne calculatrice doit offrir explicitement le choix entre la queue inférieure et la queue supérieure. C’est exactement ce que fait l’outil ci-dessus.

Idée centrale: plus la probabilité d’être dans la zone retenue devient faible, plus l’inverse du ratio de Mills tend à devenir élevé. Cette propriété explique son rôle dans les mécanismes de correction du biais de sélection.

Définition mathématique

Pour une variable aléatoire normale standard Z, la densité est donnée par φ(z) = (1 / √(2π)) e^-z²/2. La fonction de répartition cumulée est Φ(z), c’est-à-dire la probabilité que Z soit inférieure ou égale à z. À partir de ces deux éléments, on définit deux variantes usuelles:

Queue inférieure: λ_L(z) = φ(z) / Φ(z)
Queue supérieure: λ_U(z) = φ(z) / (1 – Φ(z))

Ces expressions sont très proches conceptuellement, mais elles ne racontent pas la même histoire. La version inférieure est pertinente quand l’événement d’intérêt est lié à la partie gauche de la distribution. La version supérieure s’utilise lorsque la sélection s’effectue au-dessus d’un seuil. Dans un modèle empirique, choisir la mauvaise convention peut conduire à une interprétation erronée du signe, du niveau de risque ou de la correction du biais.

Comment effectuer le calcul pas à pas

Choisir un score z, qui représente la position d’une observation sur la loi normale standard.
Calculer la densité φ(z) à ce point.
Calculer la probabilité cumulée Φ(z).
Sélectionner la queue adaptée au problème: inférieure ou supérieure.
Appliquer la formule correspondante pour obtenir l’inverse du ratio de Mills.
Interpréter la valeur dans le contexte du modèle étudié.

Supposons z = 1. Pour la loi normale standard, on a approximativement φ(1) = 0.241971 et Φ(1) = 0.841345. La version queue supérieure vaut donc 0.241971 / (1 – 0.841345), soit environ 1.525135. La version queue inférieure vaut 0.241971 / 0.841345, soit environ 0.287600. On voit immédiatement que les deux conventions conduisent à des ordres de grandeur très différents.

Pourquoi cette fonction est-elle si utile en économétrie

L’inverse du ratio de Mills est célèbre parce qu’il sert à corriger un biais de sélection. Dans de nombreux jeux de données, les observations visibles ne sont pas tirées aléatoirement de la population complète. Par exemple, le salaire n’est observé que pour les personnes en emploi, le montant d’emprunt n’est observé que pour les dossiers acceptés, ou encore une variable de santé n’est mesurée que pour les patients qui atteignent une étape précise du protocole. Si cette sélection dépend de facteurs corrélés avec le résultat étudié, une régression simple produit des estimations biaisées.

Le modèle de Heckman est l’exemple classique. Dans sa première étape, on estime une équation de sélection, souvent avec un probit. Cette équation produit une valeur de z pour chaque observation. Dans la seconde étape, on introduit l’inverse du ratio de Mills comme terme additionnel dans l’équation de résultat. Si son coefficient est statistiquement significatif, cela suggère une sélection non aléatoire. L’outil n’est donc pas seulement un calcul numérique; il devient un objet d’interprétation causale et un diagnostic de structure de l’échantillon.

Applications concrètes

Analyse du marché du travail, lorsque certains revenus ne sont observés que pour les individus actifs.
Finance et crédit, quand les contrats ne sont visibles que pour les demandes acceptées.
Santé publique, pour corriger des biais de participation ou de suivi dans certaines enquêtes.
Recherche marketing, lorsque seules les personnes ayant répondu à une offre sont mesurées.
Études d’éducation, quand certaines performances ne sont observées que pour un sous-groupe sélectionné.

Tableau de référence: valeurs courantes selon le score z

Le tableau suivant présente des statistiques usuelles de la loi normale standard et les deux formes de l’inverse du ratio de Mills. Ces valeurs sont très utiles pour vérifier rapidement si un calcul semble cohérent.

Score z	φ(z)	Φ(z)	IMR queue inférieure φ(z)/Φ(z)	IMR queue supérieure φ(z)/(1 – Φ(z))
-2.0	0.053991	0.022750	2.373216	0.055248
-1.0	0.241971	0.158655	1.525135	0.287600
0.0	0.398942	0.500000	0.797885	0.797885
1.0	0.241971	0.841345	0.287600	1.525135
2.0	0.053991	0.977250	0.055248	2.373216

Plus z devient positif, plus l’IMR de la queue supérieure augmente car la probabilité de dépasser z diminue rapidement. À l’inverse, l’IMR de la queue inférieure se contracte. La symétrie de la loi normale standard fait que λ_U(z) = λ_L(-z). Cette propriété est pratique pour contrôler la cohérence des résultats.

Interprétation économique et statistique

Une valeur élevée de l’inverse du ratio de Mills signale en général que l’observation se situe dans une région de faible probabilité conditionnelle par rapport à la queue considérée. En économétrie appliquée, cela peut indiquer qu’une observation visible dans l’échantillon est associée à un mécanisme de sélection fort. Si vous travaillez avec la queue supérieure et que z est grand, l’IMR sera souvent élevé car très peu d’observations dépassent ce seuil. Cette rareté se traduit par une correction plus marquée.

À l’inverse, lorsque z est proche de zéro, les deux versions de l’IMR convergent vers environ 0.797885. C’est un point de repère utile. En phase de diagnostic, si vos calculs à z = 0 donnent un résultat très différent de 0.797885, il y a probablement une erreur de formule, d’arrondi ou de convention de queue.

Erreurs fréquentes à éviter

Confondre la queue supérieure et la queue inférieure.
Utiliser Φ(z) quand il faudrait 1 – Φ(z), ou inversement.
Employer un score z non standardisé sans l’ajuster correctement.
Interpréter l’IMR comme une probabilité. Ce n’est pas une probabilité, mais un ratio de fonctions de la normale.
Négliger les problèmes numériques pour les z très extrêmes.

Comparaison avec des seuils courants en analyse statistique

De nombreux praticiens rencontrent indirectement l’inverse du ratio de Mills à des seuils associés aux niveaux de confiance habituels. Le tableau suivant relie quelques quantiles usuels à la queue supérieure de la loi normale standard.

Niveau usuel	Quantile z	Probabilité de queue supérieure	φ(z)	IMR queue supérieure
90 % bilatéral	1.645	0.0500	0.103111	2.062220
95 % bilatéral	1.960	0.0250	0.058441	2.337640
99 % bilatéral	2.576	0.0050	0.014459	2.891800

Ces chiffres montrent un phénomène important: lorsque l’on s’aventure dans les extrémités de la distribution normale, la probabilité de queue baisse plus vite que la densité au point. Le ratio augmente donc de façon nette. C’est précisément cette sensibilité qui rend l’IMR si informatif dans les modèles où l’accès aux observations dépend d’un seuil dur.

Bonnes pratiques de modélisation

Pour utiliser correctement l’inverse du ratio de Mills dans un travail empirique, il faut d’abord documenter clairement la règle de sélection. Ensuite, il faut expliciter la convention de queue. Enfin, il est indispensable de vérifier l’échelle du score z. Un z-score obtenu à partir d’un probit n’a de sens qu’en lien avec la loi normale standard. Si le score provient d’un autre modèle ou d’une transformation non standard, il faut valider l’équivalence avant d’appliquer la formule.

Définissez explicitement le mécanisme de sélection.
Choisissez la convention de queue compatible avec ce mécanisme.
Standardisez ou vérifiez le score z.
Contrôlez la stabilité numérique pour les valeurs extrêmes.
Interprétez l’IMR avec le coefficient estimé dans le modèle final.

Sources académiques et institutionnelles recommandées

Pour approfondir les fondements statistiques de la loi normale et les modèles de sélection, consultez des références reconnues. Voici trois ressources fiables:

Quand utiliser cette calculatrice

Cette calculatrice est utile dans plusieurs situations. Elle convient d’abord à l’enseignement, lorsqu’il faut montrer comment une simple combinaison de φ(z) et Φ(z) produit un terme de correction. Elle est également très pratique en analyse empirique, quand on veut vérifier rapidement un score z issu d’un probit ou d’un modèle de sélection. Enfin, elle sert d’outil de validation, par exemple pour comparer des résultats obtenus dans un logiciel économétrique avec un calcul indépendant et transparent.

L’affichage simultané de la densité, de la probabilité cumulée et du ratio vous aide à comprendre la mécanique du résultat. Le graphique montre quant à lui comment la valeur évolue selon z. C’est particulièrement utile pour visualiser la non-linéarité du phénomène. Une petite variation de z près des extrémités peut changer sensiblement l’IMR, alors qu’un mouvement comparable autour de zéro aura souvent un effet plus modéré.

Résumé opérationnel

Si vous devez retenir l’essentiel, retenez ceci: l’inverse du ratio de Mills est une fonction de la loi normale standard utilisée pour corriger ou interpréter la sélection. La formule dépend de la queue choisie, le score z doit être correctement défini, et la valeur obtenue n’est pas une probabilité mais un ratio fonctionnel. Plus la zone étudiée est rare, plus le ratio a tendance à s’élever. En pratique, cet outil est indispensable dès que l’observabilité des données n’est pas aléatoire.

Calcul De L Inverse Du Ratio De Mills