Calcul entropie mutuelle

Calculez rapidement l’information mutuelle entre deux variables binaires à partir d’un tableau de contingence 2×2. Cet outil estime l’intensité de dépendance entre X et Y, affiche les probabilités marginales, l’entropie de chaque variable, l’information mutuelle, ainsi qu’une visualisation des contributions de chaque cellule.

Analyse statistique Information theory Tableau 2×2 Graphique interactif

Calculatrice interactive

Saisissez les effectifs observés pour chaque combinaison de X et Y, puis choisissez la base du logarithme pour exprimer le résultat en bits, nats ou bans.

Données d’entrée

Cellule X=0, Y=0

Cellule X=0, Y=1

Cellule X=1, Y=0

Cellule X=1, Y=1

Base du logarithme

Décimales d’affichage

Rappel de la formule : I(X;Y) = Σ p(x,y) log[p(x,y) / (p(x)p(y))]. Si une cellule vaut 0, sa contribution est traitée comme 0.

	Y=0	Y=1
X=0	40	10
X=1	15	35

Résultats

Prêt pour le calcul

Entrez vos effectifs, puis cliquez sur Calculer pour obtenir l’entropie mutuelle, les entropies marginales et l’indicateur normalisé.

Guide expert du calcul d’entropie mutuelle

Le calcul d’entropie mutuelle, souvent associé à l’information mutuelle, est un outil fondamental de la théorie de l’information, des statistiques, de l’apprentissage automatique et de l’analyse de signaux. Il mesure combien la connaissance d’une variable réduit l’incertitude sur une autre. En pratique, cette quantité répond à une question simple mais puissante : dans quelle mesure X et Y partagent-elles de l’information ? Plus l’information mutuelle est élevée, plus les variables sont dépendantes. Lorsqu’elle est nulle, les variables sont indépendantes au sens probabiliste.

Cette mesure a été popularisée dans le cadre posé par Claude Shannon, dont les travaux ont structuré les fondations de la théorie de l’information moderne. Aujourd’hui, elle est utilisée dans des domaines très divers : sélection de variables en machine learning, génomique, traitement d’image, cybersécurité, sciences cognitives, neurosciences et compression de données. Contrairement à une simple corrélation linéaire, l’entropie mutuelle peut détecter des relations non linéaires, ce qui la rend particulièrement utile lorsque les données ne suivent pas un schéma simple.

Définition mathématique

Pour deux variables aléatoires discrètes X et Y, l’information mutuelle se définit par :

I(X;Y) = Σ p(x,y) log [ p(x,y) / (p(x)p(y)) ]

Cette formule compare la probabilité conjointe observée à la probabilité conjointe qui serait attendue si X et Y étaient indépendantes. Si la probabilité conjointe réelle est très différente du produit des marginales, la contribution à l’information mutuelle devient importante. Le logarithme peut être pris en base 2 pour obtenir des bits, en base e pour obtenir des nats, ou en base 10 pour obtenir des bans.

Pourquoi cette métrique est-elle si utile ?

Elle détecte aussi bien les dépendances linéaires que non linéaires.
Elle ne suppose pas une distribution gaussienne des données.
Elle est symétrique : I(X;Y) = I(Y;X).
Elle vaut toujours 0 ou plus pour des distributions discrètes exactes.
Elle peut être reliée à l’entropie de chaque variable et à l’entropie jointe.

On peut aussi écrire l’information mutuelle sous plusieurs formes équivalentes :

I(X;Y) = H(X) – H(X|Y)
I(X;Y) = H(Y) – H(Y|X)
I(X;Y) = H(X) + H(Y) – H(X,Y)

Ces identités montrent clairement le sens de la mesure : l’information mutuelle correspond à la baisse d’incertitude sur X lorsque l’on connaît Y, ou inversement. Si connaître Y n’apporte rien sur X, alors H(X|Y) est proche de H(X), et I(X;Y) devient nulle.

Interprétation concrète dans un tableau 2×2

Dans la calculatrice ci-dessus, vous saisissez quatre effectifs correspondant à un tableau de contingence binaire. Après normalisation par le total, ces effectifs deviennent des probabilités conjointes. L’algorithme calcule ensuite :

Le total des observations.
Les probabilités conjointes p(0,0), p(0,1), p(1,0), p(1,1).
Les probabilités marginales p(X=0), p(X=1), p(Y=0), p(Y=1).
Les contributions individuelles de chaque cellule à I(X;Y).
L’entropie de X et celle de Y.
Une version normalisée pour aider à comparer des jeux de données de tailles différentes.

Si vos observations sont parfaitement indépendantes, alors chaque cellule sera approximativement égale au produit de la ligne et de la colonne correspondantes. L’information mutuelle sera alors proche de 0. Si au contraire certaines combinaisons apparaissent beaucoup plus fréquemment que prévu sous indépendance, l’information mutuelle augmente.

Différence entre corrélation, khi-deux et entropie mutuelle

De nombreux utilisateurs confondent ces indicateurs. Pourtant, ils répondent à des objectifs distincts. La corrélation de Pearson évalue surtout la relation linéaire entre deux variables numériques. Le test du khi-deux mesure l’écart entre effectifs observés et attendus, souvent dans une logique d’hypothèse statistique. L’entropie mutuelle mesure directement la quantité d’information partagée, sans se limiter à une relation linéaire.

Métrique	Type de relation détectée	Variables adaptées	Interprétation
Corrélation de Pearson	Linéaire	Numériques continues	Force et sens d’une relation linéaire
Khi-deux	Dépendance globale sur tableaux de contingence	Catégorielles	Écart observé versus attendu sous indépendance
Information mutuelle	Linéaire et non linéaire	Discrètes et versions estimées pour continues	Quantité d’information partagée entre X et Y

Données de contexte et statistiques réelles

Pour situer l’intérêt de la théorie de l’information, il est utile de rappeler quelques ordres de grandeur réels issus d’organismes de référence. Les statistiques ci-dessous ne sont pas des valeurs d’entropie mutuelle, mais elles illustrent la montée en puissance des domaines où cette mesure est employée : science des données, communication numérique et calcul haute performance.

Indicateur réel	Valeur	Source	Pourquoi c’est pertinent
Part des ménages américains utilisant Internet	Environ 92% en 2023	U.S. Census Bureau	La théorie de l’information reste au cœur des réseaux, de la transmission et de la compression.
Taille typique des ensembles de données scientifiques nationaux	De plusieurs téraoctets à pétaoctets selon les projets	DOE et laboratoires nationaux	Les métriques informationnelles servent à filtrer, résumer et sélectionner les variables utiles.
Volume de données étudiées en génomique	Des millions à des milliards de bases par projet	NIH	L’information mutuelle aide à détecter des dépendances complexes entre marqueurs biologiques.

Dans les applications biomédicales, il est courant d’utiliser l’information mutuelle pour estimer la redondance entre caractéristiques ou pour identifier les gènes les plus informatifs vis-à-vis d’un phénotype. En vision par ordinateur, elle intervient dans l’alignement d’images multimodales, car elle peut comparer deux images même lorsque les intensités ne sont pas directement proportionnelles. En cybersécurité, elle aide à détecter des motifs de dépendance entre événements réseau. En NLP, elle sert à mesurer l’association entre termes et classes.

Comment calculer correctement l’entropie mutuelle

Constituer un tableau valide : les quatre cellules doivent être des effectifs ou des probabilités non négatives.
Vérifier le total : il doit être strictement positif. Sans observations, aucun calcul n’est possible.
Calculer les marginales : somme des lignes et somme des colonnes.
Transformer en probabilités : chaque cellule divisée par le total.
Évaluer les contributions : pour chaque cellule positive, appliquer p(x,y) log[p(x,y)/(p(x)p(y))].
Sommer les contributions : on obtient I(X;Y).
Interpréter l’échelle : le sens dépend de la base du log et de l’entropie des variables.

Exemple d’interprétation rapide

Supposons un tableau où X et Y sont presque alignées, par exemple beaucoup de cas dans les cellules (0,0) et (1,1), et peu de cas dans (0,1) et (1,0). L’information mutuelle sera généralement positive et relativement élevée. Cela indique que la connaissance de X donne de l’information sur Y. À l’inverse, si les fréquences sont réparties de manière proche des attentes sous indépendance, le score sera bas.

Information mutuelle normalisée

L’information mutuelle brute peut être difficile à comparer entre différents jeux de données, car sa valeur maximale dépend de l’entropie des variables. C’est pourquoi on calcule souvent une information mutuelle normalisée, par exemple en divisant I(X;Y) par la moyenne des entropies H(X) et H(Y), ou par leur minimum. Une valeur normalisée proche de 1 suggère une très forte dépendance relative, tandis qu’une valeur proche de 0 traduit une faible dépendance.

Erreurs fréquentes à éviter

Confondre effectifs bruts et probabilités sans normalisation.
Oublier que des cellules nulles ont une contribution nulle, pas une contribution négative infinie.
Comparer des résultats exprimés dans des bases logarithmiques différentes.
Interpréter l’information mutuelle comme une causalité.
Utiliser un échantillon trop petit, ce qui peut rendre l’estimation instable.

Cas d’usage en data science

En sélection de variables, l’entropie mutuelle permet d’identifier les attributs qui partagent le plus d’information avec une variable cible. C’est utile lorsque la relation n’est pas monotone ou linéaire. De nombreuses bibliothèques modernes implémentent des variantes de cette approche, car elle capte des interactions que des coefficients plus simples peuvent manquer. Dans des pipelines industriels, on peut l’utiliser avant un modèle plus complexe pour réduire la dimension, améliorer la robustesse et accélérer l’entraînement.

Cas d’usage en traitement d’image et signal

En recalage d’images, notamment en imagerie médicale, l’information mutuelle est très appréciée. Si deux modalités d’imagerie n’ont pas des intensités directement comparables, une métrique d’écart classique peut échouer. L’information mutuelle, elle, se concentre sur la dépendance statistique des distributions d’intensité. C’est l’une des raisons pour lesquelles elle reste une référence dans les problèmes d’alignement multimodal.

Comparaison de niveaux de dépendance

Situation	Répartition typique du tableau 2×2	Information mutuelle attendue	Lecture pratique
Indépendance quasi parfaite	Proche des produits de marginales	Très proche de 0	X n’apporte presque rien sur Y
Dépendance modérée	Excès sur une diagonale ou une anti-diagonale	Faible à moyenne	Une variable réduit partiellement l’incertitude sur l’autre
Dépendance forte	Concentration élevée sur deux cellules cohérentes	Élevée relativement aux entropies marginales	X et Y partagent beaucoup d’information

Sources d’autorité pour approfondir

Pour des références fiables sur la théorie de l’information, la statistique appliquée et l’usage des données, vous pouvez consulter des institutions académiques et gouvernementales :

Conclusion

Le calcul d’entropie mutuelle est bien plus qu’un simple exercice mathématique. C’est une manière rigoureuse de quantifier la dépendance entre deux variables dans des contextes où les outils linéaires classiques atteignent leurs limites. Avec une table 2×2, l’interprétation est déjà très parlante : on voit immédiatement quelles combinaisons contribuent le plus à l’information partagée. Dans des applications plus larges, cette mesure devient un levier puissant pour la sélection de caractéristiques, la détection de structure, le recalage d’images et l’analyse de systèmes complexes. Utilisez la calculatrice ci-dessus pour obtenir rapidement une estimation fiable, puis complétez votre lecture par les entropies marginales et la visualisation graphique afin d’interpréter le résultat avec précision.

Note méthodologique : l’outil ci-dessus calcule l’information mutuelle pour deux variables binaires à partir d’effectifs observés. Pour des variables continues ou à grand nombre de modalités, une estimation par discrétisation, noyaux ou k plus proches voisins peut être préférable selon le contexte analytique.

Calcul Entropie Mutuelle