Algorithmes permettant de calculer la matrice homographique
Entrez 4 correspondances de points entre un plan source et un plan destination, choisissez l’algorithme, puis calculez la matrice homographique 3×3, les erreurs de reprojection et une visualisation graphique instantanée.
Correspondance 1
Correspondance 2
Correspondance 3
Correspondance 4
Résultats
Cliquez sur le bouton de calcul pour générer la matrice homographique, les erreurs de reprojection et le graphique.
Comprendre les algorithmes qui permettent de calculer la matrice homographique
La matrice homographique, souvent notée H, est un outil central en vision par ordinateur, en photogrammétrie, en robotique mobile, en réalité augmentée et dans de nombreux pipelines de recalage d’images. Quand on parle d’algorithmes permettant de calculer la matrice homographique, on parle en réalité d’une famille de méthodes numériques et géométriques utilisées pour déduire une transformation projective entre deux plans à partir de points correspondants. Une homographie est une matrice 3×3 définie à un facteur d’échelle près, ce qui signifie qu’elle possède 8 degrés de liberté. En pratique, cela explique pourquoi il faut au minimum 4 correspondances de points non colinéaires pour la déterminer.
Dans un contexte d’application concret, l’homographie sert à corriger une perspective, faire le redressement d’un document, recaler deux vues d’une même façade, projeter un plan de terrain de sport dans l’image, détecter la position d’un marqueur ou encore créer un panorama. La qualité du résultat dépend fortement de l’algorithme choisi, de la qualité des points, du niveau de bruit, de la présence d’outliers et du prétraitement numérique. C’est précisément pour cela qu’on distingue plusieurs approches : le DLT classique, le DLT normalisé, les variantes robustes avec RANSAC, et des raffinements basés sur la minimisation de l’erreur de reprojection.
Point clé : une matrice homographique modélise la relation entre deux vues d’un même plan, ou entre deux images prises par rotation pure de la caméra. Si la scène n’est pas planaire et qu’il existe de fortes profondeurs relatives, l’homographie ne sera qu’une approximation locale.
Définition mathématique de la matrice homographique
Si un point source est exprimé en coordonnées homogènes par x = [x, y, 1]ᵀ et son point destination par x’ = [u, v, 1]ᵀ, alors la relation projective s’écrit :
x’ ~ Hx
Le symbole ~ signifie “égal à un facteur d’échelle près”. La matrice homographique prend la forme :
H = [h11 h12 h13; h21 h22 h23; h31 h32 h33]
Après multiplication, les coordonnées cartésiennes s’obtiennent via la division perspective :
- u = (h11x + h12y + h13) / (h31x + h32y + h33)
- v = (h21x + h22y + h23) / (h31x + h32y + h33)
Comme H est définie à un facteur près, il est fréquent de fixer h33 = 1 pour résoudre un système linéaire minimal lorsqu’on dispose exactement de 4 correspondances valides.
Les principaux algorithmes de calcul d’une homographie
1. DLT classique
Le Direct Linear Transform est l’algorithme le plus enseigné pour calculer une homographie. Il convertit les équations projectives en un système linéaire. Pour chaque correspondance de points, on obtient deux équations indépendantes. Avec 4 paires de points, on forme donc 8 équations pour 8 inconnues si l’on fixe h33 à 1. Le DLT est rapide, intuitif et très utile pour comprendre le problème.
Son principal inconvénient est sa sensibilité à l’échelle des coordonnées. Si les points source et destination ont des amplitudes très différentes, le système peut être mal conditionné numériquement. Cela dégrade la précision du calcul, surtout en présence de bruit ou de coordonnées pixel très élevées.
2. DLT normalisé
Le DLT normalisé, popularisé dans la littérature de géométrie multi-vue, améliore la stabilité numérique. L’idée est simple : avant de résoudre le système, on translate les points pour centrer leur barycentre à l’origine, puis on les met à l’échelle de façon à obtenir une distance moyenne de √2 à l’origine. Cette normalisation est faite séparément pour les points source et destination. Ensuite, on calcule l’homographie dans cet espace normalisé, puis on dénormalise le résultat.
Cette approche est souvent préférée en production parce qu’elle réduit les problèmes de conditionnement et améliore la précision de l’estimation, sans coût algorithmique important.
3. RANSAC pour les données bruitées et contaminées
Quand les correspondances proviennent d’un détecteur automatique de points d’intérêt, toutes ne sont pas correctes. On parle alors d’outliers. Dans ce cas, un simple DLT échoue souvent. La réponse la plus courante est d’utiliser RANSAC. L’algorithme sélectionne aléatoirement des sous-ensembles minimaux de 4 correspondances, calcule une homographie candidate, puis mesure combien de points deviennent des inliers en dessous d’un seuil d’erreur de reprojection.
La meilleure hypothèse est ensuite raffinée, souvent avec un DLT sur les inliers uniquement, voire avec une optimisation non linéaire. RANSAC est particulièrement efficace quand le taux d’outliers est significatif, mais sa performance dépend du nombre d’itérations, du seuil et du niveau de confiance désiré.
4. Raffinement par minimisation de l’erreur de reprojection
Le DLT fournit une estimation initiale. Pour obtenir une matrice plus fidèle aux observations, on peut ensuite minimiser l’erreur géométrique, c’est-à-dire la distance entre les points observés et les points projetés par H. Cette étape, souvent réalisée par une méthode du type Levenberg-Marquardt, est plus coûteuse mais généralement plus précise. Elle est standard dans les chaînes de calcul professionnelles lorsque la précision métrique compte réellement.
Tableau comparatif des méthodes
| Méthode | Points minimum | Degrés de liberté estimés | Résistance aux outliers | Usage typique |
|---|---|---|---|---|
| DLT classique | 4 | 8 | Faible | Cas propres, démonstration, petits outils |
| DLT normalisé | 4 | 8 | Faible | Estimation stable en coordonnées réelles ou pixels |
| RANSAC + DLT | 4 par hypothèse | 8 | Élevée | Matching automatique avec faux appariements |
| Raffinement non linéaire | 4+ | 8 | Dépend de l’initialisation | Calibration précise, AR, photogrammétrie |
Statistiques pratiques sur RANSAC
Le nombre d’itérations RANSAC nécessaires pour atteindre une confiance donnée dépend de la proportion d’inliers. Pour une homographie, la taille minimale d’un échantillon est de 4. La formule usuelle est :
N = log(1 – p) / log(1 – w⁴)
où p est la confiance souhaitée et w la proportion d’inliers. Voici quelques valeurs concrètes pour une confiance de 99 % :
| Taux d’inliers | Taux d’outliers | Échantillon minimal | Itérations RANSAC pour 99 % |
|---|---|---|---|
| 90 % | 10 % | 4 | ≈ 5 |
| 70 % | 30 % | 4 | ≈ 17 |
| 50 % | 50 % | 4 | ≈ 72 |
| 30 % | 70 % | 4 | ≈ 567 |
Ces statistiques montrent pourquoi RANSAC reste performant quand la qualité des correspondances est bonne, mais peut devenir coûteux quand la proportion d’outliers explose. Dans des scènes complexes ou des appariements SIFT/ORB peu filtrés, cette réalité a un impact immédiat sur le temps de traitement.
Comment savoir si une homographie est valide ?
Le calcul numérique d’une matrice n’est pas suffisant en soi. Il faut ensuite vérifier plusieurs points :
- Les 4 points source ne doivent pas être colinéaires.
- Les 4 points destination ne doivent pas être colinéaires.
- Le dénominateur projectif h31x + h32y + h33 ne doit pas tendre vers zéro sur la zone d’intérêt.
- L’erreur de reprojection doit être faible et cohérente sur les inliers.
- La transformation doit être plausible visuellement et physiquement.
En pratique, on regarde souvent l’erreur moyenne de reprojection en pixels. Pour du recalage d’images de bonne qualité, une erreur moyenne comprise entre 0,5 et 3 pixels peut déjà être très correcte selon la résolution, la focale, la texture et la méthode d’extraction des points. Dans des systèmes métrologiques, les exigences peuvent être beaucoup plus strictes.
Étapes recommandées dans un pipeline professionnel
- Détection de points d’intérêt ou sélection manuelle de points fiables.
- Appariement entre image source et image destination.
- Filtrage initial des correspondances aberrantes.
- Estimation robuste par RANSAC si les données sont bruitées.
- Calcul d’une homographie initiale par DLT ou DLT normalisé.
- Raffinement par minimisation de l’erreur de reprojection.
- Validation géométrique et inspection visuelle.
Pourquoi le DLT normalisé est souvent le meilleur point de départ
Dans de nombreux cas réels, les coordonnées source et destination ne vivent pas à la même échelle. Par exemple, un plan objet peut être exprimé en mètres ou en millimètres, alors que l’image cible est exprimée en pixels. Le DLT normalisé réduit cette dissymétrie et stabilise le problème. Il reste simple à implémenter, rapide à exécuter, et suffisamment précis pour constituer une excellente base de travail avant un raffinement non linéaire éventuel.
Le calculateur ci-dessus met justement en évidence cette logique : avec les mêmes correspondances, vous pouvez comparer l’estimation DLT directe et l’estimation DLT normalisée. Lorsque les coordonnées sont bien choisies, les deux résultats peuvent sembler proches. Mais sur des données plus difficiles, le DLT normalisé est généralement préférable.
Cas d’usage concrets de l’homographie
Redressement de documents
Quand une page est photographiée en biais, l’homographie permet de projeter les 4 coins vers un rectangle régulier. C’est la base de nombreux scanners mobiles et applications de traitement documentaire.
Réalité augmentée
Sur un marqueur planaire, l’homographie permet d’estimer rapidement la relation entre le plan du marqueur et l’image caméra. C’est l’une des briques historiques de l’AR basée sur cibles planes.
Assemblage panoramique
Si la caméra effectue principalement une rotation, une homographie peut relier deux vues successives. On peut alors aligner les images et les fusionner dans une mosaïque cohérente.
Analyse sportive et top view
Dans le suivi de terrain, on mappe l’image vidéo vers une vue zénithale du sol. Cela permet d’estimer positions, distances et zones occupées sur un plan connu.
Ressources académiques et institutionnelles utiles
Pour approfondir le sujet avec des sources fiables, vous pouvez consulter :
- MIT Vision Book – Homography
- Stanford – Projective Geometry and Homographies
- NIST – Computer Vision Program Resources
Conclusion
Pour répondre clairement à la question “quels algorithmes permettent de calculer la matrice homographique ?”, les méthodes de référence sont le DLT, le DLT normalisé, les approches robustes type RANSAC et les raffinements non linéaires basés sur l’erreur de reprojection. Le meilleur choix dépend du contexte : qualité des correspondances, présence d’outliers, exigence de précision, budget de calcul et caractère plan de la scène.
Si vous avez 4 points fiables et soigneusement sélectionnés, un calcul direct est parfaitement valable. Si vos points viennent d’un appariement automatique, vous aurez presque toujours intérêt à passer par une estimation robuste. Et si la précision est critique, un raffinement géométrique devient incontournable. En résumé, l’homographie n’est pas seulement une matrice 3×3 : c’est un composant fondamental de la géométrie projective appliquée, et son estimation correcte repose sur des choix algorithmiques adaptés au terrain.