Calcul distance génique

Estimez rapidement la distance génétique entre deux loci à partir du taux de recombinaison ou du nombre de descendants recombinants. Ce calculateur applique les approches de base en centiMorgans, ainsi que les fonctions de cartographie de Haldane et de Kosambi pour une interprétation plus réaliste lorsque des crossing-over multiples peuvent se produire.

Mode de saisie

Choisissez si vous entrez les nombres de descendants parentaux/recombinants, ou directement une fréquence de recombinaison.

Fonction de cartographie

L’approximation simple convient pour de courtes distances. Haldane et Kosambi corrigent le biais lié aux crossing-over multiples.

Nombre de descendants parentaux

Nombre de descendants recombinants

Taux de recombinaison (%)

Contexte d’étude

Résultats

Entrez vos données puis cliquez sur le bouton de calcul pour obtenir la distance génique estimée.

Guide expert du calcul de distance génique

Le calcul de distance génique est une méthode fondamentale de la génétique classique et de la cartographie des chromosomes. Lorsqu’on cherche à savoir à quelle distance deux gènes ou deux marqueurs sont situés l’un de l’autre sur un chromosome, on s’appuie sur la recombinaison observée pendant la méiose. Plus deux loci sont éloignés, plus il est probable qu’un crossing-over se produise entre eux et plus la proportion de descendants recombinants augmente. À l’inverse, des loci très proches ont tendance à être co-transmis et donnent une faible fréquence de recombinaison.

Définition simple de la distance génique

La distance génique, aussi appelée distance génétique, s’exprime généralement en centiMorgans, abrégé cM. Dans l’approximation la plus simple, 1 % de recombinaison correspond à 1 cM. Cela signifie qu’une fréquence de recombinaison de 12 % entre deux marqueurs peut être interprétée comme une distance d’environ 12 cM. Cette relation est très utile à courte distance, mais elle devient moins précise à mesure que la distance réelle augmente, car des crossing-over multiples peuvent survenir sans être tous détectés par une simple observation phénotypique.

En pratique, la distance génique ne correspond pas exactement à une distance physique en paires de bases. Deux régions de même taille physique peuvent présenter des taux de recombinaison différents selon l’espèce, le sexe, l’environnement cellulaire, la présence de points chauds de recombinaison ou encore la structure locale de la chromatine.

Principe biologique derrière le calcul

Au cours de la méiose, les chromosomes homologues peuvent échanger des segments d’ADN. Ce processus, appelé crossing-over, crée de nouvelles combinaisons allélique chez les gamètes. Si deux loci sont proches, il y a peu de chances qu’un crossing-over se produise entre eux. S’ils sont éloignés, cette probabilité augmente. C’est cette relation probabiliste qui permet de déduire une distance génétique à partir des descendants obtenus dans un croisement test.

La fréquence de recombinaison observée ne peut pas dépasser 50 %. À partir de ce seuil, les loci se comportent comme s’ils étaient non liés, soit parce qu’ils sont très éloignés sur le même chromosome, soit parce qu’ils sont situés sur des chromosomes différents.

Formules utilisées en calcul de distance génique

1. Approximation simple

Si vous disposez du nombre de descendants recombinants et du nombre total de descendants, la fréquence de recombinaison se calcule ainsi :

r = recombinants / total

Puis la distance génique approximative est :

distance (cM) = r × 100

2. Fonction de Haldane

La fonction de Haldane suppose que les crossing-over se produisent de manière indépendante, sans interférence. Elle est utile lorsque la distance est plus élevée et que le modèle simple sous-estime la distance réelle :

d = -50 × ln(1 – 2r)

où d est la distance en cM et r la fréquence de recombinaison exprimée entre 0 et 0,5.

3. Fonction de Kosambi

La fonction de Kosambi intègre une certaine interférence entre crossing-over, souvent jugée plus réaliste dans de nombreuses situations biologiques :

d = 25 × ln((1 + 2r) / (1 – 2r))

Selon l’espèce étudiée et la région génomique, Haldane ou Kosambi peut mieux représenter les données expérimentales.

Comment interpréter les résultats

0 à 5 cM : liaison très étroite, faible probabilité de recombinaison entre les loci.
5 à 20 cM : liaison nette, exploitable pour la cartographie.
20 à 40 cM : liaison plus lâche, influence croissante des crossing-over multiples.
40 à 50 cM : zone d’incertitude élevée, proche du comportement non lié.

Il faut garder à l’esprit qu’une distance de 50 cM n’est pas simplement deux fois 25 cM du point de vue du nombre d’événements de recombinaison visibles. Les doubles crossing-over peuvent masquer une partie des événements réels et réduire la fréquence observée. C’est précisément pourquoi les fonctions de cartographie ont été développées.

Exemple pas à pas

Supposons une expérience dans laquelle on observe 820 descendants parentaux et 180 recombinants. Le total est de 1000 individus. La fréquence de recombinaison vaut donc :

Total = 820 + 180 = 1000
r = 180 / 1000 = 0,18
Approximation simple = 18 cM

Si l’on applique Haldane, on obtient une distance légèrement plus grande car le modèle corrige les événements multiples non observés. Avec Kosambi, le résultat est proche mais reflète une hypothèse biologique différente. C’est pourquoi un bon calculateur de distance génique doit afficher à la fois le taux observé et la distance transformée selon la méthode choisie.

Données comparatives utiles en génétique de la recombinaison

Les valeurs ci-dessous illustrent des ordres de grandeur fréquemment cités dans les ressources de génomique et de cartographie. Elles sont utiles pour replacer un résultat de calcul dans un contexte réel. Les statistiques peuvent varier selon les populations, les croisements, les cartes et les méthodes expérimentales, mais elles restent de bons repères pédagogiques.

Espèce / contexte	Taille génome approximative	Longueur génétique totale approximative	Observation utile
Humain	3,2 milliards de paires de bases	Environ 3 300 à 3 700 cM	La recombinaison varie selon le sexe et les régions chromosomiques.
Souris	Environ 2,7 milliards de paires de bases	Environ 1 400 à 1 600 cM	Très utilisée pour les cartes de liaison expérimentales.
Drosophila melanogaster	Environ 140 millions de paires de bases	Environ 280 à 300 cM	Organisme modèle historique pour la cartographie génétique.
Arabidopsis thaliana	Environ 135 millions de paires de bases	Environ 450 à 500 cM	La densité de recombinaison peut être relativement élevée.

Taux de recombinaison observé	Distance simple	Distance Haldane	Distance Kosambi
5 %	5 cM	5,27 cM	5,02 cM
10 %	10 cM	11,16 cM	10,14 cM
20 %	20 cM	25,54 cM	21,18 cM
30 %	30 cM	45,81 cM	34,66 cM
40 %	40 cM	80,47 cM	54,93 cM

Ce second tableau montre bien l’écart croissant entre la formule simple et les fonctions de cartographie lorsque le taux de recombinaison augmente. Plus on se rapproche de 50 %, plus l’estimation naïve tend à comprimer artificiellement la distance réelle.

Quand utiliser Haldane ou Kosambi ?

Haldane

La fonction de Haldane est souvent choisie lorsque l’on suppose que les événements de crossing-over sont distribués aléatoirement et sans interférence. C’est un modèle mathématiquement élégant et historiquement très important. Il peut être utile pour certains jeux de données de laboratoire ou pour des simulations théoriques.

Kosambi

La fonction de Kosambi est fréquemment privilégiée quand on souhaite intégrer le fait qu’un crossing-over puisse influencer la probabilité qu’un second se produise à proximité. Cette interférence est observée dans de nombreuses espèces. En cartographie pratique, Kosambi donne souvent des distances moins extrêmes que Haldane pour des taux élevés.

Limites importantes du calcul de distance génique

Une fréquence de recombinaison observée dépend de la taille de l’échantillon. Plus l’effectif est faible, plus l’incertitude statistique est grande.
Les doubles et triples crossing-over peuvent masquer la distance réelle.
Les cartes génétiques ne sont pas des cartes physiques exactes.
Les points chauds et points froids de recombinaison rendent certaines régions atypiques.
Chez certaines espèces, la recombinaison diffère selon le sexe ou le type cellulaire.

Dans les études modernes, la distance génique classique est souvent combinée à des marqueurs moléculaires, à la cartographie fine, au séquençage et à des approches bioinformatiques avancées. Néanmoins, le calcul de base reste indispensable pour comprendre la logique des cartes de liaison.

Bonnes pratiques pour obtenir une estimation fiable

Utiliser un effectif important afin de réduire la variabilité d’échantillonnage.
Vérifier la qualité du phénotypage ou du génotypage.
Comparer plusieurs fonctions de cartographie lorsque les distances sont modérées ou élevées.
Interpréter les résultats dans le contexte biologique de l’espèce étudiée.
Ne pas confondre proximité physique et proximité génétique.

Si vous travaillez avec des marqueurs espacés sur de longues régions chromosomiques, il est recommandé de considérer les modèles de cartographie plutôt que l’approximation 1 % = 1 cM. À très courte distance, en revanche, la relation simple reste robuste et facile à communiquer.

Sources académiques et institutionnelles recommandées

Pour approfondir la recombinaison, la génétique de liaison et la cartographie, voici des références de haute autorité :

En résumé

Le calcul de distance génique repose sur un principe simple mais puissant : la fréquence de recombinaison révèle la proximité de deux loci sur un chromosome. Pour des distances courtes, on peut directement assimiler le pourcentage de recombinants à des centiMorgans. Pour des distances plus importantes, l’utilisation des fonctions de Haldane ou de Kosambi permet une estimation plus réaliste. Le bon choix dépend de vos hypothèses biologiques, de l’espèce étudiée et de la qualité des données expérimentales.

Le calculateur ci-dessus vous aide à passer rapidement de vos observations expérimentales à une interprétation exploitable, tout en visualisant l’écart entre la fréquence brute et les distances corrigées. C’est un excellent point de départ pour l’analyse de liaison, la construction de cartes génétiques et l’enseignement de la génétique classique.

Calcul Distance G Nique