Calcul Distance En Centimorgan

Calcul distance en centimorgan

Calculez rapidement une distance génétique en centimorgan à partir d’une fréquence de recombinaison ou d’un nombre de recombinants observés. Ce calculateur applique les fonctions de cartographie les plus utilisées en génétique, dont les modèles linéaire, Haldane et Kosambi.

Utilisez une valeur strictement inférieure à 50 %. Au-delà, deux loci ne sont plus distinguables par simple recombinaison.

Guide expert du calcul de distance en centimorgan

Le centimorgan, abrégé cM, est une unité de distance génétique utilisée pour estimer la probabilité qu’une recombinaison se produise entre deux loci au cours de la méiose. En pratique, 1 centimorgan correspond à une fréquence de recombinaison d’environ 1 %, mais cette équivalence simple n’est valable que pour de courtes distances. Dès que les loci sont plus éloignés, des recombinaisons multiples peuvent survenir dans le même intervalle et masquer une partie des événements réels. C’est précisément pour corriger cet effet que les fonctions de cartographie, comme celles de Haldane et de Kosambi, sont utilisées.

Un calcul de distance en centimorgan est central dans plusieurs domaines : cartographie de gènes responsables d’un caractère héréditaire, sélection assistée par marqueurs chez les plantes et les animaux, interprétation des blocs d’ADN partagés en généalogie génétique, ou encore construction de cartes de liaison utilisées en recherche biomédicale. Cette unité ne mesure pas une longueur physique d’ADN, comme la paire de bases, mais une distance probabiliste liée à la fréquence des crossing-over. Autrement dit, deux segments séparés par 10 cM ne sont pas nécessairement espacés par le même nombre de bases selon l’espèce, le chromosome, le sexe ou la région génomique étudiée.

1 cM ≈ 1 % de recombinaison pour les petites distances Distance génétique ≠ distance physique Haldane et Kosambi corrigent les recombinaisons multiples

Définition simple du centimorgan

Si un marqueur A et un marqueur B donnent 1 % de gamètes recombinants, on dit que ces loci sont séparés d’environ 1 cM dans une approximation simple. Lorsque la fréquence observée augmente, cette relation devient de moins en moins linéaire. Pourquoi ? Parce qu’un double crossing-over peut restaurer l’association apparente des allèles parentaux et faire sous-estimer la distance réelle si l’on ne regarde que la proportion finale de recombinants. Le calcul de la distance génétique consiste donc à transformer une fréquence de recombinaison observée en une distance cartographique plus réaliste.

Les trois approches les plus utilisées

  • Approximation linéaire : distance ≈ 100 × r, où r est la fréquence de recombinaison en fraction décimale. Elle est utile pour de petits intervalles.
  • Fonction de Haldane : suppose l’absence d’interférence entre crossing-over. La formule est d = -50 × ln(1 – 2r).
  • Fonction de Kosambi : intègre une interférence partielle et utilise d = 25 × ln((1 + 2r) / (1 – 2r)).

Dans de nombreux travaux de génétique classique et de sélection, Kosambi est souvent privilégiée car elle modélise mieux l’effet biologique selon lequel un crossing-over peut réduire la probabilité d’un autre crossing-over tout proche. Haldane reste toutefois très utile comme référence théorique et comme modèle plus simple dans certaines simulations.

Comment faire le calcul pas à pas

  1. Mesurez la fréquence de recombinaison entre deux loci.
  2. Exprimez cette fréquence en proportion décimale, par exemple 12,5 % devient 0,125.
  3. Choisissez la fonction de cartographie adaptée à votre contexte expérimental.
  4. Appliquez la formule afin d’obtenir la distance en centimorgan.
  5. Interprétez le résultat en gardant à l’esprit qu’au voisinage de 50 % de recombinaison, le pouvoir de résolution chute fortement.

Prenons un exemple. Si vous observez 25 recombinants parmi 200 descendants, la fréquence de recombinaison est de 25 / 200 = 0,125, soit 12,5 %. L’approximation linéaire donne 12,5 cM. Avec Haldane, la distance estimée est plus élevée, et avec Kosambi elle l’est légèrement aussi, mais moins fortement qu’avec Haldane. Cette différence illustre l’importance des recombinaisons multiples cachées dans les intervalles plus longs.

Pourquoi la distance génétique n’est pas la même chose que la distance en bases

En génomique, on distingue toujours la distance physique, exprimée en paires de bases, et la distance génétique, exprimée en centimorgans. Deux régions de même taille physique peuvent présenter des distances génétiques très différentes si le taux local de recombinaison varie. Les régions proches des centromères ont souvent une recombinaison plus faible, tandis que certaines régions subtélomériques montrent des taux plus élevés. De plus, les cartes génétiques peuvent différer entre les sexes. Chez l’humain, par exemple, la carte féminine est généralement plus longue que la carte masculine.

Mesure Valeur approximative Commentaire
Longueur de la carte génétique humaine sex-average Environ 3 300 à 3 600 cM Estimation globale souvent citée pour l’ensemble du génome humain.
Longueur de la carte féminine Environ 4 200 à 4 600 cM Les recombinaisons sont en moyenne plus nombreuses chez la femme.
Longueur de la carte masculine Environ 2 600 à 3 000 cM La carte est généralement plus courte que chez la femme.
Maximum observé de recombinaison entre deux loci 50 % Au-dessus de cette valeur, les loci paraissent non liés par cette mesure.

Ces ordres de grandeur rappellent une idée essentielle : le centimorgan est une mesure statistique du brassage méiotique, pas une règle de longueur moléculaire fixe. C’est pourquoi on ne peut pas convertir mécaniquement 1 cM en un nombre universel de paires de bases. Chez l’humain, une moyenne grossière de l’ordre de 1 cM pour environ 1 million de bases est parfois mentionnée dans des contextes pédagogiques, mais cette valeur varie fortement selon la région, le sexe et la population.

Table de comparaison des fonctions de cartographie

Le tableau ci-dessous montre comment la distance calculée diverge entre l’approximation linéaire, Haldane et Kosambi quand la fréquence de recombinaison augmente. Les valeurs sont calculées directement à partir des formules standards.

Fréquence de recombinaison Linéaire Haldane Kosambi
1 % 1,00 cM 1,01 cM 1,00 cM
5 % 5,00 cM 5,27 cM 5,02 cM
10 % 10,00 cM 11,16 cM 10,14 cM
20 % 20,00 cM 25,54 cM 21,18 cM
30 % 30,00 cM 45,81 cM 34,66 cM
40 % 40,00 cM 80,47 cM 54,93 cM

Quand utiliser Haldane ou Kosambi

Le choix entre Haldane et Kosambi dépend en partie du système biologique et du type d’analyse. Haldane suppose que les crossing-over sont indépendants les uns des autres. Cette hypothèse est mathématiquement élégante, mais biologiquement restrictive. Kosambi introduit une correction liée à l’interférence, c’est-à-dire au fait qu’un crossing-over peut influencer la probabilité qu’un autre événement proche se produise. En pratique, si vous travaillez sur une espèce ou une population pour laquelle l’interférence est connue ou supposée notable, Kosambi est souvent la meilleure option.

  • Pour un exercice pédagogique simple, l’approche linéaire suffit souvent sous 10 cM.
  • Pour des intervalles plus larges, il vaut mieux utiliser Haldane ou Kosambi.
  • Pour des cartes de liaison détaillées, la cohérence méthodologique sur l’ensemble du projet est essentielle.
  • Pour comparer des résultats issus de publications différentes, vérifiez toujours la fonction de cartographie utilisée.

Applications concrètes du calcul de distance en centimorgan

En génétique médicale, les distances en cM ont longtemps servi à localiser des gènes impliqués dans des maladies mendéliennes grâce à l’analyse de liaison familiale. En amélioration des plantes, elles permettent de construire des cartes de marqueurs pour suivre des régions associées au rendement, à la résistance aux maladies ou à la tolérance au stress. En élevage, elles soutiennent l’identification de loci d’intérêt économique. En généalogie génétique, la somme des segments partagés en cM aide à estimer le degré de parenté entre deux individus, même si cette utilisation concerne plutôt le partage identique par descendance que la simple cartographie de deux loci.

Il faut cependant bien distinguer ces contextes. Quand on parle de partage total de plusieurs centaines ou milliers de cM entre deux personnes, on utilise l’unité comme indicateur de parenté globale. Quand on parle de 8 cM entre deux marqueurs sur un chromosome, on est dans la logique de la cartographie de liaison. La signification biologique et statistique de l’unité reste apparentée, mais l’interprétation pratique change.

Erreurs fréquentes à éviter

  • Confondre fréquence de recombinaison et distance génétique corrigée.
  • Appliquer l’approximation 1 % = 1 cM à des intervalles très larges.
  • Comparer des cartes construites avec des fonctions différentes sans harmonisation.
  • Oublier qu’une recombinaison maximale observable de 50 % correspond à une absence de liaison détectable dans ce cadre.
  • Supposer qu’un même nombre de cM correspond partout au même nombre de bases.

Comment interpréter le résultat produit par le calculateur

Le calculateur ci-dessus renvoie d’abord la fréquence de recombinaison observée, puis la distance estimée selon la fonction choisie. Il affiche aussi les valeurs selon les trois méthodes principales afin que vous puissiez comparer l’impact du modèle. Si les trois valeurs sont proches, votre intervalle est probablement court et l’approximation simple reste acceptable. Si Haldane et Kosambi s’écartent nettement de l’estimation linéaire, cela signifie que les recombinaisons multiples deviennent importantes et que la distance réelle sur la carte est supérieure à ce que suggère la proportion brute de recombinants.

Gardez également en tête qu’un bon calcul ne remplace pas un bon design expérimental. La taille de l’échantillon, la qualité du phénotypage, la précision du génotypage, l’absence de biais de sélection dans la descendance et la pertinence du modèle statistique influencent fortement l’interprétation finale. Une fréquence de recombinaison calculée sur un très petit nombre d’individus peut être fortement instable. En recherche, les cartes robustes reposent sur des effectifs suffisants et, souvent, sur l’intégration de nombreux marqueurs.

Sources d’autorité pour approfondir

Pour vérifier les définitions et les concepts fondamentaux, consultez le glossaire du NIH NHGRI sur le centimorgan. Pour approfondir les principes de liaison et de cartographie génétique, la bibliothèque du NCBI propose des chapitres de référence sur la génétique et la recombinaison, notamment via NCBI Bookshelf. Pour une ressource pédagogique universitaire sur la recombinaison et l’hérédité, vous pouvez aussi consulter Learn Genetics de l’University of Utah.

En résumé

Le calcul de distance en centimorgan transforme une observation de recombinaison en une estimation cartographique utile pour analyser l’organisation des gènes sur les chromosomes. La règle simple 1 % = 1 cM est pratique pour débuter, mais elle devient insuffisante lorsque les distances augmentent. Les fonctions de Haldane et de Kosambi permettent d’obtenir des estimations plus réalistes, en tenant compte différemment des recombinaisons multiples et de l’interférence. Pour produire des résultats fiables, il faut toujours associer le bon modèle, un échantillonnage solide et une interprétation biologique rigoureuse.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top