Calcul distance entre 2 genes

Calculez rapidement la fréquence de recombinaison et la distance génétique entre deux gènes à partir de vos données de descendance. Cet outil applique les approches classiques de cartographie génétique, avec comparaison entre distance directe, fonction de Haldane et fonction de Kosambi.

Cartographie génétique Fréquence de recombinaison Centimorgans

Calculateur interactif

Nom du gène 1

Nom du gène 2

Nombre total de descendants

Nombre de recombinants observés

Fonction de cartographie

Décimales

Note de l’expérience

Résultats

Saisissez vos données puis cliquez sur le bouton de calcul pour obtenir la fréquence de recombinaison et la distance entre les deux gènes.

Repères utiles

Lien génétique fort

< 10 cM

Lien modéré

10 à 30 cM

Proche de l’assortiment indépendant

≈ 50 %

Unité de carte

1 cM

En génétique classique, la fréquence de recombinaison est estimée par le rapport recombinants / total. Une fréquence de 1 % correspond approximativement à 1 centimorgan pour de faibles distances, mais cette relation devient moins linéaire quand la distance augmente à cause des crossing-over multiples.

Formules utilisées

Fréquence de recombinaison : r = recombinants / total
Distance directe : d = 100 × r
Haldane : d = -50 × ln(1 – 2r)
Kosambi : d = 25 × ln((1 + 2r) / (1 – 2r))

Interprétation rapide

r faible : les gènes sont proches sur le chromosome.
r intermédiaire : lien génétique mesurable et utile pour la cartographie.
r proche de 0,5 : les gènes se comportent presque comme non liés.

Guide expert du calcul de la distance entre 2 gènes

Le calcul de la distance entre 2 gènes est une étape fondamentale en génétique de transmission, en amélioration des plantes, en génétique animale et en biologie moléculaire. Il permet d’estimer à quel point deux loci sont proches ou éloignés sur un chromosome en observant la fréquence de recombinaison chez une descendance. Avant l’ère du séquençage de masse, cette méthode représentait l’un des principaux outils de cartographie. Aujourd’hui encore, elle conserve une valeur pédagogique et pratique, notamment pour comprendre le lien entre méiose, crossing-over et héritabilité de combinaisons alléliques.

Quand deux gènes sont situés sur le même chromosome, ils ne s’assortissent pas toujours de manière indépendante. Plus ils sont proches, plus ils ont tendance à être transmis ensemble, car la probabilité qu’un crossing-over survienne entre eux pendant la méiose est relativement faible. À l’inverse, plus ils sont éloignés, plus la probabilité de recombinaison augmente. C’est précisément cette relation entre distance physique approximative et fréquence de recombinaison qui sert de base au calcul de distance génétique exprimée en centimorgans, abrégés cM.

Définition simple de la distance génétique

La distance génétique entre deux gènes est une estimation basée sur la proportion de gamètes ou de descendants recombinants. On parle de recombinant lorsqu’une descendance présente une combinaison allélique différente de celle observée chez les parents initiaux. Si, sur 1000 descendants, 180 sont recombinants, alors la fréquence de recombinaison est de 180 / 1000 = 0,18, soit 18 %. Dans une approximation simple, on peut alors dire que les deux gènes sont séparés par 18 cM.

Cependant, cette approximation devient imparfaite lorsque la distance augmente, car plusieurs crossing-over peuvent se produire entre les deux loci et certains événements doubles restaurent une configuration parentale apparente. Résultat : la fréquence observée sous-estime la distance réelle. C’est pour cette raison que des fonctions de cartographie comme celles de Haldane et de Kosambi ont été développées.

Pourquoi la recombinaison ne dépasse pratiquement pas 50 %

La fréquence de recombinaison observée entre deux gènes varie entre 0 et 50 %. Une valeur proche de 0 % indique des gènes très liés. Une valeur proche de 50 % signifie qu’ils se comportent comme s’ils étaient indépendants, soit parce qu’ils sont très éloignés sur le même chromosome, soit parce qu’ils sont portés par des chromosomes différents. Cette limite supérieure s’explique par le fait qu’au-delà d’un certain nombre d’événements de crossing-over, les classes recombinantes et parentales finissent par apparaître en proportions similaires.

Étapes concrètes pour calculer la distance entre 2 gènes

Identifier le nombre total de descendants analysés.
Classer les descendants en types parentaux et recombinants.
Calculer la fréquence de recombinaison : r = recombinants / total.
Multiplier par 100 pour obtenir un pourcentage.
Choisir une fonction de cartographie adaptée : directe, Haldane ou Kosambi.
Interpréter la valeur finale en cM en tenant compte du contexte expérimental.

Par exemple, si vous observez 80 recombinants sur 1000 descendants, alors r = 0,08. En méthode directe, la distance est de 8 cM. Si vous appliquez Haldane ou Kosambi, vous obtiendrez une correction légère mais utile, surtout lorsque la distance s’élève.

Différence entre distance directe, Haldane et Kosambi

La distance directe est la méthode la plus intuitive. Elle convient bien aux petites distances, souvent en dessous de 10 cM, où l’effet des doubles crossing-over reste limité. La fonction de Haldane suppose que les crossing-over se produisent selon un processus aléatoire sans interférence. La fonction de Kosambi, quant à elle, tient compte d’une certaine interférence, c’est-à-dire de l’idée qu’un crossing-over peut modifier la probabilité qu’un autre se produise à proximité. En pratique, Kosambi est souvent préférée pour des données expérimentales réelles parce qu’elle reflète mieux certains comportements biologiques observés.

Fréquence de recombinaison observée	Distance directe	Distance Haldane	Distance Kosambi	Lecture pratique
5 %	5,00 cM	5,27 cM	5,02 cM	Lien fort, correction très faible
10 %	10,00 cM	11,16 cM	10,14 cM	Distance modérée, la correction commence à compter
20 %	20,00 cM	25,54 cM	21,18 cM	Les doubles crossing-over masqués deviennent plus probables
30 %	30,00 cM	45,81 cM	34,66 cM	Écart important selon l’hypothèse retenue
40 %	40,00 cM	80,47 cM	54,93 cM	Zone difficile à interpréter avec la seule recombinaison observée

Pourquoi les données expérimentales doivent être suffisamment grandes

La précision d’un calcul de distance génétique dépend directement de la taille de l’échantillon. Sur un très petit nombre de descendants, un écart de quelques individus peut faire varier fortement l’estimation. À mesure que le nombre d’observations augmente, la fréquence mesurée devient plus stable. C’est pourquoi les expériences classiques de cartographie reposaient souvent sur plusieurs centaines, voire plusieurs milliers d’individus.

Le tableau suivant illustre l’effet du nombre de descendants sur la précision intuitive d’une estimation de recombinaison. Il ne s’agit pas d’une règle absolue, mais d’un repère utile pour l’interprétation.

Taille d’échantillon	Exemple de recombinants observés	Fréquence estimée	Robustesse pratique	Usage typique
100	18	18 %	Faible à moyenne	Démonstration pédagogique, pré-test
500	90	18 %	Moyenne à bonne	Travaux pratiques, premiers marqueurs
1000	180	18 %	Bonne	Cartographie classique fiable
5000	900	18 %	Très bonne	Études fines et validation

Interprétation biologique des résultats

Une distance de 2 à 5 cM indique en général un lien génétique fort. Les gènes sont relativement proches et les événements de recombinaison entre eux sont rares. Des distances de 10 à 20 cM restent très exploitables pour construire une carte génétique locale. Au-delà de 30 cM, la lecture devient plus délicate parce que les crossing-over multiples augmentent et la fréquence observée représente de moins en moins fidèlement la distance réelle sur le chromosome.

Il faut aussi distinguer la distance génétique de la distance physique. Deux gènes séparés par un même nombre de paires de bases ne présenteront pas forcément la même distance génétique selon l’espèce, le sexe, la région chromosomique ou la présence de points chauds de recombinaison. Certaines régions du génome recombinent peu, d’autres beaucoup plus. Cela signifie qu’un centimorgan n’est pas une longueur fixe en bases.

Limites du calcul de distance entre 2 gènes

La fréquence de recombinaison observée sous-estime la distance réelle quand les crossing-over multiples deviennent fréquents.
La méthode suppose une bonne classification des phénotypes ou génotypes parentaux et recombinants.
Des biais de viabilité ou de sélection peuvent déformer les proportions observées.
Les distances génétiques ne se convertissent pas directement en distance physique de manière universelle.
Les fonctions de Haldane et de Kosambi reposent sur des hypothèses biologiques différentes.

Quand utiliser Haldane et quand utiliser Kosambi

Si vous cherchez une approche théorique simple sans interférence, Haldane est une bonne référence. Si vous travaillez avec des organismes chez lesquels l’interférence méiotique est probable ou si vous souhaitez une correction souvent jugée plus réaliste, Kosambi est fréquemment privilégiée. En enseignement, comparer les trois valeurs est particulièrement utile pour comprendre pourquoi la relation entre recombinaison et distance n’est pas strictement linéaire.

Exemple complet de calcul

Supposons un croisement test avec 1200 descendants. Vous observez 252 individus recombinants. Le calcul de base donne r = 252 / 1200 = 0,21. La fréquence de recombinaison est donc de 21 %. En distance directe, cela correspond à 21 cM. Avec Haldane, la distance vaut environ 27,24 cM. Avec Kosambi, elle vaut environ 22,34 cM. Cet exemple montre bien que le choix de la fonction de cartographie a un impact croissant à mesure que la fréquence de recombinaison augmente.

Bonnes pratiques pour exploiter cet outil

Vérifiez que le nombre de recombinants ne dépasse jamais le nombre total de descendants.
Si la fréquence approche ou dépasse 50 %, interprétez le résultat avec prudence.
Précisez la nature du croisement, car un test-cross facilite souvent l’identification des classes recombinantes.
Conservez la taille d’échantillon dans vos comptes rendus pour juger de la fiabilité de l’estimation.
Comparez si besoin les trois méthodes afin d’illustrer l’impact des hypothèses de cartographie.

Ressources de référence

Pour approfondir les notions de génétique, de liaison et de cartographie, vous pouvez consulter des sources institutionnelles solides :

En résumé

Le calcul de la distance entre 2 gènes repose sur l’analyse de la recombinaison observée lors de la méiose. Cette approche permet de quantifier le lien génétique entre deux loci et de construire des cartes génétiques utiles en recherche comme en enseignement. Pour de petites distances, la méthode directe est souvent suffisante. Pour des distances plus élevées, les fonctions de Haldane et de Kosambi apportent des corrections importantes. Utilisé avec un échantillon assez grand et une bonne classification des recombinants, ce calcul reste un outil robuste pour comprendre l’organisation des gènes sur les chromosomes.

Calcul Distance Entre 2 Genes