Calcul distance génétique entre individu r cran

Calculez rapidement une distance génétique observée à partir de marqueurs comparés, puis convertissez une fraction de recombinaison r en distance cartographique exprimée en centiMorgans avec les fonctions de Haldane ou de Kosambi. L’outil ci-dessous est conçu pour une lecture claire, une visualisation immédiate et une interprétation pratique.

Calculateur interactif

Individu A

Individu B

Nombre total de marqueurs comparés

Nombre de marqueurs différents

Fraction de recombinaison r

Fonction de conversion en cM

Résultats

Renseignez les valeurs puis cliquez sur le bouton de calcul.

Interprétation rapide : la p-distance correspond à la proportion de marqueurs différents entre deux individus. La distance cartographique en cM dérivée de r décrit la probabilité de recombinaison et s’utilise surtout pour la cartographie génétique, pas comme une mesure directe d’ascendance individuelle.

Guide expert du calcul de distance génétique entre individus

Le calcul de distance génétique entre individus est une étape centrale en génétique des populations, en cartographie de liaison, en amélioration des plantes, en élevage, en médecine génomique et dans l’analyse des parentés. Lorsqu’un internaute recherche calcul distance génétique entre individu r cran, il cherche généralement à relier trois idées : la différence observée entre deux profils génétiques, la fraction de recombinaison r, et l’expression pratique de cette distance en centiMorgans, souvent abrégés en cM. Le terme saisi peut comporter une faute de frappe, mais l’intention scientifique reste claire : mesurer à quel point deux individus ou deux loci sont éloignés génétiquement et comprendre comment lire ce résultat.

Il faut d’abord distinguer deux familles de mesures. La première est la distance observée entre individus, par exemple la proportion de marqueurs différents sur un ensemble de SNP, microsatellites ou autres polymorphismes. La deuxième est la distance cartographique, qui découle de la fréquence de recombinaison entre deux loci et s’exprime en cM. Ces deux notions sont proches mais non identiques. La p-distance décrit une divergence constatée dans les données. La distance en cM décrit un espacement sur une carte génétique, donc une propension à être séparés par recombinaison au cours de la méiose.

1. La formule la plus simple pour comparer deux individus

Quand on dispose de marqueurs comparés, la manière la plus directe de quantifier l’écart génétique est de calculer :

p-distance = nombre de marqueurs différents / nombre total de marqueurs comparés

Si deux individus diffèrent sur 75 marqueurs parmi 1000, la p-distance vaut 0,075, soit 7,5 %. L’identité observée vaut alors 92,5 %. Cette approche est intuitive, robuste pour un premier niveau de lecture, et très utile dans les tableaux de comparaison, les matrices de distance et les analyses exploratoires.

Cette p-distance présente cependant une limite importante : elle ne corrige pas les événements multiples possibles à un même site ni les dépendances entre marqueurs proches. Dans un cadre de phylogénie profonde ou de cartographie fine, on préfère souvent des mesures plus élaborées. Mais pour un calcul opérationnel entre deux individus génotypés sur un panel homogène, la proportion de différences reste une référence parfaitement défendable.

2. Que signifie la fraction de recombinaison r ?

La variable r représente la fraction de recombinaison observée entre deux loci. Si r = 0,01, cela signifie qu’environ 1 % des produits méïotiques montrent une recombinaison entre ces deux loci. Plus r est élevé, plus les loci sont éloignés sur la carte génétique. En pratique, r est compris entre 0 et 0,5. À 0,5, les loci se comportent comme s’ils étaient indépendants, soit parce qu’ils sont très éloignés sur le même chromosome, soit parce qu’ils sont situés sur des chromosomes différents.

Il serait tentant de dire qu’une distance génétique en cM vaut simplement 100 x r. Cette approximation fonctionne pour les très petites distances, mais elle devient moins précise lorsque les recombinaisons multiples apparaissent. C’est exactement pour corriger ce phénomène que l’on utilise des fonctions de cartographie.

3. Conversion de r en cM : Haldane et Kosambi

Deux fonctions sont classiquement utilisées :

Haldane : suppose l’absence d’interférence entre recombinaisons.
Kosambi : prend en compte une interférence modérée et est souvent jugée plus réaliste dans de nombreux contextes biologiques.

Les formules sont les suivantes :

Haldane : d = -50 x ln(1 – 2r)
Kosambi : d = 25 x ln((1 + 2r) / (1 – 2r))

Pour r = 0,08, la distance vaut environ 8,72 cM avec Haldane et environ 8,07 cM avec Kosambi. L’écart est modeste à petite distance, mais il peut devenir plus visible à mesure que r augmente. Cela explique pourquoi un bon calculateur demande toujours quelle fonction de conversion l’utilisateur souhaite appliquer.

Fraction de recombinaison r	Approximation 100r	Distance Haldane	Distance Kosambi	Lecture pratique
0,01	1,00 cM	1,01 cM	1,00 cM	Différence négligeable entre les méthodes
0,05	5,00 cM	5,27 cM	5,02 cM	Très bonne zone pour la cartographie locale
0,10	10,00 cM	11,16 cM	10,14 cM	L’effet des recombinaisons multiples devient visible
0,20	20,00 cM	25,54 cM	21,18 cM	La simple règle 100r sous-estime la distance réelle

4. Distance génétique entre individus et parenté attendue

Dans le langage courant, beaucoup de personnes utilisent l’expression distance génétique pour parler de proximité familiale. Ici encore, il faut distinguer l’ADN partagé et la distance cartographique. Deux frères et soeurs partagent en moyenne environ 50 % de leur ADN autosomal identique par descendance, mais cette valeur varie autour de cette moyenne. Un parent et son enfant partagent également environ 50 %. Les grands-parents et petits-enfants se situent autour de 25 %, comme les oncles, tantes, neveux et nièces.

Ces chiffres sont utiles pour interpréter un profil de comparaison. Si vos marqueurs indiquent une identité extrêmement élevée, cela n’implique pas automatiquement une relation familiale proche. Tout dépend du type de marqueurs, de leur densité, de la région du génome étudiée et de la méthode de codage des génotypes. Un panel de marqueurs d’identité ne se lit pas comme une carte de recombinaison.

Relation biologique	Partage autosomal attendu	Coefficient de parenté théorique	Commentaire
Parent – enfant	Environ 50 %	0,5	Valeur théorique stable, sans variation autour de la transmission directe
Frères et soeurs complets	Environ 50 %	0,5	La part réellement partagée varie autour de la moyenne
Grand-parent – petit-enfant	Environ 25 %	0,25	Transmission sur deux générations
Oncle ou tante – neveu ou nièce	Environ 25 %	0,25	Proximité comparable à celle grand-parent – petit-enfant
Cousins germains	Environ 12,5 %	0,125	Souvent détectable sur des panels denses
Cousins issus de germains	Environ 6,25 %	0,0625	Le signal devient plus variable et plus difficile à inférer

5. Statistiques biologiques utiles pour mettre les résultats en contexte

Quelques ordres de grandeur permettent d’éviter les mauvaises interprétations :

Le génome humain haploïde contient environ 3,2 milliards de paires de bases.
L’espèce humaine possède 23 paires de chromosomes.
La grande majorité des individus humains partagent plus de 99 % de leur séquence d’ADN.
La carte génétique humaine totale se mesure en milliers de cM, pas en dizaines seulement.
Le nombre de crossing-over par méiose est limité, ce qui explique pourquoi la relation entre r et la distance physique n’est pas linéaire à grande échelle.

Ces chiffres montrent un point crucial : deux individus peuvent être très proches au niveau de la séquence globale tout en présentant des différences informatives sur un sous-ensemble de marqueurs. C’est pourquoi le choix du panel, la qualité du génotypage et le filtrage bioinformatique sont aussi importants que la formule de calcul elle-même.

6. Quand utiliser p-distance, r, ou les cM ?

Le bon indicateur dépend de la question biologique :

Comparer deux individus sur un panel de SNP : utilisez d’abord la p-distance ou une mesure dérivée de l’identité.
Cartographier deux loci sur un chromosome : partez de la fraction de recombinaison r puis convertissez en cM.
Évaluer une parenté : appuyez-vous sur l’ADN partagé, les segments IBD et les distributions attendues selon la relation familiale.
Construire un arbre ou une matrice de distance : utilisez une métrique cohérente sur tous les échantillons et évitez de mélanger p-distance et distance cartographique.

7. Erreurs fréquentes dans le calcul de distance génétique

Confondre distance physique en bases et distance génétique en cM.
Appliquer 100r sans vérifier si la distance est assez faible pour que l’approximation reste valide.
Utiliser des marqueurs avec trop de données manquantes.
Comparer des panels non homogènes d’un individu à l’autre.
Interpréter une identité élevée comme une preuve directe de parenté proche sans modèle IBD.
Oublier que r ne peut pas dépasser 0,5.

8. Comment lire le résultat du calculateur ci-dessus

Le calculateur fournit quatre niveaux d’information. D’abord, il affiche la p-distance, c’est-à-dire la part de marqueurs différents. Ensuite, il affiche l’identité observée, soit la part de marqueurs identiques. Troisièmement, si vous saisissez une fraction de recombinaison r, il calcule une distance cartographique en cM avec Haldane ou Kosambi. Enfin, il génère un graphique qui synthétise la structure des données en séparant les marqueurs identiques, les marqueurs différents, la distance en pourcentage et la distance cartographique.

Cette combinaison est particulièrement utile pour les étudiants, les enseignants, les techniciens de laboratoire, les sélectionneurs et les analystes qui veulent passer rapidement d’une lecture descriptive à une interprétation cartographique. Dans un rapport, vous pouvez par exemple écrire : sur 1000 marqueurs comparés entre les individus A et B, 75 diffèrent, soit une p-distance de 7,5 % et une identité observée de 92,5 %. En supposant une fraction de recombinaison r = 0,08, la distance cartographique estimée est de 8,07 cM selon Kosambi.

9. Sources institutionnelles recommandées

Pour approfondir, appuyez-vous sur des organismes de référence :

10. Conclusion pratique

Le calcul de distance génétique entre individus ne se résume pas à une seule formule. Si vous comparez des profils génotypiques, la p-distance est un excellent point de départ. Si vous travaillez sur la liaison entre loci, la fraction de recombinaison r doit être transformée en cM avec une fonction adaptée, idéalement Haldane ou Kosambi. Si votre objectif est la parenté, il faut aller plus loin et étudier les segments partagés et les distributions attendues selon la relation familiale. En d’autres termes, la meilleure mesure est toujours celle qui correspond exactement à la question biologique posée.

Le calculateur proposé sur cette page vous permet de relier ces approches de manière simple et visuelle. Il est particulièrement utile pour un usage pédagogique, pour des vérifications rapides en laboratoire, ou pour préparer une analyse plus poussée dans un environnement de bioinformatique. Utilisez-le comme outil de synthèse, puis confirmez toujours les conclusions importantes avec une méthode adaptée au design expérimental et au type de données génétiques disponibles.

Calcul Distance G N Tique Entre Individu R Cran