Les variation stable de l’ADN
La variation stable de l’ADN de fréquence supérieure ou égale à 1 % (sinon c’est un rare variant) qui se transmet de manière mendélienne (loi universelle et formelle de la génétique). Le polymorphisme est physiologique mais peut être à l’origine de maladies génétiques multifactorielles. Un locus sera dit polymorphe s’il existe sous au moins 2 allèles (2 versions) et qu’il est égal ou supérieur à 1% en termes de fréquence. En réalité, tous les gènes sont polymorphes.
Le polymorphisme protéique
Le polymorphisme génique peut se traduire par un polymorphisme phénotypique mais le polymorphisme des protéines provient nécessairement (a pour substratum) le polymorphisme génétique. Ce polymorphisme phénotypique est à l’origine de nombreux caractères (couleur des yeux, pigmentation de la peau).
Cependant on peut avoir 2 couleurs de peau différentes et être proche génétiquement.
Les différents types de polymorphismes de l’ADN
1. les RFLP (Restriction Fragment Length Polymorphism)
Les RFLP ou polymorphismes de restriction sont des polymorphismes de l’ADN pouvant être explorés par la méthode de Southern. (Si ce n’est pas explorable par Southern, ce n’est pas un RFLP).
Cela reflète une variation de type qualitative.
Les variations qualitatives de séquence peuvent supprimer ou introduire un site de reconnaissance d’un enzyme de restriction.
On peut avoir des variations quantitatives de séquences (PCR dans ce cas).
Les variations quantitatives induisent une modification dans la carte de digestion.
Un RFLP est défini par un couple sonde/enzyme de restriction. Dans une population d’individus, le degré de variabilité de ces RFLP est plus ou moins élevé. LES RFLP sont bialléliques ou paucialléliques ou multialléliques. Pour un RFLP donné nous recevons donc une version de notre mère et une version de notre père. Dans les cas simples, l’homozygotie pour un RFLP se traduira en Southern par une bande et l’hétérozygotie par 2 bandes.
Les RFLP peuvent être explorés par un PCR (avec deux amorces encadrant la région siège du polymorphisme) en la couplant avec la digestion enzymatique, suivie d’une migration sur gel d’agarose coloré au bromure d’Ethidium.
On n’a pas normalement besoin d’enzymes de restriction bactériennes (utilisés pour Southern) dans une PCR mais ce n’est pas le cas ici.
On peut en couplant PCR et digestion par enzyme de restriction (obligatoire) voir les variations qualitatives et quantitatives.
2. VNTR (variable number of tandem Repeal)
RFLP résultant d’un nombre variable de variations polymorphiques (plusieurs dizaines de variations polymorphiques à plus de 1000) de natures quantitatives qui sont le fait d’un nombre variable de petites séquences répétées en tandem: 11-16 Pb.
Les VNTR également appelés MINI satellites hypervariables sont
- dispersés.
- et très polymorphes.
Les mini satellites ont
- une répartition hétérogène.
- sont essentiellement localisés dans les régions télomériques.
- Ils sont hypervariables.
- Ceux sont des polymorphismes qui sont très informatifs pour comparer les individus.
- De multiples locus jusqu’à 60, situés sur plusieurs régions distinctes de notre ADN, sièges d’un polymorphisme de type VNTR, peuvent être explorés simultanément par 1 seul Southern, en utilisant une même sonde si le motif de base répété est commun à ces polymorphismes (VNTR multi locus).
3. Les microsatellites ou STR (short tandem repeat)
Ils ont une importance historique dans le séquençage du génome humain et sont encore actuellement utilisés dans les laboratoires de génétique.
On ne peut plus les explorer avec la Southern car les variations de taille sont trop subtiles pour être visibles avec un southern mais on les explore avec la PCR puis analysé sur gel de polyacrilamyde pour détecter une différence de 2 paires de bases. Ils sont très polymorphes.
Souvent, la séquence répétée est de 2 nucléotides.
C’est un polymorphisme dû à un nombre variable de petites séquences (2 nucléotides) répétées 40 fois au maximum.
Ces microsatellites ont en plus des caractéristiques
- Très variables.
- Elles sont très régulièrement distribués le long du génome (tous les 25 à 100 kb) et donc abondants (entre 50 000 et 100 000).
- Très polymorphes (multi-alléliques).
- Sont définis par leur localisation et par le couple de séquences qui entourent la région répétée.
Ils ont servis de balises pour repérer les différents endroits du génome.
Nous les utilisons en pratique médicale et dans la médecine légale. En effet ils vont supplanter les traditionnels RFLP et sont des marqueurs polymorphes. Les plus utilisés sont les Ca(n) et Gt (n).
Les STR correspondent à des locus uniques dans le génome et sont caractérisés par les séquences qui entourent la région répétée.
Allèle paternel: 9 répétitions et Allèle maternel: 11 répétitions
Homozygote 9/9 => 100 paire de base alors qu’un homozygote 9/11 => 104 paire de base (11 - 9 = 2 répétitions donc 4 paire de bases de différences).
On utilise la PCR et 2 amorces qui encadrent la région microsatellitaire et on va détecter les variations de taille et pour lire ces microsatellites, on utilisera des gels par polyacrylamide. La variabilité de séquences répétées va impacter la taille du produit.
Pour être capable de bien visualiser les différences de taille
- On va utiliser une des amorces marquée par un fluorophore de tel sorte que tous les produits amplifiés vont avoir la même couleur.
- On fait une migration sur un gel.
- Exploration de microsatellite: Abscisse: taille en PM.
- Ex: un individu dont l’exploration de pics (210 et 230 = 20/2) donc il y a entre les 2 allèles parentaux 10 répétitions.
- Ces microsatellites nous permettent de suivre la ségrégation d’une génération à une autre.
- Ceux sont des outils quotidiens pour tracer les Chromosomes paternels et maternels. Ce sont les outils de référence pour les empreintes génétiques.
- C’est la différence de taille que l’on va trouver dans un séquenceur.
- Lors d’un PCR: amorce sens et antisens: Attention une amorce va de 5’ en 3’.
- ATGCTGCT ... TTAGCT.
- amorce sens ATGCTGCT.
- amorce anti sens AGCTAA.
4. Les SNP (Single Nucleotide Polymorphism)
- Toute variation de nucléotide n’est pas à l’origine de la modification de la carte de digestion.
- Ce sont les polymorphismes les plus importants en termes D’IMPACT biologique et le plus actuel.
- C’est un polymorphisme qui touche un seul nucléotide.
- TOUS les gènes sont polymorphes.
- Les variations nucléotidiques sont donc importantes.
- Si les RFLP peuvent être dues à une variation d’un nucléotide, toute variation nucléotidique n’est pas à l’origine des modifications de la cartographie de restriction. En fait, les variations polymorphes dues à la variation d’un nucléotide sont extrêmement fréquentes.
- Chaque gène contiendrait en moyenne 5 SNP dont 70 % seraient présents dans la séquence codante.
- 50 % des SNP intéressant la séquence codante seraient non silencieux, c’est-à-dire qu’ils modifieraient la séquence en acide aminé.
- Les variations polymorphes dues à la variation d’un nucléotide sont extrêmement fréquentes.
- SNV (single nucleotide variation) par exome (qui fait 34 Mb soit 1,2 % du génome): 3000.
- 50 % non synonymes avec impact biologique potentiel = non silencieux.
- Les insertions délétions de quelques nucléotides peuvent être également polymorphes et ne sont pas obligatoirement délétères.
- Les polymorphismes n’ont pas d’impact, ce ne sont pas des mutations délétères et doivent être observé avec une fréquence dans la population supérieur à 1% (sinon ce sont des variants rares).
- 3000 SNP.
Dans l’exome on a
- 20 000 SNV dont.
- 500 SNV rares (moins de 0,1 %) non répertoriés dans la base de donnée.
- 1 SNV de novo à impact biologique.
- Il y a 10 000 ans que sont survenu la majorité des SNV à impact biologique (récent).
- Elevage.
- Regroupement d’habitants et explosion démographique.
- Augmentation des maladies infectieuses qui vont sculpter notre patrimoine génétique.
- Pour classer toutes variations génétiques.
- La notion d’impact biologique ou tolérance.
- La notion de fréquence.
- SNV: vrai polymorphisme (SNP) + variant rares.
- Touchent toutes les régions du génome (codantes 50% ou non 50%) et impactent souvent les protéines en changeant les séquences en AA des protéines.
On a des mutations délétères, des mutations polymorphiques tolérées, et des variations polymorphiques tolérées mais privées.
5. CNV (Copy Number Variation) ou CNP (Copy Number Variation)
Certains gènes sont soit dupliqués sur le même chromosome soit sur des chromosomes différents.
On utilise CNP pour introduire une fréquence dans la population: la grande découverte depuis 2004 puis cartographie en 2006.
- Pour beaucoup de nos gènes et de façon plus générale de nos segments génomiques, le nombre de copies est très variable: 0, 1, 2, 3, 4. Il existe un nombre variable de copies de gènes.
- Il y a plusieurs 100aines de CNV par personne.
- Si pour la plupart de nos gènes, nous héritons de 2 copies, pour certains de nos gènes il existe une tolérance biologique à un nombre variable de copies (certains en auront 0 d’autres 3, sans que cela les empêche de vivre). Sur certains de nos autosomes on aura la copie paternelle et 4 copies maternelles par exemple.
- les puces à ADN nous ont permis de détecter les nombre de copies de chaque gèn.
- Source majeure de polymorphisme: plusieurs centaines CNV par personne.
- Quelques Kb à quelques Mb: 1 ou plusieurs gènes.
- Ces CNP proviennent d’une duplication chez un ancêtre avec un crossing over inégal.
- Gènes impliqués dans la perception.
- Gènes impliqués dans la détoxification.
- Gènes impliqués dans la réponse immunitaire.
- Gènes impliqués dans l'ntégrité membranaire.
- C’est un mécanisme clé (les CNV) de l’adaptabilité d’homo sapiens à l’environnement avec les pressions de sélections dues aux infections importantes et à la modification des comportements alimentaires. (exemple de la lactase ou de l’amylase).
- Rôle dans les maladies multifactorielles.
Conclusion: la découverte du polymorphisme est la plus grande avancée conceptuelle de la génétique: on a 2 grands types de découvertes: les variations nucléotidiques même si chez les individus il n’y a aucun ne modèle de patrimoine génétique Les maladies génétiques sont le prix de notre adaptabilité.
La notion de normalité n’existe pas. Il existe des variations de plusieurs natures, du nombre de copies de nos gènes et toutes ces variations concourent à notre adaptabilité.
Empreint génétique (DNA fingerprinting).- L’exploration simultanée de plusieurs locus polymorphes hypervariables de type VNTR ou de type microsatellites permettent de définir une carte d’identité génétique. Le profil obtenu par Southern ou PCR est spécifique d’un individu et d’un seul.
- L’empreinte ne permet JAMAIS de déterminer un individu. Le principe de l’empreinte ne va pas permettre identifier un individu mais va être une analyse comparative et se fait de plus en plus avec des microsatellites.
Génétique des populations
La génétique des populations a pour but l’étude de la distribution des allèles dans une population et l’étude des mécanismes par lesquels la fréquence des allèles et des génotypes est maintenue constante ou est modifiée.
I. Définitions
Espèce: ensemble d’individus interféconds.
Réserve génétique: information génétique totale des reproducteurs, c’est-à-dire la somme de tous les allèles présents à l’instant considéré dans la population.
Fréquence allélique
- Il faut savoir si ce sont des allèles appartenant à des autosomes ou des gonosomes.
- Nombre allélique de copies de l’allèle considérées divisées par la somme de tous les allèles.
- Elle est calculée par la fréquence des homozygotes et hétérozygotes.
- Chaque individu possède 2 allèles pour un gène.
- 300 individus (donc 600 allèles): 147 AA, 126 Aa et 27 aa.
- Fréquence allèle A: (147 *2 +126)/600 = 0,7.
- Fréquence allèle a: (27*2 +126)/600 = 0,3.
Population: groupe d’individus qui ont en commun la même réserve génique. Les populations différentes entre elles par la fréquence des allèles.
La génétique des populations est fondée sur l’analyse du polymorphisme de l’ADN.
Une analyse de plusieurs RFLP du gène de la bêta-globine effectuée sur 8 populations différentes a permis en 1986 de reconstruire une filiation d’après les haplotypes observés. TOUTES les populations vivant actuellement auraient une origine africaine et un contingent réduit d‘individus auraient quitté l’Afrique, il y a environ 100 000 ans.
Cette théorie a été confirmée en 1966 par l’étude d’autres types de variations (ADN mitochondrial).
Entre les différentes populations, il existe non seulement des différences de la fréquence allélique à la fois pour les allèles normaux des locus polymorphes et les allèles mutants impliqués dans les maladies génétiques (la fréquence des maladies monogéniques n’est donc pas la même).
Pression de sélection due à l’environnement changement de climats.
Pression de sélection due au iInfections microbiennes avec l’élevage. Ex: mutation qui nous permet de boire du lait.
Il existe 3 grands groupes de populations: les caucasiens, les noirs, et les asiatiques, chacun de ces groupes étant eux-mêmes divisés en sous-groupes différents entre eux de par la fréquence allélique.
La notion de race est arbitraire et sans fondement scientifique. Il n’y a pas de relation entre la diversité physique des populations humaines et leur diversité génétique. Des populations génétiquement très proches peuvent comporter par exemple des individus dont la couleur de peau est très différente.
Lorsqu’on parle de génétique de population, on s’intéresse à un locus donné.
II. Equilibre ou loi Hardy Weinberg
- Situation d’une grande population dans laquelle les fréquences alléliques et des différents génotypes restent constantes de génération en génération.
- Ils répondent à la loi binomiale: p² + 2pq + q² (et P*(p+q) =p).
- Pour déterminer si une population a atteint l’équilibre de Hardy-Weinberg. Il suffit de déterminer si la distribution des génotypes obéit à la loi binomiale.
1. Calculer la fréquence allélique à partir des homozygotes et des hétérozygotes.
On dit qu’une population est en équilibre si la distribution répond à la loi binomiale p+q cela implique qu’il y a une fréquence des génotypes et des allèles restent constantes de génération en génération.
Exemple 1: 300 individus ; 147 AA, 126 Aa et 27 aa
- Fréquence des allèles A = 0,7 et a = 0,3.
- Effectif attendu des génotypes AA p2 = 0,49 ; Aa 2pq = 0,42 ; aa = 0,09.
- Effectif attendu des Phénotypes: AA = 0,49*300 = 147 ; Aa = 0,42 * 300 = 126 ; aa = 0,09 * 300 = 27.
Respect de la loi binomiale donc équilibre génétique de la population.
Exemple 2: 3146 individus: 188 AA, 717 Aa et 2241
- Fréquence des allèles A (2*188 + 717) / 6292 = 0,173.
- Fréquence des allèles a (2*2241 + 717)/6292 = 0,826.
- Fréquence attendu des génotypes: AA p2 = 0,03 ; Aa = 2pq =0,29 ; aa = q² = 0,68.
- Fréquence des phénotypes attendus: AA 0,03*3146 = 94 ; Aa = 0,29*3146 = 912 ; 0,68 * 3146 = 2139.
Cette population diffère donc significativement de l’équilibre de Hardy Weinberg.
III. Facteurs affectant la loi de Hardy-Weinberg
A. Assortiment préférentiel
Pour que l‘équilibre de Hardy-Weinberg sont atteint, il faut qu’il n’y ait pas d’assortiment préférentiel.
La définition des couples reproducteurs doit se faire au hasard: c’est la panmixie.
Un assortiment d’individus de phénotype similaire (accouplement assortimental positif) ou opposé (accouplement assortimental négatif) affecte l’équilibre de Hardy Weinberg.
Mutation et sélection
- Les mutations représentent un facteur majeur de variation allélique dans une population. Elles peuvent être avantageuses, neutre ou défavorables.
- L’élément le plus évident susceptible de casser l’équilibre de Hardy-Weinberg est les mutations délétères soumis à une sélection positive.
- Si les mutations sont soumises à une sélection négative, elles ne cassent pas l’équilibre de Hardy-Weinberg à condition d’être remplacées (sinon elles le cassent). Une mutation neutre n’a pas de conséquences sur l’équilibre.
- Dans le cas où l’allèle mutant va diminuer l’aptitude à la reproduction ou tuer son porteur, certaines mutations seront soumises à un coefficient de sélection (entre 0 et 1) W= 1-s.
Les allèles mutants éliminés par la sélection sont remplacés par des mutants générés de novo. Ceci explique pourquoi les maladies graves qui vont tuer leurs mutant ne vont pas disparaitre et vont rester constantes de génération en génération.
Avantage sélectif pour les hétérozygotes
- La fréquence élevée dans certaines populations de certains allèles mutants (mucoviscidose, drépanocytose) s’explique probablement par un avantage sélectif hétérozygote: pour la drépanocytose, la plus haute fréquente allélique est observée dans certaines régions de l’Afrique de l’Ouest: les hétérozygotes sont plus résistants au paludisme.
- Si s le coefficient de sélection est de 1, le génotype étudié va mourir et si la maladie et la population est en équilibre génétique la maladie résulte presque toujours de nouvelles mutation de novo.
- Dans les maladies liées à l’X 1/3 des mutants sont portés par les hommes et 2/3 des mutants par les femmes. Si la maladie est grave les hommes meurent (argh) et 1/3 des cas disparaissent. S’il y a équilibre génétique il faut des nouvelles mutations de novo pour remplacer les pertes. Donc 1/3 des allèles proviennent de mutations de novo afin de maintenir une fréquence allélique constante.
- Lorsqu’un gène est soumis à des mutations pour respecter l’équilibre, il faut que ces mutations soient neutres et n’introduisent pas de sélection ou alors que les allèles éliminés à chaque génération soient remplacés par des mutations de novo. Equilibre de nouvelles mutations pour remplacer celles perdues par la mort du porteur.
B. Migration
Pour que l’équilibre de Hardy Weinberg soit atteint, il faut qu’il n'y ait pas de migration de populations qui vienne perturber les fréquences relatives des allèles et des génotypes dans la population de départ. En effet, la migration de populations introduit de nouveaux allèles dans une population donnée. Les fréquences des allèles mutants différents entre les populations permettent de tracer les migrations de population.
Ex la phénylcétonurie (site d’épissage) est différente en Irlande au japon. La plupart des allèles sont d’origine celte et ces allèles mutants permettent de suivre les migrations de population celte.C. Dérive génétique
L’effet d’une dérive génétique s’inscrit dans le temps ; Migration de petite taille.
La dérive génétique signifie qu’un groupe d’individus va être plus efficace dans la reproduction et va contribuer à la fréquence des allèles.
La notion de dérive génétique peut casser un équilibre de Hardy Weinberg et en pratique les grands mouvements de populations peuvent aussi le casser et les mo ne sont pas obligatoirement fracture de cet équilibre.
Si l’échantillon d’allèles contribuant à la formation des zygotes de la génération suivante n’est pas représentatif de la composition allélique globale de la réserve de gènes de la population, on observera des déviations par rapport à l’état d’équilibre génétique.
La dérive génétique peut résulter d’un effet fondateur.- Les Amish originaires d’Europe installés en Pennsylvanie.
- Les Afrikaners en Afrique du Sud.
- Le lac saint Jean au Québec.