Les enzymes de restriction
Les enzymes de restriction d’origine bactérienne sont des enzymes dont la capacité est de couper l’ADN (nucléase) et les enzymes de restriction sont des nucléases capable de couper l’ADN double-brin. Les endonucléases existent dans toutes les bactéries et conditionnent leur virulence.
Endonucléases: ce sont des enzymes qui sont capable de couper l’ADN double-brin en des séquences spécifiques: elles ont une activité restreinte à des séquences spécifiques. Elles sont donc définies par la séquence qu’elles sont capables de reconnaître.
Ceux qui sont toujours les plus utilisé en biologie moléculaire sont ceux qui reconnaissent des séquences courtes (4-6 paires de bases).
Les séquences reconnues par ces enzymes sont des séquences qui ont une structure palindromique c’est-à-dire que la séquence est identique sur les 2 brins quand elle est lue dans le sens 5’ à 3’ (ce n’est pas le cas de toutes les séquences): donc on lit la même séquence de 5’ à 3’ sur le brin supérieur et inférieur.
Quand on lit une séquence, on lit toujours de 5’ à 3’.
Donc les enzymes de restriction sont:
- Des endonucléases.
- D’origine bactérienne (piège: pas d’origine virale mais origine BACTERIENNE).
- Capables de cliver l’ADN double-brin en des sites spécifiques (généralement, le motif reconnu est composé de 4, 5, 6 paire de bases et a une structure palindromique).
- Essentielles car elles ont permis le séquençage humain (avec les STR): le génome humain a été coupé en de multiples séquences.
- Une centaine.
- Portent un nom dont les 3 premières lettres correspondent à la bactérie dont ils sont extraits (ex: EcoR 1 qui vient de Escherichia Coli).
La coupure du brin supérieur n’est pas en vis-à-vis direct de la coupure du brin inférieur.
Le génie génétique consiste à introduire un gène humain dans un microorganisme. Il y a une nécessité de compatibilité dans le principe de la construction qu’on utilise dans le domaine du génie génétique.
On dispose des enzymes
- ADN polymérase.
- DNA ligase: on peut religuer des fragments d’ADN.
- DNA Kinase.
- DNA phosphatase alcaline.
Un arsenal d’enzymes qui permet de manipuler de n’importe quelle façon et n’importe quel fragment d’ADN.
Reverse transcription
La reverse transcription est à la fois un outil et une méthode importante: c’est une opération qui permet de transformer une molécule d’ARNm en ADN. C’est essentiel: dans notre patrimoine génétique, les régions ont une importance. La quintessence de l’information génétique est dans la région traduite du gène. Les gènes étant de très grande taille, si on n’avait utilisé le gène comme seul matériau d’investigation, on ne connaitrait pas la plupart des voies biologiques.
L’ARNm a subit une compaction après sa phase de maturation (pendant laquelle on a retiré les introns) donc est plus petite et représente vraiment la version la plus ultime du message génétique.
Mais le problème avec l’ARN est qu’on a plusieurs différences sur le plan biochimique avec l’ADN: l’une est une molécule simple brin, l’autre une molécule double-brin et dans un cas on de la thymine et dans l’autre de l’uracile et surtout, il y a une différence de sucre: le désoxyribose dans l’ADN qui est un acide nucléique très stable et le ribose dans l’ARN. Or l’ARN est instable: la difficulté de l’utilisation de l’ARN est son instabilité et cette instabilité vient du fait que par rapport à l’ADN, il y a un hydroxyle en plus et donc, l’ARN se dégrade beaucoup plus vite. Nous sommes en plus bourrés de RNases.
Les réverse transcriptases virales sont des enzymes qui sont d’origine virale et sont spécifiques des virus à ARN (le plus célèbre HIV) ; les génomes de ces virus est un ARN et grâce à l’ARN transcriptase, ils vont transformer cet ARN en un ADN. L’enzyme qui a été récupéré à des fins de biotechnologies est une transcriptase inverse virale ou réverse transcriptase issu de virus (de nombreux rétrovirus ont été identifiés avant le HIV) = origine virale.
Pour faire une opération de réverse transcription, le matériau de départ est l’ARNm qui a une signature particulière car il a à la partie 3’ une queue PolyAdénylée. On va extraire cet ARNm, on va le mettre dans un tube et on va utiliser un certain nombre de réactifs.
Une synthèse nécessite toujours un point de départ: une amorce, et pour la reverse transcriptase, on a besoin d’une amorce d’ADN simple brin artificielle, de petite taille. Cette amorce va permettre d’initier une synthèse. Du fait de sa petite taille, on parle d’oligonucléotide que l’on va commander pour qu’il reconnaisse spécifiquement les ARNm. Or ceux-ci se terminent par une queue polyA et donc on va commander un oligonucléotide dans lequel la base sera uniquement du T. cette amorce est appelé Oligo-dT-23 pour 23 nucléotides (d- car c’est une amorce d’ADN et non d’ARN).
Le principe de cette amorce lorsqu’on la mettra en présence de tous les ARNm, est qu’elle ira s’hybrider = elle va s’apparier de façon sélective par le biais de la spécifié des bases (A-T). Cette amorce va permettre d’initier l’opération de reverse transcription. Les derniers matériaux sont des désoxyribonucléotides: nous en avons 4: d-ATP, d-GTP, d-CTP, d-TTP. On va avoir une opération qui va se faire de manière antiparallèle et complémentaire et on va avoir une extension de cette amorce qui va se faire de la partie 5’ en 3’.
Donc, dans une opération de reverse transcription, on a besoin
- D’un ARNm.
- D’une amorce simple brin d’ADN (dT) et petite taille.
- De l’enzyme clé qui est la transcriptase inverse virale.
- et des désoxyribonucléotides.
A l’issu de cette opération, on obtiendra un seul brin d’ADN complémentaire du brin d’ARN qu’il a recopié. Cette molécule d’ADN s’appelle l’ADN complémentaire: molécule artificielle qui représente le messager en langage ADN. On l’appelle aussi le C-DNA.
Si cette opération de reverse transcription est suivie d’une seconde opération qu’on appelle PCR (polymerase chain reaction), on va pouvoir transformer cet ADN simple brin en ADN double-brin.
Le produit terminé de la reverse transcription est donc un ADN simple brin puis un ADN qui sera un ADN double-brin.
Ces C-ADN correspondent à des gènes réduits à leurs exons et sont tous les outils de la biotechnologie. Ils concentrent la quintessence du génome.
Les Vecteurs
Un vecteur est une molécule d’ADN bicaténaire capable de se répliquer de façon autonome dans une cellule hôte (bactérie, levure, ou cellule animale) et dans laquelle un segment d’ADN peut être inséré ou « cloné ». Il y a différents vecteurs en fonction des différents hôtes. Un vecteur est spécifique d’un hôte.
Le vecteur va permettre de multiplier à façon tout segment d’ADN dans lequel on l’aura introduit et cette opération qui consiste à introduire à un segment d’ADN dans un vecteur est appelée clonage moléculaire.
Aujourd’hui, nous avons la possibilité d’insérer n’importe quelle séquence d’ADN dans n’importe quels vecteurs.
Les différents types de vecteurs
Le plasmide
- Le plasmide est le vecteur le plus utilisé.
- Le plasmide est un vecteur naturel d’origine bactérienne.
- Ceux sont des petites molécules (environ 2700 kb) d’ADN bicaténaire et circulaire que l’on trouve à l’état naturel, dans les bactéries, portant des gènes de résistance aux antibiotiques.
Ils ont identifié grâce aux microbiologistes. Les inserts que l’on peut introduire dans les plasmides sont de petites tailles (quelques kb - insert ≤ 10 kb).
Un plasmide est une molécule d’ADN qui a des outils qui lui permettent de se répliquer dans la cellule hôte, des séquences qui sont reconnues par la machinerie de réplication de la cellule hôte: des origines de réplication (ori) - un plasmide se réplique dans les bactéries.
Un plasmide est une molécule d’ADN qui a le gène de résistance aux antibiotiques Amp. Les seuls gènes de résistance aux antibiotiques auxquels on a accès sont les gènes de résistance à l’ampicilline.
Un plasmide est une molécule d’ADN qui aDes sites d’enzymes de restriction. Le vecteur a pour intérêt pour le biologiste de faire du clonage et, dans ces plasmides, on a construit une séquence artificielle qui a reproduit des sites d’enzymes de restriction ce qui veut dire que si on incube ce plasmide avec l’enzyme EcoR1, cette molécule circulaire qu’est le plasmide va devenir linéaire.
Si on veut procéder à un clonage d’un insert, on peut introduire un insert dont les extrémités seront aussi EcoR1.
On a donc un site de multiclonage dans un plasmide.
- Origine de réplication ORI.
- Gène de résistance AMP.
- Séquence de clonage (site de multiclonage) ouvert par enzyme de restriction.
- Lorsque l’on introduit, on va avoir une réplication à l’infini de ce plasmide: c’est un plasmide de réplication.
- On peut avoir un plasmide d’expression avec un promoteur (bactérien pour exprimer un gène bactérien ou promoteur humain spécifique au gène humain).
- Pour qu’un plasmide permette l’expression de la protéine, on doit avoir en plus un promoteur = une séquence d’ADN reconnue par la RNA polymérase bactérienne.
- Un plasmide est quelque chose qui permet de répliquer à façon l’ADN et parfois d’exprimer la protéine.
- Avant le démarrage de la PCR et la production de manière artificielle en de multiples copies d’un fragment d’ADN, le seul moyen de procéder à une amplification était une amplification biologique par insertion du fragment dans les plasmides. Ceux-ci sont particulièrement importants de nos jours lorsqu’on veut comprendre à des fins de recherche, l’effet d’une protéine mutante et sont les outils essentiels des industries de biotechnologies.
- Leur limite essentielle est qu’ils ne peuvent intégrer que de petits segments d’ADN.
Le chromosome artificiel des levures YAC (Yeast Artificial Chromosome)
- Ceux sont des chromosomes que l’on a réussi à séparer.
- Insert de 100 à 1000 kb.
- L’importance de ces YAC est qu’ils ont été les vecteurs essentiels au séquençage du génome humain. On a pris la pelote d’ADN et on l’a coupé avec des enzymes de restriction mais on a d’abord généré des grands fragments qui ont été introduits dans des YAC.
A partir de ce YAC, ce segment a été digéré par des enzymes de restriction libérant de petits fragments.
Ces YAC vont avoir une anatomie proche mais ils ne se répliquent pas dans des bactéries mais dans des levures = organismes eucaryotes unicellulaires (donc avec des mitoses).
- Une séquence nécessaire à la réplication (comme le plasmide) ou ARS (Autonomous Replication Site).
- Une séquence centromérique (CEN) permettant une ségrégation mitotique (pas comme le plasmide).
- 2 séquences télomériques (TEL) qui permettront la réplication d’une molécule linéarisée.
Nous trouvons comme autre exemple de vecteur, le YAC qui a une importance historique dans le séquençage du génome car il a permis de fragmenter en grands segments (de l’ordre de 500 kb au Mb) et qui contiennent des éléments anatomiques spécifiques permettant leur réplication dans des cellules eucaryotes. Ils sont moins utilisés.
Le chromosome artificiel de bactérie BAC (Bacterial Artificial Chromosome insert de 100 à 200 kb).Les vecteurs viraux
La méthode Southern (1975)
- Le southern ou southern blot est la première méthode qui a permis de descendre à l’échelon moléculaire. C’est une méthode de base d’exploration de l’ADN génomique permettant la visualisation des gènes.
- Le matériau de départ est l’ADN. Dans un southern, on va digérer la pelote d’ADN avec des enzymes de restriction qui vont fragmenter cet ADN.
La méthode comprend les étapes suivantes
Première étape: digestion de l’ADN double brin extrait à partir des cellules ou de prélèvement tissulaire (une cellule diploïde contient environ 6x10-12 g d’ADN), par un ou plusieurs enzymes de restriction.
2ème étape: séparation de fragments d’ADN double-brin sous impulsion électrique par une électrophorèse en gel d’agarose. Cette séparation de ces fragments va se faire en fonction de leur taille. Plus les fragments sont de courte taille (en paire de base), plus ils migreront rapidement. Pour visualiser l’ADN, on aura mis dans le gel d’agarose, un intercalant qui va se fixer sur l’ADN (bromure d’éthidium) qui devient fluorescent lorsque l’on place sous UV. Ces fragments sont si collés les uns aux autres que l’aspect que l’on a, à la fin, est une bande fluorescente. A ce niveau-là, on a des fragments d’ADN double brin.
3ème étape: Dénaturation par la soude de l’ADN (séparation de 2 brins d’ADN) puis transfert du gel sur un filtre de nitrate de cellulose ou de nylon: passage immédiat du gel d’agarose sur un papier filtre, du matériel génétique. Pour faciliter le transfert, après avoir déposé le filtre, on va mettre des piles de papiers buvards et par un système de capillarité, l’eau emprisonnée dans l’agarose va remonter dans ces piles.
Cette opération a pour but de faire passer le gel d’agarose jusqu’au. avant de réaliser le transfert, il est nécessaire de réaliser une opération de dénaturation: transformation du double-brin au simple-brin (soit par chaleur, soit par un procédé chimique: la soude).
4ème étape: hybridation moléculaire avec une sonde approprié avec la sonde = fragment de molécule le plus souvent d’ADN (mais aussi d’ARN) monocaténaire qui peut être artificiel ou endogène. L’objectif de la sonde est de s’hybrider sur la séquence cible.
Une sonde est donc une molécule monocaténaire d’ADN qui va être de capable de s’hybrider avec une séquence cible et sa spécificité est qu’elle peut être détectée par marquage radioactif (sondes radioactives: sondes chaudes et sondes non-radioactive: sondes froides). Elles sont utilisées pour la détection de la séquence complémentaire contenue dans le gène ou l’ARNm au cours d’une réaction d’hybridation moléculaire.
L’hybridation de la sonde avec la séquence cible: hybridation moléculaire: appariement spécifique de deux molécules d’acides nucléiques simple-brin selon la loi de complémentarité des bases (CG, AT).
Les sondes pourront être par exemple un fragment d’ADNc ou de gène ou un oligonucléotide de synthèse. Le plus souvent, leur taille est comprise entre 20 et 2000 nucléotides.
5ème étape: exposition radiographique après lavage du filtre: le lavage permet d’éliminer la sonde en excès. Ensuite, on expose le filtre sur une plaque auto-radiographique: Chaque piste correspond à un prélèvement et on regarde s’il y a un signal ou pas. Lorsqu’on fait un gel d’agarose, on utilise un marqueur de poids moléculaire pour connaitre la taille d’un fragment.
On a donc en Southern
- Digestion de l’ADN double brin par des enzymes de restriction bactériennes.
- Séparation de fragments d’ADN double-brin par électrophorèse en gel d’agarose avec un intercalant qui va se fixer sur l’ADN et devenir fluorescent lorsque l’on place sous UV pour donner une bande fluorescente.
- Dénaturation par la soude ou la chaleur de l’ADN puis transfert par capillarité du gel sur un filtre de nitrate de cellulose ou de nylon: passage immédiat du gel d’agarose sur un papier filtre.
- Hybridation moléculaire avec une sonde monocaténaire appropriée: d’ADN ou ARN monocaténaire qui peut être artificiel ou endogène, marqué ou non, chaude ou froide.
- Exposition radiographique après lavage du filtre.
Le southern Blot permet aussi de faire le diagnostic de sexe et de visualiser la notion de méthylation lors de l’inactivation du X.
Certains enzymes coupent systématiquement (Ecor1) et il y a des enzymes qui coupent si l’ADN est non méthylé.
- Des enzymes de restriction.
- Une sonde.
Dans un résultat de southern, la taille de ce que l’on voit dépend pas de la taille de la sonde mais dépend de la taille du fragment de restriction sur lequel s’hybride cette sonde.
Un homme a un seul chromosome X qui est actif donc qui n’est pas méthylé donc on va avoir une digestion par ecor1 et eag1 et si on fait l’hybridation après l’opération de transfert avec ma sonde, on va hybrider un fragment de 2,8 kb = distance entre EcoR1 et Eag1 sur le chromosome X.
Chez une femme, on a 2 types de chromosomes X- Des chromosomes actifs qui ne sont pas méthylés donc on obtiendra le même résultat que chez l’homme.
- Des chromosomes inactifs dont l’ADN est méthylé. Puisque ces chromosomes X sont méthylés, Eag1 ne va pas couper et le site de restriction sur laquelle la sonde va s’hybrider ne va pas être un fragment de 2,8 kb mais de 5,2 kb = distance entre les EcoR1.
On peut voir facilement en choisissant des enzymes approprié et des sondes appropriées, on peut visualiser l’inactivation de X.
Amplification enzymatique d’ADN par la technique PCR (Polymerase Chain Reaction, 1958).
C’est la méthode clé de voûte de toute la biologie moléculaire: 95 % des diagnostics sont fait par la PCR.
C’est une méthode d’amplification, de synthèse enzymatique exponentielle qui est totalement artificielle, qui se fait dans un tube à essai donc in vitro et permet de produire de multiples copies d’une séquence d’ADN.
- Dénaturation.
- Hybridation.
- Extension.
Ces 3 phases du cycle de la PCR sont simplement basées sur des changements de température.
La PCR est extrêmement rapide (de l’ordre de 10 minutes aujourd’hui) et se fait dans des machines à PCR (méthode automatisée): appareils qui vont contrôler des variations thermiques = thermocycleurs (permettent de faire des cycles contrôlés de température).
La première étape est la dénaturation de l’ADN: transformer l’ADN double-brin en monobrin par chauffage (95°C, pendant 30 secondes mais actuellement elle peut se faire en 4 ou 5 secondes). Donc on a une dissociation des 2 brins de l’ADN (rupture des liaisons hydrogènes).
La deuxième étape est l’étape d’hybridation des amorces (ou primers): une amorce est une molécule de synthèse de petite taille.
Un oligonucléotide de synthèse long environ d’une vingtaine de bases. Un simple brin, l’intérêt est qu’on va la commander à façon pour que ses séquences encadrent la région que l’on souhaite amplifiée. Aujourd’hui, on amplifie des régions qui font jusqu’à 1kb de taille.
une amorce sens est une amorce dont on choisit la séquence pour qu’elle soit complémentaire du brin antisens. La finalité de cette amorce sens est qu’elle vienne s’hybrider sur le brin antisens et puisqu’elle va s’hybrider sur la séquence antisens, sa séquence est identique au début du brin sens. Elle reproduit la séquence sens.
L’amorce antisens que nous orientons de 5’ à 3’: sa finalité est de venir s’hybrider sur le brin sens et sa séquence est identique du brin antisens. Elle est complémentaire du brin sens (attention dans le sens 5’ - 3’).
- 5’ ATGCTGCT ... TTAGCT 3’.
- amorce sens 5’ ATGCTGCT 3’.
- amorce anti sens 5’ AGCTAA 3’.
Donc la 2ème étape correspond à l’hybridation des amorces va consister à déposer dans le tube des amorces complémentaires et permettre la reconstruction des liaisons hydrogènes. Pour permettre la naturation et l’hybridation, il faut descendre la température (car à 95°C toujours dénaturé) donc si on descend à 55-60° C pour permettre cela.
Ces oligonucléotides sont mis en excès pour favoriser l’appariement ADN cible/oligonucléotides et éviter la renaturation des 2 brins d’ADN.
La dernière étape est l’extension des amorces: dans ce tube, on va rajouter les éléments qui permettent la synthèse d’ADN.
d-ADP, d-GTP, d-CT, d-TTP.
Une ADN polymérase qui allonge les amorces de 5’ jusqu’à 3’ en utilisant comme matrice le brin complémentaire.
En modifiant la température, on va permettre cette synthèse. Si on prend la séquence de l’amorce sens cela va permettre la synthèse d’un brin strictement complémentaire du brin antisens donc d’un brin qui sera la réplique parfaite du brin supérieur. Si on fait la même opération, on aura une réplique parfaite à la séquence du brin inférieur.
Cette réaction ne va pas s’arrêter mais lorsque l’on va faire ce second cycle, ce 2nd cycle va venir amplifier en commun la région séparée par les amorces.
Dans la 3ème étape, l’enzyme clé qui a permis l’automatisation de la PCR est une enzyme thermostat: ce sont des ADN polymérases qui vivent dans la nature (fonds marins, geysers) extrêmophiles qui sont des ADN Polymérases thermostable. Au départ, la PCR se faisait avec 3 bain-marie avec des températures différentes et passait avec bain-marie à un autre mais on ne pouvait pas automatiser cette PCR.
La dernière étape du cycle de la PCR sera l’extension de l’amorce qui se fait à une température optimale pour ses ADN polymérases thermostats aux environ de 70 °C.
La PCR (Polymerase chain reaction)
- Est exponentielle.
- Est cyclique.
- 3 phases: dénaturation (90°), hybridation des amorces (50°) puis extensions des amorces (70°).
- Quand le 1er cycle est terminé, on recommence et le brin néo-synthétisé sert de brin matriciel.
- La zone amplifiée est la zone entre les 2 amorces.
- Ce processus va arriver à une phase plateau avec un épuisement de réactifs.
- On effectue en général 30 cycles de PCR.
- Seuls les 20 premiers cycles sont efficaces et exponentielles, les 10 dernières sont réalisées par sécurité et une réaction de PCR permet en moyenne l’obtention de 106 copies d’une séquence = 220.
- Le nombre théoriques de copies obtenues est 2n avec n nombre de cycles - grande quantité de matériel.
- Résultat de la PCR: l’issue d’un cycle, chaque brin est recopié. Il en résulte donc un doublement de la séquence encadrée par les oligonucléotides. En répétant cette opération de façon cyclique, la séquence est amplifiée de façon exponentielle.
- Cette méthode permet d’amplifier n’importe quelle région .
- Après la PCR, on va faire un gel d’agarose et nous allons procéder à un dépôt dans le puit: dans le southern blot, nous avions beaucoup d’ADN de départ, alors que dans la PCR ce qu’on a est infiniment petit donc on va voir la zone amplifié (millions de copies de même taille).
La PCR a totalement révolutionné la génétique moléculaire car elle permet de multiplier par un nombre très important n’importe quel segment de l’ADN.
Réactifs- ADN à amplifier.
- Couple d’Amorces (2).
- Briques: desoxyribonucléotides.
- ADN pol thermostable.
- L’ADN polymérase utilisé dans une réaction de PCR est thermostable et cette thermostabilité a permis l’automatisation de la méthode, l’enzyme tolérant les variations thermiques nécessaires à la dénaturation et l’hybridation.
- La première DNA Polymérase thermostable à être identifié fut la Taq DNA Polymérase. Cette enzyme est probablement l’enzyme la plus utilisée aujourd’hui en biologie moléculaire. Néanmoins, son taux d’erreur (à l’origine de mutations au cours des cycles de la PCR) a conduit à la recherche et l’identification d’autres DNA Polymérases thermostables plus fidèles et douées d’une activité exonucléasique 3’ - 5’ (dite de lecture d’épreuve): Vent Polymérase, Pfu Polymérase.
- 80 à 90 % des espèces vivants sur terre ne sont pas connues (procaryotes, bactéries): parmi celle-ci, on a les extrémophiles.
- La qualité est qu’il s’agisse d’ADN polymérase résistante à la température donc thermostable.
- PCR = 20-100 ng très sensible.
- Southern: 10 µg: moins sensible.
- Sonde: 20-20 000 Pb.
- Amorce: 20 Pb.
- Western blot / immuno blot pour les protéines.
- Northern Blot pour l’ARN.
Evaluation de la taille (ARN) ou du Poids Moléculaire (Protéine) + niveau d’expression.
L’amplification de l’ARNm
Il est possible d’amplifier l’ARN messager d’un gène après transformation de l’ARNm en ADNc = produit de l’ARNm via une réverse transcription donnant un gène restreint à ses exons. A l’issue d’une réverse transcription, on va avoir un monobrin d’ADN complémentaire.
On ne peut pas tout de suite amplifier l’ARNm mais on peut le faire de manière indirecte.
Cette opération qui passe dans un premier temps par la reverse transcription (1 seule amorce avec du T et pas du U !) puis l’amplification s’appelle la RT-PCR.
Risque de contamination
- l’extrême sensibilité de la méthode explique pourquoi le principal danger de cette méthode est le risque de contamination de la réaction avec un autre ADN, en particulier avec un ADN déjà amplifié ou avec l’Adn du manipulateur.
- La PCR est très puissante mais nécessite des mesures draconiennes dans les laboratoires pour éviter la contamination.
- Le risqué de contaminations impose de multiples précautions: sectorisation des pièces destinée à l’extraction des AN, à leur amplification, à l’analyse des produits obtenues par PCR, utilisation de réactifs stériles, de pointes à filtre, exposition des paillasses aux UV après manipulation.
- On est aux alentours du kb: si on a un gène.
- De l’ADN.
- Du couple d’amorces.
- Les désoxyribonucléotides.
- Et l’ADN polymérase thermostable.
Amplification: 45 minutes actuellement et pas besoin d’enzymes de restriction ! (sa c’est uniquement pour la digestion dans Southern ou l’ouverture du plasmide).
La PCR est devenue la méthode de choix pour le diagnostic de maladies virales et d’infections bactériennes.
Application de la PCR: bien que la méthode de Southern soit encore utilisée pour certaines applications précises, l’amplification par PCR représente aujourd’hui la première étape de l’immense majorité des analyses moléculaires, qu’il s’agisse de génétiques moléculaires, de virologie moléculaire (détection des génomes viraux: hépatites, SIDA) ou de bactériologie moléculaire (détection de génome bactériens: diagnostic moléculaire de la tuberculose par exemple).
Séquençage de l’ADN
Révolution en 2013 séquençage de nouvelles générations qui permet de séquencer non pas un gène, mais 23 000 gènes mais nous étudierons le séquençage ciblé (pas l’intégralité du génome en une fois mais des fragments d’ADN): séquençage de Sanger.
La méthode de séquençage de l’ADN s’appelle la méthode de didésoxyribonucléotides ou méthode de Sanger: cette méthode a pour astuce d’utiliser des molécules artificielles des analogues de désoxyribonucléotides mais qui ont un hydroxyle en moins: des didésoxyribonucléotides.
Ces molécules seront incorporées dans les opérations de synthèse mais une fois incorporé, elles arrêtent la synthèse: méthode des terminators.
Le plus souvent on fait le séquençage après la PCR: digestion de l’ADN pour le fragmenter en de multiples régions puis PCR pour les amplifier (avant l’amplification se faisait avec YAC qui est un vecteur).
Lorsqu’on fait la séquence, on fait la séquence d’un brin, et on a besoin d’une amorce d’ADN qui lui-même est un oligonucléotide de synthèse et on le place juste avant la région que l’on souhaite séquencer.
Les éléments que l’on va utiliser sont les didésoxyribonucléotides: dd-ATP, dd-CTP, dd-GTP, dd-TTP. Ceux que nous allons utiliser sont marqués avec un fluorochrome et on utilise 4 fluorochromes différents donc les 4 didésoxyribonucléotides sont de couleurs différentes.
- Après la première incorporation, on obtient un fragment d’ADN simple brin fluorescent.
- Pour synthétiser plusieurs fragments d’ADN et que l’on puisse séquencer les autres bases, dans la réaction de séquençage, il y a en plus des désoxyribonucléotides qui eux pourront être incorporés et ne provoqueront pas d’arrêt.
- On a 4 tubes dans lequel on séquence chaque désoxyribonucléotide.
- Pour le tube de séquence de A par exemple, on va une amorce qui fera 21.
- Le séquençage est basé sur l’incorporation alternative de didésoxyribonucléotides qui arrêtent et marquent au fluorochrome et des désoxyribonucléotides qui n’arrêtent pas et permettent l’élongation.
- A l’issue de cette opération, on aura un mélange de pleins de fragments d’ADN qui seront fluorescents et de tailles différentes.
Aujourd’hui, on met tous les réactifs dans un tube et les rapports molaires ont été travaillés de telle sorte que cela marche très bien. On aura des fragments d’ADN de différentes couleurs et différentes de taille par un seul désoxyribonucléotide.
Seule la dernière lettre incorporé (les autres ont permis l’élongation: ce sont des désoxyribonucléotides) est fluorescente.
Après l’opération biochimique de séquençage on va avoir une opération de séparation électrophorétique, de migration électrophorétique sur des séquenceurs automatiques du génome. Comme ce sont des fragments qui sont de différentes tailles mais distincts d’un nucléotide, on a besoin de gels à haute résolution qui sont verticaux: migration sur gel de polyacrylamide. (substance artificielle) on re-dénaturera ensuite pour passer à la véritable lecture lors de ce gel.
On a une séparation électrophorétique des fragments d’ADN, en fonction de leur taille. Les plus grands resteront en haut du puit, et ceux qui sont de petites tailles migreront en bas du puit. La fluorescence s’active par un faisceau laser. Lorsque les fragments lors de la fragmentation, passent devant le faisceau laser, une fluorescence est émise et émettent un signal reçu par un ordinateur.
Sur les appareils qui sont plus puissants, seulement ce sont des capillaires au lieu d’une plaque.
Il y a une cinétique différente des didesoxyribonucléotides d’où la différence de taille des pics.
L’aspect est parfaitement reproductif chez tous les individus.
Les mutations et les polymorphismes
Il existe dans le génome humain, une mutabilité intrinsèque de l’espèce humaine. Cette mutabilité intrinsèque fait que nous avons un nombre important de variations génétiques appelé mutations. Ces variations sont des causes d’une adaptabilité de l’espèce humaine mais cette mutabilité peut avoir des problèmes si ces variations génétiques ne sont pas tolérés.
On parle de mutations délétères: elles sont négatives dans leur impact biologique car non tolérées.
Il n’y a pas de distinguo dans l’origine moléculaire d’une mutation délétère et une variation qui est la base essentielle de notre différence (polymorphisme non délétaire): c’est la tolérance.
Une mutation est une variation du patrimoine génétique. Le polymorphisme est une mutation dans la population générale non pathologique.
- Il faut d’une part qu’il s’agisse d’une mutation non-délétère.
- Et il faut que l’on trouve de cette variation avec une certaine fréquence dans la population générale (fréquence allélique supérieure à 1% sinon c’est un polymorphisme rare).
- Sur 50 sujets, 100 allèles, si on trouve une seule mutation on aura une fréquence allélique de 1%.
- 10 enfants achondroplastes sur 10 000 naissances dont 8 de parents normaux: 8/20 000 mutation de novo = 4*10^-5.
- Notion de tolérance: est-ce que cette variation est tolérée biologiquement?
- Notion de fréquence de cette variation.
A. Définitions
Une mutation est un changement permanent de la séquence d’ADN. Les mutations sont à la fois à l’origine des variations normales de l’ADN observées dans une population (variation génétique – polymorphisme) et à l’origine des altérations responsables de maladies monogéniques (altérations délétères).
B. Origine
Ces variations sont dues à des erreurs de la réplication de l’’ADN ou erreurs induites par agent mutagène.
Même si l’ADN polymérase est extrêmement fidèle (1 nucléotide mal incorporé sur 10 millions de paires de base = 1/10*106), notre génome fait 3 milliards de paires de bases.
Il existe des erreurs de réplications mais elles sont réparées.
La majorité des erreurs de réplication sont réparés mais ils restent en quelques-unes. Le taux d’erreurs de la réplication = 10-10 par paire de base par division cellulaire. On est obligatoirement exposé à avoir des taux de mutations somatiques importants (d’où l’apparition de cancers) à cause de la complexité du génome et de la nécessité d’un grand nombre de mitoses. 1015 divisions cellulaires donc 105 erreurs en une vie (1015 * 10-10 = 105).
Pour des raisons purement statistiques et stochastiques, si plusieurs mutations surviennent dans une cellule, on aura un cancer. (plus de 10).
La 2ème cause: mutagènes environnementaux: mutations induites par mutagénèse chimique ou physique.
Cette mutagenèse peut être exogène (exemple: rayonnement UV qui provoquent des cancers de la peau, radiations ionisantes, cancérigènes comme l’amiante ) mais également endogène: les radicaux libres ou en particulier la désamination spontanée d’une cytosine méthylée produit une thymine et cette mutation C vers un T sera fixée lors de la prochaine réplication (A à la place d’un G sur le brin opposé) et aboutira à une transition d’une paire CG en paire TA.
- 1ère cause: erreur de réplication de l’ADN polymérase (10*10-6= 10-7).
- 2ème cause: La mutagenèse environnementale.
- 3ème cause: la mutagénèse endogène: nous portons souvent la mutagenèse en nous (C en T).
Les remaniements génomiques: D’autres mécanismes peuvent entrainer des modifications plus importantes de la séquence d’Adn.
En particulier, les crossings-overs inégaux sont à l’origine de remaniements génomiques. Un crossing-over survient à la prophase méiotique: échange parfaitement symétrique entre des chromatides sœurs: pour qu’il soit source d’un brassage normal, l’alignement entre les chromatides sœurs.
Les crossing-overs inégaux sont dus à des défauts d’alignement du à des pièges que sont les séquences répétés: lorsque le crossing over intervient, il se fait de façon décalé. Ces remaniements génomiques sont observés fréquemment dans les maladies humaines (causes des maladies génomiques).
C. niveau de survenue
Les mutations qui sont source de variabilité et de maladies génétiques sont
- Soit de mutations germinales (touchant les gamètes) qui seront alors des mutations de novo pré-zygotique (ou néo-mutation). Le taux de mutation de novo dans l’espèce humaine au niveau des exomes, à chaque naissance, il y a une mutation qui touchent un exon et qui est une mutation à impact biologique. On sait qu’on au niveau des exomes à chaque génération 1 mutation à impact biologique. Il existe des mutations de novo post zygotique (à l’origine des mosaïques).
- Soit des mutations somatiques (restreintes à une cellule). Les mutations somatiques sont à l’origine des cancers. Pour des raisons statistiques, la plupart des mutations sont des mutations somatiques.
Il existe 2 types de cancers
- Les cancers héréditaires 5 % (maladies autosomique dominante à pénétrance incomplète).
- Les cancers du à des mutations 95 % => maladies multifactorielles.
Le taux moyen de mutation de novo par locus et génération est de 10-6 (varie entre 10-4 et 10-7). Il dépend de la taille du gène et de certaines régions du génome qui sont des points chauds de mutation.
Les mutations peuvent survenir au niveau somatique. La plupart des mutations sont somatiques mais certaines sont germinales. Nous sommes faits de 1013 cellules. Si plus de 10 mutations surviennent sur la même cellule on aura un cancer.
D. Effet phénotypique
Les mutation extragénique: a priori pas d’effet phénotypique. (c’est faux, elles ont un effet même si on ne peut pas encore prévoir leurs conséquences).
Les mutations intragénique: Mutations avec effet phénotypique. Une mutation entrainant une maladie génétique est appelée mutation délétère.
Une maladie génétique peut résulter d’un seul type d’altération moléculaire et donc être associé à un seul allèle mutant. Par exemple, pour la drépanocytose, l’anomalie est toujours une mutation ponctuelle touchant le 3ème codon de la globine: Valine remplace glutamine (mutation A- T). LA mutation sera différente d’un individu à un autre peut être différente.
Les mutation sans effet phénotypique: mutation silencieuse, Ex: GGC => GGA (Glycine =>Glycine): sa peut toucher le 3ème codon et être silencieux quand même.
Leur effet phénotypique dépend de leur localisation et de leur tolérance.
Cette hétérogénéité allélique explique la gravité variable du tableau clinique.
E. Type moléculaires de mutations
Substitutions d’une base par une autre
Mutation faux-sens: le changement d‘une base dans un codon se traduisant par la substitution d’un acide aminé par un autre. Cette mutation pourra entrainer une altération de la structure et de la fonction de la protéine.
Exemple: GGC - AGC (Glycine - Sérine).
Mutation non-sens: le changement d’une base dans un codon entraîne l’apparition d’un codon stop prématuré. Ce n’est pas un arrêt prématuré de la transcription (les conséquences sont traductionnelles) donc l’ARN mutant fera la même taille mais la protéine sera plus courte = protéine tronquée. Plus cette mutation sera au début de l’ARNm plus elle sera grave. SI l’effet d’une mutation stop est l’apparition de protéine anormalement courte, il y a un autre effet de ces mutations stop: notre cellule reconnait par le système de dégradation médiée par des mutations non-sens NMD: c’est un système de dégradation de l’ARN: la cellule va suicider l’ARN mutant au lieu de créer la protéine tronquée (qui peut être toxique).
Le système ERAD.
Exemple: GGA - TGA.
Conséquences traductionnelle = Synthèse ARNm de la même taille que d’habitude mais qui comporte un codon stop prématuré ce qui fera arrêter la traduction plus tôt que prévu pour aboutir à une protéine non fonctionnelle car trop courte voire toxique.
Mutations des sites d’épissage (phénylcétonurie par exemple): Ces mutations entrainent une altération de l’épissage, soit l’excision anormale d’un exon ou la rétention d’un intron. Donc une mutation intronique peut provoquer une altération de l’épissage.
Le ribosome sera capable de lire un intron imprévu.
Exemple: AATTTGCAgtctgc - AATTTGCAttctge 1: 39
Des mutations silencieuses sur le plan traductionnel ou a priori faux sens peuvent être en fait des mutations touchant des séquences régulant l’épissage.
Délétions, duplication, insertions: La taille est très variable: de 1pb à plusieurs millions de Pb. La gravité de ces altérations quantitatives (délétion-insertion) est le fait qu’elle soit ou ne soit pas un multiple de 3.
Délétion qui respecte le cadre de lecture (si on retire 3 nucléotides).
Délétion d’un seul nucléotide ou d’un non multiple de 3 (plus grave car le cadre de lecture va changer): ce sont des délétions ou insertions frame shift (exemple de la maladie de Duchenne).
Dans les altérations quantitatives, on peut avoir des délétions et insertions, on peut avoir des expansions: augmentation anormale du nombre de séquences répétées en tandem existant normalement dans le génome. Il s’agit en particulier de triplets localisés dans les régions codantes ou non-codantes des gènes. De telles mutations sont appelées mutations dynamiques ou instables. (exemple: maladie de Huntington). L’expansion est particulièrement toxique et une forme particulière d’insertion.
Remaniements génomiques: Ceux sont des délétions ou duplications de grande taille touchant plusieurs introns et exons. Ils résultent d’un défaut d’appariement des chromosomes homologues favorisé par les séquences répétées. Les chromatides sœurs seront alors mal appariés lors des recombinaisons méiotiques pendant le crossing over.
- Maladie monogénique (6000-8000 maladies): 1 gène touché.
- Maladie génomique: Plusieurs gènes touchés.
- Détection par des puces à ADN (génomique).