Les cours pour Organisation du génome et transcription 1ére année

Comprendre l'Organisation du génome et transcription

Les outils de la génétique moléculaire

Le Génome est un ensemble de l’information génétique, contenue sous forme d’ADN dans nos cellules.
ADN nucléaire (l’ADN mitochondrial intervient dans la synthèse d’une très petite quantité de protéines).

I. Organisation de l’ADN nucléaire

ADN: principalement localisé dans le noyau (eucaryotes):

L’ADN doit subir une compaction très importante (même en interphase)

Chaque nucléosome est relié au suivant par un fragment d’ADN (ADN linker) sur lequel se fixe au niveau du site de sortie une protéine histone H1 ce qui permet l’empilement des nucléosomes. Sa phosphorylation conduira à la compaction des chromosomes pendant la mitose.

Différents niveaux de compaction.
1) La fibre de chromatine
2) Le chromosome
Remodelage de la chromatine

Toutes ces modifications ont un sens puisqu’elles vont permettre la neutralisation des charges positives des histones sur leur extrémité N-terminale (= queue N terminale des histones) et donc permettre une diminution de la liaison ADN-histone (+ de flexibilité).
Des segments d’ADN deviennent accessibles à des protéines spécifiques du remodelage.
En dehors de la division cellulaire, la chromatine est sous forme décondensée (différence avec le cours du Pr Macé où la chromatine est compactée même en interphase), sous forme de chromatine de 30 nm + chromosomes non visibles.
Au cours de la division cellulaire, la chromatine est sous forme condensée, et les chromosomes sont visibles.

II. Différentes catégories d’ADN nucléaire (ADN non fonctionnel = hétérochromatine)

On distingue l’ADN non fonctionnel de l’ADN fonctionnel.
L’ADN non fonctionnel représente 7 % de l’ADN du noyau: c’est l’hétérochromatine.
L’ADN fonctionnel représente 93 % de l’ADN du noyau: c’est l’euchromatine.

Parmi cet ADN fonctionnel, il y a:

Donc dans cet ADN fonctionnel, 2 portions importantes:

ADN génique = 29 % du génome

1. les gènes codant pour des protéines: gènes de structure ou gènes inductibles.

Chaque gène est présent sous forme d’une, deux ou quelques copies rarement dispersées sur plusieurs chromosomes. Quand il y a plusieurs copies elles sont le plus souvent sur le même chromosome (mais pas toujours): CNV.
La taille de ces gènes est très variable 30 000 nucléotides.

De temps en temps, on va retrouver:

Ces gènes sont dispersés, éloignés les uns des autres.

2. Autres Gènes: gènes de ménages ou gènes constitutifs ou gènes domestiques

A la différence des gènes des protéines, ces gènes sont répétés de nombreuses fois et organisés en tandem (les uns à la suite des autres en copies multiples, de façon séquentielle sur l’ADN).
Intérêt: production accrue d’ARN nécessaires pour la synthèse protéique et d’histones pour le renouvellement des cellules. Ces gènes constitutifs sont TOUJOURS exprimés à l’inverse des gènes de structure qui sont tissus spécifique.

2) ADN inter génique fonctionnel (64 %): peut rarement être codant

1. ADN répétitif groupé = 10 % du génome

Généralement, ce sont des séquences non codantes (non transcrites et non traduites) mais fonctionnelles.

Ce sont des séquences:

Cet ADN répétitif groupé est situé sur les chromosomes au niveau des centromères et des télomères (VNTR).

2. ADN répétitif dispersé = 50 % du génome

Ce sont des séquences répétées mais qui sont dispersées tout au long du génome et qui sont en grande partie (mais pas toutes); non codantes (non transcrites et non traduites) et qui dérivent de séquences d’ADN capables de se déplacer au sein du génome.
les rétro transposons et les transposons.

Dans les cellules eucaryotes, seule une partie de l’ADN contient l’information nécessaire à la synthèse des protéines.

3. ADN non codant très conservé

Ces séquences représentent 4% du génome.

La Transcription

1) Génome et information.

2) Eléments nécessaires à la transcription:

  1. Nucléotides.
  2. ARN Polymérase eucaryote.
  3. Gène: le gène de structure et son organisation.

3) Le mécanisme d’action de l’ARN Pol II

  1. L’initiation de la transcription.
  2. Elongation de la transcription .
  3. Fin de la transcription.

4) Modifications des transcrits

  1. Chapeau en 5’.
  2. Excision – épissage.
  3. PolyA en 3’.

5) Régulation de la transcription

  1. Niveau chromatinien.
  2. Niveau transcriptionel.
  3. Niveau post-transcriptionel.

1) Génome et information

ADN = support matériel de l’information génétique.
Génome: Ensemble de l’information héréditaire d’un organisme.
Présent en totalité dans chacune des cellules de l’organisme (à l’exception des globules rouges qui perdent leur noyau lorsqu’ils rentrent dans la circulation sanguine et deviennent alors matures et fonctionnels).
Par définition, un gène est une séquence d’ADN qui contient l’information pour la synthèse d’un ARN et pas nécessairement une protéine. (ex gènes des ARNr).

Les génomes sont différents selon les espèces.

1. leur taille est très variable (en nombre de paires de bases)

2. le nombre de gènes qu’ils contiennent:

3. La nature de ces gènes:

Les gènes des bactéries n’ont rien à voir avec ceux des humains, même s’il y a des similitudes.
Une espèce est caractérisée par un ensemble de gènes spécifiques.

Séquençage du génome humain: 1995 – 2004
  1. Détermination de la succession des nucléotides composant le génome.
  2. Localisation des gènes.
  3. Identification et annotation des gènes.

La transcription: synthèse à partir du brin matrice d’un gène, d’un ARN dont la structure primaire reproduit celle du brin sens de ce gène, par une ARN-polymérase.
L’ADN étant bicaténaire, pour chacun des gènes de l’ADN, on décrit 2 brins: le brin matrice = brin transcrit et le brin sens ou brin codant, complémentaire du brin matrice.
La transcription se fait donc à partir d’un seul des 2 brins du gène, le brin matrice. Selon les gènes, ce brin matrice peut être sur l’un ou l’autre brin de l’ADN. (Piège QCM souvent on met ADN au lieu d’ARN ou l’inverse).
On ne représente que le brin sens ou codant.

2) Eléments nécessaires à la transcription

1. Nucléotides:

2. ARN Polymérase eucaryote:

Il existe 3 ARN Polymérases (ARN Pol) différentes

3. Gène: le gène de structure et son organisation:

Il va falloir que toute la machinerie transcriptionelle (l’ARN Pol, les nucléotides triphosphates) puisse arriver au niveau du brin matrice de ce gène d’où la notion de remodelage de la chromatine nécessaire à l’accessibilité de cette machinerie.

L’organisation des gènes a un rôle important dans la transcription puis dans la traduction. On va s’intéresser surtout à la transcription des gènes de structure codant pour les ARNm: ces gènes ont une structure commune.
Par convention, on désigne par +1 le premier nucléotide à partir duquel la transcription du gène débute: c’est le site d’initiation de la transcription.

A partir de ce site +1, on va définir 2 régions:

1) en amont du site +1:

Ces gènes commencent par une région correspondant à une séquence de nucléotides non transcrite et non traduite mais indispensable à la transcription: le promoteur du gène.

On distingue:

a) le promoteur minimal ( 100 paires de bases) avec, en général:

b) Des séquences régulatrices spécifiques (activatrices ou inhibitrices) en amont du promoteur minimal:

Ce sont des séquences très courtes ( 10 paires de bases) capables de fixer certaines protéines régulatrices de la transcription. Ces séquences régulatrices avec ces protéines régulatrices sont capables d’activer ou d’inhiber l’ARN Pol II bien qu’elles ne soient pas transcrites.

Ces séquences peuvent être très éloignées les unes des autres et très éloignées du site +1: à des centaines ou des milliers de Pb de +1 (de la boite CAT ou TATA); difficile à mettre en évidence et à délimiter.

Ces séquences non transcrites et non traduites existent dans toutes les cellules mais ne sont fonctionnelles que dans un tissu particulier; elles confèrent au gène sa spécificité tissulaire.

2) En aval du +1:

Ces gènes sont composés d’une séquence de nucléotides:

Les introns (30%):

Les exons (1%):

Séquences du gène exprimée, transcrites et traduites d’environ 50 à 500 paires de base.

Le premier exon possède en général:
Le dernier exon ( miroir du 1er exon) possède:

En conclusion, les gènes

3) Le mécanisme d’action de l’ARN Pol

1. L’initiation de la transcription:

L’ARN Pol II est incapable de se lier directement sur l’ADN. Elle agit après l’intervention de facteurs généraux de transcription TF II (Transcription Factor ARN Pol II) qui va phosphoryler L’ARN Pol II. (Il y a des facteurs spécifiques de transcription: Trans cf cours n°3).

Caractéristiques de TFII:
Assemblage séquentiel de TF II:
TFII D pour la 1ère liaison à l’ADN constitué de TFII A TFII B

L’ensemble forme le complexe d’initiation et recouvre une séquence d’environ 100 nucléotides en amont du site +1 (à peu près la taille du promoteur minimal).

4) TFII H catalyse l’ouverture des 2 brins d’ADN:

TFII H active l’ARN Pol II

c) ARN Pol II

L’ARN Pol II synthétise un brin complémentaire et antiparallèle au brin matrice.
L’ARNm reproduit exactement le brin sens du gène (l’uracile a remplacé la thymine du gène).

2. Elongation de la transcription

L’ARN Pol II

3. Fin de la transcription

L’ARN Pol II reconnaît en aval le signal de polyadénylation, des signaux stop (mal connus).
L’ARN Pol II est déphosphorylée ce qui régénère l’enzyme native et libère l’ADN et l’ARNm.
(La phosphorylation est mauvaise pour tout le monde (vu jusqu’à présent dans les cours) sauf pour la myosine et la Pol II qui sont activées par phosphorylation).

4) Modifications des transcrits 1aires

Les transcrits primaires subissent dans le noyau des modifications covalentes (=maturation) pour donner les ARNm matures fonctionnels.

1. Chapeau GMP méthyle en 5’

coiffe ou cap: 7-méthyl guanine
Rôle du chapeau de l’ARNm

2. Excision – épissage

Il permet d’éliminer les introns et relier les exons. Site d’épissage: phénylcétonurie.

Pour tous les introns d’un transcrit primaire
Fonctionnement (pour les eucaryotes car pas d’introns chez les procaryotes)
  1. Clivage du GU au niveau du site donneur d’épissage qui libère un Phosphate.
  2. Fixation sur l’Adénine du site de branchement; lasso par liaison ester en 2’ de l’Adénine grâce au phosphate libéré par le site donneur d’épissage GU.
  3. Clivage du AG au niveau du site Accepteur d’épissage.
  4. Epissage de l’exon amont et de l’exon aval; liaison phosphodiester qui va les relier.
  5. Dégradation de l’intron (lasso).

Ce phénomène d’excision-épissage met en jeu des spliceosomes.

Intervention des spliceosomes = entités ribonucléoprotéiques
Ces protéines associées vont assurer

L’interaction entre eux provoque le repliement du transcrit primaire.

Epissage et médecine

3. PolyA en 3’

Rôle de la queue polyA au niveau de l’ARNm

Mêmes rôles que le chapeau de 7-méthyl guanine sans protéger contre les nucléases.
Du gène à l’ARN mature: on aboutit à de l’ARN suffisamment fin pour passer les pores de l’enveloppe nucléaire.
200 Pb entre 2 nucléosomes.

ATTENTION

Enseignement Lipides pour la faculté de médecine

Les autres chapitres
Les Lipides Les réactions biochimiques du corps humain