ADN et identification génétique.
La mise au point de la technique d'amplification de l'ADN par PCR (Polymerase Chain Reaction); la possibilité d'amplifier en plusieurs centaines de milliers de copies une seule molécule d'ADN de départ; a permis de développer de nombreuses applications.
Ce procédé révolutionnaire permet d'obtenir une amplification considérable d'un fragment donné d'ADN. Il devient alors possible de l'étudier. La réalisation d'empreintes génétiques pour un coût relativement faible
est une des possibilités offertes par cette technologie.
Nous vous proposons d'en découvrir le principe.
Le génome.
Il s'agit de l'ensemble complet du matériel génétique d'un être vivant. Une copie du génome se trouve dans chaque cellule de l'organisme (à quelques exceptions près, telles que les globules rouges par exemple). Lorsqu'une cellule se
divise, l'information est copiée et transmise aux cellules filles. Le génome est principalement contenu dans les chromosomes. L'être humain en compte 23 paires, le chien en possède 39 paires.
Le chromosome X
Le génome contient toutes les instructions nécessaires au développement, au fonctionnement, au maintien de l'intégrité et à la reproduction des cellules et de l'organisme. Ces instructions s'appellent les gènes.
L'ADN.
C'est le support matériel du génome.
Le génome est composé de molécules d'ADN (Acide DésoxyriboNucléique) géantes. La structure de l'ADN ressemble à une longue échelle qui a été torsadée et compactée pour former 1 chromosome.
Les montants de l'échelle sont formés par une colonne de molécules de sucre et de phosphate. Les échelons sont composés de bases nucléotidiques liées faiblement au milieu par des liaisons hydrogènes. Ce sont ces bases qui, par
leur ordonnancement, vont constituer l'information génétique.
Les Bases de nucléotides
Un nucléotide est composé d'une molécule de sucre, d'une molécule d'acide phosphorique et d'une molécule appelée "base" qui sera 1 des 4 produits chimiques suivants: Adénine, Thymine, Guanine ou Cytosine. Ces bases sont schématisées
par les lettres A, T, G, C.
Chaque nucléotide est donc constitué d'une partie fixe, la molécule de sucre et d'acide phosphorique, et d'une partie variable qui prendra 4 formes différentes: A ou T ou C ou G
L'information génétique est écrite dans un langage à 4 lettres, un peu de la même manière que le langage informatique dont les instructions et les données sont codées avec un langage à 2 chiffres (0 ou 1).
3 milliards de ces instructions que sont les paires de bases, assemblées en 23 paires de chromosomes vont ainsi composer le génome humain (le chien possède 39 paires de chromosomes, mais seulement 800 millions de paires de bases).
Rassemblées dans un livre, le génome humain aurait la taille de 800 dictionnaires. Pourtant, la totalité du génome est contenue dans un noyau microscopique.
A noter:
Dans la structure de l'ADN, les bases sont complémentaires 2 par 2. L 'Adénine s'apparie toujours avec la Thymine (A-T ou T-A) et la Guanine s'apparie toujours avec la Cytosine (G-C ou C-G).
L'ADN est donc, schématiquement, un long message construit à partir d'un code de 4 substances chimiques représentées par les lettres ATCG. Ce message contient toutes les informations nécessaires au fonctionnement de l'organisme. Assemblées
précisément, les nucléotides vont constituer les gènes qui seront eux-mêmes traduits en protéines sur la base d'un code génétique donnant la correspondance nucléotide-acide aminé. Il existe 20 acides aminés
différents, l'acide aminé étant le composant ou l'unité de base d'une protéine. A partir de ces 20 acides aminés, et selon une recette précise stockée dans les gènes, l'être humain fabriquera les 100 000 sortes (environ)
de protéines qui lui sont nécessaires pour vivre.
Le code génétique.
Imaginez chaque chromosome comme une longue, une très longue succession de nucléotides, un chapelet pouvant avoir une centaine de millions de perles. Chaque groupe successif de trois nucléotides correspond à un acide aminé selon un code préétabli
connu par les cellules et chaque recette de protéine constitue un gène. C'est au début des années 60 que les chercheurs ont réussi à trouver le code génétique.
AAA
Phénylalanine
|
AGA
Sérine
|
ATA
Tyrosine
|
ACA
Cystéine
|
Pourquoi est-ce AAA qui code pour la phénylalanine et non une autre combinaison de nucléotides? Actuellement on ne le sait pas. On imagine que le code sest formé au tout début de lhistoire
de la vie, il y a plus de trois milliards dannées. Mais on ne peut absolument pas expliquer pourquoi cest ce code qui a été retenu par la nature.
Peut-être que plusieurs codes différents se sont même formés au tout début de la vie. Mais même si ce fut le cas, il n'en reste plus qu'un aujourd'hui, celui que vous pouvez observer à gauche. Ce code est dit universel, il est
le même pour tous les êtres vivants.
Notez que trois triplets précis ne codent pas pour un acide aminé. Ils correspondent à un signal d'arrêt, c'est à dire qu'ils indiquent la fin de la recette. Tous les gènes se terminent donc par un de ces triplets STOP (ATT, ACT ou
ATC).
Notez également que le code est redondant. C'est à dire que plusieurs combinaisons de trois lettres peuvent désigner le même acide aminé. Ainsi, GCA, GCG, GCT, GCC, TCT et TCC codent tous pour l'arginine.
|
AAG
Phénylalanine
|
AGG
Sérine
|
ATG
Tyrosine
|
ACG
Cystéine
|
AAT
Leucine
|
AGT
Sérine
|
ATT
STOP
|
ACT
STOP
|
AAC
Leucine
|
AGC
Sérine
|
ATC
STOP
|
ACC
Tryptophane
|
GAA
Leucine
|
GGA
Proline
|
GTA
Histidine
|
GCA
Arginine
|
GAG
Leucine
|
GGG
Proline
|
GTG
Histidine
|
GCG
Arginine
|
GAT
Leucine
|
GGT
Proline
|
GTT
Glutamine
|
GCT
Arginine
|
GAC
Leucine
|
GGC
Proline
|
GTC
Glutamine
|
GCC
Arginine
|
TAA
Isoleucine
|
TGA
Thréonine
|
TTA
Asparagine
|
TCA
Sérine
|
TAT
Isoleucine
|
TGG
Thréonine
|
TTG
Asparagine
|
TCG
Sérine
|
TAG
Isoleucine
|
TGT
Thréonine
|
TTT
Lysine
|
TCT
Arginine
|
TAC
Méthionine
|
TGC
Thréonine
|
TTC
Lysine
|
TCC
Arginine
|
CAA
Valine
|
CGA
Alanine
|
CTA
Ac. aspartique
|
CCA
Glycine
|
CAT
Valine
|
CGG
Alanine
|
CTG
Ac. aspartique
|
CCG
Glycine
|
CAG
Valine
|
CGT
Alanine
|
CTT
Ac. glutamique
|
CCT
Glycine
|
CAC
Valine
|
CGC
Alanine
|
CTC
Ac. glutamique
|
CCC
Glycine
|
Reproduction avec l'aimable autorisation de Gilles Bourbonnais / Cégep de Sainte Foy
Prenons comme exemple l'information nécessaire pour synthétiser du lysozyme. La mise en oeuvre de 130 acides aminés est nécessaire pour synthétiser une molécule de lysozyme. On pourrait écrire cette information en représentant
chacun des 130 acides aminés de la chaîne par trois lettres de l'alphabet latin. On obtiendrait ceci: LYS - VAL - PHE - GLU - ARG - CYS - GLU - LEU.......et ainsi de suite jusqu'au dernier acide aminé qui est VAL
Les trois caractères LYS, par exemple, codent pour l'acide aminé lysine; les caractères VAL codent pour la valine, etc.
Cependant, ce code serait inutilisable pour la cellule. On voit difficilement comment on pourrait entrer cette recette faite d'un alphabet latin dans la cellule et comment on pourrait lui apprendre à l'utiliser (à décoder la recette) pour fabriquer du lysozyme.
Pourtant cette recette du lysozyme est bien présente dans chacune de vos cellules. Elle n'est pas écrite avec des lettres de l'alphabet, mais avec des molécules, plus précisément des nucléotides. Les nucléotides forment un code que
la cellule peut lire et reproduire.
|