Code génétique

Un article de Wikipédia, l'encyclopédie libre.

Code Génétique.
Code Génétique.

Le code génétique désigne le système de correspondance mis en jeu lors de la transformation de l'information génétique des gènes en protéines, au cours du processus de traduction. Les ribosomes traduisent ainsi, en suivant ce code, l'enchaînement des bases nucléotidiques de l'ARN en une séquence d'acides aminés.

Sommaire

[modifier] Expression du génome

La séquence des bases de l'ADN est fréquemment comparée, par analogie, à la séquence des lettres d'un texte. La séquence prise en elle-même n'a aucun sens, si le lecteur n'en connaît pas le code, c’est-à-dire le langage utilisé.

Les mots du langage génétique, appelés codons sont des triplets de nucléotides (A, C, U ou G). Il existe 4³=64 combinaisons possibles de ces quatre lettres en triplets. Trois codons, parmi ces 64 codes possibles, signifient la fin de la traduction (codon stop). Aux 61 autres codons ne correspondent que 20 acides aminés. Le code génétique est donc dit dégénéré ou redondant car un acide aminé est codé par plusieurs codons (on appelle ces codons « codons synonymes »). Ainsi, en moyenne une mutation génétique sur trois affectant une séquence d'ADN codante n'entraîne aucune modification de la protéine traduite.

Remarque : si un nucléotide avait codé pour un acide aminé, 20-41=16 acides aminés n'auraient pas été codés. Si deux nucléotides avaient codé pour un acide aminé, le même problème aurait eu lieu pour 20-4²=4 acides aminés. Avec un système de codons de 3 nucléotides, il y a au contraire trop de combinaisons.

Ce code permet la synthèse des protéines. L'ADN est transcrit en ARN-messager (ARNm). Celui-ci est traduit par les ribosomes qui assemblent les acides aminés présents sur des ARN-transfert (ARNt). L'ARNt contient un « anti-codon », complémentaire d'un codon, et porte l'acide aminé correspondant au codon. Pendant la traduction, le ribosome lit l'ARNm codon par codon, met en relation un codon de l'ARNm avec l'anti-codon d'un ARNt et ajoute l'acide aminé porté par celui-ci à la protéine en cours de synthèse.

[modifier] Codons

Dans le tableau suivant, la rangée indique la première lettre du codon, la colonne indique la seconde et la dernière colonne indique la dernière lettre du codon.

U C A G
U UUU phénylalanine UCU sérine UAU tyrosine UGU cystéine U
UUC UCC UAC UGC C
UUA leucine UCA UAA stop UGA stop A
UUG UCG UAG UGG tryptophane G
C

CUU
CUC
CUA
CUG

leucine

CCU
CCC
CCA
CCG

proline

CAU
CAC
CAA
CAG

histidine

CGU
CGC
CGA
CGG

arginine U
C
glutamine A
G
A

AUU
AUC
AUA
AUG

isoleucine

ACU
ACC
ACA
ACG

thréonine

AAU
AAC
AAA
AAG

asparagine

AGU
AGC
AGA
AGG

sérine U
C
lysine arginine A
méthionine/start G
G

GUU
GUC
GUA
GUG

valine

GCU
GCC
GCA
GCG

alanine

GAU
GAC
GAA
GAG

acide aspartique

GGU
GGC
GGA
GGG

glycine U
C
acide glutamique A
G
Tableau inverse
Ala GCU, GCC, GCA, GCG Leu UUA, UUG, CUU, CUC, CUA,

CUG

Arg CGU, CGC, CGA, CGG, AGA,

AGG

Lys AAA, AAG
Asn AAU, AAC Met AUG
Asp GAU, GAC Phe UUU, UUC
Cys UGU, UGC Pro CCU, CCC, CCA, CCG
Gln CAA, CAG Ser UCU, UCC, UCA, UCG, AGU,

AGC

Glu GAA, GAG Thr ACU, ACC, ACA, ACG
Gly GGU, GGC, GGA, GGG Trp UGG
His CAU, CAC Tyr UAU, UAC
Ile AUU, AUC, AUA Val GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA

Un ARNm et un gène se terminent toujours par un « codon non-sens » aussi appelé « codon-stop », il existe 3 codons-stop (UAG, UAA et UGA). Ceux-ci tiennent le rôle du point en bout de phrase. À noter que le codon UGA peut parfois coder une sélénocystéine, produisant alors une sélénoprotéine.

[modifier] Son universalité

[modifier] Principe de base

Ce système de codage entre l'ADN ;et les acides aminés s'est avéré être utilisé par l'immense majorité des être vivants. De l'homme à la bactérie, ce même code est utilisé. Cette universalité du code est expliquée en terme d'évolution : si le changement d'une base dans l'ADN peut entraîner des changements parfois bénéfiques dans l'être vivant, cela n'est que peu probable dans le cas d'un changement du codage. En effet, cela reviendrait à changer la position des touches d'une machine à écrire d'un dactylographe tapant à l'aveugle : le texte résultant sera fort probablement complètement illisible. Le système de codage est ainsi resté inchangé durant les milliards d'années d'évolution de la vie. On estime généralement qu'il s'est fixé ainsi très tôt dans l'histoire de la vie, probablement avant le dernier ancêtre commun à tous les êtres vivant (baptisé LUCA).

[modifier] Exceptions

Cette vision des choses est simpliste : si l'immense majorité des organismes vivants aujourd'hui utilisent le code génétique standard, les généticiens ont découvert quelques variantes à ce code. De plus, ces variantes se retrouvent dans les différentes lignées évolutives et consistent en des traductions différentes de quelques codons.

  • Le codon CUG, traduit habituellement par la leucine, correspond à la sérine[1] chez de nombreuses espèces de champignons Candida[2] .
  • Les variations du codage utilisés par les mitochondries sont encore plus nombreuses. Dans le génome mitochondrial de la levure de boulanger (Saccharomyces cerevisiaie), la thréonine est codée par 4 des 6 codons correspondant classiquement à la leucine.
  • De nombreuses espèces d'algues vertes du genre Acetabularia utilisent les codons-stop UAG et UAA pour coder la glycine.
  • De nombreux ciliés, comme Paramecium tetraurelia, Tetrahymena thermophila ou Stylonychia[3] lemnae utilisent les codons UAG et UAA pour coder la glutamine au lieu de stop. Seul UGA est stop chez ces cellules.
  • Le cilié Euplotes octocarinatus utilise le codon UGA pour coder la cystéine, ne laissant que UAG et UAA comme stops.
  • Dans les trois règnes du vivant, on trouve parfois un 21e acide aminé, la sélénocystéine, codé par le codon UGA (habituellement un codon-stop).
  • Il existe quelques acides aminés spéciaux, comme la 5-Hydroxylysine dans le collagène, la 4-Hydroxyproline dans dans la paroi végétale, le gamma-carboxylglutamate dans la prothrombine (protéine de coagulation), et la gamma-methyl-lysine dans la myosine.
  • Dans les archées et les eubactéries, un 22e acide aminé, la pyrrolysine est parfois rencontré, codé par UAG (également habituellement un codon-stop).
  • Dans les mitochondries humaines, AUA, comme AUG, code la méthionine et non l'isoleucine.
  • Dans les mitochondries humaines, AGA et AGG sont des codons-stop et ne codent pas l'arginine.
  • Dans les mitochondries humaines, de la levure de boulanger, de spiroplasmes et de Mycoplasma mollicutes, UGA n'est pas un codon-stop mais code le tryptophane.

Le premier acide aminé incorporé (déterminé par le codon-start AUG) est une méthionine chez la plupart des eucaryotes, plus rarement une valine (chez certains eucaryotes), et une formyl-méthionine chez la plupart des procaryotes. En outre, ce codon d'initiation est parfois GUG ou GUU chez certains procaryotes.

On pense donc aujourd'hui que la vie comptait à l'origine un nombre plus restreint d'acides aminés. Ces acides aminés ont été modifiés et ont vu leur nombre augmenter (par un phénomène similaire à la formation de la sélénocytéine et à la pyrrolysine qui dérivent de la sérine et de la lysine, respectivement, modifiées alors qu'elles sont sur leur ARN de transfert sur le ribosome.) Ces nouveaux acides aminés ont alors utilisé un sous-ensemble des ARN de transfert et leur codage associé. On remarque peut-être des traces de ce phénomène avec la glutamine, qui dans certaines bactéries, dérive du glutamate encore attaché à son ARN de transfert.

Autre exception : le code est parfois ambigu. Ainsi par exemple, le codon UGA peut dans un même organisme (Escherichia coli par exemple) coder tantôt pour le 21ème acide aminé évoqué plus haut (sélénocystéine) ou pour "stop".

[modifier] Notes

  1. Non-universal usage of the leucine CUG codon and the molecular phylogeny of the genus Candida
  2. génomde candida albicans
  3. voir (en) Stylonychia


Acide aminé

Ala | Arg | Asn | Asp | Cys | Glu | Gln | Gly | His | Ile | Leu | Lys | Met | Phe | Pro | Ser | Thr | Trp | Tyr | Val
Acide aminé essentiel | Protéine | Peptide | Code génétique