Cet article reprend des notions développées dans d’autres articles du site. Nous vous conseillons donc la lecture de ceux-ci avant de continuer: Gènes et protéines, qu’en savez-vous? – Un article définissant la notion de gène. Voyage au centre de l’ADN – Un article abordant la nature de l’ADN, sa composition et ses propriétés. Cet article est d’une importance considérable pour la compréhension de nombreux articles que nous publierons. Il est donc plus long que d’habitude et séparé en sous-parties. Nous vous souhaitons une belle lecture !

Il fut précédemment raconté que les gènes sont des séquences d’ADN contenant une information. Avec cette information la cellule peut par exemple synthétiser une protéine. Mais comment une cellule peut générer une protéine à partir de l’information contenu dans un gène? Comment peut-elle déchiffrer une séquence précise de nucléotides pour en obtenir une séquence précise d’acides aminés?

Penchons nous d’abord sur le génome, ce livre rempli de phrases que sont les gènes. Tout d’abord, comment trouver exactement le début et la fin d’un gène? Tout comme une phrase, un gène possède une majuscule et un point pour le délimiter. La “majuscule” est une séquence d’ADN appelée “promoteur”. Le “point” lui, plus intuitivement, est nommé “terminateur”. Entre le promoteur et le terminateur se trouve la séquence d’ADN spécifique au gène. Promoteurs et terminateurs sont des séquences très précises qui ne sont pas uniques au gène auquel elles sont associées, ils ne font pas partie du gène. En effet, plusieurs gènes dans un génome peuvent avoir le même promoteur ou le même terminateur.

Promoteurs et terminateurs agissent donc comme des séquences-balises d’ADN facilement reconnaissables dans le génome, sorte de phares dans une mer d’ADN. En bref, ce sont des séquences d’ADN “consensus” utilisées comme point de repère. Le gène porte en son sein une sous-séquence nommée “séquence codante”. Vous trouverez un résumé en Figure 1.

Figure 1: Représentation d’un gène et des différents éléments qui le définissent.

Comme le veut la sémantique, une séquence codante est amenée à être décodée. Le décodage de la séquence codante se fait en deux étapes, grâce auxquelles la cellule peut synthétiser une protéine à partir d’un gène. Intéressons-nous maintenant au premier décodage, la transcription…

Tout décodage requiert un message à déchiffrer, un décodeur, et un nouveau langage. Pour le premier décodage, le nouveau “langage” est l’ARN, qui comme l’ADN est une séquence de nucléotides. Le décodeur de l’ADN est une protéine nommée ARN polymérase. L’ensemble du processus par lequel l’ARN polymérase décode un gène pour synthétiser un ARN est nommé “transcription”.

Comment se déroule la transcription? L’ARN polymérase détecte un promoteur, puis “lit” la séquence du gène qui le suit, en s’arrêtant au terminateur. Dans notre article sur l’ADN, nous avions mentionné le “sens” de l’ADN. Pour rappel, une séquence d’ADN est constituée de deux chaînes de nucléotides dont les séquences sont complémentaires, et de sens opposées. De la même façon, Un gène possède un “sens de lecture”, qui est déterminé par le promoteur. L’ARN polymérase “lit” l’ADN dans le sens 3’ → 5’, tout comme nous lisons une phrase de gauche à droite.. Ainsi, un gène sera toujours lu par l’ARN polymérase dans le sens 3’ → 5’. Sur une séquence d’ADN, comme les deux brins sont de sens opposés, il est donc possible de trouver des gènes sur les deux brins. (Figure 2)

Figure 2: Le sens de lecture d’un gène par l’ARN polymérase est 3’ → 5’. Ici, le gène n°1 et n°2 sont présents sur leur brins respectifs mais ont le même sens. Notez que la double hélice et les liaisons entre bases azotées n’ont ici pas été représentées pour améliorer la clarté du schéma.

En lisant le gène, l’ARN polymérase synthétise une séquence dite “complémentaire” d’ARN. L’ARN est, comme l’ADN, un polymère de nucléotides bien que ceux-ci soient différents sur de nombreux points*. Une fois le promoteur détecté, l’ARN polymérase va “ouvrir” la double hélice d’ADN en deux (comme une fermeture éclair), et isoler le brin 3’ → 5’ de son partenaire 5’ → 3’. A partir du brin 3’ → 5’, l’ARN polymérase respecte un code précis et synthétise, nucléotides après nucléotides, un brin d’ARN naissant. C’est le code secret de la Vie: une base A lu et un U est ajouté., un T lu ajoute un A, un G lu ajoute un C et un C lu ajoute un G. Vous remarquerez que comme deux brins d’ADN, un brin d’ARN synthétisé à partir d’un brin d’ADN lui est complémentaire ! D’ailleurs, le nouveau brin d’ARN aura le sens 5’ → 3’ et sera presque la copie exacte du brin d’ADN 5’ → 3’ complémentaire au brin 3’→5’ lu. Petite distinction, l’ARN ne comporte pas de thymine (T) mais de l’uridine (U). L’ARN polymérase se détachera de l’ADN une fois que le terminateur est lu. La double hélice est ainsi reformée et l’ARN libéré.

Ainsi, avec la séquence d’ADN “ATTGCCACGGT”, l’ARN polymérase synthétise “UAACGGUGCCA”. L’ARN synthétisé par la transcription est un ’“ARN messager”. Il est nommé ainsi car il sera “lu” et “traduit” par d’autres acteurs dans la cellule, comme une lettre. L’ensemble de la transcription est résumé en Figure 3.

Figure 3: Résumé de la transcription. A travers diverses étapes l’ARN polymérase lit le génome jusqu’à trouver le promoteur d’un gène (4). A la fin du processus du décodage de la séquence du gène, marqué par le terminateur, un ARN messager est libéré. Notez les différents sens de l’ADN et de l’ARN. Vous constaterez que le promoteur est représenté comme une flèche directrice et le terminateur comme un hexagone.

Au final, figurez-vous le génome comme un gigantesque livre en langage codé. Le bibliothécaire, l’ARN polymérase, va trouver une phrase d’intérêt, et la décoder sur un morceau de papier. Il enverra ce message ensuite pour qu’il soit utilisé. Point important: comme l’ARN messager résulte de la transcription de toute la séquence d’ADN d’un gène, il porte aussi en son sein la séquence codante.

Résumons: Grâce au promoteur, l’ARN polymérase repère un gène dans le génome. S’initie alors la transcription, à la suite de laquelle un ARN messager complémentaire à la séquence du gène est synthétisé. Cet ARN messager sera utilisé ensuite pour la synthèse d’une protéine lors de la traduction, abordée dans la prochaine partie.

*L’ARN et l’ADN sont bien différents sur de nombreux autres points que nous avons choisi d’omettre car ne servant pas la compréhension de l’article

Les ARN messagers doivent subir un deuxième décodage pour permettre la synthèse d’une protéine. Tout comme l’ADN, les ARN messagers ont également leur décodeur attitré : le ribosome. C’est une machine moléculaire dont le rôle est de lire les ARN messagers et de les déchiffrer pour en synthétiser une protéine. Pour déchiffrer un ARN messager, les ribosomes utilisent un autre code: le code génétique. Le code génétique fonctionne ainsi: trois nucléotides forment un “codon”, une petite séquence d’ARN qui est associée à un acide aminé précis dans le code génétique. Voyez par vous même Figure 4 !

Figure 4: Le code génétique est très souvent représenté sous la forme d’un tableau. Chaque combinaison de trois nucléotides, ou “codon”, est associée à un acide aminé. Notez que plusieurs codons peuvent être associés au même acide aminé. C’est le cas, par exemple, de la valine. Seuls les codons STOP ne sont pas associés à des acides aminés. Codons STOP et START sont évoqués ci-dessous. Un exemple de décodage d’ARN est également donné.

 

Nous évoquions précédemment que la synthèse de protéine pouvait s’apparenter à un enfilage de “perles” (les acides aminés) dans un ordre bien précis, formant ainsi un “collier”, la protéine. Comme nous l’avons aussi mentionné, chaque ARN messager contient une séquence codante. Accrochez-vous: l’ordre dans lequel sont ajoutés les acides aminés pendant la synthèse d’une protéine est déterminé par la séquence codante du gène qui lui est associé.

Le rôle du ribosome est donc de détecter la séquence codante dans l’ARN messager et de la décoder pour en synthétiser une protéine. Tout comme les gènes, les séquences codantes ont également un début et une fin. Le début et la fin d’une séquence codante est intuitivement délimitée par un codon “START” et un codon “STOP” (Figure 4). Le ribosome commence à se lier à l’ARN messager grâce à une petite séquence d’ARN nommée le RBS (Site de liaison au ribosome – Ribosome binding site). Imaginez le ribosome comme un avion tentant d’atterrir sur l’ARN messager, sa piste. Le RBS agit comme un point d’ancrage qui permet au ribosome de se fixer solidement à l’ARN messager et commencer la lecture.

Le ribosome se lie d’abord faiblement à l’ARN messager et le lit dans le sens 5’ → 3’. Dès que le ribosome trouve un RBS, il s’ancre plus fortement à l’ARN messager et continue sa lecture. En somme, le RBS agit ici comme un signal donné au ribosome montrant que l’ARN lu contient bien une séquence codante. Une fois le codon START trouvé, la traduction commence. Au premier codon, il ajoute un acide aminé, qui est ensuite suivi au fur et à mesure de l’acide aminé correspondant au codon n°2 et ainsi de suite jusqu’au STOP. La protéine et le décodage sont ainsi complétés ! L’ensemble de la traduction est résumé en Figure 5.

Figure 5: Résumé de la traduction.

Vu que l’ordre et la taille de la chaîne d’acides aminés dans une protéine est directement lié aux codons et donc à la séquence codante, vous pouvez donc comprendre pourquoi chaque protéine est unique et codée par un gène qui lui est associé! Vous trouverez en Figure 6 les exemples que nous avions déjà évoqué dans notre article sur les gènes et protéines: l’amylase et l’insuline.

Figure 6: La relation directe entre la taille de la séquence d’un gène et la protéine qui résulte de sa transcription et traduction est visible avec les gènes de l’insuline et de l’amylase. Les figures ont été générées en utilisant le site Protein Data Bank. https://www.rcsb.org/

Dans cet article en deux parties, nous avons donc présenté la transcription et la traduction, deux étapes essentielles à la synthèse d’une protéine à partir d’un gène. Nous avons ici décrit la transcription et la traduction telles qu’elles se déroulent chez une bactérie comme Escherichia coli. Traduction et transcription sont des procédés complexes qui peuvent varier en fonction des organismes. La transcription chez une cellule humaine et chez Escherichia coli est par exemple différente sur de nombreux points. Néanmoins les principes généraux restent les mêmes. Si vous voulez en savoir plus sur la transcription et la traduction, n’hésitez pas à consulter nos sources ou à nous envoyer des questions ! Les informations contenues dans cet article vous seront très utiles pour comprendre la suite du dossier, avec comme prochaine étape, les plasmides !

Paul Lubrano et Victor Plet

Bibliographie:

Toute information sur la transcription et la traduction a été trouvée et peut être approfondie dans l’ouvrage suivant: Foster, J. W., & Slonczewski, J. L. (2017). Microbiology : An Evolving Science (Fourth Edition) (Fourth éd.). W. W. Norton & Company.

Toute information sur les gènes a été trouvée et peut être approfondie dans l’ouvrage suivant: Griffiths, A. J. F., Wessler, S. R., Carroll, S. B., & Doebley, J. (2010). Introduction to Genetic Analysis (10th éd.). New York, USA : W. H. Freeman