Pseudogène
Un pseudogène est, d'après sa définition originale, un gène inactif au sein d'un génome, du fait d'altérations génétiques le rendant non fonctionnel et donc incapable de conduire à l'expression d'une protéine[1]. Les connaissances acquises depuis montrent que tous les gènes ne codent pas forcément pour une protéine et que les pseudogènes peuvent avoir une fonction[2]. Ainsi, un pseudogène peut être défini comme un gène affecté par des mutations qui lui font perdre sa fonction d'origine, soit à la suite de l'échec de transcription, soit à la suite de la production d'un transcrit ou d'une protéine qui n'a pas le même répertoire fonctionnel que le gène d'origine[3]. Par ce fait, la frontière entre pseudogène codant et gène peut s'avérer assez vague.
La grande majorité des pseudogènes ne montrent pas de signe d'activité[4]. À ce titre, les pseudogènes sont parfois appelés « gènes fossiles », et sont associés à la fraction non codante du génome qu'on appelait parfois à tort « l'ADN poubelle ».
Les pseudogènes peuvent être présents en grand nombre au sein d'un génome. Ainsi chez l'Homme, il y a 20 080 gènes[5] codant des protéines et 16 997 pseudogènes recensés en 2024[5], dont la plupart sont réputés inactifs ou inutiles[6].
Détection
[modifier | modifier le code]Les pseudogènes théorisés par Ohno[1] ont été découverts et nommés ainsi à la fin des années 1970 par Jacq et al. à la suite de l'étude de l'ARNr 5S chez Xenopus laevis[7] (Ohno ne fut pas cité dans ce travail).
Un gène devenu pseudogène, établi dans un génome (non éliminé par sélection négative), échappe à la sélection naturelle. Il évoluera sous la neutralité et aura tendance à accumuler des mutations aléatoires, détruisant peu à peu son signal d'origine jusqu'à ce qu'il ne soit plus reconnaissable. Par conséquent, plus un pseudogène est ancien, plus il sera difficile de détecter et reconnaître son origine.
Les pseudogènes actifs sont une exception à ce schéma puisque, du fait de leur fonction, ils peuvent évoluer sous sélection, et donc perdurer au sein des génomes tel le ferait un gène.
Les pseudogènes peuvent être le résultat de macromutations (événements de recombinaison tels enjambement inégal, rétroposition, transfert horizontal). Les pseudogènes ainsi formés peuvent être incomplets (délétion de fragment partiel ou entier d'introns, d'exons ou de promoteurs), ou au contraire contenir une nouvelle séquence en leur sein (insertion). Si une délétion affecte totalement un gène on parlera alors de perte de gène.
Ils peuvent être également le résultat de micromutations (insertions ou délétions, substitutions). Les insertions ou les délétions peuvent entraîner des décalages de phases et donc l'apparition de codons-stop prématurés. Les substitutions peuvent engendrer l'apparition de codons-stop. Ces mutations peuvent aussi toucher les sites d'épissage ou encore enlever le codon-stop d'origine.
Plus le temps passe, plus il est difficile de déterminer la mutation à l'origine d'une pseudogénisation, car elle sera masquée par une multitude d'autres événements.
Le point commun à toutes ces mutations est qu'elles empêchent dans la majorité des cas les pseudogènes d'être exprimés et de coder pour des protéines. À leur origine, les pseudogènes partagent beaucoup de similarités avec d'autres gènes (orthologues ou paralogues) qui eux sont actifs. Cette caractéristique est utilisée par certains programmes de bio-informatique qui analysent le génome pour y trouver ces « gènes morts »[8],[9],[10],[11]. Mais, lorsque les pseudogènes sont très anciens, il devient difficile, voire impossible, de les déterminer. En théorie, seule une analyse de synténie pourrait déterminer si une séquence non codante ne ressemblant à rien d'autre ne fut pas par le passé une zone où un gène a existé.
Origines et classification
[modifier | modifier le code]Plusieurs raisons peuvent expliquer que les pseudogènes partagent des parties plus ou moins importantes d'un génome avec des gènes intra-espèces, ou présents chez d'autres espèces. Ils sont une des conséquences de l'évolution de l'organisme et de son adaptation à son environnement.
Les pseudogènes peuvent être classés en trois différents types en fonction de leur origine[12].
- Les pseudogènes non remaniés
Le terme « remanié » provient de l'anglais décrivant l'épissage. Ainsi, un gène ou pseudogène non remanié possède encore ses introns, tandis qu'un gène ou pseudogène remanié correspond à une séquence épissée et ne possédant pas d'introns.
Le phénomène de pseudogénisation proposé par Ohno correspond à une désactivation d’un gène par l’accumulation de mutations délétères. Ce phénomène, qui se produit au cours de la duplication d’un gène fonctionnel, peut entraîner un relâchement de la sélection sur un duplicata du fait de l’existence de fonctions redondantes, et produire des mutations délétères amenant à la création d’un pseudogène[13],[14]. Ces pseudogènes décrits par Ohno sont classiquement appelés pseudogènes non remaniés en opposition aux pseudogènes processés.
- Les pseudogènes remaniés
Ce sont des séquences qui proviennent de la transcription inverse d’ARN messagers (ARNm) rendue possible par l’utilisation d'enzymes (transcriptase inverse) de rétrotransposons[15],[16]. L’ADN codant (ADNc) ainsi créé est réinséré de façon aléatoire dans le génome. Ces pseudogènes sont dits remaniés car ils ne possèdent pas d’introns vu qu’ils proviennent de la transcription inverse d’ARNm épissé. Les pseudogènes remaniés sont assimilés à des gènes mort-nés car, dans la majorité des cas, ils ne possèdent pas les éléments nécessaires à leur fonctionnalité tels que les séquences promotrices. Dans certains cas, ils peuvent tout de même être fonctionnels[17].
- Les pseudogènes unitaires
Dans une lignée ou une espèce donnée, les pseudogènes unitaires sont des séquences qui n’ont aucun paralogue fonctionnel. Les pseudogénisations amenant à l’apparition de pseudogènes unitaires[18] concernent des gènes dont la fonction est bien établie. Ces gènes bien établis au sein des génomes d’une lignée, deviennent pseudogènes après des millions d’années d’existence à travers l’apparition de mutations délétères. L’apparition de pseudogènes unitaires est généralement assimilée à la perte des fonctions des gènes d’origine. La pseudogénisation de gènes précédemment établis dans les génomes reflète les conséquences d’un changement de pression de sélection au niveau de ces gènes. Elles peuvent être le fruit de changements :
- liés à des changements environnementaux ayant pour conséquence :
* un relâchement de la sélection d'un gène qui n'a plus d'utilité. Dans ce cas la séquence du gène n'est plus soumise à aucune pression sélective et évolue sous la neutralité,
* une perte adaptative d'un gène qui crée un handicap pour l'organisme. Ces pertes sont le fruit de sélections négatives liées à des événements adaptatifs. Dans ce cas, elles apportent un bénéfice aux espèces, alors que le maintien de ces gènes au sein des génomes aurait été défavorable ;
- non-liés à des changements environnementaux :
* par le relâchement de la sélection liée à l'apparition de gènes accomplissant la fonction initiale,
* par le relâchement de la sélection lié à des modifications (éthologique, physiologique, etc.) de l'organisme qui rend le gène inutile à sa survie.
Dans ces cas, la séquence du gène n'est plus soumise à aucune pression sélective et évolue sous la neutralité.
Les pseudogènes unitaires sont traditionnellement décrits comme une sous-famille de pseudogènes non remaniés car la structure exon-intron du gène ancestral est conservée. Mais pour définir les pseudogènes unitaires, il est erroné de se fier à la structure de leurs séquences. En effet, ces pseudogènes peuvent provenir de gènes qui possèdent ou non des introns. Ainsi, pour différencier ce type de pseudogène, il est primordial de connaître l’histoire évolutive du gène. Pour cela il faut passer par la comparaison génomique de différentes espèces afin de connaître les états ancestraux[11],[12],[19].
Cas particulier : certains peudogènes peuvent provenir de gènes d'autres espèces (virus, bactéries…) insérés dans un génome par transfert horizontal de gènes.
Vestige de l'évolution ; utiles ou inutiles ?
[modifier | modifier le code]Leur origine évolutive, en tant que vestiges de l'évolution de l'organisme et du génome, leur donne une valeur d'indice pour mieux comprendre l'évolution de certains gènes et de certaines fonctions biologiques à travers le temps. Dans le cas de l'Homme, par exemple, nombre de pseudogènes ont des ressemblances importantes avec des gènes codant des protéines olfactives chez d'autres espèces (or, l'Homme utilise très peu son odorat en comparaison avec d'autres espèces). Ainsi, 300 pseudogènes humains sont des gènes actifs chez le Rat et la Souris.
Certaines pseudogénisations peuvent avoir une incidence prépondérante au sein d'un organisme. Par exemple, chez les Primates, la perte du gène Gulo, qui code une enzyme qui catalyse la dernière étape de la biosynthèse de la vitamine C[20], rend impossible la synthèse de cette vitamine. C'est pourquoi les Primates doivent trouver la vitamine C dans leur alimentation.
L'hypothèse « less is more » affirme que les pertes de fonction peuvent avoir des conséquences importantes sur l'adaptation des espèces au cours de l'évolution[21].
Inactivité ?
[modifier | modifier le code]Les généticiens ont d'abord considéré que les pseudogènes étaient inutiles au sein des génomes au regard de leur inactivité observée. Les récents progrès en biologie ont permis depuis de détecter de nombreux pseudogènes actifs[2],[22],[23],[24],[25]. Leur étude est devenue une thématique importante. Pour au moins deux cas, on connaît une utilité aux pseudogènes :
- bien que normalement inactifs et ne pouvant pas traduire de protéine, certains pseudogènes peuvent tout de même avoir une influence sur le développement d'un organisme, car pouvant - dans certains cas - être l'objet d'une transcription. Ainsi, en 2003, Shinji Hirotsune a démontré que la malformation d'une de ses souris de laboratoire était la conséquence de l'altération d'un pseudogène ;
- ils sont aussi passivement utiles comme leurre biologique de certains microARN indésirables qui s'y fixent comme ils se fixeraient sur un gène actif[26].
Par exemple, le gène PTEN intervient activement dans la lutte de l'organisme contre les tumeurs (fonction de « contrôle tumoral »). Il produit des ARN messagers (ARNm) devant acheminer de l'information codante vers le lieu de synthèse des protéines. Ces ARNm peuvent être bloqués par des microARN qui s'y associent[26]. Or, dans la cellule, ces microARN sont également attirés par le pseudogène de PTNEN (PTEN1). La présence de ce dernier laisse donc plus de chances au PTEN de bien fonctionner. On a d'ailleurs noté que certains cancers du colon sont associés à l'absence de ce pseudogène PTEN1[26]. D'autres pseudogènes pourraient, comme le PTEN1, avoir été recyclés comme leurres via la sélection naturelle.
Prospective : vers une utilité pour la médecine ?
[modifier | modifier le code]Les pseudogènes, offrant des cibles multiples à des mécanismes génétiques indésirables, pourraient être de précieux outils médicamenteux de diversion, notamment pour lutter contre certains cancers[26].
Voir aussi
[modifier | modifier le code]Articles connexes
[modifier | modifier le code]Bibliographie
[modifier | modifier le code]Notes et références
[modifier | modifier le code]- Ohno, S. (1972). So much "junk" DNA in our genome. Brookhaven symposia in Biology, 23, 366-370.
- Kamalika S., Tapash C.G. (2013). Pseudogenes and their composers: delving in the ‘debris’ of human genome. Briefings in Functional Genomics 12(6), 536-547. doi: 10.1093/bfgp/elt026
- Mighell AJ, Smith NR, Robinson PA, Markham AF. 2000. Vertebrate pseudogenes. FEBS Lett. 468(2–3):109–114.
- Les pseudogènes : des gènes fossiles, Mark Gerstein et Deyou Zheng, dans Pour la Science, octobre 2006.
- « Homo sapiens Annotation Report », sur www.ncbi.nlm.nih.gov (consulté le )
- Pei B et al. (2012) The GENCODE pseudogene resource. Genome Biology 13:R51. DOI: 10.1186/gb-2012-13-9-r51
- Jacq C., Miller J.R. and Brownlee G.G. (1977). A pseudogene structure in 5S DNA of Xenopus laevis. Cell, Vol12,109-120.
- Khelifi A, Adel K, Duret L et al (2005). HOPPSIGEN: a database of human and mouse processed pseudogenes. Nucleic Acids Res, 33:D59–D66. doi: 10.1093/nar/gki084
- Ortutay C., Vihinen M. (2008) PseudoGeneQuest–service for identification of different pseudogene types in the human genome. BMC Bioinformatics 9:299. doi: 10.1186/1471-2105-9-299
- Zhang Z, Carriero N, Zheng D et al (2006). PseudoPipe: an automated pseudogene identification pipeline. Bioinformatics 22:1437–1439. doi: 10.1093/bioinformatics/btl116
- Dainat J, Paganini J, Pontarotti P, Gouret P (2012). GLADX: an automated approach to analyze the lineage-specific loss and pseudogenization of genes. PLoS One, 7:e38792. doi: 10.1371/journal.pone.0038792
- Jacques Dainat, « Étude du processus de perte de gènes et de pseudogénisation Intégration et informatisation des concepts de l’évolution biologique. Application à la lignée humaine depuis l'origine des Eucaryotes », Thèse de doctorat en Bioinformatique, Biochimie Structurale et Génomique, sous la direction de Pierre Pontarotti, Marseille, Université d’Aix-Marseille, 2012, 258p.
- Lacy, E., & Maniatis, T. (1980). The nucleotide sequence of a rabbit beta-globin pseudogene. Cell, 21(2), 545–53.
- Proudfoot, N. J., & Maniatis, T. (1980). The structure of a human alpha-globin pseudogene and its relationship to alpha-globin gene duplication. Cell, 21(2), 537–44.
- Chen, M. J., Shimada, T., Moulton, a D., Harrison, M., & Nienhuis, a W. (1982). Intronless human dihydrofolate reductase genes are derived from processed RNA molecules. Proceedings of the National Academy of Sciences of the United States of America, 79(23), 7435–9.
- Hollis, G. F., Hieter, P. A., McBride, O. W., Swan, D., & Leder, P. (1982). Processed genes: a dispersed human immunoglobulin gene bearing evidence of RNA-type processing. Nature, 296(5855), 321–325.
- McCarrey, J. R., & Thomas, K. (1987). Human testis-specific PGK gene lacks introns and possesses characteristics of a processed gene. Nature, 326(6112), 501–5.
- Mitchell, A., & Graur, D. (2005). Inferring the pattern of spontaneous mutation from the pattern of substitution in unitary pseudogenes of Mycobacterium leprae and a comparison of mutation patterns among distantly related organisms. Journal of Molecular Evolution, 61(6), 795–803.
- Jacques Dainat et Pierre Pontarotti, « Methods in molecular biology », Springer protocol (Clifton, N.J.), no 1167:87-99, (DOI 10.1007/978-1-4939-0835-6_7)
- Nishikimi M., Fukuyama R., Minoshima S., Shimizu N., Yagi K. (1994). Cloning and chromosomal mapping of the human nonfunctional gene for L-gulono-gamma-lactone oxidase, the enzyme for L-ascorbic acid biosynthesis missing in man. The Journal of biological chemistry. 269(18).
- Olson M. (1999). « When less is more: gene loss as an engine of evolutionary change ». American Journal of Human Genetics, 18-23.
- Hirotsune S, Yoshida N, Chen A et al (2003). An expressed pseudogene regulates the Messenger- RNA stability of its homologous coding gene. Nature 423:91–96. doi: 10.1038/nature01535
- Chan W-L, Yuo C-Y, Yang W-K et al (2013). Transcribed pseudogene ψPPM1K generates endogenous siRNA to suppress oncogenic cell growth in hepatocellular carcinoma. Nucleic Acids Res 41:3734–3747. doi: 10.1093/nar/gkt047
- Wen Y-Z, Zheng L-L, Qu L-H et al (2012). Pseudogenes are not pseudo any more. RNA Biol 9:27–32. doi: 10.4161/rna.9.1.18277
- Pink RC, Wicks K, Caley DP et al (2011). Pseudogenes: pseudo-functional or key regulators in health and disease? RNA 17:792–798. doi: 10.1261/rna.2658311
- DEROIN Philippe ; Des pseudogènes pas si pseudo ; Journal Biofutur 2010, n°313, p. 13 ; (ISSN 0294-3506)