L’épigénétique, cette nouvelle manière de comprendre la Vie et son évolution, met en jeu cette quincaillerie nucléique moquée, car incomprise, et raillée sous le nom d’ADN poubelle. Il faut revoir tout ça …
imaginez le génome humain comme un fil s’étirant sur la longueur d’un terrain de football, avec tous les gènes qui codent pour les protéines regroupés à l’extrémité près de vos pieds. Faites deux grands pas en avant ; toutes les informations sur les protéines sont maintenant derrière vous.
Le génome humain a trois milliards de paires de bases dans son ADN, mais seulement 2% d’entre elles codent pour des protéines. Le reste semble être une accumulation inutile, une profusion de duplications de séquences et des impasses génomiques souvent étiquetées « ADN indésirable », ou même « ADN poubelle ». Cette apparente bizarrerie du matériel génétique ne se limite pas aux humains : même de nombreuses bactéries semblent consacrer 20 % de leur génome à la charge non codante.
Les progrès technologiques dans le séquençage, en particulier au cours des deux dernières décennies, ont beaucoup fait pour changer la façon dont les scientifiques pensent de l’ADN et de l’ARN non codants. Bien que ces séquences non codantes ne portent pas d’informations sur les protéines, elles sont parfois façonnées par l’évolution à des fins différentes. En conséquence, les fonctions des différentes classes de « poubelle » – dans la mesure où elles ont des fonctions – se précisent.
Les cellules utilisent une partie de leur ADN non codant pour créer une catégorie diversifiée de molécules d’ARN qui régulent ou aident à la production de protéines de diverses manières. Le catalogue de ces molécules ne cesse de s’étendre, avec de petits ARN nucléaires, des microARN, des petits ARN interférents et bien d’autres.
Certains sont des segments courts, généralement moins de deux douzaines de paires de bases de long, tandis que d’autres sont plus longs d’un ordre de grandeur. Certains existent en double brins ou se replient sur eux-mêmes en boucles en épingle à cheveux. Mais tous peuvent se lier sélectivement à une cible, telle qu’un transcrit d’ARN messager, pour favoriser ou inhiber sa traduction en protéine.
Ces ARN peuvent avoir des effets fondamentaux sur le fonctionnement d’un organisme. Les blocages expérimentaux de certains microARN chez la souris, par exemple, ont induit des troubles allant des tremblements au dysfonctionnement hépatique.
La catégorie de loin la plus importante d’ADN non codant dans les génomes des humains et de nombreux autres organismes est constituée de transposons, des segments d’ADN qui peuvent changer leur emplacement dans un génome. Ces «gènes sauteurs» ont tendance à faire de nombreuses copies d’eux-mêmes – parfois des centaines de milliers – dans tout le génome, explique Seth Cheetham, généticien à l’Université du Queensland en Australie. Les plus prolifiques sont les rétrotransposons, qui se propagent efficacement en faisant des copies d’ARN d’eux-mêmes qui se reconvertissent en ADN à un autre endroit du génome. Environ la moitié du génome humain est constitué de transposons ; dans certaines plantes de maïs, ce chiffre grimpe à environ 90 %.
L’ADN non codant apparaît également dans les gènes des humains et d’autres eucaryotes (organismes dotés de cellules complexes) dans les séquences d’introns qui interrompent les séquences d’exons codant pour les protéines. Lorsque les gènes sont transcrits, l’ARN exon est épissé en ARNm, tandis qu’une grande partie de l’ARN intron est rejetée. Mais une partie de l’ARN d’intron peut se transformer en petits ARN impliqués dans la production de protéines. Pourquoi les eucaryotes ont des introns est une question ouverte, mais les chercheurs soupçonnent que les introns aident à accélérer l’évolution des gènes en facilitant le remaniement des exons en de nouvelles combinaisons.
Une partie importante et variable de l’ADN non codant dans les génomes est constituée de séquences hautement répétées de longueurs assorties. Les télomères coiffant les extrémités des chromosomes, par exemple, sont en grande partie constitués de ceux-ci. Il semble probable que les répétitions aident à maintenir l’intégrité des chromosomes (le raccourcissement des télomères par la perte des répétitions est lié au vieillissement). Mais bon nombre des répétitions dans les cellules n’ont aucun but connu, et elles peuvent être acquises et perdues au cours de l’évolution, apparemment sans effets néfastes.
NB: dans l’illustration sous le titre, l’artiste s’est trompé et inversé les zones actives et les zones “poubelles”.
Une catégorie d’ADN non codant qui intrigue de nombreux scientifiques de nos jours est celle des pseudogènes, qui sont généralement considérés comme les restes de gènes fonctionnels qui ont été accidentellement dupliqués puis dégradés par mutation. Tant qu’une copie du gène d’origine fonctionne, la sélection naturelle peut exercer peu de pression pour garder intacte la copie redondante.
Semblables à des gènes brisés, les pseudogènes peuvent sembler être des déchets génomiques par excellence. Mais Cheetham prévient que certains pseudogènes peuvent ne pas être du tout « pseudo ». Beaucoup d’entre eux, dit-il, étaient présumés être des copies défectueuses de gènes reconnus et étiquetés comme pseudogènes sans preuve expérimentale qu’ils n’étaient pas fonctionnels.
Les pseudogenes peuvent également faire évoluer de nouvelles fonctions. “Parfois, ils peuvent contrôler l’activité du gène à partir duquel ils ont été copiés”, a déclaré Cheetham, si leur ARN est suffisamment similaire à celui du gène de travail pour interagir avec lui. Sisu note que la découverte en 2010 que le pseudogène PTENP1 avait trouvé une seconde vie en tant qu’ARN régulant la croissance tumorale a convaincu de nombreux chercheurs d’examiner de plus près les pseudogènes indésirables.
Parce que les séquences dynamiques non codantes peuvent produire tant de changements génomiques, les séquences peuvent être à la fois le moteur de l’évolution de nouveaux gènes et la matière première de celle-ci. Les chercheurs en ont trouvé un exemple dans le gène ERVW-1, qui code une protéine essentielle au développement du placenta chez les singes, les grands singes et les humains de l’Ancien Monde. Le gène est né d’une infection rétrovirale chez un primate ancestral il y a environ 25 millions d’années, en faisant du stop sur un rétrotransposon dans le génome de l’animal. Le rétrotransposon “a essentiellement coopté cet élément, sautant autour du génome, et l’a en fait transformé en quelque chose de vraiment crucial pour la façon dont les humains se développent”, a déclaré Cheetham.
Mais quelle quantité de cet ADN est donc qualifiée de véritable « poubelle » dans le sens où elle ne sert à rien pour une cellule ? Cela fait l’objet d’un vif débat. En 2012, le projet de recherche Encyclopedia of DNA Elements (Encode) a annoncé ses découvertes selon lesquelles environ 80% du génome humain semblait être transcrit ou autrement biochimiquement actif et pourrait donc être fonctionnel. Cependant, cette conclusion a été largement contestée par les scientifiques qui ont souligné que l’ADN peut être transcrit pour de nombreuses raisons qui n’ont rien à voir avec l’utilité biologique.