Stockage des données sur ADN : deux chercheurs français réalisent l’exploit

Stockage des données sur ADN : deux chercheurs français réalisent l’exploit

4 décembre 2021 0 Par Adrien Rimena

 

Stéphane Lemaire et Pierre Crozet, deux chercheurs français, sont parvenus à stocker des données sur ADN grâce à une technologie encodage révolutionnaire. Symboliquement, ils ont encodé la Déclaration des droits de l’Homme de 1789.

Une production de données exponentielle

C’est une première mondiale. Stéphane Lemaire et Pierre Crozet, respectivement directeur de recherche CNRS et maître de conférences à Sorbonne Université, ont réussi à stocker des données sur ADN grâce à leur technologie d’encodage brevetée DNA Drive. Il réalise ainsi un vieux rêve de l’Humanité, celui de pouvoir stocker des masses de données presque pour toujours. Et cela de façon durable et économique. Aujourd’hui les supports disponibles (disques durs, bandes magnétiques ou Blu-Ray) n’arrivent pas à conserver de grandes données pendant longtemps et sans se détériorer.

D’ailleurs, ils ne peuvent plus tenir le rythme de production mondiale de data, qui s’élèvent actuuelle à 45 Zetta-octets (Zo). Soit 45 milliards de milliards de kilo-octets ! D’ici à trois ans, il passera à 175 Zo. Il existe de nos jours des data centers pour plus de capacités de stockage. Cependant, ces installations informatiques (serveurs, routeurs, commutateurs…) consomment beaucoup d’énergie électrique et polluent énormément. Une situation qui risque de s’aggraver avec la transformation numérique de notre société.

Utilisation de grandes séquences à deux brins

Pour un stockage plus durable, la recherche scientifique a étudié la piste de l’ADN. Une forme naturelle de stockage des données qui existe depuis quatre milliards d’années dans l’organisme de l’être humain. C’est Richard Feynman, lauréat du prix Nobel de physique de 1965, qui a jeté les bases en 1959. Puis un professeur de Harvard a concrétisé cette idée, longtemps plus tard, en 2012. Toutefois, le procédé ne permettait que de stocker sur de petites molécules d’environ 200 nucléotides. Ce qui ne représentait qu’un seul brin d’ADN. Or, le vivant utilise de grandes séquences à deux brins pour stocker l’information génétique.

Plus de 100 milliards de copies produites

C’est finalement en 2021 que les deux chercheurs français résoudront cette difficulté. Pour y parvenir, Stéphane Lemaire et Pierre Crozet ont transformé en données numériques binaires (0 ou 1), les lettres correspondant aux quatre briques de l’ADN, c’est-à-dire aux nucléotides. A (Adénine), T (Thymine), C (Cytosine) et G (Guanine). Ils ont utilisé un procédé de synthétisation de la séquence de nucléotides sur des fragments d’ADN. Ils ont ensuite conserver ces derniers sur divers supports : papier, capsule métallique, tube, etc.

Pour le symbole, les scientifiques français ont choisi d’encoder la Déclaration des droits de l’Homme et du citoyen de 1789 ainsi que la Déclaration des droits de la Femme et de la citoyenne rédigée par Olympe de Gouges en 1791. Grâce à leur technologie DNA Drive, développée et brevetée en 2019, ils ont stocké plus de 100 milliards de copies de ces deux textes dans de petites capsules métalliques inoxydables.

Un procédé durable et économique, mais encore cher

Exposées lors de la conférence de presse du 23 novembre 2021, les deux capsules ont été déposées dans « l’Armoire de Fer » du musée des Archives Nationales à Paris. Un lieu où sont gardés d’autres textes de haute valeur comme le testament de Napoléon 1er et la Constitution de la Ve République. Ces documents peuvent être lus grâce à des séquenceurs d’ADN, semblables à ceux utilisés en biologie et en médecine pour séquencer les génomes des êtres vivants.

Stéphane Lemaire et Pierre Crozet ont pris soin de d’ouvrir à plusieurs reprises les capsules afin de s’assurer de pouvoir récupérer les informations et de les lire. Ils ont pu le faire avec une fidélité de 100%. D’après les chercheurs, les capsules ont une durée de vie d’au moins 50 000 ans. De plus, ils seraient plus durables et économiques. De quoi garantir la transmission des informations aux générations futures. Toutefois, il faudra encore démocratiser l’encodage sur ADN. Il coûte cher (environ 850 euros par mégaoctet) et prend du temps. L’évolution de la technologie, d’ici quelques années, devrait lever ces obstacles.