La biologie entre dans l’informatique

Le calcul de l’ADN est certainement la réalisation de calculs utilisant des substances biologiques, plutôt que des chips de pomme de terre au silicium traditionnelles. L’idée que des substances individuelles (ainsi que des atomes) pourraient être utilisées pour le calcul remonte à 1959, lorsque le physicien américain Richard Feynman a présenté ses idées sur la nanotechnologie. Néanmoins, le traitement de l’ADN n’avait été réellement réalisé qu’en 1994, lorsque l’informaticien américain Leonard Adleman a montré comment les molécules pouvaient être utilisées pour résoudre un problème informatique. Un calcul peut être considéré comme la performance des critères de l’algorithme, qui eux-mêmes peuvent être considérés comme une liste étape par étape de directions bien définies qui prend certaines entrées, les traite et crée un résultat. Dans le calcul de l’ADN, l’information est représentée en utilisant l’alphabet héréditaire à quatre personnalités (A [adénine], G [guanine], C [cytosine] et T [thymine]), plutôt que l’alphabet binaire (1 et ) utilisé par les ordinateurs traditionnels . C’est vraiment possible parce que de brèves molécules d’ADN de la série arbitraire peuvent être synthétisées sur commande. L’entrée d’un algorithme est par conséquent symbolisée (dans le cas le plus simple) par des substances d’ADN avec des séquences particulières, les instructions sont effectuées par des procédures de laboratoire autour des substances (comme les trier selon la durée ou couper des brins qui contiennent une sous-séquence spécifique), ainsi que car le résultat est défini comme un foyer de la dernière série de substances (comme la présence ou l’absence d’une série spécifique). Les essais d’Adleman comprenaient la recherche d’un itinéraire à travers un réseau de « villes » (étiquetées « 1 » à « 7 ») reliées par des « routes » à sens unique. Le problème spécifie que le chemin doit commencer et se terminer dans des communautés spécifiques et vérifier chaque ville une seule fois. (Ceci est connu des mathématiciens sous le nom de problème de cours hamiltonien, un parent du problème beaucoup plus connu des vendeurs en vacances.) Adleman avait profité de la complémentarité Watson-Crick de l’ADN-A et T se collent l’un à l’autre par paires, de même que G et C (donc la séquence AGCT collerait parfaitement à TCGA). Il a conçu de courts brins d’ADN pour signifier les villes et les routes de manière à ce que les brins de route collent les brins de la ville les uns aux autres, formant une série de villes qui symbolisaient les itinéraires (comme la solution réelle, qui s’est avérée être « 1234567 »). La plupart des séries de ce type représentaient des réponses incorrectes au problème (« 12324 » visite une ville plus d’une fois, et « 1234 » tombe à plat pour visiter chaque ville), mais Adleman a utilisé suffisamment d’ADN pour être à peu près certain que la bonne solution sera symbolisé dans son pot initial de brins. Le problème était alors d’extraire cette solution unique. Il a accompli cela en amplifiant considérablement au départ (en utilisant une méthode appelée réaction en chaîne par polymérase [PCR]) uniquement les séries qui commençaient et se terminaient dans les bonnes communautés. Ensuite, il a classé le groupe de brins par longueur (en utilisant une technique connue sous le nom d’électrophorèse sur gel) pour s’assurer qu’il ne retenait que des brins de la bonne longueur. Enfin, il a utilisé à plusieurs reprises une «canne à pêche» moléculaire (filtrage par affinité) pour s’assurer que chaque ville était donc représentée dans les séquences de prospection. Les brins avec lesquels Adleman restait avaient ensuite été séquencés pour révéler la solution au problème. Même si Adleman ne cherchait qu’à créer la faisabilité du calcul avec des molécules, peu de temps après sa publication, ses essais ont été présentés par certains comme le début d’un concours entre les systèmes informatiques basés sur l’ADN ainsi que leurs homologues en silicium. Certaines personnes pensaient que les systèmes informatiques moléculaires pourraient un jour résoudre des problèmes qui entraîneraient des difficultés pour les machines existantes, en raison du parallélisme massif inhérent à la biologie. Parce qu’une petite goutte d’eau peut contenir des milliards de brins d’ADN et que les procédures biologiques agissent sur chacun d’eux – efficacement – en parallèle (par opposition à un par un), il a été affirmé qu’un jour les systèmes informatiques de l’ADN pourraient représenter (et résoudre) des problèmes difficiles qui dépassaient la portée des ordinateurs «normaux». Néanmoins, dans la plupart des problèmes difficiles, le nombre de solutions possibles augmente de façon exponentielle avec les dimensions du problème (par exemple, le nombre d’options peut doubler pour chaque ville ajoutée). Ce qui signifie que même des problèmes relativement petits nécessiteraient des quantités d’ADN ingérables (de l’ordre de grandes baignoires) afin de signifier toutes les solutions possibles. L’expérience d’Adleman était importante car elle effectuait des calculs de faible niveau avec des substances biologiques. Mais surtout, il ouvrait la possibilité de réactions biochimiques directement programmées.