L'IA peut concevoir de toutes nouvelles protéines à partir de zéro : il est temps de parler de biosécurité

L'IA peut concevoir de toutes nouvelles protéines à partir de zéro : il est temps de parler de biosécurité

Nœud source: 3089287

Il y a vingt ans, concevoir des protéines était un rêve.

Désormais, grâce à l’IA, les protéines personnalisées se vendent à la pelle. Des protéines sur commande ont souvent des formes ou des composants spécifiques qui leur confèrent des capacités nouvelles dans la nature. Des médicaments à plus longue durée d’action et des vaccins à base de protéines aux biocarburants et mangeur de plastique protéines, ce domaine devient rapidement une technologie transformatrice.

La conception de protéines personnalisées dépend de techniques d’apprentissage en profondeur. Avec de grands modèles de langage – l’IA derrière le blockbuster ChatGPT d’OpenAI – imaginant des millions de structures au-delà de l’imagination humaine, la bibliothèque de protéines de conception bioactives est appelée à s’étendre rapidement.

"C'est extrêmement stimulant", a récemment déclaré le Dr Neil King de l'Université de Washington. dit Nature. "Des choses qui étaient impossibles il y a un an et demi, maintenant vous les faites."

Pourtant, un grand pouvoir implique de grandes responsabilités. Alors que les protéines nouvellement conçues gagnent en popularité pour être utilisées en médecine et en bio-ingénierie, les scientifiques se demandent désormais : que se passe-t-il si ces technologies sont utilisées à des fins néfastes ?

Un essai récent dans Sciences souligne la nécessité de biosécurité pour les protéines de synthèse. À l’instar des discussions en cours sur la sécurité de l’IA, les auteurs affirment qu’il est temps de prendre en compte les risques et les politiques de biosécurité afin que les protéines personnalisées ne deviennent pas voyou.

L'essai est rédigé par deux experts dans le domaine. Premièrement, le Dr David Baker, directeur du Institut pour la conception de protéines à l'Université de Washington, a dirigé le développement de RoseTTAFold, un algorithme qui a résolu le problème d'une demi-décennie du décodage de la structure des protéines à partir de ses seules séquences d'acides aminés. L'autre, le Dr George Church de la Harvard Medical School, est un pionnier du génie génétique et de la biologie synthétique.

Ils suggèrent que les protéines synthétiques nécessitent des codes-barres intégrés dans la séquence génétique de chaque nouvelle protéine. Si l’une des protéines de synthèse devenait une menace, par exemple en déclenchant une épidémie dangereuse, son code-barres permettrait de retracer facilement son origine.

Le système fournit essentiellement « une piste d’audit », le duo écrire.

Mondes entrent en collision

Les protéines de synthèse sont inextricablement liées à l’IA. Il en va de même pour les politiques potentielles de biosécurité.

Il y a plus de dix ans, le laboratoire de Baker a utilisé un logiciel pour concevoir et construire une protéine baptisée Top7. Les protéines sont constituées d’éléments constitutifs appelés acides aminés, dont chacun est codé dans notre ADN. Comme des perles sur un fil, les acides aminés sont ensuite enroulés et froissés pour former des formes 3D spécifiques, qui s'intègrent souvent dans des architectures sophistiquées qui soutiennent la fonction de la protéine.

Top7 ne pouvait pas « communiquer » avec les composants cellulaires naturels : il n'avait aucun effet biologique. Mais même alors, l'équipe conclu que la conception de nouvelles protéines permet d’explorer « les vastes régions de l’univers protéique qui ne sont pas encore observées dans la nature ».

Entrez dans l'IA. De multiples stratégies ont récemment vu le jour pour concevoir de nouvelles protéines à des vitesses supersoniques par rapport aux travaux de laboratoire traditionnels.

L’une est l’IA basée sur la structure, similaire aux outils de génération d’images comme DALL-E. Ces systèmes d’IA sont formés sur des données bruitées et apprennent à supprimer le bruit pour trouver des structures protéiques réalistes. Appelés modèles de diffusion, ils apprennent progressivement les structures protéiques compatibles avec la biologie.

Une autre stratégie repose sur de grands modèles de langage. Comme ChatGPT, les algorithmes trouvent rapidement des connexions entre les « mots » protéiques et distillent ces connexions dans une sorte de grammaire biologique. Les brins de protéines générés par ces modèles sont susceptibles de se replier dans des structures que le corps peut déchiffrer. Un exemple est ProtGPT2, qui peut concevoir des protéines actives dont les formes pourraient conduire à de nouvelles propriétés.

Du numérique au physique

Ces programmes de conception de protéines d’IA tirent la sonnette d’alarme. Les protéines sont les éléments constitutifs de la vie : des changements pourraient considérablement modifier la façon dont les cellules réagissent aux médicaments, aux virus ou à d’autres agents pathogènes.

L’année dernière, les gouvernements du monde entier ont annoncé leur intention de superviser la sécurité de l’IA. La technologie n’était pas positionnée comme une menace. Au lieu de cela, les législateurs ont prudemment élaboré des politiques garantissant que la recherche respecte les lois sur la protection de la vie privée et renforce l’économie, la santé publique et la défense nationale. En tête du peloton, l'Union européenne s'est mise d'accord sur le Loi sur l'IA limiter la technologie dans certains domaines.

Les protéines synthétiques n’étaient pas directement mentionnées dans la réglementation. C'est une excellente nouvelle pour la fabrication de protéines de synthèse, qui pourraient être entravées par une réglementation trop restrictive, écrivent Baker et Church. Cependant, une nouvelle législation sur l'IA est en préparation, l'organisme consultatif des Nations Unies sur l'IA étant prêt à partager des lignes directrices sur réglementation internationale au milieu de cette année.

Étant donné que les systèmes d’IA utilisés pour fabriquer des protéines de synthèse sont hautement spécialisés, ils risquent encore de passer inaperçus en matière de réglementation, si le domaine s’unit dans un effort mondial d’autorégulation.

Au Sommet sur la sécurité de l'IA 2023, qui a discuté de la conception de protéines basées sur l'IA, les experts ont convenu qu'il était essentiel de documenter l'ADN sous-jacent de chaque nouvelle protéine. Comme leurs homologues naturelles, les protéines de synthèse sont également construites à partir du code génétique. L'enregistrement de toutes les séquences d'ADN synthétique dans une base de données pourrait faciliter la détection des signaux d'alarme concernant des conceptions potentiellement dangereuses, par exemple si une nouvelle protéine a des structures similaires à celles pathogènes connues.

La biosécurité n’empêche pas le partage de données. La collaboration est essentielle pour la science, mais les auteurs reconnaissent qu'elle reste nécessaire pour protéger les secrets commerciaux. Et comme dans l’IA, certaines protéines de synthèse peuvent être potentiellement utiles mais trop dangereuses pour être partagées ouvertement.

Une façon de contourner cette énigme consiste à ajouter directement des mesures de sécurité au processus de synthèse lui-même. Par exemple, les auteurs suggèrent d’ajouter un code-barres composé de lettres d’ADN aléatoires à chaque nouvelle séquence génétique. Pour construire la protéine, une machine de synthèse recherche sa séquence d’ADN et ce n’est que lorsqu’elle trouvera le code qu’elle commencera à construire la protéine.

En d’autres termes, les concepteurs originaux de la protéine peuvent choisir avec qui partager la synthèse – ou même s’ils souhaitent la partager – tout en étant capables de décrire leurs résultats dans des publications.

Une stratégie de codes-barres associant la fabrication de nouvelles protéines à une machine de synthèse renforcerait également la sécurité et dissuaderait les mauvais acteurs, ce qui rendrait difficile la recréation de produits potentiellement dangereux.

"Si une nouvelle menace biologique apparaît n'importe où dans le monde, les séquences d'ADN associées pourraient être retracées jusqu'à leurs origines", écrivent les auteurs.

Ce sera un chemin difficile. La sécurité des protéines de synthèse dépendra du soutien mondial des scientifiques, des instituts de recherche et des gouvernements, écrivent les auteurs. Cependant, il y a eu des succès antérieurs. Des groupes mondiaux ont établi des lignes directrices en matière de sécurité et de partage dans d’autres domaines controversés, tels que la recherche sur les cellules souches, le génie génétique, les implants cérébraux et l’IA. Bien que ce ne soit pas toujours suivi...Les bébés CRISPR sont un exemple notoire... pour la plupart, ces lignes directrices internationales ont contribué à faire progresser la recherche de pointe de manière sûre et équitable.

Pour Baker et Church, des discussions ouvertes sur la biosécurité ne ralentiront pas le terrain. Au contraire, cela peut rallier différents secteurs et engager un débat public afin que la conception de protéines personnalisées puisse continuer à prospérer.

Crédit image: Université de Washington

Horodatage:

Plus de Singularity Hub