AI kan designe helt nye proteiner fra bunnen av – det er på tide å snakke om biosikkerhet

AI kan designe helt nye proteiner fra bunnen av – det er på tide å snakke om biosikkerhet

Kilde node: 3089287

For to tiår siden var ingeniørproteiner en drøm.

Nå, takket være AI, er tilpassede proteiner en krone et dusin. Laget proteiner på bestilling har ofte spesifikke former eller komponenter som gir dem nye evner for naturen. Fra langtidsholdbare legemidler og proteinbaserte vaksiner, til grønnere biodrivstoff og plast-spising proteiner, er feltet raskt i ferd med å bli en transformativ teknologi.

Tilpasset proteindesign avhenger av dyplæringsteknikker. Med store språkmodeller – AI-en bak OpenAIs storfilm ChatGPT – som drømmer opp millioner av strukturer utover menneskelig fantasi, vil biblioteket med bioaktive designerproteiner raskt utvide seg.

"Det er enormt styrkende," Dr. Neil King ved University of Washington nylig fortalte Natur. "Ting som var umulige for halvannet år siden - nå gjør du det bare."

Men med stor makt følger stort ansvar. Ettersom nydesignede proteiner i økende grad får gjennomslag for bruk i medisin og bioteknologi, lurer forskerne nå på: Hva skjer hvis disse teknologiene brukes til uhyggelige formål?

Et nylig essay i Vitenskap fremhever behovet for biosikkerhet for designerproteiner. I likhet med pågående samtaler om AI-sikkerhet, sier forfatterne at det er på tide å vurdere biosikkerhetsrisikoer og retningslinjer slik at tilpassede proteiner ikke blir useriøse.

Essayet er skrevet av to eksperter på området. En, Dr. David Baker, direktøren for Institute for Protein Design ved University of Washington, ledet utviklingen av RoseTTAFold - en algoritme som tok et halvt tiår med å dekode proteinstruktur fra aminosyresekvensene alene. Den andre, Dr. George Church ved Harvard Medical School, er en pioner innen genteknologi og syntetisk biologi.

De foreslår at syntetiske proteiner trenger strekkoder innebygd i hvert nytt proteins genetiske sekvens. Hvis noen av designerproteinene blir en trussel – for eksempel potensielt utløst et farlig utbrudd – vil strekkoden gjøre det enkelt å spore tilbake til opprinnelsen.

Systemet gir i utgangspunktet "et revisjonsspor," duoen skrive.

Verdener kolliderer

Designerproteiner er uløselig knyttet til AI. Det samme er potensielle biosikkerhetspolitikker.

For over et tiår siden brukte Bakers laboratorium programvare for å designe og bygge et protein kalt Top7. Proteiner er laget av byggesteiner kalt aminosyrer, som hver er kodet inne i vårt DNA. Som perler på en snor, blir aminosyrer deretter snurret og rynket til spesifikke 3D-former, som ofte går videre inn i sofistikerte arkitekturer som støtter proteinets funksjon.

Top7 kunne ikke "snakke" med naturlige cellekomponenter - det hadde ingen biologiske effekter. Men selv da, laget konkluderte at utforming av nye proteiner gjør det mulig å utforske «de store områdene av proteinuniverset som ennå ikke er observert i naturen».

Skriv inn AI. Flere strategier tok nylig av for å designe nye proteiner med supersoniske hastigheter sammenlignet med tradisjonelt laboratoriearbeid.

Den ene er strukturbasert AI som ligner på bildegenererende verktøy som DALL-E. Disse AI-systemene er trent på støyende data og lærer å fjerne støyen for å finne realistiske proteinstrukturer. Kalt diffusjonsmodeller lærer de seg gradvis proteinstrukturer som er kompatible med biologi.

En annen strategi er avhengig av store språkmodeller. I likhet med ChatGPT finner algoritmene raskt sammenhenger mellom protein-"ord" og destillerer disse forbindelsene til en slags biologisk grammatikk. Proteintrådene disse modellene genererer vil sannsynligvis foldes til strukturer kroppen kan dechiffrere. Et eksempel er ProtGPT2, som kan ingeniør aktive proteiner med former som kan føre til nye egenskaper.

Digital til fysisk

Disse AI-proteindesignprogrammene slår alarmklokkene. Proteiner er byggesteinene i livet - endringer kan dramatisk endre hvordan celler reagerer på medisiner, virus eller andre patogener.

I fjor kunngjorde regjeringer over hele verden planer om å overvåke AI-sikkerhet. Teknologien ble ikke posisjonert som en trussel. I stedet utformet lovgiverne forsiktig retningslinjer som sikrer at forskning følger personvernlovgivningen og styrker økonomien, folkehelsen og det nasjonale forsvaret. Som leder for anklagen ble EU enige om AI-loven å begrense teknologien på visse domener.

Syntetiske proteiner ble ikke direkte omtalt i regelverket. Det er gode nyheter for å lage designerproteiner, som kan bli dekket av altfor restriktiv regulering, skriver Baker og Church. Ny AI-lovgivning er imidlertid under arbeid, og FNs rådgivende organ for AI skal dele retningslinjer for internasjonal regulering i midten av dette året.

Fordi AI-systemene som brukes til å lage designerproteiner er svært spesialiserte, kan de fortsatt fly under regulatoriske radarer - hvis feltet forenes i et globalt forsøk på å regulere seg selv.

2023 AI Safety Summit, som diskuterte AI-aktivert proteindesign, var eksperter enige om å dokumentere hvert nytt proteins underliggende DNA er nøkkelen. I likhet med deres naturlige motstykker, er designerproteiner også bygget fra genetisk kode. Logging av alle syntetiske DNA-sekvenser i en database kan gjøre det lettere å oppdage røde flagg for potensielt skadelige design - for eksempel hvis et nytt protein har strukturer som ligner på kjente patogene.

Biosikkerhet squasher ikke datadeling. Samarbeid er avgjørende for vitenskapen, men forfatterne erkjenner at det fortsatt er nødvendig å beskytte forretningshemmeligheter. Og som i AI, kan noen designerproteiner være potensielt nyttige, men for farlige til å dele åpent.

En vei rundt denne gåten er å legge til sikkerhetstiltak direkte i selve synteseprosessen. For eksempel foreslår forfatterne å legge til en strekkode - laget av tilfeldige DNA-bokstaver - til hver nye genetiske sekvens. For å bygge proteinet søker en syntesemaskin i DNA-sekvensen, og først når den finner koden vil den begynne å bygge proteinet.

Med andre ord kan de opprinnelige designerne av proteinet velge hvem de skal dele syntesen med – eller om de i det hele tatt skal dele den – mens de fortsatt kan beskrive resultatene i publikasjoner.

En strekkodestrategi som knytter produksjon av nye proteiner til en syntesemaskin vil også øke sikkerheten og avskrekke dårlige skuespillere, noe som gjør det vanskelig å gjenskape potensielt farlige produkter.

"Hvis en ny biologisk trussel dukker opp hvor som helst i verden, kan de tilknyttede DNA-sekvensene spores til deres opprinnelse," skrev forfatterne.

Det blir en tøff vei. Designerproteinsikkerhet vil avhenge av global støtte fra forskere, forskningsinstitusjoner og myndigheter, skriver forfatterne. Det har imidlertid vært tidligere suksesser. Globale grupper har etablert retningslinjer for sikkerhet og deling på andre kontroversielle felt, som stamcelleforskning, genteknologi, hjerneimplantater og AI. Selv om det ikke alltid ble fulgt -CRISPR-babyer er et beryktet eksempel– For det meste har disse internasjonale retningslinjene bidratt til å bringe banebrytende forskning fremover på en trygg og rettferdig måte.

For Baker og Church vil ikke åpne diskusjoner om biosikkerhet bremse feltet. Snarere kan det samle ulike sektorer og engasjere offentlig diskusjon slik at tilpasset proteindesign kan trives videre.

Bilde Credit: University of Washington

Tidstempel:

Mer fra Singularity Hub