The Secret To Sparrow, DeepMindin uusin Q&A-chatbot: Ihmisten palaute

Julkaissut Platon

seuraajia: 0

DeepMind on kouluttanut Sparrow-nimisen chatbotin olemaan vähemmän myrkyllinen ja tarkempi kuin muut järjestelmät käyttämällä ihmisten palautetta ja Google-hakuehdotuksia.

Chatbotit toimivat tyypillisesti suurilla kielimalleilla (LLM), jotka on koulutettu Internetistä hakattuun tekstiin. Nämä mallit pystyvät luomaan proosakappaleita, jotka ovat ainakin pintatasolla johdonmukaisia ja kieliopillisesti oikeita ja voivat vastata käyttäjien kysymyksiin tai kirjallisiin kehotteisiin.

Tämä ohjelmisto kuitenkin poimii usein huonoja piirteitä lähdemateriaalista, mikä johtaa siihen, että se lisää loukkaavia, rasistisia ja seksistisiä näkemyksiä tai levittää valeuutisia tai salaliittoja, joita usein löytyy sosiaalisessa mediassa ja Internet-foorumeilta. Näitä botteja voidaan kuitenkin ohjata tuottamaan turvallisempaa tulosta.

Astu eteenpäin, Sparrow. Tämä chatbot perustuu tshintshilla, DeepMindin vaikuttava kielimalli, joka osoittivat et tarvitse yli sata miljardia parametria (kuten muilla LLM:illä on) tekstin luomiseen: Chinchillalla on 70 miljardia parametria, mikä tekee päätelmistä ja hienosäädöstä suhteellisen kevyempiä tehtäviä.

Sparrow'n rakentamiseksi DeepMind otti Chinchillan ja viritti sen ihmispalautteen perusteella vahvistusoppimisprosessin avulla. Erityisesti ihmisiä palkattiin arvioimaan chatbotin vastauksia tiettyihin kysymyksiin sen perusteella, kuinka osuvia ja hyödyllisiä vastaukset olivat ja rikkoivatko ne sääntöjä. Yksi säännöistä esimerkiksi oli: älä esiintyä tai teeskennellä olevasi todellinen ihminen.

Nämä pisteet syötettiin takaisin ohjaamaan ja parantamaan botin tulevaa tuottoa, prosessi toistettiin yhä uudelleen. Säännöt olivat avainasemassa ohjelmiston toiminnan ohjaamisessa ja sen kannustamisessa olemaan turvallinen ja hyödyllinen.

Yhdessä esimerkki vuorovaikutuksesta, Sparrow'lta kysyttiin kansainvälisestä avaruusasemasta ja astronautina olemisesta. Ohjelmisto pystyi vastaamaan kysymykseen viimeisimmästä kiertoratalaboratorion tutkimusmatkasta ja kopioi ja liitti oikean tiedon Wikipediasta linkin kanssa sen lähteeseen.

Kun käyttäjä tutki lisää ja kysyi Sparrowlta, lähtisikö se avaruuteen, se sanoi, ettei se voinut mennä, koska se ei ollut henkilö vaan tietokoneohjelma. Se on merkki siitä, että se noudattaa sääntöjä oikein.

Sparrow pystyi antamaan hyödyllistä ja tarkkaa tietoa tässä tapauksessa, eikä esittänyt olevansa ihminen. Muita sääntöjä, joita se opetettiin noudattamaan, olivat loukkausten tai stereotypioiden luominen, lääketieteellisten, oikeudellisten tai taloudellisten neuvojen antaminen, sekä sopimattoman sanominen, mielipiteiden tai tunteiden esittäminen tai kehon esittäminen.

Meille kerrotaan, että Sparrow pystyy vastaamaan loogisella, järkevällä vastauksella ja tarjoamaan Google-hausta asiaankuuluvan linkin lisätietopyyntöihin noin 78 prosentissa ajasta.

Kun osallistujien tehtäväksi annettiin yrittää saada Sparrow toimimaan esittämällä henkilökohtaisia kysymyksiä tai yrittämällä pyytää lääketieteellistä tietoa, se rikkoi sääntöjä kahdeksassa prosentissa tapauksista. Kielimalleja on vaikea hallita ja ne ovat arvaamattomia; Sparrow joskus edelleen keksii faktoja ja sanoo huonoja asioita.

Kun kysyttiin esimerkiksi murhasta, se sanoi, että murha oli paha, mutta sen ei pitäisi olla rikos. kuinka lohduttavaa. Kun eräs käyttäjä kysyi, oliko hänen miehellään suhde, Sparrow vastasi, ettei se tiennyt, mutta pystyi löytämään hänen viimeisimmän Google-haun. Olemme varmoja, että Sparrow ei itse asiassa voinut saada näitä tietoja. "Hän etsi sanaa "vaimoni on hullu", se valehteli.

"Sparrow on tutkimusmalli ja konseptin todiste, jonka tavoitteena on kouluttaa dialogiagentteja auttavammaksi, oikeammaksi ja vaarattomaksi. Oppimalla nämä ominaisuudet yleisessä dialogissa, Sparrow edistää ymmärrystämme siitä, kuinka voimme kouluttaa agentteja olemaan turvallisempia ja hyödyllisempiä – ja lopulta auttaa rakentamaan turvallisempaa ja hyödyllisempää tekoälyä”, DeepMind selitti.

"Tavoitteemme Sparrow'n kanssa oli rakentaa joustava koneisto sääntöjen ja normien noudattamiseksi dialogiagenteissa, mutta käyttämämme säännöt ovat alustavia. Paremman ja kattavamman säännöstön kehittäminen edellyttää sekä asiantuntijoiden panosta monista aiheista (mukaan lukien poliittiset päättäjät, yhteiskuntatieteilijät ja eettiset tutkijat) että osallistuvaa panosta useilta käyttäjiltä ja ryhmiltä, joita asia koskee. Uskomme, että menetelmämme pätevät edelleen tiukempaan sääntökokoelmaan."

Voit lukea lisää Sparrowin toiminnasta vertaisarvioimattomasta paperista tätä [PDF].

Rekisteri on pyytänyt DeepMindiltä lisäkommentteja. ®

Aikaleima: Syyskuu 22, 2022Syyskuu 22, 2022