Toki, Microsoft, laitetaan ChatGPT robottien hallintaan

Toki, Microsoft, laitetaan ChatGPT robottien hallintaan

Lähdesolmu: 1971360

Video Microsoft, joka on sitoutunut "usean vuoden, monen miljardin dollarin" sijoitukseen OpenAI:hen, on niin täynnä suuria kielimalleja, kuten ChatGPT, että se näkee niin älykkäiden ohjelmistojen yksinkertaistavan kommunikointia robottien kanssa.

ChatGPT on suuri kielimalli (LLM), joka on koulutettu OpenAI GPT (Generative Pre-trained Transformer) -tietojoukolle, joka koostuu verkosta ja muista lähteistä kootusta tekstistä. Yhdessä chat-käyttöliittymän kanssa mallin kyky vastata kysymyksiin puoliksi johdonmukaisesti, kuitenkin ei aina tarkasti, voitti sille paikan Microsoftin Bing-hakukoneessa ja sai kielen heilumaan, että mainoksilla koristeltu, SEO-pelaaminen, maksuperusteinen Google-haku saattaa vihdoin päättyä.

Liian kiireinen sammuttamalla tulipaloja Bingin tekoälyn mielen sulamisesta Microsoft ehdottaa nyt ChatGPT:tä tapana auttaa ihmisiä ohjaamaan robotteja fyysisessä maailmassa.

"Tavoitteemme tällä tutkimuksella on nähdä, pystyykö ChatGPT ajattelemaan tekstiä pidemmälle ja miettimään fyysistä maailmaa auttaakseen robotiikkatehtävissä", yhtiö sanoi. lähettää maanantaina. "Haluamme auttaa ihmisiä vuorovaikutuksessa robottien kanssa helpommin ilman, että heidän tarvitsee opetella monimutkaisia ​​ohjelmointikieliä tai yksityiskohtia robottijärjestelmistä."

Sitä varten Redmondin tutkijat ovat julkaisseet PromptCraft, jota kuvataan avoimen lähdekoodin yhteistyöalustaksi, jolla jaetaan LLM-kyselyjen ja -komentojen parhaat sanat roboteille.

Osoittautuu, että et voi mennä suoraan "Avaa kotelon ovet, ole kiltti, Hal”, jos käytät ChatGPT:tä dronin ääniohjauskanavana. Sinun täytyy asettaa kohtaus mallille. Se alkaa jotain tällaista:

Kuvittele, että autat minua olemaan vuorovaikutuksessa AirSim-simulaattorin kanssa droneille. Sinulla on tiettynä ajankohtana seuraavat kyvyt, joista jokainen tunnistetaan ainutlaatuisella tunnisteella. Sinun on myös annettava koodi joillekin pyynnöille.

Kysymys: Voit esittää minulle selventävän kysymyksen, kunhan tunnistat sen nimenomaisesti sanomalla "Kysymys". Koodi: Anna koodikomento, joka saavuttaa halutun tavoitteen.

Syy: Kun olet antanut koodin, sinun tulee selittää, miksi teit mitä teit.

Simulaattori sisältää dronin sekä useita esineitä. Dronea lukuun ottamatta mikään esineistä ei ole liikuteltavissa. Koodissa meillä on käytettävissämme seuraavat komennot. Et saa käyttää muita hypoteettisia toimintoja.

...

Ja on olemassa tärkeitä navigointiparametreja, jotka on määritettävä. Mutta jonkinlaisen valmistelun jälkeen saatat päästä siihen pisteeseen, jossa voit keskustella ChatGPT:n kanssa ja saada sen ohjaamaan dronin etsimään sinulle juomaa ympäröivästä ympäristöstä. Tai se voi tuottaa Python-koodin, joka antaa dronin tehdä tarjouksesi, jos virheitä ei ole.

Youtube Video

"ChatGPT avaa uuden robotiikan paradigman ja sallii (mahdollisesti ei-teknisen) käyttäjän istua silmukassa ja antaa korkean tason palautetta suurelle kielimallille (LLM) samalla kun tarkkailee robotin suorituskykyä", Microsoft selittää. "Noudattamalla suunnitteluperiaatteitamme ChatGPT voi luoda koodia robotiikan skenaarioihin."

Toisin sanoen samanlainen Github Copilotin tuottama ei-välttämättä oikea koodi voitaisiin syöttää suoraan robotille ChatGPT:n kautta auttamaan sitä suorittamaan tietyn tehtävän.

Sai Vemprala, Rogerio Bonatti, Arthur Bucker ja Ashish Kapoor Microsoft Autonomous Systems and Robots Research Groupista kuvaavat yritystään ohjata robotteja ChatGPT:n kautta tutkimuspaperi [PDF], jonka otsikko on "ChatGPT for Robotics: Design Principles and Model Abilities".

Projekti määrittelee korkean tason API:n, jonka ChatGPT voi ymmärtää ja yhdistää sen alemman tason robottitoimintoihin. Sen jälkeen he kirjoittivat tekstikehotteita ChatGPT:lle, jossa kuvattiin tehtävän tavoitteita, määriteltiin käytettävissä olevia toimintoja ja asetettiin tehtävän rajoituksia.

ChatGPT vastasi sitten luomalla laitteeseen soveltuvan koodin saavuttaakseen minkä tahansa simulointitavoitteen, joka oli asetettu. Ajatuksena on, että ChatGPT:n kanssa keskusteleva henkilö voi testata robottiohjeita, kunnes ne toimivat oikein.

Microsoftin boffinit saavat sen kuulostamaan siltä, ​​että ChatGPT kykenee "tila-ajalliseen päättelyyn", joka perustuu sen kykyyn ohjata robottia kameralla, joten se voi käyttää visuaalisia antureita koripallon kiinni saamiseksi.

"Näemme, että ChatGPT pystyy asianmukaisesti käyttämään tarjottuja API-toimintoja, perustelemaan pallon ulkonäköä ja kutsumaan asiaankuuluvia OpenCV-toimintoja sekä ohjaamaan robotin nopeutta suhteellisella ohjaimella", he selittävät paperissa.

Väitetään, että tällainen järkeily – jolla on jokin maalaisjärkeä koskeva maailmanmalli – helpottaa huomattavasti robottien tehokasta toimintaa fyysisessä ympäristössä. Autonominen ajoneuvoteollisuus ei ole vielä olemassa, eikä myöskään ChatGPT näytä olevan.

Juuri tällä viikolla Etelä-Kalifornian yliopiston tutkijapari Zhisheng Tang ja Mayank Kejriwal julkaisivat. paperi ArXivin kautta, joka haastaa ChatGPT:n ja DALL•E 2:n kyvyn tehdä järkeviä johtopäätöksiä maailmasta.

Paperi, jonka otsikko on "ChatGPT:n ja DALL-E 2:n pilottiarviointi päätöksenteosta ja spatiaalista päättelystä", päättelee, että nämä kaksi mallia järkeilevät epäjohdonmukaisesti.

Mitä tulee ChatGPT:hen, he havaitsivat, että "vaikka se osoittaa jossain määrin rationaalista päätöksentekoa, monet sen päätökset rikkovat ainakin yhtä aksioomista jopa järkevissä mieltymysten, vetojen ja päätöksentekokehotteiden rakenteissa." Ja joskus, he sanoivat, ChatGPT tekee oikean päätöksen vääristä syistä.

Microsoftin boffinit myöntävät, että ChatGPT:llä on rajoituksia, ja he huomauttavat, että mallin tulosta ei tule soveltaa robottiin valitsematta.

"Korostamme, että näille työkaluille ei pitäisi antaa täydellistä hallintaa robotiikkaputkistossa, etenkään turvallisuuden kannalta kriittisissä sovelluksissa", he toteavat paperissaan. "Kun otetaan huomioon LLM:ien taipumus tuottaa lopulta vääriä vastauksia, on melko tärkeää varmistaa ratkaisun laatu ja koodin turvallisuus ihmisen valvonnassa ennen sen suorittamista robotissa." ®

Aikaleima:

Lisää aiheesta Rekisteri