Thanks To Generative AI, Catching Fraud Science Is Going To Be This Much Harder

Julkaissut Platon

seuraajia: 0

Ominaisuus Generatiivinen tekoäly asettaa mielenkiintoisia haasteita akateemisille julkaisijoille, jotka torjuvat petoksia tiedepapereissa, koska teknologia osoittaa potentiaalin huijata ihmisten vertaisarviointia.

Kuvaile kuva DALL-E:lle, Stable Diffusionille ja Midjourneylle, niin ne luovat kuvan sekunneissa. Nämä tekstistä kuvaksi -järjestelmät ovat parantuneet nopeasti viime vuosien aikana, ja se, mikä alun perin alkoi tutkimusprototyyppinä, tuottaa hyvänlaatuisia ja ihmeellisen outoja kuvitukset Vuonna 2021 koirien ulkoiluttamista koskevasta baby daikon retiisistä on sittemmin tullut kaupallinen ohjelmisto, jonka ovat rakentaneet miljardin dollarin yritykset ja jotka pystyvät luomaan yhä realistisempia kuvia.

Nämä tekoälymallit voivat tuottaa todentuntuisia kuvia ihmisten kasvoista, esineistä ja kohtauksista, ja näyttää olevan ajan kysymys, ennen kuin ne pystyvät luomaan myös vakuuttavia tieteellisiä kuvia ja dataa. Tekstistä kuvaksi -mallit ovat nyt laajalti saatavilla, melko halpoja käyttää, ja ne voivat auttaa ovelia tiedemiehiä luomaan tuloksia ja julkaisemaan huijausta tutkimusta helpommin.

Kuvankäsittely on jo nyt akateemisten kustantajien suurin huolenaihe, koska se on eniten yleinen muoto viimeaikaisista tieteellisistä virheistä. Tekijät voivat väärentää tietoja käyttämällä kaikenlaisia temppuja, kuten kääntämällä, kiertämällä tai rajaamalla saman kuvan osia. Toimittajia huijataan uskomaan, että kaikki esitetyt tulokset ovat todellisia, ja julkaisevat työnsä.

Monet julkaisijat pyrkivät nyt käyttämään tekoälyohjelmistoa havaita merkkejä kuvien päällekkäisyydestä tarkistusprosessin aikana. Useimmissa tapauksissa tietonsa sekoittaneet tutkijat ovat virheellisesti kopioineet kuvia, mutta joskus niitä käytetään räikeisiin petoksiin.

Mutta aivan kun julkaisijat alkavat saada otteen kuvien päällekkäisyydestä, ilmaantuu toinen uhka. Jotkut tutkijat saattavat tuntea houkutusta käyttää generatiivisia tekoälymalleja väärennetyn tiedon luomiseen. Itse asiassa on olemassa todisteita siitä, että huijatut tiedemiehet tekevät tämän jo.

Tekoälyllä tehdyt kuvat löytyivät papereista?

Vuonna 2019 DARPA lanseerasi semanttisen rikostutkimuksen (SemaFor) -ohjelma, jolla rahoitetaan tutkijoita, jotka kehittävät rikosteknisiä työkaluja, jotka pystyvät havaitsemaan tekoälyn tuottamaa mediaa disinformaation torjumiseksi.

Uncle Samin puolustustutkimusviraston tiedottaja vahvisti, että se on havainnut väärennettyjä lääketieteellisiä kuvia, jotka on julkaistu todellisissa tiedepapereissa ja jotka näyttävät olevan luotu tekoälyllä. Ennen tekstistä kuvaksi -malleja generatiiviset vastavuoroiset verkostot olivat suosittuja. DARPA tajusi, että nämä mallit, jotka tunnetaan parhaiten kyvystään luoda syväväärennöksiä, pystyivät myös väärentämään kuvia lääketieteellisistä skannauksista, soluista tai muun tyyppisistä kuvista, joita usein löytyy biolääketieteellisissä tutkimuksissa.

"Uhkamaisema liikkuu melko nopeasti", William Corvey, SemaForin ohjelmapäällikkö, kertoi Rekisteri. "Teknologiasta on tulossa kaikkialla hyvänlaatuisia tarkoituksia varten." Corvey sanoi, että virasto on onnistunut kehittämään ohjelmistoja, jotka pystyvät havaitsemaan GAN-valmisteisia kuvia, ja työkaluja kehitetään edelleen.

Uhkamaisema etenee melko nopeasti

"Meillä on tuloksia, jotka viittaavat siihen, että voit havaita "sisarukset tai kaukaiset serkut" generatiivisesta mekanismista, jonka olet oppinut havaitsemaan aiemmin, riippumatta luotujen kuvien sisällöstä. SemaFor analytics tarkastelee useita manipuloituun mediaan liittyviä attribuutteja ja yksityiskohtia, kaikkea metatiedoista, tilastollisista poikkeavuuksista aina visuaalisiin esityksiin, hän sanoi.

Jotkut kuva-analyytikot, jotka tarkastelevat tieteellisten julkaisujen tietoja, ovat myös törmänneet GAN-luomien kuvien ulkonäköön. GAN on generatiivinen kontradiktorinen verkosto, eräänlainen koneoppimisjärjestelmä, joka voi luoda kirjoitusta, musiikkia, kuvia ja paljon muuta.

Esimerkiksi Sydneyn yliopiston molekyylionkologian professori Jennifer Byrne ja EMBO Pressin kuvien eheyden analyytikko Jana Christopher löysivät oudon kuvasarjan, joka esiintyi 17 biokemiaan liittyvässä tutkimuksessa.

Kuvissa kuvattiin sarja bändejä, jotka tunnetaan yleisesti nimellä western blotit, jotka osoittavat tiettyjen proteiinien läsnäolon näytteessä, joilla kaikilla näytti olevan sama tausta. Niin ei pitäisi tapahtua.

Kuva A Byrne-Christopherin paperista epäilyttävistä papereista

Esimerkkejä toistuvista taustoista Western blot -kuvissa, korostettuina punaisilla ja vihreillä ääriviivoilla… Lähde: Byrne, Christopher 2020

Vuonna 2020 Byrne ja Christopher tulivat siihen tulokseen, että epäilyttävän näköiset kuvat on luultavasti tuotettu osana paperitehtaan toimintaa: yritystä tuottaa biokemiallisia tutkimuksia koskevia papereita väärennetyillä tiedoilla ja saada ne vertaisarvioituiksi ja julkaistuiksi. Tällainen kapris voidaan vetää esimerkiksi hyödyksi tutkijoille, joille maksetaan hyväksytyn paperitulosteen perusteella, tai auttamaan laitosta saavuttamaan julkaistujen raporttien kiintiön.

"Näytetyn esimerkin blotit meidän paperimme ovat todennäköisesti tietokoneella luotuja", Christopher kertoi Rekisteri.

Törmään usein väärien näköisiin kuviin, pääasiassa western blot -kuviin, mutta yhä useammin myös mikroskooppikuviin

”Seulontapapereita sekä ennen julkaisua että sen jälkeen törmään usein väärien näköisiin kuviin, pääasiassa Western blot -kuviin, mutta yhä useammin myös mikroskooppikuviin. Olen hyvin tietoinen siitä, että monet näistä on todennäköisimmin luotu GAN:ien avulla."

Elisabeth Bik, freelance-kuvatutkija, voi usein kertoa, milloin kuvia on myös manipuloitu. Hän tutkii tieteellisiä paperikäsikirjoituksia, etsii kopioituja kuvia ja ilmoittaa näistä aiheista lehtien toimittajille tutkittavaksi. Mutta väärennettyjen kuvien torjunta on vaikeampaa, kun ne on generoitu kattavasti algoritmin avulla.

Hän huomautti, että vaikka Byrnen ja Christopherin tutkimuksessa korostettujen kuvien toistuva tausta on merkki väärennyksestä, itse western blotit ovat ainutlaatuisia. Tietokonenäköohjelmiston, jota Bik käyttää papereiden skannaamiseen ja kuvapetosten havaitsemiseen, olisi vaikea ilmoittaa näistä kaistaista, koska todelliset blotit eivät ole päällekkäisiä.

"Emme koskaan löydä päällekkäisyyttä. Uskoakseni ne ovat kaikki keinotekoisesti valmistettuja. Kuinka tarkalleen, en ole varma", hän kertoi Rekisteri.

Väärennettyjen kuvien luominen on helpompaa uusimmilla generatiivisilla tekoälymalleilla

GAN:t ovat suurelta osin syrjäyttäneet diffuusiomallit. Nämä järjestelmät luovat ainutlaatuisia kuvia ja tehostavat nykypäivän tekstistä kuvaksi -ohjelmistoja, mukaan lukien DALL-E, Stable Diffusion ja Midjourney. He oppivat kartoittamaan esineiden ja käsitteiden visuaalisen esityksen luonnolliseen kieleen ja voivat merkittävästi alentaa akateemisen huijauksen estettä.

Tiedemiehet voivat vain kuvailla, minkä tyyppistä väärää dataa he haluavat tuottaa, ja nämä työkalut tekevät sen heidän puolestaan. Tällä hetkellä he eivät kuitenkaan vielä pysty luomaan realistisen näköisiä tieteellisiä kuvia. Joskus työkalut tuottavat soluryhmiä, jotka näyttävät ensi silmäyksellä vakuuttavilta, mutta epäonnistuvat surkeasti, kun on kyse Western blotista.

Nämä tekoälyohjelmat voivat tuottaa tällaista:

Tässä on mitä @OpenAI's DALL-E tekee biologisten solukehotteiden kanssa

Tarkemmin sanottuna: "solut mikroskoopin alla" ja "T-solut pyyhkäisyelektronimikroskoopin alla" pic.twitter.com/BgcZr3k5Q5

- Tara Basu Trivedi (@tbt94) Elokuu 23, 2022

William Gibson – lääkäri-tieteilijä ja lääketieteellisen onkologian stipendiaatti, ei kuuluisa kirjailija – tarjoaa lisää esimerkkejä tätä, mukaan lukien kuinka nykyajan mallit kamppailevat western blotin käsitteen kanssa.

Tekniikka paranee kuitenkin vain, kun kehittäjät kouluttavat suurempia malleja enemmän dataa varten.

David Bimler, toinen tiedepapereiden kuvankäsittelyn tunnistamisen asiantuntija, joka tunnetaan paremmin nimellä Smut Clyde, kertoi meille: "Papermyllyt havainnollistavat tuotteitaan millä tahansa menetelmällä, joka on halvin ja nopein, luottaen vertaisarviointiprosessin heikkouksiin."

”He voisivat yksinkertaisesti kopioida [Western blot] vanhemmista papereista, mutta sekin vaatii työtä vanhojen papereiden etsimiseen. Tällä hetkellä epäilen, että GANin käyttö on vielä vaivaa. Vaikka se tulee muuttumaan, hän lisäsi.

DARPA aikoo nyt laajentaa SemaFor-ohjelmaa tutkiakseen tekstistä kuvaksi -järjestelmiä. "Tällaiset mallit ovat melko uusia, ja vaikka ne ovat laajuudeltaan, ne eivät ole osa nykyistä työtämme SemaForilla", Corvey sanoi.

"SemaForin arvioijat kuitenkin todennäköisesti tarkastelevat näitä malleja ohjelman seuraavassa arviointivaiheessa, joka alkaa syksyllä 2023."

Samaan aikaan tieteellisen tutkimuksen laatu heikkenee, jos akateemiset kustantajat eivät löydä tapoja havaita tekoälyn luomia vääriä kuvia papereista. Parhaassa tapauksessa tämäntyyppinen akateeminen petos rajoittuu vain paperitehdassuunnitelmiin, jotka eivät kuitenkaan saa paljon huomiota. Pahimmassa tapauksessa se vaikuttaa arvostetuimpiinkin lehtiin, ja hyvissä aikeissa toimivat tiedemiehet tuhlaavat aikaa ja rahaa jahtaamaan vääriä ideoita, jotka uskovat olevan totta. ®

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. Pääsy tästä.
Lähde: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/

Aikaleima: Maaliskuussa 11, 2023

Aikaleima: Jan 10, 2024

Generatiivisen tekoälyn ansiosta petostieteen tavoittaminen tulee olemaan paljon vaikeampaa

Julkaissut Platon

Tekoälyllä tehdyt kuvat löytyivät papereista?

Väärennettyjen kuvien luominen on helpompaa uusimmilla generatiivisilla tekoälymalleilla

Lisää aiheesta Rekisteri

Steam kehottaa kehittäjiä paljastamaan tekoälyllä tehtyä sisältöä peleissä

Elon Musk sai salaiset kaksoset vuonna 2021 Neuralink-johtajan kanssa

Waymo robo taksit keräävät miljoona mailia tappamatta ketään

Menestyksen tien puhdistaminen

Kiekkomittakaava, tapaa atomimittakaava: Uncle Sam testaa Cerebras-siruja ydinasesimsissä

Kiina lisää kotimaisen tekoälyinfrastruktuurin to do -listalleen

Katso hyönteiset, jos haluat rakentaa pieniä tekoälyrobotteja, jotka ovat todella älykkäitä

Washington pohtii pilvien seurantaa epäilyttävien tekoälykoulutuksen varalta

Rintasyövän seulonta tekoälysovellus OK'd: watchdog

Tietoa Meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili