Establishing Reward Criteria For Reporting Bugs In AI Products

Julkaissut Platon

seuraajia: 0

Google ylläpitää a Haavoittuvuuden palkitsemisohjelma kunnioittaakseen huippuluokan ulkopuolisia lahjoituksia, jotka koskevat Googlen omistamien ja Alphabetin tytäryhtiöiden verkko-omaisuuksien ongelmia. Pysyäksemme AI-tekniikoiden nopean kehityksen tahdissa ja varmistaaksemme, että olemme valmiita vastaamaan turvallisuushaasteisiin a vastuullinen tavalla, laajensimme hiljattain olemassa olevaa Bug Hunters ohjelma edistääksemme kolmannen osapuolen löytämistä ja raportoimista tekoälyjärjestelmiimme liittyvistä ongelmista ja haavoittuvuuksista. Tämä laajennus on osa pyrkimystämme toteuttaa vapaaehtoiset tekoälysitoumukset jonka teimme Valkoisessa talossa heinäkuussa.

Auttaaksemme tietoturvayhteisöä ymmärtämään paremmin tätä kehitystä, olemme lisänneet tietoja palkitsemisohjelman osista.

Mitä palkintoja on tarjolla

Tuoreessa AI punaisen tiimin raportti, joka perustuu Googlen AI Red Team Harjoituksissa tunnistimme yleiset taktiikat, tekniikat ja menettelyt (TTP), joita pidämme sopivimpana ja realistisina reaalimaailman vastustajia käytettäväksi tekoälyjärjestelmiä vastaan. Seuraava taulukko sisältää sen, mitä olemme oppineet auttamaan tutkimusyhteisöä ymmärtämään tekoälyn virheraporttien kriteerit ja mitä palkkio-ohjelmamme koskee. On tärkeää huomata, että palkkioiden määrät riippuvat hyökkäysskenaarion vakavuudesta ja kohteen tyypistä, johon se vaikuttaa (käynti ohjelman säännöt -sivulta saadaksesi lisätietoja palkintotaulukostamme).

Kehotushyökkäykset: Vastuullisten kehotteiden laatiminen, joiden avulla vastustaja voi vaikuttaa mallin käyttäytymiseen ja siten myös tulokseen tavoilla, joita sovellus ei ole tarkoittanut.	Anna uhreille näkymättömiä injektioita nopeasti ja muuttaa uhrin tilin tilaa tai hänen omaisuuttaan.
	Pyydä injektiota kaikkiin työkaluihin, joissa vastausta käytetään sellaisten päätösten tekemiseen, jotka vaikuttavat suoraan uhrien käyttäjiin.
	Kehotteen tai alustusosan purkaminen, jossa käyttäjä voi purkaa mallin alustamiseen käytetyn alkukehotteen vain, kun puretussa johdanto-osassa on arkaluonteisia tietoja.
	Tuotteen käyttäminen loukkaavan, harhaanjohtavan tai tosiasiallisesti virheellisen sisällön tuottamiseen omassa istunnossasi: esim. "jailbreak". Tämä sisältää "hallusinaatiot" ja tosiasiallisesti epätarkkoja vastauksia. Googlen luovilla tekoälytuotteilla on jo oma raportointikanava tämäntyyppisille sisältöongelmille.	Soveltamisalan ulkopuolella
Harjoitustietojen purkaminen: Hyökkäykset, jotka pystyvät onnistuneesti rekonstruoimaan arkaluonteisia tietoja sisältäviä sanatarkasti harjoitusesimerkkejä. Kutsutaan myös jäsenpäätelmäksi.	Harjoitustietojen poiminta, joka rekonstruoi harjoitustietojoukossa käytetyt kohteet, jotka vuotavat arkaluontoista, ei-julkista tietoa.
	Poiminta, joka rekonstruoi ei-arkaluonteisen/julkisen tiedon.	Soveltamisalan ulkopuolella
Mallien manipulointi: Hyökkääjä, joka pystyy salaa muuttamaan mallin käyttäytymistä siten, että ne voivat laukaista ennalta määritellyn vastakkaisen toiminnan.	Vastuullinen tulos tai käyttäytyminen, jonka hyökkääjä voi luotettavasti laukaista tietyllä syötteellä Googlen omistamassa ja ylläpitämässä mallissa ("takaovet"). Vain laajuudessa, kun mallin tulostetta käytetään muuttamaan uhrin tilin tai tietojen tilaa.
	Hyökkäykset, joissa hyökkääjä manipuloi mallin koulutustietoja vaikuttaakseen mallin tuottoon uhrin istunnossa hyökkääjän mieltymysten mukaan. Vain laajuudessa, kun mallin tulostetta käytetään muuttamaan uhrin tilin tai tietojen tilaa.
Vastakkainen häiriö: Mallille syötetyt syötteet, jotka johtavat mallin deterministiseen, mutta erittäin odottamattomaan tulosteeseen.	Kontekstit, joissa vastustaja voi luotettavasti laukaista väärän luokituksen turvatarkastuksessa, jota voidaan käyttää väärin haitalliseen käyttöön tai kilpailevan hyödyn saamiseksi.
	Kontekstit, joissa mallin virheellinen tulos tai luokitus ei aiheuta houkuttelevaa hyökkäysskenaariota tai mahdollista polkua Googlelle tai käyttäjälle.	Soveltamisalan ulkopuolella
Mallin varkaus/suodatus: Tekoälymallit sisältävät usein arkaluontoisia immateriaalioikeuksia, joten asetamme tämän omaisuuden suojaamisen erittäin tärkeäksi. Suodatushyökkäysten avulla hyökkääjät voivat varastaa mallin tietoja, kuten sen arkkitehtuuria tai painoja.	Hyökkäykset, joissa luottamuksellisen/omistusoikeudellisen mallin tarkka arkkitehtuuri tai painot erotetaan.
	Hyökkäykset, joissa arkkitehtuuria ja painotuksia ei eroteta tarkasti tai kun ne on poimittu ei-luottamuksellisesta mallista.	Soveltamisalan ulkopuolella
Jos huomaat tekoälyllä toimivassa työkalussa jonkin muun kuin yllä mainitun vian, voit silti lähettää sen edellyttäen, että se täyttää ohjelmasivullamme luetellut pätevyydet.	Virhe tai käyttäytyminen, joka selvästi täyttää kelvollisen tietoturva- tai väärinkäyttöongelman vaatimukset.
	Tekoälytuotteen käyttäminen mahdollisesti haitallisen asian tekemiseen, mikä on jo mahdollista muilla työkaluilla. Esimerkiksi avoimen lähdekoodin ohjelmiston haavoittuvuuden löytäminen (jo mahdollista käyttämällä julkisesti saatavilla olevia staattisen analyysin työkalut) ja tuottaa vastauksen haitalliseen kysymykseen, kun vastaus on jo saatavilla verkossa.	Soveltamisalan ulkopuolella
	Ohjelmamme mukaisesti ongelmat, joista jo tiedämme, eivät ole oikeutettuja palkkioon.	Soveltamisalan ulkopuolella
	Mahdolliset tekijänoikeusongelmat – havainnot, joissa tuotteet palauttavat tekijänoikeudella suojattua sisältöä. Googlen luovilla tekoälytuotteilla on jo oma raportointikanava tämäntyyppisille sisältöongelmille.	Soveltamisalan ulkopuolella

Uskomme, että bug bounty -ohjelmamme laajentaminen tekoälyjärjestelmiimme tukee vastuullinen AI-innovaatio, ja odotamme innolla työmme jatkamista tutkimusyhteisön kanssa löytääksemme ja korjataksemme tietoturva- ja väärinkäyttöongelmia tekoälypohjaisissa ominaisuuksissamme. Jos löydät vaatimukset täyttävän ongelman, siirry Bug Hunters -verkkosivustollemme ja lähetä meille virheraporttisi ja – jos ongelma todetaan oikeaksi – saat palkinnon siitä, että autat meitä pitämään käyttäjiemme turvassa.

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
Lähde: https://www.darkreading.com/vulnerabilities-threats/establishing-reward-criteria-for-reporting-bugs-in-ai-products

Aikaleima: Joulukuu 15, 2023

Aikaleima: Elokuu 4, 2022

Palkkiokriteerien määrittäminen tekoälytuotteiden virheistä ilmoittamiseen

Julkaissut Platon

Mitä palkintoja on tarjolla

Lisää aiheesta Pimeää luettavaa

Oikeinkirjoituksen tarkistus Google Chromessa, Microsoft Edge -selaimet vuotavat salasanoja

Kattava verkon näkyvyys on välttämätöntä nollaluottamukselliselle maturille

Allurity ostaa espanjalaisen monikansallisen Aiuken Cybersecurityn

Vinkkejä SecOps-tiimien modernisoimiseen

Miksi punaiset joukkueet eivät voi vastata puolustajien tärkeimpiin kysymyksiin?

Kybervakuutuksen saaminen pienyritysten, urakoitsijoiden saataville

3 kyberturvallisuuden muunnosloukkua CISO:ille, joita vältettävä

Delinea hankkii valtuutuksen vahvistaakseen laajennettua PAM:ia

Oreo Giant Mondelez selvitti NotPetyan "Act of War" -vakuutusjutun

DataDome sulkee 42 miljoonan dollarin C-sarjan rahoituksen edistääkseen torjuntaa bottien aiheuttamia kyberhyökkäyksiä ja petoksia vastaan

35 XNUMX haitallisen koodin lisäystä GitHubissa: hyökkäys vai bug-Bounty-ponnistelu?

Tietoa meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili