Google ylläpitää a Haavoittuvuuden palkitsemisohjelma kunnioittaakseen huippuluokan ulkopuolisia lahjoituksia, jotka koskevat Googlen omistamien ja Alphabetin tytäryhtiöiden verkko-omaisuuksien ongelmia. Pysyäksemme AI-tekniikoiden nopean kehityksen tahdissa ja varmistaaksemme, että olemme valmiita vastaamaan turvallisuushaasteisiin a vastuullinen tavalla, laajensimme hiljattain olemassa olevaa Bug Hunters ohjelma edistääksemme kolmannen osapuolen löytämistä ja raportoimista tekoälyjärjestelmiimme liittyvistä ongelmista ja haavoittuvuuksista. Tämä laajennus on osa pyrkimystämme toteuttaa vapaaehtoiset tekoälysitoumukset jonka teimme Valkoisessa talossa heinäkuussa.
Auttaaksemme tietoturvayhteisöä ymmärtämään paremmin tätä kehitystä, olemme lisänneet tietoja palkitsemisohjelman osista.
Mitä palkintoja on tarjolla
Tuoreessa AI punaisen tiimin raportti, joka perustuu Googlen AI Red Team Harjoituksissa tunnistimme yleiset taktiikat, tekniikat ja menettelyt (TTP), joita pidämme sopivimpana ja realistisina reaalimaailman vastustajia käytettäväksi tekoälyjärjestelmiä vastaan. Seuraava taulukko sisältää sen, mitä olemme oppineet auttamaan tutkimusyhteisöä ymmärtämään tekoälyn virheraporttien kriteerit ja mitä palkkio-ohjelmamme koskee. On tärkeää huomata, että palkkioiden määrät riippuvat hyökkäysskenaarion vakavuudesta ja kohteen tyypistä, johon se vaikuttaa (käynti ohjelman säännöt -sivulta saadaksesi lisätietoja palkintotaulukostamme).
Kehotushyökkäykset: Vastuullisten kehotteiden laatiminen, joiden avulla vastustaja voi vaikuttaa mallin käyttäytymiseen ja siten myös tulokseen tavoilla, joita sovellus ei ole tarkoittanut. |
Anna uhreille näkymättömiä injektioita nopeasti ja muuttaa uhrin tilin tilaa tai hänen omaisuuttaan. |
|
Pyydä injektiota kaikkiin työkaluihin, joissa vastausta käytetään sellaisten päätösten tekemiseen, jotka vaikuttavat suoraan uhrien käyttäjiin. |
||
Kehotteen tai alustusosan purkaminen, jossa käyttäjä voi purkaa mallin alustamiseen käytetyn alkukehotteen vain, kun puretussa johdanto-osassa on arkaluonteisia tietoja. |
||
Tuotteen käyttäminen loukkaavan, harhaanjohtavan tai tosiasiallisesti virheellisen sisällön tuottamiseen omassa istunnossasi: esim. "jailbreak". Tämä sisältää "hallusinaatiot" ja tosiasiallisesti epätarkkoja vastauksia. Googlen luovilla tekoälytuotteilla on jo oma raportointikanava tämäntyyppisille sisältöongelmille. |
Soveltamisalan ulkopuolella |
|
Harjoitustietojen purkaminen: Hyökkäykset, jotka pystyvät onnistuneesti rekonstruoimaan arkaluonteisia tietoja sisältäviä sanatarkasti harjoitusesimerkkejä. Kutsutaan myös jäsenpäätelmäksi. |
Harjoitustietojen poiminta, joka rekonstruoi harjoitustietojoukossa käytetyt kohteet, jotka vuotavat arkaluontoista, ei-julkista tietoa. |
|
Poiminta, joka rekonstruoi ei-arkaluonteisen/julkisen tiedon. |
Soveltamisalan ulkopuolella |
|
Mallien manipulointi: Hyökkääjä, joka pystyy salaa muuttamaan mallin käyttäytymistä siten, että ne voivat laukaista ennalta määritellyn vastakkaisen toiminnan. |
Vastuullinen tulos tai käyttäytyminen, jonka hyökkääjä voi luotettavasti laukaista tietyllä syötteellä Googlen omistamassa ja ylläpitämässä mallissa ("takaovet"). Vain laajuudessa, kun mallin tulostetta käytetään muuttamaan uhrin tilin tai tietojen tilaa. |
|
Hyökkäykset, joissa hyökkääjä manipuloi mallin koulutustietoja vaikuttaakseen mallin tuottoon uhrin istunnossa hyökkääjän mieltymysten mukaan. Vain laajuudessa, kun mallin tulostetta käytetään muuttamaan uhrin tilin tai tietojen tilaa. |
||
Vastakkainen häiriö: Mallille syötetyt syötteet, jotka johtavat mallin deterministiseen, mutta erittäin odottamattomaan tulosteeseen. |
Kontekstit, joissa vastustaja voi luotettavasti laukaista väärän luokituksen turvatarkastuksessa, jota voidaan käyttää väärin haitalliseen käyttöön tai kilpailevan hyödyn saamiseksi. |
|
Kontekstit, joissa mallin virheellinen tulos tai luokitus ei aiheuta houkuttelevaa hyökkäysskenaariota tai mahdollista polkua Googlelle tai käyttäjälle. |
Soveltamisalan ulkopuolella |
|
Mallin varkaus/suodatus: Tekoälymallit sisältävät usein arkaluontoisia immateriaalioikeuksia, joten asetamme tämän omaisuuden suojaamisen erittäin tärkeäksi. Suodatushyökkäysten avulla hyökkääjät voivat varastaa mallin tietoja, kuten sen arkkitehtuuria tai painoja. |
Hyökkäykset, joissa luottamuksellisen/omistusoikeudellisen mallin tarkka arkkitehtuuri tai painot erotetaan. |
|
Hyökkäykset, joissa arkkitehtuuria ja painotuksia ei eroteta tarkasti tai kun ne on poimittu ei-luottamuksellisesta mallista. |
Soveltamisalan ulkopuolella |
|
Jos huomaat tekoälyllä toimivassa työkalussa jonkin muun kuin yllä mainitun vian, voit silti lähettää sen edellyttäen, että se täyttää ohjelmasivullamme luetellut pätevyydet. |
Virhe tai käyttäytyminen, joka selvästi täyttää kelvollisen tietoturva- tai väärinkäyttöongelman vaatimukset. |
|
Tekoälytuotteen käyttäminen mahdollisesti haitallisen asian tekemiseen, mikä on jo mahdollista muilla työkaluilla. Esimerkiksi avoimen lähdekoodin ohjelmiston haavoittuvuuden löytäminen (jo mahdollista käyttämällä julkisesti saatavilla olevia staattisen analyysin työkalut) ja tuottaa vastauksen haitalliseen kysymykseen, kun vastaus on jo saatavilla verkossa. |
Soveltamisalan ulkopuolella |
|
Ohjelmamme mukaisesti ongelmat, joista jo tiedämme, eivät ole oikeutettuja palkkioon. |
Soveltamisalan ulkopuolella |
|
Mahdolliset tekijänoikeusongelmat – havainnot, joissa tuotteet palauttavat tekijänoikeudella suojattua sisältöä. Googlen luovilla tekoälytuotteilla on jo oma raportointikanava tämäntyyppisille sisältöongelmille. |
Soveltamisalan ulkopuolella |
Uskomme, että bug bounty -ohjelmamme laajentaminen tekoälyjärjestelmiimme tukee vastuullinen AI-innovaatio, ja odotamme innolla työmme jatkamista tutkimusyhteisön kanssa löytääksemme ja korjataksemme tietoturva- ja väärinkäyttöongelmia tekoälypohjaisissa ominaisuuksissamme. Jos löydät vaatimukset täyttävän ongelman, siirry Bug Hunters -verkkosivustollemme ja lähetä meille virheraporttisi ja – jos ongelma todetaan oikeaksi – saat palkinnon siitä, että autat meitä pitämään käyttäjiemme turvassa.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://www.darkreading.com/vulnerabilities-threats/establishing-reward-criteria-for-reporting-bugs-in-ai-products
- :On
- :ei
- $ YLÖS
- 26
- 32
- 33
- 35%
- 36
- 41
- 7
- 8
- 9
- a
- pystyy
- Meistä
- edellä
- hyväksikäyttö
- väärin
- Mukaan
- Tili
- osoite
- käsitellään
- ennakot
- kontradiktorisen
- vaikuttaa
- vaikuttaa
- vastaan
- AI
- AI-mallit
- AI-järjestelmät
- AI-käyttöinen
- sallia
- jo
- Myös
- määrät
- an
- analyysi
- ja
- vastaus
- Kaikki
- Hakemus
- arkkitehtuuri
- OVAT
- AS
- Varat
- At
- hyökkäys
- Hyökkäykset
- saatavissa
- Takaportteja
- perustua
- BE
- käyttäytyminen
- Uskoa
- Paremmin
- palkkio
- palkkio-ohjelma
- Vika
- bug-palkkio
- Bugs
- mutta
- by
- nimeltään
- CAN
- haasteet
- muuttaa
- Kanava
- luokittelu
- selvästi
- Yhteinen
- yhteisö
- pakottava
- Harkita
- johdonmukainen
- sisältää
- pitoisuus
- jatkuu
- maksut
- ohjaus
- tekijänoikeus
- kriteerit
- leikkaamisreuna
- tiedot
- tietojoukko
- päätökset
- omistautunut
- riippuvainen
- yksityiskohdat
- kehitys
- suoraan
- löytää
- löytö
- do
- ei
- e
- vaivaa
- elementtejä
- oikeutettu
- varmistaa
- perustamisesta
- Eetteri (ETH)
- esimerkki
- Esimerkit
- suodatus
- laajeni
- laajenee
- laajeneminen
- ulkoinen
- uute
- uuttaminen
- mahdollinen
- Ominaisuudet
- Löytää
- löytäminen
- tulokset
- Korjata
- virhe
- jälkeen
- varten
- Eteenpäin
- Edistää
- löytyi
- alkaen
- FT
- Saada
- tuottaa
- generatiivinen
- Generatiivinen AI
- Go
- vahingoittaa
- haitallinen
- Olla
- auttaa
- auttaa
- siten
- Korkea
- erittäin
- kunnia
- Talo
- HTML
- http
- HTTPS
- tunnistettu
- if
- toteuttaa
- tärkeä
- in
- epätarkka
- sisältää
- mukana
- sisältää
- sisältää
- vaikutus
- tiedot
- ensimmäinen
- panos
- tuloa
- henkinen
- tekijänoikeuksien
- tarkoitettu
- tulee
- näkymätön
- kysymys
- kysymykset
- IT
- kohdetta
- SEN
- jpg
- heinäkuu
- Pitää
- Tietää
- vuotaa
- oppinut
- lueteltu
- katso
- tehty
- ylläpitää
- tehdä
- Meets
- jäsenyys
- harhaanjohtava
- malli
- mallit
- lisää
- eniten
- huomata
- of
- usein
- on
- verkossa
- vain
- avata
- avoimen lähdekoodin
- toimi
- or
- Muut
- meidän
- ulostulo
- oma
- omistuksessa
- osa
- polku
- Paikka
- Platon
- Platonin tietotieto
- PlatonData
- Ole hyvä
- mahdollinen
- mahdollisesti
- tarkasti
- valmis
- esittää
- tärkein
- prioriteetti
- menettelyt
- tuottavat
- Tuotteet
- Tuotteemme
- Ohjelma
- ohjeita
- ominaisuudet
- omaisuus
- suojattu
- suojella
- mikäli
- julkisesti
- edellytykset
- ajot
- kysymys
- nopea
- RE
- todellinen maailma
- realistinen
- äskettäin
- punainen
- merkityksellinen
- raportti
- Raportointi
- Raportit
- tutkimus
- tutkimus yhteisön
- vastaus
- vasteet
- tulokset
- palata
- Palkinto
- palkitaan
- säännöt
- s
- turvallista
- skenaario
- laajuus
- turvallisuus
- lähettää
- sensible
- Istunto
- setti
- ankaruus
- So
- Tuotteemme
- jotain
- lähde
- erityinen
- Osavaltio
- Yhä
- antaa
- Onnistuneesti
- niin
- tuki
- järjestelmät
- taulukko
- taktiikka
- Kohde
- joukkue-
- tekniikat
- Technologies
- kuin
- että
- -
- Valtion
- heidän
- Nämä
- ne
- kolmannen osapuolen
- tätä
- että
- työkalu
- työkalut
- koulutus
- laukaista
- tyyppi
- tyypit
- ymmärtää
- Odottamaton
- us
- käyttää
- käytetty
- käyttäjä
- Käyttäjät
- käyttämällä
- pätevä
- Ve
- kautta
- Uhri
- uhrit
- Vierailla
- vapaaehtoinen
- haavoittuvuuksia
- alttius
- Tapa..
- tavalla
- we
- verkko
- Verkkosivu
- olivat
- Mitä
- Mikä on
- kun
- joka
- valkoinen
- Valkoinen talo
- wikipedia
- tulee
- with
- Referenssit
- te
- Sinun
- zephyrnet