In ensimmäinen osa Tässä kolmiosaisessa sarjassa esittelimme ratkaisun, joka osoittaa, kuinka voit automatisoida asiakirjojen peukaloinnin ja petosten havaitsemisen laajassa mittakaavassa käyttämällä AWS AI- ja koneoppimispalveluita asuntolainavakuutusten käyttötapauksissa.
Tässä viestissä esittelemme lähestymistavan syvään oppimiseen perustuvan tietokonenäkömallin kehittämiseen, jotta voidaan havaita ja korostaa väärennettyjä kuvia asuntolainavakuutuksissa. Tarjoamme opastusta syväoppimisverkostojen rakentamiseen, koulutukseen ja käyttöönottoon Amazon Sage Maker.
Osassa 3 näytämme, kuinka ratkaisu otetaan käyttöön Amazonin petosilmaisin.
Ratkaisun yleiskatsaus
Täyttääksemme tavoitteen havaita asiakirjojen peukalointi kiinnityslainoissa käytämme SageMakerissa isännöityä tietokonenäkömallia kuvaväärennösten havaitsemisratkaisussamme. Tämä malli vastaanottaa testikuvan syötteenä ja tuottaa tulostensa väärennösten todennäköisyysennusteen. Verkkoarkkitehtuuri on seuraavan kaavion mukainen.
Kuvan väärentäminen sisältää pääasiassa neljä tekniikkaa: liittäminen, kopiointi-siirto, poistaminen ja parantaminen. Väärennöksen ominaisuuksista riippuen voidaan käyttää erilaisia vihjeitä havaitsemisen ja paikantamisen perustana. Näitä vihjeitä ovat JPEG-pakkausartefaktit, reunojen epäjohdonmukaisuudet, kohinakuviot, värien yhtenäisyys, visuaalinen samankaltaisuus, EXIF-yhteensopivuus ja kameramalli.
Koska kuvaväärennösten havaitseminen on laaja, käytämme Error Level Analysis (ELA) -algoritmia havainnollistavana menetelmänä väärennösten havaitsemiseen. Valitsimme ELA-tekniikan tähän viestiin seuraavista syistä:
- Se on nopeampi toteuttaa ja voi helposti havaita kuvien peukaloinnin.
- Se toimii analysoimalla kuvan eri osien pakkaustasoja. Näin se havaitsee epäjohdonmukaisuudet, jotka voivat viitata peukalointiin – esimerkiksi jos jokin alue kopioitiin ja liitettiin toisesta kuvasta, joka oli tallennettu eri pakkaustasolla.
- Se on hyvä havaitsemaan hienovaraisemman tai saumattoman peukaloinnin, jota voi olla vaikea havaita paljaalla silmällä. Pienetkin muutokset kuvaan voivat aiheuttaa havaittavia pakkauspoikkeavuuksia.
- Se ei perustu siihen, että alkuperäinen muokkaamaton kuva on vertailua varten. ELA voi tunnistaa peukaloinnin merkit vain itse kyseenalaisen kuvan sisällä. Muut tekniikat vaativat usein muokkaamattoman alkuperäisen vertailun.
- Se on kevyt tekniikka, joka perustuu vain digitaalisten kuvatietojen pakkausartefaktien analysointiin. Se ei riipu erikoistuneesta laitteistosta tai oikeuslääketieteen asiantuntemuksesta. Tämä tekee ELA:sta käytettävissä ensikierron analyysityökaluna.
- Tulostettava ELA-kuva voi korostaa selvästi eroja pakkaustasoissa, jolloin peukaloidut alueet näkyvät selvästi. Tämä antaa jopa ei-asiantuntijalle mahdollisuuden tunnistaa mahdollisen manipuloinnin merkkejä.
- Se toimii monilla kuvatyypeillä (kuten JPEG, PNG ja GIF) ja vaatii vain itse kuvan analysointiin. Muut rikostekniset tekniikat voivat olla rajoitetumpia muotojen tai alkuperäisten kuvien osalta.
Todellisissa skenaarioissa, joissa sinulla voi olla yhdistelmä syöttöasiakirjoja (JPEG, PNG, GIF, TIFF, PDF), suosittelemme ELA:n käyttämistä yhdessä useiden muiden menetelmien, kuten esim. havaita epäjohdonmukaisuuksia reunoissa, melukuvioita, värin tasaisuus, EXIF-tietojen johdonmukaisuus, kameran mallin tunnistaminenja fontin yhtenäisyys. Pyrimme päivittämään tämän viestin koodin lisäväärennösten havaitsemistekniikoilla.
ELA:n perustana oletetaan, että syöttökuvat ovat JPEG-muodossa, joka tunnetaan häviöisestä pakkauksestaan. Menetelmä voi kuitenkin olla tehokas, vaikka syöttökuvat olisivat alun perin häviöttömässä muodossa (kuten PNG, GIF tai BMP) ja muutettu myöhemmin JPEG-muotoon peukaloinnin aikana. Kun ELA:ta käytetään alkuperäisiin häviöttömiin muotoihin, se osoittaa yleensä tasaisen kuvanlaadun ilman heikkenemistä, mikä tekee muuttuneiden alueiden paikantamisesta haastavaa. JPEG-kuvissa oletetaan, että koko kuvassa on samanlainen pakkaustaso. Kuitenkin, jos kuvan tietyssä osassa näkyy selvästi erilainen virhetaso, se viittaa usein siihen, että digitaalinen muutos on tehty.
ELA korostaa eroja JPEG-pakkaussuhteessa. Alueilla, joilla on tasainen väritys, on todennäköisesti pienempi ELA-tulos (esimerkiksi tummempi väri verrattuna suurikontrastisiin reunoihin). Tarkasteltavat asiat peukaloinnin tai muuntamisen tunnistamiseksi ovat seuraavat:
- Samanlaisilla reunoilla tulisi olla sama kirkkaus ELA-tuloksessa. Kaikkien suurikontrastisten reunojen tulee näyttää samanlaisilta toistensa kanssa ja kaikkien matalakontrastisten reunojen tulee näyttää samanlaisilta. Alkuperäisessä valokuvassa matalakontrastisten reunojen tulee olla melkein yhtä kirkkaita kuin suuren kontrastin reunojen.
- Samanlaisilla tekstuureilla tulisi olla samanlainen väritys ELA:n alla. Alueilla, joissa on enemmän pintayksityiskohtia, kuten lähikuva koripallosta, on todennäköisesti korkeampi ELA-tulos kuin sileällä pinnalla.
- Riippumatta pinnan todellisesta väristä, kaikilla tasaisilla pinnoilla tulee olla suunnilleen sama väritys ELA:n mukaan.
JPEG-kuvat käyttävät häviöllistä pakkausjärjestelmää. Jokainen kuvan uudelleenkoodaus (uudelleentallennus) lisää kuvan laadun heikkenemistä. Erityisesti JPEG-algoritmi toimii 8 × 8 pikselin ruudukossa. Jokainen 8 × 8 -ruutu puristetaan itsenäisesti. Jos kuva on täysin muokkaamaton, niin kaikilla 8×8 neliöillä tulee olla samanlaiset virhemahdollisuudet. Jos kuvaa ei ole muokattu ja se tallennetaan uudelleen, jokaisen neliön tulee heikentyä suunnilleen samalla nopeudella.
ELA tallentaa kuvan määritetyllä JPEG-laatutasolla. Tämä uudelleentallennus aiheuttaa tunnetun määrän virheitä koko kuvassa. Uudelleen tallennettua kuvaa verrataan sitten alkuperäiseen kuvaan. Jos kuvaa muokataan, jokaisen 8×8 neliön, jota muokkaus kosketti, tulee olla suurempi virhepotentiaali kuin muulla kuvalla.
ELA:n tulokset riippuvat suoraan kuvanlaadusta. Haluat ehkä tietää, onko jotain lisätty, mutta jos kuva kopioidaan useita kertoja, ELA saattaa sallia vain uudelleentallennusten havaitsemisen. Yritä löytää kuvan laadukkain versio.
Koulutuksen ja harjoittelun avulla ELA voi myös oppia tunnistamaan kuvan skaalaus, laatu, rajaus ja muunnokset uudelleen. Jos esimerkiksi ei-JPEG-kuva sisältää näkyviä ruudukkoviivoja (1 pikselin leveys 8×8 neliössä), se tarkoittaa, että kuva aloitettiin JPEG-muodossa ja muutettiin ei-JPEG-muotoon (kuten PNG). Jos joiltakin kuvan alueilta puuttuu ruudukkoviivoja tai ruudukkoviivat siirtyvät, se tarkoittaa liitosta tai piirrettyä osaa ei-JPEG-kuvassa.
Seuraavissa osissa esittelemme tietokonenäkömallin määrittämisen, koulutuksen ja käyttöönoton vaiheet.
Edellytykset
Jos haluat seurata tätä viestiä, täytä seuraavat edellytykset:
- Onko sinulla AWS-tili.
- Perustaa Amazon SageMaker Studio. Voit käynnistää SageMaker Studion nopeasti käyttämällä oletusasetuksia, mikä helpottaa nopeaa käynnistystä. Lisätietoja on kohdassa Amazon SageMaker yksinkertaistaa Amazon SageMaker Studion asennusta yksittäisille käyttäjille.
- Avaa SageMaker Studio ja käynnistä järjestelmäpääte.
- Suorita seuraava komento terminaalissa:
git clone https://github.com/aws-samples/document-tampering-detection.git
- SageMaker Studion käytön kokonaiskustannukset yhdelle käyttäjälle ja kannettavan ympäristön kokoonpanot ovat 7.314 USD per tunti.
Aseta malliharjoittelumuistikirja
Suorita seuraavat vaiheet määrittääksesi harjoitusmuistikirjan:
- Avaa
tampering_detection_training.ipynb
tiedosto asiakirjan peukaloinnin havaitsemishakemistosta. - Asenna kannettava ympäristö TensorFlow 2.6 Python 3.8 CPU- tai GPU Optimized -kuvalla.
Saatat törmätä riittämättömään saatavuuteen tai saavuttaa AWS-tilisi GPU-instanssien kiintiörajan, kun valitset GPU-optimoituja ilmentymiä. Voit suurentaa kiintiötä siirtymällä Palvelukiintiöt-konsoliin ja suurentamalla tarvitsemasi ilmentymätyypin palvelurajaa. Tällaisissa tapauksissa voit myös käyttää CPU-optimoitua kannettavaa ympäristöä. - varten Ydin, valitse Python3.
- varten Ilmentymän tyyppi, valitse ml.m5d.24xlarge tai muu iso tapaus.
Valitsimme suuremman ilmentymän tyypin vähentääksemme mallin koulutusaikaa. ml.m5d.24xlarge kannettavan ympäristön kanssa tunnin hinta on 7.258 USD per tunti.
Suorita harjoitusmuistikirja
Suorita muistikirjan jokainen solu tampering_detection_training.ipynb
järjestyksessä. Keskustelemme joistakin soluista yksityiskohtaisemmin seuraavissa osissa.
Valmistele tietojoukko alkuperäisten ja peukaloitujen kuvien luettelolla
Ennen kuin suoritat seuraavan solun muistikirjassa, valmistele tietojoukko alkuperäisistä ja peukaloiduista asiakirjoista liiketoimintavaatimustesi perusteella. Tässä viestissä käytämme näyteaineistoa peukaloiduista maksutaulukoista ja tiliotteista. Tietojoukko on saatavilla kuvahakemistossa GitHub-arkisto.
Muistikirja lukee alkuperäiset ja peukaloidut kuvat images/training
hakemistoon.
Harjoittelun tietojoukko luodaan CSV-tiedostolla, jossa on kaksi saraketta: polku kuvatiedostoon ja kuvan nimi (0 alkuperäiselle kuvalle ja 1 peukaloidulle kuvalle).
Käsittele tietojoukko luomalla kunkin harjoituskuvan ELA-tulokset
Tässä vaiheessa luomme syötetyn harjoituskuvan ELA-tuloksen (90 %:n laadulla). Toiminto convert_to_ela_image
ottaa kaksi parametria: polku, joka on polku kuvatiedostoon, ja laatu, joka edustaa JPEG-pakkauksen laatuparametria. Toiminto suorittaa seuraavat vaiheet:
- Muunna kuva RGB-muotoon ja tallenna se uudelleen JPEG-tiedostona määritetyllä laadulla nimellä tempresaved.jpg.
- Laske alkuperäisen kuvan ja uudelleen tallennetun JPEG-kuvan (ELA) välinen ero määrittääksesi pikseliarvojen enimmäiseron alkuperäisen ja uudelleen tallennettujen kuvien välillä.
- Säädä ELA-kuvan kirkkautta laskemalla skaalauskerroin enimmäiseron perusteella.
- Paranna ELA-kuvan kirkkautta käyttämällä laskettua skaalaustekijää.
- Muuta ELA-tuloksen koko 128 x 128 x 3:een, jossa 3 edustaa kanavien määrää, joka pienentää harjoituksen syötekokoa.
- Palauta ELA-kuva.
Häviöllisissä kuvamuodoissa, kuten JPEG, alkuperäinen tallennusprosessi johtaa huomattavaan värihäviöön. Kuitenkin, kun kuva ladataan ja sen jälkeen koodataan uudelleen samaan häviölliseen muotoon, värin heikkeneminen lisääntyy yleensä vähemmän. ELA-tulokset korostavat kuva-alueita, jotka ovat alttiimpia värin heikkenemiselle uudelleen tallennettaessa. Yleensä muutokset näkyvät näkyvästi alueilla, joilla on suurempi hajoamispotentiaali verrattuna muuhun kuvaan.
Seuraavaksi kuvat käsitellään NumPy-taulukkoon harjoittelua varten. Jaoimme sitten syötetietojoukon satunnaisesti koulutus- ja testi- tai validointitietoihin (80/20). Voit ohittaa kaikki varoitukset suorittaessasi näitä soluja.
Tietojoukon koosta riippuen näiden solujen suorittaminen saattaa viedä aikaa. Tässä arkistossa tarjoamamme esimerkkitietojoukon käsittely voi kestää 5–10 minuuttia.
Määritä CNN-malli
Tässä vaiheessa rakennamme VGG-verkon minimaalisen version pienillä konvoluutiosuodattimilla. VGG-16 koostuu 13 konvoluutiokerroksesta ja kolmesta täysin yhdistetystä kerroksesta. Seuraava kuvakaappaus havainnollistaa konvoluutiohermoverkkomallimme (CNN) arkkitehtuuria.
Huomaa seuraavat kokoonpanot:
- panos – Malli ottaa kuvan sisääntulokoon 128x128x3.
- Konvoluutiokerrokset – Konvoluutiotasot käyttävät minimaalista reseptiivikenttää (3×3), pienintä mahdollista kokoa, joka silti kaappaa ylös/alas ja vasemmalle/oikealle. Tätä seuraa Rectified Linear Unit (ReLU) -aktivointitoiminto, joka vähentää harjoitusaikaa. Tämä on lineaarinen funktio, joka tulostaa tulon, jos se on positiivinen; muuten lähtö on nolla. Konvoluutioaskel on kiinteä oletusarvo (1 pikseli), jotta tilaresoluutio säilyy konvoluution jälkeen (askel on pikselien siirtymien määrä syöttömatriisin yli).
- Täysin yhdistetyt kerrokset – Verkossa on kaksi täysin yhdistettyä kerrosta. Ensimmäinen tiheä kerros käyttää ReLU-aktivointia, ja toinen käyttää softmaxia kuvan luokittelemiseksi alkuperäiseksi tai peukaloiduksi.
Voit ohittaa kaikki varoitukset suorittaessasi näitä soluja.
Tallenna malliesineet
Tallenna koulutettu malli ainutlaatuisella tiedostonimellä – esimerkiksi nykyisen päivämäärän ja kellonajan perusteella – hakemistoon nimeltä malli.
Malli on tallennettu Keras-muotoon laajennuksen kanssa .keras
. Tallennamme myös mallin artefaktit hakemistona nimeltä 1, joka sisältää sarjoitettuja allekirjoituksia ja niiden suorittamiseen tarvittavan tilan, mukaan lukien muuttuvat arvot ja sanastot käyttöönotettaviksi SageMaker-ajonaikaisesti (jota käsittelemme myöhemmin tässä viestissä).
Mittaa mallin suorituskykyä
Seuraava tappiokäyrä näyttää mallin häviön etenemisen harjoittelujaksojen (iteraatioiden) aikana.
Tappiofunktio mittaa kuinka hyvin mallin ennusteet vastaavat todellisia tavoitteita. Pienemmät arvot osoittavat parempaa linjausta ennusteiden ja todellisten arvojen välillä. Häviön väheneminen aikakausittain tarkoittaa mallin paranemista. Tarkkuuskäyrä kuvaa mallin tarkkuutta harjoituskausien aikana. Tarkkuus on oikeiden ennusteiden suhde ennusteiden kokonaismäärään. Suurempi tarkkuus osoittaa tehokkaamman mallin. Tyypillisesti tarkkuus kasvaa harjoittelun aikana, kun malli oppii kuvioita ja parantaa ennustekykyään. Nämä auttavat sinua määrittämään, onko malli ylisovitettu (toimii hyvin harjoitustiedoissa, mutta huonosti näkymättömissä) vai alisovitus (ei opi tarpeeksi harjoitustiedoista).
Seuraava hämmennysmatriisi esittää visuaalisesti, kuinka hyvin malli erottaa tarkasti positiivisen (väännetty kuva, arvo 1) ja negatiivisen (suunnittelematon kuva, arvo 0) luokan.
Mallikoulutuksen jälkeen seuraava askel on tietokonenäkömallin käyttöönotto API:na. Tämä API integroidaan yrityssovelluksiin osana vakuutustoiminnan työnkulkua. Tämän saavuttamiseksi käytämme täysin hallittua Amazon SageMaker Inference -palvelua. Tämä palvelu integroituu saumattomasti MLOps-työkaluihin, mikä mahdollistaa skaalautuvan mallin käyttöönoton, kustannustehokkaan päättelyn, tehostetun mallinhallinnan tuotannossa ja vähentää toiminnan monimutkaisuutta. Tässä viestissä käytämme mallia reaaliaikaisena päättelypäätepisteenä. On kuitenkin tärkeää huomata, että liiketoimintasovellustesi työnkulusta riippuen mallin käyttöönotto voidaan myös räätälöidä eräkäsittelyksi, asynkroniseksi käsittelyksi tai palvelimettoman käyttöönottoarkkitehtuurin kautta.
Määritä mallin käyttöönottomuistikirja
Suorita seuraavat vaiheet määrittääksesi mallin käyttöönottomuistikirjan:
- Avaa
tampering_detection_model_deploy.ipynb
tiedosto asiakirjan peukaloinnin havaitsemishakemistosta. - Asenna kannettava ympäristö Data Science 3.0:lla.
- varten Ydin, valitse Python3.
- varten Ilmentymän tyyppi, valitse ml. t. väliaine.
ml.t3.medium-kannettavassa ympäristössä tunnin hinta on 0.056 USD.
Luo mukautettu sisäinen käytäntö SageMaker-roolille salliaksesi kaikki Amazon S3 -toiminnot
- AWS-henkilöllisyyden ja käyttöoikeuksien hallinta (IAM) -rooli SageMakerille tulee olemaan muodossa AmazonSageMaker- ExecutionRole-<random numbers>
. Varmista, että käytät oikeaa roolia. Roolin nimi löytyy käyttäjätietojen alta SageMaker-verkkotunnuksen kokoonpanoissa.
Päivitä IAM-rooli sisällyttämällä siihen sisäinen käytäntö, joka sallii kaiken Amazonin yksinkertainen tallennuspalvelu (Amazon S3) -toiminnot. Tämä tarvitaan S3-ryhmien luomisen ja poistamisen automatisoimiseksi, jotka tallentavat mallin artefaktit. Voit rajoittaa pääsyä tiettyihin S3-alueisiin. Huomaa, että käytimme jokerimerkkiä S3-ryhmän nimelle IAM-käytännössä (tamperingdetection*
).
Suorita käyttöönottomuistikirja
Suorita muistikirjan jokainen solu tampering_detection_model_deploy.ipynb
järjestyksessä. Keskustelemme joistakin soluista yksityiskohtaisemmin seuraavissa osissa.
Luo S3-ämpäri
Luo S3-säilö suorittamalla solu. Ämpäri nimetään tamperingdetection<current date time>
ja samalla AWS-alueella kuin SageMaker Studio -ympäristösi.
Luo mallin artefaktiarkisto ja lataa se Amazon S3:een
Luo tar.gz-tiedosto mallin artefakteista. Olemme tallentaneet mallin artefaktit hakemistoon nimeltä 1, joka sisältää sarjoitettuja allekirjoituksia ja niiden suorittamiseen tarvittavan tilan, mukaan lukien muuttuvat arvot ja sanastot käyttöönotettaviksi SageMaker-ajonaikaisesti. Voit myös sisällyttää mukautetun päättelytiedoston nimeltä inference.py
mallin artefaktin koodikansiossa. Mukautettua päättelyä voidaan käyttää syöttökuvan esi- ja jälkikäsittelyyn.
Luo SageMaker-päätelmäpäätepiste
Solun valmistuminen SageMaker-päätelmäpäätepisteen luomiseksi voi kestää muutaman minuutin.
Testaa päättelyn päätepiste
Toiminto check_image
esikäsittelee kuvan ELA-kuvana, lähettää sen SageMaker-päätepisteeseen päätelmiä varten, hakee ja käsittelee mallin ennusteet ja tulostaa tulokset. Malli ottaa syöttökuvan NumPy-taulukon ELA-kuvana ennustaakseen. Ennusteet tulostetaan muodossa 0, joka edustaa muokkaamatonta kuvaa, ja 1, joka edustaa väärennettyä kuvaa.
Esitetään malli, jossa on ehjä kuva palkkatuesta ja tarkistetaan tulos.
Malli tulostaa luokituksen 0, joka edustaa muokkaamatonta kuvaa.
Nyt vedotaan malliin, jossa on peukaloitu kuva palkkalistasta ja tarkistetaan tulos.
Malli tulostaa luokituksen 1, joka edustaa väärennettyä kuvaa.
Rajoitukset
Vaikka ELA on erinomainen työkalu muutosten havaitsemiseen, sillä on useita rajoituksia, kuten seuraavat:
- Yksi pikselin muutos tai pieni värisäätö ei välttämättä aiheuta huomattavaa muutosta ELA:ssa, koska JPEG toimii ruudukossa.
- ELA tunnistaa vain, millä alueilla on erilaiset pakkaustasot. Jos huonompilaatuinen kuva yhdistetään korkealaatuisemmaksi kuvaksi, huonompilaatuinen kuva saattaa näkyä tummempana alueena.
- Kuvan skaalaus, värin muuttaminen tai kohinan lisääminen muokkaa koko kuvaa ja luo korkeamman virhetason mahdollisuuden.
- Jos kuva tallennetaan uudelleen useita kertoja, se voi olla kokonaan minimivirhetasolla, jolloin useat uudelleentallennukset eivät muuta kuvaa. Tässä tapauksessa ELA palauttaa mustan kuvan, eikä muutoksia voida tunnistaa tällä algoritmilla.
- Photoshopilla pelkkä kuvan tallentaminen voi terävöittää tekstuureja ja reunoja automaattisesti, mikä luo korkeamman virhetason mahdollisuuden. Tämä artefakti ei tunnista tarkoituksellista muutosta; se osoittaa, että Adoben tuotetta on käytetty. Teknisesti ELA näkyy muutoksena, koska Adobe teki muutoksen automaattisesti, mutta muutos ei välttämättä ollut käyttäjän tarkoituksellinen.
Suosittelemme ELA:n käyttöä muiden blogissa aiemmin käsiteltyjen tekniikoiden rinnalla, jotta voidaan havaita enemmän kuvankäsittelytapauksia. ELA voi toimia myös itsenäisenä työkaluna kuvien erojen visuaalisessa tarkastelussa, varsinkin kun CNN-pohjaisen mallin harjoittelu on haastavaa.
Puhdistaa
Jos haluat poistaa osana tätä ratkaisua luomasi resurssit, suorita seuraavat vaiheet:
- Suorita muistikirjan solut alla Uudelleenjärjestäminen osio. Tämä poistaa seuraavat tiedot:
- SageMaker-päätelmän päätepiste – Päätepisteen nimi on
tamperingdetection-<datetime>
. - S3-kauhan ja itse S3-kauhan esineet – Kauhan nimi tulee olemaan
tamperingdetection<datetime>
.
- SageMaker-päätelmän päätepiste – Päätepisteen nimi on
- sulkea SageMaker Studion muistikirjan resurssit.
Yhteenveto
Tässä viestissä esittelimme päästä päähän -ratkaisun asiakirjojen peukaloinnin ja petosten havaitsemiseen syväoppimisen ja SageMakerin avulla. Käytimme ELA:ta kuvien esikäsittelyyn ja pakkaustasojen erojen tunnistamiseen, jotka voivat viitata manipulointiin. Sitten koulutimme CNN-mallin tälle käsitellylle tietojoukolle luokittelemaan kuvat alkuperäisiksi tai peukaloiduiksi.
Malli voi saavuttaa vahvan suorituskyvyn yli 95 %:n tarkkuudella yrityksesi vaatimuksiin sopivalla tietojoukolla (taottu ja alkuperäinen). Tämä osoittaa, että se voi luotettavasti havaita väärennetyt asiakirjat, kuten maksulomakkeet ja tiliotteet. Koulutettu malli otetaan käyttöön SageMaker-päätepisteessä, joka mahdollistaa alhaisen latenssin päättelyn mittakaavassa. Integroimalla tämän ratkaisun asuntolainatyönkulkuihin laitokset voivat automaattisesti merkitä epäilyttävät asiakirjat petosten jatkotutkintaa varten.
Vaikka ELA on tehokas, sillä on joitain rajoituksia tietyntyyppisten hienovaraisempien manipulaatioiden tunnistamisessa. Seuraavina vaiheina mallia voitaisiin parantaa sisällyttämällä koulutukseen lisää rikosteknisiä tekniikoita ja käyttämällä suurempia, monipuolisempia tietojoukkoja. Kaiken kaikkiaan tämä ratkaisu osoittaa, kuinka voit käyttää syväoppimista ja AWS-palveluita tehokkaiden ratkaisujen rakentamiseen, jotka lisäävät tehokkuutta, vähentävät riskejä ja estävät petoksia.
Osassa 3 näytämme, kuinka ratkaisu otetaan käyttöön Amazon Fraud Detectorissa.
Tietoja kirjoittajista
Anup Ravindranath on vanhempi ratkaisuarkkitehti Amazon Web Servicesissä (AWS) Torontossa, Kanadassa ja työskentelee rahoituspalveluorganisaatioiden kanssa. Hän auttaa asiakkaita muuttamaan liiketoimintaansa ja innovoimaan pilvessä.
Vinnie Saini on vanhempi ratkaisuarkkitehti Amazon Web Servicesissä (AWS) Torontossa, Kanadassa. Hän on auttanut Financial Services -asiakkaita muuttumaan pilvessä tekoäly- ja ML-pohjaisilla ratkaisuilla, jotka on asetettu arkkitehtonisen huippuosaamisen vahvoille peruspilareille.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/train-and-host-a-computer-vision-model-for-tampering-detection-on-amazon-sagemaker-part-2/
- :on
- :On
- :ei
- :missä
- $ YLÖS
- 056
- 1
- 100
- 13
- 195
- 258
- 408
- 75
- 8
- 95%
- a
- kyky
- Meistä
- pääsy
- saatavilla
- Tili
- tarkkuus
- tarkasti
- Saavuttaa
- poikki
- Toimia
- toimet
- Aktivointi
- todellinen
- lisä-
- lisää
- lisä-
- Lisää
- säätää
- Säätö
- Adobe
- Jälkeen
- vastaan
- AI
- tavoitteena
- algoritmi
- suuntaus
- Kaikki
- sallia
- mahdollistaa
- melkein
- pitkin
- rinnalla
- Myös
- muuttunut
- Amazon
- Amazonin petosilmaisin
- Amazon Sage Maker
- Amazon SageMaker Studio
- Amazon Web Services
- Amazon Web Services (AWS)
- määrä
- an
- analyysi
- analysoida
- analysointi
- ja
- Toinen
- Kaikki
- api
- näyttää
- näyttää
- sovellukset
- sovellettu
- lähestymistapa
- suunnilleen
- arkkitehtuurin
- arkkitehtuuri
- Archive
- OVAT
- ALUE
- alueet
- Ryhmä
- AS
- olettaa
- At
- automatisoida
- automaattisesti
- saatavuus
- saatavissa
- AWS
- Pankki
- perustua
- Koripallo
- BE
- koska
- tulee
- ollut
- PARAS
- Paremmin
- välillä
- Musta
- Uutiset ja media
- edistää
- Kirkas
- rakentaa
- Rakentaminen
- liiketoiminta
- Business Applications
- yritykset
- mutta
- by
- laskettu
- nimeltään
- kamera
- CAN
- Kanada
- kaappaa
- tapaus
- tapauksissa
- paini
- solu
- Solut
- tietty
- haastava
- muuttaa
- Muutokset
- kanavat
- ominaisuudet
- tarkastaa
- Valita
- luokat
- luokittelu
- luokitella
- selvästi
- pilvi
- CNN
- koodi
- väri
- Pylväät
- yhdistelmä
- verrata
- verrattuna
- vertailu
- täydellinen
- täysin
- monimutkaisuus
- komponentti
- tietokone
- Tietokoneen visio
- konfigurointi
- sekaannus
- yhdessä
- kytketty
- huomattava
- johdonmukainen
- muodostuu
- Console
- rakentaa
- sisältää
- muuntaa
- muunnetaan
- konvoluutiohermoverkko
- korjata
- Hinta
- voisi
- prosessori
- luoda
- luotu
- Luominen
- luominen
- Nykyinen
- käyrä
- asiakassuhde
- Asiakkaat
- tummempi
- tiedot
- tietojenkäsittely
- aineistot
- Päivämäärä
- laskeva
- syvä
- syvä oppiminen
- oletusarvo
- osoittaa
- osoittaa
- tarkoittaa
- tiheä
- riippua
- riippuvainen
- Riippuen
- sijoittaa
- käyttöön
- levityspinnalta
- käyttöönotto
- yksityiskohta
- yksityiskohdat
- havaita
- Detection
- Määrittää
- kehittää
- kaavio
- ero
- erot
- eri
- digitaalinen
- suoraan
- pohtia
- keskusteltiin
- näytöt
- erotetaan
- useat
- do
- asiakirja
- asiakirjat
- ei
- verkkotunnuksen
- laadittu
- ajanut
- aikana
- kukin
- helposti
- reuna
- Tehokas
- tehokkuus
- painottaa
- käyttämällä
- mahdollistaa
- mahdollistaa
- päittäin
- päätepiste
- tehostettu
- lisälaite
- tarpeeksi
- Koko
- täysin
- ympäristö
- aikakausia
- virhe
- virheet
- erityisesti
- Eetteri (ETH)
- Jopa
- Joka
- tutkii
- esimerkki
- Erinomaisuus
- erinomainen
- näyttely
- Näytteilleasettajat
- laaja
- odotettu
- asiantuntemus
- laajentaminen
- silmä
- helpottaminen
- tekijä
- harvat
- ala
- filee
- suodattimet
- taloudellinen
- rahoituspalvelut
- Löytää
- Etunimi
- kiinteä
- tasainen
- seurata
- seurannut
- jälkeen
- varten
- oikeusopillinen
- forensics
- taotut
- muoto
- löytyi
- perusta
- perustava
- neljä
- petos
- alkaen
- täysin
- toiminto
- edelleen
- yleensä
- tuottaa
- synnyttää
- tuottaa
- gif
- mennä
- hyvä
- GPU
- suurempi
- ruudukko
- ohjaus
- HAD
- Käsittely
- Kova
- Tarvikkeet
- Olla
- ottaa
- he
- auttaa
- auttaa
- auttaa
- korkeampi
- Korostaa
- raidat
- Osuma
- isäntä
- isännöi
- tunti
- Miten
- Miten
- Kuitenkin
- HTML
- http
- HTTPS
- IAM
- tunnistettu
- tunnistaa
- tunnistaa
- tunnistaminen
- Identiteetti
- IEEE
- if
- sivuuttaa
- havainnollistaa
- kuva
- kuvien
- vaikuttavia
- toteuttaa
- tärkeä
- parantaa
- parantaminen
- in
- sisältää
- Mukaan lukien
- epäjohdonmukaisuuksia
- sisältävät
- Kasvaa
- Lisäykset
- itsenäinen
- itsenäisesti
- osoittaa
- ilmaisee
- henkilökohtainen
- tiedot
- ensimmäinen
- aloittaa
- innovoida
- panos
- esimerkki
- tapauksia
- laitokset
- integroitu
- integroi
- Integrointi
- tahallinen
- tulee
- esitellä
- Esittelee
- tutkimus
- liittyy
- kysymys
- IT
- toistojen
- SEN
- itse
- jpg
- Pitää
- Keras
- Tietää
- tunnettu
- Merkki
- Lack
- suuri
- suurempi
- myöhemmin
- käynnistää
- kerros
- kerrokset
- Liidit
- OPPIA
- oppiminen
- vähemmän
- Taso
- tasot
- kevyt
- pitää
- todennäköisyys
- Todennäköisesti
- RAJOITA
- rajoitukset
- lineaarinen
- linjat
- Lista
- Localization
- katso
- pois
- alentaa
- kone
- koneoppiminen
- tehty
- pääasiallisesti
- tehdä
- TEE
- Tekeminen
- onnistui
- johto
- Manipulointi
- monet
- ottelu
- Matriisi
- maksimi
- Saattaa..
- välineet
- toimenpiteet
- keskikokoinen
- Tavata
- menetelmä
- menetelmät
- minimi
- minimi
- vähäinen
- pöytäkirja
- ML
- MLOps
- malli
- Muutokset
- muokattu
- muokata
- lisää
- Kiinnitys
- eniten
- moninkertainen
- nimi
- nimetty
- välttämättä
- Tarve
- tarvitaan
- negatiivinen
- verkko
- verkot
- hermo-
- neuroverkkomallien
- silti
- seuraava
- Nro
- Melu
- huomata
- muistikirja
- numero
- numpy
- tavoite
- Ilmeinen
- of
- usein
- on
- ONE
- vain
- toimii
- toiminta-
- optimoitu
- or
- tilata
- organisaatioiden
- alkuperäinen
- alun perin
- Muut
- muuten
- meidän
- tuloksiin
- ulostulo
- lähdöt
- yli
- yleinen
- parametri
- parametrit
- osa
- erityinen
- osat
- polku
- kuviot
- varten
- suorituskyky
- suoritettu
- esittävä
- suorittaa
- kuva
- photoshop
- kuva
- pilarit
- pixel
- Platon
- Platonin tietotieto
- PlatonData
- juoni
- politiikka
- osa
- positiivinen
- mahdollinen
- Kirje
- mahdollinen
- potentiaalit
- voimakas
- harjoitusta.
- ennustus
- Ennusteet
- ennustavan
- Valmistella
- edellytyksiä
- esittää
- esitetty
- säilytetty
- estää
- aiemmin
- tulosteet
- prosessi
- jalostettu
- Prosessit
- käsittely
- Tuotteet
- tuotanto
- eteneminen
- toimittaa
- mikäli
- Python
- laatu
- kyseenalaiseksi
- nopeammin
- satunnainen
- alue
- nopea
- hinta
- suhde
- todellinen maailma
- reaaliaikainen
- valtakunta
- syistä
- vastaanottaa
- tunnistaa
- suositella
- hiotut
- vähentää
- Vähentynyt
- vähentää
- katso
- alue
- alueet
- jatkaminen
- luottaa
- poistaminen
- poistaa
- mallinnus
- säilytyspaikka
- edustettuina
- edustavat
- edustaa
- edellyttää
- tarvitaan
- vaatimukset
- Vaatii
- päätöslauselma
- Esittelymateriaalit
- REST
- rajoitettu
- johtua
- tulokset
- palata
- RGB
- Riski
- Rooli
- ajaa
- juoksu
- sagemaker
- SageMaker-johtopäätös
- sama
- Esimerkkitietojoukko
- Säästä
- tallennettu
- tallentaa
- skaalautuva
- Asteikko
- skaalaus
- skenaariot
- tiede
- saumaton
- saumattomasti
- Toinen
- Osa
- osiot
- valittu
- valitsemalla
- lähettää
- vanhempi
- Sarjat
- palvella
- serverless
- palvelu
- Palvelut
- setti
- setup
- hän
- siirtää
- Vuorot
- shouldnt
- Näytä
- allekirjoitukset
- merkitsee
- Signs
- samankaltainen
- Yksinkertainen
- yksinkertaistetaan
- single
- Koko
- pieni
- sujuvaa
- ratkaisu
- Ratkaisumme
- jonkin verran
- jotain
- tila-
- erikoistunut
- erityinen
- erityisesti
- määritelty
- jakaa
- Kaupallinen
- neliö
- neliöitä
- alkoi
- Osavaltio
- lausuntoja
- Vaihe
- Askeleet
- Yhä
- Levytila
- verkkokaupasta
- harppaus
- vahva
- studio
- Myöhemmin
- niin
- Ehdottaa
- varma
- pinta
- herkkä
- epäilyttävä
- nopeasti
- järjestelmä
- Räätälöity
- ottaa
- vie
- tavoitteet
- teknisesti
- tekniikka
- tekniikat
- tensorflow
- terminaali
- testi
- Testaus
- kuin
- että
- -
- Valtion
- heidän
- Niitä
- sitten
- Siellä.
- Nämä
- asiat
- tätä
- kolmella
- Kautta
- aika
- kertaa
- että
- työkalu
- työkalut
- toronto
- Yhteensä
- liikuttunut
- Juna
- koulutettu
- koulutus
- Muuttaa
- muunnokset
- totta
- yrittää
- kaksi
- tyyppi
- tyypit
- tyypillisesti
- varten
- taustalla oleva
- merkintäsitoumukset
- unique
- yksikkö
- Päivitykset
- päälle
- USD
- käyttää
- käyttölaukku
- käytetty
- käyttäjä
- käyttötarkoituksiin
- käyttämällä
- validointi
- arvo
- arvot
- muuttuja
- eri
- versio
- näkyvä
- visio
- Vierailla
- visuaalinen
- visuaalisesti
- haluta
- oli
- we
- verkko
- verkkopalvelut
- HYVIN
- olivat
- Mitä
- kun
- joka
- leveä
- tulee
- with
- sisällä
- ilman
- työnkulku
- työnkulkuja
- työskentely
- toimii
- te
- Sinun
- zephyrnet
- nolla-