Ontwikkel een automatische beoordelingsbeeldinspectieservice met Amazon SageMaker

Heruitgegeven door Plato

volgers: 0

Dit is een gastpost van Jihye Park, een datawetenschapper bij MUSINSA.

MUSINSA is een van de grootste online modeplatforms in Zuid-Korea, bedient 8.4 miljoen klanten en verkoopt 6,000 modemerken. Ons maandelijkse gebruikersverkeer bereikt 4 miljoen, en meer dan 90% van onze demografie bestaat uit tieners en jonge volwassenen die gevoelig zijn voor modetrends. MUSINSA is een toonaangevende platformleider in het land, toonaangevend met enorme hoeveelheden gegevens.

Het MUSINSA Data Solution Team houdt zich bezig met alles wat te maken heeft met gegevens verzameld uit de MUSINSA Store. We doen volledige ontwikkeling, van logverzameling tot datamodellering en modelserving. We ontwikkelen verschillende op data gebaseerde producten, waaronder de Live Product Recommendation Service op de hoofdpagina van onze app en de Keyword Highlighting Service die woorden zoals 'grootte' of 'tevredenheidsniveau' uit tekstrecensies detecteert en markeert.

Uitdagingen bij het automatische beoordelingsproces voor beeldinspectie

De kwaliteit en kwantiteit van klantrecensies zijn van cruciaal belang voor e-commercebedrijven, omdat klanten aankoopbeslissingen nemen zonder de producten persoonlijk te zien. We geven credits aan degenen die beeldrecensies schrijven over de producten die ze hebben gekocht (dat wil zeggen recensies met foto's van de producten of foto's waarop ze de producten dragen/gebruiken) om de klantervaring te verbeteren en het aankoopconversiepercentage te verhogen. Om te bepalen of de ingezonden foto's aan onze creditcriteria voldoen, worden alle foto's individueel door mensen geïnspecteerd. Onze criteria stellen bijvoorbeeld dat een ‘Stijlrecensie’ foto’s moet bevatten van het hele lichaam van een persoon die het product draagt/gebruikt, terwijl een ‘Productrecensie’ een volledige opname van het product moet bieden. De volgende afbeeldingen tonen voorbeelden van een Product Review en een Stijl Review. Voor het gebruik van de foto's is toestemming van de uploaders verleend.

Voorbeelden van productbeoordelingen.

Voorbeelden van stijlrecensie.

Dagelijks worden er meer dan 20,000 foto's geüpload naar het MUSINSA Store-platform die inspectie vereisen. Het inspectieproces classificeert afbeeldingen als 'pakket', 'product', 'volledige lengte' of 'halve lengte'. Het beeldinspectieproces is volledig handmatig, dus het was extreem tijdrovend en classificaties worden vaak door verschillende personen verschillend uitgevoerd, zelfs met de richtlijnen. Geconfronteerd met deze uitdaging, gebruikten we Amazon Sage Maker om deze taak te automatiseren.

Amazon SageMaker is een volledig beheerde service voor het bouwen, trainen en implementeren van machine learning (ML)-modellen voor elk gebruiksscenario met volledig beheerde infrastructuur, tools en workflows. Hierdoor konden we de geautomatiseerde beeldinspectieservice snel implementeren, met goede resultaten.

We zullen gedetailleerd ingaan op de manier waarop we onze problemen hebben aangepakt met behulp van ML-modellen en hoe we gaandeweg Amazon SageMaker hebben gebruikt.

Automatisering van het beoordelingsproces voor beeldinspectie

De eerste stap in de richting van het automatiseren van het Image Review Inspection-proces was het handmatig labelen van afbeeldingen, waardoor ze werden gekoppeld aan de juiste categorieën en inspectiecriteria. We hebben afbeeldingen bijvoorbeeld geclassificeerd als 'foto van het hele lichaam', 'foto van het bovenlichaam', 'opname van de verpakking', 'productfoto', enz. In het geval van een productrecensie werden alleen credits gegeven voor een productfoto. Op dezelfde manier werden in het geval van een Style Review credits gegeven voor een full body shot.

Wat betreft beeldclassificatie waren we grotendeels afhankelijk van een vooraf getraind convolutioneel neuraal netwerk (CNN) model vanwege het enorme volume aan invoerbeelden dat nodig was om ons model te trainen. Hoewel het definiëren en categoriseren van betekenisvolle kenmerken uit afbeeldingen cruciaal is voor het trainen van een model, kan een afbeelding een onbeperkt aantal kenmerken hebben. Daarom was het gebruik van het CNN-model het meest logisch, en we hebben ons model vooraf getraind met meer dan 10,000 ImageNet-datasets, en vervolgens hebben we transfer learning gebruikt. Dit betekende dat ons model later effectiever kon worden getraind met onze afbeeldingslabels.

Beeldcollectie met Amazon SageMaker Ground Truth

Transferleren had echter zijn eigen beperkingen, omdat een model opnieuw op hogere lagen moet worden getraind. Dit betekent dat er voortdurend invoerafbeeldingen nodig waren. Aan de andere kant presteerde deze methode goed en vereiste er minder invoerafbeeldingen bij training op hele lagen. Het identificeerde gemakkelijk kenmerken uit afbeeldingen uit deze lagen, omdat het al was getraind met een enorme hoeveelheid gegevens. Bij MUSINSA draait onze volledige infrastructuur op AWS en slaan we door klanten geüploade foto's op Amazon eenvoudige opslagservice (S3). We hebben deze afbeeldingen in verschillende mappen gecategoriseerd op basis van de labels die we hebben gedefinieerd, en we hebben Amazon SageMaker Ground Truth gebruikt om de volgende redenen:

Meer consistente resultaten – Bij handmatige processen kan een enkele fout van een inspecteur zonder enige tussenkomst in de modeltraining worden ingevoerd. Met SageMaker Ground Truth kunnen we verschillende inspecteurs dezelfde afbeelding laten beoordelen en ervoor zorgen dat de input van de meest betrouwbare inspecteur hoger wordt gewaardeerd voor het labelen van afbeeldingen, wat tot betrouwbaardere resultaten leidt.
Minder handmatig werk – SageMaker Ground Truth geautomatiseerde gegevenslabeling kan worden toegepast met een betrouwbaarheidsscoredrempel, zodat afbeeldingen die niet met vertrouwen machinaal kunnen worden gelabeld, worden verzonden voor menselijke labeling. Dit zorgt voor de beste balans tussen kosten en nauwkeurigheid. Meer informatie vindt u in de Amazon SageMaker Ground Truth-ontwikkelaarsgids.
Met deze methode hebben we het aantal handmatig geclassificeerde afbeeldingen met 43% verminderd. De volgende tabel toont het aantal afbeeldingen dat per iteratie is verwerkt nadat we Ground Truth hebben aangenomen (merk op dat de trainings- en validatiegegevens verzamelde gegevens zijn, terwijl de andere statistieken op per-iteratiebasis zijn).
Resultaten direct laden – Bij het bouwen van modellen in SageMaker kunnen we de resulterende manifestbestanden laden die zijn gegenereerd door SageMaker Ground Truth en deze gebruiken voor training.

Kortom, voor het categoriseren van 10,000 afbeeldingen waren 22 inspecteurs vijf dagen nodig en het kostte $980.

Ontwikkeling van een beeldclassificatiemodel met Amazon SageMaker Studio

We moesten recensieafbeeldingen classificeren als foto's van het hele lichaam, foto's van het bovenlichaam, pakketfoto's, productfoto's en producten in toepasselijke categorieën. Om onze doelen te bereiken hebben we twee modellen overwogen: het op ResNet gebaseerde ingebouwde SageMaker-model en het Op Tensorflow gebaseerd MobileNet. We hebben beide getest op dezelfde testdatasets en ontdekten dat het ingebouwde SageMaker-model nauwkeuriger was, met een F0.98-score van 1 versus 0.88 van het TensorFlow-model. Daarom hebben we gekozen voor het ingebouwde SageMaker-model.

De SageMaker Studio-gebaseerd modeltrainingsproces was als volgt:

Importeer gelabelde afbeeldingen uit SageMaker Ground Truth
Afbeeldingen voorbewerken – afbeelding vergroten of verkleinen
Laad de Ingebouwd Amazon SageMaker-model als Docker-image
Stem hyperparameters af via rasterzoeken
Pas transferleren toe
Stem parameters opnieuw af op basis van trainingsstatistieken
Sla het model op

SageMaker maakte het eenvoudig om het model met slechts één klik te trainen, zonder dat u zich zorgen hoeft te maken over het inrichten en beheren van een vloot servers voor training.

Voor het draaien van hyperparameters hebben we rasterzoeken gebruikt om de optimale waarden van hyperparameters te bepalen, aangezien het aantal trainingslagen (num_layers) en trainingscycli (epochs) tijdens transfer learning had de nauwkeurigheid van ons classificatiemodel beïnvloed.

epochs_list = [5, 10, 15]
num_layers_list = [18, 34, 50] from sagemaker.analytics import TrainingJobAnalytics
metric_df = pd.DataFrame() for i in range(len(epochs_list)): for j in range(len(num_layers_list)): # hyperparameter settings ic.set_hyperparameters(num_layers=num_layers_list[j], use_pretrained_model=1, image_shape = "3,256,256", num_classes=9, num_training_samples=50399, mini_batch_size=128, epochs=epochs_list[i], learning_rate=0.01, precision_dtype='float32') ic.fit(inputs=data_channels, logs=True) latest_job_name = ic.latest_training_job.job_name job_metric = TrainingJobAnalytics(training_job_name=latest_job_name).dataframe() job_metric['epochs'] = epochs_list[i] job_metric['num_layers'] = num_layers_list[j] metric_df = pd.concat([metric_df, job_metric])

Modelserveren met SageMaker Batch Transform en Apache Airflow

Het door ons gebouwde beeldclassificatiemodel vereiste ML-workflows om te bepalen of een recensieafbeelding in aanmerking kwam voor credits. We hebben workflows opgezet met de volgende vier stappen.

Importeer beoordelingsafbeeldingen en metagegevens die automatisch moeten worden beoordeeld
De labels van de afbeeldingen afleiden (gevolgtrekking)
Bepaal of credits moeten worden gegeven op basis van de afgeleide labels
Bewaar de resultatentabel in de productiedatabase

We gebruiken Apache-luchtstroom om dataproductworkflows te beheren. Het is een door Airbnb ontwikkeld workflowplannings- en monitoringplatform dat bekend staat om zijn eenvoudige en intuïtieve web-UI-grafieken. Het ondersteunt Amazon SageMaker, zodat het de met SageMaker Studio ontwikkelde code eenvoudig naar Apache Airflow migreert. Er zijn twee manieren om SageMaker-taken uit te voeren op Apache Airflow:

Amazon SageMaker-operators gebruiken
gebruik Python-operators : Schrijf een Python-functie met Amazon SageMaker Python SDK op Apache Airflow en importeer deze als een opvraagbare parameter

def transform(dt, bucket, training_job, **kwargs): estimator = sagemaker.estimator.Estimator.attach(training_job) transformer = estimator.transformer(instance_count=1, instance_type='ml.m4.xlarge', output_path=f's3://{bucket}/.../dt={dt}', max_payload=1) transformer.transform(data=f's3://{bucket}/.../dt={dt}', data_type='S3Prefix', content_type='application/x-image', split_type='None') transformer.wait() … transform_op = PythonOperator( task_id='transform', dag=dag, provide_context=True, python_callable=transform, op_kwargs={"dt": dt, "bucket": bucket, "training_job": training_job})

De tweede optie laten we onze bestaande Python behouden codes die we al hadden in SageMaker Studio, en we hoefden geen nieuwe grammatica's te leren voor Amazon SageMaker Operators.

We hebben echter wat vallen en opstaan moeten doorstaan, aangezien het de eerste keer was dat we Apache Airflow integreerden met Amazon SageMaker. De lessen die we leerden waren:

Boto3-update: Amazon SageMaker Python SDK versie 2 vereist Boto3 1.14.12 of nieuwer. Daarom moesten we de Boto3-versie van onze bestaande Apache Airflow-omgeving, die zich op 1.13.4 bevond, updaten.
IAM-rol en toestemmingsovername: AWS IAM-rollen die door Apache Airflow worden gebruikt, moesten rollen overnemen die Amazon SageMaker konden uitvoeren.
Netwerk configuratie: Om SageMaker-codes met Apache Airflow uit te voeren, moesten de eindpunten worden geconfigureerd voor netwerkverbindingen. De volgende eindpunten waren gebaseerd op de AWS-regio's en -services die we gebruikten. Voor meer informatie, zie de AWS-website.
1. api.sagemaker.ap-northeast-2.amazonaws.com
2. runtime.sagemaker.ap-northeast-2.amazonaws.com
3. aws.sagemaker.ap-northeast-2.studio

Resultaten

Door de inspectieprocessen voor beoordelingsafbeeldingen te automatiseren, hebben we de volgende bedrijfsresultaten behaald:

Verhoogde werkefficiëntie – Momenteel wordt 76% van de afbeeldingen van de categorieën waarin de service is toegepast automatisch geïnspecteerd met een inspectienauwkeurigheid van 98%.
Consistentie in het geven van credits – Credits worden toegekend op basis van duidelijke criteria. Er waren echter gevallen waarin de kredieten voor vergelijkbare gevallen verschillend werden toegekend vanwege verschillen in de oordelen van de inspecteurs. Het ML-model past de regels consistenter en consistenter toe bij de toepassing van ons kredietbeleid.
Minder menselijke fouten – Elke menselijke betrokkenheid brengt een risico op menselijke fouten met zich mee. We hadden bijvoorbeeld gevallen waarin Style Review-criteria werden gebruikt voor productrecensies. Ons automatische inspectiemodel heeft de risico's op deze menselijke fouten dramatisch verminderd.

We hebben specifiek de volgende voordelen behaald door Amazon SageMaker te gebruiken om het beeldinspectieproces te automatiseren:

Een omgeving gecreëerd waarin we modellen kunnen bouwen en testen via modulaire processen – Wat we het leukst vonden aan Amazon SageMaker is dat het uit modules bestaat. Hierdoor kunnen we eenvoudig en snel services bouwen en testen. In het begin hadden we uiteraard wat tijd nodig om Amazon SageMaker te leren kennen, maar toen we het eenmaal hadden geleerd, konden we het gemakkelijk in onze activiteiten toepassen. Wij zijn van mening dat Amazon SageMaker ideaal is voor bedrijven die snelle serviceontwikkelingen nodig hebben, zoals in het geval van de MUSINSA Store.
Verzamel betrouwbare invoergegevens met Amazon SageMaker Ground Truth – Het verzamelen van inputdata wordt steeds belangrijker dan het modelleren zelf op het gebied van ML. Met de snelle vooruitgang van ML kunnen vooraf getrainde modellen veel beter presteren dan voorheen, en zonder aanvullende afstemming. AutoML heeft ook de noodzaak weggenomen om codes te schrijven voor ML-modellering. Daarom is het vermogen om hoogwaardige invoergegevens te verzamelen belangrijker dan ooit, en het gebruik van labelservices zoals Amazon SageMaker Ground Truth is van cruciaal belang.

Conclusie

In de toekomst zijn we van plan om niet alleen de weergave van modellen te automatiseren, maar ook de modeltraining via automatische batches. We willen dat ons model automatisch de optimale hyperparameters identificeert wanneer nieuwe labels of afbeeldingen worden toegevoegd. Daarnaast zullen we de prestaties van ons model, namelijk terugroepacties en precisie, blijven verbeteren op basis van de eerder genoemde geautomatiseerde trainingsmethode. We zullen onze modeldekking vergroten, zodat deze meer beoordelingsafbeeldingen kan inspecteren, meer kosten kan verlagen en hogere nauwkeurigheid kan bereiken, wat allemaal zal leiden tot een hogere klanttevredenheid.

Voor meer informatie over het gebruik van Amazon Sage Maker Als u uw zakelijke problemen met ML wilt oplossen, gaat u naar de product webpagina. En blijf, zoals altijd, op de hoogte van het laatste nieuws AWS Machine Learning-nieuws hier.

De inhoud en meningen in dit bericht zijn die van de externe auteur en AWS is niet verantwoordelijk voor de inhoud of nauwkeurigheid van dit bericht.

Over de auteurs

Jihye-park is een Data Scientist bij MUSINSA die verantwoordelijk is voor data-analyse en -modellering. Ze werkt graag met alomtegenwoordige gegevens, zoals e-commerce. Haar voornaamste rol is datamodellering, maar ze heeft ook interesse in data-engineering.

Sungmin Kim is een Sr. Solutions Architect bij Amazon Web Services. Hij werkt met startups om oplossingen op AWS te ontwerpen, ontwerpen, automatiseren en bouwen voor hun zakelijke behoeften. Hij is gespecialiseerd in AI/ML en Analytics.

Bron: https://aws.amazon.com/blogs/machine-learning/develop-an-automatic-review-image-inspection-service-with-amazon-sagemaker/

Tijdstempel: 10 januari 2022

Tijdstempel: Juli 30, 2021

Heruitgegeven door Plato

Gebruik geïntegreerde verklaarbaarheidstools en verbeter de modelkwaliteit met Amazon SageMaker Autopilot

Detecteer online transactiefraude met nieuwe Amazon Fraud Detector-functies

Annoteer gegevens van dichte puntenwolken met SageMaker Ground Truth

Workflow voor actief leren voor aangepaste classificatiemodellen van Amazon Comprehend - Deel 1

Bouw uw eigen merkdetectie en zichtbaarheid met behulp van Amazon SageMaker Ground Truth en Amazon Rekognition Custom Labels - Deel 2: Trainings- en analyseworkflows

Pas Amazon Translate-uitvoer aan om te voldoen aan uw domein- en organisatiespecifieke woordenschat

Postprocessing met Amazon Textract: verwerking van tabellen met meerdere pagina's

Analyseer de kans op klantverloop met behulp van oproeptranscriptie en klantprofielen met Amazon SageMaker

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account