Sviluppa un servizio di ispezione automatica delle immagini di revisione con Amazon SageMaker

Ripubblicato da Platone

Seguaci: 0

Questo è un guest post di Jihye Park, un data scientist presso MUSINSA.

MUINSAS è una delle più grandi piattaforme di moda online della Corea del Sud, che serve 8.4 milioni di clienti e vende 6,000 marchi di moda. Il nostro traffico mensile di utenti raggiunge i 4 milioni e oltre il 90% dei nostri dati demografici è costituito da adolescenti e giovani adulti sensibili alle tendenze della moda. MUSINSA è una piattaforma leader di tendenza nel paese, leader con enormi quantità di dati.

Il team MUSINSA Data Solution si occupa di tutto ciò che riguarda i dati raccolti dal MUSINSA Store. Eseguiamo lo sviluppo dello stack completo, dalla raccolta dei log alla modellazione dei dati e al servizio dei modelli. Sviluppiamo vari prodotti basati sui dati, tra cui il servizio di raccomandazione dei prodotti in tempo reale sulla pagina principale della nostra app e il servizio di evidenziazione delle parole chiave che rileva ed evidenzia parole come "dimensione" o "livello di soddisfazione" dalle recensioni di testo.

Sfide nel processo automatizzato di ispezione delle immagini di revisione

La qualità e la quantità delle recensioni dei clienti sono fondamentali per le attività di e-commerce, poiché i clienti prendono decisioni di acquisto senza vedere i prodotti di persona. Diamo crediti a coloro che scrivono recensioni di immagini sui prodotti acquistati (ovvero recensioni con foto dei prodotti o foto di loro che indossano/utilizzano i prodotti) per migliorare l'esperienza del cliente e aumentare il tasso di conversione dell'acquisto. Per determinare se le foto inviate soddisfano i nostri criteri per i crediti, tutte le foto vengono ispezionate individualmente da esseri umani. Ad esempio, i nostri criteri stabiliscono che una "Recensione di stile" dovrebbe contenere foto che ritraggono l'intero corpo di una persona che indossa/utilizza il prodotto mentre una "Recensione di prodotto" dovrebbe fornire una ripresa completa del prodotto. Le immagini seguenti mostrano esempi di revisione del prodotto e revisione dello stile. È stato concesso il consenso degli utenti che hanno caricato le foto per l'utilizzo delle foto.

Esempi di recensione del prodotto.

Esempi di revisione dello stile.

Ogni giorno sulla piattaforma MUSINSA Store vengono caricate oltre 20,000 foto che richiedono un'ispezione. Il processo di ispezione classifica le immagini come "pacchetto", "prodotto", "a figura intera" o "a metà lunghezza". Il processo di ispezione delle immagini è completamente manuale, quindi richiedeva molto tempo e le classificazioni venivano spesso eseguite in modo diverso da individui diversi, anche con le linee guida. Di fronte a questa sfida, abbiamo utilizzato Amazon Sage Maker per automatizzare questo compito.

Amazon SageMaker è un servizio completamente gestito per la creazione, la formazione e la distribuzione di modelli di machine learning (ML) per qualsiasi caso d'uso con infrastruttura, strumenti e flussi di lavoro completamente gestiti. Ci ha permesso di implementare rapidamente il servizio di ispezione automatizzata delle immagini con buoni risultati.

Entreremo nei dettagli su come abbiamo affrontato i nostri problemi utilizzando modelli ML e utilizzando Amazon SageMaker lungo il percorso.

Automazione del processo di ispezione delle immagini di revisione

Il primo passo verso l'automazione del processo di revisione e ispezione delle immagini è stato quello di etichettare manualmente le immagini, abbinandole così alle categorie e ai criteri di ispezione appropriati. Ad esempio, abbiamo classificato le immagini come "scatto di tutto il corpo", "scatto della parte superiore del corpo", "scatto della confezione", "scatto del prodotto", ecc. Nel caso di una recensione del prodotto, i crediti sono stati assegnati solo per l'immagine dello scatto del prodotto. Allo stesso modo, nel caso di una revisione dello stile, i crediti venivano assegnati per una ripresa a corpo intero.

Per quanto riguarda la classificazione delle immagini, siamo dipesi in gran parte da un modello di rete neurale convoluzionale (CNN) pre-addestrato a causa dell'enorme volume di immagini di input necessarie per addestrare il nostro modello. Sebbene la definizione e la categorizzazione delle caratteristiche significative delle immagini siano fondamentali per l'addestramento di un modello, un'immagine può avere un numero illimitato di caratteristiche. Pertanto, l'utilizzo del modello CNN era la soluzione più sensata e abbiamo pre-addestrato il nostro modello con oltre 10,000 set di dati ImageNet, quindi abbiamo utilizzato l'apprendimento del trasferimento. Ciò significava che il nostro modello poteva essere addestrato in modo più efficace con le nostre etichette di immagine in un secondo momento.

Raccolta di immagini con Amazon SageMaker Ground Truth

Tuttavia, il trasferimento dell’apprendimento aveva i suoi limiti, perché un modello doveva essere nuovamente addestrato su livelli più alti. Ciò significa che richiedeva costantemente immagini di input. D'altro canto, questo metodo ha funzionato bene e ha richiesto meno immagini di input se addestrato su interi livelli. Ha identificato facilmente le caratteristiche dalle immagini di questi livelli perché era già stato addestrato con un'enorme quantità di dati. In MUSINSA, la nostra intera infrastruttura funziona su AWS e archiviamo le foto caricate dai clienti Amazon Simple Storage Service (S3). Abbiamo classificato queste immagini in cartelle diverse in base alle etichette che abbiamo definito e abbiamo utilizzato Amazon SageMaker Ground Truth per i seguenti motivi:

Risultati più coerenti – Nei processi manuali, l'errore di un singolo ispettore potrebbe essere inserito nella formazione modello senza alcun intervento. Con SageMaker Ground Truth, potremmo chiedere a diversi ispettori di esaminare la stessa immagine e assicurarci che gli input dell'ispettore più affidabile siano stati valutati più in alto per l'etichettatura delle immagini, portando così a risultati più affidabili.
Meno lavoro manuale – L’etichettatura automatizzata dei dati di SageMaker Ground Truth può essere applicata con una soglia di punteggio di confidenza in modo che tutte le immagini che non possono essere etichettate con sicurezza tramite macchina vengano inviate per l’etichettatura umana. Ciò garantisce il miglior equilibrio tra costi e precisione. Maggiori informazioni sono disponibili in Guida per gli sviluppatori di Amazon SageMaker Ground Truth.
Utilizzando questo metodo, abbiamo ridotto del 43% il numero di immagini classificate manualmente. La tabella seguente mostra il numero di immagini elaborate per iterazione dopo aver adottato Ground Truth (nota che i dati di addestramento e convalida sono dati accumulati, mentre gli altri parametri sono su base per iterazione).
Carica direttamente i risultati – Durante la creazione di modelli in SageMaker, potremmo caricare i file manifest risultanti generati da SageMaker Ground Truth e utilizzarli per l'addestramento.

In sintesi, la categorizzazione di 10,000 immagini ha richiesto 22 ispettori, cinque giorni e un costo di 980 dollari.

Sviluppo del modello di classificazione delle immagini con Amazon SageMaker Studio

Avevamo bisogno di classificare le immagini delle recensioni come scatti di tutto il corpo, scatti della parte superiore del corpo, scatti di confezioni, scatti di prodotti e prodotti in categorie applicabili. Per raggiungere i nostri obiettivi, abbiamo considerato due modelli: il modello integrato SageMaker basato su ResNet e il MobileNet basato su Tensorflow. Li abbiamo testati entrambi sugli stessi set di dati di test e abbiamo scoperto che il modello integrato di SageMaker era più accurato, con un punteggio F0.98 di 1 contro 0.88 del modello TensorFlow. Pertanto, abbiamo deciso per il modello integrato SageMaker.

I Sage Maker StudioIl processo di formazione del modello basato è stato il seguente:

Importa immagini etichettate da SageMaker Ground Truth
Preelaborazione delle immagini: ridimensionamento e aumento delle immagini
Carica il Modello integrato di Amazon SageMaker come immagine Docker
Ottimizza gli iperparametri tramite la ricerca nella griglia
Applicare l'apprendimento del trasferimento
Risintonizza i parametri in base alle metriche di allenamento
Salva il modello

SageMaker ha reso semplice l'addestramento del modello con un solo clic e senza preoccuparsi del provisioning e della gestione di una flotta di server per l'addestramento.

Per la rotazione degli iperparametri, abbiamo utilizzato la ricerca su griglia per determinare i valori ottimali degli iperparametri, come il numero di livelli di addestramento (num_layers) e cicli di formazione (epochs) durante il trasferimento dell'apprendimento aveva influito sull'accuratezza del nostro modello di classificazione.

epochs_list = [5, 10, 15]
num_layers_list = [18, 34, 50] from sagemaker.analytics import TrainingJobAnalytics
metric_df = pd.DataFrame() for i in range(len(epochs_list)): for j in range(len(num_layers_list)): # hyperparameter settings ic.set_hyperparameters(num_layers=num_layers_list[j], use_pretrained_model=1, image_shape = "3,256,256", num_classes=9, num_training_samples=50399, mini_batch_size=128, epochs=epochs_list[i], learning_rate=0.01, precision_dtype='float32') ic.fit(inputs=data_channels, logs=True) latest_job_name = ic.latest_training_job.job_name job_metric = TrainingJobAnalytics(training_job_name=latest_job_name).dataframe() job_metric['epochs'] = epochs_list[i] job_metric['num_layers'] = num_layers_list[j] metric_df = pd.concat([metric_df, job_metric])

Creazione di modelli con SageMaker Batch Transform e Apache Airflow

Il modello di classificazione delle immagini che abbiamo creato richiedeva flussi di lavoro ML per determinare se un'immagine di revisione era idonea per i crediti. Abbiamo stabilito flussi di lavoro con i seguenti quattro passaggi.

Importa immagini e metadati di revisione che devono essere revisionati automaticamente
Dedurre le etichette delle immagini (inferenza)
Determinare se i crediti devono essere assegnati in base alle etichette dedotte
Archiviare la tabella dei risultati nel database di produzione

Stiamo utilizzando Flusso d'aria Apache per gestire i flussi di lavoro dei prodotti dati. Si tratta di una piattaforma di pianificazione e monitoraggio del flusso di lavoro sviluppata da Airbnb nota per i grafici dell'interfaccia utente Web semplici e intuitivi. Supporta Amazon SageMaker, quindi migra facilmente il codice sviluppato con SageMaker Studio su Apache Airflow. Esistono due modi per eseguire lavori SageMaker su Apache Airflow:

Utilizzo degli operatori Amazon SageMaker
utilizzando Operatori Python : Scrivi una funzione Python con Amazon SageMaker Python SDK su Apache Airflow e importala come parametro richiamabile

def transform(dt, bucket, training_job, **kwargs): estimator = sagemaker.estimator.Estimator.attach(training_job) transformer = estimator.transformer(instance_count=1, instance_type='ml.m4.xlarge', output_path=f's3://{bucket}/.../dt={dt}', max_payload=1) transformer.transform(data=f's3://{bucket}/.../dt={dt}', data_type='S3Prefix', content_type='application/x-image', split_type='None') transformer.wait() … transform_op = PythonOperator( task_id='transform', dag=dag, provide_context=True, python_callable=transform, op_kwargs={"dt": dt, "bucket": bucket, "training_job": training_job})

Lasciaci la seconda opzione mantenere il nostro Python esistente codici che avevamo già su SageMaker Studio, e non ci ha richiesto di imparare nuove grammatiche per gli operatori di Amazon SageMaker.

Tuttavia, abbiamo affrontato alcuni tentativi ed errori, poiché era la prima volta che integravamo Apache Airflow con Amazon SageMaker. Le lezioni che abbiamo imparato sono state:

Aggiornamento Boto3: Amazon SageMaker Python SDK versione 2 richiede Boto3 1.14.12 o versione successiva. Pertanto, dovevamo aggiornare la versione Boto3 del nostro ambiente Apache Airflow esistente, che era alla 1.13.4.
Ereditarietà dei ruoli e delle autorizzazioni IAM: i ruoli AWS IAM utilizzati da Apache Airflow erano necessari per ereditare i ruoli che potevano eseguire Amazon SageMaker.
Configurazione di rete: per eseguire i codici SageMaker con Apache Airflow, i relativi endpoint dovevano essere configurati per le connessioni di rete. I seguenti endpoint erano basati sulle regioni e sui servizi AWS che stavamo utilizzando. Per ulteriori informazioni, vedere il Sito Web di AWS.
1. api.sagemaker.ap-northeast-2.amazonaws.com
2. runtime.sagemaker.ap-northeast-2.amazonaws.com
3. aws.sagemaker.ap-northeast-2.studio

Risultati

Automatizzando i processi di revisione delle immagini, abbiamo ottenuto i seguenti risultati aziendali:

Maggiore efficienza del lavoro – Attualmente, il 76% delle immagini delle categorie in cui è stato applicato il servizio vengono ispezionate automaticamente con una precisione di ispezione del 98%.
Coerenza nell'erogazione dei crediti – I crediti vengono assegnati in base a criteri chiari. Tuttavia, ci sono state occasioni in cui i crediti sono stati assegnati in modo diverso per casi simili a causa delle differenze nei giudizi degli ispettori. Il modello ML applica le regole in modo più coerente e con maggiore coerenza nell’applicazione delle nostre politiche di credito.
Errori umani ridotti – Ogni impegno umano comporta il rischio di errori umani. Ad esempio, abbiamo avuto casi in cui i criteri di revisione dello stile venivano utilizzati per le recensioni dei prodotti. Il nostro modello di ispezione automatica ha ridotto drasticamente i rischi di questi errori umani.

Abbiamo ottenuto i seguenti vantaggi in particolare utilizzando Amazon SageMaker per automatizzare il processo di ispezione delle immagini:

Abbiamo creato un ambiente in cui possiamo costruire e testare modelli attraverso processi modulari – Ciò che ci è piaciuto di più di Amazon SageMaker è che è composto da moduli. Ciò ci consente di creare e testare servizi in modo semplice e rapido. Ovviamente all'inizio abbiamo avuto bisogno di un po' di tempo per conoscere Amazon SageMaker, ma una volta imparato, abbiamo potuto applicarlo facilmente nelle nostre operazioni. Riteniamo che Amazon SageMaker sia l'ideale per le aziende che necessitano di rapidi sviluppi dei servizi, come nel caso del MUSINSA Store.
Raccogli dati di input affidabili con Amazon SageMaker Ground Truth – Nel campo del machine learning, la raccolta dei dati di input diventa sempre più importante piuttosto che la modellazione stessa. Con il rapido progresso del machine learning, i modelli pre-addestrati possono funzionare molto meglio di prima e senza ulteriori regolazioni. AutoML ha inoltre eliminato la necessità di scrivere codici per la modellazione ML. Pertanto, la capacità di raccogliere dati di input di qualità è più importante che mai e l’utilizzo di servizi di etichettatura come Amazon SageMaker Ground Truth è fondamentale.

Conclusione

In futuro, prevediamo di automatizzare non solo la pubblicazione dei modelli, ma anche l'addestramento dei modelli tramite batch automatici. Vogliamo che il nostro modello identifichi automaticamente gli iperparametri ottimali quando vengono aggiunte nuove etichette o immagini. Inoltre, continueremo a migliorare le prestazioni del nostro modello, ovvero richiami e precisione, sulla base del metodo di addestramento automatizzato precedentemente menzionato. Aumenteremo la copertura dei nostri modelli in modo che possano ispezionare più immagini di revisione, ridurre maggiori costi e ottenere una maggiore precisione, il che porterà a una maggiore soddisfazione del cliente.

Per ulteriori informazioni su come utilizzare Amazon Sage Maker per risolvere i tuoi problemi aziendali utilizzando il machine learning, visita il pagina web del prodotto. E, come sempre, rimani aggiornato sulle ultime novità Novità sul machine learning di AWS qui.

Il contenuto e le opinioni in questo post sono quelli dell'autore di terze parti e AWS non è responsabile per il contenuto o l'accuratezza di questo post.

Informazioni sugli autori

Parco Jihye è un Data Scientist presso MUSINSA responsabile dell'analisi e della modellazione dei dati. Ama lavorare con dati onnipresenti come l'e-commerce. Il suo ruolo principale è la modellazione dei dati, ma ha interessi anche nell'ingegneria dei dati.

Sungmin Kim è Sr. Solutions Architect presso Amazon Web Services. Collabora con startup per progettare, progettare, automatizzare e creare soluzioni su AWS per le loro esigenze aziendali. È specializzato in AI/ML e Analytics.