Entwickeln Sie mit Amazon SageMaker – Plato AiStream V2.1 einen automatischen Überprüfungs-Bildinspektionsdienst

Neuauflage von Plato

Verfolger: 0

Dies ist ein Gastbeitrag von Jihye Park, einem Datenwissenschaftler bei MUSINSA.

MUSINSA ist eine der größten Online-Modeplattformen in Südkorea, bedient 8.4 Millionen Kunden und verkauft 6,000 Modemarken. Unser monatlicher Nutzerverkehr erreicht 4 Millionen und über 90 % unserer Bevölkerungsgruppe besteht aus Teenagern und jungen Erwachsenen, die ein Gespür für Modetrends haben. MUSINSA ist ein richtungsweisender Plattformführer im Land und führt mit riesigen Datenmengen.

Das MUSINSA Data Solution Team befasst sich mit allem, was mit den im MUSINSA Store gesammelten Daten zu tun hat. Wir führen eine komplette Stack-Entwicklung durch, von der Protokollerfassung bis hin zur Datenmodellierung und Modellbereitstellung. Wir entwickeln verschiedene datenbasierte Produkte, darunter den Live Product Recommendation Service auf der Hauptseite unserer App und den Keyword Highlighting Service, der Wörter wie „Größe“ oder „Zufriedenheitsgrad“ aus Textrezensionen erkennt und hervorhebt.

Herausforderungen beim automatisierten Prüfbildinspektionsprozess

Qualität und Quantität der Kundenbewertungen sind für E-Commerce-Unternehmen von entscheidender Bedeutung, da Kunden Kaufentscheidungen treffen, ohne die Produkte persönlich zu sehen. Wir vergeben Gutschriften an diejenigen, die Bildbewertungen zu den von ihnen gekauften Produkten schreiben (d. h. Bewertungen mit Fotos der Produkte oder Fotos von ihnen, die die Produkte tragen/verwenden), um das Kundenerlebnis zu verbessern und die Kaufkonversionsrate zu erhöhen. Um festzustellen, ob die eingereichten Fotos unseren Kriterien für die Bildnachweise entsprechen, werden alle Fotos einzeln von Menschen geprüft. Unsere Kriterien besagen beispielsweise, dass eine „Stilbewertung“ Fotos enthalten sollte, die den gesamten Körper einer Person zeigen, die das Produkt trägt/benutzt, während eine „Produktbewertung“ eine vollständige Aufnahme des Produkts enthalten sollte. Die folgenden Bilder zeigen Beispiele einer Produktbewertung und einer Stilbewertung. Für die Verwendung der Fotos liegt die Einwilligung des Uploaders vor.

Beispiele für Produktbewertungen.

Beispiele für Style Review.

Täglich werden über 20,000 Fotos auf die MUSINSA Store-Plattform hochgeladen, die überprüft werden müssen. Der Inspektionsprozess klassifiziert Bilder als „Verpackung“, „Produkt“, „in voller Länge“ oder „halbe Länge“. Der Bildinspektionsprozess erfolgt vollständig manuell, war also äußerst zeitaufwändig und Klassifizierungen werden trotz der Richtlinien oft von verschiedenen Personen unterschiedlich vorgenommen. Angesichts dieser Herausforderung haben wir verwendet Amazon Sage Maker um diese Aufgabe zu automatisieren.

Amazon SageMaker ist ein vollständig verwalteter Dienst zum Erstellen, Trainieren und Bereitstellen von Modellen für maschinelles Lernen (ML) für jeden Anwendungsfall mit vollständig verwalteter Infrastruktur, Tools und Workflows. Dadurch konnten wir den automatisierten Bildinspektionsdienst schnell und mit guten Ergebnissen implementieren.

Wir werden im Detail darauf eingehen, wie wir unsere Probleme mithilfe von ML-Modellen angegangen sind und dabei Amazon SageMaker verwendet haben.

Automatisierung des Überprüfungsbildinspektionsprozesses

Der erste Schritt zur Automatisierung des Bildüberprüfungsprozesses bestand darin, Bilder manuell zu kennzeichnen und sie so den entsprechenden Kategorien und Inspektionskriterien zuzuordnen. Beispielsweise haben wir Bilder als „Ganzkörperaufnahme“, „Oberkörperaufnahme“, „Verpackungsaufnahme“, „Produktaufnahme“ usw. klassifiziert. Im Falle einer Produktrezension wurden Credits nur für ein Produktaufnahmebild vergeben. Ebenso wurden im Falle einer Style Review Credits für eine Ganzkörperaufnahme vergeben.

Was die Bildklassifizierung angeht, verließen wir uns weitgehend auf ein vorab trainiertes Convolutional Neural Network (CNN)-Modell, da für das Training unseres Modells eine schiere Menge an Eingabebildern erforderlich war. Während das Definieren und Kategorisieren aussagekräftiger Merkmale aus Bildern für das Training eines Modells von entscheidender Bedeutung ist, kann ein Bild eine unbegrenzte Anzahl von Merkmalen aufweisen. Daher war die Verwendung des CNN-Modells am sinnvollsten, und wir haben unser Modell mit mehr als 10,000 ImageNet-Datensätzen vorab trainiert und dann Transferlernen verwendet. Dies bedeutete, dass unser Modell später effektiver mit unseren Bildetiketten trainiert werden konnte.

Bildersammlung mit Amazon SageMaker Ground Truth

Allerdings hatte das Transferlernen seine eigenen Grenzen, da ein Modell auf höheren Schichten neu trainiert werden muss. Das bedeutet, dass ständig Eingabebilder erforderlich waren. Andererseits zeigte diese Methode eine gute Leistung und erforderte weniger Eingabebilder, wenn sie auf ganzen Ebenen trainiert wurde. Es konnte Merkmale anhand der Bilder dieser Schichten leicht identifizieren, da es bereits mit einer riesigen Datenmenge trainiert wurde. Bei MUSINSA läuft unsere gesamte Infrastruktur auf AWS und wir speichern von Kunden hochgeladene Fotos darin Amazon Simple Storage Service (S3). Wir haben diese Bilder basierend auf den von uns definierten Bezeichnungen in verschiedene Ordner kategorisiert und Amazon SageMaker Ground Truth aus folgenden Gründen verwendet:

Konsistentere Ergebnisse – Bei manuellen Prozessen könnte der Fehler eines einzelnen Prüfers ohne Eingriff in das Modelltraining einfließen. Mit SageMaker Ground Truth konnten wir mehrere Inspektoren das gleiche Bild überprüfen lassen und sicherstellen, dass die Eingaben des vertrauenswürdigsten Inspektors bei der Bildbeschriftung höher bewertet wurden, was zu zuverlässigeren Ergebnissen führte.
Weniger manuelle Arbeit – Die automatisierte Datenkennzeichnung von SageMaker Ground Truth kann mit einem Konfidenzwertschwellenwert angewendet werden, sodass alle Bilder, die nicht sicher maschinell gekennzeichnet werden können, zur menschlichen Kennzeichnung gesendet werden. Dies gewährleistet das beste Gleichgewicht zwischen Kosten und Genauigkeit. Weitere Informationen finden Sie im Amazon SageMaker Ground Truth-Entwicklerhandbuch.
Mit dieser Methode konnten wir die Anzahl der manuell klassifizierten Bilder um 43 % reduzieren. Die folgende Tabelle zeigt die Anzahl der Bilder, die pro Iteration verarbeitet wurden, nachdem wir Ground Truth übernommen haben (beachten Sie, dass es sich bei den Trainings- und Validierungsdaten um akkumulierte Daten handelt, während die anderen Metriken pro Iteration basieren).
Ergebnisse direkt laden – Beim Erstellen von Modellen in SageMaker könnten wir die resultierenden Manifestdateien laden, die von SageMaker Ground Truth generiert wurden, und sie für das Training verwenden.

Zusammenfassend lässt sich sagen, dass die Kategorisierung von 10,000 Bildern 22 Inspektoren in fünf Tagen erforderte und 980 US-Dollar kostete.

Entwicklung eines Bildklassifizierungsmodells mit Amazon SageMaker Studio

Wir mussten Rezensionsbilder als Ganzkörperaufnahmen, Oberkörperaufnahmen, Verpackungsaufnahmen, Produktaufnahmen und Produkte in geeignete Kategorien einteilen. Um unsere Ziele zu erreichen, haben wir zwei Modelle in Betracht gezogen: das auf ResNet basierende integrierte SageMaker-Modell und das Tensorflow-basiertes MobileNet. Wir haben beide mit denselben Testdatensätzen getestet und festgestellt, dass das integrierte SageMaker-Modell genauer war, mit einem F0.98-Score von 1 gegenüber 0.88 beim TensorFlow-Modell. Daher haben wir uns für das integrierte SageMaker-Modell entschieden.

Das SageMaker-Studio-basierter Modelltrainingsprozess war wie folgt:

Importieren Sie beschriftete Bilder aus SageMaker Ground Truth
Bilder vorverarbeiten – Bildgröße ändern und vergrößern
Legen Sie die Integriertes Amazon SageMaker-Modell als Docker-Image
Optimieren Sie Hyperparameter durch Rastersuche
Wenden Sie Transferlernen an
Passen Sie die Parameter basierend auf Trainingsmetriken neu an
Modell speichern

SageMaker machte es einfach, das Modell mit nur einem Klick zu trainieren, ohne sich Gedanken über die Bereitstellung und Verwaltung einer Serverflotte für das Training machen zu müssen.

Für das Drehen von Hyperparametern verwendeten wir eine Rastersuche, um die optimalen Werte von Hyperparametern zu bestimmen, da die Anzahl der Trainingsschichten (num_layers) und Trainingszyklen (epochs) während des Transferlernens hatte die Genauigkeit unseres Klassifizierungsmodells beeinträchtigt.

epochs_list = [5, 10, 15]
num_layers_list = [18, 34, 50] from sagemaker.analytics import TrainingJobAnalytics
metric_df = pd.DataFrame() for i in range(len(epochs_list)): for j in range(len(num_layers_list)): # hyperparameter settings ic.set_hyperparameters(num_layers=num_layers_list[j], use_pretrained_model=1, image_shape = "3,256,256", num_classes=9, num_training_samples=50399, mini_batch_size=128, epochs=epochs_list[i], learning_rate=0.01, precision_dtype='float32') ic.fit(inputs=data_channels, logs=True) latest_job_name = ic.latest_training_job.job_name job_metric = TrainingJobAnalytics(training_job_name=latest_job_name).dataframe() job_metric['epochs'] = epochs_list[i] job_metric['num_layers'] = num_layers_list[j] metric_df = pd.concat([metric_df, job_metric])

Modellbereitstellung mit SageMaker Batch Transform und Apache Airflow

Das von uns erstellte Bildklassifizierungsmodell erforderte ML-Workflows, um festzustellen, ob ein Rezensionsbild für Credits qualifiziert war. Wir haben Arbeitsabläufe mit den folgenden vier Schritten etabliert.

Importieren Sie Bewertungsbilder und Metadaten, die automatisch überprüft werden müssen
Auf die Beschriftungen der Bilder schließen (Inferenz)
Bestimmen Sie anhand der abgeleiteten Bezeichnungen, ob Credits vergeben werden sollen
Speichern Sie die Ergebnistabelle in der Produktionsdatenbank

Wir benutzen Apache-Luftstrom um Datenprodukt-Workflows zu verwalten. Dabei handelt es sich um eine von Airbnb entwickelte Plattform zur Workflow-Planung und -Überwachung, die für ihre einfachen und intuitiven Web-UI-Diagramme bekannt ist. Es unterstützt Amazon SageMaker und migriert daher den mit SageMaker Studio entwickelten Code problemlos zu Apache Airflow. Es gibt zwei Möglichkeiten, SageMaker-Jobs auf Apache Airflow auszuführen:

Verwendung von Amazon SageMaker-Operatoren
Die richtigen Python-Operatoren : Schreiben Sie eine Python-Funktion mit dem Amazon SageMaker Python SDK auf Apache Airflow und importieren Sie sie als aufrufbaren Parameter

def transform(dt, bucket, training_job, **kwargs): estimator = sagemaker.estimator.Estimator.attach(training_job) transformer = estimator.transformer(instance_count=1, instance_type='ml.m4.xlarge', output_path=f's3://{bucket}/.../dt={dt}', max_payload=1) transformer.transform(data=f's3://{bucket}/.../dt={dt}', data_type='S3Prefix', content_type='application/x-image', split_type='None') transformer.wait() … transform_op = PythonOperator( task_id='transform', dag=dag, provide_context=True, python_callable=transform, op_kwargs={"dt": dt, "bucket": bucket, "training_job": training_job})

Die zweite Option lassen Sie uns Pflegen Sie unser vorhandenes Python Codes, die wir bereits in SageMaker Studio hatten, und es war nicht erforderlich, dass wir neue Grammatiken für Amazon SageMaker-Operatoren lernen.

Da es jedoch das erste Mal war, dass wir Apache Airflow mit Amazon SageMaker integriert haben, mussten wir einige Versuche durchführen. Die Lektionen, die wir gelernt haben, waren:

Boto3-Update: Amazon SageMaker Python SDK Version 2 erfordert Boto3 1.14.12 oder neuer. Daher mussten wir die Boto3-Version unserer bestehenden Apache Airflow-Umgebung auf 1.13.4 aktualisieren.
IAM-Rollen- und Berechtigungsvererbung: Von Apache Airflow verwendete AWS IAM-Rollen müssen Rollen erben, die Amazon SageMaker ausführen können.
Netzwerkkonfiguration: Um SageMaker-Codes mit Apache Airflow auszuführen, mussten die Endpunkte für Netzwerkverbindungen konfiguriert werden. Die folgenden Endpunkte basierten auf den von uns verwendeten AWS-Regionen und -Diensten. Weitere Informationen finden Sie unter AWS-Website.
1. api.sagemaker.ap-northeast-2.amazonaws.com
2. runtime.sagemaker.ap-northeast-2.amazonaws.com
3. aws.sagemaker.ap-northeast-2.studio

Outcomes

Durch die Automatisierung der Inspektionsprozesse von Rezensionsbildern haben wir die folgenden Geschäftsergebnisse erzielt:

Erhöhte Arbeitseffizienz – Derzeit werden 76 % der Bilder der Kategorien, in denen der Dienst angewendet wurde, automatisch mit einer Prüfgenauigkeit von 98 % geprüft.
Kontinuität bei der Vergabe von Credits – Credits werden nach klaren Kriterien vergeben. Es gab jedoch Fälle, in denen aufgrund unterschiedlicher Beurteilungen der Inspektoren für ähnliche Fälle unterschiedliche Punkte vergeben wurden. Das ML-Modell wendet die Regeln konsistenter an und sorgt für eine höhere Konsistenz bei der Anwendung unserer Kreditrichtlinien.
Weniger menschliche Fehler – Jedes menschliche Engagement birgt das Risiko menschlicher Fehler. Wir hatten beispielsweise Fälle, in denen Style-Review-Kriterien für Produktbewertungen verwendet wurden. Unser automatisches Inspektionsmodell reduzierte das Risiko dieser menschlichen Fehler drastisch.

Durch den Einsatz von Amazon SageMaker zur Automatisierung des Bildinspektionsprozesses haben wir insbesondere die folgenden Vorteile erzielt:

Wir haben eine Umgebung geschaffen, in der wir Modelle durch modulare Prozesse erstellen und testen können – Was uns an Amazon SageMaker am besten gefallen hat, ist, dass es aus Modulen besteht. Dadurch können wir Dienste einfach und schnell erstellen und testen. Natürlich brauchten wir zunächst etwas Zeit, um uns mit Amazon SageMaker vertraut zu machen, aber sobald wir es gelernt hatten, konnten wir es problemlos in unserem Betrieb anwenden. Wir glauben, dass Amazon SageMaker ideal für Unternehmen ist, die schnelle Serviceentwicklungen benötigen, wie im Fall des MUSINSA Store.
Sammeln Sie zuverlässige Eingabedaten mit Amazon SageMaker Ground Truth – Das Sammeln von Eingabedaten wird im Bereich ML immer wichtiger als die Modellierung selbst. Mit der schnellen Weiterentwicklung von ML können vorab trainierte Modelle eine viel bessere Leistung als zuvor erbringen, und das ohne zusätzliche Optimierung. AutoML hat außerdem die Notwendigkeit beseitigt, Codes für die ML-Modellierung zu schreiben. Daher ist die Fähigkeit, qualitativ hochwertige Eingabedaten zu sammeln, wichtiger denn je, und die Nutzung von Kennzeichnungsdiensten wie Amazon SageMaker Ground Truth ist von entscheidender Bedeutung.

Zusammenfassung

Für die Zukunft planen wir, nicht nur die Modellbereitstellung, sondern auch das Modelltraining durch automatische Batches zu automatisieren. Wir möchten, dass unser Modell die optimalen Hyperparameter automatisch identifiziert, wenn neue Beschriftungen oder Bilder hinzugefügt werden. Darüber hinaus werden wir die Leistung unseres Modells, nämlich Rückrufe und Präzision, basierend auf der zuvor erwähnten automatisierten Trainingsmethode weiter verbessern. Wir werden unsere Modellabdeckung erweitern, damit mehr Bewertungsbilder überprüft, mehr Kosten gesenkt und höhere Genauigkeiten erreicht werden können, was alles zu einer höheren Kundenzufriedenheit führen wird.

Weitere Informationen zur Verwendung Amazon Sage Maker Um Ihre Geschäftsprobleme mithilfe von ML zu lösen, besuchen Sie die Produktwebseite. Und bleiben Sie wie immer immer auf dem Laufenden Neuigkeiten zu AWS Machine Learning hier.

Der Inhalt und die Meinungen in diesem Beitrag sind die des Drittautors und AWS ist nicht für den Inhalt oder die Richtigkeit dieses Beitrags verantwortlich.

Über die Autoren

Jihye-Park ist Data Scientist bei MUSINSA und verantwortlich für Datenanalyse und Modellierung. Sie liebt es, mit allgegenwärtigen Daten wie E-Commerce zu arbeiten. Ihre Hauptaufgabe ist die Datenmodellierung, aber sie interessiert sich auch für Datentechnik.

Sungmin Kim ist Senior Solutions Architect bei Amazon Web Services. Er arbeitet mit Startups zusammen, um Lösungen auf AWS für ihre Geschäftsanforderungen zu entwerfen, zu entwerfen, zu automatisieren und zu erstellen. Er ist spezialisiert auf KI/ML und Analytics.