Opracuj usługę automatycznej kontroli obrazu z przeglądem za pomocą Amazon SageMaker

Opublikowane ponownie przez Plato

Obserwuje: 0

To jest post gościnny autorstwa Jihye Park, analityka danych w MUSINSA.

MUZYNA to jedna z największych internetowych platform modowych w Korei Południowej, obsługująca 8.4 mln klientów i sprzedająca 6,000 marek modowych. Nasz miesięczny ruch użytkowników sięga 4 milionów, a ponad 90% naszej grupy demograficznej to nastolatki i młodzi dorośli, którzy są wrażliwi na trendy w modzie. MUSINSA jest liderem w zakresie platform wyznaczających trendy w kraju, dysponującym ogromnymi ilościami danych.

Zespół MUSINSA Data Solution zajmuje się wszystkim, co dotyczy danych zbieranych ze Sklepu MUSINSA. Zajmujemy się rozwojem pełnego stosu, od zbierania logów po modelowanie danych i udostępnianie modeli. Opracowujemy różne produkty oparte na danych, w tym usługę rekomendacji produktów na żywo na stronie głównej naszej aplikacji oraz usługę wyróżniania słów kluczowych, która wykrywa i podkreśla słowa takie jak „rozmiar” lub „poziom zadowolenia” z recenzji tekstowych.

Wyzwania w procesie automatycznej kontroli obrazu przeglądu

Jakość i ilość recenzji klientów ma kluczowe znaczenie dla firm e-commerce, ponieważ klienci podejmują decyzje o zakupie bez osobistego oglądania produktów. Przyznajemy punkty tym, którzy piszą recenzje obrazkowe na temat zakupionych przez siebie produktów (tj. recenzje ze zdjęciami produktów lub zdjęciami osób noszących/używających produkty), aby poprawić wrażenia klientów i zwiększyć współczynnik konwersji zakupu. Aby ustalić, czy przesłane zdjęcia spełniają nasze kryteria przyznawania kredytów, wszystkie zdjęcia są indywidualnie sprawdzane przez ludzi. Na przykład nasze kryteria stanowią, że „Recenzja stylu” powinna zawierać zdjęcia przedstawiające całe ciało osoby noszącej/używającej produkt, podczas gdy „Recenzja produktu” powinna zawierać pełne ujęcie produktu. Poniższe obrazy przedstawiają przykłady Przeglądu produktu i Przeglądu stylu. Zgoda przesyłających została udzielona na wykorzystanie zdjęć.

Przykłady recenzji produktów.

Przykłady przeglądu stylu.

Codziennie na platformę Sklepu MUSINSA przesyłanych jest ponad 20,000 XNUMX zdjęć, które wymagają wglądu. Proces kontroli klasyfikuje obrazy jako „opakowanie”, „produkt”, „pełna długość” lub „połowa długości”. Proces kontroli obrazu jest całkowicie ręczny, więc był niezwykle czasochłonny, a klasyfikacje często są przeprowadzane w różny sposób przez różne osoby, nawet z wytycznymi. W obliczu tego wyzwania skorzystaliśmy Amazon Sage Maker aby zautomatyzować to zadanie.

Amazon SageMaker to w pełni zarządzana usługa do budowania, szkolenia i wdrażania modeli uczenia maszynowego (ML) dla każdego przypadku użycia z w pełni zarządzaną infrastrukturą, narzędziami i przepływami pracy. Pozwoliło nam to szybko wdrożyć usługę automatycznej inspekcji obrazu z dobrymi wynikami.

Omówimy szczegółowo, w jaki sposób rozwiązaliśmy nasze problemy za pomocą modeli ML i wykorzystaliśmy Amazon SageMaker po drodze.

Automatyzacja procesu kontroli obrazu przeglądowego

Pierwszym krokiem w kierunku zautomatyzowania procesu kontroli przeglądu obrazu było ręczne etykietowanie obrazów, a tym samym dopasowanie ich do odpowiednich kategorii i kryteriów kontroli. Na przykład sklasyfikowaliśmy obrazy jako „ujęcie całego ciała”, „ujęcie górnej części ciała”, „ujęcie opakowania”, „ujęcie produktu” itp. W przypadku recenzji produktu punkty przyznawane były tylko za ujęcie produktu. Podobnie w przypadku Przeglądu Stylu, kredyty zostały przyznane za ujęcie całego ciała.

Jeśli chodzi o klasyfikację obrazów, w dużej mierze polegaliśmy na wstępnie wytrenowanym modelu konwolucyjnej sieci neuronowej (CNN) ze względu na ogromną liczbę obrazów wejściowych wymaganych do wytrenowania naszego modelu. Podczas gdy definiowanie i kategoryzowanie znaczących funkcji z obrazów ma kluczowe znaczenie dla uczenia modelu, obraz może mieć nieograniczoną liczbę funkcji. Dlatego użycie modelu CNN miało największy sens i wstępnie przeszkoliliśmy nasz model z ponad 10,000 XNUMX zestawów danych ImageNet, a następnie wykorzystaliśmy naukę transferu. Oznaczało to, że nasz model mógł być później trenowany bardziej efektywnie z naszymi etykietami graficznymi.

Kolekcja obrazów z Amazon SageMaker Ground Truth

Uczenie transferowe miało jednak swoje ograniczenia, ponieważ model musiał zostać przeszkolony na nowo w wyższych warstwach. Oznacza to, że stale wymagał obrazów wejściowych. Z drugiej strony ta metoda działała dobrze i wymagała mniejszej liczby obrazów wejściowych, gdy była szkolona na całych warstwach. Z łatwością identyfikował cechy z obrazów z tych warstw, ponieważ został już przeszkolony z ogromną ilością danych. W MUSINSA cała nasza infrastruktura działa w oparciu o AWS i przechowujemy w nim zdjęcia przesłane przez klientów Usługa Amazon Simple Storage (S3). Podzieliliśmy te obrazy na różne foldery na podstawie zdefiniowanych przez nas etykiet i użyliśmy Amazon SageMaker Ground Truth z następujących powodów:

Bardziej spójne wyniki – W procesach ręcznych pojedynczy błąd inspektora może zostać uwzględniony w szkoleniu modelowym bez żadnej interwencji. Dzięki SageMaker Ground Truth mogliśmy zlecić kilku inspektorom przeglądnięcie tego samego obrazu i upewnienie się, że dane wejściowe od najbardziej godnego zaufania inspektora zostały ocenione wyżej pod kątem etykietowania obrazów, co prowadzi do bardziej wiarygodnych wyników.
Mniej pracy ręcznej – Zautomatyzowane etykietowanie danych SageMaker Ground Truth może być stosowane z progiem oceny pewności, dzięki czemu wszelkie obrazy, których nie można z całą pewnością oznakować maszynowo, są wysyłane do etykietowania przez człowieka. Zapewnia to najlepszą równowagę kosztów i dokładności. Więcej informacji znajduje się w Przewodnik programisty Amazon SageMaker Ground Truth.
Korzystając z tej metody, zmniejszyliśmy liczbę ręcznie sklasyfikowanych obrazów o 43%. Poniższa tabela pokazuje liczbę obrazów przetworzonych na iterację po przyjęciu Ground Truth (należy pamiętać, że dane szkoleniowe i sprawdzające są danymi akumulowanymi, podczas gdy inne metryki są oparte na iteracji).
Bezpośrednio ładuj wyniki – Podczas budowania modeli w SageMaker mogliśmy załadować wynikowe pliki manifestu wygenerowane przez SageMaker Ground Truth i użyć ich do treningu.

Podsumowując, kategoryzowanie 10,000 22 obrazów wymagało 980 inspektorów w ciągu pięciu dni i kosztowało XNUMX USD.

Opracowanie modelu klasyfikacji obrazów w Amazon SageMaker Studio

Musieliśmy sklasyfikować zdjęcia do recenzji jako ujęcia całej sylwetki, ujęcia górnej części ciała, zdjęcia opakowań, zdjęcia produktów i produktów do odpowiednich kategorii. Aby osiągnąć nasze cele, rozważyliśmy dwa modele: wbudowany model SageMaker oparty na ResNet oraz model MobileNet oparty na Tensorflow. Przetestowaliśmy oba na tych samych zestawach danych testowych i stwierdziliśmy, że wbudowany model SageMaker był dokładniejszy, z wynikiem 0.98 F1 w porównaniu z 0.88 z modelu TensorFlow. Dlatego zdecydowaliśmy się na wbudowany model SageMaker.

Połączenia Studio SageMakerproces szkolenia na modelach wyglądał następująco:

Importuj oznaczone obrazy z SageMaker Ground Truth
Wstępne przetwarzanie obrazów – zmiana rozmiaru i powiększanie obrazu
Załaduj Wbudowany model Amazon SageMaker jako obraz Dockera
Dostosuj hiperparametry poprzez wyszukiwanie siatki
Zastosuj naukę transferu
Ponownie dostosuj parametry w oparciu o wskaźniki treningowe
Zapisz model

SageMaker ułatwił trenowanie modelu za pomocą jednego kliknięcia i bez martwienia się o udostępnianie i zarządzanie flotą serwerów do szkolenia.

W przypadku obracania hiperparametrów zastosowaliśmy wyszukiwanie siatki w celu określenia optymalnych wartości hiperparametrów, takich jak liczba warstw treningowych (num_layers) i cykle treningowe (epochs) podczas uczenia transferowego wpłynęło na dokładność naszego modelu klasyfikacji.

epochs_list = [5, 10, 15]
num_layers_list = [18, 34, 50] from sagemaker.analytics import TrainingJobAnalytics
metric_df = pd.DataFrame() for i in range(len(epochs_list)): for j in range(len(num_layers_list)): # hyperparameter settings ic.set_hyperparameters(num_layers=num_layers_list[j], use_pretrained_model=1, image_shape = "3,256,256", num_classes=9, num_training_samples=50399, mini_batch_size=128, epochs=epochs_list[i], learning_rate=0.01, precision_dtype='float32') ic.fit(inputs=data_channels, logs=True) latest_job_name = ic.latest_training_job.job_name job_metric = TrainingJobAnalytics(training_job_name=latest_job_name).dataframe() job_metric['epochs'] = epochs_list[i] job_metric['num_layers'] = num_layers_list[j] metric_df = pd.concat([metric_df, job_metric])

Obsługa modeli z SageMaker Batch Transform i Apache Airflow

Zbudowany przez nas model klasyfikacji obrazów wymagał przepływów pracy ML w celu określenia, czy obraz recenzji został zakwalifikowany do kredytów. Ustaliliśmy przepływy pracy z następującymi czterema krokami.

Importuj obrazy recenzji i metadane, które muszą być automatycznie przeglądane
Wywnioskować etykiety obrazów (wnioskowanie)
Określ, czy kredyty powinny być przyznawane na podstawie wywnioskowanych etykiet
Zapisz tabelę wyników w produkcyjnej bazie danych

Używamy Przepływ powietrza Apache do zarządzania przepływami pracy produktów danych. Jest to platforma do planowania i monitorowania przepływu pracy opracowana przez Airbnb, znana z prostych i intuicyjnych wykresów interfejsu internetowego. Obsługuje Amazon SageMaker, dzięki czemu łatwo migruje kod opracowany w SageMaker Studio do Apache Airflow. Istnieją dwa sposoby uruchamiania zadań SageMaker na Apache Airflow:

Korzystanie z operatorów Amazon SageMaker
Korzystanie z Operatory Pythona : Napisz funkcję Pythona za pomocą Amazon SageMaker Python SDK na Apache Airflow i zaimportuj ją jako parametr wywoływalny

def transform(dt, bucket, training_job, **kwargs): estimator = sagemaker.estimator.Estimator.attach(training_job) transformer = estimator.transformer(instance_count=1, instance_type='ml.m4.xlarge', output_path=f's3://{bucket}/.../dt={dt}', max_payload=1) transformer.transform(data=f's3://{bucket}/.../dt={dt}', data_type='S3Prefix', content_type='application/x-image', split_type='None') transformer.wait() … transform_op = PythonOperator( task_id='transform', dag=dag, provide_context=True, python_callable=transform, op_kwargs={"dt": dt, "bucket": bucket, "training_job": training_job})

Druga opcja pozwoliła nam utrzymać nasz istniejący Python kody, które już mieliśmy w SageMaker Studio, i nie wymagało to od nas nauki nowych gramatyk dla operatorów Amazon SageMaker.

Przeszliśmy jednak przez kilka prób i błędów, ponieważ była to nasza pierwsza integracja Apache Airflow z Amazon SageMaker. Lekcje, których się nauczyliśmy to:

Aktualizacja Boto3: Wymagany pakiet Amazon SageMaker Python SDK w wersji 2 Boto3 1.14.12 lub nowszy. Dlatego musieliśmy zaktualizować wersję Boto3 naszego istniejącego środowiska Apache Airflow, która była w wersji 1.13.4.
Dziedziczenie ról i uprawnień IAM: Role AWS IAM używane przez Apache Airflow musiały dziedziczyć role, które mogłyby uruchamiać Amazon SageMaker.
Konfiguracja sieci: Aby uruchamiać kody SageMaker za pomocą Apache Airflow, jego punkty końcowe musiały być skonfigurowane pod kątem połączeń sieciowych. Następujące punkty końcowe zostały oparte na regionach AWS i usługach, z których korzystaliśmy. Aby uzyskać więcej informacji, zobacz Strona internetowa AWS.
1. api.sagemaker.ap-northeast-2.amazonaws.com
2. runtime.sagemaker.ap-northeast-2.amazonaws.com
3. aws.sagemaker.ap-northeast-2.studio

Wyniki

Dzięki automatyzacji procesów kontroli obrazów uzyskaliśmy następujące wyniki biznesowe:

Zwiększona wydajność pracy – Obecnie 76% obrazów z kategorii, w których zastosowano usługę, jest sprawdzanych automatycznie z dokładnością inspekcji na poziomie 98%.
Konsekwencja w udzielaniu kredytów – Kredyty przyznawane są na podstawie jasnych kryteriów. Zdarzały się jednak sytuacje, w których punkty przyznawano w różny sposób w podobnych przypadkach ze względu na różnice w osądach inspektorów. Model ML stosuje zasady w sposób bardziej spójny i bardziej konsekwentny w stosowaniu naszych zasad kredytowych.
Mniej błędów ludzkich – Każde ludzkie zaangażowanie niesie ze sobą ryzyko ludzkich błędów. Na przykład mieliśmy przypadki, w których kryteria oceny stylu zostały użyte do recenzji produktów. Nasz model automatycznej kontroli radykalnie zmniejszył ryzyko tych ludzkich błędów.

Dzięki wykorzystaniu Amazon SageMaker do automatyzacji procesu kontroli obrazu uzyskaliśmy następujące korzyści:

Stworzyliśmy środowisko, w którym możemy budować i testować modele za pomocą procesów modułowych – W Amazon SageMaker najbardziej podobało nam się to, że składa się z modułów. Dzięki temu możemy łatwo i szybko budować i testować usługi. Oczywiście na początku potrzebowaliśmy trochę czasu, aby zapoznać się z Amazon SageMaker, ale kiedy już się nauczyliśmy, mogliśmy z łatwością zastosować go w naszych działaniach. Uważamy, że Amazon SageMaker jest idealny dla firm wymagających szybkiego rozwoju usług, tak jak w przypadku Sklepu MUSINSA.
Zbieraj wiarygodne dane wejściowe za pomocą Amazon SageMaker Ground Truth – Gromadzenie danych wejściowych staje się coraz ważniejsze niż samo modelowanie w obszarze ML. Dzięki szybkiemu postępowi uczenia maszynowego wstępnie wytrenowane modele mogą działać znacznie lepiej niż wcześniej i to bez dodatkowego dostrajania. AutoML usunął również potrzebę pisania kodów do modelowania ML. Dlatego zdolność do gromadzenia wysokiej jakości danych wejściowych jest ważniejsza niż kiedykolwiek, a korzystanie z usług etykietowania, takich jak Amazon SageMaker Ground Truth, ma kluczowe znaczenie.

Wnioski

Idąc dalej, planujemy zautomatyzować nie tylko udostępnianie modeli, ale także szkolenie modeli za pomocą automatycznych partii. Chcemy, aby nasz model automatycznie identyfikował optymalne hiperparametry po dodaniu nowych etykiet lub obrazów. Ponadto będziemy nadal poprawiać wydajność naszego modelu, a mianowicie wycofania i precyzję, w oparciu o wspomnianą wcześniej metodę automatycznego szkolenia. Zwiększymy pokrycie naszego modelu, aby mógł on sprawdzać więcej obrazów przeglądowych, obniżyć koszty i osiągnąć większą dokładność, co doprowadzi do większego zadowolenia klientów.

Aby uzyskać więcej informacji o tym, jak używać Amazon Sage Maker aby rozwiązać problemy biznesowe przy użyciu uczenia maszynowego, odwiedź stronę strona internetowa produktu. I, jak zawsze, bądź na bieżąco z najnowszymi informacjami Wiadomości AWS Machine Learning tutaj.

Treść i opinie zawarte w tym poście należą do autora będącego osobą trzecią, a AWS nie ponosi odpowiedzialności za treść ani dokładność tego postu.

O autorach

Park Jihye jest Data Scientist w MUSINSA odpowiedzialnym za analizę i modelowanie danych. Uwielbia pracować z wszechobecnymi danymi, takimi jak e-commerce. Jej główną rolą jest modelowanie danych, ale interesuje się również inżynierią danych.

Sungmin Kim jest starszym architektem rozwiązań w Amazon Web Services. Współpracuje ze start-upami przy architekturze, projektowaniu, automatyzacji i budowaniu rozwiązań na AWS dla ich potrzeb biznesowych. Specjalizuje się w AI/ML i analityce.