Desenvolva um serviço automático de inspeção de imagens de revisão com Amazon SageMaker

Republicado por Platão

seguidores: 0

Este é um post convidado de Jihye Park, cientista de dados da MUSINSA.

MUSINSA é uma das maiores plataformas de moda online da Coreia do Sul, atendendo 8.4 milhões de clientes e vendendo 6,000 marcas de moda. Nosso tráfego mensal de usuários chega a 4 milhões, e mais de 90% de nossa demografia consiste em adolescentes e jovens adultos sensíveis às tendências da moda. MUSINSA é uma plataforma líder em tendências no país, liderando com grandes quantidades de dados.

A Equipe de Solução de Dados MUSINSA se envolve em tudo relacionado aos dados coletados na Loja MUSINSA. Fazemos desenvolvimento full stack, desde a coleta de log até a modelagem de dados e serviço de modelo. Desenvolvemos vários produtos baseados em dados, incluindo o Serviço de recomendação de produtos ao vivo na página principal do nosso aplicativo e o Serviço de destaque de palavras-chave que detecta e destaca palavras como “tamanho” ou “nível de satisfação” em análises de texto.

Desafios no processo automatizado de inspeção de imagens de revisão

A qualidade e a quantidade das avaliações dos clientes são essenciais para as empresas de comércio eletrônico, pois os clientes tomam decisões de compra sem ver os produtos pessoalmente. Damos créditos àqueles que escrevem avaliações de imagens sobre os produtos que compraram (ou seja, avaliações com fotos dos produtos ou fotos deles usando/usando os produtos) para melhorar a experiência do cliente e aumentar a taxa de conversão de compra. Para determinar se as fotos enviadas atendem aos nossos critérios de crédito, todas as fotos são inspecionadas individualmente por humanos. Por exemplo, nossos critérios afirmam que uma “Revisão de Estilo” deve conter fotos mostrando todo o corpo de uma pessoa vestindo/usando o produto, enquanto uma “Revisão de Produto” deve fornecer uma foto completa do produto. As imagens a seguir mostram exemplos de revisão de produto e revisão de estilo. O consentimento dos uploaders foi concedido para o uso das fotos.

Exemplos de análise de produto.

Exemplos de revisão de estilo.

Mais de 20,000 fotos são carregadas diariamente na plataforma MUSINSA Store que requerem inspeção. O processo de inspeção classifica as imagens como ‘pacote’, ‘produto’, ‘completo’ ou ‘meio comprimento’. O processo de inspeção de imagens é totalmente manual, por isso consumia muito tempo e as classificações muitas vezes são feitas de forma diferente por indivíduos diferentes, mesmo com as orientações. Diante desse desafio, usamos Amazon Sage Maker para automatizar esta tarefa.

O Amazon SageMaker é um serviço totalmente gerenciado para criar, treinar e implantar modelos de machine learning (ML) para qualquer caso de uso com infraestrutura, ferramentas e fluxos de trabalho totalmente gerenciados. Isso nos permitiu implementar rapidamente o serviço automatizado de inspeção de imagens com bons resultados.

Entraremos em detalhes sobre como resolvemos nossos problemas usando modelos de ML e usamos o Amazon SageMaker ao longo do caminho.

Automação do Processo de Inspeção de Imagens de Revisão

O primeiro passo para automatizar o processo de inspeção de revisão de imagens foi rotular manualmente as imagens, combinando-as com as categorias e critérios de inspeção apropriados. Por exemplo, classificamos as imagens como “foto de corpo inteiro”, “foto da parte superior do corpo”, “foto da embalagem”, “foto do produto” etc. No caso de uma análise de produto, os créditos foram dados apenas para uma imagem de foto do produto. Da mesma forma, no caso de uma revisão de estilo, os créditos foram dados para uma foto de corpo inteiro.

Quanto à classificação de imagens, dependemos muito de um modelo de rede neural convolucional (CNN) pré-treinado devido ao grande volume de imagens de entrada necessárias para treinar nosso modelo. Embora definir e categorizar recursos significativos de imagens seja fundamental para treinar um modelo, uma imagem pode ter um número ilimitado de recursos. Portanto, usar o modelo CNN fazia mais sentido, e pré-treinamos nosso modelo com mais de 10,000 conjuntos de dados ImageNet e, em seguida, usamos o aprendizado de transferência. Isso significou que nosso modelo poderia ser treinado de forma mais eficaz com nossos rótulos de imagem posteriormente.

Coleta de imagens com Amazon SageMaker Ground Truth

No entanto, a aprendizagem por transferência tinha as suas próprias limitações, porque um modelo deve ser recentemente treinado em camadas superiores. Isso significa que exigia constantemente imagens de entrada. Por outro lado, este método teve um bom desempenho e exigiu menos imagens de entrada quando treinado em camadas inteiras. Ele identificou facilmente recursos de imagens dessas camadas porque já havia sido treinado com uma enorme quantidade de dados. Na MUSINSA, toda a nossa infraestrutura é executada na AWS e armazenamos as fotos enviadas pelos clientes em Serviço de armazenamento simples da Amazon (S3). Categorizamos essas imagens em diferentes pastas com base nos rótulos que definimos e usamos o Amazon SageMaker Ground Truth pelos seguintes motivos:

Resultados mais consistentes – Em processos manuais, um único erro do inspetor pode ser inserido no treinamento modelo sem qualquer intervenção. Com o SageMaker Ground Truth, poderíamos fazer com que vários inspetores analisassem a mesma imagem e garantir que as informações do inspetor mais confiável recebessem uma classificação mais alta para rotulagem de imagens, levando assim a resultados mais confiáveis.
Menos trabalho manual – A rotulagem automatizada de dados SageMaker Ground Truth pode ser aplicada com um limite de pontuação de confiança para que quaisquer imagens que não possam ser rotuladas por máquina com segurança sejam enviadas para rotulagem humana. Isso garante o melhor equilíbrio entre custo e precisão. Mais informações estão disponíveis no Guia do desenvolvedor do Amazon SageMaker Ground Truth.
Usando esse método, reduzimos o número de imagens classificadas manualmente em 43%. A tabela a seguir mostra o número de imagens processadas por iteração depois que adotamos o Ground Truth (observe que os dados de treinamento e validação são dados acumulados, enquanto as outras métricas são por iteração).
Carregar resultados diretamente – Ao construir modelos no SageMaker, poderíamos carregar os arquivos de manifesto resultantes gerados pelo SageMaker Ground Truth e usá-los para treinamento.

Em resumo, categorizar 10,000 imagens exigiu 22 inspetores durante cinco dias e custou US$ 980.

Desenvolvimento de modelo de classificação de imagens com Amazon SageMaker Studio

Precisávamos classificar as imagens de revisão como fotos de corpo inteiro, fotos da parte superior do corpo, fotos de embalagens, fotos de produtos e produtos em categorias aplicáveis. Para atingir nossos objetivos, consideramos dois modelos: o modelo integrado SageMaker baseado em ResNet e o modelo MobileNet baseado em Tensorflow. Testamos ambos nos mesmos conjuntos de dados de teste e descobrimos que o modelo integrado do SageMaker era mais preciso, com uma pontuação F0.98 de 1 versus 0.88 do modelo TensorFlow. Portanto, decidimos pelo modelo integrado do SageMaker.

A Estúdio SageMakerO processo de treinamento do modelo baseado foi o seguinte:

Importe imagens rotuladas do SageMaker Ground Truth
Pré-processar imagens – redimensionamento e aumento de imagens
Carregue o Modelo integrado do Amazon SageMaker como uma imagem Docker
Ajuste hiperparâmetros por meio de pesquisa em grade
Aplicar aprendizagem por transferência
Reajuste os parâmetros com base nas métricas de treinamento
Salve o modelo

O SageMaker simplificou o treinamento do modelo com apenas um clique e sem se preocupar em provisionar e gerenciar uma frota de servidores para treinamento.

Para giro de hiperparâmetros, empregamos busca em grade para determinar os valores ideais dos hiperparâmetros, como o número de camadas de treinamento (num_layers) e ciclos de treinamento (epochs) durante a aprendizagem por transferência afetou a precisão do nosso modelo de classificação.

epochs_list = [5, 10, 15]
num_layers_list = [18, 34, 50] from sagemaker.analytics import TrainingJobAnalytics
metric_df = pd.DataFrame() for i in range(len(epochs_list)): for j in range(len(num_layers_list)): # hyperparameter settings ic.set_hyperparameters(num_layers=num_layers_list[j], use_pretrained_model=1, image_shape = "3,256,256", num_classes=9, num_training_samples=50399, mini_batch_size=128, epochs=epochs_list[i], learning_rate=0.01, precision_dtype='float32') ic.fit(inputs=data_channels, logs=True) latest_job_name = ic.latest_training_job.job_name job_metric = TrainingJobAnalytics(training_job_name=latest_job_name).dataframe() job_metric['epochs'] = epochs_list[i] job_metric['num_layers'] = num_layers_list[j] metric_df = pd.concat([metric_df, job_metric])

Exibição de modelo com SageMaker Batch Transform e Apache Airflow

O modelo de classificação de imagens que construímos exigia fluxos de trabalho de ML para determinar se uma imagem de revisão estava qualificada para créditos. Estabelecemos fluxos de trabalho com as quatro etapas a seguir.

Importe imagens de revisão e metadados que devem ser revisados automaticamente
Inferir os rótulos das imagens (inferência)
Determine se os créditos devem ser dados com base nos rótulos inferidos
Armazene a tabela de resultados no banco de dados de produção

Nós estamos usando Fluxo de ar Apache para gerenciar fluxos de trabalho de produtos de dados. É uma plataforma de agendamento e monitoramento de fluxo de trabalho desenvolvida pelo Airbnb, conhecida por gráficos de UI da web simples e intuitivos. Ele oferece suporte ao Amazon SageMaker, portanto, migra facilmente o código desenvolvido com o SageMaker Studio para o Apache Airflow. Existem duas maneiras de executar trabalhos do SageMaker no Apache Airflow:

Usando operadores Amazon SageMaker
utilização Operadores Python : Escreva uma função Python com o Amazon SageMaker Python SDK no Apache Airflow e importe-a como um parâmetro que pode ser chamado

def transform(dt, bucket, training_job, **kwargs): estimator = sagemaker.estimator.Estimator.attach(training_job) transformer = estimator.transformer(instance_count=1, instance_type='ml.m4.xlarge', output_path=f's3://{bucket}/.../dt={dt}', max_payload=1) transformer.transform(data=f's3://{bucket}/.../dt={dt}', data_type='S3Prefix', content_type='application/x-image', split_type='None') transformer.wait() … transform_op = PythonOperator( task_id='transform', dag=dag, provide_context=True, python_callable=transform, op_kwargs={"dt": dt, "bucket": bucket, "training_job": training_job})

A segunda opção deixe-nos manter nosso Python existente códigos que já tínhamos no SageMaker Studio, e não foi necessário aprender novas gramáticas para operadores do Amazon SageMaker.

No entanto, passamos por algumas tentativas e erros, pois foi a primeira vez que integramos o Apache Airflow ao Amazon SageMaker. As lições que aprendemos foram:

Atualização do Boto3: o Amazon SageMaker Python SDK versão 2 exigia o Boto3 1.14.12 ou mais recente. Portanto, precisávamos atualizar a versão Boto3 do nosso ambiente Apache Airflow existente, que era 1.13.4.
Herança de função e permissão do IAM: as funções do AWS IAM usadas pelo Apache Airflow precisavam herdar funções que pudessem executar o Amazon SageMaker.
Configuração de rede: para executar códigos SageMaker com Apache Airflow, seus endpoints precisavam ser configurados para conexões de rede. Os endpoints a seguir foram baseados nas regiões e serviços da AWS que estávamos usando. Para obter mais informações, consulte o Site da AWS.
1. api.sagemaker.ap-northeast-2.amazonaws.com
2. runtime.sagemaker.ap-northeast-2.amazonaws.com
3. aws.sagemaker.ap-northeast-2.studio

Focados no Negócio

Ao automatizar os processos de inspeção de imagens de revisão, obtivemos os seguintes resultados de negócios:

Maior eficiência de trabalho – Atualmente, 76% das imagens das categorias onde o serviço foi aplicado são inspecionadas automaticamente com precisão de inspeção de 98%.
Consistência na concessão de créditos – Os créditos são concedidos com base em critérios claros. No entanto, houve ocasiões em que os créditos foram atribuídos de forma diferente para casos semelhantes devido a diferenças nos julgamentos dos inspectores. O modelo ML aplica regras de forma mais consistente e com maior consistência na aplicação das nossas políticas de crédito.
Erros humanos reduzidos – Todo envolvimento humano acarreta um risco de erros humanos. Por exemplo, tivemos casos em que critérios de Revisão de Estilo foram usados para Avaliações de Produtos. Nosso modelo de inspeção automática reduziu drasticamente os riscos desses erros humanos.

Obtivemos os seguintes benefícios especificamente ao usar o Amazon SageMaker para automatizar o processo de inspeção de imagens:

Estabelecemos um ambiente onde podemos construir e testar modelos através de processos modulares – O que mais gostamos no Amazon SageMaker é que ele consiste em módulos. Isso nos permite construir e testar serviços com facilidade e rapidez. Obviamente, inicialmente, precisávamos de algum tempo para aprender sobre o Amazon SageMaker, mas, uma vez aprendido, poderíamos aplicá-lo facilmente em nossas operações. Acreditamos que o Amazon SageMaker é ideal para empresas que necessitam de desenvolvimento rápido de serviços, como é o caso da Loja MUSINSA.
Colete dados de entrada confiáveis com o Amazon SageMaker Ground Truth – A coleta de dados de entrada está se tornando cada vez mais importante do que a própria modelagem na área de ML. Com o rápido avanço do ML, os modelos pré-treinados podem ter um desempenho muito melhor do que antes e sem ajustes adicionais. O AutoML também eliminou a necessidade de escrever códigos para modelagem de ML. Portanto, a capacidade de coletar dados de entrada de qualidade é mais importante do que nunca, e o uso de serviços de rotulagem como o Amazon SageMaker Ground Truth é fundamental.

Conclusão

No futuro, planejamos automatizar não apenas o atendimento de modelos, mas também o treinamento de modelos por meio de lotes automáticos. Queremos que nosso modelo identifique automaticamente os hiperparâmetros ideais quando novos rótulos ou imagens forem adicionados. Além disso, continuaremos a melhorar o desempenho do nosso modelo, nomeadamente recalls e precisão, com base no método de treino automatizado anteriormente mencionado. Aumentaremos a cobertura do nosso modelo para que ele possa inspecionar mais imagens de revisão, reduzir mais custos e obter maior precisão, o que levará a uma maior satisfação do cliente.

Para obter mais informações sobre como usar Amazon Sage Maker para resolver seus problemas de negócios usando ML, visite o página do produto. E, como sempre, mantenha-se atualizado com as últimas Notícias sobre aprendizado de máquina da AWS aqui.

O conteúdo e as opiniões desta postagem são de responsabilidade do autor terceirizado e a AWS não é responsável pelo conteúdo ou precisão desta postagem.

Sobre os autores

Parque Jihye é Cientista de Dados na MUSINSA responsável pela análise e modelagem de dados. Ela adora trabalhar com dados onipresentes, como comércio eletrônico. Sua função principal é modelagem de dados, mas ela também tem interesse em engenharia de dados.

Sung Min Kim é arquiteto de soluções sênior na Amazon Web Services. Ele trabalha com startups para arquitetar, projetar, automatizar e criar soluções na AWS para suas necessidades de negócios. Ele é especialista em IA/ML e Analytics.

Fonte: https://aws.amazon.com/blogs/machine-learning/develop-an-automatic-review-image-inspection-service-with-amazon-sagemaker/

Carimbo de hora: 10 de janeiro de 2022

Carimbo de hora: Julho 30, 2021

Republicado por Platão

Use ferramentas de explicabilidade integradas e melhore a qualidade do modelo usando o Amazon SageMaker Autopilot

Detecte fraudes em transações online com os novos recursos do Amazon Fraud Detector

Anote dados de nuvem de pontos densos usando SageMaker Ground Truth

Fluxo de trabalho de aprendizado ativo para modelos de classificação personalizados da Amazon Comprehend - Parte 1

Crie sua própria detecção e visibilidade de marca usando Amazon SageMaker Ground Truth e Amazon Rekognition Custom Labels - Parte 2: fluxos de trabalho de treinamento e análise

Personalize a saída do Amazon Translate para atender ao seu vocabulário específico de domínio e organização

Pós-processamento com Amazon Textract: manipulação de tabelas com várias páginas

Analise a probabilidade de rotatividade de clientes usando a transcrição de chamadas e perfis de clientes com o Amazon SageMaker

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta