Construire un modèle de détection d'objets pour identifier les plaques d'immatriculation à partir d'images de voitures

Nœud source: 749910

Ce modèle de code fait partie de la Premiers pas avec IBM Maximo Visual Inspection Parcours d'apprentissage.

Résumé

Dans ce modèle de code, découvrez comment utiliser la reconnaissance optique de caractères (OCR) et le service de reconnaissance d'objets IBM Maximo Visual Inspection pour identifier et lire les plaques d'immatriculation.

Description

À l'aide d'IBM Maximo Visual Inspection et des scripts d'inférence personnalisés, vous pouvez créer un modèle de détection d'objet pour identifier les plaques d'immatriculation à partir d'images de voitures. Les modèles du service de reconnaissance d'objets IBM Maximo Visual Inspection peuvent identifier des parties d'images représentant une plaque d'immatriculation. Ensuite, le script d'inférence post personnalisé peut recadrer cette zone et utiliser l'open source pour effectuer l'OCR sur le texte afin de renvoyer la plaque d'immatriculation. Ce cas d'utilisation est idéal pour le contrôle d'accès automatisé des portes dans des zones telles que les lieux de travail, les complexes d'appartements ou les parkings des centres commerciaux.

Lorsque vous avez terminé ce modèle de code, vous comprenez comment:

  • Construire un modèle de détection d'objets
  • Déclenchez un script de post-traitement lorsque des objets spécifiques sont détectés
  • Utilisez Python Opencv bibliothèques pour préparer une image pour l'OCR
  • Ajustez Tesseract OCR pour détecter des polices spécifiques

Flow

OCR license plate flow diagram

  1. L'utilisateur télécharge une image d'une voiture dans IBM Maximo Visual Inspection, via l'interface utilisateur ou via un appel API REST.
  2. Le modèle PowerAI reconnaît les objets dans l'image et indique où se trouve la plaque d'immatriculation dans l'image.
  3. Le script de post-traitement IBM Maximo Visual Inspection envoie l'image de plaque d'immatriculation recadrée au serveur OCR personnalisé.
  4. Un script Python charge l'image de la plaque d'immatriculation via opencv comme un tableau NumPy et utilise plusieurs algorithmes de traitement pour supprimer le bruit de fond et extraire les chiffres de la plaque.
  5. Tesseract OCR est utilisé sur l'image traitée.
  6. L'utilisateur reçoit un objet JSON avec le texte de la plaque via les journaux du terminal.

Instructions

Trouvez les étapes détaillées de ce modèle dans le readme fichier. Les étapes vous montrent comment:

  1. Déployez un cluster Kubernetes.
  2. Téléchargez les images de formation dans IBM Maximo Visual Inspection.
  3. Former et déployer un modèle dans IBM Maximo Visual Inspection.
  4. Clonez le référentiel.
  5. Déployez le serveur OCR.

Conclusion

Ce modèle de code expliquait comment utiliser l'OCR et le service de reconnaissance d'objets IBM Maximo Visual Inspection pour identifier et lire les plaques d'immatriculation. Le modèle de code est la dernière partie de la Premiers pas avec IBM Maximo Visual Inspection Parcours d'apprentissage. Toutes nos félicitations! Vous devez maintenant avoir une compréhension fondamentale d'IBM Maximo Visual Inspection et de certaines de ses fonctionnalités avancées. Mais, si vous voulez en savoir plus, jetez un œil à la Inspection visuelle IBM Maximo .

Source : https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Horodatage:

Plus de Développeur IBM