গাড়ির ছবি থেকে লাইসেন্স প্লেট সনাক্ত করতে একটি বস্তু সনাক্তকরণ মডেল তৈরি করুন

উত্স নোড: 749910

এই কোড প্যাটার্ন এর অংশ IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন দিয়ে শুরু করা শেখার পথ.

সারাংশ

এই কোড প্যাটার্নে, লাইসেন্স প্লেটগুলি সনাক্ত করতে এবং পড়ার জন্য অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) এবং IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন অবজেক্ট রিকগনিশন পরিষেবা কীভাবে ব্যবহার করবেন তা শিখুন।

বিবরণ

IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন এবং কাস্টম ইনফারেন্স স্ক্রিপ্ট ব্যবহার করে, আপনি গাড়ির ছবি থেকে লাইসেন্স প্লেট সনাক্ত করতে একটি অবজেক্ট ডিটেকশন মডেল তৈরি করতে পারেন। আইবিএম ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন অবজেক্ট রিকগনিশন সার্ভিসের মডেলগুলি ছবিগুলির অংশগুলি সনাক্ত করতে পারে যা একটি লাইসেন্স প্লেটের প্রতিনিধিত্ব করে৷ তারপর, পোস্ট কাস্টম ইনফারেন্স স্ক্রিপ্ট এই এলাকাটি ক্রপ করতে পারে এবং লাইসেন্স প্লেট ফেরত দিতে পাঠ্যে OCR সম্পাদন করতে ওপেন সোর্স ব্যবহার করতে পারে। কর্মক্ষেত্র, অ্যাপার্টমেন্ট কমপ্লেক্স বা মল পার্কিং লটের মতো এলাকায় স্বয়ংক্রিয় গেট অ্যাক্সেস নিয়ন্ত্রণের জন্য এই ব্যবহারের ক্ষেত্রে আদর্শ।

যখন আপনি এই কোড প্যাটার্নটি সম্পন্ন করেন, তখন আপনি বুঝতে পারবেন কিভাবে:

  • একটি বস্তু সনাক্তকরণ মডেল তৈরি করুন
  • নির্দিষ্ট বস্তু সনাক্ত করা হলে একটি পোস্ট-প্রসেসিং স্ক্রিপ্ট ট্রিগার করুন
  • পাইথন ব্যবহার করুন Opencv ওসিআর-এর জন্য একটি ছবি প্রস্তুত করতে লাইব্রেরি
  • নির্দিষ্ট ফন্ট সনাক্ত করতে Tesseract OCR সামঞ্জস্য করুন

ফ্লো

OCR license plate flow diagram

  1. ব্যবহারকারী UI বা API REST কলের মাধ্যমে IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশনে একটি গাড়ির ছবি আপলোড করেন।
  2. PowerAI মডেলটি চিত্রের বস্তুগুলিকে চিনতে পারে এবং নির্দেশ করে যে লাইসেন্স প্লেটটি ছবিতে কোথায় অবস্থিত।
  3. IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন পোস্ট-প্রসেসিং স্ক্রিপ্ট কাস্টম ওসিআর সার্ভারে ক্রপ করা লাইসেন্স প্লেটের ছবি পাঠায়।
  4. একটি পাইথন স্ক্রিপ্ট লাইসেন্স প্লেটের ছবি লোড করে opencv একটি NumPy অ্যারে হিসাবে এবং ব্যাকগ্রাউন্ডের শব্দ অপসারণ করতে এবং প্লেটের সংখ্যাগুলি বের করতে বেশ কয়েকটি প্রক্রিয়াকরণ অ্যালগরিদম ব্যবহার করে।
  5. প্রসেসড ইমেজে Tesseract OCR ব্যবহার করা হয়।
  6. ব্যবহারকারী টার্মিনাল লগের মাধ্যমে প্লেট টেক্সট সহ একটি JSON অবজেক্ট পায়।

নির্দেশনা

এই প্যাটার্নটির জন্য বিশদ পদক্ষেপগুলি সন্ধান করুন রিডমি ফাইল। পদক্ষেপগুলি আপনাকে কীভাবে তা দেখায়:

  1. একটি Kubernetes ক্লাস্টার স্থাপন করুন।
  2. আইবিএম ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশনে প্রশিক্ষণের ছবি আপলোড করুন।
  3. আইবিএম ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশনে একটি মডেলকে প্রশিক্ষণ ও স্থাপন করুন।
  4. সংগ্রহস্থলটি ক্লোন করুন।
  5. OCR সার্ভার স্থাপন করুন।

উপসংহার

এই কোড প্যাটার্নটি ব্যাখ্যা করেছে কিভাবে লাইসেন্স প্লেট সনাক্ত করতে ও পড়ার জন্য OCR এবং IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন অবজেক্ট রিকগনিশন পরিষেবা ব্যবহার করতে হয়। কোড প্যাটার্ন হল এর চূড়ান্ত অংশ IBM ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন দিয়ে শুরু করা শেখার পথ। অভিনন্দন! আপনার এখন আইবিএম ম্যাক্সিমো ভিজ্যুয়াল ইন্সপেকশন এবং এর কিছু উন্নত বৈশিষ্ট্য সম্পর্কে একটি মৌলিক ধারণা থাকা উচিত। কিন্তু, আপনি যদি আরও জানতে চান, তাহলে দেখুন আইবিএম ম্যাক্সিমো ভিজ্যুয়াল পরিদর্শন পাতা.

সূত্র: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

সময় স্ট্যাম্প:

থেকে আরো আইবিএম বিকাশকারী