تور PGA به بهبود تجربه گلف با دادههای بیدرنگ ادامه میدهد که طرفداران را به بازی نزدیکتر میکند. برای ارائه تجربیات غنی تر، آنها در حال توسعه نسل بعدی سیستم ردیابی موقعیت توپ هستند که به طور خودکار موقعیت توپ را در زمین سبز ردیابی می کند.
TOUR در حال حاضر از ShotLink مجهز به CDW استفاده میکند، یک سیستم امتیازدهی برتر که از یک سیستم دوربین پیچیده با محاسبه در محل استفاده میکند تا موقعیت شروع و پایان هر عکس را از نزدیک ردیابی کند. TOUR میخواست تکنیکهای بینایی کامپیوتر و یادگیری ماشین (ML) را برای توسعه نسل بعدی خط لوله مبتنی بر ابر برای قرار دادن توپهای گلف در فضای سبز کشف کند.
مرکز نوآوری هوش مصنوعی آمازون (GAIIC) اثربخشی این تکنیکها را در یک مجموعه داده نمونه از رویداد اخیر PGA TOUR نشان داد. GAIIC یک خط لوله مدولار را طراحی کرد که مجموعهای از شبکههای عصبی کانولوشن عمیق را تشکیل میدهد که با موفقیت بازیکنان را در میدان دید دوربین بومیسازی میکند، تعیین میکند کدام بازیکن قرار است و توپ را در حالی که به سمت جام حرکت میکند ردیابی میکند.
در این پست، توسعه این خط لوله، داده های خام، طراحی شبکه های عصبی کانولوشنال شامل خط لوله، و ارزیابی عملکرد آن را شرح می دهیم.
داده ها
تور 3 روز ویدیوی پیوسته از یک تورنمنت اخیر را از سه دوربین 4K که در اطراف سبزه روی یک سوراخ قرار گرفته بودند ارائه کرد. شکل زیر یک فریم از یک دوربین را نشان میدهد که برش داده شده و بزرگنمایی شده است تا پخش کننده به راحتی قابل مشاهده باشد. توجه داشته باشید که علیرغم وضوح بالای دوربین ها، به دلیل دوری از رنگ سبز، توپ کوچک به نظر می رسد (معمولاً 3×3، 4×4 یا 5×5 پیکسل) و مکان یابی دقیق اهداف با این اندازه دشوار است.
علاوه بر فید دوربین، TOUR دادههای امتیازدهی مشروح در هر عکس، از جمله مکان جهانی موقعیت استراحت و مهر زمانی را به GAIIC ارائه کرد. این امکان تجسم هر ضربه زدن روی رنگ سبز و همچنین توانایی کشیدن تمام کلیپهای ویدیویی بازیکنانی که قرار میدهند را میدهد، که میتوان به صورت دستی برچسبگذاری شده و برای آموزش مدلهای تشخیص که خط لوله را تشکیل میدهند، استفاده کرد. شکل زیر سه نمای دوربین را با همپوشانی های تقریبی مسیر ارسال توپ، در خلاف جهت عقربه های ساعت از بالا سمت چپ نشان می دهد. پین هر روز جابهجا میشود، جایی که روز 1 مربوط به آبی، روز 2 به قرمز و روز 3 به نارنجی است.
نمای کلی خط لوله
سیستم کلی هم از یک خط لوله آموزشی و هم از خط لوله استنتاج تشکیل شده است. نمودار زیر معماری خط لوله آموزشی را نشان می دهد. نقطه شروع، دریافت داده های ویدئویی است، یا از یک ماژول استریم مانند آمازون کینسیس برای ویدیوی زنده یا قرار دادن مستقیم در سرویس ذخیره سازی ساده آمازون (Amazon S3) برای ویدیوی تاریخی. خط لوله آموزشی نیاز به پیش پردازش ویدئو و برچسب گذاری دستی تصاویر با Amazon SageMaker Ground Truth. مدل ها را می توان با آمازون SageMaker و مصنوعات آنها با آمازون S3 ذخیره شده است.
خط لوله استنتاج، که در نمودار زیر نشان داده شده است، از تعدادی ماژول تشکیل شده است که به طور متوالی اطلاعات را از ویدیوی خام استخراج می کنند و در نهایت مختصات جهانی توپ را در حالت استراحت پیش بینی می کنند. در ابتدا، رنگ سبز از میدان دید بزرگتر هر دوربین بریده می شود تا ناحیه پیکسلی که مدل ها باید در آن بازیکنان و توپ ها را جستجو کنند، کاهش یابد. سپس، یک شبکه عصبی کانولوشن عمیق (CNN) برای یافتن مکان افراد در میدان دید استفاده می شود. CNN دیگری برای پیشبینی اینکه کدام نوع از افراد پیدا شده است استفاده میشود تا مشخص شود آیا کسی در شرف زدن است یا خیر. پس از اینکه یک ضربه گیر احتمالی در میدان دید بومی سازی شد، از همان شبکه برای پیش بینی موقعیت توپ در نزدیکی توپگر استفاده می شود. سومین CNN توپ را در طول حرکت آن ردیابی می کند و در نهایت، یک تابع تبدیل از موقعیت پیکسل دوربین به مختصات GPS اعمال می شود.
تشخیص بازیکن
اگرچه میتوان یک سیانان را برای تشخیص توپ در یک فریم 4K در یک بازه زمانی مشخص اجرا کرد، با توجه به اندازه زاویهای توپ در این فواصل دوربین، هر جسم سفید کوچکی باعث تشخیص میشود و در نتیجه آلارمهای کاذب بسیاری ایجاد میشود. برای جلوگیری از جستجوی کل قاب تصویر برای توپ، می توان از همبستگی بین ژست بازیکن و مکان توپ استفاده کرد. توپی که قرار است قرار گیرد باید در کنار بازیکن باشد، بنابراین یافتن بازیکنان در میدان دید، ناحیه پیکسلی را که آشکارساز باید در آن توپ را جستجو کند، بسیار محدود میکند.
همانطور که در شکل زیر نشان داده شده است، توانستیم از یک CNN استفاده کنیم که از قبل برای پیشبینی جعبههای مرزی در اطراف همه افراد در یک صحنه آموزش داده شده بود. متأسفانه، اغلب بیش از یک توپ در زمین سبز وجود دارد، بنابراین منطق بیشتری فراتر از یافتن همه افراد و جستجوی یک توپ لازم است. این به CNN دیگری نیاز دارد تا پخش کننده ای را که در حال حاضر قرار داده بود پیدا کند.
طبقه بندی بازیکنان و تشخیص توپ
برای محدودتر کردن موقعیت توپ، یک سیانان تشخیص شی از پیش آموزشدیده (YOLO v7) را بهخوبی تنظیم کردیم تا همه افراد روی زمین سبز را طبقهبندی کنیم. یکی از اجزای مهم این فرآیند برچسب زدن دستی مجموعه ای از تصاویر با استفاده از SageMaker Ground Truth بود. این برچسبها به CNN اجازه میداد تا پخش کننده را با دقت بالا طبقهبندی کند. در فرآیند برچسبگذاری، توپ به همراه بازیکن در حال قرار دادن مشخص شد، بنابراین این سیانان قادر به تشخیص توپ نیز بود، یک جعبه محدودکننده اولیه در اطراف توپ قبل از ضربه زدن ترسیم کرد و اطلاعات موقعیت را به سیانان ردیابی توپ پاییندست داد. .
ما از چهار برچسب مختلف برای حاشیه نویسی اشیاء در تصاویر استفاده می کنیم:
- بازیکن قرار دادن - بازیکنی که یک باشگاه در دست دارد و در موقعیت قرار دارد
- بازیکن-نگذار - بازیکنی که در موقعیت قرار دادن نیست (ممکن است یک باشگاه نیز در اختیار داشته باشد)
- شخص دیگر - هر شخص دیگری که بازیکن نیست
- توپ گلف - توپ گلف
شکل زیر نشان میدهد که یک CNN با استفاده از برچسبهای SageMaker Ground Truth برای طبقهبندی هر فرد در میدان دید بهخوبی تنظیم شده است. این امر به دلیل گستره وسیعی از ظاهر بصری بازیکنان، بازیکنان و طرفداران دشوار است. پس از طبقهبندی یک بازیکن بهعنوان بازیکن، یک سیانان بهخوبی تنظیم شده برای تشخیص توپ روی ناحیه کوچک بلافاصله اطراف آن پخشکننده اعمال شد.
ردیابی مسیر توپ
سومین CNN، یک معماری ResNet که از قبل برای ردیابی حرکت آموزش داده شده بود، برای ردیابی توپ پس از قرار دادن آن استفاده شد. ردیابی حرکت یک مشکل کاملاً تحقیق شده است، بنابراین این شبکه در صورت ادغام در خط لوله بدون تنظیم دقیق بیشتر عملکرد خوبی داشت.
خروجی خط لوله
آبشار سیانانها جعبههای مرزی را در اطراف افراد قرار میدهد، افراد را در رنگ سبز طبقهبندی میکند، موقعیت اولیه توپ را تشخیص میدهد و هنگامی که توپ شروع به حرکت کرد، آن را ردیابی میکند. شکل زیر خروجی ویدیوی برچسب گذاری شده خط لوله را نشان می دهد. موقعیت پیکسل های توپ در حین حرکت ردیابی و ثبت می شود. توجه داشته باشید که افراد روی سبز با کادرهای محدود ردیابی و مشخص می شوند. برنده در پایین به درستی به عنوان "بازیکن قرار دادن" برچسب گذاری شده است، و توپ متحرک توسط یک جعبه کوچک آبی رنگ ردیابی و مشخص می شود.
عملکرد
برای ارزیابی عملکرد اجزای خط لوله، داشتن داده های برچسب گذاری شده ضروری است. اگرچه موقعیت جهانی حقیقت زمینی توپ در اختیار ما قرار گرفته بود، اما نقاط میانی برای حقیقت زمین، مانند موقعیت پیکسل نهایی توپ یا مکان پیکسل بازیکنی که قرار می دهد، نداشتیم. با کار برچسبزنی که انجام دادیم، دادههای حقیقت زمینی را برای این خروجیهای میانی خط لوله توسعه دادیم که به ما امکان میدهد عملکرد را اندازهگیری کنیم.
طبقه بندی بازیکنان و دقت تشخیص توپ
برای شناسایی بازیکنی که قرار است توپ و مکان اولیه توپ را شناسایی کنیم، یک مجموعه داده را برچسب گذاری کردیم و یک مدل YOLO v7 CNN را همانطور که قبلاً توضیح داده شد، تنظیم دقیق کردیم. همانطور که در شکل زیر نشان داده شده است، این مدل خروجی ماژول تشخیص شخص قبلی را به چهار کلاس طبقه بندی کرد: بازیکنی که قرار می دهد، بازیکنی که قرار نمی دهد، افراد دیگر و توپ گلف.
عملکرد این ماژول با یک ماتریس سردرگمی که در شکل زیر نشان داده شده است، ارزیابی شده است. مقادیر موجود در کادرهای مورب نشان میدهند که کلاس پیشبینیشده چقدر با کلاس واقعی از برچسبهای حقیقت زمینی مطابقت دارد. این مدل دارای 89% یادآوری یا بهتر برای هر کلاس فردی و 79% یادآوری برای توپهای گلف است (که قابل انتظار است زیرا مدل از قبل روی نمونههایی با افراد آموزش داده شده است، اما در نمونههایی با توپ گلف، این را میتوان بهبود بخشید. توپ های گلف با برچسب بیشتر در مجموعه آموزشی).
مرحله بعدی فعال کردن ردیاب توپ است. از آنجا که خروجی تشخیص توپ یک احتمال اطمینان است، همچنین می توان آستانه را برای "توپ شناسایی شده" تنظیم کرد و مشاهده کرد که چگونه نتایج را تغییر می دهد، که در شکل زیر خلاصه شده است. در این روش یک معاوضه وجود دارد زیرا آستانه بالاتر لزوماً آلارمهای کاذب کمتری خواهد داشت، اما برخی از نمونههای کمتر مطمئن توپ را نیز از دست میدهد. ما آستانه های 20% و 50% اطمینان را آزمایش کردیم و تشخیص توپ را به ترتیب 78% و 61% یافتیم. با این معیار، آستانه 20 درصد بهتر است. این مبادله از این جهت آشکار است که برای آستانه اطمینان 20 درصد، 80 درصد از کل تشخیص ها در واقع توپ بودند (20 درصد مثبت کاذب)، در حالی که برای آستانه اطمینان 50 درصد، 90 درصد توپ بودند (10 درصد مثبت کاذب). برای موارد مثبت کاذب کمتر، آستانه اطمینان 50 درصد بهتر است. هر دوی این اقدامات را می توان با داده های برچسب گذاری شده بیشتر برای مجموعه آموزشی بزرگتر بهبود بخشید.
توان عملیاتی خط لوله تشخیص حدود 10 فریم در ثانیه است، بنابراین در شکل فعلی، یک نمونه به اندازه کافی سریع نیست که به طور مداوم روی ورودی با سرعت 50 فریم در ثانیه اجرا شود. دستیابی به علامت 7 ثانیه برای خروجی پس از مراحل توپ نیاز به بهینه سازی بیشتر برای تأخیر دارد، شاید با اجرای چندین نسخه از خط لوله به صورت موازی و فشرده سازی مدل های CNN از طریق کوانتیزاسیون (به عنوان مثال).
دقت ردیابی مسیر توپ
مدل CNN از پیش آموزش دیده از MMTracking به خوبی کار می کند، اما موارد شکست جالبی وجود دارد. شکل زیر یک مورد را نشان می دهد که در آن ردیاب روی توپ شروع می شود، جعبه مرزی خود را گسترش می دهد تا هم سر و هم توپ را در بر بگیرد و سپس متأسفانه سر پرتاب کننده را دنبال می کند و توپ را فراموش می کند. در این مورد، سر پرتاب کننده سفید به نظر می رسد (احتمالاً به دلیل انعکاس چشمی)، بنابراین سردرگمی قابل درک است. داده های برچسب گذاری شده برای ردیابی و تنظیم دقیق ردیابی CNN می تواند به بهبود این امر در آینده کمک کند.
نتیجه
در این پست، توسعه یک خط لوله مدولار را مورد بحث قرار دادیم که بازیکنان را در میدان دید دوربین قرار میدهد، تعیین میکند کدام بازیکن قرار میدهد و توپ را در حالی که به سمت جام حرکت میکند، ردیابی میکند.
برای اطلاعات بیشتر در مورد همکاری AWS با PGA TOUR، مراجعه کنید PGA TOUR با AWS آماده می شود تا تجربه طرفداران را دوباره تصور کنید.
درباره نویسنده
جیمز گلدن یک دانشمند کاربردی در Amazon Bedrock با پیشینه یادگیری ماشین و علوم اعصاب است.
هنری وانگ یک دانشمند کاربردی در مرکز نوآوری هوش مصنوعی آمازون است که در آنجا به تحقیق و ساخت راهحلهای هوش مصنوعی مولد برای مشتریان AWS میپردازد. او روی ورزش و صنعت رسانه و سرگرمی تمرکز دارد و در گذشته با لیگ های ورزشی، تیم ها و پخش کننده های مختلف کار کرده است. او در اوقات فراغت خود دوست دارد تنیس و گلف بازی کند.
تریامبک گنگوپادهای یک دانشمند کاربردی در مرکز نوآوری AWS Generative AI است، جایی که او با سازمان ها در طیف متنوعی از صنایع همکاری می کند. نقش او شامل انجام تحقیقات و توسعه راهحلهای هوش مصنوعی برای مقابله با چالشهای مهم تجاری و تسریع پذیرش هوش مصنوعی است.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/ball-position-tracking-in-the-cloud-with-the-pga-tour/
- : دارد
- :است
- :نه
- :جایی که
- $UP
- 1
- 10
- 100
- 4k
- دوربین های 4K
- 50
- a
- توانایی
- قادر
- درباره ما
- شتاب دادن
- دقت
- به درستی
- دستیابی به
- در میان
- واقعی
- واقعا
- اضافه
- نشانی
- اتخاذ
- مزیت - فایده - سود - منفعت
- پس از
- AI
- پذیرش هوش مصنوعی
- معرفی
- اجازه دادن
- مجاز
- در امتداد
- همچنین
- هر چند
- آمازون
- آمازون خدمات وب
- an
- و
- گوشه دار
- دیگر
- هر
- هر کس
- ظاهر
- حضور
- ظاهر می شود
- اعمال می شود
- تقریبی
- معماری
- هستند
- محدوده
- دور و بر
- AS
- ارزیابی کنید
- ارزیابی
- At
- بطور خودکار
- اجتناب از
- AWS
- زمینه
- توپ
- BE
- زیرا
- بوده
- قبل از
- بودن
- بهتر
- میان
- خارج از
- آبی
- هر دو
- پایین
- جعبه
- جعبه
- به ارمغان می آورد
- می سازد
- کسب و کار
- اما
- by
- دوربین
- دوربین
- CAN
- انجام
- ابشاری
- مورد
- موارد
- مرکز
- معین
- چالش ها
- تبادل
- کلاس
- کلاس ها
- طبقه بندی
- طبقه بندی
- طبقه بندی کنید
- کلیپ های
- نزدیک
- نزدیک
- ابر
- باشگاه
- CNN
- همکاری
- پیچیده
- جزء
- اجزاء
- شامل
- محاسبه
- کامپیوتر
- چشم انداز کامپیوتر
- انجام
- اعتماد به نفس
- گیجی
- تشکیل شده است
- ادامه
- مداوم
- به طور مداوم
- شبکه عصبی حلقوی
- به درستی
- همبستگی
- مطابقت دارد
- میتوانست
- بسیار سخت
- فنجان
- جاری
- در حال حاضر
- مشتریان
- برش
- داده ها
- روز
- روز
- عمیق
- ارائه
- نشان
- توصیف
- شرح داده شده
- طرح
- طراحی
- با وجود
- کشف
- مشخص کردن
- تعیین می کند
- توسعه
- توسعه
- در حال توسعه
- پروژه
- مختلف
- مشکل
- مستقیما
- بحث کردیم
- فاصله
- مختلف
- پایین
- رسم
- دو
- در طی
- هر
- هر فرد
- پیش از آن
- به آسانی
- اثر
- هر دو
- پایان
- بالا بردن
- کافی
- سرگرمی
- تمام
- اتر (ETH)
- ارزیابی
- حتی
- واقعه
- هر
- مثال
- مثال ها
- گسترش می یابد
- انتظار می رود
- تجربه
- تجارب
- اکتشاف
- عصاره
- شکست
- غلط
- پنکه
- طرفداران
- FAST
- تغذیه
- کمتر
- رشته
- شکل
- نهایی
- پیدا کردن
- پیدا کردن
- تمرکز
- پیروی
- برای
- فرم
- یافت
- چهار
- FRAME
- غالبا
- از جانب
- تابع
- بیشتر
- آینده
- بازی
- مولد
- هوش مصنوعی مولد
- داده
- گلف
- GPS
- تا حد زیادی
- سبز
- زمین
- دست
- آیا
- he
- سر
- کمک
- زیاد
- بالاتر
- خود را
- تاریخی
- برگزاری
- سوراخ
- چگونه
- HTTP
- HTTPS
- نشان می دهد
- تصویر
- تصاویر
- بلافاصله
- مهم
- بهبود
- بهبود یافته
- in
- شامل
- از جمله
- لوازم
- اطلاعات
- اول
- در ابتدا
- ابداع
- ورودی
- نمونه
- یکپارچه
- جالب
- حد واسط
- به
- شامل
- IT
- ITS
- کار
- JPG
- برچسب
- برچسب ها
- بزرگتر
- در آخر
- تاخیر
- لیگ ها
- یادگیری
- ترک کرد
- کمتر
- پسندیدن
- احتمالا
- دوست دارد
- زنده
- محل
- مکان
- منطق
- دستگاه
- فراگیری ماشین
- ساخت
- دستی
- بسیاری
- علامت
- تطبیق
- ماتریس
- ممکن است..
- اندازه
- معیارهای
- رسانه ها
- روش
- از دست
- ML
- مدل
- مدل
- پیمانهای
- واحد
- ماژول ها
- بیش
- حرکت
- نقل مکان کرد
- حرکت می کند
- متحرک
- چندگانه
- باید
- نزدیک
- لزوما
- لازم
- شبکه
- شبکه
- عصبی
- شبکه های عصبی
- شبکه های عصبی
- علوم اعصاب
- بعد
- نسل بعدی
- توجه داشته باشید
- عدد
- هدف
- اشیاء
- مشاهده کردن
- of
- غالبا
- on
- یک بار
- ONE
- بهینه سازی
- or
- نارنجی
- سفارش
- سازمان های
- دیگر
- خارج
- مشخص شده
- تولید
- خروجی
- روی
- به طور کلی
- موازی
- گذشته
- مسیر
- مردم
- برای
- انجام دادن
- کارایی
- انجام
- شاید
- شخص
- تور PGA
- خط لوله
- پیکسل
- کاریابی
- اماکن
- افلاطون
- هوش داده افلاطون
- PlatoData
- بازی
- بازیکن
- بازیکنان
- نقطه
- نقطه
- موقعیت
- موقعیت یابی شده
- موقعیت
- مثبت
- ممکن
- احتمالا
- پست
- صفحه اصلی
- پیش بینی
- پیش بینی
- نخست وزیر
- قبلی
- احتمال
- مشکل
- روند
- ارائه
- پیگیری
- قرار دادن
- محدوده
- خام
- داده های خام
- زمان واقعی
- داده های زمان واقعی
- اخیر
- ثبت
- قرمز
- مراجعه
- انعکاس
- نیاز
- ضروری
- نیاز
- تحقیق
- تحقیقات
- وضوح
- به ترتیب
- REST
- استراحت كردن
- محدود کردن
- نتیجه
- نتایج
- نقش
- دویدن
- در حال اجرا
- حکیم ساز
- همان
- صحنه
- دانشمند
- به ثمر رساندن
- جستجو
- جستجو
- دوم
- سلسله
- خدمات
- تنظیم
- عکس
- نشان
- نشان داده شده
- نشان می دهد
- ساده
- به سادگی
- تنها
- اندازه
- کوچک
- So
- مزایا
- برخی از
- طیف
- ورزش ها
- شروع
- راه افتادن
- شروع می شود
- گام
- مراحل
- ذخیره سازی
- ذخیره شده
- جریان
- موفقیت
- سیستم
- گرفتن
- اهداف
- تیم ها
- تکنیک
- تنیس
- آزمایش
- نسبت به
- که
- La
- آینده
- جهان
- شان
- سپس
- آنجا.
- اینها
- آنها
- سوم
- این
- به طور کامل
- سه
- آستانه
- توان
- زمان
- برچسب زمان
- به
- بالا
- جمع
- سفر
- مسابقه
- نسبت به
- مسیر
- پیگردی
- قطار
- آموزش دیده
- آموزش
- دگرگونی
- ماشه
- حقیقت
- نوع
- در نهایت
- قابل فهم
- متاسفانه
- us
- استفاده کنید
- استفاده
- استفاده
- با استفاده از
- معمولا
- ارزشها
- مختلف
- از طريق
- تصویری
- چشم انداز
- نمایش ها
- قابل رویت
- دید
- بصری
- خواسته
- بود
- we
- وب
- خدمات وب
- خوب
- بود
- چه زمانی
- در حالیکه
- چه
- که
- سفید
- WHO
- وسیع
- دامنه گسترده
- اراده
- با
- در داخل
- بدون
- مشغول به کار
- با این نسخهها کار
- جهان
- خواهد بود
- یولو
- زفیرنت