استخدم بيانات التنقل لاستخلاص الرؤى باستخدام القدرات الجغرافية المكانية لـ Amazon SageMaker | خدمات الويب الأمازون

استخدم بيانات التنقل لاستخلاص الرؤى باستخدام القدرات الجغرافية المكانية لـ Amazon SageMaker | خدمات الويب الأمازون

عقدة المصدر: 3067923

البيانات الجغرافية المكانية هي بيانات حول مواقع محددة على سطح الأرض. يمكن أن يمثل منطقة جغرافية ككل أو يمكن أن يمثل حدثًا مرتبطًا بمنطقة جغرافية. يتم البحث عن تحليل البيانات الجغرافية المكانية في عدد قليل من الصناعات. يتضمن فهم مكان وجود البيانات من منظور مكاني وسبب وجودها هناك.

هناك نوعان من البيانات الجغرافية المكانية: البيانات المتجهة والبيانات النقطية. البيانات النقطية عبارة عن مصفوفة من الخلايا ممثلة على شكل شبكة، تمثل في الغالب صورًا فوتوغرافية وصور الأقمار الصناعية. في هذا المنشور، نركز على البيانات المتجهة، والتي يتم تمثيلها كإحداثيات جغرافية لخطوط الطول والعرض بالإضافة إلى الخطوط والمضلعات (المناطق) التي تربطها أو تحيط بها. تحتوي بيانات المتجهات على العديد من حالات الاستخدام في استخلاص رؤى التنقل. تعد بيانات الهاتف المحمول للمستخدم أحد هذه المكونات، وهي مستمدة في الغالب من الموقع الجغرافي للأجهزة المحمولة التي تستخدم نظام تحديد المواقع العالمي (GPS) أو ناشري التطبيقات الذين يستخدمون أدوات تطوير البرامج (SDK) أو عمليات تكامل مماثلة. ولأغراض هذا المنشور، نشير إلى هذه البيانات باسم بيانات التنقل.

هذه سلسلة من جزأين. في هذه المقالة الأولى، نقدم بيانات التنقل ومصادرها ومخططًا نموذجيًا لهذه البيانات. نناقش بعد ذلك حالات الاستخدام المختلفة ونستكشف كيف يمكنك استخدام خدمات AWS لتنظيف البيانات، وكيف يمكن للتعلم الآلي (ML) أن يساعد في هذا الجهد، وكيف يمكنك الاستفادة بشكل أخلاقي من البيانات في إنشاء مرئيات ورؤى. سيكون المنشور الثاني أكثر تقنية بطبيعته وسيغطي هذه الخطوات بالتفصيل جنبًا إلى جنب مع نموذج التعليمات البرمجية. لا يحتوي هذا المنشور على نموذج لمجموعة بيانات أو نموذج للتعليمات البرمجية، ولكنه يغطي كيفية استخدام البيانات بعد شرائها من مجمع البيانات.

يمكنك استخدام قدرات Amazon SageMaker الجغرافية المكانية لتراكب بيانات التنقل على خريطة أساسية وتوفير تصور متعدد الطبقات لتسهيل التعاون. يوفر المتخيل التفاعلي المدعوم بوحدة معالجة الرسومات وأجهزة الكمبيوتر المحمولة Python طريقة سلسة لاستكشاف ملايين نقاط البيانات في نافذة واحدة ومشاركة الأفكار والنتائج.

المصادر والمخطط

هناك مصادر قليلة لبيانات التنقل. وبصرف النظر عن أصوات نظام تحديد المواقع العالمي (GPS) وناشري التطبيقات، يتم استخدام مصادر أخرى لزيادة مجموعة البيانات، مثل نقاط وصول Wi-Fi، وبيانات تدفق العطاءات التي يتم الحصول عليها من خلال عرض الإعلانات على الأجهزة المحمولة، وأجهزة إرسال الأجهزة المحددة التي تضعها الشركات (على سبيل المثال، في المتاجر الفعلية) ). غالبًا ما يكون من الصعب على الشركات جمع هذه البيانات بنفسها، لذلك قد تقوم بشرائها من مجمعي البيانات. يقوم مجمعو البيانات بجمع بيانات التنقل من مصادر مختلفة، وتنظيفها، وإضافة الضوضاء، وإتاحة البيانات على أساس يومي لمناطق جغرافية محددة. نظرًا لطبيعة البيانات نفسها وصعوبة الحصول عليها، يمكن أن تختلف دقة وجودة هذه البيانات بشكل كبير، والأمر متروك للشركات لتقييم ذلك والتحقق منه باستخدام مقاييس مثل المستخدمين النشطين يوميًا، وإجمالي الأصوات اليومية، ومتوسط ​​الأصوات اليومية لكل جهاز. يوضح الجدول التالي الشكل الذي قد يبدو عليه المخطط النموذجي لخلاصة البيانات اليومية المرسلة بواسطة مجمعي البيانات.

السمة الوصف
معرف أو خادمة معرف إعلانات الجوال (MAID) للجهاز (مجزأ)
اللات خط العرض للجهاز
الغاز الطبيعي المسال طول الجهاز
com.geohash موقع Geohash للجهاز
نوع الجهاز نظام تشغيل الجهاز = IDFA أو GAID
Horizontal_accuracy دقة إحداثيات GPS الأفقية (بالأمتار)
الطابع الزمني الطابع الزمني للحدث
ip عنوان IP
ALT ارتفاع الجهاز (بالأمتار)
سرعة سرعة الجهاز (متر/ثانية)
البلد رمز ISO المكون من رقمين لبلد المنشأ
حالة رموز تمثل الدولة
مدن رموز تمثل المدينة
الرمز البريدي الرمز البريدي للمكان الذي يظهر فيه معرف الجهاز
الناقل الناقل للجهاز
الشركة المصنعة للجهاز الشركة المصنعة للجهاز

استخدم حالات

تتمتع بيانات التنقل بتطبيقات واسعة النطاق في صناعات متنوعة. فيما يلي بعض حالات الاستخدام الأكثر شيوعًا:

  • مقاييس الكثافة – يمكن الجمع بين تحليل حركة السير على الأقدام والكثافة السكانية لمراقبة الأنشطة والزيارات إلى النقاط المثيرة للاهتمام (POIs). تقدم هذه المقاييس صورة عن عدد الأجهزة أو المستخدمين الذين يتوقفون بنشاط عن العمل ويتفاعلون معه، والتي يمكن استخدامها أيضًا لاختيار الموقع أو حتى تحليل أنماط الحركة حول حدث ما (على سبيل المثال، الأشخاص الذين يسافرون لقضاء يوم للعب). للحصول على مثل هذه الرؤى، تمر البيانات الأولية الواردة عبر عملية استخراج وتحويل وتحميل (ETL) لتحديد الأنشطة أو المشاركات من التدفق المستمر لأصوات موقع الجهاز. يمكننا تحليل الأنشطة من خلال تحديد التوقفات التي قام بها المستخدم أو الجهاز المحمول عن طريق تجميع الأصوات باستخدام نماذج ML في الأمازون SageMaker.
  • الرحلات والمسارات – يمكن التعبير عن موجز الموقع اليومي للجهاز كمجموعة من الأنشطة (التوقفات) والرحلات (الحركة). يمكن أن يمثل زوج من الأنشطة رحلة بينهما، ويمكن أن يؤدي تتبع الرحلة بواسطة الجهاز المتحرك في الفضاء الجغرافي إلى رسم خريطة للمسار الفعلي. يمكن أن تؤدي أنماط مسار تحركات المستخدم إلى رؤى مثيرة للاهتمام مثل أنماط حركة المرور، واستهلاك الوقود، وتخطيط المدن، والمزيد. ويمكنه أيضًا توفير بيانات لتحليل المسار المأخوذ من نقاط الإعلان مثل لوحة الإعلانات، أو تحديد طرق التسليم الأكثر كفاءة لتحسين عمليات سلسلة التوريد، أو تحليل مسارات الإخلاء في الكوارث الطبيعية (على سبيل المثال، الإخلاء أثناء الإعصار).
  • تحليل منطقة مستجمعات المياه - A منطقة مستجمعات المياه يشير إلى الأماكن التي تجذب منطقة معينة منها زوارها، الذين قد يكونون عملاء أو عملاء محتملين. يمكن لشركات البيع بالتجزئة استخدام هذه المعلومات لتحديد الموقع الأمثل لفتح متجر جديد، أو تحديد ما إذا كان موقعا المتجر قريبين جدًا من بعضهما البعض مع وجود مناطق مستجمعات متداخلة ويعيق كل منهما أعمال الآخر. يمكنهم أيضًا معرفة المكان الذي يأتي منه العملاء الفعليون، وتحديد العملاء المحتملين الذين يمرون بالمنطقة أثناء سفرهم إلى العمل أو المنزل، وتحليل مقاييس الزيارة المماثلة للمنافسين، والمزيد. يمكن أيضًا لشركات تكنولوجيا التسويق (MarTech) وتقنية الإعلان (AdTech) استخدام هذا التحليل لتحسين الحملات التسويقية من خلال تحديد الجمهور القريب من متجر العلامة التجارية أو تصنيف المتاجر حسب أداء الإعلانات خارج المنزل.

هناك العديد من حالات الاستخدام الأخرى، بما في ذلك إنشاء معلومات الموقع للعقارات التجارية، وزيادة بيانات صور الأقمار الصناعية بأرقام الأقدام، وتحديد مراكز التوصيل للمطاعم، وتحديد احتمالية إخلاء الأحياء، واكتشاف أنماط حركة الأشخاص أثناء الوباء، والمزيد.

التحديات والاستخدام الأخلاقي

يمكن أن يؤدي الاستخدام الأخلاقي لبيانات التنقل إلى العديد من الأفكار المثيرة للاهتمام التي يمكن أن تساعد المؤسسات على تحسين عملياتها، أو إجراء تسويق فعال، أو حتى تحقيق ميزة تنافسية. للاستفادة من هذه البيانات بشكل أخلاقي، يجب اتباع عدة خطوات.

يبدأ بجمع البيانات نفسها. على الرغم من أن معظم بيانات التنقل تظل خالية من معلومات التعريف الشخصية (PII) مثل الاسم والعنوان، إلا أنه يجب على جامعي البيانات ومجمعيها الحصول على موافقة المستخدم على جمع بياناتهم واستخدامها وتخزينها ومشاركتها. يجب الالتزام بقوانين خصوصية البيانات مثل القانون العام لحماية البيانات (GDPR) وقانون خصوصية المستهلك في كاليفورنيا (CCPA) لأنها تمكن المستخدمين من تحديد كيفية استخدام الشركات لبياناتهم. تمثل هذه الخطوة الأولى خطوة كبيرة نحو الاستخدام الأخلاقي والمسؤول لبيانات التنقل، ولكن لا يزال هناك الكثير مما يمكن القيام به.

يتم تعيين معرف إعلانات الجوال (MAID) المجزأ لكل جهاز، والذي يتم استخدامه لترسيخ الأصوات الفردية. ويمكن حجب هذا بشكل أكبر باستخدام أمازون ماسي, كائن أمازون S3 لامدا, فهم الأمازونأو حتى AWS الغراء ستوديو كشف تحويل PII. لمزيد من المعلومات، راجع التقنيات الشائعة لاكتشاف بيانات PHI وPII باستخدام خدمات AWS.

وبصرف النظر عن معلومات تحديد الهوية الشخصية، يجب مراعاة إخفاء موقع منزل المستخدم بالإضافة إلى المواقع الحساسة الأخرى مثل القواعد العسكرية أو أماكن العبادة.

الخطوة الأخيرة للاستخدام الأخلاقي هي استخلاص وتصدير المقاييس المجمعة فقط من Amazon SageMaker. وهذا يعني الحصول على مقاييس مثل متوسط ​​العدد أو العدد الإجمالي للزوار بدلاً من أنماط السفر الفردية؛ الحصول على الاتجاهات اليومية أو الأسبوعية أو الشهرية أو السنوية؛ أو فهرسة أنماط التنقل على البيانات المتاحة للجمهور مثل بيانات التعداد.

حل نظرة عامة

كما ذكرنا سابقًا، فإن خدمات AWS التي يمكنك استخدامها لتحليل بيانات التنقل هي Amazon S3 وAmazon Macie وAWS Glue وS3 Object Lambda وAmazon Comprehend وAmazon SageMaker. تسهل قدرات Amazon SageMaker الجغرافية المكانية على علماء البيانات ومهندسي تعلم الآلة إنشاء النماذج وتدريبها ونشرها باستخدام البيانات الجغرافية المكانية. يمكنك تحويل مجموعات البيانات الجغرافية المكانية واسعة النطاق أو إثرائها بكفاءة، وتسريع بناء النماذج باستخدام نماذج تعلم الآلة المدربة مسبقًا، واستكشاف تنبؤات النماذج والبيانات الجغرافية المكانية على خريطة تفاعلية باستخدام الرسومات المسرَّعة ثلاثية الأبعاد وأدوات التصور المدمجة.

تصور البنية المرجعية التالية سير العمل باستخدام تعلم الآلة مع البيانات الجغرافية المكانية.

مخطط العمارة

في سير العمل هذا، يتم تجميع البيانات الأولية من مصادر بيانات مختلفة وتخزينها في ملف خدمة تخزين أمازون البسيطة (S3) دلو. يتم استخدام Amazon Macie في حاوية S3 هذه لتحديد وتنقيح معلومات تحديد الهوية الشخصية (PII). يتم بعد ذلك استخدام AWS Glue لتنظيف البيانات الأولية وتحويلها إلى التنسيق المطلوب، ثم يتم تخزين البيانات المعدلة والمنظفة في حاوية S3 منفصلة. بالنسبة لتحويلات البيانات غير الممكنة عبر AWS Glue، يمكنك استخدامها AWS لامدا لتعديل وتنظيف البيانات الخام. عندما يتم تنظيف البيانات، يمكنك استخدام Amazon SageMaker لإنشاء نماذج تعلم الآلة وتدريبها ونشرها على البيانات الجغرافية المكانية المعدة مسبقًا. يمكنك أيضًا استخدام وظائف المعالجة الجغرافية المكانية ميزة قدرات Amazon SageMaker الجغرافية المكانية للمعالجة المسبقة للبيانات - على سبيل المثال، استخدام وظيفة Python وبيانات SQL لتحديد الأنشطة من بيانات التنقل الأولية. يمكن لعلماء البيانات إنجاز هذه العملية من خلال الاتصال عبر دفاتر ملاحظات Amazon SageMaker. تستطيع ايضا استخذام أمازون QuickSight لتصور نتائج الأعمال والمقاييس المهمة الأخرى من البيانات.

القدرات الجغرافية المكانية لـ Amazon SageMaker ووظائف المعالجة الجغرافية المكانية

بعد الحصول على البيانات وإدخالها في Amazon S3 بتغذية يومية وتنظيفها من أي بيانات حساسة، يمكن استيرادها إلى Amazon SageMaker باستخدام أمازون ساجميكر ستوديو دفتر مع صورة جغرافية مكانية. تعرض لقطة الشاشة التالية عينة من اختبارات اتصال الجهاز اليومية التي تم تحميلها إلى Amazon S3 كملف CSV ثم تم تحميلها في إطار بيانات الباندا. يأتي دفتر ملاحظات Amazon SageMaker Studio المزود بالصور الجغرافية المكانية محملاً مسبقًا بمكتبات جغرافية مكانية مثل GDAL، وGeoPandas، وFiona، وShapely، مما يسهل عملية معالجة هذه البيانات وتحليلها.

تحتوي مجموعة البيانات النموذجية هذه على ما يقرب من 400,000 اختبار اتصال يومي للجهاز من 5,000 جهاز من 14,000 مكان فريد مسجل من المستخدمين الذين يزورون Arrowhead Mall، وهو مجمع مراكز تسوق شهير في فينيكس، أريزونا، في 15 مايو 2023. تعرض لقطة الشاشة السابقة مجموعة فرعية من الأعمدة في مخطط البيانات. ال MAID يمثل العمود معرف الجهاز، ويقوم كل MAID بإنشاء أوامر ping كل دقيقة لترحيل خط العرض وخط الطول للجهاز، المسجل في ملف العينة كـ Lat و Lng الأعمدة.

فيما يلي لقطات شاشة من أداة تصور الخريطة لإمكانيات Amazon SageMaker الجغرافية المكانية المدعومة من Foursquare Studio، والتي تصور تخطيط الأصوات الصادرة من الأجهزة التي تزور المركز التجاري بين الساعة 7:00 صباحًا و6:00 مساءً.

تُظهر لقطة الشاشة التالية أصواتًا من المركز التجاري والمناطق المحيطة به.

يظهر ما يلي الأصوات من داخل المتاجر المختلفة في المركز التجاري.

تصور كل نقطة في لقطات الشاشة اختبار اتصال من جهاز معين في وقت معين. تمثل مجموعة من الأصوات المواقع الشائعة حيث تتجمع الأجهزة أو تتوقف، مثل المتاجر أو المطاعم.

كجزء من ETL الأولي، يمكن تحميل هذه البيانات الأولية على الجداول باستخدام AWS Glue. يمكنك إنشاء زاحف AWS Glue لتحديد مخطط البيانات وجداول النماذج من خلال الإشارة إلى موقع البيانات الأولية في Amazon S3 كمصدر للبيانات.

كما هو مذكور أعلاه، فإن البيانات الأولية (أصوات الجهاز اليومية)، حتى بعد ETL الأولي، ستمثل دفقًا مستمرًا من أصوات GPS التي تشير إلى مواقع الأجهزة. لاستخراج رؤى قابلة للتنفيذ من هذه البيانات، نحتاج إلى تحديد التوقفات والرحلات (المسارات). ويمكن تحقيق ذلك باستخدام وظائف المعالجة الجغرافية المكانية ميزة القدرات الجغرافية المكانية لـ SageMaker. أمازون SageMaker معالجة يستخدم تجربة مبسطة ومُدارة على SageMaker لتشغيل أحمال عمل معالجة البيانات باستخدام الحاوية الجغرافية المكانية المصممة لهذا الغرض. تتم إدارة البنية التحتية الأساسية لمهمة معالجة SageMaker بالكامل بواسطة SageMaker. تتيح هذه الميزة تشغيل التعليمات البرمجية المخصصة على البيانات الجغرافية المكانية المخزنة على Amazon S3 عن طريق تشغيل حاوية تعلم الآلة الجغرافية المكانية في مهمة معالجة SageMaker. يمكنك تشغيل عمليات مخصصة على البيانات الجغرافية المكانية المفتوحة أو الخاصة عن طريق كتابة تعليمات برمجية مخصصة باستخدام مكتبات مفتوحة المصدر، وتشغيل العملية على نطاق واسع باستخدام مهام معالجة SageMaker. يعمل النهج القائم على الحاوية على حل الاحتياجات المتعلقة بتوحيد بيئة التطوير باستخدام مكتبات مفتوحة المصدر شائعة الاستخدام.

لتشغيل أحمال العمل واسعة النطاق هذه، تحتاج إلى مجموعة حوسبة مرنة يمكنها التوسع من عشرات المثيلات لمعالجة كتلة مدينة، إلى آلاف المثيلات للمعالجة على نطاق كوكبي. تعد إدارة مجموعة حوسبة DIY يدويًا أمرًا بطيئًا ومكلفًا. تكون هذه الميزة مفيدة بشكل خاص عندما تتضمن مجموعة بيانات التنقل أكثر من عدد قليل من المدن إلى ولايات متعددة أو حتى بلدان، ويمكن استخدامها لتشغيل نهج التعلم الآلي المكون من خطوتين.

تتمثل الخطوة الأولى في استخدام التجميع المكاني للتطبيقات القائم على الكثافة مع خوارزمية الضوضاء (DBSCAN) لمجموعات التوقف من الأصوات. تتمثل الخطوة التالية في استخدام طريقة أجهزة ناقل الدعم (SVMs) لزيادة تحسين دقة نقاط التوقف المحددة وأيضًا التمييز بين توقفات التوقف مع الارتباطات مع نقطة اهتمام مقابل توقفات بدون واحدة (مثل المنزل أو العمل). يمكنك أيضًا استخدام مهمة معالجة SageMaker لإنشاء رحلات ومسارات من أصوات الجهاز اليومية عن طريق تحديد التوقفات المتتالية وتعيين المسار بين توقفات المصدر والوجهات.

بعد معالجة البيانات الأولية (أصوات الجهاز اليومية) على نطاق واسع باستخدام مهام المعالجة الجغرافية المكانية، يجب أن تحتوي مجموعة البيانات الجديدة التي تسمى التوقفات على المخطط التالي.

السمة الوصف
معرف أو خادمة معرف إعلانات الجوال للجهاز (مجزأ)
اللات خط عرض النقطه الوسطى من مجموعة التوقف
الغاز الطبيعي المسال خط طول النقطه الوسطى من مجموعة التوقف
com.geohash موقع Geohash للنقطة المهمة
نوع الجهاز نظام تشغيل الجهاز (IDFA أو GAID)
الطابع الزمني وقت بداية التوقف
يسكن_time مدة توقف التوقف (بالثواني)
ip عنوان IP
ALT ارتفاع الجهاز (بالأمتار)
البلد رمز ISO المكون من رقمين لبلد المنشأ
حالة رموز تمثل الدولة
مدن رموز تمثل المدينة
الرمز البريدي الرمز البريدي للمكان الذي يظهر فيه معرف الجهاز
الناقل الناقل للجهاز
الشركة المصنعة للجهاز الشركة المصنعة للجهاز

يتم دمج نقاط التوقف عن طريق تجميع الأصوات لكل جهاز. يتم دمج التجميع القائم على الكثافة مع معلمات مثل حد التوقف الذي يبلغ 300 ثانية والحد الأدنى للمسافة بين نقاط التوقف وهو 50 مترًا. يمكن تعديل هذه المعلمات وفقًا لحالة الاستخدام الخاصة بك.

تُظهر لقطة الشاشة التالية ما يقرب من 15,000 نقطة توقف تم تحديدها من 400,000 اختبار ping. توجد مجموعة فرعية من المخطط السابق أيضًا، حيث العمود Dwell Time يمثل مدة التوقف، و Lat و Lng تمثل الأعمدة خط العرض وخط الطول للنقط الوسطى لمجموعة التوقف لكل جهاز لكل موقع.

بعد ETL، يتم تخزين البيانات بتنسيق ملف Parquet، وهو تنسيق تخزين عمودي يسهل معالجة كميات كبيرة من البيانات.

توضح لقطة الشاشة التالية نقاط التوقف المجمعة من اختبارات الاتصال لكل جهاز داخل المركز التجاري والمناطق المحيطة به.

بعد تحديد التوقفات، يمكن ضم مجموعة البيانات هذه إلى بيانات النقاط المهمة المتاحة للعامة أو بيانات النقاط المهمة المخصصة الخاصة بحالة الاستخدام لتحديد الأنشطة، مثل التعامل مع العلامات التجارية.

تُظهر لقطة الشاشة التالية محطات التوقف المحددة عند النقاط المهمة الرئيسية (المتاجر والعلامات التجارية) داخل Arrowhead Mall.

تم استخدام الرموز البريدية للمنزل لإخفاء موقع منزل كل زائر للحفاظ على الخصوصية في حالة ما إذا كان ذلك جزءًا من رحلتهم في مجموعة البيانات. خط العرض وخط الطول في مثل هذه الحالات هما الإحداثيات الخاصة بالمركز الأوسط للرمز البريدي.

لقطة الشاشة التالية هي تمثيل مرئي لمثل هذه الأنشطة. تحدد الصورة اليسرى نقاط التوقف في المتاجر، بينما تعطي الصورة اليمنى فكرة عن تصميم المركز التجاري نفسه.

يمكن تصور مجموعة البيانات الناتجة بعدة طرق، والتي نناقشها في الأقسام التالية.

مقاييس الكثافة

يمكننا حساب وتصور كثافة الأنشطة والزيارات.

مثال 1 – لقطة الشاشة التالية توضح أفضل 15 متجراً تمت زيارتها في المول.

مثال 2 – توضح لقطة الشاشة التالية عدد الزيارات إلى متجر Apple Store حسب كل ساعة.

الرحلات والمسارات

كما ذكرنا سابقًا، يمثل زوج من الأنشطة المتتالية رحلة. يمكننا استخدام النهج التالي لاستخلاص الرحلات من بيانات الأنشطة. هنا، يتم استخدام وظائف النافذة مع SQL لإنشاء ملف trips الجدول، كما هو مبين في الصورة.

بعد trips يتم إنشاء الجدول، ويمكن تحديد الرحلات إلى النقاط المهمة.

المثال 1 - تُظهر لقطة الشاشة التالية أفضل 10 متاجر توجه حركة المرور نحو متجر Apple Store.

مثال 2 - لقطة الشاشة التالية توضح جميع الرحلات إلى مركز أروهيد التجاري.

مثال 3 – الفيديو التالي يوضح أنماط الحركة داخل المول.

مثال 4 – الفيديو التالي يوضح أنماط الحركة خارج المول.

تحليل منطقة مستجمعات المياه

يمكننا تحليل جميع الزيارات إلى نقطة الاهتمام وتحديد منطقة التجمع.

المثال 1 - تُظهر لقطة الشاشة التالية جميع الزيارات إلى متجر Macy.

مثال 2 - تعرض لقطة الشاشة التالية أهم 10 رموز بريدية لمنطقة المنزل (تم تمييز الحدود) من مكان حدوث الزيارات.

فحص جودة البيانات

يمكننا التحقق من موجز البيانات الواردة يوميًا للتأكد من الجودة واكتشاف الحالات الشاذة باستخدام لوحات معلومات QuickSight وتحليلات البيانات. تعرض لقطة الشاشة التالية مثالاً للوحة القيادة.

وفي الختام

تظل بيانات التنقل وتحليلها لاكتساب رؤى العملاء والحصول على ميزة تنافسية مجالًا متخصصًا لأنه من الصعب الحصول على مجموعة بيانات متسقة ودقيقة. ومع ذلك، يمكن لهذه البيانات أن تساعد المؤسسات على إضافة سياق إلى التحليل الحالي وحتى إنتاج رؤى جديدة حول أنماط حركة العملاء. يمكن أن تساعد إمكانات Amazon SageMaker الجغرافية المكانية ووظائف المعالجة الجغرافية المكانية في تنفيذ حالات الاستخدام هذه واستخلاص الرؤى بطريقة بديهية ويمكن الوصول إليها.

في هذا المنشور، أوضحنا كيفية استخدام خدمات AWS لتنظيف بيانات التنقل ثم استخدام القدرات الجغرافية المكانية لـ Amazon SageMaker لإنشاء مجموعات بيانات مشتقة مثل التوقفات والأنشطة والرحلات باستخدام نماذج تعلم الآلة. ثم استخدمنا مجموعات البيانات المشتقة لتصور أنماط الحركة وتوليد الأفكار.

يمكنك البدء باستخدام إمكانيات Amazon SageMaker الجغرافية المكانية بطريقتين:

لمعرفة المزيد، يرجى زيارة قدرات Amazon SageMaker الجغرافية المكانية و الشروع في العمل مع Amazon SageMaker الجغرافية المكانية. أيضا ، قم بزيارة موقعنا جيثب ريبو، والتي تحتوي على العديد من نماذج دفاتر الملاحظات حول إمكانات Amazon SageMaker الجغرافية المكانية.


حول المؤلف

جيمي ماثيوز هو مهندس حلول AWS، ويتمتع بخبرة في تقنية الذكاء الاصطناعي/تعلم الآلة. يقع مقر Jimy في بوسطن ويعمل مع عملاء المؤسسات أثناء قيامهم بتحويل أعمالهم من خلال اعتماد السحابة ومساعدتهم على بناء حلول فعالة ومستدامة. إنه شغوف بعائلته وسياراته وفنون القتال المختلطة.

جيريش كيشاف هو مهندس حلول في AWS، حيث يساعد العملاء في رحلة الترحيل السحابية الخاصة بهم لتحديث أعباء العمل وتشغيلها بشكل آمن وفعال. وهو يعمل مع قادة فرق التكنولوجيا لإرشادهم بشأن أمان التطبيقات والتعلم الآلي وتحسين التكلفة والاستدامة. يقيم في سان فرانسيسكو، ويحب السفر والمشي لمسافات طويلة ومشاهدة الألعاب الرياضية واستكشاف مصانع الجعة الحرفية.

راميش جيتي هو أحد كبار القادة في هندسة الحلول التي تركز على مساعدة عملاء مؤسسة AWS على تحقيق الدخل من أصول البيانات الخاصة بهم. ويقدم المشورة للمديرين التنفيذيين والمهندسين لتصميم وبناء حلول سحابية قابلة للتطوير وموثوقة وفعالة من حيث التكلفة، مع التركيز بشكل خاص على التعلم الآلي والبيانات والتحليلات. يستمتع في أوقات فراغه بالهواء الطلق وركوب الدراجات والمشي لمسافات طويلة مع عائلته.

الطابع الزمني:

اكثر من التعلم الآلي من AWS