مقدمة في الحوسبة السحابية لعلوم البيانات - KDnuggets

مقدمة في الحوسبة السحابية لعلوم البيانات – KDnuggets

عقدة المصدر: 2906482

مقدمة في الحوسبة السحابية لعلوم البيانات
الصورة عن طريق ستارلاين
 

في عالم اليوم، برزت قوتان رئيسيتان غيرتا قواعد اللعبة: 

علوم البيانات والحوسبة السحابية. 

تخيل عالمًا يتم فيه إنشاء كميات هائلة من البيانات في كل ثانية. 

حسنًا... ليس عليك أن تتخيل... إنه عالمنا!

من التفاعلات عبر وسائل التواصل الاجتماعي إلى المعاملات المالية، ومن سجلات الرعاية الصحية إلى تفضيلات التجارة الإلكترونية، فإن البيانات موجودة في كل مكان. 

ولكن ما فائدة هذه البيانات إذا لم نتمكن من الحصول على القيمة؟ 

هذا هو بالضبط ما يفعله علم البيانات. 

وأين نقوم بتخزين هذه البيانات ومعالجتها وتحليلها؟ 

هذا هو المكان الذي تتألق فيه الحوسبة السحابية. 

دعونا نبدأ رحلة لفهم العلاقة المتشابكة بين هاتين المعجزتين التكنولوجيتين. 

دعونا (نحاول) اكتشاف كل ذلك معًا! 

علم البيانات؟-؟فن رسم الأفكار

علم البيانات هو فن وعلم استخلاص رؤى ذات معنى من بيانات واسعة ومتنوعة.

فهو يجمع بين الخبرة من مجالات مختلفة مثل الإحصاء والتعلم الآلي لتفسير البيانات واتخاذ قرارات مستنيرة.

مع انفجار البيانات، أصبح دور علماء البيانات بالغ الأهمية في تحويل البيانات الخام إلى ذهب.

الحوسبة السحابية؟-؟ثورة التخزين الرقمي

تشير الحوسبة السحابية إلى تقديم خدمات الحوسبة عند الطلب عبر الإنترنت.

سواء كنا بحاجة إلى خدمات التخزين أو قوة المعالجة أو قاعدة البيانات، فإن الحوسبة السحابية توفر بيئة مرنة وقابلة للتطوير للشركات والمهنيين للعمل دون النفقات العامة للحفاظ على البنية التحتية المادية.

ومع ذلك، لا بد أن معظمكم يفكر في سبب ارتباطهما؟

لنعود إلى البداية…

هناك سببان رئيسيان وراء ظهور الحوسبة السحابية كعنصر محوري - أو مكمل - لعلم البيانات.

#1. الحاجة الماسة للتعاون

في بداية رحلتهم في علم البيانات، عادةً ما يبدأ محترفو البيانات المبتدئون بإعداد Python وR على أجهزة الكمبيوتر الشخصية الخاصة بهم. وبعد ذلك، يقومون بكتابة وتشغيل التعليمات البرمجية باستخدام بيئة التطوير المتكاملة المحلية (IDE) مثل تطبيق Jupyter Notebook أو RStudio.

ومع ذلك، مع توسع فرق علوم البيانات وأصبحت التحليلات المتقدمة أكثر شيوعًا، هناك طلب متزايد على الأدوات التعاونية لتقديم الرؤى والتحليلات التنبؤية وأنظمة التوصيات.

ولهذا السبب تصبح ضرورة الأدوات التعاونية أمرًا بالغ الأهمية. يتم تعزيز هذه الأدوات، الضرورية لاستخلاص الرؤى والتحليلات التنبؤية وأنظمة التوصية، من خلال الأبحاث القابلة للتكرار وأدوات الكمبيوتر المحمول والتحكم في مصدر التعليمات البرمجية. يؤدي تكامل المنصات السحابية إلى تضخيم هذه الإمكانات التعاونية.

 

مقدمة في الحوسبة السحابية لعلوم البيانات
الصورة عن طريق ناقل الماكرو
 

من المهم ملاحظة أن التعاون لا يقتصر على فرق علوم البيانات فقط. 

وهو يشمل مجموعة واسعة من الأشخاص، بما في ذلك أصحاب المصلحة مثل المديرين التنفيذيين وقادة الإدارات والأدوار الأخرى التي تركز على البيانات. 

#2. عصر البيانات الضخمة

على المدى البيانات الكبيرة وقد ارتفعت شعبيتها، خاصة بين شركات التكنولوجيا الكبرى. في حين أن تعريفها الدقيق لا يزال بعيد المنال، فإنه يشير عمومًا إلى مجموعات البيانات الضخمة جدًا لدرجة أنها تتجاوز قدرات أنظمة قواعد البيانات القياسية والأساليب التحليلية. 

تتجاوز مجموعات البيانات هذه حدود الأدوات البرمجية وأنظمة التخزين النموذجية من حيث التقاط البيانات وتخزينها وإدارتها ومعالجتها في إطار زمني معقول.

عند التفكير في البيانات الضخمة، تذكر دائمًا العناصر الثلاثة:

  • حجم: يشير إلى الكم الهائل من البيانات.
  • تشكيلة: يشير إلى التنسيقات والأنواع والتطبيقات التحليلية المتنوعة للبيانات.
  • ● السرعة: يشير إلى السرعة التي تتطور بها البيانات أو يتم إنشاؤها.

مع استمرار نمو البيانات، هناك حاجة ملحة إلى بنية تحتية أكثر قوة وتقنيات تحليل أكثر كفاءة. 

إذن فإن هذين السببين الرئيسيين هما السبب وراء حاجتنا - كعلماء بيانات - إلى التوسع إلى ما هو أبعد من أجهزة الكمبيوتر المحلية.

بدلاً من امتلاك البنية التحتية للحوسبة أو مراكز البيانات الخاصة بهم، يمكن للشركات والمهنيين استئجار الوصول إلى أي شيء بدءًا من التطبيقات وحتى التخزين من مزود الخدمة السحابية. 

وهذا يسمح للشركات والمهنيين بدفع ثمن ما يستخدمونه عند استخدامه، بدلاً من التعامل مع تكلفة وتعقيد الحفاظ على البنية التحتية المحلية لتكنولوجيا المعلومات - الخاصة بهم. 

لذلك ، ببساطة ، الحوسبة السحابية هو تقديم خدمات الحوسبة عند الطلب؟ -؟ من التطبيقات إلى قوة التخزين والمعالجة؟ -؟ عادةً عبر الإنترنت وعلى أساس الدفع أولاً بأول.

فيما يتعلق بمقدمي الخدمات الأكثر شيوعًا، أنا متأكد من أنك جميعًا على دراية بواحد منهم على الأقل. تعد Google (Google Cloud) وAmazon (Amazon Web Services) وMicrosoft (Microsoft Azure بمثابة التقنيات السحابية الثلاثة الأكثر شيوعًا وتتحكم في السوق بالكامل تقريبًا. 

على المدى سحابة قد يبدو مجردا، ولكن له معنى ملموس. 

السحابة في جوهرها تدور حول مشاركة أجهزة الكمبيوتر المتصلة بالشبكة في الموارد. فكر في الإنترنت باعتبارها شبكة الكمبيوتر الأكثر توسعًا، بينما تشمل الأمثلة الأصغر الشبكات المنزلية مثل LAN أو WiFi SSID. تتشارك هذه الشبكات في موارد تتراوح من صفحات الويب إلى تخزين البيانات.

في هذه الشبكات، تسمى أجهزة الكمبيوتر الفردية العقد. ويتواصلون باستخدام بروتوكولات مثل HTTP لأغراض مختلفة، بما في ذلك تحديثات الحالة وطلبات البيانات. في كثير من الأحيان، لا تكون أجهزة الكمبيوتر هذه موجودة في الموقع ولكنها موجودة في مراكز بيانات مجهزة بالبنية التحتية الأساسية.

مع القدرة على تحمل تكاليف أجهزة الكمبيوتر ووحدات التخزين، أصبح من الشائع الآن استخدام العديد من أجهزة الكمبيوتر المترابطة بدلاً من استخدام وحدة طاقة واحدة باهظة الثمن. يضمن هذا النهج المترابط التشغيل المستمر حتى في حالة تعطل أحد أجهزة الكمبيوتر ويسمح للنظام بمعالجة الأحمال المتزايدة.

تمثل المنصات الشهيرة مثل Twitter وFacebook وNetflix تطبيقات سحابية يمكنها إدارة ملايين المستخدمين يوميًا دون تعطل. عندما تتعاون أجهزة الكمبيوتر في نفس الشبكة لتحقيق هدف مشترك، يُطلق على ذلك اسم كتلة

توفر المجموعات، التي تعمل كوحدة فردية، أداءً محسنًا وتوافرًا وقابلية للتوسع.

الحوسبة الموزعة يشير إلى البرامج المصممة للاستخدام المجموعات لمهام محددة، مثل Hadoop وSpark.

إذًا... مرة أخرى... ما هي السحابة؟ 

بالإضافة إلى الموارد المشتركة، تشمل السحابة الخوادم والخدمات والشبكات والمزيد، والتي يديرها كيان واحد. 

على الرغم من أن الإنترنت عبارة عن شبكة واسعة، إلا أنها ليست سحابة حيث لا يملكها أي طرف واحد.

باختصار، علوم البيانات والحوسبة السحابية وجهان لعملة واحدة. 

يوفر علم البيانات للمحترفين جميع النظريات والتقنيات اللازمة لاستخراج القيمة من البيانات. 

الحوسبة السحابية هي الجهة التي تمنح البنية التحتية لتخزين ومعالجة هذه البيانات نفسها. 

في حين أن الأول يمنحنا المعرفة اللازمة لتقييم أي مشروع، فإن الثاني يمنحنا إمكانية تنفيذه.

ويشكلون معًا ترادفًا قويًا يعمل على تعزيز الابتكار التكنولوجي. 

وبينما نمضي قدمًا، فإن التآزر بين هذين الاثنين سوف يزداد قوة، مما يمهد الطريق لمستقبل يعتمد بشكل أكبر على البيانات.

احتضن المستقبل، لأنه يعتمد على البيانات ويدعمه السحابة!
 
 
جوزيب فيرير هو مهندس تحليلات من برشلونة. تخرج في هندسة الفيزياء ويعمل حاليًا في مجال علوم البيانات المطبق على التنقل البشري. وهو منشئ محتوى بدوام جزئي يركز على علوم البيانات والتكنولوجيا. يمكنك الاتصال به على لينكدين:, تويتر or متوسط.
 

الطابع الزمني:

اكثر من KD nuggets