المزيد من أوراق غش علوم البيانات

المزيد من أوراق غش علوم البيانات

عقدة المصدر: 1792233

لقد أدركنا مؤخرًا أننا لم نقدم لك أي أوراق غش في علم البيانات منذ فترة. وليس بسبب عدم توفرها ؛ أوراق الغش في علم البيانات موجودة في كل مكان ، بدءًا من المقدمة إلى المتقدمة ، وتغطي موضوعات من الخوارزميات إلى الإحصائيات ونصائح المقابلات وما بعدها.

ولكن ما الذي يجعل ورقة الغش جيدة؟ ما الذي يجعل ورقة الغش جديرة بأن يتم تمييزها على أنها ورقة جيدة بشكل خاص؟ من الصعب وضع إصبعك على على وجه التحديد ما يجعل ورقة الغش جيدة ، ولكن من الواضح أن تلك التي تنقل المعلومات الأساسية بإيجاز - سواء كانت تلك المعلومات ذات طبيعة عامة محددة - هي بالتأكيد بداية جيدة. وهذا ما يجعل مرشحينا اليوم جديرين بالملاحظة. لذا تابع القراءة للحصول على أربع أوراق غش تكميلية منظمة لمساعدتك في تعلم علوم البيانات أو مراجعتها.

أول ما يصل هو ورقة الغش الخاصة بعلوم البيانات لـ Aaron Wang 2.0وهي عبارة عن تجميع مكون من أربع صفحات من التجريدات الإحصائية وخوارزميات التعلم الآلي الأساسية وموضوعات ومفاهيم التعلم العميق. لا يُقصد منه أن يكون شاملاً ، ولكنه بدلاً من ذلك مرجع سريع لمواقف مثل التحضير للمقابلة ومراجعات الامتحانات وأي شيء آخر يتطلب مستوى مماثل من عمق المراجعة. يلاحظ المؤلف أنه في حين أن أولئك الذين لديهم فهم أساسي للإحصاء والجبر الخطي سيجدون هذا المورد الأكثر فائدة ، يجب أن يكون المبتدئين قادرين على جمع معلومات مفيدة من محتواه أيضًا.

الشكل
لقطة شاشة من آرون وانغ ورقة غش علوم البيانات 2.0
 

عرض ورقة الغش التالي اليوم هو ما يعتمد عليه مورد آرون وانغ ، ورقة غش علوم البيانات الخاصة بمنشور مافريك لين (إشارة وانغ إلى صوته 2.0 هي إشارة مباشرة إلى "أصلي" لين). يمكننا أن نفكر في ورقة الغش الخاصة بـ Lin على أنها أكثر تعمقًا من ورقة وانج (على الرغم من أن قرار وانج جعله أقل تعمقًا يبدو مقصودًا وبديلًا مفيدًا) ، حيث يغطي مفاهيم علوم البيانات الأساسية مثل تنظيف البيانات ، وفكرة النمذجة ، والقيام بـ " البيانات الضخمة "باستخدام Hadoop و SQL وحتى أساسيات Python.

من الواضح أن هذا سوف يروق لأولئك الذين هم أكثر ثباتًا في معسكر "المبتدئين" ، ويقومون بعمل جيد في إثارة الشهية وتوعية القراء بالمجال الواسع لعلوم البيانات ، والعديد من المفاهيم المتنوعة التي يشملها. هذا بالتأكيد مورد قوي آخر ، خاصةً إذا كان القارئ جديدًا في علم البيانات.

الشكل
لقطة شاشة من Maverick Lin's ورقة الغش في علوم البيانات
 

بينما نعود إلى الوراء في الزمن - بحثًا عن مصدر إلهام لورقة الغش الخاصة بـ Lin - صادفنا ذلك ورقة غش ويليام تشين الاحتمالية 2.0. حظيت ورقة الغش التي أعدها تشين بالكثير من الاهتمام والثناء على مر السنين ، ولذا ربما تكون قد صادفتها في مرحلة ما. من الواضح أن ورقة الغش الخاصة بشين هي دورة مكثفة أو مراجعة عميقة لمفاهيم الاحتمالات ، بما في ذلك مجموعة متنوعة من التوزيعات والتغاير والتحولات والتوقع الشرطي وسلاسل ماركوف والصيغ المختلفة ذات الأهمية أكثر بكثير.

في 10 صفحات ، يجب أن تكون قادرًا على تخيل اتساع نطاق موضوعات الاحتمالات التي يتم تناولها هنا. لكن لا تدع ذلك يردعك ؛ إن قدرة تشين على تلخيص المفاهيم وصولاً إلى نقاطها الأساسية والشرح بلغة إنجليزية بسيطة مع عدم التضحية بالأساسيات أمر جدير بالملاحظة. كما أنه غني بالتصورات التوضيحية ، وهو أمر مفيد للغاية عندما تكون المساحة محدودة والرغبة في الإيجاز قوية.

إن تجميع تشين ليس فقط ذا جودة عالية ويستحق وقتك ، كمبتدئ أو شخص مهتم بمراجعة كاملة ، سأعمل بترتيب عكسي لكيفية تقديم هذه الموارد - من ورقة غش تشين إلى لين ، وأخيراً إلى وانغ ، البناء على قمة المفاهيم كما تذهب.

الشكل
لقطة من وليام تشين ورقة الغش الاحتمالية 2.0
 

أحد الموارد النهائية التي أدرجها هنا ، على الرغم من أنه ليس ورقة غش من الناحية الفنية ، هو لدغات التعلم الآلي لريشابه أناند. يعد Anand نفسه بمثابة دليل مقابلة حول مفاهيم التعلم الآلي الشائعة وأفضل الممارسات والتعريفات والنظرية ، وقد قام بتجميع مجموعة واسعة النطاق من "لدغات" المعرفة ، والتي تتجاوز فائدتها بالتأكيد الإعداد الأصلي للمقابلة. تشمل الموضوعات التي يتم تناولها ما يلي:

  • مقاييس تسجيل النموذج
  • مشاركة المعلمة
  • ك-أضعاف عبر التحقق من الصحة
  • أنواع بيانات بايثون
  • تحسين أداء النموذج
  • نماذج الرؤية الحاسوبية
  • الاهتمام ومتغيراته
  • معالجة عدم توازن الفئة
  • مسرد رؤية الكمبيوتر
  • الفانيليا باكبروجاشن
  • التنظيم
  • مراجع حسابات

الشكل
لقطة من لدغات التعلم الآلي
 

بينما يتم التطرق إلى "مفاهيم التعلم الآلي وأفضل الممارسات والتعريفات والنظرية" ، كما هو موعود في وصف المورد لنفسه ، فإن هذه "الأجزاء" موجهة بالتأكيد نحو الجانب العملي ، مما يجعل الموقع مكملاً لكثير من المواد التي يتم تناولها في أوراق الغش الثلاثة المذكورة سابقًا. إذا كنت أتطلع إلى تغطية جميع المواد في جميع الموارد الأربعة في هذا المنشور ، فسأنظر بالتأكيد إلى هذا بعد الموارد الثلاثة الأخرى.

إذن لديك أربع أوراق غش (أو ثلاث أوراق غش ومورد واحد مجاور لأوراق الغش) لاستخدامها في التعلم أو المراجعة. نأمل أن يكون هناك شيء مفيد لك ، وأدعو أي شخص لمشاركة أوراق الغش التي وجدها مفيدة في التعليقات أدناه.

الطابع الزمني:

اكثر من KD nuggets