آیا می خواهید دانشمند داده شوید؟ قسمت 1: 10 مهارت سختی که نیاز دارید - KDnuggets

آیا می خواهید دانشمند داده شوید؟ قسمت 1: 10 مهارت سختی که نیاز دارید – KDnuggets

گره منبع: 2863483

آیا می خواهید دانشمند داده شوید؟ قسمت 1: 10 مهارت سختی که نیاز دارید
تصویر توسط نویسنده
 

ممکن است با مقالات جامع زیادی در مورد چگونگی تبدیل شدن به یک دانشمند داده مواجه شوید. آنها اطلاعات خوبی را ارائه می دهند، با این حال، می توانند بسیار طاقت فرسا باشند. به خصوص به عنوان یک مبتدی، شما فقط می خواهید بدانید که چه چیزی را باید بدانید و کرک کنید. 

این دقیقاً همان چیزی است که این وبلاگ درباره آن خواهد بود. من 10 مهارت سختی که برای تبدیل شدن به یک دانشمند داده نیاز دارید را مرور خواهم کرد. 

بیا بریم…

اگر نحوه کدنویسی در هیچ زبان برنامه نویسی را نمی دانید، اولین قدم شما یادگیری نحوه کدنویسی خواهد بود. توصیه من خواهد بود پــایتــون، زیرا مسلماً محبوب ترین زبان برنامه نویسی برای علم داده است. 

زبان های دیگری که می توانید برای علم داده یاد بگیرید، هستند RSQL، جولیا، و بیشتر.

A topic that some people say you don’t need in the world of coding. But I believe that is truly wrong. I did a BootCamp that did not touch on the mathematical side – and I definitely realized it played a big weakness in my proficiency in the field. 

حوزه هایی از ریاضی که برای علم داده به آن نیاز دارید عبارتند از جبر خطی، رگرسیون خطی، احتمال و آمار. یادگیری ریاضیات پشت علم داده برای حرفه علم داده شما بسیار مفید خواهد بود و مورد توجه کارفرمای شما قرار خواهد گرفت. 

یادگیری ریاضی می تواند اعصاب خردکن باشد، بنابراین من کاملاً تردید شما را درک می کنم. یک مطالعه داشته باشید چگونه بر ترس از ریاضی غلبه کنیم و ریاضی را برای علم داده یاد بگیریم تا خیالت راحت شود 

محیط توسعه یکپارچه (IDE) یک نرم افزار کاربردی است که دارای یک محیط جامع است که ترکیبی از ابزارها و ویژگی های خاص برای توسعه نرم افزار دارد. IDE ها به شما کمک می کنند تا وظایف تجزیه و تحلیل داده، تجسم و یادگیری ماشین را انجام دهید. انتخاب IDE مناسب برای شما بیشتر به اولویت شما بستگی دارد، به عنوان مثال، موارد زیر وجود دارد:

IDE شما جایی است که می آموزید چگونه در زبان برنامه نویسی خود مهارت داشته باشید، ریاضیات و همه موارد زیر را یاد بگیرید. Jupyter Notebook و Visual Studio Code مورد علاقه من هستند! اینها همچنین زمانی که شغلی پیدا می کنید بسیار سودمند خواهند بود زیرا کارفرمایان از شما انتظار دارند IDE های محبوب را بشناسید.

کدنویسی در طول سال‌ها بسیار آسان‌تر شده است، و این به دلیل تنوع کتابخانه‌های موجود است. این کتابخانه ها ابزارهایی هستند که می توانید از آنها برای ساده سازی تجزیه و تحلیل داده ها و فرآیندهای یادگیری ماشین استفاده کنید. 

اگر تصمیم به یادگیری پایتون گرفته اید، این کتابخانه ها را به شما پیشنهاد می کنم: 

دلیل اینکه من در ابتدا لیستی از کتابخانه ها را در اختیار شما قرار می دهم این است که با گذراندن سفر یادگیری علم داده خود، شروع به دیدن این کتابخانه ها خواهید کرد. بیاموزید که هر کدام از آنها چه چیزی را ارائه می دهند و خواهید دید که کجا می توانید آن را اعمال کنید. به عنوان مثال، Matplotlib می تواند برای تجسم داده ها استفاده شود. 

Exactly what it says – transforming your data. Data transformation is an important phase for a data scientist as you will spend a lot of time taking raw data and modifying, adjusting and converting it into a format that can be used for analysis and other tasks. 

شما باید در مورد نرمال سازی، استانداردسازی، مقیاس بندی، مهندسی ویژگی ها و موارد دیگر بیاموزید. 

مقاله ای که می توانید بخوانید: تبدیل داده ها: استاندارد سازی در مقابل عادی سازی

تجسم داده ها جنبه مهمی از علم داده است، زیرا شما باید بتوانید یافته های خود را به بیش از یک روش غیر از کدنویسی منتقل کنید. همه اعضای تیم شما از نظر فنی تمایل ندارند، بنابراین ارائه یافته های خود به صورت تصویری به این امر و همچنین به فرآیند تصمیم گیری کمک می کند. 

بخوانید: تجسم داده ها بهترین شیوه ها و منابع برای ارتباطات موثر

The next thing you want to learn is machine learning. There are a variety of aspects within machine learning, and you won’t be able to be an expert in everything – but it’s still good to be a jack of all trades within this area. Brace yourself, because there’s a lot to learn. 

شما می خواهید با مفاهیم اساسی مانند یادگیری تحت نظارت، یادگیری بدون نظارت، طبقه بندی و وظایف رگرسیون شروع کنید. هنگامی که درک خوبی از این موارد داشتید و می توانید آنها را متمایز کنید، سپس می خواهید درباره الگوریتم های مختلف یادگیری ماشین، مانند ماشین های بردار پشتیبان و شبکه های عصبی، اطلاعات بیشتری کسب کنید.

هنگامی که مدل های یادگیری ماشین را درک کردید، باید یاد بگیرید:

  • ساخت یک مدل یادگیری ماشینی
  • ارزیابی مدل
  • گسترش
  • تفسیرپذیری مدل
  • Overfitting و Underfitting
  • تنظیم فراپارامتر
  • اعتبار سنجی و اعتبارسنجی متقابل
  • روش های گروه
  • کاهش ابعاد
  • تکنیک های منظم سازی
  • گرادیان نزول
  • شبکه های عصبی و یادگیری عمیق
  • یادگیری تقویتی

همانطور که گفتم، چیزهای زیادی برای یادگیری در این زمینه وجود دارد، بنابراین به شما توصیه می کنم وقت بگذارید و تمرین کنید!

در اینجا مقاله ای وجود دارد که می تواند به شما کمک کند: 15 کانال برتر YouTube برای ارتقاء مهارت های یادگیری ماشینی شما

داشتن این همه دانش عالی است، اما برخی از ابزارها می توانند حرفه علم داده شما را به سطح بالاتری ببرند. درک فناوری‌های مختلف، جایی که می‌توان از آن‌ها استفاده کرد و مزایا و معایب، سفر علم داده شما را کارآمدتر می‌کند. 

ابزارها و فناوری‌های مختلفی وجود دارد که می‌تواند برای هر کسی که با داده کار می‌کند مفید باشد. با این حال، من چند مورد محبوب را لیست می کنم، مانند جرقه آپاچی, TensorFlow, PyTorch, هادوپ, تابلو, رفتن، و بیشتر. 

رایانش ابری یک عنصر بسیار مهم در علم داده است زیرا تمام پروژه ها و وظایفی که روی آنها کار خواهید کرد به محصول تبدیل می شوند. خدمات رایانش ابری ذخیره سازی مقیاس پذیر و قدرت محاسباتی را فعال می کند و دسترسی آسان به ابزارها و خدمات را فراهم می کند. 

شما باید در مورد پلتفرم های ابری مانند وب سرویس آمازون, مایکروسافت لاوروو Google Cloud Platform

سایر جنبه‌های رایانش ابری که باید در مورد آنها آگاه باشید عبارتند از: ذخیره‌سازی داده، پایگاه‌های داده، انبار داده، پردازش کلان داده، کانتینری‌سازی و خطوط لوله داده. 

بخوانید: 

من قصد دارم پروژه ها را به عنوان آخرین مهارت سخت مورد نیاز شما اضافه کنم زیرا همه موارد فوق را به نمایش می گذارد. فقط به این دلیل که می خواهید آن را در رزومه خود قرار دهید و برای خود شغلی ایجاد کنید، نروید و پروژه های زیادی را انجام دهید. بله، این هدف نهایی است، اما مطمئن شوید که پروژه های خود را کاملاً درک کرده اید. 

در یک مصاحبه، از شما در مورد پروژه ها، زیر و بم ها پرسیده می شود و باید آماده باشید تا با دانش هر چه بیشتر پاسخ دهید. از پروژه های خود برای نشان دادن مهارت های خود و اینکه چگونه نقاط ضعف خود را شناسایی کرده اید و روی آنها کار کرده اید، استفاده کنید. 

بخوانید: 

من سعی کردم این مقاله را تا حد امکان فشرده نگه دارم تا شما احساس ناراحتی نکنید. امیدوارم موفق شده باشم و جزئیات و منابع کافی در اختیار شما قرار داده باشم تا سفر علم داده خود را آغاز کنید!

برای مهارت‌های نرمی که به‌عنوان یک دانشمند داده به آن نیاز دارید، قسمت 2 را دنبال کنید.
 
 
نیشا آریا دانشمند داده، نویسنده فنی آزاد و مدیر انجمن در KDnuggets است. او به ویژه علاقه مند به ارائه مشاوره شغلی یا آموزش های علم داده و دانش مبتنی بر نظریه در مورد علم داده است. او همچنین مایل است راه‌های مختلفی را که هوش مصنوعی می‌تواند به طول عمر انسان کمک کند، کشف کند. یک یادگیرنده مشتاق که به دنبال گسترش دانش فنی و مهارت های نوشتاری خود است و در عین حال به راهنمایی دیگران کمک می کند.
 

تمبر زمان:

بیشتر از kdnuggets