تصویر توسط نویسنده
ممکن است با مقالات جامع زیادی در مورد چگونگی تبدیل شدن به یک دانشمند داده مواجه شوید. آنها اطلاعات خوبی را ارائه می دهند، با این حال، می توانند بسیار طاقت فرسا باشند. به خصوص به عنوان یک مبتدی، شما فقط می خواهید بدانید که چه چیزی را باید بدانید و کرک کنید.
این دقیقاً همان چیزی است که این وبلاگ درباره آن خواهد بود. من 10 مهارت سختی که برای تبدیل شدن به یک دانشمند داده نیاز دارید را مرور خواهم کرد.
بیا بریم…
اگر نحوه کدنویسی در هیچ زبان برنامه نویسی را نمی دانید، اولین قدم شما یادگیری نحوه کدنویسی خواهد بود. توصیه من خواهد بود پــایتــون، زیرا مسلماً محبوب ترین زبان برنامه نویسی برای علم داده است.
زبان های دیگری که می توانید برای علم داده یاد بگیرید، هستند RSQL، جولیا، و بیشتر.
A topic that some people say you don’t need in the world of coding. But I believe that is truly wrong. I did a BootCamp that did not touch on the mathematical side – and I definitely realized it played a big weakness in my proficiency in the field.
حوزه هایی از ریاضی که برای علم داده به آن نیاز دارید عبارتند از جبر خطی، رگرسیون خطی، احتمال و آمار. یادگیری ریاضیات پشت علم داده برای حرفه علم داده شما بسیار مفید خواهد بود و مورد توجه کارفرمای شما قرار خواهد گرفت.
یادگیری ریاضی می تواند اعصاب خردکن باشد، بنابراین من کاملاً تردید شما را درک می کنم. یک مطالعه داشته باشید چگونه بر ترس از ریاضی غلبه کنیم و ریاضی را برای علم داده یاد بگیریم تا خیالت راحت شود
محیط توسعه یکپارچه (IDE) یک نرم افزار کاربردی است که دارای یک محیط جامع است که ترکیبی از ابزارها و ویژگی های خاص برای توسعه نرم افزار دارد. IDE ها به شما کمک می کنند تا وظایف تجزیه و تحلیل داده، تجسم و یادگیری ماشین را انجام دهید. انتخاب IDE مناسب برای شما بیشتر به اولویت شما بستگی دارد، به عنوان مثال، موارد زیر وجود دارد:
IDE شما جایی است که می آموزید چگونه در زبان برنامه نویسی خود مهارت داشته باشید، ریاضیات و همه موارد زیر را یاد بگیرید. Jupyter Notebook و Visual Studio Code مورد علاقه من هستند! اینها همچنین زمانی که شغلی پیدا می کنید بسیار سودمند خواهند بود زیرا کارفرمایان از شما انتظار دارند IDE های محبوب را بشناسید.
کدنویسی در طول سالها بسیار آسانتر شده است، و این به دلیل تنوع کتابخانههای موجود است. این کتابخانه ها ابزارهایی هستند که می توانید از آنها برای ساده سازی تجزیه و تحلیل داده ها و فرآیندهای یادگیری ماشین استفاده کنید.
اگر تصمیم به یادگیری پایتون گرفته اید، این کتابخانه ها را به شما پیشنهاد می کنم:
دلیل اینکه من در ابتدا لیستی از کتابخانه ها را در اختیار شما قرار می دهم این است که با گذراندن سفر یادگیری علم داده خود، شروع به دیدن این کتابخانه ها خواهید کرد. بیاموزید که هر کدام از آنها چه چیزی را ارائه می دهند و خواهید دید که کجا می توانید آن را اعمال کنید. به عنوان مثال، Matplotlib می تواند برای تجسم داده ها استفاده شود.
Exactly what it says – transforming your data. Data transformation is an important phase for a data scientist as you will spend a lot of time taking raw data and modifying, adjusting and converting it into a format that can be used for analysis and other tasks.
شما باید در مورد نرمال سازی، استانداردسازی، مقیاس بندی، مهندسی ویژگی ها و موارد دیگر بیاموزید.
مقاله ای که می توانید بخوانید: تبدیل داده ها: استاندارد سازی در مقابل عادی سازی
تجسم داده ها جنبه مهمی از علم داده است، زیرا شما باید بتوانید یافته های خود را به بیش از یک روش غیر از کدنویسی منتقل کنید. همه اعضای تیم شما از نظر فنی تمایل ندارند، بنابراین ارائه یافته های خود به صورت تصویری به این امر و همچنین به فرآیند تصمیم گیری کمک می کند.
بخوانید: تجسم داده ها بهترین شیوه ها و منابع برای ارتباطات موثر
The next thing you want to learn is machine learning. There are a variety of aspects within machine learning, and you won’t be able to be an expert in everything – but it’s still good to be a jack of all trades within this area. Brace yourself, because there’s a lot to learn.
شما می خواهید با مفاهیم اساسی مانند یادگیری تحت نظارت، یادگیری بدون نظارت، طبقه بندی و وظایف رگرسیون شروع کنید. هنگامی که درک خوبی از این موارد داشتید و می توانید آنها را متمایز کنید، سپس می خواهید درباره الگوریتم های مختلف یادگیری ماشین، مانند ماشین های بردار پشتیبان و شبکه های عصبی، اطلاعات بیشتری کسب کنید.
هنگامی که مدل های یادگیری ماشین را درک کردید، باید یاد بگیرید:
- ساخت یک مدل یادگیری ماشینی
- ارزیابی مدل
- گسترش
- تفسیرپذیری مدل
- Overfitting و Underfitting
- تنظیم فراپارامتر
- اعتبار سنجی و اعتبارسنجی متقابل
- روش های گروه
- کاهش ابعاد
- تکنیک های منظم سازی
- گرادیان نزول
- شبکه های عصبی و یادگیری عمیق
- یادگیری تقویتی
همانطور که گفتم، چیزهای زیادی برای یادگیری در این زمینه وجود دارد، بنابراین به شما توصیه می کنم وقت بگذارید و تمرین کنید!
در اینجا مقاله ای وجود دارد که می تواند به شما کمک کند: 15 کانال برتر YouTube برای ارتقاء مهارت های یادگیری ماشینی شما
داشتن این همه دانش عالی است، اما برخی از ابزارها می توانند حرفه علم داده شما را به سطح بالاتری ببرند. درک فناوریهای مختلف، جایی که میتوان از آنها استفاده کرد و مزایا و معایب، سفر علم داده شما را کارآمدتر میکند.
ابزارها و فناوریهای مختلفی وجود دارد که میتواند برای هر کسی که با داده کار میکند مفید باشد. با این حال، من چند مورد محبوب را لیست می کنم، مانند جرقه آپاچی, TensorFlow, PyTorch, هادوپ, تابلو, رفتن، و بیشتر.
رایانش ابری یک عنصر بسیار مهم در علم داده است زیرا تمام پروژه ها و وظایفی که روی آنها کار خواهید کرد به محصول تبدیل می شوند. خدمات رایانش ابری ذخیره سازی مقیاس پذیر و قدرت محاسباتی را فعال می کند و دسترسی آسان به ابزارها و خدمات را فراهم می کند.
شما باید در مورد پلتفرم های ابری مانند وب سرویس آمازون, مایکروسافت لاوروو Google Cloud Platform.
سایر جنبههای رایانش ابری که باید در مورد آنها آگاه باشید عبارتند از: ذخیرهسازی داده، پایگاههای داده، انبار داده، پردازش کلان داده، کانتینریسازی و خطوط لوله داده.
بخوانید:
من قصد دارم پروژه ها را به عنوان آخرین مهارت سخت مورد نیاز شما اضافه کنم زیرا همه موارد فوق را به نمایش می گذارد. فقط به این دلیل که می خواهید آن را در رزومه خود قرار دهید و برای خود شغلی ایجاد کنید، نروید و پروژه های زیادی را انجام دهید. بله، این هدف نهایی است، اما مطمئن شوید که پروژه های خود را کاملاً درک کرده اید.
در یک مصاحبه، از شما در مورد پروژه ها، زیر و بم ها پرسیده می شود و باید آماده باشید تا با دانش هر چه بیشتر پاسخ دهید. از پروژه های خود برای نشان دادن مهارت های خود و اینکه چگونه نقاط ضعف خود را شناسایی کرده اید و روی آنها کار کرده اید، استفاده کنید.
بخوانید:
من سعی کردم این مقاله را تا حد امکان فشرده نگه دارم تا شما احساس ناراحتی نکنید. امیدوارم موفق شده باشم و جزئیات و منابع کافی در اختیار شما قرار داده باشم تا سفر علم داده خود را آغاز کنید!
برای مهارتهای نرمی که بهعنوان یک دانشمند داده به آن نیاز دارید، قسمت 2 را دنبال کنید.
نیشا آریا دانشمند داده، نویسنده فنی آزاد و مدیر انجمن در KDnuggets است. او به ویژه علاقه مند به ارائه مشاوره شغلی یا آموزش های علم داده و دانش مبتنی بر نظریه در مورد علم داده است. او همچنین مایل است راههای مختلفی را که هوش مصنوعی میتواند به طول عمر انسان کمک کند، کشف کند. یک یادگیرنده مشتاق که به دنبال گسترش دانش فنی و مهارت های نوشتاری خود است و در عین حال به راهنمایی دیگران کمک می کند.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. خودرو / خودروهای الکتریکی، کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- ChartPrime. بازی معاملاتی خود را با ChartPrime ارتقا دهید. دسترسی به اینجا.
- BlockOffsets. نوسازی مالکیت افست زیست محیطی. دسترسی به اینجا.
- منبع: https://www.kdnuggets.com/want-to-become-a-data-scientist-part-1-10-hard-skills-you-need?utm_source=rss&utm_medium=rss&utm_campaign=want-to-become-a-data-scientist-part-1-10-hard-skills-you-need
- : دارد
- :است
- :نه
- :جایی که
- $UP
- 1
- 10
- ٪۱۰۰
- a
- قادر
- درباره ما
- بالاتر
- دسترسی
- در میان
- اضافه کردن
- نصیحت
- توصیه
- الگوریتم
- معرفی
- همچنین
- am
- آمازون
- an
- تحلیل
- و
- پاسخ
- هر
- آپاچی
- کاربرد
- درخواست
- هستند
- محدوده
- شاید، قابل بحث
- دور و بر
- مقاله
- مقالات
- مصنوعی
- هوش مصنوعی
- AS
- ظاهر
- جنبه
- At
- در دسترس
- مستقر
- BE
- زیرا
- شدن
- بوده
- مبتدی
- پشت سر
- باور
- در زیر
- مفید
- سود
- بهترین
- بهترین شیوه
- بزرگ
- بزرگ داده
- بلاگ
- گسترده تر
- دسته
- اما
- by
- CAN
- کاریابی
- کانال
- انتخاب
- طبقه بندی
- ابر
- محاسبات ابری
- رمز
- برنامه نویسی
- ترکیب
- بیا
- انجمن
- به طور کامل
- جامع
- محاسبه
- قدرت پردازش
- مفاهیم
- منفی
- تبدیل
- داده ها
- تحلیل داده ها
- پردازش داده ها
- علم اطلاعات
- دانشمند داده
- ذخیره سازی داده ها
- تجسم داده ها
- پایگاه های داده
- مصمم
- تصمیم گیری
- عمیق
- یادگیری عمیق
- قطعا
- جزئیات
- پروژه
- DID
- مختلف
- تمایز
- do
- آیا
- پایین
- هر
- سهولت
- آسان تر
- ساده
- موثر
- موثر
- عنصر
- کارفرمایان
- قادر ساختن
- پایان
- مهندسی
- کافی
- اطمینان حاصل شود
- محیط
- به خصوص
- اتر (ETH)
- ارزیابی
- همه چیز
- کاملا
- مثال
- اجرا کردن
- انتظار
- کارشناس
- اکتشاف
- ترس
- ویژگی
- امکانات
- احساس
- کمی از
- رشته
- یافته ها
- نام خانوادگی
- برای
- قالب
- آزاد
- کاملا
- اساسی
- دریافت کنید
- Go
- هدف
- رفتن
- خوب
- گوگل
- بزرگ
- راهنمایی
- سخت
- آیا
- کمک
- کمک
- او
- خیلی
- امید
- چگونه
- چگونه
- اما
- HTML
- HTTPS
- انسان
- i
- شناسایی
- مهم
- جنبه مهم
- in
- شیب دار
- اطلاعات
- یکپارچه
- اطلاعات
- علاقه مند
- مصاحبه
- به
- IT
- جک
- کار
- سفر
- نوت بوک ژوپیتر
- تنها
- kdnuggets
- مشتاق
- نگاه داشتن
- دانستن
- دانش
- زمین
- زبان
- زبان ها
- نام
- یاد گرفتن
- فراگیر
- یادگیری
- سطح
- کتابخانه ها
- زندگی
- لینک
- فهرست
- طول عمر
- نگاه کنيد
- خیلی
- دستگاه
- فراگیری ماشین
- ماشین آلات
- ساخته
- ساخت
- مدیر
- ریاضی
- ریاضی
- ماتپلوتلب
- ممکن است..
- روش
- مایکروسافت
- ذهن
- مدل
- مدل
- بیش
- کارآمدتر
- اکثر
- محبوبترین
- بسیار
- my
- نیاز
- شبکه
- عصبی
- شبکه های عصبی
- بعد
- دفتر یادداشت
- of
- on
- یک بار
- ONE
- آنهایی که
- or
- دیگر
- دیگران
- خارج
- روی
- غلبه بر
- غرق شدن
- بخش
- ویژه
- مردم
- فاز
- سیستم عامل
- افلاطون
- هوش داده افلاطون
- PlatoData
- بازی
- محبوب
- ممکن
- قدرت
- شیوه های
- آماده شده
- احتمال
- روند
- فرآیندهای
- در حال پردازش
- محصولات
- برنامه نويسي
- پروژه ها
- مثبت
- ارائه
- ارائه
- فراهم می کند
- ارائه
- قرار دادن
- پــایتــون
- خام
- داده های خام
- خواندن
- متوجه
- دلیل
- توصیه
- کاهش
- رگرسیون
- منابع
- ادامه
- راست
- s
- سعید
- گفتن
- می گوید:
- مقیاس پذیر
- مقیاس گذاری
- علم
- دانشمند
- دیدن
- به دنبال
- خدمات
- او
- نمایشگاه
- طرف
- مهارت
- مهارت ها
- So
- نرم
- نرم افزار
- توسعه نرم افزار
- برخی از
- به طور خاص
- خرج کردن
- SQL
- استاندارد سازی
- شروع
- ارقام
- گام
- هنوز
- ذخیره سازی
- ساده کردن
- استودیو
- چنین
- نشان می دهد
- یادگیری نظارت شده
- پشتیبانی
- T
- تابلو
- گرفتن
- مصرف
- وظایف
- تیم
- فن آوری
- فنی
- techniquement
- تکنیک
- فن آوری
- جریان تنسور
- نسبت به
- که
- La
- پروژه ها
- جهان
- آنها
- سپس
- نظریه
- آنجا.
- از این رو
- اینها
- آنها
- چیز
- این
- از طریق
- زمان
- به
- ابزار
- موضوع
- لمس
- معاملات
- دگرگونی
- تبدیل شدن
- سعی
- صادقانه
- دور زدن
- آموزش
- فهمیدن
- درک
- یادگیری بدون نظارت
- استفاده کنید
- استفاده
- تنوع
- بسیار
- تجسم
- تصاویر
- vs
- می خواهم
- انبارداری
- مسیر..
- راه
- ضعف
- وب
- چی
- چه زمانی
- در حالیکه
- اراده
- خواسته
- با
- در داخل
- برنده شد
- مشغول به کار
- کارگر
- جهان
- خواهد بود
- نویسنده
- نوشته
- اشتباه
- سال
- بله
- شما
- شما
- خودت
- یوتیوب
- زفیرنت