Прочитайте це перед переходом на науку про дані - KDnuggets

Прочитайте це, перш ніж переходити на науку про дані – KDnuggets

Вихідний вузол: 3078033

Прочитайте це, перш ніж переходити на науку про дані
Зображення автора
 

Ви читаєте це, тому що думаєте приєднатися до лав початківців дослідників даних. І хто вас може звинуватити? Наука про дані – це галузь, що розвивається, навіть через десятиліття після сумнозвісної нагороди Harvard Business Review як «найсексуальніша робота». Зараз Бюро статистики праці США прогнозує з 35 по 2022 рік рівень зайнятості вчених з обробки даних зросте на 2032 відсотків. Порівняйте це із середнім темпом зростання кількості робочих місць, який становить лише 5 відсотків.

Для цього є й інші речі:

  • Він добре оплачується (знову ж таки, BLS знайдений середня зарплата $103 тис. у 2022 році)
  • Це пов’язано з високою якістю життя (вище, ніж у середньому, пов’язане з роботою щастя відповідно до Career Explorer)
  • Не дивлячись на недавній раунд, робота гарантована звільнення – тому що на цю роль дуже великий попит

Тож є багато причин, щоб захотіти увірватися в цю сферу.

 

Прочитайте це, перш ніж переходити на науку про дані
Джерело: https://www.bls.gov/ooh/math/data-scientists.html
 

Але наука про дані — це дуже широка галузь, у якій є багато різних посад і наборів навичок, які вам потрібно знати, перш ніж почати. Ця стаття розповість вам про різні напрямки, якими ви можете рухатися, і про те, що вам потрібно знати для кожного з них, щоб потрапити в науку про дані.

Щоб здійснити успішний перехід до a кар'єра в галузі науки про дані, вам потрібно буде дотримуватися структурованого підходу:

  • Оцініть свою навички науки про дані і визначити прогалини.
  • Отримайте практичний досвід у сферах, де ви слабкі.
  • Мережа. Приєднуйтеся до груп із вивчення даних, відвідуйте зустрічі та долучайтеся до форумів.

Зануримось глибше.

Оцініть свою вихідну позицію

Що ви вже знаєте і як це можна застосувати в науці про дані? Подумайте про будь-які ваші знання програмування, статистичні навички чи досвід аналізу даних.

Далі визначте прогалини у ваших навичках, особливо тих, які необхідні для науки про дані. SQL справді необхідний, але програмування на Python або R, розширена статистика, машинне навчання та візуалізація даних також надзвичайно корисні.

Визначивши ці прогалини, шукайте відповідну освіту чи навчання, щоб їх заповнити. Це можуть бути онлайн-курси, університетські програми, навчальні табори або самонавчання з акцентом на практичному навчанні.

Практичний досвід

Ви не повинні просто дивитися відео та читати дописи в блогах. Практичний досвід має вирішальне значення в науці про дані. Беріть участь у проектах, які дозволять вам застосувати ваші нові навички в реальних сценаріях. Це можуть бути особисті проекти, внески в платформи з відкритим кодом або участь у конкурсах даних, як-от на Kaggle.

Якщо у вас є базові початкові навички, ви можете розглянути питання про стажування або роботу на фрілансі, щоб отримати досвід у галузі.

Головне, документуйте всі свої проекти та досвід у портфоліо, висвітлюючи ваш процес вирішення проблем, методи, які ви використовували, і вплив вашої роботи.

мережу

Проникнення в науку про дані часто зводиться до того, кого ви знаєте, крім того, що ви знаєте. Знаходьте наставників, беріть участь у зустрічах, конференціях і семінарах, щоб дізнатися про нові тенденції, а також залучайтеся до онлайн-спільнот наукових даних, таких як Stack Overflow, GitHub або Reddit. Ці платформи дозволяють вам навчатися в інших, ділитися своїми знаннями та бути поміченими в спільноті науки про дані.

Якщо ви хочете стати науковцем з даних з нуля, має сенс подумати про навички, які вам потрібно буде розвинути як дерево. Існують «базові» навички, які є спільними для кожної роботи в галузі обробки даних, а потім кожна спеціальність має «галузеві» навички, які продовжують розгалужуватися на все більш спеціалізовані ролі.

Існує три основні навички, необхідні кожному досліднику даних, незалежно від того, в якому напрямку він працює:

Маніпулювання даними/переборки за допомогою SQL

Наука про дані в основному зводиться до обробки та організації великих наборів даних. Для цього вам потрібно знати SQL. Це є необхідний інструмент для маніпулювання даними та суперечок.

 

Прочитайте це, перш ніж переходити на науку про дані
Зображення автора

М'які навички

Наука про дані не виникає у вакуумі. Вам потрібно добре грати з іншими, а це означає вдосконалювати свої навички спілкування. Здатність чітко та зрозуміло повідомляти результати складних даних нетехнічним зацікавленим сторонам є такою ж важливою, як і технічні навички. До них належать ефективне спілкування, вирішення проблем і ділова хватка.

Розв’язання проблем допомагає вирішувати складні проблеми з даними, а ділова хватка гарантує, що керовані даними рішення узгоджуються з цілями організації.

Постійне ставлення до навчання

Наука про дані відрізняється від того, де вона була ще п’ять років тому. Просто подивіться, де ми сьогодні з ШІ порівняно з 2018 роком. Постійно з’являються нові інструменти, техніки та теорії. Ось чому вам потрібен настрій постійного навчання, щоб бути в курсі останніх розробок і адаптуватися до нових технологій і методологій у цій галузі.

Вам знадобиться самомотивація для навчання та адаптації, а також проактивний підхід до отримання нових знань та навичок.

Незважаючи на те, що існують загальні навички, як я описав вище, кожна роль вимагає власного певного набору навичок. (Пам’ятаєте? Гілки.) Наприклад, статистичний аналіз, навички програмування на Python/R і візуалізація даних — усе це специфічно для більш спеціалізованих робіт у галузі даних.

 

Прочитайте це, перш ніж переходити на науку про дані
Зображення автора
 

Давайте розберемо кожну роль, суміжну з наукою даних, щоб ви могли бачити, що вам потрібно.

Бізнес/аналітик даних

Так, це наукова роль! Навіть якщо скептики з цим не погоджуються, я все одно вірю, що ви можете розглядати це принаймні як сходинку, якщо ви прагнете потрапити на шлях кар’єри в галузі обробки даних.

Як бізнес-аналітик або аналітик даних, ви відповідаєте за подолання розриву між аналітичними даними та бізнес-стратегією. Він ідеально підходить для тих, хто має вміння розуміти бізнес-потреби та перетворювати їх у рішення на основі даних.

Як основні навички, які вам знадобляться бізнес-інтелект – тут немає сюрпризів – сильні аналітичні навички, знання мов запитів даних, переважно SQL. У цій ролі Python і R є необов’язковими, оскільки головним завданням є суперечка даних.

Існує компонент візуалізації але залежно від вашої роботи це може означати створення інформаційних панелей у Tableau або графіків у Excel.

Analytics даних

Ця роль зосереджена на інтерпретації даних для надання корисної інформації. Це чудова робота для вас, якщо вам подобається перетворювати цифри в історії та бізнес-стратегії.

Вам знадобиться міцна ручка статистичний аналіз і візуалізація даних – хоча знову ж таки, це можуть бути табличні інформаційні панелі та/або графіки Excel). Вам також знадобиться знання інструменти аналітики як Excel, Tableau і SQL. Python/R знову необов’язковий, але пам’ятайте, що він дійсно може допомогти у впровадженні статистики та автоматизації.

машинне навчання

Науковці машинного навчання розробляють прогностичні моделі та алгоритми, щоб робити прогнози або приймати рішення на основі даних. Ці посади підходять для тих, хто сильно цікавиться ШІ та моделюванням.

Немає сюрпризів щодо основних навичок: вам знадобиться a глибоке розуміння алгоритмів, досвід роботи з фреймворками машинного навчання, такими як TensorFlow і PyTorch, і сильні навички програмування. Python та/або R більше не є необов’язковими, а обов’язковими.

Інженерія даних

Ця роль змушує вас зосередитися на архітектурі, управлінні та обслуговуванні конвеєрів даних. Це добре підходить для людей, яким подобаються технічні проблеми керування та оптимізації потоку даних і зберігання.

Щоб потрапити на цю роботу, вам знадобиться eЕкспертиза в управлінні базами даних, процесами ETL і знання технологій великих даних, таких як Hadoop і Spark. Вам також знадобиться навички автоматизації конвеєрів даних за допомогою таких технологій, як Airflow.

Бізнес-аналітика

У бізнес-аналітиці вся справа в створенні візуалізацій. Це чудово для оповідачів і людей із сильним почуттям бізнесу.

Вам потрібно бути професіоналом із такими технологіями панелі керування, як Tableau та Qlik, оскільки це інструменти, які ви використовуватимете для створення своїх візуалізацій. Вам також знадобляться навички роботи з даними (читайте: навички SQL), щоб допомогти оптимізувати запити до даних, які підвищують продуктивність інформаційної панелі.

Як я вже згадував у статті, наука про дані – це сфера, яка швидко розвивається. Постійно відкриваються нові робочі місця та посади. Повертаючись до моєї аналогії з деревом, мені подобається думати про це як про нові гілки, які додаються до основного стовбура науки про дані. Тепер є хмарні інженери, спеціалісти з SQL, ролі DevOps тощо – усі вони досі підключені до цього напряму дослідження даних. Отже, ця стаття містить лише короткий перелік напрямків, у яких ви можете піти з наукою про дані.

Більше того, ви також повинні пам’ятати, що наука про дані пов’язана з проблемами, пов’язаними з шестизначною зарплатою. Існує дуже крута крива навчання, і навчання насправді ніколи не закінчується. Нові технології, тенденції та інструменти приходять швидко й важко – і якщо ви хочете зберегти свою роботу, ви повинні не відставати.

З огляду на все це, це чудовий варіант кар’єри. З трьома основними компетенціями, які я згадав, ви будете добре підготовлені для будь-якої наукова роль що звертається до вас.
 
 

Нейт Розіді є фахівцем із даних та стратегією продукту. Він також є ад’юнкт-професором, який викладає аналітику, і є засновником StrataScratch, платформа, яка допомагає науковцям з даних готуватися до інтерв’ю з реальними запитаннями для інтерв’ю від провідних компаній. Зв'яжіться з ним Twitter: StrataScratch or LinkedIn.

Часова мітка:

Більше від KDnuggets