Preberite to, preden kariero preklopite na podatkovno znanost - KDnuggets

Preberite to, preden kariero preklopite na podatkovno znanost – KDnuggets

Izvorno vozlišče: 3078033

Preberite to, preden kariero preklopite na podatkovno znanost
Slika avtorja
 

To berete, ker razmišljate o tem, da bi se pridružili vrstam ambicioznih podatkovnih znanstvenikov. In kdo vam lahko zameri? Podatkovna znanost je rastoče področje, celo desetletje po njenem zdaj zloglasnem priznanju za "najbolj seksi službo" Harvard Business Review. Ameriški urad za statistiko dela trenutno napoveduje stopnja zaposlenosti podatkovnih znanstvenikov se bo od leta 35 do leta 2022 povečala za 2032 odstotkov. Primerjajte to s povprečno stopnjo rasti delovnih mest, ki znaša le 5 odstotkov.

Ima še druge stvari za to:

  • Je dobro plačan (spet BLS je pokazala, povprečna plača 103 tisoč dolarjev leta 2022)
  • Prihaja z visoko kakovostjo življenja (višja od povprečne sreče, povezane z delom po v Career Explorer)
  • Kljub nedavnemu krogu je zaposlitev varna odpuščanje – ker je za to vlogo veliko povpraševanja

Obstaja torej veliko razlogov za prodor na to področje.

 

Preberite to, preden kariero preklopite na podatkovno znanost
Vir: https://www.bls.gov/ooh/math/data-scientists.html
 

Toda podatkovna znanost je zelo široko področje z veliko različnimi nazivi delovnih mest in sklopi spretnosti, ki jih morate poznati, preden začnete. Ta članek vas bo vodil skozi različne smeri, ki jih lahko uporabite, in kaj morate vedeti za vsako od njih, da se podate v podatkovno znanost.

Za uspešen prehod v a kariera podatkovne znanosti, boste morali slediti strukturiranemu pristopu:

  • Ocenite svoje veščine podatkovnih znanosti in prepoznati vrzeli.
  • Pridobite praktične izkušnje na področjih, kjer ste šibki.
  • Omrežje. Pridružite se skupinam podatkovne znanosti, udeležite se srečanj in prispevajte na forumih.

Potopimo se globlje.

Ocenite svoj začetni položaj

Kaj že veste in kako lahko to uporabite v podatkovni znanosti? Pomislite na: vaše znanje programiranja, statistične veščine ali izkušnje z analizo podatkov.

Nato ugotovite vrzeli v svojih spretnostih, zlasti tistih, ki so bistvene za podatkovno znanost. SQL je res obvezen, vendar so izjemno koristni tudi programiranje Python ali R, napredna statistika, strojno učenje in vizualizacija podatkov.

Ko natančno ugotovite te vrzeli, poiščite ustrezno izobraževanje ali usposabljanje, da jih zapolnite. To je lahko prek spletnih tečajev, univerzitetnih programov, zagonskih kampov ali samostojnega učenja s poudarkom na praktičnem in praktičnem učenju.

Praktične izkušnje

Ne bi smeli samo gledati videoposnetkov in brati objav v blogih. Praktične izkušnje so v znanosti o podatkih ključnega pomena. Sodelujte v projektih, ki vam omogočajo, da svoje nove veščine uporabite v resničnih scenarijih. To so lahko osebni projekti, prispevki k odprtokodnim platformam ali sodelovanje v podatkovnih tekmovanjih, kot so tista na Kaggle.

Če imate nekaj osnovnih začetnih veščin, boste morda želeli razmisliti o iskanju pripravništva ali samostojnega dela, da pridobite izkušnje v industriji.

Najpomembneje, dokumentirajte vse svoje projekte in izkušnje v portfelju, s poudarkom na vašem procesu reševanja problemov, tehnikah, ki ste jih uporabili, in vplivu vašega dela.

mreža

Vdor v podatkovno znanost se poleg tega, kaj veste, pogosto zmanjša na to, koga poznate. Poiščite mentorje, sodelujte na srečanjih, konferencah in delavnicah, da spoznate nove trende, in sodelujte v spletnih skupnostih podatkovne znanosti, kot so Stack Overflow, GitHub ali Reddit. Te platforme vam omogočajo, da se učite od drugih, delite svoje znanje in postanete opaženi v skupnosti podatkovnih znanosti.

Če želite postanite podatkovni znanstvenik iz nič, je smiselno pomisliti na veščine, ki jih boste morali razviti kot drevo. Obstajajo »debla« spretnosti, ki so skupne vsem delovnim mestom v znanosti o podatkih, nato pa ima vsaka specialnost »vejne« spretnosti, ki se še naprej razvejajo v vse bolj specializirane vloge.

Vsak podatkovni znanstvenik potrebuje tri glavne veščine, ne glede na to, v katero smer gre:

Manipulacija s podatki/prepiri z uporabo SQL

Podatkovna znanost se v bistvu skrči na obdelavo in organiziranje velikih naborov podatkov. Če želite to narediti, morate poznati SQL. je o bistveno orodje za manipulacijo podatkov in prepir.

 

Preberite to, preden kariero preklopite na podatkovno znanost
Slika avtorja

Mehke veščine

Podatkovna znanost se ne dogaja v vakuumu. Z drugimi se morate igrati prijazno, kar pomeni izboljšati svoje mehke veščine. Sposobnost sporočanja zapletenih ugotovitev podatkov na jasen in razumljiv način netehničnim zainteresiranim stranem je enako pomembna kot tehnična znanja. Ti vključujejo učinkovito komunikacijo, reševanje problemov in poslovno žilico.

Reševanje problemov pomaga pri spopadanju s kompleksnimi podatkovnimi izzivi, medtem ko poslovna žilica zagotavlja, da so rešitve, ki temeljijo na podatkih, usklajene z organizacijskimi cilji.

Nenehen odnos do učenja

Podatkovna znanost je drugačna, kot je bila pred petimi leti. Samo poglejte, kje smo danes z umetno inteligenco v primerjavi z letom 2018. Nenehno se pojavljajo nova orodja, tehnike in teorije. Zato potrebujete nenehno učenje, da boste na tekočem z najnovejšim razvojem in se prilagajali novim tehnologijam in metodologijam na tem področju.

Potrebovali boste samomotivacijo za učenje in prilagajanje ter proaktiven pristop k pridobivanju novih znanj in veščin.

Čeprav obstajajo skupne veščine, kot sem omenil zgoraj, vsaka vloga zahteva svoj poseben sklop spretnosti. (Se spomnite? Podružnice.) Na primer, statistična analiza, veščine programiranja v Python/R in vizualizacija podatkov so specifični za bolj specializirana delovna mesta v znanosti o podatkih.

 

Preberite to, preden kariero preklopite na podatkovno znanost
Slika avtorja
 

Razčlenimo vsako vlogo, ki je povezana s podatkovno znanostjo, da boste lahko videli, kaj potrebujete.

Poslovni/podatkovni analitik

Da, to je vloga podatkovne znanosti! Tudi če se negativci ne strinjajo, še vedno verjamem, da ga lahko obravnavate vsaj kot odskočno desko, če želite vstopiti v kariero podatkovne znanosti.

Kot poslovni ali podatkovni analitik ste odgovorni za premostitev vrzeli med vpogledi v podatke in poslovno strategijo. Popoln je za tiste, ki imajo smisel za razumevanje poslovnih potreb in njihovo prevajanje v rešitve, ki temeljijo na podatkih.

Kot temeljne veščine boste potrebovali poslovna inteligenca – tu ni presenečenj –, močne analitične sposobnosti, znanje jezikov za poizvedovanje podatkov, pretežno SQL. V tej vlogi sta Python in R neobvezna, ker je glavna naloga prepiranje podatkov.

Obstaja komponenta vizualizacije toda glede na vaše delo lahko to pomeni ustvarjanje nadzornih plošč v Tableau ali grafov v Excelu.

Podatkovna analiza

Ta vloga se osredotoča na interpretacijo podatkov za zagotavljanje uporabnih vpogledov. To je odlična naloga za vas, če uživate v prevajanju številk v zgodbe in poslovne strategije.

Potrebovali boste trden ročaj statistična analiza in vizualizacija podatkov – čeprav so to lahko tabele nadzorne plošče in/ali Excelovi grafi). Potrebovali boste tudi znanje Analitična orodja kot Excel, Tableau in SQL. Python/R je spet neobvezen, vendar ne pozabite, da lahko resnično pomaga pri izvajanju statistike in avtomatizacije.

strojno učenje

Znanstveniki strojnega učenja razvijajo napovedne modele in algoritme za izdelavo napovedi ali odločitev na podlagi podatkov. Te vloge so primerne za tiste, ki jih močno zanima AI in izdelava modelov.

Brez presenečenj glede temeljnih veščin: potrebovali boste a poglobljeno razumevanje algoritmov, izkušnje z ogrodji strojnega učenja, kot sta TensorFlow in PyTorch, in odlične sposobnosti programiranja. Python in/ali R nista več izbirna, ampak ju morate imeti.

Podatkovno inženirstvo

Ta vloga vam omogoča, da se osredotočite na arhitekturo, upravljanje in vzdrževanje podatkovnih cevovodov. Primeren je za posameznike, ki uživajo v tehničnih izzivih upravljanja in optimizacije pretoka in shranjevanja podatkov.

Za zaposlitev na tem delovnem mestu boste potrebovali exstrokovnost pri upravljanju baz podatkov, procesih ETL in strokovnost v tehnologijah velikih podatkov, kot sta Hadoop in Spark. Potrebovali boste tudi strokovnost avtomatizacije podatkovnega cevovoda z uporabo tehnologij, kot je Airflow.

Poslovna inteligenca

Pri poslovnem obveščanju gre vse za ustvarjanje vizualizacij. Odličen je za pripovedovalce zgodb in ljudi z močnim smislom za poslovanje.

Morali boste biti profesionalec s tehnologijami nadzornih plošč, kot sta Tableau in Qlik, saj sta to orodji, ki ju boste uporabili za izdelavo svojih vizualizacij. Potrebovali boste tudi veščine manipulacije s podatki (beri: spretnosti SQL), da boste lažje optimizirali podatkovne poizvedbe, ki omogočajo hitro delovanje nadzorne plošče.

Kot sem že omenil v članku, je podatkovna znanost hitro razvijajoče se področje. Ves čas se odpirajo nova delovna mesta in vloge. Če se vrnem k svoji analogiji z drevesom, rad razmišljam o tem kot o novih vejah, ki se dodajajo glavnemu deblu podatkovne znanosti. Zdaj obstajajo inženirji v oblaku, strokovnjaki za SQL, vloge DevOps in še več – vsi so še vedno povezani s to podatkovno znanstveno potjo. Ta članek ponuja le kratek pregled smeri, v katere bi lahko šli s podatkovno znanostjo.

Poleg tega se morate spomniti tudi, da podatkovna znanost prinaša izzive, povezane s to šestmestno plačo. Krivulja učenja je zelo strma in učenje se nikoli ne konča. Nove tehnologije, trendi in orodja prihajajo hitro in težko – in če hočeš obdržati službo, moraš temu slediti.

Glede na vse povedano je to odlična karierna možnost. S tremi glavnimi kompetencami, ki sem jih omenil, boste dobro opremljeni za vsako vloga podatkovne znanosti ki te privlači.
 
 

Nate Rosidi je podatkovni znanstvenik in v strategiji izdelkov. Je tudi izredni profesor, ki poučuje analitiko in je ustanovitelj StrataScratch, platforma, ki pomaga podatkovnim znanstvenikom pri pripravi na intervjuje z resničnimi vprašanji za intervjuje vrhunskih podjetij. Povežite se z njim Twitter: StrataScratch or LinkedIn.

Časovni žig:

Več od KDnuggets