7 razlogov, zakaj ne bi smeli postati podatkovni znanstvenik - KDnuggets

7 razlogov, zakaj ne bi smeli postati podatkovni znanstvenik – KDnuggets

Izvorno vozlišče: 2994981

7 razlogov, zakaj ne bi smeli postati podatkovni znanstvenik
Slika urednika
 

Ste ambiciozni podatkovni znanstvenik? Če je tako, ste verjetno že videli ali slišali za mnoge, ki so se uspešno preusmerili v kariero podatkovne znanosti. In tudi upate, da boste nekoč zamenjali.

Pri delu podatkovnega znanstvenika je več stvari vznemirljivih. Ti lahko:

  • Razvijte trde in mehke veščine, prenosljive med domenami 
  • Pripovedujte zgodbe s podatki 
  • Odgovorite na poslovna vprašanja s podatki
  • Ustvarite učinkovite rešitve za poslovne težave 

In veliko več. Čeprav se vse to sliši vznemirljivo, je biti podatkovni znanstvenik enako zahtevno, če ne še večje. Toda kateri so nekateri od teh izzivov? 

Potopimo se noter.

Ko razvijate kodiranje in tehnične veščine, vam bo verjetno udobno delati sami. Toda kot podatkovni znanstvenik bi morali dati prednost sodelovanju in komunikaciji. Ker pri podatkovni znanosti ne gre za prepiranje podatkov in drobljenje številk v izolaciji. 

Sodelovati morate z drugimi strokovnjaki – ne le v isti ekipi, temveč pogosto v več ekipah. Torej je vaša sposobnost sodelovanja z različnimi ekipami in zainteresiranimi stranmi enako pomembna kot vaše tehnične sposobnosti. 

Poleg tega bi morali imeti možnost sporočiti svoje ugotovitve in vpoglede netehničnim deležnikom, vključno z vodji podjetij.

Nisha Arya Ahmed, podatkovni znanstvenik in tehnični pisec, deli:

»V ekipi podatkovne znanosti boste sodelovali z drugimi strokovnjaki podatkovne znanosti pri vsaki nalogi, njihovi odgovornosti in tem, kako vse skupaj deluje z roko v roki. To je pomembno, saj ne želite ponavljati že opravljenega dela in porabiti več časa in virov. Poleg tega strokovnjaki za podatke niso edini ljudje, s katerimi boste morali sodelovati, ampak boste del medfunkcionalne ekipe, vključno z izdelki, trženjem in tudi drugimi deležniki.«

– Nisha Arya Ahmed, podatkovna znanstvenica in tehnična pisateljica

Če ste nekdo, ki uživa v delu na projektih, njihovem dokončanju in pošiljanju v proizvodnjo, se vam podatkovna znanost morda ne bo zdela koristna kariera.

Čeprav začnete projekt z naborom ciljev – ki se iterativno izpopolnjujejo in izboljšujejo – boste pogosto morali spremeniti obseg projektov, ko se spremenijo poslovni cilji organizacije. Morda zainteresirane strani vidijo novo obetavno smer.

Zato boste morali učinkovito ponovno določiti prednostne naloge in spremeniti obseg projektov. In v najslabšem primeru opustite svoj projekt, če je potrebno. 

Tudi v zgodnji fazi zagona boste morali pogosto nositi več klobukov. Vaše delo se torej ne konča pri izdelavi modela. Tudi če vam uspe uvesti model strojnega učenja v proizvodnjo, morate spremljati delovanje svojega modela, paziti na odmike, nazadovati in po potrebi ponovno usposobiti model.

Abid Ali Awan, pisec, urednik in podatkovni znanstvenik pri KDnuggets, deli:

»Če delate v podjetju, boste morda morali pogosto preklapljati med več ekipami in delati na različnih projektih hkrati. Vendar večina projektov, na katerih delate, morda sploh ne pride do produkcije. 

Ker se lahko spremenijo prioritete podjetja ali pa vpliv projektov morda ni bil dovolj pomemben. Nenehno preklapljanje med ekipami in projekti je lahko izčrpavajoče in morda se vam zdi, da nimate pojma, h čemu prispevate.«

– Abid Ali Awan, pisec, urednik in podatkovni znanstvenik pri KDnuggets

Delo na projektih podatkovne znanosti torej ni linearen proces od začetka do konca, kjer končate projekt in nadaljujete z naslednjim. 

Dan v življenju podatkovnega znanstvenika v dveh različnih organizacijah je lahko popolnoma drugačen. Vloge podatkovnega znanstvenika, inženirja strojnega učenja in inženirja MLOps imajo pogosto veliko prekrivajočih se funkcij.

Recimo, da ste podatkovni znanstvenik, ki ga zelo zanima izdelava napovednih modelov. Dobili ste vlogo podatkovnega znanstvenika v organizaciji, ki vas zanima. 

Vendar ne bodite presenečeni, če boste cel dan prebirali številke v preglednicah in delali poročila. Ali črpanje podatkov iz baz podatkov z uporabo SQL. Morda mislite, da bo prerekanje podatkov s SQL in iskanje odgovorov na poslovna vprašanja bolj ustrezalo vlogi podatkovnega analitika.

Medtem ko ste v nekaterih drugih primerih morda odgovorni za gradnjo in uvajanje modelov v proizvodnjo, spremljanje odmikov in ponovno usposabljanje modela po potrebi. V tem primeru ste podatkovni znanstvenik, ki prav tako nosi klobuk MLOps inženir

Poslušajmo, kaj ima Abid povedati o pretočnosti vlog v karieri podatkov:

»Vedno sem zmeden, ker me imenujejo »podatkovni znanstvenik«. Kaj to sploh pomeni? Ali sem podatkovni analitik, inženir poslovne inteligence, inženir strojnega učenja, inženir MLOps ali vse našteto? Vaša vloga v podjetju je tekoča, če delate v manjšem podjetju ali startupu. Vendar imajo lahko večje organizacije jasnejšo razliko med vlogami. Vendar to ne zagotavlja, da je vloga popolnoma opredeljena. Morda ste podatkovni znanstvenik; vendar bo veliko dela, ki ga boste opravili, morda ustvarjanje poročil o analizi, ki so v skladu s poslovnimi cilji.«

– Abid Ali Awan, pisec, urednik in podatkovni znanstvenik pri KDnuggets

Kot podatkovni znanstvenik bi se morali usmeriti v projekte, ki imajo največji vpliv na podjetje, namesto da bi sledili tehnično zanimivim, a manj relevantnim projektom. V ta namen je razumevanje poslovnih ciljev ključnega pomena iz naslednjih razlogov:

  • Razumevanje poslovnih ciljev vam omogoča, da prilagodite in ponovno razvrstite svoje projekte glede na spreminjajoče se potrebe organizacije.
  • Uspeh podatkovnega projekta se pogosto meri z njegovim vplivom na podjetje. Dobro razumevanje poslovnih ciljev torej zagotavlja jasen okvir za ocenjevanje uspeha projekta, ki povezuje tehnične vidike z oprijemljivimi poslovnimi rezultati.

Matthew Mayo, glavni urednik in podatkovni znanstvenik pri KDnuggets, deli stroške brezbrižnosti do poslovnih rezultatov:

»Če ste kot podatkovni znanstvenik brezbrižni do poslovnih ciljev, ste morda prav tako mačka, ki lovi laserski kazalec – ugotovili boste, da ste preveč aktivni in brez cilja, verjetno ne boste dosegli ničesar pomembnega. Razumevanje poslovnih ciljev in sposobnost njihovega prenosa iz poslovnega v podatkovni govor sta ključni veščini, brez katerih bi lahko vlagali čas v gradnjo najbolj izpopolnjenih, nepomembnih modelov. Odločitveno drevo, ki deluje, vsak dan premaga najsodobnejšo napako!«

– Matthew Mayo, glavni urednik in podatkovni znanstvenik, KDnuggets

Tukaj je tisto, kar ima Nisha povedati o tem:

»Kar koli narediš, potrebuješ razlog za to. To je vaš namen, ki je pred vašim dejanjem. Ko gre za svet podatkov, je razumevanje poslovanja in izzivov nujno. Brez tega boste skozi postopek samo zmedeni. Pri vsakem koraku, ki ga naredite v projektu podatkovne znanosti, se boste želeli sklicevati na cilje, ki motivirajo projekt.« 

– Nisha Arya Ahmed, podatkovna znanstvenica in tehnična pisateljica

Pri znanosti o podatkih torej ne gre le za drobljenje številk in gradnjo kompleksnih modelov. Gre bolj za izkoriščanje podatkov za spodbujanje poslovnega uspeha. 

Brez trdnega razumevanja poslovnih ciljev se lahko vaši projekti oddaljijo od poslovnih težav, ki naj bi jih rešili – kar zmanjša njihovo vrednost in vpliv.

Gradnja modelov je razburljiva. Vendar pa pot do tega morda ni tako zanimiva. 

Pričakujete lahko, da boste porabili velike kose svojega časa:

  • Zbiranje podatkov 
  • Prepoznavanje najustreznejše podmnožice podatkov za uporabo
  • Čiščenje podatkov, da bodo primerni za analizo 

To je delo, ki ni preveč razburljivo. Pogosto vam sploh ni treba zgraditi modelov strojnega učenja. Ko imate podatke v zbirki podatkov, lahko uporabite SQL za odgovore na vprašanja. V tem primeru vam sploh ni treba zgraditi modela strojnega učenja.

Tukaj je Abid, ki deli svoje poglede na to, kako pomembno delo pogosto ni zanimivo:

»Vedno ponavljati isto stvar je lahko dolgočasno. Pogosto vam lahko dodelijo nalogo čiščenja podatkov, kar je lahko precej težko, zlasti pri delu z različnimi nabori podatkov. Poleg tega naloge, kot sta preverjanje veljavnosti podatkov in pisanje enotnih testov, morda niso tako vznemirljive, vendar so potrebne.«

– Abid Ali Awan, pisec, urednik in podatkovni znanstvenik pri KDnuggets

Torej morate uživati ​​v procesu dela s podatki – vključno z dobrimi, slabimi in grdimi –, če želite imeti uspešno kariero v znanosti o podatkih. Ker je podatkovna znanost namenjena pridobivanju vrednosti iz podatkov. Pri čemer pogosto ne gre za izdelavo najbolj dovršenih modelov.

Kot podatkovni znanstvenik (verjetno) nikoli ne boste mogli doseči točke, ko bi lahko rekli, da ste se vsega naučili. Kaj se morate naučiti in koliko, je odvisno od tega, na čem delate.

To bi lahko bila dokaj preprosta naloga, kot je učenje in uporaba novega okvira v prihodnosti. Ali kaj bolj dolgočasnega, kot je selitev obstoječe kodne baze v jezik, kot je Rust, za izboljšano varnost in zmogljivost. Poleg tega, da ste tehnično močni, bi se morali znati naučiti in po potrebi hitro uporabljati ogrodja, orodja in programske jezike. 

Poleg tega bi morali biti pripravljeni izvedeti več o domeni in podjetju, če je potrebno. Ni zelo verjetno, da boste v svoji karieri v znanosti o podatkih delali v eni sami domeni. Na primer, lahko začnete kot podatkovni znanstvenik v zdravstvu, nato pa se premaknete v fintech, logistiko in drugo.

Med podiplomskim šolanjem sem imel priložnost delati na strojnem učenju v zdravstvu – na projektu prognoze bolezni. Nikoli nisem bral biologije po srednji šoli. Tako je bilo prvih nekaj tednov namenjenih raziskovanju tehničnih podrobnosti specifičnih biomedicinskih signalov – njihovih lastnosti, lastnosti in še veliko več. Ti so bili zelo pomembni, preden sem sploh lahko nadaljeval s predhodno obdelavo zapisov.

Kanwal Mehreen, tehnična pisateljica z nami deli svoje izkušnje:

»Poznaš tisti občutek, ko se končno naučiš nove veščine in si misliš: »Ah, to je to, dobro sem«? No, v podatkovni znanosti ta trenutek nikoli ne pride. To področje se nenehno razvija z novimi tehnologijami, orodji in metodologijami, ki se pogosto pojavljajo. Torej, če ste nekdo, ki raje doseže določeno točko, kjer je učenje v ozadju, potem kariera podatkovne znanosti morda ni najboljša kombinacija. 

Poleg tega je znanost o podatkih čudovita mešanica statistike, programiranja, strojnega učenja in znanja o domeni. Če vas zamisel o raziskovanju različnih področij, od zdravstva do financ in trženja, ne navdušuje, se lahko počutite izgubljene v svoji karieri.«

– Kanwal Mehreen, tehnični pisec

Kot podatkovni znanstvenik se torej nikoli ne smete izogibati nenehnemu učenju in izpopolnjevanju.

Opisali smo že več izzivov biti podatkovni znanstvenik, vključno z:

  • Preseganje tehničnih veščin kodiranja in gradnje modelov
  • Razumevanje področja in poslovnih ciljev 
  • Nenehno učenje in izpopolnjevanje, da ostanete ustrezni 
  • Biti proaktiven brez skrbi o dokončanju projektov v dobesednem pomenu 
  • Biti pripravljen na ponovno določanje prioritet, nazadovanje in spremembe
  • Opravljanje dela, ki je dolgočasno, a nujno 

Kot vsaka druga tehnološka vloga je težji del ne dobil službo podatkovnega znanstvenika. Gradi uspešno kariero v znanosti o podatkih.

Mathew Mayo primerno povzema, kako bi morali kot podatkovni znanstvenik sprejeti te izzive:

»Iščete sproščeno kariero, v kateri bi lahko prenehali z učenjem v trenutku, ko začnete službo, in vas nikoli ne bi skrbelo za najnovejša orodja, trike in tehnike? No, pozabite na podatkovno znanost! Pričakovati tiho kariero strokovnjaka za podatke je podobno pričakovanju suhega sprehoda po monsunu, oboroženega le s koktajl dežnikom in optimističnim odnosom. 

To področje je nenehni tobogan tehničnih ugank in netehničnih enigm: en dan se poglabljate v algoritme, naslednji dan pa skušate svoje ugotovitve razložiti nekomu, ki misli, da je regresija umik v otroško vedenje. Toda vznemirjenje je v teh izzivih in to je tisto, zaradi česar se zabavajo naši od kofeina preobremenjeni možgani. 

Če ste alergični na izzive, boste morda več tolažbe našli v pletenju. Toda če se še niste umaknili pred soočenjem s poplavo podatkov, je znanost o podatkih morda vaša skodelica ... kave.«

– Matthew Mayo, glavni urednik in podatkovni znanstvenik, KDnuggets

Poslušajmo Kanwalove misli o tem:

»Priznajmo si dejstvo: znanost o podatkih ni vedno gladka. Podatki ne pridejo vedno v čistih in organiziranih paketih. Vaši podatki so lahko videti, kot da so šli skozi nevihto, kar je lahko nepopolno, nedosledno ali celo netočno. Čiščenje in predhodna obdelava teh podatkov za zagotovitev njihove ustreznosti za analizo je lahko zahtevna.

Med delom na multidisciplinarnem področju boste morda morali sodelovati z netehničnimi deležniki. Razložiti jim tehnične koncepte in kako se uskladijo z njihovimi cilji, je lahko resen izziv.

Torej, če ste nekdo, ki ima raje jasno in preprosto poklicno pot, je lahko kariera podatkovne znanosti za vas polna ovir.«

– Kanwal Mehreen, tehnični pisec

Podatkovna znanost torej ni samo matematika in modeli; gre za prehod od podatkov do odločitev. In v tem procesu bi morali biti vedno pripravljeni na učenje in izpopolnjevanje, razumeti poslovne cilje in tržno dinamiko ter še veliko več.

Če iščete zahtevno kariero, v kateri bi radi vztrajno krmarili, je znanost o podatkih res dobra poklicna možnost za vas. Veselo raziskovanje!

Zahvaljujem se Matthewu, Abidu, Nishi in Kanwalu za delitev svojih vpogledov o več vidikih kariere podatkovne znanosti. In ker je ta članek veliko bolj zanimiv in prijeten za branje!
 
 

Bala Priya C je razvijalec in tehnični pisec iz Indije. Rada dela na presečišču matematike, programiranja, znanosti o podatkih in ustvarjanja vsebin. Njena področja zanimanja in strokovnega znanja vključujejo DevOps, znanost o podatkih in obdelavo naravnega jezika. Uživa v branju, pisanju, kodiranju in kavi! Trenutno se uči in svoje znanje deli s skupnostjo razvijalcev, tako da piše vadnice, vodnike z navodili, mnenja in drugo.

Časovni žig:

Več od KDnuggets