Kako sem potrojil svoj dohodek z znanostjo o podatkih v 18 mesecih

Kako sem potrojil svoj dohodek z znanostjo o podatkih v 18 mesecih

Izvorno vozlišče: 1860177

Kako sem potrojil svoj dohodek z znanostjo o podatkih v 18 mesecih
Foto: Karolina Grabowska
 

Pred približno 18 meseci sem izgubil službo zaradi pandemije COVID-19. Med študijem na fakulteti sem delal kot honorarni mentor. Denar, ki sem ga dobil od poučevanja, sem porabil za kritje stroškov, kot so hrana, bencin in avto.

Potem ko je vlada uvedla omejitve karantene za celotno državo, nisem mogel nadaljevati s poučevanjem. Tudi na fakulteto nisem mogel iti in sem se moral učiti doma.

Čeprav se je to sprva zdelo grozno, sem spoznal, da mi je odsotnost na univerzi in v službi sprostila veliko časa.

V tem času sem začel iskati razširitev svojega nabora spretnosti. Po nekaj raziskavah sem našel spletni tečaj strojnega učenja, ki se mi je zdel precej zanimiv.

To je bil prvi spletni tečaj, ki sem ga kdaj zaključil.

Po tem sem večino svojega časa porabil za gradnjo projektov, učenje kodiranja in pridobivanje spletnih certifikatov.

Sedaj – po 18 mesecih sem s svojim znanjem na področju podatkovne znanosti in analitike zgradil več tokov dohodka.

Prvič sem se pridružil podjetju kot pripravnik za podatkovno znanost za nekaj časa in zdaj tam delam s polnim delovnim časom.

Sprva sem pričakoval, da bo moje delo obsegalo predvsem izdelavo modelov.

Vendar ko sem se pridružil, sem ugotovil, da je moje delo le okoli 10 % izdelava modelov. Preostali čas smo z ekipo iskali nove rešitve, ki bi jih lahko ustvarili za reševanje poslovnih težav.

Pogosto teh težav sploh ni bilo treba rešiti s strojnim učenjem. Podatkovna rešitev bi lahko vsebovala le poslovno logiko, prevedeno v preprosto poizvedbo SQL.

Delo, ki ga opravljam vsak dan, vključuje odgovarjanje na vprašanja, kot so:

  • Kako uporabljamo podatke za iskanje informacij o konkurentih podjetja A?
  • Izdelali smo model napovedi obiska strank. Katere primere poslovne uporabe lahko identificiramo za testiranje tega modela? Ali deluje tako dobro v produkcijskem okolju kot v testnem okolju?
  • Kako lahko nenehno izboljšujemo segmentacijo in uspešnost za naše stranke? Ali lahko iz razpoložljivih podatkov sklepamo o resničnih scenarijih?

To je zelo abstrakten opis vrste dela, ki ga opravljam vsakodnevno, vendar želim poudariti, da se ustvarjanje rešitve podatkovne znanosti ne začne in ne konča z izdelavo modela.

Če ste ambiciozni podatkovni znanstvenik, predlagam, da pridobite nekaj znanja o področju v industriji, v kateri želite delati.

 
Pišem o svojih izkušnjah na področju podatkovne znanosti.

Če v službi izdelam projekt, najdem podoben nabor podatkov na Kaggleju in ponovim analizo ter okoli tega ustvarim vadnico.

Sprva sem začel pisati in objavljati vadnice o podatkovni znanosti, da bi izboljšal svoj portfelj.

Pisanje člankov o svojem delu je bil način, da sem se povezal z drugimi ambicioznimi podatkovnimi znanstveniki. To je bil tudi način, da pokažem svojo sposobnost kodiranja in gradnje modelov ML.

Na začetku nikoli nisem pričakoval, da bom za svoje pisanje plačan. Mislil sem, da je to odličen način za izboljšanje mojega portfelja znanosti o podatkih.

V zadnjem letu pa je tisto, kar se je začelo kot hobi, začelo ustvarjati prihodke.

Zdaj lahko ustvarim pasivni dohodek s preprostim ustvarjanjem vadnic, projektov, povezanih s podatki, in pisanjem o svojih izkušnjah.

Ko sem začel graditi spletno prisotnost v skupnosti podatkovnih znanosti, sem začel dobivati ​​več ponudb za samostojne poklice. Izdelal sem modele strojnega učenja za stranke na enkratni osnovi, ustvaril poročila o analizi konkurentov in napisal članke o znanosti o podatkih.

Ko sem sprva pomislil na samostojno delo, sem si predstavljal, da moram tekmovati in se potegovati za projekte na spletni platformi.

Vendar so se vse moje samostojne stranke obrnile name, ko so prebrale moje članke ali si ogledale moje portfeljske projekte.

Pred nekaj meseci sem zgradil algoritem za združevanje v gruče in na spletu objavil vadnico o tem. Naslednji dan me je nekdo poklical in me vprašal, ali bi me zanimala izgradnja modela grozdenja za njihovo stranko.

Freelancing me je opremil z veliko spretnostmi zunaj področja, na katerem običajno delam.

V mojem podjetju so podatki, s katerimi delam, običajno v določeni vnaprej obdelani obliki, podatke pa poizvedujem s SQL in Pythonom, da jih lahko uporabim.

Pri samostojnem delu pa so podatki o strankah v zelo različnih oblikah. Večina ni obdelana ali strukturirana in veliko časa sem porabil za ugotavljanje odnosov med nabori podatkov in njihovo razumevanje.

Zbrati moram tudi zunanje podatke, da pripravim analizo, kar običajno vključuje strganje spletnih mest tretjih oseb in uporabo odprtokodnih orodij.

Zdi se mi, da mi je samostojni poklic dal izpostavljenost znanju, ki ga trenutno nimam v svoji dnevni službi, in se lahko naučim novih stvari pri vsakem projektu, ki se ga lotim.

Zgoraj sem omenil, da sem obiskal spletni tečaj znanosti o podatkih in od tam so se stvari spremenile. Morda se sprašujete, kako.

Če sem popolnoma iskren, sem se po svojem prvem spletnem tečaju podatkovne znanosti počutil izgubljenega. Približno en mesec sem se učil različnih algoritmov in modelov usposabljanja s Scikit-Learn.

Preprosto nisem vedel, kam naj grem od tam.

Začel sem brati članke o ljudeh, ki jim je uspelo dobiti službo podatkovne znanosti brez magisterija ali kakršne koli poklicne kvalifikacije. Spoznal sem pomen poznavanja področja in reševanja problemov s pomočjo razpoložljivih podatkov.

Ni mi bilo treba zgraditi najbolj natančnih modelov ali razumeti osnovnega algoritma, ki stoji za modelom.

Spoznal sem, da je zame najpomembnejša veščina sposobnost reševanja problemov z uporabo podatkov. To je pomenilo, da sem moral preseči algoritme strojnega učenja.

Obiskoval sem tečaje poslovne analitike in inženiringa ML. Več časa sem porabil za učenje kodiranja kot za teorijo. Čas sem porabil za učenje SQL in obdelave podatkov.

Nato sem svoje podatke zbiral s spletnih strani s pomočjo spletnega strganja. Podatke sem uporabil za rešitev težave in z njimi zgradil preprosto spletno aplikacijo za strojno učenje.

Na ta način sem počasi pridobil veščine, ki so potrebne, da postanem podatkovni znanstvenik od konca do konca.

Tudi v ekipi za analizo podatkov na mojem delovnem mestu, če obstajajo kakršni koli projekti, ki presegajo obseg našega vsakdanjega dela (projekti, ki zahtevajo zunanje zbiranje podatkov ali nov algoritem), sem jaz tisti, ki sem mu običajno dodeljen.

Kot ambicioznemu podatkovnemu znanstveniku vam je na spletu na voljo toliko virov. Pravzaprav preveč, da ne veš, med katerimi bi izbral.

Največ poudarka pa je na gradnji modelov.

Čeprav je pomembno poznati osnove gradnje in usposabljanja modela, večina delovnih mest, ki so na voljo, zahteva, da to presežete.

Pravo povpraševanje je po ljudeh, ki znajo rešiti težave s pomočjo razpoložljivih podatkov.

 
 
Nataša Selvaraj je samouk podatkovni znanstvenik s strastjo do pisanja. Z njo se lahko povežete na LinkedIn.
 

Časovni žig:

Več od KDnuggets