Kuinka kolminkertaasin tuloni datatieteen avulla 18 kuukaudessa

Kuinka kolminkertaasin tuloni datatieteen avulla 18 kuukaudessa

Lähdesolmu: 1860177

Kuinka kolminkertaasin tuloni datatieteen avulla 18 kuukaudessa
Kuva Karolina Grabowska
 

Noin 18 kuukautta sitten menetin työpaikkani COVID-19-pandemian vuoksi. Työskentelin osa-aikaisena tutorina yliopistossa. Tutoroinnista saamani rahat käytettiin kuluihin, kuten ruokaan, bensiiniin ja autoon.

Sen jälkeen kun hallitus asetti lukitusrajoitukset koko maahan, en voinut jatkaa opettamista. En myöskään päässyt yliopistoon ja minun piti opiskella kotona.

Vaikka tämä tuntui aluksi kamalalta, tajusin, että yliopistoon ja töihin menemättä jättäminen vapautti paljon aikaani.

Tänä aikana aloin pohtimaan taitojeni laajentamista. Tutkittuani jonkin verran löysin koneoppimisen verkkokurssin, joka vaikutti melko mielenkiintoiselta.

Se oli ensimmäinen verkkokurssi, jonka olin koskaan suorittanut.

Sen jälkeen vietin suurimman osan ajastani projektien rakentamiseen, koodaamisen opettelemiseen ja online-sertifikaattien hankkimiseen.

Nyt – 18 kuukauden kuluttua – olen rakentanut useita tulovirtoja tietotieteen ja analytiikan alan tietämykselläni.

Liityin ensin johonkin yritykseen datatieteen harjoittelijaksi jonkin aikaa ja työskentelen siellä nyt kokopäiväisesti.

Aluksi odotin työni koostuvan pääasiassa mallin rakentamisesta.

Liityttyäni kuitenkin tajusin, että työni oli vain noin 10 % mallinrakennusta. Lopun ajan tiimini ja minä etsimme uusia ratkaisuja, joita voisimme luoda liiketoiminnan ongelmien ratkaisemiseksi.

Usein nämä ongelmat eivät edes vaatineet koneoppimisen ratkaisemista. Dataratkaisu voisi vain koostua liiketoimintalogiikasta, joka on käännetty yksinkertaiseksi SQL-kyselyksi.

Päivittäiseen työhöni kuuluu vastata seuraaviin kysymyksiin:

  • Kuinka käytämme tietoja löytääksemme tietoa yrityksen A kilpailijoista?
  • Olemme rakentaneet asiakasmäärän ennustemallin. Mitä yrityskäyttötapauksia voimme tunnistaa testataksemme tätä mallia? Toimiiko se yhtä hyvin tuotantoympäristössä kuin testiympäristössä?
  • Kuinka voimme jatkuvasti parantaa asiakkaidemme segmentointia ja suorituskykyä? Pystymmekö saatavilla olevien tietojen perusteella päättelemään tosielämän skenaarioita?

Tämä on hyvin abstrakti kuvaus siitä, millaista työtä teen päivittäin, mutta haluan korostaa, että datatieteen ratkaisun luominen ei ala ja pääty mallin rakentamiseen.

Jos olet aloitteleva datatieteilijä, suosittelen hankkimaan jonkin verran tietoa alalta, jolla haluat työskennellä.

 
Kirjoitan kokemuksestani datatieteen alalla.

Jos rakennan projektin työssäni, löydän samanlaisen tietojoukon Kagglesta ja toistan analyysin ja luon sen ympärille opetusohjelman.

Aloin aluksi kirjoittaa ja julkaista datatieteen opetusohjelmia parantaakseni portfolioni.

Artikkelien kirjoittaminen työstäni oli minulle tapa olla yhteydessä muihin pyrkiviin tietotieteilijöihin. Se oli myös tapa esitellä kykyäni koodata ja rakentaa ML-malleja.

Aluksi en koskaan odottanut saavani palkkaa kirjoituksestani. Ajattelin vain, että se oli loistava tapa parantaa datatieteen portfoliotani.

Kuluneen vuoden aikana harrastukselta alkanut alkoi kuitenkin tuottaa tuloja.

Pystyn ansaitsemaan passiivisia tuloja nyt yksinkertaisesti luomalla dataan liittyviä opetusohjelmia, projekteja ja kirjoittamalla kokemuksistani.

Kun aloin rakentaa online-läsnäoloa datatieteen yhteisössä, aloin saada useita freelance-tarjouksia. Olen rakentanut koneoppimismalleja asiakkaille kertaluonteisesti, luonut kilpailija-analyysiraportteja ja kirjoittanut datatieteen artikkeleita.

Kun alun perin ajattelin freelancerina, kuvittelin minun kilpailla ja tehdä tarjouksia projekteista online-alustalla.

Kaikki freelance-asiakkaani ovat kuitenkin ottaneet minuun yhteyttä luettuani artikkeleitani tai katsottuaan portfolioprojektejani.

Muutama kuukausi sitten rakensin klusterointialgoritmin ja julkaisin siitä opetusohjelman verkossa. Seuraavana päivänä joku otti minuun yhteyttä ja kysyi, olisinko kiinnostunut rakentamaan klusterointimallin heidän asiakkaalleen.

Freelancerina olen hankkinut paljon taitoja sen toimialueen ulkopuolella, jolla yleensä työskentelen.

Yrityksessäni käsittelemäni data tulee yleensä tietyssä esikäsitellyssä muodossa, ja kyselyn tiedoista SQL:llä ja Pythonilla hyödyntääkseni sitä.

Freelancerina asiakasdataa tulee kuitenkin hyvin erilaisissa muodoissa. Suurin osa niistä ei ole käsitelty tai jäsennelty, ja olen viettänyt paljon aikaa tietojoukkojen välisten suhteiden selvittämiseen ja sen ymmärtämiseen.

Minun on myös kerättävä ulkopuolista dataa analyysin tekemiseksi, ja tähän liittyy yleensä kolmannen osapuolen verkkosivustojen kaapiminen ja avoimen lähdekoodin työkalujen käyttö.

Minusta tuntuu, että freelancerina olen avannut minulle tietoa, jota minulla ei tällä hetkellä ole päivätyössäni, ja pystyn oppimaan uusia asioita jokaisessa projektissani.

Mainitsin yllä, että kävin datatieteen verkkokurssilla, ja asiat muuttuivat sieltä. Saatat ihmetellä, miten.

Ollakseni täysin rehellinen, ensimmäisen datatieteen verkkokurssini suoritettuani tunsin oloni eksykseksi. Vietin noin kuukauden opetellen erilaisia ​​algoritmeja ja koulutusmalleja Scikit-Learnin avulla.

En yksinkertaisesti tiennyt minne mennä sieltä.

Aloin lukea artikkeleita ihmisistä, jotka onnistuivat saamaan datatieteen työpaikan ilman maisterin tutkintoa tai ammattipätevyyttä. Tajusin toimialuetiedon ja ongelmien ratkaisemisen tärkeyden saatavilla olevan tiedon avulla.

Minun ei tarvinnut rakentaa tarkimpia malleja tai ymmärtää mallin taustalla olevaa algoritmia.

Ymmärsin, että tärkein taito minulle on kyky ratkaista ongelmia datan avulla. Tämä tarkoitti, että minun piti mennä koneoppimisalgoritmeja pidemmälle.

Olen käynyt yritysanalytiikan ja ML-tekniikan kursseja. Vietin enemmän aikaa koodaamiseen kuin teoriaan. Vietin aikaa SQL:n ja tietojen käsittelyn oppimiseen.

Sitten keräsin omat tietoni verkkosivustoilta web-kaappauksen avulla. Käytin dataa ongelman ratkaisemiseen ja rakensin sen avulla yksinkertaisen koneoppimisverkkosovelluksen.

Tällä tavalla sain hitaasti taidot, joita tarvitaan päästäkseni päähän datatieteilijäksi.

Jopa työssäni data-analytiikkatiimissä, jos on projekteja, jotka ylittävät päivittäisen työmme (projektit, jotka vaativat ulkopuolista tiedonkeruuta tai uutta algoritmia), olen yleensä se, joka siihen määrätään.

Pyrkivänä datatieteilijänä sinulle on tarjolla monia resursseja verkossa. Itse asiassa liian monta, ettet tiedä mistä valita.

Suurin painopiste on kuitenkin mallinrakennuksessa.

Vaikka onkin tärkeää tuntea mallin rakentamisen ja koulutuksen perusteet, useimmat siellä olevat työpaikat vaativat sinua pidemmälle.

Todellinen kysyntä on ihmisille, jotka voivat ratkaista ongelmat käytettävissä olevan tiedon avulla.

 
 
Natassha Selvaraj on itseoppinut datatieteilijä, jolla on intohimo kirjoittamiseen. Voit olla yhteydessä häneen LinkedIn.
 

Aikaleima:

Lisää aiheesta KDnuggets