Cum mi-am triplat venitul cu Data Science în 18 luni

Cum mi-am triplat venitul cu Data Science în 18 luni

Nodul sursă: 1860177

Cum mi-am triplat venitul cu Data Science în 18 luni
Fotografie de Karolina Grabowska
 

În urmă cu aproximativ 18 luni, mi-am pierdut locul de muncă din cauza pandemiei de COVID-19. Lucram ca tutor part-time în timp ce eram la facultate. Banii pe care i-am primit din învățătură au fost folosiți pentru a acoperi cheltuieli precum mâncarea, benzina și mașina mea.

După ce guvernul a impus restricții de izolare asupra întregii țări, nu am putut continua să predau. Nici eu nu puteam să merg la facultate și trebuia să studiez acasă.

Deși acest lucru mi s-a părut groaznic la început, mi-am dat seama că a nu merge la universitate și la muncă mi-a eliberat mult timp.

Am început să caut să-mi extind setul de abilități în acest timp. După ce am făcut câteva cercetări, am găsit un curs online de învățare automată care mi s-a părut destul de interesant.

Acesta a fost primul curs online pe care l-am urmat vreodată.

După aceea, mi-am petrecut cea mai mare parte a timpului construind proiecte, învățând să codific și obținând certificări online.

Acum, după 18 luni, am construit mai multe fluxuri de venit cu cunoștințele mele în domeniul științei datelor și al analizei.

M-am alăturat pentru prima dată unei companii ca stagiar în știința datelor de ceva timp și acum lucrez acolo cu normă întreagă.

La început, mă așteptam ca munca mea să cuprindă în primul rând crearea de modele.

Cu toate acestea, odată ce m-am alăturat, mi-am dat seama că munca mea era doar aproximativ 10% model-building. În restul timpului, echipa mea și cu mine căutam noi soluții pe care le puteam crea pentru a rezolva problemele de afaceri.

Adesea, aceste probleme nici măcar nu au necesitat pentru a fi rezolvate învățarea automată. Soluția de date ar putea cuprinde doar logica de afaceri tradusă într-o simplă interogare SQL.

Munca pe care o fac zilnic presupune să răspund la întrebări precum:

  • Cum folosim datele pentru a găsi informații despre concurenții Companiei A?
  • Am construit un model de predicție a piciorului clienților. Care sunt cazurile de utilizare în afaceri pe care le putem identifica pentru a testa acest model? Funcționează la fel de bine într-un mediu de producție ca și într-un mediu de testare?
  • Cum putem îmbunătăți continuu segmentarea și performanța pentru clienții noștri? Suntem capabili să deducem scenarii din viața reală din datele disponibile?

Aceasta este o descriere foarte abstractă a tipului de muncă pe care o fac zilnic, dar vreau să subliniez că crearea unei soluții de știință a datelor nu începe și se termină cu construirea de modele.

Dacă sunteți un aspirant în domeniul științei datelor, vă sugerez să obțineți cunoștințe de domeniu în industria în care doriți să lucrați.

 
Scriu despre experiența mea în domeniul științei datelor.

Dacă construiesc un proiect la locul de muncă, găsesc un set de date similar pe Kaggle și replic analiza și creez un tutorial în jurul acestuia.

Am început inițial să scriu și să postez tutoriale despre știința datelor pentru a-mi îmbunătăți portofoliul.

Scrierea de articole despre munca mea a fost o modalitate pentru mine de a intra în legătură cu alți oameni de știință de date aspiranți. A fost, de asemenea, o modalitate pentru mine de a-mi prezenta capacitatea de a codifica și de a construi modele ML.

Inițial, nu mă așteptam să fiu plătit pentru scrisul meu. M-am gândit că este o modalitate excelentă de a-mi îmbunătăți portofoliul de știință a datelor.

În ultimul an, însă, ceea ce a început ca un hobby a început să genereze venituri.

Acum pot obține venituri pasive creând, pur și simplu, tutoriale, proiecte legate de date și scriind despre experiențele mele.

Pe măsură ce am început să-mi construiesc o prezență online în comunitatea științei datelor, am început să primesc mai multe oferte pentru freelance. Am creat o singură dată modele de învățare automată pentru clienți, am creat rapoarte de analiză a concurenței și am scris articole despre știința datelor.

Când m-am gândit inițial la freelancing, mi-am imaginat că trebuie să concurez și să licitez pentru proiecte pe o platformă online.

Cu toate acestea, toți clienții mei independenți m-au contactat după ce mi-au citit articolele sau au aruncat o privire asupra proiectelor mele din portofoliu.

Cu câteva luni în urmă, am construit un algoritm de grupare și am postat online un tutorial despre acesta. A doua zi, cineva a contactat mine, întrebându-mă dacă aș fi interesat să construiesc un model de clustering pentru clientul lor.

Freelancing m-a dotat cu o mulțime de abilități în afara domeniului în care lucrez de obicei.

În compania mea, datele cu care lucrez vin de obicei într-un anumit format preprocesat și interog datele cu SQL și Python pentru a le folosi.

Cu toate acestea, atunci când lucrează independent, datele clienților vin în formate foarte diferite. Cea mai mare parte nu este procesată sau structurată și am petrecut mult timp descoperind relațiile dintre seturile de date și dând sens.

De asemenea, trebuie să colectez date externe pentru a realiza o analiză, iar acest lucru implică, de obicei, eliminarea site-urilor web terțe și utilizarea instrumentelor open-source.

Simt că munca independentă mi-a dat expunere la cunoștințe pe care nu le am în prezent la jobul meu de zi cu zi și sunt capabil să învăț lucruri noi cu fiecare proiect pe care îl asum.

Am menționat mai sus că am urmat un curs online de știință a datelor și lucrurile s-au schimbat de acolo. S-ar putea să vă întrebați cum.

Ca să fiu complet sincer, după ce am urmat primul meu curs online de știință a datelor, m-am simțit pierdut. Am petrecut aproximativ o lună învățând diferiții algoritmi și modele de antrenament cu Scikit-Learn.

Pur și simplu nu știam unde să merg de acolo.

Am început să citesc articole despre oameni care au reușit să obțină un loc de muncă în știința datelor fără o diplomă de master sau vreo calificare profesională. Mi-am dat seama de importanța cunoașterii domeniului și a rezolvării problemelor cu ajutorul datelor disponibile.

Nu a fost necesar să construiesc cele mai precise modele sau să înțeleg algoritmul care stă la baza modelului.

Mi-am dat seama că cea mai importantă abilitate pentru mine a fost abilitatea de a rezolva probleme folosind date. Acest lucru a însemnat că a trebuit să merg dincolo de algoritmii de învățare automată.

Am urmat cursuri de business analytics și ML engineering. Am petrecut mai mult timp învățând să codific decât pe teorie. Am petrecut timp învățând SQL și manipularea datelor.

Apoi, mi-am colectat propriile date de pe site-uri online cu ajutorul web scraping. Am folosit datele pentru a rezolva o problemă și am construit o aplicație web simplă de învățare automată cu ea.

În acest fel, am câștigat încet abilitățile necesare pentru a deveni un om de știință de date end-to-end.

Chiar și în cadrul echipei de analiză a datelor de la locul meu de muncă, dacă există proiecte care depășesc sfera muncii noastre zilnice (proiecte care necesită colectare externă de date sau un nou algoritm), eu sunt cel care de obicei este repartizat.

Ca un aspirant cercetător de date, există atât de multe resurse puse la dispoziție online. Prea multe, de fapt, că nu știi din ce să alegi.

Cu toate acestea, cea mai mare parte a accentului este pus în jurul construcției de modele.

Deși este important să cunoașteți elementele fundamentale ale construirii și pregătirii unui model, majoritatea locurilor de muncă disponibile acolo necesită să depășiți acest lucru.

Cererea reală este de oameni care pot rezolva probleme cu ajutorul datelor disponibile.

 
 
Natassha Selvaraj este un cercetător de date autodidact cu o pasiune pentru scris. Te poți conecta cu ea LinkedIn.
 

Timestamp-ul:

Mai mult de la KDnuggets