7 motivi per cui non dovresti diventare un data scientist - KDnuggets

7 motivi per cui non dovresti diventare un data scientist – KDnuggets

Nodo di origine: 2994981

7 motivi per cui non dovresti diventare un data scientist
Immagine dell'editore
 

Sei un aspirante data scientist? Se è così, è probabile che tu abbia visto o sentito parlare di molti che sono passati con successo a una carriera nel campo della scienza dei dati. E speri anche tu di fare il cambiamento un giorno.

Ci sono molte cose entusiasmanti nel lavorare come data scientist. Puoi:

  • Sviluppa competenze hard e soft trasferibili in più ambiti 
  • Raccontare storie con i dati 
  • Rispondi alle domande aziendali con i dati
  • Costruisci soluzioni di impatto ai problemi aziendali 

E altro ancora. Per quanto tutto ciò possa sembrare entusiasmante, essere uno scienziato dei dati è altrettanto impegnativo, se non di più. Ma quali sono alcune di queste sfide? 

Tuffiamoci dentro

Quando lavori sulle tue competenze tecniche e di codifica, probabilmente ti sentirai a tuo agio a lavorare da solo. Ma come data scientist, dovresti dare priorità alla collaborazione e alla comunicazione. Perché la scienza dei dati non consiste nel discutere dati e nell’elaborare numeri in modo isolato. 

Devi collaborare con altri professionisti, non solo nello stesso team ma spesso tra più team. Quindi la tua capacità di collaborare con team e stakeholder diversi è importante tanto quanto le tue capacità tecniche. 

Inoltre, dovresti anche essere in grado di comunicare i tuoi risultati e approfondimenti alle parti interessate non tecniche, compresi i leader aziendali.

Nisha Arya Ahmed, data scientist e scrittore tecnico, condivide:

“In un team di data science, collaborerai con altri professionisti della data science su ogni attività, sulle loro responsabilità e su come tutto funziona di pari passo. Questo è importante perché non vuoi ripetere il lavoro già svolto e consumare più tempo e risorse. Inoltre, i professionisti dei dati non sono le uniche persone con cui dovrai collaborare, farai parte di un team interfunzionale che comprende prodotto, marketing e anche altre parti interessate.

– Nisha Arya Ahmed, scienziata dei dati e scrittrice tecnica

Se sei una persona a cui piace lavorare su progetti, completarli e inviarli alla produzione, potresti non trovare la scienza dei dati una carriera gratificante.

Sebbene si avvii un progetto con una serie di obiettivi, perfezionati e migliorati in modo iterativo, spesso sarà necessario modificare l'ambito dei progetti man mano che cambiano gli obiettivi aziendali dell'organizzazione. Forse le parti interessate vedono una nuova direzione promettente.

Quindi dovrai ridefinire le priorità e modificare in modo efficace l'ambito dei progetti. E nel peggiore dei casi, abbandona il tuo progetto se necessario. 

Inoltre, in una fase iniziale di avvio, spesso dovrai indossare più cappelli. Quindi il tuo lavoro non finisce con la costruzione di modelli. Anche se riesci a distribuire un modello di machine learning in produzione, devi monitorare le prestazioni del tuo modello, fare attenzione alle derive, regredire e riqualificare il modello secondo necessità.

Abid Ali Awan, scrittore, redattore e scienziato dei dati presso KDnuggets, condivide:

“Se lavori in un’azienda, spesso potresti dover passare da un team all’altro e lavorare su progetti diversi contemporaneamente. Tuttavia, la maggior parte dei progetti su cui lavori potrebbe non arrivare nemmeno alla produzione. 

Perché le priorità dell'azienda potrebbero cambiare o l'impatto dei progetti potrebbe non essere stato sufficientemente significativo. Passare continuamente da un team all’altro e da un progetto all’altro può essere estenuante e potresti non avere la minima idea di ciò a cui stai contribuendo”.

– Abid Ali Awan, scrittore, redattore e scienziato dei dati presso KDnuggets

Quindi lavorare su progetti di data science non è un processo lineare dall'inizio alla fine in cui finisci un progetto e passi a quello successivo. 

La giornata nella vita di un data scientist presso due diverse organizzazioni può essere completamente diversa. I ruoli di data scientist, ingegnere di machine learning e ingegnere MLOps spesso hanno molte funzionalità sovrapposte.

Supponiamo che tu sia uno scienziato dei dati molto interessato alla costruzione di modelli predittivi. E hai ottenuto il ruolo di data scientist in un'organizzazione di tuo interesse. 

Tuttavia, non sorprenderti se trascorri l'intera giornata a elaborare numeri in fogli di calcolo e a creare report. Oppure estraendo dati dai database utilizzando SQL. Potresti pensare che gestire i dati con SQL e trovare risposte alle domande aziendali si adatti meglio al ruolo di analista di dati.

Mentre in alcuni altri casi, potresti essere responsabile della creazione e della distribuzione dei modelli in produzione, del monitoraggio delle derive e della riqualificazione del modello secondo necessità. In questo caso, sei uno scienziato dei dati che indossa anche il cappello di un Ingegnere MLOps

Ascoltiamo cosa ha da dire Abid sulla fluidità dei ruoli in una carriera nel settore dei dati:

“Sono sempre confuso riguardo al fatto di essere chiamato “data scientist”. Cosa significa? Sono un analista di dati, un ingegnere di business intelligence, un ingegnere di machine learning, un ingegnere di MLOps o tutto quanto sopra? Il tuo ruolo all'interno di un'azienda è fluido se lavori in un'azienda più piccola o in una startup. Tuttavia, le organizzazioni più grandi potrebbero avere una distinzione più chiara tra i ruoli. Ma ciò non garantisce che il ruolo sia completamente definito. Potresti essere uno scienziato dei dati; ma gran parte del lavoro che svolgerai forse consisterà nella creazione di report di analisi in linea con gli obiettivi aziendali.

– Abid Ali Awan, scrittore, redattore e scienziato dei dati presso KDnuggets

In qualità di data scientist, dovresti indirizzare gli sforzi verso progetti che hanno l'impatto più significativo sul business piuttosto che perseguire progetti tecnicamente interessanti ma meno rilevanti. A tal fine, comprendere gli obiettivi aziendali è fondamentale per i seguenti motivi:

  • Comprendere gli obiettivi aziendali consente di adattare e ridefinire le priorità dei progetti in base alle mutevoli esigenze dell'organizzazione.
  • Il successo di un progetto di data science è spesso misurato dal suo impatto sul business. Pertanto, una buona comprensione degli obiettivi aziendali fornisce un quadro chiaro per valutare il successo di un progetto, collegando gli aspetti tecnici a risultati aziendali tangibili.

Matteo Mayo, caporedattore e data scientist presso KDnuggets, condivide il costo dell'indifferenza verso i risultati aziendali:

“Come scienziato dei dati, se sei indifferente agli obiettivi aziendali potresti anche essere un gatto che insegue un puntatore laser: ti ritroverai iperattivo e senza scopo, probabilmente non realizzerai nulla di molto valore. Comprendere gli obiettivi aziendali ed essere in grado di tradurli dal business al linguaggio dei dati sono competenze cruciali, senza le quali potresti ritrovarti a investire tempo nella costruzione dei modelli più sofisticati e irrilevanti. Un albero decisionale che funziona batte ogni giorno un fallimento all’avanguardia!”

– Matthew Mayo, redattore capo e scienziato dei dati, KDnuggets

Ecco cosa ha da dire Nisha a questo proposito:

“Per qualunque cosa tu faccia, hai bisogno di una ragione dietro. Questa è la tua intenzione, che viene prima della tua azione. Quando si tratta del mondo dei dati, comprendere il business e le sfide è fondamentale. Senza questo, rimarrai semplicemente confuso durante il processo. In ogni passo che fai in un progetto di data science, vorrai fare riferimento agli obiettivi che motivano il progetto. 

– Nisha Arya Ahmed, scienziata dei dati e scrittrice tecnica

La scienza dei dati, quindi, non significa solo elaborare numeri e costruire modelli complessi. Si tratta piuttosto di sfruttare i dati per favorire il successo aziendale. 

Senza una solida comprensione degli obiettivi aziendali, i tuoi progetti potrebbero discostarsi dai problemi aziendali che intendono risolvere, diminuendone sia il valore che l’impatto.

Costruire modelli è emozionante. Tuttavia, la strada che porta a ciò potrebbe non essere così interessante. 

Puoi aspettarti di dedicare gran parte del tuo tempo:

  • Raccolta dati 
  • Identificare il sottoinsieme di dati più rilevante da utilizzare
  • Pulire i dati per renderli adatti all'analisi 

Questo è un lavoro che non è molto entusiasmante. Spesso non è nemmeno necessario creare modelli di machine learning. Una volta che hai i dati in un database, puoi utilizzare SQL per rispondere alle domande. In tal caso non è nemmeno necessario creare un modello di machine learning.

Ecco Abid che condivide le sue opinioni su quanto il lavoro importante spesso non sia interessante:

“Può essere noioso fare ripetutamente la stessa cosa. Spesso ti potrebbe essere assegnato il compito di pulire i dati, il che può essere piuttosto difficile, soprattutto quando si lavora con set di dati diversi. Inoltre, attività come la convalida dei dati e la scrittura di test unitari potrebbero non essere così entusiasmanti ma sono necessarie”.

– Abid Ali Awan, scrittore, redattore e scienziato dei dati presso KDnuggets

Quindi devi goderti il ​​processo di lavoro con i dati, inclusi quelli buoni, cattivi e brutti, per avere una carriera di successo nella scienza dei dati. Perché la scienza dei dati consiste nel trarre valore dai dati. Il che spesso non significa costruire i modelli più fantasiosi.

In qualità di data scientist, (probabilmente) non sarai mai in grado di raggiungere il punto in cui potrai dire di aver imparato tutto. Ciò che devi imparare e quanto dipende da ciò su cui stai lavorando.

Potrebbe essere un compito abbastanza semplice come imparare e utilizzare un nuovo framework in futuro. O qualcosa di più noioso come la migrazione della base di codice esistente in un linguaggio come Rust per migliorare sicurezza e prestazioni. Oltre ad essere tecnicamente forte, dovresti essere in grado di apprendere e migliorare rapidamente su framework, strumenti e linguaggi di programmazione secondo necessità. 

Inoltre, dovresti essere disposto a saperne di più sul dominio e sull'attività, se necessario. Non è molto probabile che lavorerai in un unico dominio per tutta la tua carriera nella scienza dei dati. Ad esempio, potresti iniziare come data scientist nel settore sanitario, per poi passare al fintech, alla logistica e altro ancora.

Durante la scuola di specializzazione, ho avuto l'opportunità di lavorare sull'apprendimento automatico nel settore sanitario, su un progetto di prognosi della malattia. Non avevo mai letto biologia oltre il liceo. Quindi le prime settimane sono state dedicate all’esplorazione degli aspetti tecnici di specifici segnali biomedici: le loro proprietà, caratteristiche e molto altro. Questi erano estremamente importanti prima ancora che potessi procedere alla preelaborazione dei record.

Kanwal Mehreen, una scrittrice tecnica condivide con noi la sua esperienza:

“Conosci quella sensazione quando finalmente impari una nuova abilità e pensi: “Ah, ecco fatto, sto bene”? Ebbene, nella scienza dei dati, quel momento non arriva mai veramente. Questo campo è in continua evoluzione con nuove tecnologie, strumenti e metodologie che emergono frequentemente. Quindi, se sei una persona che preferisce raggiungere un certo punto in cui l’apprendimento passa in secondo piano, allora una carriera nel campo della scienza dei dati potrebbe non essere la soluzione migliore. 

Inoltre, la scienza dei dati è una bella miscela di statistica, programmazione, apprendimento automatico e conoscenza del dominio. Se l’idea di esplorare ambiti diversi, dalla sanità alla finanza al marketing, non ti entusiasma, potresti sentirti perso nella tua carriera”.

– Kanwal Mehreen, scrittore tecnico

Quindi, come scienziato dei dati, non dovresti mai rifuggire dall'apprendimento costante e dal miglioramento delle competenze.

Abbiamo già delineato diverse sfide dell'essere un data scientist, tra cui:

  • Andare oltre le competenze tecniche di codifica e costruzione di modelli
  • Comprendere il dominio e gli obiettivi aziendali 
  • Apprendimento e aggiornamento continui per rimanere rilevanti 
  • Essere proattivi senza preoccuparsi di portare a termine i progetti in senso letterale 
  • Essere pronti a ridefinire le priorità, regredire e apportare modifiche
  • Fare il lavoro noioso ma necessario 

Come ogni altro ruolo tecnologico, la parte difficile è non ottenere un lavoro come scienziato dei dati. Sta costruendo una carriera di successo nella scienza dei dati.

Mathew Mayo riassume in modo appropriato come dovresti affrontare queste sfide come data scientist:

“Cerchi una carriera rilassata, in cui puoi smettere di imparare nel momento in cui inizi il tuo lavoro e non preoccuparti mai degli strumenti, dei trucchi e delle tecniche più recenti? Bene, dimentica la scienza dei dati! Aspettarsi una carriera tranquilla come professionista dei dati è come aspettarsi una passeggiata all'asciutto durante un monsone, armati solo di un ombrello da cocktail e di un atteggiamento ottimista. 

Questo campo è un ottovolante continuo di enigmi tecnici ed enigmi non tecnici: un giorno ti immergi profondamente negli algoritmi e il giorno dopo cerchi di spiegare le tue scoperte a qualcuno che pensa che la regressione sia un ritiro in un mondo stato di comportamento infantile. Ma il brivido sta in queste sfide, ed è ciò che intrattiene i nostri cervelli storditi dalla caffeina. 

Se sei allergico alle sfide, potresti trovare più conforto nel lavorare a maglia. Ma se devi ancora tirarti indietro dal confronto con un diluvio di dati, la scienza dei dati potrebbe essere proprio la tua tazza di… caffè”.

– Matthew Mayo, redattore capo e scienziato dei dati, KDnuggets

Ascoltiamo i pensieri di Kanwal a riguardo:

“Ammettiamolo: la scienza dei dati non è sempre una cosa facile. I dati non sempre arrivano in pacchetti ordinati e organizzati. Potrebbe sembrare che i tuoi dati abbiano attraversato una tempesta e potrebbero essere incompleti, incoerenti o addirittura imprecisi. Pulire e preelaborare questi dati per garantirne la pertinenza per l'analisi può essere impegnativo.

Mentre lavori in un campo multidisciplinare, potresti dover interagire con stakeholder non tecnici. Spiegare loro i concetti tecnici e il modo in cui si allineano ai loro obiettivi può essere davvero impegnativo.

Pertanto, se sei una persona che preferisce un percorso professionale chiaro e diretto, una carriera nel campo della scienza dei dati potrebbe essere piena di ostacoli per te”.

– Kanwal Mehreen, scrittore tecnico

Quindi la scienza dei dati non riguarda solo matematica e modelli; si tratta di passare dai dati alle decisioni. E nel processo, dovresti essere sempre disposto ad apprendere e migliorare le tue competenze, comprendere gli obiettivi aziendali e le dinamiche di mercato e molto altro ancora.

Se stai cercando una carriera stimolante che vorresti affrontare con resilienza, la scienza dei dati è davvero una buona opzione di carriera per te. Buona esplorazione!

Ringrazio Matthew, Abid, Nisha e Kanwal per aver condiviso le loro intuizioni su diversi aspetti di una carriera nella scienza dei dati. E per rendere questo articolo una lettura molto più interessante e piacevole!
 
 

Bala Priya C è uno sviluppatore e scrittore tecnico dall'India. Le piace lavorare all'intersezione tra matematica, programmazione, scienza dei dati e creazione di contenuti. Le sue aree di interesse e competenza includono DevOps, data science ed elaborazione del linguaggio naturale. Le piace leggere, scrivere, programmare e il caffè! Attualmente, sta lavorando all'apprendimento e alla condivisione delle sue conoscenze con la comunità degli sviluppatori creando tutorial, guide pratiche, articoli di opinione e altro ancora.

Timestamp:

Di più da KDnuggets