7 ok, amiért ne válj adattudósnak - KDnuggets

7 ok, amiért ne válj adattudósnak – KDnuggets

Forrás csomópont: 2994981

7 ok, amiért ne válj adattudósnak
Kép a szerkesztőtől
 

Ön törekvő adattudós? Ha igen, akkor valószínűleg sok emberről látott vagy hallott, aki sikeresen az adattudományi pálya felé fordult. És abban is reménykedsz, hogy egyszer majd váltasz.

Számos izgalmas dolog van az adattudósként végzett munkában. Tudsz:

  • Építsen kemény és puha készségeket, amelyek átvihetők a különböző területeken 
  • Meséljen történeteket adatokkal 
  • Válaszoljon az üzleti kérdésekre adatokkal
  • Hatékony megoldások kidolgozása üzleti problémákra 

És még sok más. Bármilyen izgalmasnak is hangzik mindez, adattudósnak lenni ugyanolyan kihívás, ha nem nagyobb. De melyek ezek a kihívások? 

Búcsúzzunk be.

Amikor a kódolási és technikai készségeiden dolgozol, valószínűleg kényelmesen fogsz egyedül dolgozni. Adattudósként azonban előnyben kell részesítenie az együttműködést és a kommunikációt. Mert az adattudomány nem az adatok vitatkozásáról és a számok elszigetelten történő ropogtatásáról szól. 

Együttműködnie kell más szakemberekkel – nem csak ugyanabban a csapatban, hanem gyakran több csapatban is. Így a különböző csapatokkal és érdekelt felekkel való együttműködés képessége ugyanolyan fontos, mint a technikai készségei. 

Ezenkívül képesnek kell lennie arra, hogy megállapításait és meglátásait közölje a nem műszaki érdekelt felekkel, beleértve az üzleti vezetőket is.

Nisha Arya Ahmed, adattudós és műszaki író megosztja:

„Egy adattudományi csapatban más adattudományi szakemberekkel fog együttműködni minden egyes feladatban, felelősségükben és mindezek kéz a kézben. Ez azért fontos, mert nem akarja megismételni a már elvégzett munkát, és nem kíván több időt és erőforrást igénybe venni. Ezenkívül nem az adatszakértők az egyetlenek, akikkel együtt kell működnie, hanem egy többfunkciós csapat tagja lesz, amely magában foglalja a terméket, a marketinget és más érdekelt feleket is.”

– Nisha Arya Ahmed, adattudós és műszaki író

Ha Ön olyan ember, aki szeret projekteken dolgozni, azokat befejezni és élesre szállítani, előfordulhat, hogy az adattudomány nem fogja kifizetődő karriert.

Bár egy projektet meghatározott célokkal indít – finomított és iteratív módon továbbfejlesztett –, gyakran meg kell változtatnia a projektek hatókörét, ahogy a szervezet üzleti céljai változnak. Talán az érintettek új, ígéretes irányt látnak.

Tehát hatékonyan újra kell rangsorolnia és módosítania kell a projektek hatókörét. És a legrosszabb esetben hagyja fel a projektet, ha szükséges. 

Ezenkívül az indulás korai szakaszában gyakran több kalapot kell viselnie. Tehát a munkája nem ér véget a modellépítéssel. Még ha sikerül is üzembe helyeznie egy gépi tanulási modellt a termelésben, figyelemmel kell kísérnie a modell teljesítményét, figyelnie kell a sodródásokat, vissza kell lépnie, és szükség szerint újra kell képeznie a modellt.

Abid Ali Awan, a KDnuggets írója, szerkesztője és adatkutatója megosztja:

„Ha egy cégnél dolgozik, gyakran kell váltania több csapat között, és egyszerre kell különböző projekteken dolgoznia. Előfordulhat azonban, hogy a legtöbb projekt, amelyen dolgozol, még a gyártásig sem jut el. 

Mert a vállalat prioritásai változhatnak, vagy a projektek hatása nem volt elég jelentős. A csapatok és projektek közötti folyamatos váltás kimerítő lehet, és tanácstalannak érezheti magát, hogy mihez járuljon hozzá.”

– Abid Ali Awan, a KDnuggets írója, szerkesztője és adatkutatója

Tehát az adattudományi projekteken való munka nem egy lineáris elejétől a befejezésig folyamat, ahol befejezi a projektet, és továbblép a következőre. 

Egy nap egy adattudós életében két különböző szervezetnél teljesen eltérő lehet. Az adattudós, a gépi tanulási mérnök és az MLOps-mérnök szerepkörei gyakran sok egymást átfedő funkciót tartalmaznak.

Tegyük fel, hogy Ön egy adattudós, akit nagyon érdekel a prediktív modellek készítése. És megkaptad az adattudós szerepét egy érdekedben álló szervezetben. 

Azonban ne lepődjön meg, ha egész napját a számok táblázatokban való ropogtatásával és jelentéskészítéssel tölti. Vagy adatok lehívása adatbázisokból SQL használatával. Azt gondolhatja, hogy az adatok SQL-lel való vitatkozása és az üzleti kérdésekre adott válaszok keresése jobban megfelel az adatelemző szerepének.

Míg más esetekben Ön felel a modellek felépítéséért és üzembe helyezéséért, az eltolódások figyeléséért és a modell szükség szerinti átképzéséért. Ebben az esetben Ön egy adattudós, aki szintén viseli a kalapját MLOps mérnök

Halljuk meg, mit mond Abid az adatkarrierben betöltött szerep gördülékenységéről:

„Mindig zavarban vagyok attól, hogy „adattudósnak” neveznek. Egyáltalán mit jelent? Adatelemző, üzleti intelligencia mérnök, gépi tanulási mérnök, MLOps mérnök vagy a fentiek mindegyike? A vállalaton belüli szerepe változó, ha kisebb cégnél vagy startupnál dolgozik. A nagyobb szervezetek azonban világosabb különbséget tehetnek a szerepek között. De ez nem garantálja, hogy a szerepkör teljesen meghatározott. Lehet, hogy adattudós; de az Ön által végzett munka nagy része talán az üzleti célokhoz igazodó elemzési jelentések készítése lesz.”

– Abid Ali Awan, a KDnuggets írója, szerkesztője és adatkutatója

Adattudósként erőfeszítéseit olyan projektekre kell irányítania, amelyek a legjelentősebb hatással vannak az üzletre, ahelyett, hogy technikailag érdekes, de kevésbé releváns projekteket folytatnának. Ebből a célból az üzleti célok megértése kulcsfontosságú a következő okok miatt:

  • Az üzleti célok megértése lehetővé teszi, hogy projektjeit a szervezet változó szükségleteihez igazítsa és átállítsa.
  • Egy adattudományi projekt sikerét gyakran az üzletre gyakorolt ​​hatásán mérik. Tehát az üzleti célok megfelelő ismerete világos keretet biztosít a projekt sikerének értékeléséhez, összekapcsolva a technikai szempontokat a kézzelfogható üzleti eredményekkel.

Matthew Mayo, a KDnuggets főszerkesztője és adattudósa megosztja az üzleti eredményekkel szembeni közömbösség költségeit:

„Adattudósként, ha közömbös az üzleti célok iránt, akár macska is lehet, aki egy lézermutatót kerget – túlzottan aktívnak és céltalannak fog tűnni, és valószínűleg semmi értékes dolgot nem fog elérni. Az üzleti célok megértése és az üzleti célokról az adatbeszédre való átültetése kulcsfontosságú készségek, amelyek nélkül időt fektethet a legkifinomultabb, irreleváns modellek megalkotásába. Egy működő döntési fa minden nap legyőzi a legkorszerűbb kudarcot!”

– Matthew Mayo, a KDnuggets főszerkesztője és adatkutatója

Íme, amit Nisha mond ezzel kapcsolatban:

„Bármit csinálsz, ok kell mögötte. Ez a szándékod, ami előbbre való, mint a tetteid. Amikor az adatok világáról van szó, elengedhetetlen az üzlet és a kihívások megértése. E nélkül csak összezavarodsz a folyamat során. Egy adattudományi projektben minden lépésnél hivatkozni kell a projektet motiváló célkitűzésekre.” 

– Nisha Arya Ahmed, adattudós és műszaki író

Az adattudomány tehát nem csak a számok roppantozásáról és összetett modellek felépítéséről szól. Sokkal inkább az adatok kihasználásáról van szó az üzleti siker érdekében. 

Az üzleti célok alapos ismerete nélkül a projektjei eltérhetnek azoktól az üzleti problémáktól, amelyeket meg kell oldani – csökkentve ezáltal értéküket és hatásukat.

A modellek építése izgalmas. Az odáig vezető út azonban nem biztos, hogy olyan érdekes. 

Számíthat arra, hogy idejének nagy részét tölti:

  • Adatgyűjtés 
  • A felhasználandó adatok legrelevánsabb részhalmazának azonosítása
  • Az adatok tisztítása, hogy alkalmassá tegyük az elemzésre 

Ez most nem túl izgalmas munka. Gyakran nem is kell gépi tanulási modelleket készítenie. Miután megvannak az adatok egy adatbázisban, használhatja az SQL-t a kérdések megválaszolására. Ebben az esetben még gépi tanulási modellt sem kell felépítenie.

Íme, Abid megosztja nézeteit arról, hogy a fontos munka gyakran nem érdekes:

„Fárasztó lehet ugyanazt a dolgot többször megcsinálni. Gyakran előfordulhat, hogy adattisztítási feladatot kap, ami meglehetősen nehéz lehet, különösen, ha különböző adatkészletekkel dolgozik. Ezenkívül az olyan feladatok, mint az adatellenőrzés és az egységtesztek nem olyan izgalmasak, de szükségesek.”

– Abid Ali Awan, a KDnuggets írója, szerkesztője és adatkutatója

Élveznie kell tehát az adatokkal való munka folyamatát – beleértve a jót, a rosszat és a csúnyát is – ahhoz, hogy sikeres adattudományi karriert lehessen elérni. Mert az adattudomány az adatokból való érték levezetéséről szól. Ami gyakran nem a legszebb modellek megalkotásáról szól.

Adattudósként (valószínűleg) soha nem fogsz tudni eljutni addig a pontig, amikor azt mondhatod, hogy mindent megtanultál. Az, hogy mit és mennyit kell tanulnod, attól függ, hogy min dolgozol.

Ez egy meglehetősen egyszerű feladat lehet, mint például egy új keretrendszer tanulása és használata. Vagy valami unalmasabb dolog, mint például a meglévő kódbázis migrálása egy olyan nyelvre, mint a Rust a fokozott biztonság és teljesítmény érdekében. Amellett, hogy technikailag erős, képesnek kell lennie a keretrendszerek, eszközök és programozási nyelvek gyors megtanulására és használatára. 

Ezenkívül készen kell állnia arra, hogy többet megtudjon a domainről és az üzletről, ha szükséges. Nem túl valószínű, hogy egyetlen területen fog dolgozni adattudományi pályafutása során. Például elkezdheti adattudósként az egészségügyben, majd áttérhet a fintech, a logisztika és egyebekre.

Az érettségi alatt lehetőségem volt gépi tanulással foglalkozni az egészségügyben – egy betegség-előrejelzési projekten. Soha nem olvastam biológiát középiskolán kívül. Tehát az első néhány hét az egyes orvosbiológiai jelek technikai jellemzőinek – tulajdonságaik, jellemzőik és még sok más – feltárásáról szólt. Ezek rendkívül fontosak voltak, mielőtt még hozzáfoghattam volna a feljegyzések előfeldolgozásához.

Kanwal Mehreen, egy műszaki író megosztja velünk tapasztalatait:

„Ismered azt az érzést, amikor végre elsajátítasz egy új készséget, és azt gondolod: „Ó, ez az, jó vagyok”? Nos, az adattudományban ez a pillanat sosem jön el igazán. Ez a terület folyamatosan fejlődik, az új technológiák, eszközök és módszerek gyakran megjelennek. Tehát ha Ön olyan ember, aki szívesebben szeretne elérni egy bizonyos pontot, ahol a tanulás háttérbe szorul, akkor lehet, hogy az adattudományi karrier nem a legjobb választás. 

Ezenkívül az adattudomány a statisztika, a programozás, a gépi tanulás és a tartományi tudás gyönyörű keveréke. Ha nem izgat a különböző területek felfedezésének gondolata, az egészségügytől a pénzügyeken át a marketingig, akkor úgy érezheti, elveszett a karrierje.”

– Kanwal Mehreen, műszaki író

Adattudósként tehát soha nem szabad visszariadnia a folyamatos tanulástól és a készségfejlesztéstől.

Korábban már felvázoltunk néhány adatkutatói kihívást, többek között:

  • Túllépve a kódolás és a modellkészítés technikai készségein
  • A tartomány és az üzleti célok megértése 
  • Folyamatos tanulás és készségfejlesztés, hogy relevánsak maradjanak 
  • Legyen proaktív anélkül, hogy aggódnia kellene a szó szerinti értelemben vett projektek befejezésétől 
  • Készen áll a prioritások átrendezésére, a visszalépésre és a változtatásokra
  • Olyan munkát végezni, ami unalmas, de szükséges 

Mint minden más technológiai szerepnek, itt is a nehéz része nem adattudósként helyezkednek el. Sikeres adattudományi karriert épít fel.

Mathew Mayo találóan összefoglalja, hogy adattudósként hogyan kell elfogadnia ezeket a kihívásokat:

„Egy laza karriert keresel, ahol abbahagyhatod a tanulást abban a pillanatban, amikor elkezded dolgozni, és soha nem kell aggódnod a legújabb eszközök, trükkök és technikák miatt? Nos, felejtsd el az adattudományt! Nyugodt adatszakértői karriert várni olyan, mintha száraz sétát várnánk egy monszunban, csak koktélesernyővel és optimista hozzáállással felvértezve. 

Ez a mező a technikai rejtvények és nem technikai rejtélyek megállás nélküli hullámvasútja: egyik nap az algoritmusokba merül, a másik nap pedig megpróbálja elmagyarázni az eredményeket valakinek, aki azt gondolja, hogy a regresszió egy visszavonulás egy gyermekszerű viselkedési állapot. De az izgalom ezekben a kihívásokban rejlik, és ez az, ami koffeinnel teli agyunkat szórakoztatja. 

Ha allergiás a kihívásokra, több vigaszt találhat a kötésben. De ha még nem kell meghátrálnia az adatözönnel való szembenézéstől, az adattudomány lehet, hogy csak a te csésze… kávéd lesz.”

– Matthew Mayo, a KDnuggets főszerkesztője és adatkutatója

Halljuk Kanwal gondolatait ezzel kapcsolatban:

„Nézzünk szembe ezzel a ténnyel: az adattudomány nem mindig zökkenőmentes. Az adatok nem mindig rendezett és rendezett csomagokban érkeznek. Az adatok úgy tűnhetnek, mintha viharon mentek volna keresztül, ami hiányosak, következetlenek vagy pontatlanok lehetnek. Az adatok tisztítása és előfeldolgozása annak biztosítása érdekében, hogy az elemzés szempontjából relevánsak legyenek, kihívást jelenthet.

Míg multidiszciplináris területen dolgozik, előfordulhat, hogy kapcsolatba kell lépnie a nem műszaki érdekelt felekkel. Igazán kihívást jelenthet elmagyarázni nekik a technikai fogalmakat és azt, hogy hogyan illeszkednek a célkitűzéseikhez.

Ezért, ha Ön a világos, egyértelmű karrierutat részesíti előnyben, az adattudományi karrier tele van akadályokkal.”

– Kanwal Mehreen, műszaki író

Tehát az adattudomány nem csak a matematikáról és a modellekről szól; az adatoktól a döntésekig való eljutásról szól. A folyamat során mindig készen kell állnia a tanulásra és a készségfejlesztésre, az üzleti célok és a piac dinamikájának megértésére, és még sok másra.

Ha kihívásokkal teli karriert keresel, amelyben rugalmasan szeretne eligazodni, az adattudomány valóban jó karrierlehetőség az Ön számára. Boldog felfedezést!

Köszönöm Matthew-nak, Abidnak, Nisha-nak és Kanwalnak, hogy megosztották meglátásaikat az adattudományi karrier számos aspektusával kapcsolatban. És azért, hogy ezt a cikket sokkal érdekesebbé és élvezetesebbé tegye!
 
 

Bala Priya C egy indiai fejlesztő és műszaki író. Szeret a matematika, a programozás, az adattudomány és a tartalomkészítés metszéspontjában dolgozni. Érdeklődési területe és szakértelme a DevOps, az adattudomány és a természetes nyelvi feldolgozás. Szeret olvasni, írni, kódolni és kávézni! Jelenleg a tanuláson és tudásának a fejlesztői közösséggel való megosztásán dolgozik oktatóanyagok, útmutatók, véleménycikkek és egyebek készítésével.

Időbélyeg:

Még több KDnuggets