5 elkerülendő adattudományi hiba

Forrás csomópont: 1052502

5 elkerülendő adattudományi hiba

Mindenki követ el hibákat, ami jó is lehet, ha idővel tanuláshoz és fejlődéshez vezet. De megpróbálhatjuk először másoktól tanulni, hogy felgyorsítsuk személyes fejlődésünket. A kezdéshez vegye figyelembe ezeket a legkeményebb leckéket, hogy ne kelljen.


By Tessa Xie, vezető adattudós a Cruise-nál

Ábra
Fotó bruce menet on Unsplash.

 

Amikor először áttértem a pénzügyről az adattudományra, úgy éreztem, a világ tetején állok – álmaim területén kaptam állást, a karrierem ki van jelölve, csak leszegetem a fejem, és keményen dolgozom, mi romolhat el? Nos, volt néhány dolog… A következő évben adattudósként több olyan hiba is történt, amelyeknek örülök, hogy karrierem elején azon kaptam magam, hogy elkövettem. Így volt időm átgondolni és helyesbíteni az irányt, mielőtt túl késő lett volna. Egy idő után rájöttem, hogy ezek a hibák elég gyakoriak. Valójában sok DS-t figyeltem meg körülöttem, akik még mindig elkövetik ezeket a hibákat, nem tudván, hogy hosszú távon árthatnak az adatkarrierjüknek.

Ha enyém 5 lecke, amelyet McKinsey tanított nekem, amitől jobb adatkutató lesz a legjobbaktól tanultam, ebben a cikkben azokat a leckéket, amelyeket kemény úton tanultam meg, és remélem, segíthetek elkerülni ugyanazokat a hibákat.

1. hiba: Gondolattárs helyett gyalogos katonának tekinted magad

 
 
Felnőttként mindig az alapján értékeltek minket, hogy mennyire tudjuk betartani a szabályokat, rendeket, különösen az iskolában. Ön lesz a legjobb tanuló, ha követi a tankönyvet és a gyakorlati vizsgákat, és csak keményen dolgozik. Úgy tűnik, hogy sokan ezt a „lábkatona” gondolkodásmódot viszik a munkahelyi környezetükbe. Véleményem szerint ez az a gondolkodásmód, amely sok adatkutatót akadályoz abban, hogy maximalizálja hatását, és kitűnjön társai közül. Sok DS-t megfigyeltem, különösen a juniorok, akik úgy gondolják, hogy semmivel sem járulnak hozzá a döntéshozatali folyamathoz, és inkább a háttérbe vonulnak, és passzívan hajtják végre a helyettük hozott döntéseket. Ez egy ördögi kört indít el – minél kevésbé vesz részt ezekben a megbeszélésekben, annál kevésbé valószínű, hogy az érintettek bevonják Önt a jövőbeli találkozókba, és annál kevesebb lehetősége lesz a jövőbeni közreműködésre.

Hadd mondjak egy konkrét példát a gyalogos katona és a gondolattárs közötti különbségre modellfejlesztés esetén. Az adatgyűjtésen és az ötletbörze alkalmával a régi én passzívan jegyzetelte az érintettek javaslatait, hogy azokat a későbbiekben „tökéletesen” tudjam megvalósítani. Amikor valaki olyan funkciót javasolt, amelyről tudtam, hogy nem rendelkezünk adatokkal, nem mondtam semmit azon a feltételezésen alapulva, hogy idősebb, és tudnia kell valamit, amit figyelmen kívül hagytam. De képzeld, nem tették. Később szembesülnék azzal a helyzettel, hogy az általunk kitalált funkciók 50%-a további adatgyűjtést igényelne, ami veszélyeztetné projektünk határidejét. Ennek eredményeként gyakran kerültem végül a rossz hírt hozó hírnök nemkívánatos helyzetébe. Manapság arra törekszem, hogy gondolattárs legyek, korán bevonom magam a beszélgetésbe, és kihasználom egyedülálló pozíciómat, mint az adatokhoz legközelebb álló személy. Így már korán kezelni tudom az érintettek elvárásait, és javaslatokat tehetek a csapat előrehaladásának elősegítésére.

Hogyan lehet ezt elkerülni:

  • Ügyeljen arra, hogy ne tartsa vissza magát az olyan értekezleteken, amelyeken az adatok szempontjából hozzá tud járulni: elegendőek-e az érintettek mérőszám-definíciói ahhoz, amit mérni szeretnének? Rendelkezésre állnak-e adatok a mérőszámok mérésére? Ha nem, találhatunk-e proxykat a rendelkezésünkre álló adatokhoz?
  • Imposztor szindróma valós, különösen a junior DS között. Győződjön meg róla, hogy tisztában van ezzel, és amikor felteszi a kérdést, hogy mondjon-e olyat, ami „másoknak már eszébe jutott”, vagy tegyen fel egy „hülye tisztázó kérdést”, KELL-e.
  • Fenntartja a kíváncsiságot az iránt, hogy mások min dolgoznak. Nagyon sok alkalom van, amikor azt tapasztaltam, hogy hozzáadhatok értéket azáltal, hogy észreveszek olyan hiányosságokat, amelyeket mások figyelmen kívül hagytak, mert nem értik a vállalat adatait.

2. hiba: Haladjon bele az adattudomány egy meghatározott területébe

 
 
Adatmérnök vagy adattudós szeretnék lenni? Marketing és értékesítési adatokkal szeretnék dolgozni, vagy térinformatikai elemzést szeretnék végezni? Talán észrevette, hogy a DS kifejezést eddig ebben a cikkben általános kifejezésként használtam sok mindenre adatokkal kapcsolatos karrierutak (pl. adatmérnök, adattudós, adatelemző stb.). Ennek az az oka, hogy manapság az adatvilágban annyira elmosódnak a határok e címek között, különösen a kisebb cégeknél. Megfigyeltem, hogy sok adattudós CSAK olyan adattudósnak tekinti magát, aki modelleket épít, és nem figyel semmilyen üzleti szempontra vagy adatmérnökökre, akik csak az adatfolyam-kezelésre összpontosítanak, és nem akarnak tudni semmit a modellezésről, ami jelenleg folyik. a cég.

A legjobb adattehetségek azok, akik több kalapot is viselnek, vagy legalább képesek megérteni más adatszerepek folyamatait. Ez különösen akkor hasznos, ha egy korai szakaszban vagy növekedési szakaszban szeretne dolgozni, ahol a funkciók még nem annyira specializáltak, és rugalmasnak kell lenni, és számos adathoz kapcsolódó felelősséget kell lefednie. Még ha egy egyértelműen meghatározott munkaköri profilban is dolgozik, az idő múlásával egyre több tapasztalatot szerezhet, felfedezheti, hogy szeretne áttérni egy másik típusú adatszerepre. Ez a fordulat sokkal könnyebb lesz, ha nem helyezi el magát és képességeit egy bizonyos szerepkör szűk fókuszába.

Hogyan lehet ezt elkerülni:

  • Ismét legyen kíváncsi azokra a projektekre, amelyeken más adatszerepek dolgoznak. Rendszeres időközönként találkozókat tervezzen kollégáival, hogy érdekes projektekről beszélhessenek egymással, vagy kérje meg, hogy a különböző adatcsoportok rendszeresen megosszák egymással munkájukat/projekteiket.
  • Ha a munkahelyén nem tud más adatszerepeket megismerni, próbálja meg fenntartani/gyakorolni azokat az adatkészségeket, amelyeket szabadidejében nem használ. Például, ha Ön adatelemző, és egy ideje nem foglalkozott a modellezéssel, fontolja meg a készségek gyakorlását külső projekteken, például egy Kaggle-versenyen keresztül.

3. hiba: Nem tartunk lépést a terület fejlődésével

 
 

Az önelégültség megöl

Ezt minden katona tudja, és minden DS-nek is tudnia kell. Gyakori hiba, hogy önelégültnek érzi magát az adatkezelési készségeit illetően, és nem szán időt az új ismeretek elsajátítására. Ez az adatmezőn belül veszélyesebb, mint néhány más területen, mivel az adattudomány viszonylag új terület, és még mindig drasztikus változásokon és fejlesztéseken megy keresztül. Folyamatosan új algoritmusok, új eszközök, sőt új programozási nyelvek kerülnek bevezetésre.

Ha nem akarsz az az egyetlen adattudós lenni, aki még csak 2021-ben tudja a STATA használatát (ő létezik, dolgoztam vele), akkor lépést kell tartanod a terület fejlesztéseivel.


Ne hagyd, hogy te legyél (GIF szerző: GIPHY)

Hogyan lehet ezt elkerülni:

  • Iratkozzon fel online órákra, hogy megismerje az új fogalmakat és algoritmusokat, vagy felfrissítse azokat, amelyeket már ismer, de már régóta nem használt a munkája során. A tanulási képesség egy olyan izom, amelyet mindenkinek folytatnia kell, és az egész életen át tartó tanulás valószínűleg a legjobb ajándék, amit magadnak adhatsz.
  • Iratkozzon fel egy DS hírlevélre, vagy kövessen egy DS bloggert/kiadványt a Mediumon, és alakítsa ki a DS „hírek” követésének szokását.

4. hiba: Az elemző izom túlhajlítása

 
 
Ha csak egy kalapácsod van, minden úgy néz ki, mint egy szög. Ne légy az a DS, aki mindenben az ML-t próbálja használni. Amikor először beléptem az adattudomány világába, annyira izgatott voltam az iskolában tanult divatos modellek miatt, és alig vártam, hogy mindegyiket kipróbálhassam a való világ problémáira. De a való világ különbözik az akadémiai kutatástól, és a 80/20 szabály mindig játékban van.

Korábbi cikkemben "5 lecke, amit McKinsey tanított nekem”, arról írtam, hogy az üzleti hatás és az értelmezhetőség néha fontosabb, mint a modell pontosságának több százalékpontja. Néha talán egy feltevések által vezérelt Excel-modellnek több értelme van, mint egy többrétegű neurális hálónak. Ilyen esetekben ne hajlítsa túl az elemző izmát, és ne tegye túlzásba a megközelítést. Ehelyett hajlítsa meg üzleti izmait, és legyen az a DS, akinek van üzleti érzéke is.

Hogyan lehet ezt elkerülni:

  • Legyen a fegyvertárában az analitikai készségek/eszközök teljes skálája, az egyszerű Exceltől a haladó ML-modellezési ismeretekig, így mindig felmérheti, melyik eszköz a legmegfelelőbb az adott helyzetben, és ne vegyen magával fegyvert a késharcba.
  • Mielőtt belevágna az elemzésbe, ismerje meg az üzleti igényeket. Néha az érdekeltek kérnek egy ML modellt, mert ez egy népszerű koncepció, és irreális elvárásaik vannak azzal kapcsolatban, hogy az ML modellek mire képesek. DS-ként az Ön feladata, hogy kezelje az elvárásokat, és segítsen nekik jobb és egyszerűbb módszereket találni céljaik elérésére. Emlékezik? Legyen gondolattárs, ne gyalogos.

5. hiba: Gondolja úgy, hogy az adatkultúra felépítése valaki más feladata

 
 
cikkemben "6 alapvető lépés a nagyszerű adatkultúra felépítéséhez”, írtam arról, hogy az adattudósok élete borzalmas és terméketlen lehet, ha a cégnek nincs nagy adatkultúrája. Valójában sok DS-t hallottam panaszkodni a nem produktív ad hoc adatkérések miatt, amelyeket az érdekelt feleknek könnyen, önellátó módon kell kezelniük (például havi összesítést napira cserélni a Lookerben, ami szó szerint két kattintásból áll). ). Ne gondolja, hogy a kultúra megváltoztatása valaki más feladata. Ha változásokat szeretne látni, hajtsa végre azokat. Végül is ki állhat jobban az adatkultúra felépítésében és az érdekelt felek adatokkal kapcsolatos oktatásában, mint maguk az adattudósok? Ha segít az adatkultúra felépítésében a vállalaton belül, az Ön és az érdekelt felek életét is sokkal könnyebbé teszi.

Hogyan lehet ezt elkerülni:

  • Legyen a saját felelőssége a nem analitikus érdekelt felek képzésének lebonyolítása és az önkiszolgáló erőforrások fejlesztése.
  • Győződjön meg arról, hogy elkezdi gyakorolni, amit prédikál, kezdje el a lekérdezések diákhoz való kapcsolását, az igazság adatforrásait dokumentumokhoz, és kezdje el dokumentálni a kódot és az adatbázisokat. Az adatkultúrát nem lehet egyik napról a másikra felépíteni, ezért mindenképp türelem kell hozzá.

Szeretnék rámutatni, hogy RENDBEN véthetsz hibákat a karriered során. A legfontosabb dolog az, hogy tanuljunk ezekből a hibákból, és elkerüljük őket a jövőben. Vagy ami még jobb, írja le őket, hogy segítsen másoknak elkerülni ugyanazokat a hibákat.

 
eredeti. Engedéllyel újra közzétéve.

Bio: Tessa Xie egy tapasztalt, haladó elemzési tanácsadó, aki jártas az adattudományban, az SQL-ben, az R-ben, a Pythonban, a fogyasztói kutatásban és a gazdaságkutatásban, erős mérnöki háttérrel, miután megszerezte az MIT-n szerzett pénzügyi mérnöki mesterképzést.

Kapcsolódó:

Forrás: https://www.kdnuggets.com/2021/08/5-data-science-career-mistakes-avoid.html

Időbélyeg:

Még több KDnuggets