Po letih navdušenja in obljub je končno prispela umetna inteligenca (AI). Organizacije vseh vrst in velikosti tekmujejo za integracijo umetne inteligence v svoje poslovne procese, da bi svoje delovanje naredile močnejše, učinkovitejše in donosnejše. A podatkovni znanstvenik in inženir strojnega učenja sta dva izmed najbolj vznemirljivih in vrhunskih poklicev v tehnologiji. Medtem ko oba vključujeta uresničitev obljub umetne inteligence v poslu, izbira med inženirjem strojnega učenja ali podatkovnim znanstvenikom zahteva razumevanje, kako se obe vlogi razlikujeta in kako se dopolnjujeta.
Inženirji strojnega učenja in podatkovni znanstveniki so člani ekipe, ki stoji za podjetjem platformo strojnega učenja (ML).. Vsak položaj izpolnjuje ključne naloge pri razvoju, izvajanju in vzdrževanju aplikacij za strojno učenje.
Vendar se vloge, sklopi spretnosti in odgovornosti inženirja strojnega učenja in podatkovnega znanstvenika pomembno razlikujejo. Razumevanje razlik in podobnosti obeh položajev vam pomaga pri odločitvi, katera vloga bolje ustreza vašim kariernim ciljem.
Vloga inženirja strojnega učenja v primerjavi s podatkovnim znanstvenikom
Cilj strojnega učenja in drugih dejavnosti, ki temeljijo na AI, je ustvariti programske aplikacije, ki izboljšajo naša življenja, bodisi v poslovnih okoljih bodisi v naših vsakodnevnih dejavnostih izven službe. Inženirji strojnega učenja in podatkovni znanstveniki so ključni za načrtovanje in uporabo inteligentnih sistemov, ki se sčasoma naravno izboljšujejo, s pomočjo ali brez pomoči ljudi.
Eden od načinov za razlikovanje vlog inženirjev strojnega učenja in podatkovnih znanstvenikov pri oblikovanju inteligentnega sistema je, da na podatkovne znanstvenike gledamo kot na arhitekte strukture in inženirje strojnega učenja kot na graditelje, ki načrte in modele pretvorijo v delujoč sistem.
To so med glavne naloge podatkovnih znanstvenikov pri ustvarjanju inteligentnih sistemov:
- Ugotovite, kateri poslovni problemi so primerni za rešitve ML
- Vizualizirajte številne stopnje Življenjski cikel ML (zbiranje podatkov, priprava podatkov, prepir podatkov, analiza podatkov, usposabljanje za modeliranje, testiranje modela, uvedba)
- Oblikujte algoritme in podatkovne modele po meri
- Identificirajte komplementarne nize podatkov in ustvarite sintetični podatki ki jih zahtevajo modeli globokega učenja (DL).
- Določite sistemske zahteve za opombe podatkov
- Ohranjajte stalno komunikacijo z vsemi deležniki
- Ustvarite orodja po meri za optimizacijo delovnega toka modeliranja
Nasprotno pa vloga inženirjev strojnega učenja poudarja uvajanje in delovanje modelov ML in DL:
- Razmestite in optimizirajte modele ML in DL v produkcijskih nastavitvah
- Spremljajte delovanje modelov, da obravnavate zakasnitev, pomnilnik, prepustnost in druge operativne parametre
- Izvedite testiranje sklepanja na CPU-jih, GPE-jih, robnih napravah in drugi strojni opremi
- Vzdrževanje in odpravljanje napak v modelih ML in DL
- Upravljanje nadzora različic za modele, metapodatke in poskuse
- Optimizirajte potek dela modela z orodji po meri
Podatkovni znanstveniki so neposredno vključeni v analizo in interpretacijo spoznanj pridobljeni iz modelov ML in DL z uporabo statističnih in matematičnih tehnik za prepoznavanje vzorcev, trendov in odnosov v podatkih.
Inženirji strojnega učenja se bolj zanašajo na svoje ozadje programiranja in inženiringa, da pretvorijo koncepte podatkovne znanosti v funkcionalne sisteme, ki so prilagodljivi, razširljivi in pregledni.
Inženir strojnega učenja proti podatkovnemu znanstveniku: spretnosti, izobrazba in odgovornosti
Kvalifikacije, potrebne za kariero na področju inženiringa strojnega učenja in znanosti o podatkih, se precej prekrivajo. Na primer, obe področji zahtevata tehnično bistrost, analitično razmišljanje in veščine reševanja problemov. Zanašajo se tudi na izkušnje s programiranjem, ki običajno vključujejo programiranje Python in R, sisteme v oblaku (AWS, Microsoft Azure in Google Cloud Platform ali GPC) in shranjevanje metapodatkov in optimizacija.
Še pomembnejše od podobnosti v izobrazbi in spretnostih inženirjev strojnega učenja in podatkovnih znanstvenikov so razlike v njihovem tehničnem in izobrazbenem ozadju:
- Podatkovni znanstveniki morajo biti vešči statistike, podatkovne analitike, vizualizacije podatkov, pisne in verbalne komunikacije ter predstavitev.
- Inženirji strojnega učenja morajo imeti poglobljeno znanje o podatkovnih strukturah, modeliranju podatkov, programskem inženiringu in konceptih, na katerih temeljijo modeli ML in DL.
Podatkovni znanstveniki imajo običajno širši nabor trde veščine kot inženirji strojnega učenja, vključno z izkušnjami s statistično in matematično programsko opremo, poizvedovalnimi jeziki, orodji za vizualizacijo podatkov, upravljanjem baz podatkov, Microsoft Excelom in prerekanjem podatkov.
O najpomembnejša merila za inženirje strojnega učenja vključujejo znanje o ML okvirji in knjižnice ML, podatkovne strukture, tehnike modeliranja podatkov in arhitekture programske opreme.
To so med veščinami, potrebnimi za a kariero inženirja strojnega učenja:
- Operacijski sistemi Linux/Unix
- Programski jeziki Java, C in C++
- Arhitekture GPU in programiranje CUDA
- Modeliranje in vrednotenje podatkov
- Arhitekture nevronskih mrež
- Obdelava naravnega jezika (NLP)
- Razdeljeno računalništvo
- Okrepitveno učenje
- Iskra in Hadoop programiranje
O nabore spretnosti podatkovnih znanstvenikov obsega ta področja:
- Kodiranje SQL in Python
- Oblikovanje in programiranje baze podatkov, vključno z bazami podatkov NoSQL in oblaki
- Orodja za zbiranje in čiščenje podatkov, vključno z orodji za poslovno inteligenco (BI).
- Orodja za statistično analizo, kot so SPSS, Matlab in SAS
- Deskriptivne, diagnostične, napovedne in preskriptivne statistične analize
- Linearna algebra in račun
- Gradnja modela ML
- Orodja za preverjanje in uvajanje modela (SAS, Neptune, Kubeflow in Google AI)
- Orodja za razvoj API-jev, kot sta Amazon AWS (Amazon API Gateway) in IBM Cloud (IBM API Connect)
Ameriški urad za statistiko dela (BLS) poudarja, da večina podatkovnih znanstvenikov imeti magisterij ali doktorat iz matematike, statistike, računalništva, poslovanja ali inženiringa. (Skupine BLS inženirji strojnega učenja pod kategorijo podatkovnih znanstvenikov.) Programski jeziki ki veljajo za bistvene za podatkovne znanstvenike, so Python, R, SQL, Git in GitHub.
Inženirji strojnega učenja naj bi bili obvlada Javo, R, Python in C++, pa tudi pri uporabi knjižnic ML, kot so Microsoftov CNTK, MLlib Apache Spark in Googlov TensorFlow. Prav tako se pričakuje, da dobro razumejo spletne API-je ter dinamične in statične knjižnice API-jev.
Obeti za inženirje strojnega učenja in podatkovne znanstvenike
BLS napoveduje, da bo število delovnih mest, ki so na voljo podatkovnim znanstvenikom povečanje za 36% med letoma 2021 in 2031, kar je veliko hitreje od povprečne rasti vseh poklicev.
Svetovnega gospodarskega foruma “Poročilo o prihodnosti delovnih mest 2023” postavlja strokovnjake za umetno inteligenco in strojno učenje med najhitreje rastoča delovna mesta s povprečno 30-odstotno letno rastjo do leta 2027. Poročilo poudarja, da namerava 42 % anketiranih podjetij dati prednost usposabljanju delavcev za uporabo umetne inteligence in velikih podatkov v naslednjem pet let.
Ocene plač za podatkovne znanstvenike vključujejo poročanje BLS an povprečna letna plača 100,910 $ od maja 2021, in raziskava PayScale, ki navaja podatkovne znanstvenike povprečna osnovna plača 99,344 $ leta 2023, v razponu od 71,000 $ do 138,000 $ na leto.
Nasprotno pa PayScale postavlja povprečna osnovna plača inženirjev strojnega učenja pri 115,243 $ v razponu od približno 80,000 $ do 157,000 $ na leto.
Po podatkih PayScale so veščine, ki imajo največji vpliv na plače inženirjev strojnega učenja, obdelava slik (26 % višja od povprečja), krepitveno učenje (22 % višja), DevOps (22 % višja) in Scala (20 % višje).
Plače podatkovnih znanstvenikov se povečajo zaradi veščin programiranja C++ (42 % višje od povprečja), kibernetske varnosti (39 % višje), raziskovalne analize (26 % višje), programske knjižnice PyTorch (24 % višje) in napovedovanja (22 % višje). ).
Rastoče področje za podatkovne znanstvenike je kvantno računalništvo – posebej kvantna informacijska znanost – ki zahteva poznavanje kvantne mehanike in uporabo kvantnih algoritmov v aplikacijah za reševanje problemov.
Podobno lahko inženirji strojnega učenja pričakujejo izboljšanje svojih zaposlitvenih možnosti v prihodnjih letih zaradi pojava generativni AI, ki naj bi dodala kar 4.4 trilijona dolarjev ekonomske vrednosti s povečanjem splošne produktivnosti, glede na McKinseyjevo poročilo “Technology Trends Outlook 2023”.
Inženir strojnega učenja in podatkovni znanstvenik: Na grebenu naslednjega tehnološkega vala
Tehnologije umetne inteligence bodo imele v prihodnjih letih izjemen vpliv na gospodarstva in trge dela po vsem svetu, a kot pri vsaki tehnologiji, ki spreminja igro, bodo zmagovalci in poraženci. Center za raziskave ekonomske politike (CEPR) ocenjuje, da bo AI povečati svetovno rast za 4 % do 6 % vsako leto, v primerjavi s povprečnim 4-odstotnim letnim povečanjem v zadnjih nekaj desetletjih.
Učinek umetne inteligence na zaposlovanje je manj gotov, vendar Svetovni gospodarski forum ocenjuje, da bo umetna inteligenca nadomestila 85 milijonov delovnih mest po vsem svetu med letoma 2020 in 2025, hkrati pa bo ustvariti 97 milijonov delovnih mest, predvsem na področjih, kot so veliki podatki, strojno učenje in digitalni marketing. Kot kažejo te številke, bo povpraševanje po inženirjih strojnega učenja in podatkovnih znanstvenikih verjetno ostalo veliko še mnogo let.
Slika, uporabljena pod licenco Shutterstock
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://www.dataversity.net/machine-learning-engineer-vs-data-scientist/
- :ima
- : je
- 000
- 2020
- 2021
- 2023
- 2025
- 2031
- 224
- 300
- 97
- a
- O meni
- Po
- dejavnosti
- pronicljivost
- Naslov
- spreten
- prihod
- AI
- AI v poslu
- algoritmi
- vsi
- Prav tako
- Amazon
- Amazon API Gateway
- med
- znesek
- an
- Analiza
- Analitično
- analitika
- in
- letno
- Apache
- API
- API-ji
- aplikacije
- Uporabi
- Uporaba
- arhitekti
- SE
- območja
- okoli
- prispeli
- umetni
- Umetna inteligenca
- Umetna inteligenca (AI)
- AS
- pomoč
- At
- Na voljo
- povprečno
- AWS
- Azure
- ozadje
- ozadja
- baza
- BE
- postajajo
- zadaj
- Boljše
- med
- Big
- Big Podatki
- povečanje
- Povečana
- tako
- širši
- gradbeniki
- Predsedstvo
- urad za statistiko dela
- rastoči
- poslovni
- Poslovna inteligenca
- poslovnih procesov
- vendar
- by
- C + +
- CAN
- Kariera
- kariere
- Kategorija
- center
- nekatere
- izbiri
- čiščenje
- Cloud
- Platforma v oblaku
- zbirka
- kako
- prihajajo
- Komunikacija
- Communications
- Podjetja
- v primerjavi z letom
- Dopolnilo
- dopolnilni
- računalnik
- Računalništvo
- računalništvo
- koncepti
- Connect
- velika
- šteje
- kontrast
- nadzor
- pretvorbo
- ustvarjajo
- Oblikovanje
- kritično
- po meri
- vrhunsko
- Cybersecurity
- datum
- Analiza podatkov
- Podatkovna analiza
- Priprava podatkov
- znanost o podatkih
- podatkovni znanstvenik
- nabori podatkov
- vizualizacija podatkov
- Baze podatkov
- PODATKOVNOST
- iz dneva v dan
- desetletja
- odloča
- globoko
- globoko učenje
- Povpraševanje
- uvajanje
- Oblikovanje
- Razvoj
- razvojna orodja
- naprave
- DevOps
- diagnostiko
- se razlikujejo
- razlike
- digitalni
- digitalni marketing
- neposredno
- razlikovati
- dinamično
- vsak
- Gospodarska
- Gospodarski forum
- ekonomska politika
- gospodarstev
- Edge
- Izobraževanje
- izobraževalne
- učinek
- učinkovite
- poudarja
- zaposlovanja
- obsegajo
- inženir
- Inženiring
- Inženirji
- okrepi
- bistvena
- ocene
- Tudi vsak
- Primer
- Excel
- zanimivo
- pričakovati
- Pričakuje
- izkušnje
- hitreje
- Nekaj
- Polje
- Področja
- Številke
- končno
- pet
- prilagodljiv
- za
- Forbes
- Napovedi
- Forum
- iz
- funkcionalno
- delovanje
- Prihodnost
- Prehod
- zbiranje
- ustvarjajo
- git
- GitHub
- Globalno
- Cilj
- Cilji
- Google Cloud
- Google Cloud Platform
- Googlova
- Grafične kartice
- Največji
- Rast
- Imajo
- Pomaga
- visoka
- več
- Kako
- HTTPS
- Ljudje
- hype
- IBM
- IBM Cloud
- identificirati
- slika
- vpliv
- Izvajanje
- Pomembno
- izboljšanje
- in
- Poglobljena
- vključujejo
- vključuje
- Vključno
- Povečajte
- narašča
- Navedite
- označuje
- Podatki
- integrirati
- Intelligence
- Inteligentna
- nameravajo
- razlago
- v
- vključujejo
- vključeni
- IT
- Java
- Job
- Delovna mesta
- poročilo o delovnih mestih
- znanje
- KubeFlow
- dela
- jezik
- jeziki
- Latenca
- učenje
- učni inženirji
- manj
- knjižnice
- Knjižnica
- Licenca
- Verjeten
- živi
- Poraženci
- stroj
- strojno učenje
- vzdrževanje
- Znamka
- upravljanje
- več
- Trženje
- Prisotnost
- poveljnika
- Stave
- matematični
- matematika
- max širine
- Maj ..
- McKinsey
- mehanika
- člani
- Spomin
- metapodatki
- Microsoft
- Microsoft Azure
- Microsoft Excel
- milijonov
- ML
- Model
- Testiranje modela
- modeliranje
- modeli
- več
- učinkovitejše
- Najbolj
- veliko
- morajo
- potrebno
- potrebna
- Neptun
- mreža
- Naslednja
- nlp
- Številka
- of
- on
- v teku
- deluje
- Delovanje
- operativno
- operacije
- optimizacija
- Optimizirajte
- optimizacijo
- or
- organizacije
- Ostalo
- naši
- ven
- Outlook
- zunaj
- več
- Splošni
- preteklosti
- vzorci
- za
- performance
- Mesta
- platforma
- platon
- Platonova podatkovna inteligenca
- PlatoData
- točke
- politika
- Stališče
- pozicije
- imeti
- močan
- napovedno
- Priprava
- Predstavitve
- v prvi vrsti
- Prednost
- reševanje problema
- Težave
- Procesi
- obravnavati
- proizvodnja
- produktivnost
- donosno
- Programiranje
- Obljuba
- možnosti
- Postavlja
- Python
- pitorha
- kvalifikacije
- Kvantna
- kvantni algoritmi
- kvantno računalništvo
- Kvantna mehanika
- R
- racing
- območje
- uresničevanje
- okrepljeno učenje
- Razmerja
- zanašajo
- ostajajo
- zamenjajte
- poročilo
- Poročanje
- zahteva
- zahteva
- Raziskave
- odgovornosti
- povzroči
- vloga
- vloge
- Run
- s
- plače
- plače
- SAS
- Lestvica
- razširljive
- Znanost
- Znanstvenik
- Znanstveniki
- videnje
- nastavite
- Kompleti
- nastavitve
- podobnosti
- velikosti
- spretnost
- spretnosti
- Software
- inženiring programske opreme
- strokovnjaki
- SQL
- postopka
- Statistično
- Statistika
- močna
- Struktura
- strukture
- taka
- primerna
- Anketa
- anketiranih
- sistem
- sistemi
- skupina
- tech
- tehnični
- tehnike
- Tehnologije
- Tehnologija
- nagiba
- tensorflo
- Testiranje
- kot
- da
- O
- svet
- njihove
- Tukaj.
- te
- jih
- Razmišljanje
- skozi
- pretočnost
- čas
- do
- orodja
- usposabljanje
- Transform
- pregleden
- ogromno
- Trends
- Bilijona
- turing
- dva
- Vrste
- tipično
- nas
- pod
- osnovni
- razumevanje
- uporaba
- Rabljeni
- uporabo
- potrjevanje
- različica
- nadzor različice
- vizualizacija
- ključnega pomena
- vs
- plača
- način..
- načini
- web
- Dobro
- ali
- ki
- medtem
- WHO
- bo
- Zmagovalci
- z
- v
- brez
- delo
- delavci
- delovnih tokov
- svet
- Svetovni gospodarski forum
- po vsem svetu
- pisni
- leto
- let
- jo
- Vaša rutina za
- zefirnet