Kuidas luua tugevat andmeteaduste portfelli algajana
Pärast andmeteaduse põhitõdede omandamist võite hakata tegelema reaalsete probleemidega. Aga kuidas oma tööd esitleda? Selles artiklis õpime ainulaadset viisi andmeteaduse portfelli loomiseks.
By Abid Ali Awan, sertifitseeritud andmeteadlane.
Pilt autorilt | Elemendid autor Tasuta vektor | Statistika mõiste illustratsioon
Algajana tekkis mul palju küsimusi, kuidas alustada? Kuidas ma õpin või kust saan ideid projektidega töötamiseks. Nii leidsin pärast pikka otsimist andmeanalüüsi projekti. Mul kulus koodi kirjutamiseks 3 päeva ja ma olin oma esimese katsega rahul, kuid siis tekkis suur küsimus, kuidas seda maailmaga jagada? Mul polnud lihtsalt häid kodeerimisoskusi ega dokumenteerimisoskusi oma töö tutvustamiseks, nii et salvestasin selle pilve ja unustasin selle. Kuu aja pärast otsisin GitHubist juhuslikult rohkem projekte ja leidsin selle hämmastava profiil mis ajendas mind oma portfelli looma. See oli minu parim otsus, kuna see pani mind arendajate kogukonna kaardile ja varsti pärast seda hakkasin saama värbajatelt ja algajatelt oma projektide kohta meile.
Tööle saamine on tavaliselt portfelli loomise peamine põhjus. Mõnikord on see vajalik, kui meil puudub vastav haridus või kogemus (eugeneyan.com). Tänases maailmas suhtuvad tööandjad uute koolilõpetajate palkamisse skeptiliselt, seega kuidas veenda neid, et olete selle töö jaoks parim? Näitate oma oskusi, näidates eelmises projektis tehtud tööd. Mida tugevam on teie veebiportfell, seda suurem on võimalus saada oma unistuste töökohale tööle.
"Portfoolio omamine on äärmiselt oluline, sest intervjuul olles näitab see teie reaalset kogemust, nii et saate tööandjale A-st Z-ni selgitada kogu andmeteaduse töövoogu." — David Jakobovitš.
Teine motivatsioon on luua oma isiklik projekt mis rahuldab teie uudishimu uute asjade õppimise vastu. Kui õpime uut oskust, tahame katsetada ja lõpuks ehitada toimiva toote, mida saab kasutada ka pärismaailmas.
Sellest artiklist õpime, kuidas saate oma tööd andmeteaduse algajana tutvustada. Saate teada mõne uue platvormi kohta, mis muudab teie elu lihtsaks, ja näpunäiteid tugevate portfellide loomiseks.
GitHub
Lubage mul lihtsalt selgitada andmeteadlaste eksiarvamus. jah, GitHub on vajalik ja me kõik peaksime õppima git. Andmeteadlasena kasutan Githubi igapäevaselt, kust otsin huvitavaid andmekogumeid ja projekte. See on arendajate seas kõige populaarsem platvorm ja ausalt öeldes kontrollib värbaja enne intervjuule kutsumist teie GitHubi profiili.
Pilt autori järgi | github
GitHub on ülemaailmne koostööplatvorm, kus inimesed jagavad projekte ja teevad nendega koostööd. Nagu näete allpool minu profiilis, kuidas olen panustanud teiste inimeste projektidesse ja töötanud ka oma projektide kallal.
Pilt autorilt | kingabzpro
Näpunäiteid kindla profiili loomiseks:
- Looge oma profiilileht ja täieliku õpetuse saamiseks vaadake Sarah Hart blogi.
- Dokumenteerige iga projekt linkide, kaanepiltide ja üksikasjalike kirjeldustega.
- Valige projekt, mis teile kõige rohkem meeldib, ja saatke oma esimene tõmbetaotlus (freecodecamp.org).
- Olge sellel platvormil aktiivne, panustades, vigadest teatades ja oma praeguseid projekte edasi lükates.
Sügav märkus
Sügav märkus on palju lihtsam kui GitHub ja see on ka algajasõbralik. Kui olete tuttav Jupyteri märkmik siis on teie jaoks käkitegu avaldada oma esimene projekt. Minu kogemus Deepnote'iga on täiesti hämmastav, kuna platvorm pakub teile kõiki GitHubi omadusi, kuid on palju lihtsam ja keskendub andmeteadlaste kogukonnale.
Pilt autorilt | Pakistani vaktsineerimise edenemine
Hiljuti tutvustasid nad Deepnote'i profiili, mis kuvab kõik teie avaldatavad märkmikud koos teie teabe ja profiilipildiga.
Pilt autorilt | Sügav märkus
Just nagu GitHub Gist, saate jagada oma koodijuppi oma meeskonna või üldsusega. Kasutasin Deepnote'i lahtrit kõigil Medium Publicationi ja sotsiaalmeedia platvormidel. Saate vaadata minu eelmist artikkel et mõista, kuidas Deepnote'i lahtrit rakendada. Väljundiga koodilõikude kasutamine annab teile võimaluse jagada oma projekte mitmel platvormil.
Põhjus, miks ma eelistan Deepnote'i manustatud rakku GitHub Gistile, on see, et sellel on väljund, mitte ainult staatiline väljund, vaid ka interaktiivsed funktsioonid.
Saate kasutada Plotlyt ja kuvada oma diagrammi keskmise artiklina:
Näpunäiteid kindla profiili loomiseks:
- Värskendage oma biograafiat, profiilifotot ja kontaktteavet.
- Lisage alati oma projekti üksikasjalikud kirjeldused, kasutades allahindluslahtrit.
- Kasutage kaanefotot, et oma projekt silma paista.
- Kasutage interaktiivse veebirakenduse loomiseks Deepnote'i rakenduse funktsioone.
- Jätkake oma vana projekti postitamist või isegi märkmikute uuesti postitamist GitHubist.
DAGsHub
DAGsHub on selles maailmas uus ja teeb oma nime kiiresti, pakkudes masinõppe praktikutele ja andmeinseneridele ühtset lahendust. DAGsHubiga on kaasas a CVD server, MLflow, Konveieri visualiseerimine ja GitHubi sünkroonimine. Me ei süvene funktsioonidesse, vaid keskendume funktsioonidele, mis selle silma paistavad.
DAGsHub võimaldab teil jagada oma GitHubi hoidlat ja luua oma andmeteaduse projekti, mis võimaldab visualiseerida masinõpet ja andmetorusid. Sellel on teie projekti kirjeldusfailina ka peidetud funktsioon README.ipynb, mis sobib kõige paremini algajatele, kes pole harjunud allahindlusega, ja andmeteadlastele, kellele meeldib Jupyteri sülearvutiga töötada. See sarnaneb GitHubiga, mis tähendab, et selle platvormi õigeks kasutamiseks peate õppima nii Giti kui ka DVC-d.
Olen näinud, et teised kasutajad naudivad võimalust visualiseerida oma projekti struktuuri torujuhtme kaudu, samuti võimalust näha oma andmeid ja mudeleid projekti lahutamatu osana. Samuti meeldib inimestele tõsiasi, et me lähtume avatud lähtekoodiga tööriistadest, selle asemel et leiutada olemasolevaid lahendusi. — dekaan
Pildi autor Dean | dagshub
Minu profiil on üsna uus, kuid mulle meeldib see platvorm, kuna need pakuvad mulle täielikku masinõppe ökosüsteemi. Arvan, et eelistan seda funktsioonide ja kasutajaliidese lihtsuse poolest rohkem kui GitHubi.
Pilt autorilt | DAGsHub
Näpunäiteid kindla profiili loomiseks:
- Õppima CVD, Gitja MLflow täiel määral ära kasutada.
- Lisage oma märkmikusse projekti kirjeldus ja README.
- Värskendage oma profiili, lisades biograafia, avatari ja kontaktteabe.
- Proovige lisada dvc.yaml ja dvc.lock oma projektis andmekonveierite kuvamiseks. Lisateabe saamiseks vaadake Torujuhtme määratlemine.
- Hoidke aktiivset profiili, panustades avatud lähtekoodiga projektidesse ja edendades oma isiklikku projekti. Sa võid kasutada Fds cli teha oma elu lihtsaks ja vältida vigu.
- Kasutab DVC-d täielikult ära, laadides teie andmed ja mudeli üles kaugserverisse. Värbajad on huvitatud kandidaatidest, kes tunnevad kogu andmeteaduse tsüklit andmete sisestamisest armatuurlaudadeni.
Kaagutama
Kui soovid end andmeteaduse maailmas kiiremini märgata, peaksid looma a Kaagutama konto ja hakake panustama võistlustele, andmekogudesse, märkmikesse ja aruteludesse. Kui sinust saab suurmeister, siis inimesed austavad sind ja pakuvad sulle paremaid karjäärivõimalusi. Kui küsite minult, soovitan teil põhitõdesid õppides luua Kaggle'i profiil. Õppige ekspertidelt ja avastage oma nišš. Olen selle platvormi suur fänn, kuna see pakub algajale tuge konkureerimiseks ja uuenduslike lahenduste väljatöötamiseks erinevatele tööstusharudele. See on AI-uuringute selgroog.
Pilt autorilt | Kaagutama
Saate vaadata minu profiili allpool, kuna algusest peale olen panustanud erinevates kategooriates, et saada auastmeid. Hetkel olen Ekspert, aga ühe kuld- ja hõbemedaliga konkursil saan Meistriks, mis ei ole lihtne ja ausalt öeldes austan suurmeistreid, kuna nad on tõestanud, et on teiste andmepraktikute seas parimad.
Pilt autorilt | Kaagutama
Näpunäiteid kindla profiili loomiseks:
- Olge platvormil aktiivne, kasutades uusi andmekogumeid ja luues andmeanalüüsi või masinõppe mudeleid.
- Osalege arutelus, õppige ekspertidelt ja küsige abi.
- Uue andmestiku avaldamiseks kasutage veebikraapimist.
- Osalege enamikul võistlustel, et õppida mitut tüüpi masinõppeprobleeme ja teenida märke.
- Keskenduge oma parimate tööde avaldamisele üksikasjalike kirjelduste ja kvaliteetse koodiga.
- Kirjuta endast biosse ja lisa kontaktandmed.
Blogi
Blogide kirjutamine on järgmine samm pärast projekti loomist ülaltoodud platvormidel. Kui soovite oma vaatajaskonda laiendada, soovitan teil alustada sellest Keskmine. Blogi kirjutamine pole vajalik, kuid erinevatest valdkondadest saab rohkem tõmmet. Platvorm Medium võimaldab teil luua oma profiili ja avaldada oma artikleid mitmesugustes väljaannetes, näiteks Andmeteaduse poole ja AI poole. Saate arendada oma ajaveebisaiti või kasutada mõnda muud sarnast platvormi, näiteks Analüütika Vidhya.
Pilt autorilt | Keskmine
Näpunäiteid kindla profiili loomiseks:
- Kirjutage ajaveebi projekti kohta, millega te isiklikult töötasite.
- Looge ajaveebe areneva tehnoloogia või uute andmeteaduse rakenduste kohta.
- Tehke ajaveebi kirjutamise ajal korralikku uurimistööd ja lisage tsitaate, et vältida platvormireeglite rikkumisi.
- Kasutage iga ajaveebi jaoks atraktiivseid kaanefotosid.
- Andmeteaduse projekte arendades kirjutage alati sellest, mida olete oma kogemusest õppinud.
- Ärge järgige trende ja keskenduge asjadele, milles olete hea.
Portfelli veebileht
Saate oma projekti kuvada ka isiklikul veebisaidil ja kui te pole veebiarendaja, on saadaval mõned lihtsad tööriistad, mis muudavad protsessi üsna lihtsaks. Saate vaadata Kuidas luua Hugo ja GitHubi lehtedega andmeteaduse portfelli veebisait ja Hugo erinevate mallide jaoks.
Minu portfelli veebisaidil on projekt kõigilt platvormidelt koos lühikeste kirjelduste ja alamkategooriatega. Kogu veebisaidi loomiseks ja GitHubi lehtedele juurutamiseks kulus mul kolm päeva.
Pilt autorilt | Tehtud tööd
Näpunäiteid kindla portfelli veebisaidi loomiseks:
- Lisage oma oskused, biograafia ja CV.
- Näidake oma kogemusi ja a
- Esitage oma projekte GitHubi või Deepnote'i projektide linkidega.
- Muutke oma veebisait minimaalseks ja interaktiivseks, et värbajal oleks lihtne kogu teie portfelli sirvida.
- Hoidke oma portfelli veebisaiti kursis uusima projektiga, mille kallal töötate.
Kaal ja eelarvamused
Ma tavaliselt kasutan Kaal ja eelarvamused masinõppe katsetamiseks ja minu mudelite jõudlusnäitajate logimiseks, kuid see muutus W&B profiili kasutuselevõtuga. Saate kirjutada oma praegusest projektist ajaveebi, kasutades manustatud linke ja graafikute integreerimist. See on üsna sarnane muudele portfelliplatvormidele, mida mainisin, kuid sellega kaasneb otsene integreerimine Pythoni raamatukogudega.
. Ayush profiil on mulle kõige rohkem muljet avaldanud, kuna ta on masinõppest blogisid kirjutades panustanud teistesse organisatsioonidesse.
Pildi autor Ayush | Kaalud ja eelarvamused
W&B projektil on mudeli jõudlusnäitajad, nagu allpool näidatud.
Pilt autorilt | kaggle-seti
Näpunäiteid kindla profiili loomiseks:
- Liituge teiste andmeteaduslike organisatsioonidega ja osalege rühmaprojektides.
- Kasutage masinõppeprojekti tulemuste kuvamiseks W&B API-t.
- Kirjutage ajaveebi, kasutades W&B mõõdikute integreerimist.
- Lisa biograafia, profiilipilt, kontaktandmed.
- Proovige osaleda kogukonna arutelus ja otsige alati uut huvitavat projekti.
Järeldus
W&B on metamärk, kuna see on kuulus logimiskatsete, mitte portfellide poolest, kuid interaktiivsete ajaveebide kasutuselevõtt on andnud meile ainulaadse eelise teie projekti kuvamiseks ja tugeva portfelli loomisel.
Kui olete algaja, soovitan teil alustada Deepnote'iga, kuna see on meeskondadele tasuta ja andke alustamiseks oma algajasõbralikud tööriistad. Kui soovite, et andmeteaduse kogukond teid märkaks, proovige luua oma profiil GitHubis ja Kaggle'is. Kui soovite oma brändi luua, alustage ajaveebisaitidest või looge oma veebisait.
Lõpuks soovin, et te kõik looksite oma profiili kõigil ülalmainitud platvormidel, kuna neil kõigil on ainulaadsed eelised teie potentsiaalsele tööandjale muljet avaldades. Ma tean, et see on alguses üsna üle jõu käiv, kuid kui olete harjunud oma projekte dokumenteerima ja esitlema, muutub see lihtsaks.
Bio: Abid Ali Awan (@1abidaliawan) on sertifitseeritud andmeteadlase professionaal, kes armastab masinõppemudelite loomist ja uusimate tehisintellekti tehnoloogiate uurimist. Praegu katsetavad tehisintellekti tooteid PEC-PITC-s, nende töö kiidetakse hiljem heaks inimkatseteks, näiteks rinnavähi klassifikaatoris.
Seotud:
Allikas: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- konto
- aktiivne
- ADEelis
- AI
- ai uuringud
- Materjal: BPA ja flataatide vaba plastik
- vahel
- analüüs
- API
- app
- rakendused
- apps
- artikkel
- kaubad
- publik
- avatar
- märgid
- Alused
- BEST
- Blogi
- Blogimine
- blogid
- Rinnavähk
- Bug
- ehitama
- Ehitus
- vähk
- Karjäär
- Cloud
- kood
- Kodeerimine
- koostööl
- kogukond
- konkurents
- Võistlused
- Aitas
- loomine
- uudishimu
- Praegune
- andmed
- andmete analüüs
- andmeteadus
- andmeteadlane
- sügav õpe
- arendama
- arendaja
- Arendajad
- DID
- ökosüsteemi
- Käsitöö
- tööandjad
- Inseneriteadus
- Inseneride
- Excel
- Laiendama
- kogemus
- eksperiment
- ekspertide
- nägu
- tunnusjoon
- FUNKTSIOONID
- Valdkonnad
- esimene
- Keskenduma
- järgima
- tasuta
- täis
- Üldine
- Git
- GitHub
- Globaalne
- Kuldne
- hea
- Grupp
- suunata
- Töökohad
- Kuidas
- Kuidas
- HTTPS
- tohutu
- tööstusharudes
- info
- uuenduslik
- lahutamatu
- integratsioon
- interaktiivne
- Intervjuu
- IT
- töö
- Jupyteri sülearvuti
- hiljemalt
- Õppida
- õppimine
- Pikk
- armastus
- masinõpe
- Tegemine
- kaart
- Meedia
- keskmine
- Meetrika
- mudel
- Populaarseim
- Uus platvorm
- märkmikud
- pakkuma
- Internetis
- avatud
- Võimalused
- organisatsioonid
- Muu
- Inimesed
- jõudlus
- pilt
- inimesele
- Platvormid
- populaarne
- portfell
- Toode
- Toodet
- profiil
- projekt
- projektid
- avalik
- väljaanded
- avaldama
- Kirjastamine
- Python
- päris maailm
- teadustöö
- Tulemused
- eeskirjade
- teadus
- teadlased
- kraapides
- Otsing
- Jaga
- Lühike
- Silver
- lihtne
- Saidid
- oskused
- So
- sotsiaalmeedia
- Sotsiaalse meedia
- sotsiaalse meedia platvormidel
- Lahendused
- algus
- alustatud
- statistika
- Lood
- toetama
- Tehnoloogiad
- Tehnoloogia
- Testimine
- Põhitõed
- maailm
- aeg
- nõuanded
- ülemine
- juhendaja
- ui
- us
- Kasutajad
- web
- veebi kraapimine
- veebisait
- WHO
- Töö
- töövoog
- maailm
- kirjutamine
- X
- youtube