Hvordan bygge en sterk datavitenskapsportefølje som nybegynner
Etter å ha lært det grunnleggende i datavitenskap, kan du begynne å jobbe med virkelige problemer. Men hvordan viser du frem arbeidet ditt? I denne artikkelen skal vi lære en unik måte å lage en datavitenskapsportefølje på.
By Abid Ali Awan, Sertifisert datavitenskapsmann.
Bilde av forfatter | Elementer av Gratis vektor | Statistikk, begrep, illustrasjon
Som nybegynner hadde jeg mange spørsmål om hvordan jeg skal begynne? Hvordan lærer jeg, eller hvor får jeg ideer til å jobbe med prosjekter. Så etter et langt søk fant jeg et prosjekt om dataanalyse. Det tok meg tre dager bare å skrive kode, og jeg var fornøyd med mitt første forsøk, men så var det dette store spørsmålet om hvordan jeg deler det med verden? Jeg hadde rett og slett ikke gode kodingskunnskaper eller dokumentasjonskunnskaper for å vise frem arbeidet mitt, så jeg lagret det i skyen og glemte det. Etter en måned lette jeg tilfeldigvis etter flere prosjekter på GitHub og fant dette fantastisk profil som motiverte meg til å lage min portefølje. Det var den beste avgjørelsen jeg tok da det satte meg på kartet over utviklermiljøet, og like etter begynte jeg å få e -post fra rekrutterere og nybegynnere om prosjektene mine.
Få en jobb er vanligvis hovedårsaken til å bygge en portefølje. Noen ganger er det nødvendig hvis vi ikke har relevant utdannelse eller erfaring (eugeneyan.com). I denne moderne verden er arbeidsgivere skeptiske til å ansette nyutdannede, så hvordan overbeviser du dem om at du er best for jobben? Du viser dine ferdigheter ved å vise arbeidet du har gjort i et tidligere prosjekt. Jo sterkere din online portefølje er, jo større sjanse har du for å bli ansatt for drømmejobben din.
"Porteføljene er ekstremt kritiske å ha, fordi når du er i intervjuet, viser det din virkelige opplevelse, slik at du kan forklare en arbeidsgiver fra A til Å hele datavitenskapens arbeidsflyt." - David Yakobovitch.
Den andre motivasjonen er å lage din personlig prosjekt som tilfredsstiller din nysgjerrighet om å lære nye ting. Når vi lærer en ny ferdighet, vil vi eksperimentere og til slutt bygge et fungerende produkt som kan brukes i den virkelige verden.
I denne artikkelen lærer vi hvordan du kan vise frem arbeidet ditt som nybegynner innen datavitenskap. Du vil lære om en ny plattform som gjør livet ditt enkelt og tips om hvordan du bygger sterke porteføljer.
GitHub
La meg bare fjerne misforståelsen blant datavitenskapere. Ja, GitHub er nødvendig, og vi bør alle lære git. Som datavitenskapsmann bruker jeg Github daglig, hvor jeg ser etter interessante datasett og prosjekter. Dette er den mest populære plattformen blant utviklere, og for å være ærlig, sjekker rekruttereren din GitHub -profil før han kaller deg til et intervju.
Bilde av forfatter | GitHub
GitHub er en global samarbeidsplattform der folk deler og samarbeider om prosjekter. Som du kan se i profilen min nedenfor, har jeg bidratt til andres prosjekter og også jobbet med mine egne prosjekter.
Bilde av forfatter | kingabzpro
Tips for å lage en solid profil:
- Opprett profilsiden din, og sjekk for en komplett opplæring Sarah Hart blogg.
- Dokumenter hvert prosjekt med lenker, omslagsbilder og detaljerte beskrivelser.
- Gaffel prosjektet du liker best, og send din første trekkforespørsel (freecodecamp.org).
- Vær aktiv på denne plattformen ved å bidra, rapportere feil og presse dine nåværende prosjekter.
Deepnote
Deepnote er mye enklere enn GitHub, og det er nybegynnervennlig også. Hvis du er kjent med Jupyter notisbok da blir det et stykke kake for deg å publisere ditt første prosjekt. Min erfaring med Deepnote er helt fantastisk ettersom plattformen gir deg alle egenskapene til GitHub, men er mye enklere og fokusert på dataforskerens fellesskap.
Bilde av forfatter | Pakistans vaksinasjonsfremgang
Nylig introduserte de en Deepnote -profil som viser alle notatbøkene du publiserer med informasjonen og profilbildet ditt.
Bilde av forfatter | Deepnote
Akkurat som GitHub Gist, kan du dele et utdrag av koden din med teamet ditt eller publikum generelt. Jeg brukte Deepnote -celle på alle mellomstore publikasjoner og sosiale medier. Du kan sjekke min forrige Artikkel for å forstå hvordan man implementerer en Deepnote -celle. Ved å bruke kodebiter med output gir deg muligheten til å dele prosjektene dine på flere plattformer.
Grunnen til at jeg foretrekker Deepnote innebygd celle fremfor GitHub Gist er at den kommer med utgang, ikke bare statisk utgang, men med interaktive funksjoner.
Du kan bruke Plotly og vise diagrammet i en middels artikkel:
Tips for å lage en solid profil:
- Oppdater bio, profilbilde og kontaktinformasjon.
- Legg alltid til detaljerte beskrivelser om prosjektet ditt ved å bruke markdown -celle.
- Bruk forsidebildet for å få prosjektet ditt til å skille seg ut.
- Bruk appfunksjoner i Deepnote til å lage interaktiv webapp.
- Fortsett å legge ut det gamle prosjektet ditt eller til og med legge ut notatbøker fra GitHub.
DAGsHub
DAGsHub er nytt for denne verden, og det skaper navn raskt ved å tilby en one-stop-løsning for maskinlæringsutøvere og dataingeniører. DAGsHub kommer med en DVC server, MLflow, Visualisering av rørledning og GitHub -synkronisering. Vi kommer ikke til å gå dypt inn i funksjoner, men vil fokusere på funksjonene som gjør at det skiller seg ut.
DAGsHub lar deg dele GitHub -depotet ditt og lage datavitenskapsprosjektet ditt med muligheten til å visualisere maskinlæring og datarørledninger. Den har også en skjult funksjon README.ipynb som prosjektbeskrivelsesfil, som er best for nybegynnere som ikke er vant til markdown og dataforskere som liker å jobbe med Jupyter Notebook. Det ligner på GitHub, noe som betyr at du må lære både Git og DVC for å bruke denne plattformen riktig.
Det jeg har sett andre brukere liker, er muligheten til å visualisere prosjektstrukturen via pipeline, samt muligheten til å se dataene og modellene som en integrert del av prosjektet. Det at vi er basert på verktøy for åpen kildekode i stedet for å finne opp eksisterende løsninger på nytt, er noe folk liker. - Dean
Bilde av Dean | dagshub
Profilen min er ganske ny, men jeg elsker denne plattformen ettersom de gir meg et komplett maskinlæringsøkosystem. Jeg tror jeg foretrekker det mer enn GitHub når det gjelder funksjoner og brukervennlighet.
Bilde av forfatter | DAGsHub
Tips for å lage en solid profil:
- Lær DVC, gåog MLflow å dra full nytte.
- Legg til prosjektbeskrivelse i notatblokken og README.
- Oppdater profilen din ved å legge til bio, avatar og kontaktinformasjon.
- Prøv å legge til dvc.yaml og dvc.lock i prosjektet ditt for å vise datarørledninger. For mer informasjon, sjekk ut Definere rørledningen.
- Behold en aktiv profil ved å bidra til åpen kildekode-prosjekter og ved å presse ditt personlige prosjekt. Du kan bruke FDS cli for å gjøre livet ditt enkelt og unngå feil.
- Tar full bruk av DVC ved å laste opp data og modell på en ekstern server. Rekrutterere er interessert i kandidater som kjenner hele datavitenskapssyklusen fra datainntak til dashbord.
kaggle
Hvis du vil bli lagt merke til raskere i datavitenskapens verden, bør du opprette en kaggle konto og begynn å bidra til konkurranser, datasett, notatbøker og diskusjoner. Når du blir stormester, respekterer folk deg og tilbyr deg bedre karrieremuligheter. Hvis du spør meg, foreslår jeg at du oppretter en Kaggle -profil mens du lærer det grunnleggende. Lær av eksperter og oppdag din nisje. Jeg er en stor fan av denne plattformen, da den gir støtte for en nybegynner til å konkurrere og utvikle innovative løsninger for ulike bransjer. Det er ryggraden i AI -forskning.
Bilde av forfatter | kaggle
Du kan sjekke profilen min nedenfor, siden jeg fra starten har bidratt i forskjellige kategorier for å få rang. Foreløpig er jeg en ekspert, men med en gull- og sølvmedalje i konkurransen, vil jeg bli en mester, noe som ikke er lett, og ærlig talt, jeg respekterer stormestere ettersom de har bevist at de er best blant andre datautøvere.
Bilde av forfatter | kaggle
Tips for å lage en solid profil:
- Vær aktiv på plattformen ved å bruke nye datasett og lage dataanalyse- eller maskinlæringsmodeller.
- Delta i diskusjon, lær av eksperter, og be om hjelp.
- Bruk webskraping for å publisere et nytt datasett.
- Delta i de fleste konkurranser for å lære flere typer maskinlæringsproblemer og tjene merker.
- Fokuser på å publisere det beste arbeidet ditt med detaljerte beskrivelser og kode av høy kvalitet.
- Skriv om deg selv i bio og legg til kontaktinformasjon.
Blogg
Å skrive blogger er det neste trinnet etter at du har opprettet prosjektet ditt på plattformene ovenfor. Hvis du vil utvide publikummet ditt, vil jeg sterkt foreslå at du starter med Medium. Å skrive en blogg er ikke nødvendig, men du får mer trekkraft fra forskjellige felt. Medium -plattformen lar deg lage din profil og la deg publisere artiklene dine under forskjellige publikasjoner som f.eks Mot datavitenskap og Mot AI. Du kan utvikle bloggsiden din eller bruke en annen lignende plattform som f.eks Analytics Vidhya.
Bilde av forfatter | Medium
Tips for å lage en solid profil:
- Skriv blogger om prosjektet du personlig jobbet med.
- Lag blogger om en ny teknologi eller nye datavitenskapelige applikasjoner.
- Gjør ordentlig forskning mens du skriver blogger og legg til sitater for å unngå brudd på plattformregler.
- Bruk attraktive forsidebilder for hver blogg.
- Skriv alltid om det du lærer av din erfaring mens du utvikler datavitenskapelige prosjekter.
- Ikke følg trenden, og fokuser på de tingene du er god på.
Portefølje nettsted
Du kan også vise prosjektet ditt på et personlig nettsted, og hvis du ikke er en webutvikler, er det noen enkle verktøy tilgjengelig for å gjøre prosessen ganske enkel. Du kan sjekke ut Hvordan bygge et nettsted for datavitenskapsportefølje med Hugo & GitHub -sider og Hugo for forskjellige maler.
Min porteføljeside har et prosjekt fra alle plattformene med korte beskrivelser og underkategorier. Det tok meg tre dager å lage hele nettstedet og distribuere det på GitHub -sider.
Bilde av forfatter | portefølje
Tips for å lage et solid porteføljeside:
- Legg til din ferdighet, bio og CV.
- Vis din erfaring og a
- Vis frem prosjektene dine med lenker til GitHub- eller Deepnote -prosjektene dine.
- Gjør nettstedet ditt minimalt og interaktivt, slik at rekruttereren har lett for å bla gjennom hele porteføljen din.
- Hold porteføljenettstedet ditt oppdatert med det siste prosjektet du jobber med.
Vekt og skjevheter
Jeg pleier å bruke Vekt og skjevheter for maskinlæringseksperimentering og logging av ytelsesberegninger for modellene mine, men det endret seg med introduksjonen av W & B -profilen. Du kan skrive en blogg om ditt nåværende prosjekt ved å bruke innebygde lenker og grafintegrasjon. Det er ganske likt andre porteføljeplattformer jeg nevnte, men det kommer med fordelen med direkte integrasjon med Python -biblioteker.
De Ayush profilen har imponert meg mest ettersom han har bidratt til andre organisasjoner mens han skrev blogger om maskinlæring.
Bilde av Ayush | Vekter og skjevheter
W & B -prosjektet har modellytelse, som vist nedenfor.
Bilde av forfatter | kaggle-seti
Tips for å lage en solid profil:
- Bli med i andre datavitenskapelige organisasjoner og delta i gruppeprosjekter.
- Bruk W&B API for å vise maskinlæringsprosjektresultatene dine.
- Skriv en blogg med integrering av W & B -beregninger.
- Legg til en bio, profilbilde, kontaktinformasjon.
- Prøv å delta i samfunnsdiskusjon og se alltid etter et nytt interessant prosjekt.
konklusjonen
W&B er et jokertegn, ettersom det er kjent for loggeksperimenter og ikke for porteføljer, men introduksjonen av interaktive blogger har gitt oss den unike fordelen med å vise prosjektet ditt og skape en sterk portefølje.
Hvis du er nybegynner, vil jeg foreslå at du starter med Deepnote, ettersom det er gratis for lag og gir deg nybegynnervennlige verktøy for å komme i gang. Hvis du ønsker å bli lagt merke til av datavitenskapsmiljøet, kan du prøve å lage profilen din på GitHub og Kaggle. Hvis du er interessert i å lage merkevaren din, kan du begynne med bloggsider eller opprette nettstedet ditt.
Til slutt vil jeg at du alle skal lage din profil på alle plattformene jeg nevnte ovenfor, ettersom de alle har unike fordeler med å imponere din potensielle arbeidsgiver. Jeg vet at det er ganske overveldende i starten, men når du blir vant til å dokumentere og vise frem prosjektene dine, blir det enkelt.
Bio: Abid Ali Awan (@1abidaliawan) er en sertifisert dataforsker som elsker å bygge modeller for maskinlæring og forskning på de nyeste AI -teknologiene. For tiden tester AI-produkter på PEC-PITC, deres arbeid blir senere godkjent for menneskelige forsøk, for eksempel Breast Cancer Classifier.
Relatert:
Kilde: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- Logg inn
- aktiv
- Fordel
- AI
- ai forskning
- Alle
- blant
- analyse
- api
- app
- søknader
- apps
- Artikkel
- artikler
- publikum
- avatar
- emblemer
- Grunnleggende
- BEST
- Blogg
- Blogging
- blogger
- Brystkreft
- Bug
- bygge
- Bygning
- Kreft
- Karriere
- Cloud
- kode
- Koding
- samarbeids
- samfunnet
- konkurranse
- Konkurranser
- bidratt
- Opprette
- nysgjerrighet
- Gjeldende
- dato
- dataanalyse
- datavitenskap
- dataforsker
- dyp læring
- utvikle
- Utvikler
- utviklere
- gJORDE
- økosystem
- Kunnskap
- arbeidsgivere
- Ingeniørarbeid
- Ingeniører
- Excel
- Expand
- erfaring
- eksperiment
- eksperter
- Face
- Trekk
- Egenskaper
- Felt
- Først
- Fokus
- følge
- Gratis
- fullt
- general
- gå
- GitHub
- Global
- Gull
- god
- Gruppe
- veilede
- Ansetter
- Hvordan
- Hvordan
- HTTPS
- stort
- bransjer
- informasjon
- innovative
- integrert
- integrering
- interaktiv
- Intervju
- IT
- Jobb
- Jupyter Notebook
- siste
- LÆRE
- læring
- Lang
- elsker
- maskinlæring
- Making
- kart
- Media
- medium
- Metrics
- modell
- Mest populær
- Ny plattform
- notatbøker
- tilby
- på nett
- åpen
- Muligheter
- organisasjoner
- Annen
- Ansatte
- ytelse
- bilde
- plattform
- Plattformer
- Populær
- portefølje
- Produkt
- Produkter
- Profil
- prosjekt
- prosjekter
- offentlig
- publikasjoner
- publisere
- Publisering
- Python
- virkelige verden
- forskning
- Resultater
- regler
- Vitenskap
- forskere
- skraping
- Søk
- Del
- Kort
- Sølv
- Enkelt
- Nettsteder
- ferdigheter
- So
- selskap
- sosiale medier
- sosiale medieplattformer
- Solutions
- Begynn
- startet
- statistikk
- Stories
- støtte
- Technologies
- Teknologi
- Testing
- Grunnleggende
- verden
- tid
- tips
- topp
- tutorial
- ui
- us
- Brukere
- web
- nettskraping
- Nettsted
- HVEM
- Arbeid
- arbeidsflyt
- verden
- skriving
- X
- youtube