Sådan opbygger du en stærk datavidenskabsportefølje som begynder
Efter at have lært det grundlæggende i datavidenskab, kan du begynde at arbejde på problemer i den virkelige verden. Men hvordan fremviser du dit arbejde? I denne artikel skal vi lære en unik måde at skabe en datavidenskabsportefølje på.
By Abid Ali Awan, certificeret dataforsker.
Billede af forfatter | Elementer af Gratis vektor | Statistik koncept illustration
Som nybegynder havde jeg mange spørgsmål om, hvordan starter jeg? Hvordan lærer jeg, eller hvor får jeg ideer til at arbejde med projekter. Så efter en lang søgen fandt jeg et projekt om dataanalyse. Det tog mig 3 dage bare at skrive kode, og jeg var tilfreds med mit første forsøg, men så var der det store spørgsmål om, hvordan deler jeg det med verden? Jeg havde simpelthen ikke gode kodningsevner eller dokumentationsevner til at fremvise mit arbejde, så jeg gemte det i skyen og glemte det. Efter en måned ledte jeg tilfældigt efter flere projekter på GitHub og fandt dette fantastiske profil som motiverede mig til at oprette min portfolio. Det var den bedste beslutning, jeg tog, da det satte mig på kortet over udviklerfællesskabet, og kort efter begyndte jeg at få e-mails fra rekrutteringspersonale og begyndere om mine projekter.
Få et job er normalt hovedårsagen til at bygge en portefølje. Nogle gange er det nødvendigt, hvis vi ikke har den relevante uddannelse eller erfaring (eugeneyan.com). I denne moderne verden er arbejdsgiverne skeptiske over for at ansætte nyuddannede, så hvordan overbeviser du dem om, at du er bedst til jobbet? Du viser dine færdigheder ved at vise det arbejde, du har udført i et tidligere projekt. Jo stærkere din online portefølje er, jo større chance har du for at blive ansat til dit drømmejob.
"Portfolioerne er ekstremt kritiske at have, fordi når du er i interviewet, viser den din oplevelse fra den virkelige verden, så du kan forklare en arbejdsgiver fra A til Z hele datavidenskabens workflow." — David Yakobovitch.
Den anden motivation er at skabe din personligt projekt der tilfredsstiller din nysgerrighed efter at lære nye ting. Når vi lærer en ny færdighed, ønsker vi at eksperimentere og til sidst bygge et fungerende produkt, der kan bruges i den virkelige verden.
I denne artikel lærer vi, hvordan du kan fremvise dit arbejde som nybegynder i datavidenskab. Du vil lære om nogle nye platforme, der gør dit liv nemt og tips til at opbygge stærke porteføljer.
GitHub
Lad mig lige fjerne misforståelsen blandt dataforskere. Ja, GitHub er nødvendigt, og vi bør alle lære git. Som data scientist bruger jeg dagligt Github, hvor jeg leder efter interessante datasæt og projekter. Dette er den mest populære platform blandt udviklere, og for at være ærlig tjekker rekruttereren din GitHub-profil, før han kalder dig til et interview.
Billede af forfatter | github
GitHub er en global samarbejdsplatform, hvor folk deler og samarbejder om projekter. Som du kan se i min profil nedenfor, hvordan jeg har bidraget til andres projekter og også arbejdet på mine egne projekter.
Billede af forfatter | kingabzpro
Tips til at skabe en solid profil:
- Opret din profilside, og se en komplet vejledning Sarah Harts blog.
- Dokumenter hvert projekt med links, forsidebilleder og detaljerede beskrivelser.
- Fordel det projekt, du bedst kan lide, og send din første pull-anmodning (freecodecamp.org).
- Vær aktiv på denne platform ved at bidrage, fejlrapportere og pushe dine nuværende projekter.
Deepnote
Deepnote er meget enklere end GitHub, og det er også begyndervenligt. Hvis du er bekendt med Jupyter notesbog så vil det være et stykke kage for dig at udgive dit første projekt. Min erfaring med Deepnote er helt fantastisk, da platformen giver dig alle kvaliteterne ved GitHub, men er meget enklere og fokuseret på dataforskernes fællesskab.
Billede af forfatter | Pakistan Vaccinationsfremskridt
For nylig introducerede de en Deepnote-profil, der vil vise alle de notesbøger, du udgiver, med dine oplysninger og profilbillede.
Billede af forfatter | Deepnote
Ligesom GitHub Gist, kan du dele et uddrag af din kode med dit team eller offentligheden generelt. Jeg brugte Deepnote celle på alle Medium Publication og sociale medier platforme. Du kan tjekke min tidligere artikel at forstå, hvordan man implementerer en Deepnote-celle. Brug af kodestykker med output giver dig mulighed for at dele dine projekter på flere platforme.
Grunden til, at jeg foretrækker Deepnote embedded cell over GitHub Gist, er, at den kommer med output, ikke kun statisk output, men med interaktive funktioner.
Du kan bruge Plotly og vise dit diagram i en medium artikel:
Tips til at skabe en solid profil:
- Opdater din bio, profilbillede og kontaktoplysninger.
- Tilføj altid detaljerede beskrivelser af dit projekt ved at bruge markdown-celle.
- Brug forsidebilledet til at få dit projekt til at skille sig ud.
- Brug appfunktioner i Deepnote til at oprette interaktiv webapp.
- Fortsæt med at sende dit gamle projekt eller endda genindlægge notesbøger fra GitHub.
DAGsHub
DAGsHub er nyt i denne verden, og det skaber hurtigt sit navn ved at levere en one-stop-løsning til maskinlæringsudøvere og dataingeniører. DAGsHub leveres med en CVD server, MLflow, Visualisering af pipeline og GitHub-synkronisering. Vi vil ikke gå dybt ind i funktioner, men vil fokusere på de funktioner, der gør det skiller sig ud.
DAGsHub giver dig mulighed for at dele dit GitHub-lager og oprette dit datavidenskabsprojekt med evnen til at visualisere maskinlæring og datapipelines. Den har også en skjult funktion README.ipynb som din projektbeskrivelsesfil, som er bedst for begyndere, der ikke er vant til markdown, og dataforskere, der elsker at arbejde på Jupyter Notebook. Det ligner GitHub, hvilket betyder, at du skal lære både Git og DVC for at bruge denne platform korrekt.
Det, jeg har set andre brugere nyde, er muligheden for at visualisere deres projektstruktur via pipelinen, samt muligheden for at se deres data og modeller som en integreret del af projektet. Også det faktum, at vi er baseret på open source-værktøjer i stedet for at genopfinde eksisterende løsninger, er noget folk kan lide. — Dean
Billede af Dean | dagshub
Min profil er ret ny, men jeg elsker denne platform, da de giver mig et komplet maskinlæringsøkosystem. Jeg tror, jeg foretrækker det mere end GitHub med hensyn til funktioner og UI-enkelhed.
Billede af forfatter | DAGsHub
Tips til at skabe en solid profil:
- Learn CVD, Gitog MLflow at få det fulde udbytte.
- Tilføj projektbeskrivelse til din notesbog og README.
- Opdater din profil ved at tilføje bio, avatar og kontaktoplysninger.
- Prøv at tilføje dvc.yaml , dvc.lås i dit projekt for at vise datapipelines. For mere information, tjek Definition af rørledningen.
- Hold en aktiv profil ved at bidrage til open source-projekter og ved at presse dit personlige projekt. Du kan bruge FDS cli for at gøre dit liv nemt og undgå fejl.
- Tager fuld brug af DVC ved at uploade dine data og model på en ekstern server. Rekrutterere er interesserede i kandidater, der kender den komplette datavidenskabelige cyklus fra dataindtagelse til dashboards.
Kaggle
Hvis du vil blive bemærket hurtigere i datavidenskabens verden, bør du oprette en Kaggle gøre rede for og begynde at bidrage til konkurrencer, datasæt, notesbøger og diskussioner. Når du bliver stormester, respekterer folk dig og tilbyder dig bedre karrieremuligheder. Hvis du spørger mig, foreslår jeg, at du opretter en Kaggle-profil, mens du lærer det grundlæggende. Lær af eksperter og opdag din niche. Jeg er stor fan af denne platform, da den giver støtte til en nybegynder til at konkurrere og udvikle innovative løsninger til forskellige brancher. Det er rygraden i AI-forskning.
Billede af forfatter | Kaggle
Du kan tjekke min profil nedenfor, da jeg fra starten har bidraget i forskellige kategorier for at få rang. I øjeblikket er jeg ekspert, men med én guld- og sølvmedalje i konkurrencen bliver jeg en mester, hvilket ikke er let, og ærligt talt respekterer jeg stormestre, da de har bevist, at de er de bedste blandt andre datapraktikere.
Billede af forfatter | Kaggle
Tips til at skabe en solid profil:
- Vær aktiv på platformen ved at bruge nye datasæt og skabe dataanalyse eller maskinlæringsmodeller.
- Deltag i diskussionen, lær af eksperter, og bed om hjælp.
- Brug web-skrabning til at publicere et nyt datasæt.
- Deltag i de fleste konkurrencer for at lære flere typer maskinlæringsproblemer og for at tjene badges.
- Fokuser på at udgive dit bedste arbejde med detaljerede beskrivelser og kode af høj kvalitet.
- Skriv om dig selv i bio og tilføj kontaktoplysninger.
Blog
At skrive blogs er det næste skridt efter at have oprettet dit projekt på ovenstående platforme. Hvis du vil udvide dit publikum, vil jeg varmt anbefale dig at starte med Medium. Det er ikke nødvendigt at skrive en blog, men du får mere trækkraft fra forskellige felter. Medium platformen giver dig mulighed for at oprette din profil og lade dig publicere dine artikler under forskellige publikationer som f.eks Mod datalogi , Mod AI. Du kan udvikle din blogside eller bruge en anden lignende platform som f.eks Analyse Vidhya.
Billede af forfatter | Medium
Tips til at skabe en solid profil:
- Skriv blogs om det projekt, du personligt har arbejdet på.
- Opret blogs om en ny teknologi eller om nye datavidenskabelige applikationer.
- Foretag ordentlig research, mens du skriver blogs, og tilføj citater for at undgå overtrædelser af platformsregler.
- Brug attraktive forsidebilleder til hver blog.
- Skriv altid om, hvad du lærer af din erfaring, mens du udvikler datavidenskabelige projekter.
- Følg ikke trenden, og fokuser på de ting, du er god til.
Porteføljes websted
Du kan også vise dit projekt på en personlig hjemmeside, og hvis du ikke er webudvikler, er der nogle enkle værktøjer til rådighed til at gøre processen ret nem. Du kan tjekke ud Sådan opbygger du et Data Science-porteføljewebsted med Hugo & GitHub-sider , Hugo til forskellige skabeloner.
Min portfolio hjemmeside har et projekt fra alle platforme med korte beskrivelser og underkategorier. Det tog mig tre dage at oprette hele webstedet og implementere det på GitHub-sider.
Billede af forfatter | Portefølje
Tips til at skabe et solidt porteføljewebsted:
- Tilføj dine færdigheder, bio og CV.
- Vis din oplevelse og en
- Vis dine projekter frem med links til dine GitHub- eller Deepnote-projekter.
- Gør din hjemmeside minimal og interaktiv, så rekruttereren har let ved at scrolle gennem hele din portefølje.
- Hold din porteføljehjemmeside opdateret med det seneste projekt, du arbejder på.
Vægt og skævheder
Jeg plejer at bruge Vægt og skævheder til maskinlæringseksperimentering og logning af ydeevnemålinger for mine modeller, men det ændrede sig med introduktionen af W&B-profilen. Du kan skrive en blog om dit nuværende projekt ved at bruge indlejrede links og grafintegration. Det ligner meget andre porteføljeplatforme, jeg nævnte, men det kommer med fordelen ved direkte integration med Python-biblioteker.
Ayush profil har imponeret mig mest, da han har bidraget til andre organisationer, mens han har skrevet blogs om machine learning.
Billede af Ayush | Vægte og skævheder
W&B-projektet har modelpræstationsmålinger, som vist nedenfor.
Billede af forfatter | kaggle-seti
Tips til at skabe en solid profil:
- Deltag i andre datavidenskabelige organisationer og deltag i gruppeprojekter.
- Brug W&B API til at vise dine maskinlæringsprojektresultater.
- Skriv en blog ved hjælp af W&B-metrics integration.
- Tilføj en bio, profilbillede, kontaktoplysninger.
- Prøv at engagere dig i samfundsdiskussion og se altid efter et nyt interessant projekt.
Konklusion
W&B er et jokertegn, da det er berømt for logningseksperimenter og ikke for porteføljer, men introduktionen af interaktive blogs har givet os den unikke fordel at vise dit projekt og skabe en stærk portefølje.
Hvis du er nybegynder, vil jeg foreslå, at du starter med Deepnote, da det er gratis for hold og giver dine begyndervenlige værktøjer til at komme i gang. Hvis du ønsker at blive bemærket af datavidenskabsfællesskabet, så prøv at oprette din profil på GitHub og Kaggle. Hvis du er til at skabe dit brand, så start med blogging-sider eller opret din hjemmeside.
I sidste ende ønsker jeg, at I alle sammen opretter jeres profil på alle de platforme, jeg nævnte ovenfor, da de alle har unikke fordele ved at imponere jeres potentielle arbejdsgiver. Jeg ved godt, at det er ret overvældende i starten, men når du først har vænnet dig til at dokumentere og fremvise dine projekter, bliver det nemt.
Bio: Abid Ali Awan (@1abidaliawan) er en certificeret dataforsker, der elsker at bygge maskinlæringsmodeller og forske i de nyeste AI-teknologier. I øjeblikket tester AI-produkter på PEC-PITC, og deres arbejde bliver senere godkendt til forsøg på mennesker, såsom Breast Cancer Classifier.
Relateret:
Kilde: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- Konto
- aktiv
- Fordel
- AI
- ai forskning
- Alle
- blandt
- analyse
- api
- app
- applikationer
- apps
- artikel
- artikler
- publikum
- avatar
- badges
- Grundlæggende
- BEDSTE
- Blog
- Blogging
- blogs
- Brystkræft
- Bug
- bygge
- Bygning
- Kræft
- Karriere
- Cloud
- kode
- Kodning
- kollaborativ
- samfund
- konkurrence
- Konkurrencer
- bidrog
- Oprettelse af
- nysgerrighed
- Nuværende
- data
- dataanalyse
- datalogi
- dataforsker
- dyb læring
- udvikle
- Udvikler
- udviklere
- DID
- økosystem
- Uddannelse
- arbejdsgivere
- Engineering
- Ingeniører
- Excel
- Udvid
- erfaring
- eksperiment
- eksperter
- Ansigtet
- Feature
- Funktionalitet
- Fields
- Fornavn
- Fokus
- følger
- Gratis
- fuld
- Generelt
- Git
- GitHub
- Global
- Guld
- godt
- gruppe
- vejlede
- Ansættelse
- Hvordan
- How To
- HTTPS
- kæmpe
- industrier
- oplysninger
- innovativ
- integral
- integration
- interaktiv
- Interview
- IT
- Job
- Jupyter Notebook
- seneste
- LÆR
- læring
- Lang
- kærlighed
- machine learning
- Making
- kort
- Medier
- medium
- Metrics
- model
- Mest Populære
- Ny platform
- notesbøger
- tilbyde
- online
- åbent
- Muligheder
- organisationer
- Andet
- Mennesker
- ydeevne
- billede
- perron
- Platforme
- Populær
- portefølje
- Produkt
- Produkter
- Profil
- projekt
- projekter
- offentlige
- publikationer
- offentliggøre
- Publicering
- Python
- virkelige verden
- forskning
- Resultater
- regler
- Videnskab
- forskere
- skrabning
- Søg
- Del
- Kort
- Sølv
- Simpelt
- Websteder
- færdigheder
- So
- Social
- sociale medier
- sociale medieplatforme
- Løsninger
- starte
- påbegyndt
- statistik
- Historier
- support
- Teknologier
- Teknologier
- Test
- Grundlæggende
- verdenen
- tid
- tips
- top
- tutorial
- ui
- us
- brugere
- web
- webskrabning
- Hjemmeside
- WHO
- Arbejde
- workflow
- world
- skrivning
- X
- youtube