Jak zbudować silne portfolio analizy danych jako początkujący?
Po zapoznaniu się z podstawami data science możesz zacząć pracować nad rzeczywistymi problemami. Ale jak prezentujesz swoją pracę? W tym artykule poznamy unikalny sposób tworzenia portfolio do nauki o danych.
By Abid Ali Awan, Certyfikowany specjalista ds. danych.
Zdjęcie autora | Elementy wg Darmowy wektor | Ilustracja koncepcja statystyki
Jako początkujący miałem wiele pytań dotyczących tego, jak zacząć? Jak się uczę lub skąd czerpię pomysły do pracy nad projektami. Tak więc po długich poszukiwaniach znalazłem projekt dotyczący analizy danych. Samo napisanie kodu zajęło mi 3 dni i byłem zadowolony z pierwszej próby, ale potem pojawiło się wielkie pytanie, jak podzielić się tym ze światem? Po prostu nie miałem dobrych umiejętności kodowania ani umiejętności dokumentowania, aby zaprezentować swoją pracę, więc przechowywałem je w chmurze i zapomniałem o tym. Po miesiącu losowo szukałem kolejnych projektów na GitHubie i uznałem to za niesamowite profil to zmotywowało mnie do stworzenia mojego portfolio. To była najlepsza decyzja, jaką podjąłem, ponieważ umieściła mnie na mapie społeczności programistów, a wkrótce potem zacząłem dostawać e-maile od rekruterów i początkujących o moich projektach.
Zdobywanie pracy jest zwykle głównym powodem budowania portfela. Czasami jest to konieczne, jeśli nie mamy odpowiedniego wykształcenia lub doświadczenia (eugeneyan.com). W tym nowoczesnym świecie pracodawcy sceptycznie podchodzą do zatrudniania nowych absolwentów, więc jak przekonać ich, że jesteś najlepszy do pracy? Pokazujesz swoje umiejętności, pokazując pracę, którą wykonałeś w poprzednim projekcie. Im silniejsze portfolio online, tym większa szansa na zatrudnienie w wymarzonej pracy.
„Portfolia są niezwykle ważne, ponieważ kiedy bierzesz udział w rozmowie kwalifikacyjnej, pokazuje Twoje doświadczenie w świecie rzeczywistym, dzięki czemu możesz wyjaśnić pracodawcy od A do Z cały przepływ pracy w zakresie analizy danych”. — Dawid Jakubowicz.
Inną motywacją jest tworzenie własnych osobisty projekt która zaspokoi Twoją ciekawość uczenia się nowych rzeczy. Kiedy uczymy się nowej umiejętności, chcemy poeksperymentować i ostatecznie zbudować działający produkt, który można wykorzystać w prawdziwym świecie.
W tym artykule dowiemy się, w jaki sposób możesz zaprezentować swoją pracę jako początkujący naukowiec. Dowiesz się o nowej platformie, która ułatwi Ci życie, oraz dowiesz się, jak budować silne portfele.
GitHub
Pozwólcie, że wyjaśnię błędne przekonanie wśród naukowców zajmujących się danymi. Tak, GitHub jest konieczne i wszyscy powinniśmy się uczyć odrzutowiec. Jako data scientist na co dzień korzystam z Github, gdzie wyszukuję ciekawe zbiory danych i projekty. Jest to najpopularniejsza platforma wśród programistów i szczerze mówiąc, rekruter sprawdza Twój profil na GitHub przed zadzwonieniem do Ciebie na rozmowę kwalifikacyjną.
Obraz według autora | GitHub
GitHub to globalna platforma współpracy, na której ludzie dzielą się projektami i współpracują przy nich. Jak możesz zobaczyć na moim profilu poniżej, jak przyczyniłem się do projektów innych osób, a także pracowałem nad własnymi projektami.
Zdjęcie autora | królabzpro
Wskazówki dotyczące tworzenia solidnego profilu:
- Stwórz swoją stronę profilową, a pełny samouczek znajdziesz tutaj Sary Hart blog.
- Dokumentuj każdy projekt za pomocą linków, obrazów okładek i szczegółowych opisów.
- Rozwiń projekt, który najbardziej Ci się podoba i wyślij swoje pierwsze żądanie ściągnięcia (freecodecamp.org).
- Bądź aktywny na tej platformie, wnosząc swój wkład, zgłaszając błędy i przekazując swoje bieżące projekty.
Głębokie notatki
Głębokie notatki jest znacznie prostszy niż GitHub i jest również przyjazny dla początkujących. Jeśli znasz Notatnik Jupyter wtedy opublikowanie pierwszego projektu będzie dla Ciebie bułką z masłem. Moje doświadczenie z Deepnote jest absolutnie niesamowite, ponieważ platforma zapewnia wszystkie cechy GitHub, ale jest znacznie prostsza i skupia się na społeczności naukowców zajmujących się danymi.
Zdjęcie autora | Postęp szczepień w Pakistanie
Niedawno wprowadzili profil Deepnote, który będzie prezentował wszystkie publikowane notatniki z Twoimi informacjami i zdjęciem profilowym.
Zdjęcie autora | Głębokie notatki
Tak jak GitHub Gist, możesz udostępnić fragment kodu swojemu zespołowi lub ogółowi społeczeństwa. Używałem komórki Deepnote na wszystkich platformach Medium Publication i social media. Możesz sprawdzić moje poprzednie artykuł aby zrozumieć, jak zaimplementować komórkę Deepnote. Korzystanie z fragmentów kodu z danymi wyjściowymi daje możliwość udostępniania projektów na wielu platformach.
Powodem, dla którego wolę osadzoną komórkę Deepnote od GitHub Gist, jest to, że zawiera ona dane wyjściowe, a nie tylko statyczne dane wyjściowe, ale także interaktywne funkcje.
Możesz użyć Plotly i wyświetlić swój wykres w artykule Medium:
Wskazówki dotyczące tworzenia solidnego profilu:
- Zaktualizuj swoją biografię, zdjęcie profilowe i informacje kontaktowe.
- Zawsze dodawaj szczegółowe opisy swojego projektu za pomocą komórki przeceny.
- Użyj zdjęcia na okładkę, aby wyróżnić swój projekt.
- Użyj funkcji aplikacji w Deepnote, aby utworzyć interaktywną aplikację internetową.
- Nadal publikuj swój stary projekt, a nawet ponownie publikuj notatniki z GitHub.
DAGsHub
DAGsHub jest nowością na tym świecie i szybko zyskuje swoją nazwę, zapewniając kompleksowe rozwiązanie dla praktyków uczenia maszynowego i inżynierów danych. DAGsHub zawiera rozszerzenie DVC serwer, MLflow, potok wizualizacji i synchronizacja GitHub. Nie będziemy zagłębiać się w funkcje, ale skupimy się na funkcjach, które go wyróżniają.
DAGsHub umożliwia udostępnianie repozytorium GitHub i tworzenie projektu analizy danych z możliwością wizualizacji uczenia maszynowego i potoków danych. Ma również ukrytą funkcję README.ipynb jako plik opisu projektu, który jest najlepszy dla początkujących, którzy nie są przyzwyczajeni do przecen i naukowców zajmujących się danymi, którzy uwielbiają pracować na Jupyter Notebook. Jest podobny do GitHub, co oznacza, że musisz nauczyć się zarówno Git, jak i DVC, aby prawidłowo korzystać z tej platformy.
To, co podobało się innym użytkownikom, to możliwość wizualizacji struktury ich projektu za pomocą potoku, a także możliwość zobaczenia ich danych i modeli jako integralnej części projektu. Ludziom podoba się również to, że opieramy się na narzędziach open-source zamiast wymyślać na nowo istniejące rozwiązania. — Dziekan
Zdjęcie: Dean | dagszub
Mój profil jest całkiem nowy, ale uwielbiam tę platformę, ponieważ zapewnia mi kompletny ekosystem uczenia maszynowego. Myślę, że wolę go bardziej niż GitHub pod względem funkcji i prostoty interfejsu użytkownika.
Zdjęcie autora | DAGsHub
Wskazówki dotyczące tworzenia solidnego profilu:
- Uczyć się rozszerzenie DVC, git, MLflow aby w pełni wykorzystać.
- Dodaj opis projektu do swojego notatnika i README.
- Zaktualizuj swój profil, dodając biografię, awatar i informacje kontaktowe.
- Spróbuj dodać dvc.yaml i blokada dvc w projekcie, aby wyświetlić potoki danych. Aby uzyskać więcej informacji, sprawdź Definiowanie rurociągu.
- Utrzymuj aktywny profil, przyczyniając się do projektów open source i przekazując swój osobisty projekt. Możesz użyć FDS cli, aby ułatwić sobie życie i uniknąć błędów.
- W pełni wykorzystuje DVC, przesyłając dane i model na zdalny serwer. Rekruterzy są zainteresowani kandydatami, którzy znają pełny cykl nauki o danych, od pozyskiwania danych do pulpitów nawigacyjnych.
Kaggle
Jeśli chcesz szybciej zostać zauważonym w świecie data science, powinieneś stworzyć Kaggle konto i zacznij współtworzyć konkursy, zbiory danych, notatniki i dyskusje. Kiedy zostajesz arcymistrzem, ludzie cię szanują i oferują lepsze możliwości kariery. Jeśli mnie pytasz, sugeruję, abyś stworzył profil Kaggle podczas nauki podstaw. Ucz się od ekspertów i odkryj swoją niszę. Jestem wielkim fanem tej platformy, ponieważ zapewnia wsparcie początkującemu w konkurowaniu i opracowywaniu innowacyjnych rozwiązań dla różnych branż. Jest podstawą badań nad sztuczną inteligencją.
Zdjęcie autora | Kaggle
Możesz sprawdzić mój profil poniżej, ponieważ od samego początku pomagałem w różnych kategoriach, aby zdobywać rangi. Obecnie jestem Ekspertem, ale z jednym złotym i srebrnym medalem w konkursie zostanę Mistrzem, co nie jest łatwe i szczerze szanuję Arcymistrzów, ponieważ udowodnili, że są najlepsi wśród innych praktyków danych.
Zdjęcie autora | Kaggle
Wskazówki dotyczące tworzenia solidnego profilu:
- Bądź aktywny na platformie, korzystając z nowych zestawów danych i tworząc modele analizy danych lub uczenia maszynowego.
- Weź udział w dyskusji, ucz się od ekspertów i poproś o pomoc.
- Użyj web scrapingu, aby opublikować nowy zestaw danych.
- Weź udział w większości konkursów, aby poznać kilka rodzajów problemów z uczeniem maszynowym i zdobyć odznaki.
- Skoncentruj się na publikowaniu swojej najlepszej pracy ze szczegółowymi opisami i wysokiej jakości kodem.
- Napisz o sobie w bio i dodaj dane kontaktowe.
Blog
Pisanie blogów to kolejny krok po stworzeniu swojego projektu na powyższych platformach. Jeśli chcesz poszerzyć swoją publiczność, gorąco sugeruję zacząć od Średni. Pisanie bloga nie jest konieczne, ale masz większą przyczepność z różnych dziedzin. Platforma Medium pozwala stworzyć swój profil i publikować artykuły w różnych publikacjach, takich jak W kierunku nauki o danych i W stronę AI. Możesz rozwinąć swoją witrynę blogową lub skorzystać z innej podobnej platformy, takiej jak Analityka Widhja.
Zdjęcie autora | Średni
Wskazówki dotyczące tworzenia solidnego profilu:
- Pisz blogi o projekcie, nad którym osobiście pracowałeś.
- Twórz blogi dotyczące nowej technologii lub nowych aplikacji do analizy danych.
- Prowadź odpowiednie badania podczas pisania blogów i dodawaj cytaty, aby uniknąć naruszeń zasad platformy.
- Użyj atrakcyjnych zdjęć na okładkę każdego bloga.
- Zawsze pisz o tym, czego uczysz się ze swojego doświadczenia podczas opracowywania projektów z zakresu nauki o danych.
- Nie podążaj za trendem i skup się na tym, w czym jesteś dobry.
Strona z portfolio
Możesz także wyświetlić swój projekt na osobistej stronie internetowej, a jeśli nie jesteś programistą internetowym, dostępnych jest kilka prostych narzędzi, które ułatwiają ten proces. Możesz to sprawdzić Jak zbudować witrynę portfolio Data Science za pomocą stron Hugo i GitHub i Hugo dla różnych szablonów.
Moja strona portfolio zawiera projekt ze wszystkich platform z krótkimi opisami i podkategoriami. Stworzenie całej witryny i wdrożenie jej na stronach GitHub zajęło mi trzy dni.
Zdjęcie autora | Portfolio
Wskazówki dotyczące tworzenia solidnej witryny z portfolio:
- Dodaj swoje umiejętności, biografię i CV.
- Pokaż swoje wrażenia i
- Zaprezentuj swoje projekty za pomocą linków do projektów GitHub lub Deepnote.
- Spraw, aby Twoja witryna była minimalna i interaktywna, aby rekruter mógł łatwo przewijać całe portfolio.
- Aktualizuj swoją witrynę portfolio o najnowszy projekt, nad którym pracujesz.
Waga i uprzedzenia
Zwykle używam Waga i uprzedzenia do eksperymentowania z uczeniem maszynowym i rejestrowania metryk wydajności moich modeli, ale to się zmieniło wraz z wprowadzeniem profilu W&B. Możesz pisać bloga o swoim bieżącym projekcie, korzystając z osadzonych linków i integracji wykresów. Jest dość podobny do innych wspomnianych platform portfolio, ale ma zaletę bezpośredniej integracji z bibliotekami Pythona.
Połączenia Ayush Profil zrobił na mnie największe wrażenie, ponieważ współpracował z innymi organizacjami, pisząc blogi o uczeniu maszynowym.
Zdjęcie autorstwa Ayush | Wagi i uprzedzenia
Projekt W&B ma metryki wydajności modelu, jak pokazano poniżej.
Zdjęcie autora | kaggle-seti
Wskazówki dotyczące tworzenia solidnego profilu:
- Dołącz do innych organizacji zajmujących się nauką o danych i uczestnicz w projektach grupowych.
- Użyj interfejsu API W&B, aby wyświetlić wyniki projektu uczenia maszynowego.
- Napisz bloga, korzystając z integracji metryk W&B.
- Dodaj biografię, zdjęcie profilowe, informacje kontaktowe.
- Staraj się angażować w dyskusję społecznościową i zawsze szukaj nowego ciekawego projektu.
Wnioski
W&B to symbol wieloznaczny, ponieważ słynie z eksperymentów z logowaniem, a nie z portfolio, ale wprowadzenie interaktywnych blogów dało nam wyjątkową zaletę wyświetlania Twojego projektu i stworzenia silnego portfolio.
Jeśli jesteś początkującym, sugeruję, abyś zaczął od Deepnote, ponieważ jest bezpłatny dla zespołów i zapewnia przyjazne dla początkujących narzędzia, aby zacząć. Jeśli chcesz zostać zauważony przez społeczność data science, spróbuj utworzyć swój profil na GitHub i Kaggle. Jeśli chcesz stworzyć swoją markę, zacznij od blogów lub stwórz swoją witrynę.
Na koniec chcę, abyście wszyscy stworzyli swój profil na wszystkich platformach, o których wspomniałem powyżej, ponieważ wszystkie mają unikalne zalety w imponowaniu potencjalnemu pracodawcy. Wiem, że na początku jest to dość przytłaczające, ale kiedy przyzwyczaisz się do dokumentowania i prezentowania swoich projektów, stanie się to łatwe.
Bio: Abid Ali Awan (@ 1abidaliawan) jest certyfikowanym specjalistą ds. analityków danych, który uwielbia budować modele uczenia maszynowego i prowadzić badania nad najnowszymi technologiami sztucznej inteligencji. Obecnie testują produkty AI w PEC-PITC, a ich praca zostaje później zatwierdzona do badań na ludziach, takich jak Breast Cancer Classifier.
Związane z:
Źródło: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- Konto
- aktywny
- Korzyść
- AI
- ai badania
- Wszystkie kategorie
- wśród
- analiza
- api
- Aplikacja
- aplikacje
- mobilne i webowe
- artykuł
- towary
- publiczność
- awatara
- plakietki
- Podstawy
- BEST
- Blog
- Blogów
- blogi
- Rak piersi
- Bug
- budować
- Budowanie
- Rak
- Kariera
- Chmura
- kod
- Kodowanie
- współpracy
- społeczność
- konkurencja
- Konkursy
- przyczyniły
- Tworzenie
- ciekawość
- Aktualny
- dane
- analiza danych
- nauka danych
- naukowiec danych
- głęboka nauka
- rozwijać
- Deweloper
- deweloperzy
- ZROBIŁ
- Ekosystem
- Edukacja
- pracodawcy
- Inżynieria
- Inżynierowie
- przewyższać
- Rozszerzać
- doświadczenie
- eksperyment
- eksperci
- Twarz
- Cecha
- Korzyści
- Łąka
- i terminów, a
- Skupiać
- obserwuj
- Darmowy
- pełny
- Ogólne
- git
- GitHub
- Globalne
- Złoto
- dobry
- Zarządzanie
- poprowadzi
- Wynajmowanie
- W jaki sposób
- How To
- HTTPS
- olbrzymi
- przemysłowa
- Informacja
- Innowacyjny
- integralny
- integracja
- interaktywne
- Wywiad
- IT
- Praca
- Notebook Jupyter
- firmy
- UCZYĆ SIĘ
- nauka
- długo
- miłość
- uczenie maszynowe
- Dokonywanie
- mapa
- Media
- średni
- Metryka
- model
- Najbardziej popularne posty
- Nowa platforma
- laptopy
- oferta
- Online
- koncepcja
- Szanse
- organizacji
- Inne
- Ludzie
- jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,
- obraz
- Platforma
- Platformy
- Popularny
- teczka
- Produkt
- Produkty
- Profil
- projekt
- projektowanie
- publiczny
- publikacje
- publikować
- Wydawniczy
- Python
- Prawdziwy świat
- Badania naukowe
- Efekt
- reguły
- nauka
- Naukowcy
- skrobanie
- Szukaj
- Share
- Short
- Srebro
- Prosty
- Witryny
- umiejętności
- So
- Obserwuj Nas
- Media społecznościowe
- platform społecznych mediów
- Rozwiązania
- początek
- rozpoczęty
- statystyka
- historie
- wsparcie
- Technologies
- Technologia
- Testowanie
- Podstawy
- świat
- czas
- wskazówki
- Top
- Tutorial
- ui
- us
- Użytkownicy
- sieć
- skrobanie sieci
- Strona internetowa
- KIM
- Praca
- workflow
- świat
- pisanie
- X
- youtube