Wie man als Anfänger ein starkes Data-Science-Portfolio erstellt
Nachdem Sie die Grundlagen der Data Science erlernt haben, können Sie mit der Arbeit an realen Problemen beginnen. Aber wie präsentieren Sie Ihre Arbeit? In diesem Artikel werden wir einen einzigartigen Weg kennenlernen, um ein Data-Science-Portfolio zu erstellen.
By Abid Ali Awan, zertifizierter Datenwissenschaftler.
Bild nach Autor | Elemente von Kostenloser Vektor | Abbildung des Statistikkonzepts
Als Anfänger hatte ich viele Fragen, wie fange ich an? Wie lerne ich, oder wo bekomme ich Ideen für die Arbeit an Projekten. So fand ich nach langer Suche ein Projekt zur Datenanalyse. Ich habe 3 Tage gebraucht, um nur Code zu schreiben, und ich war mit meinem ersten Versuch zufrieden, aber dann war da noch die große Frage, wie ich ihn mit der Welt teile. Ich hatte einfach keine guten Programmier- oder Dokumentationsfähigkeiten, um meine Arbeit zu präsentieren, also habe ich sie in der Cloud gespeichert und vergessen. Nach einem Monat suchte ich auf GitHub zufällig nach weiteren Projekten und fand das erstaunlich profile das hat mich motiviert, mein Portfolio zu erstellen. Das war die beste Entscheidung, die ich getroffen habe, da sie mich auf die Landkarte der Entwickler-Community gebracht hat, und kurz darauf erhielt ich E-Mails von den Recruitern und Anfängern über meine Projekte.
Einen Job bekommen ist in der Regel der Hauptgrund für den Aufbau eines Portfolios. Manchmal ist es notwendig, wenn wir nicht über die entsprechende Ausbildung oder Erfahrung verfügen (eugeneyan.com). In dieser modernen Welt stehen Arbeitgeber der Einstellung neuer Absolventen skeptisch gegenüber. Wie überzeugen Sie sie also davon, dass Sie am besten für den Job geeignet sind? Sie zeigen Ihre Fähigkeiten, indem Sie die Arbeit zeigen, die Sie in einem früheren Projekt geleistet haben. Je stärker Ihr Online-Portfolio ist, desto höher ist Ihre Chance, für Ihren Traumjob eingestellt zu werden.
„Die Portfolios sind äußerst wichtig, denn wenn Sie im Vorstellungsgespräch sind, zeigen sie Ihre realen Erfahrungen, sodass Sie einem Arbeitgeber von A bis Z den gesamten Data Science-Workflow erklären können.“ — David Jakobowitsch.
Die andere Motivation besteht darin, deine persönliches Projekt das befriedigt Ihre Neugier, Neues zu lernen. Wenn wir eine neue Fähigkeit erlernen, möchten wir experimentieren und schließlich ein funktionierendes Produkt bauen, das in der realen Welt verwendet werden kann.
In diesem Artikel erfahren Sie, wie Sie Ihre Arbeit als Data Science-Anfänger präsentieren können. Sie lernen eine neue Plattform kennen, die Ihnen das Leben leichter macht und Tipps zum Aufbau starker Portfolios.
GitHub
Lassen Sie mich nur das Missverständnis unter Data Scientists ausräumen. Jawohl, GitHub ist notwendig, und wir alle sollten lernen git. Als Data Scientist nutze ich Github täglich, wo ich nach interessanten Datensätzen und Projekten suche. Dies ist die beliebteste Plattform unter Entwicklern, und um ehrlich zu sein, überprüft der Recruiter Ihr GitHub-Profil, bevor er Sie zu einem Vorstellungsgespräch anruft.
Bild nach Autor | github
GitHub ist eine globale kollaborative Plattform, auf der Menschen Projekte teilen und zusammenarbeiten. Wie Sie in meinem Profil unten sehen können, habe ich zu den Projekten anderer beigetragen und auch an meinen eigenen Projekten gearbeitet.
Bild nach Autor | kingabzpro
Tipps zum Erstellen eines soliden Profils:
- Erstellen Sie Ihre Profilseite und sehen Sie sich ein vollständiges Tutorial an Sarah Harts </span><a href="https://rof-style.com/de/leather-boots-care/" target="_top" data-no-instant="">Weitere Tipps zur Pflege deiner ROFs findest du in unserem Blog.</a>
- Dokumentieren Sie jedes Projekt mit Links, Titelbildern und detaillierten Beschreibungen.
- Forken Sie das Projekt ab, das Ihnen am besten gefällt und senden Sie Ihren ersten Pull-Request (freecodecamp.org).
- Seien Sie auf dieser Plattform aktiv, indem Sie Beiträge leisten, Fehler melden und Ihre aktuellen Projekte vorantreiben.
Tiefennote
Tiefennote ist viel einfacher als GitHub und auch anfängerfreundlich. Wenn Sie vertraut sind mit Jupyter Notizbuch dann ist es für Sie ein Kinderspiel, Ihr erstes Projekt zu veröffentlichen. Meine Erfahrung mit Deepnote ist absolut erstaunlich, da die Plattform Ihnen alle Qualitäten von GitHub bietet, aber viel einfacher ist und sich auf die Community der Datenwissenschaftler konzentriert.
Bild nach Autor | Fortschritte bei der Impfung in Pakistan
Vor kurzem haben sie ein Deepnote-Profil eingeführt, in dem alle von Ihnen veröffentlichten Notizbücher mit Ihren Informationen und Ihrem Profilbild angezeigt werden.
Bild nach Autor | Tiefennote
Genau wie GitHub Gist, können Sie einen Ausschnitt Ihres Codes mit Ihrem Team oder der Öffentlichkeit im Allgemeinen teilen. Ich habe Deepnote Cell auf allen Medium Publication- und Social-Media-Plattformen verwendet. Sie können meine vorherigen überprüfen Artikel um zu verstehen, wie eine Deepnote-Zelle implementiert wird. Durch die Verwendung von Codeschnipseln mit der Ausgabe können Sie Ihre Projekte auf mehreren Plattformen freigeben.
Der Grund, warum ich die eingebettete Deepnote-Zelle gegenüber GitHub Gist bevorzuge, ist, dass sie mit einer Ausgabe geliefert wird, nicht nur mit statischer Ausgabe, sondern mit interaktiven Funktionen.
Sie können Plotly verwenden und Ihr Diagramm in einem Medium-Artikel anzeigen:
Tipps zum Erstellen eines soliden Profils:
- Aktualisieren Sie Ihre Biografie, Ihr Profilfoto und Ihre Kontaktinformationen.
- Fügen Sie immer detaillierte Beschreibungen zu Ihrem Projekt hinzu, indem Sie die Markdown-Zelle verwenden.
- Verwenden Sie das Titelbild, um Ihr Projekt hervorzuheben.
- Verwenden Sie App-Funktionen in Deepnote, um eine interaktive Webapp zu erstellen.
- Posten Sie weiterhin Ihr altes Projekt oder veröffentlichen Sie Notizbücher von GitHub erneut.
DAGsHub
DAGsHub ist neu auf dieser Welt und macht sich schnell einen Namen, indem es eine Komplettlösung für Praktiker des maschinellen Lernens und Dateningenieure bietet. DAGsHub kommt mit einem DVC Server, MLflow, Visualisierungspipeline und GitHub-Synchronisierung. Wir werden nicht tief in die Funktionen eingehen, sondern uns auf die Funktionen konzentrieren, die es auszeichnen.
Mit DAGsHub können Sie Ihr GitHub-Repository teilen und Ihr Data-Science-Projekt mit der Möglichkeit erstellen, maschinelles Lernen und Datenpipelines zu visualisieren. Es hat auch eine versteckte Funktion README.ipynb als Projektbeschreibungsdatei, die sich am besten für Anfänger eignet, die nicht an Markdown gewöhnt sind, und Datenwissenschaftler, die gerne an Jupyter Notebook arbeiten. Es ähnelt GitHub, was bedeutet, dass Sie sowohl Git als auch DVC lernen müssen, um diese Plattform richtig zu verwenden.
Was ich anderen Benutzern gefallen habe, ist die Möglichkeit, ihre Projektstruktur über die Pipeline zu visualisieren, sowie die Möglichkeit, ihre Daten und Modelle als integralen Bestandteil des Projekts zu sehen. Auch die Tatsache, dass wir auf Open-Source-Tools setzen, anstatt bestehende Lösungen neu zu erfinden, gefällt den Leuten. — Dekan
Bild von Dean | dagshub
Mein Profil ist noch recht neu, aber ich liebe diese Plattform, da sie mir ein komplettes Ökosystem für maschinelles Lernen bietet. Ich denke, ich bevorzuge es in Bezug auf die Funktionen und die Einfachheit der Benutzeroberfläche mehr als GitHub.
Bild nach Autor | DAGsHub
Tipps zum Erstellen eines soliden Profils:
- Lernen Sie DVC, Git und MLflow voll auszunutzen.
- Fügen Sie Ihrem Notizbuch und der README-Datei eine Projektbeschreibung hinzu.
- Aktualisieren Sie Ihr Profil, indem Sie Bio, Avatar und Kontaktinformationen hinzufügen.
- Versuchen Sie hinzuzufügen dvc.yaml und DVC-Sperre in Ihrem Projekt, um Datenpipelines anzuzeigen. Weitere Informationen finden Sie unter Definieren der Pipeline.
- Behalten Sie ein aktives Profil, indem Sie zu Open-Source-Projekten beitragen und Ihr persönliches Projekt vorantreiben. Sie können verwenden fds cli, um Ihnen das Leben zu erleichtern und Fehler zu vermeiden.
- Nutzt DVC voll aus, indem Sie Ihre Daten und Ihr Modell auf einen Remote-Server hochladen. Recruiter sind an Kandidaten interessiert, die den kompletten Data-Science-Zyklus von der Datenaufnahme bis hin zu Dashboards kennen.
Kaggle
Wenn Sie in der Welt der Data Science schneller auffallen wollen, sollten Sie ein Kaggle und beginnen Sie, an Wettbewerben, Datensätzen, Notizbüchern und Diskussionen teilzunehmen. Wenn Sie Großmeister werden, respektieren Sie die Leute und bieten Ihnen bessere Karrierechancen. Wenn Sie mich fragen, empfehle ich Ihnen, ein Kaggle-Profil zu erstellen, während Sie die Grundlagen erlernen. Lernen Sie von Experten und entdecken Sie Ihre Nische. Ich bin ein großer Fan dieser Plattform, da sie Anfängern dabei hilft, im Wettbewerb zu bestehen und innovative Lösungen für verschiedene Branchen zu entwickeln. Es ist das Rückgrat der KI-Forschung.
Bild nach Autor | Kaggle
Sie können mein Profil unten überprüfen, da ich von Anfang an in verschiedenen Kategorien mitgewirkt habe, um Ränge zu gewinnen. Derzeit bin ich ein Experte, aber mit einer Gold- und Silbermedaille im Wettbewerb werde ich ein Meister, was nicht einfach ist, und ehrlich gesagt respektiere ich Großmeister, da sie bewiesen haben, dass sie unter anderen Datenpraktikern die Besten sind.
Bild nach Autor | Kaggle
Tipps zum Erstellen eines soliden Profils:
- Seien Sie auf der Plattform aktiv, indem Sie neue Datensätze nutzen und Datenanalyse- oder Machine-Learning-Modelle erstellen.
- Beteiligen Sie sich an Diskussionen, lernen Sie von Experten und bitten Sie um Hilfe.
- Verwenden Sie Web-Scraping, um ein neues Dataset zu veröffentlichen.
- Nehmen Sie an den meisten Wettbewerben teil, um verschiedene Arten von Problemen des maschinellen Lernens zu erlernen und Abzeichen zu verdienen.
- Konzentrieren Sie sich darauf, Ihre besten Arbeiten mit detaillierten Beschreibungen und hochwertigem Code zu veröffentlichen.
- Schreiben Sie über sich in der Bio und fügen Sie Kontaktdaten hinzu.
Blog
Das Schreiben von Blogs ist der nächste Schritt, nachdem Sie Ihr Projekt auf den oben genannten Plattformen erstellt haben. Wenn Sie Ihr Publikum erweitern möchten, empfehle ich Ihnen dringend, mit zu beginnen Medium. Einen Blog zu schreiben ist nicht notwendig, aber Sie erhalten mehr Traktion aus verschiedenen Bereichen. Auf der Medium-Plattform können Sie Ihr Profil erstellen und Ihre Artikel unter verschiedenen Publikationen veröffentlichen, wie z Auf dem Weg zu Data Science und Auf dem Weg zur KI. Sie können Ihre Blogging-Site entwickeln oder eine andere ähnliche Plattform wie z Analytics-Vidhya.
Bild nach Autor | Medium
Tipps zum Erstellen eines soliden Profils:
- Schreiben Sie Blogs über das Projekt, an dem Sie persönlich mitgearbeitet haben.
- Erstellen Sie Blogs zu einer neuen Technologie oder zu neuen Data-Science-Anwendungen.
- Recherchieren Sie beim Schreiben von Blogs und fügen Sie Zitate hinzu, um Verstöße gegen die Plattformregeln zu vermeiden.
- Verwenden Sie für jeden Blog attraktive Titelbilder.
- Schreiben Sie immer darüber, was Sie aus Ihrer Erfahrung bei der Entwicklung von Data Science-Projekten lernen.
- Folgen Sie nicht dem Trend und konzentrieren Sie sich auf die Dinge, in denen Sie gut sind.
Portfolio-Website
Sie können Ihr Projekt auch auf einer persönlichen Website anzeigen, und wenn Sie kein Webentwickler sind, stehen einige einfache Tools zur Verfügung, die den Prozess ganz einfach machen. Sie können auschecken So erstellen Sie eine Data-Science-Portfolio-Website mit Hugo- und GitHub-Seiten und Hugo für verschiedene Vorlagen.
Meine Portfolio-Website enthält ein Projekt aus allen Plattformen mit kurzen Beschreibungen und Unterkategorien. Ich habe drei Tage gebraucht, um die gesamte Website zu erstellen und auf GitHub-Seiten bereitzustellen.
Bild nach Autor | Portfolio
Tipps zum Erstellen einer soliden Portfolio-Website:
- Fügen Sie Ihre Fähigkeiten, Ihre Biografie und Ihren Lebenslauf hinzu.
- Zeigen Sie Ihre Erfahrung und a
- Präsentieren Sie Ihre Projekte mit Links zu Ihren GitHub- oder Deepnote-Projekten.
- Gestalten Sie Ihre Website minimal und interaktiv, damit der Personalvermittler problemlos durch Ihr gesamtes Portfolio scrollen kann.
- Halten Sie Ihre Portfolio-Website mit dem neuesten Projekt, an dem Sie arbeiten, auf dem neuesten Stand.
Gewicht & Neigungen
Ich benutze normalerweise Gewicht & Neigungen für Machine-Learning-Experimente und Protokollierung der Leistungsmetriken meiner Modelle, aber das hat sich mit der Einführung des W&B-Profils geändert. Sie können einen Blog über Ihr aktuelles Projekt schreiben, indem Sie eingebettete Links und die Integration von Grafiken verwenden. Es ist anderen Portfolio-Plattformen, die ich erwähnt habe, ziemlich ähnlich, bietet jedoch den Vorteil der direkten Integration mit Python-Bibliotheken.
Das Ayush Profil hat mich am meisten beeindruckt, da er für andere Organisationen mitgewirkt hat und Blogs über maschinelles Lernen geschrieben hat.
Bild von Ayush | Gewichte & Neigungen
Das W&B-Projekt verfügt über Modellleistungsmetriken, wie unten gezeigt.
Bild nach Autor | kaggle-seti
Tipps zum Erstellen eines soliden Profils:
- Schließen Sie sich anderen Data-Science-Organisationen an und nehmen Sie an Gruppenprojekten teil.
- Verwenden Sie die W&B API, um die Ergebnisse Ihres Machine Learning-Projekts anzuzeigen.
- Schreiben Sie einen Blog mit der Integration von W&B-Metriken.
- Fügen Sie eine Biografie, ein Profilbild und Kontaktinformationen hinzu.
- Versuchen Sie, sich in der Community zu diskutieren und suchen Sie immer nach einem neuen interessanten Projekt.
Zusammenfassung
W&B ist ein Wildcard, da es für das Protokollieren von Experimenten und nicht für Portfolios bekannt ist, aber die Einführung interaktiver Blogs hat uns den einzigartigen Vorteil verschafft, Ihr Projekt anzuzeigen und ein starkes Portfolio zu erstellen.
Wenn Sie ein Anfänger sind, empfehle ich Ihnen, mit Deepnote zu beginnen, da es für Teams kostenlos ist und Ihren anfängerfreundlichen Tools für den Einstieg bietet. Wenn Sie von der Data Science-Community wahrgenommen werden möchten, erstellen Sie Ihr Profil auf GitHub und Kaggle. Wenn Sie Ihre Marke erstellen möchten, beginnen Sie mit Blogging-Sites oder erstellen Sie Ihre Website.
Am Ende möchte ich, dass Sie alle Ihr Profil auf allen oben genannten Plattformen erstellen, da sie alle einzigartige Vorteile bieten, um Ihren potenziellen Arbeitgeber zu beeindrucken. Ich weiß, dass es am Anfang ziemlich überwältigend ist, aber wenn Sie sich erst einmal daran gewöhnt haben, Ihre Projekte zu dokumentieren und zu präsentieren, wird es einfach.
Bio: Abid Ali Awan (@1abidaliawan) ist ein zertifizierter Datenwissenschaftler, der es liebt, Modelle für maschinelles Lernen zu entwickeln und die neuesten KI-Technologien zu erforschen. Derzeit werden KI-Produkte bei PEC-PITC getestet, ihre Arbeit wird später für Humanstudien wie den Brustkrebs-Klassifikator genehmigt.
Related:
Quelle: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- Konto
- aktiv
- Vorteil
- AI
- ai Forschung
- Alle
- unter
- Analyse
- Bienen
- App
- Anwendungen
- Apps
- Artikel
- Artikel
- Publikum
- Benutzerbild
- Abzeichen
- Grundlagen
- BESTE
- Blog
- Bloggen
- Blogs
- Brustkrebs
- Fehler
- bauen
- Building
- Krebs
- Karriere
- Cloud
- Code
- Programmierung
- kollaborative
- community
- Wettbewerb
- Ligen
- beigetragen
- Erstellen
- Neugier
- Strom
- technische Daten
- Datenanalyse
- Datenwissenschaft
- Datenwissenschaftler
- tiefe Lernen
- entwickeln
- Entwickler:in / Unternehmen
- Entwickler
- DID
- Ökosystem
- Bildungswesen
- Arbeitgeber
- Entwicklung
- Ingenieure
- Excel
- Erweitern Sie die Funktionalität der
- ERFAHRUNGEN
- Experiment
- Experten
- Gesicht
- Merkmal
- Eigenschaften
- Felder
- Vorname
- Setzen Sie mit Achtsamkeit
- folgen
- Frei
- voller
- Allgemeines
- Git
- GitHub
- Global
- Gold
- gut
- Gruppe an
- Guide
- Verleih
- Ultraschall
- Hilfe
- HTTPS
- riesig
- Branchen
- Information
- innovativ
- Integral
- Integration
- interaktive
- Interview
- IT
- Job
- Jupyter Notizbuch
- neueste
- LERNEN
- lernen
- Lang
- ich liebe
- Maschinelles Lernen
- Making
- Karte
- Medien
- mittlere
- Metrik
- Modell
- Am beliebtesten
- Neue Plattform
- Laptops
- bieten
- Online
- XNUMXh geöffnet
- Entwicklungsmöglichkeiten
- Organisationen
- Andere
- Personen
- Leistung
- ein Bild
- Plattform
- Plattformen
- Beliebt
- Mappe
- Produkt
- Produkte
- Profil
- Projekt
- Projekte
- Öffentlichkeit
- Publikationen
- veröffentlichen
- Publishing
- Python
- realen Welt
- Forschungsprojekte
- Die Ergebnisse
- Ohne eine erfahrene Medienplanung zur Festlegung von Regeln und Strategien beschleunigt der programmatische Medieneinkauf einfach die Rate der verschwenderischen Ausgaben.
- Wissenschaft
- Wissenschaftler
- kratzen
- Suche
- Teilen
- Short
- Silbermedaille
- Einfacher
- Seiten
- Fähigkeiten
- So
- Social Media
- Social Media
- Social-Media-Plattformen
- Lösungen
- Anfang
- begonnen
- Statistiken
- Geschichten
- Support
- Technologies
- Technologie
- Testen
- Die Grundlagen
- die Welt
- Zeit
- Tipps
- Top
- Lernprogramm
- ui
- us
- Nutzer
- Netz
- Bahnkratzen
- Webseite
- WHO
- Arbeiten
- Arbeitsablauf.
- weltweit wie ausgehandelt und gekauft ausgeführt wird.
- Schreiben
- X
- Youtube