14 grundlegende Git-Befehle für Data Scientists

14 grundlegende Git-Befehle für Data Scientists

Quellknoten: 2562575

14 grundlegende Git-Befehle für Data Scientists
Photo by RealToughCandy.com
 

Historisch gesehen sind sich die meisten Datenwissenschaftler nicht über Softwareentwicklungspraktiken und -tools wie Versionskontrollsysteme im Klaren. Aber das ändert sich gerade, Data-Science-Projekte übernehmen Best Practices aus der Softwareentwicklung und Git ist zu einem unverzichtbaren Werkzeug für die Datei- und Datenversionierung geworden. Moderne Datenteams nutzen es, um an Codebasisprojekten zusammenzuarbeiten und Konflikte schneller zu lösen. 

In diesem Beitrag lernen wir 14 wichtige Git-Befehle kennen, die Ihnen dabei helfen, ein Projekt zu initialisieren, Zweige zu erstellen und zusammenzuführen, die Dateien zu versionieren, sie mit einem Remote-Server zu synchronisieren und die Änderungen zu überwachen. 

Hinweis: Stellen Sie sicher, dass Sie Git ordnungsgemäß installiert haben offizielle Seite.

Sie können das Git-Versionskontrollsystem im aktuellen Verzeichnis initialisieren, indem Sie Folgendes eingeben:

Oder Sie können Git in einem bestimmten Verzeichnis initialisieren. 

git init

Git in einem bestimmten Verzeichnis initialisieren
 

Das klonen Der Befehl kopiert alle Projektdateien von einem Remote-Server auf den lokalen Computer. Außerdem wird ein Remote-Name als „Ursprung“ hinzugefügt, um Dateien mit dem Remote-Server zu synchronisieren.

Der Git-Klon erfordert einen HTTPS-Link und für eine sichere Verbindung einen SSH-Link.

Git-Klon

Sie können eine Verbindung zu einem oder mehreren Remote-Servern herstellen, indem Sie den Namen des Remote-Servers und die HTTPS/SSH-Adresse hinzufügen. 

Git Remote hinzufügen

Hinweis: Beim Klonen eines Repositorys von GitHub oder einem anderen Remote-Server wird Remote automatisch als „Origin“ hinzugefügt.

Zweige sind die beste Möglichkeit, an einer neuen Funktion zu arbeiten oder den Code zu debuggen. Es ermöglicht Ihnen, isoliert zu arbeiten, ohne den „Hauptzweig“ zu stören. 

Erstellen Sie einen neuen Zweig mit Kasse Befehl mit dem Tag „-b“ und dem Zweignamen. 

git checkout -b

Oder benutzen wechseln mit „-c“-Tag und Filialnamen

Git-Schalter -c

Oder einfach verwenden Filiale Befehl 

Git-Zweig

Erstellen Sie einen Git-Zweig
 

Um einen Zweig vom aktuellen zum anderen Zweig zu wechseln, können Sie den verwenden Kasse or wechseln Befehl gefolgt vom Filialnamen. 

git-Kasse Git-Schalter

Um Änderungen mit einem Remote-Server zu synchronisieren, müssen wir zunächst mithilfe von die Änderungen vom Remote-Server in das lokale Repository abrufen ziehen Befehl. Dies ist erforderlich, wenn Änderungen in einem Remote-Repository vorgenommen werden.  

Sie können einen Remote-Namen gefolgt von einem Zweignamen hinzufügen, um einen einzelnen Zweig abzurufen. 

Git Pull 

Standardmäßig ruft der Pull-Befehl die Änderungen ab und führt sie mit dem aktuellen Zweig zusammen. Um einen Rebase durchzuführen, können Sie anstelle einer Zusammenführung das Flag „–rebase“ vor dem Remote-Namen und dem Remote-Zweig hinzufügen. 

git pull --rebase origin master

Verwenden Sie die hinzufügen Befehl zum Hinzufügen von Dateien zum Staging-Bereich. Es erfordert den Dateinamen oder eine Liste von Dateinamen.

Git hinzufügen

Sie können alle Dateien auch mit dem Flag „.“ oder „-A“ hinzufügen. 

Nachdem Sie Dateien zum Staging-Bereich hinzugefügt haben, können Sie mithilfe von eine Version erstellen verpflichten Befehl.

Der Commit-Befehl erfordert den Titel des Commits unter Verwendung des Flags „-m“. Wenn Sie mehrere Änderungen vorgenommen haben und diese alle auflisten möchten, fügen Sie sie der Beschreibung hinzu, indem Sie ein weiteres Flag „-m“ verwenden.

git commit -m „Titel“ -m „Beschreibung“

Git-Commit

Hinweis: Stellen Sie sicher, dass Sie Ihre konfiguriert haben Benutzername und E-Mail bevor Sie Änderungen vornehmen.

git config --global user.name git config --global user.email

Um lokale Änderungen mit Remote-Servern zu synchronisieren, verwenden Sie die drücken Befehl. Sie können einfach „git push“ eingeben, um die Änderungen in das Remote-Repository zu übertragen.  

Um Änderungen an einen bestimmten Remote-Server und Zweig zu übertragen, verwenden Sie den folgenden Befehl. 

Git Push

Git zurückkehren macht die Änderungen an einem bestimmten Commit rückgängig und fügt es als neues Commit hinzu, wobei das Protokoll intakt bleibt. Zum Zurücksetzen müssen Sie einen Hash eines bestimmten Commits bereitstellen. 

Git zurücksetzen

Sie können Änderungen auch rückgängig machen, indem Sie die verwenden zurückstellen Befehl. Es setzt die Änderungen auf einen bestimmten Commit zurück und verwirft alle danach vorgenommenen Commits. 

Git zurückgesetzt

Hinweis: Von der Verwendung des Befehls „reset“ wird abgeraten, da dadurch der Verlauf Ihres Git-Protokolls geändert wird.

Das fusionieren Der Befehl führt einfach die Änderungen des jeweiligen Zweigs in den aktuellen Zweig ein. Der Befehl erfordert einen Zweignamen. 

Git Merge

Dieser Befehl ist sehr praktisch, wenn Sie mit mehreren Zweigen arbeiten und Änderungen am Hauptzweig zusammenführen möchten. 

Um den vollständigen Verlauf früherer Commits zu überprüfen, können Sie die verwenden Log Befehl.

Um die neuesten Protokolle anzuzeigen, können Sie „-“ gefolgt von der Nummer hinzufügen. Dadurch wird Ihnen eine begrenzte Anzahl des aktuellen Commit-Verlaufs angezeigt.

Beschränken Sie beispielsweise die Anzahl der Protokolle auf 5:

git-Protokoll -5

Sie können auch die von bestimmten Autoren vorgenommenen Commits überprüfen.

git log --author=“ ”

Hinweis: Git Log verfügt über mehrere Flags, um bestimmte Arten von Commits herauszufiltern. Vollständig ansehen Dokumentation

 

Git-Protokoll
 

Verwendung der diff Der Befehl zeigt den Vergleich zwischen nicht festgeschriebenen Änderungen und dem aktuellen Festschreiben an. 

Um zwei verschiedene Commits zu vergleichen, verwenden Sie:

git diff

Und um zwei Zweige zu vergleichen, verwenden Sie:

git diff

Der Befehl Status Zeigt den aktuellen Status des Arbeitsverzeichnisses an. Es enthält Informationen zu festzuschreibenden Änderungen, nicht zusammengeführten Pfaden, nicht für die Festschreibung bereitgestellten Änderungen und die Liste der nicht verfolgten Dateien. 

Git Status

Hinweis: überprüfen Github- und Git-Tutorial für Anfänger um mehr über Versionskontrollsysteme in der Datenwissenschaft zu erfahren. 

 
 
Abid Ali Awan (@1abidaliawan) ist ein zertifizierter Datenwissenschaftler, der es liebt, Modelle für maschinelles Lernen zu erstellen. Derzeit konzentriert er sich auf die Erstellung von Inhalten und schreibt technische Blogs zu maschinellem Lernen und Data-Science-Technologien. Abid hat einen Master-Abschluss in Technologiemanagement und einen Bachelor-Abschluss in Telekommunikationstechnik. Seine Vision ist es, ein KI-Produkt mit einem grafisch-neuronalen Netzwerk für Schüler zu entwickeln, die mit psychischen Erkrankungen zu kämpfen haben.
 

Zeitstempel:

Mehr von KDnuggets