14 Essentiële Git-opdrachten voor gegevenswetenschappers

14 Essentiële Git-opdrachten voor gegevenswetenschappers

Bronknooppunt: 2562575

14 Essentiële Git-opdrachten voor gegevenswetenschappers
Foto door RealToughCandy.com
 

Historisch gezien zijn de meeste datawetenschappers zich niet bewust van softwareontwikkelingspraktijken en -tools zoals versiecontrolesystemen. Maar dit is aan het veranderen, datawetenschapsprojecten nemen de beste praktijken uit software-engineering over en Git is een essentieel hulpmiddel geworden voor het versiebeheer van bestanden en gegevens. Moderne datateams gebruiken het om samen te werken aan codebase-projecten en conflicten sneller op te lossen. 

In dit bericht leren we over 14 essentiële Git-commando's die je zullen helpen bij het initialiseren van een project, het maken en samenvoegen van branches, het versiebeheer van de bestanden, het synchroniseren met een externe server en het monitoren van de wijzigingen. 

Opmerking: zorg ervoor dat je Git correct hebt geïnstalleerd vanaf de officiële site.

Je kunt het Git-versiecontrolesysteem in de huidige map initialiseren door het volgende te typen:

Of je kunt Git in een specifieke map initialiseren. 

git init 

initialiseer Git in een specifieke map
 

De klonen opdracht kopieert alle projectbestanden van een externe server naar de lokale machine. Het zal ook een externe naam toevoegen als `origin` om bestanden te synchroniseren met de externe server.

Git-kloon vereist een HTTPS-link en voor een veilige verbinding een SSH-link.

git-kloon 

U kunt verbinding maken met een enkele of meerdere externe servers door de naam van de externe server en het HTTPS/SSH-adres toe te voegen. 

git remote voeg   toe

Opmerking: Het klonen van een repository vanaf GitHub of een externe server voegt automatisch remote toe als `origin`.

Vertakkingen zijn de beste manier om aan een nieuwe functie te werken of fouten in de code op te sporen. Hiermee kunt u geïsoleerd werken zonder de hoofdtak te verstoren. 

Maak een nieuwe vertakking met behulp van de uitchecken commando met de `-b` tag en vertakkingsnaam. 

git checkout -b 

Of gebruik schakelaar met `-c` tag en vertakkingsnaam

git switch -c 

Of gewoon gebruiken tak commando 

git branch 

Maak een Git-branch
 

Om een ​​tak van de huidige naar een andere tak te wisselen, kunt u de uitchecken or schakelaar commando gevolgd door vertakkingsnaam. 

git checkout  git switch 

Om wijzigingen te synchroniseren met een externe server, moeten we eerst wijzigingen van de externe naar de lokale opslagplaats halen met behulp van de trek commando. Dit is vereist wanneer er wijzigingen worden aangebracht in een externe repository.  

U kunt een externe naam toevoegen, gevolgd door een vertakkingsnaam om één vertakking op te halen. 

git pull   

Standaard haalt het pull-commando de wijzigingen op en voegt deze samen met de huidige branch. Om te rebasen, in plaats van samen te voegen, kunt u de vlag `–rebase` vóór de externe naam en vertakking toevoegen. 

git pull --rebase oorsprong master

Te gebruiken toevoegen opdracht om bestanden toe te voegen aan het verzamelgebied. Het vereist de bestandsnaam of een lijst met bestandsnamen.

git add 

Je kunt ook alle bestanden toevoegen met de vlag `.` of `-A`. 

Nadat u bestanden aan het verzamelgebied hebt toegevoegd, kunt u een versie maken met behulp van de plegen opdracht.

Het commit commando vereist de titel van de commit door gebruik te maken van de `-m` vlag. Als je meerdere wijzigingen hebt aangebracht en ze allemaal wilt weergeven, voeg ze dan toe aan de beschrijving door een andere `-m` vlag te gebruiken.

git commit -m "Titel" -m "Beschrijving"

Git vastleggen

Opmerking: Zorg ervoor dat u uw gebruikersnaam en email voordat u wijzigingen doorvoert.

git config --global user.name  git config --global user.email 

Om lokale wijzigingen te synchroniseren met externe servers met behulp van de duwen commando. Je kunt eenvoudigweg `git push` typen om de wijzigingen naar de externe repository te pushen.  

Gebruik de onderstaande opdracht om wijzigingen naar een specifieke externe server en branche te pushen. 

git push  

Git terugkeren maakt de wijzigingen aan een specifieke commit ongedaan en voegt deze toe als een nieuwe commit, waarbij de log intact blijft. Om terug te keren, moet je een hash van een specifieke commit opgeven. 

git retourneert 

U kunt wijzigingen ook ongedaan maken met behulp van de opnieuw in te stellen commando. Het reset de wijzigingen terug naar een specifieke commit, waarbij alle commits die daarna zijn gemaakt worden verwijderd. 

git reset 

Opmerking: Het gebruik van het reset-commando wordt afgeraden omdat het je git-loggeschiedenis wijzigt.

De samensmelten commando zal eenvoudigweg de wijzigingen van de specifieke branch samenvoegen met de huidige branch. Voor de opdracht is een vertakkingsnaam vereist. 

git merge 

Dit commando is erg handig als u met meerdere vertakkingen werkt en wijzigingen in de hoofdvertakking wilt samenvoegen. 

Om de volledige geschiedenis van eerdere commits te controleren, kun je de inloggen opdracht.

Om de meest recente logs te tonen, kun je `-` toevoegen, gevolgd door het nummer, en het zal je een beperkt aantal recente commitgeschiedenis tonen.

Beperk logs bijvoorbeeld tot 5:

gitlog -5

Je kunt ook de commits van specifieke auteurs controleren.

git log --author=””

Opmerking: git log heeft meerdere vlaggen om specifieke typen commits uit te filteren. Bekijk volledig documentatie

 

Git-logboek
 

De diff commando zal de vergelijking weergeven tussen niet-vastgelegde wijzigingen met de huidige commit. 

Gebruik voor het vergelijken van twee verschillende commits:

git diff  

En gebruik voor het vergelijken van twee takken:

git diff  

Het bevel toestand toont de huidige status van de werkmap. Het bevat informatie over de wijzigingen die moeten worden vastgelegd, niet-samengevoegde paden, wijzigingen die niet zijn geënsceneerd voor vastlegging en de lijst met niet-bijgehouden bestanden. 

git status

Opmerking: uitchecken Github en Git-tutorial voor beginners voor meer informatie over versiebeheersystemen in data science. 

 
 
Abid Ali Awan (@1abidaliawan) is een gecertificeerde datawetenschapper-professional die dol is op het bouwen van machine learning-modellen. Momenteel richt hij zich op het creëren van content en het schrijven van technische blogs over machine learning en data science-technologieën. Abid heeft een Master in Technologie Management en een Bachelor in Telecommunicatie Engineering. Zijn visie is om een ​​AI-product te bouwen met behulp van een grafisch neuraal netwerk voor studenten die worstelen met een psychische aandoening.
 

Tijdstempel:

Meer van KDnuggets