SQL oefenen zonder eigen database
SQL is een zeer belangrijke vaardigheid voor data-analisten en datawetenschappers. Als u echter net begint met leren in het veld, hoe kunt u dan oefenen met query's met SQL als u geen gegevens in een database hebt opgeslagen?
By Hui Xiang Chua, Data scientist.
Veel organisaties hebben gegevens opgeslagen in databases, en SQL is een querytaal die vaak wordt gebruikt om de gegevens uit deze databases te extraheren. Veel grote organisaties zoals Facebook en Amazon hebben SQL zelfs opgenomen als onderdeel van hun technische vaardigheidstests. Dit komt omdat het belangrijk is om de relevante gegevens samen te brengen voordat de noodzakelijke gegevensanalyse wordt uitgevoerd.
Een uitdaging bij het beoefenen van SQL is dat we om te beginnen databases nodig hebben, iets wat we vaak niet hebben. Echter, data.wereld stelt ons in staat precies dat te doen zonder onze eigen database te hebben. We kunnen rechtstreeks SQL-query's uitvoeren op openbaar beschikbare datasets op data.world. Het aanmaken van een account op data.world is gratis en u hoeft geen kosten te maken voor het uitvoeren van SQL-query's!
Voor degenen die niet bekend zijn: data.world is een platform dat veel open data biedt met betrekking tot veel verschillende domeinen en industrieën (je kunt ook je eigen datasets uploaden). Hun missie is om:
- Bouw de meest betekenisvolle, collaboratieve en overvloedige databron ter wereld om het maatschappelijke probleemoplossende nut van data te maximaliseren;
- Publiekelijk pleiten voor het verbeteren van de adoptie, bruikbaarheid en verspreiding van open data en linked data;
- Dienen als een toegankelijke historische opslagplaats van gegevens over de hele wereld.
Hier schets ik een voorbeeld met behulp van a dataset over de Covid-19-trends in Singapore. De queryfunctie is soms verborgen onder de vervolgkeuzelijst van de knop met drie stippen, of kan verschijnen in de rechterbovenhoek van de dataset die wordt weergegeven met een >_ symbool.
De volgende SQL berekent het voortschrijdende zevendaagse gemiddelde van het aantal bevestigde gevallen, waarbij de uitvoer is gerangschikt op aflopende datumvolgorde. Er is een link naar de zoekopdracht te vinden hier.
Aan de andere kant berekent de onderstaande SQL de procentuele toename van dag tot dag in het cumulatieve aantal personen dat hun vaccinatie heeft voltooid, waarbij de uitvoer is gerangschikt in aflopende datumvolgorde. Hiervoor is een self-join vereist, dat wil zeggen: een tabel met zichzelf verbinden. Ik heb gebruik gemaakt van de functie DATE_SUB als onderdeel van de self-join om de gegevens van de vorige dag tegen de huidige dag op te halen. Als u op de tekst DATE_SUB klikt, krijgt u ook meer informatie over de functie en de benodigde parameters. Er is een link naar de zoekopdracht te vinden hier.
Er is ook een SQL-zelfstudie op data.world dat basis-, tussenliggende en geavanceerde SQL-concepten omvat. Daarom is het een goed open-sourceplatform om SQL te leren en te oefenen.
Even apart: als u een aanwervingspositie heeft en alternatieven onderzoekt voor de manier waarop SQL-tests kunnen worden uitgevoerd, kan dit ook een goed platform zijn om te overwegen.
Zie ook:
Topverhalen afgelopen 30 dagen | |||||
---|---|---|---|---|---|
|
|
Bron: https://www.kdnuggets.com/2021/08/sql-without-own-database.html
- "
- &
- Account
- Adoptie
- Amazone
- analyse
- analytics
- gevallen
- uitdagen
- bestanddeel
- Kosten
- Covid-19
- Actueel
- gegevens
- gegevensanalyse
- data science
- Database
- databanken
- dag
- diepgaand leren
- Director
- domeinen
- ingenieur
- Ingenieurs
- ervaring
- extraheer de gegevens
- Kenmerk
- Gratis
- functie
- goed
- GPU's
- Verhuring
- Hoe
- How To
- HTTPS
- Laat uw omzet
- industrieën
- informatie
- IT
- taal
- Groot
- LEARN
- leren
- LINK
- Missie
- ML
- Aanbod
- online.
- open
- open source
- bestellen
- Organisaties
- Overige
- platform
- hulpbron
- Retourneren
- Wetenschap
- wetenschappers
- SQL
- gestart
- Blog
- Technisch
- testen
- top
- Trends
- us
- bruikbaarheid
- utility
- wereld
- X