Esercitarsi con SQL senza il proprio database
SQL è un'abilità molto importante per analisti di dati e data scientist. Tuttavia, quando stai appena iniziando a imparare sul campo, come puoi esercitarti a eseguire query con SQL se non disponi di dati archiviati in un database?
By Hui XiangChua, Scienziato dei dati.
Molte organizzazioni dispongono di dati archiviati in database e SQL è un linguaggio di query comunemente utilizzato per estrarre i dati da questi database. In effetti, molte grandi organizzazioni come Facebook e Amazon hanno incluso SQL come componente dei loro test di abilità tecnica. Questo perché essere in grado di mettere insieme i dati rilevanti è importante prima di eseguire qualsiasi analisi dei dati necessaria.
Una sfida per la pratica di SQL è che abbiamo bisogno di database per cominciare, che è qualcosa che spesso non abbiamo. Tuttavia, dati.mondo ci permette di fare esattamente questo senza avere il nostro database. Possiamo eseguire direttamente query SQL su set di dati pubblicamente disponibili su data.world. La creazione di un account su data.world è gratuita e non è necessario sostenere alcun costo per l'esecuzione di query SQL!
Per chi non lo conoscesse, data.world è una piattaforma che offre molti dati aperti relativi a molti domini e settori diversi (puoi anche caricare i tuoi set di dati). La loro missione è:
- Costruire la risorsa di dati più significativa, collaborativa e abbondante al mondo al fine di massimizzare l'utilità di risoluzione dei problemi sociali dei dati;
- Sostenere pubblicamente il miglioramento dell'adozione, dell'usabilità e della proliferazione di dati aperti e dati collegati;
- Fungere da archivio storico accessibile dei dati mondiali.
Qui, delineo un esempio usando a dataset sulle tendenze Covid-19 di Singapore. La funzione di query a volte è nascosta sotto l'elenco a discesa del pulsante con i tre puntini oppure potrebbe apparire nell'angolo in alto a destra del set di dati rappresentato con un >_ simbolo.
L'SQL seguente calcola la media mobile di 7 giorni del numero di casi confermati, con l'output ordinato in ordine di data decrescente. È possibile trovare un collegamento alla query qui.
D'altra parte, l'SQL seguente calcola l'aumento percentuale giorno per giorno nel numero cumulativo di individui che hanno completato la vaccinazione, con l'output ordinato in ordine di data decrescente. Ciò richiede un self-join, cioè unire una tabella con se stessa. Ho utilizzato la funzione DATE_SUB come parte del self-join per ottenere i dati del giorno precedente rispetto al giorno corrente. Cliccando sul testo DATE_SUB si ottengono anche maggiori informazioni sulla funzione e sui parametri necessari. È possibile trovare un collegamento alla query qui.
C'è anche un Tutorial SQL su data.world che copre concetti SQL di base, intermedi e avanzati. Quindi è una buona piattaforma open source per imparare e praticare SQL.
In una nota a parte, se sei in una posizione di assunzione ed esplori alternative a come possono essere condotti i test SQL, questa potrebbe anche essere una buona piattaforma da considerare.
Correlato:
Le migliori storie degli ultimi 30 giorni | |||
---|---|---|---|
|
Fonte: https://www.kdnuggets.com/2021/08/sql-without-own-database.html
- "
- &
- Il mio account
- Adozione
- Amazon
- .
- analitica
- casi
- Challenge
- componente
- Costi
- COVID-19
- Corrente
- dati
- analisi dei dati
- scienza dei dati
- Banca Dati
- banche dati
- giorno
- apprendimento profondo
- Direttore
- domini
- ingegnere
- Ingegneri
- esperienza
- estrarre i dati
- caratteristica
- Gratis
- function
- buono
- GPU
- Affitto
- Come
- Tutorial
- HTTPS
- Aumento
- industrie
- informazioni
- IT
- Lingua
- grandi
- IMPARARE
- apprendimento
- LINK
- Missione
- ML
- Offerte
- online
- aprire
- open source
- minimo
- Organizzazioni
- Altro
- piattaforma
- risorsa
- problemi
- Scienze
- scienziati
- SQL
- iniziato
- Storie
- Consulenza
- test
- top
- tendenze
- us
- usabilità
- utilità
- mondo
- X