Øvelse af SQL uden din egen database
SQL er en meget vigtig færdighed for dataanalytikere og dataforskere. Men når du lige er begyndt at lære i felten, hvordan kan du så øve dig i at forespørge med SQL, hvis du ikke har nogen data gemt i en database?
By Hui XiangChua, dataforsker.
Mange organisationer har data gemt i databaser, og SQL er et forespørgselssprog, der almindeligvis bruges til at udtrække data fra disse databaser. Faktisk har mange store organisationer som Facebook og Amazon inkluderet SQL som en del af deres tekniske færdighedstests. Dette skyldes, at det er vigtigt at kunne sammensætte de relevante data, før der udføres en nødvendig dataanalyse.
En udfordring ved at praktisere SQL er, at vi har brug for databaser til at begynde med, hvilket er noget, vi ofte ikke har. Imidlertid, data.verden giver os mulighed for at gøre præcis det uden at have vores egen database. Vi kan udføre SQL-forespørgsler på offentligt tilgængelige datasæt på data.world direkte. Det er gratis at oprette en konto på data.world, og du behøver ikke at pådrage dig nogen omkostninger ved at udføre SQL-forespørgsler!
For dem, der ikke kender det, er data.world en platform, der tilbyder en masse åbne data vedrørende mange forskellige domæner og industrier (du kan også uploade dine egne datasæt). Deres mission er at:
- Byg den mest meningsfulde, samarbejdsbaserede og rigelige dataressource i verden for at maksimere datas samfundsmæssige problemløsningsnytte;
- Fortaler offentligt for at forbedre adoptionen, anvendeligheden og udbredelsen af åbne data og forbundne data;
- Tjen som et tilgængeligt historisk lager af verdens data.
Her skitserer jeg et eksempel ved hjælp af en datasæt om Singapores Covid-19-tendenser. Forespørgselsfunktionen er nogle gange skjult under rullemenuen på knappen med tre prikker, eller den vises muligvis i øverste højre hjørne af datasættet repræsenteret med en >_ symbol.
Følgende SQL beregner det glidende 7-dages gennemsnit af antallet af bekræftede tilfælde med output sorteret efter faldende datorækkefølge. Et link til forespørgslen kan findes link..
På den anden side beregner SQL'en nedenfor den procentvise stigning dag-til-dag i det kumulative antal individer, der har afsluttet deres vaccination, med output sorteret efter faldende datorækkefølge. Dette kræver en selvforbindelse, dvs. sammenføjning af et bord med sig selv. Jeg har brugt DATE_SUB-funktionen som en del af selvtilslutningen for at få data fra den foregående dag i forhold til den aktuelle dag. Ved at klikke på teksten DATE_SUB returneres også mere information om funktionen og de nødvendige parametre. Et link til forespørgslen kan findes link..
Der er også en SQL tutorial på data.world, der dækker grundlæggende, mellemliggende og avancerede SQL-koncepter. Derfor er det en god open source platform til at lære og øve SQL.
Hvis du er i en ansættelsesstilling og udforsker alternativer til, hvordan SQL-tests kan udføres, kan dette også være en god platform at overveje.
Relateret:
Tophistorier de seneste 30 dage | |||||
---|---|---|---|---|---|
|
|
Kilde: https://www.kdnuggets.com/2021/08/sql-without-own-database.html
- "
- &
- Konto
- Vedtagelse
- Amazon
- analyse
- analytics
- tilfælde
- udfordre
- komponent
- Omkostninger
- Covid-19
- Nuværende
- data
- dataanalyse
- datalogi
- Database
- databaser
- dag
- dyb læring
- Direktør
- Domæner
- ingeniør
- Ingeniører
- erfaring
- udtrække dataene
- Feature
- Gratis
- funktion
- godt
- GPU'er
- Ansættelse
- Hvordan
- How To
- HTTPS
- Forøg
- industrier
- oplysninger
- IT
- Sprog
- stor
- LÆR
- læring
- LINK
- Mission
- ML
- Tilbud
- online
- åbent
- open source
- ordrer
- organisatorisk
- Andet
- perron
- ressource
- afkast
- Videnskab
- forskere
- SQL
- påbegyndt
- Historier
- Teknisk
- tests
- top
- Tendenser
- us
- usability
- nytte
- world
- X