独自のデータベースなしでSQLを実践する
SQL は、データ アナリストやデータ サイエンティストにとって非常に重要なスキルです。 しかし、フィールドでの学習を始めたばかりで、データベースにデータが保存されていない場合、SQL を使用したクエリをどのように練習できますか?
By フイ・シャンチュア、データサイエンティスト.
多くの組織はデータベースにデータを格納しており、SQL はこれらのデータベースからデータを抽出するために一般的に使用されるクエリ言語です。 実際、Facebook や Amazon などの大規模な組織の多くは、技術スキル テストのコンポーネントとして SQL を取り入れています。 これは、必要なデータ分析を実行する前に、関連するデータをまとめることができることが重要だからです。
SQL を実践する上での課題の XNUMX つは、最初にデータベースが必要であるということです。これは、多くの場合、私たちが持っていないものです。 しかし、 データ.ワールド 独自のデータベースを持たなくても、まさにそれを行うことができます。 data.world で公開されているデータセットに対して SQL クエリを直接実行できます。 data.world でのアカウントの作成は無料で、SQL クエリを実行するための費用は一切かかりません!
よく知らない人のために説明すると、data.world は、さまざまな分野や業界に関連する多くのオープン データを提供するプラットフォームです (独自のデータセットをアップロードすることもできます)。 彼らの使命は次のとおりです。
- データの社会的問題解決ユーティリティを最大化するために、世界で最も有意義で、協力的で、豊富なデータ リソースを構築します。
- オープンデータとリンクされたデータの採用、使いやすさ、拡散の改善を公に提唱する。
- 世界のデータのアクセス可能な履歴レポジトリとして機能します。
ここでは、 データセット シンガポールのCovid-19トレンドについて。 クエリ機能は、XNUMX つのドット ボタンのドロップダウンの下に表示されない場合や、データセットの右上隅に表示される場合があります。 >_ シンボル。
次の SQL は、確認された症例数の 7 日間の移動平均を計算し、出力を日付の降順で並べ替えます。 クエリへのリンクを見つけることができます こちら.
一方、以下の SQL は、ワクチン接種を完了した個人の累積数の日々の増加率を計算し、出力は日付の降順で並べられています。 これには、自己結合、つまりテーブルをそれ自体と結合する必要があります。 自己結合の一部として DATE_SUB 関数を使用して、現在の日に対する前日からのデータを取得しました。 テキスト DATE_SUB をクリックすると、関数と必要なパラメーターに関する詳細情報も返されます。 クエリへのリンクを見つけることができます こちら.
また、 SQLチュートリアル 基本、中級、および高度な SQL の概念をカバーする data.world で。 したがって、SQL を学習して実践するための優れたオープンソース プラットフォームです。
別の注意として、雇用の立場にあり、SQL テストを実施する方法の代替案を検討している場合、これも検討するのに適したプラットフォームになる可能性があります。
関連する
過去30日間の人気記事 | |||||
---|---|---|---|---|---|
|
|
ソース: https://www.kdnuggets.com/2021/08/sql-without-own-database.html