Практика SQL без собственной базы данных
SQL — очень важный навык для аналитиков данных и специалистов по данным. Однако, когда вы только начинаете учиться в этой области, как вы можете практиковаться в выполнении запросов с помощью SQL, если у вас нет данных, хранящихся в базе данных?
By Хуэй СянЧуа, Ученый данных.
Многие организации хранят данные в базах данных, и SQL — это язык запросов, обычно используемый для извлечения данных из этих баз данных. На самом деле, многие крупные организации, такие как Facebook и Amazon, включили SQL в свои тесты технических навыков. Это связано с тем, что возможность собрать соответствующие данные важна перед выполнением любого необходимого анализа данных.
Одна из проблем при использовании SQL заключается в том, что для начала нам нужны базы данных, которых у нас часто нет. Однако, данные.мир позволяет нам делать именно это, не имея собственной базы данных. Мы можем выполнять SQL-запросы к общедоступным наборам данных напрямую на data.world. Создать учетную запись на data.world можно бесплатно, и вам не нужно нести никаких затрат на выполнение SQL-запросов!
Для тех, кто не знаком, data.world — это платформа, которая предлагает множество открытых данных, относящихся к разным областям и отраслям (вы также можете загружать свои собственные наборы данных). Их миссия состоит в том, чтобы:
- Создайте самый значимый, совместный и богатый ресурс данных в мире, чтобы максимально использовать данные для решения социальных проблем;
- Публично выступать за улучшение принятия, удобства использования и распространения открытых данных и связанных данных;
- Служить доступным историческим хранилищем мировых данных.
Здесь я обрисовываю пример, используя Набор данных о тенденциях Covid-19 в Сингапуре. Функция запроса иногда скрыта в раскрывающемся списке кнопки с тремя точками или может отображаться в правом верхнем углу набора данных, представленного с помощью а >_ символ.
Следующий SQL вычисляет скользящее среднее число подтвержденных случаев за 7 дней, при этом выходные данные упорядочены по дате в порядке убывания. Ссылку на запрос можно найти здесь.
С другой стороны, приведенный ниже SQL вычисляет процентное увеличение ежедневного совокупного числа лиц, завершивших вакцинацию, с выходными данными, упорядоченными по дате убывания. Для этого требуется самосоединение, т. е. соединение таблицы с самой собой. Я использовал функцию DATE_SUB как часть самообъединения, чтобы получить данные за предыдущий день по сравнению с текущим днем. Щелчок по тексту DATE_SUB также возвращает дополнительную информацию о функции и необходимых параметрах. Ссылку на запрос можно найти здесь.
Существует также Учебник по SQL на data.world, который охватывает базовые, промежуточные и продвинутые концепции SQL. Следовательно, это хорошая платформа с открытым исходным кодом для изучения и практики SQL.
Отдельно стоит отметить, что если вы нанимаете сотрудников и изучаете альтернативы проведению тестов SQL, это также может быть хорошей платформой для рассмотрения.
Связанный:
Источник: https://www.kdnuggets.com/2021/08/sql-without-own-database.html.
- "
- &
- Учетная запись
- Принятие
- Amazon
- анализ
- аналитика
- случаев
- вызов
- компонент
- Расходы
- Covid-19.
- Текущий
- данным
- анализ данных
- наука о данных
- База данных
- базы данных
- день
- глубокое обучение
- директор
- доменов
- инженер
- Инженеры
- опыт
- извлечь данные
- что его цель
- Особенность
- Бесплатно
- функция
- хорошо
- Графические процессоры
- Наем
- Как
- How To
- HTTPS
- Увеличение
- промышленности
- информация
- IT
- язык
- большой
- УЧИТЬСЯ
- изучение
- LINK
- Наша миссия
- ML
- Предложения
- онлайн
- открытый
- с открытым исходным кодом
- заказ
- Организации
- Другое
- Платформа
- ресурс
- Возвращает
- Наука
- Ученые
- SQL
- и политические лидеры
- Истории
- Технический
- тестов
- топ
- Тенденции
- us
- юзабилити
- утилита
- Мир
- X