Thực hành SQL mà không có cơ sở dữ liệu của riêng bạn
SQL là một kỹ năng rất quan trọng đối với các nhà phân tích dữ liệu và nhà khoa học dữ liệu. Tuy nhiên, khi bạn mới bắt đầu học trong lĩnh vực này, làm thế nào bạn có thể thực hành truy vấn bằng SQL nếu bạn không có bất kỳ dữ liệu nào được lưu trữ trong cơ sở dữ liệu?
By Hui XiangChua, Nhà khoa học dữ liệu.
Nhiều tổ chức có dữ liệu được lưu trữ trong cơ sở dữ liệu và SQL là ngôn ngữ truy vấn thường được sử dụng để trích xuất dữ liệu từ các cơ sở dữ liệu này. Trên thực tế, nhiều tổ chức lớn như Facebook và Amazon đã đưa SQL vào như một thành phần trong các bài kiểm tra kỹ năng kỹ thuật của họ. Điều này là do việc có thể tổng hợp các dữ liệu liên quan là rất quan trọng trước khi thực hiện bất kỳ phân tích dữ liệu cần thiết nào.
Một thách thức đối với việc thực hành SQL là chúng ta cần cơ sở dữ liệu để bắt đầu, đây là thứ mà chúng ta thường không có. Tuy nhiên, data.wworld cho phép chúng tôi thực hiện chính xác điều đó mà không cần có cơ sở dữ liệu của riêng mình. Chúng tôi có thể trực tiếp thực hiện các truy vấn SQL trên các bộ dữ liệu có sẵn công khai trên data.world. Tạo một tài khoản trên data.world là miễn phí và bạn không cần phải chịu bất kỳ chi phí nào khi thực hiện các truy vấn SQL!
Đối với những người chưa quen thuộc, data.world là một nền tảng cung cấp nhiều dữ liệu mở liên quan đến nhiều lĩnh vực và ngành khác nhau (bạn cũng có thể tải lên bộ dữ liệu của riêng mình). Nhiệm vụ của họ là:
- Xây dựng nguồn dữ liệu phong phú, hợp tác và có ý nghĩa nhất trên thế giới để tối đa hóa tiện ích giải quyết vấn đề xã hội của dữ liệu;
- Vận động công khai để cải thiện việc áp dụng, khả năng sử dụng và phổ biến dữ liệu mở và dữ liệu được liên kết;
- Phục vụ như một kho lưu trữ lịch sử có thể truy cập của dữ liệu thế giới.
Ở đây, tôi phác thảo một ví dụ sử dụng một tập dữ liệu về xu hướng Covid-19 của Singapore. Tính năng truy vấn đôi khi bị ẩn bên dưới menu thả xuống của nút ba chấm hoặc có thể xuất hiện ở góc trên cùng bên phải của tập dữ liệu được biểu thị bằng một >_ Biểu tượng.
SQL sau tính toán mức trung bình động trong 7 ngày của số trường hợp được xác nhận, với đầu ra được sắp xếp theo thứ tự ngày giảm dần. Một liên kết đến truy vấn có thể được tìm thấy tại đây.
Mặt khác, SQL bên dưới tính toán tỷ lệ phần trăm tăng lên hàng ngày về số lượng tích lũy các cá nhân đã hoàn thành tiêm chủng, với đầu ra được sắp xếp theo thứ tự ngày giảm dần. Điều này yêu cầu tự tham gia, tức là tham gia một bảng với chính nó. Tôi đã sử dụng hàm DATE_SUB như một phần của quá trình tự tham gia để lấy dữ liệu từ ngày hôm trước so với ngày hiện tại. Nhấp vào văn bản DATE_SUB cũng trả về nhiều thông tin hơn về hàm và các tham số cần thiết. Một liên kết đến truy vấn có thể được tìm thấy tại đây.
Cũng có một hướng dẫn SQL trên data.world bao gồm các khái niệm SQL cơ bản, trung cấp và nâng cao. Do đó, nó là một nền tảng mã nguồn mở tốt để học và thực hành SQL.
Trên một lưu ý riêng, nếu bạn đang ở vị trí tuyển dụng và khám phá các lựa chọn thay thế về cách thức tiến hành các bài kiểm tra SQL, thì đây cũng có thể là một nền tảng tốt để xem xét.
Liên quan:
Câu chuyện hàng đầu trong 30 ngày qua | |||
---|---|---|---|
|
Nguồn: https://www.kdnuggets.com/2021/08/sql-without-own-database.html
- "
- &
- Tài khoản
- Nhận con nuôi
- đàn bà gan dạ
- phân tích
- phân tích
- trường hợp
- thách thức
- thành phần
- Chi phí
- Covid-19
- Current
- dữ liệu
- phân tích dữ liệu
- khoa học dữ liệu
- Cơ sở dữ liệu
- cơ sở dữ liệu
- ngày
- học kĩ càng
- Giám đốc
- lĩnh vực
- ky sư
- Kỹ sư
- kinh nghiệm
- trích xuất dữ liệu
- Đặc tính
- Miễn phí
- chức năng
- tốt
- GPU
- Thuê
- Độ đáng tin của
- Hướng dẫn
- HTTPS
- Tăng lên
- các ngành công nghiệp
- thông tin
- IT
- Ngôn ngữ
- lớn
- LEARN
- học tập
- LINK
- Sứ mệnh
- ML
- Cung cấp
- Trực tuyến
- mở
- mã nguồn mở
- gọi món
- Tổ chức
- Nền tảng khác
- nền tảng
- tài nguyên
- Trả về
- Khoa học
- các nhà khoa học
- SQL
- bắt đầu
- Những câu chuyện
- Kỹ thuật
- kiểm tra
- hàng đầu
- Xu hướng
- us
- khả năng sử dụng
- tiện ích
- thế giới
- X