SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan - KDnuggets

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan – KDnuggets

Node Sumber: 2805506

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
Gambar oleh Penulis
 

Data science is an interdisciplinary field that relies heavily on extracting insights and making informed decisions from vast amounts of data. One of the fundamental tools in a data scientist’s toolbox is SQL (Structured Query Language), a programming language designed for managing and manipulating relational databases.

Pada artikel ini, saya akan fokus pada salah satu fitur paling kuat dari SQL: join.

SQL Joins memungkinkan Anda menggabungkan data dari beberapa tabel database berdasarkan kolom umum. Dengan begitu, Anda dapat menggabungkan informasi dan membuat hubungan bermakna antara kumpulan data terkait.

Ada beberapa jenis gabungan SQL:

  • Bergabung batin
  • Gabung luar kiri
  • Gabungan kanan luar
  • Gabung luar penuh
  • Bergabung silang

Mari kita jelaskan masing-masing jenisnya.

Gabungan dalam hanya mengembalikan baris yang memiliki kecocokan pada kedua tabel yang digabungkan. Ini menggabungkan baris dari dua tabel berdasarkan kunci atau kolom bersama, membuang baris yang tidak cocok.

Kami memvisualisasikannya dengan cara berikut.
 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
Gambar oleh Penulis
 

Dalam SQL, jenis join ini dilakukan dengan menggunakan kata kunci JOIN atau INNER JOIN.

Gabungan luar kiri mengembalikan semua baris dari tabel kiri (atau pertama) dan baris yang cocok dari tabel kanan (atau kedua). Jika tidak ada kecocokan, ia mengembalikan nilai NULL untuk kolom dari tabel kanan.

Kita bisa memvisualisasikannya seperti ini.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
Gambar oleh Penulis
 

Saat ingin menggunakan join ini di SQL, Anda dapat melakukannya dengan menggunakan kata kunci LEFT OUTER JOIN atau LEFT JOIN. Berikut artikel yang membahas tentang gabung kiri vs gabung kiri luar.

Gabungan kanan merupakan kebalikan dari gabung kiri. Ini mengembalikan semua baris dari tabel kanan dan baris yang cocok dari tabel kiri. Jika tidak ada kecocokan, ia mengembalikan nilai NULL untuk kolom dari tabel kiri.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
Gambar oleh Penulis
 

Dalam SQL, tipe join ini dilakukan dengan menggunakan kata kunci RIGHT OUTER JOIN atau RIGHT JOIN.

Gabungan luar penuh mengembalikan semua baris dari kedua tabel, mencocokkan baris jika memungkinkan, dan mengisi nilai NULL untuk baris yang tidak cocok.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
Gambar oleh Penulis
 

Kata kunci dalam SQL untuk join ini adalah FULL OUTER JOIN atau FULL JOIN.

Jenis join ini menggabungkan semua baris dari satu tabel dengan semua baris dari tabel kedua. Dengan kata lain, ia mengembalikan produk Cartesian, yaitu semua kemungkinan kombinasi baris kedua tabel.

Berikut visualisasinya yang akan memudahkan pemahamannya.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
Gambar oleh Penulis
 

Saat melakukan cross-join di SQL, kata kuncinya adalah CROSS JOIN.

Untuk melakukan penggabungan di SQL, Anda perlu menentukan tabel yang ingin kita gabung, kolom yang digunakan untuk pencocokan, dan jenis penggabungan yang ingin kita lakukan. Sintaks dasar untuk menggabungkan tabel dalam SQL adalah sebagai berikut:

SELECT columns
FROM table1
JOIN table2
ON table1.column = table2.column;

 

Contoh ini menunjukkan cara menggunakan GABUNG.

Anda mereferensikan tabel pertama (atau kiri) dalam klausa FROM. Kemudian Anda mengikutinya dengan GABUNG dan mereferensikan tabel kedua (atau kanan).

Kemudian muncul kondisi bergabung pada klausa ON. Di sinilah Anda menentukan kolom mana yang akan Anda gunakan untuk menggabungkan kedua tabel. Biasanya, ini adalah kolom bersama yang merupakan kunci utama di satu tabel dan kunci asing di tabel kedua.

Catatan: Kunci utama adalah pengidentifikasi unik untuk setiap catatan dalam tabel. Kunci asing membuat hubungan antara dua tabel, yaitu kolom pada tabel kedua yang mereferensikan tabel pertama. Kami akan menunjukkan kepada Anda melalui contoh apa artinya.

Jika Anda ingin menggunakan LEFT JOIN, RIGHT JOIN, atau FULL JOIN, Anda cukup menggunakan kata kunci ini, bukan JOIN – semua kode lainnya sama persis!

Hal yang sedikit berbeda dengan CROSS JOIN. Sifatnya adalah menggabungkan semua kombinasi baris dari kedua tabel. Itu sebabnya klausa ON tidak diperlukan, dan sintaksnya terlihat seperti ini.

SELECT columns
FROM table1
CROSS JOIN table2;

 

Dengan kata lain, Anda cukup mereferensikan satu tabel di FROM dan tabel kedua di CROSS JOIN.

Alternatifnya, Anda dapat mereferensikan kedua tabel di FROM dan memisahkannya dengan koma – ini adalah singkatan dari CROSS JOIN.

SELECT columns
FROM table1, table2;

Ada juga satu cara khusus untuk menggabungkan tabel – menggabungkan tabel dengan tabel itu sendiri. Ini juga disebut bergabung sendiri ke dalam tabel.

Ini bukan jenis gabungan yang berbeda, karena salah satu jenis gabungan yang disebutkan sebelumnya juga dapat digunakan untuk bergabung sendiri.

Sintaks untuk bergabung sendiri mirip dengan yang saya tunjukkan sebelumnya. Perbedaan utamanya adalah tabel yang sama direferensikan di FROM dan JOIN.

SELECT columns
FROM table1 t1
JOIN table1 t2
ON t1.column = t2.column;

 

Selain itu, Anda perlu memberi tabel dua alias untuk membedakannya. Apa yang Anda lakukan adalah menggabungkan tabel dengan tabel itu sendiri dan memperlakukannya sebagai dua tabel.

Saya hanya ingin menyebutkannya di sini, tetapi saya tidak akan menjelaskan lebih jauh. Jika Anda tertarik untuk bergabung sendiri, silakan lihat panduan bergambar ini bergabung sendiri di SQL.

Saatnya menunjukkan kepada Anda bagaimana semua yang saya sebutkan bekerja dalam praktik. saya akan menggunakan Pertanyaan wawancara SQL GABUNG dari StrataScratch untuk menampilkan setiap jenis gabungan yang berbeda dalam SQL.

1. GABUNG Contoh

Pertanyaan ini oleh Microsoft ingin Anda membuat daftar setiap proyek dan menghitung anggaran proyek berdasarkan karyawan.

Proyek Mahal

“Dengan adanya daftar proyek dan karyawan yang dipetakan ke setiap proyek, hitung berdasarkan jumlah anggaran proyek yang dialokasikan untuk setiap karyawan. Outputnya harus mencakup judul proyek dan anggaran proyek yang dibulatkan ke bilangan bulat terdekat. Urutkan daftar Anda berdasarkan proyek dengan anggaran tertinggi per karyawan terlebih dahulu.”

Data

Pertanyaannya memberikan dua tabel.

ms_projects

id: int
Judul: varchar.dll
anggaran: int

ms_emp_projects

emp_id: int
proyek_id: int

Sekarang, kolom id di tabel ms_projects adalah kunci utama tabel. Kolom yang sama dapat ditemukan di tabel ms_emp_projects, meskipun dengan nama berbeda: project_id. Ini adalah kunci asing tabel, yang merujuk pada tabel pertama.

Saya akan menggunakan dua kolom ini untuk menggabungkan tabel dalam solusi saya.

Kode

SELECT title AS project, ROUND((budget/COUNT(emp_id)::FLOAT)::NUMERIC, 0) AS budget_emp_ratio
FROM ms_projects a
JOIN ms_emp_projects b ON a.id = b.project_id
GROUP BY title, budget
ORDER BY budget_emp_ratio DESC;

 

Saya menggabungkan dua tabel menggunakan JOIN. Meja ms_projects direferensikan dalam FROM, sementara ms_emp_projects direferensikan setelah GABUNG. Saya telah memberikan alias pada kedua tabel, memungkinkan saya untuk tidak menggunakan nama panjang tabel di kemudian hari.

Sekarang, saya perlu menentukan kolom tempat saya ingin menggabungkan tabel. Saya sudah menyebutkan kolom mana yang merupakan kunci utama dalam satu tabel dan kunci asing di tabel lain, jadi saya akan menggunakannya di sini.

Saya menyamakan kedua kolom ini karena saya ingin mendapatkan semua data yang ID proyeknya sama. Saya juga menggunakan alias tabel di depan setiap kolom.

Sekarang saya memiliki akses ke data di kedua tabel, saya dapat membuat daftar kolom di SELECT. Kolom pertama adalah nama proyek, dan kolom kedua dihitung.

Perhitungan ini menggunakan fungsi COUNT() untuk menghitung jumlah karyawan pada setiap proyek. Lalu saya membagi anggaran setiap proyek dengan jumlah karyawan. Saya juga mengonversi hasilnya menjadi nilai desimal dan membulatkannya ke nol desimal.

Keluaran

Inilah yang dikembalikan oleh kueri.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan

2. Contoh GABUNG KIRI

Mari kita praktekan join ini di Pertanyaan wawancara Airbnb. Ia ingin Anda mengetahui jumlah pesanan, jumlah pelanggan, dan total biaya pesanan untuk setiap kota.

Pesanan Pelanggan dan Detailnya

“Temukan jumlah pesanan, jumlah pelanggan, dan total biaya pesanan untuk setiap kota. Hanya sertakan kota yang telah melakukan minimal 5 pesanan dan hitung semua pelanggan di setiap kota meskipun mereka tidak melakukan pemesanan.

Keluarkan setiap perhitungan beserta nama kota yang sesuai.”

Data

Anda diberi tabel pelanggan, dan perintah.

pelanggan

id: int
nama depan: varchar.dll
nama keluarga: varchar.dll
kota: varchar.dll
alamat: varchar.dll
nomor telepon: varchar.dll

perintah

id: int
ID_kustom: int
tanggal pemesanan: tanggal Waktu
Detail pesanan: varchar.dll
total_biaya_pesanan: int

Kolom yang dibagikan adalah id dari tabel pelanggan dan cust_id dari tabel perintah. Saya akan menggunakan kolom ini untuk menggabungkan tabel.

Kode

Berikut cara menyelesaikan pertanyaan ini menggunakan LEFT JOIN.

SELECT c.city, COUNT(DISTINCT o.id) AS orders_per_city, COUNT(DISTINCT c.id) AS customers_per_city, SUM(o.total_order_cost) AS orders_cost_per_city
FROM customers c
LEFT JOIN orders o ON c.id = o.cust_id
GROUP BY c.city
HAVING COUNT(o.id) >=5;

 

Saya mereferensikan tabel pelanggan di FROM (ini adalah tabel kiri kami) dan LEFT JOIN dengan perintah pada kolom ID Pelanggan.

Sekarang saya dapat memilih kota, menggunakan COUNT() untuk mendapatkan jumlah pesanan dan pelanggan berdasarkan kota, dan menggunakan SUM() untuk menghitung total biaya pesanan berdasarkan kota.

Untuk mendapatkan semua perhitungan ini berdasarkan kota, saya mengelompokkan hasilnya berdasarkan kota.

Ada satu permintaan tambahan dalam pertanyaan: “Hanya sertakan kota yang telah membuat setidaknya 5 pesanan…” Saya menggunakan HAVING untuk hanya menampilkan kota dengan lima pesanan atau lebih untuk mencapai hal tersebut.

Pertanyaannya adalah, mengapa saya menggunakan LEFT JOIN dan tidak BERGABUNG? The clue is in the question:”…and count all customers in each city even if they did not place an order.” It’s possible that not all customers have placed orders. This means I want to show all customers from the table pelanggan, yang sangat sesuai dengan definisi LEFT JOIN.

Seandainya saya menggunakan JOIN, hasilnya akan salah, karena saya akan kehilangan pelanggan yang tidak melakukan pemesanan.

Catatan: Kompleksitas gabungan dalam SQL tidak tercermin dalam sintaksisnya tetapi dalam semantiknya! Seperti yang Anda lihat, setiap gabungan ditulis dengan cara yang sama, hanya kata kuncinya yang berubah. Namun, setiap gabungan bekerja secara berbeda dan, oleh karena itu, dapat menghasilkan hasil yang berbeda bergantung pada datanya. Oleh karena itu, sangat penting bagi Anda untuk sepenuhnya memahami apa yang dilakukan setiap penggabungan dan memilih salah satu yang akan memberikan hasil sesuai keinginan Anda!

Keluaran

Sekarang, mari kita lihat hasilnya.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan

3. Contoh GABUNG KANAN

GABUNG KANAN adalah bayangan cermin dari GABUNG KIRI. Itu sebabnya saya bisa dengan mudah menyelesaikan masalah sebelumnya menggunakan RIGHT JOIN. Izinkan saya menunjukkan cara melakukannya.

Data

Tabelnya tetap sama; Saya hanya akan menggunakan jenis gabungan yang berbeda.

Kode

SELECT c.city, COUNT(DISTINCT o.id) AS orders_per_city, COUNT(DISTINCT c.id) AS customers_per_city, SUM(o.total_order_cost) AS orders_cost_per_city
FROM orders o
RIGHT JOIN customers c ON o.cust_id = c.id GROUP BY c.city
HAVING COUNT(o.id) >=5;

 

Inilah yang berubah. Saat saya menggunakan RIGHT JOIN, saya mengganti urutan tabel. Sekarang mejanya perintah menjadi yang kiri, dan meja pelanggan yang paling benar. Kondisi bergabung tetap sama. Saya baru saja mengganti urutan kolom untuk mencerminkan urutan tabel, tetapi hal itu tidak perlu dilakukan.

Dengan mengganti urutan tabel dan menggunakan RIGHT JOIN, saya akan menampilkan kembali semua pelanggan, meskipun mereka belum melakukan pemesanan apa pun.

Kueri lainnya sama seperti pada contoh sebelumnya. Hal yang sama berlaku untuk keluarannya.

Catatan: Dalam praktiknya, GABUNG BENAR relatif jarang digunakan. LEFT JOIN tampak lebih alami bagi pengguna SQL, sehingga mereka lebih sering menggunakannya. Apa pun yang bisa dilakukan dengan RIGHT JOIN juga bisa dilakukan dengan LEFT JOIN. Oleh karena itu, tidak ada situasi khusus di mana RIGHT JOIN lebih disukai.

Keluaran

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan

4. Contoh GABUNG LENGKAP

Pertanyaan dari Salesforce dan Tesla ingin Anda menghitung selisih bersih antara jumlah produk yang diluncurkan perusahaan pada tahun 2020 dengan jumlah produk yang diluncurkan perusahaan pada tahun sebelumnya.

Baru Produk

“Anda diberikan tabel peluncuran produk menurut perusahaan berdasarkan tahun. Tulis query untuk menghitung selisih bersih antara jumlah produk yang diluncurkan perusahaan pada tahun 2020 dengan jumlah produk yang diluncurkan perusahaan pada tahun sebelumnya. Keluarkan nama perusahaan dan selisih bersih produk bersih yang dikeluarkan untuk tahun 2020 dibandingkan tahun sebelumnya.”

Data

Pertanyaannya menyediakan satu tabel dengan kolom berikut.

peluncuran_mobil

tahun: int
nama perusahaan: varchar.dll
nama Produk: varchar.dll

Bagaimana saya bisa bergabung dengan meja jika hanya ada satu meja? Hmm, mari kita lihat juga!

Kode

Kueri ini sedikit lebih rumit, jadi saya akan mengungkapkannya secara bertahap.

SELECT company_name, product_name AS brand_2020
FROM car_launches
WHERE YEAR = 2020;

 

Pernyataan SELECT pertama menemukan perusahaan dan nama produk pada tahun 2020. Kueri ini nantinya akan diubah menjadi subkueri.

Pertanyaannya ingin Anda menemukan perbedaan antara tahun 2020 dan 2019. Jadi, mari kita tulis kueri yang sama tetapi untuk tahun 2019.

SELECT company_name, product_name AS brand_2019
FROM car_launches
WHERE YEAR = 2019;

 

Sekarang saya akan membuat kueri ini menjadi subkueri dan menggabungkannya menggunakan FULL OUTER JOIN.

SELECT *
FROM (SELECT company_name, product_name AS brand_2020 FROM car_launches WHERE YEAR = 2020) a
FULL OUTER JOIN (SELECT company_name, product_name AS brand_2019 FROM car_launches WHERE YEAR = 2019) b ON a.company_name = b.company_name;

 

Subkueri dapat diperlakukan sebagai tabel dan, oleh karena itu, dapat digabungkan. Saya memberi alias pada subkueri pertama, dan saya menempatkannya di klausa FROM. Lalu saya gunakan FULL OUTER JOIN untuk menggabungkannya dengan subquery kedua pada kolom nama perusahaan.

Dengan menggunakan jenis gabungan SQL ini, saya akan menggabungkan semua perusahaan dan produk pada tahun 2020 dengan semua perusahaan dan produk pada tahun 2019.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan
 

Sekarang saya dapat menyelesaikan pertanyaan saya. Mari pilih nama perusahaan. Selain itu, saya akan menggunakan fungsi COUNT() untuk mencari jumlah produk yang diluncurkan setiap tahun dan kemudian menguranginya untuk mendapatkan selisihnya. Terakhir, saya akan mengelompokkan output berdasarkan perusahaan dan mengurutkannya juga berdasarkan perusahaan berdasarkan abjad.

Inilah keseluruhan pertanyaannya.

SELECT a.company_name, (COUNT(DISTINCT a.brand_2020)-COUNT(DISTINCT b.brand_2019)) AS net_products
FROM (SELECT company_name, product_name AS brand_2020 FROM car_launches WHERE YEAR = 2020) a
FULL OUTER JOIN (SELECT company_name, product_name AS brand_2019 FROM car_launches WHERE YEAR = 2019) b ON a.company_name = b.company_name
GROUP BY a.company_name
ORDER BY company_name;

Keluaran

Berikut daftar perusahaan dan perbedaan produk yang diluncurkan antara tahun 2020 dan 2019.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan

5. Contoh LINTAS GABUNG

Pertanyaan ini oleh Deloitte sangat bagus untuk menunjukkan cara kerja CROSS JOIN.

Maksimal Dua Angka

“Diberikan satu kolom bilangan, pertimbangkan semua kemungkinan permutasi dari dua bilangan dengan asumsi pasangan bilangan (x,y) dan (y,x) adalah dua permutasi yang berbeda. Kemudian, untuk setiap permutasi, carilah bilangan maksimum dari kedua bilangan tersebut.

Keluarkan tiga kolom: angka pertama, angka kedua, dan maksimal keduanya.”

Pertanyaannya ingin Anda mencari semua kemungkinan permutasi dari dua bilangan dengan asumsi pasangan bilangan (x,y) dan (y,x) adalah dua permutasi yang berbeda. Kemudian, kita perlu mencari bilangan maksimum untuk setiap permutasi.

Data

Pertanyaannya memberi kita satu tabel dengan satu kolom.

deloitte_numbers

jumlah: int

Kode

Kode ini adalah contoh CROSS JOIN, tetapi juga self join.

SELECT dn1.number AS number1, dn2.number AS number2, CASE WHEN dn1.number > dn2.number THEN dn1.number ELSE dn2.number END AS max_number
FROM deloitte_numbers AS dn1
CROSS JOIN deloitte_numbers AS dn2;

 

Saya mereferensikan tabel di FROM dan memberinya satu alias. Lalu saya CROSS JOIN dengan dirinya sendiri dengan mereferensikannya setelah CROSS JOIN dan memberikan alias lain pada tabel tersebut.

Sekarang dimungkinkan untuk menggunakan satu tabel karena ada dua tabel. Saya memilih nomor kolom dari setiap tabel. Kemudian saya menggunakan pernyataan CASE untuk mengatur kondisi yang akan menampilkan jumlah maksimum dari kedua angka tersebut.

Mengapa CROSS JOIN digunakan di sini? Ingat, ini adalah jenis gabungan SQL yang akan menampilkan semua kombinasi semua baris dari semua tabel. Itulah tepatnya pertanyaan yang diajukan!

Keluaran

Berikut cuplikan semua kombinasi dan angka tertinggi dari keduanya.

 

SQL Untuk Ilmu Data: Memahami dan Memanfaatkan Gabungan

Sekarang setelah Anda mengetahui cara menggunakan gabungan SQL, pertanyaannya adalah bagaimana memanfaatkan pengetahuan tersebut dalam ilmu data.

SQL Joins memainkan peran penting dalam tugas ilmu data seperti eksplorasi data, pembersihan data, dan rekayasa fitur.

Berikut adalah beberapa contoh bagaimana gabungan SQL dapat dimanfaatkan:

  1. Menggabungkan Data: Menggabungkan tabel memungkinkan Anda menyatukan berbagai sumber data, memungkinkan Anda menganalisis hubungan dan korelasi di beberapa kumpulan data. Misalnya, menggabungkan tabel pelanggan dengan tabel transaksi dapat memberikan wawasan tentang perilaku pelanggan dan pola pembelian.
  1. Validasi data: Gabungan dapat digunakan untuk memvalidasi kualitas dan integritas data. Dengan membandingkan data dari tabel yang berbeda, Anda dapat mengidentifikasi inkonsistensi, nilai yang hilang, atau outlier. Ini membantu Anda dalam pembersihan data dan memastikan bahwa data yang digunakan untuk analisis akurat dan dapat diandalkan.
  1. Rekayasa Fitur: Gabungan dapat berperan penting dalam menciptakan fitur baru untuk model pembelajaran mesin. Dengan menggabungkan tabel yang relevan, Anda dapat mengekstrak informasi bermakna dan menghasilkan fitur yang menangkap hubungan penting dalam data. Hal ini dapat meningkatkan kekuatan prediktif model Anda.
  1. Agregasi dan Analisis: Gabungan memungkinkan Anda melakukan agregasi dan analisis kompleks di beberapa tabel. Dengan menggabungkan data dari berbagai sumber, Anda dapat memperoleh gambaran data yang komprehensif dan memperoleh wawasan yang berharga. Misalnya, menggabungkan tabel penjualan dengan tabel produk dapat membantu Anda menganalisis kinerja penjualan berdasarkan kategori produk atau wilayah.

Seperti yang telah saya sebutkan, kompleksitas gabungan tidak terlihat dalam sintaksisnya. Anda melihat bahwa sintaksisnya relatif mudah.

Praktik terbaik untuk join juga mencerminkan hal tersebut, karena praktik tersebut tidak berkaitan dengan pengkodean itu sendiri, melainkan apa yang dilakukan join dan bagaimana kinerjanya.

Untuk memaksimalkan gabungan dalam SQL, pertimbangkan praktik terbaik berikut.

  1. Pahami Data Anda: Biasakan diri Anda dengan struktur dan hubungan dalam data Anda. Ini akan membantu Anda memilih jenis gabungan yang sesuai dan memilih kolom yang tepat untuk dicocokkan.
  1. Gunakan Indeks: Jika tabel Anda berukuran besar atau sering digabungkan, pertimbangkan untuk menambahkan indeks pada kolom yang digunakan untuk bergabung. Indeks dapat meningkatkan kinerja kueri secara signifikan.
  1. Perhatikan Kinerja: Menggabungkan tabel-tabel besar atau beberapa tabel dapat memakan biaya komputasi yang mahal. Optimalkan kueri Anda dengan memfilter data, menggunakan tipe gabungan yang sesuai, dan mempertimbangkan penggunaan tabel atau subkueri sementara.
  1. Uji dan Validasi: Selalu validasi hasil join Anda untuk memastikan kebenarannya. Lakukan pemeriksaan kewarasan dan verifikasi bahwa data yang digabungkan sesuai dengan harapan dan logika bisnis Anda.

SQL Joins adalah konsep dasar yang memberdayakan Anda sebagai data scientist untuk menggabungkan dan menganalisis data dari berbagai sumber. Dengan memahami berbagai jenis gabungan SQL, menguasai sintaksisnya, dan memanfaatkannya secara efektif, ilmuwan data dapat membuka wawasan berharga, memvalidasi kualitas data, dan mendorong pengambilan keputusan berdasarkan data.

Saya menunjukkan cara melakukannya dalam lima contoh. Sekarang terserah Anda untuk memanfaatkan kekuatan SQL dan bergabung dalam proyek ilmu data Anda dan mencapai hasil yang lebih baik.
 
 
Nat Rosidi adalah seorang ilmuwan data dan dalam strategi produk. Dia juga seorang profesor yang mengajar analitik, dan merupakan pendiri Goresan Strata, sebuah platform yang membantu ilmuwan data mempersiapkan wawancara mereka dengan pertanyaan wawancara nyata dari perusahaan terkemuka. Terhubung dengan dia di Twitter: StrataScratch or LinkedIn.
 

Stempel Waktu:

Lebih dari KDnugget