SQL Untuk Sains Data: Penyelesaian sehenti untuk Pemula



Catatan blog mengenai SQL untuk Sains Data ini akan membantu anda memahami bagaimana SQL dapat digunakan untuk menyimpan, mengakses dan mengambil data untuk melakukan analisis data.

Sejak masa Sains Data berada di kedudukan 1 sebagai pekerjaan yang paling menjanjikan pada zaman ini, kita semua berusaha untuk menyertai perlumbaan . Catatan blog mengenai SQL untuk Sains Data ini akan membantu anda memahami bagaimana SQL dapat digunakan untuk menyimpan, mengakses dan mengambil data untuk melakukan analisis data.

Berikut adalah senarai topik yang akan menjadi diliputi dalam blog ini:





    1. Mengapa SQL Diperlukan Untuk Sains Data?
    2. Apa itu SQL?
    3. Asas SQL
    4. Memasang MySQL
    5. Hands-On

Mengapa SQL Diperlukan Untuk Sains Data?

Tahukah anda bahawa kami menghasilkan lebih daripada 2.5 quintillion bait data setiap hari? Langkah penjanaan data ini adalah sebab di sebalik populariti teknologi canggih seperti Sains Data , , dan sebagainya.

Mendapatkan pandangan berguna dari data adalah apa yang disebut sebagai Sains Data. Sains Data melibatkan pengekstrakan, pemprosesan, dan analisis banyak data. Pada masa ini apa yang kita perlukan yang boleh digunakan untuk menyimpan dan menguruskan sejumlah besar data ini.



Apa itu Sains Data - Edureka

Di sinilah dimana SQL masuk.

SQL dapat digunakan untuk menyimpan, mengakses dan mengekstrak sejumlah besar data untuk menjalankan keseluruhan proses Sains Data dengan lebih lancar.



Apa itu SQL?

SQL yang bermaksud Structured Query Language adalah bahasa pertanyaan yang bertujuan untuk menguruskan Pangkalan Data Relasional.

Tetapi apa sebenarnya Pangkalan Data Relasional?

Pangkalan data relasional adalah sekumpulan jadual yang ditentukan dengan baik dari mana data dapat diakses, diedit, dikemas kini dan sebagainya, tanpa perlu mengubah jadual pangkalan data. SQL adalah standard (API) untuk pangkalan data hubungan.

Kembali ke SQL, pengaturcaraan SQL dapat digunakan untuk melakukan banyak tindakan pada data seperti query, memasukkan, mengemas kini, menghapus catatan pangkalan data. Contoh pangkalan data hubungan yang menggunakan SQL merangkumi Pangkalan Data MySQL, Oracle, dll.

Untuk mengetahui lebih lanjut mengenai SQL, anda boleh melalui blog berikut:

  1. Memahami Jenis Data SQL - Semua Yang Perlu Anda Ketahui Mengenai Jenis Data SQL
  2. BUAT JADUAL dalam SQL - Semua Yang Perlu Anda Ketahui Mengenai Membuat Jadual di SQL

Sebelum kita memulakan demo di SQL, mari kita kenal dengan perintah SQL asas.

Asas SQL

SQL menyediakan sekumpulan perintah mudah untuk mengubah jadual data, mari kita ikuti beberapa perintah SQL asas:

  • BUAT Pangkalan Data - membuat pangkalan data baru
  • BUAT JADUAL - membuat jadual baru
  • MASUKKAN KE DALAM - memasukkan data baru ke dalam pangkalan data
  • PILIH - mengekstrak data dari pangkalan data
  • KEMASKINI - mengemas kini data dalam pangkalan data
  • HAPUS - memadam data dari pangkalan data
  • Pangkalan Data ALTER - mengubahsuai pangkalan data
  • JADUAL ALTER - mengubahsuai jadual
  • JADUAL HABIS - memadamkan jadual
  • BUAT INDEKS - membuat indeks untuk mencari elemen
  • INDEKS HABIS - memadam sebuah indeks

Untuk lebih memahami SQL, mari pasang MySQL dan lihat bagaimana anda boleh bermain dengan data.

Memasang MySQL

Memasang MySQL adalah tugas yang mudah. Inilah a panduan langkah demi langkah yang akan membantu anda memasang MySQL pada sistem anda.

Setelah selesai memasang MySQL, ikuti bahagian di bawah ini untuk demo ringkas yang akan menunjukkan kepada anda bagaimana anda boleh memasukkan, memanipulasi dan mengubah data.

SQL Untuk Sains Data - Demo MySQL

Dalam demonstrasi ini, kita akan melihat bagaimana membuat pangkalan data dan memprosesnya. Ini adalah demonstrasi peringkat pemula untuk memulakan anda dengan analisis data mengenai SQL.

Jadi mari kita mulakan!

Langkah 1: Buat Pangkalan Data SQL

Pangkalan data SQL adalah gudang penyimpanan di mana data dapat disimpan dalam format tersusun. Sekarang mari buat pangkalan data dengan menggunakan MySQL :

BUAT DATABASE edureka PENGGUNAAN edureka

Dalam kod di atas, terdapat dua perintah SQL:

Catatan : Perintah SQL didefinisikan dengan huruf besar dan titik koma digunakan untuk menghentikan perintah SQL.

  1. BUAT DATABASE: Perintah ini membuat pangkalan data yang disebut 'edureka'

  2. PENGGUNAAN: Perintah ini digunakan untuk mengaktifkan pangkalan data. Di sini kami mengaktifkan pangkalan data ‘edureka’.

Langkah 2: Buat jadual dengan ciri data yang diperlukan

Membuat jadual semudah membuat pangkalan data. Anda hanya perlu menentukan pemboleh ubah atau ciri jadual dengan jenis data masing-masing. Mari lihat bagaimana ini dapat dilakukan:

BUAT mainan TABLE (TID INTEGER BUKAN NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, INTEGER Price, Quantity INTEGER)

Dalam coretan kod di atas perkara berikut berlaku:

  1. Gunakan arahan ‘CREATE TABLE’ untuk membuat meja yang dipanggil mainan.
  2. Meja mainan mengandungi 4 ciri, iaitu, TID (Transaction ID), Item_name, Price dan Quantity.
  3. Setiap pemboleh ubah ditentukan dengan jenis data masing-masing.
  4. Pemboleh ubah TID dinyatakan sebagai kunci utama. Kunci utama pada dasarnya menunjukkan pemboleh ubah yang dapat menyimpan nilai unik.

Anda boleh memeriksa lebih terperinci jadual yang ditentukan dengan menggunakan arahan berikut:

Jelaskan mainan

Langkah 3: Memasukkan data ke dalam jadual

Sekarang kita telah membuat jadual, mari kita isi dengan beberapa nilai. Sebelumnya di blog ini, saya menyebutkan bagaimana anda dapat menambahkan data ke dalam tabel dengan hanya menggunakan satu perintah, iaitu, INSERT INTO.

Mari lihat bagaimana ini dilakukan:

INSERT INTO mainan NILAI (NULL, 'Train', 550, 88) INSERT INTO toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO mainan NILAI (NULL, 'Magic_Pencil', 70, 100) INSERT INTO VALUES mainan ( NULL, 'Dog_house', 120, 54) INSERT INTO mainan NILAI (NULL, 'Skateboard', 700, 42) INSERT INTO mainan NILAI (NULL, 'GI Joe', 300, 120)

Dalam coretan kod di atas, kami memasukkan 6 pemerhatian ke dalam jadual 'mainan' kami dengan menggunakan arahan INSERT INTO. Untuk setiap pemerhatian, dalam tanda kurung, saya telah menentukan nilai setiap pemboleh ubah atau ciri yang ditentukan semasa membuat jadual.

Pemboleh ubah TID ditetapkan ke NULL kerana kenaikan secara automatik dari 1.

Sekarang mari kita paparkan semua data yang ada dalam jadual kami. Ini boleh dilakukan dengan menggunakan arahan di bawah:

PILIH * DARI mainan


Langkah 4: Ubah suai data

Katakan bahawa anda memutuskan untuk menaikkan harga G.I. Joe kerana mendapat banyak pelanggan. Bagaimana anda mengemas kini harga pemboleh ubah dalam pangkalan data?

Sangat mudah, gunakan arahan di bawah:

UPDATE mainan SET Harga = 350 DI MANA TID = 6

Perintah UPDATE membolehkan anda mengubah nilai / pemboleh ubah yang tersimpan dalam jadual. Parameter SET membolehkan anda memilih ciri tertentu dan parameter DI MANA digunakan untuk mengenal pasti pemboleh ubah / nilai yang ingin anda ubah. Dalam arahan di atas, saya telah mengemas kini harga entri data yang TIDnya 6 (G.I. Joe).

Sekarang mari kita lihat jadual yang dikemas kini:

PILIH * DARI mainan

Anda juga dapat mengubahsuai apa yang anda ingin tampilkan dengan hanya merujuk pada lajur yang ingin anda lihat. Sebagai contoh, arahan di bawah ini hanya akan memaparkan nama mainan dan harganya:

PILIH Item_nama, Harga DARI mainan

Langkah 5: Mengambil data

Oleh itu, setelah memasukkan data dan mengubahnya, akhirnya tiba masanya untuk mengekstrak dan mengambil data mengikut keperluan perniagaan. Di sinilah data dapat diambil untuk analisis data lebih lanjut dan pemodelan data.

Perhatikan bahawa ini adalah contoh mudah untuk memulakan anda dengan SQL, namun, dalam senario dunia nyata data jauh lebih rumit dan besar. Walaupun begitu, perintah SQL tetap sama dan itulah yang menjadikan SQL begitu mudah dan mudah difahami. Ia dapat memproses kumpulan data yang kompleks dengan satu set perintah SQL sederhana.

Sekarang mari kita dapatkan data dengan beberapa pengubahsuaian. Rujuk kod di bawah dan cuba fahami apa yang dilakukannya tanpa melihat hasilnya:

pemboleh ubah contoh dalam contoh java
PILIH * DARI TERHAD mainan 2

Anda meneka! Ia memaparkan dua pemerhatian pertama yang terdapat di dalam jadual saya.

Mari cuba sesuatu yang lebih menarik.

PILIH * DARI mainan ORDER MENGIKUT Harga ASC

Seperti yang ditunjukkan dalam gambar, nilai disusun sehubungan dengan urutan menaik dari pemboleh ubah harga. Sekiranya anda ingin mencari tiga barang yang paling kerap dibeli, apa yang akan anda lakukan?

Ia sangat mudah!

PILIH * DARI mainan ORDER MENGIKUT BATASAN DESC Kuantiti 3

Mari cuba sekali lagi.

PILIH * DARI mainan DI MANA Harga> 400 ORDER MENGIKUT Harga ASC


Pertanyaan ini mengekstrak perincian mainan yang harganya lebih dari 400 dan mengatur output dalam urutan kenaikan harga.

Oleh itu, anda boleh memproses data dengan menggunakan SQL. Setelah anda mengetahui asas-asas SQL untuk Sains Data, saya pasti anda ingin mengetahui lebih lanjut. Berikut adalah beberapa blog untuk memulakan anda:

  1. Apa itu Sains Data? Panduan Permulaan untuk Sains Data
  2. Tutorial MySQL - Panduan Pemula Untuk Belajar MySQL

Sekiranya anda ingin mendaftar untuk mengikuti kursus lengkap mengenai Artificial Intelligence dan Machine Learning, Edureka mempunyai pilihan khusus yang akan menjadikan anda mahir dalam teknik seperti Pembelajaran yang Diawasi, Pembelajaran Tanpa Pengawasan, dan Pemprosesan Bahasa Asli. Ia merangkumi latihan mengenai kemajuan terkini dan pendekatan teknikal dalam Artificial Intelligence & Machine Learning seperti Pembelajaran Dalam, Model Grafik dan Pembelajaran Pengukuhan.