Pembelajaran Mesin tidak diragukan lagi merupakan teknologi yang paling banyak diminati pada zaman ini! Sekiranya anda seorang pemula yang memulakan Pembelajaran Mesin, adalah penting anda mengetahui prasyarat untuk Pembelajaran Mesin. Blog ini akan membantu anda memahami pelbagai konsep yang perlu anda ketahui sebelum anda memulakan Pembelajaran Mesin.
Untuk mendapatkan pengetahuan mendalam mengenai Kecerdasan Buatan dan Pembelajaran Mesin, anda boleh mendaftar secara langsung oleh Edureka dengan sokongan 24/7 dan akses seumur hidup.
Berikut adalah senarai topik diliputi dalam blog ini:
Prasyarat Untuk Pembelajaran Mesin
Untuk memulakan denganPembelajaran Mesin anda mesti mengetahui konsep berikut:
Statistik
Statistik mengandungi alat yang dapat digunakan untuk mendapatkan beberapa hasil dari data. Terdapat statistik deskriptif yang digunakan untuk mengubah data mentah dalam beberapa maklumat penting. Juga, statistik inferensi dapat digunakan untuk mendapatkan maklumat penting dari sampel data dan bukannya menggunakan set data yang lengkap.
Untuk mengetahui lebih lanjut mengenai Statistik anda boleh melalui blog berikut:
Algebra Linear
Tawaran aljabar lineardengan vektor, matriks, dan transformasi linear. Ini sangat penting dalam pembelajaran mesin kerana dapat digunakan untuk mengubah dan melakukan operasi pada set data.
Kalkulus
Kalkulus adalah bidang penting dalam matematik dan memainkan peranan penting dalam banyak algoritma pembelajaran mesin. Kumpulan data yang mempunyai pelbagai ciri adalahdigunakan untuk membina model pembelajaran mesin kerana ciri adalah kalkulus pelbagai pembolehubah memainkan peranan penting untuk membina model pembelajaran mesin. Integrasi dan Pembezaan adalah suatu kemestian.
Kebarangkalian
Kebarangkalian membantu meramalkan kemungkinan berlakunya kejadian itu, Ini membantu kita untuk membuat alasan bahawa keadaan mungkin atau tidak akan berulang lagi. Untuk pembelajaran mesin, kebarangkalian adalah asas.
Untuk mengetahui lebih lanjut mengenai Kebarangkalian, anda boleh melalui ini Blog.
Bahasa pengaturcaraan
Adalah penting untuk mengetahui bahasa pengaturcaraan seperti R dan Python untuk melaksanakan keseluruhan proses Pembelajaran Mesin. Python dan R sama-sama menyediakan perpustakaan dalam yang menjadikannya sangat mudah untuk melaksanakan algoritma Pembelajaran Mesin.
c ++ menyusun tatasusunan
Selain mempunyai pengetahuan asas pengaturcaraan, anda juga perlu mengetahui cara mengekstrak, memproses dan menganalisis data. Ini adalah salah satu kemahiran terpenting yang diperlukan untuk Pembelajaran Mesin.
Untuk mengetahui lebih lanjut mengenai pengaturcaraan bahasa untuk Pembelajaran Mesin, anda boleh melalui blog berikut:
Kes Penggunaan Pembelajaran Mesin
Pembelajaran mesin adalah mengenai membuat algoritma yang dapat belajar dari data untuk membuat ramalan seperti apa jenis objek yang terdapat dalam gambar, atau mesin cadangan, kombinasi ubat terbaik untuk menyembuhkan penyakit tertentu atau penapisan spam.
Pembelajaran mesin dibina berdasarkan prasyarat matematik dan jika anda tahu mengapa matematik digunakan dalam pembelajaran mesin, ia akan menjadikannya menyeronokkan. Anda perlu mengetahui matematik di sebalik fungsi yang akan anda gunakan dan model mana yang sesuai untuk data dan mengapa.
Oleh itu, mari kita mulakan dengan masalah menarik untuk meramalkan harga rumah, mempunyai set data yang mengandungi sejarah ciri dan harga yang berbeza, buat masa ini, kita akan mempertimbangkan luas ruang kediaman dengan kaki persegi dan harganya.
Sekarang kami memiliki kumpulan data yang berisi dua lajur seperti yang ditunjukkan di bawah:
Pasti ada hubungan antara dua pemboleh ubah ini untuk mengetahui bahawa kita perlu membina model yang dapat meramalkan harga rumah, bagaimana kita dapat melakukannya?
Mari buat grafik data ini dan lihat bagaimana rupanya:
Di sini paksi-X adalah harga per sqft ruang kediaman dan paksi-Y adalah harga rumah. Sekiranya kita memplot semua titik data, kita akan mendapat plot penyebaran yang dapat diwakili oleh garis seperti yang ditunjukkan pada gambar di atas dan jika kita memasukkan beberapa data maka akan meramalkan beberapa hasil. Sebaik-baiknya, kita mesti mencari garis yang akan memotong titik data maksimum.
Di sini kita cuba membuat garis yang diistilahkan sebagai:
Y = mX + c
Kaedah ini untuk meramalkan hubungan linear antara sasaran (pemboleh ubah bersandar) dan pemboleh ubah prediktor (pemboleh ubah bebas) disebut sebagai regresi linear. Ini membolehkan kita mengkaji dan meringkaskan hubungan antara dua pemboleh ubah.
- X = Pemboleh ubah bebas
- Y = Pemboleh ubah bersandar
- c = pintasan-y
- m = Cerun garisan
Sekiranya kita mempertimbangkan persamaan kita mempunyai nilai untuk X yang merupakan pemboleh ubah tidak bersandar, jadi yang harus kita lakukan adalah mengira nilai untuk m dan c untuk meramalkan nilai Y.
Jadi bagaimana kita mencari pemboleh ubah ini?
Untuk mencari pemboleh ubah ini, kita dapat mencuba sekumpulan nilai dan berusaha mencari garis yang memotong bilangan titik data maksimum. Tetapi, bagaimana kita dapat mencari garis yang paling sesuai?
Oleh itu, untuk mencari garis yang paling sesuai, kita boleh menggunakan fungsi ralat kuadrat paling sedikit yang akan menemui ralat antara nilai sebenar y dan nilai ramalan y`.
Fungsi ralat kuasa dua dapat ditunjukkan dengan menggunakan persamaan berikut:
tukar rentetan ke java tarikh
Dengan menggunakan fungsi ini kita dapat mengetahui kesalahan untuk setiap titik data yang diramalkan dengan membandingkannya dengan nilai titik data yang sebenarnya. Anda kemudian mengambil penjumlahan semua kesalahan ini dan buatkannya untuk mengetahui penyimpangan dalam ramalan tersebut.
Sekiranya kita menambahkan paksi ketiga ke grafik kita yang mengandungi semua kemungkinan nilai ralat dan memplotnya dalam ruang 3-Dimensi, ia akan kelihatan seperti ini:
Dalam gambar di atas, nilai ideal adalah bahagian hitam bawah yang akan meramalkan harga hampir dengan titik data sebenar. Langkah seterusnya adalah mencari nilai terbaik untuk m dan c. Ini dapat dilakukan dengan menggunakan teknik pengoptimuman yang disebut gradient keturunan.
Penurunan gradien adalah kaedah berulang, di mana kita bermula dengan menginisialisasi beberapa set nilai untuk pemboleh ubah kita dan memperbaikinya secara perlahan dengan meminimumkan ralat antara nilai sebenar dan nilai yang diramalkan.
Sekarang jika kita berfikir secara praktikal harga pangsapuri tidak bergantung hanya pada harga per kaki persegi, terdapat banyak faktor seperti jumlah bilik tidur, bilik mandi, dan lain-lain. Sekiranya kita mempertimbangkan ciri-ciri itu, maka persamaan akan kelihatan seperti seperti ini
Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c
Ini adalah regresi multilinear milik aljabar linier, di sini kita boleh menggunakan matriks ukuran mxn di mana m adalah ciri dan n adalah titik data.
Mari kita fikirkan keadaan lain di mana kita boleh menggunakan kebarangkalian untuk mencari keadaan rumah untuk mengklasifikasikan rumah berdasarkan sama ada dalam keadaan baik atau keadaan buruk. Untuk ini, kita mesti menggunakan teknik yang disebut Logistic Regression yang berfungsi pada kebarangkalian kejadian yang ditunjukkan oleh fungsi sigmoid.
Dalam artikel ini, kami membahas prasyarat pembelajaran mesin dan bagaimana ia diterapkan dalam pembelajaran mesin. Jadi pada asasnya, ia terdiri daripada statistik, kalkulus, aljabar linear, dan teori kebarangkalian. Kalkulus mempunyai teknik yang digunakan untuk pengoptimuman, aljabar linear mempunyai algoritma yang dapat berfungsi pada set data yang besar, dengan kebarangkalian kita dapat meramalkan kemungkinan kejadian dan statistik membantu kita menyimpulkan pandangan berguna dari sampel kumpulan data.
Sekarang setelah anda mengetahui Prasyarat Pembelajaran Mesin, saya pasti anda ingin mengetahui lebih lanjut. Berikut adalah beberapa blog yang akan membantu anda memulakan Sains Data:
Sekiranya anda ingin mendaftar untuk mengikuti kursus lengkap mengenai Artificial Intelligence dan Machine Learning, Edureka mempunyai pilihan khusus yang akan menjadikan anda mahir dalam teknik seperti Pembelajaran yang Diawasi, Pembelajaran Tanpa Pengawasan, dan Pemprosesan Bahasa Semula jadi. Ia merangkumi latihan mengenai kemajuan terkini dan pendekatan teknikal dalam Artificial Intelligence & Machine Learning seperti Pembelajaran Dalam, Model Grafik dan Pembelajaran Pengukuhan.