Pembelajaran yang Diselia Di Apache Mahout



Pembelajaran diawasi adalah teknik pembelajaran mesin, di mana fungsi disimpulkan dari contoh data latihan yang berlabel.

apakah perbezaan antara kelas abstrak dan antara muka

Pembelajaran yang diawasi adalah kaedah, di mana data latihan merangkumi input dan hasil yang diinginkan. Melatih sistem dengan contoh disebut pembelajaran yang diselia. Atau, melatih algoritma dengan guru juga boleh dianggap sebagai pembelajaran yang diselia. Setelah melatih algoritma dengan semua data sampel atau data berlabel, yang mempunyai kedua-dua peramal pada pemboleh ubah sasaran, seseorang dapat melatih algoritma dan menggunakan contoh yang tidak dapat dilihat untuk klasifikasi lebih lanjut.





Berikut adalah beberapa ciri penting Pembelajaran Terpantau di Mahout:

  • Pembinaan set latihan, pengesahan dan ujian yang betul (Bok) sangat penting.
  • Kaedah-kaedah ini biasanya cepat dan tepat.
  • Kaedah Pembelajaran Terpantau harus dapat membuat generalisasi.
  • Mereka memberikan hasil yang betul, ketika data baru diberikan dalam input tanpa mengetahui apriorisasaran.
  • Dalam beberapa kes, hasil (sasaran) yang betul diketahui dan diberikan sebagai input kepada model semasa proses pembelajaran.

Contoh Pembelajaran Yang Diselia

Sekiranya anda ingin melatih misi dan anda akan diberikan dua kumpulan gambar yang berbeza bersama dengan data berlabel, mis. dalam gambar di atas, satu kumpulan mempunyai gambar seekor gajah dan yang lain mempunyai gambar seekor singa. Data berlabel menunjukkan setiap set data memiliki nilai sasaran. Dalam contoh di atas, kumpulan data adalah gambar gajah, sedangkan label yang diberikan kepadanya, yaitu 'Gajah' adalah nilai sasaran dari set data. Kumpulan data berlabel seperti itu digunakan untuk proses latihan, sehingga algoritma latihan dapat memanfaatkan set data ini dan membangun beberapa model, yang dapat digunakan lebih jauh untuk mengklasifikasikan contoh yang tidak terlihat tanpa data berlabel, atau pemboleh ubah sasaran.



Mari kenal pasti ciri-ciri yang membantu dalam mengenal pasti objek sebagai gajah atau singa:

Keistimewaannya boleh jadi - saiz, warna, tinggi, ukuran telinga, batang, gading

Ini dapat disebut set fitur, yang akan digunakan untuk tujuan latihan. Kumpulan ciri ini akan mempengaruhi pemboleh ubah sasaran akhir. Pemboleh ubah ini dikenali sebagai pemboleh ubah ramalan , kerana mereka membantu kita dalam menentukan pemboleh ubah sasaran akhir . Pemboleh ubah akhir juga boleh dipanggil label. Pemboleh ubah akhir inilah Gajah / Singa.



table-word

Dalam contoh ini, setiap catatan dalam kategori, ukuran, warna, tinggi, ukuran telinga, batang dan gading adalah pemboleh ubah prediktor, sementara Gajah dan Singa adalah pemboleh ubah sasaran. Pemboleh ubah ini boleh dianggap sebagai contoh latihan dan kumpulan data latihan masing-masing.

Oleh itu, Pembelajaran yang Diawasi adalah cara, di mana anda melatih bersama label, di mana anda meminta algoritma untuk mengekstrak ciri-ciri tertentu darinya, dan berdasarkannya, setiap kali anda melihat contoh yang tidak dapat dilihat, algoritma akan dapat mengklasifikasikannya ke kelas yang betul.

Ada soalan untuk kami? Sebutkannya di bahagian komen dan kami akan menghubungi anda.

Catatan berkaitan: