Penggabungan Fuzzy K-Means di Mahout



Blog ini memberikan pengenalan kepada pengelompokan Fuzzy K-Means di Apache Mahout.

Fuzzy K-Means adalah algoritma yang sama persis dengan K-means, yang merupakan teknik pengelompokan mudah yang popular. Satu-satunya perbezaan adalah, alih-alih memberikan titik secara eksklusif hanya pada satu kelompok, ia dapat memiliki semacam kekaburan atau tumpang tindih antara dua atau lebih kelompok. Berikut adalah perkara penting, yang menerangkan Fuzzy K-Means:





  • Tidak seperti K-Means, yang mencari kluster keras, di mana setiap titik tergolong dalam satu kluster, Fuzzy K-Means mencari kluster yang lebih lembut untuk tumpang tindih.
  • Titik tunggal dalam kluster lembut dapat menjadi milik lebih dari satu kluster dengan nilai pertalian tertentu terhadap setiap titik.
  • Perkaitannya sepadan dengan jarak titik itu dari cluster centroid.
  • Sama dengan K-Means, Fuzzy K-Means berfungsi pada objek yang mempunyai ukuran jarak yang ditentukan dan dapat ditunjukkan dalam n- ruang vektor dimensi.

Peta K-Means FuzzyMengurangkan Aliran

Tidak ada banyak perbezaan antara aliran MapReduce K-Means dan Fuzzy K-Means. Pelaksanaan kedua-duanya di Mahout adalah serupa.

fungsi kuasa dalam java untuk bilangan bulat

Berikut adalah parameter penting untuk pelaksanaan Fuzzy K-Means:



  • Anda memerlukan set data Vektor untuk input.
  • Harus ada RandomSeedGenerator untuk menyusun kluster awal.
  • Untuk ukuran jarak, SquaredEuclideanDistanceMeasure diperlukan.
  • Nilai ambang penumpuan yang besar, seperti –cd 1.0, jika nilai kuadrat dari ukuran jarak telah digunakan
  • Nilai untuk maxIterations nilai lalai adalah -x 10.
  • Pekali normalisasi atau faktor kabur, dengan nilai lebih besar daripada -m 1.0

Ada soalan untuk kami? Sebutkannya di bahagian komen dan kami akan menghubungi anda.

perkhidmatan kini tutorial alat tiket

Catatan Berkaitan



java cara menggunakan tostring

Pembelajaran yang Diselia di Apache Mahout