Proses Kerja Algoritma K-Means

Daftar Isi

LancangKuning - K- means ialah salah satu algoritma clustering. Tujuan algoritma ini ialah buat membagi informasi jadi sebagian kelompok. Algoritma ini menerima masukan berbentuk informasi tanpa label kelas. Perihal ini berbeda dengan supervised learning yang menerima masukan berbentuk vektor (¬x¬1, y1),(¬x¬2, y2),…,(- x¬i, yi), di mana xi ialah informasi dari sesuatu informasi pelatihan serta yi ialah label kelas buat xi.

Pada algoritma pendidikan ini, pc mengelompokkan sendiri data- data yang jadi masukannya tanpa mengenali terlebih dahulu sasaran kelasnya. Pendidikan ini tercantum dalam unsupervised learning. Masukan yang diterima merupakan informasi ataupun objek serta k buah kelompok (cluster) yang diidamkan. Algoritma ini hendak mengelompokkan informasi ataupun objek ke dalam k buah kelompok tersebut. Pada tiap cluster ada titik pusat (centroid) yang merepresentasikan cluster tersebut.

K- means ditemui oleh sebagian orang ialah Lloyd( 1957, 1982), Forgey (1965), Friedman and Rubin( 1967), and McQueen( 1967)[1]. Ilham dari clustering awal kali ditemui oleh Lloyd pada tahun 1957, tetapi perihal tersebut baru dipublikasi pada tahun 1982. Pada tahun 1965, Forgey pula mempublikasikan metode yang sama sehingga terkadang diketahui selaku Lloyd- Forgey pada sebagian sumber.

Algoritma buat melaksanakan K- Means clustering merupakan selaku berikut:

Seleksi K buah titik centroid secara acak
Kelompokkan informasi sehingga tercipta K buah cluster dengan titik centroid dari tiap cluster ialah titik centroid yang sudah diseleksi sebelumnya
Perbaharui nilai titik centroid
Ulangi langkah 2 serta 3 hingga nilai dari titik centroid tidak lagi berubah

Proses pengelompokkan informasi ke dalam sesuatu cluster bisa dicoba dengan metode menghitung jarak terdekat dari sesuatu informasi ke suatu titik centroid. Perhitungan jarak Minkowski bisa digunakan buat menghitung jarak antar 2 buah informasi. Rumus buat menghitung jarak tersebut adalah :

Di mana:

g = 1, buat menghitung jarak Manhattan
g = 2, buat menghitung jarak Euclidean
g =∞, buat menghitung jarak Chebychev
xi, xj merupakan 2 buah informasi yang hendak dihitung jaraknya
p= dimensi dari suatu data

Update sesuatu titik centroid bisa dicoba dengan rumus berikut :

Dimana :

µk= titik centroid dari cluster ke- K

Nk= banyaknya informasi pada cluster ke- K

xq= informasi ke- q pada cluster ke- K

Sebagian kasus yang kerap timbul pada di kala memakai tata cara K- Means buat melaksanakan pengelompokan informasi merupakan:

Ditemuinya sebagian model clustering yang berbeda
Pemilihan jumlah cluster yang sangat tepat
Kegagalan buat converge
Outliers
Wujud cluster

Terdapat sebagian kelebihan pada algoritma k- means, ialah:

Gampang buat diimplementasikan serta dijalankan.
Waktu yang diperlukan buat melaksanakan pendidikan ini relatif kilat.
Gampang buat diadaptasi.
Universal digunakan.

Algoritma k- means mempunyai sebagian kelebihan, tetapi terdapat kekurangannya pula. Kekurangan dari algoritma tersebut ialah:

Saat sebelum algoritma dijalankan, k buah titik diinisialisasi secara random sehingga pengelompokan informasi yang dihasilkan bisa berbeda-beda. Bila nilai random buat inisialisasi kurang baik, hingga pengelompokan yang dihasilkan juga jadi kurang maksimal.

Bisa terjebak dalam permasalahan yang diucap curse of dimensionality. Perihal ini bisa terjalin bila informasi pelatihan mempunyai ukuran yang sangat besar (Contoh bila informasi pelatihan terdiri dari 2 atribut hingga dimensinya merupakan 2 ukuran. Tetapi bila terdapat 20 atribut, hingga hendak terdapat 20 ukuran). Salah satu metode kerja algoritma ini merupakan mencari jarak terdekat antara k buah titik dengan titik yang lain. Bila mencari jarak antar titik pada 2 ukuran, masih gampang dicoba. Tetapi bagaimana mencari jarak antar titik bila ada 20 ukuran.

Bila cuma ada sebagian titik ilustrasi informasi, hingga lumayan gampang buat menghitung serta mencari titik terdekat dengan k titik yang diinisialisasi secara random. Tetapi bila ada banyak sekali titik informasi(misalnya satu milyar buah informasi), hingga perhitungan serta pencarian titik terdekat hendak memerlukan waktu yang lama. Proses tersebut bisa dipercepat, tetapi diperlukan struktur informasi yang lebih rumit semacam kD- Tree ataupun hashing.(Arif)

Beri penilaian untuk artikel Proses Kerja Algoritma K-Means

Sangat Suka

Suka

Terinspirasi

Tidak Peduli

Marah

Penulis

Ulty Desi

Belum ada bio

Proses Kerja Algoritma K-Means

Daftar Isi

Sangat Suka

Suka

Terinspirasi

Tidak Peduli

Marah

Penulis

Komentar

Berita Terkait

Kinibisa Hadir Memberikan Informasi Beasiswa

Perjuangkan Gedung Permanen dan KIP Kuliah, LLDIKTI XVII Sampaikan Aspirasi ke Komisi X DPR RI

Kemenag Riau Pastikan Ujian Madrasah Berkualitas

Unilak Kukuhkan Tiga Guru Besar Sekaligus, Catat Sejarah Baru di Riau

Wamendikdasmen Launching Program JMSI Goes School di Banjarmasin-Kalsel di HUT ke 5

Tags

5 Tips Memilih Spare Part Alat Berat yang Tepat untuk Proyek Anda

Jemaah Haji Riau Nikmati Layanan Bus Shalawat

Tragis dan Tega: Kakak-Adik Kirim Mayat Bayi Hasil Inses Lewat Ojol

Gubri Abdul Wahid: Saya Sudah Wakafkan Diri Bangun Riau

HKG PKK Ke-53 Inhil Fokuskan Pelayanan Kesehatan, Bupati Harap Kegiatan Serupa Diperbanyak

Sultan Biro Jasa, Sindikat Pemalsu Dokumen Negara Dibongkar. Oknum Disdukcapil Terlibat

7 Pelaku Pengeroyokan Debt Collector Wanita Masih Buron

Berikut ini 9 Produk Mengandung Unsur Babi, Ada Yang Sudah Bersertifikat Halal

Kapolda Riau Perintahkan Dirreskrimsus Penyelidikan Tata Kelola Sampah Pekanbaru

MUI Pertanyakan Rencana Presiden Prabowo Evakuasi 1.000 Warga Gaza ke Indonesia

Jl. Subrantas No. 188 Panam. Pekanbaru, Riau.

redaksi@lancangkuning.com

LancangKuning Support

Proses Kerja Algoritma K-Means

Daftar Isi

Bagikan Artikel

Sangat Suka

Suka

Terinspirasi

Tidak Peduli

Marah

Penulis

Komentar

Berita Terkait

Tags