Daftar Isi
LancangKuning - Saat sebelum kita masuk ke topik berbagai berbagai algoritma klasifikasi, kita wajib tau dahulu ap aitu algoritma klasifikasi serta gimana metode kerjanya, algoritma klasifikasi merupakan catatan record informasi hendak diklasifikasikan kedalam salah satu dari sekian klasifikasi informasi yang ada pada variabel tujuan bersumber pada nilai- nilai“ variabel prediktor”.
Metode Kerja Algoritma klasifikasi dalam informasi mining bekerja pada informasi historis ataupun informasi sejarah. Informasi historis diucap informasi latihan ataupun training informasi. Histori informasi digunakan selaku metode memperoleh pengetahuan serta diucap informasi pengalaman.
Sehabis kita mengenali apa itu algoritma klasifikasi serta metode kerjanya saat ini kita masuk ke topik berbagai berbagai algoritma klasifikasi
-
Decision Tree
Tumbuhan Keputusan (Decision Tree) ialah tata cara klasifikasi serta prediksi yang sangat kokoh serta populer. Tata cara tumbuhan keputusan mengganti kenyataan yang sangat besar jadi tumbuhan keputusan yang merepresentasikan ketentuan. Ketentuan bisa dengan gampang dimengerti dengan bahasa natural. Ketentuan ini pula bisa diekspresikan dalam wujud bahasa basis informasi semacam SQL buat mencari record pada jenis tertentu.
Tumbuhan keputusan pula bermanfaat buat mengeksplorasi informasi, menciptakan ikatan tersembunyi antara beberapa calon variabel input dengan suatu variabel sasaran. Sebab tumbuhan keputusan memadukan antara eksplorasi informasi serta pemodelan, tumbuhan keputusan ini sangat bagus selaku langkah dini dalam proses pemodelan apalagi kala dijadikan selaku model akhir dari sebagian metode lain( J R Quinlan, 1993).
-
k- Nearest Neighbors
K- Nearest Neighbor (KNN) merupakan sesuatu tata cara yang memakai algoritme supervised dimana hasil dari query instance yang baru diklasifikasikan bersumber pada kebanyakan dari jenis pada KNN. Tujuan dari algoritma ini merupakan mengklasifikasikan objek baru berdasarkan atribut serta training sample. Algoritma tata cara KNN sangatlah simpel, bekerja bersumber pada jarak terpendek dari query instance ke training sample buat memastikan KNN- nya. Training sample diproyeksikan ke ruang berukuran banyak, dimana tiap- tiap ukuran merepresentasikan fitur dari informasi. Ruang ini dipecah jadi bagian- bagian bersumber pada klasifikasi training sample.
-
Naıve Bayes
Naïve Bayes ialah pengklasifikasian dengan tata cara probabilitas serta statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, ialah memprediksi kesempatan di masa depan bersumber pada pengalaman di masa tadinya sehingga diketahui selaku teorema Bayes. Teorema tersebut dikombinasikan dengan” naive” dimana diasumsikan keadaan antar atribut silih leluasa. Pada suatu dataset, tiap baris/ dokumen I diasumsikan selaku vector dari nilai- nilai atribut<x1, x2,…, x3 dimana masing- masing nilai- nilai jadi peninjauan atribut Xi( iЄ[1, n])).
-
Classification and Regression Trees
CART (Classification And Regression Trees) ialah tata cara tumbuhan regresi serta tumbuhan klasifikasi. Bila variabel dependen yang dipunyai bertipe kategori hingga CART menciptakan tumbuhan klasifikasi (classification trees), sebaliknya bila variabel dependen yang dipunyai bertipe kontinu ataupun numerik hingga CART menciptakan tumbuhan regresi (regression trees).
-
K- Means Clustering
Semacam namanya, algoritma ini biasa digunakan buat permasalahan clustering. Metode kerja algoritma ini mula- mula merupakan dengan membentuk beberapa k titik, yang diucap dengan centroid (dimana nilai k merepresentasikan jumlah cluster). Setelah itu titik- titik informasi (informasi points) yang terdapat hendak membentuk cluster dengan centroid terdekat darinya.
Otomatis, titik pusat (centroid) hendak berganti bersamaan dengan pertambahan anggota masing- masing cluster- nya (yang mana merupakan data points tadi). Oleh sebab itu, masing- masing cluster yang sudah tercipta hendak ‘mencari’ titik centroid barunya. Proses ini terus menerus dicoba sampai diperoleh keadaan konvergensi, contohnya bila posisi centroid telah tidak berganti.
-
Logistic Regression
Algoritma ini biasa digunakan buat menghitung nilai probabilitas, sehingga output yang dihasilkan terletak antara nilai 0 sampai 1. Contoh penggunaannya merupakan proses pengajuan kredit di bank. Umumnya pihak bank hendak mengajukan beberapa persoalan/ kuisioner buat memperhitungkan kelayakan calon penerima kredit. Dari sebagian persoalan seperti itu nantinya pihak bank hendak memperhitungkan probabilitas calon penerima kredit hendak mengembalikan pinjaman ataupun tidak.(Arif)
Komentar