Daftar Isi
LancangKuning - Mesin dari pembelajaran mesin algoritma bukanlah mitos sama sekali. Sebagian besar pemula memulai dengan mempelajari regresi. Ini mudah dipelajari dan digunakan, tetapi apakah itu menyelesaikan tujuan kita? Tentu saja tidak! Karena Anda dapat melakukan lebih dari sekadar Regresi. Pikirkan algoritma pembelajaran mesin sebagai gudang senjata yang dikemas dengan kapak, pedang, bilah, busur, belati, dll.
Anda memiliki berbagai alat, tetapi Anda harus belajar menggunakannya pada waktu yang tepat. Sebagai analogi, pikirkan 'Regresi' sebagai pedang yang mampu memotong dan memotong data secara efisien, tetapi tidak mampu menangani data yang sangat kompleks. Sebaliknya, ‘Support Vector Machines’ seperti pisau tajam - ini bekerja pada kumpulan data yang lebih kecil, tetapi pada kumpulan data yang kompleks, ini bisa jauh lebih kuat dan andal dalam membuat model pembelajaran mesin.
Sekarang, saya harap Anda sekarang telah menguasai hutan acak, algoritme naif bayes. Jika tidak, saya sarankan Anda meluangkan beberapa menit dan membaca tentangnya juga. Dalam artikel ini, saya akan memandu Anda melalui dasar-dasar pengetahuan lanjutan tentang algoritme pembelajaran mesin yang penting, mendukung mesin vektor.
Support Vector Machine atau mempunyai singkatannya adalah SVM adalah algoritme pembelajaran mesin yang diawasi yang dapat digunakan untuk tantangan klasifikasi atau regresi. Namun, ini banyak digunakan dalam masalah klasifikasi. Dalam algoritma SVM, kami memplot setiap item data sebagai titik dalam ruang n-dimensi (di mana n adalah jumlah fitur yang Anda miliki) dengan nilai setiap fitur menjadi nilai koordinat tertentu. Kemudian, kami melakukan klasifikasi dengan menemukan hyper-plane yang membedakan kedua kelas dengan sangat baik (lihat snapshot di bawah ini). Vektor Pendukung hanyalah koordinat pengamatan individu. Pengklasifikasi SVM adalah perbatasan yang paling baik memisahkan kedua kelas (hyper-plane / line).
Bagaimana cara kerjanya? Di atas, kami terbiasa dengan proses pemisahan dua kelas dengan bidang hiper. Sekarang pertanyaan yang membara adalah "Bagaimana kita bisa mengidentifikasi hyper-plane yang benar?". Jangan khawatir, ini tidak sesulit yang Anda pikirkan.
- Identifikasi bidang-hiper kanan (Skenario-1): Di sini, kami memiliki tiga bidang-hiper (A, B dan C). Sekarang, tentukan hyper-plane yang tepat untuk mengklasifikasikan bintang dan lingkaran. Anda perlu mengingat aturan umum untuk mengidentifikasi bidang-hiper kanan: "Pilih bidang-hiper yang memisahkan dua kelas dengan lebih baik". Dalam skenario ini, hyper-plane “B” telah melakukan pekerjaan ini dengan sangat baik.
- Identifikasi hyper-plane yang tepat (Skenario-2): Di sini, kita memiliki tiga hyper-planes (A, B dan C) dan semuanya memisahkan kelas dengan baik. Sekarang, Bagaimana kita bisa mengidentifikasi hyper-plane yang benar? Di sini, memaksimalkan jarak antara titik data terdekat (salah satu kelas) dan bidang-hiper akan membantu kita menentukan bidang-hiper yang tepat. Jarak ini disebut Margin. Di atas, Anda dapat melihat bahwa margin untuk bidang-hiper C lebih tinggi dibandingkan dengan A dan B. Oleh karena itu, kami menamai bidang-hiper kanan sebagai C. Alasan kilat lainnya untuk memilih bidang-hiper dengan margin lebih tinggi adalah ketahanan. Jika kita memilih hyper-plane yang memiliki margin rendah maka kemungkinan besar terjadi kesalahan klasifikasi.
- Identifikasi hyper-plane kanan (Skenario-3): Petunjuk: Gunakan aturan seperti yang dibahas di bagian sebelumnya untuk mengidentifikasi hyper-plane kanan. Beberapa dari Anda mungkin telah memilih hyper-plane B karena memiliki margin yang lebih tinggi dibandingkan dengan A. Tapi, berikut tangkapannya, SVM memilih hyper-plane yang mengklasifikasikan kelas secara akurat sebelum memaksimalkan margin. Di sini, hyper-plane B memiliki kesalahan klasifikasi dan A telah mengklasifikasikan semua dengan benar. Oleh karena itu, bidang-hiper kanan adalah A.
Dalam pengklasifikasi SVM, mudah untuk memiliki hyper-plane linier di antara kedua kelas ini. Tapi, pertanyaan penting lainnya yang muncul adalah, apakah kita perlu menambahkan fitur ini secara manual untuk memiliki hyper-plane.(Yazid)
Komentar