Perhitungan Algoritma Cart

Daftar Isi

    LancangKuning CART adalah singkatan dari kata Classification and Regression Tree. CART adalah salah satu metode atau sebuah algoritma dari salah satu teknik eksplorasi data yaitu teknik pohon keputusan yang sebelumnya sudah ada dijelaskan.

    CART dikembangkan sebagai alat untuk melakukan analisis klasifikasi pada alat untuk mengubah respon baik yang nominal dan ordinal serta kontinu. CART menghasilkan suatu pohon klasifikasi jika alat pengubah tersebut mempunyai respon kategori dan menghasilkan pohon regresi jika pengubah responnya kontinu. Mulai tingkat pada kesalahan yang paling kecil yang terdapat pada pohon klasifikasi yang dihasilkan akan cenderung membuat pohon ini digunakan untuk memperkirakan respon.

    Prinsip dari metode pohon klasifikasi ini adalah memilah seluruh amatan menjadi dua buah bahan gugus amatan dan memilah kembali gugus amatan tersebut menjadi gugus berikutnya dan memperoleh jumlah amatan minimal tiap gugus berikutnya.

    Algoritma Cart dapat digunakan sebagai alat klasifikasi penerima program bantuan berdasarkan variabel yang ada agar memberikan hasil yang dapat mempermudah penentuan calon penerima bantuan.

    1. Data Mining

    Pengertian data mining ini adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan pada suatu database. Data Mining ini adalah suatu proses yang digunakan sebagai teknik menghitung seperti statistik, matematika, Artificial Intelligence atau bisa disebut dengan kecerdasan buatan, pembelajaran mesin atau machine learning untuk mengidenntifikasi informasi yang berguna dan bermanfaat yang juga terkait dari berbagai basis data besar.

    1. Algoritma CART

    Adapun langkah – langkah dari Algoritma Cart ini, yaitu:

    1. Menyusun calon cabang seluruh variabel seorang prediksi secara lengkap. Daftar yang berisi tentang calon cabang yang sudah disebutkan sebelumnya disebut sebagai calon cabang mutakhir.
    2. Menilai kinerja keseluruhan calon cabang yang ada di daftar pada calon cabang mutakhir dengan menghitung nilai besaran kesesuaian yang nanti dijelaskan.
    3. Menentukan manakah calon cabang yang akan dijadikan sebagai cabang dengan memilih calon cabang yang mempunyai nilai kesesuaian terbesar.

    Untuk menghitung menggunakan Algoritma CART yaitu adalah menentukan puncak pohon keputusan terlebih dahulu. Diambil dari tiga atribut utama yaitu terdapat pada table nilai rata – rata, gaji orang tua dan jumlah tanggungan orang tua kemudian disusun menjadi calon cabang. Lalu dihitung dari nilai kandidat split purity left dan purity right. Selanjutnya mulai menghitung P(j|tL) dan P(j|tR) untuk kemungkinan bantuan biaya pendidikan.

    Kemudian menghitung nilai kesesuaian untuk calon cabang dengan hasil perhitungan cabang pertama. Hasil perhitungan kesesuaian untuk calon cabang, menunjukkan bahwa calon cabang tertinggi nilai besarnya adalah nomor calon cabang 9 sebesar 18,37 terdapat pada cabang pada posisi kiri dari jumlah tanggungan kecil sama dengan 3 dan cabang pada posisi kanan terdapat jumlah tanggungan besar dari 3.

    Maka berarti calon cabang ini dipilih sebagai root node pada tahap ini. Karena cabang selanjutnya memiliki jumlah tanggungan kecil sama dengan 3, juga cabang dari sebelah kanan memiliki tanggungan besar dari 3, belum memberikan suatu noktah keputusan yaitu keduanya masih memiliki anggota dengan dua pilihan yaitu iya dan tidak.

    Maka kedua dari cabang ini akan bercabang lalu cabang lainnya akan terus dihitung dengan cara yang sama seperti tadi. Setelah melakukan analisis, perancangan dan implementasi serta pengujian tadi, maka dapat disimpulkan bahwa aplikasi telah berhasil dibuat dan diujicobakan untuk mengimplementasikan CART pada penentuan calon penerima bantuan biaya pendidikan yang telah ditentukan.

    Ada juga cara penjelasan CART untuk membentuk pohon keputusan. Tidak beda jauh dari langkah sebelumnya yang sudah dibuat diatas tadi, disini menambahkan dengan menentukan root dengan memilih cabang yang memiliki nilai kesesuaian. Setelah diperoleh model pohon keputusan selanjutnya evaluasi tingkat akurasi Algoritma dilakukan dengan menggunakan confussion matriks dan curva ROC (Receiver Operating Characterictics) atau AUC (Area Under Cover). Teknik validasi yang digunakannya adalah cross validasi pada Rapid Miner dan teknik pengambilan sampel dengan menggunakan stratified sampling atau pengambilan sampel dengan memperhatikan strata atau disebut dengan tingkatan pada populasi.

    Cara kerja aplikasi yang isinya dengan menggunakan CART dengan cara memasukkan data identitas calon yaitu terdapat nama, alamat lalu memasukkan data yang merupakan variabel yang berpengaruh terhadap proses klasifikasi yang isinya terdapat umur, jenis kelamin pendidikan atau pekerjaan dan lain sebagainya. Kemudian mengklik tombol klasifikasi dan muncul hasil klasifikasi diterima atau tidaknya calon penerima bantuan ini.

    Variabel pekerjaan menjadi root yang tinggi pada pohon keputusan CART yang memiliki pengaruh dalam menentukan penerimaan calon bantuan apakah mereka diterima atau tidaknya. Dari hasil yang dilakukan, memperoleh hasil bahwa akurasi terbaik ada pada rasio data training sebesar 85% menggunakan 105 data dengan nilai akurasi yang sangat besar yaitu 98%.

    Data yang digunakan ini begitu berpengaruh pada tingkat akurasi. Hal ini bisa dilihat ketika dilakukan percobaan dari 55% sampai dengan 85% yang mengalami kenaikan akurasi, namun berada pada 95% data training, dan akurasi ini mengalami penurunan yang menurun hingga 97,3%. Hal ini sebanding dengan keadaan kurva yang memiliki nilai keakurasian AUC dan termasuk dalam failure classification.(Yazid H)

    Bagikan Artikel

    data.label
    data.label
    data.label
    data.label
    Beri penilaian untuk artikel Perhitungan Algoritma Cart
    Sangat Suka

    100%

    Suka

    0%

    Terinspirasi

    0%

    Tidak Peduli

    0%

    Marah

    0%

    Komentar