Iseng-iseng melakukan studi kecil-kecilan melakukan klasifikasi untuk Machine Learning pada Weka, karena saya akan menggunakan salah satu klasifikasi untuk tugas akhir dan akhirnya saya mencobanya pada weka. Sewaktu kuliah saya pernah diajarkan klasifikasi menggunakan weka pada kuliah Data Mining, namun karena saya termasuk mahasiswa yang malas dan kurang memperhatikan (penyakit mahasiswa, ato saya aja kali ya) sehingga mata kuliah tersebut kurang bisa di tangkap oleh saya dengan baik.
Klasifikasi yang akan saya coba adalah Bayesian Network, Decision Tree dan Support Vector Machine (SVM). apa hanya itu classifier yang ada?Tentu tidak, banyak sekali klasifikasi yang ada namun ketiga classifier tersebut yang lumayan canggih sedang populer. oke, langsung saja kita akan membahas ketiga classifier tersebut, oh iya ketiga classifier tersebut saya coba pada software Data Mining Weka 3.6.7 dengan tambahan libSVM (library terpisah dari weka).
Pertama-tama tentukan datanya , disini saya menggunakan data yang sudah ada di weka yaitu iris.arff, lalu kita pakai filter Discretize untuk mendiskretisasikan nilai numerik yang ada pada data.
Lalu pada tab classifiy kita memilih classifier yang akan kita gunakan, disini Bayesian Network, Decision Tree dan SVM. Test Options yang kita gunakan adalah Cross-Validation dengan nilai, berikut pilihan Test Options :
• Use training set : data uji dengan data latih sama
• Supplied test set : data uji dengan data latih benar-benar berbeda
• Cross-Validation : membagi data menjadi k-subset. Misalnya Folds yang digunakan 10, 9 akan digunakan sebagai data training dan 1 sebagai data uji sampai seluruh data.
• Percentage Split : Membagi data sesuai dengan parameter yang akan menjadi data training.
Berikut hasilnya :
Bayesian Network
Decision Tree
SVM
Dilihat dari hasil Akurasi / Correctly Classified Instances SVM mendapatkan akurasi yang lebih tinggi dibanding dengan Bayesian Network dan Decision Tree, namun dalam proses klasifikasi SVM memproses lebih lama. Mungkin dengan data yang berbeda dapat menghasilkan akurasi yang berbeda, tinggal mencoba-coba dan pakai yang terbaik.
Sumber Bacaan :
- LibSVM