Classification with Decision Tree
(Klasifikasi dengan Pohon Keputusan)
Di dalam metode klasifikasi dengan menggunakan "Decision Tree", terdapat beberapa cara :
1. Metode Hunt
2. Metode CART
3. Metode ID3, C4.5
4. SLIQ
5. SPRINT
Pemecahan Tree digolongkan menjadi 2, yaitu :
- 2 Way Split
- Multi Way Split
Pemecahan split terbaik pada tree dapat diukur dari :
- Purity dan Impurity
- Makin besar nilai purity, semakin baik, begitu pula sebaliknya
- Makin kecil nilai impurity, semakin baik, begitu pula sebaliknya
- Homogeneous
- Makin homogen, makin baik
Menghitung nilai impurity dari suatu "node" pada tree yaitu dapat dengan :
- GINI Index
- Entrophy
- Rumusnya : Entrophy = -P( x | y ) log P( x, y)
- Misclassification Error
- Rumusnya : Error = 1 - Max P( x | y )
Di dalam tree, terdapat dua macam "Stop Tree", yaitu :
- Stop expand node jika isi sudah sesuai dengan class-classnya
- Stop expand node jika isi sudah sesuai dengan nilai atribut
Beberapa kelebihan dari klasifikasi dengan menggunakan "Decision Tree" yaitu :
- Cepat komputasinya / dalam mengklasifikasikannya
- Mudah membangunnya untuk tree yang berukuran kecil
- Akurasi tinggi
- Mudah dimengerti
- Mudah dibangun untuk data yang sudah jelas aturannya
- Dapat diaplikasikan ke dalam problem secara real
- Dapat untuk memproses data berbentuk numerik maupun kategorial
Beberapa kelemahan pada metode "Decision Tree" yaitu :
- Underfitting
- Overfitting
- Terbatas hanya memiliki 1 buah output
- Tidak stabil
0 comments:
Post a Comment