Lecturer Note of Decision Tree

Classification with Decision Tree
(Klasifikasi dengan Pohon Keputusan)


Di dalam metode klasifikasi dengan menggunakan "Decision Tree", terdapat beberapa cara :
1. Metode Hunt
2. Metode CART
3. Metode ID3, C4.5
4. SLIQ
5. SPRINT

Pemecahan Tree digolongkan menjadi 2, yaitu :
  1. 2 Way Split
  2. Multi Way Split

Pemecahan split terbaik pada tree dapat diukur dari :
  • Purity dan Impurity
    • Makin besar nilai purity, semakin baik, begitu pula sebaliknya
    • Makin kecil nilai impurity, semakin baik, begitu pula sebaliknya
  • Homogeneous
    • Makin homogen, makin baik

Menghitung nilai impurity dari suatu "node" pada tree yaitu dapat dengan :
  1. GINI Index
  2. Entrophy
    • Rumusnya : Entrophy = -P( x | y ) log P( x, y)
  3. Misclassification Error
    • Rumusnya : Error = 1 - Max P( x | y )

 Di dalam tree, terdapat dua macam "Stop Tree", yaitu :
  • Stop expand node jika isi sudah sesuai dengan class-classnya
  • Stop expand node jika isi sudah sesuai dengan nilai atribut

Beberapa kelebihan dari klasifikasi dengan menggunakan "Decision Tree" yaitu :
  1. Cepat komputasinya / dalam mengklasifikasikannya
  2. Mudah membangunnya untuk tree yang berukuran kecil
  3. Akurasi tinggi
  4. Mudah dimengerti
  5. Mudah dibangun untuk data yang sudah jelas aturannya
  6. Dapat diaplikasikan ke dalam problem secara real
  7. Dapat untuk memproses data berbentuk numerik maupun kategorial

Beberapa kelemahan pada metode "Decision Tree" yaitu :
  1. Underfitting
  2. Overfitting
  3. Terbatas hanya memiliki 1 buah output
  4. Tidak stabil

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

0 comments:

Post a Comment

UNIVERSITAS TRISAKTI - Takwa Tekun Terampil - Asah Asih Asuh - Setia Satria Sportif

Total Pageviews