Artikel Umum‎ > ‎

Overfitting pada Data Mining

posted Nov 17, 2012, 10:15 AM by Feris Thia   [ updated Nov 17, 2012, 10:20 AM ]
Seperti yang kita ketahui, untuk menghasilkan model prediktif pada machine learning digunakan training set (historical data) yang diharapkan dapat memberikan prediksi data yang akurat.

Untuk menunjang hal tersebut, ketika training set menghasilkan model. Maka model itu akan diperbandingkan kembali dengan training set tersebut untuk mendapatkan rasio kesalahan "plotting".

Nah, kadangkala model kita terlalu "pintar" sehingga rasio kesalahan sangat kecil ketika dibandingkan dengan training set tersebut. Ini menjadi bahaya karena sebenarnya tidak realistis untuk memprediksi data yang belum diketahui.

Kondisi ini sering disebut dengan overfitting pada ranah data mining.

[todo]
Comments