Perbandingan Hard Voting dan Soft Voting dalam Klasifikasi Diabetes Mellitus dengan Feature Selection = Comparison of Hard Voting and Soft Voting in Diabetes Mellitus Classification with Feature Selection


NURFADILLAH, NURFADILLAH (2026) Perbandingan Hard Voting dan Soft Voting dalam Klasifikasi Diabetes Mellitus dengan Feature Selection = Comparison of Hard Voting and Soft Voting in Diabetes Mellitus Classification with Feature Selection. Skripsi thesis, Universitas Hasanuddin.

[thumbnail of Cover]
Preview
Image (Cover)
D121211004-Cover.jpg

Download (323kB) | Preview
[thumbnail of Bab1-2] Text (Bab1-2)
D121211004-1-2(FILEminimizer).pdf

Download (733kB)
[thumbnail of Dapus] Text (Dapus)
D121211004-dp(FILEminimizer).pdf

Download (128kB)
[thumbnail of Full Text] Text (Full Text)
D121211004-fulll(FILEminimizer).pdf
Restricted to Repository staff only until 5 January 2028.

Download (1MB)

Abstract (Abstrak)

Latar Belakang. Diabetes mellitus merupakan penyakit kronis yang ditandai oleh tingginya kadar glukosa darah akibat gangguan produksi atau fungsi insulin. Kondisi ini dapat menimbulkan komplikasi penyakit serius jika tidak terdeteksi dan ditangani sejak dini. Namun, banyak penderita yang tidak menyadari penyakitnya hingga komplikasi muncul, sehingga diperlukan sistem skrining awal berbasis data mining. Berbagai metode machine learning telah diterapkan untuk mendeteksi diabetes, namun setiap model tunggal memiliki keterbatasan masing-masing. Oleh karena itu, metode ensemble seperti Hard Voting dan Soft Voting dikombinasikan dengan teknik seleksi fitur Recursive Feature Elimination with Cross-Validation (RFECV) diharapkan dapat meningkatkan akurasi dan stabilitas model klasifikasi diabetes. Tujuan. Penelitian ini bertujuan untuk membandingkan efektivitas metode Hard Voting dan Soft Voting dalam klasifikasi diabetes serta menganalisis pengaruh penerapan seleksi fitur RFECV terhadap peningkatan performa model. Metode. Penelitian ini menggunakan tiga model dasar yaitu Logistic Regression, Random Forest, dan Decision Tree. Model kemudian digabungkan menggunakan metode ensemble yaitu Hard Voting dan Soft Voting. Untuk meningkatkan kinerja model, dilakukan seleksi fitur menggunakan RFECV pada setiap base model. Pengujian dilakukan menggunakan metrik evaluasi accuracy, precision, recall, dan F1-score guna menilai performa model sebelum dan sesudah penerapan RFECV. Hasil. Hasil pengujian menunjukkan bahwa model individu Logistic Regression memiliki performa paling stabil di antara ketiga model dasar dengan nilai akurasi sebesar 0,974. Setelah penerapan metode RFECV, khususnya dengan base model Logistic Regression, sebagian besar model mengalami peningkatan pada metrik evaluasi, terutama pada precision dan F1-score. Sementara itu, model Soft Voting dengan pembobotan menggunakan Particle Swarm Optimization (PSO) memberikan performa terbaik dari sisi recall sebesar 0,864 serta accuracy sebesar 0,968, yang menunjukkan kemampuan klasifikasi yang sangat baik dalam membedakan pasien diabetes dan non-diabetes. Kesimpulan. Kombinasi metode ensemble Soft Voting dan teknik seleksi fitur RFECV terbukti mampu meningkatkan performa klasifikasi diabetes secara signifikan dibandingkan dengan model individu maupun Hard Voting. Pendekatan ini dapat digunakan sebagai sistem pendukung keputusan untuk skrining awal penyakit diabetes secara lebih efektif.

Keyword : Diabetes Mellitus; Machine Learning; Hard Voting; Soft Voting; RFECV.

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: Diabetes Mellitus; Machine Learning; Hard Voting; Soft Voting; RFECV.
Subjects: T Technology > TA Engineering (General). Civil engineering (General)
Divisions (Program Studi): Fakultas Teknik > Teknik Informatika
Depositing User: Rasman
Date Deposited: 01 Apr 2026 05:25
Last Modified: 01 Apr 2026 05:25
URI: http://repository.unhas.ac.id:443/id/eprint/54890

Actions (login required)

View Item
View Item