Optimasi Random Forest Menggunakan Kombinasi SMOTE-ENN dan Seleksi Fitur RFECV untuk Prediksi Penyakit Jantung

Aulia, Sabrina Putri (2025) Optimasi Random Forest Menggunakan Kombinasi SMOTE-ENN dan Seleksi Fitur RFECV untuk Prediksi Penyakit Jantung. Undergraduate thesis, UPN Veteran Jawa Timur.

[img] Text (COVER)
21081010048-cover.pdf

Download (1MB)
[img] Text (BAB I)
21081010048-bab1.pdf

Download (203kB)
[img] Text (BAB II)
21081010048-bab2.pdf
Restricted to Repository staff only until 27 May 2027.

Download (675kB)
[img] Text (BAB III)
21081010048-bab3.pdf
Restricted to Repository staff only until 27 May 2027.

Download (744kB)
[img] Text (BAB IV)
21081010048-bab4.pdf
Restricted to Repository staff only until 27 May 2027.

Download (2MB)
[img] Text (BAB V)
21081010048-bab5.pdf

Download (154kB)
[img] Text (DAFTAR PUSTAKA)
21081010048-daftarpustaka.pdf

Download (187kB)

Abstract

Penyakit jantung merupakan penyebab kematian utama secara global, dengan dampak signifikan terhadap beban ekonomi dan produktivitas masyarakat. Klasifikasi penyakit jantung diperlukan untuk mendukung deteksi dini dan penanganan lebih cepat, sehingga dapat menurunkan risiko komplikasi yang fatal. Penelitian ini bertujuan untuk meningkatkan akurasi klasifikasi penyakit jantung melalui optimasi algoritma Random Forest menggunakan kombinasi metode Synthetic Minority Over-sampling Technique–Edited Nearest Neighbors (SMOTE-ENN) dan seleksi fitur Recursive Feature Elimination with Cross Validation (RFECV). Penelitian ini membandingkan empat skenario berbeda, yaitu tanpa SMOTE-ENN dan RFECV, hanya dengan SMOTE-ENN, hanya dengan RFECV, serta kombinasi SMOTE-ENN dan RFECV. Evaluasi dilakukan pada rasio pembagian data latih dan uji (70:30, 75:25, dan 80:20) dengan variasi parameter rasio sampling dan jumlah tetangga pada SMOTE-ENN serta jumlah lipatan pada RFECV. Hasil terbaik diperoleh pada kombinasi SMOTE-ENN dengan rasio sampling 1.0 dan 5 tetangga, serta RFECV dengan 3-Fold pada rasio data 80:20. Model menghasilkan akurasi 95.7%, precision 89.6%, recall 98.4%, dan F1-score 93.8%, yang menunjukkan bahwa kombinasi metode ini dapat meningkatkan kinerja Random Forest dalam klasifikasi penyakit jantung.

Item Type: Thesis (Undergraduate)
Contributors:
ContributionContributorsNIDN/NIDKEmail
Thesis advisorRahmat, BasukiNIDN5972549basukirahmat.if@upnjatim.ac.id
Thesis advisorJunaidi, AchmadNIDN0710117803achmadjunaidi.if@upnjatim.ac.id
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Computer Science > Departemen of Informatics
Depositing User: Sabrina Putri Aulia
Date Deposited: 27 May 2025 06:16
Last Modified: 27 May 2025 06:16
URI: https://repository.upnjatim.ac.id/id/eprint/36750

Actions (login required)

View Item View Item