PREDIKSI SOFTWARE DEFECTS PADA LEVEL PACKAGE PROJECT JAVA MENGGUNAKAN METODE ENSEMBLE LEARNING

Zahra, Nabila Athifah (2025) PREDIKSI SOFTWARE DEFECTS PADA LEVEL PACKAGE PROJECT JAVA MENGGUNAKAN METODE ENSEMBLE LEARNING. Undergraduate thesis, Universitas Pembangunan Nasional Veteran Jawa Timur.

[img] Text (COVER)
21082010053.-cover.pdf

Download (961kB)
[img] Text (BAB 1)
21082010053.-bab1.pdf

Download (163kB)
[img] Text (BAB 2)
21082010053.-bab2.pdf
Restricted to Repository staff only until 26 May 2028.

Download (682kB)
[img] Text (BAB 3)
21082010053.-bab3.pdf
Restricted to Repository staff only until 26 May 2028.

Download (389kB)
[img] Text (BAB 4)
21082010053.-bab4.pdf
Restricted to Repository staff only until 26 May 2028.

Download (6MB)
[img] Text (BAB 5)
21082010053.-bab5.pdf

Download (12kB)
[img] Text (DAFTAR PUSTAKA)
21082010053.-daftarpustaka.pdf

Download (88kB)
[img] Text (LAMPIRAN)
21082010053.-lampiran.pdf
Restricted to Repository staff only until 26 May 2028.

Download (914kB)

Abstract

Dibandingkan dengan pengujian manual dan otomatis, pengujian berbasis AI menawarkan pendekatan yang lebih cerdas dengan memungkinkan prediksi lebih awal terhadap cacat perangkat lunak serta meningkatkan efisiensi pengujian. Penelitian ini berfokus pada prediksi cacat perangkat lunak dengan menganalisis software metrics Chidamber & Kemerer menggunakan algoritma tree-based ensemble. Sebanyak 8.924 data dikumpulkan dari lima proyek Java open-source di Github. Pelabelan dilakukan menggunakan data historis bug pada pesan commit di repositori. Masalah ketidakseimbangan kelas diatasi dengan teknik undersampling pada tahap data preprocessing. Dataset akhir terdiri dari 1.314 instance (746 bersih dan 568 buggy). Model prediktif dikembangkan dalam dua tahap: base learner (level-0) menggunakan algoritma AdaBoost, Random Forest (RF), Extra Trees (ET), Gradient Boosting (GB), Histogram-based Gradient Boosting (HGB), XGBoost (XGB), dan CatBoost (CAT), serta meta-learner (level-1) yang mengoptimalkan hasil dengan teknik ensemble stacking. Model stacking mencapai skor ROC-AUC sebesar 0.8575, mengungguli semua classifier individu dan bisa membedakan modul project Java yang cacat dan tidak cacat. Peningkatan performa antara model dasar dan stacking divalidasi secara statistik melalui uji t berpasangan, dengan semua nilai p di bawah 0,05. Kontribusi stacking pada peningkatan performa terbesar terjadi pada Gradient Boosting (+0,0411, p = 0,0030). Deployment model dilakukan menggunakan kerangka kerja Robotic Process Automation (RPA) melalui UIPath, memungkinkan prediksi hanya dengan memasukkan tautan repositori. Proses prediksi hanya membututhkan waktu 2-6 menit bergantung kompleksitas proyek. Temuan ini membuktikan bahwa ensemble stacking menghasilkan model prediksi yang lebih andal dan implementasi model dapat membantu memprediksi software defects lebih awal dalam siklus hidup pengembangan perangkat lunak (SDLC).

Item Type: Thesis (Undergraduate)
Contributors:
ContributionContributorsNIDN/NIDKEmail
Thesis advisorAnjani, AmaliaNIDN0712089201amalia_anjani.fik@upnjatim.ac.id
Thesis advisorSatria, DhianNIDN0722058601dhian.satria@upnjatim.ac.id
Uncontrolled Keywords: Software Defects, Java, Tree-Based Ensemble, Stacking, RPA Framework, UIPath
Subjects: T Technology > T Technology (General)
T Technology > T Technology (General) > T385 Computer Graphics
Divisions: Faculty of Computer Science > Departemen of Information Systems
Depositing User: Nabila Athifah Zahra
Date Deposited: 26 May 2025 03:02
Last Modified: 26 May 2025 03:02
URI: https://repository.upnjatim.ac.id/id/eprint/36513

Actions (login required)

View Item View Item