Tsani, Faris Nur (2026) PENINGKATAN ROBUSTNESS CNN PADA DETEKSI LAGU AI MENGGUNAKAN DATA AUGMENTATION. Undergraduate thesis, UPN Veteran Jawa Timur.
|
Text (Cover)
22083010076_Cover.pdf Download (947kB) |
|
|
Text (BAB 1)
22083010076_Bab 1.pdf Download (384kB) |
|
|
Text (BAB 2)
22083010076_Bab 2.pdf Restricted to Repository staff only until 6 March 2029. Download (1MB) |
|
|
Text (BAB 3)
22083010076_Bab 3.pdf Restricted to Repository staff only until 6 March 2029. Download (1MB) |
|
|
Text (BAB 4)
22083010076_Bab 4.pdf Restricted to Repository staff only until 6 March 2029. Download (1MB) |
|
|
Text (BAB 5)
22083010076_Bab 5.pdf Download (191kB) |
|
|
Text (DAFTAR PUSTAKA)
22083010076_Daftar Pustaka.pdf Download (235kB) |
|
|
Text (LAMPIRAN)
22083010076_Lampiran.pdf Restricted to Repository staff only Download (285kB) |
Abstract
Perkembangan teknologi Artificial Intelligence (AI) telah memungkinkan produksi lagu secara otomatis dengan kualitas yang menyerupai karya manusia, sehingga menimbulkan tantangan dalam membedakan lagu AI-generated dan human-generated. Penelitian ini bertujuan untuk meningkatkan robustness model Convolutional Neural Network (CNN) dalam mendeteksi lagu AI melalui penerapan data augmentation serta menganalisis pengaruh kompleksitas arsitektur Residual Network (ResNet-18, ResNet-34, dan ResNet-50) terhadap performa dan generalisasi model. Representasi audio menggunakan spektogram berbasis Short-Time Fourier Transform (STFT) sebagai input model. Evaluasi dilakukan pada data utama serta dua skenario robustness, yaitu manipulasi sinyal (noise, pitch shifting, dan time stretching) dan pengujian lintas genre sebagai bentuk out-of-distribution testing. Hasil penelitian menunjukkan bahwa peningkatan kedalaman arsitektur tidak selalu berbanding lurus dengan peningkatan robustness. Penerapan data augmentation secara konsisten meningkatkan ketahanan model terhadap manipulasi sinyal pada seluruh arsitektur, dengan peningkatan paling signifikan terjadi pada ResNet-18 (64,79% menjadi 73,71%). Pada pengujian lintas genre, performa model relatif stabil dengan atau tanpa augmentasi. Temuan ini menunjukkan adanya trade-off antara kompleksitas model dan generalisasi, serta menegaskan bahwa data augmentation berperan penting dalam memperluas distribusi pembelajaran sehingga meningkatkan robustness model terhadap variasi kondisi audio. Penelitian ini juga mengintegrasikan metode Explainable Artificial Intelligence (XAI) berbasis Grad-CAM untuk meningkatkan interpretabilitas hasil klasifikasi.
| Item Type: | Thesis (Undergraduate) | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Contributors: |
|
||||||||||||
| Subjects: | Q Science > QA Mathematics > QA76.6 Computer Programming | ||||||||||||
| Divisions: | Faculty of Computer Science > Departemen of Data Science | ||||||||||||
| Depositing User: | Faris Nur Tsani | ||||||||||||
| Date Deposited: | 09 Mar 2026 07:47 | ||||||||||||
| Last Modified: | 09 Mar 2026 07:47 | ||||||||||||
| URI: | https://repository.upnjatim.ac.id/id/eprint/50216 |
Actions (login required)
![]() |
View Item |
