PENINGKATAN ROBUSTNESS CNN PADA DETEKSI LAGU AI MENGGUNAKAN DATA AUGMENTATION

Tsani, Faris Nur (2026) PENINGKATAN ROBUSTNESS CNN PADA DETEKSI LAGU AI MENGGUNAKAN DATA AUGMENTATION. Undergraduate thesis, UPN Veteran Jawa Timur.

[img] Text (Cover)
22083010076_Cover.pdf

Download (947kB)
[img] Text (BAB 1)
22083010076_Bab 1.pdf

Download (384kB)
[img] Text (BAB 2)
22083010076_Bab 2.pdf
Restricted to Repository staff only until 6 March 2029.

Download (1MB)
[img] Text (BAB 3)
22083010076_Bab 3.pdf
Restricted to Repository staff only until 6 March 2029.

Download (1MB)
[img] Text (BAB 4)
22083010076_Bab 4.pdf
Restricted to Repository staff only until 6 March 2029.

Download (1MB)
[img] Text (BAB 5)
22083010076_Bab 5.pdf

Download (191kB)
[img] Text (DAFTAR PUSTAKA)
22083010076_Daftar Pustaka.pdf

Download (235kB)
[img] Text (LAMPIRAN)
22083010076_Lampiran.pdf
Restricted to Repository staff only

Download (285kB)

Abstract

Perkembangan teknologi Artificial Intelligence (AI) telah memungkinkan produksi lagu secara otomatis dengan kualitas yang menyerupai karya manusia, sehingga menimbulkan tantangan dalam membedakan lagu AI-generated dan human-generated. Penelitian ini bertujuan untuk meningkatkan robustness model Convolutional Neural Network (CNN) dalam mendeteksi lagu AI melalui penerapan data augmentation serta menganalisis pengaruh kompleksitas arsitektur Residual Network (ResNet-18, ResNet-34, dan ResNet-50) terhadap performa dan generalisasi model. Representasi audio menggunakan spektogram berbasis Short-Time Fourier Transform (STFT) sebagai input model. Evaluasi dilakukan pada data utama serta dua skenario robustness, yaitu manipulasi sinyal (noise, pitch shifting, dan time stretching) dan pengujian lintas genre sebagai bentuk out-of-distribution testing. Hasil penelitian menunjukkan bahwa peningkatan kedalaman arsitektur tidak selalu berbanding lurus dengan peningkatan robustness. Penerapan data augmentation secara konsisten meningkatkan ketahanan model terhadap manipulasi sinyal pada seluruh arsitektur, dengan peningkatan paling signifikan terjadi pada ResNet-18 (64,79% menjadi 73,71%). Pada pengujian lintas genre, performa model relatif stabil dengan atau tanpa augmentasi. Temuan ini menunjukkan adanya trade-off antara kompleksitas model dan generalisasi, serta menegaskan bahwa data augmentation berperan penting dalam memperluas distribusi pembelajaran sehingga meningkatkan robustness model terhadap variasi kondisi audio. Penelitian ini juga mengintegrasikan metode Explainable Artificial Intelligence (XAI) berbasis Grad-CAM untuk meningkatkan interpretabilitas hasil klasifikasi.

Item Type: Thesis (Undergraduate)
Contributors:
ContributionContributorsNIDN/NIDKEmail
Thesis advisorSaputra, Wahyu Syaifullah Jauharis0725088601wahyu.s.j.saputra.if@upnjatim.ac.id
Thesis advisorPratama, Alfan Rizaldy19990606 202406 1 001alfan.fasilkom@upnjatim.ac.id
Subjects: Q Science > QA Mathematics > QA76.6 Computer Programming
Divisions: Faculty of Computer Science > Departemen of Data Science
Depositing User: Faris Nur Tsani
Date Deposited: 09 Mar 2026 07:47
Last Modified: 09 Mar 2026 07:47
URI: https://repository.upnjatim.ac.id/id/eprint/50216

Actions (login required)

View Item View Item