KOMPARASI PERFORMA MODEL KLASIFIKASI EMOSI DENGAN WORD EMBEDDING MENGGUNAKAN ALGORITMA SVM DAN RANDOM FOREST

Rachman, Muhammad Adam (2025) KOMPARASI PERFORMA MODEL KLASIFIKASI EMOSI DENGAN WORD EMBEDDING MENGGUNAKAN ALGORITMA SVM DAN RANDOM FOREST. Undergraduate thesis, UNIVERSITAS PEMBANGUNAN NASIONAL "VETERAN" JAWA TIMUR.

[img] Text (Cover)
20082010086-Cover.pdf

Download (568kB)
[img] Text (Bab 1)
20082010086-Bab 1.pdf

Download (90kB)
[img] Text (Bab 2)
20082010086-Bab 2.pdf
Restricted to Repository staff only until 3 February 2028.

Download (423kB)
[img] Text (Bab 3)
20082010086-Bab 3.pdf
Restricted to Repository staff only until 3 February 2028.

Download (173kB)
[img] Text (Bab 4)
20082010086-Bab 4.pdf
Restricted to Repository staff only until 3 February 2028.

Download (987kB)
[img] Text (Bab 5)
20082010086-Bab 5.pdf

Download (74kB)
[img] Text (Daftar Pustaka)
20082010086-Daftar pustaka.pdf

Download (90kB)
[img] Text (Lampiran)
20082010086-lampiran.pdf
Restricted to Repository staff only until 3 February 2028.

Download (343kB)

Abstract

Beragamnya emosi dari masyarakat dalam merespon dinamika pemerintahan yang sedang berlangsung saat ini sudah berlangsung dari tahun ke tahun. Banyak informasi yang tidak tersampaikan dengan baik karena kurangnya pemahaman masyarakat terkait konteks emosional yang terkandung dalam informasi tersebut. Salah satu pendekatan yang dapat dilakukan adalah dengan melakukan sebuah pengelompokkan emosi. Penelitian ini bertujuan untuk membandingkan performa algoritma Support Vector Machine (SVM) dan Random Forest yang diintegrasikan dengan teknik word embedding dalam klasifikasi emosi pada komentar YouTube berbahasa Indonesia terkait kebijakan kenaikan Uang Kuliah Tunggal (UKT) dan kebijakan Tabungan Perumahan Rakyat. Data pada penelitian ini sebanyak 3074 data, dan akan dibangun total 16 skenario pemodelan. Proses klasifikasi terdiri dari dua tahap yaitu klasifikasi emosi dan klasifikasi jenis emosi. Penggunaan teknik sampling dan rasio pembagian data memberikan hasil yang bervariasi di setiap model. Model dengan performa paling optimal untuk klasifikasi emosi adalah Random Forest dengan Word2Vec dengan hasil akurasi 86%, sedangkan model klasifikasi jenis emosi dengan performa paling optimal adalah Support Vector Machine dengan FastText dengan nilai akurasi sebesar 77%. Word2Vec mampu menangkap hubungan semantis kata cukup baik walaupun jumlah dataset yang digunakan relatif kecil. Di satu sisi lain, FastText mampu mengimbangi performa Word2Vec karena kemampuannya memanfaatkan representasi berbasis subkata untuk menangani kata yang tidak ada dalam korpus.

Item Type: Thesis (Undergraduate)
Contributors:
ContributionContributorsNIDN/NIDKEmail
Thesis advisorAgussalim, AgussalimNIDN0911088501agussalim.si@upnjatim.ac.id
Thesis advisorWahyuni, Eka DyarNIDN0001128406ekawahyuni.si@upnjatim.ac.id
Subjects: Q Science > Q Science (General)
Q Science > QA Mathematics > QA76.6 Computer Programming
T Technology > T Technology (General)
Divisions: Faculty of Computer Science > Departemen of Information Systems
Depositing User: Muhammad Adam Rachman
Date Deposited: 11 Feb 2025 07:43
Last Modified: 11 Feb 2025 07:43
URI: https://repository.upnjatim.ac.id/id/eprint/34484

Actions (login required)

View Item View Item