‘Azizah, Luthfiyatul (2019) METODE MULTINOMIAL NAÏVE BAYES CLASSIFIER DAN REDUKSI FITUR MENGGUNAKAN DF THRESHOLDING UNTUK KLASIFIKASI GENRE BERDASARKAN BLURB PADA MEDIA BERBAGI CERITA ONLINE. Undergraduate thesis, UPN Veteran Jawa Timur.
|
Text (COVER)
2.pdf Download (976kB) | Preview |
|
|
Text (BAB 1)
4. BAB I.pdf Download (22kB) | Preview |
|
Text (BAB 2)
5. BAB II.pdf Restricted to Repository staff only Download (379kB) |
||
Text (BAB 3)
6. BAB III.pdf Restricted to Repository staff only Download (478kB) |
||
Text (BAB 4)
7. BAB IV.pdf Restricted to Repository staff only Download (1MB) |
||
|
Text (BAB 5)
8. BAB V.pdf Download (13kB) | Preview |
|
|
Text (DAFTAR PUSTAKA)
9. DAFTAR PUSTAKA.pdf Download (146kB) | Preview |
Abstract
Saat ini banyak media online yang menyediakan bacaan berupa cerita-cerita untuk bisa dinikmati oleh para pembaca. Untuk menentukan sebuah bacaan masuk ke genre tertentu bukanlah sesuatu yang mudah apalagi bacaan yang perbedaannya tidak terlalu jelas. Penelitian ini bertujuan untuk melakukan prediksi menggunakan metode Multinomial Naïve Bayes Classifier (MNBC) dipadukan dengan pembobotan kata yaitu Term Frequency Inverse Document Frequency (TF IDF) dan reduksi fitur menggunakan Document Frequency Thresholding. Data yang digunakan dalam penelitian ini diambil dari media berbagi cerita online yaitu https://www.wattpad.com/ berjumlah 500 data yang terdiri dari lima kategori yaitu humor, horror, roman, misteri dan spiritual. Proses pertama adalah text prossesing yang terdiri dari empat tahap yaitu case folding, tokenizing, filtering dan stemming. Proses selanjutnya adalah pembobotan kata menggunakan TF IDF dan reduksi fitur menggunakan DF Thresholding. Kemudian proses klasifikasi menggunakan Multinomial Naïve Bayes Classifier. Dari hasil penelitian ini diketahui bahwa DF Thresholding meningkatkan nilai akurasi, presisi dan recall. Rata-rata nilai yang dihasilkan oleh TF IDF + MNBC adalah akurasi = 0.80, presisi = 0.80, dan recall = 0.81. Dan rata-rata nilai dari TF IDF + DF Thresholding + MNBC adalah akurasi = 0. 86, presisi = 0.87, dan recall = 0.87.
Item Type: | Thesis (Undergraduate) | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Contributors: |
|
||||||||||||
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science | ||||||||||||
Divisions: | Faculty of Computer Science > Departemen of Informatics | ||||||||||||
Depositing User: | Lisa nadya irawan | ||||||||||||
Date Deposited: | 04 Mar 2024 04:11 | ||||||||||||
Last Modified: | 04 Mar 2024 04:11 | ||||||||||||
URI: | http://repository.upnjatim.ac.id/id/eprint/21023 |
Actions (login required)
View Item |