Maharani, Masti Fatchiyah (2018) IDENTIFIKASI KECOCOKAN DOKUMEN TANYA JAWAB MENGGUNAKAN METODE TEXT MINING DAN VECTOR SPACE MODEL. Undergraduate thesis, UPN Veteran Jawa Timur.
|
Text (COVER)
Laporan Skripsi baru-1-11.pdf Download (1MB) | Preview |
|
|
Text (BAB 1)
Laporan Skripsi baru-12-15.pdf Download (137kB) | Preview |
|
Text (BAB 2)
Laporan Skripsi baru-16-33.pdf Restricted to Repository staff only Download (409kB) |
||
Text (BAB 3)
Laporan Skripsi baru-34-52.pdf Restricted to Repository staff only Download (382kB) |
||
Text (BAB 4)
Laporan Skripsi baru-53-90.pdf Restricted to Repository staff only Download (511kB) |
||
|
Text (BAB 5)
Laporan Skripsi baru-91.pdf Download (7kB) | Preview |
|
|
Text (DAFTAR PUSTAKA)
Laporan Skripsi baru-92-93.pdf Download (134kB) | Preview |
|
Text (LAMPIRAN)
Laporan Skripsi baru-94-101.pdf Restricted to Repository staff only Download (85kB) |
Abstract
Information Retrieval (IR) atau sistem temu kembali merupakan sebuah sistem yang bekerja untuk menemukan informasi yang relevan dengan apa yang dicari oleh pengguna. Dalam penelitian yang dilakukan oleh penulis, proses IR diterapkan dengan menggunakan metode text mining dan algoritma vector space model. Text mining merupakan proses awal dari alur kerja sebuah sistem temu kembali, yang mana proses ini bertujuan untuk menghasilkan kumpulan kata-kata yang berhubungan dengan dokumen yang dicari. Proses IR kemudian dilanjutkan dengan proses mencari nilai kemiripan antar dokumen yang relevan menggunakan algoritma vector space model. Algoritma vector space model merupakan sebuah algoritma yang menggambarkan sebuah dokumen sebagai sebuah bentuk vector yang memiliki jarak dan arah. Dalam penerapannya, algoritma ini melalui beberapa tahapan seperti indexing dokumen yang dilakukan dalam proses text mining, pembobotan term yang dalam penelitian ini dilakukan dengan menggunakan algoritma TF-IDF, dan perhitungan kesamaan. Ada beberapa jenis metode yang digunakan dalam menghitung kesamaan dokumen dalam algoritma vector space model, salah satunya adalah cosine similarity yang digunakan dalam penelitian ini. Cosine similarity mengukur kesamaan antar dua vektor dengan mengambil nilai kosinus dari sudut antara vektor kata kunci dan vektor tiap dokumen. Dari hasil penelitian ini, diketahui bahwa sistem mampu menghasilkan nilai rata-rata precision sebesar 3.04%
Item Type: | Thesis (Undergraduate) | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Contributors: |
|
||||||||||||
Subjects: | P Language and Literature > P Philology. Linguistics > P87 Communication. Mass Media | ||||||||||||
Divisions: | Faculty of Computer Science > Departemen of Informatics | ||||||||||||
Depositing User: | Lisa nadya irawan | ||||||||||||
Date Deposited: | 08 Mar 2024 02:41 | ||||||||||||
Last Modified: | 08 Mar 2024 02:41 | ||||||||||||
URI: | http://repository.upnjatim.ac.id/id/eprint/20593 |
Actions (login required)
View Item |