IMPLEMENTASI ALGORITMA RAPID AUTOMATIC KEYWORD EXTRACTION (RAKE) PADA PEMBUATAN INDEKS BUKU = Implementation of the Rapid Automatic Keyword Extraction (RAKE) Algorithm in Book Indexes Creation


Davina, Chindy Christie (2024) IMPLEMENTASI ALGORITMA RAPID AUTOMATIC KEYWORD EXTRACTION (RAKE) PADA PEMBUATAN INDEKS BUKU = Implementation of the Rapid Automatic Keyword Extraction (RAKE) Algorithm in Book Indexes Creation. Skripsi thesis, Universitas Hasanuddin.

[thumbnail of Cover]
Preview
Image (Cover)
D121201077_skripsi_14-05-2024 cover1.png

Download (166kB) | Preview
[thumbnail of Bab 1-2] Text (Bab 1-2)
D121201077_skripsi_14-05-2024 1-2.pdf

Download (1MB)
[thumbnail of Dapus] Text (Dapus)
D121201077_skripsi_14-05-2024 dp.pdf

Download (3MB)
[thumbnail of Full Text] Text (Full Text)
D121201077_skripsi_14-05-2024.pdf
Restricted to Repository staff only until 8 May 2026.

Download (8MB)

Abstract (Abstrak)

Indeks adalah sebuah daftar item (seperti topik atau nama) yang dibahas dalam sebuah karya cetak yang memberikan untuk setiap item nomor halaman di mana item tersebut dapat ditemukan. Saat ini, pembuatan indeks masih memerlukan banyak tenaga kerja manusia, sehingga memakan waktu dan rentan terhadap kelalaian. Dalam konteks ini, pemanfaatan algoritma komputasional diharapkan dapat menjadi solusi yang efisien dan efektif. Algoritma RAKE (Rapid Automatic Keyword Extraction) muncul sebagai solusi potensial untuk mempercepat dan memudahkan pembuatan indeks buku.
Penelitian ini bertujuan untuk mengimplementasikan algoritma RAKE untuk membuat indeks buku secara otomatis dan menilai kinerja indeks yang dihasilkan oleh algoritma RAKE, dengan membandingkannya terhadap indeks yang dibuat secara manual.
Penelitian dilakukan dengan mencoba berbagai skenario pada algoritma, yaitu penggunaan fitur Part of Speech (PoS) tagging untuk mendeteksi kata yang juga berperan sebagai phrase delimiter selain stopwords; menyaring kata kunci yang dihasilkan RAKE; penambahan fitur cosine similarity dan jumlah huruf kapital (percobaan terhadap pembobotan kedua fitur); dan pengambilan N keyword peringkat teratas. Evaluasi dilakukan dengan memperbandingkan indeks yang dihasilkan sistem dengan indeks yang sudah ada di belakang buku evaluasi.
Hasil penelitian menunjukkan bahwa skenario terbaik adalah pengambilan 20 indeks peringkat teratas, menggunakan PoS tagging untuk mendeteksi tambahan phrase delimiter, melakukan penyaringan keyword, menggunakan fitur cosine similarity berbobot 1 dan jumlah huruf kapital berbobot 8. Pada buku EM Modeling of Antennas and RF Components for Wireless Communication Systems, didapatkan peringkat rata-rata indeks yaitu 8,3968, presisi 0,02723, recall 0,45818, dan f-measure 0,05141; sedangkan pada buku High-Performance Scientific Computing peringkat rata-rata indeksnya adalah 8,3955, presisi 0,02177, recall 0,35733, dan f-measure 0,04105; sedangkan pada buku Scientific Computing with MATLAB and Octave peringkat rata-rata indeksnya adalah 7,6805, presisi 0,04653, recall 0,42289, dan f-measure 0,08383; sedangkan pada buku Introduction to Deep Learning peringkat rata-rata indeksnya adalah 8,7226, presisi 0,04115, recall 0,46441, dan f-measure 0,07561.

Keywords : RAKE, Rapid Automatic Keyword Extraction, indeks buku, cosine similarity, huruf kapital, keyword

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: RAKE, Rapid Automatic Keyword Extraction, book indexes, cosine similarity, capital letter, keyword.
Subjects: T Technology > T Technology (General)
Divisions (Program Studi): Fakultas Teknik > Teknik Informatika
Depositing User: S.Sos Rasman -
Date Deposited: 27 Jun 2024 07:24
Last Modified: 27 Jun 2024 07:24
URI: http://repository.unhas.ac.id:443/id/eprint/34829

Actions (login required)

View Item
View Item