Normalisasi Teks Berbasis Kamus Slang dan Levenshtein Distance: Implementasi pada Analisis Sentimen Ekspedisi SiCepat Ekspres di Twitter = Text Normalization Based on Slang Dictionary and Levenshtein Distance: Implementation of SiCepat Ekspres Expedition Sentiment Analysis on Twitter


Siswanto, Diki (2022) Normalisasi Teks Berbasis Kamus Slang dan Levenshtein Distance: Implementasi pada Analisis Sentimen Ekspedisi SiCepat Ekspres di Twitter = Text Normalization Based on Slang Dictionary and Levenshtein Distance: Implementation of SiCepat Ekspres Expedition Sentiment Analysis on Twitter. Skripsi thesis, Universitas Hasanuddin.

[thumbnail of Cover] Image (Cover)
D42116316_skripsi_05-01-2023 cover1.jpg
Restricted to Repository staff only until 25 January 2026.

Download (253kB)
[thumbnail of Bab 1-3] Text (Bab 1-3)
D42116316_skripsi_05-01-2023 bab 1-3.pdf

Download (11MB)
[thumbnail of Dapus] Text (Dapus)
D42116316_skripsi_05-01-2023 dp.pdf

Download (11MB)
[thumbnail of Full Text] Text (Full Text)
D42116316_skripsi_05-01-2023.pdf
Restricted to Repository staff only until 25 January 2026.

Download (11MB)

Abstract (Abstrak)

Twitter merupakan salah satu media sosial populer yang dapat dimanfaatkan untuk mengektraksi opini dan sentimen publik terhadap suatu layanan atau jasa, termasuk jasa ekspedisi. Salah satunya adalah SiCepat Ekspres. Opini yang disampaikan masyarakat terhadap SiCepat Ekspres di Twitter dapat dianalisis untuk mengetahui persepsi pengguna terhadap layanan perusahaan tersebut. Akan tetapi, sebagai jejaring sosial dimana satu pengguna dapat secara bebas berkomunikasi atau berpendapat sesuai keinginannya membuat format data teks pada media sosial Twitter menjadi beragam, di antaranya muncul variasi tulisan, seperti kata singkatan, bahasa tidak baku, dan slang. Penelitian ini bertujuan untuk merancang sistem normalisasi teks tweet berbasis kamus slang dan algoritma Levenshtein Distance. Hasilnya kemudian diimplementasikan pada sistem klasifikasi sentimen menggunakan pretrained-model IndoBERT untuk mengetahui pengaruh antara data tweet yang dilakukan normalisasi dan tanpa normalisasi. Dataset yang digunakan berjumlah 865, dengan rincian 547 data berlabel negatif dan 318 data berlabel positif. Dataset dibagi menjadi 80% data latih dan 20% data uji. Pengujian dilakukan sebanyak 3 kali dengan dua skenario, yakni dataset yang dinormalisasi dan tanpa normalisasi. Hasilnya didapatkan rata-rata akurasi, precision, dan recall untuk model dengan dataset tanpa normalisasi masing-masing 94.41%, 90.78%, dan 92.75%. Sedangkan pada model dengan dataset yang dinormalisasi diperoleh akurasi 97.88%, precision 98.95%, dan recall 95.30%. Terjadi peningkatan akurasi sebesar 3.47% pada model dengan dataset yang dinormalisasi dibandingkan dengan dataset tanpa normalisasi.

Keywords : Normalisasi teks, Twitter, Levenshtein Distance, Kamus slang, IndoBERT, Natural Language Processing.

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: Normalisasi teks, Twitter, Levenshtein Distance, Kamus slang, IndoBERT, Natural Language Processing.
Subjects: T Technology > TA Engineering (General). Civil engineering (General)
Divisions (Program Studi): Fakultas Teknik > Teknik Informatika
Depositing User: S.Sos Rasman -
Date Deposited: 25 Jan 2024 06:10
Last Modified: 25 Jan 2024 06:10
URI: http://repository.unhas.ac.id:443/id/eprint/32413

Actions (login required)

View Item
View Item