Penerapan Combine Sampling Pada Analisis Sentimen Menggunakan Algoritma K-Nearest Neighbor (Studi Kasus: Sentimen Kebijakan Lepas Masker di Indonesia)


Kondy, Evlyn Pricilia (2023) Penerapan Combine Sampling Pada Analisis Sentimen Menggunakan Algoritma K-Nearest Neighbor (Studi Kasus: Sentimen Kebijakan Lepas Masker di Indonesia). Skripsi thesis, Universitas Hasanuddin.

[thumbnail of Bab 1-2] Text (Bab 1-2)
H051191027_skripsi_27-02-2024 bab1-2.pdf

Download (3MB)
[thumbnail of Cover]
Preview
Image (Cover)
H051191027_skripsi_27-02-2024 Cover1.jpg

Download (285kB) | Preview
[thumbnail of Dapus] Text (Dapus)
H051191027_skripsi_27-02-2024 Dapus.pdf

Download (482kB)
[thumbnail of Full text] Text (Full text)
H051191027_skripsi_27-02-2024.pdf
Restricted to Repository staff only

Download (4MB)

Abstract (Abstrak)

Kebijakan lepas masker merupakan salah satu topik yang pernah dibahas di twitter. Oleh sebab itu, dapat dilakukan analisis sentimen mengenai topik kebijakan lepas masker. Namun pada data real yang diperoleh dari twitter dapat mengandung kelas data yang tidak seimbang. Ketidakseimbangan jumlah data dapat mengganggu proses klasifikasi. Combine sampling merupakan pendekatan penyeimbangan data dengan menggabungkan metode oversampling dan metode undersampling. Data pada penelitian ini adalah tweet berbahasa Indonesia dengan kata kunci “Kebijakan Lepas Masker”. Metode oversampling dan metode undersampling yang digunakan pada penelitian ini adalah SMOTE dan Tomek Links sedangkan untuk metode klasifikasi yang digunakan adalah K-Nearest Neighbor. Penelitian ini bertujuan untuk menyeimbangkan jumlah data latih pada kedua kelas yang belum seimbang menggunakan metode Combine Sampling serta melakukan klasifikasi sentimen terkait kebijakan lepas masker di Indonesia menggunakan algoritma K-Nearest Neighbor. Setelah tahapan pembagian data latih dan data uji diperoleh 234 data latih bersentimen positif dan 652 data latih bersentimen negatif. Jumlah data latih pada kedua kelas tidak seimbang sehingga data pada kelas negatif merupakan data mayor dan data pada kelas positif merupakan data minor. Diperoleh jumlah data latih setelah tahapan combine sampling yaitu 613 data pada kelas positif dan 613 data pada kelas negatif. Setelah jumlah data pada kedua kelas telah seimbang dilanjutkan dengan klasifikasi sentimen dan diperoleh akurasi sebesar 60,4%, presisi sebesar 78,5%, dan recall sebesar 65%. Penyebab nilai akurasi sebesar 60,4% adalah makna yang ingin disampaikan oleh setiap tweet terhadap kebijakan lepas masker di Indonesia tidak terbaca dengan baik oleh pembelajaran mesin yang mengakibatkan terjadinya kesalahan klasifikasi.

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: Combine Sampling, SMOTE, Tomek Links, K-Nearest Neighbor, Analisis Sentimen, Kebijakan Lepas Masker.
Subjects: Q Science > QA Mathematics
Divisions (Program Studi): Fakultas Matematika dan Ilmu Peng. Alam > Statistika
Depositing User: Andi Milu
Date Deposited: 21 Nov 2024 07:16
Last Modified: 21 Nov 2024 07:16
URI: http://repository.unhas.ac.id:443/id/eprint/39754

Actions (login required)

View Item
View Item