Ilham, Amil Ahmad and Bustamin, Anugrayani (2024) Implementasi Algoritma Bernoulli Naïve Bayes dalam Klasifikasi Cyberbullying pada Media Sosial Twitter = Implementation of the Bernoulli Naïve Bayes Algorithm in Cyberbullying Classification on Twitter Social Media. Skripsi thesis, Universitas Hasanuddin.
D121181004_skripsi_14-05-2024 cover1.png
Download (164kB) | Preview
D121181004_skripsi_14-05-2024 1-2.pdf
Download (924kB)
D121181004_skripsi_14-05-2024 dp.pdf
Download (2MB)
D121181004_skripsi_14-05-2024.pdf
Restricted to Repository staff only until 5 April 2026.
Download (3MB)
Abstract (Abstrak)
Seiring peningkatan pengguna media sosial, fenomena cyberbullying juga semakin meningkat yang menimbulkan dampak negatif seperti gangguan mental bahkan bunuh diri. Pemerintah Indonesia bersama POLRI telah meresmikan beroperasinya polisi virtual untuk memantau dan memperingatkan pengguna yang melanggar UU ITE melalui unggahan teks atau gambar. Dari sejumlah akun yang mendapat peringatan, tercatat bahwa akun Twitter menyumbang sebanyak 79 akun yang mendapat teguran. Analisis text mining dengan metode klasifikasi teks, menggunakan algoritma Bernoulli Naïve Bayes, diusulkan sebagai solusi untuk meminimalisir cyberbullying.
Tujuan dari penelitian ini adalah untuk mengimplementasikan algoritma Bernoulli Naïve Bayes dalam melakukan klasifikasi cuitan cyberbullying dan bukan cyberbullying pada media sosial Twitter, serta untuk mengevaluasi algoritma tersebut.
Penelitian ini mengimplementasikan algoritma Bernoulli Naïve Bayes dan menggunakan dataset dari Twitter dengan menggunakan kata kunci "puan". Setelah tahap pelabelan manual, langkah berikutnya adalah melakukan tahap preprocessing text dengan tujuan untuk menghilangkan noise pada dataset. Dataset yang digunakan sebanyak 3.541 cuitan untuk kelas bukan cyberbullying dan 3.227 cuitan untuk kelas cyberbullying. Proses berikutnya yaitu melakukan ekstraksi fitur dengan metode bag of words. Selanjutnya, data dibagi menjadi 90% sebagai data latih dan 10% sebagai data uji.
Evaluasi model menggunakan confusion matrix menghasilkan tingkat accuracy sebesar 0.91, recall sebesar 0.96, precision sebesar 0.86, dan f-measure sebesar 0.91. Meskipun demikian, model belum mampu mengklasifikasikan makna kata secara pragmatik.
Keywords : Cyberbullying, Twitter, Bernoulli Naïve Bayes, Klasifikasi Teks, Bag of Words
Item Type: | Thesis (Skripsi) |
---|---|
Uncontrolled Keywords: | Cyberbullying, Twitter, Bernoulli Naïve Bayes, Text Classification, Bag of Words. |
Subjects: | T Technology > TD Environmental technology. Sanitary engineering |
Divisions (Program Studi): | Fakultas Teknik > Teknik Informatika |
Depositing User: | S.Sos Rasman - |
Date Deposited: | 28 Jun 2024 08:12 |
Last Modified: | 28 Jun 2024 08:12 |
URI: | http://repository.unhas.ac.id:443/id/eprint/34811 |