Implementasi BERTopic pada Abstrak Publikasi Ilmiah di Bidang Ilmu Komputer = Implementation of BERTopic on Scientific Publication Abstracts in The Field of Computer Science


IMSAN, RIFYAL MUHAMMAD (2025) Implementasi BERTopic pada Abstrak Publikasi Ilmiah di Bidang Ilmu Komputer = Implementation of BERTopic on Scientific Publication Abstracts in The Field of Computer Science. Skripsi thesis, Universitas Hasanuddin.

[thumbnail of COVER]
Preview
Image (COVER)
D121201099-SKRIPSI-COVER.png

Download (112kB) | Preview
[thumbnail of BAB 1-2] Text (BAB 1-2)
D121201099-SKRIPSI-BAB 1-2.pdf

Download (363kB)
[thumbnail of DAPUS] Text (DAPUS)
D121201099-SKRIPSI-DAPUS.pdf

Download (109kB)
[thumbnail of FULL TEXT] Text (FULL TEXT)
D121201099-SKRIPSI-FULL TEXT.pdf
Restricted to Repository staff only until 22 December 2027.

Download (3MB)

Abstract (Abstrak)

Latar belakang. Di era informasi digital, jumlah publikasi ilmiah mengalami peningkatan eksponensial dengan tingkat pertumbuhan tahunan mencapai 8-9%. Pertumbuhan ini memberikan dampak signifikan pada komunitas sains, khususnya dalam penelitian dan evaluasi ilmiah. Salah satu tantangan utama yang muncul adalah bagaimana menganalisis volume data publikasi ilmiah yang besar secara efisien dan akurat. Tujuan. Penelitian ini bertujuan untuk mengidentifikasi topik-topik utama, khususnya di bidang ilmu komputer pada tahun 2023, melalui analisis abstrak menggunakan BERTopic. Selain itu, penelitian ini juga bertujuan untuk mengungkap tren penelitian pada rentang waktu tertentu berdasarkan hasil pemodelan topik. Metode. Penelitian ini menggunakan teknik pemodelan topik berbasis machine learning, yaitu BERTopic. BERTopic adalah metode pemodelan topik yang memanfaatkan representasi teks berbasis BERT (Bidirectional Encoder Representations from Transformers) untuk menghasilkan text embeddings yang kaya secara semantik. Dengan menggunakan BERT sebagai sentence transformer, BERTopic mampu menangkap hubungan semantik antar teks dengan lebih baik, menghasilkan topik yang lebih koheren dan mudah diinterpretasi. Data yang digunakan dalam penelitian ini dikumpulkan melalui proses web scraping dari arXiv, sebuah repositori terbuka untuk publikasi ilmiah yang mencakup berbagai bidang studi. Hasil. Hasil penelitian menunjukkan bahwa implementasi BERTopic berhasil mengidentifikasi 49 topik untuk semester pertama dan 46 topik untuk semester kedua dari kumpulan abstrak ilmu komputer. Model ini juga mencapai skor coherence di atas 0,7 untuk kedua semester, yang mencerminkan kemampuan BERTopic dalam menghasilkan topik yang koheren dan relevan. Kesimpulan. Penelitian ini membuktikan bahwa BERTopic merupakan metode yang efektif untuk melakukan pemodelan topik dalam publikasi ilmiah, khususnya dalam bidang ilmu komputer. Dengan skor coherence yang tinggi, BERTopic mampu mengidentifikasi topik yang relevan serta mengungkap tren penelitian dalam kurun waktu tertentu. Oleh karena itu, pendekatan ini dapat digunakan sebagai alat eksplorasi dalam memahami lanskap penelitian yang terus berkembang.

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: Pemodelan topik, BERTopic, arXiv, publikasi ilmiah, ilmu komputer
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions (Program Studi): Fakultas Teknik > Teknik Informatika
Depositing User: Unnamed user with username pkl2
Date Deposited: 05 Mar 2026 02:21
Last Modified: 05 Mar 2026 02:21
URI: http://repository.unhas.ac.id:443/id/eprint/54382

Actions (login required)

View Item
View Item