IMSAN, RIFYAL MUHAMMAD (2025) Implementasi BERTopic pada Abstrak Publikasi Ilmiah di Bidang Ilmu Komputer = Implementation of BERTopic on Scientific Publication Abstracts in The Field of Computer Science. Skripsi thesis, Universitas Hasanuddin.
D121201099-SKRIPSI-COVER.png
Download (112kB) | Preview
D121201099-SKRIPSI-BAB 1-2.pdf
Download (363kB)
D121201099-SKRIPSI-DAPUS.pdf
Download (109kB)
D121201099-SKRIPSI-FULL TEXT.pdf
Restricted to Repository staff only until 22 December 2027.
Download (3MB)
Abstract (Abstrak)
Latar belakang. Di era informasi digital, jumlah publikasi ilmiah mengalami peningkatan eksponensial dengan tingkat pertumbuhan tahunan mencapai 8-9%. Pertumbuhan ini memberikan dampak signifikan pada komunitas sains, khususnya dalam penelitian dan evaluasi ilmiah. Salah satu tantangan utama yang muncul adalah bagaimana menganalisis volume data publikasi ilmiah yang besar secara efisien dan akurat. Tujuan. Penelitian ini bertujuan untuk mengidentifikasi topik-topik utama, khususnya di bidang ilmu komputer pada tahun 2023, melalui analisis abstrak menggunakan BERTopic. Selain itu, penelitian ini juga bertujuan untuk mengungkap tren penelitian pada rentang waktu tertentu berdasarkan hasil pemodelan topik. Metode. Penelitian ini menggunakan teknik pemodelan topik berbasis machine learning, yaitu BERTopic. BERTopic adalah metode pemodelan topik yang memanfaatkan representasi teks berbasis BERT (Bidirectional Encoder Representations from Transformers) untuk menghasilkan text embeddings yang kaya secara semantik. Dengan menggunakan BERT sebagai sentence transformer, BERTopic mampu menangkap hubungan semantik antar teks dengan lebih baik, menghasilkan topik yang lebih koheren dan mudah diinterpretasi. Data yang digunakan dalam penelitian ini dikumpulkan melalui proses web scraping dari arXiv, sebuah repositori terbuka untuk publikasi ilmiah yang mencakup berbagai bidang studi. Hasil. Hasil penelitian menunjukkan bahwa implementasi BERTopic berhasil mengidentifikasi 49 topik untuk semester pertama dan 46 topik untuk semester kedua dari kumpulan abstrak ilmu komputer. Model ini juga mencapai skor coherence di atas 0,7 untuk kedua semester, yang mencerminkan kemampuan BERTopic dalam menghasilkan topik yang koheren dan relevan. Kesimpulan. Penelitian ini membuktikan bahwa BERTopic merupakan metode yang efektif untuk melakukan pemodelan topik dalam publikasi ilmiah, khususnya dalam bidang ilmu komputer. Dengan skor coherence yang tinggi, BERTopic mampu mengidentifikasi topik yang relevan serta mengungkap tren penelitian dalam kurun waktu tertentu. Oleh karena itu, pendekatan ini dapat digunakan sebagai alat eksplorasi dalam memahami lanskap penelitian yang terus berkembang.
| Item Type: | Thesis (Skripsi) |
|---|---|
| Uncontrolled Keywords: | Pemodelan topik, BERTopic, arXiv, publikasi ilmiah, ilmu komputer |
| Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
| Divisions (Program Studi): | Fakultas Teknik > Teknik Informatika |
| Depositing User: | Unnamed user with username pkl2 |
| Date Deposited: | 05 Mar 2026 02:21 |
| Last Modified: | 05 Mar 2026 02:21 |
| URI: | http://repository.unhas.ac.id:443/id/eprint/54382 |
