Penerapan Topic Modeling Menggunakan Latent Dirichlet Allocation (LDA) Dalam Berita Kesehatan Gizi


Hadriana, Nurul Pertiwi (2025) Penerapan Topic Modeling Menggunakan Latent Dirichlet Allocation (LDA) Dalam Berita Kesehatan Gizi. Skripsi thesis, Universitas Hasanuddin Makassar.

[thumbnail of D121201059_skripsi_16-10-2024 bab 1-2.pdf] Text
D121201059_skripsi_16-10-2024 bab 1-2.pdf

Download (5MB)
[thumbnail of D121201059_skripsi_16-10-2024 cover1.jpg]
Preview
Image
D121201059_skripsi_16-10-2024 cover1.jpg

Download (257kB) | Preview
[thumbnail of D121201059_skripsi_16-10-2024 dp.pdf] Text
D121201059_skripsi_16-10-2024 dp.pdf

Download (2MB)
[thumbnail of D121201059_skripsi_16-10-2024.pdf] Text
D121201059_skripsi_16-10-2024.pdf
Restricted to Repository staff only until 27 February 2027.

Download (18MB)

Abstract (Abstrak)

Dalam era informasi digital yang berkembang pesat, berita kesehatan gizi menjadi sumber penting untuk informasi terbaru mengenai isu-isu gizi. Jumlah berita kesehatan gizi online yang terus meningkat menimbulkan tantangan baru dalam menganalisis topik utama karena proses manual memerlukan banyak waktu. Selain itu, melacak perkembangan atau tren topik gizi dari waktu ke waktu juga sulit. Oleh karena itu, diperlukan sistem untuk menemukan topik utama dan tren dari berita kesehatan gizi.
Penelitian ini bertujuan menerapkan topic modeling dalam berita kesehatan gizi menggunakan Latent Dirichlet Allocation (LDA) dan menganalisis kinerjanya dalam mengelompokkan tren topik.
Data diambil dari berita kesehatan gizi di portal berita online Indonesia, di-scraping berdasarkan tahun 2019 hingga 2023. Tahapannya meliputi preprocessing, feature extraction, topic modeling, dan analisis hasil. Implementasi preprocessing mencakup case folding, punctuation removal, number removal, stopword removal, stemming, dan tokenizing. Feature extraction melibatkan pembobotan kata dengan Term Frequency-Inverse Document Frequency (TF-IDF) serta bigram dan trigram. Topic modeling dilakukan dengan menggunakan corpus dan dictionary, metode LDA, dan evaluasi model dengan topic coherence.
Hasil penelitian menunjukkan bahwa LDA dapat mengidentifikasi sejumlah topik utama dalam berita dengan jumlah topik yang terbentuk pada tahun 2019, 2020, 2021, 2022 dan 2023 secara berturut-turut adalah 9, 10, 4, 8 dan 8 topik. Tahun 2019 dengan nilai coherence 0.42057 mencakup nutrisi anak dan manajemen kesehatan serta pola makan dan risiko kesehatan. Tahun 2020 dengan nilai coherence 0.4656 berfokus pada nutrisi ibu hamil dan anak. Tahun 2021 dengan nilai coherence 0.45326 mengenai kesehatan dan gizi selama pandemi. Tahun 2022 dengan nilai coherence 0.41281 mencakup manajemen kesehatan dan hidrasi selama puasa. Tahun 2023 dengan nilai coherence 0.46266 berfokus pada gizi dan keamanan pangan.

Item Type: Thesis (Skripsi)
Subjects: T Technology > T Technology (General)
Divisions (Program Studi): Fakultas Teknik > Teknik Informatika
Depositing User: Unnamed user with username pkl2
Date Deposited: 07 May 2025 01:54
Last Modified: 07 May 2025 01:54
URI: http://repository.unhas.ac.id:443/id/eprint/44464

Actions (login required)

View Item
View Item