Implementasi Text-to-Text Transfer Transformer berbasis Abstraksi dan Ekstraksi dalam Text Summarization Berita Online=Implementation of Abstraction and Extraction-based Text-To-Text Transfer Transformer in Online News Text Summarization


SITORUS, KISANA ADZAN (2024) Implementasi Text-to-Text Transfer Transformer berbasis Abstraksi dan Ekstraksi dalam Text Summarization Berita Online=Implementation of Abstraction and Extraction-based Text-To-Text Transfer Transformer in Online News Text Summarization. Skripsi thesis, UNIVERSITAS HASANUDDIN MAKASSAR.

[thumbnail of cover]
Preview
Image (cover)
D121201106_skripsi_05-08-2024 cover1.jpg

Download (248kB) | Preview
[thumbnail of bab 1-2] Text (bab 1-2)
D121201106_skripsi_05-08-2024 bab I-II.pdf

Download (884kB)
[thumbnail of dapus] Text (dapus)
D121201106_skripsi_05-08-2024 dp.pdf

Download (2MB)
[thumbnail of full text] Text (full text)
D121201106_skripsi_05-08-2024.pdf
Restricted to Repository staff only until 22 July 2027.

Download (4MB)

Abstract (Abstrak)

Di era digital, banyaknya informasi memerlukan metode efektif untuk merangkum teks secara otomatis guna membantu pembaca menyerap detail penting. Peringkasan teks adalah tugas penting dalam Natural Language Processing (NLP), yang memungkinkan pengurangan teks panjang menjadi ringkasan singkat tanpa kehilangan informasi esensial. Dengan meningkatnya konsumsi berita digital, menyediakan ringkasan yang singkat dan informatif dapat meningkatkan pengalaman pengguna dan penyebaran informasi. Penelitian ini bertujuan untuk menganalisis performa model Text-to-text transfer transformer (T5) dalam menghasilkan ringkasan artikel berita Indonesia dan membandingkan efektivitas pendekatan abstraksi dan ekstraksi. Model abstraksi menghasilkan teks baru yang koheren, sedangkan model ekstraksi memilih segmen penting dari teks asli tanpa mengubah struktur kalimat. Metodologi penelitian ini melibatkan beberapa langkah kunci. Pertama, dataset komprehensif artikel berita online berbahasa Indonesia dikumpulkan menggunakan teknik web scraping kemudian digabungkan dengan dataset Indosum. Dataset ini kemudian dibagi menjadi set pelatihan, validasi, dan uji. Langkah-langkah preprocessing mencakup tokenisasi, pembersihan, dan normalisasi data teks. Kedua model dievaluasi menggunakan metrik ROUGE dan BLEU untuk menilai performa dalam hal presisi, recall, dan kualitas keseluruhan ringkasan yang dihasilkan. Hasil penelitian menunjukkan bahwa model T5 berbasis abstraksi memiliki kinerja lebih baik dibandingkan model ekstraksi. Pada metrik ROUGE-1, model abstraksi memiliki precision 0.838, recall 0.544, dan F1-score 0.662, sedangkan model ekstraksi memiliki precision 0.757, recall 0.444, dan F1-score 0.56. Pada metrik ROUGE-2, model abstraksi memiliki precision 0.778, recall 0.509, dan F1-score 0.617, sementara model ekstraksi memiliki precision 0.889, recall 0.516, dan F1-score 0.651. Pada metrik ROUGE-L, model abstraksi memiliki precision 0.811, recall 0.526, dan F1-score 0.639, sedangkan model ekstraksi memiliki precision 0.919, recall 0.54, dan F1-score 0.679. Selain itu, model abstraksi memiliki skor BLEU 0.375, lebih tinggi dibandingkan model ekstraksi yang memiliki skor BLEU 0.338. Temuan ini menunjukkan bahwa pendekatan abstraksi lebih efektif dalam menghasilkan ringkasan yang koheren dan informatif.

Item Type: Thesis (Skripsi)
Uncontrolled Keywords: text summarization, abstraksi, ekstraksi, text-to-text transfer transformer (T5), ROUGE
Subjects: T Technology > T Technology (General)
Divisions (Program Studi): Fakultas Teknik > Teknik Informatika
Depositing User: Unnamed user with username pkl2
Date Deposited: 10 Jul 2025 00:53
Last Modified: 10 Jul 2025 00:53
URI: http://repository.unhas.ac.id:443/id/eprint/46363

Actions (login required)

View Item
View Item