Triatmojo Hw, Muh. Yoga (2025) Part-of-Speech Tagging dan Named Entity Recognition Menggunakan Random Forest dan Rule-Based Chunking Untuk Geocoding Artikel Ilmiah. Skripsi thesis, Universitas Hasanuddin.
![[thumbnail of D121191007_skripsi_07-01-2025 bab 1-2.pdf]](/style/images/fileicons/text.png)
D121191007_skripsi_07-01-2025 bab 1-2.pdf
Download (1MB)
![[thumbnail of D121191007_skripsi_07-01-2025 cover1.jpg]](/44139/2.hassmallThumbnailVersion/D121191007_skripsi_07-01-2025%20cover1.jpg)

D121191007_skripsi_07-01-2025 cover1.jpg
Download (267kB) | Preview
![[thumbnail of D121191007_skripsi_07-01-2025 dp.pdf]](/style/images/fileicons/text.png)
D121191007_skripsi_07-01-2025 dp.pdf
Download (387kB)
![[thumbnail of D121191007_skripsi_07-01-2025.pdf]](/style/images/fileicons/text.png)
D121191007_skripsi_07-01-2025.pdf
Restricted to Repository staff only until 25 February 2027.
Download (3MB)
Abstract (Abstrak)
Bagian judul dan abstrak pada artikel ilmiah merupakan bagian penting bagi peneliti dalam menemukan informasi mengenai kesenjangan dan perbedaan dari sebuah penelitian terhadap penelitian lainnya. Salah satu informasi kesenjangan yang penting adalah informasi mengenai lokasi penelitian tersebut dilakukan. Dalam mencari informasi lokasi penelitian dari banyak artikel ilmiah, peneliti perlu untuk membaca banyak artikel ilmiah secara manual, selain itu terdapat banyak nama lokasi di Indonesia memiliki nama yang serupa tetapi lokasi dan titik koordinatnya berbeda dikarenakan adanya perbedaan pada wilayah geografis atau administratif dari lokasi tersebut.
Tujuan dari penelitian ini adalah untuk membuat sistem yang mampu mengekstraksi entitas lokasi penelitian dari file artikel ilmiah berbahasa Indonesia kemudian menampilkannya dalam bentuk titik penanda pada peta digital secara akurat meskipun terdapat lokasi lain yang memiliki nama yang serupa. Penelitian ini dibagi menjadi empat tahapan yaitu proses POS tagging menggunakan Random Forest, pembentukan frasa menggunakan Rule-Based Chunking, proses NER menggunakan Random Forest, dan proses geocoding menggunakan Google API.
Hasil pengujian pada setiap proses dengan menggunakan metrik evaluasi f1-score adalah sebesar 95,69% pada proses POS tagging, sebesar 90,15% pada proses pembentukan frasa, dan sebesar 91,67% pada proses NER. Penelitian ini kemudian diimplementasikan dalam bentuk WebGIS dengan hasil pengujian akurasi dalam mengekstraksi entitas lokasi penelitian dari file artikel ilmiah sebesar 90,41% yang diuji menggunakan 73 file artikel ilmiah berbahasa Indonesia dengan nama lokasi penelitian yang serupa. Sedangkan pada evaluasi keakuratan geocoding yang diukur menggunakan metrik match type mendapatkan hasil akurasi sebesar 98,48%. Sehingga sistem WebGIS ini berhasil mendapatkan akurasi sebesar 90,41% dalam mengekstraksi artikel ilmiah berbahasa Indonesia yang memiliki nama lokasi penelitian yang serupa dengan tingkat keakuratan proses geocoding sebesar 98,48%.
Item Type: | Thesis (Skripsi) |
---|---|
Subjects: | T Technology > T Technology (General) |
Divisions (Program Studi): | Fakultas Teknik > Teknik Informatika |
Depositing User: | Unnamed user with username pkl2 |
Date Deposited: | 21 Apr 2025 06:51 |
Last Modified: | 21 Apr 2025 06:51 |
URI: | http://repository.unhas.ac.id:443/id/eprint/44139 |