KOMPARASI BEBERAPA METODE WORD SPOTTING BERBASIS SEGMENTATION-FREE PADA NASKAH DIGITAL LONTAR BALI

Gusti Ngurah Made Agus Wibawantara

Abstract


Teknik word spotting telah banyak dikembangkan baik pada dokumen cetak maupun dokumen tulisan tangan untuk menemukan semua item yang sesuai dengan query dalam suatu dataset citra. Teknik word spotting telah diaplikasikan pada tulisan latin, Cina, dan tulisan Arab namun belum pernah diaplikasikan pada naskah digital lontar Bali. Penelitian komparasi metode word spotting pada naskah digital lontar Bali berfokus pada metode word spotting yang berbasis segmentation-free. Komparasi kinerja metode word spotting yang diteliti adalah metode word spotting dengan menggunakan model representasi fitur Bag of Visual Word (BoVW) yang dikombinasikan dengan teknik Latent Semantic Indexing (LSI), Longest Common Subsequence (LCS) dan Longest Weighted Profile (LWP). Model representasi fitur BVW dipilih karena model ini menunjukkan kinerja yang baik bukan hanya untuk tugas Content Based Image Recognition (CBIR) namun juga pada tugas Computer Vision lain seperti pengenalan objek, klasifikasi citra, dan anotasi. Penelitian yang telah dilakukan sebelumnya juga menunjukkan model ini memiliki kinerja yang baik ketika diaplikasikan untuk teknik word spotting. Teknik word spotting dengan model fitur BoVW bekerja dengan berbasis patch. Jarak vektor BoVW pada query dan patch yang terdapat pada lontar dihitung dengan menggunakan cosine distance. Berdasarkan penelitian yang dilakukan, word spotting dengan model BoVW yang dikombinasikan dengan teknik LSI dan LCS menunjukkan kinerja yang paling tinggi dibandingkan dengan metode lainnya yang dieksperimenkan. Hal ini terlihat dari nilai rerata Mean Average Precision (MAP) pada metode ini sebesar 38,56728%, lebih tinggi dibandingkan dengan nilai rerata MAP pada metode lainnya. Melihat keterbatasan dalam penelitian ini, pada penelitian selanjutnya perlu mengaplikasikan penggunaan classifier dan ekstraksi fitur lain untuk melihat pengaruhnya terhadap kinerja word spotting pada naskah digital lontar Bali.


Full Text:

Untitled


DOI: https://doi.org/10.23887/jik.v3i1.2748

Refbacks

  • There are currently no refbacks.


Diterbitkan oleh:

UNIVERSITAS PENDIDIKAN GANESHA


Jl. Udayana, Kampus Tengah, Singaraja-Bali
Kode Pos 81116
Telp. 0362-22570
Homepage: http://www.undiksha.ac.id


JURNAL ILMU KOMPUTER INDONESIA Undiksha indexed by:

     

Creative Commons License