Penerapan Sistem Pencarian Dokumen Berdasarkan Frasa diAbstrak Perpustakaan Digital Menggunakan Algoritma BM25 danWord2Vec
DOI:
https://doi.org/10.26618/t9pgjs86Abstract
Perkembangan perpustakaan digital menyebabkan meningkatnya volume abstrak dokumen
sehingga menuntut metode pencarian yang akurat untuk menemukan buku relevan. Penelitian ini
mengusulkan penerapan sistem pencarian berbasis frasa pada abstrak dengan menggabungkan
algoritma BM25 dan Word2Vec untuk meningkatkan relevansi hasil. Dataset terdiri dari 500 abstrak
skripsi yang dipreproses (lowercasing, tokenisasi, stopword removal); model Word2Vec dilatih
dengan arsitektur skip-gram (vector_size=100, window=5, epochs=50) dan BM25 diinisialisasi pada
representasi token dokumen. Skor BM25, Word2Vec (cosine similarity) dan TF-IDF dinormalisasi
lalu digabungkan (rata-rata) untuk pemeringkatan akhir. Evaluasi dilakukan menggunakan metrik
Precision, Recall dan F1-Score pada beberapa query uji. Hasil menunjukkan peningkatan performa
pada banyak query (rata-rata F1 ≈ 0.80) dengan beberapa kasus mencapai nilai sempurna (1.00),
meskipun ada variabilitas antar tipe query. Temuan ini menegaskan bahwa penggabungan
pencocokan lesikal BM25 dan representasi semantik Word2Vec dapat meningkatkan relevansi
pencarian; pengembangan lanjutan direkomendasikan pada metode penggabungan skor dan
perluasan korpus.
Downloads
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Nur Fajar, Fahrim Irhmna Rachman, Ida Mulyadi

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.










