Penerapan Natural Language Processing dan Regular Expressions dalam Validasi Artikel Ilmiah
DOI:
https://doi.org/10.26618/dkjw7933Abstract
ABSTRAK
Penelitian ini membahas penerapan Natural Language Processing (NLP) dalam proses validasi otomatis aturan penulisan artikel ilmiah pada AINET: Jurnal Informatika. Sistem dikembangkan dalam bentuk aplikasi web interaktif yang bertujuan untuk memeriksa kesesuaian struktur dan format artikel ilmiah secara otomatis, meliputi penulisan judul, identitas penulis, abstrak, kata kunci, bagian wajib artikel, serta format referensi yang digunakan. Metode yang diterapkan dalam penelitian ini adalah pendekatan rule-based, yang terdiri dari beberapa tahapan, yaitu ekstraksi teks dari dokumen, preprocessing NLP, segmentasi dokumen, serta pencocokan pola teks menggunakan Regular Expressions (Regex). Evaluasi sistem dilakukan menggunakan metode black-box testing terhadap 20 artikel jurnal sebagai data uji untuk mengukur tingkat ketepatan hasil validasi yang dihasilkan sistem. Hasil pengujian menunjukkan bahwa sistem mampu mencapai tingkat akurasi sebesar 90%, di mana 18 artikel berhasil divalidasi sesuai dengan kondisi sebenarnya. Temuan ini menunjukkan bahwa integrasi NLP dan Regex efektif dalam mendukung proses validasi penulisan artikel ilmiah secara efisien, cepat, dan konsisten. Namun demikian, sistem masih memiliki keterbatasan dalam mendeteksi abstrak bilingual, konsistensi penggunaan bahasa pada header, serta variasi format referensi, sehingga diperlukan pengembangan lanjutan untuk meningkatkan keandalan dan fleksibilitas sistem.
Kata Kunci:
Natural Language Processing, Regular Expressions, Validasi Penulisan, Artikel Ilmiah, AINET: Jurnal Informatika
ABSTRACT
This study discusses the application of Natural Language Processing (NLP) in the automatic validation of scientific article writing rules in AINET: Journal of Informatics. The system was developed as an interactive web-based application aimed at automatically checking the conformity of article structure and formatting, including the title, author information, abstract, keywords, mandatory article sections, and references. The method used in this study is a rule-based approach, which consists of several stages, namely text extraction, NLP preprocessing, document segmentation, and pattern matching using Regular Expressions (Regex). System evaluation was conducted using the black-box testing method on 20 journal articles to measure the accuracy of the validation results. The testing results show that the system achieved an accuracy rate of 90%, with 18 articles successfully validated in accordance with actual conditions. These findings indicate that the integration of NLP and Regex is effective in supporting the validation process of scientific article writing in an efficient, fast, and consistent manner. However, the system still has limitations in detecting bilingual abstracts, language consistency in headers, and variations in reference formats, indicating the need for further development to improve system reliability and flexibility.
Keyworsds:
Natural Language Processing, Regular Expressions, Writing Validation, Scientific Articles, AINET: Journal of Informatics




