Penggunaan Information Retrieval untuk Mendeteksi Kesamaan Judul Skripsi dengan Modified Cosine Similarity
Abstract
Abstract: This research develops a web-based system to detect the similarity of thesis titles using the Modified Cosine Similarity method and TF-IDF weighting. This system helps students in evaluating the similarity of titles automatically, so as to avoid plagiarism and increase the originality of research. The process used includes text preprocessing (case folding, tokenizing, stopword removal, stemming), TF-IDF calculation for word weighting, and the use of Modified Cosine Similarity to measure the level of similarity between titles. The test results show that the system is able to identify the similarity of titles with a 100% recall rate, where titles with >70% similarity need to be revised, 31%-70% similarity can be clarified by adding words, and ≤30% similarity is potentially accepted as an original title. With this implementation, it is expected that students can more easily determine a thesis title that is unique and in accordance with academic standards.
Abstrak: Penelitian ini mengembangkan sistem berbasis web untuk mendeteksi kemiripan judul skripsi menggunakan metode Modified Cosine Similarity dan pembobotan TF-IDF. Sistem ini membantu mahasiswa dalam mengevaluasi kemiripan judul secara otomatis, sehingga dapat menghindari plagiarisme dan meningkatkan orisinalitas penelitian. Proses yang digunakan meliputi text preprocessing (case folding, tokenizing, stopword removal, stemming), perhitungan TF-IDF untuk pembobotan kata, dan penggunaan Modified Cosine Similarity untuk mengukur tingkat kemiripan antar judul. Hasil pengujian menunjukkan bahwa sistem mampu mengidentifikasi kemiripan judul dengan tingkat recall 100%, di mana judul dengan kemiripan >70% perlu direvisi, kemiripan 31%-70% dapat diperjelas dengan penambahan kata, dan kemiripan ≤30% berpotensi diterima sebagai judul orisinil. Dengan implementasi ini, diharapkan mahasiswa dapat lebih mudah menentukan judul skripsi yang unik dan sesuai dengan standar akademik.Keywords
Full Text:
PDFReferences
Afandi, M. D., Homaidi, A., Ghofur, A., & Zubairi, A. (2024). Penerapan Information Retrieval dalam Sistem Analisis Kemiripan Proposal Skripsi menggunakan Cosine Similarity. Swabumi, 12(1), 39–46.https://doi.org/10.31294/swabumi.v12i1.17087
Ahmad, Nuraini, Arienda, Addis Prasetyo, A. M. (2021). Penerapan Information Retrieval Pada Search Engine. KNOWLEDGE : Jurnal Inovasi Hasil Penelitian Dan Pengembangan, 1(no.1), 15–23.
Ahmad, I., Indra Borman, R., Caksana, G. G., & Fakhrurozi, J. (2021). SINTECH Journal | 53 Implementasi String Matching Dengan Algoritma Boyer-Moore Untuk Menentukan Tingkat Kemiripan Pada Pengajuan Judul Skripsi/Ta Mahasiswa (Studi Kasus: Universitas XYZ). https://doi.org/10.31598
Al Rasyid, R., & Ningsih, D. H. U. (2024). Penerapan Algoritma TF-IDF dan Cosine Similarity untuk Query Pencarian Pada Dataset Destinasi Wisata. Jurnal JTIK (Jurnal Teknologi Informasi Dan Komunikasi), 8(1), 170–178. https://doi.org/10.35870/jtik.v8i1.1416
Alamsyah, N., Rasyidan, M., Kalimantan, I., Al, M. A., & Banjarmasin, B. (2019). Deteksi Plagiarisme Tingkat Kemiripan Judul Skripsi Pada Fakultas Teknologi Informasi Menggunakan Algoritma Winnowing. In Technologia (Vol. 10, Issue 4). Oktober-Desember.
Deolika, A., Kusrini, K., & Luthfi, E. T. (2019). Analisis Pembobotan Kata Pada Klasifikasi Text Mining. Jurnal Teknologi Informasi, 3(2), 179. https://doi.org/10.36294/jurti.v3i2.1077
Hidayatulloh, M. S. (2020). Sistem Temu Kembali Informasi Dinas Pemuda Olahraga dan Pariwisata Kabupaten Purbalingga dengan Metode Vector Space Model. Journal of Informatics, Information System, Software Engineering and Applications (INISTA), 2(2), 1–10. https://doi.org/10.20895/inista.v2i2.101
H. Herlambang, J. Suwita, and B.Tiara, "Analisa Dan Perancangan Sistem Pendeteksi Plagiarisme Skripsi Pada STMIK Insan Pembangunan Menggunakan Metode Cosine Similarity," Jurnal IPSIKOM, vol. 9, no. 1, 2021.
Ihsan Maulana, T., & Abdillah, R. (2022). SINTESIA: Jurnal Sistem dan Teknologi Informasi Indonesia Pemanfaatan Sistem Temu Kembali Informasi Dalam Pencarian Dokumen Menggunakan Vector Space Model.
Kosasih, R., & Alberto, A. (2021). Analisis Sentimen Produk Permainan Menggunakan Metode TF-IDF Dan Algoritma K-Nearest Neighbor. 6(1). https://doi.org/10.30743/infotekjar.v6i1.3893
Kurnia Aini, S. (2022). Perancangan Sistem Pendukung Keputusan Terhadap Pendeteksi Plagiarisme Judul Skripsi. In Teknologipintar.Org (Vol. 2, Issue 2).
L. Dara Jayanti And A. Masruri. (2024). "Temu Kembali Informasi Dengan Menggunakan Eskripsi Di Perpustakaan Universitas Respati Yogyakarta," Jurnal Pustaka Budaya, vol. 11, no. 1, 2024. https://journal.unilak.ac.id/index.php/pb/.
Mi’andri, M., Siregar, A. C., & Utami, P. Y. (2022). Sistem Penilaian Ujian Otomatis Untuk Soal Esai Menggunakan Metode Vector Space Model. JUTECH : Journal Education and Technology, 2(2), 1–15. https://doi.org/10.31932/jutech.v2i2.1273
Mirs, E. (2023). v o L. Romanian Journal Ofapplied Science and Technology, XIII(3), 254–260.
Nurmalasari, D., & Nengsih, W. (2021). Sistem Rekomendasi Referensi Jurnal Ilmiah dengan Metode Frequent Itemset. Journal of Applied Informatics and Computing, 5(2), 176–181.
Nuzul Hikmah, Dyah Ariyanti, & Ferry Agus Pratama. (2022). Implementasi Chatbot Sebagai Virtual Assistant di Universitas Panca Marga Probolinggo menggunakan Metode TF-IDF. JTIM : Jurnal Teknologi Informasi Dan Multimedia, 4(2), 133–148. https://doi.org/10.35746/jtim.v4i2.225
Priandono, I. R., Rozi, N. F., & Hakimah, M. (2020). Implementasi Vector Space Model Dengan Pembobotan Berbasis Kelas Pada Mesin Pencari Dokumen Skripsi. Jurnal Informatika: Jurnal Pengembangan IT, 5(2), 54–58. https://doi.org/10.30591/jpit.v5i2.2079
Putri Gabriella, Y. A. (2023). Optimasi Penerimaan Siswa Baru Dengan Penerapan Algortima Text Mining Dan Tf-Idf. Journal of Computing and Informatics Research, 2(3), 110–117. https://doi.org/10.47065/comforch.v2i3.941
Septiani, D., & Isabela, I. (2022). SINTESIA: Jurnal Sistem dan Teknologi Informasi Indonesia Analisis Term Frequency Inverse Document Frequency (TF-IDF) Dalam Temu Kembali Informasi Pada Dokumen Teks.
Via, Y. vita, & Mumpuni, R. (2019). Deteksi Kemiripan Dokumen Publikasi Skripsi Mahasiswa Menggunakan Algoritma Modifikasi Cosine Similarity. Journal of Information Engineering and Educational Technology, 3(2), 57–61. https://doi.org/10.26740/jieet.v3n2.p57-61
DOI: https://doi.org/10.31764/justek.v8i2.30146
Refbacks
- There are currently no refbacks.
JUSTEK : Jurnal Sains dan Teknologi sudah terindeks
EDITORIAL OFFICE: