Klasifikasi Penyakit Kanker Paru-Paru Menggunakan Metode Decision Tree C4.5

Khorlis Jainudin, Asrul Abdullah, Sucipto Sucipto

Abstract


The incidence of lung cancer in Indonesia has shown a significant increase, positioning the country as the eighth highest in Southeast Asia, with a growth rate of 10.85% over the past five years. A considerable number of lung cancer cases remain undiagnosed at earlier stages due to difficulties in detection, which contributes to the high mortality rate associated with this disease. Consequently, there is a need for a relatively efficient and straightforward technique to uncover knowledge, patterns, and interrelationships among data. The objective of this study is to develop a classification model for lung cancer using the C4.5 decision tree method and to evaluate its predictive performance. The methodology comprises several stages, including data preprocessing, exploratory data analysis (EDA), handling of missing values, identification of duplicate records, assessment of feature correlations, separation of features and target variables, partitioning of data into training and testing sets, model implementation, and performance evaluation through a confusion matrix. The experimental results demonstrate that the proposed model achieves a recall of 90%, a precision of 86%, an F1-score of 88%, and an overall accuracy of 89%. These findings indicate that the C4.5 decision tree method is effective in classifying lung cancer cases and holds potential as a reliable approach in medical data analysis for early detection and diagnosis.

Keywords


Classification; Confusion Matrix; Data Mining; Decision Tree C4.5; Lung Cancer

Full Text:

PDF

References


Aktalina, L. (2022). Edukasi tentang Merokok sebagai Faktor Risiko Terjadinya Kanker Paru pada Masyarakat di Kelurahan Pelawi Utara Kecamatan Babalan Kabupaten Langkat. Jurnal Pengabdian Masyarakat, 1(2), 1–8.

Anugrah Pratama, D., Rizal Mutaqin, I., & Rafael Manuela, K. (2023). Analisis Terjadinya Kanker Paru-Paru Pada Pasien Menggunakan Decision Tree: Penerapan Algoritma C4.5 Dan RapidMiner Untuk Menentukan Risiko Kanker Pada Gejala Pasien. Jtmei, 2(4), 156–170. https://doi.org/10.55606/jtmei.v2i4.3004

Fatimatuz Zahroh, & Nur Rahmawati. (2024). Analisis Sistem Pengolahan Data Berbasis Web pada Badan Pusat Statistik Kabupaten X. Manufaktur: Publikasi Sub Rumpun Ilmu Keteknikan Industri, 2(1), 01–13. https://doi.org/10.61132/manufaktur.v2i1.119

Fitriani, E., Aryanti, R., Saepudin, A., & Ardiansyah, D. (2020). Penerapan Algoritma C4.5 Untuk Klasifikasi Penempatan Tenaga Marketing. Paradigma - Jurnal Komputer Dan Informatika, 22(1), 72–78. https://doi.org/10.31294/p.v22i1.6898

Gustipartsani, K., Rahaningsih, N., Dana, R. D., Mustafa, I. Y., Studi, P., Informatika, T., Studi, P., Akuntansi, K., Studi, P., Informatika, M., Perhotelan, P. S., Pariwisata, P., Internasional, P., Cirebon, K., & Barat, J. (2023). Data Mining Clustering Menggunakan Algoritma K-Means Pada. 7(6), 3595–3601.

Hikmah, N., Ariyanti, D., & Sugesti, M. (2019). Penerapan Teknik Data Mining untuk Clustering Armada pada PT. Siaga Transport Indonesia Menggunakan Metode k-Means. Explore, 9(1), 8. https://doi.org/10.35200/explore.v9i1.116

Jatnika Fahmi Idris, Rafid Ramadhani, & Muhammad Malik Mutoffar. (2024). Klasifikasi Penyakit Kanker Paru Menggunakan Perbandingan Algoritma Machine Learning. Jurnal Media Akademik (JMA), 2(2). https://doi.org/10.62281/v2i2.145

Kresimo Negoro, N., diana, M., Izul Ula, M., & Dwi Insani, F. (2022). Analisis Kebakaran pada Hutan dan Lokasi Lahan di Provinsi Riau Menggunakan Metode C4.5. Jurnal Informatika Universitas Pamulang, 7(1), 107–114. http://openjournal.unpam.ac.id/index.php/informatika

Lestari, I. I., & Homaidi, A. (2024). Gudang Jurnal Multidisiplin Ilmu Komparasi Algoritma Naive Bayes Dan Random Forest Pada Klasifikasi Kanker Payudara. 2, 778–785.

Mardi, Y. (2017). Data Mining : Klasifikasi Menggunakan Algoritma C4.5. Edik Informatika, 2(2), 213–219. https://doi.org/10.22202/ei.2016.v2i2.1465

Marzuq, R. D., Wicaksono, S. A., & Setiawan, N. Y. (2023). Prediksi Kanker Paru-Paru menggunakan Algoritme Random Forest Decision Tree. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 7(7), 3448–3456.

Naldy, E. T., & Andri, A. (2021). Penerapan Data Mining Untuk Analisis Daftar Pembelian Konsumen Dengan Menggunakan Algoritma Apriori Pada Transaksi Penjualan Toko Bangunan MDN. Jurnal Nasional Ilmu Komputer, 2(2), 89–101. https://doi.org/10.47747/jurnalnik.v2i2.525

Nasrullah, A. H. (2021). Implementasi Algoritma Decision Tree Untuk Klasifikasi Produk Laris. Jurnal Ilmiah Ilmu Komputer, 7(2), 45–51. https://doi.org/10.35329/jiik.v7i2.203

Nazifah, N., & Prianto, C. (2023). Decision Tree Algoritma C4.5 dengan algoritma lainnya: Sistematic Literature Review. Jurnal Informatika Dan Teknologi Komputer, 04(https://ejurnalunsam.id/index.php/jicom/), 57–64. https://ejurnalunsam.id/index.php/jicom/

Petra Valentino, & Siska Narulita. (2023). Performansi Algoritma Decision Tree (C4.5) untuk Prediksi Penyakit Jantung. Jurnal Cakrawala Informasi, 3(2), 18–24. https://doi.org/10.54066/jci.v3i2.349

Sartika, D., & Yupianti. (2020). Klasifikasi Penyakit Tiroid Menggunakan Algoritma C4 . 5. Journal of Science and Technology, 13(1), 71–76.

Suryawijaya, T. W. E. (2023). Memperkuat Keamanan Data melalui Teknologi Blockchain: Mengeksplorasi Implementasi Sukses dalam Transformasi Digital di Indonesia. Jurnal Studi Kebijakan Publik, 2(1), 55–68. https://doi.org/10.21787/jskp.2.2023.55-68

Taufik, G., & Jatmika, D. (2021). Penerapan Algoritma C4 . 5 Untuk Klasifikasi. 12–26.

Wahidah, A. R., Bachtiar, Y., & Wulan, R. (2022). Sistem Pendukung Analisa Key Performance Indicator (KPI) Menggunakan Metode Data Mining Berbasis Web Python Programming. JRKT (Jurnal Rekayasa Komputasi Terapan), 2(03), 151–158. https://doi.org/10.30998/jrkt.v2i03.7971

Widya, H., Surya Putra, N., Atina, V., & Maulindar, J. (2023). Penerapan Algoritme Decision Tree Pada Klasifikasi Penyakit Kanker Paru-Paru. Jurnal Ilmiah Teknik Informatika Dan Sistem Informasi. https://www.kaggle.com/datasets/mysarahmadbhat/lung-cancer,




DOI: https://doi.org/10.31764/justek.v8i3.31981

Refbacks

  • There are currently no refbacks.


JUSTEK Official: