Data Mining untuk Klasifikasi Diagnosa Kanker Payudara Dengan Menerapkan Algoritma C4.5

Yulia Eka Praptiningsih, Winda Widya Ariestya, Ida Astuti, Sylvia Nurulita

Abstract


Penyakit kanker merupakan gangguan kesehatan pada organ tubuh manusia atau jaringan tubuh di mana sel-sel yang tidak normal berkembang biak dengan tidak terkendali. Kanker adalah penyebab kematian terbesar kedua, tak terkecuali kanker payudara yang diderita sebagian besar wanita Indonesia. Tujuan penelitian ini adalah untuk mendiagnosa penyakit kanker payudara yang diderita pasien apakah bersifat  ganas atau jinak  menggunakan algoritma C4.5 sehingga dapat membantu penanganan penyakit kanker tersebut untuk mencegah kematian.  Metode penelitian yang digunakan terdiri dari tiga tahapan yaitu preprocessing, modeling, dan evaluation. Tahap preprocessing, 570 catatan data klinis dari UCI (UC Irvine) Machine Learning Repository digunakan dalam penelitian ini dan selanjutnya dilakukan split data yaitu data train dan data test. Tahap modeling (pembentukan model) mengimplementasikan algoritma C4.5 sebagai metode klasifikasi penyakit kanker payudara ganas dan jinak. Tahap akhir evaluation dari hasil klasifikasi pada 32 atribut diperoleh 8 atribut sebagai penentu. Hasil evaluasi performance menunjukan algoritma C4.5 dapat digunakan sebagai algoritma pada klasifikasi penyakit kanker payudara karena nilai akurasi yang diperoleh cukup besar yaitu 93,04%, presisi 80,00% dan recall 92,31%.


Keywords


Data Mining; Klasifikasi; C4.5; Kanker Payudara

Full Text:

PDF

References


. WHO, “Cancer,” 2016. https://www.who.int/health-topics/cancer#tab=tab_1 (accessed Jan. 12, 2023).

. Global Cancer Observatory, “Cancer Over Time,” 2020. [Online]. Available: https://gco.iarc.fr/

. Agung, “Kalkulasi Faktor Risiko Kanker Payudara Perlu Dilakukan,” Universitas Gadjah Mada, 2020. https://www.ugm.ac.id/id/berita/20137-kalkulasi-faktor-risiko-kanker-payudara-perlu-dilakukan (accessed Feb. 10, 2023).

. W. W. Ariestya, W. Supriyatin, and I. Astuti, “Marketing Strategy for the Determination of Staple Consumer Products Using Fp-Growth and Apriori Algorithm,” J. Ilm. Ekon. Bisnis, vol. 24, no. 3, pp. 225–235, 2019, doi: 10.35760/eb.2019.v24i3.2229.

. U. Ependi and A. Putra, “Solusi Prediksi Persediaan Barang dengan Menggunakan Algoritma Apriori (Studi Kasus: Regional Part Depo Auto 2000 Palembang),” JEPIN (Jurnal Edukasi dan Penelit. Inform., vol. 5, no. 2, pp. 139–145, Aug. 2019, doi: 10.26418/JP.V5I2.32648.

. F. Elfaladonna and A. Rahmadani, “Analisa Metode Classification-Decission Tree Dan Algoritma C.45 Untuk Memprediksi Penyakit Diabetes Dengan Menggunakan Aplikasi Rapid Miner,” SINTECH (Science Inf. Technol. J., vol. 2, no. 1, pp. 10–17, Apr. 2019, doi: 10.31598/SINTECHJOURNAL.V2I1.293.

. M. Ture, F. Tokatli, and I. Kurt, “Using Kaplan–Meier analysis together with decision tree methods (C&RT, CHAID, QUEST, C4.5 and ID3) in determining recurrence-free survival of breast cancer patients,” Expert Syst. Appl., vol. 36, no. 2, pp. 2017–2026, Mar. 2009, doi: 10.1016/J.ESWA.2007.12.002.

. T. Wulandari, M. Marji, and L. Muflikkah, “Klasifikasi Jenis Kanker Berdasarkan Struktur Protein Menggunakan Algoritma Naive Bayes,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 10, pp. 3738–3743, Feb. 2018, Accessed: Jul. 07, 2023. [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/2718

. M. A. E. Setyorini, “Analisis perbandingan metode machine learning: random forest dan support vector machine untuk deteksi kanker paru-paru,” Universitas Jember, 2020. Accessed: Jul. 07, 2023. [Online]. Available: https://repository.unej.ac.id/handle/123456789/101771

. M. Maryam and H. W. Ariono, “Sistem Pakar Pengklasifikasi Stadium Kanker Serviks Berbasis Mobile Menggunakan Metode Decision Tree,” J. Kaji. Ilm., vol. 22, no. 3, pp. 267–278, Sep. 2022, doi: 10.31599/JKI.V22I3.1368.

. A. R. Pratama, TG, “Application of the C4. 5 Algorithm for Early Cervical Cancer Classification,” Urecol J., vol. 1, no. 1, p. 1, 2021, doi: 10.53017/uje.4.

. D.-K. I. J. I. K. Gunawan, “Evaluasi Performa Pemecahan Database dengan Metode Klasifikasi Pada Data Preprocessing Data mining,” J. Ilmu Komput. dan Inform. Khazanah Inform., vol. 2, no. 1, pp. 10–13, 2016, Accessed: Feb. 02, 2023. [Online]. Available: https://journals.ums.ac.id/index.php/khif/article/view/1749

. UCI, “Breast Cancer Coimbra - UCI Machine Learning Repository,” 2018. https://archive.ics.uci.edu/dataset/451/breast+cancer+coimbra (accessed Dec. 12, 2022).

. F. M. Hana, “Klasifikasi Penderita Penyakit Diabetes Menggunakan Algoritma Decision Tree C4. 5,” J. Sist. Komput. dan Kecerdasan Buatan, vol. IV, no. 1, pp. 32–39, 2020, doi: https://doi.org/10.47970/siskom-kb.v4i1.173.

. D. Novianti, “Implementasi Algoritma Naïve Bayes Pada Data Set Hepatitis Menggunakan Rapid Miner,” J. Inform. dan Komput., vol. 21, no. 1, pp. 49–54, 2019, doi: 10.31294/p.v20i2.

. I. Astuti, W. Ariestya, and B. Solehudin, “Deteksi Objek Daun Semanggi Secara Real Time Menggunakan CNN-Single Shot Multibox Detector (SSD),” J. Ilm. FIFO, vol. XIV, no. 1, pp. 47–58, 2022, doi: 10.22441/fifo.2022.v14i1.005.

. Kuncahyo Setyo Nugroho, “Confusion Matrix untuk Evaluasi Model pada Supervised Learning,” 2019. https://ksnugroho.medium.com/confusion-matrix-untuk-evaluasi-model-pada-unsupervised-machine-learning-bc4b1ae9ae3f (accessed Jan. 02, 2023).




DOI: http://dx.doi.org/10.22441/fifo.2023.v15i1.005

Refbacks

  • There are currently no refbacks.


Jurnal Ilmiah FIFO
Portal ISSNPrint ISSN: 2085-4315
Online ISSN: 2502-8332

Sekretariat
Fakultas Ilmu Komputer
Universitas Mercu Buana
Jl. Raya Meruya Selatan, Kembangan, Jakarta 11650
Tlp./Fax: +62215871335

http://publikasi.mercubuana.ac.id/index.php/fifo

e-mail:[email protected]

Creative Commons Licence
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

Web
Analytics Made Easy - StatCounter
View My Stats

 

width= width=