Evaluasi Kinerja Algoritma Klasifikasi Deep Learning dalam Prediksi Diabetes

Tuahta Hasiholan Pinem, Zico Pratama Putra

Abstract


Penelitian yang bertujuan untuk mengembangkan dan mengevaluasi algoritma model prediksi diabetes telah dilakukan dengan menggunakan algoritma model K-Nearest Neighbor Classifier, Naive Bayes, Regresi Logistik, SVM, dan Neural Network. Dataset yang digunakan didapatkan dari Kaggle yang terdiri dari 768 data pasien yang dibagi menjadi data training 60%, data validation 20%, dan data test 20%. Hasil penelitian menunjukkan bahwa akurasi tertinggi diperoleh oleh model Regresi Logistik dan Neural Network, masing-masing sebesar 73% dan 72%. Model Regresi Logistik unggul dalam presisi untuk kelas non-diabetes dan recall untuk kelas diabetes, sedangkan model Neural Network menunjukkan keseimbangan performa yang baik antara presisi dan recall untuk kedua kelas. Model Naive Bayes juga menunjukkan performa yang kompetitif dengan akurasi 72% dan recall tinggi untuk kelas diabetes, model ini dapat menjadi pilihan yang baik dalam situasi yang memprioritaskan deteksi positifKinerja yang lebih rendah ditunjukkan oleh model KNN dan SVM jika dibandingkan dengan model lainnya. Masalah utama yang diangkat dalam penelitian ini adalah pentingnya meningkatkan akurasi prediksi diabetes untuk mendukung deteksi dini dan pengobatan. Secara keseluruhan, model Regresi Logistik dan Neural Network diidentifikasi sebagai model yang paling potensial untuk prediksi diabetes, dengan Regresi Logistik menunjukkan efektivitas yang tinggi dalam mengidentifikasi kasus non-diabetes, sementara Neural Network memberikan keseimbangan performa yang baik di kedua kelas.


Keywords


Diabetes; K-Nearest Neighbors; Machine Learning; Naïve Bayes; Neural Network; Regresi Logistik; Support Vector Machine

Full Text:

PDF

References


A. Oktaviana, D. P. Wijaya, A. Pramuntadi and D. Heksaputra, "Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor (K-NN)," MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol. 4, pp. 812-818, 3 Juli 2024.

A. Massaro, N. Magaletti, G. Cosoli, V. O. Giardinelli and A. Leogrande, "Methods and Metrics for the Prediction of Diabetes," Preprints, no. doi:10.20944/preprints202206.0202.v1, pp. 1-22, 14 Juni 2022.

N. A. ElSayed, G. Aleppo, V. R. Aroda, R. R. Bannuru, F. M. Brown, D. Bruemmer, B. S. Collins, J. L. Gaglia, M. E. Hilliard, D. Isaacs, E. L. Johnson, S. Kahan, K. Khunti, S. K. Lyons and L, "Classification and Diagnosis of Diabetes: Standards of Care in Diabetes—2023," Diabetes Care, vol. 46, pp. 19-40, Januari 2023.

R. Wagh, J. M. Wagh, S. Upadhyay, C. Prajapati and U. Parit, "COMPLICATIONS IN DIABETES : A REVIEW," Indian Journal of Applied Research, vol. 12, no. 10, pp. 19-31, Oktober 2022.

R. Pahlevi, "Jumlah Penderita Diabetes di Indonesia Diproyeksikan Capai 28,57 Juta pada 2045," 24 November 2021. [Online]. Available: https://databoks.katadata.co.id/datapublish/2021/11/24/jumlah-penderita-diabetes-di-indonesia-diproyeksikan-capai-2857-juta-pada-2045. [Accessed 16 Juni 2024].

J. Jasmani and T. Rihiantoro, "Edukasi dan Kadar Glukosa Darah pada Pasien Diabetes," Jurnal Keperawatan, vol. XII (1), no. ISSN 1907 - 0357, pp. 140-148, April 2016.

A. Panesar, Machine Learning and AI for Healthcare - Big Data for Improved Health Outcomes, Berkeley, California: Apress, 2021.

A. Asmarani, M. I. Permana, A. Putri, M. R. Wijaya, E. Rasywir, D. Meisak and Y. Pratama, "Implementasi Algoritma K-Nearst Neighbor Untuk Memprediksi Penyakit Diabetes," Jurnal Informatika Dan Rekayasa Komputer (JAKAKOM), vol. 2 (2), pp. 231-239, September 2022.

H. O. P. A. S. Patel, "Diabetes Prediction Using Machine Learning," in roceedings of Second International Conference on Computing, Communications, and Cyber-Security, Singapura, 2021.

MrSimple, "Diabetes Prediction [Data set]," Kaggle, 2024. [Online]. Available: https://www.kaggle.com/dsv/7655840. [Accessed Juni 2024].

S. Vishwakarma and S. Ganguly, "Optimal partition of feature using Bayesian classifier," arXiv, vol. 1, pp. 1-7, 27 April 2023.

A. Atthohiroh, R. Ayu and S. Maharani, "Penerapan Metode Naive Bayes dalam Memprediksi Penyakit Jantung," Jurnal Teknisi : Jurnal Teknologi Komputer dan Sistem Informasi, vol. 3 (1), pp. 8-13, Februari 2023.

J. C. Stoltzfus, "Logistic Regression: A Brief Primer," Academic Emergency Medicine, vol. 18, no. 10; Doi: https://doi.org/10.1111/j.1553-2712.2011.01185.x, pp. 1099-1104, 13 Oktober 2011.

V. Bewick, L. Cheek and J. Ball, "Review Statistics review 14: Logistic regression," Critical Care, vol. 9, pp. 112-118, 13 Januari 2005.

J. M. Davis, "Support Vector Machines for Classification and Quantitative Analysis," Microscopy and Microanalysis, vol. 20, no. DOI: https://doi.org/10.1017/S1431927614005005, pp. 656 - 657, Agustus 2014.

L. Nguyen, "Tutorial on Support Vector Machine," Applied and Computational Mathematics, vol. 6, pp. 1-15, 17 Juni 2017.

S. Manzhos and M. Ihara, "Neural Network with Optimal Neuron Activation Functions Based on Additive Gaussian Process Regression," The Journal of Physical Chemistry A, vol. 127 (37), pp. 7823-7835, 12 September 2023.

M. Thorat, S. Pandit and S. Balote, "Artificial Neural Network: A brief study," Asian Journal of Convergence in Technology, vol. VIII (3), no. III, pp. 12-16, 2022.

K. Riehl, M. Neunteufel and M. Hemberg, "Hierarchical confusion matrix for classification performance evaluation," arXiv, vol. 1, pp. 1-8, 15 Juni 2023.

J. Li, H. Sun and J. Li, "Beyond confusion matrix: learning from multiple annotators with awareness of instance features," Machine Learning, vol. 112, pp. 1053-1075, 7 Juli 2021.

J. Görtler, F. Hohman, D. Moritz, K. Wongsuphasawat, D. Ren, R. Nair, M. Kirchner and K. Patel, "Neo: Generalizing Confusion Matrix Visualization to Hierarchical and Multi-Output Labels," in CHI '22: Proceedings of the 2022 CHI Conference on Human Factors in Computing Systems, 2022.

World Health Organization, "Cardiovascular diseases," World Health Organization, 22 Maret 2023. [Online]. Available: https://www-who-int.translate.goog/?_x_tr_sl=en&_x_tr_tl=id&_x_tr_hl=id&_x_tr_pto=sc&_x_tr_hist=true#tab=tab_3. [Accessed 11 Juni 2024].

L. Yahaya, N. D. Oye and J. E. Garba, "A Comprehensive Review on Heart Disease Prediction Using Data Mining and Machine Learning Techniques," American Journal of Artificial Intelligence, vol. 4 (1), no. doi: 10.11648/j.ajai.20200401.12, pp. 20-29, 23 April 2020.

Y. Amelia, "Perbandingan Metode Machine Learning Untuk Mendeteksi Penyakit Jantung," Idealis: Indonesia Journal Information System, vol. 6 (2), no. ISSN 2684-7280, pp. 220-225, Juli 2023.

M. A. A.-R. Asif, M. M. Nishat, F. Faisal, R. R. Dip, M. H. Udoy, M. F. Shikder and R. Ahsan, "Performance Evaluation and Comparative Analysis of Different Machine Learning Algorithms in Predicting Cardiovascular Disease," Engineering Letters, vol. 29, no. 2, pp. 1-11, Juni 2021.

D. Lowd and P. Domingos, "Naive Bayes Models for Probability Estimation," in ICML '05: Proceedings of the 22nd international conference on Machine learning, 2005.




DOI: http://dx.doi.org/10.22441/fifo.2025.v17i1.003

Refbacks

  • There are currently no refbacks.


Jurnal Ilmiah FIFO
Portal ISSN Print ISSN: 2085-4315
Online ISSN: 2502-8332

Sekretariat
Fakultas Ilmu Komputer
Universitas Mercu Buana
Jl. Raya Meruya Selatan, Kembangan, Jakarta 11650
Tlp./Fax: +62215871335

http://publikasi.mercubuana.ac.id/index.php/fifo

e-mail:[email protected]

Creative Commons Licence
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

Web Analytics Made Easy - StatCounter
View My Stats

width=width=