Research Article
BibTex RIS Cite

COVID-19 HASTALIK TEŞHİSİNİN ADABOOST VE NAİVE BAYES ALGORİTMALARIYLA TAHMİN EDİLMESİ

Year 2022, Volume: 10 Issue: 4, 1212 - 1221, 30.12.2022
https://doi.org/10.21923/jesd.976865

Abstract

Koronavirüs hastalığı (COVID-19) , tüm dünyada milyonlarca insana bulaşmış ve birçok insanın ölümüne sebep olmuştur. Bu hastalığı taşıyan kişilerin en kısa sürede tespit edilmesi, hastalığın yayılmasına engel olmaktadır. Hastalık tespiti için PCR (Polymerase Chain Reaction) testleri yapılmaktadır. Bu testleri sonuçları %100 doğrulukta olmamaktadır. Ayrıca test sonuçlarının öğrenilmesi bazı durumlarda birkaç gün zaman alabilmektedir. Hastalık şüphesiyle sağlık kuruluşlarına başvuran kişilerin COVID-19 hastalık teşhisi farklı hastalık belirtilerinin varlığı kullanılarak gerçekleşebilmektedir. Bu çalışmada, Adaboost ve Naive Bayes denetimli makine öğrenme algoritması kullanılarak COVID-19 Surveillance veri seti içindeki hastaların COVID-19 teşhis tahminleri gerçekleştirilmiştir. Makine öğrenmesi algoritmaları kullanılarak önceden var olan verilerden tecrübe kazanarak yeni veriler hakkında tahminler yapılabilmektedir. Bu çalışmada, COVID-19 hastalık teşhis tahminlerinde, uluslararası hastalık kodlarıyla belirtilen veriler kullanılmıştır. Veri setindeki hastaların gösterdiği belirtiler öznitelik bilgisi olarak kullanılmıştır. Öznitelik verileri makine öğrenme algoritmalarına uygun olması için ikili formatta kullanılmıştır. Bu çalışmada elde sonuçlara göre Naive Bayes algoritmasıyla %85, Adaboost algoritmasıyla %100 doğrulukta sınıflandırma tahmini gerçekleştirilmiştir.

References

  • Balaban, M. E., Kartal, E. (2018). Veri madenciliği ve makine öğrenmesi temel algoritmaları ve R Dili ile Uygulamaları, İkinci Baskı. İstanbul, Türkiye, Çağlayan Kitap & Yayıncılık & Eğitim.
  • Chen, Y., Chang, Y., Kan, Y., Chen, R. S., Wu, S. F. (2018). Using Data Mining Technique to Improve Billing System Performance in Semiconductor Industry, 2018 International Conference on Information and Computer Technologies (ICICT), DeKalb, IL, 23-25 March, 2018.
  • Çelik, A. (2020). Using Apriori Data Mining Method in COVID-19 Diagnosis. Journal of Engineering Technology and Applied Sciences, 5(3), 121-131.
  • Dua, D., Graf, F. C. (2019). UCI Machine Learning Repository, University of California, School of Information and Computer Science, Irvine, USA.
  • Freund, Y, Schapire, R. E. (1999). A Decision-Theoretic Generalization of On-line Learning and An Application to Boosting, Proc. Eur. Conf. Comput. Learn. Theory, 119-139.
  • Kumari, S., Singh, M. (2019). Big Data Analytics for Healthcare Industry: Impact, Applications, and Tools, in Big Data Mining and Analytics, 2(1), 48-57.
  • Olgun, M., Özdemir, G. (2013). İstatiksel Özellik Temelli Bayes Sınıflandırıcı Kullanarak Kontrol Grafiklerinde Örüntü Tanıma, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 27(2), 303-311.
  • Orhan, U., Adem, K. (2012). The Effects of Probability Factors in Naive Bayes Method, 2012 Elektrik-Elektronik ve Bilgisayar Mühendisliği Sempozyumu, Bursa, Turkey, 29 Nov-01 Dec. 2012.
  • Randhawa, K., Loo, C. K., Seera, M., Lim, C. P., Nandi, A. K. (2018). Credit Card Fraud Detection Using AdaBoost and Majority Voting, IEEE Access, 6,14277-14284.
  • Silahtaroğlu, G. (2016). Veri madenciliği (Kavram ve algoritmaları), Üçüncü Baskı, İstanbul, Türkiye, Papatya Yayıncılık Eğitim.
  • Sun, Y., Kamel, M. S., Wang, Y. (2006). Boosting for Learning Multiple Classes with Imbalanced Class Distribution, Sixth International Conference on Data Mining (ICDM'06), Hong Kong, China, 18-22 Dec 2006.
  • Wang, F., Li, F., He, F., Wang, R., Yu, W., Nie, F. (2019). Feature Learning View Point of Adaboost and a New Algorithm, IEEE Access, 7, 149890-149899.
  • Wiguna, W., Riana, D. (2020). Diagnosis of Coronavirus Disease 2019 (Covid-19) Surveillance Using C4.5 Algorithm, Journal PILAR Nusa Mandiri, 16, 71-80.
  • World Health Organization (WHO). (2005). International Statistical Classification of Diseases and Related Health Problems, 10th Revision (ICD-10 manual), Centers for Disease Control and Prevention, 1: 1-1268.
  • Wu, X., Zhu, X. (2008). Mining With Noise Knowledge: Error-Aware Data Mining, IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, 38(4), 917-932.
  • Xiao, F., Wang, Y., He, L., Wang, H., Li, W., Liu, Z. (2019). Motion Estimation From Surface Electromyogram Using Adaboost Regression and Average Feature Values, IEEE Access, 7,13121-13134.
  • Xu, H., Yuan, H. (2020). An SVM-Based AdaBoost Cascade Classifier for Sonar Image, IEEE Access, 8: 115857-115864.
  • Yılmaz, İ., Öztürk, D. (2019). Mekânsal Planlama ve Karar Problemlerinde CBS ve Bayes Ağlarının Entegrasyonu: Orman Yangın Tehlikesi Örneği, TMMOB 6. Coğrafi Bilgi Sistemleri Kongresi, Ankara, Türkiye, 23-25 Ekim 2019

PREDICTING DIAGNOSIS OF COVID-19 DISEASE WITH ADABOOST AND NAIVE BAYES MACHINE LEARNING ALGORITHMS

Year 2022, Volume: 10 Issue: 4, 1212 - 1221, 30.12.2022
https://doi.org/10.21923/jesd.976865

Abstract

Coronavirus disease (COVID-19) has infected millions of people all over the world and caused the death of many people. Identifying people with this disease as soon as possible is an important factor to prevent the disease from spreading. For disease detection, PCR (Polymerase Chain Reaction) tests performed. The results of tests always cannot give 100% accurate. In addition, obtaining information about test results sometimes may take a few days. Regarding the persons who applied to health institutions with suspicion of that illness, the diagnosis of COVID-19 disease takes place with the emergence of different disease symptoms. In this study, diagnostic estimates made for patients in the COVID-19 Surveillance dataset implementing Adaboost and Naive Bayes machine learning (ML) algorithm. It is possible to make predictions about new data by gaining experience from pre-existing data by means of using ML algorithms. In dataset determined within international disease codes for COVID-19 disease diagnosis estimates. Symptoms of patients used as attribute data in the dataset and used in binary format to be suitable for machine learning algorithms. According to the results obtained in this study, the classification forecast made with 85% accuracy with the Naive Bayes algorithm and 100% with the Adaboost algorithm.

References

  • Balaban, M. E., Kartal, E. (2018). Veri madenciliği ve makine öğrenmesi temel algoritmaları ve R Dili ile Uygulamaları, İkinci Baskı. İstanbul, Türkiye, Çağlayan Kitap & Yayıncılık & Eğitim.
  • Chen, Y., Chang, Y., Kan, Y., Chen, R. S., Wu, S. F. (2018). Using Data Mining Technique to Improve Billing System Performance in Semiconductor Industry, 2018 International Conference on Information and Computer Technologies (ICICT), DeKalb, IL, 23-25 March, 2018.
  • Çelik, A. (2020). Using Apriori Data Mining Method in COVID-19 Diagnosis. Journal of Engineering Technology and Applied Sciences, 5(3), 121-131.
  • Dua, D., Graf, F. C. (2019). UCI Machine Learning Repository, University of California, School of Information and Computer Science, Irvine, USA.
  • Freund, Y, Schapire, R. E. (1999). A Decision-Theoretic Generalization of On-line Learning and An Application to Boosting, Proc. Eur. Conf. Comput. Learn. Theory, 119-139.
  • Kumari, S., Singh, M. (2019). Big Data Analytics for Healthcare Industry: Impact, Applications, and Tools, in Big Data Mining and Analytics, 2(1), 48-57.
  • Olgun, M., Özdemir, G. (2013). İstatiksel Özellik Temelli Bayes Sınıflandırıcı Kullanarak Kontrol Grafiklerinde Örüntü Tanıma, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 27(2), 303-311.
  • Orhan, U., Adem, K. (2012). The Effects of Probability Factors in Naive Bayes Method, 2012 Elektrik-Elektronik ve Bilgisayar Mühendisliği Sempozyumu, Bursa, Turkey, 29 Nov-01 Dec. 2012.
  • Randhawa, K., Loo, C. K., Seera, M., Lim, C. P., Nandi, A. K. (2018). Credit Card Fraud Detection Using AdaBoost and Majority Voting, IEEE Access, 6,14277-14284.
  • Silahtaroğlu, G. (2016). Veri madenciliği (Kavram ve algoritmaları), Üçüncü Baskı, İstanbul, Türkiye, Papatya Yayıncılık Eğitim.
  • Sun, Y., Kamel, M. S., Wang, Y. (2006). Boosting for Learning Multiple Classes with Imbalanced Class Distribution, Sixth International Conference on Data Mining (ICDM'06), Hong Kong, China, 18-22 Dec 2006.
  • Wang, F., Li, F., He, F., Wang, R., Yu, W., Nie, F. (2019). Feature Learning View Point of Adaboost and a New Algorithm, IEEE Access, 7, 149890-149899.
  • Wiguna, W., Riana, D. (2020). Diagnosis of Coronavirus Disease 2019 (Covid-19) Surveillance Using C4.5 Algorithm, Journal PILAR Nusa Mandiri, 16, 71-80.
  • World Health Organization (WHO). (2005). International Statistical Classification of Diseases and Related Health Problems, 10th Revision (ICD-10 manual), Centers for Disease Control and Prevention, 1: 1-1268.
  • Wu, X., Zhu, X. (2008). Mining With Noise Knowledge: Error-Aware Data Mining, IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, 38(4), 917-932.
  • Xiao, F., Wang, Y., He, L., Wang, H., Li, W., Liu, Z. (2019). Motion Estimation From Surface Electromyogram Using Adaboost Regression and Average Feature Values, IEEE Access, 7,13121-13134.
  • Xu, H., Yuan, H. (2020). An SVM-Based AdaBoost Cascade Classifier for Sonar Image, IEEE Access, 8: 115857-115864.
  • Yılmaz, İ., Öztürk, D. (2019). Mekânsal Planlama ve Karar Problemlerinde CBS ve Bayes Ağlarının Entegrasyonu: Orman Yangın Tehlikesi Örneği, TMMOB 6. Coğrafi Bilgi Sistemleri Kongresi, Ankara, Türkiye, 23-25 Ekim 2019
There are 18 citations in total.

Details

Primary Language English
Subjects Computer Software
Journal Section Research Articles
Authors

Ahmet Çelik 0000-0002-6288-3182

Publication Date December 30, 2022
Submission Date July 31, 2021
Acceptance Date July 24, 2022
Published in Issue Year 2022 Volume: 10 Issue: 4

Cite

APA Çelik, A. (2022). PREDICTING DIAGNOSIS OF COVID-19 DISEASE WITH ADABOOST AND NAIVE BAYES MACHINE LEARNING ALGORITHMS. Mühendislik Bilimleri Ve Tasarım Dergisi, 10(4), 1212-1221. https://doi.org/10.21923/jesd.976865