Sınıflandırma problemlerinde topluluk öğrenme yöntemlerinin incelenmesi ve küçük hücreli dışı akciğer kanseri verileri üzerine bir uygulaması
Yükleniyor...
Dosyalar
Tarih
2020
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İnönü Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Amaç: Bu çalışmanın amacı, yapay zekâya dayalı topluluk öğrenme yöntemlerinin tıpta kullanılabilirliğini araştırılmak ve geliştirmektir. KHDAK ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri seti kullanılarak, KHDAK değişkeni; yanıt/çıktı/hedef ve veri setinde yer alan ölçümler ile diğer faktörler açıklayıcı/tahminleyici/bağımsız değişkenler olmak üzere, topluluk öğrenme yöntemlerinin KHDAK değişkenini sınıflandırmadaki performansı incelenecek ve en iyi model belirlenecektir. Materyal ve Metot: Bu çalışma, adresli açık kaynak erişimli web sitesinde yer alan KHDAK hastaları ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri setini kullanarak yapılmıştır. Veri seti toplam 181 inoperabl evre I-IIIB KHDAK hasta kaydını içermektedir. Veri setinin yaklaşık % 55.2'si radyoterapi yada kemoterapi alan hastalardan oluşurken % 44.8'i radikal tedavi gören hastalardan oluşmaktadır. Makine öğrenme yöntemlerinden olan SMO, K-NN, random forest ve XGBoost gibi bireysel sınıflandırıcılar ve performansları ile topluluk öğrenme yöntemlerinden voting, bagging, boosting ve stacking yöntemleri kullanılmıştır. Bulgular: Genel değerlendirmeye göre doğruluk, duyarlılık, kesinlik, özgüllük ve ROC eğrisi altında kalan alan metriklerinde en yüksek performansı boosting topluluk öğrenme yöntemi sağlamıştır. XGBoost ile en yüksek sınıflandırma performansını sağlayan boosting topluluk öğrenme yöntemi 0.982 doğruluk değeri, 0.971 duyarlılık değeri, 0.989 kesinlik değeri, 0.989 özgüllük değeri ve 0.998 ROC eğrisi altında kalan alan değerlerini elde etmiştir. Sonuç: Temel sınıflandırıcılara göre topluluk öğrenme sınıflandırıcıları KHDAK ölüm durumunu sınıflandırmada daha iyi sonuçlar vermiştir. Prevelansı yüksek kanser hastalıklılarında, sınıflandırma problemleri için topluluk öğrenme yöntemlerinin kullanılması başarılı sonuçların elde edilmesi açısından önerilmektedir.
Aim: The aim of this study is to investigate and improve the usability of AI -based community learning methods in medicine. Using the data set including various clinical variables to classify NSCLC death status, NSCLC variable; The performance of ensemble learning methods in classifying NSCLC variable will be examined, and the best model will be determined. Material and Methods: This study was conducted using the data set containing various clinical variables to classify the death status of NSCLC patients on the addressed open source website. The data set includes a total of 181 inoperable stage I-IIIB NSCLC patients. Approximately 55.2 % of the data set consisted of patients receiving radiotherapy or chemotherapy, while 44.8 % consisted of patients receiving radical treatment. Individual classifiers such as SMO, K-NN, random forest and XGBoost, which are machine learning methods, and their performances, and voting, bagging, boosting and stacking methods from ensemble learning methods were used. Results: According to the general evaluation, the boosting ensemble learning method provided the highest performance in the metrics of accuracy, sensitivity, precision, specificity and the area under the ROC curve. The boosting ensemble learning method, which provides the highest classification performance with XGBoost, achieved 0.982 accuracy value, 0.971 sensitivity value, 0.989 precision value, 0.989 specificity value and 0.998 ROC curve. Conclusion: Ensemble learning classifiers gave better results in classifying NSCLC mortality according to the basic classifiers. It is recommended to use ensemble learning methods for classification problems in cancer patients with high prevalence in order to achieve successful results.
Aim: The aim of this study is to investigate and improve the usability of AI -based community learning methods in medicine. Using the data set including various clinical variables to classify NSCLC death status, NSCLC variable; The performance of ensemble learning methods in classifying NSCLC variable will be examined, and the best model will be determined. Material and Methods: This study was conducted using the data set containing various clinical variables to classify the death status of NSCLC patients on the addressed open source website. The data set includes a total of 181 inoperable stage I-IIIB NSCLC patients. Approximately 55.2 % of the data set consisted of patients receiving radiotherapy or chemotherapy, while 44.8 % consisted of patients receiving radical treatment. Individual classifiers such as SMO, K-NN, random forest and XGBoost, which are machine learning methods, and their performances, and voting, bagging, boosting and stacking methods from ensemble learning methods were used. Results: According to the general evaluation, the boosting ensemble learning method provided the highest performance in the metrics of accuracy, sensitivity, precision, specificity and the area under the ROC curve. The boosting ensemble learning method, which provides the highest classification performance with XGBoost, achieved 0.982 accuracy value, 0.971 sensitivity value, 0.989 precision value, 0.989 specificity value and 0.998 ROC curve. Conclusion: Ensemble learning classifiers gave better results in classifying NSCLC mortality according to the basic classifiers. It is recommended to use ensemble learning methods for classification problems in cancer patients with high prevalence in order to achieve successful results.
Açıklama
Anahtar Kelimeler
Biyoistatistik, Biostatistics
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Kıvrak, M. (2020). Sınıflandırma problemlerinde topluluk öğrenme yöntemlerinin incelenmesi ve küçük hücreli dışı akciğer kanseri verileri üzerine bir uygulaması. Yayınlanmış Doktora Tezi, İnönü Üniversitesi.