Topluluk öğrenme yöntemleri ile renal hücreli karsinom'un tahmin edilmesi

Yükleniyor...
Küçük Resim

Tarih

2020

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

İnönü Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivs 3.0 United States

Özet

Amaç: Bu çalışmada farklı makine öğrenme yöntemlerinin birleştirilmesi ile elde edilen topluluk öğrenme yöntemleri ile renal hücreli karsinom hastalığının tahmin edilmesi amaçlanmıştır. Renal hücreli karsinomların sınıflandırılmasında, farklı sınıflayıcılar ve birleştirme teknikleri, topluluk öğrenme yöntemlerine uygulanarak en yüksek sınıflandırma performansını sağlayan topluluk öğrenme modelinin oluşturulması amaçlanmıştır. Materyal ve Metot: Çalışmanın veri seti, Kahramanmaraş Sütçü İmam Üniversitesi, Sağlık Uygulama ve Araştırma Hastanesi Üroloji Kliniği'ne gelen hastaların verilerinden retrospektif olarak elde edilmiştir. Çalışmanın örneklemi 140 renal hücreli karsinom hastası ve 140 renal hücreli karsinomu olmayan toplam 280 hastadan oluşmaktadır. Veri setinde hemogram ve laboratuar bulgularından oluşan 28 bağımsız ve bir bağımlı değişken yer almaktadır. Renal hücreli karsinomların tahmin edilmesinde boosting (artırma), bagging (torbalama), voting (oylama) ve stacking (istifleme) topluluk öğrenme yöntemi uygulanmıştır. Topluluk öğrenme yöntemlerinde, IB1, IBk, KStar, LWL, Random Forest, REPTree ve SMO sınıflayıcıları kullanılmıştır. Bulgular: Renal hücreli karsinomların tahmin edilmesinde en yüksek sınıflama performansı stacking topluluk öğrenme yönteminde IB1, IBk, KStar, LWL, Random Forest ve REPTree sınıflayıcılarının birleştirilmesinden oluşan model sağlamıştır. Modelin sınıflandırma performans ölçütleri sırasıyla doğruluk değeri 0.906, duyarlılık değeri 0.906, kesinlik değeri 0.906, özgüllük değeri 0.910 ve AUC değeri 0.944 olarak elde edilmiştir. Sonuç: Renal hücreli karsinomların tahmin edilmesinde topluluk öğrenme yöntemleri başarılı sınıflandırma gerçekleştirmiştir. Renal hücreli karsinomları en yüksek performans ile sınıflandıran topluluk yöntemi stacking topluluk öğrenme yöntemi olmuştur. Stacking topluluk öğrenme yönteminin tıbbi verilerde bilgi keşfi sürecinde uygulanması başarılı sonuçlar vermektedir. Topluluk öğrenme yöntemlerinde, birleştirme tekniklerinin geliştirilmesi ve uygun sınıflayıcıların modele dahil edilmesi, sınıflama performansını artıracaktır.
Objective: The aim of this research was to predict RCC disease by using ensemble learning methods obtained by combining different machine learning methods. It was aimed to create an ensemble learning model that provides the highest classification performance by applying different classifiers and combination of techniques to ensemble learning methods in the classification of RCC. Material and Methods: The data set was obtained retrospectively from Urology Clinic of KSU, Health Practice-Research Hospital. The sample size consisted of 280 patients. The data set includes 28 predictors and one dependent variable. In the prediction of RCC ensemble learning methods of boosting, bagging, voting and stacking were applied. In the ensemble learning methods, IB1, IBk, KStar, LWL, random forest, REPTree and SMO classifiers were used. Results: The model combining IB1, IBk, KStar, LWL, random forest and REPTree classifiers provided the highest classification performance in predicting RCC in the stacking ensemble learning method. The classification performance criteria of the model were obtained as: accuracy value 0.906, sensitivity value 0.906, precision value 0.906, specificity value 0.910 and AUC value 0.944. Conclusion: Ensemble learning methods have been successful in predicting RCC. The ensemble method that classifies RCC with the highest performance has been the Stacking ensemble learning method. The implementation of the stacking ensemble learning method in the process of knowledge discovery in medical data yields successful results. In ensemble learning methods, the development of combination of techniques and the inclusion of appropriate classifiers in the model will improve classification performance.

Açıklama

Anahtar Kelimeler

Biyoistatistik, Biostatistics

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Doğaner, Adem (2020). Topluluk öğrenme yöntemleri ile renal hücreli karsinom'un tahmin edilmesi. Yayımlanmış Doktora tezi, İnönü Üniversitesi, Malatya.1-83 ss.