Yapay zekâya dayalı anlamsal video işleme yöntemlerinin tıpta kullanılabilirliğinin araştırılması
Yükleniyor...
Dosyalar
Tarih
2020
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İnönü Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Amaç: Nesne algılama veya tanıma, dijital görüntülerdeki nesneleri tanımlamayı içeren ilgili bilgisayarlı görü işlemlerinin bir koleksiyonunu tanımlayan genel bir terimdir. Son zamanlarda sağlık alanında nesne algılama uygulamalarının klinik karar destek sistemleri olarak kullanımına yönelik çalışmalar giderek önem kazanmaktadır. Gelişen bilgisayar ve makine öğrenmesi teknolojileri sayesinde klinik görüntü ve videolar (Bilgisayarlı tomografi, ultrason, vb.) üzerinden hastalık veya anomali tespiti bilgisayarlar tarafından otomatik olarak yapılabilir hale gelmiştir. Hesaplama maliyeti yüksek bu işlemlerin yüksek doğruluk ve hassasiyetle gerçekleştirilebilmesi için amaca yönelik derin öğrenme mimarileri geliştirilmiştir. Nesne tanıma işlemleri için sıklıkla kullanılan mimarilerden olan evrişimsel sinir ağları (Convolutional neural networks, CNN) derin, ileri beslemeli yapay sinir ağı sınıfıdır. Bu çalışmada uygun video/görüntü işleme teknikleri ve CNN mimarisi kullanılarak endoskopik video görüntüleri içerisinde bulunan poliplerin tespiti, tanımlanması, sınıflandırılması ve takibi gibi çeşitli yöntemler ile sağlık personelleri için kullanıcı dostu bir yazılımın geliştirilmesi amaçlanmıştır. Materyal ve Metot: Çalışmada kullanılan veriseti, toplam 300 görüntüden oluşmaktadır. Bu görüntüler sindirim yolundaki anatomik dönüm noktaları, patolojik bulgular veya gastrointestinal prosedürler gibi her sınıf için yüzlerce görüntüden oluşan çeşitli sınıflara ait tıp doktorları (deneyimli endoskopistler) tarafından açıklanan ve doğrulanan görüntülerden oluşmaktadır. Görüntüler, araştırma ve eğitim amaçlı olarak açık erişimli olarak sunulan https://datasets.simula.no/kvasir internet adresinden temin edilmiştir. Modelleme aşamasında Dlib kütüphanesinde bulunan derin sinir ağları mimarilerinden CNN ve maksimum aralık nesne algılama yöntemi (Max-Margin Object Detection, MMOD) kullanılmıştır. Basit çapraz geçerlilik yöntemi (hold-out) kullanılarak veri seti %80 eğitim, %20 test olacak şekilde iki kısma ayrılmıştır. Model performansının değerlendirilmesinde ise kesinlik, duyarlılık, F1-skor, ortalama kesinlik (average precision, AP), ortalama kesinlik değerlerinin ortalaması (mean average precision, mAP), kesiştirilmiş bölgeler ölçütleri (intersection over union, IoU), en uygun konumlandırma kesinliği ve duyarlılığı (optimal localization recall precision, oLRP), ortalama en uygun LRP (Mean Optimal LRP, moLRP) kullanılmıştır. Bulgular: Bu tez çalışmasının uygulamasında endoskopik poliplere ilişkin açık erişimli video görüntü veri seti üzerinde önceden açıklanan aşamalar gerçekleştirildiğinde, eğitim veri setinde incelenen bütün performans metrikleri 1 değerini alırken, test veri setinde ise kesinlik %98, duyarlılık %90, F1-skoru %94, AP ve mAP %89, oLRP ve moLRP %48 olarak hesaplanmıştır. Sonuç: Hesaplanan performans ölçütlerine ait değerler dikkate alındığında, önerilen sistemin gastrointestinal poliplerin tanısında başarılı tahminler verdiği tespit edilmiştir. Anahtar kelimeler: Nesne tanıma, derin öğrenme, karar destek sistemi, gastrointestinal polipler, evrişimsel sinir ağları
Aim: Object scanning or recognition is a general term that describes a collection of related computer vision processes that involve identifying objects in digital images. Recently, studies on the use of object recognition applications in the field of health as clinical decision support systems are gaining importance. Thanks to the developing computer and machine learning technologies, detection of disease or anomaly via clinical images and videos (computed tomography, ultrasound, etc.) has been made automatically by computers. To perform these operations having high calculation cost with high accuracy and precision, purposeful deep learning architectures have been developed. Convolutional neural networks (CNN), one of the frequently used architectures for object recognition processes, is a deep, feed forward neural network class. In this study, by using appropriate video/image processing techniques and CNN architecture, it is aimed to develop a user-friendly software for healthcare professionals with various methods such as detection, identification, classification and tracking of polyps contained in the endoscopic images. Material and Methods: The dataset consisted of 300 images in total. These images are images described and validated by medical doctors (experienced endoscopists) of several classes, consisting of hundreds of images for each class, such as anatomical milestones, pathological findings, or gastrointestinal procedures in the digestive tract. The images were obtained from the web address https://datasets.simula.no/kvasir, which is open source for research and educational purposes. CNN and Max-Margin object detection method (MMOD), one of the deep neural network architectures in the Dlib library, was used in the modeling phase. The simple cross-validation (i.e., hold-out) method is used and the whole data is divided into two parts: 80% for training and 20% testing. In the evaluation of model performance, precision, recall, F1-score, average precision (AP), mean average precision (mAP), optimal localization recall precision (oLRP), mean optimal LRP, (moLRP) and intersection over union (IoU) were used. Results: In the implementation of the study, when the previously described steps on the open access video image dataset related to the colonic polyps were performed, all performance metrics examined in the training dataset were 100%, while precision of 98%, recall of 94%, F1-score of 94%, AP of 89% and mAP of 89%, oLRP of 48% and moLRP of %48 were calculated on the testing dataset. Conclusion: Considering the values of the calculated performance criteria, it was found that the proposed system gave successful predictions in the diagnosis of gastrointestinal polyps. Keywords: Object recognition, deep learning, decision support system, gastrointestinal polyps, convolutional neural networks
Aim: Object scanning or recognition is a general term that describes a collection of related computer vision processes that involve identifying objects in digital images. Recently, studies on the use of object recognition applications in the field of health as clinical decision support systems are gaining importance. Thanks to the developing computer and machine learning technologies, detection of disease or anomaly via clinical images and videos (computed tomography, ultrasound, etc.) has been made automatically by computers. To perform these operations having high calculation cost with high accuracy and precision, purposeful deep learning architectures have been developed. Convolutional neural networks (CNN), one of the frequently used architectures for object recognition processes, is a deep, feed forward neural network class. In this study, by using appropriate video/image processing techniques and CNN architecture, it is aimed to develop a user-friendly software for healthcare professionals with various methods such as detection, identification, classification and tracking of polyps contained in the endoscopic images. Material and Methods: The dataset consisted of 300 images in total. These images are images described and validated by medical doctors (experienced endoscopists) of several classes, consisting of hundreds of images for each class, such as anatomical milestones, pathological findings, or gastrointestinal procedures in the digestive tract. The images were obtained from the web address https://datasets.simula.no/kvasir, which is open source for research and educational purposes. CNN and Max-Margin object detection method (MMOD), one of the deep neural network architectures in the Dlib library, was used in the modeling phase. The simple cross-validation (i.e., hold-out) method is used and the whole data is divided into two parts: 80% for training and 20% testing. In the evaluation of model performance, precision, recall, F1-score, average precision (AP), mean average precision (mAP), optimal localization recall precision (oLRP), mean optimal LRP, (moLRP) and intersection over union (IoU) were used. Results: In the implementation of the study, when the previously described steps on the open access video image dataset related to the colonic polyps were performed, all performance metrics examined in the training dataset were 100%, while precision of 98%, recall of 94%, F1-score of 94%, AP of 89% and mAP of 89%, oLRP of 48% and moLRP of %48 were calculated on the testing dataset. Conclusion: Considering the values of the calculated performance criteria, it was found that the proposed system gave successful predictions in the diagnosis of gastrointestinal polyps. Keywords: Object recognition, deep learning, decision support system, gastrointestinal polyps, convolutional neural networks
Açıklama
Anahtar Kelimeler
Biyoistatistik, Biostatistics
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Ucuzal, Hasan (2020). Yapay zekâya dayalı anlamsal video işleme yöntemlerinin tıpta kullanılabilirliğinin araştırılması. Yayımlanmış Yüksek Lisans tezi, İnönü Üniversitesi, Malatya.1-70 ss.