Topluluk öğrenme yöntemlerine dayalı bilgisayar destekli tanı sisteminin geliştirilmesi: genomik teknolojileri üzerine uygulaması
Küçük Resim Yok
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İnönü Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Amaç: Bu çalışmanın amacı sisplatin ile hepatotoksisite oluşturulmuş sıçanlar ile patoloji oluşturulmamış sıçanlardan alınan karaciğer doku örneklerinin genomik analizlerinin yapılması ile elde edilen büyük verilerin biyoinformatik analizlerinin yapılması amacıyla bir bir web-tabanlı yazılımın geliştirilmesidir. Ayrıca verilerin topluluk öğrenmesi metodları ile modellenmesi sonucunda hepatotoksisite ile ilişkili tanıya/erken tanıya yönelik olası biyobelirteçlerin tespit edilmesi amaçlanmıştır. Materyal ve Metot: Çalışmada 20 adet dişi Sprague-Dawley sıçanın alınmasıyla oluşturulan bir deney düzeneğinden elde edilen genomik veriler kullanıldı. Biyoinformatik analizlerin yapılması için geliştirilen web tabanlı yazılım R programlama dili temelinde interaktif web tabanlı uygulamaların tasarlanmasına izin veren Shiny kütüphanesi ve ggplot2, ggrepel, DT, shinyWidgets, shinyLP, shinydashboard ve limma paketleri kullanılmıştır. Modellemelerde ise topluluk öğrenme yöntemlerinden bagging, boosting, stacking ve XGBoost modelleri kullanılmıştır. Bulgular: Çalışmada kullanılan genomik veri seti 16.386 ifade içermektedir. Biyoinformatik analiz sonuçlarına göre hepatotoksisite ve kontrol grupları için 589 adet lncRNA gruplarda farklı ekspresyon göstermiştir. Bunlardan 450 tanesi yukarı ekspresyon göstermişken 139 tanesi aşağı ekspresyon göstermiştir. Değişken seçimi ile seçilen lncRNA lar ile yapılan modellemeler sonucunda XGBoost modeli en yüksek performans metriklerine sahipti. Sonuç: Bu çalışma ile biyoinformatik analiz yapılmasına olanak sağlayan bir yazılım geliştirilmiştir. Ayrıca yapılan biyoinformatik analiz ve modellemeler sonucunda hepatotoksisitesi olan sıçanlar ile kontrol grubunda yer alan sıçanların lncRNA ekspresyon verileri kullanılarak hepatotoksisite için potansiyel genomik biyobelirteçleri belirlenmiştir. Anahtar Kelimeler: Bilgisayar Destekli Tanı Sistemi, Genomik, Makine Öğrenmesi, Sınıflandırma, Topluluk Öğrenme, Yapay Zekâ
Aim: The aim of this study is to develop web-based software for bioinformatic analysis of large data obtained by performing genomic analysis of liver tissue samples from rats with cisplatin hepatotoxicity and rats without pathology. In addition, as a result of modeling the data with community learning methods, it was aimed to determine possible biomarkers for diagnosis/early diagnosis related to hepatotoxicity. Material and Method: Genomic data obtained from an experimental setup created by taking 20 female Sprague-Dawley rats were used in the study. The web-based software developed for bioinformatics analysis is designed using the Shiny library, which allows interactive web-based applications to be designed based on the R programming language, and ggplot2, ggrepel, DT, shinyWidgets, shinyLP, shinydashboard, and limma the packages. In the models, bagging, boosting, stacking, and XGBoost models from ensemble learning methods were used. Results: The genomic dataset used in the study contains 16,386 expressions. According to the results of the bioinformatics analysis, 589 lncRNAs for hepatotoxicity and control groups showed different expressions in the groups. Of these, 450 showed up-expression, while 139 showed down-expression. As a result of modeling with lncRNAs selected by the variable selection, the XGBoost model had the highest performance metrics. Conclusion: With this study, software was developed that allows bioinformatic analysis. In addition, as a result of bioinformatic analysis and modeling, potential genomic biomarkers for hepatotoxicity were determined using lncRNA expression data of rats with and without hepatotoxicity. Keywords: Computer Aided Diagnosis System, Genomics, Machine Learning, Classification, Ensemble Learning, Artificial Intelligence
Aim: The aim of this study is to develop web-based software for bioinformatic analysis of large data obtained by performing genomic analysis of liver tissue samples from rats with cisplatin hepatotoxicity and rats without pathology. In addition, as a result of modeling the data with community learning methods, it was aimed to determine possible biomarkers for diagnosis/early diagnosis related to hepatotoxicity. Material and Method: Genomic data obtained from an experimental setup created by taking 20 female Sprague-Dawley rats were used in the study. The web-based software developed for bioinformatics analysis is designed using the Shiny library, which allows interactive web-based applications to be designed based on the R programming language, and ggplot2, ggrepel, DT, shinyWidgets, shinyLP, shinydashboard, and limma the packages. In the models, bagging, boosting, stacking, and XGBoost models from ensemble learning methods were used. Results: The genomic dataset used in the study contains 16,386 expressions. According to the results of the bioinformatics analysis, 589 lncRNAs for hepatotoxicity and control groups showed different expressions in the groups. Of these, 450 showed up-expression, while 139 showed down-expression. As a result of modeling with lncRNAs selected by the variable selection, the XGBoost model had the highest performance metrics. Conclusion: With this study, software was developed that allows bioinformatic analysis. In addition, as a result of bioinformatic analysis and modeling, potential genomic biomarkers for hepatotoxicity were determined using lncRNA expression data of rats with and without hepatotoxicity. Keywords: Computer Aided Diagnosis System, Genomics, Machine Learning, Classification, Ensemble Learning, Artificial Intelligence
Açıklama
Anahtar Kelimeler
Biyoistatistik, Biostatistics