Yazar "Uçkan, Taner" seçeneğine göre listele
Listeleniyor 1 - 3 / 3
Sayfa Başına Sonuç
Sıralama seçenekleri
Öğe Ağırlıklandırılmış Çizgelerde Tf-Idf ve Eigen Ayrışımı Kullanarak Metin Sınıflandırma(2019) Hark, Cengiz; Karcı, Ali; Uçkan, Taner; Seyyarer, EbubekirÖz: Günümüzde gerek metin gerekse cümle sınıflandırma problemleri üzerinde yoğunlukla çalışılmaktadır. Metinsınıflandırma işlemlerinde en önemli problemlerden biri sınıflandırılacak metinlerin yapısal olmamasıdır. Belli birformata sahip olmayan metinlerin öncelikle bir önişlemden geçirilmesi gerekmektedir. Bu çalışmada metinlerisınıflandırma işleminde öncelikle sınıflandırılacak metinlerin önişlemini yapmak amacıyla KUSH (Karci-UçkanSeyyarer-Hark) adında bir önişleme aracı geliştirildi. Sonrasında elde edilen işlenmiş metinlerinsınıflandırılmasında çizge tabanlı matematiksel bir yaklaşım sunulmaktadır. Yapılan çalışmada Türkiye’de iyibilinen 6 haber portalından ve 6 farklı alandan elde edilen metinleri içeren TTC-3600 veri seti kullanılmaktadır.Sınıflandırılacak metinler Tf (Terim frekansı) ve Idf (Ters doküman Frekansı) değerleri dikkate alınarak çeşitliönişlemlerden geçirildikten sonra kenar ve düğümlerden oluşan bir ağırlıklı çizge oluşturulmaktadır.Ağırlıklandırılmış çizgeler kullanılarak sınıflandırma işleminin etkililiği ve matematiksel verimliliği arttırılmıştır.Elde edilen çizgeyi ifade eden Komşuluk Matrisi ve Derece Matrisi kullanılarak Laplace Matrisi elde edilmektedir.Laplace Matrisinin özdeğer ayrışımı sonucunda elde edilen özdeğer ve özdeğer vektörleri ile metinlersınıflandırılmaktadır. Yapılan testler sonucunda sınıflandırma oranlarında dikkate değer bir doğruluk değerineulaşıldığı görülmektedir.Öğe CatSumm: Extractive Text Summarization based on Spectral Graph Partitioning and Node Centrality(2021) Uçkan, Taner; Hark, Cengiz; Karcı, AliIn this paper, we introduce CatSumm (Cengiz, Ali, Taner Summarization), a novel method for multi-document document summarisation. The suggested method forms a summarization according to three main steps: Representation of input texts, the main stages of the CatSumm model, and sentence scoring. A Text Processing software, is introduced and used to protect the semantic loyalty between word groups at stage of representation of input texts. Spectral Sentence Clustering (SSC), one of the main stages of the CatSumm model, is the summarization process obtained from the proportional values of the sub graphs obtained after spectral graph segmentation. Obtaining super edges is another of the main stages of the method, with the assumption that sentences with weak values below a threshold value calculated by the standard deviation (SD) cannot be included in the summary. Using the different node centrality methods of the CatSumm approach, it forms the sentence rating phase of the recommended summarising approach, determining the significant nodes and hence significant nodes. Finally, the result of the CatSumm method for the purpose of text summarisation within the in the research was measured ROUGE metrics on the Document Understanding Conference (DUC-2004, DUC-2002) datasets. The presented model produced 44.073%, 53.657%, and 56.513% summary success scores for abstracts of 100, 200 and 400 words, respectively.Öğe Metin Özetlemesi için Düğüm Merkezliklerine Dayalı Denetimsiz Bir Yaklaşım(2019) Hark, Cengiz; Uçkan, Taner; Seyyarer, Ebubekir; Karcı, AliÖz: Cümle seçerek özetleme çalışmaları kapsamında birçok farklı yaklaşım mevcuttur. Bu çalışmada tek dokümanlıçıkarıcı metin özetleme için yeni ve denetimsiz bir süreç önerilmektedir. Çalışma kapsamında metin dokümanlarıçizgelerle temsil edilmektedir. Sunulan yaklaşım temel olarak metinleri temsil eden çizgeleri kullanmakta vecümlelere yönelik bir ağırlıklandırma önermektedir. Önerilen sürecin farklı düğüm ağırlıklandırma yöntemlerinikullanarak önemli düğümleri belirlenmesi, önerilen özetleme sisteminin cümle puanlandırma aşamasınıoluşturmaktadır. Son olarak bu çalışma kapsamında metin özetleme amaçlı önerilen yaklaşımın, açık erişimlimetinler ve bu metinlere ait özetleri içeren Document Understanding Conference (DUC-2002) veri seti üzerindekiperformansı ROUGE değerlendirme metrikleri kullanılarak hesaplanmıştır. Yapılan deneysel çalışmalarsonucunda önerilen özetleme sisteminin geleneksel çizge tabanlı yaklaşımlar ile rekabet edebilir ölçüdeperformans değerleri ortaya koyduğunu göstermektedir. Önerilen özetleme yaklaşımı ile elde edilen ROUGE-2metriğinin Duyarlılık, Kesinlik ve F-Skor değerleri sırasıyla 0.17068, 0.15772, 0.16383 olarak hesaplandı. Ayrıcasunulan bu basit ve etkili yöntemin dilbilimsel bir süreç izlememesi oldukça önemlidir.