Metin özetleme yöntemlerinin karşılaştırmalı incelenmesi ve baskın küme tabanlı bir çıkarıcı yaklaşımın geliştirilmesi
Küçük Resim Yok
Tarih
2025
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İnönü Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu tez, metin özetleme alanında extractive (çıkarıcı) ve abstractive (soyutlayıcı) yöntemlerin incelenmesi ve karşılaştırılması üzerine odaklanmaktadır. Çalışmada, metin özetleme yöntemlerinin performanslarını değerlendirmek amacıyla, farklı yapıya sahip iki İngilizce veri seti kullanılmıştır: haber içerikli BBC News Summary ve bilimsel makale içerikli PubMed Summarization. TextRank, LexRank, LSA ve KL gibi çıkarıcı yöntemler ile PEGASUS, BART, T5 ve LED gibi soyutlayıcı modeller üzerinde gerçekleştirilen analizlerde, bu yöntemlerin farklı içerik türlerindeki etkileri çeşitli metrikler kullanılarak karşılaştırılmıştır. Elde edilen sonuçlar, her yöntemin belirli durumlarda farklı avantajlar sunduğunu ortaya koymuştur. Tezin ikinci aşamasında, Dominating Set (Baskın Küme) tabanlı yeni bir çıkarıcı özetleme yöntemi önerilmiş ve bu yöntem detaylı olarak incelenmiştir. Bu yöntem, metinlerdeki gereksiz bilgileri filtrelemeyi ve metnin en anlamlı bölümlerini seçerek daha özlü özetler üretmeyi hedeflemektedir. Önerilen yöntemin performansı ROUGE metrikleriyle değerlendirilmiş ve özellikle haber içerikli veri setlerinde diğer yöntemlere kıyasla üstünlük sağladığı görülmüştür. Yöntemin, metin özetleme sürecinde daha verimli ve anlamlı sonuçlar üretebildiği gözlemlenmiştir. Çalışma, bilgi yoğun veri setleri üzerinde özetleme yöntemlerinin etkinliğini değerlendirmeyi, farklı yaklaşımlar arasında kapsamlı bir karşılaştırma sunmayı ve Dominating Set tabanlı yeni bir yöntemin metin özetleme alanındaki uygulanabilirliğini araştırmayı hedeflemektedir. Bu bağlamda tez, hem teorik hem de uygulamalı boyutlarıyla literatüre katkı sağlamayı amaçlamaktadır. Anahtar Kelimeler: Metin Özetleme, Graf, Baskın Küme, Çıkarıcı Özetleme, Soyutlayıcı Özetleme, ROUGE Metrikleri.
This thesis focuses on the examination and comparison of extractive and abstractive methods in the field of text summarization. To evaluate the performance of text summarization methods, two English datasets with different structures were employed: the news-oriented BBC News Summary and the scientific article-oriented PubMed Summarization. Analyses were conducted on extractive methods such as TextRank, LexRank, LSA, and KL, as well as abstractive models including PEGASUS, BART, T5, and LED, comparing their effectiveness across various content types using diverse evaluation metrics. The results demonstrated that each method offers distinct advantages under specific circumstances. In the second phase of the thesis, a novel extractive summarization method based on Dominating Set theory was proposed and thoroughly analyzed. This method aims to filter out redundant information in texts and select the most meaningful segments, producing more concise summaries. The performance of the proposed method was evaluated using ROUGE metrics, and it was observed to outperform other methods, particularly on news-oriented datasets. The method demonstrated its capability to generate more efficient and meaningful results in text summarization tasks. This study aims to assess the effectiveness of summarization methods on information-rich datasets, provide a comprehensive comparison between different approaches, and explore the applicability of the Dominating Set-based method in the field of text summarization. In this context, the thesis seeks to contribute to the literature both theoretically and practically. Keywords: Text Summarization, Graph, Dominating Set, Extractive Summarization, Abstractive Summarization, ROUGE Metrics.
This thesis focuses on the examination and comparison of extractive and abstractive methods in the field of text summarization. To evaluate the performance of text summarization methods, two English datasets with different structures were employed: the news-oriented BBC News Summary and the scientific article-oriented PubMed Summarization. Analyses were conducted on extractive methods such as TextRank, LexRank, LSA, and KL, as well as abstractive models including PEGASUS, BART, T5, and LED, comparing their effectiveness across various content types using diverse evaluation metrics. The results demonstrated that each method offers distinct advantages under specific circumstances. In the second phase of the thesis, a novel extractive summarization method based on Dominating Set theory was proposed and thoroughly analyzed. This method aims to filter out redundant information in texts and select the most meaningful segments, producing more concise summaries. The performance of the proposed method was evaluated using ROUGE metrics, and it was observed to outperform other methods, particularly on news-oriented datasets. The method demonstrated its capability to generate more efficient and meaningful results in text summarization tasks. This study aims to assess the effectiveness of summarization methods on information-rich datasets, provide a comprehensive comparison between different approaches, and explore the applicability of the Dominating Set-based method in the field of text summarization. In this context, the thesis seeks to contribute to the literature both theoretically and practically. Keywords: Text Summarization, Graph, Dominating Set, Extractive Summarization, Abstractive Summarization, ROUGE Metrics.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control











