Metin özetleme yöntemlerinin karşılaştırmalı incelenmesi ve baskın küme tabanlı bir çıkarıcı yaklaşımın geliştirilmesi

Yunus, Said

Metin özetleme yöntemlerinin karşılaştırmalı incelenmesi ve baskın küme tabanlı bir çıkarıcı yaklaşımın geliştirilmesi

Tarih

2025

Yazarlar

Yunus, Said

Yayıncı

İnönü Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu tez, metin özetleme alanında extractive (çıkarıcı) ve abstractive (soyutlayıcı) yöntemlerin incelenmesi ve karşılaştırılması üzerine odaklanmaktadır. Çalışmada, metin özetleme yöntemlerinin performanslarını değerlendirmek amacıyla, farklı yapıya sahip iki İngilizce veri seti kullanılmıştır: haber içerikli BBC News Summary ve bilimsel makale içerikli PubMed Summarization. TextRank, LexRank, LSA ve KL gibi çıkarıcı yöntemler ile PEGASUS, BART, T5 ve LED gibi soyutlayıcı modeller üzerinde gerçekleştirilen analizlerde, bu yöntemlerin farklı içerik türlerindeki etkileri çeşitli metrikler kullanılarak karşılaştırılmıştır. Elde edilen sonuçlar, her yöntemin belirli durumlarda farklı avantajlar sunduğunu ortaya koymuştur. Tezin ikinci aşamasında, Dominating Set (Baskın Küme) tabanlı yeni bir çıkarıcı özetleme yöntemi önerilmiş ve bu yöntem detaylı olarak incelenmiştir. Bu yöntem, metinlerdeki gereksiz bilgileri filtrelemeyi ve metnin en anlamlı bölümlerini seçerek daha özlü özetler üretmeyi hedeflemektedir. Önerilen yöntemin performansı ROUGE metrikleriyle değerlendirilmiş ve özellikle haber içerikli veri setlerinde diğer yöntemlere kıyasla üstünlük sağladığı görülmüştür. Yöntemin, metin özetleme sürecinde daha verimli ve anlamlı sonuçlar üretebildiği gözlemlenmiştir. Çalışma, bilgi yoğun veri setleri üzerinde özetleme yöntemlerinin etkinliğini değerlendirmeyi, farklı yaklaşımlar arasında kapsamlı bir karşılaştırma sunmayı ve Dominating Set tabanlı yeni bir yöntemin metin özetleme alanındaki uygulanabilirliğini araştırmayı hedeflemektedir. Bu bağlamda tez, hem teorik hem de uygulamalı boyutlarıyla literatüre katkı sağlamayı amaçlamaktadır. Anahtar Kelimeler: Metin Özetleme, Graf, Baskın Küme, Çıkarıcı Özetleme, Soyutlayıcı Özetleme, ROUGE Metrikleri.
This thesis focuses on the examination and comparison of extractive and abstractive methods in the field of text summarization. To evaluate the performance of text summarization methods, two English datasets with different structures were employed: the news-oriented BBC News Summary and the scientific article-oriented PubMed Summarization. Analyses were conducted on extractive methods such as TextRank, LexRank, LSA, and KL, as well as abstractive models including PEGASUS, BART, T5, and LED, comparing their effectiveness across various content types using diverse evaluation metrics. The results demonstrated that each method offers distinct advantages under specific circumstances. In the second phase of the thesis, a novel extractive summarization method based on Dominating Set theory was proposed and thoroughly analyzed. This method aims to filter out redundant information in texts and select the most meaningful segments, producing more concise summaries. The performance of the proposed method was evaluated using ROUGE metrics, and it was observed to outperform other methods, particularly on news-oriented datasets. The method demonstrated its capability to generate more efficient and meaningful results in text summarization tasks. This study aims to assess the effectiveness of summarization methods on information-rich datasets, provide a comprehensive comparison between different approaches, and explore the applicability of the Dominating Set-based method in the field of text summarization. In this context, the thesis seeks to contribute to the literature both theoretically and practically. Keywords: Text Summarization, Graph, Dominating Set, Extractive Summarization, Abstractive Summarization, ROUGE Metrics.

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Bağlantı

https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=E_eEUHQic_C-LvhxNQn1W1c28bhyLWV-TaRl7r6U8j4yRGHILQag03uIO56dwVbO
https://hdl.handle.net/11616/106607

Koleksiyon

Fen Bilimleri Enstitüsü Tez Koleksiyonu

Detaylı Öğe Kaydı

Metin özetleme yöntemlerinin karşılaştırmalı incelenmesi ve baskın küme tabanlı bir çıkarıcı yaklaşımın geliştirilmesi

Tarih

Yazarlar

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

Özet

Açıklama

Anahtar Kelimeler

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Bağlantı

Koleksiyon