Metin çizgelerinde entropi ve optimizasyon tabanlı çıkarımsal metin özetleme

Yükleniyor...
Küçük Resim

Tarih

2020

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

İnönü Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Metin boyutlarında meydana gelen artış, otomatik belge özetleme araçlarına duyulan ihtiyacı arttırmaktadır. Tez çalışmasında, metin belgelerinin özetlenmesi için iki yeni metodoloji; Karcı Özetleme, Çok Amaçlı Modifiye Fidan Gelişim Algoritması (ÇA-FGA) sunulmaktadır. Benzersiz bir yaklaşımla, bir belge özetleme çalışmasında Karcı Entropi kullanılmış ve literatüre kazandırılmıştır. Önerilen sistem, eğitim verisi gerektirmemektedir. Optimizasyon teknikleri özetleme çalışmalarında sık kullanılan bir başka tekniktir. Ancak bu çalışmalarda, birbirleri ile çelişen farklı amaçlar genelde ağırlıklandırılarak veya birleştirilerek tek amaçlı probleme dönüştürülmektedir. Bu dönüşüm çözüm kalitesini doğrudan etkilemektedir. Tez çalışmasında Karcı Özetleme'ye ek olarak zengin bir özetin iki temel niteliği olan maksimum kapsam ve minimum fazlalığın optimizasyonun amaçları olarak modellendiği bir yaklaşım sunulmaktadır. Eklenen budama aşaması ile Fidan Gelişim Algoritması bir adım ileri taşınmış ve ÇA-FGA tanıtılmıştır. Sunulan yaklaşım kapsamında gerçek bir eşzamanlı optimizasyon uygulanmaktadır. Sunulan yaklaşımların sonuçları açık erişimli veri setleri (DUC 2002-2004) ile test edilmişlerdir. Yaklaşımların performansları, Recall-Oriented Understudy for Gisting Evaluation (ROUGE) ölçekleri kullanılarak incelenmiştir. Deneysel sonuçlar her iki yaklaşımında gelecek vaat eden teknikler olduğunu ortaya koymaktadır.
The increase in text sizes requires the increasing the need for automatic document summarizing tools. In the thesis, two new methodologies for summarizing text documents; Karcı Summarization, Multi-Objective Sapling Growing Up Algorithm (MO-SGA) are offered. Karcı Entropy was used in a document summarizing study with a unique approach and it was introduced to the literature. The proposed system does not require training data. Optimization techniques are another technique commonly used in summarizing studies. However, in these studies, the different contradictory objectives are often weighted or combined into a single-purpose problem. This conversion directly affects the quality of the solution. In addition to Karcı Summarization, the thesis presents an approach in which the two main characteristics of a rich summary, maximum coverage and minimum redundancy, are modeled as the objectives of optimization. With the added pruning step, the Sapling Growing Up Algorithm was moved one step further and MO-FGA was introduced. A simultaneously optimization is implemented within the scope of the presented approach. The results of the proposed approaches were tested with open access data sets (DUC 2002-2004). The performances of the approaches were examined using Recall-Oriented Understudy for Gisting Evaluation (ROUGE) criteria. Experimental results reveal that there are promising techniques in both approaches.

Açıklama

Anahtar Kelimeler

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye

Hark, C. (2020). Metin çizgelerinde entropi ve optimizasyon tabanlı çıkarımsal metin özetleme. Yayınlanmış Doktora Tezi, İnönü Üniversitesi.