DSpace@İnönü

CatSumm: Extractive Text Summarization based on Spectral Graph Partitioning and Node Centrality

Basit öğe kaydını göster

dc.contributor.author Uçkan, Taner
dc.contributor.author Hark, Cengiz
dc.contributor.author Karcı, Ali
dc.date.accessioned 2022-12-09T12:30:01Z
dc.date.available 2022-12-09T12:30:01Z
dc.date.issued 2021
dc.identifier.citation UÇKAN T, HARK C, KARCI A (2021). CatSumm: Extractive Text Summarization based on Spectral Graph Partitioning and Node Centrality. Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, 10(4), 1349 - 1365. 10.17798/bitlisfen.949052 en_US
dc.identifier.uri https://search.trdizin.gov.tr/yayin/detay/499903/catsumm-extractive-text-summarization-based-on-spectral-graph-partitioning-and-node-centrality
dc.identifier.uri http://hdl.handle.net/11616/85700
dc.description.abstract In this paper, we introduce CatSumm (Cengiz, Ali, Taner Summarization), a novel method for multi-document document summarisation. The suggested method forms a summarization according to three main steps: Representation of input texts, the main stages of the CatSumm model, and sentence scoring. A Text Processing software, is introduced and used to protect the semantic loyalty between word groups at stage of representation of input texts. Spectral Sentence Clustering (SSC), one of the main stages of the CatSumm model, is the summarization process obtained from the proportional values of the sub graphs obtained after spectral graph segmentation. Obtaining super edges is another of the main stages of the method, with the assumption that sentences with weak values below a threshold value calculated by the standard deviation (SD) cannot be included in the summary. Using the different node centrality methods of the CatSumm approach, it forms the sentence rating phase of the recommended summarising approach, determining the significant nodes and hence significant nodes. Finally, the result of the CatSumm method for the purpose of text summarisation within the in the research was measured ROUGE metrics on the Document Understanding Conference (DUC-2004, DUC-2002) datasets. The presented model produced 44.073%, 53.657%, and 56.513% summary success scores for abstracts of 100, 200 and 400 words, respectively. en_US
dc.description.abstract Bu çalışmada, çok belgeli metin özetleme için yeni bir yöntemi CatSumm (Cengiz, Ali, Taner Özetleme) tanıtılmaktadır. Önerilen yöntem, üç ana adıma göre bir özet oluşturmaktadır: Giriş metinlerinin temsili, CatSumm modelinin ana aşamaları ve cümle puanlama. Girilen metinlerin gösterimi aşamasında kelime grupları arasındaki anlamsal bağlılığı korumak için bir Metin İşleme yazılımı tanıtılmış ve kullanılmıştır. CatSumm modelinin ana aşamalarından biri olan Spektral Cümle Kümeleme (SCK), spektral çizge bölmeleme sonrasında elde edilen alt çizgelerin oransal değerlerinden elde edilen özetleme işlemidir. Standart sapma ile hesaplanan bir eşik değerinin altında kalan cümlelerin özete dahil edilemeyeceği varsayımıyla, yöntemin ana aşamalarından bir diğeri de süper kenarların elde edilmesidir. Son olarak, araştırma kapsamında metin özetleme amacıyla CatSumm yönteminin sonucu, Belge Anlama Konferansı (DUC-2004, DUC-2002) veri setleri üzerinde ROUGE metrikleri ile ölçülmüştür. Sunulan model 100, 200 ve 400 kelimelik özetler için sırasıyla %44.073, %53.657, %56.513 özet başarı puanı üretmektedir. en_US
dc.language.iso eng en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.title CatSumm: Extractive Text Summarization based on Spectral Graph Partitioning and Node Centrality en_US
dc.type article en_US
dc.relation.journal Bitlis Eren Üniversitesi Fen Bilimleri Dergisi en_US
dc.contributor.department İnönü Üniversitesi en_US


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster