Ön Eğitimli Dil Modelleri Kullanarak Türkçe Tweetlerden Cinsiyet Tespiti

dc.contributor.authorSel, İlhami
dc.contributor.authorHanbay, Davut
dc.date.accessioned2024-08-04T19:51:23Z
dc.date.available2024-08-04T19:51:23Z
dc.date.issued2021
dc.departmentİnönü Üniversitesien_US
dc.description.abstractYazar profili oluşturma (Author Profiling) bir metnin üslup ve içeriğine bakarak yazarın çeşitli özelliklerinin ortaya çıkarılmasına yönelik bir metin kümesi analizidir. Bu özellikler yaş, cinsiyet, kişilik özellikleri ve hatta meslek gibi unsurları barındırır. Cinsiyet belirleme yazar profili oluşturma çalışmalarının alt alanlarından birisidir. Siber suçlar başta olmak üzere sahte haber yayma gibi adli olayların yanında pazarlama (reklamcılık), sosyolojik ve psikolojik olayların incelenmesinde cinsiyet belirleme oldukça önemlidir. Ayrıca İletişim partnerinin cinsiyetini belirlemek, e-posta, bloglar, forumlar gibi sosyal medya aracılığıyla gerçekleşen sahtekarlık ve suistimallerin önlenmesine yardımcı olabilmektedir. Türkçe dili için kısa gönderilerden cinsiyet tespiti yapılması, diğer dillere oranla çok fazla çalışılmayan bir alandır. Bu çalışmada Türkçe Twitter gönderilerinden cinsiyet tespiti yapılmaya çalışılmıştır. Twitter gönderileri dil kurallarına uymayan, kısaltılmış kelimeler ve anlamsız cümle yapıları da içerme ihtimallerine rağmen cinsiyet belirleme görevi için yaygın bir şekilde kullanılmaktadır. Problem bir sınıflandırma görevi olarak ele alınmıştır. Yapılan çalışmada makine öğrenmesi metotları(TF-IDF + SVM), derin öğrenme yöntemleri (LSTM, CNN) ve Türkçe için ön eğitimli dil modelleri(BERT, DistilBert, Electra) kullanılmıştır. Yapılan deneyler sonucunda en yüksek başarımı (%80.1) kelime boyutunun 128k olduğu Bert modeli sağlamıştır. Bu çalışma diğer metin sınıflandırma görevleri için de detaylı bir çalışma olma özelliği göstermektedir.en_US
dc.identifier.doi10.35234/fumbd.929133
dc.identifier.endpage684en_US
dc.identifier.issn1308-9072
dc.identifier.issue2en_US
dc.identifier.startpage675en_US
dc.identifier.trdizinid1125234en_US
dc.identifier.urihttps://doi.org/10.35234/fumbd.929133
dc.identifier.urihttps://search.trdizin.gov.tr/yayin/detay/1125234
dc.identifier.urihttps://hdl.handle.net/11616/88943
dc.identifier.volume33en_US
dc.indekslendigikaynakTR-Dizinen_US
dc.language.isotren_US
dc.relation.ispartofFırat Üniversitesi Mühendislik Bilimleri Dergisien_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.titleÖn Eğitimli Dil Modelleri Kullanarak Türkçe Tweetlerden Cinsiyet Tespitien_US
dc.typeArticleen_US

Dosyalar