Publication:
Gözetimli Makine Öğrenmesiyle Noktalama ve Etkisiz Kelime Sıklıkları Kullanarak Yazar Tanıma

dc.contributor.authorUYAR, TEVFİK
dc.contributor.authorUyar, Kübra Karacan
dc.contributor.authorYağlı, Emre
dc.date.accessioned2023-01-31T12:18:43Z
dc.date.available2023-01-31T12:18:43Z
dc.date.issued2021
dc.description.abstractBu çalışmada köşe yazısı uzunluğundaki yazılarda noktalama ve etkisiz kelime kullanım sıklığı gibi basit özniteliklerin yazar tanımada yeterli olduğu ortaya konmuştur. Cumhuriyet gazetesi yazarlarından sıkça köşe yazan 6 adedi seçilerek her birinin çalışmanın başladığı tarihten geriye doğru son 120 köşe yazıları alınmış, her bir yazı için bir takım etkisiz kelime ve noktalama işaretlerinin kullanım sıklıklarına dayanan dokuz adet öznitelik elde edilmiştir. Sekiz gözetimli yapay öğrenme algoritması eğitildikten sonra yazının yazarını tanıma başarısı önişlemsiz ve önişlemden geçirilmiş veri kümelerinde ayrı ayrı ölçülmüş, asgari %82 ve azami %92 olmak üzere yüksek isabetli sonuçlar elde edilmiştir. Ölçeklemenin ve temel bileşen analizinin (PCA) başarıyı anlamlı miktarda değiştirmediği, ancak ölçekleme ve boyut azaltma yöntemi olarak doğrusal ayırtaç çözümlemenin (LDA) birlikte kullanılmasının en yakın komşu (kNN) ve Gaussian Naive Bayes (GNB) algoritmalarının yöntemlerin başarılarında yüksek anlamlı (p<0.001), destek vektör makineleri (SVM) algoritmasının başarısında ise anlamlı (p<0.05) bir fark yarattığı görülmüştür. Ayrıca karar ağacı temelli rasgele orman algoritmasında (RF) öznitelik önem analizi yapılarak cümle başına ortalama kelime sayısının ve virgül kullanma sıklığının en ayırıcı öznitelikler olduğu tespit edilmiştir.tr
dc.identifier14
dc.identifier.citationUYAR T, UYAR K, YAĞLI E (2021). Gözetimli Makine Öğrenmesiyle Noktalama ve Etkisiz Kelime Sıklıkları Kullanarak Yazar Tanıma. Bilişim Teknolojileri Dergisi, 14(2), 183 - 190. 10.17671/gazibtd.623629
dc.identifier.eissn2147-0715
dc.identifier.urihttps://doi.org/10.17671/gazibtd.623629
dc.identifier.urihttps://hdl.handle.net/11413/8282
dc.language.isotr
dc.publisherGazi Üniversitesi Bilişim Enstitüsü
dc.relation.journalBilişim Teknolojileri Dergisi
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectGözetimli Öğrenme
dc.subjectSınıflandırma Algoritmaları
dc.subjectYapay Öğrenme
dc.subjectYazar Tanıma
dc.titleGözetimli Makine Öğrenmesiyle Noktalama ve Etkisiz Kelime Sıklıkları Kullanarak Yazar Tanımatr
dc.title.alternativeColumnist Identification with Supervised Machine Learning using Punctuation and Stop Word Frequenciesen
dc.typeArticle
dspace.entity.typePublication
local.indexed.attrdizin
local.journal.endpage190
local.journal.issue2
local.journal.startpage183

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tam Metin/Full Text
Size:
388.83 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.82 KB
Format:
Item-specific license agreed upon to submission
Description: