Publication:
Sentiment analysis for Turkish Language

dc.contributor.advisorBayrak, Coşkun
dc.contributor.authorÇelik, Hakan
dc.date.accessioned2017-10-20T08:14:53Z
dc.date.available2017-10-20T08:14:53Z
dc.date.issued2013-01
dc.descriptionSentiment analysis a.k.a. opinion mining is an application of natural language processing to extract subjective information from given texts. Consumer comments, evaluation of films, stock exchange predictions and political researches are some examples of subjective declarations that sentiment analysis involves. Subjective data have hugely increased parallel to web 2.0 and social media growth in recent years. People generate petabytes of data every day. Processing of this amount of raw data became more and more important for both companies and individuals. Many sentiment analysis studies conducted in the past are focused on English Language only. Therefore, for Turkish Language, sentiment analysis is a blue ocean yet. There is a single study focused on only one input domain and tested with only one machine learning algorithm. Within the focus of this thesis new datasets were constructed in various domains, a Turkish specific input preparation algorithm was introduced, and different machine learning algorithms were applied over prepared data. ~85% accuracy was achieved with Naïve Bayes Classifier.tr_TR
dc.description.abstractDuygu yada düşünce analizi metinlerden kişisel değerlendirmelerin çıkarımını sağlayan doğal dil işleme branşıdır. Duygu analizinin ilgi alanına giren değerlendirmelere örnek olarak tüketici yorumları, film değerlendirmeleri, borsa tahminleri ve siyasi araştırmalar gibi geniş ölçekte örnekler verilebilir. Son yıllarda web 2.0 ve sosyal medyanın artış hızına bağlı olarak öznel değerlendirmeler müthiş derecede arttı. Her gün insanlar petabaytlarca veri girişi yapıyor. Bu boyuttaki ham verinin analizi gerek bireyler gerekse de şirketler için gittikçe daha fazla önem arz etmeye başladı. İngilizce için birçok duygu analizi çalışmaları mevcut. Ancak bu çalışma alanı Türkçe için hala bakir. Gerçekleştirilen tek çalışma tek bir alan üzerine yoğunlaşıp tek tipte veri üzerinde tek tip makina öğrenmesi algoritması kullanmış. Bu tez kapsamında farklı alanlara ait yeni veri grupları oluşturulmuş, Türkçe'ye özel veri hazırlama algoritması tanıtılmış ve oluşturulan veri üzerinde farklı makina öğrenmesi algoritmaları uygulanmıştır. Naïve Bayes sınıflandırıcı kullanılarak başarılı sayılabilecek %85'lik doğruluk oranı yakalanmıştır.tr_TR
dc.identifier.urihttp://hdl.handle.net/11413/1721
dc.language.isoen_UStr_TR
dc.publisherİstanbul Kültür Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Anabilim Dalıtr_TR
dc.subjectDoğal dil işlemetr_TR
dc.subjectNatural language processingtr_TR
dc.titleSentiment analysis for Turkish Languagetr_TR
dc.titleTürk Dili için duygu analizi
dc.typemasterThesistr_TR
dspace.entity.typePublication

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
HakanÇelikYLTez.pdf
Size:
738.43 KB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: