Pre-processing techniques for movie review sentiment analysis : a comparative study for best feature set determination

dc.authorid0000-0003-1033-4461en_US
dc.authorid0000-0001-5988-8882en_US
dc.contributor.authorAly, Sohayla E.
dc.contributor.authorBayat, Oğuz
dc.contributor.authorDuru, Adil D.
dc.date.accessioned2023-10-16T13:43:50Z
dc.date.available2023-10-16T13:43:50Z
dc.date.issued2022en_US
dc.departmentEnstitüler, Lisansüstü Eğitim Enstitüsü, Bilişim Teknolojileri Ana Bilim Dalıen_US
dc.description.abstractSentiment analysis is considered as the process to extract the overall expression, opinions, or feelings from reviews about something such as products, services, or movies. A pre-processing is considered as a crucial phase in sentiment analysis for text mining because it allows us to analyse the reviews according to its intended meaning by removing all of the appendages which are the words that do not affect the semantic from sentences. And therefore, the number of features will decrease and thus accuracy will increase. Accordingly, we have decided to evaluate our experiment in identifying the best influencing technique of pre-processing for several features through making a comparison between the features and by combining them together to reach the best result based on features number for each pre-processing technique and classification accuracy. this comparison was done by using three algorithms for classification SVM, NB and DT after applying tools for feature selection and feature extraction with three techniques for tokenization. We concluded that there are some of these techniques that have a negative effect like lemmatization and the part of them is not due to any difference, other, which is a little part, have an effecten_US
dc.description.abstractDuygu analizi, ürünler, hizmetler veya filmler gibi bir şey hakkındaki incelemelerden genel ifade, görüş veya duyguları çıkarma süreci olarak kabul edilir. Bir ön işleme, metin madenciliği için duygu analizinde çok önemli bir aşama olarak kabul edilir, çünkü semantiği etkilemeyen kelimelerin tüm eklerini cümlelerden çıkararak yorumları amaçlanan anlamına göre analiz etmemize izin verir. Bu nedenle öznitelik sayısı azalacak ve dolayısıyla doğruluk artacaktır. Buna göre, her bir ön işleme tekniği için özellik numarasına dayalı olarak en iyi sonuca ulaşmak, özellikler arasında bir karşılaştırma yaparak ve bunları bir araya getirerek birkaç özellik için en iyi ön işleme tekniğini belirlenilmiştir. Bu karşılaştırma, üç tokenleştirme tekniği ile özellik seçimi ve özellik çıkarımı için araçlar uygulandıktan sonra sınıflandırma için üç algoritma (SVM, NB ve DT) kullanılarak yapıldı. Bu tekniklerden lemmatizasyon gibi olumsuz etkisi olan bazılarının olduğu ve bunların bir kısmının herhangi bir farklılıktan kaynaklanmadığı, küçük bir kısmının etkisinin olduğu sonucuna varılmıştır.en_US
dc.identifier.citationAly, S. E., Bayat, O., Duru, A. D. (2022). Pre-processing techniques for movie review sentiment analysis : a comparative study for best feature set determination. AURUM Journal of Engineering Systems and Architecture, 6(2), 239-251.en_US
dc.identifier.endpage251en_US
dc.identifier.issn2564-6397
dc.identifier.issue2en_US
dc.identifier.startpage239en_US
dc.identifier.urihttps://hdl.handle.net/20.500.12939/4152
dc.identifier.volume6en_US
dc.institutionauthorAly, Sohayla E.
dc.institutionauthorBayat, Oğuz
dc.language.isoen
dc.publisherAltınbaş Üniversitesien_US
dc.relation.ispartofAURUM Journal of Engineering Systems and Architecture
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - İdari Personel ve Öğrencien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectSentiment analysisen_US
dc.subjectPre-processing Techniquesen_US
dc.subjectMachine Learning Approachen_US
dc.subjectFeature Selectionen_US
dc.subjectDuyarlılık analizien_US
dc.subjectÖn İşleme Tekniklerien_US
dc.subjectMakine Öğrenimi Yaklaşımıen_US
dc.subjectÖznitelik Seçimien_US
dc.titlePre-processing techniques for movie review sentiment analysis : a comparative study for best feature set determination
dc.title.alternativeFilm duygu analizi için ön işleme teknikleri : en iyi özellik setini belirlemek için karşılaştırmalı bir çalışma
dc.typeArticle

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
239-251.pdf
Boyut:
821.78 KB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text
Lisans paketi
Listeleniyor 1 - 1 / 1
[ X ]
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: