Communication publiée dans un ouvrage (Colloques, congrès, conférences scientifiques et actes)
An Annotation Framework for Luxembourgish Sentiment Analysis
SIRAJZADE, Joshgun; GIERSCHEK, Daniela; SCHOMMER, Christoph
2020In Besacier, Laurent; Sakti, Sakriani; Soria, Claudia et al. (Eds.) Proceedings of the LREC 2020 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020)
Peer reviewed
 

Documents


Texte intégral
AnAnnotationFrameworkforLuxembourgishSentimentAnalysis.pdf
Postprint Éditeur (1.18 MB)
Télécharger

Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Opinion Mining; Sentiment Analysis; Corpus (Creation, Annotation, etc.); Luxembourgish Language; Crowdsourcing; Time Series
Résumé :
[en] The aim of this paper is to present a framework developed for crowdsourcing sentiment annotation for the low-resource language Luxembourgish. Our tool is easily accessible through a web interface and facilitates sentence-level annotation of several annotators in parallel. In the heart of our framework is an XML database, which serves as central part linking several components. The corpus in the database consists of news articles and user comments. One of the components is LuNa, a tool for linguistic preprocessing of the data set. It tokenizes the text, splits it into sentences and assigns POS-tags to the tokens. After that, the preprocessed text is stored in XML format into the database. The Sentiment Annotation Tool, which is a browser-based tool, then enables the annotation of split sentences from the database. The Sentiment Engine, a separate module, is trained with this material in order to annotate the whole data set and analyze the sentiment of the comments over time and in relationship to the news articles. The gained knowledge can again be used to improve the sentiment classification on the one hand and on the other hand to understand the sentiment phenomenon from the linguistic point of view.
Disciplines :
Langues & linguistique
Sciences informatiques
Auteur, co-auteur :
SIRAJZADE, Joshgun ;  University of Luxembourg > Faculty of Science, Technology and Communication (FSTC) > Computer Science and Communications Research Unit (CSC)
GIERSCHEK, Daniela ;  University of Luxembourg > Faculty of Language and Literature, Humanities, Arts and Education (FLSHASE) > Identités, Politiques, Sociétés, Espaces (IPSE)
SCHOMMER, Christoph  ;  University of Luxembourg > Faculty of Science, Technology and Communication (FSTC) > Computer Science and Communications Research Unit (CSC)
Co-auteurs externes :
no
Langue du document :
Anglais
Titre :
An Annotation Framework for Luxembourgish Sentiment Analysis
Date de publication/diffusion :
mai 2020
Nom de la manifestation :
LREC 2020 Workshop Language Resources and Evaluation Conference 11–16 May 2020, 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020)
Organisateur de la manifestation :
European Language Resources Association (ELRA)
Lieu de la manifestation :
Marseille, France
Date de la manifestation :
from 11-05-2020 to 16-05-2020
Manifestation à portée :
International
Titre de l'ouvrage principal :
Proceedings of the LREC 2020 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020)
Editeur scientifique :
Besacier, Laurent
Sakti, Sakriani
Soria, Claudia
Beermann, Dorothee
Maison d'édition :
European Language Resources Association (ELRA), Paris, France
ISBN/EAN :
979-10-95546-35-1
9791095546351
Pagination :
172-176
Peer reviewed :
Peer reviewed
Focus Area :
Computational Sciences
Disponible sur ORBilu :
depuis le 11 mai 2020

Statistiques


Nombre de vues
303 (dont 50 Unilu)
Nombre de téléchargements
149 (dont 23 Unilu)

Bibliographie


Publications similaires



Contacter ORBilu