Communication publiée dans un ouvrage (Colloques, congrès, conférences scientifiques et actes)
Machine Learning to Geographically Enrich Understudied Sources: A Conceptual Approach
VIOLA, Lorella; Verheul, Jaap
2020In Rocha, Ana; Steels, Luc; van den Herik, Jaap (Eds.) Proceedings of the 12th International Conference on Agents and Artificial Intelligence - Volume 1: ARTIDIGH
Peer reviewed
 

Documents


Texte intégral
ARTIDIGH_2020_1.pdf
Postprint Éditeur (588.92 kB)
Demander un accès

The original publication is available at scitepress.org


Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Machine Learning; Sequence Tagging; Spatial Humanities
Résumé :
[en] This paper discusses the added value of applying machine learning (ML) to contextually enrich digital collections. In this study, we employed ML as a method to geographically enrich historical datasets. Specifically, we used a sequence tagging tool (Riedl and Padó 2018) which implements TensorFlow to perform NER on a corpus of historical immigrant newspapers. Afterwards, the entities were extracted and geocoded. The aim was to prepare large quantities of unstructured data for a conceptual historical analysis of geographical references. The intention was to develop a method that would assist researchers working in spatial humanities, a recently emerged interdisciplinary field focused on geographic and conceptual space. Here we describe the ML methodology and the geocoding phase of the project, focussing on the advantages and challenges of this approach, particularly for humanities scholars. We also argue that, by choosing to use largely neglected sources such as immigrant newspapers (a lso known as ethnic newspapers), this study contributes to the debate about diversity representation and archival biases in digital practices.
Centre de recherche :
- Luxembourg Centre for Contemporary and Digital History (C2DH) > Digital History & Historiography (DHI)
Disciplines :
Ingénierie, informatique & technologie: Multidisciplinaire, généralités & autres
Auteur, co-auteur :
VIOLA, Lorella ;  University of Luxembourg > Luxembourg Center for Contemporary and Digital History (C2DH)
Verheul, Jaap;  Universiteit Utrecht > History and Art History
Co-auteurs externes :
yes
Langue du document :
Anglais
Titre :
Machine Learning to Geographically Enrich Understudied Sources: A Conceptual Approach
Date de publication/diffusion :
2020
Nom de la manifestation :
12th International Conference on Agents and Artificial Intelligence
Lieu de la manifestation :
Valletta, Malte
Date de la manifestation :
from 22-02-2020 to 24-02-2020
Manifestation à portée :
International
Titre de l'ouvrage principal :
Proceedings of the 12th International Conference on Agents and Artificial Intelligence - Volume 1: ARTIDIGH
Auteur, co-auteur :
Rocha, Ana
Steels, Luc
van den Herik, Jaap
Maison d'édition :
SCITEPRESS
ISBN/EAN :
978-989-758-395-7
Collection et n° de collection :
NLPinAI
Pagination :
469-475
Peer reviewed :
Peer reviewed
Focus Area :
Computational Sciences
Disponible sur ORBilu :
depuis le 08 avril 2020

Statistiques


Nombre de vues
214 (dont 5 Unilu)
Nombre de téléchargements
2 (dont 2 Unilu)

citations Scopus®
 
4
citations Scopus®
sans auto-citations
1
citations OpenAlex
 
4

Bibliographie


Publications similaires



Contacter ORBilu