Présentation scientifique dans des universités ou centres de recherche (Présentations scientifiques dans des universités ou centres de recherche)
Asynchronous Stream Data Processing using a Light-Weight and High-Performance Dataflow Engine
ELLAMPALLIL VENUGOPAL, Vinu; THEOBALD, Martin
2020
 

Documents


Texte intégral
Dbdbd2020.pdf
Postprint Éditeur (328.04 kB)
Télécharger

Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Stream data processing; Big Data; sustainable-throughput
Résumé :
[en] Processing high-throughput data-streams has become a major challenge in areas such as real-time event monitoring, complex dataflow processing, and big data analytics. While there has been tremendous progress in distributed stream processing systems in the past few years, the high-throughput and low-latency (a.k.a. high sustainable-throughput) requirement of modern applications is pushing the limits of traditional data processing infrastructures. This paper introduces a new distributed stream data processing engine (DSPE), called “Asynchronous Iterative Routing” or simply AIR, which implements a light-weight, dynamic sharding protocol. AIR expedites a direct and asynchronous communication among all the worker nodes via multiple Message Passing Interface (MPI) communication channels and thereby completely avoids any additional communication overhead with a dedicated master node. With its unique design, AIR scales out to clusters consisting of up to 8 nodes and 224 cores, performing much better than existing DSPEs, and it performs up to 15 times better than Spark and Flink in terms of sustainable-throughput.
Disciplines :
Sciences informatiques
Auteur, co-auteur :
ELLAMPALLIL VENUGOPAL, Vinu ;  University of Luxembourg > Faculty of Science, Technology and Medicine (FSTM) > Department of Computer Science (DCS)
THEOBALD, Martin ;  University of Luxembourg > Faculty of Science, Technology and Medicine (FSTM) > Department of Computer Science (DCS)
Langue du document :
Anglais
Titre :
Asynchronous Stream Data Processing using a Light-Weight and High-Performance Dataflow Engine
Date de publication/diffusion :
11 décembre 2020
Nom de la manifestation :
The Dutch-Belgian DataBase Day (DBDBD) 2020
Organisateur de la manifestation :
Software Languages Lab of the Vrije Universiteit Brussel
Lieu de la manifestation :
Brussels, Belgique
Date de la manifestation :
11-12-2020
Manifestation à portée :
International
Disponible sur ORBilu :
depuis le 18 janvier 2021

Statistiques


Nombre de vues
205 (dont 10 Unilu)
Nombre de téléchargements
89 (dont 4 Unilu)

Bibliographie


Publications similaires



Contacter ORBilu