Présentation scientifique dans des universités ou centres de recherche (Présentations scientifiques dans des universités ou centres de recherche)
Optimized Coordinated Checkpoint/Rollback Protocol using a Dataflow Graph Model
BESSERON, Xavier; Gautier, Thierry
2009
 

Documents


Texte intégral
talk_2009_apretaf.pdf
Postprint Auteur (1.01 MB)
Télécharger

Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Grid; Distributed Computing; Fault Tolerance; Dataflow graph
Résumé :
[en] Fault-tolerance protocols play an important role in today long runtime scienti\ufb01c parallel applications. The probability of a failure may be important due to the number of unreliable components involved during an execution. We present our approach and preliminary results about a new checkpoint/rollback protocol based on a coordinated scheme. The application is described using a dataflow graph, which is an abstract representation of the execution. Thanks to this representation, the fault recovery in our protocol only requires a partial restart of other processes. Simulations on a domain decomposition application show that the amount of computations required to restart and the number of involved processes are reduced compared to the classical global rollback protocol.
Disciplines :
Sciences informatiques
Auteur, co-auteur :
BESSERON, Xavier  ;  University of Luxembourg > Faculty of Science, Technology and Communication (FSTC) > Engineering Research Unit ; Laboratoire d'Informatique de Grenoble > MOAIS project
Gautier, Thierry;  Laboratoire d'Informatique de Grenoble > MOAIS project
Langue du document :
Anglais
Titre :
Optimized Coordinated Checkpoint/Rollback Protocol using a Dataflow Graph Model
Date de publication/diffusion :
22 janvier 2009
Nom de la manifestation :
Workshop APRETAF : Algorithmes Parallèles, Répartis Et Tolérance Aux Fautes
Lieu de la manifestation :
Grenoble, France
Date de la manifestation :
from 22-01-2009 to 23-01-2009
Disponible sur ORBilu :
depuis le 24 juillet 2019

Statistiques


Nombre de vues
85 (dont 6 Unilu)
Nombre de téléchargements
29 (dont 3 Unilu)

Bibliographie


Publications similaires



Contacter ORBilu