Communication publiée dans un ouvrage (Colloques, congrès, conférences scientifiques et actes)
Debugging machine learning pipelines
DE PAULA LOURENCO, Raoni; Freire, Juliana; Shasha, Dennis
2019In Proceedings of the 3rd Workshop on Data Management for End-To-End Machine Learning, DEEM 2019 - In conjunction with the 2019 ACM SIGMOD/PODS Conference
Peer reviewed
 

Documents


Texte intégral
3329486.3329489.pdf
Postprint Auteur (1.04 MB)
Télécharger

Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Error prones; Experimental evaluation; New approaches; Reproducibilities; Root cause; Root cause of failures; Source codes; State of the art; Software; Information Systems; Computer Science - Learning; Computer Science - Databases; Statistics - Machine Learning
Résumé :
[en] Machine learning tasks entail the use of complex computational pipelines to reach quantitative and qualitative conclusions. If some of the activities in a pipeline produce erroneous or uninformative outputs, the pipeline may fail or produce incorrect results. Inferring the root cause of failures and unexpected behavior is challenging, usually requiring much human thought, and is both time consuming and error prone. We propose a new approach that makes use of iteration and provenance to automatically infer the root causes and derive succinct explanations of failures. Through a detailed experimental evaluation, we assess the cost, precision, and recall of our approach compared to the state of the art. Our source code and experimental data will be available for reproducibility and enhancement.
Disciplines :
Sciences informatiques
Auteur, co-auteur :
DE PAULA LOURENCO, Raoni  ;  University of Luxembourg > Interdisciplinary Centre for Security, Reliability and Trust (SNT) > SerVal ; NYU - New York University [US-NY]
Freire, Juliana;  New York University, United States
Shasha, Dennis;  New York University, United States
Co-auteurs externes :
yes
Langue du document :
Anglais
Titre :
Debugging machine learning pipelines
Date de publication/diffusion :
30 juin 2019
Nom de la manifestation :
Proceedings of the 3rd International Workshop on Data Management for End-to-End Machine Learning
Lieu de la manifestation :
Amsterdam, Nld
Date de la manifestation :
30-06-2019
Titre de l'ouvrage principal :
Proceedings of the 3rd Workshop on Data Management for End-To-End Machine Learning, DEEM 2019 - In conjunction with the 2019 ACM SIGMOD/PODS Conference
Maison d'édition :
Association for Computing Machinery
ISBN/EAN :
978-1-4503-6797-4
Peer reviewed :
Peer reviewed
Organisme subsidiant :
ACM Special Interest Group on Management of Data (SIGMOD)
Commentaire :
10 pages
Disponible sur ORBilu :
depuis le 22 novembre 2023

Statistiques


Nombre de vues
35 (dont 1 Unilu)
Nombre de téléchargements
19 (dont 0 Unilu)

citations Scopus®
 
6
citations Scopus®
sans auto-citations
5
OpenCitations
 
10
citations OpenAlex
 
24

Bibliographie


Publications similaires



Contacter ORBilu