Article (Périodiques scientifiques)
Aggregated hold-out for sparse linear regression with a robust loss function
MAILLARD, Guillaume
2022In Electronic Journal of Statistics, 16 (1), p. 935-997
Peer reviewed vérifié par ORBi
 

Documents


Texte intégral
21-EJS1952.pdf
Postprint Éditeur (691.64 kB)
Télécharger

Tous les documents dans ORBilu sont protégés par une licence d'utilisation.

Envoyer vers



Détails



Mots-clés :
Hyperparameter selection; Sparse regression; Cross-validation; Robust regression; Lasso; Aggregation; Model selection
Résumé :
[en] Sparse linear regression methods generally have a free hyperparameter which controls the amount of sparsity, and is subject to a bias-variance tradeoff. This article considers the use of Aggregated hold-out to aggregate over values of this hyperparameter, in the context of linear regression with the Huber loss function. Aggregated hold-out (Agghoo) is a procedure which averages estimators selected by hold-out (cross-validation with a single split). In the theoretical part of the article, it is proved that Agghoo satisfies a non-asymptotic oracle inequality when it is applied to sparse estimators which are parametrized by their zero-norm. In particular, this includes a variant of the Lasso introduced by Zou, Hastié and Tibshirani \cite{Zou_Has_Tib:2007}. Simulations are used to compare Agghoo with cross-validation. They show that Agghoo performs better than CV when the intrinsic dimension is high and when there are confounders correlated with the predictive covariates.
Disciplines :
Mathématiques
Auteur, co-auteur :
MAILLARD, Guillaume ;  University of Luxembourg > Faculty of Science, Technology and Medicine (FSTM) > Department of Mathematics (DMATH)
Co-auteurs externes :
no
Langue du document :
Anglais
Titre :
Aggregated hold-out for sparse linear regression with a robust loss function
Date de publication/diffusion :
2022
Titre du périodique :
Electronic Journal of Statistics
eISSN :
1935-7524
Maison d'édition :
Institute of Mathematical Statistics, Beachwood, Etats-Unis - Ohio
Volume/Tome :
16
Fascicule/Saison :
1
Pagination :
935-997
Peer reviewed :
Peer reviewed vérifié par ORBi
Projet européen :
H2020 - 811017 - SanDAL - ERA Chair in Mathematical Statistics and Data Science for the University of Luxembourg
Organisme subsidiant :
European Union Horizon 2020
CE - Commission Européenne
Disponible sur ORBilu :
depuis le 18 juin 2021

Statistiques


Nombre de vues
194 (dont 47 Unilu)
Nombre de téléchargements
118 (dont 35 Unilu)

citations Scopus®
 
0
citations Scopus®
sans auto-citations
0
citations OpenAlex
 
0
citations WoS
 
0

Bibliographie


Publications similaires



Contacter ORBilu