Nonsmooth Implicit Differentiation for Machine Learning and Optimization

Jérôme Bolte; Tam Le; Edouard Pauwels; Antonio Silveti-Falls

Communication Dans Un Congrès Année : 2021

Nonsmooth Implicit Differentiation for Machine Learning and Optimization

(1) , (1) , (2) , (1)

1
2

Jérôme Bolte

Fonction : Auteur

Toulouse School of Economics

Tam Le

Fonction : Auteur
PersonId : 752715
IdHAL : tam-le

Toulouse School of Economics

Edouard Pauwels

Fonction : Auteur
PersonId : 12830
IdHAL : edouard-pauwels
ORCID : 0000-0002-8180-075X

Argumentation, Décision, Raisonnement, Incertitude et Apprentissage

Antonio Silveti-Falls

Fonction : Auteur
PersonId : 1052483

Toulouse School of Economics

Résumé

In view of training increasingly complex learning architectures, we establish a nonsmooth implicit function theorem with an operational calculus. Our result applies to most practical problems (i.e., definable problems) provided that a nonsmooth form of the classical invertibility condition is fulfilled. This approach allows for formal subdifferentiation: for instance, replacing derivatives by Clarke Jacobians in the usual differentiation formulas is fully justified for a wide class of nonsmooth problems. Moreover this calculus is entirely compatible with algorithmic differentiation (e.g., backpropagation). We provide several applications such as training deep equilibrium networks, training neural nets with conic optimization layers, or hyperparameter-tuning for nonsmooth Lasso-type models. To show the sharpness of our assumptions, we present numerical experiments showcasing the extremely pathological gradient dynamics one can encounter when applying implicit algorithmic differentiation without any hypothesis.

Domaines

Optimisation et contrôle [math.OC] Intelligence artificielle [cs.AI] Apprentissage [cs.LG]

Fichier principal

implicitNonsmooth.pdf (1.58 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Edouard Pauwels : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03251332

Soumis le : lundi 7 juin 2021-08:30:29

Dernière modification le : jeudi 28 mars 2024-03:10:20

Archivage à long terme le : mercredi 8 septembre 2021-18:05:28

Dates et versions

hal-03251332 , version 1 (07-06-2021)

hal-03251332 , version 2 (04-04-2022)

Identifiants

HAL Id : hal-03251332 , version 1
ARXIV : 2106.04350

Citer

Jérôme Bolte, Tam Le, Edouard Pauwels, Antonio Silveti-Falls. Nonsmooth Implicit Differentiation for Machine Learning and Optimization. Advances in Neural Information Processing Systems, Dec 2021, Online, France. ⟨hal-03251332v1⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

243 Consultations

280 Téléchargements

Nonsmooth Implicit Differentiation for Machine Learning and Optimization

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Altmetric

Partager