Thèse soutenue

Résolution de systèmes linéaires de grande taille avec un nombre massif de second-membres et apprentissage

FR  |  
EN
Auteur / Autrice : Yan-Fei Xiang
Direction : Luc GiraudPaul Mycek
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées et calcul scientifique
Date : Soutenance le 07/12/2022
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire bordelais de recherche en informatique - Institut national de recherche en informatique et en automatique (France). Centre de recherche Inria de l'université de Bordeaux (Bordeaux)
Jury : Président / Présidente : Eric de Sturler
Examinateurs / Examinatrices : Carola Kruse, Jayant Sengupta, Michaël Bauerheim, Stéphane Lanteri
Rapporteur / Rapporteuse : Eric de Sturler, Andreas Frommer

Résumé

FR  |  
EN

Ce travail se concentre sur la résolution itérative de grands systèmes linéaires avec des second-membres multiples qui apparaissent dans diverses applications scientifiques. Lorsque de multiples second-membres doivent être résolus, les variantes par blocs des méthodes du sous-espace de Krylov sont les méthodes de choix. La mise en œuvre de l’algorithme des blocs permettant l’utilisation de noyaux de calcul efficaces de type BLAS-3, le temps de résolution devrait être réduit. Malheureusement, ces avantages potentiels se font au prix de difficultés numériques induites par l’éventuelle différence de vitesse de convergence des second-membres. Cette caractéristique numérique est appelée convergence partielle. Pour les séquences de systèmes linéaires non symétriques, dans le chapitre 2, nous développons une nouvelle approche de résidu de norme minimale par bloc qui combine deux ingrédients principaux. Le premier composant exploite les idées de la méthode GCRO-DR, ce qui nous permet de recycler les informations spectrales d’un système linéaire à un autre. Le deuxième composant est le mécanisme numérique de gestion de la convergence partielle desecond-membres appelé mécanisme de détection breakdown incomplet dans la méthode IB-BGMRES. Étant donné que le problème de la convergence partielle se pose dans tous les types de solveurs de Krylov par blocs, dans le chapitre 3, nous étendons ce mécanisme à la variante par blocs de la méthode du résidu conjugué, une approche de résidu de norme minimale à récurrence courte pour des systèmes symétrique indéfini. Ensuite, inspirés par l’idée de réutiliser l’information spectrale afin d’accélérer la convergence, nous concevons au chapitre 4 une stratégie de recyclage du sous-espace correspondant. Plus précisément, nous appliquons les idées de “thick-restart’, introduites dans la méthode de Lanczos pour le calcul des paires propres, dans l’algorithme du gradient conjugué par blocs (BCG) pour les systèmes linéaires symétriques définis positifs. Nous étudions également la possibilité d’utiliser la détection de convergence partielle dans BCG. Enfin, ces stratégies de détection de convergence partielle et de recyclage du sous-espace peuvent être combinées efficacement pour concevoir un algorithme de gradient conjugué par blocs déflatés pour les séquences de systèmes linéaires définis positifs symétriques. Une voie alternative aux approches traditionnelles d’algèbre linéaire numérique mentionnées ci-dessus consiste à envisager l’utilisation des techniques d’apprentissage automatique. Dans le chapitre 5, nous présentons quelques façons d’hybrider les nouveaux solveurs d’apprentissage profond et les techniques d’algèbre linéaire numérique plus traditionnelles afin qu’ils puissent bénéficier les uns des autres. Dans le contexte de la résolution d’une équation de Helmholtz hétérogène, nous nous concentrons d’abord sur l’introduction de certains ingrédients mathématiques d’un solveur itératif classique dans la phased’apprentissage d’un solveur de réseau profond de neurones récemment proposé. Le principal avantage estune amélioration significative de la phase d’apprentissage, plus robuste et plus rapide, qui s’avère également applicable au processus de test. En outre, une fois que les réseaux ont été correctement entrainés, leurs inférences peuvent être appliquées comme préconditionneur non linéaire dans la méthode GMRES flexible traditionnelle. Cette partie démontre que ces variantes hybrides présentent des avantages évidents par rapport à la fois à l’approche récemment introduite et au solveurs itératifs classiques de sous-espaces, tant en termes de coût de calcul que de précision des résultats.