Soutenance de thèse de Jai KUMAR

Ecole Doctorale
Physique et Sciences de la Matière
Spécialité
PHYSIQUE & SCIENCES DE LA MATIERE - Spécialité : ENERGIE, RAYONNEMENT ET PLASMA
établissement
Aix-Marseille Université
Mots Clés
fusion nucléaire,simulations HPC,apprentissage statistique,machine learning,PINN,
Keywords
nuclear fusion,HPC simulations,machine learning,apprentissage automatique,PINN,
Titre de thèse
Intelligence artificielle pour le traitement numérique et l'analyse de simulations cinétiques et fluides de plasmas de fusion
Machine learning for numerical processing and analysis of kinetic and fluid simulations of fusion plasmas
Date
Mercredi 13 Décembre 2023 à 14:00
Adresse
IRFM Salle René GRAVIER Bât 506 pièce 7, CEA Cadarache, St Paul lez Durance 13108 cedex, France
Salle René GRAVIER
Jury
Directeur de these M. David ZARZOSO-FERNANDEZ M2P2, CNRS
Rapporteur M. Emmanuel FRANCK Université de Strasbourg
CoDirecteur de these Mme Virginie GRANDGIRARD CEA Cadarache
Rapporteur M. Emmanuel FRENOD Université Bretagne Sud
Président M. Eric SERRE M2P2, CNRS
Examinateur M. Stefan KESSELHEIM Institute for Advanced Simulation, Forschungszentrum Jülich GmbH
Examinateur M. Didier LUCOR Université Paris Saclay

Résumé de la thèse

L'étude des plasmas de fusion magnétique s'articule généralement autour de trois axes principaux : la théorie analytique, la modélisation numérique et les expériences. En raison du niveau de complexité accru requis pour modéliser les plasmas de fusion, l'approche numérique nécessite des simulations à grande échelle réalisées sur des ordinateurs à haute performance (HPC). Bien que les installations HPC les plus avancées permettent aujourd'hui l'intégration des équations du modèle de manière très performante, la grande quantité de données à haute dimension générées par les simulations peut difficilement être gérée, soit en raison des besoins de stockage importants, soit en raison de l'impossibilité d'explorer l'espace de phase à haute dimension à l'aide d'outils de post-traitement standard. Pour cette raison, cette thèse propose des méthodes numériques basées sur des techniques d'intelligence artificielle pour rationaliser le stockage des résultats de simulation et extraire des informations significatives des données de haute dimension. La première partie de la thèse se concentre sur l'application d'une technique d'apprentissage profond récemment développée, appelée Physics Informed Neural Networks (PINN). Il est basé sur un perceptron multicouche standard avec une fonction de perte qui inclut un terme pour forcer le réseau neuronal à satisfaire l'équation différentielle qui est en train d'être résolue. Cette technique est utilisée pour réduire l'espace de stockage nécessaire pour les résultats de la simulation et est étendue pour résoudre les équations différentielles à l'aide d'algorithmes sans maillage. PINN est appliqué à un modèle réduit du système de Vlasov-Poisson mis en œuvre dans le code VOICE en tant que cas test pour stocker les résultats des simulations de résonance onde-particule. Deux cas physiques dans lesquels la résonance onde-particule joue un rôle important ont été examinés : (1) l'amortissement de Landau et (2) l'instabilité de type "bump-on-tail". En utilisant PINN, il est démontré que l'espace de stockage nécessaire pour stocker les résultats de simulation est réduit d'un facteur de 600. Le travail présenté dans cette thèse va au-delà de l'application de PINN aux équations différentielles. Il propose un moyen d'inclure l'information physique dans l'équation de Poisson, une équation intégro-différentielle pour laquelle la PINN standard ne peut pas être appliquée directement. Une nouvelle variante de PINN, appelée PINN intégrable (I-PINN), est développée sur la base de l'intégration automatique et utilisée pour résoudre avec succès le système de Vlasov-Poisson. La formation des PINN et I-PINN est mise en œuvre avec la parallélisation des données sur les GPU afin d'obtenir des résultats plus rapides. La deuxième partie de cette thèse vise à extraire des informations des simulations réalisées avec un code fluide pour modéliser la turbulence 2D dans les plasmas de tokamaks. Pour ce faire, des méthodes d'apprentissage automatique non supervisées sont appliquées aux résultats d'un modèle réduit appelé TOKAM2D. Le regroupement basé sur la densité est utilisé pour isoler les structures représentatives des événements de type avalanche. Cette technique permet de récupérer les différentes échelles de temps présentes dans la simulation. Enfin, des auto-encodeurs convolutifs sont appliqués pour détecter des événements rares et des anomalies (à la fois physiques et non physiques), avec un accent particulier sur l'application possible à la détection en ligne.

Thesis resume

The study of magnetic fusion plasmas is usually done through three main axes: analytic theory, numerical modeling and experiments. Because of the increased level of complexity required to model fusion plasmas, the numerical approach needs large-scale simulations performed on high-performance computers (HPC). Although the most advanced HPC facilities now allow the integration of the model equations in a very performant fashion, the large amount of high-dimensional data that are generated from the simulations can hardly be handled, either because of the large storage requirements or because of the impossibility to explore with standard post-processing tools the high-dimensional phase space. For this reason, this thesis proposes numerical methods based on artificial intelligence techniques to rationalize the storage of the simulation results and extract meaningful information from the high-dimensional data. The first part of the thesis focuses on the application of a recently developed deep learning technique called Physics Informed Neural Networks (PINN). It is based on a standard multilayer perceptron with a loss function that includes a term to enforce the neural network to satisfy the differential equation that is being solved. This technique is employed to reduce the storage space needed for the simulation results and extended to solve the differential equations using mesh-free algorithms. PINN is applied to a reduced model of the Vlasov-Poisson system implemented in the VOICE code as a test case to store the results of wave-particle resonance simulations. Two physical cases where the wave-particle resonance plays a significant role have been considered: (1) the Landau damping and (2) the bump-on-tail instability. Using PINN, it is shown that the storage space required to store the simulation results is reduced by almost a factor of 600. The work presented in this thesis goes beyond the application of PINN to differential equations. It proposes a way to include the physical information in the Poisson equation, an integro-differential equation for which standard PINN cannot be applied directly. A new PINN variant, called Integrable PINN (I-PINN), is developed based on automatic-integration and employed to solve the Vlasov-Poisson system successfully. The training of both PINN and I-PINN is implemented with data parallelization on GPUs to achieve faster results. The second part of this thesis aims at extracting information from simulations performed with a fluid code to model 2D turbulence in tokamak plasmas. For this purpose, unsupervised machine learning methods are applied to the results of a reduced model called TOKAM2D. Density-based clustering is used to isolate structures that are representative of avalanche-like events. By means of this technique, the different time scales present in the simulation are recovered. Finally, convolutional auto-encoders are applied to detect rare events and anomalies (both physical and non-physical), with particular emphasis on the possible application to online detection.