Soutenance de thèse de Ziyu GUO

Ecole Doctorale
Physique et Sciences de la Matière
Spécialité
PHYSIQUE & SCIENCES DE LA MATIERE - Spécialité : PHYSIQUE DES PARTICULES ET ASTROPARTICULES
établissement
Aix-Marseille Université
Mots Clés
tt̄H,trajectographe interne,arbres de décision boostés,apprentissage profond,boson de Higgs,
Keywords
tt̄H,boosted decision trees,inner tracker,Higgs boson,deep learning,
Titre de thèse
Recherche du boson de Higgs dans le canal ttH (H->bb) avec l'expérience ATLAS auprès du LHC avec des méthodes d'apprentissage automatique et synchronisation de la description de la géométrie de l'ITk pour la simulation et les études de radiation de la jouvence d'ATLAS pour le HL-LHC
Search for the Higgs boson in the ttH (H->bb) channel in the ATLAS experiment at the LHC using machine learning methods and synchronization of the ITk geometry description for simulation and radiation studies for the HL-LHC ATLAS upgrade
Date
Mardi 5 Novembre 2019 à 14:00
Adresse
163 avenue de Luminy, Case 902, 13288 Marseille cedex 09
CPPM amphithéâtre
Jury
Directeur de these M. Cristinel DIACONU CPPM
CoDirecteur de these M. Thierry ARTIERES LIS & Ecole Centrale Marseille
Rapporteur M. David ROUSSEAU Laboratoire de l'accelerateur lineaire
Rapporteur Mme Anne-Catherine LE BIHAN Institut pluridisciplinaire Hubert Curien
Examinateur M. Mossadek TALBY CPPM
Examinateur Mme Elisa FROMONT Université Rennes 1

Résumé de la thèse

Dans le Modèle Standard (MS) les particules élémentaires obtiennent une masse par couplage au champ de Higgs. Ce mécanisme prédit l’existence du boson de Higgs, découvert en 2012 par les collaborations ATLAS et CMS. Les couplages entre le Higgs et les bosons vecteurs sont depuis bien établis, alors que les mesures des couplages entre le Higgs et les fermions (couplages de Yukawa) sont encore incomplètes. Le couplage entre le Higgs et le quark top est le plus intéressant car proche de un et beaucoup plus fort que celui des autres quarks. Tout écart entre sa mesure et la prédiction théorique du MS serait un signe de nouvelle physique. La production associée d’un boson de Higgs et d’une paire de quarks top (ttH) permet une mesure directe de ce couplage de Yukawa. Cette thèse documente une recherche d’événements ttH où le boson de Higgs se désintègre en une paire de quarks beaux (H -> bb) dans les données collectées avec le détecteur ATLAS auprès du LHC durant le Run 2, avec des collisions de protons à une énergie dans le centre de masse de 13 TeV. Les nombreux jets et b-jets dans l’état final sont un défi pour cette analyse, qui nécessite l’utilisation de techniques avancées. Les grandes incertitudes théoriques sur les bruits de fond tt+jets ont un impact majeur sur la sensibilité. Impliquée dans l’analyse des données collectées en 2015 et 2016, avec une luminosité intégrée de 36,1 fb-1 , l’auteure a étudié et optimisé des arbres de décision boostés (BDT), pour résoudre l’association entre les jets et les partons dans la reconstruction du signal ttH, puis pour distinguer les événements du signal de ceux de tt+jets. Le BDT de classification est une des variables discriminantes utilisées dans l’ajustement aux données du modèle utilisant les échantillons simulés basés sur les prédictions du MS. Dans l’hypothèse de la seule présence du bruit de fond, la significance observée (attendue) de la présence du signal ttH en plus du bruit de fond du MS est de 1,4 (1,6) déviations standard, résultat consistant à la fois avec l’hypothèse du seul bruit de fond ou de la présence du signal ttH. Afin de proposer de nouvelles approches pour l’analyse de l’ensemble des données du Run 2, differentes techniques d’apprentissage profond ont été explorées. L’utilisation de réseaux de neurones récurrents permet de répondre, en une seule passe, à la double problématique de la reconstruction et de la classification. Cette méthode est d’abord testée à partir du même type de variables discriminantes, motivées par la physique et calculées explicitement à partir des propriétés cinématiques des objets de l’état final. Afin d’utiliser directement ces propriétés de base, un réseau de neurones profond est proposé, en y intégrant des connaissances sur la physique pour permettre au modèle de déterminer automatiquement des caractéristiques discriminantes. Pour améliorer la sensibilité tout en contraignant mieux les bruits de fond, une nouvelle façon de catégoriser les événements en régions enrichies en ttH et en différentes sous-catégories de tt est implémentée, à l’aide d’un réseau de neurones profond à sorties multiples, et comparée au schéma manuel de partitionnement utilisé précédemment. Pour finir, des réseaux antagonistes ont été étudiés pour réduire la dépendance aux incertitudes de modélisation de tth. Le High-Luminosity LHC (HL-LHC), version améliorée de l’actuel LHC qui collectera dix fois plus de luminosité que lui, devrait entrer en opération au milieu des années 2020 avec un potentiel accru de découverte de nouvelle physique. Pour tenir le choc de cette nouvelle phase, le détecteur ATLAS sera mis à niveau, avec un nouveau trajectographe (ITk) dont la géométrie est en cours d’optimisation. Les descriptions de la géométrie utilisées dans la simulation du détecteur et les études de radiation sont implémentées de façon indépendante. L’auteure a contribué à la synchronisation des deux géométries, étape importante pour valider les estimations de radiation.

Thesis resume

According to the Standard Model (SM), elementary particles obtain their mass by coupling with the Higgs field. This mechanism predicts the existence of the Higgs boson, which was discovered by the ATLAS and CMS collaborations in July 2012. The couplings between the Higgs and vector bosons are completely established, while the measurements of the strength of the Higgs-fermion couplings, the so-called Yukawa couplings, are incomplete. Being much stronger than the ones for the other quarks and close to unity, the Higgs-top quark Yukawa coupling is the most interesting one. It can be a hint for new physics if any measurement shows deviation from the theory. The associated production of a Higgs boson with a top quark pair (ttH) allows for a direct measurement of the top Yukawa coupling. This thesis presents a search for ttH events with the Higgs boson decaying into a bottom quark pair (H -> bb) based on data collected with the ATLAS detector at the LHC during Run 2 operation, with proton pair collisions at a center of mass energy of 13 TeV. The multiple jets and b-jets in the final state make the analysis challenging and heavily relying on advanced analysis techniques. The large modelling uncertainties of the tt +jets backgrounds are a driving factor of the sensitivity. In the analysis round using datasets collected in years 2015 and 2016 for an integrated luminosity of 36.1 fb-1 , the author studies and optimizes boosted decision trees (BDT) to firstly solve the jet-parton assignment in the reconstruction of the ttH signal, and, in a second step, separate the signal from the tt + jets backgrounds. The classification BDT output is one of the discriminants to fit experimental data with simulated samples based on the SM expectation. Through this process, the existence of the ttH signal is tested. Under the background only hypothesis, the observed (expected) significance of the ttH signal over the expected SM background is 1.4 (1.6) standard deviations, which is consistent with both SM background-only and ttH prediction. Targeting a contribution to the new analysis round using the full Run 2 data, deep learning techniques are also explored. Recurrent neural networks are exploited, aiming to, in one step, better solve the event reconstruction and classification. This method still uses as input the physics motivated features manually calculated from the basic kinematics of the final-state objects. To use these raw features as input directly, a deep neural network model is designed while incorporating the physics domain knowledge to automatically extract more discriminating features. To improve the signal sensitivity while constraining backgrounds, an event categorization, having separately the ttH and different tt components enriched regions, is implemented using a deep neural network based multi-classifier, which is compared with the manual splitting in the previous analysis. Finally adversarial networks are studied in order to decrease the tt modelling uncertainty. The High-Luminosity Large Hadron Collider (HL-LHC), the upgrade of the current LHC, with an enhanced luminosity by a factor of ten beyond the LHC’s design value, is expected to start operation in the mid-2020's with increased potential for physics discovery. To cope with this new phase, the ATLAS detector will be upgraded, including a new inner tracker (ITk) which geometry is under design. For the detector simulation and radiation study, the geometry descriptions are independently implemented. The author contributes to the synchronization of the two geometries, which is important to validate a proper radiation estimation.