Return to search

Caractérisation des amas de galaxies avec des méthodes d'apprentissage automatique

Les amas de galaxies sont les plus grandes structures gravitationnellement liées de l'Univers. Ils sont communément séparés en trois catégories, basées sur la distribution du gaz intra-amas. Ce gaz peut être très concentré vers le centre de l'amas, il peut être réparti dans l'amas de manière plutôt uniforme, ou encore il peut avoir une distribution légèrement piquée vers le centre dans un cas intermédiaire. Une autre distinction entre les trois catégories est l'interaction entre le trou noir supermassif se trouvant au centre de l'amas de galaxies et le gaz intra-amas environnant. Dans le cas de la première catégorie, lorsque le gaz est concentré au centre de l'amas, le trou noir est dit "actif". Il produit alors des jets, qui à leur tour injectent de l'énergie dans le gaz intra-amas sous forme d'ondes sonores, d'ondes de choc et de turbulence. Les amas de galaxies offrent donc une opportunité très intéressante pour étudier ce mécanisme d'échange d'énergie. Afin de mieux caractériser ces processus, il est essentiel d'avoir des méthodes robustes pour classifier les amas de galaxies selon les trois catégories. Il existe plusieurs propriétés pouvant être utilisées comme métriques de classification, mais celles-ci ne sont pas toujours en accord les unes avec les autres. Ces propriétés ont été étudiées pour des petits échantillons d'amas de galaxies, analysés de manière individuelle avec des méthodes traditionnelles. Cependant, avec le développement de puissants instruments d'observation tels que eROSITA, on s'attend à obtenir des échantillons contenant environ 100 000 amas de galaxies. Étant donné la taille de ces ensemble de données, il devient nécessaire d'avoir un moyen rapide, efficace et automatique pour les traiter. On a donc recours à l'apprentissage automatique pour accélérer l'analyse. Ce mémoire présente une analyse des propriétés du gaz intra-amas avec des méthodes d'apprentissage automatique. On se sert des simulations cosmologiques IllustrisTNG pour obtenir des images en rayons X d'amas de galaxies, à partir desquelles on construit notre ensemble de données. On s'intéresse à cinq propriétés du gaz intra-amas contenu dans les amas de galaxies, qui sont couramment utilisées comme métriques de classification: le temps de refroidissement central, la densité électronique centrale, l'excès d'entropie centrale, le paramètre de concentration de la brillance de surface et le paramètre de courbure du profil de densité. On explore les relations entre ces différentes métriques, puis on implémente un réseau de neurones qui vise à prédire leur valeur à partir d'une image en rayons X d'un amas de galaxies. Notre réseau atteint une pourcentage d'erreur moyen de 1.8% pour les prédictions de la métrique la plus performante, c'est-à-dire le temps de refroidissement central. Ensuite, afin d'estimer les incertitudes sur les résultats obtenus, on effectue une analyse probabiliste de nos prédictions à l'aide de la méthode de l'inférence sans vraisemblance. On utilise également une méthode de partitionnement de données qui rassemble les images en rayons-X en trois groupes distincts; on constate que ce regroupement corrèle fortement avec la division des mêmes images en utilisant le paramètre de concentration comme métrique de classification. L'ensemble de ce travail permet de conclure que le temps de refroidissement central et la concentration sont les métriques se prêtant le mieux à une analyse avec des méthodes d'apprentissage automatique, ainsi que de mettre en place les outils qui serviront à caractériser les futurs échantillons d'amas de galaxies. / Galaxy clusters are the largest gravitationally bound structures of the universe. They are commonly divided into three categories, based on the distribution of the intracluster gas. In one case, the gas is strongly concentrated towards the center of the cluster. In another case, it is rather uniformly dispersed through the cluster. In a third intermediate case, the distribution is slightly peaked towards the center. The three categories also differ by the interaction between the gas and the supermassive black hole located at the center of the cluster. In the first category, the black hole is said to be 'active' and it produces jets that heat up the intracluster gas through shock waves, sound waves and turbulence. The feedback mechanism from the black hole is not entirely understood, and galaxy clusters offer a valuable opportunity to study this energy transfer mechanism in more detail. Numerous properties can serve as classification metrics, but they are not always consistent with one another. Moreover, traditional methods used to extract those properties are time-consuming and have only been applied to small samples. With the advent of powerful X-ray observatories such as eROSITA, we expect to obtain large galaxy clusters datasets (~100 000). Given the size of the datasets and the number of parameters to consider, machine learning methods are needed to accelerate the data processing. This thesis presents an analysis of intracluster gas properties with machine learning techniques. We use the galaxy clusters from the IllustrisTNG cosmological simulations to create the X-ray images that make up our dataset. We study five properties of the hot gas in galaxy clusters that are commonly used as classification metrics; the central cooling time, the central electron density, the central entropy excess, the concentration of the surface brightness and the cuspiness parameter, which represents the slope of the density profile. We explore the correlations between the different metrics, and implement a neural network that predicts their values from an X-ray image of a galaxy cluster. The network achieves a mean percentage error of 1.8% on the central cooling time predictions, making it the best-performing metric. In order to get uncertainty estimates, we perform a probabilistic analysis of the network predictions using simulation-based inference. We also use a clustering approach that groups the X-ray images into three separate groups; we note that those groups are consistent with classification based on the concentration parameter. Our results show that the central cooling time and the concentration are the metrics that lend themselves the best to a machine learning analysis of galaxy cluster images. This project aims to lay the groundwork for characterizing future galaxy cluster observations.

Identiferoai:union.ndltd.org:umontreal.ca/oai:papyrus.bib.umontreal.ca:1866/32360
Date08 1900
CreatorsSadikov, Maria
ContributorsHlavacek-Larrondo, Julie, Perreault-Levasseur, Laurence
Source SetsUniversité de Montréal
Languagefra
Detected LanguageFrench
Typethesis, thèse
Formatapplication/pdf

Page generated in 0.0199 seconds