The significant increase of astronomical data necessitates new strategies and developments to analyse a large amount of information, which no longer is efficient if done by hand. Supervised machine learning is an example of one such modern strategy. In this work, we apply the classification technique on Gaia+2MASS+WISE data to explore the usage of supervised machine learning on large astronomical archives. The idea is to create an algorithm that recognises entries with unusual infrared properties which could be interesting for follow-up observations. The programming is executed in MATLAB and the training of the algorithms in the classification learner application of MATLAB. Each catalogue; Gaia+2MASS+WISE contains ~109, 5×108 and 7×108 (The European Space Agency 2019, Skrutskie et al. 2006, R. M. Cutri IPAC/Caltech) entries respectively. The algorithms searches through a sample from these archives consisting of 765266 entries, corresponding to objects within a <500 pc range. The project resulted in a list of 57 entries with unusual infrared properties, out of which 8 targets showed none of the four common features that provide a natural physical explanation to the unconventional energy distribution. After more comprehensive studies of the aforementioned targets, we deem it necessary for further studies and observations on 2 out of the 8 targets (Nr.1 and Nr.8 in table 3) to establish their true nature. The results demonstrate the applicability of machine learning in astronomy as well as suggesting a sample of intriguing targets for further studies. / Inom astronomi samlas stora mängder data in kontinuerligt och dess tillväxt ökar snabbt för varje år. Detta medför att manuella analyser av datan blir mindre och mindre lönsama och kräver istället nya strategier och metoder där stora datamängder snabbare kan analyseras. Ett exempel på en sådan strategi är vägledd maskininlärning. I detta arbete utnyttjar vi en vägled maskininlärnings teknik kallad klassificering. Vi använder klassificerings tekniken på data från de tre stora astronomiska katalogerna Gaia+2MASS+WISE för att undersöka användningen av denna teknik på just stora astronomiska arkiv. Idén är att skapa en algorithm som identifierar objekt med okontroversiella infraröda egenskaper som kan vara intressanta för vidare observationer och analyser. Dessa ovanliga objekt är förväntade att ha en lägre emission i det optiska våglängdsområdet och en högre emission i det infraröda än vad vanligtvis är observerad för en stjärna. Programmeringen sker i MATLAB och träningsprocessen av algoritmerna i MATLABs applikation classification learner. Algoritmerna söker igenom en samling data bestående av 765266 objekt, från katalogerna Gaia+2MASS+WISE. Dessa kataloger innehåller totalt ~109, 5×108 och 7×108 (The European Space Agency 2019, Skrutskie et al. 2006, R. M. Cutri IPAC/Caltech) objekt vardera. Det begränsade dataset som algoritmerna söker igenom motsvarar objekt inom en radie av <500 pc. Många av de objekt som algoritmerna identifierade som ”ovanliga” tycks i själva verket vara nebulösa objekt. Den naturliga förklaringen för dess infraröda överskott är det omslutande stoft som ger upphov till värmestrålning i det infraröda. För att eliminera denna typ av objekt och fokusera sökningen på mer okonventionella objekt gjordes modifieringar av programmen. En av de huvudsakliga ändringarna var att introducera en tredje klass bestående av stjärnor inneslutna av stoft som vi kallar "YSO"-klassen. Ytterligare en ändring som medförde förbättrade resultat var att introducera koordninaterna i träningen samt vid den slutgiltiga klassificeringen och på så vis, identifiering av intressanta kandidater. Dessa justeringar resulterade i en minskad andelen nebulösa objekt i klassen av ”ovanliga” objekt som algoritmerna identifierade. Projektet resulterade i en lista av 57 objekt med ovanliga infraröda egenskaper. 8 av dessa objekt påvisade ingen av det fyra vanligt förekommande egenskaperna som kan ge en naturlig förklaring på dess överflöd av infraröd strålning. Dessa egenskaper är; nebulös omgivning eller påvisad stoft, variabilitet, Hα emission eller maser strålning. Efter vidare undersökning av de 8 tidigare nämnda objekt anser vi att 2 av dessa behöver vidare observationer och analys för att kunna fastslå dess sanna natur (Nr.1 och Nr.8 i tabell 3). Den infraröda strålningen är alltså inte enkelt förklarad för dessa 2 objekt. Resultaten av intressanta objekt samt övriga resultat från maskininlärningen, visar på att klassificeringstekniken inom maskininlärning är användbart på stora astronomiska datamängder.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:uu-446965 |
Date | January 2021 |
Creators | Ahlvind, Julia |
Publisher | Uppsala universitet, Observationell astrofysik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | FYSAST ; FYSMAS1156 |
Page generated in 0.0056 seconds