Star Formation Rates Estimation via Machine Learning Methods

Michele Delli Veneri (2018)

 

Abstract

In ambito astrofisico la determinazione del tasso di formazione stellare (SFR o Stellar Formation Rate), gioca un ruolo cruciale ai fini della comprensione del processo evolutivo delle galassie. L’odierna disponibilità di dati osservativi di ottima qualità, dovuti ai grandi progetti di survey galattiche ed extra-galattiche (tra cui SDSS, HST, PanSTARSS, COSMOS, GAIA, Planck, Euclid, LSST, Hi-GAL, VST, VISTA), stanno ponendo le basi per un’indagine esplorativa senza precedenti, in grado di coprire l’intero spettro di lunghezze d’onda. Una conoscenza accurata della SFR garantisce la possibilità di determinare i parametri fisici che sono per comprendere la formazione ed evoluzione delle galassie. La SFR, in particolare, permette di estrapolare una media, pesata sulla luminosità, tra le variazioni locali nella storia di formazione stellare e le condizioni fisiche all’interno delle galassie stesse. Tradizionalmente la determinazione della SFR veniva effettuata con tecniche fotometriche o spettroscopiche che però non sono in grado di affrontare in modo efficente l’enorme mole di dati prodotta dalle nuove survey digitali. Gli spettri, infatti, sebbene assicurino la determinazione più accurata della SFR richiedono un notevole sforzo di analisi e tempi di osservazione talmente lunghi da non consentire la misura su campioni formati in ancluni casi da centinaia di milioni di oggetti. Ragion per cui, l’indagine fotometrica, sia pur meno precisa, diventa l’unico strumento realisticamente valido. Le metodologie dell’Astroinformatica, in particolare il data mining e il machine learning, forniscono un valido e affidabile viatico al problema dell’esplorazione automatica di grandi volumi di dati. Questo lavoro, quindi, è imperniato sull’applicazione del paradigma del machine learning alla stima fotometrica della SFR, attraverso l’apprendimento supervisionato effettuato su una ristretta ma sufficiente quantità di dati spettroscopici, per cui é noto il valore della SFR (base di conoscenza o ground truth). Il lavoro ha incluso anche l’impiego di un recente metodo di analisi statistica dello spazio dei parametri, in grado di estrarre con estrema affidabilità l’insieme di parametri fotometrici realmente utili ai fini della stima della SFR. Attraverso un confronto con tecniche simili e di recente pubblicazione, il presente lavoro dimostra il corretto approccio metodologico e la capacità di risolvere il problema di partenza, risultando concretamente promettente per l’applicazione a grandi progetti di survey presenti e futuri.

Relatori:

  • Longo Giuseppe – Università degli studi di Napoli Federico II
  • Brescia Massimo – INAF OACN
  • Cavuoti Stefano – Università degli studi di Napoli Federico II

scarica tesi

 

 

Condividi