Calcolo ad alte prestazioni basato su GPU. Un modello ibrido neurale-genetico per data mining in Astrofisica

Andrea Solla (2012)

Università degli studi di Napoli Federico II

Abstract

La tesi del candidato ha avuto come obiettivo la progettazione ed implementazione di un modello di Soft Computing, basato sul paradigma supervisionato del Machine Learning. Si tratta della rete neurale Multi Layer Perceptron (MLP) addestrata con un Algoritmo Genetico (GA). Tale modello nasce allo scopo di permettere esperimenti di data mining su grossi volumi di dati, in particolare classificazione e regressione. Avendo compiuto il lavoro in collaborazione con l’INAF Osservatorio Astronomico di Capodimonte, il lavoro aveva come fine ultimo la possibilità di esplorare dati derivanti da osservazioni astronomiche. Dovendo lavorare con dati di grandi dimensioni, sia in numero di campioni (cataloghi di oggetti estratti da immagini osservate), che in termini di parametri interni (spazio dei parametri multi-dimensionale), il principale requisito, oltre alla qualità scientifica dei risultati, era la scalabilità. La capacità cio` di dimostrarsi efficiente in termini di tempo computazionale. Pertanto il modello ` stato pensato ed implementato sia in versione seriale (per CPU multi-core), sia in versione parallela (su GPU many-core). I test, compiuti su dataset derivanti da osservazioni multi-banda e multi-epoca, da Terra e dallo Spazio, hanno evidenziato un’ottima qualità scientifica, sia in classificazione di oggetti peculiari (ammassi globulari), che in regressione, cio` la stima di valori di distanze astronomiche per oggetti Quasar. Il valore aggiunto ` importante, se si pensa che i dataset avevano un basso rapporto segnale/rumore. L’implementazione in ambiente GPU ha fornito un guadagno medio pari a 8X in termini di speedup, rispetto alla versione seriale, soddisfacendo quindi anche il requisito computazionale.

Relatori:

  • Guido Russo – Università degli studi di Napoli Federico II
  • Massimo Brescia – INAF OACN
Condividi