Francesco Esposito (2013)
Università degli studi di Napoli Federico II
Abstract
La tesi del candidato ha avuto come obiettivo la progettazione ed impleentazione di una serie di algoritmi e modelli software integrati all’interno della web application DAMEWARE (Data Mining & Exploration Web Application Resource), infrastruttura orientata ai servizi specializzata in data mining su grandi archivi di dati astrofisici. Tali modelli discendono dai paradigmi di auto-apprendimento supervisionato e non supervisionato del machine learning, specializzati per risolvere problemi di clustering e classificazione. I modelli progettati e sviluppati in linguaggio C, sono stati implementati da zero, dovendo rispettare vincoli progettuali e d’interfaccia imposti dall’infrastruttura web ospite. Il concetto chiave che ha guidato il candidato a selezionare e sviluppare gli algoritmi si � basato sul classico modello SOM (Self Organizing Map), storicamente impiegato con successo in innumerevoli settori disciplinari. A partire dalle sue caratteristiche di base, il candidato ha derivato da un�attenta analisi bibliografica una serie di modelli di ultima generazione, capaci di ottimizzare le prestazioni della SOM per clustering e classificazione multivariata di problemi complessi. Tali derivazioni sono state basate o sull’evoluzione topologica o sulla variazione della regola di apprendimento della SOM, ottenendo nel primo caso un modello di classificazione (E-TREE) con topologia ad albero, nel secondo due tipologie di modelli di clustering: l’E-SOM (Evolving SOM), versione di una SOM ad apprendimento dinamico, ed un modello gerarchico di clustering (battezzato 2-stage clustering).
Relatori:
- Roberto Prevete – Università degli studi di Napoli Federico II
- Massimo Brescia – INAF OACN