Tecniche di Clustering basate sul Machine Learning

Francesco Esposito (2013)

Università degli studi di Napoli Federico II

Abstract

La tesi del candidato ha avuto come obiettivo la progettazione ed impleentazione di una serie di algoritmi e modelli software integrati all’interno della web application DAMEWARE (Data Mining & Exploration Web Application Resource), infrastruttura orientata ai servizi specializzata in data mining su grandi archivi di dati astrofisici. Tali modelli discendono dai paradigmi di auto-apprendimento supervisionato e non supervisionato del machine learning, specializzati per risolvere problemi di clustering e classificazione. I modelli progettati e sviluppati in linguaggio C, sono stati implementati da zero, dovendo rispettare vincoli progettuali e d’interfaccia imposti dall’infrastruttura web ospite. Il concetto chiave che ha guidato il candidato a selezionare e sviluppare gli algoritmi si � basato sul classico modello SOM (Self Organizing Map), storicamente impiegato con successo in innumerevoli settori disciplinari. A partire dalle sue caratteristiche di base, il candidato ha derivato da un�attenta analisi bibliografica una serie di modelli di ultima generazione, capaci di ottimizzare le prestazioni della SOM per clustering e classificazione multivariata di problemi complessi. Tali derivazioni sono state basate o sull’evoluzione topologica o sulla variazione della regola di apprendimento della SOM, ottenendo nel primo caso un modello di classificazione (E-TREE) con topologia ad albero, nel secondo due tipologie di modelli di clustering: l’E-SOM (Evolving SOM), versione di una SOM ad apprendimento dinamico, ed un modello gerarchico di clustering (battezzato 2-stage clustering).

Relatori:

  • Roberto Prevete – Università degli studi di Napoli Federico II
  • Massimo Brescia – INAF OACN
Condividi