Francesco Manna (2009)
Università degli studi di Napoli Federico II
Abstract
Negli ultimi decenni, il data mining è divenuta una delle attività fondamentali per la comprensione, la navigazione e lo sfruttamento dei dati nella nuova era digitale. Per data mining si intende un processo automatico che permette di estrarre informazioni significative da grandi moli di dati tramite l’applicazione di particolari tecniche e algoritmi. Grazie al continuo progredire delle tecnologie, avere dati a disposizione non è piu un grande problema, si sa esattamente dove reperirli o dove depositarli, ma il problema che si deve affrontare, man mano che essi aumentano, è cercare di utilizzarli per estrarne informazioni. Spesso i dati, nella maggior parte dei casi si presentano in forma eterogenea, ridondante, non strutturata e senza strumenti di data mining sarebbe impossibile estrarne informazioni. Da quanto detto sono evidenti i numerosi ambiti applicativi del data mining, da comuni operazioni di marketing ad ambiti di ricerca scientifica. Il progetto DAME (Data Mining & Exploration, http://voneural.na.infn.it), si propone di fare data mining ovviamente in ambito di ricerca scientifica, in particolare di tipo astronomico. Il dominio astronomico è caratterizzato da insieme di dati estremamente grandi, quindi il tempo di elaborazione per estrarre informazioni da questi insiemi può avere costi computazionali molto alti, e questo come ben sappiamo pone grossi limiti. Nella seguente tesi vengono esaminate le principali caratteristiche del componente di front-end, strutturato sottoforma di una web application, che pone l’utente generico in grado di eseguire esperimenti sfruttando la potenza di calcolo distribuita della rete GRID del progetto PON S.Co.P.E.
Relatori:
- Anna Corazza – Università degli studi di Napoli Federico II
- Massimo Brescia – INAF OACN