I big data e il loro utilizzo

Pubblicato in Cultura

Dal 27 al 29 settembre 2019 si è tenuta l’ottava edizione del festival della ricerca scientifica Trieste NEXT, promosso tra gli altri da Comune e Università di Trieste, Sissa, Ogs, Immaginario scientifico e Area Science Park.

Quest’anno il tema è stato i “Big data”, con le loro ricadute. Vediamo cosa sono i big data e come possono essere utilizzati per cercare risposta a molte domande. I big data, come suggerisce direttamente il termine, sono un volume estremamente grande di dati. Questo enorme volume deriva spesso da diverse fonti, e viene poi analizzato attraverso tecniche analitiche avanzate che, auspicabilmente, individuano schemi che possono portare a conclusioni utili.

I big data sono caratterizzati tra “tre V”: Volume, Varietà e Velocità. Il volume si riferisce alla dimensione dei dati, la varietà indica che i set di dati non sono omogenei e la velocità è la velocità alla quale si svolge l’analisi, spesso con l’obiettivo di raggiungere l’analisi in tempo reale. I dati provengono da vari tipi di luoghi, inclusi Web, social media, reti, file video, sensori e dispositivi mobili (spesso abbiamo il telefono con noi 24 ore su 24, 7 giorni su 7, usiamo sensori, scriviamo e-mail, giochiamo, navighiamo nel Web e usiamo social).

Una volta accumulati i dati viene svolta l’analisi, denominata data mining, che cerca modelli e anomalie all’interno di questi grandi set di dati. Questi schemi che vengono “scoperti” generano informazioni che vengono utilizzate per una varietà di scopi. Ad esempio, il sito di prenotazione per biglietti di treno “TheTrainLine” è in grado di prevedere i costi e consente ai passeggeri di acquistare tariffe a prezzi inferiori. Da McDonald’s, in Canada, i menu digitali mostrano in modo flessibile le voci sulla base di un’analisi in tempo reale dei dati, tra cui l’ora del giorno e il tempo all’esterno.

Un ambito particolarmente interessante dei big data è quello sanitario: i dati del medico sono archiviati in un archivio elettronico pronto per essere estratto. È possibile usare questi dati per “migliorare la nostra comprensione della causalità e della classificazione delle malattie e per migliorare la salute e l’assistenza sanitaria” (da European Hearth Journal). Un gruppo di quattro ospedali di Parigi ha usato un set di dati di 10 anni di registrazioni dei ricoveri ospedalieri, con data e ora del giorno e dati meteorologici. Grazie alle analisi sono in grado di prevedere i tassi di ricovero nei prossimi 15 giorni, e sanno valutare la quantità e il tipo di personale necessario.

Per approfondire: http://www.intelligenzaartificiale.it/big-data/

Lorenzo Marafatto