Da ormai più di una decina d’anni uno dei principali canali di ascolto dei cittadini è rappresentato dal monitoraggio dei social media. Purtroppo, le tecnologie che attualmente vengono utilizzate per l’analisi dei testi (in linguaggio naturale) che i cittadini pubblicano su Web, hanno diverse importanti limitazioni, tra cui, le più rilevanti sono le seguenti:
A. l’identificazione degli argomenti trattati viene svolta con tecniche di confronto di parole chiave, senza una più profonda comprensione dell’argomento e soprattutto dei contesti in cui tali parole chiave vengono utilizzate; ciò ha diverse conseguenze: molti falsi positivi e, soprattutto, l’incapacità di considerare anche le diverse espressioni linguistiche sinonime delle parole chiave cercate, e più in generale ancora, l’impossibilità di scoprire nuovi aspetti e nuovi concetti potenzialmente rilevanti (knowldge discovery).
B. l’analisi di sentiment e emozioni è condotta troppo semplicisticamente: (i) sulla base dei giudizi numerici (numero di stellette) indicate da chi esprime la sua opinione su Web ovvero (ii) sulla base dell’uso di certe parole che vengono utilizzate per esprimere positività o negatività, e quindi nuovamente senza di fatto ‘capire’ il senso della frase e il contesto in cui tali parole sono inserite. L’effetto è nuovamente un alto numero di falsi positivi.
Tali criticità di fatto rendono molto poco utili gli strumenti digitali che vengono attualmente usati per il monitoraggio dei social media e ciò costituisce una grave limitazione, in un epoca in cui la presenza di opinioni sul Web è in continua crescita.
La proposta intende realizzare degli strumenti innovativi di monitoraggio dei social media basati sui tool proposti negli ultimissimi anni, quali BERT (sperimentato da Google dal 2019/20) e GPT 2 (presentato da OpenAI nel 2019). Tali strumenti, denomiati ‘pre-trained language model’ si basano su tecniche di Deep Learning pre-addestrate su enormi quantità di testo scritto in linguaggio naturale (DataSet di molte centinaia di miliardi di parole), in modo da imparare a ‘comprendere’ moltissimi contesti in cui i concetti possono essere inseriti, cogliendo anche le sfumature di significato.
L’obiettivo è superare le criticità attuali degli approcci utilizzati, per poter quindi disporre di strumenti effettivamente efficaci, e quindi in grado di fornire tempestivamente informazioni corrette. L’obiettivo è anche quello di considerare l’evoluzione temporale del processo di monitoraggio, riuscendo a cogliere i cosiddetti segnali deboli che spesso anticipano l’arrivo di situazioni rischiose o critiche.