Smart Listening: new tools for bridging the gap between governance e citizens

Exploiting advanced Deep Learning techniques for NLP in e-Government: experimenting innovative language models for topic discovery and tracking and sentiment&emotion analysis in public Healthcare services.

Government

Proponente
Università di Udine

Sito web

Contatti

Smart Listening: new tools for bridging the gap between governance e citizens

Descrizione

Da ormai più di una decina d’anni uno dei principali canali di ascolto dei cittadini è rappresentato dal monitoraggio dei social media. Purtroppo, le tecnologie che attualmente vengono utilizzate per l’analisi dei testi (in linguaggio naturale) che i cittadini pubblicano su Web, hanno diverse importanti limitazioni, tra cui, le più rilevanti sono le seguenti:
A. l’identificazione degli argomenti trattati viene svolta con tecniche di confronto di parole chiave, senza una più profonda comprensione dell’argomento e soprattutto dei contesti in cui tali parole chiave vengono utilizzate; ciò ha diverse conseguenze: molti falsi positivi e, soprattutto, l’incapacità di considerare anche le diverse espressioni linguistiche sinonime delle parole chiave cercate, e più in generale ancora, l’impossibilità di scoprire nuovi aspetti e nuovi concetti potenzialmente rilevanti (knowldge discovery).
B. l’analisi di sentiment e emozioni è condotta troppo semplicisticamente: (i) sulla base dei giudizi numerici (numero di stellette) indicate da chi esprime la sua opinione su Web ovvero (ii) sulla base dell’uso di certe parole che vengono utilizzate per esprimere positività o negatività, e quindi nuovamente senza di fatto ‘capire’ il senso della frase e il contesto in cui tali parole sono inserite. L’effetto è nuovamente un alto numero di falsi positivi.
Tali criticità di fatto rendono molto poco utili gli strumenti digitali che vengono attualmente usati per il monitoraggio dei social media e ciò costituisce una grave limitazione, in un epoca in cui la presenza di opinioni sul Web è in continua crescita.
La proposta intende realizzare degli strumenti innovativi di monitoraggio dei social media basati sui tool proposti negli ultimissimi anni, quali BERT (sperimentato da Google dal 2019/20) e GPT 2 (presentato da OpenAI nel 2019). Tali strumenti, denomiati ‘pre-trained language model’ si basano su tecniche di Deep Learning pre-addestrate su enormi quantità di testo scritto in linguaggio naturale (DataSet di molte centinaia di miliardi di parole), in modo da imparare a ‘comprendere’ moltissimi contesti in cui i concetti possono essere inseriti, cogliendo anche le sfumature di significato.
L’obiettivo è superare le criticità attuali degli approcci utilizzati, per poter quindi disporre di strumenti effettivamente efficaci, e quindi in grado di fornire tempestivamente informazioni corrette. L’obiettivo è anche quello di considerare l’evoluzione temporale del processo di monitoraggio, riuscendo a cogliere i cosiddetti segnali deboli che spesso anticipano l’arrivo di situazioni rischiose o critiche.

Obiettivi

L’obiettivo è sviluppare strumenti innovativi per l’ascolto online dei cittadini al fine di cogliere con il massimo anticipo segnali deboli che possono evolvere in situazioni di rischio o crisi al fine di fornire ai decisori tempestive informazioni utili per adeguare le scelte.

Elementi di innovazione

Obiettivi innovativi: cogliere i segnali deboli nelle opinioni dei cittadini Strumenti innovativi: utilizzo dei pre-trained language model (BERT, GPT 2,Top-to-Vecti) che offrono un salto di qualità rispetto agli strumenti per lo più usati oggi, garantendo perfomance di qualità significativamente migliori.

Impatti / Risultati attesi

Sviluppo e sperimentazione di una piattaforma di monitoraggio dei social media basato sugli ultimissimi Language Model sviluppati nell’ambito della Linguistica Computazionale. In particolare la piattaforma sarà costituita da due moduli fondamentali: Topic Modeler e Sentiment/Emotion Analyzer.

Fattibilità

Saranno utilizzati finanziamenti pubblico/privati per la fase di start-up

Elementi di replicabilità

La piattaforma sarà sperimentata e messa a punto in ambito Sanità. Potrà essere immediatamente riutilizzata in ambito Sanità e facilmente estesa in ambiti di servizi della PA.

Stato di implementazione

Prototipi del Topic Modeler e del Sentiment Analyzer sono in fase di sperimentazione dal 2020 nel sito http://ailab.uniud.it/covid-vaccines/it per il monitoraggio delle opinioni (tweet) espresse sugli effetti collaterali del Covid.

Partners

Laboratorio di Intelligenza Artificiale/UniUD

Laboratorio di Geomatica per la ricerca applicata

Istituzione di Sanità Pubblica per la sperimentazione e la validazione dei risultati.

Il nuovo Spin-off AIperTECH nato dal Laboratorio di Intelligenza Artificiale e con la partecipazione di UniUD per il deployment in ambito applicativo delle nuove tecnologie messe a punto in fase di ricerca.