Le diagnosi dai colpi di tosse e i sistemi anti assembramento: che ruolo ha l’intelligenza artificiale nella pandemia?

Quella sanitaria è una sfida che non coinvolge solo la medicina ma tutti i comparti della scienza, fino all’ingegneria e alla robotica. Insieme ad Alessio Del Bue, ricercatore senior dell’IIT di Genova, abbiamo dato uno sguardo alle applicazioni tecnologiche più avanzate, basate su l’IA e il machine learning. Accanto ai milioni di calcoli rapidissimi dei supercomputer, oggi la nuova frontiera è nella diagnosi delle infezioni da Coronavirus, con un algoritmo del MIT che sarebbe in grado di riconoscere i pazienti malati solo da un semplice colpo di tosse.
Entra nel nuovo canale WhatsApp di Ohga
Kevin Ben Alì Zinati 8 Novembre 2020
* ultima modifica il 08/11/2020
In collaborazione con Alessio Del Bue Responsabile delle linee di ricerca PAVIS (Pattern Analysis and Computer Vision) e VGM (Visual Geometry and Modelling) dell’Istituto Italiano di Tecnologia di Genova

Da quando la pandemia ci è piombata addosso, l’intelligenza artificiale è una delle pedine che si muovono sulla scacchiera della partita contro il Coronavirus. Lo è stata nei mesi di giugno e luglio, quando abbiamo imparato a “prevederla” costruendo software in grado di diagnosticare precocemente i danni polmonari dalle radiografie dei pazienti.

La mossa successiva è stato intervenire sulla gestione dei contagi. Se hai scaricato Immuni sai che l’app ti avverte ogni volta che entri in contatto con una persona positiva al Coronavirus. E sai, quindi, che il suo sistema di contact tracing si basa proprio sulla commistione tra intelligenza artificiale e big data, ovvero quell’insieme di informazioni anonime, tra cui l’eventuale positività al tampone, che vengono scambiate tra gli smartphone.

Oggi i ricercatori del MIT hanno sviluppato un algoritmo in grado di diagnosticare la presenza del virus dal semplice suono di un colpo di tosse. Il loro studio ci ha spinti così a interrogarci sul ruolo che finora ha ricoperto l’intelligenza artificiale nella partita. L’abbiamo chiesto al dottor Alessio Del Bue, responsabile delle linee di ricerca PAVIS (Pattern Analysis and Computer Vision) e VGM (Visual Geometry and Modelling) dell’Istituto Italiano di Tecnologia di Genova. Con il suo team, Del Bue ha lavorato a diversi sistemi di IA oggi attivi sul nostro territorio al servizio delle autorità sanitarie.

Uomo e algoritmo 

Se provi a immaginare l’andamento della partita, non è da escludere che domani un algoritmo possa davvero individuare la presenza dell’infezione da Sars-Cov-2 dal semplice suono di un colpo di tosse. Non è un’idea tanto lontana dalla realtà se pensi che il sistema sviluppato dai ricercatori del Massachusetts Institute of Technology di Boston avrebbe raggiunto un tasso di successo pari al 98,5% e del 100% nei pazienti che, oltre alla tosse, non avevano nessun altro sintomo.

Per capire come e dove si collochi il contributo di questa tecnologia nella lotta al Coronavirus, serve capire cos'è l’intelligenza artificiale e in cosa si distingue da quella umana. Di per sé “intelligenza artificiale” è un termine molto generico che racchiude tante discipline che vanno dall’apprendimento automatico (il machine learning), alla visione artificiale, al processamento automatico del parlato fino alla robotica. “Parlare di intelligenza artificiale significa dotare un computer o un sistema di alcune abilità che possono simulare l’intelligenza umana. Con una differenza netta” ha spiegato il dottor Del Bue. Quella artificiale è un’intelligenza “basata sui big data ed è molto abile ad affrontare compiti specifici e ben definiti che possono essere scritti con una formula matematica. L’intelligenza umana invece è molto più flessibile, è in grado di affrontare task differenti e possiede la capacità di adattarsi a nuovi compiti da eseguire”.

No assembramenti

La pandemia ha unito sotto lo stesso obiettivo tutti gli ambiti della scienza, dalla medicina alla robotica. Tutti hanno risposto alla chiamata e hanno trovato un modo per declinare le proprie competenze al servizio della popolazione mondiale. L’IIT e il dottor Del Bue si sono concentrati sul problema del sovraffollamento dei luoghi e del rispetto del distanziamento sociale tra le persone. Così hanno ideato il Visual Social Distacing: “È un sistema di intelligenza artificiale che, collegandosi a sistemi di videosorveglianza già attivi, è in grado di individuare e segnalare se le persone sono troppo vicine fra loro.

Alessio Del Bue, responsabile delle linee di ricerca PAVIS e VGM dell’IIT di Genova.

Allo stesso tempo, il sistema offre una statistica sulla resilienza del luogo, quindi sul grado di pericolosità legata alla trasmissione del virus di quel determinato spazio. "Questo sistema è in funzione da almeno 6 mesi in due posti, all’aeroporto di Genova e in un ipermercato di Genova Bolzaneto”. Due luoghi, insomma, dove le migliaia di persone che vi transitavano ogni giorno potevano creare assembramenti alzando il rischio di contagio.

Il Visual Social Distacing funziona sostanzialmente con due modalità. C’è un monitoraggio in tempo reale che permette all’operatore di fronte allo schermo di intervenire nello stesso momento in cui il sistema rileva se una persona è troppo vicina ad un altra.

L'IA è abile ad affrontare compiti specifici strutturabili in formule matematiche. La nostra intelligenza è molto più flessibile

Alessio Del Bue, ricercatore senior presso l'IIT di Genova

Ma il sistema funziona anche per statistiche perché “raccogliendo dati sul distanziamento per giorni o mesi siamo in grado di capire quali sono le aree più pericolose, in modo tale da avere dati sulla base dei quali poi intervenire sulla struttura e la conformazione degli spazi andando ad eliminare i potenziali pericoli”.

Una rappresentazione di come funziona il Visual Social Distacing. Fonte: IIT Genova.

L’avrai sentito ripetutamente anche in concomitanza con il lancio dell’App Immuni: uno dei grossi problemi dietro queste tecnologia è quello della privacy. Che dati fornisci a questi algoritmi? Quali invece sono in grado di acquisire da soli? I miei spostamenti sono tracciati? Incognite a cui il Visual Social Distacing genovese, proprio come Immuni, ha trovato una soluzione. “Il nostro sistema di intelligenza artificiale estrae le immagini, fa la computazione e poi le elimina, non le salva in nessun database e non ci sono dunque immagini delle persone: estrae soltanto la posizione della persona in 3D e calcola la distanza con le altre”. La tua privacy è dunque rispettata.

Tra le corsie

L’intelligenza artificiale negli ultimi anni ha messo sempre più piede anche all’interno degli ospedali e della medicina. Pensa agli algoritmi per diagnosticare l'inizio di un tumore al pancreas, agli antibiotici scoperti in librerie di oltre 2000 composti grazie alle analisi e alle comparazioni dei supercomputer oppure al ruolo che questa tecnologia sta ricoprendo nello sviluppo di un vaccino contro il Coronavirus. Di impatto ancora più immediato è stato l’impiego dell’intelligenza artificiale per l’individuazione delle positività al virus dalle radiografie o delle tac dei pazienti.

I dati raccolti da questi sistemi permettono di intervenire sulla conformazione degli spazi per prevenire il rischio di assembramenti

In questi casi gli algoritmi funzionano così: “Viene costruita una base di dati, un cosiddetto dataset, su cui poi l’algoritmo compie le proprie analisi – ha spiegato il dottor Del Bue – In questo dataset ci sono delle immagini, quelle radiografiche o le immagini delle tac, dove un medico ha già annotato le caratteristiche che descrivono la presenza del Covid-19 insieme ad altre informazioni cliniche come malattie pregresse del paziente o il livello dell’ossigenazione. Tutti quegli elementi, insomma, che possono aiutare a distinguere la normale influenza o un'altra malattia alle vie respiratorie dall’infezione da Coronavirus.

Un sistema di IA mette a confronto radiografie diverse fornendo risposte in tempi rapidissimi. Qui, per esempio, sta confrontando immagini di cisti al pancreas

“Gli algoritmi di intelligenza artificiale, machine learning e deep learning fondamentalmente hanno il compito di prendere una decisione, a volte binaria, di dare un «sì» o un «no» e per farlo devono avere una descrizione precisa e il più realistica possibile del mondo che stanno analizzando. Capisci, dunque, che la qualità dei dati che si fornisce all’algoritmo è di fondamentale importanza. Ogni risultato che il sistema darà sarà il riflesso delle analisi fatte su quel mondo: se all’algoritmo diciamo che la pelle delle persone è di colore rosso, una volta che dovesse incontrare un uomo con la pelle bianca lo segnalerà come un’anomalia e quindi come un errore. “Se le sue analisi si basano su dati che non corrispondono effettivamente al problema che si cerca di risolvere, l’algoritmo potrebbe offrire risultati che sono giusti per il suo mondo di dati ma che non corrispondono alla realtà” ha spiegato l’ingegnere dell’IIT.

Siccome in questo caso l’algoritmo deve identificare se un paziente è malato di Covid-19 oppure no, il “suo” mondo sarà rappresentato da una serie di radiografie e indicazione che dicono se una persona è infetta. “Raccogliendo di volta in volta sempre più dati corretti, l’algoritmo apprende e autonomamente sa indicare se la radiografia successiva che gli viene proposta è di un malato o di una persona sana”.

Tossisca, prego

L’ultima applicazione dell’IA nella pandemia arriva dagli Stati Uniti, precisamente da Boston. Come ti dicevo, nei laboratori del MIT un gruppo di ricercatori ha sviluppato un algoritmo che potrebbe riconoscere il colpo di tosse di un malato di Covid-19. La notizia ha fatto il giro del mondo arrivando fino alla nostra sanità che, lo sai, in queste settimane è vicino al sovraccarico. È chiaro che la suggestione di un sistema rapido e poco costoso che possa eseguire una diagnosi (o quantomeno facilitarla) per i nostri medici, oggi, potrebbe apparire come un’oasi per un maratoneta nel deserto.

Per questi algoritmi è fondamentale il dataset fornito, ovvero il mondo entro cui lavora, che deve essere il più fedele possibile alla realtà

L’algoritmo ha suscitato interesse anche all’interno dell'IIT di Genova. Insieme ai colleghi, il dottor Del Bue ne ha analizzato i vantaggi e i limiti. “Il lato positivo è il parametro dell’accuracy, cioè quante volte l’algoritmo riesce a trovare una persona positiva al Covid-19 – ha sottolineato Del Bue – L’algoritmo del MIT ha come valore il 98.5% e solo il 6% delle volte sbaglia: significa, dunque, che se su un campione di 1 milione di persone, 60 mila saranno erroneamente considerate positive al covid-19”. Quindi, oltre alla prestazione del sistema, diventa determinante anche la sua interpretazione perché se è vero che “l’algoritmo riporta una accuratezza del 98.5%, che si riferisce alla sua capacita’ di trovare un positivo, questo sbaglia anche il 6% delle volte nell’indicare un caso negativo al COVID-19 come se fosse positivo”, quindi come un falso positivo.

Per svilupparlo i ricercatori hanno raccolto circa 70mila campioni audio che riproducevano un certo numero di colpi di tosse e di una fetta proveniva da pazienti che avevano avuto una diagnosi confermata di Covid-19. Anche in questo caso, quindi, sarà fondamentale quello che ormai hai imparato a conoscere: il dataset, il mondo di dati all’interno del quale performa il sistema. “La rappresentazione del mondo di questo algoritmo è costituito da 2660 positivi al Covid-19 e altrettanti negativi. Stiamo parlando di un campione di sole 5mila persone divise equamente tra positivi e sani quando, invece, speriamo proprio che non sia così”.

Inoltre, il ricercatore dell’IIT ci ha spiegato che tendenzialmente un dataset viene diviso in tre parti: una serve per addestrare l’algoritmo, una per valicarlo e una per testarlo. “I ricercatori dicono che l’80% del loro dataset è stata destinata all’addestramento mentre il rimanente 20% per la validazione, che consiste nel trovare i parametri con cui l’algoritmo funziona al meglio. Manca però un’indicazione sulla terza parte: non essendo specificato nell’articolo, potrebbe significare che il test è stato fatto sullo stesso dataset con la divisione tra 50% e 50%”.

In sostanza, ha spiegato Del Bue, vuol dire che l’operatività del sistema potrebbe non corrispondere all’operatività che si può riscontrare, per esempio, con diversi tipi di pazienti in ospedale poiché, come detto prima, non corrisponde alla “realtà” della fase di test. “Resta poi critico anche il fatto che tutte le persone che hanno tossito creando quindi questo dataset, sapevano già se avevano o meno il Covid-19: è quindi molto difficile sapere se l’informazione data è corretta perché si basa su un’indicazione volontaria. E poi, ha aggiunto, se la persona è già malata e sa di esserlo, non sappiamo se questo possa modificare il modo in cui tossisce.

In ogni caso, il parere del dottor Alessio Del Bue verso questa nuova applicazione dell’intelligenza artificiale al servizio della partita contro il virus è positivo, fino a un certo punto. “Questo sistema è estremamente interessate e rappresenta un primo passo per lo sviluppo di sistemi di Intelligenza Artificiale sempre più avanzati. Oggi, però, potrebbe essere utile come prima indicazione a cui far seguire comunque altri test più accurati che ne confermino i risultati”.

La partita, insomma, è ancora lunga, ma stiamo facendo le mosse giuste.

Le informazioni fornite su www.ohga.it sono progettate per integrare, non sostituire, la relazione tra un paziente e il proprio medico.