Usando questo sito si accetta l'utilizzo dei cookie per analisi, contenuti personalizzati e annunci.

L’idea che anche nel campo delle malattie respiratorie si possa arrivare un giorno a utilizzare un software per avere un secondo parere esperto aumentando così la qualità dell’interpretazione diagnostica dei dati funzionali e clinici è qualcosa di molto interessante e nello stesso tempo provocatorio. L’Intelligenza Artificiale (IA) è un sistema in grado di rielaborare, gestire e incrociare ampi archivi di dati. La metodica è già in uso in altri campi della medicina: in radiologia (per rilevare lesioni precancerose polmonari o mammarie), in dermatologia (per identificare e classificare le lesioni cutanee) o in cardiologia (per la lettura dell’ECG).
Il lavoro di Topalovic e colleghi pubblicato sulla rivista dell'ERS nel febbraio scorso si basa quindi sull’ipotesi che l'utilizzo dell’IA possa migliorare la lettura clinica dei test di funzionalità respiratoria (TFR - dati globalmente standardizzati e utilizzati in tutto il mondo) superando l’interpretazione data dai singoli specialisti nella classificazione dei diversi quadri clinici.
E' stato condotto pertanto uno studio multicentrico che ha coinvolto 120 pneumologi in 16 ospedali di 5 paesi europei. Ad ogni specialista venivano somministrati i dati di 50 pazienti (gruppo scelto tra pazienti ricoverati presso l’Ospedale Universitario di Leuven, Belgio, e già studiati e classificati da un gruppo concorde di 3 esperti) tra cui: i TFR (test di broncodilatazione, pletismografia, calcolo delle resistenze polmonari e capacità di diffusione alveolo-capillare del CO) e le informazioni cliniche (storia di fumo, tosse, espettorato e dispnea). Dovevano quindi rispondere a diversi quesiti: 1) interpretazione della spirometria (quadro ostruttivo, restrittivo, misto o normale); 2) assegnare una diagnosi tra asma, Broncopneumopatia Cronica Ostruttiva (BPCO), altre malattie ostruttive (tra cui bronchiectasie, bronchiolite e fibrosi cistica), malattia polmonare interstiziale (inclusa fibrosi polmonare idiopatica, polmonite interstiziale non specifica e sarcoidosi), malattia vascolare polmonare (incluse ipertensione polmonare, embolia e vasculiti), malattia neuromuscolare (incluso paralisi del diaframma, poliomielite, miopatia), deformità toracica (incluso pneumonectomia, lobectomia, problemi alla parete toracica, cifoscoliosi), sani e altro; 3) autovalutare il proprio grado di sicurezza diagnostica con la scala di Likert: da 1 punto (“assolutamente non sicuro”) fino a 5 punti (“assolutamente sicuro”). Gli stessi dai clinici e funzionali (sia in valore assoluto sia in percentuale) sono stati presentati all’IA. Tale sistema è stato realizzato con un software di apprendimento dati derivanti da un database di circa 1.400 casi clinici presi da precedenti lavori di ricerca. Dallo studio emergono diversi dati interessanti: 1) che il pattern restrittivo è più difficilmente riconosciuto e diagnosticato dagli specialisti; 2) che non ci sono state differenze tra i diversi centri, universitari o ospedalieri; 3) che l’età o l’esperienza clinica degli esaminatori non ha influenzato la precisione diagnostica. Sulle 6.000 interpretazioni totali l'accuratezza diagnostica è stata del 44,6 (± 8,7%) per centro. Il software dell’IA, basando la sua valutazione al 100% sul modello dato dalle linee guida ATS/ERS, ha avuto tempi di risposta veloci (0,2 secondi) con 82% di esattezza diagnostica.
Gli autori hanno quindi evidenziato quanto sia difficile per il singolo specialista, indipendentemente dalla sua esperienza clinica, eseguire un'adeguata interpretazione dei dati funzionali associati a dati clinici per poter giungere a una diagnosi accurata. Sicuramente sistemi di supporto potrebbero facilitarci ma esistono delle problematiche aperte. Prima fra tutte eseguire una corretta diagnostica senza conoscere tutti gli antecedenti del paziente. In secondo luogo mancano ancora delle chiare linee guida internazionali che ci permettano di etichettare adeguatamente le diverse patologie respiratorie in base ai dati funzionali (vedasi la controversa e spesso arbitraria scelta di cut-off patologici come il rapporto FEV1/FVC: patologico dopo broncodilatatore < 0,7 oppure sotto il valore del limite inferiore di normalità?). La maggior accuratezza diagnostica dell’IA è dovuta alla possibilità di inserire i dati di un nuovo paziente in un software che ha accumulato, analizzato, smembrato e riunito un enorme numero di elementi e che grazie a ciò, in un tempo brevissimo, riesce rielaborando il tutto ad assegnare il paziente a una determinata categoria. Inoltre è un software capace di migliorare nel tempo "imparando" dai propri errori e acquisendo esperienza con nuovi casi. Topalovic e colleghi concludono il loro lavoro consapevoli che il software difficilmente arriverà ad essere preciso al 100%, soprattutto nella diagnostica precoce o in processi patologici combinati (overlap syndrome), ma auspicano un margine di miglioramento che potrebbe realizzarsi introducendo dati di altri test come l’NO espirato, i FOT, dati radiologici o i biomarcatori oppure informazioni su anamnesi, esame obiettivo e comorbidità.
Concludono comunque il lavoro asserendo che l’IA potrebbe fornire uno strumento di supporto decisionale per i medici nell'ottica di migliorare la loro pratica clinica. E mi permetto di aggiungere, non certo per sostituirsi alla loro figura professionale. Nella risposta a tale articolo, Gonem e Siddiqui (1) tuttavia sottolineano un punto interessante: se attualmente si pensa che sia l’IA a dover essere allenata usando dati estrapolati da un gruppo di esperti come gold standard da tenere in considerazione, sarebbe altrettanto interessante eseguire l’esatto opposto. E cioè utilizzare l’IA come interfaccia ad uso didattico in modo da poter combinare dati funzionali all’interno del modello, osservando come cambia di conseguenza la probabilità diagnostica delle diverse patologie respiratorie.
 

Bibliografia

1) Gonem S, Siddiqui S. Artificial intelligence for pulmonary function test interpretation. Eur Respir J 2019;53:1900638.