Feb 25, 2024
A che punto siamo nell’intelligenza artificiale per l’analisi delle immagini endoscopiche? Decifrare le lacune e le direzioni future
npj Digital Medicine volume 5, numero articolo: 184 (2022) Cita questo articolo 5830 accessi 3 citazioni 15 dettagli sulle metriche alternative I recenti sviluppi nel deep learning hanno consentito l'utilizzo dei dati
npj Medicina Digitale volume 5, numero articolo: 184 (2022) Citare questo articolo
5830 accessi
3 citazioni
15 Altmetrico
Dettagli sulle metriche
I recenti sviluppi nel deep learning hanno abilitato algoritmi basati sui dati in grado di raggiungere prestazioni a livello umano e oltre. Lo sviluppo e l'implementazione di metodi di analisi delle immagini mediche presentano diverse sfide, tra cui l'eterogeneità dei dati dovuta alla diversità della popolazione e ai diversi produttori di dispositivi. Inoltre, per un processo di sviluppo del metodo affidabile è necessario un maggiore contributo da parte degli esperti. Sebbene la crescita esponenziale dei dati di imaging clinico abbia consentito il fiorire del deep learning, l’eterogeneità dei dati, la multimodalità e i casi di malattie rare o poco appariscenti devono ancora essere esplorati. Poiché l'endoscopia è altamente dipendente dall'operatore, con esiti clinici negativi in alcuni casi di malattia, una guida automatizzata affidabile e accurata può migliorare la cura del paziente. La maggior parte dei metodi progettati deve essere più generalizzabile rispetto ai dati target invisibili, alla variabilità della popolazione di pazienti e alle manifestazioni variabili della malattia. L'articolo esamina i recenti lavori sull'analisi endoscopica delle immagini con l'intelligenza artificiale (AI) e sottolinea le attuali esigenze ineguagliabili in questo campo. Infine, delinea le direzioni future per soluzioni di intelligenza artificiale complesse clinicamente rilevanti per migliorare i risultati dei pazienti.
L’endoscopia è una procedura gold standard per molti organi cavi. Viene utilizzato principalmente per la sorveglianza della malattia, il monitoraggio dell'infiammazione, la diagnosi precoce del cancro, la caratterizzazione del tumore e le procedure di resezione, gli interventi di trattamento minimamente invasivi e il monitoraggio della risposta terapeutica. L'analisi endoscopica delle immagini ha iniziato a guadagnare maggiore attenzione negli ultimi anni con un gran numero di metodi basati sull'imaging endoscopico pubblicati in rilevamento assistito da computer (CADe)1,2,3,4,5 e diagnosi assistita da computer (CADx)6 ,7,8,9,10,11 e chirurgia assistita da computer (CAS)12,13,14,15,16. A differenza di altri dati radiologici (ad esempio, raggi X, TC, MRI), l'imaging endoscopico e la sua analisi sono un argomento altamente specializzato e impegnativo. L'imaging endoscopico presenta dipendenze multifattoriali, tra cui la grande dipendenza dell'operatore (ad esempio, esperienza e formazione), problemi legati all'ambito (ad esempio, variabilità della qualità delle immagini) e sottolineando le dinamiche della scena (ad esempio, corruzione imminente di fotogrammi con gravi artefatti, movimento di organi di grandi dimensioni e derive superficiali17). Gli standard di qualità negli interventi endoscopici gastrointestinali sono discussi in diversi importanti studi di linee guida18,19. Alcuni lavori recenti hanno esplorato aree di deep learning per automatizzare le metriche per valutare la qualità dell’endoscopia. Questi sono particolarmente critici nel quantificare i punti ciechi20,21. Mentre la ricostruzione 3D basata su SLAM è stata utilizzata per generare mappe del colon18, la lunghezza e l'area del precursore del cancro del tratto gastrointestinale superiore (GI), l'esofago di Barrett, sono state quantificate utilizzando la tecnica di stima della profondità basata sul deep learning22. Allo stesso modo, il compito più cruciale per le procedure chirurgiche minimamente invasive (ad esempio, laparoscopia) è comprendere e interpretare la scena sottolineata.
Sebbene una ricostruzione 3D degli organi cavi sia vitale, è difficile da ottenere per diversi motivi, tra cui la deformazione altamente non lineare degli organi, il disordine della scena (ad esempio, flusso di fluidi, sangue) e occlusione (ad esempio, grasso circostante un intervento chirurgico al fegato). Pertanto, la maggior parte della ricerca si concentra sulla valutazione della scena locale utilizzando metodi di classificazione, rilevamento e segmentazione. Il rilevamento e la caratterizzazione delle lesioni insieme alla loro delineazione rappresentano l'obiettivo primario dell'endoscopia gastrointestinale1,2,3,4,5,6,7,8,9,10,11. Allo stesso modo, la segmentazione mirata dei calcoli e la sua caratterizzazione sono di primaria importanza nell'ureteroscopia23, mentre il rilevamento del tumore24 è stato esplorato nella cistoscopia. Per gli interventi laparoscopici minimamente invasivi, l'area di interesse è stata la classificazione12 degli strumenti chirurgici, il rilevamento e la segmentazione13, il riconoscimento della fase12,14, la segmentazione dei punti di riferimento associati15 e la sovrapposizione del volume 3D preoperatorio sulla laparoscopia 2D interoperatoria16. Nella Fig. 1 è presentato un riepilogo illustrativo degli obiettivi chiave e dei vari compiti di analisi delle immagini endoscopiche per diversi interventi endoscopici.