Generalizzabilità limitata della singola rete neurale profonda per la segmentazione degli strumenti chirurgici in diversi ambienti chirurgici

Blog

CasaCasa / Blog / Generalizzabilità limitata della singola rete neurale profonda per la segmentazione degli strumenti chirurgici in diversi ambienti chirurgici

Jun 11, 2024

Generalizzabilità limitata della singola rete neurale profonda per la segmentazione degli strumenti chirurgici in diversi ambienti chirurgici

Scientific Reports volume 12, Numero articolo: 12575 (2022) Cita questo articolo 1042 Accessi 1 Citazioni 2 Dettagli sulle metriche altmetriche Chiarire la generalizzabilità dell'apprendimento basato sul deep-learning

Rapporti scientifici volume 12, numero articolo: 12575 (2022) Citare questo articolo

1042 accessi

1 Citazioni

2 Altmetrico

Dettagli sulle metriche

Chiarire la generalizzabilità delle reti di segmentazione degli strumenti chirurgici basate sul deep learning in diversi ambienti chirurgici è importante per riconoscere le sfide legate all’overfitting nello sviluppo di dispositivi chirurgici. Questo studio ha valutato in modo completo la generalizzabilità della rete neurale profonda per la segmentazione degli strumenti chirurgici utilizzando 5238 immagini estratte casualmente da 128 video intraoperatori. Il set di dati video conteneva 112 casi di resezione colorettale laparoscopica, 5 casi di gastrectomia distale laparoscopica, 5 casi di colecistectomia laparoscopica e 6 casi di epatectomia parziale laparoscopica. La segmentazione degli strumenti chirurgici basata sull'apprendimento profondo è stata eseguita per set di test con (1) le stesse condizioni del set di addestramento; (2) lo stesso strumento chirurgico target di riconoscimento e lo stesso tipo di intervento chirurgico ma diversi sistemi di registrazione laparoscopica; (3) lo stesso sistema di registrazione laparoscopica e lo stesso tipo di intervento chirurgico ma pinze chirurgiche laparoscopiche target di riconoscimento leggermente diverse; (4) lo stesso sistema di registrazione laparoscopica e lo stesso strumento chirurgico di riconoscimento del bersaglio ma diversi tipi di intervento chirurgico. La precisione media media e l'intersezione media sull'unione per i set di test 1, 2, 3 e 4 erano rispettivamente 0,941 e 0,887, 0,866 e 0,671, 0,772 e 0,676 e 0,588 e 0,395. Pertanto, la precisione del riconoscimento è diminuita anche in condizioni leggermente diverse. I risultati di questo studio rivelano la limitata generalizzabilità delle reti neurali profonde nel campo dell’intelligenza artificiale chirurgica e cautela nei confronti di set di dati e modelli distorti basati sul deep learning.

Numero di registrazione della prova: 2020-315, data di registrazione: 5 ottobre 2020.

La chirurgia mini-invasiva (MIS), inclusa la chirurgia robotica, è diventata sempre più comune1. La MIS che utilizza endoscopi per osservare l'anatomia interna è preferita per molte procedure chirurgiche perché attraverso l'oscilloscopio è possibile ottenere un campo visivo chirurgico ingrandito. Inoltre, le procedure chirurgiche possono essere memorizzate come dati video; pertanto, questo approccio facilita non solo la formazione e l’istruzione chirurgica, ma anche la scienza dei dati chirurgici2, come la visione artificiale che utilizza il deep learning.

La visione artificiale è un campo di ricerca che descrive la comprensione automatica di immagini e video e progressi significativi hanno portato le macchine a raggiungere capacità di livello umano in aree come il riconoscimento di oggetti e scene3. Il principale lavoro correlato all'assistenza sanitaria nel campo della visione artificiale è la diagnosi assistita da computer, come il rilevamento dei polipi del colon4,5 e il rilevamento del cancro della pelle6,7; tuttavia, anche l'applicazione della chirurgia assistita da computer ha subito un'accelerazione8,9. In particolare, la segmentazione degli strumenti chirurgici e il tracciamento delle loro punte sono importanti tecnologie di base perché possono essere applicate alla valutazione delle abilità chirurgiche10,11 e sono essenziali per la realizzazione di una chirurgia automatica e autonoma12.

La segmentazione è un'attività di visione artificiale in cui intere immagini vengono divise in gruppi di pixel che possono essere etichettati e classificati. In particolare, la segmentazione semantica tenta di comprendere semanticamente il ruolo di ciascun pixel nelle immagini13. La segmentazione delle istanze, che estende la segmentazione semantica, segmenta diverse istanze di classi, ovvero etichettando cinque individui con cinque colori diversi; pertanto, può identificare i confini, le differenze e le relazioni tra oggetti per più oggetti sovrapposti14.

Questi approcci di visione artificiale hanno una grande applicabilità al riconoscimento degli strumenti chirurgici nei video intraoperatori per MIS e, negli ultimi anni, sono stati compiuti numerosi sforzi per sviluppare la segmentazione degli strumenti chirurgici15,16. Tra questi, la Medical Image Computing and Computer Assisted Interventions Society ha organizzato sfide internazionali basate sull'accuratezza del riconoscimento per la segmentazione degli strumenti chirurgici e la Endoscopic Vision Challenge15,17,18,19; nuove reti neurali profonde hanno battuto il record di precisione di segmentazione all’avanguardia. Tuttavia, questi sforzi sono stati eseguiti su set di dati video corrispondenti allo stesso tipo di intervento chirurgico utilizzando un tipo fisso di strumento chirurgico e lo stesso tipo di sistema di registrazione laparoscopica, a differenza delle impostazioni chirurgiche del mondo reale. In pratica, ci sono molte condizioni diverse nelle situazioni chirurgiche del mondo reale. Ad esempio, in diversi ospedali vengono utilizzati diversi tipi di sistemi di registrazione laparoscopica e strumenti chirurgici laparoscopici; inoltre, i dispositivi chirurgici vengono aggiornati e la loro forma cambia leggermente ogni pochi anni. Quando si considerano le proprietà generali di una singola rete di riconoscimento di strumenti chirurgici, è anche importante verificare l'applicabilità della rete ad altri tipi di interventi chirurgici, vale a dire chiarire la differenza nella precisione del riconoscimento quando una rete di riconoscimento sviluppata in base ai dati di un certo tipo di intervento chirurgico viene applicato un altro tipo di intervento chirurgico. Sebbene tali condizioni relative all'accuratezza del riconoscimento possano chiarire che la costruzione di un set di dati video intraoperatori con diversità è importante, non è stato riportato uno studio completo sulla generalizzabilità di una singola rete di riconoscimento di strumenti chirurgici. Pertanto, i risultati di questo studio sono importanti perché forniscono informazioni preziose per il futuro sviluppo e implementazione chirurgica.

3.0.CO;2-E" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291522-712X%281995%291%3A6%3C308%3A%3AAID-IGS3%3E3.0.CO%3B2-E" aria-label="Article reference 31" data-doi="10.1002/(SICI)1522-712X(1995)1:63.0.CO;2-E"Article CAS Google Scholar /p>