Spelling suggestions: "subject:"aemantic image egmentation"" "subject:"aemantic image asegmentation""
1 |
Automatic Image Segmentation for Hair Masking: two MethodsVestergren, Sara, Zandpour, Navid January 2019 (has links)
We propose two different methods for image segmentation with the objective of marking contaminated regions in images from biochemical tests. The contaminated regions consists of thin hair or fibers and the purpose of this thesis is to eliminate the tedious task of masking the contaminated regions by hand by implementing automatic hair masking. Initially an algorithm based on Morphological Image Processing is presented, followed by solving the problem of pixelwise classification using a Convolutional Neural Network (CNN). Finally, the performance of each implementation is measured by comparing the segmented images with labelled images which are considered to be the ground truth. The result shows that both implementations have strong potential at successfully performing semantic segmentation on the images from the biochemical tests.
|
2 |
Using Satellite Images and Deep Learning to Detect Water Hidden Under the Vegetation : A cross-modal knowledge distillation-based method to reduce manual annotation work / Användning Satellitbilder och Djupinlärning för att Upptäcka Vatten Gömt Under Vegetationen : En tvärmodal kunskapsdestillationsbaserad metod för att minska manuellt anteckningsarbeteCristofoli, Ezio January 2024 (has links)
Detecting water under vegetation is critical to tracking the status of geological ecosystems like wetlands. Researchers use different methods to estimate water presence, avoiding costly on-site measurements. Optical satellite imagery allows the automatic delineation of water using the concept of the Normalised Difference Water Index (NDWI). Still, optical imagery is subject to visibility conditions and cannot detect water under the vegetation, a typical situation for wetlands. Synthetic Aperture Radar (SAR) imagery works under all visibility conditions. It can detect water under vegetation but requires deep network algorithms to segment water presence, and manual annotation work is required to train the deep models. This project uses DEEPAQUA, a cross-modal knowledge distillation method, to eliminate the manual annotation needed to extract water presence from SAR imagery with deep neural networks. In this method, a deep student model (e.g., UNET) is trained to segment water in SAR imagery. The student model uses the NDWI algorithm as the non-parametric, cross-modal teacher. The key prerequisite is that NDWI works on the optical imagery taken from the exact location and simultaneously as the SAR. Three different deep architectures are tested in this project: UNET, SegNet, and UNET++, and the Otsu method is used as the baseline. Experiments on imagery from Swedish wetlands in 2020-2022 show that cross-modal distillation consistently achieved better segmentation performances across architectures than the baseline. Additionally, the UNET family of algorithms performed better than SegNet with a confidence of 95%. The UNET++ model achieved the highest Intersection Over Union (IOU) performance. However, no statistical evidence emerged that UNET++ performs better than UNET, with a confidence of 95%. In conclusion, this project shows that cross-modal knowledge distillation works well across architectures and removes tedious and expensive manual work hours when detecting water from SAR imagery. Further research could evaluate performances on other datasets and student architectures. / Att upptäcka vatten under vegetation är avgörande för att hålla koll på statusen på geologiska ekosystem som våtmarker. Forskare använder olika metoder för att uppskatta vattennärvaro vilket undviker kostsamma mätningar på plats. Optiska satellitbilder tillåter automatisk avgränsning av vatten med hjälp av konceptet Normalised Difference Water Index (NDWI). Optiska bilder fortfarande beroende av siktförhållanden och kan inte upptäcka vatten under vegetationen, en typisk situation för våtmarker. Synthetic Aperture Radar (SAR)-bilder fungerar under alla siktförhållanden. Den kan detektera vatten under vegetation men kräver djupa nätverksalgoritmer för att segmentera vattennärvaro, och manuellt anteckningsarbete krävs för att träna de djupa modellerna. Detta projekt använder DEEPAQUA, en cross-modal kunskapsdestillationsmetod, för att eliminera det manuella annoteringsarbete som behövs för att extrahera vattennärvaro från SAR-bilder med djupa neurala nätverk. I denna metod tränas en djup studentmodell (t.ex. UNET) att segmentera vatten i SAR-bilder semantiskt. Elevmodellen använder NDWI, som fungerar på de optiska bilderna tagna från den exakta platsen och samtidigt som SAR, som den icke-parametriska, cross-modal lärarmodellen. Tre olika djupa arkitekturer testas i detta examensarbete: UNET, SegNet och UNET++, och Otsu-metoden används som baslinje. Experiment på bilder tagna på svenska våtmarker 2020-2022 visar att cross-modal destillation konsekvent uppnådde bättre segmenteringsprestanda över olika arkitekturer jämfört med baslinjen. Dessutom presterade UNET-familjen av algoritmer bättre än SegNet med en konfidens på 95%. UNET++-modellen uppnådde högsta prestanda för Intersection Over Union (IOU). Det framkom dock inga statistiska bevis för att UNET++ presterar bättre än UNET, med en konfidens på 95%. Sammanfattningsvis visar detta projekt att cross-modal kunskapsdestillation fungerar bra över olika arkitekturer och tar bort tidskrävande och kostsamma manuella arbetstimmar vid detektering av vatten från SAR-bilder. Ytterligare forskning skulle kunna utvärdera prestanda på andra datamängder och studentarkitekturer.
|
3 |
Contributions à la fusion de segmentations et à l’interprétation sémantique d’imagesKhelifi, Lazhar 08 1900 (has links)
No description available.
|
4 |
Machine Learning en Resonancia Magnética. Describiendo la Fisiopatología del Dolor LumbarSáenz Gamboa, Jhon Jairo 02 September 2024 (has links)
[ES] El dolor lumbar es una afección común que afecta a casi el 70% de la población, representando una carga significativa para el sistema de atención médica. Esta tesis se centra en extraer conocimiento médico a partir de Imágenes de Resonancia Magnética (IRM) lumbar, relacionándolas con el dolor lumbar. A través de las técnicas de aprendizaje automático (Machine Learning), se procesan extensos conjuntos de datos de IRM lumbar para desarrollar algoritmos de segmentación semántica que identifican las estructuras en la columna vertebral. El objetivo principal es mejorar la comprensión de las causas del dolor lumbar y desarrollar modelos predictivos que respalden una toma de decisiones clínicas más precisa. Simultáneamente, se busca crear un repositorio público de imágenes de columna lumbar anonimizadas y datos poblacionales para facilitar la colaboración en la investigación en este campo.
Los métodos propuestos en esta tesis se centran en el análisis preciso de IRM lumbar de pacientes con antecedentes de dolor lumbar en hospitales públicos de la Comunidad Valenciana, generando dos conjuntos de datos significativos. El primero, llamado "Massive Image Data Anatomy of the Spine" (MIDAS), contiene datos de alrededor de 23,688 pacientes, equivalente a unas 124,800 IRM lumbar. Estos datos fueron recopilados de 17 departamentos de salud y sometidos a diversas fases, que incluyen la aprobación de un comité ético, la de-identificación y corrección de metadatos DICOM, y la estandarización de protocolos de adquisición. Además, se implementó una estructura de archivos estandarizada llamada " Medical Imaging Data Structure" (MIDS) para garantizar la transparencia y reproducibilidad de los datos. Este conjunto de datos está disponible para descarga bajo solicitud en https://bimcv.cipf.es/bimcv-projects/midas- 2/.
El segundo conjunto de datos se creó mediante la segmentación manual de 181 IRM lumbar, realizada por dos radiólogos expertos. El propósito de esta tarea fue asignar etiquetas de clase a cada píxel de las imágenes, donde las clases se definieron según elementos anatómicos como vértebras, discos intervertebrales, nervios, vasos sanguíneos y otros tejidos, cubriendo un total de 11 elementos diferentes de la columna vertebral. Estos datos se utilizaron para diseñar y entrenar variantes de arquitecturas de Redes Neuronales Convolucionales (Convolutional Neural Networks o CNN) para la tarea de segmentación automática de IRM lumbar.
Como resultado de los experimentos, esta tesis hace hincapié en la importancia de recopilar y preprocesar datos de alta calidad, así como elegir estratégicamente arquitecturas de red y técnicas de aprendizaje profundo en la segmentación semántica de imágenes médicas. Presenta topologías de red efectivas que superan al modelo U-Net estándar y resalta la versatilidad de un solo modelo para segmentar imágenes de diferentes protocolos y vistas, simplificando el desarrollo de sistemas de procesamiento de imágenes médicas.
En última instancia, esta tesis representa un viaje interdisciplinario desde la ingeniería hasta la medicina, destacando la innovación de aplicar métodos de ML para obtener conjuntos de datos médicos etiquetados a gran escala. Las futuras investigaciones se centran en mejorar el conjunto de datos y desarrollar herramientas de visión por computadora para detectar y clasificar patologías de la columna lumbar. Una vez validadas clínicamente, estas innovaciones podrían revolucionar el diagnóstico clínico y la toma de decisiones médicas basadas en evidencia en este campo. / [CA] El dolor lumbar és una afecció comuna que afecta a gairebé el 70% de la població, la qual cosa representa una càrrega significativa per al sistema d'atenció mèdica. Aquesta tesi se centra a extraure coneixement mèdic a partir d'Imatges de Ressonància Magnètica (IRM) lumbar, relacionant-les amb el dolor lumbar. Mitjançant tècniques d'aprenentatge automàtic ("Machine Learning", ML), es processen extensos conjunts de dades d'IRM lumbar per tal de desenvolupar algoritmes de segmentació semàntica que identifiquen les estructures a la columna vertebral. L'objectiu principal és millorar la comprensió de les causes del dolor lumbar i desenvolupar models predictius que donen suport a una presa de decisions clíniques més precisa. Simultàniament, es busca crear un repositori públic d'imatges de columna lumbar anonimitzades i dades poblacionals per facilitar la col·laboració en la recerca en aquest camp.
Els mètodes proposats en aquesta tesi se centren en l'anàlisi precisa d'IRM lumbar de pacients amb antecedents de dolor lumbar en hospitals públics de la Comunitat Valenciana, generant dos conjunts de dades significatius. El primer, anomenat "Massive Image Data Anatomy of the Spine" (MIDAS), conté dades de vora 23.688 pacients, equivalent a unes 124.800 IRM lumbars. Aquestes dades van ser recopilades de 17 departaments de salut i sotmeses a diverses fases, que inclouen l'aprovació d'un comitè ètic, la desidentificació i correcció de metadades DICOM (Digital Imaging and Communications in Medicine), i l'estandardització de protocols d'adquisició. A més, es va implementar una estructura d'arxius estandarditzada anomenada "Medical Imaging Data Structure" (MIDS) per tal de garantir la transparència i la reproducció de les dades. Aquest conjunt de dades està disponible per a descarregar sota sol·licitud a https://bimcv.cipf.es/bimcv-projects/midas-2/.
El segon conjunt de dades es va crear mitjançant la segmentació manual de 181 IRM lumbars, realitzada per dos radiòlegs experts. El propòsit d'aquesta tasca va ser assignar etiquetes de classe a cada píxel de les imatges, classes que es van definir segons elements anatòmics com ara vèrtebres, discs intervertebrals, nervis, vasos sanguinis i altres teixits, tot cobrint un total d'11 elements diferents de la columna vertebral. Aquestes dades es van utilitzar per dissenyar i entrenar variants d'arquitectures de Xarxes Neuronals Convolucionals (Convolutional Neural Networks o CNN) per a la tasca de segmentació automàtica d'IRM lumbar.
Com a resultat dels experiments, aquesta tesi destaca la importància de recopilar i preprocessar dades d'alta qualitat, així com de triar estratègicament arquitectures de xarxa i tècniques de DL en la segmentació semàntica d'imatges mèdiques. Presenta topologies de xarxa efectives que superen al model U-Net estàndard i destaca la versatilitat d'un sol model per a segmentar imatges de diferents protocols i vistes, simplificant el desenvolupament de sistemes de processament d'imatges mèdiques.
Finalment, aquesta tesi representa un viatge interdisciplinari des de l'enginyeria fins a la medicina, tot destacant la innovació a l'hora d'aplicar mètodes d'ML per obtenir conjunts de dades mèdiques etiquetats a gran escala. Les futures investigacions se centren a millorar el conjunt de dades i desenvolupar eines de visió per ordinador per detectar i classificar patologies de la columna lumbar. Un cop validades clínicament, aquestes innovacions podrien revolucionar el diagnòstic clínic i la presa de decisions mèdiques basades en evidències en aquest camp. / [EN] Lower back pain is a common condition affecting nearly 70% of the population, representing a significant burden for the healthcare system. This thesis focuses on extracting medical knowledge from lumbar Magnetic Resonance Imaging (MRI), linking them to lower back pain. Through Machine Learning techniques, extensive lumbar MRI datasets are processed to develop semantic segmentation algorithms that identify structures in the spine. The main goal is to improve understanding of the causes of lower back pain and develop predictive models that support more accurate clinical decision-making. Simultaneously, the aim is to create a public repository of anonymized lumbar spine images and population data to facilitate collaboration in research in this field.
The methods proposed in this thesis focus on the precise analysis of lumbar MRI from patients with a history of lower back pain in public hospitals of the Valencian Community, generating two significant datasets. The first, called "Massive Image Data Anatomy of the Spine" (MIDAS), contains data from around 23,688 patients, equivalent to about 124,800 lumbar MRIs. These data were collected from 17 health departments and underwent various phases, including ethical committee approval, de-identification and correction of DICOM metadata, and standardization of acquisition protocols. In addition, a standardized file structure called "Medical Imaging Data Structure" (MIDS) was implemented to ensure data transparency and reproducibility. This dataset is available for download upon request at https://bimcv.cipf.es/bimcv-projects/midas-2/.
The second dataset involved the manual segmentation of 181 lumbar MRIs. Two expert radiologists performed this to assign class labels to each pixel in the images based on anatomical elements, including vertebrae, intervertebral discs, nerves, blood vessels, and other tissues, comprising 11 distinct elements of the spine. This data was utilized to design and train different Convolutional Neural Network (CNN) architectures for the automatic segmentation of lumbar MRI.
As a result of the experiments, this thesis emphasizes the importance of collecting and preprocessing high-quality data and strategically choosing network architectures and DL techniques in the semantic segmentation of medical images. It presents effective network topologies that surpass the standard U-Net model and highlights the versatility of a single model to segment images from different protocols and views, simplifying the development of medical image processing systems.
Ultimately, this thesis represents an interdisciplinary journey from engineering to medicine, highlighting the innovation of applying ML methods to obtain large-scale labelled medical datasets. Future research focuses on improving the dataset and developing computer vision tools to detect and classify lumbar spine pathologies. Once clinically validated, these innovations could revolutionize clinical diagnosis and evidence-based medical decision-making in this field. / Sáenz Gamboa, JJ. (2024). Machine Learning en Resonancia Magnética. Describiendo la Fisiopatología del Dolor Lumbar [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/207346
|
Page generated in 0.0983 seconds