Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.ufu.br/handle/123456789/43533
ORCID: | http://orcid.org/0000-0003-3789-5074 |
Tipo de documento: | Tese |
Tipo de acceso: | Acesso Aberto |
Título: | Ensemble architectures and fusion techniques for convolutional neural networks applied to medical image analysis |
Título (s) alternativo (s): | Arquiteturas de comitê e técnicas de fusão para redes neurais convolucionais aplicadas à análise de imagens médicas |
Autor: | Costa, Cícero Lima |
Primer orientador: | Travençolo, Bruno Augusto Nassif |
Primer coorientador: | Barcelos, Celia Aparecida Zorzo |
Primer miembro de la banca: | Backes, André Ricardo |
Segundo miembro de la banca: | Couto, Leandro Nogueira |
Tercer miembro de la banca: | Mari, João Fernando |
Cuarto miembro de la banca: | Borges, Vinicius Ruela Pereira |
Resumen: | Algoritmos de visão computacional, como redes neurais convolucionais, são usados para automatizar processos na medicina e apoiar o diagnóstico. Esses algoritmos minimizam o erro humano durante a análise de imagens médicas e reduzem a variabilidade interoperador. Neste estudo, para apoiar o diagnóstico, foram propostas três estratégias envolvendo fusão de redes neurais convolucionais. Primeiro, comitês de redes neurais convolucionais foram utilizados na tarefa de classificação de imagens gastrointestinais. Em segundo lugar, através da fusão de modelos convolucionais, foi proposto um novo modelo para detectar pontos de referência em imagens de cefalogramas laterais, radiografias de mãos e radiografias de pulmão. A terceira análise testou se o pré-processamento de imagens ajudaria os modelos convolucionais na tarefa de detecção de pontos de referência e segmentação de regiões. As estratégias propostas foram avaliadas com base em métricas comuns na literatura, como erro radial médio e F1-score. Além disso, alinhado aos conceitos de computação verde, também foram avaliados o consumo de recursos e as emissões de poluentes. Para a tarefa de classificação, o comitê proposto obteve F1-score de 0,910, correspondendo à literatura, porém, utilizando equipamentos de menor custo. Para detecção de pontos de referência, por meio de fusão de modelos, considerando a taxa de detecção de sucesso, success detection rate (SDR), entre os pontos de referência previstos e os pontos de referência originais, alcançamos SDR de 95,72% para o cefalograma lateral e 99,56% para as radiografias de mão, ambos considerando uma distância de até 4 mm. Para radiografias de pulmão, obtivemos um SDR de 84,21% considerando 6 pixels de distância. Nossa proposta também reduziu o tempo de execução, o consumo de energia e as emissões de carbono em cerca de 65%. A estratégia de pré-processamento não apresentou melhorias significativas nos resultados. |
Abstract: | Computer vision algorithms such as convolutional neural networks are used to automate processes in medicine and support diagnosis. These algorithms minimize human error during medical image analysis and reduces inter-operator variability. In this study, to support the diagnosis, three strategies involving fusion of convolutional neural networks were proposed. First, ensemble architectures were used in the gastrointestinal image classification task. Second, through the fusion of convolutional models, a new model was proposed to detect landmarks in images of lateral cephalograms, hand X-rays and lung X-rays. The third analysis tested whether image preprocessing would help convolutional models in the task of landmark detection and region segmentation. The proposed strategies were evaluated based on common metrics in the literature such as mean radial error and F1-score. In addition, aligning with the concepts of green computing, resource consumption and pollutant emissions were also evaluated. For the classification task, the proposed ensemble achieved an F1-score of 0.910, matching the literature, however, using lower cost equipment. For landmark detection, through model fusion, considering the success detection rate (SDR) between the predicted landmarks and the original landmarks, we achieved SDR of 95.72% for the lateral cephalogram and 99.56% for the hand x-rays, both considering a distance up to 4mm. For lung x-rays, we obtained an SDR 84.21% considering 6 pixels of distance. Our proposal also reduced execution time, energy consumption and carbon emissions by around 65%. The preprocessing strategy showed no with significant improvements over the results. |
Palabras clave: | Deep learning Ensamble Fusion Classification X-rays Aprendizagem profunda Comitês Fusão Classificação Raios X Computação |
Área (s) del CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Tema: | Computação |
Idioma: | eng |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Programa: | Programa de Pós-graduação em Ciência da Computação |
Cita: | COSTA, Cícero Lima. Ensemble architectures and fusion techniques for convolutional neural networks applied to medical image analysis. 2024. 97 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2024. DOI http://doi.org/10.14393/ufu.te.2024.618. |
Identificador del documento: | http://doi.org/10.14393/ufu.te.2024.618 |
URI: | https://repositorio.ufu.br/handle/123456789/43533 |
Fecha de defensa: | 26-ago-2024 |
Objetivos de Desarrollo Sostenible (ODS): | ODS::ODS 3. Saúde e bem-estar - Assegurar uma vida saudável e promover o bem-estar para todos, em todas as idades. ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação. ODS::ODS 12. Consumo e produção responsáveis - Assegurar padrões de produção e de consumo sustentáveis. ODS::ODS 13. Ação contra a mudança global do clima - Tomar medidas urgentes para combater a mudança climática e seus impactos. |
Aparece en las colecciones: | TESE - Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
EnsembleArchitecturesFusion.pdf | Tese | 36.1 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons