Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/39593
ORCID:  http://orcid.org/0000-0002-8321-6370
Tipo de documento: Tese
Tipo de acceso: Acesso Aberto
Título: Exploração de estratégias para a classificação de fluxos de dados de imagens
Título (s) alternativo (s): Exploring strategies for image data stream classification
Autor: Lima, Mateus Curcino de
Primer orientador: Barioni, Maria Camila Nardini
Primer coorientador: Faria, Elaine Ribeiro
Primer miembro de la banca: Sousa, Elaine
Segundo miembro de la banca: Cerri, Ricardo
Tercer miembro de la banca: Pereira, Fabíola
Cuarto miembro de la banca: Travençolo, Bruno
Resumen: A classificação de fluxos de dados de imagens apresenta vários desafios, por exemplo, a evolução de conceitos das classes conhecidas (concept-drift) e o surgimento de novas classes (concept-evolution). Embora muitos estudos tratem sobre a classificação de fluxos de dados de imagens, algumas características desse contexto não foram exploradas em conjunto nesses trabalhos, por exemplo: métodos de avaliação específicos para cenários de fluxos de dados, evolução do descritor de características das imagens, atualização do modelo de decisão considerando características de ambientes de aplicações reais e algoritmos de classificação capazes de lidar com dados de alta dimensão. O objetivo principal do trabalho descrito nesta tese é contribuir para a classificação de fluxos de dados de imagens nas etapas de classificação, atualização do modelo e avaliação considerando aspectos inerentes de cenários de aplicações reais. Para tanto, foi desenvolvido o framework EVISClass para a avaliação de algoritmos de classificação de fluxos de dados de imagens. Esse framework é capaz de considerar: ocorrência de concept-drift e concept-evolution, atrasos para rotular imagens (latência) e técnicas de aprendizado ativo para a seleção de instâncias a serem rotuladas. Com a utilização desse framework constatou-se que a latência possui forte influência na eficácia dos resultados. Além disso, observou-se que técnicas de aprendizado ativo podem contribuir para a seleção de um menor número de instâncias rotuladas, sem impactar de maneira significativa a eficácia do classificador. Por fim, foi desenvolvido o algoritmo HubISC para a classificação de fluxos de dados de imagens. Esse algoritmo incorpora o aspecto hubness, que é inerente de dados de alta dimensão. O algoritmo HubISC fornece também uma estrutura de sumarização de instâncias por meio da utilização dos hubs, que são instâncias de dados representativas. Além disso, essas instâncias são utilizadas no algoritmo como uma estratégia de aprendizado ativo. Os resultados dos experimentos com o algoritmo HubISC mostram o potencial do algoritmo em termos de desempenho preditivo e da quantidade de instâncias rotuladas em relação aos algoritmos comumente usados para a classificação de fluxos de dados de imagens.
Abstract: The image data stream classification presents several challenges, for example, the evolution of concepts of known classes (concept-drift) and the emergence of new classes (concept-evolution). Although many studies deal with the image data stream classification, these studies did not explore some characteristics of this context together. For example, specific evaluation methods for data stream scenarios, the evolution of the image descriptor (feature-evolution), updating the decision model considering characteristics of real application environments, and classification algorithms capable of dealing with high dimensional data. The work described herein aims to contribute to the image data stream classification exploring the stages of classification, model update, and evaluation, considering inherent aspects of real application scenarios. Therefore, the EVISClass framework was developed for the evaluation of algorithms for image data stream classification. This framework can consider: the occurrence of concept-drift and concept-evolution, delays for labeling images (latency), and active learning strategies for selecting instances to be labeled. The use of this framework allowed us to observe that latency has a strong influence on the efficacy of the results. Furthermore, we observed that active learning strategies could contribute to the selection of a smaller number of labeled instances without significantly impacting the classifier's effectiveness. Finally, the HubISC algorithm for the image data stream classification was developed. This algorithm incorporates the hubness aspect, which is inherent in high-dimensional data. The HubISC algorithm also provides a structure for summarizing instances using hubs, which are representative data instances. Furthermore, these instances are used in the algorithm as an active learning strategy. The experiment results with the HubISC algorithm show the potential in terms of predictive performance and the number of labeled instances compared to commonly used algorithms for image data stream classification.
Palabras clave: Classificação de Fluxos de Dados de Imagens
Avaliação de Fluxos de Dados de Imagens
Aprendizado Ativo
Hubness
Image Data Stream Classification
Image Data Stream Evaluation
Active Learning
Área (s) del CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
Tema: Computação
Estruturas de dados (Computação)
Arquivos de imagem
Compressão de dados (Computação)
Processamento eletrônico de dados - Técnicas estruturadas
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Programa: Programa de Pós-graduação em Ciência da Computação
Cita: LIMA, Mateus Curcino de. Exploração de estratégias para a classificação de fluxos de dados de imagens. 2023. 153 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2023. DOI http://doi.org/10.14393/ufu.te.2023.608.
Identificador del documento: http://doi.org/10.14393/ufu.te.2023.608
URI: https://repositorio.ufu.br/handle/123456789/39593
Fecha de defensa: 7-nov-2023
Objetivos de Desarrollo Sostenible (ODS): ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.
Aparece en las colecciones:TESE - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
ExploraçãoEstratégiasClassificação.pdfTese9.74 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.