Use este identificador para citar ou linkar para este item: https://repositorio.ufu.br/handle/123456789/39593
ORCID:  http://orcid.org/0000-0002-8321-6370
Tipo do documento: Tese
Tipo de acesso: Acesso Aberto
Título: Exploração de estratégias para a classificação de fluxos de dados de imagens
Título(s) alternativo(s): Exploring strategies for image data stream classification
Autor(es): Lima, Mateus Curcino de
Primeiro orientador: Barioni, Maria Camila Nardini
Primeiro coorientador: Faria, Elaine Ribeiro
Primeiro membro da banca: Sousa, Elaine
Segundo membro da banca: Cerri, Ricardo
Terceiro membro da banca: Pereira, Fabíola
Quarto membro da banca: Travençolo, Bruno
Resumo: A classificação de fluxos de dados de imagens apresenta vários desafios, por exemplo, a evolução de conceitos das classes conhecidas (concept-drift) e o surgimento de novas classes (concept-evolution). Embora muitos estudos tratem sobre a classificação de fluxos de dados de imagens, algumas características desse contexto não foram exploradas em conjunto nesses trabalhos, por exemplo: métodos de avaliação específicos para cenários de fluxos de dados, evolução do descritor de características das imagens, atualização do modelo de decisão considerando características de ambientes de aplicações reais e algoritmos de classificação capazes de lidar com dados de alta dimensão. O objetivo principal do trabalho descrito nesta tese é contribuir para a classificação de fluxos de dados de imagens nas etapas de classificação, atualização do modelo e avaliação considerando aspectos inerentes de cenários de aplicações reais. Para tanto, foi desenvolvido o framework EVISClass para a avaliação de algoritmos de classificação de fluxos de dados de imagens. Esse framework é capaz de considerar: ocorrência de concept-drift e concept-evolution, atrasos para rotular imagens (latência) e técnicas de aprendizado ativo para a seleção de instâncias a serem rotuladas. Com a utilização desse framework constatou-se que a latência possui forte influência na eficácia dos resultados. Além disso, observou-se que técnicas de aprendizado ativo podem contribuir para a seleção de um menor número de instâncias rotuladas, sem impactar de maneira significativa a eficácia do classificador. Por fim, foi desenvolvido o algoritmo HubISC para a classificação de fluxos de dados de imagens. Esse algoritmo incorpora o aspecto hubness, que é inerente de dados de alta dimensão. O algoritmo HubISC fornece também uma estrutura de sumarização de instâncias por meio da utilização dos hubs, que são instâncias de dados representativas. Além disso, essas instâncias são utilizadas no algoritmo como uma estratégia de aprendizado ativo. Os resultados dos experimentos com o algoritmo HubISC mostram o potencial do algoritmo em termos de desempenho preditivo e da quantidade de instâncias rotuladas em relação aos algoritmos comumente usados para a classificação de fluxos de dados de imagens.
Abstract: The image data stream classification presents several challenges, for example, the evolution of concepts of known classes (concept-drift) and the emergence of new classes (concept-evolution). Although many studies deal with the image data stream classification, these studies did not explore some characteristics of this context together. For example, specific evaluation methods for data stream scenarios, the evolution of the image descriptor (feature-evolution), updating the decision model considering characteristics of real application environments, and classification algorithms capable of dealing with high dimensional data. The work described herein aims to contribute to the image data stream classification exploring the stages of classification, model update, and evaluation, considering inherent aspects of real application scenarios. Therefore, the EVISClass framework was developed for the evaluation of algorithms for image data stream classification. This framework can consider: the occurrence of concept-drift and concept-evolution, delays for labeling images (latency), and active learning strategies for selecting instances to be labeled. The use of this framework allowed us to observe that latency has a strong influence on the efficacy of the results. Furthermore, we observed that active learning strategies could contribute to the selection of a smaller number of labeled instances without significantly impacting the classifier's effectiveness. Finally, the HubISC algorithm for the image data stream classification was developed. This algorithm incorporates the hubness aspect, which is inherent in high-dimensional data. The HubISC algorithm also provides a structure for summarizing instances using hubs, which are representative data instances. Furthermore, these instances are used in the algorithm as an active learning strategy. The experiment results with the HubISC algorithm show the potential in terms of predictive performance and the number of labeled instances compared to commonly used algorithms for image data stream classification.
Palavras-chave: Classificação de Fluxos de Dados de Imagens
Avaliação de Fluxos de Dados de Imagens
Aprendizado Ativo
Hubness
Image Data Stream Classification
Image Data Stream Evaluation
Active Learning
Área(s) do CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
Assunto: Computação
Estruturas de dados (Computação)
Arquivos de imagem
Compressão de dados (Computação)
Processamento eletrônico de dados - Técnicas estruturadas
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Programa: Programa de Pós-graduação em Ciência da Computação
Referência: LIMA, Mateus Curcino de. Exploração de estratégias para a classificação de fluxos de dados de imagens. 2023. 153 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2023. DOI http://doi.org/10.14393/ufu.te.2023.608.
Identificador do documento: http://doi.org/10.14393/ufu.te.2023.608
URI: https://repositorio.ufu.br/handle/123456789/39593
Data de defesa: 7-Nov-2023
Objetivos de Desenvolvimento Sustentável (ODS): ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.
Aparece nas coleções:TESE - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ExploraçãoEstratégiasClassificação.pdfTese9.74 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.