Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/39593
ORCID: | http://orcid.org/0000-0002-8321-6370 |
Document type: | Tese |
Access type: | Acesso Aberto |
Title: | Exploração de estratégias para a classificação de fluxos de dados de imagens |
Alternate title (s): | Exploring strategies for image data stream classification |
Author: | Lima, Mateus Curcino de |
First Advisor: | Barioni, Maria Camila Nardini |
First coorientator: | Faria, Elaine Ribeiro |
First member of the Committee: | Sousa, Elaine |
Second member of the Committee: | Cerri, Ricardo |
Third member of the Committee: | Pereira, Fabíola |
Fourth member of the Committee: | Travençolo, Bruno |
Summary: | A classificação de fluxos de dados de imagens apresenta vários desafios, por exemplo, a evolução de conceitos das classes conhecidas (concept-drift) e o surgimento de novas classes (concept-evolution). Embora muitos estudos tratem sobre a classificação de fluxos de dados de imagens, algumas características desse contexto não foram exploradas em conjunto nesses trabalhos, por exemplo: métodos de avaliação específicos para cenários de fluxos de dados, evolução do descritor de características das imagens, atualização do modelo de decisão considerando características de ambientes de aplicações reais e algoritmos de classificação capazes de lidar com dados de alta dimensão. O objetivo principal do trabalho descrito nesta tese é contribuir para a classificação de fluxos de dados de imagens nas etapas de classificação, atualização do modelo e avaliação considerando aspectos inerentes de cenários de aplicações reais. Para tanto, foi desenvolvido o framework EVISClass para a avaliação de algoritmos de classificação de fluxos de dados de imagens. Esse framework é capaz de considerar: ocorrência de concept-drift e concept-evolution, atrasos para rotular imagens (latência) e técnicas de aprendizado ativo para a seleção de instâncias a serem rotuladas. Com a utilização desse framework constatou-se que a latência possui forte influência na eficácia dos resultados. Além disso, observou-se que técnicas de aprendizado ativo podem contribuir para a seleção de um menor número de instâncias rotuladas, sem impactar de maneira significativa a eficácia do classificador. Por fim, foi desenvolvido o algoritmo HubISC para a classificação de fluxos de dados de imagens. Esse algoritmo incorpora o aspecto hubness, que é inerente de dados de alta dimensão. O algoritmo HubISC fornece também uma estrutura de sumarização de instâncias por meio da utilização dos hubs, que são instâncias de dados representativas. Além disso, essas instâncias são utilizadas no algoritmo como uma estratégia de aprendizado ativo. Os resultados dos experimentos com o algoritmo HubISC mostram o potencial do algoritmo em termos de desempenho preditivo e da quantidade de instâncias rotuladas em relação aos algoritmos comumente usados para a classificação de fluxos de dados de imagens. |
Abstract: | The image data stream classification presents several challenges, for example, the evolution of concepts of known classes (concept-drift) and the emergence of new classes (concept-evolution). Although many studies deal with the image data stream classification, these studies did not explore some characteristics of this context together. For example, specific evaluation methods for data stream scenarios, the evolution of the image descriptor (feature-evolution), updating the decision model considering characteristics of real application environments, and classification algorithms capable of dealing with high dimensional data. The work described herein aims to contribute to the image data stream classification exploring the stages of classification, model update, and evaluation, considering inherent aspects of real application scenarios. Therefore, the EVISClass framework was developed for the evaluation of algorithms for image data stream classification. This framework can consider: the occurrence of concept-drift and concept-evolution, delays for labeling images (latency), and active learning strategies for selecting instances to be labeled. The use of this framework allowed us to observe that latency has a strong influence on the efficacy of the results. Furthermore, we observed that active learning strategies could contribute to the selection of a smaller number of labeled instances without significantly impacting the classifier's effectiveness. Finally, the HubISC algorithm for the image data stream classification was developed. This algorithm incorporates the hubness aspect, which is inherent in high-dimensional data. The HubISC algorithm also provides a structure for summarizing instances using hubs, which are representative data instances. Furthermore, these instances are used in the algorithm as an active learning strategy. The experiment results with the HubISC algorithm show the potential in terms of predictive performance and the number of labeled instances compared to commonly used algorithms for image data stream classification. |
Keywords: | Classificação de Fluxos de Dados de Imagens Avaliação de Fluxos de Dados de Imagens Aprendizado Ativo Hubness Image Data Stream Classification Image Data Stream Evaluation Active Learning |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS |
Subject: | Computação Estruturas de dados (Computação) Arquivos de imagem Compressão de dados (Computação) Processamento eletrônico de dados - Técnicas estruturadas |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Program: | Programa de Pós-graduação em Ciência da Computação |
Quote: | LIMA, Mateus Curcino de. Exploração de estratégias para a classificação de fluxos de dados de imagens. 2023. 153 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2023. DOI http://doi.org/10.14393/ufu.te.2023.608. |
Document identifier: | http://doi.org/10.14393/ufu.te.2023.608 |
URI: | https://repositorio.ufu.br/handle/123456789/39593 |
Date of defense: | 7-Nov-2023 |
Sustainable Development Goals SDGs: | ODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação. |
Appears in Collections: | TESE - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ExploraçãoEstratégiasClassificação.pdf | Tese | 9.74 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.