Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/39593
Full metadata record
DC FieldValueLanguage
dc.creatorLima, Mateus Curcino de-
dc.date.accessioned2023-12-01T14:53:52Z-
dc.date.available2023-12-01T14:53:52Z-
dc.date.issued2023-11-07-
dc.identifier.citationLIMA, Mateus Curcino de. Exploração de estratégias para a classificação de fluxos de dados de imagens. 2023. 153 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2023. DOI http://doi.org/10.14393/ufu.te.2023.608.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/39593-
dc.description.abstractThe image data stream classification presents several challenges, for example, the evolution of concepts of known classes (concept-drift) and the emergence of new classes (concept-evolution). Although many studies deal with the image data stream classification, these studies did not explore some characteristics of this context together. For example, specific evaluation methods for data stream scenarios, the evolution of the image descriptor (feature-evolution), updating the decision model considering characteristics of real application environments, and classification algorithms capable of dealing with high dimensional data. The work described herein aims to contribute to the image data stream classification exploring the stages of classification, model update, and evaluation, considering inherent aspects of real application scenarios. Therefore, the EVISClass framework was developed for the evaluation of algorithms for image data stream classification. This framework can consider: the occurrence of concept-drift and concept-evolution, delays for labeling images (latency), and active learning strategies for selecting instances to be labeled. The use of this framework allowed us to observe that latency has a strong influence on the efficacy of the results. Furthermore, we observed that active learning strategies could contribute to the selection of a smaller number of labeled instances without significantly impacting the classifier's effectiveness. Finally, the HubISC algorithm for the image data stream classification was developed. This algorithm incorporates the hubness aspect, which is inherent in high-dimensional data. The HubISC algorithm also provides a structure for summarizing instances using hubs, which are representative data instances. Furthermore, these instances are used in the algorithm as an active learning strategy. The experiment results with the HubISC algorithm show the potential in terms of predictive performance and the number of labeled instances compared to commonly used algorithms for image data stream classification.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectClassificação de Fluxos de Dados de Imagenspt_BR
dc.subjectAvaliação de Fluxos de Dados de Imagenspt_BR
dc.subjectAprendizado Ativopt_BR
dc.subjectHubnesspt_BR
dc.subjectImage Data Stream Classificationpt_BR
dc.subjectImage Data Stream Evaluationpt_BR
dc.subjectActive Learningpt_BR
dc.titleExploração de estratégias para a classificação de fluxos de dados de imagenspt_BR
dc.title.alternativeExploring strategies for image data stream classificationpt_BR
dc.typeTesept_BR
dc.contributor.advisor-co1Faria, Elaine Ribeiro-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/8238524390290386pt_BR
dc.contributor.advisor1Barioni, Maria Camila Nardini-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3785426518998830pt_BR
dc.contributor.referee1Sousa, Elaine-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/6253898580239376pt_BR
dc.contributor.referee2Cerri, Ricardo-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/6266519868438512pt_BR
dc.contributor.referee3Pereira, Fabíola-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/2320001731969968pt_BR
dc.contributor.referee4Travençolo, Bruno-
dc.contributor.referee4Latteshttp://lattes.cnpq.br/2590427557264952pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/7700888395514232pt_BR
dc.description.degreenameTese (Doutorado)pt_BR
dc.description.resumoA classificação de fluxos de dados de imagens apresenta vários desafios, por exemplo, a evolução de conceitos das classes conhecidas (concept-drift) e o surgimento de novas classes (concept-evolution). Embora muitos estudos tratem sobre a classificação de fluxos de dados de imagens, algumas características desse contexto não foram exploradas em conjunto nesses trabalhos, por exemplo: métodos de avaliação específicos para cenários de fluxos de dados, evolução do descritor de características das imagens, atualização do modelo de decisão considerando características de ambientes de aplicações reais e algoritmos de classificação capazes de lidar com dados de alta dimensão. O objetivo principal do trabalho descrito nesta tese é contribuir para a classificação de fluxos de dados de imagens nas etapas de classificação, atualização do modelo e avaliação considerando aspectos inerentes de cenários de aplicações reais. Para tanto, foi desenvolvido o framework EVISClass para a avaliação de algoritmos de classificação de fluxos de dados de imagens. Esse framework é capaz de considerar: ocorrência de concept-drift e concept-evolution, atrasos para rotular imagens (latência) e técnicas de aprendizado ativo para a seleção de instâncias a serem rotuladas. Com a utilização desse framework constatou-se que a latência possui forte influência na eficácia dos resultados. Além disso, observou-se que técnicas de aprendizado ativo podem contribuir para a seleção de um menor número de instâncias rotuladas, sem impactar de maneira significativa a eficácia do classificador. Por fim, foi desenvolvido o algoritmo HubISC para a classificação de fluxos de dados de imagens. Esse algoritmo incorpora o aspecto hubness, que é inerente de dados de alta dimensão. O algoritmo HubISC fornece também uma estrutura de sumarização de instâncias por meio da utilização dos hubs, que são instâncias de dados representativas. Além disso, essas instâncias são utilizadas no algoritmo como uma estratégia de aprendizado ativo. Os resultados dos experimentos com o algoritmo HubISC mostram o potencial do algoritmo em termos de desempenho preditivo e da quantidade de instâncias rotuladas em relação aos algoritmos comumente usados para a classificação de fluxos de dados de imagens.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration153pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSpt_BR
dc.identifier.doihttp://doi.org/10.14393/ufu.te.2023.608pt_BR
dc.orcid.putcode147924762-
dc.crossref.doibatchid22c2c65d-02b4-4579-9e8b-fb2a6c04a69e-
dc.subject.autorizadoComputaçãopt_BR
dc.subject.autorizadoEstruturas de dados (Computação)pt_BR
dc.subject.autorizadoArquivos de imagempt_BR
dc.subject.autorizadoCompressão de dados (Computação)pt_BR
dc.subject.autorizadoProcessamento eletrônico de dados - Técnicas estruturadaspt_BR
dc.subject.odsODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.pt_BR
Appears in Collections:TESE - Ciência da Computação

Files in This Item:
File Description SizeFormat 
ExploraçãoEstratégiasClassificação.pdfTese9.74 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.