Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/35084
ORCID:  http://orcid.org/0000-0002-3654-7839
Tipo de documento: Dissertação
Tipo de acceso: Acesso Aberto
Título: Extração e seleção de características para a classificação eficiente de séries temporais
Título (s) alternativo (s): Feature extraction and selection for efficient time series classification
Autor: Freitas Júnior, Márcio Antônio
Primer orientador: Albertini, Marcelo Keese
Primer miembro de la banca: Backes, André Ricardo
Segundo miembro de la banca: Rios, Ricardo Araújo
Resumen: Com o aumento da produção de séries temporais, houve também o aumento da necessidade de minerá-las. Uma das tarefas de mineração que mais ganhou destaque nos últimos anos foi a classificação de séries temporais. Essa tarefa recebeu muitas publicações e soluções que focaram principalmente na acurácia das classificações. Isso levou a um estado da arte especializado em resultados de alta acurácia, mas também com um alto tempo de processamento. Essa particularidade inviabiliza o uso das soluções em problemas reais de maior escala. Com o objetivo de obter resultados tão acurados quanto rápidos, este trabalho propõe o 4T que é um algoritmo de extração e seleção de características baseado em dicionário com foco na eficiência da classificação de séries temporais. A eficiência, proposta nesta dissertação como uma métrica de avaliação, foi definida como a razão entre o score e o tempo de treinamento de uma classificação. Os resultados obtidos pelo 4T mostram uma eficiência média maior que a eficiência dos resultados disponíveis de todo o estado da arte. Esses resultados incluem os scores de acurácia e AUROC e o tempo de treinamento na classificação de 71 datasets do repositório UEA & UCR.
Abstract: As the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive.
Palabras clave: 4T
Baseado em dicionário
Dictionary-based
Classificação eficiente
Efficient classification
Eficiência
Efficiency
Séries temporais
Time Series
TSC
Computação
Computing
Área (s) del CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Tema: Computação
Análise de séries temporais
Algorítmos computacionais
Idioma: por
País: Brasil
Editora: Universidade Federal de Uberlândia
Programa: Programa de Pós-graduação em Ciência da Computação
Cita: FREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53.
Identificador del documento: https://doi.org/10.14393/ufu.di.2022.53
URI: https://repositorio.ufu.br/handle/123456789/35084
Fecha de defensa: 24-ene-2022
Aparece en las colecciones:DISSERTAÇÃO - Ciência da Computação

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
ExtracaoSelecaoCaracteristicas.pdfDissertação1.38 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons