Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/35084
ORCID: | http://orcid.org/0000-0002-3654-7839 |
Document type: | Dissertação |
Access type: | Acesso Aberto |
Title: | Extração e seleção de características para a classificação eficiente de séries temporais |
Alternate title (s): | Feature extraction and selection for efficient time series classification |
Author: | Freitas Júnior, Márcio Antônio |
First Advisor: | Albertini, Marcelo Keese |
First member of the Committee: | Backes, André Ricardo |
Second member of the Committee: | Rios, Ricardo Araújo |
Summary: | Com o aumento da produção de séries temporais, houve também o aumento da necessidade de minerá-las. Uma das tarefas de mineração que mais ganhou destaque nos últimos anos foi a classificação de séries temporais. Essa tarefa recebeu muitas publicações e soluções que focaram principalmente na acurácia das classificações. Isso levou a um estado da arte especializado em resultados de alta acurácia, mas também com um alto tempo de processamento. Essa particularidade inviabiliza o uso das soluções em problemas reais de maior escala. Com o objetivo de obter resultados tão acurados quanto rápidos, este trabalho propõe o 4T que é um algoritmo de extração e seleção de características baseado em dicionário com foco na eficiência da classificação de séries temporais. A eficiência, proposta nesta dissertação como uma métrica de avaliação, foi definida como a razão entre o score e o tempo de treinamento de uma classificação. Os resultados obtidos pelo 4T mostram uma eficiência média maior que a eficiência dos resultados disponíveis de todo o estado da arte. Esses resultados incluem os scores de acurácia e AUROC e o tempo de treinamento na classificação de 71 datasets do repositório UEA & UCR. |
Abstract: | As the production of time series increases, so does the need to mine them. Currently one of the most prominent mining tasks has been the time series classification. This task received many publications and solutions mainly focused on classification accuracy. This led to a state of the art specialized in high accuracy results, but also with a high processing time. This characteristic makes the solution usability infeasible for large scale problems. Aiming to obtain both accurate and fast results, this work proposes 4T. It is a dictionary-based algorithm of feature extraction and selection focused on the efficiency of time series classification. The efficiency was proposed in this dissertation as an evaluation metric and was defined as the fraction between score and fitting time of a classification. The results obtained by 4T show an average efficiency higher than the efficiency of the available state-of-the-art results. These results include two scores: accuracy and AUROC. Along with fitting time the scores were calculated by classifying 71 datasets of the UEA & UCR archive. |
Keywords: | 4T Baseado em dicionário Dictionary-based Classificação eficiente Efficient classification Eficiência Efficiency Séries temporais Time Series TSC Computação Computing |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
Subject: | Computação Análise de séries temporais Algorítmos computacionais |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Program: | Programa de Pós-graduação em Ciência da Computação |
Quote: | FREITAS JÚNIOR, Márcio Antônio. Extração e seleção de características para a classificação eficiente de séries temporais. 2022. 72 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.53. |
Document identifier: | https://doi.org/10.14393/ufu.di.2022.53 |
URI: | https://repositorio.ufu.br/handle/123456789/35084 |
Date of defense: | 24-Jan-2022 |
Appears in Collections: | DISSERTAÇÃO - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ExtracaoSelecaoCaracteristicas.pdf | Dissertação | 1.38 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License