Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/12601
Document type: | Dissertação |
Access type: | Acesso Aberto |
Title: | Mineração de padrões temporais híbridos especificados na lógica temporal de intervalos |
Author: | Pereira Junior, Waldecir |
First Advisor: | Amo, Sandra Aparecida de |
First member of the Committee: | Traina Junior, Caetano |
Second member of the Committee: | Guliato, Denise |
Summary: | A descoberta de padrões freqüentes em bancos de dados constitui um importante problema do domínio da descoberta de conhecimentos e sua importância é justificada pela diversidade de áreas onde pode ser empregada, como no varejo, no mercado financeiro, na medicina, na agricultura, na agropecuária, em empresas de telecomunicações, etc. O problema de mineração de padrões freqüentes em bancos de dados temporais, conhecido também como mineração de padrões temporais, tem sido amplamente estudado. Em alguns trabalhos os padrões temporais propostos são especificados por formalismos da Lógica Temporal Proposicional, em outros, eles são mais expressivos, por isso, são especificados por formalismos da Lógica Temporal de Primeira Ordem. Os padrões temporais existentes na literatura representam o tempo em termos de pontos, onde, seus eventos ocorrem em determinados instantes, ou em termos de intervalos, onde, seus eventos ocorrem durante períodos de tempo. Esta distinção faz com que alguns fatos não sejam reconhecidos, como por exemplo fatos relacionados ao histórico clínico de um paciente, onde o paciente tomou determinado medicamento durante um intervalo e sofreu uma determinada cirurgia, em uma certa data, durante o tempo em que estava tomando o medicamento. Nesta dissertação esta sendo proposto um novo padrão temporal, chamado padrão temporal híbrido ou simplesmente pth, que representa o tempo explicitamente em termos de pontos e/ou intervalos. Este padrão é bastante expressivo, por isso, a Lógica Temporal de Intervalos de Allen foi adaptada para especificá-lo. Está sendo proposto também um algoritmo, chamado MILPRIT*, para minerar os pth's freqüentes em bancos de dados temporais com relação a um suporte mínimo e a uma restrição especificada pelo usuário através de uma expressão regular. Isto permite ao usuário um maior controle sobre o processo de mineração. A performance e a escalabilidade do MILPRIT* foi avaliada através de um conjunto de testes em bancos de dados sintéticos e real. |
Abstract: | Discovering frequent patterns in databases is an important problem for knowledge discovery and its importance is justified by the diversity of areas where it can be used, such as retail, financial market, medicine, agriculture, farming, telecommunications, etc. The problem of mining frequent patterns in temporal databases, also know as mining temporal patterns, has been widely studied. In some works the temporal patterns are expressed by propositional temporal logic, and in others, the temporal patterns are more expressive and are expressed by first order temporal logic. The existing temporal patterns in the literature represent the time either in terms of points, where event occur in determined instants, or in terms of intervals, where event occur during a period of time. This dichotomy implies that some facts may not be inferred. For instance, facts related to the clinical history of a patient, where, the patient took some medicine during a period of time and was submitted to a surgery on a day, during the period when he or she was taking the medicine. In this dissertation, we propose a new temporal pattern, called the hybrid temporal pattern or simply htp, where, time is represented in terms of points and/or intervals. This pattern is very expressive. We adapted Allen's Interval Temporal Logic to specify it. We also proposed the algorithm MILPRIT* for mining the frequents htp's in a database with respect to a minimum support and satisfying a constraint specified by user through a regular expression. Doing so, we allow the user to control the process of htp discovery. The performance and scalability of MILPRIT* has been evaluated through a set of experiments over synthetic and real databases. |
Keywords: | Banco de dados Mineração de dados (Computação) Mineração de dados temporais Lógica temporal de intervalos Mineração baseada em restrições e padrões seqüenciais Temporal data mining Interval temporal logic Constraint-based mining and sequential patterns |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Language: | por |
Country: | BR |
Publisher: | Universidade Federal de Uberlândia |
Institution Acronym: | UFU |
Department: | Ciências Exatas e da Terra |
Program: | Programa de Pós-graduação em Ciência da Computação |
Quote: | PEREIRA JUNIOR, Waldecir. Mineração de padrões temporais híbridos especificados na lógica temporal de intervalos. 2007. 142 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2007. |
URI: | https://repositorio.ufu.br/handle/123456789/12601 |
Date of defense: | 30-Nov-2007 |
Appears in Collections: | DISSERTAÇÃO - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
WPJuniorDISPRT.pdf | 1.06 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.