Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/12603
Full metadata record
DC FieldValueLanguage
dc.creatorSilva, Nyara de Araújo-
dc.date.accessioned2016-06-22T18:32:36Z-
dc.date.available2008-04-10-
dc.date.available2016-06-22T18:32:36Z-
dc.date.issued2007-10-22-
dc.identifier.citationSILVA, Nyara de Araújo. CobMiner: mineração de Padrões Arborescentes com restrições. 2007. 88 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2007.por
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/12603-
dc.description.abstractMost work on pattern mining focus on simple data structures like itemsets or sequences of itemsets. However, a lot of recent applications dealing with complex data like chemical compounds, protein structure, social network, XML and Web Log databases, require much more sophisticated data structures (trees or graphs) for their specification. Here, interesting patterns involve not only frequent object values (labels) appearing in the trees (or graphs) but also frequent specific topologies found in these structures. Mining frequent tree patterns have been extensively studied, motivated by the increasing interest and applicability in different areas (Web Mining, Bioinformatics, etc). However, conventional tree mining systems normally consider only minimum support criterium as a mechanism for filtering patterns to be mined. After mining process, hard work is requiring to filter patterns concerned with user interests. In this dissertation, we propose CobMiner, Constrained-based Miner, a tree pattern mining algorithm which incorporates tree automata into the mining process in order to restrict the mining scope and to generate frequent patterns more closely related to user interests. We compare two methods for introducing user constraints into the discovery process: the first one is CobMiner which incorporates tree automata constraints as an intra-mining mechanism, the second one is TreeMinerPP which consists of a well-known tree pattern mining algorithm, TreeMiner, followed by a post-processing phase, where patterns are filtered using a tree automatum. An extensive set of experiments executed over synthetic and real data (XML documents) allow us to conclude that incorporating constraints during the mining process is far better effective than filtering the frequent and interesting patterns after the mining process.eng
dc.formatapplication/pdfpor
dc.languageporpor
dc.publisherUniversidade Federal de Uberlândiapor
dc.rightsAcesso Abertopor
dc.subjectDescoberta de Padrões Freqüentespor
dc.subjectMineração de Padrões Arborescentespor
dc.subjectAutômato de Árvorepor
dc.subjectMineração de Dados com Restriçõespor
dc.subjectMineração de Documentos XMLpor
dc.subjectMineração na Webpor
dc.subjectFrequent Pattern Descoveryeng
dc.subjectTree Pattern Miningeng
dc.subjectTree Automataeng
dc.subjectConstraint-based Data Miningeng
dc.subjectXML Miningeng
dc.subjectWeb Miningeng
dc.subjectMineração de dados (Computação)por
dc.titleCobMiner: mineração de Padrões Arborescentes com restriçõespor
dc.typeDissertaçãopor
dc.contributor.advisor1Amo, Sandra Aparecida de-
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4791545U6por
dc.contributor.referee1Meira Junior, Wagner-
dc.contributor.referee1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798498T5por
dc.contributor.referee2Silva, Ilmério Reis da-
dc.contributor.referee2Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4760865T7por
dc.creator.Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4127504U3por
dc.description.degreenameMestre em Ciência da Computaçãopor
dc.description.resumoHá muito trabalho em mineração de padrões com foco em estruturas de dados simples como itemsets ou seqüência de itemsets. Entretanto, recentes aplicações utilizam dados mais complexos como componentes químicos, estruturas proteicas, rede social, XML e logs da Web, exigindo estruturas de dados mais sofisticadas (árvores ou grafos) para serem especificadas. Aqui, padrões de interesse não envolvem apenas valores de objetos frequentes labels que aparecem em árvores (ou grafos), mas também topologias específicas frequentes encontradas nessas estruturas. A mineração de padrões de árvores frequentes tem sido bastante estudada, com a motivação do crescente interesse e aplicabilidade em diferentes áreas (Web Mining, Bioinformática, etc.). Porém, os sistemas convencionais de mineração de árvores permitiam ao usuário apenas definir o suporte mínimo como mecanismo de filtro dos padrões a serem minerados. Após o processo de mineração, um árduo trabalho é necessário para filtrar os padrões de interesse dos usuários. Nessa dissertação, propomos o algoritmo CobMiner, Constrained-based Miner, um algoritmo de mineração de padrões arborescentes, incorporando ao processo de mineração os Autômatos de Árvores, como mecanismo para restringir o escopo da mineração e produzir padrões frequentes mais próximos do real interesse dos usuários. Comparamos dois métodos de inclusão das restrições do usuário dentro do processo de descoberta: o primeiro é o CobMiner que incorpora o autômato de árvore dentro do mecanismo de mineração, o segundo é o TreeMinerPP que consiste do conhecido algoritmo de mineração de árvores, TreeMiner, seguido de uma fase de pós-processamento, onde os padrões são filtrados pelo autômato de árvore. Um grande conjunto de testes foi executado em dados sintéticos e reais (documentos XML), o que nos permite concluir que utilizar as restrições durante a mineração é muito mais eficiente do que filtrar os padrões frequentes após o processo de mineração.por
dc.publisher.countryBRpor
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopor
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.publisher.departmentCiências Exatas e da Terrapor
dc.publisher.initialsUFUpor
dc.orcid.putcode81753118-
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
CobMinerMineracaoPadroes.pdf882.88 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.