Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/18309
Full metadata record
DC FieldValueLanguage
dc.creatorLima, Mateus Curcino de-
dc.date.accessioned2017-04-04T18:28:13Z-
dc.date.available2017-04-04T18:28:13Z-
dc.date.issued2017-01-23-
dc.identifier.citationLIMA, Mateus Curcino de. Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão. 2017. 90 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2017.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/18309-
dc.description.abstractThe curse of dimensionality turns the high-dimensional data analysis a challenging task for data clustering techniques. Recent works have efficiently employed an aspect inherent to high-dimensional data in the proposal of clustering approaches guided by hubs which provide information about the distribution of the data instances among the K-nearest neighbors. Though, hubs can not well reflect the implicit semantics of the data, leading to an unsuitable data partition. In order to cope with both issues (i.e., high-dimensional data and meaningful clusters), this dissertation presents a clustering approach that explores the combination of two strategies: semi-supervision and density estimation based on hubness scores. The experimental results conducted with 23 real datasets show that the proposed approach has a good performance when applied on datasets with different characteristics.pt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológicopt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectComputaçãopt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectBanco de dadospt_BR
dc.subjectAgrupamento semi-supervisionadopt_BR
dc.subjectAnálise de dados em alta dimensãopt_BR
dc.subjectHubnesspt_BR
dc.subjectData miningpt_BR
dc.subjectHigh-dimensional data analysispt_BR
dc.subjectHubnesspt_BR
dc.subjectSemi-supervised clusteringpt_BR
dc.titleCombinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensãopt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Barioni, Maria Camila Nardini-
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4770458D2pt_BR
dc.contributor.referee1Faria, Elaine Ribeiro de-
dc.contributor.referee1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4127008H7pt_BR
dc.contributor.referee2Ribeiro, Marcela Xavier-
dc.contributor.referee2Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766919E1pt_BR
dc.creator.Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4332933P2pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoA chamada maldição da dimensionalidade faz com que a análise de dados em alta dimensão seja uma tarefa desafiadora para técnicas de agrupamento de dados. Para tratar desta questão, trabalhos recentes têm empregado de forma eficiente um aspecto inerente de dados de alta dimensão na realização de processos de agrupamentos de dados. Esse aspecto, denominado hubness, consiste na tendência de algumas instâncias de dados, chamadas hubs, ocorrerem com maior frequência nas listas dos K-vizinhos mais próximos de outras instâncias. Contudo, os hubs podem não refletir a semântica implícita dos dados, levando a uma partição de dados inadequada. Esta dissertação apresenta uma abordagem de agrupamento que explora a combinação de duas estratégias: semi-supervisão e estimativa de densidade baseada em pontuações hubness. Os resultados dos experimentos realizados com 23 conjuntos de dados reais mostram que a abordagem proposta tem um desempenho superior quando aplicada em conjuntos de dados com características diferentes.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration90pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.identifier.doiufu.http://dx.doi.org/10.14393/ufu.di.2017.113-
dc.orcid.putcode81753101-
dc.crossref.doibatchidcfc6af78-95df-434f-8cba-ff3aa9588d23-
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
CombinandoSemiSupervisao.pdfDissertação5.32 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.