Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/41170
Full metadata record
DC FieldValueLanguage
dc.creatorRosa, Frederico Rezende-
dc.date.accessioned2024-02-15T18:28:34Z-
dc.date.available2024-02-15T18:28:34Z-
dc.date.issued2024-01-19-
dc.identifier.citationROSA, Frederico Rezende. Compact data structures for the Metric Suffix Array. 2024. 54 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2024. DOI 10.14393/ufu.di.2023.656.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/41170-
dc.description.abstractA busca por similaridade aproximada tem sido usada em diversas disciplinas, como reconhecimento de padrões e aprendizado de máquina, e em aplicações como buscas de imagens, strings e genoma. Geralmente, essas atividades lidam com um grande volume de dados de alta dimensão, sendo relevantes tanto o tempo de execução das buscas quanto o tamanho da memória alocada pela estrutura de dados que responde a essas buscas. A busca por similaridade aproximada é realizada por meio de elementos de referência, que estabelecem um compromisso entre o nível de precisão das buscas e o tempo necessário e memória alocada. Utilizando esta técnica, propomos uma estrutura que opera busca por similaridade aproximada com uma estrutura de dados compacta que ainda apresenta um custo linear para construção e busca, e que não se limita a dados de 32 bits. Realizado os experimentos, conseguimos obter um método que requer menos memória, atingindo 1/3 da mémoria requerida pelo método MSA, ao custo de um aumento no tempo de construção e busca, demandando até 2,7 e 3,5 o tempo do MSA respectivamente no melhor caso.pt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectBusca por similaridadept_BR
dc.subjectSimilarity searchingpt_BR
dc.subjectEstrutura de dados compactapt_BR
dc.subjectCompact data structurespt_BR
dc.subjectVetor de sufixos métricopt_BR
dc.subjectMetric Suffix Arraypt_BR
dc.titleCompact data structures for the metric suffix arraypt_BR
dc.title.alternativeEstruturas de dados compactas para o vetor de sufixos métricopt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor-co1Louza, Felipe Alves da-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/7042349168112978pt_BR
dc.contributor.advisor1Razente, Humberto Luiz-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4700164571979002pt_BR
dc.contributor.referee1Travençolo, Bruno Augusto Nassif-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/2590427557264952pt_BR
dc.contributor.referee2Moreira, Mayron César de Oliveira-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/0935496725221542pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/0326521645259486pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoApproximate similarity searching has been used in several disciplines such as pattern recognition and machine learning, and applications such as image, strings and genome searches. Generally, these activities deal with a large volume of high-dimensional data, with both the execution time of the searches and the size of the memory allocated by the data structure that responds to these searches being relevant. The approximate similarity searching is carried out using reference elements, which establish a compromise between the level of precision of the searches and the time required and allocated memory. Using this technique, we propose a structure that operates approximate similarity searching with a compact data structure that still presents a linear cost for construction and search, and that is not limited to 32-bit data. With the experiments executed, we managed to obtain a method that requires less memory, achieving 1/3 of the memory required for the MSA, at the cost of an increase in construction and search time, demanding 2.7 and 3.5 the time required for the MSA respectively in the best case.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration54pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.identifier.doihttp://doi.org/10.14393/ufu.di.2023.656pt_BR
dc.orcid.putcode153320362-
dc.crossref.doibatchid1f4b89c3-a107-46d7-b108-e3e41901ffa7-
dc.subject.autorizadoComputaçãopt_BR
dc.subject.odsODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.pt_BR
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
EstruturasDadosCompactas.pdfDissertação2.56 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons