Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/42067
Full metadata record
DC FieldValueLanguage
dc.creatorAngelo, Danyelle da Silva Oliveira-
dc.date.accessioned2024-08-06T14:00:22Z-
dc.date.available2024-08-06T14:00:22Z-
dc.date.issued2024-05-06-
dc.identifier.citationANGELO, Danyelle da Silva Oliveira. Compressão Gramatical com extração eficiente. 2024. 88 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2024. DOI http://doi.org/10.14393/ufu.di.2024.341.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/42067-
dc.description.abstractWe present a grammar compressor, called GCX (Grammar Compression modulo X), based on the induced suffix sorting grammar compression technique introduced in GCIS. Our method incorporates the text factorization used by algorithm DC3 to create a context-free grammar that produces the input string. We evaluated the performance of our algorithm using different values of covering X, and we introduce a heuristic based on the average longest common prefix between the rules of the grammar to define this coverage. GCX supports very fast extraction on the encoded grammar without the need to complete decompression. Experiments with real and artificial datasets showed that GCX, compared with GCIS, in most cases, is faster to compress, faster to decompress, have worse compression ratio most often; however, it has an extraction speed approximately 100 times larger. Similar behavior is observed when comparing the performance of GCX with that of RePair.pt_BR
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectCompressãopt_BR
dc.subjectExtraçãopt_BR
dc.subjectGramáticapt_BR
dc.subjectEstrutura de dados compactaspt_BR
dc.subjectAlgoritmospt_BR
dc.subjectCompressionpt_BR
dc.subjectExtractionpt_BR
dc.subjectGrammarpt_BR
dc.subjectCompact data structurespt_BR
dc.subjectAlgorithmspt_BR
dc.titleCompressão gramatical com extração eficientept_BR
dc.title.alternativeGrammar compression with efficient extractionpt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor-co1Telles, Guilherme Pimentel-
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/9783560852644016pt_BR
dc.contributor.advisor1Louza, Felipe Alves da-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7042349168112978pt_BR
dc.contributor.referee1Albertini, Marcelo Keese-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/1404596833493304pt_BR
dc.contributor.referee2Badino, Gonzalo Navarro-
dc.contributor.referee2Latteshttps://orcid.org/0000-0002-2286-741Xpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/8268481908738666pt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoApresentamos um compressor, denominado GCX (Grammar Compression modulo X), baseado na técnica de compressão gramatical por ordenação de sufixos induzida, introduzida no GCIS. Nosso método incorpora a fatoração de textos utilizada pelo algoritmo de ordenação de sufixos DC3, para criar uma gramática livre de contexto capaz de produzir o texto de entrada. Nós avaliamos o desempenho do nosso algoritmo utilizando diferentes valores de cobertura X, e introduzimos uma heurística baseada na média do prefixo comum mais longo entre as regras da gramática para definir o valor dessa cobertura. GCX suporta operações de extração rápidas sobre o texto codificado sem a necessidade de descompressão completa. Nossos experimentos foram realizados com conjuntos de dados reais e artificiais e os resultados mostraram que o GCX, em comparação com o GCIS, na maioria dos casos é mais rápido para comprimir, mais rápido para descomprimir, tem uma taxa de compressão pior na maioria das vezes; por outro lado, possui velocidade de extração, aproximadamente 100 vezes mais rápida. Observa-se um comportamento semelhante ao comparar o desempenho do GCX com o do método RePair.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Administraçãopt_BR
dc.sizeorduration88pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::ANALISE DE ALGORITMOS E COMPLEXIDADE DE COMPUTACAOpt_BR
dc.identifier.doihttps://doi.org/10.14393/ufu.di.2024.341pt_BR
dc.orcid.putcode165077705-
dc.crossref.doibatchid84621cd9-4105-4d69-a599-aba51dbbbb22-
dc.subject.autorizadoComputaçãopt_BR
dc.subject.odsODS::ODS 9. Indústria, Inovação e infraestrutura - Construir infraestrutura resiliente, promover a industrialização inclusiva e sustentável, e fomentar a inovação.pt_BR
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
GrammarCompressionEfficient.pdfDissertação11.89 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.