Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/31882
Full metadata record
DC FieldValueLanguage
dc.creatorSoares, Paulo Henrique Maia-
dc.date.accessioned2021-06-07T17:32:22Z-
dc.date.available2021-06-07T17:32:22Z-
dc.date.issued2020-12-03-
dc.identifier.citationSOARES, Paulo Henrique Maia. Aprendizado de ranking de entidades aplicado aos dados do governo brasileiro. 2020. 71 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2020. DOI https://doi.org/10.14393/ufu.di.2021.6003.pt_BR
dc.identifier.urihttps://repositorio.ufu.br/handle/123456789/31882-
dc.description.abstractWith the growth in the amount of information, according to the governmental transparency available in recent years due to legislative requirements, access to information becomes increasingly difficult. Traditional search engines like Google, Yahoo and Bing return as desired information ordered by searching the document before the informed query. The area whose objective is to return relevant documents to the user is known as Information Retrieval which can be aided by machine learning algorithms to improve the ordering of documents, called in this context as Learning to Rank (L2R). There are several algorithms in the literature to solve L2R problems which each one seeks to solve the ranking problem in the best possible way. In the context of government documents, there is a possibility of identifying which are the main entities present in the most relevant documents relevant to a given query. This work aimed obtaining an ordering of the documents available on the Brazilian Government Data Portal using Learning to Rank and extracting information from entities from unstructured, semi-structured and tabular databases, which are common among the sources available on the Portal. To achieve this goal, used state-of-the-art techniques to recognize named entities and convex optimization models to model the L2R. The results obtained proved to be superior to the search engines available on the market (Google, Yahoo and Bing) since these index only the summary of data sets from the Data Portal.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Uberlândiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizado de rankingpt_BR
dc.subjectRecuperação de Informaçãopt_BR
dc.subjectComputaçãopt_BR
dc.subjectAprendizado de máquinapt_BR
dc.titleAprendizado de ranking de entidades aplicado aos dados do governo brasileiropt_BR
dc.title.alternativeEntity learning to rank applied to brazilian government datapt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor1Albertini, Marcelo Keese-
dc.contributor.advisor1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4184508T7&tokenCaptchar=03AGdBq24f13mp-SyjtZylIv4dOnn0eQQtiJhdwSeIhMtkVmKZRTH-_x8yBX2iZ4E8ODz5zo_joX7LDgmlYoa0xHeu6qXHpMx17ESJf1JED__iR1jd5EunHo-TFn9i8-4NqBt9S0x_COtPG104yxHNd7fM4Zb3zGM1SDuD6cX2YsR713hkT7fPsWtNWNXcy3lrzylhx3VIPizzbX_zEIaQy2Eg9nBOw0K39PghGj2Y01G-9aYzbBuMvro8_LtsoTC25jsHUbmmPpp1VB_9xExjxfuJ3jjKGKSclOBxy7jGHSrCf-PfpZoLaYe0LO8EYtR7LqW5cLpVoAyxgSIeiN-ty1pedLzwPhIZh8noh1ZQQqdz85DvHKQHNDfmor0j1jwV3xP1O0yDmWPx4_LZVT3EwdL-LbVEuINw4F-GbsdR-DBQ58Aa0zgjzNa8atj-9b-rEMY3HDckFl0agH0HtWCM-09zQihc9vvv6Qpt_BR
dc.contributor.referee1Rios, Ricardo Araújo-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/0427387583450747pt_BR
dc.contributor.referee2Maia, Marcelo de Almeida-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/4915659948263445pt_BR
dc.creator.Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8939342P0&tokenCaptchar=03AGdBq26yzW12u83kZeDQyN2qJCmvm50pCYL2N4A4rGEcFg3h6Jdb3qI0Wf9RdBaAbJZXf7vhuvGYf6KABWi8hbHJbRNw4gI_wK5uQDPj0CcLoBaUV2_laB4alIswpG0aQZqDWBqahR_LdYmNrZQthGFJbCCpvBjvS7NT1X5JS0gPE8g_L4DRT0sV8VNplpMMUHtsjuXcUjVxot2UNjpQbnDAkUSb0cQQXvOjlz8zbFcWbQyRWwSxsqtVbQNsR0LG8AXEtKn8gwYZbiFhYC8f9FQHivSxUQ8I2kDhcXdunt4BUBEuK_ZApySO32oHN6tB4PsB4X6c67rIoixLnQp0KtpKwdlxw37qjYnTU8xzBb_H9VkibuwMQImhxf1Nw_xGqq7WHgxzRvHZtkiDj0PgjQslykrkdzCJF9Ben5LvmniOaZFWza2pGLibqTikGl5hxmUwgC9BSbLOPF3CJTBrfSWle8FMkF_94Apt_BR
dc.description.degreenameDissertação (Mestrado)pt_BR
dc.description.resumoCom o crescimento da quantidade de informações referente à transparência governamental disponíveis nos últimos anos devido as exigências legislativas, o acesso à informação desejada torna-se cada vez mais difícil. Buscadores tradicionais como Google, Yahoo e Bing retornam os documentos ordenados pela relevância perante a consulta informada. A área cujo objetivo é retornar os documentos relevantes é conhecida como Recuperação de Informação à qual pode ser auxiliada por algoritmos de aprendizado de máquina para melhorar a ordenação dos documentos, denominada nesse contexto como Aprendizado de Ranking. Existem na literatura diversos algoritmos para resolver problemas de Aprendizado de Ranking, onde cada um busca resolver o problema de ordenação com base em diferentes critérios. No contexto de documentos governamentais observa-se a possibilidade de identicar quais são as principais entidades presentes nos documentos mais relevantes retornados em uma determinada consulta. Essa dissertação visou obter uma ordenação dos documentos disponíveis no Porta de Dados do Governo Brasileiro utilizando Aprendizado de Ranking e extrair informação de entidades de bases de dados não-estruturadas, semi-estruturas e tabulares, que são comuns entre as fontes disponibilizadas no Portal. Para atingir tal objetivo recorreu-se às técnicas disponíveis no estado da arte para reconhecimento de entidade nomeadas e utilizou-se das técnicas de otimização convexa para modelar o processo de aprendizado de ranking. Os resultados obtidos demonstraram-se superiores aos buscadores disponíveis no mercado (Google, Yahoo e Bing) visto que esses indexam somente o resumo dos conjuntos de dados do Portal de Dados.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-graduação em Ciência da Computaçãopt_BR
dc.sizeorduration71pt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.identifier.doihttps://doi.org/10.14393/ufu.di.2021.6003pt_BR
dc.orcid.putcode95144418-
dc.crossref.doibatchidc80afe6f-2cd2-4890-bf03-e337f9634027-
dc.subject.autorizadoRecuperação da informaçãopt_BR
dc.subject.autorizadoAprendizado do computadorpt_BR
dc.subject.autorizadoTransparência na administração públicapt_BR
Appears in Collections:DISSERTAÇÃO - Ciência da Computação

Files in This Item:
File Description SizeFormat 
AprendizadoRankingEntidades.pdfDissertação7.86 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.