Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/36237
ORCID: | http://orcid.org/0000-0002-3797-1260 |
Document type: | Tese |
Access type: | Acesso Aberto |
Title: | Mineração de soluções relevantes para tarefas de programação a partir de resultados de mecanismos de busca |
Alternate title (s): | Mining relevant solutions for programming tasks from search engine results |
Author: | Rocha, Adriano Mendonça |
First Advisor: | Maia, Marcelo de Almeida |
First member of the Committee: | Figueiredo, Eduardo |
Second member of the Committee: | Kulesza, Uirá |
Third member of the Committee: | Dorça, Fabiano Azevedo |
Fourth member of the Committee: | Silva, Flávio de Oliveira |
Summary: | O desenvolvimento de software é uma atividade intensiva em conhecimento. Documentações oficiais para desenvolvedores podem não ser suficientes para todas as suas necessidades. A busca de informações na Web é uma prática usual, mas encontrar informações realmente úteis pode ser um desafio, pois nem sempre as melhores soluções estão entre as primeiras páginas ranqueadas. Assim, os desenvolvedores têm que ler e descartar páginas irrelevantes, ou seja, páginas que não possuem exemplos de código ou que possuem conteúdo não focado na solução desejada. Este trabalho tem como objetivo entender como a qualidade do ranking retornado por mecanismos de busca pode influenciar o desempenho de desenvolvedores durante a resolução de tarefas de programação, e propor uma abordagem para minerar soluções relevantes para tarefas de programação a partir de resultados de buscas. Em uma análise preliminar, avaliamos as 20 principais páginas retornadas pelo mecanismo de pesquisa do Google, para 10 consultas diferentes, e observamos que apenas 31% das páginas avaliadas são relevantes para desenvolvedores. Diante disso, realizamos um primeiro estudo com desenvolvedores que mostrou que estes gastaram menos tempo durante a resolução de tarefas de programação, ao utilizarem um ranking de qualidade superior (em média, os desenvolvedores gastaram por volta de 4 minutos a mais, durante a resolução das tarefas, ao utilizarem um ranking de qualidade inferior). Em um segundo estudo, propusemos e avaliamos três abordagens diferentes para minerar páginas relevantes retornadas pelo mecanismo de busca. Os filtros propostos se mostraram eficazes na remoção de páginas irrelevantes, e desta forma, melhoraram a qualidade do ranking. Concluímos que desenvolvedores podem se beneficiar desses filtros, de maneira a aumentar sua produtividade durante realizações de tarefas de programação. |
Abstract: | Software development is a knowledge-intensive activity. Official documentation for developers may not be sufficient for all developer needs. Searching for information on the web is a usual practice, but finding really useful information may be challenging, because the best solutions are not always among the first ranked pages. So, developers have to read and discard irrelevant pages, that is, pages that do not have code examples or that have content not focused on the desired solution. This work aims to understand how the ranking quality returned by search engines can influence the performance of developers when solving programming tasks, and to propose an approach to mine relevant solutions for programming tasks from search engines results. In a preliminary analysis, we evaluated the top 20 pages returned by Google’s search engine, for 10 different queries, and observed that only 31% of the pages evaluated are relevant to developers. Therefore, we carried out a first study with developers that showed that they spent less time solving programming tasks, when using a higher quality ranking (on average, developers spent around 4 minutes more during solving tasks, when using a lower quality ranking). In a second study, we proposed and evaluated three different approaches to mine relevant pages returned by the search engine. The Google search engine that was used as a baseline returns a fair number of pages that are irrelevant to developers. The filters we propose are effective in removing irrelevant pages, in this way, a better quality ranking is generated. Developers can benefit from these filters in order to increase their productivity while performing programming tasks. |
Keywords: | Tarefas de Programação Programming Tasks Mineração de Soluções Relevantes Mining Relevant Solutions Motores de Busca Search Engines |
Area (s) of CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Subject: | Computação Engenharia de sistemas Ferramentas de busca na Web Programadores de computador |
Language: | eng |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Program: | Programa de Pós-graduação em Ciência da Computação |
Quote: | ROCHA, Adriano Mendonça. Mineração de soluções relevantes para tarefas de programação a partir de resultados de mecanismos de busca. 2022. 91 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI https://doi.org/10.14393/ufu.te.2022.565. |
Document identifier: | https://doi.org/10.14393/ufu.te.2022.565 |
URI: | https://repositorio.ufu.br/handle/123456789/36237 |
Date of defense: | 29-Sep-2022 |
Appears in Collections: | TESE - Ciência da Computação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MineracaoSolucoesRelevantes.pdf | Tese | 3.43 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License