Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/25433
ORCID:  http://orcid.org/0000-0002-7002-9664
Document type: Dissertação
Access type: Acesso Aberto
Title: ToGatherUp: um protótipo de ferramenta para a construção de corpora
Alternate title (s): ToGatherUp: a prototype tool for building corpora
Author: Oliveira, Fernando Paulino de
First Advisor: Fromm, Guilherme
First member of the Committee: Silva, Igor
Second member of the Committee: Tagnin, Stella
Third member of the Committee: Novodvorski, Ariel
Summary: Esta pesquisa consiste em verificar o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, desenvolvemos um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serve de base para realizarmos um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizarmos o ToGatherUp e no outro não. A abordagem e a metodologia da Linguística de Corpus, em conjunto com os conceitos da área de Gerenciamento de Projetos, subsidiam a nossa proposta de sistematização do trabalho relativo à construção manual de corpora, a criação das duas versões do CoCLI e, juntamente com as noções da área da Computação, orientam-nos no desenvolvimento do ToGatherUp. O resultado do experimento demonstra uma redução média de 7,47% no ETP em que lançamos mão do ToGatherUp comparado ao ETP em que não utilizamos a ferramenta, o que corrobora a nossa hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.
Abstract: This research verifies the effects of incorporating the ToGatherUp tool on both time and effort for building manually the corpus presented herein: the Corpus of Computing in English (CoCLI). We have developed a set of effort measurement metrics – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The theory and methodology of Corpus Linguistics, together with the concepts from Project Management, subsidized our proposal of systematizing the manual construction of corpora and for creating the two versions of the CoCLI and, along with the notions of the Computing area, guided us in the development of ToGatherUp. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora.
Keywords: Linguística de corpus
Construção manual de corpus
CoCLI
Métricas de medição de esforço
ToGatherUp
Linguística
Língua inglesa - Computação
Corpus Linguistics
Manual construction of corpus
Effort measurement metrics
Area (s) of CNPq: CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Estudos Linguísticos
Quote: OLIVEIRA, Fernando Paulino de. ToGatherUp: um protótipo de ferramenta para a construção de corpora. Orientador: Dr. Guilherme Fromm. 2019. 219 f. Dissertação (Mestrado em Estudos Linguísticos) – Universidade Federal de Uberlândia, Uberlândia, 2019. DOI http://dx.doi.org/10.14393/ufu.di.2019.679.
Document identifier: http://dx.doi.org/10.14393/ufu.di.2019.679
URI: https://repositorio.ufu.br/handle/123456789/25433
Date of defense: 30-May-2019
Appears in Collections:DISSERTAÇÃO - Estudos Linguísticos

Files in This Item:
File Description SizeFormat 
ToGatherUpProtótipoFerramentaDissertação de Fernando Paulino de Oliveira.3.2 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons