Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/18315
Document type: Dissertação
Access type: Acesso Aberto
Title: O Corpus of English Language Videos: uma nova ferramenta de corpus on-line para aprendizagem direcionada por dados
Author: Peixoto, Lucas Maciel
First Advisor: Fromm, Guilherme
First member of the Committee: Novodvorski, Ariel
Second member of the Committee: Dutra, Deise Prina
Summary: O tema central deste trabalho é o uso de corpora no ensino-aprendizagem de língua inglesa, e seu objetivo principal foi a concepção e desenvolvimento do Corpus ofEnglish Language Videos (CELV), juntamente com uma ferramenta on-line para consultas a esse corpus, que inclui, entre outras funções, a geração de linhas de concordância. O principal embasamento teórico para o desenvolvimento e aplicação do corpus e de sua ferramenta de consulta foi a Aprendizagem Direcionada por Dados, uma abordagem ao ensino- aprendizagem de línguas que propõe o papel do aluno como investigador da língua por meio da observação empírica de dados linguísticos contidos em um corpus, com auxílio do professor e do concordanciador e passando por um processo cognitivo indutivo de aprendizagem. O principal embasamento metodológico para a realização do trabalho foi a Linguística de Corpus, a área da Linguística dedicada à compilação e análise de amostras de língua em formato eletrônico por meio de computadores, e também a Linguística Computacional, a área da Linguística destinada à criação e uso de ferramentas computacionais para o processamento de línguas. Foi compilado um corpus a partir de legendas de vídeos do site YouTube, e foi desenvolvido e publicado na internet um sistema computacional de busca a esse corpus, para uso de pesquisadores, professores e alunos interessados no ensino-aprendizagem de inglês. O corpus possui tamanho e variedade linguística suficientes para ser usado como fonte de exemplos de língua inglesa em uso, e sua ferramenta de consulta permite não só a observação de linhas de concordância de forma escrita, mas, também, o acesso aos vídeos originais que compõem a amostra, possibilitando que o usuário assista e ouça as palavras e expressões pesquisadas no corpus em forma audiovisual. A principal fonte de inspiração para a compilação do corpus e desenvolvimento da ferramenta foi o Corpus of Contemporary American English (COCA). A página do CELV na internet possui uma interface de pesquisa simples e de fácil uso, buscando ajudar a promover a difusão das técnicas da Linguística de Corpus para que mais pesquisadores, professores e alunos possam tirar proveito das vantagens do uso de corpora em suas pesquisas, atividades de ensino e de aprendizagem. Após a conclusão do desenvolvimento do corpus e da ferramenta, ambos foram testados com professores de inglês, e foram levantadas as opiniões desses participantes da pesquisa sobre a utilidade do CELV em suas atividades de ensino, recebendo, de maneira geral, avaliações positivas. Ainda, foram feitas sugestões sobre tópicos em língua inglesa cuja aprendizagem pode ser enriquecida com uso desta ferramenta. Espera-se que o produto deste trabalho possa vir a contribuir com o ensino- aprendizagem de inglês e com a literatura sobre as aplicações de corpora nesse contexto.
Abstract: The main topic of this research is the use of corpora in the teaching and learning of the English language, and its main objective was the conception and development of the Corpus of English Language Videos (CELV), along with an on-line tool for queries in this corpus, which includes, among other functions, the generation of concordance lines. The main theoretical basis for the development and application of the corpus and its query tool was Data-Driven Learning, an approach to the teaching and learning of languages which proposes that the role of the student is that of a language investigator who conducts empiric observation of the linguistic data contained in a corpus, aided by the teacher and the concordancer and following an inductive cognitive process for learning. The main methodological basis for the implementation of the project was Corpus Linguistics, the field in Linguistics dedicated to the compilation and analysis of language samples in electronic format using computers, and Computational Linguistics, the field in Linguistics aimed at the creation and use of computer tools for the processing of languages. A corpus was compiled using YouTube video subtitles, and a computer system for searches in this corpus was developed and published on the internet, to be used by researchers, professors and students interested in the teaching and learning of English. The corpus has enough size and linguistic variation to be used as a source for examples of English language in use, and its query tool enables not only the observation of concordance lines in written form, but also the access to the original videos which compose the sample, allowing the user to watch and listen to the words and expressions searched in the corpus in audiovisual format. The main source of inspiration for the compilation of the corpus and development of the tool was the Corpus of Contemporary American English (COCA). The CELV website has a simple and easy-to-use search interface, aiming to help promote the spread of Corpus Linguistics techniques so that more researchers, professors and students may benefit from the advantages of using corpora in their researches, teaching and learning activities. After the conclusion of the development of the corpus and the tool, both were tested with English teachers, and the opinions of these participants of the research about the usefulness of CELV in their teaching activities were raised, receiving, in general, positive feedback. Additionally, suggestions about topics of the English language whose learning can be enriched by using this tool were made. It is expected that the product of this research may contribute with the teaching and learning of English and with the literature about the applications of corpora in this context.
Keywords: Linguística
Linguística de corpus
Língua inglesa - Ensino auxiliado por computador
Língua inglesa - Estudo e ensino - Inovações tecnológicas
Aprendizagem Direcionada por Dados
Corpora on-line
Corpus Linguistics
Data-Driven Learning
On-line corpora
Area (s) of CNPq: CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA
Language: por
Country: Brasil
Publisher: Universidade Federal de Uberlândia
Program: Programa de Pós-graduação em Estudos Linguísticos
Quote: PEIXOTO, Lucas Maciel. O Corpus of English Language Videos: uma nova ferramenta de corpus on-line para aprendizagem direcionada por dados. 2016. 114 f. Dissertação (Mestrado em Estudos Linguísticos) - Universidade Federal de Uberlândia, Uberlândia, 2016. DOI http://doi.org/10.14393/ufu.di.2016.403
Document identifier: http://doi.org/10.14393/ufu.di.2016.403
URI: https://repositorio.ufu.br/handle/123456789/18315
Date of defense: 14-Jul-2016
Appears in Collections:DISSERTAÇÃO - Estudos Linguísticos

Files in This Item:
File Description SizeFormat 
CorpusEnglishLanguage.pdfDissertação24.42 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.