Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/44268
ORCID: | http://orcid.org/0009-0007-7911-0868 |
Document type: | Trabalho de Conclusão de Curso |
Access type: | Acesso Aberto |
Title: | Modelos de preenchimento de falhas de dados pluviométricos diários usando aprendizado de máquina. |
Author: | Rios, Pedro Augusto Toledo |
First Advisor: | Pereira, Carlos Eugênio |
First coorientator: | Miani, Rodrigo Sanches |
First member of the Committee: | Pereira, Carlos Eugênio |
Second member of the Committee: | Miani, Rodrigo Sanches |
Third member of the Committee: | Sanches, Rafael Greco |
Summary: | A reconstrução de séries temporais pluviométricas incompletas é crucial tanto para a Climatologia e Hidrologia, quanto para a Engenharia Civil. A qualidade e integralidade desses dados impactam diretamente a acurácia de previsões meteorológicas e investigações hidrológicas, bem como o dimensionamento adequado de infraestruturas hídricas, como reservatórios, barragens e sistemas de drenagem urbana, cuja precisão depende da confiabilidade dos dados pluviométricos. Neste trabalho, investiga-se a aplicação de modelos de aprendizado de máquina, como KNN Imputer e Iterative Imputer, para a imputação de dados pluviométricos faltantes, comparando-os com métodos tradicionais, utilizando dados que abrangem o período de 2002 a 2019, coletados na estação de Itirapina-CRHEA, e o intervalo de 1979 a 2023, fornecidos pelo Instituto Nacional de Meteorologia (INMET) de São Carlos. Para tanto, foram empregadas três abordagens distintas: uma análise global, considerando a totalidade do conjunto de dados, e análises separadas para os períodos chuvoso e seco, a fim de avaliar o desempenho dos métodos sob diferentes regimes sazonais, para validar os modelos, retirou-se porcentagens dos dados (2,5%, 5,0%, 7,5% e 10,0%), simulando falhas, e os valores imputados foram comparados aos originais, além de ser realizada uma comparação detalhada entre os modelos de aprendizado de máquina e técnicas tradicionais. Os resultados demonstram que os modelos de aprendizado de máquina apresentaram desempenho superior aos métodos convencionais em termos de precisão e manutenção da consistência dos dados, mostrando-se eficazes na melhoria da qualidade dos dados e no aumento da confiabilidade das previsões, e evidenciando seu potencial para aplicação em estudos climáticos mais amplos. Para pesquisas futuras, sugere-se a aplicação dos métodos em diferentes regiões geográficas, biomas e regimes climáticos, o que permitirá a avaliação da adaptabilidade e eficiência dos métodos propostos em diversos contextos, contribuindo para a gestão de recursos hídricos e o planejamento climático de longo prazo no Brasil. |
Abstract: | The reconstruction of incomplete rainfall time series is crucial for both Climatology/Hydrology and Civil Engineering. Data quality and integrity directly impact the accuracy of weather forecasts and hydrological investigations, as well as the proper design of water infrastructure such as reservoirs, dams, and urban drainage systems, whose precision relies on the reliability of rainfall data. This study investigates the application of machine learning models, namely KNN Imputer and Iterative Imputer, for imputing missing rainfall data, comparing them to traditional methods. Datasets covering the periods from 2002 to 2019 (collected at the Itirapina-CRHEA station) and 1979 to 2023 (provided by the Brazilian National Institute of Meteorology (INMET) in São Carlos) were used. Three distinct approaches were employed: a global analysis considering the entire dataset, and separate analyses for the wet and dry seasons to evaluate the methods' performance under different seasonal regimes. To validate the models, percentages of the data (2.5%, 5.0%, 7.5%, and 10.0%) were removed, simulating missing values, and the imputed values were compared to the originals. A detailed comparison between the machine learning models and traditional techniques was also performed. The results demonstrate that the machine learning models outperformed conventional methods in terms of accuracy and maintaining data consistency, proving effective in improving data quality and increasing the reliability of predictions, and highlighting their potential for application in broader climate studies. For future research, the application of these methods in different geographical regions, biomes, and climate regimes is suggested, which will allow for the evaluation of the adaptability and efficiency of the proposed methods in diverse contexts, contributing to water resource management and long-term climate planning in Brazil. |
Keywords: | Séries Temporais Pluviométricas; Imputação de Dados; Aprendizado de Máquina; KNN Imputer; Iterative Imputer; Engenharia Civil; Recursos Hídricos; Climatologia; Hidrologia. Rainfall Time Series; Data Imputation; Machine Learning; KNN Imputer; Iterative Imputer; Civil Engineering; Water Resources; Climatology; Hydrology. |
Area (s) of CNPq: | CNPQ::ENGENHARIAS CNPQ::CIENCIAS EXATAS E DA TERRA |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Uberlândia |
Quote: | RIOS, Pedro Augusto Toledo. Modelos de preenchimento de falhas de dados pluviométricos diários usando aprendizado de máquina. Trabalho de Conclusão de Curso (Graduação em Engenharia Civil) - Universidade Federal de Uberlândia, Uberlândia, 2024. |
URI: | https://repositorio.ufu.br/handle/123456789/44268 |
Date of defense: | 22-Nov-2024 |
Appears in Collections: | TCC - Engenharia Civil |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Modelosdepreenchimentofalhas.pdf | 7.2 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.