Please use this identifier to cite or link to this item:
https://repositorio.ufu.br/handle/123456789/47470Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.creator | Pereira, Laylla Royer | - |
| dc.date.accessioned | 2025-10-20T17:13:32Z | - |
| dc.date.available | 2025-10-20T17:13:32Z | - |
| dc.date.issued | 2025-10-09 | - |
| dc.identifier.citation | PEREIRA, Laylla Royer. Exploração de sistemas de gerenciamento de banco de dados vetoriais para dados financeiros. 2025. 63 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Universidade Federal de Uberlândia, Uberlândia, 2025. | pt_BR |
| dc.identifier.uri | https://repositorio.ufu.br/handle/123456789/47470 | - |
| dc.description.abstract | This work aimed to demonstrate the feasibility of performing clustering and similarity search of financial data directly within a relational Database Management System (DBMS), expanding upon the working method of a previous study. The working method included the automated collection of NYSE (New York Stock Exchange) stock data, followed by preprocessing to handle missing values, remove duplicates, and normalize attributes. For the analysis, the data were converted into high-dimensional vectors and stored in a PostgreSQL DBMS, using the pgvector extension for native vector manipulation and similarity search tests. In addition, the K-Means algorithm was implemented as a stored procedure within the DBMS itself. The research results demonstrate that it is possible to efficiently perform clustering and similarity searches directly in the DBMS, eliminating the need to export large volumes of data to external environments and leveraging the optimized performance of the pgvector extension. It is concluded that the approach adopted in this thesis provides a robust and scalable solution for the analysis of large financial datasets. | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal de Uberlândia | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.subject | Clusterização | pt_BR |
| dc.subject | K-Means | pt_BR |
| dc.subject | PostgreSQL | pt_BR |
| dc.subject | pgvector | pt_BR |
| dc.subject | Análise Financeira | pt_BR |
| dc.subject | Clustering | pt_BR |
| dc.subject | Financial Analysis | pt_BR |
| dc.title | Exploração de sistemas de gerenciamento de banco de dados vetoriais para dados financeiros | pt_BR |
| dc.title.alternative | Exploration of vector database management systems for financial data | pt_BR |
| dc.type | Trabalho de Conclusão de Curso | pt_BR |
| dc.contributor.advisor1 | Barioni, Maria Camila Nardini | - |
| dc.contributor.advisor1Lattes | : http://lattes.cnpq.br/3785426518998830 | pt_BR |
| dc.contributor.referee1 | Paiva, Elaine Ribeiro de Faria | - |
| dc.contributor.referee1Lattes | : http://lattes.cnpq.br/3785426518998830 | pt_BR |
| dc.contributor.referee2 | Couto, Leandro Nogueira | - |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/9500586005920379 | pt_BR |
| dc.description.degreename | Trabalho de Conclusão de Curso (Graduação) | pt_BR |
| dc.description.resumo | Este trabalho teve como objetivo principal demonstrar a viabilidade de realizar o processo de clusterização e busca por similaridade de dados financeiros diretamente em um Sistema Gerenciador de Banco de Dados (SGBD) relacional, expandindo o método de trabalho de um estudo anterior. O método de trabalho incluiu a coleta automatizada de dados de ações da NYSE (New York Stock Exchange), seguida por um pré-processamento para tratar valores ausentes, remover duplicatas e normalizar os tributos. Para a análise, os dados foram convertidos em vetores e armazenados em um SGBD PostgreSQL, utilizando a extensão pgvector para manipulação nativa desses vetores e testes de busca por similaridade. Além disso, o algoritmo K-Means foi implementado como uma stored procedure no próprio SGBD. Os resultados da pesquisa demonstram que é possível executar eficientemente a clusterização e as buscas por similaridade diretamente no SGBD, eliminando a necessidade de exportar grandes volumes de dados para ambientes externos e aproveitando o desempenho otimizado da extensão pgvector. Conclui-se que a abordagem adotada no trabalho descrito aqui oferece uma solução robusta e escalável para a análise de grandes conjuntos de dados financeiros. | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.course | Ciência da Computação | pt_BR |
| dc.sizeorduration | 63 | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| dc.orcid.putcode | 194750785 | - |
| Appears in Collections: | TCC - Ciência da Computação | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| ExploracaoSistemasGerenciamento.pdf | 1.9 MB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
