Análise e processamento de dados usando Apache Kafka, Spark e Pinot

Oliveira, Ingrid Iplinsky de

Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufu.br/handle/123456789/43211

Tipo de documento:	Trabalho de Conclusão de Curso
Tipo de acceso:	Acesso Aberto
Título:	Análise e processamento de dados usando Apache Kafka, Spark e Pinot
Título (s) alternativo (s):	Data analysis and processing using Apache Kafka, Spark and Pinot
Autor:	Oliveira, Ingrid Iplinsky de
Primer orientador:	Oliveira, Daniele Carvalho
Primer miembro de la banca:	Ribeiro, Thiago Pirola
Segundo miembro de la banca:	Molinos, Diego Nunes
Resumen:	O volume de dados gerados pelos usuários tem crescido de forma exponencial. No entanto, muitas empresas enfrentam desafios na captura e análise dessas informações, o que impacta diretamente na geração de valor para seus negócios. Com isso o presente trabalho de conclusão de curso tem o objetivo de apresentar uma forma de realizar análise de dados no âmbito de Big Data, utilizando os softwares Apache Kafka para consumir os dados e distribuir dentro do ecossistema, o Apache Spark para realizar análises e filtragem dos dados e o Apache Pinot para fazer o armazenamento e possibilitar futuras consultas. E para a análise utilizou-se dados da Application Programming Interface (API) do Twitter disponibilizado na Kaggle, visando a variedade de dados e permitindo analisar tendências. Os resultados obtidos demonstram a viabilidade e eficácia da metodologia proposta. O sistema desenvolvido foi capaz de lidar com a ingestão e processamento de dados, demonstrando a escalabilidade e desempenho das ferramentas Apache Kafka, Apache Spark e Apache Pinot. Além disso, as análises realizadas forneceram insights valiosos sobre os dados do Twitter, destacando a capacidade do sistema em extrair informações relevantes.
Palabras clave:	Big Data Apache Kafka Apache Spark Apache Pinot
Área (s) del CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO::ARQUITETURA DE SISTEMAS DE COMPUTACAO
Idioma:	por
País:	Brasil
Editora:	Universidade Federal de Uberlândia
Cita:	OLIVEIRA, Ingrid Iplinsky de Oliveira. Análise e processamento de dados usando Apache Kafka, Spark e Pinot. 2024. 46 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2024
URI:	https://repositorio.ufu.br/handle/123456789/43211
Fecha de defensa:	24-abr-2024
Aparece en las colecciones:	TCC - Sistemas de Informação (Monte Carmelo)

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
AnáliseProcessamentoDe.pdf		3.19 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons