Análise comparativa de algoritmos de escalonamento de workflows científicos em processadores heterogêneos

Monteiro, Matheus Costa

Please use this identifier to cite or link to this item: https://repositorio.ufu.br/handle/123456789/47466

Full metadata record

DC Field	Value	Language
dc.creator	Monteiro, Matheus Costa	-
dc.date.accessioned	2025-10-20T15:01:15Z	-
dc.date.available	2025-10-20T15:01:15Z	-
dc.date.issued	2025-09-23	-
dc.identifier.citation	MONTEIRO, Matheus Costa. Análise comparativa de algoritmos de escalonamento de workflows científicos em processadores heterogêneos. 2025. 140f . Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Universidade Federal de Uberlândia, Uberlândia, 2025.	pt_BR
dc.identifier.uri	https://repositorio.ufu.br/handle/123456789/47466	-
dc.description.abstract	In high-performance computing (HPC), scheduling algorithms are decisive to translate hardware into performance, cost efficiency, and energy efficiency—an especially critical concern for modern workloads such as machine learning training. Unlike homogeneous settings (identical nodes), heterogeneous CPU/GPU clusters vary in compute and communication capabilities; thus, task mapping and ordering policies become central to minimizing queues, latency, and idleness, thereby reducing runtime, energy, and the CO2 footprint. This work compares six classic list scheduling heuristics—DLS, HEFT, HEFT-LA, PEFT, IHEFT, and IPEFT—within a fully reproducible simulated pipeline that standardizes I/O interfaces, DAG generation, and metric computation to isolate decision-logic effects. We evaluate large workflow-derived instances (256–4096 tasks) on sets of 8, 16, and 32 machines, measuring makespan, load balance, waiting time, and energy. Results indicate that look-ahead heuristics (PEFT, IPEFT, HEFT-LA) consistently reduce makespan and waiting time in communication-dominated scenarios; PEFT and IPEFT preserve 𝑂(𝑉 2𝑃) time complexity, whereas HEFT-LA incurs higher asymptotic cost. Under low communication, HEFT remains competitive. IHEFT and IPEFT mitigate scheduling gaps and raise utilization. We observe an energy–performance tradeoff: curbing idleness often lowers total energy even with a slight rise in average power. Additionally, DLS achieves speedups as machine count grows by exploiting computebound parallelism, while predictive heuristics become more sensitive to communication bottlenecks. We release paper-faithful implementations, a seeded case generator, and a comparison pipeline to support future studies in heterogeneous environments.	pt_BR
dc.description.sponsorship	Pesquisa sem auxílio de agências de fomento	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Uberlândia	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by-sa/3.0/us/	*
dc.subject	Computação de Alto Desempenho	pt_BR
dc.subject	Escalonamento de tarefas	pt_BR
dc.subject	DAG	pt_BR
dc.subject	Modelos de ML	pt_BR
dc.subject	LLM	pt_BR
dc.subject	Workflows científicos	pt_BR
dc.title	Análise comparativa de algoritmos de escalonamento de workflows científicos em processadores heterogêneos	pt_BR
dc.title.alternative	Comparative analysis of scientific workflow scheduling algorithms on heterogeneous processors	pt_BR
dc.type	Trabalho de Conclusão de Curso	pt_BR
dc.contributor.advisor1	Gabriel, Paulo Henrique Ribeiro	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/3181954061121790	pt_BR
dc.contributor.referee1	Miani, Rodrigo Sanches	-
dc.contributor.referee1Lattes	http://lattes.cnpq.br/2992074747740327	pt_BR
dc.contributor.referee2	Araújo, Rafael Dias	-
dc.contributor.referee2Lattes	http://lattes.cnpq.br/3067137114142725	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/3420386831460864	pt_BR
dc.description.degreename	Trabalho de Conclusão de Curso (Graduação)	pt_BR
dc.description.resumo	Em computação de alto desempenho (HPC), algoritmos de escalonamento são decisivos para transformar hardware em desempenho, custo e eficiência energética — aspecto crítico em cargas modernas que incluem o treinamento de modelos de aprendizado de máquina, cada vez mais intensivas em recursos. Diferentemente de ambientes homogêneos (nós idênticos), clusters heterogêneos de CPUs/GPUs exibem variação de capacidade de processamento e de comunicação; assim, a política de mapeamento e ordenação de tarefas torna-se central para minimizar filas, latências e ociosidade, reduzindo o tempo de execução, o consumo de energia e, consequentemente, a pegada de CO2. Neste trabalho foi comparado seis heurísticas clássicas de list scheduling — DLS, HEFT, HEFT-LA, PEFT, IHEFT e IPEFT — em um pipeline reprodutível simulado, padronizando a interface de E/S, o gerador de DAGs e o cálculo de métricas para isolar o efeito da lógica de decisão. Avaliamos instâncias de grande porte (256–4096 tarefas) derivadas de workflows científicos, em conjuntos de 8, 16 e 32 máquinas, medindo makespan, balanceamento de carga, waiting time e energia. Os resultados mostram que heurísticas com look-ahead (PEFT, IPEFT, HEFT-LA) reduzem consistentemente makespan e waiting time em cenários com comunicação dominante; PEFT e IPEFT preservam a complexidade 𝑂(𝑉 2𝑃), ao passo que o HEFT-LA apresenta complexidade assintótica superior. Sob baixa comunicação, HEFT permanece competitivo. IHEFT e IPEFT mitigam lacunas de escalonamento e elevam a utilização. Observamos um compromisso energia–desempenho: menor ociosidade tende a reduzir a energia total, mesmo com leve aumento da potência média. Além disso, o DLS apresenta ganhos de velocidade com o aumento de máquinas ao capturar paralelismo de forma mais compute-bound, enquanto heurísticas com predição podem tornar-se mais sensíveis às barreiras de comunicação. Como artefatos, disponibilizamos implementações paper-faithful, um gerador de casos com controle de semente e um pipeline para comparações futuras em ambientes heterogêneos.	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.course	Sistemas de Informação	pt_BR
dc.sizeorduration	140	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO	pt_BR
dc.orcid.putcode	195265372	-
Appears in Collections:	TCC - Sistemas de Informação (Uberlândia)

Files in This Item:

File	Description	Size	Format
AnaliseComparativaAlgoritmos.pdf		38.29 MB	Adobe PDF	View/Open

Show simple item record

This item is licensed under a Creative Commons License