Use este identificador para citar ou linkar para este item:
https://repositorio.ufu.br/handle/123456789/39375
ORCID: | http://orcid.org/0009-0002-6727-3866 |
Tipo do documento: | Trabalho de Conclusão de Curso |
Tipo de acesso: | Acesso Aberto |
Título: | Implementação de algoritmos de aprendizado por reforço no controle de um carro pêndulo |
Autor(es): | Alves Júnior, Tércio de Melo |
Primeiro orientador: | Assis, Pedro Augusto Queiroz de |
Primeiro membro da banca: | Lobato, Fran |
Segundo membro da banca: | Silva, Leonardo |
Resumo: | No Reinforcement Learning (RL) ou aprendizado baseado em reforço, pretende-se fazer com que o agente aprenda a realizar uma tarefa por meio de interações com o ambiente. Sendo um ramo da Inteligência Artificial não supervisionado, nos métodos de RL o aprendizado é realizado com base em tentativa e erro. O objetivo é determinar a sequência de ações que maximizam o somatório de recompensas a longo prazo, o que é denominado retorno. Neste trabalho serão avaliados quatro algoritmos de aprendizado baseado em reforço para o controle de um carro pêndulo. Em particular são implementados SARSA, Q-Learning, Deep Q-Learning e Double Deep Q-Learning. O objetivo dos métodos con siste em treinar um agente para manter uma haste equilibrada e o carro dentro de um certo intervalo em torno da origem. Com esse propósito é definida uma função que retorna recompensas positivas, caso esses objetivos sejam alcançados, e recompensas negativas, caso contrário. Para tais objetivos, será utilizado a linguagem Python, tanto para implementação, quanto para simulação e exibição dos resultados. Os resultados da simulação no modelo não linear do sistema demonstram a capacidade de aprendizado do agente, pois foi possível realizar a tarefa proposta utilizando todos os métodos implementados. Mais ainda, usando essas simulações, avaliam-se efeitos de variações nos parâmetros de ajuste dos métodos no aprendizado do agente. Esses resultados podem orientar outros projetistas na implementação dos métodos de RL considerados. Constatou-se que o método Double Deep Q-Learning proporcionou um aprendizado mais rápido, tornando-se assim o melhor entre os métodos testados. |
Palavras-chave: | SARSA Reinforcement learning Q-learning Deep q-learning |
Área(s) do CNPq: | CNPQ::OUTROS::ENGENHARIA MECATRONICA |
Idioma: | por |
País: | Brasil |
Editora: | Universidade Federal de Uberlândia |
Referência: | ALVES JÚNIOR, Tércio de Melo. Implementação de algoritmos de aprendizado por reforço no controle de um carro pêndulo. 2023. 63 f. Trabalho de Conclusão de Curso (Graduação em Engenharia Mecatrônica) – Universidade Federal de Uberlândia, Uberlândia, 2023. |
URI: | https://repositorio.ufu.br/handle/123456789/39375 |
Data de defesa: | 23-Ago-2023 |
Aparece nas coleções: | TCC - Engenharia Mecatrônica |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ImplementaçãoAlgoritmosAprendizado.pdf | 16.98 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.