DyLam
AAMAS 2025
Dynamic Lambda: um método para estudar sinais de recompensa e seu impacto ao longo do tempo em ambientes de aprendizado por reforço multiagente.
Ler Artigo
AAMAS 2025
Dynamic Lambda: um método para estudar sinais de recompensa e seu impacto ao longo do tempo em ambientes de aprendizado por reforço multiagente.
Ler Artigo
arXiv, 2024
Este trabalho investiga o potencial do Aprendizado por Reforço para resolver desafios de planejamento de movimento robótico na dinâmica RoboCup Small Size League. Usando uma abordagem de controle heurístico, avaliamos a eficácia do RL em ambientes sem obstáculos e com um único obstáculo. Nosso método alcançou um ganho de 60% no tempo em ambientes sem obstáculos comparado aos algoritmos baseline.
Ler Artigo
arXiv, 2021
Apresenta um simulador open-source para o IEEE Very Small Size Soccer e a Small Size League otimizado para experimentos de aprendizado por reforço. Propõe um framework para criar ambientes OpenAI Gym com tarefas de benchmark para avaliar habilidades de futebol robótico single-agent e multi-agent.
Ler Artigo
Latin American Robotics Symposium, 2020
Propõe uma abordagem end-to-end para a tarefa de treinador baseada em Aprendizado por Reforço. O sistema processa informações durante partidas simuladas para aprender uma política ótima que escolhe a formação atual dependendo do oponente e das condições do jogo. Alcançou uma taxa de vitória/derrota de aproximadamente 2.0 contra uma das melhores equipes da liga VSSS.
Ler Artigo
IEEE, 2024
Aplica aprendizado por reforço para automatizar o processo de calibração de sistemas de detecção robótica baseados em segmentação de cor, melhorando a precisão e reduzindo o esforço de ajuste manual.
Ler Artigo
IEEE, 2025
Aplica algoritmos de multi-armed bandit para otimizar caminhos de segment routing para Comunicações Ultra-Confiáveis de Baixa Latência em redes de transporte móvel de próxima geração.
Ler Artigo