Publicações

DyLam

DyLam

AAMAS 2025

Dynamic Lambda: um método para estudar sinais de recompensa e seu impacto ao longo do tempo em ambientes de aprendizado por reforço multiagente.

Ler Artigo
Planning the path with RL

Planning the Path with Reinforcement Learning

arXiv, 2024

Este trabalho investiga o potencial do Aprendizado por Reforço para resolver desafios de planejamento de movimento robótico na dinâmica RoboCup Small Size League. Usando uma abordagem de controle heurístico, avaliamos a eficácia do RL em ambientes sem obstáculos e com um único obstáculo. Nosso método alcançou um ganho de 60% no tempo em ambientes sem obstáculos comparado aos algoritmos baseline.

Ler Artigo
rSoccer

rSoccer: A Framework for Studying RL in Robot Soccer

arXiv, 2021

Apresenta um simulador open-source para o IEEE Very Small Size Soccer e a Small Size League otimizado para experimentos de aprendizado por reforço. Propõe um framework para criar ambientes OpenAI Gym com tarefas de benchmark para avaliar habilidades de futebol robótico single-agent e multi-agent.

Ler Artigo
Coach task VSSS

RL Applied to Coach Task in IEEE Very Small Size Soccer

Latin American Robotics Symposium, 2020

Propõe uma abordagem end-to-end para a tarefa de treinador baseada em Aprendizado por Reforço. O sistema processa informações durante partidas simuladas para aprender uma política ótima que escolhe a formação atual dependendo do oponente e das condições do jogo. Alcançou uma taxa de vitória/derrota de aproximadamente 2.0 contra uma das melhores equipes da liga VSSS.

Ler Artigo
Auto calibration

RL-driven Automatic Calibration for Color Segmentation-based Robot Detection

IEEE, 2024

Aplica aprendizado por reforço para automatizar o processo de calibração de sistemas de detecção robótica baseados em segmentação de cor, melhorando a precisão e reduzindo o esforço de ajuste manual.

Ler Artigo
Segment Routing

Segment Routing Path Optimization for URLLC via Multi-Armed Bandits

IEEE, 2025

Aplica algoritmos de multi-armed bandit para otimizar caminhos de segment routing para Comunicações Ultra-Confiáveis de Baixa Latência em redes de transporte móvel de próxima geração.

Ler Artigo