Publicações — Mateus

DyLam

AAMAS 2025

Dynamic Lambda: um método para estudar sinais de recompensa e seu impacto ao longo do tempo em ambientes de aprendizado por reforço multiagente.

Ler Artigo

Planning the Path with Reinforcement Learning

arXiv, 2024

Este trabalho investiga o potencial do Aprendizado por Reforço para resolver desafios de planejamento de movimento robótico na dinâmica RoboCup Small Size League. Usando uma abordagem de controle heurístico, avaliamos a eficácia do RL em ambientes sem obstáculos e com um único obstáculo. Nosso método alcançou um ganho de 60% no tempo em ambientes sem obstáculos comparado aos algoritmos baseline.

Ler Artigo

rSoccer: A Framework for Studying RL in Robot Soccer

arXiv, 2021

Apresenta um simulador open-source para o IEEE Very Small Size Soccer e a Small Size League otimizado para experimentos de aprendizado por reforço. Propõe um framework para criar ambientes OpenAI Gym com tarefas de benchmark para avaliar habilidades de futebol robótico single-agent e multi-agent.

Ler Artigo

RL Applied to Coach Task in IEEE Very Small Size Soccer

Latin American Robotics Symposium, 2020

Propõe uma abordagem end-to-end para a tarefa de treinador baseada em Aprendizado por Reforço. O sistema processa informações durante partidas simuladas para aprender uma política ótima que escolhe a formação atual dependendo do oponente e das condições do jogo. Alcançou uma taxa de vitória/derrota de aproximadamente 2.0 contra uma das melhores equipes da liga VSSS.

Ler Artigo

RL-driven Automatic Calibration for Color Segmentation-based Robot Detection

IEEE, 2024

Aplica aprendizado por reforço para automatizar o processo de calibração de sistemas de detecção robótica baseados em segmentação de cor, melhorando a precisão e reduzindo o esforço de ajuste manual.

Ler Artigo

Segment Routing Path Optimization for URLLC via Multi-Armed Bandits

IEEE, 2025

Aplica algoritmos de multi-armed bandit para otimizar caminhos de segment routing para Comunicações Ultra-Confiáveis de Baixa Latência em redes de transporte móvel de próxima geração.

Ler Artigo