Capítulo III

Aprendizado por Reforço

Um agente toma decisões em um ambiente. A cada escolha, ganha recompensas ou penalidades. Você verá esse aprendizado emergir diante dos seus olhos.

Simulação · única

Roteirização inteligente (Agente em ambiente em grade)

Um agente precisa encontrar o melhor caminho em um mapa, evitando armadilhas. Ajuste a taxa de exploração e veja sua estratégia melhorar a cada episódio.

Cenário gerado6 etapas≈ 8–12 min
Iniciar simulação
MEL · ML Executive Lab
@AndreBarcaui
Edição experimental · 2026