Um agente toma decisões em um ambiente. A cada escolha, ganha recompensas ou penalidades. Você verá esse aprendizado emergir diante dos seus olhos.
Um agente precisa encontrar o melhor caminho em um mapa, evitando armadilhas. Ajuste a taxa de exploração e veja sua estratégia melhorar a cada episódio.