Atividade

98419 - Aprendizado por Reforço

Período da turma: 09/05/2023 a 11/07/2023

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivo:

Aprendizado por reforço é uma área importante de aprendizado de máquina onde um agente aprende como se comportar em um ambiente realizando ações e verificando os seus resultados. A idéia por trás do aprendizado por reforço é um agente aprender por meio da sua interação com o ambiente recebendo recompensas por suas ações. Esse modo de aprendizado é utilizado quando não se tem uma resposta desejada, apenas se sabe se a resposta é boa ou não. Essa disciplina apresenta o conceito do aprendizado por reforço, como o método de recompensa funciona, as três formas básicas de aprendizado por reforço e aplicação de aprendizado por reforço com redes neurais “deep-learning”.

Ementa:

• Introdução ao aprendizado por reforço. Suas três formas de abordagem: baseado em valor, baseado em modelo e baseado em política.
• Processos de decisão de Markov.
• Planejamento por programação dinâmica.
• Predição livre de modelo.
• Controle livre de modelo.
• Aproximação de função de valor.
• Métodos de gradiente de políticas.
• Integração de aprendizado e planejamento.
• Exploração e extração.
• Aprendizado por reforço usando redes neurais “deep-learning”.
• Estudo de caso: jogos clássicos.
• Realização de atividades práticas de programação durante as aulas.

Bibliografia:

• Sutton, R. and Barto, A., Reinforcement Learning: An Introduction, 2a edição, 2018.
• Lapan, M., Deep Reinforcement Learning Hands-On, Packt, 2018.
• Ramsundar, B. and Zadeh, R. B., TensorFlow for Deep Learning: From Linear Regression to Reinforcement Learning, O’Reilly, 2018.

Carga Horária:

30 horas
Tipo: Obrigatória
Vagas oferecidas: 44
 
Ministrantes: Larissa Driemeier
Thiago de Castro Martins


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP