98419 - Aprendizado por Reforço |
Período da turma: | 09/05/2023 a 11/07/2023
|
||||
|
|||||
Descrição: | Objetivo:
Aprendizado por reforço é uma área importante de aprendizado de máquina onde um agente aprende como se comportar em um ambiente realizando ações e verificando os seus resultados. A idéia por trás do aprendizado por reforço é um agente aprender por meio da sua interação com o ambiente recebendo recompensas por suas ações. Esse modo de aprendizado é utilizado quando não se tem uma resposta desejada, apenas se sabe se a resposta é boa ou não. Essa disciplina apresenta o conceito do aprendizado por reforço, como o método de recompensa funciona, as três formas básicas de aprendizado por reforço e aplicação de aprendizado por reforço com redes neurais “deep-learning”. Ementa: • Introdução ao aprendizado por reforço. Suas três formas de abordagem: baseado em valor, baseado em modelo e baseado em política. • Processos de decisão de Markov. • Planejamento por programação dinâmica. • Predição livre de modelo. • Controle livre de modelo. • Aproximação de função de valor. • Métodos de gradiente de políticas. • Integração de aprendizado e planejamento. • Exploração e extração. • Aprendizado por reforço usando redes neurais “deep-learning”. • Estudo de caso: jogos clássicos. • Realização de atividades práticas de programação durante as aulas. Bibliografia: • Sutton, R. and Barto, A., Reinforcement Learning: An Introduction, 2a edição, 2018. • Lapan, M., Deep Reinforcement Learning Hands-On, Packt, 2018. • Ramsundar, B. and Zadeh, R. B., TensorFlow for Deep Learning: From Linear Regression to Reinforcement Learning, O’Reilly, 2018. |
||||
Carga Horária: |
30 horas |
||||
Tipo: | Obrigatória | ||||
Vagas oferecidas: | 44 | ||||
Ministrantes: |
Larissa Driemeier Thiago de Castro Martins |
voltar |
Créditos © 1999 - 2024 - Superintendência de Tecnologia da Informação/USP |