Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
 
Computação e Matemática
 
Disciplina: 5952042 - Introdução à Teoria do Aprendizado Estatístico
Introduction to Statistical Learning

Créditos Aula: 4
Créditos Trabalho: 1
Carga Horária Total: 90 h
Tipo: Semestral
Ativação: 15/07/2020 Desativação:

Objetivos
Complementar a formação dos alunos do curso Matemática Aplicada a Negócios em tópicos de Análise Estatística de Dados. Consolidar as habilidades dos alunos quanto ao Pacote Estatístico R, muito usado nos ambientes de estágio dos graduandos, e de trabalho dos alunos egressos do curso. Introduzir métodos da Teoria do Aprendizado Estatístico (Statistical Learning), área da Estatística e os métodos da área de Machine Learning, área de computação, que hoje compõem um currículo mínimo para profissionais que trabalham com grandes quantidades de dados. 
 
 
 
Docente(s) Responsável(eis)
1036923 - Geraldine Góes Bosco
 
Programa Resumido
Machine Learning e a Teoria do Aprendizado Estatístico (Statistical Learning): visão geral das áreas. Tópicos de Análise Exploratória de Dados usando o Pacote Estatístico R. Tópicos de Modelos de Regressão usando Pacote Estatístico R. Tópicos de Análise Categórica de Dados usando Pacote Estatístico R. Seleção de Modelos. 
 
 
 
Programa
1. Introdução: Machine Learning e Teoria do Aprendizado Estatístico (Statistical Learning): visão geral dos métodos, diferenças, exemplos e aplicações motivacionais para apresentação dos demais tópicos da disciplina.
2. Tópicos de Análise Exploratória de Dados usando o Pacote Estatístico R
2.1. O Pacote Estatístico R: apresentação, orientações para a instalação do R Studio, orientação básica, principais bibliotecas e procedimentos. Exercícios práticos.
2.2.  Organização dos dados brutos em tabelas, gráficos e outras formas de apresentação que podem indicar padrões e características dos dados analisados. Classificação das variáveis, construção de histograma e gráfico de barras; determinação da forma de suas distribuições. 
2.3 Clusterização: Clusterização Hierárquica e K-Means.
2.4.Complemento de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina.
3. Tópicos de Modelos de Regressão usando o Pacote Estatístico R: 
3.1. Método dos mínimos quadrados e regressão linear: análise de resíduos; previsões; análise da aderência do modelo. Exemplos aplicados. 
3.2. Regressão Multivariada: conceitos teóricos e exemplos; análise da aderência do modelo. Exemplos aplicados.
3.3. Regressão Logística: conceitos teóricos e exemplos; análise da aderência do modelo. Exemplos aplicados.
3.4. Complementos de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina.
4. Tópicos de Análise Categórica de Dados usando Pacote Estatístico R: 
4.1 Variáveis discretas e tabelas de contingência. 
4.2 Medidas de associação. 
4.3 Modelos probabilísticos para dados discretos. 
4.4 Tabelas 2 x 2: testes de independência e homogeneidade. 
4.5 Tabelas s x r: testes de independência, homogeneidade, simetria e homogeneidade marginal. Exemplos de classificação de tweets ou outros textos gerados em redes sociais.
4.6 Complemento de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina.
5. Seleção de Modelos e Classificação (uso dos métodos dos itens anteriores): 
5.1 Modelos de aprendizado supervisionado e não-supervisionado; 
5.2 Modelos de regressão e categóricos; 
5.3 Métodos de avaliação, comparação e aderência dos modelos. Aplicação em vários conjuntos de dados.  
5.4 Complemento de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina.
 
 
 
Avaliação
     
Método
Aula expositiva e aulas práticas em Laboratório de Computação.
Critério
Serão aplicadas 2 provas (P1 e P2) e trabalhos computacionais individuais ou em grupo. Média final= (P1+2*P2+ 0.2*Média_Trabalhos)/3.2
Norma de Recuperação
Uma prova escrita dentro do prazo regimental antes do início do próximo semestre letivo. A nota da segunda avaliação será a média entre a nota da prova de recuperação (com peso 2) e a nota final da primeira avaliação (com peso 1). O estudante será aprovado se obtiver nota na segunda avaliação igual ou superior a cinco (5,0).
 
Bibliografia
     
Dalgaard Introductory Statistics with R. Springer; 2nd edition, 2008. Statistics and Computing Series. 
JAMES, G.; 	WITTEN, D.; HASTIE, T.; TIBSHIRANI, R. An Introduction to Statistical Learning: with Applications in R, Springer Texts in Statistics, 1st ed. 2013, Corr. 7th printing 2017 Edition.
CHARNET, R., AZEVEDO DE LUNA FREIRE, C.; REGINATO CHARNET, E. M.; BONVINO, H. Análise de modelos de regressão linear - Com aplicações, Editora Unicamp, 1999. 
HASTIE, T.; TIBSHIRANI,  R. ; FRIEDMAN, J.  The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer (disponível na biblioteca do IMPA e online em http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf).
MACKAY, D. J. C.  Information Theory, Inference, and Learning Algorithms.  Cambridge University Press (versão online em http://www.cs.toronto.edu/~mackay/itila/book.html).
 

Clique para consultar os requisitos para 5952042

Clique para consultar o oferecimento para 5952042

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP