Disciplina Discipline MAE5904
Aprendizagem estatística em altas dimensões

Statistical learning in high dimensions

Área de Concentração: 45133

Concentration area: 45133

Criação: 18/06/2019

Creation: 18/06/2019

Ativação: 18/06/2019

Activation: 18/06/2019

Nr. de Créditos: 8

Credits: 8

Carga Horária:

Workload:

Teórica

(por semana)

Theory

(weekly)

Prática

(por semana)

Practice

(weekly)

Estudos

(por semana)

Study

(weekly)

Duração Duration Total Total
4 2 4 12 semanas 12 weeks 120 horas 120 hours

Docente Responsável:

Professor:

Florencia Graciela Leonardi

Objetivos:

Apresentar técnicas atuais de aprendizagem estatística, no caso clássico e no caso de altas dimensões; isto é, quando o número de parâmetros a serem estimados é muito maior que o número de observações. Fornecer ferramentas teóricas de análise e exemplos práticos de aplicação.

Objectives:

To present current techniques of statistical learning, in the classical and in the high dimensional setting; that is, when the number of parameters to be estimated is much larger than the number of observations. To provide theoretical results as well as examples of practical application.      

Justificativa:

Com o avanço de novas tecnologias na obtenção de dados em diferentes áreas de conhecimento é cada vez mais frequente o uso de técnicas de aprendizagem estatística. Nos últimos anos há havido um grande desenvolvimento metodológico, matemático e computacional nesta área, que tem possibilitado a inferência estatística em altas dimensões de forma eficiente.

Rationale:

With the development of new technologies for obtaining data in different areas of knowledge, the use of statistical learning techniques has became more frequent. In recent years there has been an enormous methodological, mathematical and computational development in this area, which has enabled the statistical inference in high dimensions in an efficient way.

Conteúdo:

1- Introdução à aprendizagem estatística supervisionada. 2- Modelos lineares para regressão e classificação. 4- O método LASSO e o problema de seleção de variáveis. 5- Avaliação e seleção de modelos. 4- Método de k-vizinhos mais próximos, máquinas de vetores suporte e redes neurais. 5- Método “bagging", florestas aleatórias e método "boosting". 9- Modelos gráficos. 10- Aprendizagem não supervisionada.

Content:

1- Overview of supervised learning. 2- Linear models for regression and classification. 4- The LASSO method and the problem of variable selection. 5- Model assessment and selection. 4- k-nearest neighbors, support vector machines and neural networks. 5- Bagging, random forests and boosting. 9- Graphical models. 10- Unsupervised learning.     

Forma de Avaliação:

Média ponderada de provas e exercícios.

Type of Assessment:

Weighted mean of tests and exercises.

Observação:

Bibliografia:

1- T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009.  2- G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer, 2013. 3- T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015. 4- P. Bühlmann & S. Van de Geer. Statistics for High-dimensional Data. Springer, 2011.  5- C. Giraud. Introduction to High-dimensional Statistics. CRC Press, 2014. 

Bibliography:

1- T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009.  2- G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R. Springer, 2013. 3- T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015. 4- P. Bühlmann & S. Van de Geer. Statistics for High-dimensional Data. Springer, 2011.  5- C. Giraud. Introduction to High-dimensional Statistics. CRC Press, 2014.