Disciplina Discipline MAE5898
Estatística para dados superdimensionados

Statistics for oversized data

Área de Concentração: 45133

Concentration area: 45133

Criação: 18/11/2015

Creation: 18/11/2015

Ativação: 18/11/2015

Activation: 18/11/2015

Nr. de Créditos: 8

Credits: 8

Carga Horária:

Workload:

Teórica

(por semana)

Theory

(weekly)

Prática

(por semana)

Practice

(weekly)

Estudos

(por semana)

Study

(weekly)

Duração Duration Total Total
4 2 4 12 semanas 12 weeks 120 horas 120 hours

Docente Responsável:

Professor:

Florencia Graciela Leonardi

Objetivos:

Apresentar técnicas atuais de inferência estatística para dados superdimensionados, quando o número de parâmetros a serem estimados é muito maior que o número de observações. Fornecer ferramentas teóricas de análise e exemplos práticos de aplicação.

Objectives:

Present statistical inference techniques for oversized data, when the number of parameters to be estimated is much larger than the number of observations.

Justificativa:

Com o avanço de novas tecnologias na obtenção de dados em diferentes áreas de conhecimento é cada vez mais frequente a análise de dados superdimensionados. De modo geral, métodos estatísticos clássicos não são adequados para a inferência neste tipo de situação e novas abordagens tem sido desenvolvidas. Nos últimos anos há havido um grande desenvolvimento metodológico, matemático e computacional que tem possibilitado a inferência estatística em altas dimensões com base em certas noções de esparsidade. Estas técnicas são suficientemente gerais como para cobrir uma grande gama de modelos, como regressão linear e não linear, modelos auto-regressivos e modelos gráficos, entre outros.

Rationale:

With the advancement of new technologies in obtaining data in different areas of knowledge is increasingly frequent the analysis of oversized data. In general, traditional statistical methods are not suitable for this type of inference and new approaches have been developed. In recent years there has been a great development methodological and computational that allows the inference in high dimensions based on notions of sparsity. These techniques are sufficiently general to cover a large variety of regression models and graphic models, among others.

Conteúdo:

1- O estimador “LASSO” para modelos lineares em alta dimensão. 2- “LASSO” para modelos lineares generalizados e modelos aditivos. 3- Generalizações: Group-LASSO, Fused-LASSO, modelos segmentados. 4- Seleção de variáveis. 5- Modelos gráficos.

Content:

1. Lasso estimator for high-dimensional linear models. 2. Lasso estimator for generalized linear models and additive models. 3. Generalizations: Group-LASSO, Fused-Lasso and segmented models. 4. Selection of variables. 5. Graphic models.

Forma de Avaliação:

Média ponderada de provas e exercícios, avaliação da apresentação de seminários.

Type of Assessment:

Tests, lists of exercises and seminars.

Observação:

Bibliografia:

1- P. Bühlmann & S. Van de Geer. Statistics for High-dimensional Data. Springer, 2011. 2- T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009. 3- C. Giraud. Introduction to High-dimensional Statistics. CRC Press, 2014. 4- I. Rish & G. Grabarnik. Sparse Modeling: Theory, Algorithms and Applications. CRC Press, 2014.

Bibliography:

1- P. Bühlmann & S. Van de Geer. Statistics for High-dimensional Data. Springer, 2011. 2- T. Hastie, R. Tibshirani & J. Friedman. The Elements of Statistical Learning. 2nd edition. Springer, 2009. 3- C. Giraud. Introduction to High-dimensional Statistics. CRC Press, 2014. 4- I. Rish & G. Grabarnik. Sparse Modeling: Theory, Algorithms and Applications. CRC Press, 2014.