Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Instituto de Matemática e Estatística
 
Estatística
 
Disciplina: MAE0330 - Análise Multivariada de Dados
Multivariate Data Analysis

Créditos Aula: 6
Créditos Trabalho: 0
Carga Horária Total: 90 h
Tipo: Semestral
Ativação: 15/07/2022 Desativação:

Objetivos
Estudar os métodos multivariados de análise de dados e aplicações.
 
 
 
Docente(s) Responsável(eis)
88691 - Lucia Pereira Barroso
 
Programa Resumido
1.	Estatística Descritiva 
2.	Análise de Agrupamentos 
3.	Análise de Regressão Multivariada
4.	Análise de Componentes Principais 
5.	Escalonamento Multidimensional
6.	Análise de Correspondência
7.	Análise Procrustes
8.	Análise Fatorial e Modelos de Equações Estruturais
9.	Análise Discriminante e Classificatória 
10.	Análise de Correlação Canônica.
11.	Mínimos Quadrados Parciais (PLS) 
12.	Análises em big-p
13.	Análises em big-n
 
 
 
Programa
1.	Estatística Descritiva: medidas resumo (centroide, matriz de covariâncias e correlações, medidas de distância) e gráficos (matriz de gráficos de dispersão, boxplot multivariado, radar, faces de Chernoff, coordenadas paralelas). 
2.	Análise de Agrupamentos: métodos hierárquicos (ligação completa, ligação simples, ligação média, centroide, Wald) e de partição (K-médias), dendrogramas e heatmaps. 
3.	Análise de Regressão Multivariada: modelo estrutural linear e premissas clássicas, estimadores de mínimos quadrados e máxima verossimilhança, análises de diagnóstico, teste de hipóteses (CBU=0), correções para múltiplos testes. 
4.	Análise de Componentes Principais: estrutura dos dados, decomposição espectral de matrizes, escores e coeficientes, propriedades, critérios de seleção do número de componentes, gráfico dos autovalores (screeplot), representação biplot.
5.	Escalonamento Multidimensional: estrutura dos dados, soluções métricas e não-métricas, equivalência com componentes principais
6.	Análise de Correspondência: medida de distância Qui-quadrado em tabelas de duas entradas, simplex, biplot, análise de múltiplas tabelas.
7.	Análise Procrustes: estrutura dos dados, configuração de consenso entre 2 ou mais representações de tabelas de dados, medidas de discrepância entre configurações.
8.	Análise Fatorial e Modelos de Equações Estruturais: análise fatorial exploratória (via solução de componentes principais e máxima verossimilhança), modelo estrutural e premissas clássicas, diagramas de caminhos, soluções rotacionadas, representações biplot, estatísticas da bondade de ajuste (Bartlet), análise fatorial confirmatória e modelos de equações estruturais (equações de mensuração, equações envolvendo variáveis latentes exógenas e endógenas).
9.	Análise Discriminante e Classificatória: estrutura dos dados, função discriminante de Fisher, função discriminante linear e quadrática, regra geral de classificação de Bayes, noções de árvores de classificação, noções do método K-NN, métricas de validação preditiva, validação cruzada (K-fold), noções de florestas aleatórias para classificação.
10.	Análise de Correlação Canônica: estrutura de dados, caso de duas ou mais tabelas.
11.	Mínimos Quadrados Parciais (PLS): solução de mínimos quadrados parciais para predição de resposta quantitativa uni e multidimensional, representação biplot. 
12.	Análises em big-p (n<1000 e (n/p)>10): soluções por partição ou reamostragem, cálculos paralelizados, visualização de dados (perfis mais e menos frequentes em coordenadas paralelas, gráfico de Andrews).
 
 
 
Avaliação
     
Método
Aulas e exercícios.
Critério
Média ponderada de provas e exercícios.
Norma de Recuperação
Média ponderada entre prova de recuperação e média do semestre.
 
Bibliografia
     
1.	R. A. Johnson, D. W. Wichern, Applied Multivariate Statistical Analysis, 6th ed., New Jersey: Prentice Hall, 2007. 
2.	K. V. Mardia, J. T. Kent, J. Bibby, Multivariate Analysis, London: Academic Press, 1979. 
3.	M. J. Greenacre, Theory and Applications of Correspondence Analysis, London: Academic Press, 1984. 
4.	M. J. Greenacre, Correspondence Analysis in Practice, 2nd ed., Boca Raton: Chapman & Hall, 2007. 
5.	B. Everitt, An R and S-Plus Companion to Multivariate Analysis, London: Springer, 2005. 
6.	J. F. Hair, W. C. Black, B. J. Babin, R. E. Anderson, Multivariate Data Analysis, 7th ed., Upper Saddle River: Prentice Hall, 2010. 
7.	B. F. J. Manly, Multivariate Statistical Methods, 3rd ed., Boca Raton: Chapman & Hall, 2005. 
8.	J. Neter, M. H. Kutner, W. Li, C. J. Nachtsheim, Applied Linear Statistical Models, 5th ed., Boston: McGraw-Hill, 2005.
9.	 T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015.
10.	A. J. Izenman, Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning, Springer, 2013.
11.	K. Bollen, Structural Equations with latent variables, John Wiley & Sons, 1989.
12.	Handbook of Big Data, Edited by Peter Bühlmann, Petros Drineas, Michael Kane, Mark van der Laan, New York: Chapman and Hall/CRC, 2016.
13.	Krzanowski, W.J. A stopping rule for structure-preserving variable selection. Stat Comput 6, 51–56 (1996). https://doi.org/10.1007/BF00161573.
14.	G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R, Springer, 2013.
 

Clique para consultar os requisitos para MAE0330

Clique para consultar o oferecimento para MAE0330

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP