Estudar os métodos multivariados de análise de dados e aplicações.
1. Estatística Descritiva 2. Análise de Agrupamentos 3. Análise de Regressão Multivariada 4. Análise de Componentes Principais 5. Escalonamento Multidimensional 6. Análise de Correspondência 7. Análise Procrustes 8. Análise Fatorial e Modelos de Equações Estruturais 9. Análise Discriminante e Classificatória 10. Análise de Correlação Canônica. 11. Mínimos Quadrados Parciais (PLS) 12. Análises em big-p 13. Análises em big-n
1. Estatística Descritiva: medidas resumo (centroide, matriz de covariâncias e correlações, medidas de distância) e gráficos (matriz de gráficos de dispersão, boxplot multivariado, radar, faces de Chernoff, coordenadas paralelas). 2. Análise de Agrupamentos: métodos hierárquicos (ligação completa, ligação simples, ligação média, centroide, Wald) e de partição (K-médias), dendrogramas e heatmaps. 3. Análise de Regressão Multivariada: modelo estrutural linear e premissas clássicas, estimadores de mínimos quadrados e máxima verossimilhança, análises de diagnóstico, teste de hipóteses (CBU=0), correções para múltiplos testes. 4. Análise de Componentes Principais: estrutura dos dados, decomposição espectral de matrizes, escores e coeficientes, propriedades, critérios de seleção do número de componentes, gráfico dos autovalores (screeplot), representação biplot. 5. Escalonamento Multidimensional: estrutura dos dados, soluções métricas e não-métricas, equivalência com componentes principais 6. Análise de Correspondência: medida de distância Qui-quadrado em tabelas de duas entradas, simplex, biplot, análise de múltiplas tabelas. 7. Análise Procrustes: estrutura dos dados, configuração de consenso entre 2 ou mais representações de tabelas de dados, medidas de discrepância entre configurações. 8. Análise Fatorial e Modelos de Equações Estruturais: análise fatorial exploratória (via solução de componentes principais e máxima verossimilhança), modelo estrutural e premissas clássicas, diagramas de caminhos, soluções rotacionadas, representações biplot, estatísticas da bondade de ajuste (Bartlet), análise fatorial confirmatória e modelos de equações estruturais (equações de mensuração, equações envolvendo variáveis latentes exógenas e endógenas). 9. Análise Discriminante e Classificatória: estrutura dos dados, função discriminante de Fisher, função discriminante linear e quadrática, regra geral de classificação de Bayes, noções de árvores de classificação, noções do método K-NN, métricas de validação preditiva, validação cruzada (K-fold), noções de florestas aleatórias para classificação. 10. Análise de Correlação Canônica: estrutura de dados, caso de duas ou mais tabelas. 11. Mínimos Quadrados Parciais (PLS): solução de mínimos quadrados parciais para predição de resposta quantitativa uni e multidimensional, representação biplot. 12. Análises em big-p (n<1000 e (n/p)>10): soluções por partição ou reamostragem, cálculos paralelizados, visualização de dados (perfis mais e menos frequentes em coordenadas paralelas, gráfico de Andrews).
1000 e (n/p)>10): soluções por partição ou reamostragem, cálculos paralelizados, visualização de dados (perfis mais e menos frequentes em coordenadas paralelas, gráfico de Andrews).
1. R. A. Johnson, D. W. Wichern, Applied Multivariate Statistical Analysis, 6th ed., New Jersey: Prentice Hall, 2007. 2. K. V. Mardia, J. T. Kent, J. Bibby, Multivariate Analysis, London: Academic Press, 1979. 3. M. J. Greenacre, Theory and Applications of Correspondence Analysis, London: Academic Press, 1984. 4. M. J. Greenacre, Correspondence Analysis in Practice, 2nd ed., Boca Raton: Chapman & Hall, 2007. 5. B. Everitt, An R and S-Plus Companion to Multivariate Analysis, London: Springer, 2005. 6. J. F. Hair, W. C. Black, B. J. Babin, R. E. Anderson, Multivariate Data Analysis, 7th ed., Upper Saddle River: Prentice Hall, 2010. 7. B. F. J. Manly, Multivariate Statistical Methods, 3rd ed., Boca Raton: Chapman & Hall, 2005. 8. J. Neter, M. H. Kutner, W. Li, C. J. Nachtsheim, Applied Linear Statistical Models, 5th ed., Boston: McGraw-Hill, 2005. 9. T. Hastie, R. Tibshirani & M. Wainwright. Statistical Learning with Sparsity. The Lasso and Generalizations. CRC Press, 2015. 10. A. J. Izenman, Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning, Springer, 2013. 11. K. Bollen, Structural Equations with latent variables, John Wiley & Sons, 1989. 12. Handbook of Big Data, Edited by Peter Bühlmann, Petros Drineas, Michael Kane, Mark van der Laan, New York: Chapman and Hall/CRC, 2016. 13. Krzanowski, W.J. A stopping rule for structure-preserving variable selection. Stat Comput 6, 51–56 (1996). https://doi.org/10.1007/BF00161573. 14. G. James, D. Witten, T. Hastie & R. Tibshirani. An Introduction to Statistical Learning with Applications in R, Springer, 2013.