Complementar a formação dos alunos do curso Matemática Aplicada a Negócios em tópicos de Análise Estatística de Dados. Consolidar as habilidades dos alunos quanto ao Pacote Estatístico R, muito usado nos ambientes de estágio dos graduandos, e de trabalho dos alunos egressos do curso. Introduzir métodos da Teoria do Aprendizado Estatístico (Statistical Learning), área da Estatística e os métodos da área de Machine Learning, área de computação, que hoje compõem um currículo mínimo para profissionais que trabalham com grandes quantidades de dados.
Machine Learning e a Teoria do Aprendizado Estatístico (Statistical Learning): visão geral das áreas. Tópicos de Análise Exploratória de Dados usando o Pacote Estatístico R. Tópicos de Modelos de Regressão usando Pacote Estatístico R. Tópicos de Análise Categórica de Dados usando Pacote Estatístico R. Seleção de Modelos.
1. Introdução: Machine Learning e Teoria do Aprendizado Estatístico (Statistical Learning): visão geral dos métodos, diferenças, exemplos e aplicações motivacionais para apresentação dos demais tópicos da disciplina. 2. Tópicos de Análise Exploratória de Dados usando o Pacote Estatístico R 2.1. O Pacote Estatístico R: apresentação, orientações para a instalação do R Studio, orientação básica, principais bibliotecas e procedimentos. Exercícios práticos. 2.2. Organização dos dados brutos em tabelas, gráficos e outras formas de apresentação que podem indicar padrões e características dos dados analisados. Classificação das variáveis, construção de histograma e gráfico de barras; determinação da forma de suas distribuições. 2.3 Clusterização: Clusterização Hierárquica e K-Means. 2.4.Complemento de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina. 3. Tópicos de Modelos de Regressão usando o Pacote Estatístico R: 3.1. Método dos mínimos quadrados e regressão linear: análise de resíduos; previsões; análise da aderência do modelo. Exemplos aplicados. 3.2. Regressão Multivariada: conceitos teóricos e exemplos; análise da aderência do modelo. Exemplos aplicados. 3.3. Regressão Logística: conceitos teóricos e exemplos; análise da aderência do modelo. Exemplos aplicados. 3.4. Complementos de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina. 4. Tópicos de Análise Categórica de Dados usando Pacote Estatístico R: 4.1 Variáveis discretas e tabelas de contingência. 4.2 Medidas de associação. 4.3 Modelos probabilísticos para dados discretos. 4.4 Tabelas 2 x 2: testes de independência e homogeneidade. 4.5 Tabelas s x r: testes de independência, homogeneidade, simetria e homogeneidade marginal. Exemplos de classificação de tweets ou outros textos gerados em redes sociais. 4.6 Complemento de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina. 5. Seleção de Modelos e Classificação (uso dos métodos dos itens anteriores): 5.1 Modelos de aprendizado supervisionado e não-supervisionado; 5.2 Modelos de regressão e categóricos; 5.3 Métodos de avaliação, comparação e aderência dos modelos. Aplicação em vários conjuntos de dados. 5.4 Complemento de outros métodos conhecidos e usados pelo(s) ministrante(s) da disciplina.
Dalgaard Introductory Statistics with R. Springer; 2nd edition, 2008. Statistics and Computing Series. JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R. An Introduction to Statistical Learning: with Applications in R, Springer Texts in Statistics, 1st ed. 2013, Corr. 7th printing 2017 Edition. CHARNET, R., AZEVEDO DE LUNA FREIRE, C.; REGINATO CHARNET, E. M.; BONVINO, H. Análise de modelos de regressão linear - Com aplicações, Editora Unicamp, 1999. HASTIE, T.; TIBSHIRANI, R. ; FRIEDMAN, J. The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer (disponível na biblioteca do IMPA e online em http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf). MACKAY, D. J. C. Information Theory, Inference, and Learning Algorithms. Cambridge University Press (versão online em http://www.cs.toronto.edu/~mackay/itila/book.html).