Disciplina Discipline MAE5905
Introdução a Ciência de Dados

Área de Concentração: 45133

Concentration area: 45133

Criação: 31/05/2019

Creation: 31/05/2019

Ativação: 31/05/2019

Activation: 31/05/2019

Nr. de Créditos: 8

Credits: 8

Carga Horária:

Workload:

Teórica

(por semana)

Theory

(weekly)

Prática

(por semana)

Practice

(weekly)

Estudos

(por semana)

Study

(weekly)

Duração Duration Total Total
4 2 4 12 semanas 12 weeks 120 horas 120 hours

Docente Responsável:

Professor:

Pedro Alberto Morettin

Objetivos:

Fornecer aos alunos os conceitos básicos da Ciência de Dados. Destacam-se os métodos em Aprendizado Estatístico Supervisionado e Não Supervisionado, com uso intensivo de métodos computacionais.

Justificativa:

Ciência de Dados é uma disciplina nova, envolvendo Estatística e Computação. O objetivo é apresentar os tópicos recentes do ponto de vista teórico e aplicado.

Conteúdo:

1. Estatística, Computação e Ciência de Dados. 2. Aprendizado estatístico: supervisionado e não supervisionado. 3. Aprendizado supervisionado: regressão e classificação: noções. 4. Aprendizado não supervisionado: análise de agrupamentos, redução da dimensão (componentes principais, componentes independentes, decomposição em valores singulares): noções. 5. Máquinas de suporte vetorial. 6. Métodos baseados em árvores. 7. Ferramentas computacionais: o repositório R. 8. Análise de conjuntos massivos de dados (Big Data). 9. Exemplos e aplicações a conjuntos de dados.

Forma de Avaliação:

Média ponderada de notas em provas e listas de problemas.

Observação:

Bibliografia:

Breiman, L. et al. (2001). Statistical learning: The two cultures. Statistical Science, 16, 199-231. Donoho,D.L. (2017). 50 years of data science. Journal of Computational and Graphical Statistics, 26, 745-766. Hastie, T. Tibshirani, R. and Friedman, J. (2009). The Elements of Statistical Learning. Second Edition. Springer. Hastie, T. and Efron, B. (2016). Computer Age Statistical Inference. Cambridge University Press. James, G., Witten, D., Hastie, T. and Tibshirani, R. (2017). An Introduction to Statistical Learning: With Applications in R. Springer. Morettin, P. A. e Singer, J. M. (2019). Introdução à Ciência de Dados. Texto Preliminar. Wickham, H. and Grolemund, G. (2016). Data Science with R. O’Reilly.