O objetivo da disciplina é apresentar conceitos e técnicas básicas de análise exploratórias, visualização de dados, reconhecimento de padrões e engenharia de dados em larga escala. O aluno deverá compreender as principais ideias ligadas à ciência de dados e conduzir suas próprias modelagens em problemas reais.
Conceitos gerais em ciência de dados; Análise exploratória de dados; Métodos estatísticos de ciência de dados; Métodos computacionais de machine learning; Engenharia de dados.
[1] Conceitos gerais em ciência de dados; [2] Análise exploratória: visualização de dados, limpeza, transformação, tratamento de dados faltantes e outliers; [3] Métodos estatísticos de ciência de dados: modelos lineares generalizados e análise de dados categorizados; [4] Métodos computacionais de machine learning: aprendizado supervisionado e não supervisionado, tratamento de desbalanceamento, calibração e validação de modelos; [5] Engenharia de dados, novas tecnologias e aplicações em larga escala; [6] Estudos de casos aplicados a negócios.
Básica WITTEN, I.H., ET AL. Data Mining: Practical Machine Learning Tools and Techniques. 4th Edition, Elsevier, Morgan Kaufmann, 2016. AGRESTI, A. An Introduction to Categorical Data Analysis. 2nd Edition. Hoboken: John Wiley & Sons, 2007. LESKOVEC, J., ET AL. Mining of Massive Datasets. 2nd. Edition. Cambridge University Press, 2014. Complementar BHATIA, P. Data Mining and Data Warehousing. Cambridge: Cambridge University Press, 2019. EMC. Data Science & Big Data Analytics: Discovering, Analysing, Visualizing and Presenting Data. EMC Education Services. Indianópolis: John Wiley & Sons, 2015. GÉRON, A. Hands-on Machine Learning with Scikit-Learning & TensorFlow. O´REILLY, 2017. IRIZARRY, R.A. Introduction to Data Science. Disponível em: https://rafalab.github.io/dsbook/ KUHN, M.; JOHNSON, K. Applied Predictive Modeling. New York: Springer, 2013. PAULA, G.A. Modelos de Regressão com Apoio Computacional. São Paulo: EDUSP, 2004. SIVARAJAH, U., ET AL. Critical analysis of Big Data challenges and analytical methods. Journal of Business Research 70 (2017) 263-286.