O objetivo é apresentar conceitos e técnicas básicas de análise exploratórias, visualização de dados, reconhecimento de padrões e aprendizado de máquinas em larga escala. O aluno deverá compreender as ideias básicas da ciência de dados e realizar suas próprias modelagens em problemas reais.
1) Análise Exploratória; 2) Rudimentos de Teoria Bayesiana de Decisão; 3) Aprendizado de Máquina Supervisionado; 4) Aprendizado de Máquina não-supervisionado; 5) Redução de Dimensionalidade.
Análise exploratória: visualização de dados, limpeza, transformação, tratamento de dados faltantes e outliers; Rudimentos de Teoria Bayesiana da Decisão; Técnicas não-paramétricas para aferir densidades; Classificação Supervisionada: hiperplanos em problemas linearmente separáveis; Validação de modelos: matriz de confusão e métricas de performance a ela associadas; Classificação não-Supervisionada: métricas/distâncias e algoritmos para agrupamento; Redução de Dimensionalidade: PCA (Principal Component Analysis) e Seleçao de Características (Feature Selection).
WITTEN, I.H., ET AL. Data Mining: Practical Machine Learning Tools and Techniques. 4th Edition, Elsevier, Morgan Kaufmann, 2016. Richard O. Duda, Peter E. Hurt, David G. Stork. Pattern Classification. John Wiley and Sons. Inc. 2. Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer Joao Gama, Katti Faceli, Ana Carolina Lorena, Andre C. P. L. F. De Carvalho. Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. Grupo Gen - LTC, 2011