Apresentar ao aluno os principais conceitos e técnicas de mineração estatística de dados. A teoria será desenvolvida com aplicações em várias área do conhecimento, dentre as quais, biologia, economia, engenharia, finanças e medicina.
Introdução à mineração de dados. Análise estatística de dados. O processo de descoberta do conhecimento. Segmentação de sumarização de dados. Métodos de classificação supervisionada. Medidas de capacidade preditiva. Análise de associação. Análise de agrupamentos. Métodos de redução de dimensionalidade. Técnicas de seleção de atributos. Combinação de classificadores.
Introdução à mineração de dados. Mineração de dados e análise estatística. Importância do banco de dados. O Processo KDD. Procedimentos de segmentação de base. Sumarização. Modelos supervisionados de classificação. Modelos pontuais e predição, regressão logística, regressão probito, regressão logística limitada. Modelos temporais de predição; estimadores empíricos da função de sobrevivência e da função de risco, modelos paramétricos básicos, estimação, compração de modelos. Medidas de capacidade preditiva. Análise de associação. Análise de Agrupamentos. Redução de dimensionalidade. Seleção de atributos. Combinação de classificadores. A disciplina poderá ser oferecida de forma híbrida, sendo parte das atividades desenvolvidas remotamente.
Livros texto:Francisco Louzada-Neto e Carlos A. R. Diniz . Técnicas Estatísticas em Data Mining. IMCA, Lima , 2002.Sergios Theodoridis, Konstantinos Koutroumbas. Pattern Recognition, Academic Press; 4 edition, 2008.Trevor Hastie, Robert Tibshirani and Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer-Verlag, 2001.Bibliografia complementar:Christopher M. Bishop. Pattern Recognition and Machine Learning, Springer, 2007.Ian H. Witten, Eibe Frank, Morgan Kaufmann. Data Mining: Practical Machine Learning Tools and Techniques, 2005.Katti Faceli, Ana Carolina Lorena, João Gama e André C. P. L. F. de Carvalho. Inteligência Artificial Uma Abordagem de Aprendizado de Máquina, LTC, 2011.Olivia Park Rud, Data Mining Cookbook- Modeling Data for Marketing, Risk, and Customer Relationship Management. Wiley, 2001. Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to Data Mining, Addison Wesley, 2005.