Oferecer uma visão ampla de técnicas de mineração de dados e suas aplicações na análise de dados biomédicos. Os estudantes ganham habilidade prática na seleção, aplicação e avaliação de algoritmos de mineração de dados ao analisar conjuntos de dados biológicos e clínicos.
O processo de mineração de dados. Pré-processamento, mineração e pós-processamento de dados. Aprendizado por memorização. Árvores de decisão. Classificadores baseados em regras. Avaliação do conhecimento descoberto e comparação de classificadores. Mineração de regras de associação. Agrupamento de dados (clustering).
O que é a mineração de dados, suas relações com outros campos. Levantamento das principais técnicas e aplicações. Exploração de dados. Pré-processamento de dados: agregação, amostragem, discretização e seleção de atributos. Família de algoritmos baseados em memorização. Algoritmo de indução de árvores de decisão: o que são árvores de decisão, como selecionar a melhor divisão, como lidar com valores contínuos e atributos faltantes, super-ajuste (overfitting). Algoritmos que induzem classificadores baseados em regras: o que é uma regra de classificação, avaliação de uma regra. Medidas de avaliação do desempenho de um classificador, custos de classificação incorreta, o problema do desequilíbrio de classes, validação cruzada, bootstrap, comparação de classificadores. Mineração de regras de associação: o algoritmo Apriori. Conceitos básicos sobre agrupamentos. Similaridade e medidas de dissimilaridade. Validação de agrupamentos. Agrupamento hierárquico. Aplicações em Biomedicina.
1. WITTEN, I. H. & FRANK, E., Data Mining: Practical Machine Learning Tools and Techniques, 3rd ed., Morgan Kaufmann, 2011. 2. HAN, Jiawei & KAMBER, Micheline. Data Mining Concepts and Techniques, 2nd ed, Morgan Kaufmann, 2006. 3. RUSSEL, Stuart J. & NORVIG, Peter. Inteligência Artificial, 2ª edição, Campus, 2004. ISBN: 8-535-21177-2. 4. REZENDE, S.O. (ed). Sistemas Inteligentes, Manole, 2003, ISBN 85-204-1683-7. 5. QUINLAN, J. R., C4.5: Programs for Machine Learning, Morgan Kaufmann, 1993. 6. BREIMAN, L., Classification and Regression Trees, CRC Press, 1983. 7. MITCHELL, T. M., Machine Learning, McGraw-Hill, 1997. 8. BERKA, Petr; RAUCH, Jan & ZIGHED, Djamel Abdelkader. Data Mining and medical knowledge management: cases and applications, Medical Information Science, 2009. 9. CHERKASSKY, Vladimir & MULIER, Filip. Learning from data, 2nd ed, IEEE Press, 2007. 10. WEISS, S. M. & INDURKIHYA, N., Predictive Data Mining, Morgan Kaufmann, 1998. 11. MORIK, K.; WROBEL, S. & KIETZ, J., Knowledge Aquisition and Machine Learning, Academic Press, 1994. 12. LANGLEY, P., Elements of Machine Learning, Morgan Kaufman, 1996. 13. HASTIE, T., TIBSHIRANI, R., FRIEDMAN, J. H., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer Verlag, 2001.