Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto
 
Computação e Matemática
 
Disciplina: 5955005 - Mineração de Dados
Data Mining

Créditos Aula: 4
Créditos Trabalho: 2
Carga Horária Total: 120 h
Tipo: Semestral
Ativação: 01/01/2019 Desativação:

Objetivos
Oferecer uma visão ampla de técnicas de mineração de dados e suas aplicações na análise de dados biomédicos. Os
estudantes ganham habilidade prática na seleção, aplicação e avaliação de algoritmos de mineração de dados ao analisar
conjuntos de dados biológicos e clínicos.
 
 
 
Docente(s) Responsável(eis)
1164815 - José Augusto Baranauskas
 
Programa Resumido
O processo de mineração de dados. Pré-processamento, mineração e pós-processamento de dados. Aprendizado por
memorização. Árvores de decisão. Classificadores baseados em regras. Avaliação do conhecimento descoberto e comparação
de classificadores. Mineração de regras de associação. Agrupamento de dados (clustering).
 
 
 
Programa
O que é a mineração de dados, suas relações com outros campos. Levantamento das principais técnicas e aplicações.
Exploração de dados. Pré-processamento de dados: agregação, amostragem, discretização e seleção de atributos. Família de
algoritmos baseados em memorização. Algoritmo de indução de árvores de decisão: o que são árvores de decisão, como
selecionar a melhor divisão, como lidar com valores contínuos e atributos faltantes, super-ajuste (overfitting). Algoritmos que
induzem classificadores baseados em regras: o que é uma regra de classificação, avaliação de uma regra. Medidas de avaliação
do desempenho de um classificador, custos de classificação incorreta, o problema do desequilíbrio de classes, validação
cruzada, bootstrap, comparação de classificadores. Mineração de regras de associação: o algoritmo Apriori. Conceitos básicos
sobre agrupamentos. Similaridade e medidas de dissimilaridade. Validação de agrupamentos. Agrupamento hierárquico.
Aplicações em Biomedicina.
 
 
 
Avaliação
     
Método
Aulas teóricas e práticas complementadas com exemplos e exercícios propostos.
Critério
A nota final será dada pela nota no trabalho prático que deve ser realizado pelo aluno no decorrer do semestre
Norma de Recuperação
Uma prova escrita dentro do prazo regimental. A nota da segunda avaliação será a média aritmética entre a nota da prova de recuperação e a nota final da primeira avaliação. O aluno será aprovado se obtiver nota na segunda avaliação igual ou superior a 5,0 (cinco).
 
Bibliografia
     
1. WITTEN, I. H. & FRANK, E., Data Mining: Practical Machine Learning Tools and Techniques, 3rd ed., Morgan Kaufmann,
2011.
2. HAN, Jiawei & KAMBER, Micheline. Data Mining Concepts and Techniques, 2nd ed, Morgan Kaufmann, 2006.
3. RUSSEL, Stuart J. & NORVIG, Peter. Inteligência Artificial, 2ª edição, Campus, 2004. ISBN: 8-535-21177-2.
4. REZENDE, S.O. (ed). Sistemas Inteligentes, Manole, 2003, ISBN 85-204-1683-7.
5. QUINLAN, J. R., C4.5: Programs for Machine Learning, Morgan Kaufmann, 1993.
6. BREIMAN, L., Classification and Regression Trees, CRC Press, 1983.
7. MITCHELL, T. M., Machine Learning, McGraw-Hill, 1997.
8. BERKA, Petr; RAUCH, Jan & ZIGHED, Djamel Abdelkader. Data Mining and medical knowledge management: cases and
applications, Medical Information Science, 2009.
9. CHERKASSKY, Vladimir & MULIER, Filip. Learning from data, 2nd ed, IEEE Press, 2007.
10. WEISS, S. M. & INDURKIHYA, N., Predictive Data Mining, Morgan Kaufmann, 1998.
11. MORIK, K.; WROBEL, S. & KIETZ, J., Knowledge Aquisition and Machine Learning, Academic Press, 1994.
12. LANGLEY, P., Elements of Machine Learning, Morgan Kaufman, 1996.
13. HASTIE, T., TIBSHIRANI, R., FRIEDMAN, J. H., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer Verlag, 2001.
 

Clique para consultar os requisitos para 5955005

Clique para consultar o oferecimento para 5955005

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP