Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Instituto de Ciências Matemáticas e de Computação
 
Matemática Aplicada e Estatística
 
Disciplina: SME0878 - Mineração Estatística de Dados
Statistical Data Mining

Créditos Aula: 4
Créditos Trabalho: 2
Carga Horária Total: 120 h
Tipo: Semestral
Ativação: 01/01/2024 Desativação:

Objetivos
Apresentar ao aluno os principais conceitos e técnicas de mineração estatística de dados. A teoria será desenvolvida com aplicações em várias área do conhecimento, dentre as quais, biologia, economia, engenharia, finanças e medicina.
 
Introduced to the students with the key concepts and techniques of statistical data mining . The theory will be developed with applications in several areas of knowledge , among which , biology , economics, engineering , finance and medicine.
 
 
Docente(s) Responsável(eis)
2950182 - Francisco Aparecido Rodrigues
1595890 - Mariana Cúri
 
Programa Resumido
Introdução à mineração de dados. Análise estatística de dados. O processo de descoberta do conhecimento. Segmentação de sumarização de dados. Métodos de classificação supervisionada. Medidas de capacidade preditiva. Análise de associação. Análise de agrupamentos. Métodos de redução de dimensionalidade. Técnicas de seleção de atributos. Combinação de classificadores.
 
Introduction to data mining . Statistical analysis of data. The process of knowledge discovery . Segmentation data summarization . Methods of supervised classification . Measures of predictive ability . Association analysis . Cluster analysis . Methods of dimensionality reduction . Feature selection techniques . Combination of classifiers .
 
 
Programa
Introdução à mineração de dados. Mineração de dados e análise estatística. Importância do banco de dados. O Processo KDD. Procedimentos de segmentação de base. Sumarização. Modelos supervisionados de classificação. Modelos pontuais e predição, regressão logística, regressão probito, regressão logística limitada. Modelos temporais de predição; estimadores empíricos da função de sobrevivência e da função de risco, modelos paramétricos básicos, estimação, compração de modelos. Medidas de capacidade preditiva. Análise de associação. Análise de Agrupamentos. Redução de dimensionalidade. Seleção de atributos. Combinação de classificadores.

Atividades de extensão: Desenvolvimento de projetos práticos de interesse da sociedade ou de um pesquisador/empresa, para serem conduzidos por Problem-based Learning (PBL), captado pelo Núcleo de Estatística Aplicada (NEA), Centro de Ciências Matemáticas Aplicadas à Industria (CeMEAI) ou outros centros de pesquisa. Estas atividades correspondem a 60 horas de atividades de extensão.
A disciplina poderá ser oferecida de forma híbrida, sendo parte das atividades desenvolvidas remotamente.
 
Introduction to data mining . Data mining and statistical analysis . Importance of the database . The KDD process . Procedures based segmentation . Summarization. Supervised classification models . Punctual and prediction models , logistic regression , probit regression , logistic regression limited . Temporal prediction models , empirical estimates of the survival function and the hazard function , basic parametric models , estimation , compração models . Measures of predictive ability . Association analysis . Cluster Analysis . Dimensionality reduction . Selection of attributes . Combination of classifiers .
 
 
Avaliação
     
Método
A avaliação será realizada por um ou mais dos seguintes meios:
- Provas individuais
- Trabalhos ou exercícios realizados individualmente ou em grupo
- Estudos de casos em grupos
- Apresentação de seminários individualmente ou em grupo
Critério
Provas e exercícios, dentro e fora da classe.
Norma de Recuperação
Número de provas: no mínimo uma (01) e no máximo duas (02) provas.
Critério de aprovação: a nota final (MF) do aluno que realizou provas de recuperação dependerá da média do semestre (MS) e da média das provas de recuperação (MR), como segue:
MF = 5 se 5 <= MR <= (10 - MS)
MF = (MS + MR) / 2 se MR > (10 - MS)
MF = MS se MR< 5
 
Bibliografia
     
Livros texto:
Francisco Louzada-Neto e Carlos A. R. Diniz . Técnicas Estatísticas em Data Mining. IMCA, Lima , 2002.
Sergios Theodoridis, Konstantinos Koutroumbas. Pattern Recognition, Academic Press; 4 edition, 2008.
Trevor Hastie, Robert Tibshirani and Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer-Verlag, 2001.

Bibliografia complementar:
Christopher M. Bishop. Pattern Recognition and Machine Learning, Springer, 2007.
Ian H. Witten, Eibe Frank, Morgan Kaufmann. Data Mining: Practical Machine Learning Tools and Techniques, 2005.
Katti Faceli, Ana Carolina Lorena, João Gama e André C. P. L. F. de Carvalho. Inteligência Artificial Uma Abordagem de Aprendizado de Máquina, LTC, 2011.
Olivia Park Rud, Data Mining Cookbook- Modeling Data for Marketing, Risk, and Customer Relationship Management. Wiley, 2001.
Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to Data Mining, Addison Wesley, 2005.
 

Clique para consultar os requisitos para SME0878

Clique para consultar o oferecimento para SME0878

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP