Área de Concentração: 45134
Concentration area: 45134
Criação: 14/06/2019
Creation: 14/06/2019
Ativação: 14/06/2019
Activation: 14/06/2019
Nr. de Créditos: 8
Credits: 8
Carga Horária:
Workload:
Teórica (por semana) |
Theory (weekly) |
Prática (por semana) |
Practice (weekly) |
Estudos (por semana) |
Study (weekly) |
Duração | Duration | Total | Total |
---|---|---|---|---|---|---|---|---|---|
4 | 2 | 4 | 12 semanas | 12 weeks | 120 horas | 120 hours |
Docentes Responsáveis:
Professors:
João Eduardo Ferreira
Nina Sumiko Tomita Hirata
Roberto Marcondes Cesar Junior
Roberto Hirata Junior
Objetivos:
Ao final da disciplina o aluno deverá saber os fundamento e as técnicas para manipulação, representação, análise, modelagem e validação de grandes conjuntos de dados.
Justificativa:
A facilidade da coleta de dados alcançada pela civilização atual nos impõe um grande desafio: armazenar, representar, analisar e modelar o que usualmente é conhecido como "avalanche de dados". A formação dos pós-graduandos em Ciência da Computação não pode dispensar o conhecimento dos referidos fundamentos e técnicas proporcionados por esta disciplina.
Conteúdo:
Importância da área e de suas aplicações. Processo de descoberta do conhecimento (KDD) em conjuntos de dados. Tratamento, representação e qualificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Indexação e recuperação de grande volumes de dados. Grafos em Bancos de Dados. Análise exploratória de dados (análise de agrupamentos e associações de dados). Modelagem de conhecimento (classificadores, regras de classificação, exemplos). Desenvolvimento e uso de software para KDD. Exercícios com utilização de dados simulados e reais.
Forma de Avaliação:
Provas escritas e exercícios programados.
Bibliografia:
1) Inmon, W. H. Building the Data Warehouse. Wiley, 2005. 2) Kantardzic, M.. Data Mining: Concepts, Models, Methods, and Algorithms. Wiley-Interscience, 2003. 3) Kimball, R. Data Warehouse Toolkit. Makron Books, 1997. 4) Baeza-Yates, Ricardo e Ribeiro-Neto, Berthier. Modern Information Retrieval: The Concepts and Technology behind Search (2nd Edition) (ACM Press Books), 2011. 5) Snodgrass, R. T. Developing time-oriented database applications in SQL. Morgan Kaufmann Publishers Inc, 2000. 6) Tan, P.-N., Steinbach, M., Kumar, V. Introdução ao Data Mining. Ciência Moderna, 2009. 7) Torgo, Luis. Data Mining with R: Learning with Case Studies (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series). 2010 8) Witten, I., Frank, E. Data Mining: practical machine learning tools and techniques with java implementations. The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publishers Inc, , 2006. 9) Dominich, Sándor. The Modern Algebra of Information Retrieval (The Information Retrieval Series). Springer, 2010. 10) Manning, Christopher D; Raghavan, Prabhakar; Schütze , Hinrich. An Introduction to Information Retrieval . Online edition, Cambridge, 2009. 11) Robinson, Ian; Webber Jim; Eifrem, Emil. Graph Databases. O’Reilly Media, Inc. 2013.
Tipo de oferecimento da disciplina:
Presencial
Class type:
Presencial