Disciplina Discipline MAC5865
Tópicos em Ciência e Engenharia de Dados

Topics in Data Science and Engineering

Área de Concentração: 45134

Concentration area: 45134

Criação: 14/06/2019

Creation: 14/06/2019

Ativação: 14/06/2019

Activation: 14/06/2019

Nr. de Créditos: 8

Credits: 8

Carga Horária:

Workload:

Teórica

(por semana)

Theory

(weekly)

Prática

(por semana)

Practice

(weekly)

Estudos

(por semana)

Study

(weekly)

Duração Duration Total Total
4 2 4 12 semanas 12 weeks 120 horas 120 hours

Docentes Responsáveis:

Professors:

João Eduardo Ferreira

Nina Sumiko Tomita Hirata

Roberto Marcondes Cesar Junior

Roberto Hirata Junior

Objetivos:

Ao final da disciplina o aluno deverá saber os fundamento e as técnicas para manipulação, representação, análise, modelagem e validação de grandes conjuntos de dados.

Justificativa:

A facilidade da coleta de dados alcançada pela civilização atual nos impõe um grande desafio: armazenar, representar, analisar e modelar o que usualmente é conhecido como "avalanche de dados". A formação dos pós-graduandos em Ciência da Computação não pode dispensar o conhecimento dos referidos fundamentos e técnicas proporcionados por esta disciplina.

Conteúdo:

Importância da área e de suas aplicações. Processo de descoberta do conhecimento (KDD) em conjuntos de dados. Tratamento, representação e qualificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Indexação e recuperação de grande volumes de dados. Grafos em Bancos de Dados. Análise exploratória de dados (análise de agrupamentos e associações de dados). Modelagem de conhecimento (classificadores, regras de classificação, exemplos). Desenvolvimento e uso de software para KDD. Exercícios com utilização de dados simulados e reais.

Forma de Avaliação:

Provas escritas e exercícios programados.

Bibliografia:

1) Inmon, W. H. Building the Data Warehouse. Wiley, 2005. 2) Kantardzic, M.. Data Mining: Concepts, Models, Methods, and Algorithms. Wiley-Interscience, 2003. 3) Kimball, R. Data Warehouse Toolkit. Makron Books, 1997. 4) Baeza-Yates, Ricardo e Ribeiro-Neto, Berthier. Modern Information Retrieval: The Concepts and Technology behind Search (2nd Edition) (ACM Press Books), 2011. 5) Snodgrass, R. T. Developing time-oriented database applications in SQL. Morgan Kaufmann Publishers Inc, 2000. 6) Tan, P.-N., Steinbach, M., Kumar, V. Introdução ao Data Mining. Ciência Moderna, 2009. 7) Torgo, Luis. Data Mining with R: Learning with Case Studies (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series). 2010 8) Witten, I., Frank, E. Data Mining: practical machine learning tools and techniques with java implementations. The Morgan Kaufmann Series in Data Management Systems. Morgan Kaufmann Publishers Inc, , 2006. 9) Dominich, Sándor. The Modern Algebra of Information Retrieval (The Information Retrieval Series). Springer, 2010. 10) Manning, Christopher D; Raghavan, Prabhakar; Schütze , Hinrich. An Introduction to Information Retrieval . Online edition, Cambridge, 2009. 11) Robinson, Ian; Webber Jim; Eifrem, Emil. Graph Databases. O’Reilly Media, Inc. 2013.

Tipo de oferecimento da disciplina:

Presencial

Class type:

Presencial