Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Instituto de Matemática e Estatística
 
Ciência da Computação
 
Disciplina: MAC0459 - Ciência e Engenharia de Dados
Data Science and Engineering

Créditos Aula: 4
Créditos Trabalho: 0
Carga Horária Total: 60 h
Tipo: Semestral
Ativação: 01/01/2021 Desativação:

Objetivos
Ao final da disciplina o aluno deverá saber os fundamentos e as técnicas para manipulação, análise, representação, validação e processamento de grandes volumes de dados.
 
By the end of the discipline the pupil must know the foundations and main techniques to manipulate, analyse, represent, validate and process large quantities of data.
 
 
Docente(s) Responsável(eis)
827412 - João Eduardo Ferreira
3150657 - Kelly Rosa Braghetto
1620932 - Nina Sumiko Tomita Hirata
2017173 - Roberto Hirata Junior
1914321 - Roberto Marcondes Cesar Junior
 
Programa Resumido
Importância da área e de suas aplicações. Processo de descoberta do conhecimento. Tratamento, representação e qualificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Noções de Redes de Petri e Álgebra de Processos.  Modelagem e implementação de workflows científicos e processos de negócio. Indexação e recuperação de grandes volumes de dados. Análise exploratória de dados. Redes complexas e bancos de dados orientado a grafos. Exercícios com utilização de dados simulados e reais.
 
Importance of the area and its applications. Knowledge Discovery in Databases (KDD). Treatment, representation and qualification of large quantities of data. Data storage and multidimensional modeling. Notions of Petri Networks and Process Algebra. Modeling and implementation of scientific workflows and business processes. Indexing and recovery of large data quantities. Exploratory data analysis. Complex networks and graph oriented data bases. Exercises using simulated and real data.
 
 
Programa
Importância da área e de suas aplicações. 
Processo de descoberta do conhecimento (KDD). 
Tratamento, representação e qualificação de grande volumes de dados. 
Armazém de dados e modelos multidimensionais. 
Noções de Redes de Petri e Álgebra de Processos.  
Modelagem e implementação de workflows científicos e processos de negócio. 
Indexação e recuperação de grandes volumes de dados. 
Análise exploratória de dados. 
Redes complexas e bancos de dados orientado a grafos. 
Exercícios com utilização de dados simulados e reais.
 
Importance of the area and its applications. Knowledge Discovery in Databases (KDD). Treatment, representation and qualification of large quantities of data. Data storage and multidimensional modeling. Notions of Petri Networks and Process Algebra. Modeling and implementation of scientific workflows and business processes. Indexing and recovery of large data quantities. Exploratory data analysis. Complex networks and graph oriented data bases. Exercises using simulated and real data.
 
 
Avaliação
     
Método
Média ponderada de provas e exercícios
Critério
Média geral deve ser maior ou igual a 5 para aprovação.
Norma de Recuperação
Em caso de média geral maior ou igual a 3 e menor que 5, a nova média geral consiste de uma média ponderada entre a média geral e uma prova de recuperação.
 
Bibliografia
     
Bibliografia Básica:

Skiena, S., The Data Science Design Manual (versão online aberta)

Notas de Aula do Professor.

Bibliografia Complementar: 

W. H. Inmon, Building the Data Warehouse, Wiley, 2005. 

M. Kantardzic, Data Mining: Concepts, Models, Methods, and Algorithms, Wiley-Interscience, 2003. 

R. Kimball, Data Warehouse Toolkit, Makron Books, 1997. 

R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval: The Concepts and Technology behind Search, 2nd ed., ACM Press Books, 2011. 

W. Fokkink, Introduction to Process Algebra, Springer, 2000. 

W. van der Aalst, C. Stahl, Modeling Business Processes: A Petri Net- Oriented Approach, The MIT Press, 2011. 

W. van der Aalst, K. van Hees, Workflow Management: Models, Methods, and Systems, The MIT Press, 2004.

I.J. Taylor, E. Deelman, D.B. Gannon, M. Shields (Eds.), Workflows for e- Science: Scientific Workflows for Grids, Springer, 2006. 

P.-N. Tan, M. Steinbach, V. Kumar, Introdu¸ão ao Data Mining. Ciência Moderna, 2009.

S. Dominich, The Modern Algebra of Information Retrieval (The Information Retrieval Series), Springer, 2010. 

C.D. Manning, P. Raghavan, H. Schütze, An Introduction to Information Retrieval, Online edition, Cambridge, 2009. 

I. Robinson, J. Webber, E. Eifrem, Graph Databases, O’Reilly Media, 2013. 

Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman. Stanford University, 2010.
 

Clique para consultar os requisitos para MAC0459

Clique para consultar o oferecimento para MAC0459

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP