Atividade

107030 - Análise de dados com base em processamento massivo em paralelo

Período da turma: 30/09/2023 a 02/12/2023

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivos:


Fornecer aos alunos uma visão ampla sobre os objetivos, conceitos, fundamentos e ferramentas voltados à análise de dados em larga escala.

Ementa:


1. Business intelligence: measures, reporting, analytics, collaboration, management.
2. Infraestrutura de comunicação: Conceitos de aplicação de redes, Protocolos web, Nuvem computacional.
3. Infraestrutura de alto desempenho: Paralelismo e distribuição; Clusters computacionais; Submissão e controle de tarefas em clusters.
4. Big Data: definition, use, challenges,
5. Big Data Warehousing
6. Architecture of the data warehousing: operational tier (OLTP - on line analytical processing), access tier, enterprise data warehouse tier, analytical tier (OLAP: on line analytical processing), metadata.
7. Multidimensional Modeling: concept of cube, static characteristics, analytical operations, ROLAP (relational OLAP) systems, materialized views.
8. Map-Reduce: concepts, algorithmic model, main processing algorithms. Most used commercial frameworks.
9. Distributed systems for large-scale processing.
10. Large-scale data analysis: frameworks for analytical processing.
11. Processamento massivo em prática com python: Hadoop e pySpark.


Referências:


12. KIMBALL, R., ROSS, M. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd edition. John Wiley and Sons, Inc., 2002.
13. CIFERRI, C., CIFERRI, R., GÓMEZ, L., SCHNEIDER, M., VAISMAN, A., ZIMÁNYI, E. Cube algebra: A generic user-centric model and query language for OLAP cubes. Journal of Data Warehousing and Mining, v. 9, n. 2, p. 39-65, 2013.
14. VAISMANN, A., ZIMÁNYI, E. Data Warehouse Systems: Design and Implementation, 1st edition. Springer, 2014.
15. LINSTEDT, D., OLSCHIMKE, M. Building a Scalable Data Warehouse with Data Vault 2.0, 1st edition. Morgan Kaufmann, 2015.
16. WHITE, T. Hadoop: The Definitive Guide, Storage and Analysis at Internet Scale, 4th Edition. O'Reilly Media, 2015.

Carga Horária:

40 horas
Tipo: Obrigatória
Vagas oferecidas: 320
 
Ministrantes: Cristina Dutra de Aguiar


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP