Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Instituto de Matemática e Estatística
 
Ciência da Computação
 
Disciplina: MAC0476 - Laboratório Avançado de Ciência de Dados
Advanced Data Science Laboratory

Créditos Aula: 4
Créditos Trabalho: 2
Carga Horária Total: 120 h
Tipo: Semestral
Ativação: 15/07/2022 Desativação:

Objetivos
Destinada a alunos que já possuam conhecimentos básicos de Ciência de Dados, esta disciplina tem como objetivo desenvolver práticas avançadas para a resolução de questões de pesquisas avançadas em Ciências de Dados. Os alunos trabalharão em problemas reais propostos por cientistas e profissionais de áreas tais como Educação, Economia, Saúde, Mobilidade, Urbanismo e Logística, desenvolvendo soluções criativas e inovadoras com potencial de impacto social e em políticas públicas. Ao final da disciplina, o aluno terá adquirido experiência prática no desenvolvimento de sistemas computacionais envolvendo Ciência de Dados de forma focada em responder a uma questão de pesquisa específica proposta por um especialista da área de aplicação. 
 
Targeted at students who already have basic knowledge of Data Science, this course aims to develop advanced practices for solving advanced research questions in Data Sciences. Students will work on real problems proposed by scientists and professionals in areas such as Education, Economics, Health, Mobility, Urbanism, and Logistics, developing creative and innovative solutions with a potential for social impact and supporting public policymaking. At the end of the course, the student will have acquired practical experience in developing computer systems involving Data Science to answer a specific research question proposed by a domain expert.
 
 
Docente(s) Responsável(eis)
84724 - Fabio Kon
2017173 - Roberto Hirata Junior
 
Programa Resumido
Coleta, filtragem, armazenamento, análise, processamento e visualização de dados. Aprendizado de Máquina. Projeto prático de implementação baseado em requisitos apresentados por especialista de domínio externo. Ética e privacidade. 
 
Data collection, filtering, storage, analysis, processing, and visualization. Machine Learning. Practical hands-on project based on requirements brought by an external domain expert. Ethics and privacy.
 
 
Programa
1) Revisão de conceitos de coleta, filtragem, armazenamento, análise, processamento e visualização de dados, 2) Revisão de conceitos de aprendizado de máquina, 3) Ferramentas computacionais para coleta, filtragem, armazenamento, análise, processamento e visualização de dado, 4) Bibliotecas para aprendizado de máquina, 5) Projeto prático de implementação de sistema computacional de ciência de dados desenvolvido com o objetivo específico de responder a um conjunto de questões de pesquisa proposta por um especialista convidado. 6) Ética e privacidade. 7) Divulgação científica e jornalismo de Dados. 8) Redação de artigos científicos em ciência de dados.
 
1) Recapitulation of the concepts of data collection, filtering, storage, analysis, processing, and visualization. 2) Recapitulation of Machine Learning, 3) Computational tools and libraries for data collection, filtering, storage, analysis, processing, and visualization, 4) Machine learning libraries, 5) Practical hands-on project implementing a data science computational system developed to answering to research questions elaborated by an external invited expert in a specific domain. 6) Ethics and privacy. 7) Popular scientific dissemination and data journalism. 8) Scientific paper writing in data science.
 
 
Avaliação
     
Método
Média ponderada de trabalhos, seminários e projeto.
Critério
MF = MT*pt + MPS*ps + MP*pp
Norma de Recuperação
Alunos que tiverem sua média final entre 3,0 e 4,9 farão um trabalho extra para entrega no período de recuperação.
 
Bibliografia
     
Bibliografia básica: 
1. David Donoho. "50 Years of Data Science". Journal of Computational and Graphical Statistics, 26(4), 2017. 
2. Cao, Longbing. "Data science: a comprehensive overview." ACM Computing Surveys (CSUR) 50(3), 2017. 
3. Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms, 2nd Edition, Cambridge University Press, March 2020. (versão online)

Bibliografia complementar: 
1. Wil Van Der Aalst. Process Mining - Data science in action. Springer, Berlin, Heidelberg, 2016. 
2. Martin Kleppmann. "Designing Data-Intensive Applications: The Big Ideas Behind Reliable Scalable, and Maintainable Systems", O'Reilly Media, 2017. 
3. Aurélien Géron, "Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems". O'Reilly Media, 2017. 
 

Clique para consultar os requisitos para MAC0476

Clique para consultar o oferecimento para MAC0476

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP