Destinada a alunos que já possuam conhecimentos básicos de Ciência de Dados, esta disciplina tem como objetivo desenvolver práticas avançadas para a resolução de questões de pesquisas avançadas em Ciências de Dados. Os alunos trabalharão em problemas reais propostos por cientistas e profissionais de áreas tais como Educação, Economia, Saúde, Mobilidade, Urbanismo e Logística, desenvolvendo soluções criativas e inovadoras com potencial de impacto social e em políticas públicas. Ao final da disciplina, o aluno terá adquirido experiência prática no desenvolvimento de sistemas computacionais envolvendo Ciência de Dados de forma focada em responder a uma questão de pesquisa específica proposta por um especialista da área de aplicação.
Coleta, filtragem, armazenamento, análise, processamento e visualização de dados. Aprendizado de Máquina. Projeto prático de implementação baseado em requisitos apresentados por especialista de domínio externo. Ética e privacidade.
1) Revisão de conceitos de coleta, filtragem, armazenamento, análise, processamento e visualização de dados, 2) Revisão de conceitos de aprendizado de máquina, 3) Ferramentas computacionais para coleta, filtragem, armazenamento, análise, processamento e visualização de dado, 4) Bibliotecas para aprendizado de máquina, 5) Projeto prático de implementação de sistema computacional de ciência de dados desenvolvido com o objetivo específico de responder a um conjunto de questões de pesquisa proposta por um especialista convidado. 6) Ética e privacidade. 7) Divulgação científica e jornalismo de Dados. 8) Redação de artigos científicos em ciência de dados.
Bibliografia básica: 1. David Donoho. "50 Years of Data Science". Journal of Computational and Graphical Statistics, 26(4), 2017. 2. Cao, Longbing. "Data science: a comprehensive overview." ACM Computing Surveys (CSUR) 50(3), 2017. 3. Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Machine Learning: Fundamental Concepts and Algorithms, 2nd Edition, Cambridge University Press, March 2020. (versão online) Bibliografia complementar: 1. Wil Van Der Aalst. Process Mining - Data science in action. Springer, Berlin, Heidelberg, 2016. 2. Martin Kleppmann. "Designing Data-Intensive Applications: The Big Ideas Behind Reliable Scalable, and Maintainable Systems", O'Reilly Media, 2017. 3. Aurélien Géron, "Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems". O'Reilly Media, 2017.