O curso tem como objetivo introduzir conceitos de ciência de dados, visando principalmente oferecer os fundamentos necessários para para que o estudante tenha uma visão geral do tema.
Introdução ao Python, exemplos de problemas reais em Ciência de Dados, dados e seus problemas, introdução ao aprendizado de máquina.
- Exemplos e aplicações de ciência de dados. - Introdução ao método científico. - Python para Ciência de Dados: comandos básicos, tipos de dados, estruturas de dados, funções, visualização de dados, tipos de gráficos, bibliotecas principais: Numpy, Pandas, Scikit Learn. - Tipos de dados: dados estruturados e não-estruturados, séries temporais, imagens. Leitura, escrita e manipulação de dados no Python. - Limpeza e tratamento de dados: tratamento de atributos faltantes, dados com ruídos, one-hot- encoding. Exemplos em Python. - Análise exploratória de dados: medidas de posição e dispersão (média, moda, mediana e variância), medidas de correlação. - Introdução ao aprendizado supervisionado: Classificação: k-vizinhos mais próximos, árvore de decisão; Regressão: k-vizinhos mais próximos; Medidas de avaliação: funções perda e custo.; Conceitos de overfitting e seleção de modelos. Validação cruzada. - Introdução ao aprendizado não supervisionado: método k-médias, agrupamento hierárquico. - Questões éticas em ciência de dados
Livro- texto: - Moreira, João, André Carlos Ponce de Leon Ferreira, and Tomáš Horváth. A general introduction to data analytics. Wiley, 2019. - Lutz, Mark. Learning python: Powerful object-oriented programming. " O'Reilly Media, Inc.", 2013. Bibliografia Complementar: - Saltz, Jeffrey S., and Jeffrey M. Stanton. An introduction to data science. Sage Publications, 2017.