90912 - Programação Python para Ciência de Dados |
Período da turma: | 21/09/2019 a 29/02/2020
|
||||
|
|||||
Descrição: | Sumário da ementa (programa completo anexo):
1. Ambiente de Programação: python 3, jupyter notebook, pacotes e github 2. Python I: tipos de dados, sequências e operações, estruturas de controle e repetição 3. Python II: referências, funções, funções avançadas e comprehention 4. Python III: I/O e noções básicas de classes e objetos 5. Numpy I: array, slicing, fancy index, copy and view 6. Pandas I: dataframes, series, index, Pandas I/O (csv, json, excell) 7. Numpy II e Matplotlib: operações com array, broadcasting, construção de gráficos usuais 8. Pandas II: limpeza de dados 9. Scikit learn: introdução a mecanismos de clustering, regressão e classificação 10. Web Crawler: request e funcionalidades associadas Programação Python para Ciência de Dados O curso de extensão será ministrado em 5 módulos com 4 horas cada módulo. Os módulos serão divididos em 2 horas de aula expositivas seguidas de 2 horas de aulas práticas. Cada módulo conta ainda com uma lista de exercícios, sendo que um dos exercícios será escolhido para ser entregue e servirá como critério de aprovação. O curso possui um foco bastante prático, encorajando a solução de problemas reais. Desta forma, a carga horário do curso fica assim distribuída: • 10 horas de aulas expositivas (2 horas por módulo) • 10 horas de aulas práticas em sala de aula (2 horas por módulo) • 10 horas de solução de exercícios práticos. O conteúdo dos módulos está organizado como segue: Módulo 1: 1.1 Ambiente de Programação: python 3, jupyter notebook, pacotes e github 1.2. Python I: tipos de dados, sequências e operações, estruturas de controle e repetição 1.3 Prática dos conteúdos estudados: construindo e operando listas e strings Módulo 2: 2.1 Python II: referências, funções, funções avançadas e comprehention 2.2 Python III: I/O e noções básicas de classes e objetos 2.3 Prática dos conteúdos estudados: construindo um pequeno pacote para manipular arquivos texto. Módulo 3: 3.1 Numpy I: array, slicing, fancy index, copy and view 3.2 Pandas I: dataframes, series, index, Pandas I/O (csv, json, excell) 3.3 Prática dos conteúdos estudados: Processando e extraindo informações de arquivos csv Módulo 4: 4.1 Numpy II e Matplotlib: operações com array, broadcasting, construção de gráficos usuais 4.2 Pandas II: limpeza de dados e estatísticas básicas 4.3 Prática dos conteúdos estudados: manipulando dados do ensino médio Módulo 5: 5.1 Scikit learn: introdução a mecanismos de clustering, regressão e classificação 5.2 Web Crawler: request e funcionalidades associadas 5.3 Prática dos conteúdos estudados: clusterizando e predizendo o desempenho de escolas do ensino médio Bibliografia: - Wes McKinny, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd edition O'Reilly Media, 2017 - Mark Lutz, Learning Python, 5th Edition, O'Reilly Media, 2013 |
||||
Carga Horária: |
46 horas |
||||
Tipo: | Obrigatória | ||||
Vagas oferecidas: | 150 | ||||
Ministrantes: |
Luis Gustavo Nonato |
voltar |
Créditos © 1999 - 2024 - Superintendência de Tecnologia da Informação/USP |