Atividade

90912 - Programação Python para Ciência de Dados

Período da turma: 21/09/2019 a 29/02/2020

Selecione um horário para exibir no calendário:
 
 
Descrição: Sumário da ementa (programa completo anexo):
1. Ambiente de Programação: python 3, jupyter notebook, pacotes e github
2. Python I: tipos de dados, sequências e operações, estruturas de controle e repetição
3. Python II: referências, funções, funções avançadas e comprehention
4. Python III: I/O e noções básicas de classes e objetos
5. Numpy I: array, slicing, fancy index, copy and view
6. Pandas I: dataframes, series, index, Pandas I/O (csv, json, excell)
7. Numpy II e Matplotlib: operações com array, broadcasting, construção de gráficos usuais
8. Pandas II: limpeza de dados
9. Scikit learn: introdução a mecanismos de clustering, regressão e classificação
10. Web Crawler: request e funcionalidades associadas

Programação Python para Ciência de Dados

O curso de extensão será ministrado em 5 módulos com 4 horas cada módulo. Os módulos serão divididos em 2 horas de aula expositivas seguidas de 2 horas de aulas práticas. Cada módulo conta ainda com uma lista de exercícios, sendo que um dos exercícios será escolhido para ser entregue e servirá como critério de aprovação. O curso possui um foco bastante prático, encorajando a solução de problemas reais.

Desta forma, a carga horário do curso fica assim distribuída:

• 10 horas de aulas expositivas (2 horas por módulo)
• 10 horas de aulas práticas em sala de aula (2 horas por módulo)
• 10 horas de solução de exercícios práticos.

O conteúdo dos módulos está organizado como segue:

Módulo 1:
1.1 Ambiente de Programação: python 3, jupyter notebook, pacotes e github
1.2. Python I: tipos de dados, sequências e operações, estruturas de controle e repetição
1.3 Prática dos conteúdos estudados: construindo e operando listas e strings

Módulo 2:
2.1 Python II: referências, funções, funções avançadas e comprehention
2.2 Python III: I/O e noções básicas de classes e objetos
2.3 Prática dos conteúdos estudados: construindo um pequeno pacote para manipular arquivos texto.

Módulo 3:
3.1 Numpy I: array, slicing, fancy index, copy and view
3.2 Pandas I: dataframes, series, index, Pandas I/O (csv, json, excell)
3.3 Prática dos conteúdos estudados: Processando e extraindo informações de arquivos csv

Módulo 4:
4.1 Numpy II e Matplotlib: operações com array, broadcasting, construção de gráficos usuais
4.2 Pandas II: limpeza de dados e estatísticas básicas
4.3 Prática dos conteúdos estudados: manipulando dados do ensino médio

Módulo 5:
5.1 Scikit learn: introdução a mecanismos de clustering, regressão e classificação
5.2 Web Crawler: request e funcionalidades associadas
5.3 Prática dos conteúdos estudados: clusterizando e predizendo o desempenho de escolas do ensino médio

Bibliografia:
- Wes McKinny, Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd edition O'Reilly Media, 2017
- Mark Lutz, Learning Python, 5th Edition, O'Reilly Media, 2013

Carga Horária:

46 horas
Tipo: Obrigatória
Vagas oferecidas: 150
 
Ministrantes: Luis Gustavo Nonato


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP