Atividade

89671 - Introdução a Ciências de Dados

Período:
Terça 19:00 às 20:00
Quinta 19:00 às 20:00
Sábado 09:00 às 12:00
 
Descrição: Objetivos:


Apresentar os aspectos fundamentais e principais de Ciências de Dados, descrevendo os conhecimentos necessários para atuar nesta área, e explicando quais fatores são importantes para o sucesso na ciência de dados. Discutir as limitações das Ciências de Dados e estratégias para enfrentá-los. Apresentar as principais etapas do processo de tomada de decisão e discutir os objetivos de cada etapa, a problemática envolvida, e as ferramentas tipicamente empregadas na solução dos problemas. Apresentar noções básicas de como ferramentas estatísticas, álgebra linear e otimização
são empregadas no contexto de ciência de dados para resolver problemas específicos. Mostrar como implementar os conceitos apresentados em Python. Mostrar a importância da proteção de dados na área de Ciências de Dados e descrever os abusos no uso de técnicas de Ciências de Dados.

Ementa:

1. O que é Ciência de Dados?
2. Problemas e Soluções em Ciência de Dados
3. Ciência de Dados e suas Etapas: Tipos de dados, Explorando e Analisando os Dados, Estatística Descritiva, Visualização, Selecionando Métodos e Ajustando Modelos.
4. Escolha do método
5. Avaliando métodos e modelos
6. Métodos Matemáticos e Computacionais: Técnicas para Tratamento e Transformação de Dados, Normalização e PCA, Técnicas de agrupamento (K-means, Agrupamento Hierárquico, Avaliando Agrupamentos), Modelos de Regressão (Regressão Linear, Simplificando Modelos via Regularização), Avaliando e Interpretando modelos
7. Modelos de Classificação: Vizinhos mais próximos, Regressão Logistica, Naive Bayes, SVM, Árvores de Decisão, Boosting and Comitês, Avaliando Modelos de Classificação
8. Um exemplo real: A estrutura de um Projeto de Ciência de Dados, Preparando os dados, Analisando os Dados, Modelando os Dados, . Comunicação de Resultados
9. Questões Éticas em Ciência de dados: Privacidade e segurança, Raciocínio de dados em um mundo digital, A próxima geração de cientistas de dados.

Referências:


1. Faceli, Katti; Lorena, Ana Carolina; Gama, João ; de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. 1. ed. Rio de Janeiro: LTC.
2. James, G.; Witten, D.; Hastie, T.; Tibshirami, R. (2913). An Introduction to Statistical Learning: with Applications in R. Springer, Berlin: Springer series in statistics.
3. Friedman, J., Hastie, T., & Tibshirani, R. (2001). The elements of statistical learning. Springer, Berlin: Springer series in statistics.

Carga Horária:

40 horas
Tipo: Obrigatória
Vagas oferecidas: 167
 
Ministrantes: André Carlos Ponce de Leon Ferreira de Carvalho


 
 voltar

Créditos
© 1999 - 2019 - Superintendência de Tecnologia da Informação/USP