126339 - Introdução a Ciências de Dados |
Período da turma: | 25/01/2025 a 29/03/2025
|
||||
|
|||||
Descrição: | Objetivos:
Apresentar os aspectos fundamentais e principais de Ciências de Dados, descrevendo os conhecimentos necessários para atuar nesta área, e explicando quais fatores são importantes para o sucesso na ciência de dados. Discutir as limitações das Ciências de Dados e estratégias para enfrentá-los. Apresentar as principais etapas do processo de tomada de decisão e discutir os objetivos de cada etapa, a problemática envolvida, e as ferramentas tipicamente empregadas na solução dos problemas. Apresentar noções básicas de como ferramentas estatísticas, álgebra linear e otimização são empregadas no contexto de ciência de dados para resolver problemas específicos. Mostrar como implementar os conceitos apresentados em Python. Mostrar a importância da proteção de dados na área de Ciências de Dados e descrever os abusos no uso de técnicas de Ciências de Dados. Ementa: 1. O que é Ciência de Dados? 2. Problemas e Soluções em Ciência de Dados 3. Ciência de Dados e suas Etapas: Tipos de dados, Explorando e Analisando os Dados, Estatística Descritiva, Visualização, Selecionando Métodos e Ajustando Modelos. 4. Escolha do método 5. Avaliando métodos e modelos 6. Métodos Matemáticos e Computacionais: Técnicas para Tratamento e Transformação de Dados, Normalização e PCA, Técnicas de agrupamento (K-means, Agrupamento Hierárquico, Avaliando Agrupamentos), Modelos de Regressão (Regressão Linear, Simplificando Modelos via Regularização), Avaliando e Interpretando modelos 7. Modelos de Classificação: Vizinhos mais próximos, Regressão Logistica, Naive Bayes, SVM, Árvores de Decisão, Boosting and Comitês, Avaliando Modelos de Classificação 8. Um exemplo real: A estrutura de um Projeto de Ciência de Dados, Preparando os dados, Analisando os Dados, Modelando os Dados, . Comunicação de Resultados 9. Questões Éticas em Ciência de dados: Privacidade e segurança, Raciocínio de dados em um mundo digital, A próxima geração de cientistas de dados. Referências: 1. Faceli, Katti; Lorena, Ana Carolina; Gama, João ; de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. 1. ed. Rio de Janeiro: LTC. 2. James, G.; Witten, D.; Hastie, T.; Tibshirami, R. (2913). An Introduction to Statistical Learning: with Applications in R. Springer, Berlin: Springer series in statistics. 3. Friedman, J., Hastie, T., & Tibshirani, R. (2001). The elements of statistical learning. Springer, Berlin: Springer series in statistics. |
||||
Carga Horária: |
40 horas |
||||
Tipo: | Obrigatória | ||||
Vagas oferecidas: | 320 | ||||
Ministrantes: |
Oilson Alberto Gonzatto Junior |
voltar |
Créditos © 1999 - 2024 - Superintendência de Tecnologia da Informação/USP |