Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Instituto de Ciências Matemáticas e de Computação
 
Ciências de Computação
 
Disciplina: SCC0275 - Introdução à Ciência de Dados
Introduction to Data Science

Créditos Aula: 4
Créditos Trabalho: 1
Carga Horária Total: 90 h
Tipo: Semestral
Ativação: 01/01/2024 Desativação: 14/07/2024

Objetivos
Complementar a formação dos alunos de graduação em Computação com interesse em conhecer os principais conceitos e técnicas da área de Ciência de Dados. O curso visa prover teoria e prática a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas em problemas reais.
 
 
 
Docente(s) Responsável(eis)
5890222 - Diego Furtado Silva
55735 - Roseli Aparecida Francelin Romero
 
Programa Resumido
Ciência de Dados; Descoberta de Conhecimento em Bases de Dados; Mineração de Dados,  Preparação de Dados, Pré-processamento de Dados; Modelagem de dados; Estudo de algoritmo preditivo simples (k-NN), Planejamento de experimentos; Análise de resultados experimentais.
 
 
 
Programa
Introdução à ciência de dados. Descoberta de conhecimento em bases de dados, mineração de dados. Exploração de dados: caracterização de dados (objetos e atributos; tipos de dados); dados univariados; dados multivariados; visualização. Pré-processamento: qualidade de dados, limpeza dos dados, valores inconsistentes, objetos redundantes, ruído, outliers, dados desbalanceados. Transformação, conversão. Planejamento de experimentos: modelagem, desempenho (preditivo, custo), amostragem (hold-out, reamostragem), classificação binária. Análise de resultados experimentais: medidas de avaliação, gráficos ROC. Medidas de distância: estudo de algoritmo preditivo simples (k-NN).
Atividades de Extensão: Os alunos podem conduzir trabalhos práticos em tópicos de interesse da sociedade, por exemplo, lidando com dados populacionais do censo recente, estudando padrões de mudanças climáticas conforme registros históricos, etc, produzindo vídeos e palestras sobre o assunto.
Carga horária: 10 horas.
 
 
 
Avaliação
     
Método
Exercícios e trabalhos práticos dentro e fora da classe. Aulas práticas utilizando simulações em microcomputador. Seminários para discussão de resultados obtidos nas aplicações. Participação das aulas práticas e seminários. Trabalhos práticos extraclasse. Ministrar seminários.
Critério
Serão atribuídas notas aos trabalhos práticos e participação em discussões e seminários. A nota final será calculada pela média ponderada das notas obtidas pelo aluno no decorrer do semestre.
Norma de Recuperação
Critério de aprovação: NP + (Mrec/2,5), se Mrec > ou =7,5; ou Max {NP, Mrec}, se Mrec < ou = 5,0; ou 5,0, se 5,0 < ou = Mrec < 7,5.( NP=1ª avaliação, Mrec=prova)
 
Bibliografia
     
Stuart Russell; Peter Norvig. Artificial Intelligence: A Modern Approach, Pearson Education Limited; 4ª edition, 2021. 
Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021.
Provost, F.; Fawcett, T. Data Science for Business: What you need to know about data mining and data-analytic thinking by O'Reilly Media, 2013.
Han, J.; Kamber, M.; Pei, J. Data Mining: Concepts and Techniques, Third Edition (The Morgan Kaufmann Series in Data Management Systems). Morgan Kaufmann , 2011.
Witten, I.; Frank, E. Third Edition (The Morgan Kaufmann Series in Data Management Systems). 2011.
Tan, P.-N.; Steinbach, M.; Kumar, T. Introduction to Data Mining. Addison Wesley, 2005.
 

Clique para consultar os requisitos para SCC0275

Clique para consultar o oferecimento para SCC0275

Créditos | Fale conosco
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP