Informações da Disciplina

 Preparar para impressão 

Júpiter - Sistema de Gestão Acadêmica da Pró-Reitoria de Graduação


Instituto de Ciências Matemáticas e de Computação
 
Ciências de Computação
 
Disciplina: SCC0275 - Introdução à Ciência de Dados
Introduction to Data Science

Créditos Aula: 4
Créditos Trabalho: 1
Carga Horária Total: 90 h
Tipo: Semestral
Ativação: 15/07/2022 Desativação:

Objetivos
Complementar a formação dos alunos de graduação em Computação com interesse em conhecer os principais conceitos e técnicas da área de Ciência de Dados. O curso visa prover teoria e prática a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas em problemas reais.
 
 
 
Docente(s) Responsável(eis)
55735 - Roseli Aparecida Francelin Romero
 
Programa Resumido
Ciência de Dados; Descoberta de Conhecimento em Bases de Dados; Mineração de Dados,  Preparação de Dados, Pré-processamento de Dados; Modelagem de dados; Estudo de algoritmo preditivo simples (k-NN), Planejamento de experimentos; Análise de resultados experimentais.
 
 
 
Programa
Introdução à ciência de dados. Descoberta de conhecimento em bases de dados, mineração de dados. Exploração de dados: caracterização de dados (objetos e atributos; tipos de dados); dados univariados; dados multivariados; visualização. Pré-processamento: qualidade de dados, limpeza dos dados, valores inconsistentes, objetos redundantes, ruído, outliers, dados desbalanceados. Transformação, conversão. Planejamento de experimentos: modelagem, desempenho (preditivo, custo), amostragem (hold-out, reamostragem), classificação binária. Análise de resultados experimentais: medidas de avaliação, gráficos ROC. Medidas de distância: estudo de algoritmo preditivo simples (k-NN).
 
 
 
Avaliação
     
Método
Exercícios e trabalhos práticos dentro e fora da classe. Aulas práticas utilizando simulações em microcomputador. Seminários para discussão de resultados obtidos nas aplicações. Participação das aulas práticas e seminários. Trabalhos práticos extraclasse. Ministrar seminários.
Critério
Serão atribuídas notas aos trabalhos práticos e participação em discussões e seminários. A nota final será calculada pela média ponderada das notas obtidas pelo aluno no decorrer do semestre.
Norma de Recuperação
Critério de aprovação: NP + (Mrec/2,5), se Mrec > ou =7,5; ou Max {NP, Mrec}, se Mrec < ou = 5,0; ou 5,0, se 5,0 < ou = Mrec < 7,5.( NP=1ª avaliação, Mrec=prova)
 
Bibliografia
     
Stuart Russell; Peter Norvig. Artificial Intelligence: A Modern Approach, Pearson Education Limited; 4ª edition, 2021. 
Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021.
Provost, F.; Fawcett, T. Data Science for Business: What you need to know about data mining and data-analytic thinking by O'Reilly Media, 2013.
Han, J.; Kamber, M.; Pei, J. Data Mining: Concepts and Techniques, Third Edition (The Morgan Kaufmann Series in Data Management Systems). Morgan Kaufmann , 2011.
Witten, I.; Frank, E. Third Edition (The Morgan Kaufmann Series in Data Management Systems). 2011.
Tan, P.-N.; Steinbach, M.; Kumar, T. Introduction to Data Mining. Addison Wesley, 2005.
 

Clique para consultar os requisitos para SCC0275

Clique para consultar o oferecimento para SCC0275

Créditos | Fale conosco
© 1999 - 2023 - Superintendência de Tecnologia da Informação/USP