Complementar a formação dos alunos de graduação em Computação com interesse em conhecer os principais conceitos e técnicas da área de Ciência de Dados. O curso visa prover teoria e prática a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas em problemas reais.
Ciência de Dados; Descoberta de Conhecimento em Bases de Dados; Mineração de Dados, Preparação de Dados, Pré-processamento de Dados; Modelagem de dados; Estudo de algoritmo preditivo simples (k-NN), Planejamento de experimentos; Análise de resultados experimentais.
Introdução à ciência de dados. Descoberta de conhecimento em bases de dados, mineração de dados. Exploração de dados: caracterização de dados (objetos e atributos; tipos de dados); dados univariados; dados multivariados; visualização. Pré-processamento: qualidade de dados, limpeza dos dados, valores inconsistentes, objetos redundantes, ruído, outliers, dados desbalanceados. Transformação, conversão. Planejamento de experimentos: modelagem, desempenho (preditivo, custo), amostragem (hold-out, reamostragem), classificação binária. Análise de resultados experimentais: medidas de avaliação, gráficos ROC. Medidas de distância: estudo de algoritmo preditivo simples (k-NN). Atividades de Extensão: Os alunos podem conduzir trabalhos práticos em tópicos de interesse da sociedade, por exemplo, lidando com dados populacionais do censo recente, estudando padrões de mudanças climáticas conforme registros históricos, etc, produzindo vídeos e palestras sobre o assunto. Carga horária: 10 horas.
Stuart Russell; Peter Norvig. Artificial Intelligence: A Modern Approach, Pearson Education Limited; 4ª edition, 2021. Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021. Provost, F.; Fawcett, T. Data Science for Business: What you need to know about data mining and data-analytic thinking by O'Reilly Media, 2013. Han, J.; Kamber, M.; Pei, J. Data Mining: Concepts and Techniques, Third Edition (The Morgan Kaufmann Series in Data Management Systems). Morgan Kaufmann , 2011. Witten, I.; Frank, E. Third Edition (The Morgan Kaufmann Series in Data Management Systems). 2011. Tan, P.-N.; Steinbach, M.; Kumar, T. Introduction to Data Mining. Addison Wesley, 2005.