Complementar a formação dos alunos de graduação em Computação com interesse em conhecer os principais conceitos e técnicas da área de Ciência de Dados. O curso visa prover teoria e prática a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas em problemas reais.
Ciência de Dados; Descoberta de Conhecimento em Bases de Dados; Mineração de Dados, Preparação de Dados, Pré-processamento de Dados; Modelagem de dados; Estudo de algoritmo preditivo simples (k-NN), Planejamento de experimentos; Análise de resultados experimentais.
Introdução à ciência de dados. Descoberta de conhecimento em bases de dados, mineração de dados. Exploração de dados: caracterização de dados (objetos e atributos; tipos de dados); dados univariados; dados multivariados; visualização. Pré-processamento: qualidade de dados, limpeza dos dados, valores inconsistentes, objetos redundantes, ruído, outliers, dados desbalanceados. Transformação, conversão. Planejamento de experimentos: modelagem, desempenho (preditivo, custo), amostragem (hold-out, reamostragem), classificação binária. Análise de resultados experimentais: medidas de avaliação, gráficos ROC. Medidas de distância: estudo de algoritmo preditivo simples (k-NN).
Stuart Russell; Peter Norvig. Artificial Intelligence: A Modern Approach, Pearson Education Limited; 4ª edition, 2021. Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021. Provost, F.; Fawcett, T. Data Science for Business: What you need to know about data mining and data-analytic thinking by O'Reilly Media, 2013. Han, J.; Kamber, M.; Pei, J. Data Mining: Concepts and Techniques, Third Edition (The Morgan Kaufmann Series in Data Management Systems). Morgan Kaufmann , 2011. Witten, I.; Frank, E. Third Edition (The Morgan Kaufmann Series in Data Management Systems). 2011. Tan, P.-N.; Steinbach, M.; Kumar, T. Introduction to Data Mining. Addison Wesley, 2005.