Disciplina Discipline PCS5016
Qualidade de Dados

Data Quality

Área de Concentração: 3141

Concentration area: 3141

Criação: 12/12/2022

Creation: 12/12/2022

Ativação: 12/12/2022

Activation: 12/12/2022

Nr. de Créditos: 8

Credits: 8

Carga Horária:

Workload:

Teórica

(por semana)

Theory

(weekly)

Prática

(por semana)

Practice

(weekly)

Estudos

(por semana)

Study

(weekly)

Duração Duration Total Total
3 0 7 12 semanas 12 weeks 120 horas 120 hours

Docentes Responsáveis:

Professors:

Pedro Luiz Pizzigatti Corrêa

Solange Nice Alves de Souza

Objetivos:

Apresentar os conceitos relacionados ao campo da qualidade de dados, as causas e problemas que levam à falta de qualidade de dados e as dimensões utilizadas para qualificar se um dado possui qualidade. São discutidas metodologias e modelos para realizar a medição e o gerenciamento da melhoria da qualidade de dados e a implementação de políticas e procedimentos que auxiliem a manter a qualidade requerida. Aspectos de governança de dados e metadados são também discutidos, de forma a apoiar a implementação e manutenção de programas de qualidade de dados.

Objectives:

The discipline introduces the concepts related to data quality area, discussing causes and problems that lead to the lack of data quality and the dimensions used to qualify them. Methodologies and models that support the measurement, the implementation of policies and procedures, as well as the management of data quality improvement are discussed. Aspects of data governance and metadata are also considered in order to support the implementation and maintenance of data quality programs.

Justificativa:

A tecnologia da informação vem evoluindo de modo a oferecer recursos tecnológicos e computacionais capazes de processar, de forma rápida e confiável, uma grande e diversa volumetria de informações, gerando oportunidades para os gestores melhorarem a visão de futuro das organizações, promovendo à inovação, a melhoria de serviços, a previsibilidade do comportamento de mercado, a prevenção de riscos, o aumento da efetividade dos negócios. Por isso, uma das questões de extrema relevância na atualidade diz respeito à utilização dos dados digitais gerados pelo uso intensivo da tecnologia da informação, notadamente internet e redes sociais. Tais dados precisam ter a qualidade necessária para que possam gerar informações e conhecimentos úteis. A grande maioria das organizações que automatizam seus processos de negócio se confronta com problemas de qualidade de dados, independentemente da tecnologia que adotam. À medida que uma grande volumetria de informações decorrente desses processos de negócio é gerada e armazenada, aumentam os riscos de comprometer a tomada de decisões sobre estes dados. É fundamental planejar e implementar um programa de gerenciamento de qualidade de dados de amplo espectro, acompanhado de mecanismos que atuem no aculturamento dos utilizadores de dados para minimizar o impacto gerado pela má qualidade dos dados, seja qual for o contexto de uso dos dados.

Rationale:

Information technology has been evolving in the sense of offering technological and computational resources capable of processing, quickly and reliably, a large and diversified volume of information, generating opportunities for innovation, service improvement, market predictability, risk prevention, in addition to increase the effectiveness of business or researches. Therefore, one of the most relevant issues today concerns the use of digital data generated by the intensive use of information technologies, notably the internet and social networks. Such data need to have the necessary quality so that they can generate useful information and knowledge. The vast majority of organizations that automate their business processes face data quality issues, regardless of the technology they adopt. As the volume of data/information resulting from these business processes increases, the risks of compromising decision-making on this data increase. It is essential to plan and implement a broad-spectrum data quality management program, accompanied by mechanisms that act to acculturate data users to minimize the impact generated by poor data quality, whatever the context of data use.

Conteúdo:

1. Introdução a Qualidade de Dados – importância, análise de estudos de caso, problemas e consequências. A transformação digital e a era dos dados: a revolução tecnológica, o mundo conectado e o impacto nos dados. 2. Desafios da qualidade de dados nos ambientes analíticos. 3. Dimensões da Qualidade de Dados (para dados estruturados, semi e não estruturados). 4. Modelos para a Qualidade de dados (DMM, DMBOK, dentre outros). 5. Metodologias de gerenciamento da Qualidade de Dados (TDQM, TQIM, AIQM, HDQM, dentre outras). 6. Programa de Qualidade de Dados (estratégia para a definição, implementação e manutenção) 7. Ferramentas de apoio (ferramentas de apoio ao ciclo de vida da qualidade de dados) 8. Conceitos de Governança e Metadados – relação com a qualidade de dados Estudos de caso

Content:

1 Introduction to Data Quality – importance, analysis of case studies, problems and consequences. Digital transformation and the data age: the technological revolution, the connected world and the impact on data. 2. Data quality challenges in analytics environments. 3. Data Quality Dimensions (for structured, semi and unstructured data). 4. Models for Data Quality (DMM, DMBOK, among others). 5. Data Quality Management Methodologies (TDQM, TQIM, AIQM, HDQM, among others). 6. Data Quality Program (strategy for definition, implementation and maintenance) 7. Support tools (data quality lifecycle support tools) 8. Data Governance and Metadata Concepts – relationship with data quality Case studies

Forma de Avaliação:

Participação nas discussões de aula, leitura e apresentação de artigos, seminários sobre estudos de casos propostos.

Type of Assessment:

Participation in class discussions, reading and presentation of articles, seminars on proposed case studies.

Bibliografia:

- Francisco, Maritza M. C., Solange N. Alves-Souza, Edit G. L. Campos, and Luiz S. De Souza. 2017. ‘Total Data Quality Management and Total Information Quality Management Applied to Costumer Relationship Management’. In ICIME 2017: 2017 9th International Conference on Information Management and Engineering. Barcelona, Espanha: ACM. https://doi.org/https://doi.org/10.1145/3149572.3149575. - BATINI, C; SCANAPIENCO, M.; Data and Information Quality – dimensions, principles and techniques. Springer, New York 2016. - BATINI, C; et al. Hetergeneous Data Quality Methodology; International Journal of Database Management Systems (IJDMS); v.3; n.1; 2011. - CAI, LI; YANGYONG, ZHU. The Challenges of Data Quality and Data Assessment in the Big Data Era. Data Science Journal, 14: 2, pp. 1-10. 2015. Disponível em: http://dx.doi.org/10.5334/dsj-2015-002 . - DMMM – Data Management Maturity (DMM) Model; CMMI Institute; version 1.0; August, 2014. - DMBOK 2 Guide – Guide to the DAMA Management Body of Knowledge; DAMA International. Revisão 2017. - FIRMANI , DONATELLA; MECELLA, MASSIMO; SCANNAPIECO , MONICA; BATINI, CARLO. On the Meaningfulness of “Big Data Quality”. Data Sci. Eng. DOI 10.1007/s41019-015-0004-7. 2014 - ISO/IEC 25012:2008 2015. Software Engineering - Software Product Quality Requirements and Evaluation (SQuaRE) - Data Quality Model. ISO/IEC. - Alhassan, Ibrahim, David Sammon, and Mary Daly. 2019. ‘Critical Success Factors for Data Governance: A Telecommunications Case Study’. Journal of Decision Systems 28 (1): 41–61. https://doi.org/10.1080/12460125.2019.1633226. - Artigos IEEE, ACM, Springer relacionados à qualidade de dados, governança de dados e metadados.

Bibliography:

- Francisco, Maritza M. C., Solange N. Alves-Souza, Edit G. L. Campos, and Luiz S. De Souza. 2017. ‘Total Data Quality Management and Total Information Quality Management Applied to Costumer Relationship Management’. In ICIME 2017: 2017 9th International Conference on Information Management and Engineering. Barcelona, Espanha: ACM. https://doi.org/https://doi.org/10.1145/3149572.3149575. - BATINI, C; SCANAPIENCO, M.; Data and Information Quality – dimensions, principles and techniques. Springer, New York 2016. - BATINI, C; et al. Hetergeneous Data Quality Methodology; International Journal of Database Management Systems (IJDMS); v.3; n.1; 2011. - CAI, LI; YANGYONG, ZHU. The Challenges of Data Quality and Data Assessment in the Big Data Era. Data Science Journal, 14: 2, pp. 1-10. 2015. Disponível em: http://dx.doi.org/10.5334/dsj-2015-002 . - DMMM – Data Management Maturity (DMM) Model; CMMI Institute; version 1.0; August, 2014. - DMBOK 2 Guide – Guide to the DAMA Management Body of Knowledge; DAMA International. Revisão 2017. - FIRMANI , DONATELLA; MECELLA, MASSIMO; SCANNAPIECO , MONICA; BATINI, CARLO. On the Meaningfulness of “Big Data Quality”. Data Sci. Eng. DOI 10.1007/s41019-015-0004-7. 2014 - ISO/IEC 25012:2008 2015. Software Engineering - Software Product Quality Requirements and Evaluation (SQuaRE) - Data Quality Model. ISO/IEC. - Alhassan, Ibrahim, David Sammon, and Mary Daly. 2019. ‘Critical Success Factors for Data Governance: A Telecommunications Case Study’. Journal of Decision Systems 28 (1): 41–61. https://doi.org/10.1080/12460125.2019.1633226. - Artigos IEEE, ACM, Springer relacionados à qualidade de dados, governança de dados e metadados.

Tipo de oferecimento da disciplina:

Não-Presencial

Class type:

Não-Presencial

Informações adicionais do oferecimento da disciplina:

Híbrido significa aula simultânea para alunos presentes e remotos ao mesmo tempo

Additional class type information:

Híbrido significa aula simultânea para alunos presentes e remotos ao mesmo tempo