Apresentar os conceitos relacionados com tolerância a falhas: disponibilidade, mantenabilidade, confiabilidade e segurança crítica em sistemas elétrico-eletrônicos e programáveis (SEEP). Apresentar diversas técnicas de projeto visando obter um sistema tolerante a falhas, além de diversas técnicas de avaliação do projeto do sistema, quantitativa e qualitativa.
1. Conceitos de confiabilidade, disponibilidade, manutenabilidade, testabilidade, segurança crítica e dependabilidade. 2. Técnicas de projeto para alcançar tolerância a falhas: Redundância de Hardware, Redundância de Informação, Redundância de Software e Redundância Temporal. 3. Técnicas de avaliação de projetos tolerantes a falhas: Modelos Combinatórios, Modelos Analíticos, Árvores de Falhas e Redes de Petri. 4. Estudo de casos em sistemas eletro-eletrônicos e programáveis.
1. Conceitos de confiabilidade, disponibilidade, manutenabilidade, testabilidade, segurança crítica e dependabilidade. Conceito de taxa de falhas, função confiabilidade, tempo médio entre falhas - MTBF, tempo médio para falhar - MTTF e tempo médio para reparo - MTTR . Conceito dos termos fault, error, failure. Falhas de modo comum. Conceito de computação tolerante a falha. Tipos de falha. Conceito de redundância. 2. Técnicas de projeto para alcançar tolerância a falhas - redundância de hardware: redundância de hardware passiva, ativa e híbrida. 3. Técnicas de projeto para alcançar tolerância a falhas - redundância de informação: Códigos separáveis e não separáveis; códigos de paridade, códigos m de n, códigos duplicados, checksums, códigos cíclicos (separáveis e não separáveis), códigos aritméticos, códigos de Berger, códigos de Hamming de correção de erro. 4. Técnicas de projeto para alcançar tolerância a falhas - redundância de software: verificação de consistência, verificação de capacidade, blocos de recuperação (forward, backward), N-versões, computação robusta. 5. Técnicas de projeto para alcançar tolerância a falhas - redundância temporal: detecção de falha transiente e detecção de falha permanente. 6. Técnicas de avaliação de projetos tolerantes a falhas: Modelos combinatórios (série, paralelo, misto), Modelos analíticos markovianos (sem reparo, com reparo), Árvores de falha (construção e avaliação qualitativa e quantitativa), Redes de Petri (avaliação qualitativa), Análise dos efeitos dos modos de falhas (Críticas) - FEMECA. 7. Estudo de casos em sistemas eletro-eletrônicos e programáveis: palestras convidadas, análise de artigos científicos, projeto e avaliação de sistemas experimentais.
1. Reliability of Computer Systems and Networks. Fault Tolerance, Analysis and Design. Martin L. Shooman. John Wiley & Sons, 2002. 2. Self-Checking and Fault-Tolerant Digital Design, Parag K. Lala, Morgan Kaufmann Publishers, 2001. 3. Safety-Critical Computer Systems. Neil Storey. Addison-Wesley, 1996. 4. Apostila do Prof. João Batista Camargo Jr. 5. Artigos Científicos/ Scientific Papers.