« Julho 2010 | Pagina Principal | Maio 2010 »

Arquivos, Publicações do Mês de Junho 2010

Metodologia de Árvore de Falhas

A árvore de falhas é um modelo gráfico, onde a combinação das falhas é descrita (i.e., a ocorrência em série ou paralelo dos eventos irá resultar na ocorrência do evento indesejado pré-definido).

As faltas podem ser do tipo falha de equipamento, erro humano, erro de software, ou qualquer outro evento pertinente no qual pode conduzir ao evento indesejado.

Contudo é importante perceber que a árvore de falhas é um modelo de todas as possíveis falhas do sistema ou todas as possíveis causas para a falha do sistema. Uma vez que a análise cobre somente as falhas que são consideradas realísticas pelo analista, e as que não se enquadram nesta exigência são desprezadas na análise.

A árvore de falhas pode caracterizar os resultados (conseqüências) como evento binário (i.e., sucesso ou falha). No modelo lógico existem entidades conhecidas como “portas”, que tem a função de permitir ou impedir a passagem de uma falha para o topo da árvore (i.e., as portas mostram a relação entre os eventos necessários para a ocorrência do evento “mais alto”, entende-se por evento “mais alto” as saídas das portas, e o evento “mais baixo” são as entradas na porta).

Para uma melhor compreensão na Figura1, o diagrama de blocos funcional do sistema “D” é convertido na respectiva árvore de falhas.

Fig1. Convertendo o diagrama de blocos funcional em uma árvore de falhas

Etapas para o desenvolvimento da análise da árvore de falhas

Com base em Stamatelatos, et al.(2002), uma análise de árvore de falhas, bem sucedida, deve possuir os seguintes passos:

•Identificar o objetivo da análise de árvore de falhas;

•Definir o evento topo da árvore de falhas;

•Definir o escopo da análise de árvore de falhas;

•Definir a resolução da análise de árvore de falhas;

•Definir as regras básicas para a análise de árvore de falhas;

•Construir a árvore de falhas;

•Avaliara a árvore de falhas;

•Interpretar e apresentar os resultados.

Os cincos primeiros estão relacionados à formulação (planejamento) da árvore de falhas, já os passos seis, sete, e oito estão relacionados à construção, avaliação e interpretação dos resultados respectivamente. Nem todos estes passos são executados em seqüência, é possível, porém executar os passos os passos três, quatro, e cinco simultaneamente, também não é incomum os passos quatro e cinco serem modificados durante os passos seis e sete.

Abaixo o inter-relacionamento entre os passos é mostrado na Figura 2, as setas no sentido da direita para esquerda, significam re-alimentação dos passos anteriores.

Figura 2. Etapas da análise da árvore de falhas

O primeiro passo está relacionado à identificação do objetivo da análise de árvore de falhas, a primeira vista é possível acreditar que este passo parece obvio, no entanto se a construção for designada para uma equipe que não incorporou de forma concreta o objetivo da análise, ou se o objetivo não for claramente esclarecido, dificilmente os objetivos de diferentes equipes coincidirão. Uma vez que o critério de sucesso, como foi visto anteriormente, possui vários níveis, baseado no espaço de sucesso e falha, por isto é difícil perceber qual de fato é o critério de sucesso sob o ponto de vista decisor.

Uma vez que o primeiro passo foi executado, o segundo passo torna-se mais obvio, pois definir o evento topo é a definição literal de qual modo de falha do sistema será analisado. Se o sistema analisado possui diferentes fases, então os eventos topos são analisados para cada fase do sistema. A definição do evento topo é uma das mais importantes tarefas na análise de árvore de falhas, uma vez que o evento topo define a direção de toda a análise restante, e uma vez que ele é definido de forma incorreta, o restante da análise estará incorreta também, podendo conduzir até a uma tomada de decisão incorreta.

É extremamente frutífero definir vários eventos topos potencias e a partir deles decidir o mais apropriado frente ao decisor. Uma boa prática é definir o evento topo em função de critérios específicos que define a ocorrência do evento, outra boa prática é primeiramente definir o critério de sucesso para o sistema, e assim o evento topo do sistema será definido como a falha em satisfazer o dado critério de sucesso. Por exemplo, se o critério de sucesso para um dado poço de petróleo é que ele produza sem intervenção por pelo menos um ano, então o evento topo pode ser definido como: “falhar em operar sem intervenção por menos um ano”. Em resumo os pontos que devem ser levados em consideração na definição do evento topo deve ser os seguintes:

•Definir o evento topo, definir critérios para a ocorrência do evento;

•Garantir que o evento topo seja consistente com o problema a ser solucionado e objetivo da análise;

•Se incerto, o evento topo, definir várias possibilidades possíveis, que cubra o objetivo da árvore e avaliar a aplicabilidade de cada um.

No terceiro passo, onde o escopo da análise é definido, ela indica quais falhas e contribuidores serão incluídos, e quais não serão. No escopo também é incluída a condição de contorno para a análise. A condição de contorno inclui estado inicial do componente e os “inputs” que serão considerados para o sistema, desta forma a árvore de falhas é uma representação instantânea do sistema para um dado tempo, uma dada configuração e contorno.

De forma geral definir o contorno da análise significa definir o que está dentro da análise e o que está fora. O que está dentro da analise, são os contribuidores e eventos no qual estão relacionados ao evento topo indesejado, e o que esta fora da análise, são os contribuidores que não serão analisados. Em caso de sistemas onde mais de uma versão está disponível, nesta etapa será definido qual versão do sistema será analisada (i.e., em caso da análise de equipamentos onde novas versões são lançadas, versões de atualização).

No quarto passo o processo de resolução da análise de árvore de falhas é definido. Nele, o nível de detalhe no qual a causa de falha para o evento topo será desenvolvida é determinado. O processo de resolução, basicamente é dependente de duas características, a primeira é o foco da análise, uma vez que o evento topo é definido em função de um evento indesejado, que pode ser, por exemplo, “incêndio em um poço de petróleo”, então a resolução conduzirá ao nível de detalhe em que a modelagem das causas pode ser feita, a outra está vinculada aos dados disponíveis. A árvore é freqüentemente desenvolvida ao nível de detalhe da disponibilidade dos dados.

No quinto passo as regras básicas são definidas. Nela esta incluída o procedimento e nomenclatura pelo quais os eventos e portas serão nomeados na árvore de falhas. Esta organização é importante, uma vez que ela tornará a árvore de falha compreensível. Caso esta etapa seja desprezada, em caso de construção de várias árvores por diferentes equipes de especialistas, certamente o re-trabalho gerado na padronização após a construção, dependendo da complexidade do sistema, será extremamente dispendiosa.

No sexto passo que trata da construção da árvore de falhas, será comentado com maior detalhe mais adiante.

No sétimo passo a avaliação da árvore de falhas é feita. A avaliação inclui tanto a qualitativa quanto a quantitativa. A avaliação qualitativa está relacionada à análise dos cortes mínimos, natureza dos eventos básicos, e numero de eventos combinados em cada corte. Na avaliação quantitativa é analisada a probabilidade de cada evento, análise de dominância, análise dos cortes mínimos em função da probabilidade (qual possui maior ou menor probabilidade) e ordenação. É possível fazer também estudos de sensibilidade e avaliação da incerteza.

No oitavo passo a interpretação e apresentação dos resultados. Os resultados devem ser interpretados para fornecer implicações práticas tangíveis, especialmente centradas no impacto potencial sobre o objetivo.

No proximo artigo daremos continuidade a metodologia com "Avaliação qualitativa e quantitativa da árvore de falha"

Ref. Introdução: Introdução ao Fault Tree Analysis  

Process Explorer

Mostra as informações sobre quais identificadores e processos de DLLs abriram ou carregaram no seu sistema (desktop / servidor). O Processo de visualização do explorer consiste em duas sub-janelas.

O "top" sempre mostra uma lista dos processos atualmente ativos, incluindo os nomes das suas contas que possuem, ao passo que as informações exibidas na janela inferior depende do modo que o Process Explorer está em: se estiver no modo de lidar com youll ver as alças que o processo selecionado na janela superior tem aberto; se os processos do explorer está no modo "DLL youll" ver o DLLs e arquivos mapeados na memória que o processo tenha carregado.

Process Explorer também tem uma poderosa capacidade de pesquisa que irá rapidamente mostrar-lhe que os processos têm particular identificadores abertos ou DLLs carregadas. Boa solução para analise de capacidade de processamento e consumo da cpu dos servidores ou bem do seu desktop, uma versão mais completa do famos tsk manager do windows.

Download

Introdução ao Fault Tree Analysis

Os objetivos primários de qualquer análise de confiabilidade, impacto ou segurança é reduzir a probabilidade de um incidente ocorrer. Entendendo os impactos, podemos entender o quanto estão suscetíveis aos riscos os recursos de TI e posteriormente entendendo os impactos e riscos da uma eminência de um incidente que possa provocar uma indisponibilidade e possível definir planos de disponibilidade de forma de mitigar os riscos associados e a capacidade de recuperar a qualidade do serviço indisponível ou degradado.

Fault Tree Analysis

A utilização prática da teoria da confiabilidade surgiu primeiramente na indústria aeronáutica após a primeira guerra mundial. No início da década de 60 os laboratórios Bell desenvolveram o conceito de FTA para um projeto da força aérea americana. Pouco tempo depois a Boeing utilizava extensivamente a metodologia FTA para o estudo de eliminação de falhas do sistema de trem de pouso de aeronaves. Devido aos excelentes resultados obtidos pela Boeing a metodologia FTA foi rapidamente absorvida por outros segmentos industriais (automobilística, petroquímicas, nucleares, etc).

Atualmente a metodologia FTA é reconhecida como uma das melhores ferramentas de abordagem sistêmica de falhas, sendo o seu uso amplamente utilizado para produtos complexos, tais como, aviões, alto-forno e automóveis, além de ser utilizada também para a abordagem sistêmica de problemas organizacionais das empresas.

FTA é uma ferramenta de análise de confiabilidade em que a técnica de análise de falhas pode ser do tipo qualitativa ou quantitativa. Na análise qualitativa, o objetivo reside na determinação das causas básicas que levaram um evento qualquer a falhar. Para a análise quantitativa, o objetivo é determinar a probabilidade de ocorrência de falhas para o evento estudado. Os itens abaixo apresentam as principais vantagens do uso de FTA:

•Fácil visualização do problema possibilitando um conhecimento aprofundado do sistema e de sua confiabilidade;

•Excelente ferramenta para o conhecimento sistêmico de processos complexos;

•Permite a determinação de falhas de difícil detecção;

•Identifica itens que necessitam ter um alto nível de confiabilidade;

•Possibilita uma análise qualitativa ou quantitativa visando a confiabilidade de um sistema;

•Possibilita introduzir reduções de custo no equipamento ou produto sem prejudicar o atual desempenho;

•Possibilita formular planos de manutenção centrados em confiabilidade;

•Permite identificar procedimentos de manutenção com o enfoque de diminuir a probabilidade de quebra.

Uma indisponibilidade ocorre quando um evento inicial ocorre, seguido pela falha dos sistemas.

Os três tipos de falhas dos eventos básicos são propostos por Kumamoto:

1.Eventos relacionados ao homem;

2.Eventos relacionados a equipamentos;

3.Eventos relacionados ao ambiente.

Um quarto tipo de falha deve ser adicionado, que são os eventos relacionados ao software, uma vez que a automação é generalizada nas indústrias atuais. Porém em eventos relacionados à falha de software têm como causa raiz o eventos relacionados ao homem (erro de codificação falta de procedimentos de testes de stress na aplicação).

Em geral a indisponibilidade ocorre devido à falha combinada de dois ou mais eventos, que pode ser: equipamento junto com o erro humano e (ou) falta ambiental.

Algumas políticas para reduzir estes riscos são:

1.Redundância de equipamentos;

2.Inspeção e manutenção;

3.Sistema e segurança;

4.Sistema com falha segura e projeto de falha suave.

A identificação do relacionamento causal entre eventos relacionados ao homem, ao equipamento, e ao ambiente, que pode conduzir a um evento indesejado, é um objetivo da Análise Probabilística do Risco (APR). Uma vez que esta análise é concluída, medidas de reengenharia contribuem para a melhoria da operacionalidade segura e (ou) confiável do sistema.

A análise árvore de falhas é uma técnica dedutiva (i.e., abordagem baseada na falha, iniciando a análise supondo a ocorrência da um evento indesejado, tal como perda de um poço de petróleo, e a partir deste evento determina [deduz] suas causas, utilizando um processo de análise para traz, identificando os eventos que poderiam ter ocorrido contribuindo para a ocorrência do evento analisado).

Figura 1. Método Dedutivo

Com o objetivo de determinar as causas, utilizamos à análise de árvore de falhas, nela existem eventos necessários e suficientes que resultam na ocorrência do evento indesejado, ou evento topo. A análise de árvore de falhas é também um modelo qualitativo que fornece informações importantes das causas do evento indesejado. Exemplo: Qual causa é mais relevante? Ou listar em nível de relevância todas as causas. Quando quantificada fornece informação sobre a probabilidade de ocorrência do evento topo e a importância de todas as causas e eventos intermediários modelados na árvore de falhas.

À análise de árvore falhas pode ser somada a métodos de abordagem indutiva que também são utilizadas em análise de segurança e risco, e análise de confiabilidade. Diferente da abordagem dedutiva usada em análise de árvore de falhas, métodos indutivos são processos de análise para frente (i.e., inicia na causa básica ou evento inicial, e a partir dele investiga [induz] os efeitos finais). Ambos, análise de árvore de falhas e métodos indutivos são baseados na falha.

Figura 2. Método Indutivo

A análise de árvore de falhas fornece informações críticas que pode ser usada para priorizar em grau de importância dos contribuidores do evento indesejado. A ordem hierárquica dos contribuidores do evento indesejado mostra as causas que são mais dominantes, no sentido de contribuir para a ocorrência deste evento.

Análise do risco / benefício pode também ser utilizada para definir de maneira mais precisa a alocação de recursos, com o objetivo de reduzir a alocação de recursos e a probabilidade de ocorrência de um evento indesejado de forma correlacionada.

Esta análise pode ajudar na tomada de decisão do desenvolvimento de tecnologia de monitoramento de poço ou completação inteligente, por exemplo. Comparando o investimento necessário e o beneficio de cada investimento na redução da probabilidade de falha de um componente ou missão, estas perguntas podem ser respondidas.

A análise de árvore de falhas pode também ser usada como um elemento importante no desenvolvimento de projetos baseados no desempenho, uma vez que as causas e conseqüências são analisadas tanto qualitativamente quanto quantitativamente.

Aplicando a análise de árvore de falhas em sistemas já existentes, ela pode ajudar na identificação de pontos fracos e na avaliação de possíveis aprimoramentos de sistemas, pode também ser usada para monitorar e predizer comportamento do sistema estudado.

No proximo artigo estarenmos abordando a metodologia do FTA utilziando ele na pratica....

Implantar as Melhorias de Disponibilidade

As melhorias de disponibilidade e os detalhes das medições do Plano de Disponibilidade podem ser implantadas incluindo qualquer requerimento de monitoramento e relatórios. A implantação é realizada de acordo com o processo de Gerenciamento de Alterações.

Monitorar a disponibilidade

O processo de Gerenciamento de Disponibilidade precisa garantir que está sendo realizado o correto monitoramento e que a informação está disponível para obter os relatórios de disponibilidade e que eles sejam úteis para verificar melhorias e cumprimento dos níveis de serviço.

Alguns pontos que devem ser monitorados quando ocorrem os incidentes estão na figura a seguir:

Informar e pesquisar exceções

Onde as medições atuais de disponibilidade não sejam cumpridas, o processo é responsável por informar e pesquisar as exceções. O gerenciamento de Disponibilidade suporta o processo de Gerenciamento de Problemas, que apresenta foco na identificação dos custos de falta de disponibilidade, as causas das exceções e qualquer melhoria que possa ser realizada para prever futuras faltas de disponibilidade.