Baixe o app para aproveitar ainda mais
Prévia do material em texto
Entrega e Serviços em Tecnologia da Informação Christian Ganzert Aula 4 * Disponibilidade Conceitos de Disponibilidade Gerência da Disponibilidade Níveis de disponibilidade Níveis de SLA Responsabilidades Tolerância a falhas Diferença entre falha, erro e defeito. Latência Benefícios e fatores críticos de sucesso * * Disponibilidade Conceito de Disponibilidade: ter a infraestrutura de serviços em condições de funcionar sem problemas, de forma contínua, de maneira que os negócios da organização possam ser realizados sem interrupção de qualquer espécie. * * Disponibilidade O ITIL define que: disponibilidade é um aspecto crítico da garantia do serviço e seu propósito é garantir que o nível de disponibilidade entregue em todos os serviços de TI atenda de maneira eficaz às necessidades de disponibilidade e/ ou metas de nível de serviço acordadas (SLA). * * Disponibilidade Expressa em valores percentuais relacionados ao tempo total 24/7: Exemplo: Nosso provedor nos entregou a disponibilidade de 98%. o que significa dizer que das 24 horas de cada dia, ela deve estar no ar por pelo menos 23h31m12s. * * Responsabilidades Gerência de Disponibilidade: Monitorar todos os aspectos da disponibilidade relativos aos serviços de TI e os componentes de suporte, com os eventos, alarmes com scripts automatizados para recuperação; Manutenção de uma série de métodos, técnicas e cálculos para medir e reportar todas as métricas envolvidas; * * Responsabilidades Assistência com avaliação e gestão de riscos; Entender as atuais e futuras demandas de disponibilidade, objetos de contrato; Influenciar o desenho dos processos de serviços e componentes para que estejam alinhados aos processos de negócio; Produzir um plano de disponibilidade (alinhar SLA e SLR – System Level Requirements); * * Responsabilidades Manter uma rotina agendada de testes para os componentes e mecanismos de serviços que sejam sujeitos à falha; Assistir a identificação e solução dos diversos acidentes e problemas associados à indisponibilidade de serviços; Melhoria proativa da disponibilidade de serviços ou componentes, onde quer que seja justificável, alinhando às necessidades do negócio. * * Tolerância a Falhas É a habilidade de um serviço de TI ou item de configuração de continuar a operar corretamente após a falha de um componente. Lista de componentes com tolerância a falhas: UPS (popularmente conhecido como nobreak) e BP (Backup Power ; RAID (Redundant Array of Independent Drives); Duplicação de servidores ou CLUSTER. * * Tolerância a Falhas A maior parte dos sistemas de tolerância a falhas está embarcado em um dispositivo (hardware) e não em aplicativos. Existem também sistemas de aplicativos para gerenciamento de contingências, criando redundâncias críticas e tolerância a falhas. Ex: Big IP. * * Diferenças entre conceitos Erro: resultado incorreto provocado por uma intervenção humana; Defeito: manifestação do erro (bug); Falha: o que é observado quando ocorre um defeito, normalmente uma situação indesejada. * * Latência Diferença de tempo entre o início de um evento e a percepção dos seus efeitos existem muitas variáveis que interferem nos serviços de uma organização, criando latência. O problema fica mais evidente em sistemas encadeados. Jitter: fenômeno de variação da latência. * * Latência Latência é indisponibilidade, mesmo que por tempos relativamente pequenos. Mas fica claro que, quando seus efeitos ocorrem em ambientes conectados, eles se potencializam. Latência também é o tempo que um serviço leva para ser restabelecido, depois da ocorrência de uma falha. É uma responsabilidade direta da gerência de disponibilidade. * * Classificação de Falhas Originadas por especificação incorreta; Originadas por implementação inadequada; Originadas por componentes com defeito; Fadiga; Externas ao serviço; Operacionais. * * Classificação das Falhas Podemos ainda definir as falhas quanto: À natureza - falha de software, hardware, operação e projeto; À duração - se é permanente ou temporária; À extensão - se é local ou global; Ao valor - determinado ou indeterminado. * * Medição da Disponibilidade Confiabilidade Tempo de funcionamento sem falhas Sustentabilidade Tempo de restauração após falha Função de negócio vital * * Fatores de disponibilidade Complexidade da infraestrutura de TI; Confiabilidade dos ativos e componentes; Reação rápida e eficiente a falhas; Qualidade na manutenção; Fatores ambientais; Fornecimento de serviços externos; Atuação de elementos externos. * * Cálculo da disponibilidade * Tempo de serviço acordado – tempo de queda Tempo de serviço acordado X 100 * Gerenciamento da Disponibilidade * disponibilidade * Indicadores de Desempenho * Entrega e Serviços em Tecnologia da Informação Christian Ganzert Atividade 4 * * Atividade Se minha SLA de disponibilidade em contrato fixado com um determinado cliente é de 98%/mês, e na última semana deixei de fornecer o serviço por indisponibilidade técnica por 2h, terei que pagar a multa contratual associada à SLA? * Solução Cálculo da disponibilidade: * Tempo de serviço acordado – tempo de queda Tempo de serviço acordado X 100 * Solução Cálculo da disponibilidade: * ([1 mês = 720h] – 2h) 720h X 100 * Solução Cálculo da disponibilidade: * ([1 mês = 720h] – 2h) 720h X 100 99,72% * Solução Como a SLA é de 98%, não precisarei pagar a multa contratual. Lembre-se: a interrupção de 2 horas deverá ser aferida e gerar informações para melhoria do serviço, evitando que a paralização volte a ocorrer pelo mesmo motivo. *
Compartilhar