Baixe o app para aproveitar ainda mais
Prévia do material em texto
Entrega e Serviços em Tecnologia da Informação Christian Ganzert Aula 4 Disponibilidade • Conceitos de Disponibilidade –Gerência da Disponibilidade –Níveis de disponibilidade –Níveis de SLA –Responsabilidades –Tolerância a falhas • Diferença entre falha, erro e defeito. –Latência –Benefícios e fatores críticos de sucesso 2 Disponibilidade • Conceito de Disponibilidade: – ter a infraestrutura de serviços em condições de funcionar sem problemas, de forma contínua, de maneira que os negócios da organização possam ser realizados sem interrupção de qualquer espécie. 3 Disponibilidade • O ITIL define que: – disponibilidade é um aspecto crítico da garantia do serviço e seu propósito é garantir que o nível de disponibilidade entregue em todos os serviços de TI atenda de maneira eficaz às necessidades de disponibilidade e/ ou metas de nível de serviço acordadas (SLA). 4 Disponibilidade • Expressa em valores percentuais relacionados ao tempo total 24/7: –Exemplo: •Nosso provedor nos entregou a disponibilidade de 98%. –o que significa dizer que das 24 horas de cada dia, ela deve estar no ar por pelo menos 23h31m12s. 5 Responsabilidades • Gerência de Disponibilidade: –Monitorar todos os aspectos da disponibilidade relativos aos serviços de TI e os componentes de suporte, com os eventos, alarmes com scripts automatizados para recuperação; –Manutenção de uma série de métodos, técnicas e cálculos para medir e reportar todas as métricas envolvidas; 6 Responsabilidades –Assistência com avaliação e gestão de riscos; –Entender as atuais e futuras demandas de disponibilidade, objetos de contrato; – Influenciar o desenho dos processos de serviços e componentes para que estejam alinhados aos processos de negócio; –Produzir um plano de disponibilidade (alinhar SLA e SLR – System Level Requirements); 7 Responsabilidades –Manter uma rotina agendada de testes para os componentes e mecanismos de serviços que sejam sujeitos à falha; –Assistir a identificação e solução dos diversos acidentes e problemas associados à indisponibilidade de serviços; –Melhoria proativa da disponibilidade de serviços ou componentes, onde quer que seja justificável, alinhando às necessidades do negócio. 8 Tolerância a Falhas • É a habilidade de um serviço de TI ou item de configuração de continuar a operar corretamente após a falha de um componente. –Lista de componentes com tolerância a falhas: • UPS (popularmente conhecido como nobreak) e BP (Backup Power ; • RAID (Redundant Array of Independent Drives); • Duplicação de servidores ou CLUSTER. 9 Tolerância a Falhas • A maior parte dos sistemas de tolerância a falhas está embarcado em um dispositivo (hardware) e não em aplicativos. • Existem também sistemas de aplicativos para gerenciamento de contingências, criando redundâncias críticas e tolerância a falhas. –Ex: Big IP. 10 Diferenças entre conceitos • Erro: – resultado incorreto provocado por uma intervenção humana; • Defeito: –manifestação do erro (bug); • Falha: –o que é observado quando ocorre um defeito, normalmente uma situação indesejada. 11 Latência • Diferença de tempo entre o início de um evento e a percepção dos seus efeitos –existem muitas variáveis que interferem nos serviços de uma organização, criando latência. • O problema fica mais evidente em sistemas encadeados. –Jitter: fenômeno de variação da latência. 12 Latência • Latência é indisponibilidade, mesmo que por tempos relativamente pequenos. Mas fica claro que, quando seus efeitos ocorrem em ambientes conectados, eles se potencializam. • Latência também é o tempo que um serviço leva para ser restabelecido, depois da ocorrência de uma falha. É uma responsabilidade direta da gerência de disponibilidade. 13 Classificação de Falhas • Originadas por especificação incorreta; • Originadas por implementação inadequada; • Originadas por componentes com defeito; • Fadiga; • Externas ao serviço; • Operacionais. 14 Classificação das Falhas • Podemos ainda definir as falhas quanto: –À natureza - falha de software, hardware, operação e projeto; –À duração - se é permanente ou temporária; –À extensão - se é local ou global; –Ao valor - determinado ou indeterminado. 15 Medição da Disponibilidade • Confiabilidade –Tempo de funcionamento sem falhas • Sustentabilidade –Tempo de restauração após falha • Função de negócio vital 16 Fatores de disponibilidade • Complexidade da infraestrutura de TI; • Confiabilidade dos ativos e componentes; • Reação rápida e eficiente a falhas; • Qualidade na manutenção; • Fatores ambientais; • Fornecimento de serviços externos; • Atuação de elementos externos. 17 Cálculo da disponibilidade 18 Tempo de serviço acordado – tempo de queda Tempo de serviço acordado X 100 Gerenciamento da Disponibilidade 19 disponibilidade Indicadores de Desempenho 20 Entrega e Serviços em Tecnologia da Informação Christian Ganzert Atividade 4 22 Atividade • Se minha SLA de disponibilidade em contrato fixado com um determinado cliente é de 98%/mês, e na última semana deixei de fornecer o serviço por indisponibilidade técnica por 2h, terei que pagar a multa contratual associada à SLA? Solução • Cálculo da disponibilidade: 23 Tempo de serviço acordado – tempo de queda Tempo de serviço acordado X 100 Solução • Cálculo da disponibilidade: 24 ([1 mês = 720h] – 2h) 720h X 100 Solução • Cálculo da disponibilidade: 25 ([1 mês = 720h] – 2h) 720h X 100 99,72% Solução • Como a SLA é de 98%, não precisarei pagar a multa contratual. • Lembre-se: a interrupção de 2 horas deverá ser aferida e gerar informações para melhoria do serviço, evitando que a paralização volte a ocorrer pelo mesmo motivo. 26
Compartilhar