Buscar

Aula_04

Prévia do material em texto

Entrega e Serviços em Tecnologia da Informação
Christian Ganzert
Aula 4
*
Disponibilidade
Conceitos de Disponibilidade
Gerência da Disponibilidade
Níveis de disponibilidade
Níveis de SLA
Responsabilidades
Tolerância a falhas
Diferença entre falha, erro e defeito.
Latência
Benefícios e fatores críticos de sucesso
*
*
Disponibilidade
Conceito de Disponibilidade:
ter a infraestrutura de serviços em condições de funcionar sem problemas, de forma contínua, de maneira que os negócios da organização possam ser realizados sem interrupção de qualquer espécie.
*
*
Disponibilidade
O ITIL define que:
 disponibilidade é um aspecto crítico da garantia do serviço e seu propósito é garantir que o nível de disponibilidade entregue em todos os serviços de TI atenda de maneira eficaz às necessidades de disponibilidade e/ ou metas de nível de serviço acordadas (SLA). 
*
*
Disponibilidade
Expressa em valores percentuais relacionados ao tempo total 24/7:
Exemplo:
Nosso provedor nos entregou a disponibilidade de 98%.
o que significa dizer que das 24 horas de cada dia, ela deve estar no ar por pelo menos 23h31m12s. 
*
*
Responsabilidades
Gerência de Disponibilidade:
Monitorar todos os aspectos da disponibilidade relativos aos serviços de TI e os componentes de suporte, com os eventos, alarmes com scripts automatizados para recuperação;
Manutenção de uma série de métodos, técnicas e cálculos para medir e reportar todas as métricas envolvidas;
*
*
Responsabilidades
Assistência com avaliação e gestão de riscos;
Entender as atuais e futuras demandas de disponibilidade, objetos de contrato;
Influenciar o desenho dos processos de serviços e componentes para que estejam alinhados aos processos de negócio;
Produzir um plano de disponibilidade (alinhar SLA e SLR – System Level Requirements);
*
*
Responsabilidades
Manter uma rotina agendada de testes para os componentes e mecanismos de serviços que sejam sujeitos à falha;
Assistir a identificação e solução dos diversos acidentes e problemas associados à indisponibilidade de serviços; 
Melhoria proativa da disponibilidade de serviços ou componentes, onde quer que seja justificável, alinhando às necessidades do negócio.
*
*
Tolerância a Falhas
É a habilidade de um serviço de TI ou item de configuração de continuar a operar corretamente após a falha de um componente.
Lista de componentes com tolerância a falhas:
UPS (popularmente conhecido como nobreak) e BP (Backup Power ;
RAID (Redundant Array of Independent Drives);
Duplicação de servidores ou CLUSTER. 
*
*
Tolerância a Falhas
A maior parte dos sistemas de tolerância a falhas está embarcado em um dispositivo (hardware) e não em aplicativos. 
Existem também sistemas de aplicativos para gerenciamento de contingências, criando redundâncias críticas e tolerância a falhas. 
Ex: Big IP.
*
*
Diferenças entre conceitos
Erro: 
resultado incorreto provocado por uma intervenção humana;
Defeito:
manifestação do erro (bug);
Falha:
o que é observado quando ocorre um defeito, normalmente uma situação indesejada. 
*
*
Latência 
Diferença de tempo entre o início de um evento e a percepção dos seus efeitos 
existem muitas variáveis que interferem nos serviços de uma organização, criando latência. 
O problema fica mais evidente em sistemas encadeados.
Jitter: fenômeno de variação da latência.
*
*
Latência
Latência é indisponibilidade, mesmo que por tempos relativamente pequenos. Mas fica claro que, quando seus efeitos ocorrem em ambientes conectados, eles se potencializam.
 
Latência também é o tempo que um serviço leva para ser restabelecido, depois da ocorrência de uma falha. É uma responsabilidade direta da gerência de disponibilidade.
*
*
Classificação de Falhas
Originadas por especificação incorreta;
Originadas por implementação inadequada;
Originadas por componentes com defeito;
Fadiga;
Externas ao serviço;
Operacionais.
*
*
Classificação das Falhas
Podemos ainda definir as falhas quanto:
À natureza - falha de software, hardware, operação e projeto;
À duração - se é permanente ou temporária;
À extensão - se é local ou global;
Ao valor - determinado ou indeterminado.
*
*
Medição da Disponibilidade
Confiabilidade
Tempo de funcionamento sem falhas
Sustentabilidade
Tempo de restauração após falha
Função de negócio vital
*
*
Fatores de disponibilidade
Complexidade da infraestrutura de TI;
Confiabilidade dos ativos e componentes;
Reação rápida e eficiente a falhas;
Qualidade na manutenção;
Fatores ambientais;
Fornecimento de serviços externos;
Atuação de elementos externos.
*
*
Cálculo da disponibilidade
*
Tempo de serviço acordado – tempo de queda
Tempo de serviço acordado 
X 100
*
Gerenciamento da Disponibilidade
*
disponibilidade
*
Indicadores de Desempenho
*
Entrega e Serviços em Tecnologia da Informação
Christian Ganzert
Atividade 4
*
*
Atividade
Se minha SLA de disponibilidade em contrato fixado com um determinado cliente é de 98%/mês, e na última semana deixei de fornecer o serviço por indisponibilidade técnica por 2h, terei que pagar a multa contratual associada à SLA?
*
Solução
Cálculo da disponibilidade:
*
Tempo de serviço acordado – tempo de queda
Tempo de serviço acordado 
X 100
*
Solução
Cálculo da disponibilidade:
*
([1 mês = 720h] – 2h)
720h
X 100
*
Solução
Cálculo da disponibilidade:
*
([1 mês = 720h] – 2h)
720h
X 100
99,72%
*
Solução
Como a SLA é de 98%, não precisarei pagar a multa contratual.
Lembre-se: a interrupção de 2 horas deverá ser aferida e gerar informações para melhoria do serviço, evitando que a paralização volte a ocorrer pelo mesmo motivo.
*

Continue navegando