Buscar

Ciclo de Vida da Operação do Serviço

Prévia do material em texto

*
Operação de Serviço
*
 Processos do ciclo de vida OPERAÇÃO DE SERVIÇO: *Gerenciamento de Eventos *Gerenciamento de Incidentes *Gerenciamento de Problemas *Gerenciamento de Requisições * Gerenciamento de Acesso 
*Central de Serviços
*Gerenciamento Técnico
*Operação de TI
*Gerenciamento de Aplicações
Funções
*
 Conteúdo desta aula: *Gerenciamento de Eventos *Gerenciamento de Incidentes *Gerenciamento de Problemas *Gerenciamento de Requisições * Gerenciamento de Acesso 
*
 Alguns Conceitos e Definições de Operação de Serviço Balanceamento entre visão interna de TI x visão externa de negócio -Clientes percebem o serviço em relação a sua utilidade e garantia 
 -A área operacional de TI enxerga os componentes técnicos necessários para a entrega do serviço 
 -TI deve falar a linguagem do cliente e do negócio de forma mínima a satisfazer a entrega do serviço com garantia e qualidade 
 -A operação de serviço precisa garantir o atendimento aos serviços de TI, contemplando em seu escopo o rápido atendimento das mudanças nos negócios 
*
Balanceamento entre qualidade do serviço x custo do serviço 
 -Cultura disseminada da relação custo x benefício 
 -Altos investimentos são desperdícios se não promovem melhorias em termos de qualidade dos serviços 
 -Por outro lado, melhorias na qualidade dos serviços demandam investimentos financeiros 
 Qual é o ponto ótimo então? 
 Atendimento dos níveis de qualidade dos serviços de acordo com os níveis de serviço acordados 
*
 Balanceamento entre proatividade e reatividade -Uma organização proativa está sempre buscando melhorar os serviços de TI 
 -Uma organização reativa, pode, por outro lado, viver de ‘apagar incêndios’ 
 -Porém, proatividade demais pode custar caro, além de promover melhorias desnecessárias 
 Qual é o ponto ótimo então? 
 Proatividade voltada para o atendimento das necessidades do negócio e dos usuários 
*
Gerenciamento de Eventos 
Evento -É qualquer ocorrência detectável ou discernível que tenha significância para o gerenciamento da infraestrutura de TI ou entrega dos serviços de TI quanto ao impacto que um desvio possa causar no serviço. (ITIL) -Requer ações das equipes de operações de TI e pode iniciar um registro de um incidente qualquer Pontos Importantes do Gerenciamento de Eventos 
Os eventos podem: -Indicar que algo não está de acordo com a operação do serviço ou descumpre um nível de serviço acordado -Indicar uma informação importante para o negócio, como uma confirmação de que um processo rodou com sucesso -Indicar uma necessidade de intervenção, como uma troca de mídia de backup, por exemplo 
*
Monitorar serviços requer configurar alertas em dois níveis: 
 * Ativo, quando são identificadas tendências de serviços de TI que permitem a configuração de alertas antes do impacto no serviço se concretizar * Reativo, quando uma falha que já ocorreu é detectada 
*
*
 Pense nas situações abaixo: 1) Uma notificação foi emitida porque um determinado servidor atingiu um nível crítico de armazenamento 2) Uma notificação foi emitida porque houve uma troca de senha do usuário em um determinado sistema 3) Uma notificação foi emitida porque um determinado serviço não está funcionando como o previsto 
Estas notificações são semelhantes? Eventos são, portanto, categorizados quanto às suas significâncias: * Informativos: não requerem ações (confirmações de status, se atividades ou situações específicas foram atendidas ou executadas)
 * Aviso: é gerado quando um serviço está se aproximando de um limite 
 * Exceção: identifica que uma determinada situação pré-definida não está funcionando como previsto (perdas de funcionalidades, quedas de performance, queda de nível de serviço) 	 	 
*
Gerenciamento de Incidentes Conceitos 
É uma interrupção não planejada de um serviço de TI
O gerenciamento de incidentes é responsável por tratar as exceções que causam falhas na operação normal dos serviços ou qualquer outra interrupção não planejada
O termo ‘operação normal’ refere-se aos níveis de serviço acordados nos Acordos e Contratos de Nível de Serviço É o processo mais visível para os usuários de serviços de TI porque o gerenciamento de incidentes é o responsável direto pelo primeiro atendimento de falhas na operação dos serviços de TI Objetivo Restaurar a operação normal dos serviços o mais rápido possível para minimizar o impacto no negócio, respeitando os prazos estabelecidos no acordo 
*
 Modelo de Incidentes
 -Incidentes não são novidade para suporte de TI e podem se repetir ou podem ocorrer de forma semelhante. Portanto, trocar informações sobre os incidentes ou documentar os processos de atendimento pode economizar horas futuras de resolução de problemas 
 -Agir proativamente em prol de ações que busquem a causa raiz dos incidentes e implemente melhorias nos serviços de TI
 -Além de economizar tempo para resolver um incidente, o modelo de incidentes pode ajudar a identificar prontamente a equipe competente, caso o problema tenha de ser encaminhado para níveis mais complexos
 -Modelos de incidentes podem ser encontrados em formatos de scripts de atendimento 
*
 Na Ausência de um Modelo de Incidentes -Incidentes ‘órfãos’ largados em uma fila de atendimento -Conflitos de responsabilidades -Equipes realizando as mesmas atividades repetidamente. Este tipo de situação é muito comum quando um usuário é contactado duas, três ou mais vezes pela mesma razão e ele é obrigado a reportar o mesmo incidente diversas vezes -Se não há modelo, quais incidentes serão tratados com maior prioridade? Quem define isso? O usuário? 
*
 
Problema de acesso do usuário
Início
Fim
*
Atividades do Gerenciamento de Incidentes 
 -Identificação do incidente por meio de uma das seguintes opções: 
 * Gerenciamento de eventos 
 * Identificação da própria equipe de TI 
 * Solicitação de atendimento de incidentes feita pelo usuário (via ligação telefônica, sistema ou qualquer outro canal de solicitação) 
*
 -Registro do incidente em um sistema de acompanhamento, que pode incluir os seguintes atributos: * Número de identificação único do incidente * Urgência do incidente *Impacto do incidente * Datas de abertura e de cada atualização * Identificação do técnico responsável e grupo de suporte que está atendendo o incidente *Fonte de origem do incidente (e-mails, telefone, intranet, etc) * Descrição dos sintomas do incidente * Status do incidente (aberto, aguardando em fila, sendo atendido, fechado, cancelado, etc) * Atividades realizadas para resolução do incidente 
*
 -Categorização do Incidente: 
 * Critérios dependem de cada organização * Separação em níveis de atendimento para o incidente Exemplo de categorização de um incidente: 
 Nível 1: serviço de TI 
 -Análise inicial do incidente
 -Categorização do chamado
 -Dúvidas de acesso ou operacionais
 -Cumprimento de Requisição
 - Verificação de escalonamento 
*
 -Categorização do Incidente (continuação):
 Nível 2: tipo de solicitação para esse serviço de TI 	 	-Suporte especializado do sistema 	-Análise do incidente 	- Verificação de escalonamento 
 Nível 3: tipos de atividades requeridas para cada tipo de solicitação 	-Análise do incidente
 -Procedimentos para a resolução do incidente 	-Suporte terceirizado 
*
 -Priorização do Incidente: Definida com base em uma matriz de risco entre a urgência do tratamento do incidente e o impacto que o incidente causa na operação da empresa, seguindo alguns critérios: * Quantidade de áreas afetadas * Quantidade de serviçosimpactados * Nível de exposição da imagem da empresa * Risco de perdas financeiras * Conformidade com leis e regulamentações 
Urgência é a determinação do tempo máximo que uma empresa pode suportar esses impactos sem solução e pode ser determinada: * Pela taxa de sustentabilidade (tempo médio para restauração do serviço) * Acordada pelo gerenciamento de disponibilidade (desenho de serviço) *Definida no acordo ou contrato de nível de serviço 
*
-Priorização do Incidente: Exemplo de definição de prioridade: Matriz GUT (gravidade, urgência e tendência) Exemplo de aplicação da Matriz GUT: 
*
 Em consonância com a matriz, a organização pode estabelecer também no ANS o tempo médio para restauração do serviço a partir das prioridades listadas. Exemplo: Prioridade 1: TMPRS = 1 hora Prioridade 2: TMPRS = 4 horas Prioridade 3: TMPRS = 8 horas Prioridade 4: TMPRS = 24 horas Prioridade 5: TMPRS = 40 horas 
*
 
Considere os seguintes dados a partir do Acordo de Nível de Serviço: Prioridade 1: TMPRS = 1 hora Prioridade 2: TMPRS = 4 horas Prioridade 3: TMPRS = 8 horas Prioridade 4: TMPRS = 24 horas Prioridade 5: TMPRS = 40 horas 
*
 Ponto importante a considerar ao definir os entendimentos de prioridade: -Clientes VIP (very important person) Quem são os clientes VIP? -Usuários que trabalham com operações críticas de negócio, gerentes seniores da empresa, diretores, etc Diagnóstico Inicial do Incidente Investiga o sintoma do incidente, podendo consultar informações de incidentes anteriores, bases de dados de erros conhecidos (BDEC) para auxílio no diagnóstico do incidente Escalação do Incidente Após o diagnóstico inicial do incidente, o técnico tentará aplicar a solução de contorno ou resolução do incidente. Caso não seja possível, o incidente deve ser escalado por meio de um entre dois níveis possíveis: Escalação funcional – o erro é encaminhado para uma equipe especializada, com mais experiência Escalação hierárquica – pode ser necessário acionamento de um fornecedor da solução ou mesmo a resolução de conflitos de incidentes com a mesma classificação, sendo um gerente o responsável por determinar qual incidente deverá ser tratado primeiro 
*
 Resolução do Incidente Verifica se a resolução do incidente pode ser aplicada sem requisição de mudanças. Se houver necessidade, uma requisição de mudanças (RDM) deve ser aberta para a resolução da falha Caso não haja a necessidade de mudanças, a solução é rápida, o registro de incidentes é atualizado e o incidente é fechado Fechamento do Incidente Verificado se o incidente foi realmente resolvido e se o usuário está satisfeito com a solução aplicada A central de serviços verifica se todas as informações relevantes do serviço estão preenchidas de acordo com as políticas do registro de incidentes Se o incidente não estiver de acordo com as políticas do registro de incidentes ou se o usuário não estiver satisfeito com a solução, o incidente é escalado de volta para a equipe que estava tratando o incidente 
*
 
Cumprimento de Requisição
 Todas as solicitações feitas à central de serviços são registros de incidentes? Usuários podem solicitar serviços que são previamente planejados, não causam impactos nos serviços de TI e já possuem procedimentos específicos para a sua execução Conceito do cumprimento de requisição É o processo que executa as solicitações de serviço dos usuários que não estão relacionadas a incidentes e são serviços pré-aprovados, com baixo ou nenhum impacto na operação de TI e que podem ser realizados sem a necessidade de planejamento e aprovação do gerenciamento de mudanças 
*
 Atividades do Cumprimento de Requisição Requisição de Serviço – define previamente como as solicitações de serviço deverão ser atendidas, seguindo a mesma filosofia dos modelos de incidentes. 
 Aprovação – define os critérios para aprovação de um serviço. Aqui podem entrar também aprovações meramente informativas, como, por exemplo, a ciência de um gerente acerca da execução de um serviço ou mesmo descentralizações para aprovações de gerências menores, conforme a relevância do serviço. Execução – é a execução ou realização do serviço solicitado. Dependendo do serviço a ser executado, podem ser planejadas no modelo de solicitação de serviços uma ciência de um gerente, um ‘ciente’ sobre um teste a ser realizado ou a evidência de quem executou o serviço Fechamento – segue o mesmo fluxo de fechamento de um incidente, ou seja, a central de serviços verifica se todas as informações relevantes do serviço estão preenchidas de acordo com as políticas Se o serviço não estiver de acordo com as políticas do cumprimento de requisição ou se o usuário não estiver satisfeito com o atendimento do serviço, o serviço é escalado de volta para a equipe ou profissional responsável 
*
Gerenciamento de Problemas 
Primeiramente: incidente ≠ problema -Gerenciamento de incidentes busca restabelecer o serviço de TI o mais rápido possível -Gerenciamento de problemas busca encontrar a causa raiz do problema e aplicar uma solução definitiva para a resolução do problema 
-Se o incidente é recorrente, mesmo após a aplicação de diversas soluções de contorno, então um registro de problemas deve ser aberto -A causa raiz de um problema deve ser identificada por meio de uma análise de sintomas, possíveis causas, cruzamento de informações, bases de conhecimento e resultados de testes 
Diagrama de Ishikawa
Análise de Pareto
Brainstorm
BDEC
*
Gerenciamento de Problemas 
-Após a identificação da causa raiz, o Gerenciamento de Problemas aplica a solução encontrada ou abre uma RDM para mudança no serviço, se for necessário
-Identificação e documentação da causa raiz de um problema: erro conhecido -Gerenciamento de problemas é realizado normalmente por equipes com maior nível de conhecimento. Muitas empresas possuem somente estruturas de gerenciamento de incidentes, fazendo com que tal estrutura viva de aplicar soluções de contorno indefinidamente
 Objetivo do Gerenciamento de Problemas
 Prevenir a ocorrência de problemas e incidentes associados através da:
 -Eliminação de incidentes recorrentes
 -Minimização dos impactos de incidentes que não puderam ser prevenidos
 
*
 Divisões do Gerenciamento de Problemas -Gerenciamento de problemas reativos: executado como parte da operação do serviço -Gerenciamento de problemas proativos : é iniciado na operação do serviço, mas não possui um fim em si mesmo Assim como os incidentes, o gerenciamento de problemas possui modelos com as mesmas características de categorização, priorização, histórico etc Gerenciamento de Problemas administra o BDEC 
Contribuição para a Gestão do Conhecimento -Maior probabilidade dos níveis inferiores atenderem os incidentes em tempos mais reduzidos -Foco das outras equipes de TI (atividades de mais valor aos serviços de TI e aos negócios)
*
 
Revisão do Problema
+
*
Gerenciamento de Acesso 
Objetiva a garantia de que somente os usuários autorizados acessem os serviços de TI Foco na confidencialidade, integridade e disponibilidade definidas pelo gerenciamento de segurança da informação 
Conceitos básicos: 
Acesso – nível de funcionalidade de um serviço a quem um usuário tem direito de acesso e uso 
Identidade – a forma como o usuário é identificado dentro da organização, sendo única para cada indivíduo 
Direitos – são os privilégios de acesso do usuário a determinadas funções 
*
 Atividades do Gerenciamento de Acesso
 Solicitação de acesso (RDM ou solicitação de serviço) Verificaçãode acesso (o usuário é quem realmente diz ser? Ele possui legitimidade para solicitar o acesso) Prover permissões (conceder ou negar acesso, lembrando que o gerenciamento de acesso concede ou nega tais acessos com base no que foi decidido nos ciclos de estratégia de serviço e desenho de serviço) Monitorar status das identidades (funcionários podem ser transferidos, desligados, promovidos e suas permissões devem refletir seu status atual) Registrar e rastrear acessos (monitorar as atividades dos perfis nos serviços de TI) Remover ou restringir permissões (remover acessos de acordo com as políticas definidas pela estratégia e desenho de serviço)

Continue navegando