Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profº Rafael Braga O que é gerenciamento de rede? "Gerenciamento de rede inclui o oferecimento, a integração e a coordenação de elementos de hardware, software e humanos, para monitorar, testar, consultar, configurar, analisar, avaliar e controlar os recursos da rede, e de elementos, para satisfazer às exigências operacionais, de desempenho e de qualidade de serviço em tempo real a um custo razoável." Tuncay Saydam em From networks and network management into service and service management. MOTIVAÇÃO ➔ Crescimento das redes: ➔ Número de equipamentos ➔ Diversidade de tecnologias ➔ Diversidade de ambientes operacionais ➔ Extensão/Dispersão da rede ➔ Garantir a qualidade no serviço; ➔ Clientes mais exigentes ➔ Competitividade ➔ Outages ➔ Novos dispositivos/protocolos/arquiteturas de rede; ➔ Virtualização ➔ Computação na Nuvem MOTIVAÇÃO ➔ Complexidade das redes modernas ➔ Migração de tecnologias legadas para redes de dados ➔ Telefonia ➔ TV (Streaming / GVT / Netflix / PS3) ➔ Telemetria ➔ Vigilância ➔ Múltiplos fornecedores ➔ Ausência de recursos suficientes para administrar/monitorar a rede Exemplos de sistemas de gerência de rede Veja também o sistema de gerenciamento de redes da RNP no link abaixo: http://www.rnp.br/backbone/ Exemplos de sistemas de gerência de rede Exemplos de sistemas de controle "O administrador de rede deve monitorar, gerenciar e controlar ativamente o sistema do qual está encarregado." Kurose e Ross OBJETIVOS ➔ Detecção de falhas ➔ Falhas em interfaces de rede, Computadores/Servidores, Roteadores, etc ➔ Através do monitoramento de tráfego ou ainda contadores de performance ➔ Monitoração de Hospedeiro ➔ Acompanhar a disponibilidade dos hosts da rede ➔ Realizar gerência proativa na ocorrência de uma falha ➔ Monitoração de Tráfego ➔ A rede pode ser otimizada ➔ Gargalos resolvidos ➔ Novas contratações podem ser iniciadas antes da exaustão do recurso OBJETIVOS ➔ Detecção de Mudanças rápidas em tablas de roteamento ➔ Quando muito frequentes, podem indicar instabilidade em um roteador mal configurado ou intermitência em links de comunicação ➔ Monitoração de SLA's (Service level Agreement) ➔ Seja garantido o nível de serviço contratado ➔ Alguns indicadores: Disponibilidade, latência, throughput, notificação de eventos/atividades planejadas ➔ É necessário que seja especificado no contrato OBJETIVOS ➔ Detecção de Intrusos ➔ Filtragem de tráfego ➔ Notificação de eventos suspeitos ➔ Aumento de consumo de banda repentino ➔ Aumento de pacotes TCP SYN direcionados a um único hospedeiro ➔ Conexões a portas de acesso remoto ➔ Autenticações inválidas Modelo de Gerenciamento de redes da ISO A ISO (International Organization for Standarization) criou um modelo de gereciamento de rede mais estruturado, baseado em 5 áreas de gerenciamento: ➔ Gerencimaneto de Desempenho ➔ Gerenciamento de Falhas ➔ Gerenciamento de Configurações ➔ Gerenciamento de Contabilização ➔ Gerenciamento de Segurança Gerenciamento de Desempenho ➔ Quantificar, medir, analisar, informar, analisar e controlar o desempenho de diferentes componentes/recursos de rede ➔ ➔ Sejam ativos de rede, links, servidores ou ainda hosts SNMP desempenha um papel fundamental neste gerenciamento ➔ Controlar as variáveis da rede para atingir o nível de desempenho especificado: ➔ Capacidade de Utilização e Quantidade de Tráfego; ➔ Vazão dos Dados e Tempo de Resposta. ➔ Definição de indicadores de rede Gerenciamento de Desempenho Gerenciamento de Desempenho ➔ Utilizado no planejamento da rede: ➔ Dimensionamento ➔ Identificação de gargalos ➔ Resolução de problemas de performance ➔ Relocação de recursos ➔ Ampliações programadas Gerenciamento de Desempenho Exemplos: ➔ Utilização de CPU dos servidores é considerada OK até 60%, entre 61-85% deve-se iniciar processo de upgrade, acima de 86% é considerado crítico ➔ Ocupação dos links da rede devem ser observados, ao chegar a 70%, deve-se solicitar ampliação, se links forem redundantes/load balance, um link não deve ultrapassar 40% de sua capacidade, pois em situação de falha, receberá a carga do outro link. Gerenciamento de Falhas ➔ Registrar, detectar e reagir a condições de falha da rede ➔ Gerenciamento de falha é o tratamento imediato, já o gerenciamento de desempenho é a longo prazo ➔ Requer constante observação do funcionamento dos dispositivos de forma que se possa identificar rapidamente o problema e resolvê-lo ➔ Gerência proativa de falhas ➔ Determinar e isolar o ponto de falha; ➔ Reconfigurar a rede para diminuir impacto da falha; ➔ Reparar a falha e voltar à situação normal de funcionamento Gerenciamento de Falhas ➔ Registrar, detectar e reagir a condições de falha da rede ➔ Gerenciamento de falha é o tratamento imediato, já o gerenciamento de desempenho é a longo prazo Gerenciamento de Falhas Exemplos de eventos a serem monitorados ➔ Interfaces de rede down ➔ Serviços parados em servidores ➔ Links de comunicação fora ➔ Taxa de erro em links de comunicação ➔ Ocupação de disco acima de um dado threshold (limite inferior) Gerenciamento de Falhas Meios para atingir estes objetivos ➔ Utilizar ferramentas e funções de gerenciamento rápidas e confiáveis; ➔ Utilizar redundância de rotas e equipamentos para minimizar o impacto das falhas; ➔ Utilizar uma estratégia de gerenciamento de falhas redundante. Gerenciamento de Configuração ➔ ➔ Permite ao administrador saber quais dispositivos fazem parte da rede administrada Lidam com a instalação, inicialização, partida, modificação e registro de parâmetros de configuração ou opções de hardware e software de rede. ➔ Manter um inventário atualizado e produzir relatórios baseados nesse inventário. ➔ Reconfigurar a rede em função do desempenho, expansão ou recuperação de falhas; ➔ RFC-3139 oferece uma visão geral de gerenciamento de requisitos e de configurações Gerenciamento de Configuração RFC 3139 - Requirements for Configuration Management of IP- based Networks ➔ ➔ ➔ ➔ Policy Based Management: define um serviço específico em todos os devices da rede, incluindo comandos para múltiplos vendors. SNMP não é aplicado a este nível de gerência A rede deve ser especificada de forma abstrata em uma uma network-wide configuration Existência de tradutores da política network-wide configuration para configurações específicas de cada vendor/device Gerenciamento de Contabilização ➔ Permite aoadministrador da rede que especifique, registre e controle o acesso de usuários e dispositivos a recursos da rede. ➔ Monitoração de quanto dos recursos estão sendo utilizados por usuários ou grupos de usuários ➔ Quotas de utilização ➔ Limitação de uso dos recursos por usuários ou grupos de usuários ➔ Cobrança por utilização ➔ Alocação de acesso privilegiado a recursos Gerenciamento de Segurança ➔ Controlar o acesso aos recursos da rede de acordo com alguma política definida. Controla o acesso aos recursos da rede através do uso de técnicas de autenticação e políticas de autorização. ➔ Geração, distribuição e armazenamento de chaves criptográficas e de senhas; ➔ Registro dos logs de Segurança ➔ Proteção dos recursos da rede e das informações dos usuários Exemplo de Soluções FUNCIONALIDADE APLICAÇÃO FABRICANTE Gerência de desempenho Netclarity Lanquest Gerência de faltas Spectrum's alarm Aprisma managers Manipulação de alarmes Trap exploder Empire technologies Gerência de segurança Boks Securix Gerência de bens Assetview Hp Configuração Netbuilder 3com Configuração Cisco works Cisco Exemplo de Soluções Detecção de problemas com conectividade: ➔ Traceroute ➔ Ping ➔ Route ➔ Netstat ➔ ➔ ➔ Ifconfig(linux) / ipconfig(windows) Iperf (linux) Iftop (linux) ➔ MTR Rede sem Gerência Principais problemas de redes sem gerência ➔ Congestionamento ➔ Má utilização de recursos ➔ Recursos sobrecarregados ➔ ➔ Problemas com segurança Indisponibilidade ➔ Outros ? Tipos de Gerência Gerência Reativa ➔ Administrador da rede limita-se a reagir aos problemas que surgem ➔ Se utiliza de padrões e ferramentas de gerência para ser alertado de um problema Tipos de Gerência Gerência Pró-ativa ➔ Administrador da Rede procura, rotineiramente, por informações que possam revelar com antecedência a possibilidade de um problema na rede ➔ Concentra esforços nos estudos dos avisos (warnings), que são registros da ocorrência de uma situação anormal, porém não crítica ➔ Utiliza históricos, estatísticas e o monitoramento frequente dos eventos relevantes da rede ➔ Mais difícil de ser efetuada que a reativa. Entretanto, resulta em tempos menores de parada e economia geral de operação da rede Métricas ➔ Disponibilidade ➔ MTTR ➔ Tempo de Resposta ➔ Taxa de Erros ➔ Latência ➔ Vazão (Throughput) ➔ Utilização Métricas Disponibilidade "Um sistema de alta disponibilidade é um sistema informático resistente a falhas de software e energia, cujo objectivo é manter os serviços disponibilizados o máximo de tempo possível." (Fonte: Wikipedia) Métricas Disponibilidade Níveis de Alta Disponibilidade Quanto maior a disponibilidade, maior a redundância e custo das soluções: tudo depende do tipo de serviço que se pretende disponibilizar Métricas Disponibilidade Cálculo da Disponibilidade Métricas MTTR É o espaço de tempo (médio) que decorre entre a ocorrência da falha e a total recuperação do sistema ao seu estado operacional. (Fonte: Wikipedia) Métricas Tempo de Resposta ➔ Tempo decorrido entre a requisição de uma ação ao sistema e a resposta completa à sua requisição ➔ Medição Complexa ➔ Depende de diversas variáveis e suas interações Métricas Taxa de Erro ➔ Relaciona a quantidade de pacotes, recebidos ou enviados por uma interface de rede, cujo conteúdo (em bits) apresenta erro em relação ao total de pacotes nessa mesma interface. ➔ Normalmente, essa taxa é medida em valores percentuais dentro do período de monitoramento. ➔ É de difícil detecção e pode ser a causadora de muitos problemas que serão detectados posteriormente Métricas Latência ➔ Tempo que um pacote leva para ir de um ponto a outro da rede ➔ Normalmente medido em milisegundos ➔ Quanto menor a latência, melhor o tempo de resposta da rede Métricas Vazão (Throughput) Throughput (ou taxa de transferência) é a quantidade de dados transferidos de um lugar a outro, tem como unidades básicas de medidas o Kbps, o Mbps e o Gbps. O throughput pode ser traduzido como a taxa de transferência efetiva de um sistema. A taxa de transferência efetiva de um determinado sistema (uma rede de roteadores por exemplo) pode ser menor que a taxa de entrada devido às perdas e atrasos no sistema. (Fonte: Wikipedia) Throughput é diferente da largura de banda nominal. Métricas Utilização ➔ É a quantidade em uso de um determinado recurso (porcentagem), em relação à sua capacidade total de atendimento ➔ Auxilia na avaliação e detecção de gargalos, uma vez que influenciam diretamente no tempo de resposta da rede e das aplicações envolvidas ➔ Monitorando-se a utilização, ao longo de um determinado período de tempo, é possível observar os intervalos de pico na utilização de um serviço ou recurso ➔ Exemplos: memória disponível, leitura/escrita em disco, processador (CPU), largura de banda da rede.
Compartilhar