Baixe o app para aproveitar ainda mais
Prévia do material em texto
TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 1 de 71 Aula 05 – Datacenters e Storage Sumário 1. Datacenters ......................................................................................................................................... 3 Classificações de Tier ........................................................................................................................ 3 Padrões de Infraestrutura de Sites ................................................................................................... 3 Modos de contratação ..................................................................................................................... 5 Questões Comentadas – Modos de Contratação em Datacenters .................................................. 6 2. Storage ................................................................................................................................................ 7 2.1. Conceitos de Storage .................................................................................................................. 7 Questões Comentadas – Conceitos de Storage .............................................................................. 10 2.2. RAID .......................................................................................................................................... 17 Questões Comentadas - RAID ......................................................................................................... 23 2.3. Padrões de comunicação .......................................................................................................... 32 Questões Comentadas – Padrões de Comunicação ....................................................................... 36 2.4. Padrões de Disco ...................................................................................................................... 40 2.5. Fitotecas ................................................................................................................................... 41 2.6. Fitas LTO ................................................................................................................................... 42 3. Backup e restauração de dados ........................................................................................................ 44 3.1. Full Backup ................................................................................................................................ 44 3.2. Backup Incremental e Diferencial............................................................................................. 45 3.3. Backups na prática .................................................................................................................... 46 3.3.1. Windows ................................................................................................................................ 47 3.3.2. Linux....................................................................................................................................... 48 Questões Comentadas – Ferramentas de Backup .......................................................................... 53 3.4. Políticas de Backup ................................................................................................................... 54 3.5. Tópicos Adicionais sobre Backup .............................................................................................. 57 Questões Comentadas - Backup ..................................................................................................... 60 4. Conclusão ........................................................................................................ 83 5. Referências ...................................................................................................... 83 Olá concurseiros! Agora vamos falar um pouco Datacenters e Ambientes de Armazenamento de Dados (ou de Storage). TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 2 de 71 Após a teoria, vamos resolver as principais questões que têm caído sobre o assunto nos últimos anos, para fixar o conteúdo. Devido à relativa pouca quantidade de questões da Vunesp, trouxemos questões de várias bancas. Vamos aos estudos? TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 3 de 71 1. Datacenters Os datacenters são hoje componentes centrais da TI de grande parte das organizações. Hoje é bem abundante o número de organizações que operam seus próprios centros de dados, mesmo que pequenos. Isto se dá porque, apesar das vantagens Nuvem e outros tipos de contratação de serviços de infraestrutura, nem sempre é mais barato para as organizações contratar estes serviços do que operar a própria estrutura de hardware. Ou seja, apesar da Nuvem e dos novos serviços, sempre encontraremos cenários de uso de centros de dados próprios dentro de algumas organizações, mesmo que de tamanhos pequenos ou com missões mais restritas. Já para prestadores de serviços de TI que tenham em seu portfólio serviços como esse, a operação do datacenter é um processo que está simplesmente dentro do núcleo do seu principal negócio. Classificações de Tier Há uma classificação de datacenters bastante usada no mercado, os níveis, ou “Tier” desenvolvidos pelo Uptime Institute. Estas classificações foram criadas para descrever de modo consistente a infraestrutura de um local que é requerida para sustentar as operações de um centro de dados, e deixar claro que data centers dependem da integração bem- sucedida da operação dos sistemas elétricos, mecânicos, hidráulicos e prediais. O objetivo deste padrão é prover aos profissionais de operação datacenters e administradores não técnicos um objetivo e meios efetivos de prever a performance de diferentes projetos de topologias de datacenters. Simplificando, o nível, ou Tier de um site todo é limitado pela classificação do seu subsistema mais fraco (alimentação elétrica, refrigeração, etc), que impactará na operação do datacenter. Como exemplo, um serviço de proteção de queda elétrica (UPS) Tier IV combinado com um sistema de refrigeração Tier II garantirá uma classificação do site como Tier II. Padrões de Infraestrutura de Sites No Tier I temos uma Infraestrutura básica de site. Neste nível não temos capacidade de redundância dos componentes, e uma distribuição nãoredundante de linhas de alimentação elétrica servindo ao ambiente crítico. Tem ainda como requisitos: TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 4 de 71 • Um espaço dedicado para os sistemas de TI; • Um sistema de prevenção a quedas de energia (UPS) para filtrar picos de energia e quedas momentâneas; • Equipamento dedicado de refrigeração; • Um gerador de energia para proteger as operações de TI de quedas de energia prolongadas. No Tier II temos um Componentes Redundantes de Infraestrutura de Site, além dos requisitos do Tier I, componentes de capacidade redundantes e uma única linha de alimentação servindo ao ambiente crítico. Os componentes redundantes incluem: • Geradores de energia extras; • Módulos de nobreaks com bancos de baterias; • Resfriadores e unidades de resfriamento; • Tanques de combustível (para o gerador). No Tier III temos uma Infraestrutura de Site Manutenível Concorrentemente. Neste nível, além dos requisitos do Tier II, temos: • Múltiplas linhas de alimentação elétrica servido independentemente ao ambiente crítico. Qualquer uma única entre as linhas de distribuiçãodeve ser suficiente suficiente para servir o ambiente crítico a qualquer tempo (redundância de redes elétricas). • Redundância de alimentação em cada equipamento de TI, com a instalação apropriada (nada de dois cabos de energia vindo da mesma tomada); • Reservatório no local que comporte no mínimo 20h de combustível para o gerador. Devido às configurações, espera-se que cada um e todos componentes de capacidade e elementos de um dos caminhos de distribuição elétrica possa ser posto fora de serviço de forma planejada sem impactar no ambiente crítico. Deve haver capacidade instalada suficiente para atender às necessidades no site quando qualquer um dos componentes ficar fora de serviço por qualquer razão. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 5 de 71 No Tier IV, temos uma Infraestrutura de Site Tolerante a Falhas, que atende, além dos requisitos do Tier III, os seguintes requisitos: • Componentes de capacidade independentes, sistemas fisicamente isolados com redundância; • Vários e diversos caminhos de distribuição de energia servindo simultaneamente ao ambiente crítico; • Os componentes de capacidade redundante e caminhos de distribuição diversos devem ser configurado de tal forma que sejam capazes de prover a potência e refrigeração ao ambiente crítico após qualquer falha da infraestrutura. Para este Tier, se espera que os sistemas de controle da infraestrutura demonstrem resposta autônoma às falhas, enquanto sustenta o ambiente crítico. O site não será suscetível à interrupção dos serviços devido a um (único) evento não planejado, bem como a nenhum evento de manutenção planejada. Modos de contratação Cada fornecedor de serviços de data center tem seus próprios serviços e níveis de serviços, como velocidade disponível de conexão, Backup, Disaster Recovery com replicação de dados ou dados + aplicação, serviços de Segurança (Firewall, proteção contra DDoS, Scanner de vulnerabilidades, IPS/IDS), monitoração, entre outros. Geralmente estes são os serviços que os melhores datacenters oferecem, cada um ao seu modo. Já os modelos que veremos a seguir são modelos que praticamente todo datacenter oferece. Colocation Colocation é o aluguel de espaço físico dentro do Data Center para o funcionamento de servidores e outros hardwares do cliente. É uma modalidade bastante usada, uma vez que tende a ser muito mais barato para um cliente contratar um espaço que já tenha toda estrutura de alimentação elétrica, refrigeração e segurança física consolidadas do que montar sua própria estrutura. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 6 de 71 Servidor dedicado Nesta modalidade o cliente contrata um ou mais servidores físicos, com níveis previamente estipulados de armazenamento, disponibilidade, e backup. Tem caído um pouco em desuso devido o crescimento da virtualização. Serviços virtualizados A modalidade que tem crescido mais é a de servidores virtualizados. Pode-se ter tanto um ambiente virtualizado tradicional num ambiente de hosting tradicional, conforme conhecemos, como um ambiente de Nuvem. No caso de o ambiente do fornecedor de serviços ser um ambiente de Nuvem, podemos ter servidores virtualizados fazendo parte da nuvem pública do fornecedor, como também podemos ter uma compartimentalização dentro da estrutura do fornecedor formando uma Nuvem privada, isolada do restante do ambiente. Questões Comentadas – Modos de Contratação em Datacenters VUNESP – 2014 - Órgão: DESENVOLVESP - Prova: Analista Um Datacenter típico possibilita que diversos serviços sejam disponibilizados. O serviço no qual o cliente contrata o espaço físico dos racks e a infraestrutura de operação (telecomunicação e energia), para instalar os seus servidores, os sistemas computacionais, e efetuar ele próprio o gerenciamento, monitoramento e suporte técnico, é denominado a. Co-location. b. Hosting. c. Nuvem Pública. d. Computer as a Service (CaaS). e. Space as a Service (SaaS). Comentário: O modo de contratação onde o cliente contrata somente espaço físico e a infraestrutura básica de telecomunicações, refrigeração e energia é o Colocation. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 7 de 71 No Hosting o cliente contrata a hospedagem de seus serviços de internet. Computer e Space as Service são itens criados pelo elaborador para nos confundir. Letra A é a correta. Resposta: A 2. Storage 2.1. Conceitos de Storage SAN Storage Area Network (SAN) é uma rede de alta velocidade projetada para um propósito especial, ela conecta vários dispositivos de armazenamento de dados com os servidores que utilizam este armazenamento. Geralmente as redes SAN são parte do Data Center, e são montadas próximas aos principais servidores da organização. Praticamente sempre são feitas sub-redes, de modo que o tráfego dentro dela é isolado dos demais componentes da rede, garantindo desempenho elevado. No entanto, cuidado, com o uso de fibra ótica, nada impede que haja uma SAN seja localizada fisicamente distante de servidores (questão de prova!). As principais tecnologias de comunicação usadas são a de fibra ótica ESCON da IBM e a tecnologia Fibre Channel. As redes SAN suportam, além do arquivamento e recuperação dos dados, o espelhamento de discos, backup e restauração, e a migração de dados de um dispositivo para outro, além do compartilhamento de dados entre vários servidores diferentes da rede. NAS Network-Attached Storage (NAS) é um dispositivo dedicado a um disco rígido para armazenamento, que possui o seu próprio endereço de rede e provê uma camada de armazenamento de dados em nível de arquivos (ex.: compartilhamentos Windows – SMB, compartilhamento de arquivos Unix/Linux – NFS, FTP) para outros dispositivos da rede. Um dispositivo NAS está ligado à rede local e possui um endereço IP, permitindo que aplicações e arquivos sejam servidos rápido, sem dependência a outros recursos. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 8 de 71 O armazenamento em NAS consiste em discos rígidos, incluindo geralmente configurações de RAID (veremos mais a frente). Acima disso está o suporte aos vários protocolos de rede para permitir a comunicação com os outros dispositivos da rede. Algumas soluções NAS podem embarcar um sistema Linux ou Windows, mas geralmente a maioria dos dispositivos possuem um sistema operacional proprietário. DAS Direct-Attached Storage (DAS) é um armazenamento diretamente ligado a um computador ou servidor. Ele não é geralmente acessível diretamente por outros computadores, a não ser com suporte especial na camada do software do sistema operacional. O DAS tem como vantagem o baixo custo, e como desvantagem a dificuldade de compartilhamento do armazenamento na rede, algo que já é previsto e melhor suportado nas arquiteturas NAS e SAN. Zoning Diz respeito ao recurso de segmentação dos dados em uma SAN de modo que apenas os usuários (ou sistemas) que devem ter acesso sejam habilitados a usar os dados. Esta funcionalidade não provê segurança completa, e sim apenas segregação, isolação. Este recurso geralmente é provido pelo software do fornecedor da SAN. Multipathing Multipathing consiste em dispor de mais de um caminho físico do servidor ao Storage, provendo assim tolerância a falhas. Essa é uma característica que deve estar presente em toda SAN bem projetada. Além das falhas nos cabos, há também possibilidade de falhas nos outros componentes da SAN, como adaptadores e switches fibre channel. Há várias soluções no mercado para Multipathing em SANs. Geralmente o fabricante disponibiliza uma solução de software que habilite a lida dos servidores com o Storage, embutindo o suporte aoMultipathing no Sistema Operacional. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 9 de 71 Figura 1: Exemplo de uma ligação dupla dos servidores ao Storage. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 10 de 71 Questões Comentadas – Conceitos de Storage CESPE - 2011 - PC-ES - Perito Criminal - Específicos Quanto aos conceitos de banco de dados, storage e RAID, julgue os itens seguintes. O storage do tipo SAN (Storage Area Network) é embasado em redes de armazenamento dedicadas e escaláveis que conectam servidores e dispositivos. Certo ( ) Errado ( ) Comentário: As Storage Area Networks são: • Redes dedicadas com tráfego interno isolado da rede; • Conectam os servidores ao storage; • Projetadas para prover alta disponibilidade e tolerância a falhas. O texto do enunciado da questão adere completamente às características que citamos e também às definições que trabalhamos. Correta. Resposta: C FCC - 2011 - TRT - 24ª REGIÃO (MS) - Analista Judiciário - Tecnologia da Informação Os clientes acessam o NAS - Network Attached Storage, por meio de uma interface a) SAN, tal como NFS, tanto para Unix quanto para Windows. b) NFS, tal como CIFS, tanto para Unix quanto para Windows. c) RPC, tal como NFS para Unix ou CIFS para Windows. d) RPC, tal como CIFS para Unix ou SAN para Windows. e) UDP, tal como NFS, tanto para Unix quanto para Windows. Comentário: Relembrando: CIFS é o SMB, procolo de compartilhamento Windows. NFS é o protocolo de compartilhamento do mundo Unix/Linux. A opção que bate com a definição é c) RPC, tal como NFS para Unix ou CIFS para Windows. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 11 de 71 Resposta: C FCC - 2010 - TRF - 4ª REGIÃO - Analista Judiciário - Tecnologia da Informação O tipo de informação que trafega nas redes com arquitetura Network Attached Storage (NAS) é a) a tupla. b) o arquivo. c) o bloco de dados d) o bloco de palavras. e) o fragmento. Comentário: Os NAS armazenam e provêm compartilhamento em nível de arquivo. A solução que armazena os dados em nível de bloco são os Storage SAN. Resposta: B FCC - 2010 - TRT - 9ª REGIÃO (PR) - Analista Judiciário - Tecnologia da Informação Em relação às redes de armazenamento de dados SAN e NAS, considere: I. A responsabilidade de formatar, particionar e distribuir informações nosdiscos do storage é do próprio storage, e não do sistema operacional. II. A distância entre os servidores e os dispositivos de armazenamento dedados é praticamente ilimitada, porém está restrita em latência. III. Tanto o crescimento quanto a diminuição das áreas de armazenamentopodem ocorrer sem ações no sistema operacional do servidor. IV. O desempenho está atrelado ao trabalho adicional no tratamento dosdados, pois os protocolos são voltados à movimentação de arquivos. As afirmações I, II, III e IV, referem-se, respectivamente a TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 12 de 71 a) ambas, SAN, NAS, SAN. b) SAN, ambas, ambas, NAS. c) NAS, ambas, NAS, NAS. d) NAS, SAN, NAS, SAN. e) NAS, SAN, ambas, ambas. Comentário: I. NAS. Nas SAN, o storage entrega ao servidor uma área de disco que ficará sob sua administração, podendo este criar sistemas de arquivos e partições conforme sua necessidade. II. Ambas. A conectividade dos dois são pela rede, sendo que os SAN atualmente utilizam redes fibre channel, que possuem longo alcance. A única limitação de distância é a latência, como foi colocado. III. NAS. Nas SAN os sistemas operacionais conhecem a um nível mais detalhado o armazenamento que estão usando, enquanto nos NAS o cliente só acessa o conjunto de arquivos, ficando qualquer alteração dos volumes de armazenamento transparente aos clientes. IV. NAS. O NAS trabalha com protocolos de movimentação de arquivos,enquanto as SAN trabalham com movimentação de blocos de dados. Resposta: C FCC - 2010 - TRT - 22ª Região (PI) - Analista Judiciário - Tecnologia da Informação Considere as características abaixo. (I) Comporta-se como se fosse uma única unidade de armazenamento,que o servidor pode acessar diretamente, de forma transparente. (II) Usa HDs tradicionais como blocos básicos de montagem, que são ligados a uma unidade controladora, que se encarrega do acesso aos dados, RAID e outras funções. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 13 de 71 (III) Processa um sistema operacional completo e funciona como um servidor de arquivos, ligado diretamente na rede e pode ser acessado simultaneamente por vários clientes. A correta associação das características explícitas em I, II e III com SAN e NAS, é respectivamente, a) SAN - NAS - SAN b) SAN - NAS - NAS c) SAN - SAN - NAS d) NAS - SAN - SAN e) NAS - NAS – SAN Comentário: I. “O servidor acessando diretamente” trata-se de SAN. No NAS, o acesso é feito via protocolos de compartilhamento de arquivos. II. Vários HDs ligados a uma controladora, com níveis de RAID aplicados aesta configuração, com outras funções, trata-se da descrição interna da parte de Storage de uma SAN. III. Processa o seu próprio sistema operacional, funcionando como servidor de arquivos... Ligado na rede e acessado por vários clientes simultaneamente. Mole né? NAS. Resposta: C TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 14 de 71 FGV - 2010 - SEAD-AP - Auditor da Receita do Estado - Prova 2 A solução mais simples nas situações em que ocorre a necessidade da busca de maior espaço de armazenamento em um microcomputador é a de adquirir um outro disco rígido. Quando se faz referência ao armazenamento em redes, três siglas surgem como solução: NAS, DAS e SAS. A esse respeito, analise as afirmativas a seguir. I. "Serial Attached SCSI - SAS" refere-se a um barramento paralelo, similarao IDE utilizado em HDs domésticos, mas que adiciona recursos para o uso em servidores. As versões iniciais do SAS suportavam taxas de transferência de 1 e 8 GB/s. II. "Network Attached Storage - NAS" refere-se a uma máquina que funciona como um servidor de arquivos, ligado diretamente na rede e que roda um sistema operacional completo. III. "Direct Attached Storage - DAS" refere-se a dispositivos de armazenamento externo, ligados diretamente ao servidor ou a qualquer outro micro da rede, como no caso das "cases" de HD ligadas à portas USB. Assinale: a) se somente a afirmativa II estiver correta. b) se somente as afirmativas I e II estiverem corretas. c) se somente as afirmativas I e III estiverem corretas. d) se somente as afirmativas II e III estiverem corretas. e) se todas as afirmativas estiverem corretas. Comentário: Vamos comentar cada uma das afirmações. I. O SAS é um barramento SERIAL, assim como o SATA e como o SCSI. Osbarramentos paralelos foram deixados de lado a um bom tempo no uso em padrões de transmissão. Outro erro, caso o anterior passasse despercebido, é a afirmação de que as versões atuais suportavam taxas de transferência de 1 a 8 GB/s quando na verdade as primeiras versões TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 15 de 71 suportavam taxas full-duplex de 300 MB/s e 600 MB/s no SAS 1.1 e 2.1, respectivamente. Somente a versão 3.0, mais recente, suporta taxa de 1200 MB/s, que seria acima de 1 GB/s. Neste item o elaborador seguiu a boa tradição dos itens estarem corretos por mais de um motivo. II. Servidor de arquivos (compartilhamento em nível de arquivos), estar ligado diretamente à rede e operar um S.O. completo são características do NAS. Correto. III. O DAS tem como característicadispositivo de armazenamento externoconectado diretamente ao servidor. Correto. A resposta que traz os itens II e III como corretos é a letra D. Resposta: D FGV – 2008 - Órgão: Senado Federal - Prova: Analista de Suporte de Sistemas Quando há necessidade de mais espaço de armazenamento em um microcomputador, a opção mais comum é simplesmente adquirir outro HD. Quando se faz referência a armazenamento em redes, três siglas surgem como solução: NAS, DAS e SAN. A esse respeito, analise as afirmativas a seguir: I. DAS (Direct Attached Storage) refere-se a dispositivos de armazenamento externo ligados diretamente ao servidor ou a qualquer outro micro da rede, como no caso das "cases" de HD ligadas a portas USB. II. NAS (Network Attached Storage) refere-se a uma máquina que funcionacomo um servidor de arquivos ligado diretamente na rede e que roda um sistema operacional completo. III. SAS (Serial Attached SCSI) é um barramento serial, similar ao SATA utilizado em HDs domésticos, mas que adiciona recursos para o uso em servidores. As versões iniciais do SAS suportavam taxas de transferência de 150 e 300 MB/s. Recentemente foi introduzido o padrão de 600 MB/s e passou a ser desenvolvido o padrão seguinte, de 1,2 GB/s. Assinale: TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 16 de 71 a) se somente a afirmativa II estiver correta. b) se somente as afirmativas I e II estiverem corretas. c) se somente as afirmativas I e III estiverem corretas. d) se somente as afirmativas II e III estiverem corretas. e) se todas as afirmativas estiverem corretas. Comentário: A questão anterior, que é mais recente, foi claramente inspirada (para não dizer copiada) desta, isto retrata a importância de resolvermos questões. Os itens I e II já foram previamente comentados, estão corretos. O item III traz informações sobre taxas de transferência das versões do padrão SAS. As informações estão corretas, as versões 1.1 e 2.1 traziam velocidades de transmissão em cada direção de 150 e 300 MB/s, respectivamente, e a mais nova de 600 MB/s em cada direção. Para mais informações vejam a sessão de 5. Referências. Desta forma, temos todos itens corretos. Letra E. Resposta: E TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 17 de 71 2.2. RAID RAID é a sigla para Redundant Array of Inexpensive Disks. Através do RAID podemos usar várias configurações de uso de HDs em conjunto para obter maior velocidade e/ou segurança dos dados armazenados. O RAID pode ser feito tanto por uma controladora na placa-mãe do computador (hardware), quanto por software. O RAID por hardware tem uma performance superior ao feito por software. Os níveis mais comumente utilizados em servidores são o 1, 5 e 6. Os arranjos do tipo 2, 3 e 4 são considerados obsoletos atualmente, por isso não citaremos aqui, mas vocês podem pesquisar por curiosidade técnica. No RAID é recomendável a utilização de HDs idênticos, ou pelo menos do mesmo tamanho, caso contrário a área excedente será desperdiçada. Por este motivo, partiremos desse pressuposto nas explicações. RAID 0 Conhecido como striping, consiste em dividir o armazenamento de dados em segmentos (stripes) que ficam armazenados em cada um dos discos. Esta divisão acarreta em maior desempenho na leitura e gravação. Vantagens: • Acesso mais rápido às informações (o tempo de leitura é dividido entre os discos do array) e maior velocidade de escrita. Desvantagens: • Caso um dos discos venha a dar problema, os dados que estavam divididos entre os discos do grupo passam a estar corrompidos, sem possibilidade de recuperação. • Há maior possibilidade de falha a cada HD que incluímos a mais, uma vez que um conjunto de vários HDs tem uma probabilidade maior de apresentar defeito do que somente um. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 18 de 71 RAID 1 É a configuração geralmente mais usada, conhecida como mirroring ou espelhamento. Nela, cada um dos HDs do grupo recebe os dados escritos, tornando os dados replicados entre os HDs. Como temos vários HDs iguais escrevendo o mesmo dado, o tempo de gravação é constante neste tipo de arranjo. Vantagens: • Recuperação de dados em caso de falha em um dos HDs; Desvantagens: • Custo maior, pois temos que utilizar dois (ou mais) HDs para prover um espaço de armazenamento útil de apenas um. RAID 1 RAID 5 Striping com paridade. Já vimos o que é striping, agora falta vermos o que é paridade. Paridade nada mais é do que incluirmos um dígito de verificação para certificar que a informação está correta, como nos dígitos dos boletos bancários. Há uma soma de modo que se um dos números for alterado, a soma não irá mais bater, acusando um erro. Os algoritmos usados na verificação real são um pouco mais sofisticados, mas esse raciocínio serve para nos TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 19 de 71 ajudar a entender o que é a informação de paridade. No RAID 5 essa informação da paridade é distribuída entre os diversos drives, permitindo a falha de até 1 deles sem perda da integridade das informações. A partir da ocorrência da falha em um único drive, as leituras seguintes podem ser calculadas a partir da paridade armazenada nos diversos discos, sem nenhuma perda de dados. Requer no mínimo 3 discos para funcionar (dois discos não garantiriam os dados em caso de falha de um deles). Vantagens: • Boa performance; • Se um disco falha, o sistema continua funcionando. Desvantagens: • Controle complexo dos HDs. Figura 4: RAID 5: cada disco armazena informação de paridade de uma faixa (stripe) de dados. RAID 6 Similar ao RAID 5 em vantagens e desvantagens, mas com a utilização de 2 blocos para para verificação de paridade, garantindo a integridade em caso de falha de até 2 drivers. O que acontece se a gente Com essa configuração, ao ocorrer falha em um disco podemos retirá-lo para substituição e o sistema ainda continuará a operar garantindo a integridade dos dados, uma vez que ele suporta a falha de até 2 discos. Esta operação ocorre com desempenho um pouco menor, TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 20 de 71 pois os dados que só estavam no disco perdido estão sendo recalculados a partir das informações de paridade. Ao ser feita a substituição do disco falhado, o sistema volta a operar com a mesma performance e segurança do estado original. Por este motivo, essa configuração é ideal para ambientes com necessidade de alta disponibilidade. Figura 5: RAID 6 RAID 6: são gravadas duas faixas de informações de paridade em cada disco do arranjo. Vantagens: • Garantia de integridade dos dados em caso de falha em até 2 HDs; Desvantagens: • Suportado apenas por controladoras mais recentes; • Escrita é tornada mais lenta no processo de gravação duplas das informações de paridade, em relação ao RAID 5. Níveis aninhados de RAID Além dos níveis expostos, há a possibilidade de utilizarmos níveis de RAID aninhados uns dentro dos outros. Para ajudar a memorização, lembre-se que a sigla vem sempre de baixo pra cima, por exemplo, no RAID 10 temos no nível mais baixo um RAID 1 e no nível acima um RAID 0. Vejamos abaixo os principais exemplos. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 21 de 71 RAID 01 (0+1) Espelhamento de stripes. É uma configuração utilizada para striping e replicação. Tem uma área útil igual à do RAID 1, do tamanho de um HD. É possível montar um RAID 01 com 3 HDs, embora seja mais comum utilizar 4 HDs. Nesta configuração, se um dos discos falhar, o sistema passaa ser um RAID 0. Figura 6: Arranjo RAID 01 ou 0+1 RAID 10 (1+0) É similar ao 01, mas com os níveis invertidos. É um striping de espelhos. Nesta configuração a taxa de leitura é muito rápida, só é menos rápida que a do próprio RAID 0. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 22 de 71 Figura 7: Arranjo RAID 10 ou 1+0 RAID 50 (5+0) RAID 5 aninhado dentro de um RAID 0, contemplando o striping em nível de blocos com paridade distribuída, do RAID 5, com o striping do RAID 0. Figura 8: Arranjo RAID 50 ou 5+0 Vantagens: • Muito rápido; • Oferece redundância dos dados; Desvantagens: TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 23 de 71 • Caro (exige no mínimo 6 discos, 3 para o RAID 5, multiplicados por 2 para o RAID 0); RAID 60 (6+0) O mesmo que o RAID 5+0, mas utilizando o RAID 6 no lugar do 5, ou seja, com o dobro de blocos para armazenamento de informações de paridade. Figura 9: Arranjo RAID 6+0 Vantagens: • Muito rápido; • Oferece redundância dos dados; Desvantagens: • Caro (exige no mínimo 6 discos, 3 para o RAID 6, multiplicados por 2 para o RAID 0); Questões Comentadas - RAID FCC - 2013 - TRT - 5ª Região (BA) - Analista Judiciário - Tecnologia da Informação A tecnologia RAID divide ou duplica a tarefa de um disco rígido por mais discos, de forma a melhorar o desempenho ou a criar redundância de dados, em caso de uma avaria na unidade. A seguir estão descritos dois níveis de RAID: I. É uma boa opção se a segurança for mais importante do que a velocidade. Os discos devem ter a mesma capacidade. A capacidade de armazenamento é calculada através da multiplicação do número de unidades pela capacidade do disco dividido por 2. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 24 de 71 II. É ideal para os usuários que necessitam o máximo de velocidade e capacidade. Todos os discos devem ter a mesma capacidade. A capacidade de armazenamento é calculada através da multiplicação do número de unidades pela capacidade do disco. Se um disco físico no conjunto falhar, os dados de todos os discos se tornam inacessíveis. Os níveis de RAID descritos em I e II são, respectivamente, a) RAID 10 e RAID 5. b) RAID 1 e RAID 3. c) RAID 3 e RAID 5. d) RAID 3 e RAID 0. e) RAID 1 e RAID 0. Comentário: I. A opção que provê segurança e capacidade de armazenamento igual àsoma da capacidade total dos HDs é o RAID 1 – Espelhamento ou Mirroring. II. A opção que provê velocidade e capacidade igual à simples soma dascapacidades de todos os HDs é o RAID 0 – Stripping. Resposta: E FCC - 2013 - TRT - 9ª REGIÃO (PR) - Técnico Judiciário - Tecnologia da Informação Considere as afirmativas sobre armazenamento utilizando RAID: I. São usados dois discos (ou qualquer outro número par). O primeiro discoarmazena dados e o segundo armazena uma cópia exata do primeiro, atualizada em tempo real. Se o primeiro disco falha, a controladora automaticamente chaveia para o segundo, permitindo que o sistema continue funcionando. II. Todos os discos passam a ser acessados como se fossem um único drive. Ao serem gravados, os arquivos são fragmentados nos vários discos, permitindo que os fragmentos possam ser lidos e gravados simultaneamente. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 25 de 71 Estas descrições correspondem, respectivamente, aos modos a) 5 e 1. b) 0 e 10. c) 1 e 0. d) 5 e 10. e) 6 e 5. Comentário: I. A opção que utiliza apenas 2 HDs (ou múltiplos de 2) onde um assumeo funcionamento no lugar de falha no outro é o RAID 1 – Espelhamento. II. A opção que divide o armazenamento em dois HDs diferentes, que funcionam logicamente como uma única unidade de armazenamento é o RAID 0 – Stripping. Resposta: C FCC - 2012 - MPE-PE - Analista Ministerial - Informática Um conjunto de discos configurados para funcionar em RAID nível 5 escrevem os dados em a) faixas de k setores distribuídas consecutivamente pelos discos, commais uma faixa de paridade em um disco de paridade. b) bits distribuídos consecutivamente pelos discos, com mais um bit deparidade em um disco de paridade. c) faixas de k setores distribuídas consecutivamente pelos discos. d) faixas de k setores duplicadas e distribuídas consecutivamente pelosdiscos. e) faixas de k setores distribuídas consecutivamente pelos discos, commais uma faixa de paridade intercalada uniformemente entre todos os discos. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 26 de 71 FCC - 2012 - TRT - 6ª Região (PE) - Analista Judiciário - Tecnologia da Informação A tecnologia conhecida como RAID, a) tem como principal vantagem o aumento na velocidade das operações de leitura e escrita, na comparação com discos convencionais. b) consiste numa tecnologia de armazenamento de dados que combina vários discos físicos num único “disco lógico”. c) pode ser utilizada para implementar um sistema de backup uma vez que oferece toda a funcionalidade necessária a um sistema de backup. d) consiste numa tecnologia de armazenamento de dados que combina várias partições de um mesmo disco numa única “partição lógica”. e) tem como desvantagem exigir o uso de discos e/ou controladores de disco especiais e, portanto, mais dispendiosos. Comentário: O RAID é uma tecnologia que combina vários discos em um único “disco lógico” para melhorar o desempenho de leitura/escrita ou para garantir os dados em caso de falha em um dos discos. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 27 de 71 A tecnologia que combina várias partições em uma partição lógica é a LVM, com ela é possível redimensionar partições de forma mais fácil, bem como utilizar um número maior de partições do que as tecnologias tradicionais de tabela de partições permitem. O RAID pode ser feito com uma controladora de disco em hardware ou também via software, portanto não é verdadeiro dizer que ele só pode ser feito da primeira forma, embora seja a mais aconselhável em termos de desempenho. Resposta: B FCC - 2012 - TRF - 2ª REGIÃO - Analista Judiciário - Informática O RAID é um meio de se criar um subsistema de armazenamento composto por vários discos, visando obter segurança e desempenho. O RAID 6 é semelhante ao RAID 5, porém usa o dobro de bits de paridade para garantir a integridade dos dados. Em RAID 6, ao se usar 8 discos de 600 GB cada um, a fração relativa destinada aos códigos de paridade é de a) 20%. b) 15%. c) 10%. d) 30%. e) 25%. Comentário: O RAID 5 precisa do no mínimo 3 discos para funcionar, e consome o equivalente a um HD inteiro para armazenar dados de paridade, sendo estes dados distribuídos equitativamente entre todos HDs do grupo. Já o RAID 6 utiliza o equivalente a dois HDs para paridade, a fim de suportar a falha simultânea de até dois HDs. Ao consumir o equivalente a dois HDs, nós precisamos no mínimo de 4 discos para operar um RAID 6. No caso de um RAID 6 com 8 discos, temos o equivalente a 2 discos consumidos por informação de paridade. No caso, 2/8 temos 25% do armazenamento utilizado por informação de paridade. Letra E. Resposta: E TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 28 de 71 FCC - 2010 - TRT - 8ª Região (PA e AP) - Analista Judiciário - Tecnologia da Informação Considere as afirmativas abaixo sobre RAID. I. No RAID 1, um mesmo dado é escrito em dois discos diferentes (espelhamento). Se um disco falhar, o dado estará disponível no outro disco. II. O RAID 5 pode ser implementado com, no mínimo, 2 discos. III. Os dados de paridade do RAID 1ficam armazenados em um único disco. IV. No RAID 5, os dados de paridade são distribuídos em todos os discos doarray, sendo que um disco nunca armazena a paridade de um dado que está armazenado nele. Está correto o que se afirma APENAS em a) I e II. b) I e III. c) I e IV. d) II e III. e) II e IV. Comentário: I. A afirmação está correta. O RAID 1 funciona como espelhamento e garante os dados no caso de falha de um disco. II. O RAID 5 precisa no mínimo de 3 discos. Errado. III. No RAID 1, os dados ficam espelhados em ambos discos, não somenteem um disco. Por isso o item está errado. IV. Correto, no RAID 5 cada disco do array possui informações de paridade de outras faixas de dados, e todas as faixas de dados armazenadas em um disco possuem sua informação de paridade armazenada nos outros discos do array. Resposta: C FCC - 2010 - MPE-RN - Analista de Tecnologia da Informação - Suporte Técnico TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 29 de 71 O RAID (Redundant Array of Inexpensive Disks) consiste em um controlador mais um conjunto de discos rígidos que, para o sistema operacional, parecem um único disco que pode ser organizado em um dos seis níveis de operação. O nível no qual o RAID duplica os dados da primeira metade para a segunda metade do conjunto de discos é o nível a) 0 b) 1 c) 2 d) 3 e) 5 Comentário: O arranjo de RAID em que os dados são duplicados ou “espelhados” entre um disco e outro, ou entre uma metade do arranjo e outra é o ... RAID 1. Lembre-se: espelhamento é com RAID 1. Resposta: B FGV – 2014 – Órgão: SUSAM – Prova: Analista de Sistemas A capacidade de armazenamento, em GB, da configuração RAID 1 composta por seis unidades com capacidade de 800 GB cada uma é de a) 4800. b) 4000. c) 3200. d) 2400. e) 2000. Comentário: O arranjo RAID 1 é composto por dois HDs. Ao utilizarmos 6 unidades, teremos que dispor estas 6 unidades em 3 pares de 2. O RAID 1 é o mirroring, ou espelhamento, é a técnica que TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 30 de 71 replica o conteúdo de um disco no outro, para redundância. Neste arranjo o espaço útil de dois HDs equivale a somente um deles. Desta forma temos: 1x arranjo RAID 1 com dois HDs de 800 GB = 800 GB de capacidade 3x arranjos RAID 1 = 800 GB x 3 = 2400 GB Resposta: D FGV – 2014 - Órgão: DPE-RJ - Técnico Superior Especializado - Segurança da Informação Existem diversos tipos de RAID (Redundant Array of Independent Disks). Para fazer simplesmente o espelhamento de discos, de modo que as informações sejam armazenadas simultaneamente em mais de um disco, criando copias idênticas, deve-se implementar um esquema de: a) RAID 0. b) RAID 1 c) RAID 3. d) RAID 5. e) RAID 6. Comentário: A opção de RAID que faz espelhamento (mirroring) é a … RAID 1. Vamos relembrar as outras opções: O RAID 0 faz stripping. O RAID 3 (obsoleto) faz stripping com paridade. O RAID 5 faz striping com paridade distribuída; e O RAID 6 faz striping com paridade distribuída, assim como o RAID 5, mas com o dobro de espaço dedicado para informação sobre a paridade. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 31 de 71 Resposta: B FGV – 2010 - Órgão: CODESP-SP - Prova: Analista de Sistemas A figura abaixo está relacionada à tecnologia denominada Redundant Array of Independent Disks - RAID. O sistema RAID consiste em um conjunto de dois ou mais discos rígidos com dois objetivos básicos, descritos a seguir: I. Tornar o sistema de disco mais rápido, acelerando o carregamento dedados do disco. Para atender a esse objetivo, é utilizada uma técnica, em que dois discos rígidos atuam como se fossem um só disco maior. Se os dois discos são de 120 GB, então o computador "pensará" que existe um disco rígido único de 240 GB instalado no micro. No momento de gravar um arquivo no disco, o sistema RAID irá dividir esse arquivo entre os dois discos rígidos, gravando metade do arquivo em um disco e a outra metade do arquivo no outro disco. Tudo isso é feito sem que o usuário perceba. II. Tornar o sistema de disco mais seguro. Para atender a esse objetivo, éutilizada uma técnica, que faz com que o conteúdo de um disco rígido seja inteiramente copiado para outro disco rígido, de forma automática. Ou seja, o segundo disco rígido será cópia fiel do primeiro disco. Se o disco rígido principal queimar, o segundo entra em ação automaticamente. Essas técnicas são conhecidas, respectivamente, como a) data stripping ou RAID 0 / double storage ou RAID 1. b) data matrix ou RAID 0 / double storage ou RAID 1. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 32 de 71 c) data matrix ou RAID 0 / disk duplexing ou RAID 1. d) data swapping ou RAID 0 / mirroring ou RAID 1. e) data stripping ou RAID 0 / mirroring ou RAID 1. Comentário: Esta questão não pede para julgarmos o conteúdo das assertivas, somente dizer do que se trata cada um. Dessa forma devemos acertar sabendo o nome das técnicas, pois a única que traz o nome correto dos arranjos é a opção E) data stripping ou RAID 0 / mirroring ou RAID 1. Muito fácil né? Mas cuidado nas questões fáceis também. Muita atenção! Resposta: E 2.3. Padrões de comunicação Fibre Channel Fibre Channel (FC) é uma das tecnologias disponíveis no mercado para possibilitar a transmissão dos dados entre os computadores e os servidores de armazenamento. É um protocolo de alta velocidade, que fornece um excelente desempenho, sendo um dos grandes responsáveis pelo grande crescimento da adoção das Storage Area Network (SAN). Atualmente o FC suporta conexões de fibra ótica monomodo e multimodo, além de cabo coaxial. Ele pode ser configurado de modo ponto a ponto, via switch, com ou sem hub, conectando até 127 nós. – Como assim configurado ponto a ponto? Estamos falando das topologias, as formas de instalação de uma rede FC. As formas de dispor os links de fibras na rede. Temos: • Point-to-point (ponto a ponto - FC-P2P): conecta dois dispositivos diretamente. • Arbitrated Loop (FC-AL): os dispositivos são ligados em anel (similar ao token ring), de forma que para adicionar dispositivos temos que parar o funcionamento da rede para adicionar um dispositivo. A falha num dispositivo quebra o anel. Esta configuração suporta a conexão de até 127 nós. Essa topologia também pode ser montada com hubs, continuando na prática a topologia lógica como um anel (todos compartilham o mesmo barramento, só dois transmitem por vez), porém evitando o problema da topologia física de anel. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 33 de 71 • Switched Fabric (FC-SW): Todos dispositivos são conectados aos switches Fibre Channel, de uma forma similar aos switches Ethernet. Os switches gerenciam o estado da fabric, otimizando as conexões. O tráfego é isolado somente entre duas portas, não sendo transmitido para nenhuma outra porta. Nesta configuração, a falha de uma porta não afeta as demais. Desta forma é possível instalar até 224 dispositivos. Os padrões de transmissão em Fibre Channel evoluíram com o tempo, sendo o padrão atual de mercado capaz de transmitir até 3,2 GB/s em taxa de transmissão. Os próximos padrões já estão sendo projetados. Algumas bancas gostam de cobrar esse tipo de detalhes, vamos ver rapidamente alguns padrões de transmissão e suas velocidades. Taxa sinalização Taxa de transmissão Data de dis- Padrão (GBaud) (Full duplex, em MB/s) ponibilização 2GFC 2.125 400 2001 4GFC 4.25 800 2004 8GFC 8.5 1,600 2005 10GFC 10.52 2,550 2008 16GFC 14.025 3,200 2011 Modelo de camadas do Fibre Channel No FC temos um modelo de camada. Estemodelo felizmente é um consenso, podendo ser utilizado tranquilamente para estudar. O FC é uma pilha de protocolos/padrões, onde temos cada um se encaixando na devida camada. Vamos ver a definição das camadas: • FC-0: Link físico, fibra conectores e sinais elétricos; • FC-1: Define o protocolo de comunicação, incluindo regras de codificação e decodificação; • FC-2: Serve como mecanismo de transporte do Fibre Channel. Tem regras para definição de quadros de transmissão e controle de fluxo; • FC-3: Provê funções avançadas como divisão da transmissão em múltiplos links, multicast, entre outros; • FC-4: É o nível mais alto, que define as interfaces de aplicação que podem funcionar sobre o Fibre Channel. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 34 de 71 Figura 10: Camadas do Fibre Channel e os protocolos na camada FC-4. FCoE – Fibre Channel Over Ethernet O FCoE é um padrão que encapsula o protocolo Fibre Channel dentro de redes Ethernet. Ora, se o padrão foi criado para operar em Fibras, qual o intuito disso? Com o FCoE podemos compatibilizar redes Ethernet com redes FC, preservando a comunicação com este protocolo para facilitar a compatibilidade com equipamentos de redes legados, sem necessidade de substituição total da infraestrutura. iSCSI O iSCSI, ou Internet Small Computer System Interface, é um protocolo de rede baseado em IP para ligação de dispositivos de storage. Ele permite a comunicação de mensagens do protocolo SCSI através de redes IP, habilitando assim a transferência de dados em redes de storage (SAN). O iSCSI pode ser usado tanto para transmitir dados através de redes locais (LANs) quanto através de redes de longa distância (WANs). A principal vantagem do iSCSI é permitir utilizar o cabeamento das redes IP já existentes, permitindo assim montar uma SAN com custo reduzido em relação à tecnologia Fibre Channel, que requer cabeamento e equipamentos especiais. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 35 de 71 EMC PowerPath EMC é uma das principais fornecedoras de soluções de Storage do mercado. O PowerPath é a sua solução de multipathing, que engloba também balanceamento de carga, além da tolerância a falhas. Ele funciona de forma muito parecida com o que já vimos no Multipathing: é adicionada uma camada no Sistema Operacional, ou no Hypervisor em ambientes virtualizados, para que o servidor entenda como operar com os vários caminhos até o Storage. Figura 11: Modelo de arquitetura de uma SAN com o PowerPath Na ilustração acima observe a localização do PowerPath. A sigla “VE” significa “Virtualized Enviroments”. Principais características: • Bom suporte a ambientes virtualizados, principalmente VMWare; • Suporte a várias configurações de balanceamento de carga no Windows Server: Somente Fail Over (balanceamento desligado), Round Robin, Caminhos ponderados (de acordo com a prioridade dada a cada caminho), Menor Fila e Menos Blocos (sendo processados). • Suporte a configurações de balanceamento de carga no Red Hat Enterprise Linux: Tamanho da fila e Tempo de resposta. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 36 de 71 Questões Comentadas – Padrões de Comunicação FCC - 2011 - TRE-PE - Analista Judiciário - Análise de Sistemas Sobre redes SAN, considere: I. O modelo do Fibre Channel define uma arquitetura de cinco camadaspara o transporte dos dados pela rede, cabendo às camadas inferiores, FC-1 e FC-0, o real transporte dos dados através da rede. II. Fibre Channel pode trabalhar com várias classes de serviço, entre asquais, um serviço de conexão dedicada entre dois pontos com confirmação de entrega do quadro e outro onde a conexão não é dedicada e não há confirmação de entrega do quadro. III. Como o FCP no Fibre Channel, a tarefa básica do iSCSI é encapsular oscomandos SCSI, estados, e os dados, tornando a transação entre os clientes e alvos no iSCSI bastante similar à transação do FCP. IV. O SAN é uma rede de dispositivos que conectam vários clientes e dispositivos de armazenamento, através de múltiplos caminhos que protegem contra falha de um caminho entre cliente e um dispositivo de armazenamento. É correto o que consta em a) I, II e III, apenas. b) I, II e IV, apenas. c) I, III e IV, apenas. d) II, III e IV, apenas. e) I, II, III e IV TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 37 de 71 Comentário: I. O Fibre Channel define uma arquitetura de 4 camadas. As camadas 0 e1 são as que proveem o suporte físico e lógico à transmissão. A expressão “real” nos cria dúvidas mas podemos considerar o item correto. II. O Fibre Channel pode trabalhar com pelo menos 3 classes de serviços.Dentre estas, há modalidades com e sem confirmação de entrega. Correto. III. O iSCSI transmite através da rede os comandos SCSI encapsulados,analogamente ao que o FCP faz no Fibre Channel. Correto. IV. Ele apresenta a definição correta de SAN, e define como uma das características a redundância de caminhos entre o computador cliente e o dispositivo de armazenamento, o que é correto. Todos itens estão corretos. Questão resumo para vocês estudarem. Resposta: E TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 38 de 71 FGV - 2013 - AL-MA - Técnico de Gestão Administrativa - Programador de Sistemas Com relação ao sistema de armazenamento SAN (Storage Area Network), analise as afirmativas a seguir. I. O uso de iSCSI em SANS é adequado para aplicações de alto desempenho, como banco de dados. II. Alta segurança, redundância e tolerância a falhas são características doSAN. III. O uso do protocolo iSCSI em SANs facilita a transferência de dados emIntranets de forma robusta e confiável. Assinale: a) se somente a afirmativa I estiver correta. b) se somente a afirmativa II estiver correta. c) se somente a afirmativa II e III estiverem corretas. d) se somente as afirmativas I e II estiverem corretas. e) se todas as afirmativas estiverem corretas. Comentário: Vamos comentar cada uma das afirmativas: I. O padrão iSCSI é uma adaptação para redução de custos. O iSCSI permite trafegar operações do protocolo SCSI via TCP/IP. Portanto há uma camada a mais para “overhead”, isto é, lentidão causada pelo processamento de informações de controle em vez das informações em si. Além disso a velocidade do iSCSI será totalmente dependente da velocidade da rede na qual está implementado, tornando uma opção menos desejável para operações de alto desempenho como a citada (banco de dados). TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 39 de 71 Neste caso seria preferível implementar uma SAN dedicada com tecnologias disponíveis no mercado que permitissem maior taxa de transmissão, como o Fibre Channel. Afirmativa Errada. II. Alta segurança, redundância e tolerância são sim características dasredes SAN. Correto. III. O protocolo iSCSI nos permite utilizar, integrar, dispositivos a umarede já existente, por exemplo da “Intranet” citada no texto, sem necessidade de investir em uma nova rede, de forma robusta e confiável. Sim, embora a gente tenha falado que é uma adaptação, e que não seja a opção mais rápida em taxa de transmissão, é uma tecnologia bem consolidada, bastante documentada e padronizada, e além disso suporta grandes distâncias, então é correto afirmar que é uma tecnologia robusta e confiável. Correto. A opção que traz somente os itens II e III como corretos é a letra C. Resposta: C TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 40 de 71 2.4. Padrões de Disco Os discos rígidos são uma tecnologiarelativamente antiga porém ainda muito utilizada devido o seu grande custo-benefício. Da geração dos discos mais modernos, o padrão mais antigo é o PATA (Parallel Advanced Technology Attachment). Neste padrão os discos se conecta através duma cabo paralelo através da interface IDE. Esta interface suporta até dois dispositivos por porta, sendo um mestre e outro escravo. A última especificação desta tecnologia foi o ATA 133. A evolução dos discos PATA foram os discos SATA – Serial Advanced Technology Attachment. Esta tecnologia suporta velocidades de transmissão de até 16 Gbps entre o disco e a placa-mãe. Nesta interface, um dispositivo é conectado por porta. Geralmente uma placa- mãe vem com 4 portas. Outra evolução considerável deste padrão em relação ao PATA foi a ausência de necessidade de configurar os discos master e slave com jumpers. Um padrão de equipamentos de conexão de discos muito utilizado é o SCSI. Este padrão é relativamente antigo e teve melhorias incrementais durante o seu ciclo de vida, como melhoria da velocidade de transmissão: • SCSI-1 5 MB/s; • Fast SCSI 10 MB/s; • Ultra SCSI 20 MB/s; • Ultra2 Wide SCSI 80 MB/s; • Ultra-320 SCS 320 MB/s. O padrão SCSI suporta até 15 dispositivos conectados. Como evoluções deste padrão, tivemos o SSA (Serial Storage Architecture) e o SAS (Serial Attached SCSI – Questão de prova!). O SAS é um padrão de custo intermediário entre o SCSI (padrão mais caro) e o SATA (padrão mais barato). Através do SAS é possível conectarmos tanto dispositivos SATA quanto SAS. O SAS é atualmente o padrão de disco em servidores. Uma particularidade do SCSI é que os dispositivos são ligados um ao outro encadeadamente e há a necessidade de colocar um terminal resistivo específico do padrão no último dispositivo conectado “da ponta”. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 41 de 71 2.5. Fitotecas As fitotecas, bibliotecas de fitas ou robôs de fitas, são um componente de armazenamento de dados que trabalha com várias fitas magnéticas de armazenamento, com capacidade de gerenciamento destas mídias. Este tipo de solução é necessária devido a dificuldade de gerenciar um grande número de mídias deste tipo manualmente, o que inclusive adiciona alguns riscos e lentidão ao processo de recuperação de dados. Um equipamento de armazenamento e acesso automatizado tem várias vantagens, como acondicionamento correto, proteção contra calor, umidade, choques mecânicos, entre outros incidentes que podem acontecer com as mídias quando manuseamos as mesmas em armários comuns. Por serem utilizadas fitas magnéticas, que são uma mídia de acesso lento, as fitotecas são utilizadas principalmente para backup. Temos uso destacado de fitotecas automatizadas tanto dentro dos servidores, principalmente os mainframes; para cópias de segurança, longe dos servidores para evitar acidentes ou sabotagens, porém geralmente dentro do mesmo prédio; e para contingência, em um local fisicamente distante do servidor e da fitoteca de produção ou de backup primária, e longe do prédio principal, protegendo os dados contra desastres (bombas, enchentes, terremotos, etc) através da replicação dos dados. Fitotecas automatizadas variam em porte e custo. É possível ter armazenamento de dados partindo de poucas dezenas de terabytes até alguns exabytes. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 42 de 71 Figura 12: Exemplo de um robô de fita de porte grande. Figura 13: Exemplo de uma gaveta de fitas, identificada pelo robô através de um código de barras. 2.6. Fitas LTO As fitas LTO (Linear Tape-Open) são um padrão de fita magnética largamente utilizado para backups. Por ser um padrão, esta fita é produzida por vários fabricantes. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 43 de 71 Figura 14: Exemplo de uma fita LTO6, de 6,25 TB de capacidade. LTO-1 Primeiro padrão disponível comercialmente em setembro de 2000. A capacidade inicial era de 100 GB. Velocidade de transferência de dados de 20 MB/s LTO-2 Primeiros produtos disponíveis em 2003. Este padrão duplicou a capacidade de 200 GB e aumentou velocidade de transferência de dados para 40 MB/s. LTO-3 Primeiras mídias aprovadas em Novembro de 2004. Duplicou a capacidade de 400 GB. Aumentou a velocidade de transferência de dados de TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 44 de 71 80 MB/s. Introduzido recurso WORM (Write Once Read Many) muitas leitu ras para uma escrita. Dobrou o número de elementos de escrita na cabeça de gravação. LTO-4 Disponibilizada em 2007. Duplicou a capacidade novamente para 800 GB. O aumento da taxa de transferência de dados para até 120 MB/s (máximo). Nesta versão foi introduzido recurso de criptografia de nível de unidade usando 256-bit AES-GCM. LTO-5 Disponibilizada em 2010. Capacidade aumentou para 1,5 TB (1500 GB). O aumento da taxa de transferência de dados foi para até 140 MB/s (máximo). Foi introduzido o recurso de particionamento, o qual permitiu que a fita seja dividida em duas áreas separadamente graváveis. Este recurso é exigido por LTFS (Linear Tape File System). LTO-6 O padrão foi lançado em 2012. Aumentou a capacidade para 2,5 TB. Houve aumento da proporção estimada de compressão de dados devido a um buffer de compressão maior. Cartucho de memória aumentou para 16 KB. A taxa de transferência de dados passou ser de até 160 MB/s (máximo). Outros Detalhes • Estima-se que a durabilidade da fita LTO armazenada seja de 15 a 30 anos. • Estima-se que elas suportem 5000 operações de carga e descarga no leitor. 3. Backup e restauração de dados 3.1. Full Backup O Full Backup é técnica é a mais simples e na qual se baseiam as demais. Consiste simplesmente em gerar uma cópia completa do estado atual dos dados. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios - Página 45 de 71 3.2. Backup Incremental e Diferencial Os tipos de backup Incremental e Diferencial possuem os mesmos objetivos, porém abordagens diferentes. Eles visam tornar o backup mais rápido e reduzir a quantidade de dados salvos, que são significativamente menores do que um backup completo. No backup incremental, é comparada a imagem do backup full (chamaremos este de FULL) com as alterações feitas, gerando assim um arquivo somente com as modificações, que chamaremos e MOD1. Os backups incrementais feitos daí em diante seguirão a mesma lógica: é gerado um arquivo contendo somente as diferenças entre o estado novo e o anterior, MOD2, MOD3, … O arquivo mais recente de backup incremental depende de todos backups incrementais anteriores, além do backup FULL, para gerar uma imagem de restauração consistente. Quando é feita a restauração, a ferramenta de backup identifica o backup incremental mais recente e automaticamente inclui os backups incrementais anteriores que são necessários. + + ... O backup diferencial, inicialmente faz o mesmo procedimento do backup incremental, no primeiro passo é gerada uma imagem completa de backup (FULL), e em seguida é gerado um arquivo que passa a receber as modificações. No Diferencial, o arquivo armazenado “DIF1” contém o conteúdo dos arquivos MOD1+MOD2+...+MODn dentro de um mesmo arquivo. Este arquivo já está pronto para ser restaurado, dependendo ape nas da imagem de backup do estado zero (FULL), e ainda assim teremos um backup pronto para ser restaurado. Sendo assim o backup diferencial consome muito mais espaço caso queiramos armazenar vários estados completos para restauração. A performance também diminui, pois os arquivos passam a ser grandes. + Vale ressaltar que podemos criar estados novos no backup diferencialque passem a ser uma imagem “full backup” de uma determinada versão, gerando a partir daí um novo backup diferencial. Vamos recapitular, ver um resumão para a gente entender. FULL MOD1 + MOD2 FULL MOD1 + MOD2 + … + MODn TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 46 de 71 Backup Incremental: • Faz uma imagem completa e arquivos incrementais em série; • Vantagens: ◦ Menor quantidade salva de dados, portanto procedimento de backup mais rápido; ◦ A restauração em quaisquer estados intermediários é possível; • Desvantagens: ◦ É necessário manter todos os arquivos incrementais; ◦ Há um maior risco de erro. Se um dos arquivos for corrompido, toda série seguinte de backups que dependem dele será afetada; • Recomendado para: geração de imagens de discos (backup de partições). Backup Diferencial: • Constrói um único arquivo contendo o backup completo mais recente; • Pode ser usado para consolidar uma série de backups incrementais; • Vantagens: ◦ Mais simples, cada backup consiste em apenas dois arquivos; • Desvantagens: ◦ É necessário o armazenamento de mais dados, a partir da segunda sessão de backup; ◦ A restauração dos estados intermediários só é possível se for mantida uma cópia desses backups diferenciais; • Recomendado para: backup de arquivos. 3.3. Backups na prática Tá, tudo isso é muito bonitinho na teoria, mas e na prática, como a gente faz isso? Vamos ver um pouco como é feito no Windows Server e no Linux. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios - Página 47 de 71 3.3.1. Windows Windows 7 No Windows 7, há duas opções de backup do sistema. Uma é a configuração de pontos de restauração do sistema. Meu computador → Propriedades → Proteção do sistema e em seguida escolhendo a opção “Criar” para criar um ponto de recuperação, que salvará o estado atual do sistema para que possa ser restaurado caso o sistema passe por algum problema. Dentro desta mesma aba, podemos tanto restaurar pontos de recuperação anteriores como configurar a criação periódica de pontos de recuperação do sistema. A outra é a criação de um backup completo do sistema. Acessamos esta opção através de Painel de Controle → Segurança → Fazer backup do sistema. Ao utilizarmos esta opção, o Windows nos pergunta onde queremos salvar o backup, após isso nos pergunta se deixaremos ele decidir o que será feito backup ou se queremos escolher as opções, e em seguida cria um backup completo do sistema. Durante a criação do backup com pleto do sistema, o Windows pergunta se queremos criar um disco de restauração do sistema. Caso optemos pela opção de escolha das opções, podemos configurar por exemplo um backup periódico dos arquivos do usuário. Windows Server No Windows Server, há uma ferramenta nativa para a realização de backups incrementais. Em se tratando do Windows Server 2012, o processo é bem simples. Para utilizar esta função, temos que: 1. Instalar a função/role Windows Server Backup; 2. Configurar a localização onde se encontrará o backup, que pode ser um drive de armazenamento no servidor local um compartilhamento em um servidor remoto; TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 48 de 71 3. Criar um agendamento de backup, onde configuramos os objetos que serão feitos backup e utilizaremos a localização remota onde serão salvos os dados; 4. Verificar a criação do agendamento de backup no snap-in do Server Backup, dentro do Server Manager → Tools → Windows Server Backup, onde podemos visualizar a criação do agendamento do backup. Algumas recomendações devem ser levadas em conta quando criamos o agendamento do backup, que é o agendamento em um horário que não impacte na disponibilidade da rede para outros sistemas em produção. Comumente utilizamos horários fora do expediente, onde há poucos ou nenhum usuário utilizando sistemas na rede, como horários de madrugada. Em caso de remoção de arquivos, o Windows Server Backup não apagará os arquivos fisicamente, ele utilizará o VSS – Volume Shadow Copy, que permite a recuperação de versões anteriores dos arquivos e diretórios. 3.3.2. Linux Vamos comentar os utilitários/soluções de backup da ordem do mais simples para os mais sofisticados. TAR O tar é um utilitário do Linux desenvolvido originalmente para juntar vários arquivos para armazenamento em drives de fitas. Com ele é possível criar pacotes que contém os arquivos que são feitos backups. Vamos comentar um pouco das suas principais opções: • -c: utilizado para criar um arquivo .tar contendo os arquivos • -x: utilizado para extrair os arquivos de um arquivo .tar • -z : Utilizado para compactar os arquivos do backup com o GunZip • -j: Utilizado para compactar os arquivos do backup com o Bzip2 • -v: Utilizado para exibir os arquivos que estão sendo processados • -A: Utilizado para incluir arquivos (append) ao pacote .tar TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios - Página 49 de 71 • -p: Utilizado para manter as permissões originais dos arquivos A sintaxe do comando tar é: “tar [-opções] <nomedoarquivotar.tar...> [caminho_dos_arquivos-diret]” DUMP O dump é um utilitário para o Linux criado para fazer backups incrementais em sistemas de arquivo EXT2/3/4. Utilizamos o comando restore para restaurar os backups criados pelo dump. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 50 de 71 Rsync No mundo Linux, o rsync é o principal utilitário para criação de backups incrementais suportando o envio de informações através da rede. É um utilitário de linha de comando muito poderoso. No entanto, existem alguns frontends gráficos que facilitam o seu uso. O rsync trabalha com backups incrementais e é indicado para trabalhar com backups de arquivos, não sendo indicado para utilização com arquivos muito grandes. O seu melhor uso é geralmente quando temos já uma versão dos arquivos/diretório no computador remoto no qual queremos armazenar o backup. O seu algoritmo de compressão basicamente divide o arquivo em vários blocos e faz um hash de cada pedaço, comparando com os blocos do arquivo local com os do computador destino. Ele suporta compactação na transmissão dos blocos. Vamos ver o uso mais comum do Rsync: rsync -avz maquina:src/bar /data/tmp Neste exemplo, vamos explicar os parâmetros utilizados: • “-z”: habilita a compressão na transmissão; • “-v”: modo verboso, informa na tela o andamento das operações; • “-a”: informa que a cópia deve ser recursiva e manter as demais informações dos arquivos (permissões, etc), exceto hardlinks (links físicos); • “maquina:src/bar”: é o primeiro bloco após as opções principais do comando, é onde informamos a origem dos arquivos. No caso o diretório src/bar no computador “maquina” para o diretório /data/tmp da máquina local. Podemos utilizar outra máquina tanto na origem quando no destino, quanto podemos fazer cópias locais com o Rsync; • “/data/tmp”: diretório local para onde serão copiados os arquivos do argumento anterior. É isso aí, guardem essas informações e serão capazes de acertar a maioria esmagadora das questões sobre Rsync. Não estresse, caso queira saber mais, pesquise um pouco na internet os exemplos básicos ou me mande sua dúvida! TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 51 de 71 Cron O cron não é uma ferramenta de backup, e sim um recurso do Linux que pode ser utilizado junto a uma ferramenta de backup para criar uma rotina que fará o backup. O cron é o daemon (processo de sistema) que roda as tarefas agendadas em sua tabela, a crontab. Para incluir uma tarefa (job) no crontab, basta criarmos um shellscript e incluí-loem um dos diretórios abaixo: • /etc/cron.daily/ para execução diária do script; • /etc/cron.hourly/ para execução horária do script; • /etc/cron.weekly/ para execução semanal do script; • /etc/cron.monthly/ para execução mensal do script. Outra opção é incluí-los manualmente no crontab, através do comando crontab -e. Este comando abre um editor de texto dentro do terminal para a inclusão do job no cron. Galera, isso já caiu em questão viu. A sintaxe de uma linha de job na crontab é muito simples, basta ver uma vez e você nunca mais irá esquecer: Minuto Hora DiaDoMês Mês DiaDaSemana CaminhoDoComando Por exemplo, o comando: 30 17 * * 1 /caminho/do/comando Irá executar o comando indicado no caminho, à hora 17:30, toda segundafeira (dia da semana vai de 0-6 onde 0 é o domingo). O caractere '*' indica que o comando será executado em toda variação daquela opção, seja ela minuto, hora, dia do mês, etc. Para cada opção podem ser utilizadas listas, como “0,15,30” que se utilizados na opção de minutos, por exemplo, informarão a execução nos momentos de 0, 15 e 30 minutos; e intervalos, como em */20, que se utilizado na opção minutos informará que o comando deve ser executado a cada 20 minutos (0 minuto, 20 minutos e 40 minutos). Bacula O Bacula é uma solução open source para geração automatizada de backups. Ele suporta Linux, Unix, Windows e MacOS. O Bacula é uma solução completa, que suporta vários protocolos de rede como NFS, CIFS, TLS; vários protocolos de compactação, e vários dispositivos de armazenamento. O Bacula funciona em um servidor e com clientes TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 52 de 71 configurados nas máquinas que terão seus arquivos feitos backup. Um ponto forte do Bacula é a disponibilidade de interfaces gráficas – GUI como o BAT (Bacula Administrative Tool), uma interface gráfica para administração das tarefas de backup; e o Tray Monitor, um cliente gráfico onde podemos monitorar a operação do Bacula. Figura 15: Interface de administração do Bacula Cygwin Através do Cygwin, podemos instalar um ambiente de processamento de shell Linux no Windows, e através dele rodar comandos do Linux no ambiente Windows. Isso é muito útil para administradores que possuem conhecimento numa plataforma, e que desejam utilizá-la na outra, e também para utilizar algumas recursos que o Windows não possui ou que são mais simples de fazer no Linux. É possível portar, por exemplo, o Rsync no Windows através do Cygwin. TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 53 de 71 Questões Comentadas – Ferramentas de Backup IADES - 2013 - Órgão: EBSERH - Analista de Tecnologia da Informação Assinale a alternativa que apresenta, somente exemplos de ferramentas de backup de código livre (considere as variantes de licença GPL). a. Windows Server Backup e Amanda. b. Windows Server Backup e Arcserve. c. Arcserve e Amanda. d. Bacula e Amanda. e. Arcserve e Bacula. D TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 54 de 71 3.4. Políticas de Backup Uma política de backup são princípios e regras que dizem como irão ser feitos os backups. A política define um conjunto de regras que serão necessárias para atingir os objetivos do backup. Nestas regras são definidos tanto aspectos técnicos como não-técnicos. Para que uma política de backup seja feita, são consideradas informações como análise de riscos dos ativos da organização, e requisitos legais e regulatórios. São levados em conta também: as necessidades de negócio; limitações e orçamento; janela máxima de tempo para execução de backups e os aspectos técnicos. Alguns exemplos de requisitos do negócio são o Recovery Point Objective (RPO) e o Recovery Time Objective (RTO). O RPO é o tempo decorrido entre o acontecimento de um incidente e o último backup feito. Neste intervalo, os dados são perdidos. É importante definir um RPO adequado, pois backups com RPO baixo ou tendendo a zero são muito caros, e RPOs altos podem prejudicar a organização em caso de incidentes mais graves. O RTO é o tempo despendido desde o incidente e a recuperação total dos dados. Estas duas medidas, assim como a própria política de backups geralmente fazem parte dos Planos de Continuidade de Negócios das organizações. Backup←------------------------ INCIDENTE ------------------------→Recuperação |<-------------RPO------------------->|<------------------RTO------------------>| Para definir uma política de backup, definimos alguns simples aspectos como o quê, onde, como, quanto e quão frequentemente serão feitos os backups. Para cada estratégia, temos associados custos e velocidade nos procedimentos de proteção e de recuperação. Métodos de proteção: • Backup manual; • Replicação em temo real; • Backups em fita; • Backups em disco fora da máquina; Métodos de recuperação: TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 55 de 71 • Busca e recuperação manual; • Recuperação Instantânea; • Restauração em fita; • Restauração em disco. O quê copiar? Para cada tipo de dado, temos um nível requerido de proteção necessária. Tipos diferentes de dados também devem ser copiados de maneiras diferentes. Por exemplo, diferente de cópias simples de arquivos, os dados de Aplicações devem ser copiados de maneira que se possa manter a consistência necessária para recuperá-los, pois eles não são simplesmente uma coleção de arquivos, precisam de informações sobre o estado das coisas que estavam funcionando lá. O mesmo acontece com Sistemas e Máquinas Virtuais. A isto está associada também, como vimos na parte de tipos de backup, um método de transporte: ele pode ser uma cópia completa, uma transferência incremental. Como copiar? Os backups podem ser feitos por uma abordagem com agentes ou sem agentes. Algumas aplicações, como Bancos de Dados, possuem aplicativos próprios apenas para as tarefas de geração de logs e outros tipos de backups. Neste caso temos uma abordagem com “agentes” de backup. Nestes casos, devemos sempre usar este agente para manusear corretamente as informações de backup. Podemos classificar também os backups entre Hot ou Cold, sendo o primeiro, hot (a quente), uma cópia feita com a aplicação rodando, enquanto o outro (a frio) uma cópia com a aplicação parada. Backups hot quase sempre são feitos por agentes específicos da aplicação. Consistência e integridade Na geração de backup, temos alguns problemas a serem tratados. O primeiro é o problema dos arquivos abertos, que não estão disponíveis para leitura de outras aplicações, inclusive a que gera o backup. No Windows Server esse problema pode ser contornado através das VSS (Volume Shadow Copies), recurso do sistema de arquivos que mantém várias versões anteriores do mesmo arquivo. Outra questão importante, como já comentamos, é a cópia de dados de aplicações. Neste caso, devemos utilizar as ferramentas específicas da TCE-SP – Analista de Infraestrutura Aula 05 – Datacenters e Storage Teoria e Exercícios Página 56 de 71 aplicação, e as aplicações de preferência devem suportar o VSS. Para o backup de sistemas operacionais inteiros rodando virtualizados, os hipervisores geralmente têm funções muito boas de salvar backups instantâneos dos estados das máquinas através de “snapshots”, podendo esses instantâneos serem copiados para uma mídia fora do Storage onde estão as máquinas virtuais. Onde armazenamos? As destinações dos backups costumam ser: • Baseadas em disco: tem como características boa capacidade, boa escalabilidade, replicação e recuperação de desastres. ◦ D2D (disco para disco): soluções DAS, SAN e NAS; ◦ Discos lógicos ou compartilhamentos de redes; • Baseados em fitas (D2T): a grande
Compartilhar