Prévia do material em texto
Infraestrutura de Tecnologia da Informação Material Teórico Responsável pelo Conteúdo: Prof. Esp. Antonio Eduardo Marques da Silva Revisão Textual: Prof.ª Esp. Kelciane da Rocha Campos Armazenamento • Introdução; • Meios de Armazenamento; • Escala de Armazenamento (Disk Array); • Tecnologias de RAID; • Redes de Armazenamento. • Compreender e apresentar sistemas de armazenamento de alta capacidade, tanto em relação a características dos storages físicos como em relação às redes de armazenamento. OBJETIVO DE APRENDIZADO Armazenamento Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Armazenamento Introdução A infraestrutura de centros de dados de hoje depende de várias tecnologias e técnicas específicas para funcionar corretamente e com uma melhor performan- ce, segurança e redução de custos. É muito importante conhecer os fundamentos sobre armazenamento, como, por exemplo, os componentes onde os dados são armazenados e os subsistemas de um sistema completo de armazenamento, como, por exemplo, os arranjos de discos e as redes de armazenamento existentes. Esta unidade tem como objetivo apresentar alguns desses subsistemas com mais detalhes. Os primeiros computadores não tinham capacidade de memória suficiente para armazenar programas e dados enquanto as computações (cálculos) estavam sendo realizadas. Por esta razão, desde o início dos tempos, foi realizada uma distinção entre memória e armazenamento, embora ambos sejam conceitualmente seme- lhantes. Pensamos de uma maneira diferente, ou seja, os dados na memória estão sendo ativamente utilizados pelo computador, enquanto os dados no armazena- mento são mantidos para uso futuro. Um conceito importante em relação à memória é a volatilidade. Os tipos de chips usados para RAM hoje em dia são “voláteis”, na medida em que o conteú- do é perdido se eles não forem continuamente energizados eletronicamente. Esta é outra razão de os computadores modernos se diferenciarem entre memória e armazenamento: a mídia de armazenamento normalmente não é volátil (não é perdida se não for energizada), portanto os dados não serão perdidos, mesmo que o computador esteja desligado ou desconectado (COMER, 2016). Toda vez que você liga ou reinicia o seu computador, o processador e a memória começam do zero e precisam para carregar suas informações de algum tipo de mídia de armazenamento. Em operação regular, os computadores rotineiramente movem dados ativos para a memória. Isso é chamado de “Entrada/Saída” ou “I/O” no com- putador, que é um dos conceitos mais importantes para entender quando se trata de armazenamento: dados “em repouso” em um sistema de armazenamento não podem ser processados, devem ser armazenados primeiro na memória. Essas ope- rações ocorrem constantemente na computação; uma das técnicas para otimizar e reduzir as operações de I/O (ou E/S em português) seria o “armazenado em cache”. Meios de Armazenamento São muitas as formas de armazenar os dados, como, por exemplo, a utilização de fitas magnéticas, discos eletromecânicos (HDDs) e unidades de mídia estado sólido (SSDs). Os primeiros computadores armazenam dados como bits no estado ligado/des- ligado em tubos de vácuo. Mais tarde tinham memória de núcleo magnético, que era não volátil, mas de alto custo para a época. Em ambos os casos, a capacidade 8 9 de memória era limitada, portanto era necessário algum tipo de armazenamento de longo prazo e capacidade maior do que os existentes. Esses primeiros com- putadores usavam bobinas de fita perfurada, mas os engenheiros mudaram essa forma rapidamente para mídia magnética. Uma superfície foi revestida com uma substância que poderia ser alterada para ser positiva ou negativa em certos pontos e isso poderia também representar dados de maneira não volátil e de uma forma mais barata (MARIN, 2011). Fi gura 1 – Discos HDD e SSD Samsung SSD: SSD v HDD (inglês), disponível em: https://youtu.be/SStYw356J1k Ex pl or Duas abordagens para a memória magnética evoluíram rapidamente: a fiação plana de discos (flat spinning disks) e carretéis de fita (fitas magnéticas). Os discos, por sua vez, possuíam uma vantagem de acesso aleatório, pois a cabeça de leitura/ gravação da unidade poderia se mover sobre a superfície do disco para alcançar qualquer ponto desejado. Já os carretéis de fita poderiam conter muito mais dados, mas só poderiam ser acessados sequencialmente (do começo ao fim), com longas esperas para a identificação de pontos a serem localizados. Essas duas tecnologias, disco e fita, permanecem ativas até os dias de hoje em centros de dados. Figura 2 – Fita Magnética Fonte: iStock/Getty Images 9 UNIDADE Armazenamento Um terceiro tipo de mídia de armazenamento entrou em cena nos últimos anos. A memória flash não é volátil e possui um desempenho extremamente alto para acesso aleatório e sequencial. Mas a capacidade do flash é muito melhor e mais cara que o disco ou a fita, bem como a sua produção limitada em função do alto custo. A memória Flash é tipicamente empacotada como uma unidade de estado sólido (SSD) que parece com um disco rígido convencional (porém mais fino). Esses disposi- tivos contêm um controlador que traduz instruções de armazenamento em bloco em operações de memória flash, decidindo onde colocar dados e como escrevê-los para otimizar a compatibilidade com os chips de flash. Os SSDs são tão rápidos interna- mente que o barramento e o controlador se tornaram um gargalo para os computa- dores. Por esse motivo, alguns SSDs estão sendo movidos para interconexões mais rápidas, como PCI Express e até mesmo o canal de memória (SERVICES, 2010). Debugging the 1959 IBM 729 Vacuum Column Tape Drive at the Computer History Museum (inglês) disponível em: https://youtu.be/7Lh4CMz_Z6MEx pl or Bloco, arquivo e armazenamento de objeto No início, a mídia de armazenamento foi acessada diretamente, com a CPU traduzindo o que foi lido em dados úteis. Os protocolos padrão surgiram nos anos 80 e contribuíram para a utilização e evolução das mídias. A maneira mais simples de acessar uma unidade de disco rígido é como um dispositivo consegue acessar os blocos (geralmente de tamanho igual) através de seus endereços ecom uma inter- face de nível superior (normalmente um sistema de arquivos em um computador) decide como posicionar seus dados. O SCSI foi criado nos anos 80 como um bar- ramento físico para anexar unidades de disco rígido e um protocolo para endereçar dispositivos de armazenamento e blocos de disco. Hoje, o protocolo SCSI continua sendo dominante para acessar o armazena- mento de blocos, como os discos rígidos e matrizes de disco, ambos conectados diretamente e em uma rede de área de armazenamento (SAN – Storage Area Network). Os dispositivos SCSI originais usavam um cabo grosso com dezenas de conectores, mas esse elemento foi substituído por três alternativas mais populares: • a conectividade local: com unidades de disco é geralmente tratada por Serial Attached SCSI (SAS), que usa um cabo serial similar ao usado pelo serial ATA (SATA). O SAS também pode ser usado para conectividade a prateleiras de disco (disk arrays) e matrizes de disco através de expansores e cabos externos. Como o SATA, o SAS pode operar na velocidade de 1.5, 3, 6 ou 12 Gbps. • a conectividade de SAN: geralmente usa cabos e switches Fibre Channel (FC). Estes permitem uma interconexão muito maior, atuando como uma ver- dadeira rede com desempenho e gerenciamento de alta disponibilidade e de controle de acesso. O FC SAN pode operar a 1, 2, 4, 8 ou 16 Gbps. 10 11 • outro protocolo SAN é o iSCSI, que usa cabos e switches Ethernet e o protocolo TCP/IP. Isso pode ser executado em uma rede Ethernet de 1,10 ou 100 Gbps, mas funciona melhor com switches de alta capacidade e específi- cos para esses tipos de redes. Todas essas três opções de conectividade utilizam o protocolo SCSI para comunica- ção de dispositivos, mas também há outras opções. Alguns servidores usam discos SATA, que se parecem com o SAS, mas usam um protocolo muito mais simples que o SCSI. Também são dispositivos de armazenamento de estado sólido que podem se parecer com placas de servidor, unidades de disco ou arrays externos, mas usam uma interco- nexão PCI Express (PCIe), como a tecnologia Thunderbolt da Intel (SERVICES, 2010). Ao mesmo tempo, as unidades de disco foram padronizadas no protocolo SCSI, como alternativas de armazenamento em rede que estavam surgindo. Empresas como a IBM, 3COM, Novell e Microsoft começaram a desenvolver sistemas de armazenamento que podem ser acessados como sistema de arquivos, em vez de um dispositivo de bloco. Hoje, esse armazenamento conectado à rede (NAS – Network Attached Storage) tem uma forte presença no data center. Essas matrizes geralmente usam o protocolo NFS ou SMB e variam de servidores de arquivos a matrizes de armazenamento completas. Bloco, Arquivo e Armazenamento de Objeto, disponível em: https://goo.gl/R7zygE Ex pl or Uma alternativa emergente trata os dados armazenados como um objeto em um banco de dados em vez de um bloco ou arquivo. Os sistemas de armazenamento de objetos surgiram no início de 2000, principalmente destinados ao arquivamento, mas tiveram o seu pico assim que os aplicativos em nuvem apareceram. Em vez de manter um mapa para blocos ou arquivos, o armazenamento em nuvem geralmente faz refe- rência a um “blob” de dados usando uma chave única e simples. O sistema de armaze- namento lida com todas as decisões de controle de acesso e posicionamento de dados internamente. Esta reatribuição de responsabilidade é o que permite que os sistemas de armazenamento em nuvem, como S3 da Amazon, possam escalar (crescer) muito além dos limites de qualquer solução de armazenamento anterior (MARIN, 2011). Escala de Armazenamento (Disk Array) Como discutido anteriormente, a maioria dos dispositivos de armazenamento contém atualmente alguns componentes: • a mídia de armazenamento bruta retém dados para uso futuro; • um barramento interno conecta a mídia ao controlador; • um controlador arbitra entre solicitações de acesso e a mídia, e pode decidir sobre o posicionamento de dados e outras funções internas; • uma interface de protocolo conecta-se ao barramento externo ou rede de comunicação. 11 UNIDADE Armazenamento Esse arranjo é semelhante, quer estejamos falando de um disco rígido, unidade de fita, SSD, prateleira de disco ou até mesmo um enorme storage array corporativo. Cada um destes dispositivos pode ser simples ou extraordinariamente complexo. A maioria das soluções de armazenamento combina vários discos ou SSDs em um “array” e atua como um ou mais dispositivos virtuais. Esta é uma capacida- de central do protocolo SCSI, com controladores que virtualizam as unidades de armazenamento subjacentes usando tecnologias como RAID (Redundant Array of Independent Disks) e apresentando discos virtuais para servidores conectados (SERVICES, 2010). Os sistemas NAS também costumam usar o RAID, mas apresentam o armaze- namento como um volume compartilhado, como um sistema de arquivos e arqui- vos. Muitos arrays têm uma arquitetura modular, com cada uma das quatro funções claramente visíveis. O controlador se parece com um servidor de rack e possui placas Ethernet ou Fibre Channel para conectividade externa, as portas frontais SAS ou FC para acesso ao disco na parte traseira. Abaixo disso estão as prateleiras contendo discos HDDs ou SSDs, juntamente com suas portas de barramento as- sociadas, fontes de alimentação, ventiladores e outros componentes. Muitas vezes, esses sistemas modulares podem ser “ampliados”, adicionando mais prateleiras de disco, conforme a necessidade de armazenamento (SERVICES, 2010). Outros arrays corporativos são integrados, com todos esses componentes com- partilhando um único chassi. Algumas matrizes integradas são bem pequenas, como slots de disco que residem na mesma unidade dos controladores e placas de interface. Mas outros são grandes, ocupando um rack inteiro. Matrizes integradas às vezes têm slots vazios para discos ou placas controladoras a serem adicionadas, mas alguns estão completamente selados. Alguns sistemas de armazenamento podem ser “expandidos” com vários arrays que compartilham a carga de trabalho e crescem conforme necessário. Sistemas convencionais de armazenamento SAN ou NAS, geralmente um cluster bem aco- plado de 2, 4 ou mais nós. Sistemas de armazenamento de objeto ou nuvem, em contraste, são geralmente projetados para serem dimensionados para dezenas, centenas ou até milhares de nós. Capacidades do array de armazenamento Os storage arrays corporativos geralmente possuem recursos avançados além da apresentação de armazenamento virtualizado. Eles melhoram o desempenho, adicio- nam proteção de dados e recursos de alta disponibilidade e podem executar funções avançadas, como instantâneos espelhos (espelhamento) e replicação de dados. Esse é o motivo pelo qual as matrizes de armazenamento dedicadas permanecem populares mesmo quando a capacidade de armazenamento interno e o desempenho aumentam. Storage Devices and Arrays (inglês) disponível em: https://youtu.be/fxqt0NR0dHo Ex pl or 12 13 A superação dos limites inerentes de desempenho dos discos rígidos individuais foi a principal preocupação quando as matrizes de armazenamento foram inventa- das. Um disco giratório em movimento e um braço que permite o acesso aleatório aos dados, mas há uma velocidade máxima na qual dispositivos mecânicos podem operar, combinando múltiplos “fusos” em um conjunto, mais desempenho à ob- tenção de acesso aleatório. Este conceito foi codificado nos anos 80 como RAID (Redundant Array of Independent Disks), que define o padrão para uma “matriz redundante de discos baratos e independentes” (SERVICES, 2010). Os sistemas de armazenamento de hoje geralmente incorporam o armazenamento em cache para melhorar o desempenho ainda mais. Em vez de ler ou escrever direta- mente em suas unidades de disco, eles usam pool de RAM ou flash como um local de armazenamento de curto prazo para dados acessados com frequência. A inteligência do controlador e a comunicação com os servidores ajudam a otimizar quais dados são armazenadosneste cache e quando são passados para as unidades de disco mais lentas. Alguns dos sistemas também armazenam camadas, movendo dados dinamica- mente entre diferentes mídias de acordo com algoritmos avançados projetados para maximizar o desempenho. Matrizes de armazenamento também podem otimizar a capacidade usando a desduplicação de dados e a compactação dos mesmos. Sendo dispositivos mecânicos, as falhas na unidade de disco rígido são normais. Então quase todas as matrizes de armazenamento colocam dados em vários discos, prateleiras ou nós usando RAID, replicação, ou código de apagamento. A abor- dagem mais simples grava dados em discos que são imagens de espelho um do outro. Se um falhar, os dados ainda estarão acessíveis no outro componente de armazenamento. Abordagens de posicionamento de dados mais avançadas ope- ram no nível de bloco ou objeto ou usam a matemática para permitir que os dados sejam reconstruídos quando um disco é perdido. Algumas destas técnicas também melhoram o desempenho, uma vez que diferentes dados podem ser lidos de vários discos ao mesmo tempo (MARIN, 2011). Os arrays de armazenamento externo são essenciais para o acesso multiusuário ou multi-sistema. O NAS foi desenvolvido inicialmente para permitir que muitos compu- tadores compartilhem os mesmos conjuntos de dados. Os diretórios iniciais podem ser acessados em qualquer estação de trabalho, por exemplo esses computadores serem compartilhados. Atualmente, o armazenamento em rede é essencial para os serviços virtualizados e arquiteturas de servidores altamente disponíveis. O VMware ESX, por exemplo, exige armazenamento SAN ou NAS para construir um “data center virtual” de nós de computação que suportam movimento de máquinas virtuais do servidor para o servidor, assim que as soluções hiper-convergentes surgiram, per- mitindo que o armazenamento fosse compartilhado sem matriz autônoma. Atualmente, a maioria dos arrays é capaz de criar cópias de dados sob demanda. Alguns usam pontos de verificação (snapshots), permitindo que os dados sejam visu- alizados como estavam em um ponto de tempo antigo. Isso é útil para operações de backup e recuperação. Clones ativos de conjuntos de dados são úteis para aplicações como desktops virtuais, onde muitos sistemas compartilhem muitos dados. Os dados 13 UNIDADE Armazenamento também podem ser replicados de um array para um array, tanto no site local como remotamente, para recuperação de desastres ou uso geral dos negócios. A última tendência em armazenamento corporativo é a integração com virtu- alização, gerenciamento e plataformas de nuvem. Novos protocolos permitem o controle direto de sistemas de armazenamento, simplificando recursos de provisio- namento e gerenciamento de dados. Este é um elemento essencial de armazena- mento em nuvem, que usa uma API (interface de programação de aplicativos) em vez de protocolo de armazenamento convencional. Armazenamento futuro será um componente essencial de um data center definido por software. Tecnologias de RAID O RAID (Redundant Array of Independent Disks) é uma tecnologia que apro- veita várias unidades como parte de um conjunto que fornece proteção de dados contra falhas de unidade de armazenamento. Em geral, as implementações de RAID também melhoram o desempenho do sistema de armazenamento, atenden- do I/Os de vários discos simultaneamente. Matrizes modernas com drives flash também se beneficiam em termos de proteção e desempenho usando o RAID (SERVICES, 2010). Em 1987, Patterson, Gibson e Katz, da Universidade da Califórnia, Berkeley, publicaram um artigo intitulado “Um caso para matrizes redundantes de discos baratos (RAID)”. Este artigo descreveu o uso de unidades de disco de baixo custo a unidades de grande capacidade comuns em computadores mainframe. Esse termo RAID foi redefinido para se referir a discos independentes, em vez de baratos, para refletir os avanços na tecnologia de armazenamento. Existem dois métodos clássicos de implementação de RAID, o de hardware e de software. Ambos têm suas vantagens e desvantagens. O software RAID utiliza software baseado em host para fornecer as funções de RAID e é implementado no nível do sistema operacional de rede (SOR). As implementações RAID de software oferecem benefícios de custo e simplicidade quando comparadas com o RAID de hardware. No entanto, elas têm as seguintes limitações (SERVICES, 2010): • Desempenho: o RAID de software afeta o desempenho geral do sistema. Isso se deve aos ciclos de CPU adicionais necessários para realizar cálculos de RAID. • Recursos Suportados: o RAID de software não suporta todos os níveis de RAID existentes. • Compatibilidade do Sistema Operacional de Rede: o RAID de software está vinculado ao sistema operacional do host; portanto as atualizações para o RAID de software ou para o sistema operacional devem ser validadas para fins de com- patibilidade. Isso leva à inflexibilidade no ambiente de processamento de dados. 14 15 Já em implementações de RAID de hardware, um controlador de hardware especializado é implementado no host ou na matriz de armazenamento. A placa controladora é uma implementação do RAID de hardware baseada em host ao qual um controlador RAID especializado é instalado no host e as unidades de disco são conectadas a ele. Os fabricantes também integram controladores RAID em placa-mãe. Um controlador RAID baseado em host não é uma solução efi- ciente em um ambiente de data center com um grande número de hosts. O con- trolador RAID externo é um RAID de hardware baseado em array. Ele age como uma interface entre o host e os discos e apresenta volumes de armazenamento gerenciando essas unidades. As principais funções dos controladores RAID são as seguintes: • gerenciamento e controle de agregações de disco; • tradução de solicitações de I/O entre discos lógicos e discos físicos; • regeneração de dados em caso de falhas no disco. Tipos de RAID • RAID 0: a configuração de RAID 0 utiliza técnicas de distribuição de dados, em que os dados são divididos em todos os discos dentro de um conjunto de RAID. E por esse motivo, utiliza a capacidade total de armazenamento de um conjunto RAID. Quanto mais as unidades de conjunto de RAID aumentam, melhor seu desempenho de leitura e gravação, porém é uma técnica muito fraca em relação à redundância de disco, pois caso uma única unidade falhe, o RAID pode ser corrompido. RAID 0, disponível em: https://goo.gl/AG4Z34 Ex pl or • RAID 1: a configuração de RAID 1 é baseada na técnica de espelhamento. Nesta, os dados são espelhados para fornecer tolerância a falhas. Um con- junto RAID 1 consiste em duas unidades de disco e cada gravação é realizada em ambos os discos do conjunto. O espelhamento é transparente para o host e durante a falha de um eventual disco, o impacto na recuperação de dados no RAID 1 é o menor entre todas as implementações RAID existen- tes. Isso ocorre porque o controlador RAID usa a unidade espelhada para recuperação de dados. Podemos citar como uma desvantagem o custo desse conjunto de RAID, que deve ser sempre aos pares, bem como os tempos de uma certa forma lentos de gravação, já que os dados devem ser copiados em ambos os discos. RAID 1, disponível em: https://goo.gl/8mZhXq Ex pl or 15 UNIDADE Armazenamento • RAID 5: a configuração de RAID 5 é uma implementação RAID mais versátil. É semelhante ao RAID 4 (não apresentada aqui e não mais utili- zada) porque usa striping (tiras). As unidades de strip (tiras) também são acessadas de forma independente. A diferença entre o RAID 4 e o RAID 5 é a localização da paridade que é usada para a remontagem de um disco perdido ou com falha no conjunto. No RAID 4, a paridade é gravada em uma unidade dedicada, criando um gargalo de gravação para o disco de paridade; já no RAID 5, a paridade é distribuída por todos os discos para superar o gargalo de gravação de um disco de paridade dedicado, como em seu antecessor. No RAID 5, é necessário pelo menostrês (3) discos para a montagem do conjunto. RAID 5, disponível em: https://goo.gl/zycqa6 Ex pl or • RAID 6: a configuração de RAID 6 funciona da mesma forma que o RAID 5, exceto se o RAID 6 inclua um segundo elemento de paridade para permitir a sobrevivência se duas falhas de discos ocorrerem em um conjunto de RAID. Portanto, uma implementação do RAID 6 requer pelo menos quatro (4) dis- cos. O RAID 6 distribui a paridade entre todos os discos. A penalidade de gravação no RAID 6 é maior do que no RAID 5; portanto, o RAID 5 grava com um desempenho melhor do que o RAID 6. A operação de reconstrução no RAID 6 pode demorar mais do que no RAID 5 devido à presença de dois conjuntos de paridades. RAID 6, disponível em: https://goo.gl/QB4crP Ex pl or • RAID 10 (ou 1+0): é uma configuração de nível de RAID que associa o espelhamento de informações (RAID 1) e a gravação em alta performance (RAID 0), dividindo os dados em blocos que serão escritos em todos os discos do arranjo simultaneamente. Cada par de discos é considerado um conjunto de paridade. Além de ser espelhado logicamente, o RAID 10 também usa striping no nível do bloco. O armazenamento em cache do adaptador de I/O aprimora muito as características de desempenho de leitura e gravação em uma configuração desse tipo de RAID. RAID 10, disponível em: https://goo.gl/Rsb9ps Ex pl or RAID Concepts (inglês) disponível em: https://youtu.be/LJSWo_QZcGI Ex pl or 16 17 Redes de Armazenamento Muitas vezes, as redes de armazenamento não recebem atenção suficiente na arquitetura do sistema como um todo, mas podem quebrar o acordo de nível de serviço (SLA) para os tempos de resposta de uma determinada aplicação compu- tacional. Entender como criar um sistema de armazenamento econômico e de alto desempenho pode economizar dinheiro não apenas no subsistema de armazena- mento, mas também no restante do sistema. O armazenamento anexado direto (DAS - Direct Attached Storage), rede de área de armazenamento (SAN - Storage Area Network) e armazenamento co- nectado à rede (NAS - Network Attached Storage) são os três tipos básicos de armazenamento. O DAS é o bloco de construção básico de um sistema de ar- mazenamento e pode ser empregado direta ou indiretamente quando usado nos sistemas SAN e NAS. O NAS é a camada mais alta de armazenamento e pode ser construída sobre um sistema de armazenamento SAN ou DAS. A SAN está em algum lugar entre um DAS e um NAS. Vamos conhecer com mais detalhes esses tipos de redes de armazenamento existentes como um componente de um sistema de armazenamento completo (SERVICES, 2010). DAS (Direct Attached Storage) O DAS é o subsistema de armazenamento mais básico que fornece armazena- mento em nível de bloco e é o bloco de construção para SAN e NAS. Um sistema DAS é conectado diretamente a um servidor ou estação de trabalho, sem uma rede de armazenamento intermediária. O desempenho de um SAN ou NAS é, em últi- ma instância, determinado pelo desempenho do DAS subjacente, e ele sempre ofe- recerá os mais altos níveis de desempenho, pois é diretamente conectado à inter- face de armazenamento do computador. O DAS é limitado a um host específico e não pode ser usado por nenhum outro computador, a menos que seja apresentado (compartilhado) a outros computadores em uma rede especializada, chamada SAN, ou rede de dados, como um servidor NAS. Um controlador DAS permite geral- mente que no máximo 4 servidores acessem a mesma unidade de armazenamento lógico. Os protocolos usados para comunicação entre computadores/servidores e sistemas de armazenamento DAS são FC, SATA ou SCSI ou PATA ou SASA. Direct Attached Storage, disponível em: https://goo.gl/fZB5gW Ex pl or SAN (Storage Area Network) NAS e SAN são duas formas de compartilhar o armazenamento na rede. As SANs oferecem um nível mais alto de funcionalidade que o DAS porque permi- tem que vários hosts (computadores servidores) se conectem a um único dispositivo 17 UNIDADE Armazenamento de armazenamento no nível do bloco. Ele não permite acesso simultâneo a um único volume de armazenamento dentro do dispositivo de armazenamento, mas permite que um servidor abandone o controle de um volume e, em seguida, outro servidor assuma o volume. Isso é útil em um ambiente de cluster, em que um ser- vidor principal pode falhar e um servidor de backup deve assumir o controle e se conectar ao mesmo volume de armazenamento. Como uma SAN oferece armaze- namento em nível de bloco para o host, ela pode enganar o aplicativo, acreditando que está usando um subsistema de armazenamento DAS que oferece muitas van- tagens de compatibilidade. A SAN pode usar FC ou Ethernet (iSCSI ou AoE) para fornecer conectividade entre hosts e armazenamento. Storage Area Network, disponível em: https://goo.gl/4iaLbZ Ex pl or NAS (Network Attached Storage) O NAS é uma tecnologia de armazenamento em nível de arquivo (e não de bloco) criada com base na tecnologia SAN ou DAS. É basicamente outro nome para “servidor de arquivos”. Os dispositivos NAS geralmente são apenas servidores regulares com sistemas operacionais limitados dedicados à entrega de arquivos. Embora seja tecnicamente possível executar outro software em uma unidade NAS, ele não foi projetado para ser um servidor de propósito geral. Por exemplo, as unidades NAS geralmente não possuem um teclado ou monitor e são controladas e configuradas pela rede, geralmente usando um navegador. Um sistema operacional com recursos completos não é necessário em um dispositivo NAS, portanto, geral- mente, é usado um sistema operacional simplificado. Os sistemas NAS contêm um ou mais discos rígidos, geralmente organizados em contêineres de armazenamento redundantes lógicos ou matrizes RAID. O NAS remove a responsabilidade de ser- vir arquivos de outros servidores na rede. Os dispositivos NAS normalmente usam SMB/CIFS para compatibilidade com Microsoft, NFS para compatibilidade com UNIX ou Samba para ambos. Muitos dispositivos NAS mais modernos suportarão tecnologias SAN, como iSCSI, e você basicamente pode criar a mesma solução de armazenamento híbrido usando um sistema operacional de uso geral, como Linux, BSD ou Windows Server, usando seu próprio hardware. Network Attached Storage, disponível em: https://goo.gl/8Tt5qJ Ex pl or SAN vs. NAS vs. DAS: Competing or Complementary? (inglês) Disponível em: https://youtu.be/bpUzGZLO948Ex pl or 18 19 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Livros Virtualização: tecnologia central do data center VERA S, M. Virtualização: tecnologia central do data center. 2ª ed. São Paulo: Editora Brasport, 2016. Computação em nuvem VERAS, M. Computação em nuvem. 1ª ed. São Paulo: Editora Brasport, 2015. Redes de computadores WHITE, C. M. Redes de computadores. 1ª ed. São Paulo: Editora Cengage Learning, 2013. Armazenamento e gerenciamento das informações SERVICES, EMC Education. Armazenamento e gerenciamento das informações. 1ª ed. São Paulo: Editora Bookman, 2010. 19 UNIDADE Armazenamento Referências COMER, D. E. Redes de computadores e internet. 6ª ed. Porto Alegre: Editora Bookman, 2016. MARIN, P. S. Data Centers: desvendando cada passo - conceitos, projeto, infra- estrutura física e eficiência energética. 1ª ed. São Paulo: Editora Érica, 2011. CHAGAS, M. W. S. Sistemas de energia e climatização: aplicações práticas em telecomunicações e data center. 1ª ed. São Paulo: Editora Érica, 2014. 20