Buscar

Quase Tudo Sobre RAID

Prévia do material em texto

RAID
QUANDO SURGIU?
Universidade da Califórnia - Berkeley
Em 1987
Cientistas Patterson, Gibson e Katz
Conceito inicial: combinação de discos rígidos pequenos e económicos num único segmento, de tal forma que este se apresentaria no sistema de grande capacidade e caro.
O QUE É RAID?
Conjunto Redundante de Discos Independentes ou Conjunto Redundante de Discos Econômicos
Trata-se, de uma solução computacional que combina HDs para formar uma única unidade lógica de armazenamento de dados.
Fazer com que várias unidades de armazenamento trabalhem em conjunto resulta em muitas possibilidades, como:
Se um HD sofrer danos, os dados não serão perdidos pois há uma cópia dos mesmos(redundância);
Aumento da capacidade adicionando mais HDs;
A performance de leitura/escrita pode ser melhorada;
O sistema não é paralisado se uma unidade parar de funcionar, pois há maior tolerância a falhas;
Pode ser mais barato que um HD mais sofisticado e oferecer os mesmos resultados.
JBOD
Just a Bunch Of Disks: Apenas um Monte de Discos;
A capacidade dos HDs é somada e passam a ser vistos pelo sistema como único disco;
Se um HD para de funcionar, a unidade lógica continua funcionando pois os arquivos são espalhados pelos discos;
Tem baixa performance e redundância;
CONTROLADORA
Off-board: Mais cara e melhor, conecta ele na placa mãe pelo slot pci(Tem mais recursos e pode ser substituída facilmente);
On-board - A controladora RAID já vem embutido na placa-mãe(Não tem tantos recursos quanto as off-board);
Virtual - Mais barata, onde o próprio sistema operacional agrupa estes discos, Windows server(storage space);
NÍVEIS DE RAID
Para um sistema RAID é necessário pelo menos dois HDs (ou SSDs) e definir o nível de RAID do sistema;
Parâmetros que definem o RAID: performance, capacidade e tolerância a falhas;
O níveis diferenciam-se pela combinação desses parâmetros;
RAID 0
Características
Os dados gravados são divididos em partes e são gravados por todos os discos.
O 0 indica nenhuma redundância;
O foco é o desempenho de leitura e gravação;
Desvantagens
Se um HD apresentar problema, todos os dados serão perdidos.
É possível usar discos de diferentes capacidades, mas o desempenho ficará limitado ao desempenho do disco mais lento;
Exemplo
Suponha uma palavra formada pelos caracteres A1A2...A7A8. Neste mecanismo, os caracteres com final ímpar vão para o disco 0 e com o final par vão para o disco 1. Tanto na leitura e na escrita em uma posição qualquer, ela será acessada em ambos os discos ao mesmo tempo. Isso faz com que dois dados sejam lidos ou escritos no mesmo momento, dobrando a taxa de leitura ou gravação. Logo, se a taxa de transferência era de 100 MB/s, ela passaria a trabalhar como 200 MB/s. 
RAID 1
Características
Redundância de dados, proteção de dados ou espelhamento;
Um HD é o principal e o outro HD é o espelhamento dele;
Dois HD’s de 500 GB é como se fosse um HD 500 GB apenas;
Se um HD falha, todos os dados estarão disponíveis no outro HD;
Desvantagens
Pode ocorrer perda de desempenho, já que a gravação acaba tendo que acontecer duas vezes, uma em cada unidade.
Mais adequado para proteção de falhas "físicas" das unidades;
É possível usar discos de diferentes capacidades, mas a capacidade ficará limitada ao HD de menor capacidade;
Exemplo
Em uma escrita, os dados são modificados nos dois discos ao mesmo tempo. Por exemplo, a palavra A1A2A3A4 ficaria armazenada do mesmo modo em ambos HDs. Assim a taxa de transferência de dados continuaria a mesma, mas o espaço utilizado seria o dobro do real, pois um disco rígido de 250 MB exigiria outra cópia idêntica de 250 MB.
RAID 2
Distribuição com ECC (obsoleto);
Igual ao RAID 0 com ECC(Error Correcting Code) de Hamming usado para diminuir a taxa de erros em seu disco rígido, mas que já estão integrados nos controladores de disco rígido;
RAID 3 ATÉ O RAID 7
Duplicar um disco inteiro como backup pode não ser uma boa opção, principalmente utilizando vários HD’s.
Por isso o RAID 3 até o RAID 7 efetuam cálculos de paridade para a segurança dos dados e recuperação dos mesmos;
Dependendo do RAID utilizado, o esquema de paridade varia um pouco, mas o princípio continua o mesmo. 
COMO FUNCIONA O BIT DE PARIDADE DO RAID?
Características:
Tendo 4 HD’s, 3 HD’s deverão ser para dados e 1 HD para paridade.
O bit de paridade pode ser espalhado entre todos os HD’s.
Para descobrir as informações na unidade, faça um XOR com o bit de paridade. Se for par, retorna 0. Se for ímpar, retorna 1.
Bit de paridade diz quais informações estão ausentes em um HD.
Podemos usar os resultados XOR para recuperar dados perdidos.
Exemplo:
0101 XOR 0011 = 0110
Se ???? XOR 1100 = 0110
Então 1100 XOR 0110 = 1010
RAID 3
Funcionamento igual ao RAID 0 e raramente usado;
Gravação de dados por bytes com paridade em HD separado;
Capaz de oferecer boa taxa de transferência e grande confiabilidade das informações.
RAID 4
Funcionamento semelhante RAID 3, só que mais rápido por usar blocos de dados maiores;
Mínimo 3 HD’s, 2 HD’s de dados e 1 HD exclusivo para Paridade;
Apenas 1 HD pode falhar, assim é possível reconstruir ele com as informações dos bits de paridade;
Sua velocidade não é boa, por ter 1 HD reservado para paridade. 
Assim como o RAID 2, é pouco usado fora de empresas.
A velocidade de leitura aumenta, porém a escrita requer que a paridade seja atualizada todas as vezes que ocorrerem gravações no HD, tornando mais lenta a gravação dos dados no disco.
RAID 5
Paridade Distribuída;
Mínimo de 3 HD’s;
Similar ao RAID 4, só que gravando as informações de paridade dentro dos próprios HD’s, sem um HD extra.
Um bit de paridade é gerado após cada dado gravado. Utilizado na reconstrução dos dados perdidos em caso de falha;
Nesse nível é tolerante perder apenas 1 HD;
A capacidade total de uma unidade lógica RAID 5 é:
(tamanho do menor HD) x (Qtde HD’s na matriz - 1);
É alto o desempenho de leitura pois os dados podem ser lidos em múltiplos discos simultaneamente.
É baixo a performance das gravações porque a paridade precisa ser calculada e gravada em todos os discos.
RAID 6
Dupla paridade distribuída;
Mínimo de 4 HD’s;
Similar ao RAID 5, ele grava uma segunda informação de paridade em todos os HD’s, aumentando a confiabilidade.
A tolerância aumenta em 2 discos.
Recomendado com a utilização de 8 HD’s ou mais.
RAID 7
Altíssima performance;
As informações são controladas e cacheadas de modo independente;
Usa HD extra para armazenamento de informações de paridade;
Pode ser considerado como um RAID 4 com cache de disco;
RAID 0+1
Combinação da divisão de dados com o espelhamento;
Alta performance com tolerância;
Mínimo: 4 HD’s.
A divisão de dados será usada em 2 HD’s e os outros 2 HD’s serão backup;
Se 1 dos HD’s falhar, o sistema age como divisão de dados.
RAID 10
Combinação do espelhamento com a divisão;
É benéfico para o gerenciamento de banco de dados críticos que precisam de desempenho máximo e alta tolerância a falhas. 
Oferece metade da capacidade total de todos os HD’s.
Mínimo de 4 HD’s e é obrigatório que seja número par de HD’s;
Quando um HD falha, todos os dados estarão disponíveis no outro HD sem nenhum impacto à integridade desses dados.
A tolerância a falhas de dados pode ser restaurada com a troca da unidade defeituosa.
RAID 50
Combina pelo menos 2 arranjos RAID 5 trabalhando em RAID 0. 
Mínimo 6 HD’s, esse RAID se torna viável em sistemas com menos de 9 HD’s, através da criação de três sub-grupos RAID 5.
Montagem mínima é de dois grupos de três discos.
Esse nível de arranjo possui um disco de paridade por grupo e garante que o sistema continue operante mesmo que dois HD’s falhem simultaneamente, desde que sejam de grupos distintos.
RAID 60
Mínimo de 8 HD’s e de 2 subgrupos RAID 6 montados no mesmo pool, esse sistema mantém dupla paridade por grupo. 
Garante o funcionamento do sistema mesmo que 4 discos falhem simultaneamente, sem que haja perda de informações.
UtilizaçãoO RAID 0 é bastante usado em aplicações com grande volume de dados como softwares de edição de imagens, vídeos ou de jogos. Não é recomendado para uso em servidores ou em outros ambientes onde a redundância de dados é o objetivo principal. Todos os outros RAID’s com certeza pode-se afirmar que são mais utilizados entre empresas que querem manter segurança de dados em seus servidores. Algumas soluções são bastante caras, mas permitem um nível de segurança compatível com o investimento realizado.

Continue navegando