Baixe o app para aproveitar ainda mais
Prévia do material em texto
Farid Nourani Aula 2: Armazenamento Externo – Conceitos Básicos 2S - 2020 ED-IIED-II Questões relevantes Velocidade com que os dados podem ser acessados; Custo por unidade de dado; Confiabilidade ◦ Perda de dados em falha de energia ou do sistema; ◦ Falha física do dispositivo de armazenamento; Diferenciar o armazenamento em: ◦ Armazenamento Volátil: Os dados se perdem quando o equipamento é desligado ◦ Armazenamento Não-Volátil: Os dados persistem quando o equipamento é desligado Inclui o armazenamento Secundário e Terciário Armazenamento: Conceitos Básicos 2 ED-IIED-II Cache ◦ Mais rápida e mais cara forma de armazenamento; ◦ Gerenciado por hardware; ◦ Volátil. Memória Principal ◦ Acesso rápido (10 a100 nanosegundos – nanosegundo = 10–9 segundos) ◦ Geralmente muito limitado (ou muito caro) para armazenar um conjunto grande de dados (um arquivo ou uma base de dados); Atualmente se usa amplamente capacidades de poucos Gigabytes; A capacidade tem aumentado e o custo por byte tem caído, constante e rapidamente (aproximadamente fator de 2 a cada 2 ou 3 anos). ◦ Volátil. Armazenamento: Conceitos Básicos 3 ED-IIED-II Memória Flash ◦ Armazenamento não volátil (dados persistentes). ◦ Permite “regravação” de dados (gravar/apagar) Suporta um número limitado de “regravações” (10K – 1M de ciclos de gravar/apagar). ◦ Leitura tão rápida quanto à memória principal; ◦ Gravação porém é lenta (alguns micro segundos), apagar dados é mais lenta ainda; ◦ Custo por unidade de armazenamento similar à mem. principal; ◦ Vastamente usado em dispositivos embarcados como câmeras digitais; ◦ É um tipo EEPROM (Electrically Erasable Programmable Read-Only Memory) Armazenamento: Conceitos Básicos 4 ED-IIED-II Disco Magnético ◦ Armazenamento não volátil (dados persistentes); ◦ Dados são armazenados na superfície de um disco giratório, que permite leitura/gravação magnética; ◦ Acesso direto – permite ler um dado em qualquer ordem; ◦ Meio primário para o armazenamento de dados a longo prazo; normalmente armazena banco de dados inteiro; ◦ Acesso extremamente mais lento comparado com a memória principal (~10 milisegundos ); ◦ Os dados armazenados devem ser transferidos do disco para a memória principal para acesso e depois escritos de volta ao disco para armazenamento; ◦ Capacidade de armazenamento elevada – atualmente pode atingir centenas de Gigabytes; Cresce constante e rapidamente com avanços tecnológicos (fator de 2 a 3 a cada 2 anos). Armazenamento: Conceitos Básicos 5 ED-IIED-II Armazenamento: Conceitos Básicos Discos Ópticos ◦ Armazenamento não volátil (dados persistentes). ◦ Os dados são lidos a partir de um disco giratório por meio óptico, usando um feixe de laser; ◦ Leituras e Gravações são mais lentas do que em discos magnéticos; ◦ Formatos mais populares: CD-ROM (640MB) e DVD (4.7 a 17 GB); WORM (Write-One, Read-Many): usados para arquivar dados (CD-R, DVD-R, DVD+R) Disponível também em versões Regraváveis (CD-RW, DVD-RW, DVD+RW, e DVD-RAM) ◦ Juke-box systems - Grande número de discos removíveis, com poucas unidades de leitura (drivers) e um mecanismo automático para montagem/desmontagem de discos, permitindo armazenamento de grande volumes de dados. 6 ED-IIED-II Armazenamento: Conceitos Básicos Fitas Magnéticas ◦ Armazenamento não volátil (dados persistentes); ◦ Usados primordialmente para arquivamento de dados e para cópias de segurança (backup) de dados dos discos magnéticos; ◦ Os dados são gravados/lidos na superfície magnética de um rolo de fita de nylon; ◦ Acesso Sequencial – mais lento do que discos magnéticos; ◦ Alta capacidade de armazenamento (40 a 300GB); ◦ Armazenamento de baixo custo – uma fita tem baixo custo e pode ser removida da unidade de fita (driver), mas uma unidade de fita tem custo elevado; ◦ Tape juke-boxes: armazenamento massivo de dados Centenas de terabytes (1 terabyte = 109 bytes) a até petabytes (1 petabyte = 1012 bytes). 7 ED-IIED-II Armazenamento Primário ◦ Acesso mais rápido ◦ Volátil Ex: Memória Cache e Memória Principal Armazenamento Secundário ◦ Conhecido também como armazenamento on-line ◦ Tempo de acesso razoavelmente rápido ◦ Não-Volátil Ex: Memória Flash e Discos Magnéticos Armazenamento Terciário ◦ Conhecido também como armazenamento off-line ◦ Tempo de acesso lento ◦ Não-Volátil Ex: Discos Ópticos e Fitas Magnéticas Armazenamento: Conceitos Básicos 8 ED-IIED-II Armazenamento: Conceitos Básicos A rm a z e n a m e n to 1º 2º 3º Aumenta custo e velocidade, Diminui capacidade Diminui custo e velocidade, Aumenta capacidade 9 ED-IIED-II Armazenamento Primário Inclui dispositivos de armazenamento que podem ser operadas diretamente pela unidade central de processamento (CPU) do computador. Armazenamento Secundário e Terciário Inclui dispositivos de armazenamento que NÃO podem ser operadas diretamente pela CPU (precisam de operações de I/O). Armazenamento: Conceitos Básicos 10 ED-IIED-II Armazenamento Primário (Interno) ◦ Registradores ◦ Memória Cache (SRAM Static Random Access Memory) ◦ Memória Principal (DRAM Dynamic Random Access Memory) Armazenamento Secundário (Externo) ◦ Discos Magnéticos ◦ Memória Flash ◦ Armazenamento On-Line Armazenamento Terciário (Externo) ◦ Discos Ópticos (CD-ROM, DVD) ◦ Fitas Magnéticas ◦ Cartão Perfurada; Papel ◦ Armazenamento Off-Line C u s to / V e lo c id a d e C a p a c id a d e V o lá ti l N ã o V o lá ti l Armazenamento: Conceitos Básicos 11 ED-IIED-II RAM (Random Access Memory) A Memória de Acesso Aleatório é um tipo de armazenamento amplamente usado como memória principal de um sistema de computador. RAM é o tipo de memória que um computador usa para abrir programas e executar aplicativos. A RAM também é conhecida como memória do sistema e é usada para armazenar informações temporárias. As informações desaparecem da memória quando o sistema é desligado. Existem dois tipos de RAM: DRAM e SRAM. Armazenamento: Conceitos Básicos 12 ED-IIED-II DRAM (Dynamic RAM) RAM Dinâmica é um tipo de RAM amplamente utilizado como memória principal de um sistema de computador. Cada célula de memória é composta de duas partes: um transistor e um capacitor. A DRAM armazena cada bit de informação em um capacitor separado dentro de um circuito integrado. O capacitor pode ser carregado ou descarregado, sendo esses dois estados usados para representar os dois valores de um bit, convencionalmente chamados 0 e 1. Uma célula de armazenamento DRAM é considerada dinâmica, pois precisa ser atualizada ou receber uma nova carga eletrônica a cada poucos milissegundos para compensar as perdas de carga do capacitor. Armazenamento: Conceitos Básicos 13 ED-IIED-II SRAM (Static RAM) RAM Estática é um tipo de RAM que retém bits de dados em sua memória enquanto a energia estiver sendo fornecida. Ele usa uma tecnologia completamente diferente da DRAM. Na RAM Estática, uma forma de flip-flop, que usa 4 ou 6 transistores, armazena cada bit de memória e nunca precisa ser atualizada. Isso torna a RAM Estática bem mais rápida que a RAM Dinâmica. No entanto, como possui mais partes, uma célula de memória estática ocupa muito mais espaço em um chip do que uma célula de memória dinâmica. Portanto, permite menos capacidade de memória por chip e isso torna a RAM Estática muito mais cara. Armazenamento: Conceitos Básicos 14 ED-IIED-II DRAM x SRAM A RAM Estática é rápida e cara, enquanto que a RAM Dinâmica é menos cara e mais lenta. Portanto, a RAM Estática é usada para criar o cache sensível à velocidade da CPU (CPU's speed- sensitive cache), enquanto a RAM Dinâmica forma o maior espaço de RAM do sistema. Armazenamento: Conceitos Básicos 15 ED-IIED-II Variedades de DRAM ◦ FPM RAM (Fast Page Mode RAM ) ◦ EDO DRAM (Extended Data Output DRAM ) ◦ BEDO DRAM (Burse Extended DataOutput DRAM ) ◦ SDRAM (Synchronous Dynamic Random Access Memory) Armazenamento: Conceitos Básicos 16 ED-IIED-II Variedades de DRAM FPM RAM Fast Page Mode RAM é um tipo de DRAM que permite acesso mais rápido aos dados na mesma linha ou página. Às vezes, é chamado de memória de página (page mode memory) e funciona eliminando a necessidade de um endereço de linha, se os dados estiverem localizados na linha acessada anteriormente. Armazenamento: Conceitos Básicos 17 ED-IIED-II Variedades de DRAM EDO DRAM Extended Data Output DRAM é mais rápida que a DRAM convencional. Diferente da DRAM convencional, que pode acessar apenas um bloco de dados por vez, a EDO DRAM pode começar a buscar o próximo bloco de memória ao mesmo tempo em que envia o bloco anterior à CPU. Armazenamento: Conceitos Básicos 18 ED-IIED-II Variedades de DRAM BEDO DRAM Burst Extended Data Output DRAM é um tipo de DRAM que pode enviar dados de volta ao computador a partir de uma operação de leitura, ao mesmo tempo em que lê o endereço dos próximos dados a serem enviados. Além disso, depois de ler o endereço, ele é capaz de enviar os dados de volta em três ciclos sucessivos de clock, sem a coordenação de clock (ou seja, as três saídas sucessivas parecem ser enviadas da RAM em uma explosão repentina). Funciona bem com microprocessadores que operam até 66 MHz. Armazenamento: Conceitos Básicos 19 ED-IIED-II Variedades de DRAM SDRAM DRAM Síncrona é um tipo de DRAM sincronizado com o barramento do sistema e pode operar em velocidades de clock muito mais altas que a memória convencional. É capaz de rodar a 133 MHz, cerca de três vezes mais rápida que a RAM convencional de FPM e duas vezes mais rápida que a EDO DRAM e a BEDO DRAM. A SDRAM está substituindo a EDO DRAM em muitos computadores mais novos. Armazenamento: Conceitos Básicos 20 ED-IIED-II Discos X RAM Tempo de acesso: ◦ HD: alguns milissegundos ~ 10ms; ◦ RAM: alguns nanossegundos ~ 10ns...40ns; ◦ Ordem de grandeza da diferença entre os tempos de acesso é aproximadamente 250.000 (HD é 1/4 de milhão mais lento); Suponha que o acesso à RAM equivale a buscar uma informação no índice de um livro que está em suas mãos, e que essa operação consome 20 segundos, o acesso a disco seria equivalente a mandar buscar a mesma informação em uma biblioteca que levaria quase 58 dias para retornar a informação (~ 5.000.000 segundos)!!! Porque? Armazenamento: Conceitos Básicos 21 ED-IIED-II Discos X RAM RAM Discos (HD) Custo Alto Baixo Tempo de Acesso Baixo Alto Capacidade Baixa Alto Princípio Elétrico Magnético Persistência Volátil Não-volátil Acesso Aleatório Aleatório Organização Células Trilhas/Setores Armazenamento: Conceitos Básicos 22 ED-IIED-II Armazenamento: Conceitos Básicos 23 ED-IIED-II Cabeça de Leitura-Gravação (Read-Write head) ◦ Posicionado muito próximo à superfície do disco (quase encostando nela); ◦ Lê ou grava magneticamente as informações codificadas nesta superfície; ◦ Normalmente existem de 1 a 5 discos em uma unidade de disco e no braço do disco existe uma cabeça de leitura/gravação para cada superfície de cada disco. A superfície do disco é dividido em Trilhas circulares (tracks) ◦ Mais de 50K-100K trilhas por disco nos HDs mais comuns. Cada trilha é dividido em setores ◦ Um setor é a menor unidade de dado que pode ser lida ou gravada; ◦ Tamanho típico de um setor é de 512 bytes; ◦ Quantidade típica de setores por trilha: 500 (nas trilhas internas) a 1000 (nas trilhas externas). Para ler/gravar um setor ◦ O braço do disco se movimenta para posicionar a cabeça de leitura na trilha correta; ◦ O disco gira continuamente; os dados são lidos/gravados a medida que os setores passam por baixo da cabeça de leitura/gravação. Cilindro ◦ Consiste do conjunto das trilhas que estão no mesmo raio em todos os discos; (Cilindro i consiste dos iésimos trilhas de todos os discos). Armazenamento: Conceitos Básicos 24 ED-IIED-II Controlador do Disco (Interface entre o Sistema e o hardware da unidade de disco) ◦ Aceita comandos de alto nível para ler ou gravar um setor; ◦ Inicia ações como mover o braço do disco até a trilha certa para realizar a leitura ou gravação efetiva dos dados; ◦ Calcula e avalia checksums para cada setor, verificando se o dado é lido de volta corretamente; Se o dado é corrompido, certamente o checksum armazenado não vai bater com o checksum recalculado; ◦ Garante gravações bem sucedidas através da verificação da releitura do setor após a sua gravação; ◦ Realiza o remanejamento dos setores danificados. Armazenamento: Conceitos Básicos 25 ED-IIED-II Padrões de Interface (controladores) ◦ ATA (Advanced Technology Attachment) (PATA or IDE - Integrated Drive Electronics) ≃ 66 a 133 MB/s ◦ SATA (Serial ATA) ≃ 150 a 600 MB/s ◦ SCSI (Small Computer System Interconnect) ) ≃ 320 MB/s Existem variações diferentes de cada padrão com velocidade e capacidades diferentes. Armazenamento: Conceitos Básicos 26 ED-IIED-II 27 ED-IIED-II Tempo de Acesso – O tempo de acesso é calculado a partir do momento em que uma solicitação de leitura ou gravação é emitida até o momento que inicia a transferência e consiste em: ◦ Seek Time (tempo de busca) – o tempo necessário para posicionar o braço do disco sobre a trilha correta; Tempo de busca médio é 1/2 do tempo de busca do pior caso; Será de 1/3 se todas as trilhas tem o mesmo numero de setores, desconsiderando o tempo necessário para iniciar e parar o movimento do braço; Aproximadamente de 4 a 10 milissegundos na maioria dos discos comuns. ◦ Latência Rotacional (Rotational latency or Rotational Delay) – O tempo gasto para girar o disco e posicionar o setor correto em baixo da cabeça de leitura; Latência média é 1/2 da latência do pior caso; 2 a 11 milissegundos em discos comuns (5400 a 15000 r.p.m.). ◦ Taxa de transferência de dados (Data-transfer rate) – a taxa pela qual os dados podem ser acessados a partir do disco ou armazenados nele; Normalmente de 50 a 200 MB por segundo (mais baixo para trilhas internas), existindo máximos em torno de 700MB a 1GB por segundo.; Armazenamento: Conceitos Básicos 28 ED-IIED-II Tempo Médio até Falha (Mean time to failure – MTTF) O tempo médio esperado para o disco funcionar continuamente sem nenhuma falha. ◦ Tipicamente de 3 a 5 anos; ◦ Probabilidade de falha dos novos discos é muito baixo, refletindo um MTTF teórico de 500.000 a 1.500.000 horas para um disco novo; Ou seja, um MTTF de 1.500.000 significa que entre 1000 discos relativamente novos, em media, um irá falhar a cada 1500 horas; ◦ MTTF decai com tempo de uso do disco. Armazenamento: Conceitos Básicos 29 ED-IIED-II Bloco – uma sequencia contígua de setores de uma única trilha. ◦ Dados são transferidos em blocos entre disco e a memória principal; ◦ O tamanho varia a partir de 512 bytes até vários Kbytes; Blocos pequenos: representam mais transferências do disco; Blocos grandes: representam maior desperdício de espaço, pois, os blocos são parcialmente preenchidos; O tamanho típico de blocos atualmente varia de 4 a 16 kilobytes; Organização de Arquivo – otimiza o tempo de acesso a blocos por organizar os blocos conforme como os dados são acessados pela aplicação; ◦ Isto é, armazenar informações correlacionadas em um mesmo cilindro ou em cilindros próximos. Armazenamento: Conceitos Básicos 30 ED-IIED-II Armazenamento: Conceitos Básicos 31 ED-IIED-II Um setor é a menor porção endereçável de um disco. fread (&c,1,1,fd) - lê 1 byte na posição corrente S.O. se encarrega em determinar qual é a superfície, a trilha e o setor, onde se encontra esse byte; Então, o conteúdo do setor é carregado para uma área especial da memória (buffer de E/S) e o byte desejado é lido do buffer para a RAM; Se o setor procurado já estiver no buffer, o acesso ao disco torna-se desnecessário.Armazenamento: Conceitos Básicos 32 ED-IIED-II Conjunto de setores logicamente contíguos no disco. Um arquivo é visto pelo S.O. como um grupo de clusters distribuídos no disco: ◦ Arquivos são alocados em um ou mais clusters. Armazenamento: Conceitos Básicos 33 ED-IIED-II Sequência de clusters consecutivos no disco, alocados para o mesmo arquivo. 1 seek para recuperar 1 extent. A situação ideal é um arquivo ocupar 1 extent: ◦ frequentemente isso não é possível, e o arquivo é espalhado em vários extents pelo disco. Armazenamento: Conceitos Básicos 34 ED-IIED-II Armazenamento: Conceitos Básicos 35 ED-IIED-II Perda de espaço útil decorrente da organização em setores de tamanho fixo. ◦ Temos duas alternativas: 1 registro por setor => fragmentação Registros ocupando mais de 1 setor => acesso mais complexo Fragmentação também ocorre organizando os arquivos em clusters: ◦ Ex: 1 cluster = 3 setores de 512 bytes, arquivo com 100 bytes (quanto espaço se perdeu?) Armazenamento: Conceitos Básicos 36 ED-IIED-II Armazenamento: Conceitos Básicos 37 ED-IIED-II Capacidade de um setor: ◦ nº bytes (Ex. 512 bytes). Capacidade de uma trilha: ◦ nº de setores/trilha x capacidade do setor. Capacidade de um cilindro: ◦ nº de trilhas/cilindro x capacidade da trilha. Capacidade de um disco: ◦ nº de cilindros x capacidade do cilindro. **Capacidade Nominal Armazenamento: Conceitos Básicos 38 ED-IIED-II Exemplo: ◦ Queremos armazenar 20.000 registros de tamanho fixo num disco de 300 Mbytes que contém: 512 bytes/setor 40 setores/trilha 11 trilhas/cilindro 1331 cilindros Armazenamento: Conceitos Básicos 39 ED-IIED-II Exemplo: ◦ Queremos armazenar 20.000 registros de tamanho fixo num disco de 300 Mbytes que contém: 512 bytes/setor 40 setores/trilha 11 trilhas/cilindro 1331 cilindros ◦ Quantos cilindros são necessários, se cada registro tem 256 bytes ? Armazenamento: Conceitos Básicos 40 ED-IIED-II Exemplo: ◦ Queremos armazenar 20.000 registros de tamanho fixo num disco de 300 Mbytes que contém: 512 bytes/setor 40 setores/trilha 11 trilhas/cilindro 1331 cilindros ◦ Quantos cilindros são necessários, se cada registro tem 256 bytes ? 2 registros/setor = 10.000 setores. Se em cada cilindro há 40 x 11 = 440 setores, então o número de cilindros é aproximadamente 10.000/440 = 22.7 cilindros. É provável que um disco tenha essa quantidade de cilindros disponível, mas não de forma contígua, então o arquivo pode ser espalhando em dezenas, ou centenas, de cilindros. Armazenamento: Conceitos Básicos 41 ED-IIED-II Este custo resulta da combinação de 3 fatores: 1. Tempo de busca (seek): tempo p/ posicionar o braço de acesso na posição (trilha/setor) desejada; 2. Delay de rotação: tempo p/ o disco rodar de forma que a cabeça de L/E esteja posicionada sobre a posição desejada; 3. Tempo de transferência: tempo p/ transferir os bytes. O tempo real de acesso é afetado também por outros fatores, além das características físicas do disco: ◦ Distribuição do arquivo no disco; ◦ Modo de acesso (aleatório x sequencial). Armazenamento: Conceitos Básicos 42 ED-IIED-II Movimento de posicionar a cabeça de L/E sobre a trilha/setor desejado. É a parte mais expressiva do tempo de acesso. ◦ Depende de quanto o braço precisa se movimentar. ◦ Deve ser reduzido ao mínimo. O conteúdo de todo um cilindro pode ser lido com 1 único seek. Para cálculos, normalmente se trabalha com o tempo de busca médio (tempo de busca para 1/3 do número de cilindros). Armazenamento: Conceitos Básicos 43 ED-IIED-II Por exemplo, para um HD de 5000 rpm, normalmente o delay de rotação é de 12ms. Na média, considera-se o delay de rotação de meia-volta. Na prática, esse delay é reduzido quando é possível ler/gravar o arquivo em setores da mesma trilha e trilhas do mesmo cilindro. Armazenamento: Conceitos Básicos 44 ED-IIED-II Tempo transferência = (nº de bytes transferidos / nº de bytes por trilha) * tempo de rotação. Exemplo: disco de 10.000 rpm com 170 setores por trilha: ◦ Para ler 1 setor: 1/170 de rotação; ◦ 10.000 rpm = 6ms por rotação; ◦ Tempo de transf. para 1 setor = 0,035ms. Armazenamento: Conceitos Básicos 45 ED-IIED-II Capítulo 3 do livro (Seção 3.1 – pg. 46 a 64) M. J. Folk; B. Zoelick; G. Riccardi. File Structures: An Object- Oriented Approach with C++. 3d Edition, Addison-Wesley, 1998. Wikipedia – Unidade de disco rígido https://pt.wikipedia.org/wiki/Unidade_de_disco_r%C3%ADgido 46 Armazenamento: Conceitos Básicos https://pt.wikipedia.org/wiki/Unidade_de_disco_r%C3%ADgido
Compartilhar