armazenamento externo

15
Armazenamento externo: DAS, NAS e SAN Quando você precisa de mais espaço de armazenamento no seu micro de trabalho, a opção mais comum é simplesmente comprar outro HD. Quando falamos em redes, entretanto, três siglas vêm à tona: NAS, DAS e SAN, acompanhadas geralmente por longas discussões sobre qual das três é mais adequada a determinada situação. Pode parecer estranho que uma grande empresa pague 50.000 dólares para implementar uma SAN, que oferece apenas alguns terabytes de espaço de armazenamento, quando seria possível obter o mesmo espaço usando um punhado de HDs comuns instalados em um servidor de arquivos, mas, como de praxe, existem fatores que justificam o investimento em muitas situações. Vamos então a uma explicação sobre as três tecnologias, começando com a mais simples: DAS. A sigla DAS é abreviação de "Direct Attached Storage". Ela se refere a dispositivos de armazenamento externo ligados diretamente ao servidor (ou a qualquer outro micro da rede), como no caso das gavetas de HD ligadas a portas eSATA (o eSATA é uma versão externa das portas SATA, que mantém a mesma velocidade de 150 ou 300 MB/s, mas permite o uso de um cabo externo) ou a portas USB, por exemplo. Além de gavetas e suportes baratos para ligar HDs externos, a lista inclui dispositivos mais caros. Nas fotos a seguir temos dois exemplos. O primeiro é uma gaveta de HD simples, ligada em uma porta USB e o segundo é uma unidade eSATA da Micronet, que utiliza 5 HDs, com RAID via hardware e outras funções. Apesar da diferença de complexidade, temos em ambos os casos uma unidade externa ligada à uma porta USB ou eSATA, que não tem nada a ver com o uso da rede:

Upload: adrianoapdf752

Post on 27-Jun-2015

98 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Armazenamento externo

Armazenamento externo: DAS, NAS e SAN

Quando você precisa de mais espaço de armazenamento no seu micro de trabalho, a opção mais comum é simplesmente comprar outro HD. Quando falamos em redes, entretanto, três siglas vêm à tona: NAS, DAS e SAN, acompanhadas geralmente por longas discussões sobre qual das três é mais adequada a determinada situação. Pode parecer estranho que uma grande empresa pague 50.000 dólares para implementar uma SAN, que oferece apenas alguns terabytes de espaço de armazenamento, quando seria possível obter o mesmo espaço usando um punhado de HDs comuns instalados em um servidor de arquivos, mas, como de praxe, existem fatores que justificam o investimento em muitas situações. Vamos então a uma explicação sobre as três tecnologias, começando com a mais simples: DAS.

A sigla DAS é abreviação de "Direct Attached Storage". Ela se refere a dispositivos de armazenamento externo ligados diretamente ao servidor (ou a qualquer outro micro da rede), como no caso das gavetas de HD ligadas a portas eSATA (o eSATA é uma versão externa das portas SATA, que mantém a mesma velocidade de 150 ou 300 MB/s, mas permite o uso de um cabo externo) ou a portas USB, por exemplo.

Além de gavetas e suportes baratos para ligar HDs externos, a lista inclui dispositivos mais caros. Nas fotos a seguir temos dois exemplos. O primeiro é uma gaveta de HD simples, ligada em uma porta USB e o segundo é uma unidade eSATA da Micronet, que utiliza 5 HDs, com RAID via hardware e outras funções. Apesar da diferença de complexidade, temos em ambos os casos uma unidade externa ligada à uma porta USB ou eSATA, que não tem nada a ver com o uso da rede:

Page 2: Armazenamento externo

Um NAS (Network Attached Storage), por sua vez, roda um sistema operacional completo e funciona como um servidor de arquivos, ligado diretamente na rede. Em modelos antigos, o desempenho de leitura e gravação era limitado aos pouco mais de 10 MB/s permitidos pela interface de rede de 100 megabits, mas a grande maioria dos modelos atuais são equipados com interfaces Gigabit Ethernet, eliminando o gargalo.

Apesar disso, o desempenho varia muito de acordo com o modelo, não apenas devido a variações na configuração dos discos, mas em muitos casos devido a limitações de processamento da controladora. Um NAS baseado em uma controladora barata, com pouco poder de processamento, pode oferecer apenas 15 ou 20 MB/s de taxa de transferência (limitada pela velocidade da controladora), mesmo que utilize 4 HDs operando em modo RAID 5, por exemplo.

Os NASes são muitas vezes chamados de "network storage", ou simplesmente de "storage", termos que são mais descritivos para o público não-técnico do que "NAS". Entre o público técnico, eles são também chamado de "filers" (arquivadores). O termo "storage" é na verdade um termo técnico genérico para soluções de armazenamento, que é usado também em outras situações, como no caso das SANs.

Existem muitas opões de NAS, que vão desde sistemas baratos, que custam pouco mais que uma gaveta USB, até equipamentos caros, que utilizam um grande número de HDs. Os modelos mais baratos comportam apenas um ou dois HDs e oferecem apenas funções básicas. Alguns modelos incluem também um transmissor wireless ou disponibilizam uma porta USB, o que permite que sejam ligados ao PC diretamente e sejam usados como um DAS. Modelos intermediários suportam em sua maioria 4 drives e modelos high-end ou racks para uso em datacenters suportam muitas vezes 8 drives ou mais.

Os modelos com apenas um HD são genericamente chamados de single-drive e os que utilizam dois ou mais são chamados de multi-drive. Alguns modelos são vendidos sem os drives, de forma que você pode instalar os HDs que quiser (eles são chamados de "diskless") e são geralmente bem mais baratos, enquanto muitos fabricantes optam por vender os aparelhos com drives pré-instalados (chamados genericamente de "diskfull"), de forma a tentar agregar valor e trabalhar com margens de lucro um pouco maiores.

Um exemplo de NAS é Buffalo TeraStation Pro II, que permite o uso de 4 discos, que podem ser configurados em modo RAID 0, 1, 10 ou RAID 5. Originalmente ele vinha com 4 drives de 250 GB (daí o nome), mas logo foram lançadas versões atualizadas, com drives de 500 GB, 750 GB e 1 TB, totalizando até 4 TB de espaço de armazenamento:

Page 3: Armazenamento externo

O mostrador frontal exibe informações básicas, como o endereço IP usado pelo servidor, o status da conexão e a configuração dos discos, mas a configuração em si é feita remotamente, através da interface de administração via navegador. É através dela que você escolhe qual modo RAID será usado, altera a configuração de rede do NAS, cria os compartilhamentos de rede, executa operações administrativas (como realizar testes de superfície nos HDs ou recuperar o array RAID em caso de falha em um dos discos) e assim por diante.

O uso da interface web não é uma exclusividade do TeraStation, muito pelo contrário. Quase todos os modelos de NAS disponíveis são configurados via navegador, com alguns poucos modelos demandando o uso de um software cliente, ou sendo configuráveis apenas via linha de comando (via SSH ou Telnet).

Page 4: Armazenamento externo

Via de regra, um NAS não faz nada que um PC tradicional não possa ser configurado para fazer. Um número surpreendente deles utilizam processadores x86, rodam Linux e compartilham os arquivos com a rede utilizando o Samba. Ou seja, nada mais são do que PCs compactos, otimizados para a tarefa.

A principal vantagem é que eles são soluções prontas, que podem ser instaladas rapidamente, sem exigir muitos conhecimentos técnicos, o que os tornam ideais para uso em escritórios e redes domésticas, por exemplo. Os modelos mais simples são bem mais baratos que um PC, além de serem mais compactos e consumirem menos energia, enquanto os modelos mais caros oferecem mais espaço de armazenamento, recursos de redundância e de gerenciamento que permitem o uso em redes que demandam um maior nível de confiabilidade.

Existem ainda distribuições Linux ou BSD que permitem transformar um PC comum em um NAS de forma prática. Um bom exemplo é o FreeNAS (baseado no FreeBSD), que pode ser instalado de forma simples, ocupando apenas 32 MB, e é inteiramente administrado através de uma interface de gerenciamento via web, sem precisar de monitor. Ele suporta o uso de RAID, compartilhamentos via CIFS (Samba), FTP, NFS e SFTP, além de oferecer um grande volume de recursos de gerenciamento. Você pode baixá-lo no http://www.freenas.org. Outro projeto similar é o OpenFiler, disponível no http://www.openfiler.com.

Em muitas situações, entretanto, usar um NAS não é suficiente. Muitas empresas precisam de volumes gigantescos de espaço de armazenamento, que deve não apenas oferecer um desempenho muito bom, mas também incluir backup dos dados e redundância.

De acordo com a escala necessária, usar um único servidor, com HDs SATA regulares seria a solução mais barata, já que muitas placas-mãe possuem até 10 portas SATA (e você poderia adicionar mais portas instalando controladoras adicionais), de forma que, você poderia simplesmente instalar 10 HDs SATA de 1 TB e contar assim com um total de 10 TB de armazenamento.

Usando o Samba ou o NFS você não gastaria nada com o software, de forma que, além da mão-de-obra, o custo se resumiria ao preço dos HDs e dos demais componentes escolhidos. Usando um array RAID você poderia sacrificar parte do espaço de armazenamento para melhorar o desempenho e a confiabilidade, criando um array RAID 5, por exemplo.

O uso de um NAS, ou de um servidor de arquivos com vários HDs atende bem à maioria das redes de pequeno e médio porte. Entretanto, muitas empresas precisam de muito mais do que 10 TB de espaço de armazenamento, sobretudo quando falamos em grandes bancos de dados e aplicações web. Usar vários pequenos servidores seria uma solução barata, mas em compensação complexa e mais propensa a falhas. Surge então a opção de usar uma SAN (Storage Area Network).

Page 5: Armazenamento externo

Toda SAN usa HDs tradicionais como blocos básicos de montagem, que são ligados a uma unidade controladora, que se encarrega do acesso aos dados, RAID e outras funções. A unidade de armazenamento é ligada a um servidor através de uma interface dedicada, que pode ser tanto uma interface Fibre Channel quanto uma interface de rede Gigabit Ethernet ou 10 Gigabit Ethernet (usando o iSCSI). O servidor se encarrega então de distribuir os dados para os clientes da rede ou fornecê-los para aplicativos específicos, como no caso de um cluster de servidores web, que utilizam a SAN para armazenar um grande banco de dados usado para atender às requisições dos clientes.

Além da maior capacidade de armazenamento e de recursos de redundância, a principal diferença de uma SAN e um NAS ou um servidor de arquivos tradicional é que o SAN se comporta como se fosse uma única unidade de armazenamento, que o servidor pode acessar diretamente, de forma transparente. Ou seja, é como se você conectasse um único HD de 100 TB (por exemplo) no servidor, diferente de um NAS, que se comporta como um servidor de arquivos e pode ser acessado simultaneamente por vários clientes.

Apesar disso, na grande maioria dos casos o objetivo de usar uma SAN não é simplesmente obter um grande espaço de armazenamento, mas sim obter ganhos de desempenho e de confiabilidade para aplicações críticas. Imagine o caso de um cluster de servidores responsáveis pelo site de um grande portal. As páginas são montadas a partir de um enorme banco de dados, armazenado na SAN, que é acessado de forma conjunta por todos os servidores do cluster. As unidades de armazenamento combinam um grande número de HDs em RAID, o que as torna capazes de atender a um grande volume de requisições por segundo, o que permite atender aos muitos visitantes simultâneos. Além do desempenho e do armazenamento centralizado, temos também a questão da redundância, que garante que o sistema funcione de forma contínua, sobrevivendo a falhas em componentes diversos.

Os componentes básicos de uma SAN são um ou mais storage racks (as unidades de armazenamento, com os arrays de discos), um switch Fibre Channel, os cabos e o servidor ao qual a SAN é conectada. Apesar disso, é comum o uso de dois switchs e dois servidores, de forma a oferecer um sistema redundante (o segundo servidor fica a postos para assumir o lugar o primeiro em caso de falha). Os componentes são ligados como na figura abaixo, de forma a garantir que o sistema continue funcionando caso qualquer um dos componentes falhe. O próprio array de discos é constituído por componentes redundantes, incluindo o uso de fontes e outros circuitos redundantes e RAID:

Page 6: Armazenamento externo

A principal vantagem do uso de uma SAN é que o sistema pode ser expandido conforme necessário, incluindo mais storage racks e mais switchs. Os diferentes arrays podem então ser acessados por diferentes servidores e, dependendo da configuração, até mesmo serem configurados para se comportarem como uma única unidade, com as capacidades somadas. Se dinheiro não for problema, é possível atingir facilmente a marca de 100 terabytes de espaço de armazenamento, com direito a um sistema de redundância completo.

O grande problema é mesmo a questão do custo, já que uma SAN completa pode facilmente superar a marca dos US$ 50.000 (sem incluir os impostos). Isso faz com que elas fiquem restritas a ambientes onde as vantagens compensam o maior custo. Para pequenas redes, servidores com diversos HDs (configurados como um array RAID) acabam sendo a melhor opção, já que podem oferecer um espaço de armazenamento similar ao de uma pequena SAN (embora com um desempenho e confiabilidade inferiores) a uma fração do custo.

Page 7: Armazenamento externo

Storage rack com redundância

Continuando, é possível também que um único array seja dividido em várias unidades lógicas, cada uma com um identificador próprio (chamado de LUN, ou "Logical Unit Number"), de forma a permitir que cada uma das unidades lógicas seja acessada por um servidor diferente. Isso permite centralizar o armazenamento de dados da rede, armazenando todos os dados importantes na SAN, ao invés de utilizar HDs separados em cada servidor. As unidades podem ser inclusive redimensionadas durante o uso, realocando o espaço entre os servidores conforme necessário.

O Fibre Channel é um padrão de redes desenvolvido especialmente para uso de unidades remotas de armazenamento. Existem diversos padrões de Fibre Channel, que incluem o 1GFC (1.06 gigabits), 2GFC (2.12 gigabits), 4 GFC (4.25 gigabits), 8GFC (8.5 gigabits) e o 10GFC (10.5 gigabits), sendo que atualmente (2008) os padrões mais usados ainda são o 2GFC e o 4GFC.

Existem três topologias de Fibre Channel: Ponto-a-ponto (dois dispositivos ligados diretamente), Arbitrated loop (onde os dispositivos são ligados uns aos outros, formando um anel) e Switched fabric (onde os dispositivos são ligados a um switch central, de forma similar ao que temos em uma rede de par trançado). Como pode imaginar, a topologia Switched fabric é de longe a mais utilizada atualmente.

Page 8: Armazenamento externo

Switch Fibre Channel

Embora exista um padrão de Fibre Channel que utiliza fios de cobre, os cabos de fibra óptica são de longe os mais comuns. É possível utilizar cabos de fibra óptica de até 50 km, utilizando cabos monomodo, mas o mais comum é que sejam usados cabos multimodo (mais baratos e suficientes para a maioria das situações), que oferecem um alcance de até 300 metros. Tipicamente, os cabos são curtos, com de 2 a 10 metros, de forma que a questão do alcance raramente é um problema. As controladoras Fibre Channel são chamadas de FC HBA (Fibre Channel Host Bus Adapter).

Fibre Channel HBA e conectores de um cabo Fibre Channel LC/LC

Outra tecnologia, mais recente, é o iSCSI (pronuncia-se "ai-iscâzi"), que permite que o cliente (chamado de initiator) envie comandos SCSI para um array de armazenamento (chamado de target) via TCP/IP, utilizando uma rede Ethernet tradicional. Isso permite que eles (os arrays) sejam acessados como se fossem unidades de armazenamento local através de cabos de rede. Você pode pensar no iSCSI como um protocolo para encapsular comandos de acesso a disco, juntamente com os dados resultantes, transformando-os em pacotes TCP/IP.

A função é basicamente a mesma do Fibre Channel, ou seja, interligar os servidores aos arrays de discos que formam a SAN, mas nesse caso a um custo mais baixo, já que dispensa o uso dos caros switchs, controladores e cabos Fibre Channel, substituídos por cabos de rede e switchs Ethernet.

Page 9: Armazenamento externo

Abaixo temos uma controladora iSCSI Adaptec 7211C. À primeira vista ela parece uma placa de rede, incluindo o uso do conector RJ45, mas a presença do processador, chipset e chips de memória denunciam sua verdadeira função. As controladoras iSCSI (chamadas de iSCSI HBA) executam muito mais processamento que uma simples placa de rede e, por isso, incluem um volume muito maior de componentes. Quando instaladas, as controladoras iSCSI são vistas pelo sistema como controladoras de disco e não como interfaces de rede:

As funções da controladora iSCSI podem ser também executadas via software (o software cliente é chamado de "iSCSI initiator"), o que permite utilizar uma placa de rede Ethernet regular no lugar da controladora iSCSI. O desempenho é naturalmente mais baixo, mas a redução no custo faz com que esta seja a opção mais usada em pequenas instalações. Com relação ao cabeamento, o ideal é que seja utilizado um segmento dedicado entre o servidor e os arrays de discos, mas o tráfego do iSCSI pode conviver com o tráfego Ethernet da rede, de forma que (embora não seja a solução ideal do ponto de vista do desempenho, nem da segurança) é possível simplesmente ligar os arrays em uma rede já existente, utilizando inclusive links de longa distância, o que permite a criação de sistemas de armazenamento remoto.

Esta ilustração, cortesia da Adaptec, mostra um exemplo de SAN usando o iSCSI. Nele, os dois servidores compartilham o mesmo array de discos, acessado através de um par de switchs Ethernet. O uso de dois switchs e duas placas de rede em cada servidor visam adicionar uma camada de redundância contra falhas nos equipamentos de rede. No exemplo, o primeiro servidor usa controladoras iSCSI dedicadas e o segundo utiliza um software iSCSI initiator, combinado com duas placas de rede comuns:

Page 10: Armazenamento externo

A popularização dos arrays iSCSI tornou as SANs muito mais acessíveis. Montar uma pequena SAN usando Fibre Channel custa, pelo menos, US$ 10.000 (sem contar os impostos) apenas em equipamento básico (o array de discos, o switch, as controladoras e os cabos), sem sequer incluir os HDs. Um array de discos iSCSI, por sua vez, pode ser ligado diretamente a uma placa Gigabit Ethernet no servidor, o que torna possível montar uma pequena SAN utilizando apenas o array (os mais simples custam a partir de US$ 1500) e os HDs.

Aqui temos o iX8-RAID, um exemplo de array iSCSI de baixo custo. Ele permite o uso de até 8 HDs SATA, que podem ser usados em modo RAID 0, 10, 5 ou 6 e é conectado ao servidor através de uma ou duas interfaces Gigabit Ethernet (a segunda é usada para redundância).

Ele inclui um processador Intel IOP 331 e 512 MB de memória, usada pra cache de disco e é administrado através de uma interface web, mas, diferente de um NAS, ele não compartilha arquivos diretamente na rede. Depois de ligá-lo ao servidor, você instala o iSCSI initiator, que faz com que ele seja visto pelo servidor como uma unidade local. A partir daí, você pode formatar os discos e usar o espaço como quiser, inclusive criando compartilhamentos de rede:

Page 11: Armazenamento externo

Com 8 HDs, os modos RAID com melhor custo-benefício são os modos 5 e 6. Optando pelo RAID 5, você sacrifica o espaço equivalente a apenas um dos discos e tem segurança contra falha de qualquer um dos HDs. Melhor ainda, o sistema pode continuar funcionando normalmente, mesmo sem um dos HDs, já que a controladora é capaz de reconstruir os dados a partir dos códigos de paridade em tempo real.

A falha é reportada através do display frontal e através da interface web (opcionalmente, você pode configurar também o envio de avisos por e-mail) e a troca pode ser feita à quente, sem precisar desativar a SAN. Desde que dois HDs não falhem simultaneamente e que você não demore muito para trocar o HD defeituoso, todos os dados ficam protegidos. Existe ainda a opção de usar o modo RAID 6, onde dois dos HDs são sacrificados, dobrando o volume de bits de redundância e permitindo que o array resista à falha de dois dos HDs.

Hoje em dia é comum também o uso de servidores de armazenamento que oferecem diversas opções de interface de comunicação, já que isso adiciona relativamente pouco (proporcionalmente) ao custo. Eles podem ser tanto usados em uma SAN, conectados via iSCSI ou Fibre Channel quanto trabalharem ligados diretamente na rede, como um NAS. Nas fotos temos um StorMaster SNi-4020ez SAN NAS iSCSI Storage Server, um exemplo de storage rack de maior porte, que oferece as três interfaces e permite o uso de até 40 HDs (com mais dois HDs extra, instalados na parte traseira, usados pelo sistema operacional):

Page 12: Armazenamento externo