Comunidad de CIOs Revista Byte TI | Noticias tecnología

Únete a la Comunidad de Directivos de Tecnología, Ciberseguridad e Innovación Byte TI

Encontrarás un espacio diseñado para líderes como tú, donde podrás explorar tecnologías emergentes, compartir estrategias y colaborar en soluciones de vanguardia

RAID

Evaluación de sistemas RAID para NAS

Las matrices redundantes de discos independientes (RAID) ganaron popularidad hace más de un cuarto de siglo y formalizaron un mercado de sistemas de almacenamiento de nivel empresarial seguros y fiables para el acceso compartido a los datos. Grandes empresas, pymes y también usuarios particulares los utilizan porque, en comparación con el uso de una única unidad de disco duro (HDD), un RAID puede proteger datos valiosos ante fallos en los medios de almacenamiento y resultar más rentable, además de mejorar el rendimiento y aumentar la resiliencia.

Rainer W. Kaese, director sénior de Desarrollo de Negocio de HDD de Toshiba Electronics Europe

Del mismo modo que diferentes configuraciones de RAID pueden ser más o menos adecuadas para determinada aplicación de almacenamiento determinada, existen también distintas formas de configurar el almacenamiento conectado a la red (NAS) y estas configuraciones se comportan de manera distinta en diferentes circunstancias. Comprender estas diferencias sutiles resulta muy instructivo y útil a la hora de decidir qué configuración adoptar.

Variaciones RAID

Los RAID se definen tradicionalmente como un conjunto de activos de almacenamiento instalados en un sistema, pero tratados lógicamente como un único dispositivo de almacenamiento. Una característica destacada es su disponibilidad de nivel empresarial, lo que significa que un RAID permanece activo, en funcionamiento y accesible para usuarios cualificados de la red durante todo el tiempo excepto unos pocos unos minutos al año. Los datos se protegen bien con su réplica (mirroring) o utilizando un esquema de paridad donde los datos perdidos pueden recuperarse recalculándolos a partir de la información aún existente.

Hay muchas formas de configurar un RAID y cada una tiene una designación numérica diferente, desde RAID0 hasta RAID60. Por ejemplo, RAID0 divide los datos (distribuye bloques de datos entre varias unidades), pero sin duplicación (crea una copia completa de un conjunto de datos) ni paridad (dedica una unidad a la tolerancia a fallos). En la práctica, en esta configuración no hay redundancia y los datos pueden perderse si falla alguna parte del sistema.

Por su parte, en RAID1 no existe striping, es decir, distribución de cargas en múltiples unidades físicas, ni paridad, pero los bloques están replicados. En RAID5, los bloques están divididos y hay paridad distribuida. RAID10 se caracteriza por bloques distribuidos y replicados. Así, mientras que RAID0 y RAID1 pueden configurarse con solo dos discos, RAID5 depende al menos de tres, mientras que RAID10 habitualmente se implementa a partir de cuatro unidades y puede llegar a cualquier número par superior de unidades.

Almacenamiento conectado a la red (NAS)

Los sistemas NAS constan de un subsistema de almacenamiento RAID conectado a la red y pueden equiparse con un número variable de dispositivos de almacenamiento.

Los dispositivos de almacenamiento suelen ser unidades de disco duro (HDD), aunque a veces se utilizan unidades de estado sólido (SSD). Los sistemas NAS de escritorio equipados con dos HDD son suficientes para muchos usos, pero las configuraciones con cuatro unidades no son infrecuentes y algunas tienen capacidad para hasta ocho HDD.

Por su parte, los sistemas empresariales, que con frecuencia se configuran en un formato de montaje en rack, pueden tener 12, 16 o incluso hasta 24 unidades HDD.

Evaluación NAS de dos y cuatro bahías

Es en este escenario donde surge las preguntas ¿cómo funcionan las distintas configuraciones RAID con diferentes configuraciones de NAS? Para responder a estas cuestiones, hemos llevado a cabo en el Laboratorio HDD de Toshiba una evaluación del nivel RAID centrada en los populares modelos básicos de NAS de dos y cuatro bahías.

En concreto, probamos varios sistemas NAS de distintos fabricantes, cada uno de ellos ampliado con una tarjeta de red de 10 GbE para evitar cuellos de botella en el rendimiento de la conectividad de red. Las pruebas con cada NAS se realizaron con dos y cuatro discos duros empresariales del modelo MG08ADA400E de 4TB de Toshiba.

En las pruebas, almacenamos 6TB de datos en el sistema y medimos su rendimiento para la escritura secuencial de bloques de 1MB, la lectura secuencial y la lectura aleatoria de bloques de 1MB, y, en tercer lugar, para una carga de trabajo mixta de lectura y escritura de una combinación de diferentes tamaños de bloques.

También probamos configuraciones utilizando controladores hardware RAID o control RAID de software. Para dos o cuatro unidades de HHD, aunque el RAID de hardware es la forma de administración más común y adecuada para dos o cuatro unidades de HDD, con una potencia informática de alto rendimiento y efectiva en coste (CPU, DRAM, etc.), los RAID también pueden gestionarse completamente mediante software, con la ventaja de ofrecer funciones de almacenamiento adicionales, como instantáneas o snapshots, copias de seguridad y más.

Los dos controladores RAID de hardware probados se encuentran entre los más populares del mercado para sistemas con hasta ocho unidades: el Broadcom MegaRAID 9560-8i de Broadcom y SmartRAID 3204-8i Microchip de Adaptec®. Para el almacenamiento definido por software, probamos el sistema de archivos Zettabyte (ZFS) administrado por el software JovianDSS de Open-E.

Los valores de rendimiento secuencial para NAS con configuraciones RAID son ligeramente más bajos que para los controladores RAID de hardware, mientras que el rendimiento aleatorio es similar al de ZFS sin almacenamiento en caché. Si se comparan RAID5 y RAID10, RAID5 es aproximadamente un 20% más rápido en términos de velocidad secuencial y RAID10 es un 20% más rápido con vistas a cargas de trabajo aleatorias/mixtas

La mayoría de los sistemas NAS todavía vienen con una interfaz de 1 GbE o 2,5 GbE, por lo que es necesario enfatizar que los valores de rendimiento secuencial de 200 MB/s y mayores requieren una interfaz de 10 GbE como mínimo. El uso de una interfaz de 1 GbE limita la velocidad secuencial a aproximadamente 100 MB/s, que es inferior a la de un solo disco duro. El uso de 2,5 GbE aumenta la velocidad máxima a 250 MB/s, suficiente para una configuración RAID1 de 2 bahías. Únicamente con 10GbE podremos alcanzar velocidades superiores a ese nivel.

Por lo tanto, cualquier compensación / optimización en términos de velocidad secuencial solo es relevante para redes de 10 GbE o de velocidad superior. Para infraestructuras de red de 1GbE y 2,5GbE, dos HDD en RAID1 son suficientes. Sólo para cargas de trabajo con muchos accesos aleatorios de lectura/escritura, cuatro unidades de RAID10 pueden brindar una ventaja de velocidad de aproximadamente 1,5 veces mayor.

Recomendación tras las pruebas

En conclusión, los administradores de almacenamiento deben tener en cuenta una serie de factores al evaluar las configuraciones de almacenamiento en red, ya sea una configuración RAID en general o una configuración NAS específicamente. Estos factores incluyen ¿cuánta capacidad necesito?, ¿cuál es mi carga típica de trabajo? y ¿existe alguna limitación impuesta por la conectividad del host / red?

Después de las pruebas, nuestra recomendación para configuraciones RAID en NAS es RAID1 (duplicación simple) de dos unidades de mayor capacidad como la configuración elegida para sistemas NAS razonablemente en hogares y pequeñas empresas con conectividad de red de 1 GbE o 2,5 GbE.

Para todo tipo de soluciones de sistemas de almacenamiento donde la mayor parte de la carga de trabajo es de naturaleza secuencial es mejor RAID5 (protección de paridad) con cuatro unidades es mejor y también proporciona la mejor eficiencia de almacenamiento (75%). Por lo tanto, RAID5 es adecuado para requerimientos de alta capacidad neta y ofrece los tiempos de reconstrucción más cortos posibles en los reemplazos de unidades defectuosas.

Por su parte, RAID10 (distribución y duplicación) con cuatro unidades es mejor para cargas de trabajo aleatorias/mixtas compensando, por supuesto, una menor eficiencia de almacenamiento de solo el 50%. RAID10 se recomienda para subsistemas de almacenamiento de servidor local con cargas de trabajo genéricas que utilizan controladores RAID de hardware o tecnología de software RAID.

Autor: Rainer W. Kaese, director sénior de Desarrollo de Negocio de HDD de Toshiba Electronics Europe

Deja un comentario

Scroll al inicio