Pregunta Raid1, tres o más unidades, ¿solución a configuraciones de múltiples terrazas en pequeñas empresas?


Con la relación entre espacio y costo de los discos duros que conducen a capacidades que presentan un desafío creciente a los sistemas Raid de paridad (probabilidad URE, reconstrucciones de varios días que acentúan unidades y arriesgando fallas secundarias), existe la posibilidad de que también presenten una oportunidad / recomendación para configuraciones multi-disk (> 2) Raid 1 para uso en el hogar y en pequeñas empresas? Es decir, Raid1 'desperdicia' espacio en comparación con un esquema de paridad, pero con unidades baratas de multiterabyte, el espacio no es sin duda el producto básico que tenemos a desperdicio en comparación con la memoria, el ancho de banda, el reloj de la CPU, el tiempo de inactividad, etc. requerido en la creación de bandas, reconstrucciones, etc.

Si entiendo la tecnología correctamente, una configuración Raid 1 (> 2):

  • ..no puede fallar una reconstrucción, en tanto que se pueda acceder a una unidad, también lo estarán los archivos.
  • .. proporciona una mayor seguridad en relación con el conteo de unidades. Básicamente es una inversión de la relación, ¿verdad? Raid5 en tres discos proporciona el 66% de capacidad utilizable y puede manejar el 33% (1 unidad) de falla. Raid1 proporciona solo el 33% de capacidad pero el 66% de falla (2 unidades).
  • ..tiene un mecanismo de recuperación más fácil y más robusto. En condiciones extremas, el Raid no necesita ser reconstruido para acceder a los datos. Las unidades se pueden migrar entre diferentes sistemas.

Ese último punto se asemeja a la filosofía no-Rid donde los archivos se guardan en unidades, y no en bandas, y el segundo punto me sugiere algo más atractivo para una pequeña empresa; priorizando la seguridad de datos sobre la capacidad de datos. ¿De qué sirve poder almacenar más datos si está en mayor riesgo?

Preguntas:

  1. ¿Una estrategia de 'duplicación manual' del contenido, en oposición a la copia de Raid1 en el momento de la escritura, evitaría posibles problemas con la corrupción de memoria que no es ECC? Como el trabajo de escribir en cada disco sería un proceso distinto, la misma falla de memoria que ocurre en una escritura no ocurriría teóricamente en otra?

  2. ¿Existe un software / hardware Raid1 diseñado para funcionar con más de dos unidades y, por lo tanto, puede manejar comportamientos tradicionales de tipo raid1 como bit-rot, URE, etc.? Con una configuración de espejo de disco tradicional si el disco A informa un 0 y B informa un 1, no tiene idea de quién lo hizo, pero en una solución de disco de tres o más, ¿no podría 'corregir' el disco de hombre impar? A = 0, B = 1, C = 0, ¿así que B debe haberse volteado?

  3. Al mismo tiempo, ¿podría una solución Raid1 soportar lecturas paralelas de más de dos discos para proporcionar velocidades de lectura aceleradas? Esto es especialmente importante ya que imagino que hay muchas empresas que leen los mismos datos muchas más veces de las que editan.

  4. Raid no es una solución de respaldo. Entonces, si siguiera las buenas prácticas y tuviera entre 2 y 3 ubicaciones de almacenamiento, ¿se pretende que solo una de ellas esté protegida contra fallas en la unidad a través de un esquema de ataque o podría esperar que una segunda ubicación fuera de sitio también tenga redundancia multidisco? ¿Se da el caso de que incluso una sola unidad, almacenada en una ubicación diferente, se haya protegido del fallo del dispositivo porque está en una relación espejo "efectiva" con las unidades en las otras ubicaciones? Si no es así, ¿Raid1 no ofrece algo de redudancia para el recuento de unidades mínimo más bajo (2)?

Actualizar:

Re punto 1, como algunos han señalado, esto se basa en una fuente de datos libre de errores. Sin embargo, este es el caso de prácticamente cualquier estrategia de almacenamiento / copia de seguridad. Podemos usar sistemas sofisticados para la integridad de los datos en nuestras soluciones NAS / SAN, pero los datos que almacenamos en ellos generalmente los generan las estaciones de trabajo y los dispositivos sin tales medidas. La mayoría de las PC de producción están diseñadas por costo o velocidad. Es altamente improbable, especialmente en una pequeña empresa, que la computadora con la que hace su CAD o financia o usa Power Point, etc., utilice unidades formateadas ZFS y memoria ECC.

En mi ejemplo específico, una de las cosas que buscaré almacenar será la salida de una cámara. Tengo que asumir que las fotos y videos que guarda en la tarjeta SD son 'correctos', y no hay mucho que pueda hacer si la corrupción ocurre en el punto en la cadena de datos.

Sugerencia:

Si esta estrategia no se admite en el nivel RAID, ¿hay algún paquete de software que se pueda usar para realizar manualmente algunas de las actividades de las que estoy hablando? ¿Escribir copias mediante tareas rysnc discretas y en cola? ¿Una secuencia de comandos bash podría realizar un fregado de rotura de bits periódica? ¿Simplemente suma todas las copias de un archivo en particular en todos los discos y luego sobrescribe la copia en un disco con la suma de comprobación incorrecta utilizando la copia en un disco correcto?


0


origen


Me puede estar perdiendo el punto / intención de su subpregunta # 1. Si la corrupción de datos ocurre cuando escribe en su disco principal (primero) y luego copia el archivo en un segundo disco, ¿no copiaría eso la información corrupta que se escribió en el primer disco? - Scott
Que hay muchas preguntas ... Ver superuser.com/questions/489793/... para un potencial duplicado aunque .... - Pimp Juice IT
RAID 6 también proporciona 2 fallas en el disco. La parte superior de RAID 5 es +1, y RAID 6 es +2, por lo que la sobrecarga disminuye a medida que aumenta la cantidad de unidades. Como el número total de unidades adicionales sigue siendo el mismo. - cybernard
Si encadenas tus escritos, estarías en lo correcto. Así que escribir desde la fuente al disco 1, luego el disco 1 al disco 2, etc. perpetuaría el error. Sin embargo, si lees y escribes a cada disco por separado, ¿podrías evitar este problema? Obviamente, la fuente que contiene los datos originales debe ser correcta. - John S.
Disculpas por las muchas preguntas. Hay algunos temas aquí que son posibles duplicados pero ninguno que vi que abordara estas preguntas en particular. Lo mejor que he reunido es que hasta ahora nadie puede nombrar un controlador de hardware que proporcione esta funcionalidad y que Linux mdadm maneja Raid1 con más de dos unidades, pero no ofrece ninguna funcionalidad adicional cuando se trata de> 2 configuraciones. - John S.


Respuestas:


Para responder las preguntas

  1. La duplicación manual del contenido omitiría algunos problemas potenciales relacionados con ECC, pero podría introducir otros. También asume que los datos de origen no han sido dañados por una falla anterior.

  2. Esto depende del hardware / software. Me imagino que la mayoría de las implementaciones de RAID1 no recogerían bitrot, pero manejarían URE. Las lecturas de un dato generalmente solo se hacen desde 1 de las unidades, no todas, lo que permitiría lecturas más rápidas en general.

  3. Si RAID1 admite los 3 discos, sí, las lecturas paralelas serían más rápidas con más discos. AFAIK esto no se admite en mdadm (es decir, soluciones basadas en incursiones de software de Linux) ya que la 3ª unidad se trata como un repuesto dinámico.

  4. Si RAID su ubicación fuera del sitio es una cuestión de solidez y confiabilidad. Sería una mejor práctica, pero no una necesidad absoluta. En mi opinión, los discos duros son partes consumibles: tener RAID permite la sustitución de fallas sin tener que reconstruir Y aumenta la durabilidad. Esto realmente sería una discusión costo-beneficio.


0



Un pensamiento (pero no una respuesta) - ¿Ha considerado tecnologías alternativas a RAID? ZFS (ideal para snapshots / pitr y replicación fuera del sitio), MooseFS o similar debería permitir ladrillos con redundancia distribuida pero menos hardware, incluso LVM puede proporcionar duplicación: usado junto con MDADM podría proporcionar una solución de tipo RAID1 en 3 discos. - davidgo
Gracias por una respuesta tan completa. ¿Puede explicar en detalle qué tipos de problemas podrían introducirse mediante la duplicación manual y cómo se imagina que se podría manejar un URE? ¿Simple ya que el controlador intentará leer desde un disco y moverá la lectura automáticamente a otro si encuentra un URE? - John S.
Tiene razón en que en ZFS un vdev reflejado admite la suma de comprobación y múltiples arreglos de disco (zfsbuild.com/2010/05/05/26/zfs-raid-levels) Sería interesante averiguar si este arreglo tiene una sobrecarga más baja (ZFS consume mucha RAM) que los arreglos RaidZ, RaidZ2 y RaidZ3 mucho más comunes. - John S.


Comencemos con las suposiciones:

Si entiendo la tecnología correctamente, una configuración Raid 1 (> 2):

..no puede fallar una reconstrucción, en tanto que se pueda acceder a una unidad, también lo estarán los archivos.

Esto es cierto, pero no protege de los rayos, robos, inundaciones, etc. Por lo tanto, mientras reduce un riesgo, aún necesita copias de seguridad fuera del sitio.

.. proporciona una mayor seguridad en relación con el conteo de unidades. Básicamente es una inversión de la relación, ¿verdad? RAID5 en tres discos proporciona el 66% de capacidad utilizable y puede manejar el 33% (1 unidad) de falla. Raid1 proporciona solo el 33% de capacidad pero el 66% de falla (2 unidades).

Eso supone que el fallo de la unidad es independiente. En SAS, este podría ser el caso (a menos que el disco falle espectacularmente y también dañe otras unidades), pero no es el caso para PATA o SATA. Por lo general, un disco colgado significa que todas las unidades de ese controlador se colgarán. Todavía tendrá sus datos, pero también tendrá su tiempo de inactividad.

..tiene un mecanismo de recuperación más fácil y más robusto. En condiciones extremas, el RAID no necesita ser reconstruido para acceder a los datos.

La mayoría de las veces la reconstrucción no es un problema. Nadie reconstruye matrices RAID. Con los discos de terabyte, es más rápido reemplazar el disco, recrear las matrices con sus datos y restaurar desde la copia de seguridad.

Desde una perspectiva empresarial, el objetivo principal de RAID es mantener el sistema funcionando hasta las 17:00, luego asegúrese de que su copia de seguridad diaria funcione, seguida de un nuevo disco, una nueva matriz RAID y una restauración desde la copia de seguridad.

Las unidades se pueden migrar entre diferentes sistemas

Esto depende de la implementación de RAID. Puede funcionar Puede que no.


¿Una estrategia de "duplicación manual" del contenido, a diferencia de la copia en tiempo-escritura de RAID1, evitaría posibles problemas con la corrupción de memoria que no es ECC? Como el trabajo de escribir en cada disco sería un proceso distinto, la misma falla de memoria que ocurre en una escritura no ocurriría teóricamente en otra?

Si tienes suerte. Pero, ¿qué le impediría copiar con éxito y sin problemas un archivo corregido?

¿Existe un software / hardware RAID1 diseñado para funcionar con más de dos unidades y, por lo tanto, puede manejar comportamientos tradicionales como los de raid1 como bit-rot, URE, etc.? Con una configuración de espejo de disco tradicional si el disco A informa un 0 y B informa un 1, no tiene idea de quién lo hizo, pero en una solución de disco de tres o más, ¿no podría 'corregir' el disco de hombre impar? A = 0, B = 1, C = 0, ¿así que B debe haberse volteado?

Hay theis 'RAID1-flavor' llamado RAID5 ....

En serio, me vienen a la mente RAID3,4,5 y RAID6. No hay necesidad de forzar un espejo a otra cosa.

Al mismo tiempo, ¿podría una solución RAID1 soportar lecturas paralelas de más de dos discos para proporcionar velocidades de lectura aceleradas? Esto es especialmente importante ya que imagino que hay muchas empresas que leen los mismos datos muchas más veces de las que editan.

RAID 5 lo haría. Y RAID 6, y ...

RAID no es una solución de respaldo. Entonces, si siguiera las buenas prácticas y tuviera entre 2 y 3 ubicaciones de almacenamiento, ¿está previsto que solo una de ellas esté protegida contra fallas de la unidad a través de un esquema RAID o esperaría que una segunda ubicación externa también tuviera redundancia de múltiples discos?

Yo quisiera un desconectado apoyo. Uno no accesible a través de Internet y en una ubicación física diferente. También es bueno tener una segunda copia de seguridad accesible y actualizada a diario. Pero sobre todo en caso de incendio y similares.

Las copias de seguridad de Mothly a realmente seguras fuera de línea y diarias a cinta / disco / nube serían una buena adición a eso.

¿Se da el caso de que incluso una sola unidad, almacenada en una ubicación diferente, se haya protegido del fallo del dispositivo porque está en una relación espejo "efectiva" con las unidades en las otras ubicaciones?

RAID no es una copia de seguridad. Una parte de un RAID no es una copia de seguridad adecuada. Ni siquiera un disco de un espejo multidisco. Dependiendo de su implementación de RAID podría funcionar o no. Una copia de seguridad adecuada siempre funciona. Incluso después de actualizar el software (por ejemplo, controladores RAID).

Si no es así, ¿RAID1 no ofrece cierta redudancia para el conteo de unidades mínimo más bajo (2)?

Ofrece redudancy a un sector no regable o disco roto.

Y eso es todo lo que normalmente se necesita. Redundancia suficiente para mantener las cosas en funcionamiento hasta que pueda realizar el mantenimiento de emergencia.


0