Franjas de datos

Técnica de segmentación de datos

En el almacenamiento de datos informáticos , la segmentación de datos es la técnica de segmentar datos secuenciales de forma lógica, como un archivo, de modo que los segmentos consecutivos se almacenen en diferentes dispositivos de almacenamiento físico.

La segmentación es útil cuando un dispositivo de procesamiento solicita datos con mayor rapidez que la que puede proporcionar un único dispositivo de almacenamiento. Al distribuir segmentos entre varios dispositivos a los que se puede acceder simultáneamente, se aumenta el rendimiento total de los datos. También es un método útil para equilibrar la carga de E/S en una matriz de discos. La segmentación se utiliza en unidades de disco en el almacenamiento de matriz redundante de discos independientes (RAID), controladores de interfaz de red , matrices de discos, diferentes computadoras en sistemas de archivos en clúster y almacenamiento orientado a cuadrículas , y RAM en algunos sistemas.

Método

Un método de segmentación se realiza intercalando segmentos secuenciales en dispositivos de almacenamiento de forma rotatoria desde el comienzo de la secuencia de datos. Esto funciona bien para la transmisión de datos, pero los accesos aleatorios posteriores requerirán saber qué dispositivo contiene los datos. Si los datos se almacenan de forma que la dirección física de cada segmento de datos se asigna a un dispositivo en particular, el dispositivo que accede a cada segmento solicitado se puede calcular a partir de la dirección sin conocer el desplazamiento de los datos dentro de la secuencia completa.

Se podrían emplear otros métodos en los que los segmentos secuenciales no se almacenen en dispositivos secuenciales. Este entrelazado no secuencial puede tener ventajas en algunos esquemas de corrección de errores .

Ventajas y desventajas

Las ventajas de la segmentación incluyen el rendimiento y el rendimiento. El intercalado secuencial de accesos a los datos en el tiempo permite que el menor rendimiento de acceso a los datos de cada dispositivo de almacenamiento se multiplique de forma acumulativa por la cantidad de dispositivos de almacenamiento empleados. El aumento del rendimiento permite que el dispositivo de procesamiento de datos continúe su trabajo sin interrupciones y, por lo tanto, finalice sus procedimientos más rápidamente. Esto se manifiesta en un mejor rendimiento del procesamiento de datos.

Debido a que los distintos segmentos de datos se guardan en distintos dispositivos de almacenamiento, la falla de un dispositivo provoca la corrupción de la secuencia completa de datos. En efecto, la tasa de fallas de la matriz de dispositivos de almacenamiento es igual a la suma de la tasa de fallas de cada dispositivo de almacenamiento. Esta desventaja de la segmentación se puede superar mediante el almacenamiento de información redundante, como la paridad , con el fin de corregir errores. En un sistema de este tipo, la desventaja se supera a costa de requerir almacenamiento adicional.

Terminología

Los segmentos de datos secuenciales escritos o leídos en un disco antes de que la operación continúe en el siguiente disco se denominan generalmente fragmentos , pasos o unidades de franja , mientras que sus grupos lógicos que forman operaciones de franja única se denominan franjas o rayas . La cantidad de datos en un fragmento (unidad de franja), a menudo denominada en bytes, se conoce de diversas formas como tamaño del fragmento , tamaño del paso , tamaño de franja , profundidad de franja o longitud de franja . El número de discos de datos en la matriz a veces se denomina ancho de franja , pero también puede referirse a la cantidad de datos dentro de una franja. ^[1]^[2]^[3]^[4]

La cantidad de datos en un paso multiplicada por la cantidad de discos de datos en la matriz (es decir, la profundidad de la franja por el ancho de la franja , que en la analogía geométrica daría como resultado un área) a veces se denomina tamaño de la franja o ancho de la franja . ^[5] La formación de franjas anchas se produce cuando fragmentos de datos se distribuyen en varias matrices, posiblemente todas las unidades del sistema. La formación de franjas estrechas se produce cuando los fragmentos de datos se distribuyen en las unidades de una sola matriz.

Aplicaciones

La segmentación de datos se utiliza en algunas bases de datos , como Sybase , y en ciertos dispositivos RAID bajo control de software o hardware, como el subsistema de matriz RAMAC 9394 de IBM . Los sistemas de archivos de clústeres también utilizan la segmentación. Oracle Automatic Storage Management permite que los archivos ASM tengan una segmentación gruesa o fina.

RAID: En algunas configuraciones RAID, como RAID 0 , la falla de una sola unidad miembro de la matriz RAID provoca la pérdida de todos los datos almacenados. En otras configuraciones RAID, como RAID 5 que contiene paridad distribuida y proporciona redundancia , si una unidad miembro falla, los datos se pueden restaurar utilizando las otras unidades de la matriz.

LVM2: La segmentación de datos también se puede lograr con la Gestión de volúmenes lógicos (LVM) de Linux. El sistema LVM permite ajustar la tosquedad del patrón de segmentación. Las herramientas LVM permiten la implementación de la segmentación de datos junto con la duplicación . LVM ofrece el beneficio adicional de almacenamiento en caché de lectura y escritura en NVM Express para almacenamiento de rotación lenta. LVM tiene otras ventajas que no están directamente relacionadas con la segmentación de datos (como instantáneas, cambio de tamaño dinámico, etc.).

Btrfs y ZFS: Tienen características similares a las de RAID pero con la seguridad de la integridad de los fragmentos para detectar bloques defectuosos y la flexibilidad adicional de agregar una cantidad arbitraria de unidades adicionales. También tienen otras ventajas que no están directamente relacionadas con la segmentación de datos (copia al escribir, etc.).

Véase también

Referencias

^ "Guía de administración de almacenamiento de Red Hat Enterprise Linux 6, capítulo 6. El sistema de archivos ext4". Red Hat . 9 de octubre de 2014 . Consultado el 8 de febrero de 2015 .
^ "mdadm(8) – Página del manual de Linux". linux.die.net . Consultado el 8 de febrero de 2015 .
^ "Documentación del kernel de Linux: configuración RAID". kernel.org . 11 de noviembre de 2014 . Consultado el 8 de febrero de 2015 .
^ "Tamaño de fragmento RAID" (PDF) . xyratex.com . Enero de 2008. págs. 6–7. Archivado desde el original (PDF) el 1 de agosto de 2014 . Consultado el 8 de febrero de 2015 .
^ "La profundidad de la franja es el tamaño de la franja, a veces llamada unidad de franja. El ancho de la franja es el producto de la profundidad de la franja y la cantidad de unidades en el conjunto de franjas".

[1] "Guía de administración de almacenamiento de Red Hat Enterprise Linux 6, capítulo 6. El sistema de archivos ext4". Red Hat . 9 de octubre de 2014 . Consultado el 8 de febrero de 2015 .

[2] "mdadm(8) – Página del manual de Linux". linux.die.net . Consultado el 8 de febrero de 2015 .

[3] "Documentación del kernel de Linux: configuración RAID". kernel.org . 11 de noviembre de 2014 . Consultado el 8 de febrero de 2015 .

[4] "Tamaño de fragmento RAID" (PDF) . xyratex.com . Enero de 2008. págs. 6–7. Archivado desde el original (PDF) el 1 de agosto de 2014 . Consultado el 8 de febrero de 2015 .

[5] "La profundidad de la franja es el tamaño de la franja, a veces llamada unidad de franja. El ancho de la franja es el producto de la profundidad de la franja y la cantidad de unidades en el conjunto de franjas".