¿Qué es una matriz de discos?
Una matriz de discos es un sistema que combina varios discos duros de acuerdo con ciertos requisitos. Toda la matriz de discos es administrada por un controlador de matriz. La tecnología RAID (Redundant Array of Independent Disks) fue propuesta por la Universidad de California, Berkeley, en 1987. Fue desarrollado originalmente para reemplazar discos grandes y costosos con una combinación de discos pequeños y económicos. Para reducir el costo del almacenamiento masivo de datos (en ese momento RAID se llamaba una matriz redundante de discos baratos), y al mismo tiempo, se esperaba utilizar información redundante para que el acceso a los datos no se perdiera cuando un disco fracasó, desarrollando así un cierto nivel de tecnología de protección de datos.
El principio de funcionamiento y las características de las matrices de discos;
La característica estructural básica de RAID es la división en bandas, que une dos o más discos físicos en un grupo para formar un único disco lógico. Un conjunto de bandas es un grupo de discos físicos agrupados. Cuando se utilizan varias unidades de disco, esta combinación puede proporcionar un mejor aumento del rendimiento que una única unidad de disco física. Los datos se escriben en la funda combinada en bloques, cuyo tamaño es un valor fijo que se elige antes de implementar el proceso de vinculación. La relación entre el tamaño del bloque y la demanda promedio de E/S determina las características del socket combinado. En términos generales, el propósito de seleccionar el tamaño de bloque es maximizar el rendimiento para adaptarse a las características de diferentes aplicaciones del entorno informático.
Ventajas de las matrices de discos:
Las matrices de discos tienen muchas ventajas: en primer lugar, aumentan la capacidad de almacenamiento; en segundo lugar, varias unidades de disco pueden funcionar en paralelo, lo que aumenta la velocidad de transferencia de datos. La tecnología proporciona indicadores de rendimiento, integridad y disponibilidad de datos más altos que el almacenamiento en disco ordinario, especialmente cuando el problema de los cuellos de botella de E/S siempre por detrás del rendimiento de la CPU se vuelve cada vez más prominente, las soluciones RAID pueden compensar esta brecha de manera efectiva.
Introducción a la tecnología de matriz;
La tecnología RAID es un estándar industrial y diferentes fabricantes tienen diferentes definiciones de niveles RAID. Actualmente, existen cuatro niveles de RAID ampliamente reconocidos en la industria: RAID 0, RAID 1, RAID 1 y RAID 5. Nuestros chips de matriz o tarjetas de matriz de placa base comunes pueden admitir los siguientes modos: RAID 0, RAID 1 y RAID 1.
1) RAID 0 es una franja de espacio de almacenamiento sin redundancia de datos. Forma una matriz de discos con todos los discos duros y puede leer y escribir varios discos duros al mismo tiempo. Sin embargo, no tiene respaldo ni tolerancia a fallas. Tiene las características de bajo costo, rendimiento de lectura y escritura extremadamente alto y alta utilización del espacio de almacenamiento. En teoría, puede mejorar el rendimiento del subsistema de disco.
2) RAID 1 es un espejo completo de dos discos duros, lo que puede mejorar la seguridad del subsistema de disco. Tiene tecnología simple, administración conveniente y buen rendimiento de lectura y escritura. Pero no se puede ampliar (la capacidad de un solo disco duro), lo que desperdicia mucho espacio de datos. Estrictamente hablando, no debería llamarse "formación".
3) RAID 1 combina las características de RAID 0 y RAID 1. Los discos independientes están configurados como RAID 0 y los dos conjuntos completos de RAID 0 son imágenes reflejadas entre sí. Tiene un rendimiento de lectura y escritura excelente y alta seguridad, pero el costo es alto y la utilización del espacio de datos es baja. No se puede considerar una solución rentable.
Hay tres chips de tarjetas de matriz comunes: Promise, highpoint y ami. Estos tres chips están disponibles en dos formas de producto: placa base integrada o tarjeta de matriz independiente. Utilizamos principalmente tarjetas de matriz Promise y, después de las pruebas, son estables sin discos. Los chips de matriz comunes que no son fáciles de romper incluyen: Promise Fasttrak 66, Fasttrak 65438+370a, Fasttrak 133, 20262, 20265, 20267, 20270, Fasttrak TX2, Fasttrak TX4, fasttraktx2000, tx4000.high. /Productos de chip LSI Logical MegaRAID. Ahora sabemos que el controlador de la tendencia estadounidense MG80649 está integrado en la placa base de Awai WO2-R, y sus productos de tarjeta de matriz nunca se han utilizado.
Notas:
1) Los discos duros utilizados para crear matrices de discos se utilizan generalmente en pares.
2) Se recomienda encarecidamente utilizar cuatro discos duros del mismo modelo, capacidad y marca como matriz.
3) Las tarjetas de matriz y algunos chips de matriz integrados admiten matrices duales.
Cuando utiliza cuatro discos duros como una matriz, se recomienda configurarlos como una matriz dual. Pero si la placa base integra un chip Promise, casi no admite la creación de matrices duales. (4) El controlador de matriz correspondiente no está instalado o el error del controlador está configurado para iniciar la matriz y aparecerá una pantalla azul cuando se inicie el servidor NT. ¡Cualquier operación que cree o reconstruya la matriz borrará todos los datos existentes en el disco duro o la matriz!
La función de la tarjeta de matriz es solo acelerar el cibercafé. Los discos duros IDE con más de 30 MB provocarán cuellos de botella y reducirán la velocidad. Si desea aumentar la velocidad, debe crear una matriz. No solo es rápido, sino que no tendrá mucho impacto en la adición de máquinas en el futuro.
A lo que debes prestar atención al crear matrices es:
Un malentendido acerca de las matrices es que todos todavía miran los discos por separado. Como matriz, ¡solo puede tratar el disco duro como un disco duro grande! Antes de copiar el disco, usamos SFDISK (u otro software de partición, no existe FDISK.EXE, porque FDISK.EXE solo reconoce 80G, pero generalmente después de crear una matriz, el disco duro tiene más de 80G), y luego usamos GHOST para grabar el disco en el disco duro de la matriz.
Mientras la ubicación del disco duro no esté separada del cable de datos, el contenido de la tarjeta de matriz no cambiará incluso si se reemplaza con el mismo nombre, porque la configuración de los parámetros relevantes en el La tarjeta de matriz se guarda en el disco duro.
Matriz de discos
1. ¿Qué es una matriz de discos?
La matriz de discos es una tecnología que utiliza un controlador de disco duro para controlar la interconexión de múltiples discos duros para sincronizar la lectura y escritura de múltiples discos duros, reducir errores y mejorar la eficiencia y confiabilidad.
2. ¿Qué es RAID?
RAID es la abreviatura de redundant array of cheap disks, que significa redundant array of cheap disks. RAID es un estándar teórico para la tecnología de matrices de discos. Su propósito es reducir los errores y mejorar el rendimiento y la confiabilidad de los sistemas de almacenamiento. Los niveles más utilizados son 1, 3, 5, etc.
3. ¿Qué es el nivel RAID 0?
El nivel 0 de RAID es la implementación de la tecnología de separación de datos. Convierte todos los discos duros en una matriz de discos, que puede leer y escribir en varios discos duros al mismo tiempo, pero no tiene capacidades de respaldo ni tolerancia a fallas. El precio es económico, la eficiencia en el uso del disco duro es la mejor, pero la confiabilidad es la peor.
Tomemos como ejemplo una matriz de discos de nivel RAID compuesta por dos discos duros. Escribe 1 y 2 bits de datos en el primer disco duro, el 3.º y 4.º bits de datos en el segundo disco duro... y así sucesivamente, por eso se llama "partición de datos". Debido a que los datos en cada disco se escriben simultáneamente, su velocidad de almacenamiento puede ser varias veces más rápida que la de un solo disco duro.
Sin embargo, de esta manera, si falla un disco duro de la matriz de discos, debido a que separa los datos y los almacena en diferentes discos duros, la falla de uno equivale a interrumpir la integridad de los datos. Sin cintas de respaldo de toda la matriz de discos, todos los datos serán irreparables. Por eso, a pesar de su alta eficiencia, pocos adoptan esta tecnología a riesgo de perder datos.
4. ¿Qué es el nivel RAID 1?
RAID nivel 1 utiliza tecnología de duplicación de disco, que consiste en copiar sincrónicamente el contenido de un disco duro a otro disco duro, por lo que tiene capacidades de respaldo y tolerancia a fallas, baja eficiencia pero alta confiabilidad.
5. ¿Qué es el nivel RAID 3?
RAID Nivel 3 utiliza tecnología de entrelazado de bytes. Los discos duros se ejecutan simultáneamente bajo la tarjeta de control SCSI y los datos utilizados para la verificación de paridad se almacenan en discos duros específicos. Tiene tolerancia a fallas y la eficiencia de uso del disco duro se reduce en uno por cada pocos instalados, por lo que la confiabilidad es mejor.
6. ¿Qué es el nivel RAID 5?
El nivel RAID utiliza tecnología de división de discos. A diferencia del nivel 3, almacena datos de paridad en cada disco duro. Cada disco duro se ejecuta en paralelo bajo el control de la tarjeta de control SCSI, con tolerancia a fallos. Al igual que el nivel tres, su eficiencia es instalar algunos y luego reducir uno.
7. ¿Qué es un disco duro intercambiable en caliente?
El nombre en inglés de disco duro intercambiable en caliente es hot-swappable. En una matriz de discos, si se utiliza un disco duro que admita tecnología de intercambio en caliente, el servidor puede extraer directamente el disco duro roto y reemplazarlo por uno nuevo sin apagarlo. En las matrices de discos comerciales generales, si el disco duro está dañado, se llamará automáticamente al administrador para que lo reemplace.
El principio de la matriz de discos
¿Por qué se necesita la matriz de discos? Cómo mejorar la velocidad de acceso al disco, cómo evitar la pérdida de datos debido a una falla del disco y cómo utilizar eficazmente el espacio en disco siempre han sido preocupaciones de los profesionales y usuarios de informática. Sin embargo, los discos de gran capacidad son muy caros y suponen una gran carga para los usuarios. La aparición de la tecnología de matriz de discos resolvió estos problemas de una sola vez.
En los últimos diez años, la velocidad de procesamiento de la CPU ha aumentado casi geométricamente y la velocidad de acceso a la memoria también ha mejorado considerablemente. Sin embargo, la velocidad de acceso a los dispositivos de almacenamiento de datos, es decir, los discos duros. , palidece en comparación. Más lento. Todo el rendimiento de E/S no puede seguir el ritmo del sistema, lo que forma un cuello de botella en el sistema informático y reduce el rendimiento general del sistema informático. Si la velocidad de acceso al disco no se puede mejorar de manera efectiva, el desequilibrio entre la CPU, la memoria y el disco hará que la mejora de la CPU y la memoria sea un desperdicio.
Actualmente, existen dos métodos principales para mejorar la velocidad de acceso al disco. Uno es el controlador de caché de disco, que almacena los datos leídos del disco en la caché para reducir la cantidad de accesos al disco. Los datos se leen y escriben en la memoria caché, lo que aumenta considerablemente la velocidad de acceso. Una operación de acceso al disco se completa si los datos que se van a leer no están en la memoria caché o si los datos se van a escribir en el disco. Esta fórmula se utiliza en entornos de tarea única como DOS. El acceso a grandes cantidades de datos tiene buen rendimiento (los accesos pequeños y frecuentes no lo tienen). Sin embargo, su rendimiento no se puede mostrar en un entorno multitarea (debido al constante intercambio de datos) o en el acceso a bases de datos (debido al pequeño tamaño de cada registro). No hay garantía de seguridad.
Una es utilizar tecnología de matriz de discos. Una matriz de discos es una matriz de varios discos que funcionan como un solo disco. Almacena datos en diferentes discos en forma de franjas. Al acceder a los datos, los discos relacionados en la matriz trabajan juntos para reducir en gran medida el tiempo de acceso a los datos y lograr una mejor utilización del espacio. Las diferentes tecnologías utilizadas en las matrices de discos se denominan niveles RAID y los diferentes niveles abordan problemas de seguridad de datos para diferentes sistemas y aplicaciones.
Generalmente, las matrices de discos de alto rendimiento se pueden implementar en forma de hardware, y el control de la caché del disco y la matriz de discos se combinan aún más en un controlador RAID o una tarjeta de control para resolver los problemas de las personas con el disco I/ O sistema. Cuatro necesidades de los mismos usuarios:
(1) Mejorar la velocidad de acceso.
(2) Tolerancia a fallos, es decir, seguridad.
(3) Utilice eficazmente el espacio en disco.
(4) Intente equilibrar el rendimiento de la CPU, la memoria y el disco para mejorar el rendimiento general de la computadora.
Principios de Disk Array
En 1987, un miembro del personal de la Universidad de California en Berkeley publicó un artículo llamado "Disk Array Research", que mencionaba oficialmente RAID, que significa RAID contenido. matriz de discos. El artículo señala que los discos duros económicos de 5,25 y 3,5 pulgadas también pueden proporcionar capacidad humana, alto rendimiento y consistencia de datos como los discos duros de 8 pulgadas en máquinas grandes, y presenta la tecnología RAID1-5 en detalle. Las diferentes tecnologías de matrices de discos utilizadas para diferentes aplicaciones se denominan niveles RAID, abreviatura de Redundant Array of Inexpensive Disks, y cada nivel representa una tecnología. Los estándares actualmente reconocidos en la industria son RAID 0-RAID 5. Este nivel no representa el nivel técnico. El nivel 5 no es superior al nivel 3 y el nivel 1 es inferior al nivel 4. El plazo depende del producto de nivel RAID que se elija, lo que depende completamente del entorno operativo y la aplicación del usuario, independientemente del nivel. RAID0 no tiene garantía de seguridad, pero es rápido y adecuado para sistemas de E/S de alta velocidad. RAID 1 es adecuado para sistemas que requieren seguridad y velocidad, mientras que RAID2 y RAID3 son adecuados para computadoras centrales y procesamiento de imágenes y CAD/CAM. RAID5 se utiliza principalmente en 0LTP y es bien conocido por las necesidades urgentes de las instituciones financieras y los grandes centros de procesamiento de datos. Sin embargo, muchas personas tienen malentendidos acerca de las matrices de discos y creen que RAID5 es necesario para las matrices de discos. RAID4 rara vez se utiliza y tiene algunas características en común con RAID5, pero es adecuado para acceder a grandes cantidades de datos. Otros como RAID6, RAID7. Incluso RAIDl0, 50, 100, etc. Todos están hechos por fabricantes y no existe un estándar consistente, por lo que no los explicaré aquí.
RAID1
RAID1 es una tecnología que utiliza duplicación de disco. Antes de la llegada de RAID, muchos sistemas utilizaban la duplicación de discos. Su método consiste en agregar un disco de respaldo al disco de trabajo y los datos almacenados en los dos discos son seguros y consistentes. Los datos se escriben en el disco de trabajo y en el disco de respaldo.
RAID2
RAID2 consiste en dispersar los datos en bits/bytes o bloques (b1ock), agregar código Hamming e intercalarlo en la matriz de discos al tamaño de cada disco. Y la dirección es la misma, es decir, en cada disco, los datos están en el mismo cilindro o pista y sector. RAID2, también conocido como matriz paralela, está diseñado para utilizar * * * tecnología de sincronización de eje para controlar que la matriz de discos se inicie cuando se accede a los datos y realizar acceso paralelo en la misma ubicación en cada disco, para que tenga el mejor tiempo de acceso. * *El bus está diseñado específicamente para acceder a datos con tiempos de transferencia paralelos de gran ancho de banda, por eso lo tiene. En la aplicación de acceso a archivos personales, RAID2 tiene el mejor rendimiento y su rendimiento sólo se reconocerá cuando el archivo sea demasiado pequeño. Porque el acceso al disco es suficiente por un tiempo. El acceso RAID2 es una operación paralela de todos los discos, que es un acceso de una sola unidad o byte. Por tanto, los datos con menos de un sector reducirán en gran medida su composición. RAID2 está diseñado para ordenadores que requieren datos continuos y masivos, como desde mainframes hasta supercomputadores, estaciones de trabajo de procesamiento de imágenes o CAD/CAM, etc. , es también un servidor web apto para entornos multiusuario. minicomputadora o computadora personal.
RAID3
Los métodos de acceso y almacenamiento de datos de RAID3 son los mismos que los de RAID2, excepto que se utiliza paridad en lugar del código Hamming para la corrección y detección de errores, por lo que solo se utiliza un disco de paridad. necesario. El cálculo del valor de paridad es suficiente para realizar una operación lógica XOR en los bits correspondientes de cada disco y luego escribir el resultado en el disco de paridad. Cualquier modificación de datos requiere un cálculo de paridad.
RAID4
RAID4 también usa un disco de verificación, pero a diferencia de RAID3, RAID4 usa RAID0 y un disco de verificación.
RAID5
RAID5 es similar a RAID4, pero evita los cuellos de botella de RAID4. El método consiste en buclear los datos de verificación en cada disco sin verificar el disco. El control de RAID5 es más complejo, especialmente el control de hardware de la matriz de discos, porque la aplicación de este método requiere más cosas que otros niveles RAID, más requisitos de entrada/salida, velocidades más rápidas, procesamiento de datos y cálculos de valores de paridad, corrección de errores. , etc. , por lo que el precio es más alto.
Comparación de RAID: la siguiente tabla enumera algunos atributos de RAID:
Modo de funcionamiento Capacidad mínima disponible del disco duro Rango aplicable
Expansión del disco RAID0 y asignación de datos 2 T Servidores de PC y estaciones de trabajo gráficas
Distribución y duplicación de datos RAIDl 2 t/2
RAID2 ***sincronización de ejes, transmisión paralela, ECC 3 depende de la estructura de archivos grandes y no es Aplicaciones de entrada y salida de uso común, como procesamiento de imágenes y CAD/CAM.
RAID3 *** sincronización de ejes y transmisión en paralelo, paridad 3tx (n-1)/n
Distribución de datos RAID4, paridad fija 3tx (n-1)/n
La distribución de datos RAID5 se distribuye en aplicaciones de paridad 3tx (n-1)/OLTP en grandes centros de procesamiento de datos como bancos, finanzas, mercados de valores y bases de datos.
Rendimiento y disponibilidad de RAID
Nivel de RAID Utilización de datos de usuario Rendimiento de ancho de banda Rendimiento de transacciones Disponibilidad de datos
RAID0 1 0,25 1 0,0005
RAID1 0,5 0,25 0,85 1
RAID2 0,67 1 0,25 0,9999
RAID3 0,75 1 0,25 0,9999
RAID4 0,75 0,25 0,61 0,9999
RAID5 0,75 0,25 0,61 0.9999
Los datos anteriores se basan en 4 discos, tamaño de bloque de transferencia lK y 75 % de probabilidad de lectura.
El cálculo de la disponibilidad de datos se basa en la misma probabilidad de corrupción.
Descripción general de RAID
RAID0
No hay disco ni espacio adicional para la preparación de seguridad, por lo que la mayoría de la gente no le presta atención. De hecho, su eficiencia y utilización del espacio son las mejores y es muy adecuado para aplicaciones que buscan eficiencia. Al mismo tiempo, se pueden utilizar otros niveles de RAID u otros métodos de copia de seguridad para compensar sus deficiencias y proteger datos importantes.
RAID1
La seguridad es la mejor, 100% ininterrumpida. Incluso si un disco está dañado, puede seguir funcionando como de costumbre sin afectar el rendimiento (tiene un ligero impacto). sistemas a los que se puede acceder en paralelo), porque los datos se almacenan repetidamente. La lectura paralela de RAIDl casi tiene el rendimiento de RAID0, porque los discos que están reflejados entre sí se pueden leer al mismo tiempo, la escritura es sólo ligeramente peor que la de RAID0, porque la escritura en dos discos al mismo tiempo no aumenta; la carga de trabajo mucho. Aunque se utilizan el doble de discos para la duplicación que RAID0, es la solución más barata como punto de entrada para utilizar una matriz de discos y es la mejor opción para los usuarios que son nuevos en la configuración de un monitor de disco.
RAlD5
RAID5 funciona bien en términos de tiempo sin inactividad y tolerancia a fallas, pero si ocurre una falla en el disco. El impacto en el rendimiento es enorme y una caché grande ayuda a mantener el rendimiento. Sin embargo, en las aplicaciones 0LTP, dado que cada dato o registro es pequeño, el acceso al disco es relativamente frecuente. Entonces tiene cierta influencia. Cuando un disco falla, para leer los datos del disco, debe leer todos los datos y los valores de verificación segmentados por el mismo valor de verificación, y luego calcular los datos del disco fallido al escribir, además de leer; repetidamente El programa recuperado también necesita calcular el valor de verificación y luego escribir los datos actualizados y el valor de verificación cuando se reemplaza un disco nuevo, el sistema tarda mucho en calcular los datos de toda la matriz de discos para restaurar los datos del fallido; disco. Si el sistema tiene una gran carga de trabajo, habrá muchas solicitudes de E/S en cola, lo que reducirá el rendimiento del sistema. Sólo mediante el uso de matrices de discos de hardware se puede mejorar considerablemente su rendimiento, porque las matrices de discos de hardware, como la serie Arena, tienen sus propias CPU integradas que se ejecutan en paralelo con el sistema de computadora personal. Todo el trabajo de entrada y salida para acceder al disco se completa en la pantalla del disco, sin consumir tiempo del host. Al utilizar la memoria caché del monitor de disco, se puede mejorar el rendimiento general del sistema y un control SCSI superior puede aumentar las tasas de transferencia de datos de modo que incluso si falla un disco, el rendimiento de los componentes del sistema host no se degradará significativamente. RAID5 tiene demasiadas cosas que hacer, por lo que es más caro. No es adecuado para sistemas pequeños, pero si un sistema grande utiliza una gran matriz de discos, RAID5 es la solución más barata.
En resumen, RAID0 y RAIDl son los más adecuados para usuarios de servidores de PC y estaciones de trabajo gráficas, ya que ofrecen el mejor rendimiento y el precio más económico. Bajo costo para satisfacer la demanda del mercado. RAID2 y RAID3 son adecuados para aplicaciones que requieren entrada y salida frecuente de archivos grandes, como procesamiento de imágenes y CAD/CAM. RAID5 es adecuado para aplicaciones 0LTP en grandes centros de procesamiento de datos, como bancos, finanzas, mercados de valores y bases de datos. RAID4 y RAID5 tienen la misma funcionalidad y uso, pero son más adecuados para leer archivos grandes.
Tolerancia adicional a fallos de las matrices de discos
De hecho, la tolerancia a fallos se ha convertido en la característica más popular de las matrices de discos. Para mejorar la función de tolerancia a fallos y permitir que el sistema reconstruya rápidamente los datos en caso de fallo del disco, manteniendo así el rendimiento del sistema, los sistemas de matriz de discos generales pueden utilizar la función de repuesto dinámico o de unidad de repuesto dinámico. La llamada copia de seguridad en caliente se realiza cuando se configura el sistema de matriz de discos. Uno de los discos está designado como disco de respaldo y no funciona correctamente. Solo cuando falla un disco en la matriz, el disco de respaldo de la matriz de discos reemplazará el disco fallido y reconstruirá automáticamente los datos del disco fallido en el disco de respaldo. Debido a la rápida velocidad de respuesta y al caché que reduce el acceso al disco, la reconstrucción de datos se puede completar rápidamente con poco impacto en el rendimiento del sistema. Para grandes centros de procesamiento de datos o centros de control que requieren apagados ininterrumpidos, la copia de seguridad en caliente es una característica importante porque puede evitar todos los inconvenientes causados por fallas de disco durante la noche o cuando están desatendidos.
Los discos de respaldo se pueden dividir en respaldo en caliente y respaldo en caliente. La diferencia entre la copia de seguridad en caliente y la copia de seguridad en caliente es que el disco y la matriz de copia de seguridad en caliente comienzan a ejecutarse y se realizará una copia de seguridad si hay una falla, mientras que el disco de copia de seguridad en caliente se carga, pero se ejecuta en paralelo y no se iniciará hasta que se necesite la copia de seguridad. .
Se están ejecutando o no, y cuando se inician, solo la copia de seguridad en caliente no se ejecuta, por lo que en teoría tienen una larga vida útil. Otra característica adicional de tolerancia a fallos es la reubicación de sectores defectuosos. Los sectores defectuosos son la principal causa de falla del disco. Normalmente, los sectores defectuosos indican una falla del disco mientras se lee o escribe. No puede leer ni escribir, y muchos sistemas incluso fallan debido a una lectura y escritura incompletas. Si el trabajo no se puede completar porque un sector está dañado o es necesario reemplazar el disco, el rendimiento del sistema se reducirá considerablemente y el costo de mantenimiento del sistema será demasiado alto. La transferencia de sectores defectuosos significa que cuando el sistema de matriz de discos encuentra un sector defectuoso, reemplaza el sector con otro sector en blanco que no sea defectuoso para extender la vida útil del disco y reducir la incidencia de discos defectuosos y los costos de mantenimiento del sistema. Por lo tanto, la función de transferencia de sectores defectuosos hace que la matriz de discos tenga una mejor tolerancia a fallas y, al mismo tiempo, hace que todo el sistema tenga la mejor relación costo-beneficio. Otros, como el caché de una matriz de discos respaldada por batería, se pueden conectar externamente para evitar la pérdida de datos que no se han vuelto a escribir en el disco en caso de un corte de energía repentino o para verificar la coherencia de la escritura en RAID1; Es una técnica pequeña, pero no se puede ignorar.
Más información sobre RAID
2000-9-29 Yuan Kaining Computer Hard Drive
RAID fue desarrollado por el profesor D.A. Patterson de la Universidad de California, Berkeley. Propuesto en 1988. RAID es la abreviatura de matriz redundante de discos baratos, traducida literalmente como "matriz redundante de discos baratos", también conocida como "matriz de discos". Más tarde, la letra I en RAID se cambió a Independiente y RAID se convirtió en una "matriz de discos redundantes independientes". Sin embargo, esto fue solo un cambio de nombre y el contenido real no cambió. RAID puede entenderse como un método de utilizar unidades de disco para conectar lógicamente un grupo de unidades de disco y utilizarlas como una unidad de disco lógica. Normalmente, la capacidad de una unidad de disco lógica es menor que la suma de las capacidades de cada unidad de disco. La implementación específica de RAID puede depender del hardware o del software. El sistema operativo Windows NT proporciona la funcionalidad RAID de software. RAID generalmente se implementa en unidades de disco SCSI porque el rendimiento de las unidades de disco IDE está limitado por la interfaz IDE (IDE solo puede conectar dos unidades de disco, con una velocidad de transferencia máxima de 1,5 MBps). El canal IDE solo puede conectar hasta cuatro unidades de disco y solo una unidad de disco puede transmitir datos al mismo tiempo. Además, el canal IDE generalmente está conectado a una unidad óptica. El retraso causado por la unidad óptica afectará gravemente al sistema. velocidad. El adaptador SCSI garantiza que cada canal SCSI esté abierto en todo momento y que cada unidad de disco SCSI pueda transmitir datos libremente al host al mismo tiempo, por lo que no habrá unidades de disco IDE compitiendo por los canales del dispositivo.
Ventajas del RAID
1. Bajo coste, bajo consumo de energía y alta tasa de transferencia. En RAID, muchas unidades de disco pueden transmitir datos al mismo tiempo, y estas unidades de disco son lógicamente una unidad de disco, por lo que la velocidad de una sola unidad de disco que usa RAID puede ser varias veces, docenas o incluso cientos de veces. Este es también el problema que RAID originalmente quería resolver. En ese momento, la velocidad de las CPU mejoraba rápidamente, pero la velocidad de transferencia de datos de las unidades de disco no se podía mejorar significativamente, por lo que se necesitaba una solución para resolver la contradicción entre las dos. La redada finalmente tuvo éxito.
2. Puede proporcionar tolerancia a fallos. Esta es la segunda razón para usar RAID, porque las unidades de disco comunes no pueden proporcionar tolerancia a fallas sin incluir el código CRC (verificación de redundancia cíclica) escrito en el disco. RAID y tolerancia a fallos se basan en la tolerancia a fallos del hardware de cada unidad de disco, por lo que proporciona mayor seguridad.
3. En comparación con las unidades de disco tradicionales de gran diámetro, el coste de RAID es mucho menor con la misma capacidad.
Clasificación RAID
1. Nivel RAID0, matriz de discos no redundante y no verificada. Los datos se distribuyen en todas las unidades de disco simultáneamente, no hay tolerancia a fallas y las velocidades de lectura y escritura son las más rápidas en RAID. Sin embargo, dado que el daño a cualquier unidad de disco hará que falle todo el sistema RAID, el factor de seguridad es menor que el de una sola unidad de disco. Generalmente se utiliza en situaciones donde la seguridad de los datos no es alta pero la velocidad sí lo es.
2. Nivel RAID1, matriz de discos espejo. Cada unidad de disco tiene una unidad de disco espejo que mantiene el mismo contenido que la unidad de disco original en todo momento.
RAID1 es el más seguro, pero sólo la mitad del espacio en disco se utiliza para almacenar datos. Se utiliza principalmente en situaciones en las que la seguridad de los datos es muy alta y los datos dañados se pueden restaurar rápidamente.
3. RAID nivel 2, matriz de discos Hamming de corrección de errores. La primera, segunda, cuarta... Las unidades de disco 2n del grupo de unidades de disco son discos de verificación dedicados que se utilizan para verificar y corregir errores, como RAID2 de siete unidades de disco, la primera, segunda y cuarta unidades de disco son discos para corrección de errores. y el resto para almacenar datos. Cuantas más unidades de disco se utilicen, menor será el porcentaje de discos que se comprueban. RAID2 tiene un alto rendimiento de entrada y salida para grandes cantidades de datos, pero un rendimiento deficiente de entrada y salida para pequeñas cantidades de datos. RAID2 rara vez se utiliza en la práctica.
4. RAID3 y RAID4, matrices de discos con paridad par o impar. No importa cuántos discos de datos haya, los discos de paridad se utilizan para comprobar si hay errores mediante la paridad. Cualquier daño en una sola unidad de disco se puede recuperar. La velocidad de lectura de datos de RAID3 y RAID4 es muy rápida, pero al escribir datos, es necesario calcular el valor del bit de paridad para escribir en el disco de verificación, lo que reduce la velocidad. RAID3 y RAID4 no se utilizan mucho.
5. RAID nivel 5, una matriz de discos de paridad sin discos de paridad independientes. La paridad también se utiliza para comprobar si hay errores, pero no existe un disco de paridad independiente; la información de paridad se distribuye en cada unidad de disco. RAID5 tiene un buen rendimiento en lectura y escritura de datos grandes y pequeños, y se utiliza ampliamente.
En varias soluciones, desde RAID1 a RAID5, siempre que un disco está dañado, se puede extraer el disco dañado en cualquier momento e insertar un disco en buen estado (requiere soporte de intercambio en caliente de hardware), y los datos no Si se daña, el contenido del disco defectuoso se puede reconstruir rápidamente y el trabajo de reconstrucción también se completa mediante hardware RAID o software RAID. Sin embargo, RAID0 no proporciona verificación de errores, por lo que algunas personas dicen que no se puede contar como RAID. Esta es en realidad la razón por la cual RAID0 se llama RAID de nivel 0; 0 en sí mismo representa "no".
Aplicación de RAID
En la actualidad, el cuello de botella de velocidad de todo el sistema de PC es principalmente el disco duro. Aunque continuamente se introducen estándares rápidos como Ultra DMA33, DMA66 y DMA100, el efecto no es muy bueno. En PC, la desaceleración del disco no es demasiado grave. Pero en el servidor esto no está permitido. El servidor debe poder responder a solicitudes de servicio desde todas las direcciones. La mayoría de estas solicitudes de servicio están relacionadas con datos en el disco, por lo que el subsistema de disco del servidor debe tener una alta tasa de entrada y salida. Para la seguridad de los datos, debe existir un cierto grado de tolerancia a fallos. RAID proporciona estas funciones, por lo que se utiliza ampliamente en sistemas de servidores.
La función de tolerancia a fallos proporcionada por RAID se implementa automáticamente (a través de hardware RAID o software RAID). Es transparente para la aplicación, es decir, la aplicación no necesita realizar ningún trabajo para la tolerancia a fallos. Para obtener máxima seguridad y recuperación más rápida, utilice RAID1 (espejo); RAID5 se puede utilizar para compensar capacidad, tolerancia a fallos y rendimiento. En la mayoría de los servidores de bases de datos, la unidad de disco donde se encuentran el sistema operativo y el sistema de administración de la base de datos es RAID1, y los archivos de datos de la base de datos se almacenan en unidades de disco RAID5.
A veces miramos las hojas de configuración de algunos servidores conocidos y encontramos que su CPU no es muy rápida, la memoria no es muy grande y la tarjeta gráfica no es la mejor, pero el precio sí. Definitivamente caro. ¿Son todos los sistemas de servidores productos rentables? Por supuesto que no. La configuración del servidor es diferente a la de una PC doméstica general. Además de una mayor estabilidad, redundancia y tolerancia a fallas hay características como fuentes de alimentación duales, caché de disco con respaldo de batería, discos duros intercambiables en caliente, ranuras PCI intercambiables en caliente, etc. Otra característica es el enorme rendimiento del disco. Esto se debe principalmente al RAID. Por ejemplo, un Pentium 166 que usa SCSI RAID y un PⅲCopermine 800 con un disco duro IDE se utilizan como servidores de archivos. La capacidad de procesamiento de transacciones del Pentium 166 será docenas o incluso cientos de veces mayor que la del Pⅲ, porque el La potencia informática del procesador Pⅲ es completamente inútil. Es el RAID del Pentium 166 el que entra en juego.
RAID se utiliza principalmente en servidores ahora, pero como cualquier tecnología de alta gama, RAID se está trasladando a las PC. Quizás el día en que todos los PC utilicen unidades de disco SCSI RAID sea el verdadero "día del futuro" para los PC.