La Red de Conocimientos Pedagógicos - Currículum vitae - ¿Qué hace hadoop?

¿Qué hace hadoop?

Hadoop se utiliza para desarrollar programas distribuidos.

Hadoop es una infraestructura de sistema distribuido desarrollada por la Fundación Apache. Los usuarios pueden desarrollar programas distribuidos sin comprender los detalles subyacentes de la distribución. Aproveche al máximo el poder de los clústeres para computación y almacenamiento de alta velocidad. Hadoop implementa un sistema de archivos distribuido (Distributed File System), uno de sus componentes es HDFS (Hadoop Distributed File System).

HDFS es altamente tolerante a fallas y está diseñado para implementarse en hardware de bajo costo y proporciona un alto rendimiento para acceder a los datos de las aplicaciones, lo que lo hace adecuado para aquellas aplicaciones con grandes conjuntos de datos.

Ventajas de Hadoop

1. Alta confiabilidad. La capacidad de Hadoop para almacenar y procesar datos bit a bit es digna de confianza.

2. Alta escalabilidad. Hadoop distribuye datos y completa tareas informáticas entre los grupos de ordenadores disponibles, que pueden ampliarse fácilmente a miles de nodos.

3. Hadoop puede mover datos dinámicamente entre nodos y garantizar el equilibrio dinámico de cada nodo, por lo que la velocidad de procesamiento es muy rápida.

4. Alta tolerancia a fallos. Hadoop puede guardar automáticamente múltiples copias de datos y redistribuir automáticamente las tareas fallidas.

5. En comparación con computadoras todo en uno, almacenes de datos comerciales y mercados de datos como QlikView y Yonghong Z-Suite, hadoop es de código abierto, por lo que el costo del software del proyecto se reducirá considerablemente.

El contenido anterior se refiere a la Enciclopedia Baidu-Hadoop