¿Cómo garantiza MapReduce la unicidad de las claves en el archivo de resultados?
1. Abra el clúster de Hadoop, abra la terminal del host maestro e ingrese el comando ifconfig para ver la dirección IP del host. .
2. Utilice el software SecureCRT para conectarse al host del clúster Hadoop.
3. Primero ingrese al directorio bin en el directorio hadoop. Debido a que el archivo de código se cargará en este directorio, primero debe abrir este directorio y luego ingresar el comando rz para prepararse para cargar el archivo de código.
4. Seleccione dos archivos de código que se hayan escrito, haga clic en Agregar y luego haga clic en Aceptar para comenzar a cargar los archivos.
5. Observe el progreso de la carga en el software. Una vez que la carga se haya realizado correctamente, aparecerá como se muestra en la imagen a continuación.
6. Los resultados de la ejecución son los siguientes.
Notas:
MapReduce se basa en las ideas de diseño del lenguaje de programación funcional Lisp para proporcionar un método de programación paralela simple y conveniente para lograr computación paralela básica a través de tareas de programación de funciones Map y Reduce. Y proporciona operaciones abstractas e interfaces de programación paralela para completar fácil y cómodamente la programación y el procesamiento informático de datos a gran escala.