Número de archivo de resultados de salida de MR y reductor
MapReduce también tiene los formatos de salida correspondientes. De forma predeterminada, solo hay una Reducción y la salida es solo un archivo. El nombre de archivo predeterminado es part-r-00000 y la cantidad de archivos de salida es consistente con la cantidad de Reducciones. Si hay dos Reduce, el resultado de salida serán dos archivos, el primero es part-r-00000, el segundo es part-r-00001, y así sucesivamente
MapReduce es un modelo de programación para paralelo. operaciones en grandes conjuntos de datos (más de 1 TB).
Los conceptos "Mapa" y "Reducir" son sus ideas principales, ambas tomadas de lenguajes de programación funcionales y de características de lenguajes de programación vectoriales. Facilita enormemente a los programadores ejecutar sus propios programas en sistemas distribuidos sin conocer la programación paralela distribuida.
La implementación de software actual especifica una función de Mapa para asignar un conjunto de pares clave-valor a un nuevo conjunto de pares clave-valor y especifica una función Reducir concurrente para garantizar que cada uno de todos los pares clave-valor asignados comparte el mismo grupo clave.