La Red de Conocimientos Pedagógicos - Currículum vitae - La relación entre hadoop y mapreduce, gfs y otras tecnologías de Google.

La relación entre hadoop y mapreduce, gfs y otras tecnologías de Google.

En pocas palabras, Hadoop es un marco desarrollado en base a las ideas MapReduce y GFS de Google, y luego fue entregado a Apache como un proyecto de código abierto.

MapReduce nace en Google Labs. MapReduce, GFS y BigTable también se conocen como la Troika de Google, y Hadoop es la implementación de código abierto de la Troika de Google.

En 2003, Google publicó un artículo académico técnico "Google File System (GFS)". GFS es un sistema de archivos especial diseñado por Google para almacenar datos de búsqueda masivos.

En 2004, el fundador de Nutch, Doug Cutting, implementó un sistema de almacenamiento de archivos distribuido llamado NDFS basado en el documento GFS de Google.

En 2004, Google publicó otro artículo académico técnico, MapReduce. MapReduce es un modelo de programación para el análisis paralelo de conjuntos de datos a gran escala (1TB+).

En 2005, Doug Cutting implementó esta función en el buscador Nutch basado en MapReduce.

En 2006, Yahoo contrató a Doug Cutting, quien nombró la actualización de NDFS y MapReduce Hadoop. Yahoo estableció un equipo independiente para investigar y desarrollar Hadoop.