Computación en la nube, big data, minería de datos, aprendizaje automático, reconocimiento de patrones. ¿Cuál es la relación entre estos conceptos?
Déjame explicarte estos términos:
Computación en la nube: es un concepto empresarial muy candente. De hecho, para decirlo sin rodeos, significa transferir tareas informáticas al servidor. Los usuarios sólo necesitan un monitor, pero los recursos informáticos del servidor se pueden subcontratar. Por supuesto, todavía existen algunos problemas cuando se trata de la comercialización a gran escala, especialmente cuestiones de protección de la privacidad.
Big data: Para decirlo sin rodeos, hay demasiados datos. Los datos de varios megabytes actuales también eran big data hace 20 años. Pero, ¿qué tiene de especial el big data actual? El problema hoy es que hay demasiados datos, lo que ha excedido el poder de procesamiento de las computadoras tradicionales (diferencias con las computadoras cuánticas), por lo que tenemos que usar algunos métodos de compromiso (como la minería de datos) para big data, lo que significa que todos los datos No es necesario. Todos requieren una gestión precisa. De hecho, los datos efectivos son muy limitados. Simplemente utilice métodos de minería de datos para extraer este conocimiento limitado. ·Además, el muestreo y la compresión de datos también son algunas estrategias para resolver problemas de big data.
Minería de datos: Extracción de conocimiento potencial de datos que pueda describir o predecir las características de los datos. Las tareas representativas de minería de datos incluyen análisis de reglas de asociación, clasificación de datos, agrupación de datos, etc. Puede aprender sobre esto en cualquier libro de texto de minería de datos. Permítanme hablar sobre la diferencia con Big Data: la minería de datos es solo un método de procesamiento de Big Data. Los big data mencionados por Jack Ma, o los big data mencionados en el campo empresarial actual, en realidad se refieren a la minería de datos, de hecho, los llamados big data reales, o los big data mencionados en la revista Science, o el desarrollo de big data. La estrategia propuesta por Obama tiene entendido que están mucho más allá del alcance de la minería de datos y, por supuesto, la minería de datos es un método muy importante. El verdadero propósito es cómo gestionar eficazmente big data.
Aprendizaje automático: este término es muy vago y se refiere a una gran clase de algoritmos informáticos. El punto clave es la palabra aprendizaje. Si desea que la computadora aprenda de manera efectiva, la mayoría de los métodos actuales utilizan un enfoque iterativo. Por lo tanto, en la comunidad de investigación científica, siempre que se adopte esta estrategia de iteración y aproximación continua, generalmente se puede clasificar en la categoría de aprendizaje automático. Además, el llamado aprendizaje debe saber qué aprender. Este es el llamado conjunto de entrenamiento. La computadora debe aprender una determinada regla general de los datos del conjunto de entrenamiento y luego usar algunos otros datos (es decir, el conjunto de prueba). vea si puede aprender bien, entonces puede usarse para aplicaciones prácticas. Por lo tanto, seleccionar un conjunto de formación adecuado también es una cuestión de conocimiento.
Reconocimiento de patrones: Significa el reconocimiento de patrones. Hay muchos tipos de patrones, pueden ser lenguaje, pueden ser imágenes, pueden ser módulos significativos de cosas, todos cuentan. En general, creo que el término reconocimiento de patrones es un poco vago, pero el reconocimiento de imágenes faciales específicas, el reconocimiento de voz, etc., son bastante reales. Quizás no lo entiendo bien.
Cuéntame también tus otras preguntas.
Los métodos de análisis tradicionales no incluyen la minería de datos. No sé mucho sobre análisis de datos, pero lo cierto es que el análisis tradicional tiene ciertas direcciones de análisis. Por ejemplo, si quiero saber la relación entre estos dos productos, puedo consultar la base de datos. Aunque la minería de datos tiene cierta historia, también está bastante de moda. Durante este período, el usuario no necesita especificar los objetos específicos del análisis de datos.
Si quieres afrontar la era del big data, el curso de minería de datos es indispensable. Además, es mejor comprender las bases de datos, especialmente las bases de datos paralelas y las bases de datos distribuidas. En cuanto al aprendizaje automático y el reconocimiento de patrones, generalmente tienen poco que ver con la minería de datos, excepto en algunos campos especiales.
En resumen, el concepto está bastante de moda, pero el big data aún está muy inmaduro, tanto en términos de investigación como de comercialización. Actualmente estoy investigando algoritmos en el contexto de big data. Para ser honesto, básicamente no existen algoritmos muy escalables en este momento, por lo que estoy bastante confundido acerca de la dirección futura del desarrollo de big data.
PD: Al aplicar la minería de datos a los negocios, lo más importante es cómo determinar el ángulo de la minería. Esto requiere una buena comprensión del campo de aplicación específico y una visión muy aguda.
En cuanto a los algoritmos específicos de minería de datos, ¡déjelos a nosotros, que nos especializamos en investigación! (También es importante comprender el algoritmo, lo que puede expandirlo al campo de su aplicación)