La Red de Conocimientos Pedagógicos - Conocimientos primarios - ¿Cómo aprender big data?

¿Cómo aprender big data?

1. ¿Cuáles son los requisitos para un analista de datos?

1. Requisitos teóricos y sensibilidad a los números, incluidos conocimientos estadísticos, estudios de mercado, principios de modelos, etc.

2. Uso de herramientas, incluidas herramientas de minería, bases de datos, software ofimático de uso común (excel, PPT, word, mapas cerebrales), etc.

3. Capacidad de comprensión de los negocios y sensibilidad hacia los negocios. Tener un conocimiento profundo de los negocios y los productos, ya que el punto de partida del análisis de datos es resolver problemas comerciales. Sólo comprendiendo los problemas comerciales se pueden transformar en problemas de análisis de datos y cumplir con los requisitos del departamento.

4. Capacidad de expresar informes y gráficos. Este es un modelo analítico clave. Si no se puede presentar bien a los líderes y clientes, su eficacia se reducirá considerablemente y también afectará el avance profesional de los analistas de datos.

En segundo lugar, desarrolle el análisis de datos como una capacidad.

En términos generales, la mayoría de los trabajos ahora requieren capacidades analíticas, especialmente hoy en día, cuando el concepto de operaciones de datos es profundo. Empresas como BAT enfatizan la participación de todos los empleados en las operaciones de datos. Por lo tanto, considérelo como una especie de entrenamiento de habilidades que lo beneficiará durante toda su vida.

3. Observe las habilidades y conocimientos que requieren los analistas de datos a partir de los cuatro pasos del análisis de datos:

Los cuatro pasos del análisis de datos (diferentes del proceso de minería de datos: comprensión del negocio) , comprensión de datos, preparación de datos, establecimiento de modelos, evaluación de modelos, implementación de modelos) muestra el proceso de análisis de datos desde una perspectiva más macro: obtener datos, procesar datos, analizar datos y presentar datos.

(1) Obtención de datos

El requisito previo para obtener datos es la comprensión de los problemas comerciales. Para convertir los problemas comerciales en problemas de datos, debemos descubrir la esencia a través de los fenómenos, determinar la amplitud del análisis del problema y recopilar datos después de aclarar el problema. Este vínculo requiere que los analistas de datos tengan un pensamiento estructurado y una comprensión de los problemas comerciales.

Libros recomendados: "El principio de la Torre Dorada", "Trilogía McKinsey: Conciencia McKinsey", "Herramientas McKinsey", "Método McKinsey".

Herramientas: mapas mentales, software de gestión del pensamiento

(2) Procesamiento de datos

Un proyecto de análisis de datos suele tomar más del 70% del tiempo de procesamiento de datos. Entonces, el uso de herramientas avanzadas ayudará a mejorar la eficiencia, así que intente aprender las herramientas de procesamiento más recientes y efectivas. Las siguientes son las herramientas más tradicionales pero efectivas:

Excel: se utiliza a menudo en notificaciones diarias, informes y análisis de muestras. Su función de gráficos es muy poderosa y puede manejar fácilmente 654,38 millones de datos de nivel.

UltraEdit: La herramienta Texto es más fácil de usar que la herramienta TXT y es más rápida de abrir y ejecutar.

ACCESO: base de datos de escritorio, utilizada principalmente para análisis de muestreo diario (el análisis estadístico a gran escala consume muchos recursos y tiempo, generalmente los analistas seleccionarán aleatoriamente algunos datos para el análisis). Usando lenguaje SQL, todavía es muy rápido procesar 6,5438 millones de datos.

Servidor Orcle y SQL: Estos dos tipos de bases de datos son necesarios para manejar decenas de millones de datos.

Por supuesto, si su capacidad y su tiempo lo permiten, aprender sobre la base de datos distribuida recientemente popular y mejorar sus habilidades de programación también será de gran ayuda para su futuro desarrollo profesional.

Principales recomendaciones para software de análisis:

Serie SPSS: software de análisis estadístico antiguo, SPSS Statistics (algunas funciones estadísticas, investigación de mercado), SPSS Modeler (algunos de minería de datos), sin programación Muy fácil de aprender.

SAS: El viejo software de minería clásico requiere programación.

r: El software de código abierto, este nuevo y popular software, procesa datos no estructurados de manera más eficiente y requiere programación.

Con el mayor desarrollo de la tecnología de minería de textos, la demanda de análisis de datos no estructurados está aumentando y el uso de herramientas de minería de textos también debería recibir mayor atención.

(3) Análisis de datos

Para analizar datos, necesitamos utilizar varios modelos, incluidas reglas de asociación, agrupamiento, clasificación, modelos de predicción, etc.

Uno de los puntos más importantes es la comparación. Todos los datos deben compararse dentro de un marco de referencia para que las conclusiones sean significativas.

Libros recomendados:

1. "Minería de datos y operaciones digitales, ideas, métodos, técnicas y aplicaciones", Lu Hui, Mechanical Press. Este libro es el mejor escrito en China en los últimos años. Debe leerse como la Biblia.

2. "Quién dice que los novatos no pueden analizar datos (Introducción)" y "Quién dice que los novatos no pueden analizar datos (Herramientas)", editados por Zhang Wenlin y otros. Es un libro introductorio, apto para principiantes.

3. Estadísticas, quinta edición, editado por Jia Jun, Renmin University of China Press. Un mejor libro de estadísticas.

4. La versión completa de "Introducción a la minería de datos", [EE.UU.] Pang-Tan Ning et al., traducida por Fan Ming, People's Posts and Telecommunications Press.

5. "Conceptos y tecnologías de minería de datos", traducido por Han Jiawei et al., y Fan Ming et al. , Prensa de la Industria de Maquinaria. Este libro es relativamente difícil.

6. "Métodos de análisis cuantitativo y aplicaciones en investigación de mercados", editado por Jian Ming, Renmin University of China Press.

7. "La práctica del análisis estadístico de cuestionarios: funcionamiento y aplicación de SPSS", Wu·, Chongqing University Press. Un libro muy conocido en el campo de la investigación de mercados que explica en detalle el análisis de los datos de los cuestionarios.

(4) Presentación de datos

Esta parte requiere una presentación y un informe efectivos de los resultados de los datos. Requiere el uso de principios de la pirámide dorada, gráficos, PPT y Word para desarrollar un buen discurso. habilidades. .