La Red de Conocimientos Pedagógicos - Conocimientos sobre estudiar en el extranjero - Aprender a analizar datos desde cero, ¿hasta qué punto puedo encontrar trabajo y cómo planificar mi plan de estudios?

Aprender a analizar datos desde cero, ¿hasta qué punto puedo encontrar trabajo y cómo planificar mi plan de estudios?

1. La primera etapa (el puesto general se llama especialista en datos)

Conocimientos básicos de Excel (VBA es mejor; puede hacer una tabla dinámica; hábil en filtrado, clasificación y fórmulas) y hacer bien PPT. . Los especialistas en datos de muchas empresas tradicionales ya pueden hacer esto.

2. La segunda etapa (especialista de datos ~analista de datos)

En esta etapa, debe comprender SQL y los negocios, además de aquellas cosas de la primera etapa. La mayoría de las empresas tradicionales y las pequeñas operaciones de Internet y equipos de productos serán suficientes.

3. La tercera etapa (analista de datos)

Es imprescindible tener dominio de la estadística (regresión, prueba de hipótesis, series de tiempo, Monte Carlo simple), visualización, PPT y Excel. Estas tecnologías son suficientes para manejar la mayoría de los negocios corporativos tradicionales y negocios de Internet.

4. La cuarta etapa (dividida)

Analistas de datos (científicos de datos), BI, etc. : Esta parte es generalmente estadística intensiva, familiarizada con el negocio y se puede utilizar en aprendizaje automático (ajuste de parámetros, selección de modelo, optimización). La recuperación de datos, ETL y visualización son posturas básicas.

Ingeniero de visualización: esta parte es relativamente rara en China, pero de hecho se centra en la interfaz. Puede aprender Gaotu, d3.js y echarts.js. La ruta de desarrollo técnico puede ser independiente. No en estas cuatro etapas, sino en la parte delantera. Quizás sea mejor cambiar de carrera.

Ingeniero ETL: Como su nombre indica, ingeniero ETL.

Ingeniero de big data: Familiarizado con la tecnología de big data, Hadoop de segunda generación.

Ingeniero de datos (en parte se superpone con el ingeniero de minería de datos): nivel de competencia en aprendizaje automático (a menudo varios, no se preocupe, no todos, a diferencia del enfoque de los analistas de datos, también es necesario comprender teorías y modelos combinados). ), combinar modelos para formar productos de datos; conocimientos informáticos básicos (incluidos conocimientos de Linux e ingeniería de software) (sistemas de gestión de bases de datos relacionales, NoSQL (categoría 4))

Minería de datos: básicamente lo mismo que el anterior; .

Ingeniero rastreador: como sugiere el nombre, es mejor estar familiarizado con el protocolo http y el protocolo tcp/ip. La ruta del desarrollo tecnológico puede ser independiente y no estar en estas cuatro etapas.

Descubrí que la respuesta es un poco descabellada, pero es más o menos el camino básico para que todos los trabajadores de datos se desarrollen desde el nivel inferior. La ruta de aprendizaje básica del desarrollo de datos se puede resumir de la siguiente manera:

1. EXCEL, PPT (debe ser competente)

La actitud básica de los trabajadores de datos es que no soy muy técnico. , pero al menos sé cómo hacerlo Operación muéstrese con valentía, comuníquese con los departamentos comerciales y presente los resultados del análisis. Técnicamente hablando, VBA y pivoting son los más importantes.

2. Clase de base de datos (obligatoria)

Siempre que comprenda RDBMS desde el principio, debe saber qué empresa lo utiliza. No te unes a la empresa para aprender MySQL.

NoSQL se podrá estudiar mediante estadísticas u otros métodos en el futuro. MongoDB y Redis de sangre NoSQL básica (caché, Neo4j es una base de datos en sentido estricto), y luego (seleccione) puede conocer varios NoSQL, base de datos basada en gráficos Neo4j, base de datos basada en columnas BigTable, base de datos basada en valores clave redis / cassendra, una base de datos MongoDB basada en colecciones.

3. Datos estadísticos (obligatorio)

Si desea aprender estadística, los conceptos importantes incluyen estadística descriptiva, prueba de hipótesis, Bayes, método de máxima verosimilitud y regresión (especialmente regresión lineal generalizada). , análisis de componentes principales. Estos se utilizan con más frecuencia. También hay series temporales, bootstrap, no paramétricas, etc. Depende de tus propios deseos.

Otros conocimientos matemáticos: el álgebra lineal se usa más comúnmente (es la base detrás de muchas cosas), el cálculo se usa menos, los sistemas dinámicos y el análisis de Fourier dependen de la industria en la que quieras ingresar.

4. Aprendizaje automático (requiere que los analistas de datos seleccionen, usen y ajusten)

Existen varios clasificadores lineales, agrupación, regresión, bosque aleatorio y Bayes de uso común. sobre aquellos que no se usan comúnmente, el aprendizaje profundo depende de la situación.

5. Big data (elija un curso, puede usarlo si la empresa lo requiere, no requiere entorno)

Conceptos básicos de Hadoop, incluidos hdfs, map-reduce, hive, etc. .; más tarde Contacto chispas y tormentas.

6. Categoría de texto (opcional, si lo requiere la empresa)

No estoy familiarizado con esta parte. Básicamente necesito conocer el impacto, la segmentación de palabras y el análisis de sentimientos.

7. Categoría de herramienta

Idioma: R, Python y otras categorías que no son de big data son las más populares (en comparación con geek, julia también es útil, no está mal para dinero y SAS). , Matlab requerido por algunas empresas) Los datos también pueden usar Scala y Java