¿Cuáles son las opciones profesionales para estudiar ciencia de datos en los Estados Unidos?
¿Cuáles son las opciones profesionales para estudiar ciencia de datos en Estados Unidos? Categoría 1: Análisis de datos puros.
1.? Analista de datos
Analista de datos
El analista de datos se centra en la minería de datos utilizando estadísticas, matemáticas y otros conocimientos. El principal trabajo diario es recopilar datos, limpiarlos y luego realizar algún análisis o procesamiento visual, lo que requiere ciertos lenguajes de programación, como R, Python, Javascript, C/C, SQL, etc. El trabajo de un analista principal es trabajar con científicos e ingenieros. Son los operadores de primera línea cuando el negocio requiere ciertos métodos. Cuando los científicos necesitan datos, deben recopilar datos limpios. Cuando los clientes o las filiales requieren datos, también deben recopilar datos limpios. Presentar informe de análisis final a ingeniería o gerencia del grupo de productos. Entonces, desde esta perspectiva, los analistas simplemente procesan datos.
2.? Científico de datos
Científico de datos
El científico de datos es un puesto de alto nivel muy complejo en el campo de los datos. A menudo requiere la capacidad de completar de forma independiente un conjunto de procesos de análisis de datos: extracción, integración y procesamiento. analizar datos en capas, realizar análisis estadísticos u otros análisis complejos, crear explicaciones y efectos visuales convincentes y desarrollar herramientas de datos con perspectivas de aplicación más amplias. El enfoque principal en el trabajo real probablemente esté en la implementación y optimización de algoritmos distribuidos, especialmente este último, lo cual es extremadamente desafiante y requiere científicos de datos de alto nivel para completarlo, por lo que requiere una formación muy sólida en matemáticas, estadística e informática para optimizar. La pregunta es muy experimentada.
3.? Arquitecto de datos
Arquitecto de datos
Todo el mundo dice que Cheng, que no quiere ser arquitecto de datos, no es una buena persona de front-end. Porque un excelente arquitecto de datos debe tener una comprensión completa y clara de los principales sistemas técnicos en su campo, una comprensión profunda de los principios y mecanismos operativos de una determinada tecnología, ser un experto en el campo y tener la capacidad de abstraer cosas objetivas. Preste atención a las fronteras tecnológicas y los puntos críticos actuales y resuelva los problemas de la manera más eficiente. Sus principales tareas diarias son crear sistemas de gestión de datos que integren, centralicen y mantengan fuentes de datos. En concreto se requieren conocimientos de SQL, XML, HIVE, PIG, SPARK, etc. , tiene un profundo conocimiento de la arquitectura de bases de datos y es bueno en soluciones de almacenamiento de datos.
4.? Ingeniero de datos
Ingeniero de datos
Como un nuevo tipo de carrera, los ingenieros de datos tienden a dominar habilidades de datos específicas a un nivel táctico, centrándose en hacer que los datos estén disponibles y procesarlos en un entorno de producción. como lenguajes de programación específicos, sistemas operativos y bases de datos. Los científicos de datos prefieren habilidades de datos "estratégicas", como análisis de datos, minería de datos, análisis estadístico, aprendizaje automático, etc. Su trabajo diario implica principalmente el uso de SQL para responder preguntas de análisis, el uso de scripts para integrar datos, la limpieza de tareas ETL (Extract-Transform-Load) y el uso de herramientas ecológicas Hadoop. Tienen altos requisitos para lenguajes de programación, como SQL, HIVE, PIG, R, MATLAB, SAS, SPSS, Python, Java, Ruby, C, Perl, etc.
5.? Administrador de Base de Datos
Administrador de Base de Datos
La relación entre el administrador de la base de datos y el análisis de datos no es muy grande, similar a un puesto de TI. Sus responsabilidades son gestionar los datos y respaldar las instalaciones de gestión de datos y garantizar que la base de datos esté disponible para todos los usuarios relevantes y se realice de forma correcta y segura. Por lo tanto, se pueden utilizar SQL, hadoop y lenguajes de consulta relacionados, como Hive y Pig. El enfoque diario está en optimizar el almacén de datos y es responsable de leer, escribir y administrar datos.
La segunda categoría: análisis empresarial basado en datos.
1.? Analista de Negocios
Analista de Negocios
Los analistas de negocios y los científicos de datos puros son expertos en trabajar con datos, pero el contenido de su trabajo es muy diferente. Por lo general, un analista de negocios debe tener un conocimiento profundo de un determinado campo profesional, tener una alta sensibilidad comercial y ser bueno extrayendo información de datos en un determinado campo para evaluar el desempeño comercial pasado, presente y posible futuro. Determinar los modelos y métodos analíticos más eficaces para ofrecer y explicar soluciones a los usuarios empresariales.
Este proceso generalmente implica primero comunicarse con los clientes para identificar sus problemas y necesidades, luego definir los problemas comerciales, recopilar datos sin procesar y utilizar análisis predictivos, prescriptivos y descriptivos para investigar, interpretar y visualizar estos datos, haciéndolos valioso y visible para los clientes. Durante este proceso, discutimos repetidamente los requisitos con los clientes, actualizamos el modelo y finalmente utilizamos el modelo de datos para comprenderlo e integrarlo para obtener la mejor solución.
2. Responsable de productos de datos
Responsable de productos de datos y análisis
Los analistas del equipo directivo y los científicos de datos no solo deben tener SQL, R, SAS, Python, Java. , Matlab y otros lenguajes básicos, minería de datos, modelado de datos y otras capacidades. También debe tener un conocimiento profundo del producto, dominar el uso de herramientas de visualización de datos y tener buenas habilidades de comunicación interpersonal. Sus principales responsabilidades incluyen, entre otras, crear canales de datos, realizar análisis, realizar escenarios experimentales, evaluar y ejecutar resultados de análisis y formular requisitos para la lógica de datos en función de los resultados, responder preguntas de otros departamentos, diseñar mejores productos y retener más. clientes y generar más ganancias.