¿Qué son los algoritmos de big data?
Big data es un concepto muy amplio y no existe un algoritmo de big data. Lo que probablemente quieras preguntar es sobre el algoritmo para la minería de big data:
1. . Naive Bayes
Súper fácil, como contar un poco. Si se cumple el supuesto de independencia condicional, NB convergerá más rápido que el modelo discriminante, por lo que solo necesitará una pequeña cantidad de datos de entrenamiento. Incluso si el supuesto de independencia condicional no se cumple, NB todavía se desempeña sorprendentemente bien en la práctica.
2. Regresión
LR tiene muchas formas de regularizar el modelo. En comparación con el supuesto de independencia condicional de NB, LR no necesita considerar si las muestras están relacionadas. A diferencia de los árboles de decisión y las máquinas de vectores de soporte, NB tiene una buena interpretación probabilística y es fácil actualizar el modelo con nuevos datos de entrenamiento (mediante el descenso de gradiente en línea).
3. Árbol de decisión
DT es fácil de entender y explicar. DT no es paramétrico, por lo que no necesita preocuparse por si los puntos salvajes y los datos son linealmente separables. Además, RF a menudo funciona mejor en muchos problemas de clasificación, es rápido y escalable y no necesita ajustar un gran número. de parámetros como SVM, por lo que RF es un algoritmo muy popular recientemente.
4. Máquina de vectores de soporte
Tiene una precisión de clasificación muy alta y tiene una buena garantía teórica de sobreajuste. Selecciona una función del núcleo adecuada y enfrenta el problema de la inseparabilidad lineal. de características. También es posible comportarse bien. SVM es muy popular en la clasificación de textos donde la dimensionalidad suele ser muy alta.
Si quieres aprender más sobre minería de datos, puedes conocer el curso CDA Data Analyst. Los analistas de Big Data ahora tienen certificaciones internacionales profesionales. "CDA Data Analyst" se refiere específicamente a aquellos que se especializan en la recopilación, limpieza, procesamiento y análisis de datos en Internet, finanzas, comercio minorista, consultoría, telecomunicaciones, medicina, turismo y otras industrias. Nuevos talentos de análisis de datos que producen informes comerciales y brindan toma de decisiones. Los titulares de certificados CDA globales se adhieren a los nuevos conceptos de análisis avanzado de datos comerciales, siguen las nuevas normas del "Código de conducta y ética profesional del analista de datos CDA", aprovechan al máximo sus capacidades profesionales en ciencia de datos, promueven la innovación y el progreso tecnológico, y contribuir al desarrollo económico sostenible. Haga clic para reservar una lección de prueba gratuita.