¿Cuál es el camino hacia la definición autorizada de aprendizaje automático?
En este artículo, quiero abordar una pregunta muy simple: ¿Qué es el aprendizaje automático?
Quizás te interese o sepas un poco sobre el aprendizaje automático. Si un día hablas sobre aprendizaje automático con tus amigos o colegas, es posible que alguien te pregunte "¿Qué es el aprendizaje automático?". Bueno, el objetivo de este artículo es brindarle algunas definiciones de referencia, así como una definición lista para usar, interesante y fácil de recordar. Comenzaremos mirando la definición estándar de aprendizaje automático del libro líder en el campo y terminaremos con la definición de aprendizaje automático de un programador y un chiste ya hecho cuando se les pregunta qué es el aprendizaje automático. La definición autorizada comienza con la lectura de los libros de referencia sobre aprendizaje automático que se utilizan habitualmente en cuatro cursos universitarios. Estas son nuestras definiciones autorizadas y proporcionan una base para pensar más profundamente sobre este tema. He elegido estos cuatro libros para resaltar algunas de las perspectivas diversas y útiles en esta área. La experiencia nos dice que este campo sí incluye muchos métodos, por lo que elegir el ángulo adecuado es la clave para avanzar. Aprendizaje automático definido por Mitchell Tom Mitchell dio una definición en el prefacio de su libro "Aprendizaje automático" (versión china: Computer Science Series: Machine Learning): "Aprendizaje automático" La disciplina se ocupa de cómo los programas de computadora mejoran automáticamente su rendimiento con la experiencia. .” Me gusta esta definición simple y clara, que es la base de la definición de programador que obtenemos al final de la publicación. Nótese la referencia a un programa de computadora y la mención de la palabra "mejora automática". ¡Escribir programas para mejorarte a ti mismo es un desafío! Mencionó repetidamente un breve sistema formal en su introducción: "Para un cierto tipo de tarea T y una medida de desempeño P, si el desempeño de un programa de computadora medido por P sobre T mejora con la experiencia E, entonces decimos que este programa de computadora aprender de la experiencia E" No dejes que la definición del término te asuste, es un sistema formal muy útil. Usamos este sistema formal como modelo para enumerar la experiencia E, la tarea T y el indicador de desempeño P en la parte superior de una tabla con complejidades menos vagas. Puede utilizarse como herramienta de diseño para ayudarnos a pensar claramente sobre qué datos recopilar (E), qué decisiones tomar (T) y cómo evaluar los resultados (P). Por eso la tenemos como definición estándar. Por favor recuérdalo. Los elementos del aprendizaje estadístico: minería de datos, impacto y predicción están escritos por tres estadísticos de Stanford y se describen a sí mismos como un marco estadístico para organizaciones que exploran su campo. En el prefacio escribe: “Muchos campos generan grandes cantidades de datos, y el trabajo del estadístico es darles sentido a todos estos datos: extraer patrones y tendencias importantes, entender ‘lo que dicen los datos’. A esto lo llamamos aprendizaje. de los datos: “El trabajo de un estadístico, según tengo entendido, es utilizar herramientas estadísticas para interpretar datos en un entorno contextual. El autor parece querer incluir todas las áreas del aprendizaje automático como herramientas auxiliares. Curiosamente, optaron por incluir “minería de datos” en el título del libro. Los estadísticos aprenden de los datos, pero el software también puede hacerlo, y nosotros aprendemos de lo que aprende el software, de las decisiones tomadas y de los resultados obtenidos mediante diversos métodos de aprendizaje automático. Bishop escribe en el prefacio de "Reconocimiento de patrones y aprendizaje automático": "El reconocimiento de patrones tiene su origen en la ingeniería y el aprendizaje automático tiene su origen en la informática. Sin embargo, estos campos pueden considerarse como dos aspectos del mismo campo". Al leerlos, se tiene la impresión de que Bishop llegó al campo desde una perspectiva de ingeniería y luego adoptó el mismo enfoque para estudiar y utilizar la informática. Este es el enfoque probado que debemos seguir. En términos más generales, no importa en qué campo diga estar un método, si nos permite obtener conocimientos o resultados más detallados que satisfagan mejor nuestras necesidades a través del aprendizaje de los datos, entonces lo llamamos aprendizaje automático. Perspectiva del algoritmo Marshland adoptó la definición de aprendizaje automático de Mitchell en "Aprendizaje automático: una perspectiva del algoritmo". En el prefacio, proporciona una poderosa explicación que lo impulsó a escribir el libro: "Una de las características más interesantes del aprendizaje automático es que se encuentra entre varias disciplinas teóricas diferentes, principalmente informática, estadística, matemáticas e ingeniería. Aprendizaje automático a menudo se estudia como parte de la inteligencia artificial, lo que la ubica firmemente dentro de la informática, y comprender por qué estos algoritmos funcionan de manera efectiva requiere un cierto grado de conocimiento estadístico y matemático que a menudo falta entre los estudiantes universitarios que se especializan en informática.
"Esto fue profundo e informativo. En primer lugar, destacó la naturaleza multidisciplinaria de este campo. Si bien la definición anterior nos dio esa sensación, para nosotros el aprendizaje automático proviene de una variedad de ciencias de la información. Los peligros de insistir demasiado en una perspectiva determinada, en casos particulares en los que los ingenieros algorítmicos evitan el funcionamiento matemático interno de un método, y donde los estadísticos sin duda están igualmente limitados por lo contrario, evitan los problemas prácticos de implementación y despliegue. Drew Conway creó un bonito diagrama de Venn que me resultó muy útil. En su explicación, comentó que el aprendizaje automático trata sobre piratería, matemáticas y estadísticas. La suma de los diagramas de Venn de la ciencia de datos es la atribución no comercial de. También describe la zona de peligro como la suma de las habilidades y la experiencia de los hackers. Con esto se refiere a aquellos que saben lo suficiente, pero no pueden acceder a ellos y construirlos. No entiendo lo que significan los resultados. Supongo que eso es lo que Maslander podría estar insinuando.
Ahora hablemos de lo que los programadores deben hacer para desglosar todos estos problemas en detalles concretos. a los problemas complejos que se resisten a descomponernos y programar para resolverlos. Esto es lo que impulsa la fuerza del aprendizaje automático. Luego, necesitamos encontrar una definición amigable para los programadores, una que podamos usar siempre que otros programadores nos hagan preguntas complejas. , terminará con muchos tipos de problemas que se resisten obstinadamente a las soluciones lógicas y procedimentales. Lo que quiero decir es que para muchos tipos de problemas, no es factible ni viable sentarse y escribir todos los enunciados condicionales necesarios para resolver el problema. Rentable. Escucho a su cerebro de programador gritar "blasfemia". Tome como ejemplo el problema de identificar el spam todos los días. ¿Cómo escribiría un programa para filtrar el spam y decidir si lo tiraría a la papelera o a la bandeja de entrada? comience a recopilar algunos ejemplos y profundice en ellos. Buscará patrones específicos de spam y no spam; también considerará abstraer esos patrones para que su aprendizaje heurístico pueda aplicarse a nuevos casos en el futuro. Ignore los correos electrónicos extraños que nunca se verán y podrá mejorar fácilmente la precisión y los límites de destino. Se desarrollan programas especiales para la situación. Revisa el correo repetidamente y abstrae nuevos patrones para mejorar las decisiones que toma. esto lo hace un programador en lugar de una computadora. Un sistema codificado tendría la misma capacidad que un programador para extraer reglas de los datos e implementarlas, pero consumiría demasiados recursos y sería una pesadilla constante para el aprendizaje automático. hacer. ejemplos, estoy seguro de que la parte de su cerebro programador que está decidido a automatizar puede ver oportunidades para automatizar y optimizar el proceso de extracción de patrones de ejemplos. El método de aprendizaje automático es un proceso tan automatizado. En el ejemplo de spam/no spam, la experiencia E son los correos electrónicos que recopilamos y la tarea T es un problema de decisión (también llamado clasificación) que requiere etiquetar cada correo electrónico como spam o no y colocarlo en la carpeta correcta. Nuestra métrica de rendimiento será un porcentaje del 0% al 100%, similar a la precisión (número de decisiones correctas dividido por el número total de decisiones multiplicado por 100). El proceso de preparación de dicho programa de toma de decisiones a menudo se denomina capacitación, y los ejemplos recopilados se denominan conjunto de capacitación. El programa es un modelo, un modelo del problema de separar el spam del spam. Como programadores, nos encanta este término. Los modelos tienen un estado específico y requieren mantenimiento. La capacitación es un proceso que se realiza una vez y se puede volver a ejecutar según sea necesario. La clasificación es una tarea que hay que hacer. Todos estos son significativos para nosotros. Podemos ver que la terminología utilizada en la definición anterior no es muy adecuada para programadores. Técnicamente hablando, los programas que escribimos funcionan automáticamente, por lo que no tiene sentido decir que el aprendizaje automático es aprendizaje automático. Un chiste ya hecho Bueno, veamos si podemos usar estos fragmentos para construir la definición de aprendizaje automático de un programador. El aprendizaje automático es un proceso de formación basado en modelos de datos, que en última instancia conduce a una decisión orientada a indicadores de rendimiento.
“Entrenar un modelo” representa instancias de entrenamiento, “modelo” representa un estado adquirido a través del aprendizaje empírico e “inducir una decisión” representa la capacidad de tomar decisiones basadas en información, y las decisiones futuras requieren una información esperada invisible. Finalmente, las "métricas orientadas al desempeño" se refieren a los requisitos objetivo y las características de orientación del modelo preparado. No soy un poeta. ¿Puedes darles a los programadores de aprendizaje automático una definición más precisa y concisa? Por favor deja tus comentarios.