¿Por qué a los ingenieros de inteligencia artificial se les llama en broma "personas que pueden participar en la capacitación"?
Ponme a mí como ejemplo. Trabajo en la dirección CV (visión por computadora) y el ajuste de parámetros no representa una gran proporción en mi trabajo diario.
En CV, además de los hiperparámetros, los principales factores que afectan el efecto del modelo son la estructura de la red, los datos y la función de pérdida. Una vez determinados estos tres aspectos, no hay mucho tiempo para ajustar los parámetros.
¡Volvemos al tema!
Sintoniza, ¿qué sintonizar? En inteligencia artificial, los parámetros se pueden dividir a grandes rasgos en dos categorías:
¿Por qué se les llama "personas que ajustan parámetros"? Hay dos razones principales:
Cómo evitar convertirse en un "entrenador" La competencia por los talentos de la IA se está volviendo cada vez más feroz y la era del "entrenador" ha pasado lentamente. De hecho, estas cosas no requieren ningún ingeniero de inteligencia artificial, ¡los futuros ingenieros de I + D pueden encargarse de ellas! Hace unos años, si dominabas TensorFlow y dominabas los algoritmos básicos de IA, podías encontrar fácilmente un trabajo bien remunerado. Pero ahora es diferente. Los requisitos para los puestos de IA son cada vez mayores y la profundidad del conocimiento también es mayor.
Si quieres mantenerte al día, deberás armarte para evitar ser eliminado.
Los verdaderos ingenieros de inteligencia artificial, a menudo comienzan con datos y funciones, y también necesitan una rica experiencia en la industria. Asegúrese de recordar un proverbio de la industria: los datos y las características determinan el límite superior del algoritmo, y el algoritmo y los parámetros seleccionados solo determinan la velocidad para acercarse a este límite superior.
No hay que avergonzarse de ajustar parámetros. Buen hombre de ajuste de parámetros es muy bueno. Técnicamente, los ingenieros de algoritmos sólo se ocupan de datos y modelos. El modelo es una caja mágica negra derivada de datos y parámetros.
Hay dos tipos de parámetros en el modelo, uno se llama peso, que se puede aprender; el otro se llama hiperparámetro, y se requieren experimentos continuos para determinarlo. La llamada sintonización es la última de las sintonizaciones. Por supuesto, estos experimentos requieren habilidades de diseño profesionales y están fuera del alcance de este artículo. Los estudiantes interesados pueden buscar los libros de Ng Enda.
Mucha gente dice que los ingenieros de algoritmos son detectives y tienen poco contenido técnico. Todos son xgb, ¿por qué algunas personas pueden ganar el campeonato y otras solo pueden ser débiles? Tal vez dirías que la ingeniería de funciones está bien hecha. Pero en el campo de los gráficos y el texto, la base del modelo son los bloques de construcción, y los bloques de construcción también pueden considerarse como hiperparámetros, el número de capas del modelo y las dimensiones del modelo.
En una competencia de súper resolución, un equipo de Corea del Sur ganó el campeonato, eliminando la estandarización por lotes que todos daban por sentado, e inesperadamente ganó el campeonato.
La práctica es importante y no hay que avergonzarse de ajustar parámetros. Si entrenas bien, puedes ganar el campeonato. Incluso podría escribir un artículo sobre su experiencia con el ajuste de parámetros. En ese momento, Google tenía un artículo que probó violentamente varias funciones y publicó un artículo.
A veces primero se practica la teoría y luego se adivina o infiere. ¿Está bien? No importa los gatos negros y los gatos blancos. Un gato que puede cazar ratones es un buen gato. Orientado a objetivos.
No todos los ingenieros de sonido pueden trascender la música hermosa. Aunque sólo algunas notas. Si las habilidades de ajuste de parámetros se hacen bien, se pueden publicar artículos, se pueden mejorar los indicadores comerciales y se pueden generar ganancias.
Puede haber dos caminos: de la teoría a la práctica, o de la práctica a la teoría. Desafortunadamente, la mayoría de la gente no puede hacerlo.
Ser un gran detective no es fácil. La clave es pensar. Las personas que son buenas pensando y reflexionando, ya sea en teoría o en la práctica, progresarán más rápido y se convertirán en héroes más fácilmente que la repetición mecánica.
De hecho, el significado de "Diao Shenxia" es similar al de "codificadores" que escriben programas. Es una burla de las personas involucradas en esta industria. Por ejemplo, quienes escriben programas estarán expuestos al negocio de agregar, eliminar, modificar y verificar al principio. Después de hacer mucho, podrán decir leche cuajada. La inteligencia artificial tiene muchos otros nombres, como Baoxia, esclavo indicador.
La tecnología y el conocimiento de la inteligencia artificial son aún muy extensos, no sólo ajustando parámetros. También hay ingeniería de datos y características, conocimiento de algoritmos matemáticos, etc.
Veinte años de albañilería profesional
Esto...
Es la primera vez que veo este nombre, pero este problema existe en el campo de la inteligencia artificial.
Para dar un ejemplo sencillo, tomemos el método de inteligencia artificial actualmente popular: la red neuronal profunda.
Entonces, ¿qué es una red neuronal profunda? Hablemos primero de las redes neuronales. Como sugiere el nombre, la red neuronal es un algoritmo teórico utilizado por los científicos para lograr inteligencia artificial simulando el trabajo coordinado de las neuronas humanas.
Permítanme explicarles aquí que las llamadas neuronas son la parte portadora de las actividades del pensamiento humano. Algunas actividades del pensamiento en el cerebro requieren la participación de las neuronas.
Entonces, ¿qué es una red neuronal profunda? Para decirlo sin rodeos, es la superposición de varias capas de redes neuronales. No entraré en detalles sobre los principios más específicos aquí. Podemos dar un ejemplo más vívido para ilustrar el término simple de esta red neuronal profunda:
Ahora necesitamos resolver un problema, cuál es cómo. para identificar fotos. Los animales en son humanos o algunos otros animales. Ahora utilizamos un método de red neuronal profunda para identificar esta imagen.
¿Cuáles son entonces las características distintivas de una persona?
El más común tiene cabeza, tronco y cuatro extremidades. Pero aquí hay un problema. Al igual que los gatitos comunes en la vida diaria, los cachorros también tienen cabeza, tronco y extremidades. Por tanto, el problema de la capa 1 de nuestra red neuronal profunda es distinguir el contorno de esta persona del contorno de perros y gatos. Aquí introduciremos el concepto de similitud de contorno, que tiene un significado topológico simple. No entraré en detalles aquí. Si está interesado, puede buscar contenido relacionado sobre topología usted mismo. Cuando se utiliza la primera capa de esta red neuronal profunda para distinguir entre humanos y gatos y perros, surgirá un problema de parámetros de la red neuronal. Necesitamos ajustar este parámetro a un nivel apropiado para distinguir entre humanos y animales.
Por supuesto, con 1 capa, podemos tener una segunda capa o incluso más capas, como si la persona está usando ropa, el color de la piel de la persona, como el cabello que crece en la cabeza de la persona, y No crece por todo el cuerpo. En este momento, esta capa de red neuronal implicará un problema de ajuste de parámetros. Sólo ajustando los parámetros a los valores adecuados la máquina puede identificar correctamente si se debe usar ropa, si hay pelo en la cabeza, etc.
En resumen, a partir del proceso de reconocimiento profundo de la red neuronal, podemos ver que estas inteligencias artificiales son en realidad el proceso de ajustar algunos parámetros en el modelo existente, por lo que el ajuste de parámetros en la pregunta del cartel es realmente digno de su nombre.
Es demasiado difícil para unas pocas personas proponer nuevos modelos e ideas. Ambos son alquimistas y es difícil explicar por qué.
Las personas que trabajan en inteligencia artificial se ocupan básicamente de modelos de datos. Además de los datos, los modelos de datos también tienen parámetros de modelo que son ajustables. Lo que normalmente llamamos hiperparámetros es ajustarlos para que se ajusten a los datos. Por supuesto, ajustar los parámetros también requiere habilidades matemáticas y comprensión de algoritmos. Por lo tanto, es de mala educación decir simplemente que alguien está ajustando parámetros. Lo que otros pueden hacer, es posible que tú no puedas hacerlo.
Hay muy pocos modelos efectivos y los ingenieros restantes realmente solo necesitan ajustar parámetros y encontrar datos para entrenar. [Risas]
Las personas que solo usan modelos de otras personas son en realidad un malentendido y prejuicio del mundo exterior y de aquellos que son superficiales con respecto a la inteligencia artificial. Por supuesto, la inteligencia artificial no puede simplemente utilizar modelos de otras personas.
Porque una vez encapsulado el algoritmo lo único que queda es ajustar los parámetros. La limpieza de datos, la selección de funciones y la ingeniería de funciones no son tareas técnicas. Hay muchas personas capaces. Necesita conocer el algoritmo para ajustar los parámetros.