El vicepresidente de MSRA, Zhou Ming, piensa ¿cómo puede la PNL de China llegar a la vanguardia mundial?
Para tener una comprensión más profunda del estado de desarrollo y las perspectivas de la PNL en China, los esfuerzos de CCF en la dirección de la PNL y el desarrollo de la conferencia NLPCC, Lei Feng.com. com entrevistó a Zhou Ming, director del Comité Chino de Tecnología de la Información de CCF y vicepresidente de Microsoft Research Asia (quien también es director ejecutivo de la Sociedad de Información China de China (CIPS) y presidente electo de la Asociación Internacional de Lingüística Computacional ACL ), el profesor Zhao Dongyan de la Universidad de Pekín y el secretario general del Comité Chino de Tecnología de la Información del CCF (Lei Feng com informará más adelante).
El contenido principal de este artículo es la introducción en profundidad del Dr. Zhou Ming al progreso de la investigación del procesamiento del lenguaje natural y el estado de desarrollo y las perspectivas del procesamiento del lenguaje natural en China desde la perspectiva de CCF Chinese Information. Comité de Tecnología. Sus palabras de apertura son las siguientes:
Actualmente, los gobiernos de varios países (incluidos Estados Unidos, Alemania, Japón, China, etc.) están haciendo algunos planes para la inteligencia artificial, pero el plan de China para la inteligencia artificial es el más claro. Combinando el "Plan de desarrollo de la inteligencia artificial de China" del Consejo de Estado (julio de 2017) y el Informe del 19º Congreso Nacional del Secretario General (julio de 2017), podemos ver que nuestro país ha planificado dos etapas de desarrollo de la inteligencia artificial. para ingresar al nivel avanzado del mundo en 2020, y la segunda etapa es en 2030.
Nuestro procesamiento nacional del lenguaje natural está básicamente sincronizado con el plan del país para la inteligencia artificial. En otras palabras, alcanzaremos el nivel avanzado del mundo en 2020 y se espera que alcancemos el nivel más alto del mundo en 2030.
¿Cuál es la diferencia entre gama alta y nivel superior? El nivel avanzado significa que sigues a los países más desarrollados del mundo y dominas todas las tecnologías clave, pero no eres el iniciador de las tecnologías clave, es decir, no eres el líder en el nivel superior, en realidad eres el líder; le dices al mundo qué dirección tomar. Adelante, propones un modelo teórico clave y otros siguen tu ejemplo. Esa es la diferencia.
En el campo de la PNL, China es ahora un muy buen seguidor. Una vez que aparezca cualquier tecnología en el mundo (principalmente en Estados Unidos), inmediatamente aprenderemos a dominarla y aplicarla rápidamente, no peor que Estados Unidos. La diferencia ahora es que no somos los primeros en proponer esta tecnología y método. Por lo tanto, nuestro Comité Chino de Tecnología de la Información del CCF cree que ahora nos encontramos básicamente en el nivel avanzado del mundo y que alcanzaremos el nivel avanzado del mundo tres años después, es decir, en 2020. Sobre esta base, esperamos alcanzar el nivel más alto del mundo para 2030. Esta es nuestra visión.
La siguiente es la explicación detallada del Dr. Zhou Ming. Lei Feng. Sin cambiar la intención original, com ha simplificado y editado el contenido de la entrevista para servir la cena a los lectores.
En primer lugar, el procesamiento del lenguaje natural es el núcleo de la inteligencia cognitiva
Lei Feng. com: ¿Cuál es el estado de la PNL en todo el campo de la IA?
Zhou Ming: En los últimos años, la inteligencia artificial ha entrado en un período de rápido desarrollo debido a los cuatro elementos principales de la gran informática, los grandes datos, los modelos de algoritmos (representados por el aprendizaje profundo) y los escenarios de implementación. Su principal dirección de desarrollo: inteligencia perceptiva e inteligencia cognitiva.
La llamada inteligencia perceptiva se refiere a capacidades perceptivas como la visión (imagen) y la audición (sonido). Todo el mundo sabe que la inteligencia perceptiva avanza a pasos agigantados. Por ejemplo, la evaluación ImageNet para el reconocimiento de imágenes y la evaluación Switchboard para el reconocimiento de voz han alcanzado o incluso superado los niveles humanos en este conjunto de pruebas. Los avances de la investigación en este campo también han promovido el desarrollo de muchas aplicaciones, como la seguridad, el reconocimiento facial, la detección de objetos y la aplicación del reconocimiento de voz en teléfonos móviles, hogares inteligentes y otros dispositivos.
La inteligencia cognitiva, en términos generales, es “la capacidad de comprender y pensar”. La inteligencia cognitiva tiene muchas cosas, cuyo núcleo incluye inteligencia del lenguaje, gráficos de conocimiento, retratos de usuarios, etc. Sobre esta base, admite varias aplicaciones, como escritura inteligente, chat, creación de poesía, generación de texto y juegos.
Algunos funcionan bien, como el sistema de juego representado por AlphaGo, pero otros no son satisfactorios. En la actualidad, la inteligencia cognitiva se ha quedado atrás de la inteligencia perceptiva en la introducción del aprendizaje profundo, pero aún se está poniendo al día. Por ejemplo, la calidad de la traducción automática neuronal es cada vez mejor, y los sistemas de chat y el diálogo entre humanos y máquinas son cada vez mejores.
La comprensión del lenguaje natural es el núcleo de la inteligencia cognitiva. Su progreso conducirá al avance de los gráficos de conocimiento, la mejora de las capacidades de comprensión de los usuarios y una mayor mejora de las capacidades generales de razonamiento. Sobre esta base también se mejorarán el chat, la resolución de problemas, la traducción y el diálogo. Una vez que avance la inteligencia cognitiva, junto con los avances en la inteligencia perceptiva, la inteligencia artificial en general se desarrollará aún más.
Bill Gates dijo una vez que "la comprensión del lenguaje es la joya de la corona de la inteligencia artificial", y el Dr. Shen Xiangyang también dijo que "aquellos que entiendan el lenguaje conquistarán el mundo", todos los cuales enfatizan la importancia de la PNL. . La tecnología de procesamiento del lenguaje natural promoverá el progreso general de la inteligencia artificial y permitirá que la tecnología de inteligencia artificial se ponga en aplicaciones prácticas.
2. El desarrollo de la PNL en los próximos cinco a diez años
Leifeng.com: ¿Cómo se desarrollará la PNL en los próximos cinco a diez años?
Zhou Ming: Generalmente hay varias direcciones: 1) Los avances en la respuesta a preguntas y la comprensión lectora harán que los motores de búsqueda sean más precisos; 2) el reconocimiento de voz y la traducción automática neuronal harán que la traducción automática hablada sea completamente práctica; Debido a La precisión y la mejora en tiempo real de los retratos de los usuarios hacen que los servicios de información y los anuncios sean más naturales, amigables y personalizados 4) Mejorar las habilidades de chat, preguntas y respuestas y diálogo para promover el uso práctico del diálogo en lenguaje natural; tecnología de diálogo y gráficos de conocimiento Con el progreso del servicio al cliente inteligente y el servicio al cliente artificial, la eficiencia del servicio al cliente ha mejorado enormemente 6) Debido al avance de la tecnología de generación de lenguaje natural, escritura automática de poemas, composiciones, generación automática de noticias. e incluso las novelas se volverán populares; 7) Diálogo persona-computadora El progreso ha promovido la popularización de los asistentes de voz, Internet de las cosas, hardware inteligente y hogares inteligentes; 8) Finalmente, la PNL, es decir, la PNL se usa ampliamente en campos verticales; como finanzas, derecho, educación y atención médica.
Tomemos como ejemplo la inteligencia de los motores de búsqueda. En los motores de búsqueda anteriores, ingresar palabras clave arrojaba un montón de cosas que tenías que mirar tú mismo. Con la mejora de las preguntas y respuestas automáticas, la comprensión lectora y otras capacidades, los motores de búsqueda actuales pueden formular una pregunta sin tener miedo a las oraciones. Puede analizar el problema y encontrar la respuesta a partir de una gran cantidad de documentación. Incluso si no solo le brinda un enlace a un documento, también puede brindarle la respuesta directamente, y los resultados de los motores de búsqueda son cada vez más precisos.
Lei Feng. com: ¿En qué direcciones debería centrarse la investigación de la PNL en el futuro?
Zhou Ming: Personalmente me preocupan los siguientes puntos: 1) Servicios personalizados a través de retratos de usuarios; 2) Información sobre el mecanismo de la inteligencia artificial a través del aprendizaje interpretable 3) Mejora mediante la combinación de conocimiento y aprendizaje profundo; Eficiencia del aprendizaje; 4) Adaptación del dominio a través del aprendizaje por transferencia; 5) Evolución continua a través del aprendizaje por refuerzo; 6) Utilización completa de datos no etiquetados a través del aprendizaje no supervisado;
En tercer lugar, la investigación de PNL de China ocupa el segundo lugar en el mundo
Lei Feng. com: ¿Cuál es el estado actual de desarrollo de China en el campo de la PNL?
Zhou Ming: El desarrollo de la PNL en China tiene dos aspectos, uno es el nivel de investigación científica y el otro es la industrialización. En términos de industrialización de la PNL, a China le ha ido muy bien. Por ejemplo, la PNL ocupa una posición central en los sistemas técnicos de los motores de búsqueda, el comercio electrónico, los sitios web de noticias, la traducción automática y los altavoces inteligentes. Me centraré en el nivel de investigación científica de la PNL en China.
Tomemos ACL como ejemplo. ACL es la conferencia académica internacional más importante en el campo del procesamiento del lenguaje natural. Hace unos 20 años, no había artículos sobre ACL en China. En 1998, el grupo de investigación del profesor Huang Changning de la Universidad de Tsinghua publicó el primer artículo sobre ACL. En ese momento, la base de investigación de China en la dirección de la PNL era débil. Japón, Corea del Sur e incluso la provincia china de Taiwán y Hong Kong publicaron muchos más artículos sobre ACL que China continental.
Microsoft China Research (Nota: más tarde rebautizado como Microsoft Asia Research) se estableció en junio de 1998 11, lo que promovió en gran medida el desarrollo de la PNL en China.
Los sucesivos decanos han pedido a todos que se internacionalicen y alienten a los investigadores del instituto a cooperar con universidades y sociedades relacionadas para que podamos trabajar juntos para promover los niveles de investigación nacionales. Microsoft Research ha ayudado a China a cultivar una gran cantidad de talentos en PNL a través de laboratorios conjuntos, escuelas de verano y proyectos de pasantías.
Al mismo tiempo, CIPS, CCF y otras sociedades organizaron varios seminarios y conferencias académicas, introdujeron teorías y tecnologías avanzadas internacionalmente y promovieron en gran medida la mejora de los niveles locales de procesamiento del lenguaje natural. En términos de publicación de artículos, los expertos chinos en PNL también trabajan duro y constantemente para mejorar su influencia en ACL. El gobierno chino ha fortalecido la inversión y la orientación en el campo del procesamiento del lenguaje natural a través de los programas 863 y 973 de la Fundación de Ciencias Naturales. Gracias a los esfuerzos de todos los sectores de la sociedad y después de casi 20 años de rápido desarrollo, China se ha convertido en el segundo país en ACL.
En los últimos cinco años, China ocupó el segundo lugar en el número de artículos sobre ACL (incluidos artículos largos y cortos), solo superado por Estados Unidos. En términos de artículos largos, está entre 20 y 30 artículos por detrás de Estados Unidos y también está muy por delante de todos los demás países, incluidos Japón, Corea del Sur, Alemania, Reino Unido, etc. Resulta que China no puede seguir el ritmo de estos países. Si el número de documentos ACL largos en China continúa aumentando en el futuro, es posible alcanzar a los Estados Unidos en tres años. Debido a que la PNL tiene un buen impulso de desarrollo en China, este es un objetivo esperado.
En términos de artículos chinos, en 2014, los artículos de primer autor chinos representaron el 36 % del total de artículos en ACL y han aumentado año tras año desde entonces. Este año somos 40 y muchos de ellos son estudiantes que estudian en China fuera de China.
A juzgar por las cifras anteriores, los artículos de ACL de China han saltado a la vanguardia mundial. Este es un resultado muy sorprendente. Hace 20 años solo había un artículo de ACL en China y ahora ocupa el segundo lugar en el mundo.
Además de la cantidad de artículos, la calidad de los artículos ACL de China también ha mejorado considerablemente. Por ejemplo, entre los 22 artículos destacados en ACL 2017, 5 artículos de China estaban en la lista.
China se está volviendo cada vez más activa en las actividades internacionales. Por ejemplo, el Comité Ejecutivo de ACL tiene 65.438 03 miembros del Comité Ejecutivo, 3 de los cuales son de China, incluidos Zhao y yo de Baidu. Soy el candidato a presidente de ACL (nota: asumiré el cargo en 2019), Zhao es el secretario general y el de la provincia de Taiwán es el director de TI.
Además, el número total de patrocinadores y el número de patrocinadores de China también son cercanos a los de Estados Unidos; en cuanto al número de participantes, también ocupamos el segundo lugar.
Otros congresos importantes en el campo de la PNL, como COLING o EMNLP, son similares.
Así que China es el segundo país más fuerte en PNL.
El Christian Children's Fund ha hecho muchas contribuciones en este sentido. El Comité Chino de Tecnología de la Información del CCF organizó conferencias académicas como conferencias NLPCC y ADL y una serie de actividades universitarias. En la conferencia NLPCC, se organizó un taller para estudiantes especialmente para enseñarles cómo investigar y escribir artículos. Christian Children's Fund también trabaja en estrecha colaboración con CIPS para organizar la Cumbre de Lenguaje e Inteligencia de forma rotativa. Esta cumbre promovió efectivamente el desarrollo del campo de la PNL y mejoró su influencia en la sociedad.
Por supuesto, todavía tenemos algunas cosas que mejorar. Esto se refleja en: 1) Hay muy pocas conferencias o actividades internacionales en el campo de la PNL celebradas en China; 2) Hay menos miembros de la ACL de China; 3) En conferencias internacionales de PNL, informes especiales invitados, mejores artículos y SIG; hay pocos presidentes de China, presidentes de talleres y oradores tutores. 4) Aunque el número de artículos de China ocupa el segundo lugar, muchos de ellos siguen más o menos los gustos de otros; Se espera que los artículos de China reflejen más tendencias principales en el futuro.
En cuarto lugar, la razón del rápido aumento de la PNL en China
Lei Feng. com: ¿Qué factores han llevado al rápido progreso de la PNL en China?
Zhou Ming:? En primer lugar, todo el país se está desarrollando con una tendencia ascendente, ya sea la industria y la agricultura, la economía nacional o la fortaleza nacional en general. En segundo lugar, nuestra integración con la comunidad internacional es cada vez mejor. Por ejemplo, el idioma de trabajo de nuestra conferencia NLPCC es el inglés. El presidente de la conferencia, el presidente del comité del programa y el presidente de cada campo tienen dos copresidentes, uno de China y otro del extranjero.
En tercer lugar, las universidades y empresas nacionales han absorbido una gran cantidad de excelentes talentos en PNL a través de capacitación e introducción.
Cabe mencionar especialmente las contribuciones de empresas extranjeras y empresas nacionales de Internet a ACL. Por ejemplo, Microsoft Research Asia ha llevado a cabo una cooperación integral con muchas universidades de China y Asia, incluida la capacitación conjunta de estudiantes de doctorado y pasantes en escuelas de verano y laboratorios, y el cultivo de una gran cantidad de talentos de PNL. Por ejemplo, desde 65438 hasta 2008, Microsoft Research capacitó hasta 450 pasantes en el campo de la PNL. Estas personas vienen de todo el país. Después de las pasantías en Microsoft, regresan a varios colegios y universidades y luego se unen a empresas o escuelas para asumir tareas de liderazgo, impulsando así el crecimiento de la próxima ola de talentos y promoviendo continuamente el desarrollo de este campo.
Cabe señalar que grandes empresas de Internet como Baidu, Alibaba, Tencent, JD.COM y Toutiao, así como muchas empresas emergentes (como Mobvoi, Guo Shuang, Singularity, Xiaoniu Translation, y Sibi Chi, Xinhua Zhiyun, etc.) también han hecho grandes contribuciones al desarrollo de la PNL en China en varios aspectos. En nombre de CCF, estoy muy agradecido a estas empresas nacionales y extranjeras por sus contribuciones al desarrollo y progreso de la PNL.
Lei Feng. com: Japón, Corea del Sur y otros países desarrollaron el campo de la PNL antes que China. ¿Por qué están ahora por detrás de China?
Zhou Ming: Creo que hay varios factores. El primer factor es que China ha aprovechado el desarrollo y las oportunidades de la Internet china en la era de Internet, mientras que muchos otros países están relativamente rezagados en Internet (especialmente Internet móvil, comercio electrónico, búsquedas, etc.). ). Por ejemplo, muchos países no tienen sus propios motores de búsqueda, pero China tiene muchos, como Baidu, Sogou y el motor de búsqueda localizado Bing de Microsoft. Los motores de búsqueda desempeñan un papel importante en la promoción del lenguaje natural, porque sus necesidades de comprensión de preguntas, comprensión de artículos, preguntas y respuestas y traducción han promovido el desarrollo de tecnologías de PNL relacionadas. Al mismo tiempo, su enorme valor económico ha atraído a muchas personas a invertir en investigación e industrialización en este campo. Un país sin un motor de búsqueda naturalmente se quedará atrás en PNL.
Otro factor son los datos. China tiene los datos más grandes del mundo, con más de 800 millones de usuarios de Internet móvil y una gran cantidad de datos de comercio electrónico, lo que ayudará a la investigación y el desarrollo tecnológico.
El tercero es el papel del gobierno en este sentido. La posición de un país en la cadena económica mundial conducirá a su posición en la era de Internet y de Internet móvil, especialmente en la actual era de la inteligencia artificial. Dado que China es ahora el país con el segundo PIB más grande, en la era de Internet, especialmente en la era de Internet móvil, China se ha puesto al día con esta tendencia e incluso ha liderado la tendencia. El gobierno chino ha formulado planes relevantes para apoyar y guiar el desarrollo de la tecnología y la industria. Por lo tanto, se espera que en la era de la inteligencia artificial, China supere a otros países y se convierta en el país más desarrollado en inteligencia artificial. En consecuencia, también se promoverán las investigaciones relacionadas con la inteligencia artificial, incluida la PNL.
Lei Feng. com: Además de China y Estados Unidos, ¿a qué países les está yendo mejor en PNL?
Zhou Ming: Según ACL, Estados Unidos, China, Reino Unido, Alemania, Japón, Corea del Sur y Canadá tienen sus propias características. La Universidad de Edimburgo y la Universidad de Oxford en el Reino Unido tienen excelentes características en la investigación del lenguaje natural.
La PNL también tiene un buen desarrollo en Canadá. Aunque hay relativamente pocas personas dedicadas al lenguaje natural en China, y hay muchas más personas dedicadas a la PNL sólo en Beijing que en Canadá en su conjunto, se han propuesto muchos métodos líderes en el mundo, como nuevos métodos de traducción automática neuronal y Comprensión de lectura automática. Vale la pena aprender de China en términos de innovación teórica.
Cómo convertirse en un país poderoso de PNL
Lei Feng. com: ¿Cómo debería China mejorar su investigación o aplicación en PNL a continuación?
Zhou Ming: Depende de varios aspectos.
En primer lugar, creo que debemos aprovechar las oportunidades del desarrollo de China. 1)Transformación digital. China ahora presta atención a la transformación digital y todas las empresas e industrias deben digitalizarse. Sólo con la digitalización podremos tener inteligencia artificial. Pero muchas empresas ni siquiera han hecho bien la digitalización, por lo que aquí hay muchas oportunidades. 2) Locura por la IA. La moda de la IA ha impulsado la demanda de inversión del mercado y ha desarrollado aún más el talento y los datos.
Esta es una gran oportunidad y todos los involucrados en la PNL deberían aprovecharla.
En segundo lugar, debemos hacer un buen trabajo de popularización. Aunque hay muchas universidades que se dedican a la PNL en China, muchas de ellas todavía están relativamente atrasadas y no tienen suficiente conocimiento de la última tecnología. Muchas universidades (especialmente las occidentales) tienen una base débil y deben hacer un buen trabajo para popularizarla. él. El comité CCF tiene un grupo de trabajo especial llamado "Grupo de ingreso a la universidad". En respuesta al llamado del CCF, los lingüistas naturales también ingresamos a las universidades. Fuimos a muchas universidades (como la Universidad del Tíbet) para enseñar el desarrollo de la inteligencia artificial, el lenguaje natural y la última tecnología, y pedimos a más estudiantes que aprendieran inteligencia artificial y lenguaje natural.
Nota de Lei Feng.com: La distribución de lectura de un artículo representativo de IA de la cuenta oficial de WeChat (ID: A ItechTalk) siempre es de dos dígitos (o incluso de un solo dígito) en la región occidental. Esto también refleja hasta cierto punto la distribución de los trabajadores domésticos de IA.
En tercer lugar, atraer y cultivar los mejores talentos. En primer lugar, atraer a los mejores talentos internacionales para que vengan a China, conocer el estado de desarrollo de China regresando a sus países de origen para reuniones o cooperación y fortalecer los intercambios con universidades y empresas nacionales. Finalmente, esperamos que algunos talentos se sientan atraídos por las oportunidades de desarrollo nacional y se queden. Además, y lo que es más importante, a través del modelo de formación universitaria de la escuela y los canales de pasantías de la empresa, podemos cultivar talentos más destacados con bases teóricas sólidas y una rica experiencia práctica, incluso talentos líderes de alto nivel.
En cuarto lugar, promover la internacionalización de nuestra investigación en China. Incluye NLPCC administrado por Christian Children's Fund. Durante los últimos años se ha celebrado en China. En el futuro, también consideraremos celebrar conferencias en Singapur, Japón, Corea del Sur e incluso Estados Unidos para promover nuestra investigación local en China en el mundo, liderando especialmente la tendencia en el campo internacional de la informática china.
En quinto lugar, fortalecer la innovación. Incluyendo 1). Por ejemplo, desarrolle algoritmos de aprendizaje automático no supervisados, utilice contexto y retratos de usuarios para mejorar el modelado de tareas de PNL e integre conocimientos y datos para mejorar las capacidades de los sistemas de PNL. 2) Abrir nuevos campos interdisciplinares, como la PNL y la intersección de imágenes y vídeos. También hay una investigación en profundidad sobre la amplia aplicación de la PNL en importantes campos verticales; 3) La innovación de productos, a través de la combinación de software y hardware, combinada con escenarios específicos, mejora la experiencia del usuario.
En sexto lugar, debemos prestar atención a los datos, las herramientas y la evaluación. CCF y nuestro Consejo de Computación de China han establecido un grupo de trabajo de datos para compartir datos para su uso, capacitación y evaluación. Por ejemplo, NLPCC2017 ha atraído a muchas escuelas y empresas a participar en los campos de reconocimiento de vocabulario y relaciones de voz, clasificación de textos breves, resumen de documentos únicos, preguntas y respuestas y retratos de usuarios.
En séptimo lugar, promover la cooperación entre la industria, la universidad y la investigación. A través de plataformas como CCF, atraemos profesionales de la industria para que se sumen a nuestro proceso de investigación y promocionemos el desarrollo industrial de las empresas y el desarrollo académico de las universidades a través de diversas cooperaciones.
Finalmente, China debería considerar ejercer una mayor influencia en conferencias y organizaciones internacionales. Incluyendo organizar y albergar conferencias de clase mundial, esforzarse por convertirse en miembro del comité ejecutivo, presidente de la asociación general, presidente del comité de planificación y presidente del campo de una sociedad de clase mundial, y ejercer más influencia desde China.
Cabe señalar que, aunque el procesamiento del lenguaje natural en China tiene un buen impulso de desarrollo, todavía enfrentamos muchas dificultades. Requiere esfuerzos continuos de gobiernos, escuelas, instituciones de investigación científica, empresas, sociedades relevantes y personas de todos los ámbitos de la vida. En particular, fortalecer la innovación teórica y explorar nuevas oportunidades en campos interdisciplinarios y verticales puede pasar gradualmente de seguidores a líderes. Creo que si estas medidas se pueden implementar bien, la PNL de China se desarrollará constantemente hacia objetivos más altos en el siguiente paso y eventualmente se convertirá en el nivel más alto de PNL del mundo.