La Red de Conocimientos Pedagógicos - Educación de postgrado - ¿Cómo evalúa las "Catorce conferencias sobre Visual SLAM" de Gao Bo?

¿Cómo evalúa las "Catorce conferencias sobre Visual SLAM" de Gao Bo?

La tecnología SLAM comenzó a utilizarse en juegos de ordenador en los años 1990. Al jugar a StarCraft, cada soldado que se mueve a través de la niebla es inseparable del algoritmo SLAM. En un robot barredor que cuesta varios cientos de dólares, utiliza una sola placa integrada que cuesta decenas de dólares, un sensor de infrarrojos que cuesta unos pocos dólares y un motor de juguete que cuesta 1 yuan para recorrer la habitación y limpiar. Para ser honesto, ninguno de estos algoritmos requiere estimación de estado, y mucho menos álgebra de Lie o incluso álgebra lineal. Mediante el uso de sensores infrarrojos, la estimación de la posición del robot es más sencilla, precisa y eficiente, y no requiere el uso de cámaras. Y en la mayoría de las aplicaciones prácticas, el robot no necesita estimar su posición en absoluto. El robot sólo necesita encontrar el objetivo, moverse hacia él y evitar obstáculos cuando los encuentre. Si el sistema de visión no puede encontrar el objetivo, atravesará la habitación.

Entonces, en mi humilde opinión, la tecnología SLAM tiene solo unos 2000 años y no hay necesidad de innovación en absoluto. Para la aplicación de cámaras y visión en ingeniería robótica, el verdadero problema a resolver es hacer que el robot sepa dónde está la sala de estar, dónde está la cocina y dónde está el frigorífico. Cuando el propietario ordena ir al refrigerador, el robot puede moverse hasta el refrigerador por sí solo, abrir la puerta del refrigerador y tomar cosas. Esto es algo que un niño de cuatro o cinco años sólo puede hacer cuando se encuentra en un entorno extraño y puede observar el entorno por sí solo y escuchar instrucciones de los adultos. Esto es lo que la verdadera innovación debería hacer hoy. Su estimación de estado no es sólo una estimación interna del espacio tridimensional, sino también una estimación del espacio semántico visual. El espacio semántico visual permite a los robots establecer la misma comprensión del entorno que los humanos. Porque el modelado espacial tridimensional realizado por el robot no puede comunicarse directamente con las personas. Sólo modelando el espacio semántico visual de la sala podemos comunicarnos verdaderamente con las personas y resolver problemas de aplicaciones prácticas. Si puedes hacer esto, ¡NB será genial!