¿Cómo evalúa las "Catorce conferencias sobre Visual SLAM" de Gao Bo?
Entonces, en mi humilde opinión, la tecnología SLAM tiene solo unos 2000 años y no hay necesidad de innovación en absoluto. Para la aplicación de cámaras y visión en ingeniería robótica, el verdadero problema a resolver es hacer que el robot sepa dónde está la sala de estar, dónde está la cocina y dónde está el frigorífico. Cuando el propietario ordena ir al refrigerador, el robot puede moverse hasta el refrigerador por sí solo, abrir la puerta del refrigerador y tomar cosas. Esto es algo que un niño de cuatro o cinco años sólo puede hacer cuando se encuentra en un entorno extraño y puede observar el entorno por sí solo y escuchar instrucciones de los adultos. Esto es lo que la verdadera innovación debería hacer hoy. Su estimación de estado no es sólo una estimación interna del espacio tridimensional, sino también una estimación del espacio semántico visual. El espacio semántico visual permite a los robots establecer la misma comprensión del entorno que los humanos. Porque el modelado espacial tridimensional realizado por el robot no puede comunicarse directamente con las personas. Sólo modelando el espacio semántico visual de la sala podemos comunicarnos verdaderamente con las personas y resolver problemas de aplicaciones prácticas. Si puedes hacer esto, ¡NB será genial!