Artículo sobre física cuántica
Con la llegada de las computadoras cuánticas, se han propuesto muchas arquitecturas diferentes que pueden proporcionar ventajas sobre las arquitecturas clásicas. Las redes neuronales cuánticas (QNN) son una de las arquitecturas más prometedoras, con aplicaciones que incluyen simulación física, optimización y tareas más generales de aprendizaje automático. Aunque QNN tiene un gran potencial, se ha demostrado que presenta una "meseta estéril", donde el gradiente de la función de costos desaparece exponencialmente con el tamaño del sistema, lo que hace que la arquitectura no pueda prepararse para problemas a gran escala.
Aquí, el Laboratorio Nacional de Los Álamos (LANL), en colaboración con investigadores de la Universidad de Londres, demuestra que no existen mesetas estériles en una arquitectura QNN específica.
Los investigadores analizaron una arquitectura llamada red neuronal convolucional cuántica (QCNN), que se propuso recientemente para resolver el problema de la clasificación de datos cuánticos. Por ejemplo, se puede entrenar a QCNN para clasificar objetos en función de sus estados cuánticos relativos. Además, los investigadores han demostrado que las QCNN no se ven afectadas por las mesetas áridas, por lo que se destacan como arquitecturas candidatas potenciales para lograr una ventaja cuántica en el corto plazo.
Esta investigación se titula "No hay plataformas estériles en redes neuronales de convección cuántica" y se publicó en "Physical Reviews X" el 15 de octubre de 2021.
QNN ha generado interés en torno a la posibilidad de analizar eficientemente datos cuánticos. Sin embargo, este entusiasmo se ve atenuado por la presencia de gradientes de desaparición exponenciales para muchas construcciones QNN (llamadas paisajes de meseta áridas). Recientemente se ha propuesto QCNN, que implica una serie de capas convolucionales y capas de agrupación para reducir la cantidad de qubits y al mismo tiempo conservar la información de las características de los datos.
Esquema QCNN
En este trabajo, los investigadores analizaron rigurosamente el escalado de gradiente de los parámetros en la arquitectura QCNN. Se encontró que la varianza del gradiente no desaparece más rápido que el polinomio, lo que significa que QCNN no exhibe una meseta estéril. Este resultado proporciona una garantía analítica para la capacidad de entrenamiento de la inicialización aleatoria de QNN y resalta la capacidad de entrenamiento de la inicialización aleatoria de QNN. Esto es diferente de muchos otros edificios QNN.
Para obtener los resultados, los investigadores introdujeron un nuevo método basado en gráficos para analizar el valor esperado de la distribución unitaria de Haar; esto puede ser útil en otras situaciones, además, los investigadores realizaron simulaciones numéricas; verificar los resultados del análisis.
Representación de red tensorial de red neuronal celular cuántica.
Como método de inteligencia artificial, QCNN se inspira en la corteza visual. Por lo tanto, implican una serie de capas convolucionales o filtros que se entrelazan con capas de agrupación para reducir la dimensionalidad de los datos y al mismo tiempo mantener características importantes del conjunto de datos. Estas redes neuronales se pueden utilizar para resolver problemas que van desde el reconocimiento de imágenes hasta el descubrimiento de materiales. Superar esta meseta árida es clave para desbloquear todo el potencial de las computadoras cuánticas en aplicaciones de inteligencia artificial y demostrar su superioridad sobre las computadoras clásicas.
Marco Cerezo (uno de los coautores del artículo) afirma que hasta ahora los investigadores del aprendizaje automático cuántico han analizado cómo reducir el impacto de las mesetas áridas, pero carecen de la base teórica para evitarlo por completo. impacto . El trabajo de LANL muestra que algunas redes neuronales cuánticas son en realidad inmunes a las mesetas estériles.
"Con esta garantía, los investigadores ahora podrán examinar datos de computadoras cuánticas sobre sistemas cuánticos y utilizar esta información para estudiar propiedades de materiales o descubrir nuevos materiales", dice el físico cuántico Patrick Coles de LANL
Coles cree que a medida que los investigadores utilicen computadoras cuánticas recientes con mayor frecuencia y generen más y más datos, habrá más aplicaciones para algoritmos de inteligencia artificial cuántica, todos los cuales son aprendizaje automático. Ambos programas requieren grandes cantidades de datos. /p>
Módulo GRIM de la arquitectura QCNN
Durante más de 40 años, los físicos han creído que las computadoras cuánticas serían capaces de simular y comprender sistemas cuánticos de partículas que acabarían con las investigaciones de LANL. demuestra que los tipos robustos de redes neuronales convolucionales cuánticas son prometedores para analizar datos de simulación cuántica
"El campo del aprendizaje automático cuántico comenzó tarde.
Coles dijo: "Hay un dicho famoso sobre los láseres. Cuando se descubrieron por primera vez, la gente decía que estaban buscando una solución a un problema. Ahora los láseres se utilizan en todas partes. Del mismo modo, muchos de nosotros dudamos de que los datos cuánticos puedan volverse altamente disponibles, esto podría significar que el aprendizaje automático cuántico también despegará. Por ejemplo, Coles dijo que la investigación se está centrando en materiales cerámicos como superconductores de alta temperatura que podrían mejorar el transporte sin fricción, como los trenes maglev. Sin embargo, analizar y clasificar datos de grandes cantidades de fases afectadas por la temperatura, la presión y las impurezas del material es una tarea difícil. Utilizando redes neuronales cuánticas escalables, las computadoras cuánticas pueden examinar conjuntos de datos masivos sobre varios estados de un material determinado y relacionar esos estados con fases para determinar el estado óptimo para la superconductividad de alta temperatura.
Arthur Pesah, autor del artículo, dijo: "Con el vigoroso desarrollo de QNN, creemos que es importante realizar análisis similares en otras arquitecturas candidatas, y la tecnología desarrollada en nuestro trabajo puede servir como base para este Un plan de análisis."
Enlace del artículo: https://journals.APS.org/prx/abstract/10.1103/physrevx.11.04165438.
Informes relacionados: https://phys.org/news/2021-10-breakthrough-proof-path-quantum-ai.html.