Cómo AlphaGo simula el "pensamiento" humano
En cuanto a los programas de inteligencia artificial Go, además de Pachi y Fuego, también están Zen de Japón, DolBaram de Corea del Sur y CrazyStone de Francia. Según resultados anteriores, ¿AlphaGo y Madman? Shitou y Zen tienen un récord de 494 victorias en 495 juegos, y cuando entregan cuatro piezas (dejando que el otro lado juegue cuatro piezas primero), usan Kuang? Stone y Zen recibieron el 77% y el 86% de los votos respectivamente. Aunque no hay un registro específico del partido de AlphaGo contra DolBaram de Corea del Sur, esto no impide que AlphaGo se convierta en el principal programa de inteligencia artificial de Go en esta etapa. ?
La clasificación de los jugadores profesionales se determina en función de los resultados de sus juegos: las puntuaciones se calculan en función de las puntuaciones de victorias, derrotas y empates, y los jugadores se dividen en segmentos del 1 al 9 según las puntuaciones. La clasificación se basará en el desempeño de los jugadores en la competencia. Los resultados del partido aumentan o disminuyen dentro de un período de tiempo determinado. Según la clasificación de jugadores profesionales chinos de Go anunciada el 31 de febrero de 2014, el jugador chino Lian Xiao (séptima etapa) que derrotó a Dolbalam con cuatro y cinco hijos ocupó el puesto 12, mientras que el jugador veterano Li Shishi (novena etapa) ocupó el puesto 12. Mejor que eso. ?
Fan Hui, el ajedrecista profesional chino de segunda etapa que fue derrotado por AlphaGo, está muy por detrás de Lee Sedol, que se enfrentará a AlphaGo, y Lian Xiao, que derrotó a Dolbaram, pero después de todo, es un Ajedrecista profesional. Calidad y nivel básico. A juzgar por los resultados de hoy, AlphaGo básicamente tiene una habilidad ajedrecística no inferior a la de los ajedrecistas profesionales en la primera etapa. ?
Si las habilidades ajedrecísticas de AlphaGo están a la par de las de Dolbaram de Corea del Sur, o sólo ligeramente mejores que Dolbaram, es obviamente imposible derrotar a Lee Sedol. Si AlphaGo tiene la fuerza para derrotar a Dolbalam en un juego de seis jugadores, entonces el juego contra Lee Sedol puede tener algo de suspenso. Me atrevo a especular aquí. Quizás AlphaGo pueda competir con Lee Sedol en el futuro, pero en este momento, es poco probable que AlphaGo derrote a Lee Sedol.
2. ¿Cuál es el secreto de la victoria de AlphaGo?
En el ajedrez, debido a la diferente importancia del Rey, Hou, Torre, Xiang, Caballo y Peón, los programadores pueden establecer diferentes puntuaciones para diferentes jugadores, como Rey 10, Hou 8... . .Deje que la computadora guíe a la computadora para calcular y mover la pelota juzgando el puntaje. Pero no hay diferencia en el tamaño de las piezas de ajedrez, por lo que a la computadora le resulta difícil elegir y sólo puede utilizar el método exhaustivo para calcular. Otra característica del Go es que es muy complejo: ¿puedes encontrar 3 361 cuando juegas al ajedrez? Para este cambio, el rendimiento de la computadora era relativamente limitado en el pasado y no había una buena asistencia de algoritmo. El uso de cálculos exhaustivos llevó naturalmente a que la inteligencia artificial derrotara a Kasparov en el ajedrez, pero siempre ha estado al nivel de los jugadores aficionados en el campo del Go. ?
El secreto de la victoria de AlphaGo sobre Fan Hui radica en el sistema de red neuronal, el algoritmo Monte Carlo y el aprendizaje profundo. ?
El sistema de red neuronal se basa en el modelo de procesamiento de información del cerebro humano, que permite a la red neuronal generar salidas específicas basadas en entradas específicas y realizar funciones como el reconocimiento de imágenes y el reconocimiento de voz. Google ha construido dos redes neuronales. Una red neuronal se utiliza para la evaluación dinámica: calcula la posibilidad del próximo movimiento del oponente dependiendo de la potencia informática de la computadora, que excede con creces la potencia informática del jugador de ajedrez, lo que tendrá una cierta ventaja. medida. Se utiliza otra red neuronal para la evaluación estática: evaluar la situación general de ambos combatientes en el juego de ajedrez. ? Dado que es difícil utilizar valores numéricos para puntuar y cuantificar piezas de ajedrez, y no existe una "ley Go" que describa con precisión el juego de ajedrez, la simple alta potencia informática de la computadora puede no ser más fuerte que el "sentido del ajedrez". y otros pensamientos abstractos de ajedrecistas profesionales en evaluaciones estáticas. ? Además, Google también ingresó una gran cantidad de registros de ajedrez de jugadores de ajedrez y pidió a AlphaGo que realizara 30 millones de juegos de autocombinación basados en los datos de los registros de ajedrez, enriqueciendo completamente la base de datos y aumentando la precisión de predecir el próximo movimiento del oponente al 57%. . ? En el proceso de jugar al ajedrez, el algoritmo de Monte Carlo de la función de evaluación estática universal en el tablero de Go fue una vez el cuello de botella de la inteligencia artificial de Go. Sin embargo, después de la introducción del algoritmo de Monte Carlo, este problema se ha resuelto en gran medida. El algoritmo de Monte Carlo construye un proceso aleatorio y evalúa estadísticamente el proceso para obtener una solución óptima. ?
En pocas palabras, el algoritmo de Monte Carlo filtra los cálculos, abandona directamente las opciones con baja tasa de ganancia en la base de datos y abandona los cálculos sin sentido en el método exhaustivo que consume muchos recursos informáticos. Se aclara la dirección principal del cálculo, lo que hace que el cálculo y el análisis de opciones con altas tasas de ganancia sean más precisos.
En particular, se agrega más conocimiento profesional relacionado con Go a la estrategia de selección, de modo que el sistema de registro Go basado en la búsqueda de árboles de Monte Carlo tenga la capacidad de competir con los profesionales. ?
3. ¿AlphaGo no solo copiará los trucos de los ajedrecistas humanos?
Existe una visión artificial de que puedes ganar realizando movimientos no registrados en AlphaGo, incluso si estos movimientos no se ajustan en absoluto a los principios de Go. Pero el autor cree que la viabilidad de este enfoque no es alta. ?
AlphaGo no es una simple copia de la memoria de los jugadores de ajedrez humanos, sino una simulación de algún tipo de capacidad de "pensamiento" de las redes neuronales humanas. No se trata de una búsqueda exhaustiva del mayor número de opciones, como antaño, ni de un conjunto registrado en una partida de ajedrez o de una reproducción de los músculos de la mano. En cambio, "pensarán" en las opciones, eliminarán aquellas con una tasa de ganancia baja, "pensarán" profundamente en las opciones con una tasa de ganancia alta y finalmente elegirán la opción óptima basándose en su propio "pensamiento" entre innumerables opciones. ? Por lo tanto, si un jugador de ajedrez humano quiere seguir adelante con un movimiento que no se ajusta a la lógica del ajedrez o no está registrado en el registro de ajedrez, es poco probable que pueda derrotar fácilmente a AlphaGo. Porque AlphaGo es inteligencia artificial, no una máquina que sólo puede copiar los movimientos de ajedrecistas humanos. ?
AlphaGo se basa en un sistema de evaluación experto preciso (¿valor? Red), una red neuronal profunda (¿política? Red) y la combina con el método tradicional de inteligencia artificial de búsqueda de árbol de Monte Carlo, que al menos alcanza el Nivel amateur estándar nacional El nivel de un jugador de 6 dan o un jugador profesional de 200 puntos. Si los mejores jugadores de ajedrez humanos acompañan a AlphaGo durante mucho tiempo, las capacidades de ajedrez de AlphaGo mejorarán aún más. ?
Así que AlphaGo ya no es un programa de Go que pueda ser derrotado por errores, al igual que Lian Xiao perdió ante DolBaram en el juego donde Lian Xiao fue devorado por el dragón. Con respecto a esto, Lian Xiao dijo: "Sabía que Qi iba a morir, pero pensé que no podía decirlo. No esperaba que saliera pronto, y también jugó bien en el lugar que agarró". p>
4. ¿Expectativas IA?
Actualmente existen dos factores centrales que limitan el desarrollo de la inteligencia artificial: primero, el algoritmo aún no ha alcanzado la perfección y los humanos aún no comprenden lo suficientemente bien el proceso de la computación inteligente. Todavía hay mucho margen de mejora en el algoritmo actual. El segundo es el cuello de botella del hardware informático. Aunque la tecnología informática ha avanzado a pasos agigantados en los últimos 30 años, todavía existe una brecha de muchos órdenes de magnitud entre los circuitos integrados actuales y la compleja red compuesta por cientos de miles de millones de neuronas y billones de sinapsis en el cerebro humano. ?
Pero la inteligencia artificial no está fuera de alcance. Ha sido ampliamente utilizada en muchos aspectos, como reconocimiento de voz, reconocimiento de imágenes, traducción automática, recomendación publicitaria, minería de datos, etc., y ha sido comercializada o. entró en la corriente principal. ?
Además de la comprensión antes mencionada de la inteligencia perceptual de entrada externa. El surgimiento de inteligencias de nivel superior, como el razonamiento, la imaginación y la toma de decisiones, se denomina inteligencia cognitiva. Google Go puede ser un gran avance en la inteligencia cognitiva. Los avances tecnológicos relacionados no se limitan al rincón de la inteligencia artificial de Go, sino que también pueden generar una serie de nuevas tecnologías y nuevos productos en este campo. Dejemos que la inteligencia artificial sirva plenamente para la vida de las personas y al mismo tiempo afecte la producción social.