Alpha Zero, IA y autoaprendizaje

Vitov #1 Dic '17 Watson

Alpha Zero, el programa que revoluciona el ajedrez y puede cambiar el mundo

La inteligencia artificial creada por Google bate por 28-0 al mejor ordenador ideado por humanos

El futuro ha llegado de golpe. Hace veinte años muchos dudaban que una máquina fuese capaz de derrotar a los humanos en una partida de ajedrez. La victoria de Deep Blue, el ordenador creado por IBM, en 1997 sobre el campeón del mundo Gary Kasparov supuso un cambio de paradigma. Desde ese momento, la historia del deporte-ciencia cambió para siempre. Sin embargo, hace una semana llegó el holocausto absoluto. Un programa de inteligencia artificial destrozó de forma humillante al campeón de los ordenadores ajedrecistas, cambiando para siempre la disciplina y abriendo una nueva era a nivel científico.

A diferencia de otros programas, Alpha Zero, la inteligencia artificial creada por Deep Mind, propiedad de Google desde 2014, no está basado en el conocimiento humano. Su comprensión sobre el ajedrez, más allá de las reglas básicas, proviene únicamente de su capacidad de autoaprendizaje. Tras jugar casi cinco millones de partidas durante cuatro horas contra sí mismo, Alpha Zero obtuvo el mismo conocimiento que los humanos en casi 1.400 años.

Siempre me he preguntado cómo sería si una raza superior aterrizara en la tierra y nos enseñara cómo juegan ellos al ajedrez, y ahora siento que ya lo sé”

PETER HEINE NIELSEN, ANALISTA DE MAGNUS CARLSEN
Partiendo desde una hoja en blanco, fue capaz de entrenar la red neuronal en la que se basa para aprender hasta límites insospechados sin ningún tipo de aportación humana. Descartando jugadas y deduciendo nuevas estrategias ha adquirido un conocimiento capaz de humillar a Stockfish 8, el otro protagonista del duelo interestelar que tuvo lugar hace semanas.

Stockfish 8 no es más que el campeón del mundo de los módulos de ajedrez. Una máquina programada por los ingenieros más brillantes del planeta desde hace casi diez años con la misión de jugar un ajedrez perfecto, con capacidad para calcular millones de posiciones y decidir la jugada precisa siempre. Alpha Zero, en tan solo cuatro horas y jugando contra sí mismo, igualó los conocimientos de Stockfish y lo humilló de manera histórica en un duelo a 100 partidas. La inteligencia artificial ganó 28 (tres con negras) e hizo tablas en las restantes 72. El programa alimentado de conocimiento humano fracasó de manera estrepitosa e histórica. No ganó ni una sola partida.

La habilidad de una máquina de replicar y superar siglos de conocimiento es una herramienta que puede cambiar el mundo”

GARY KASPAROV
Tras estos resultados, la perplejidad de Grandes Maestros, analistas, jugadores y aficionados fue general. “Siempre me he preguntado cómo sería si una raza superior aterrizara en la tierra y nos enseñara cómo juegan ellos al ajedrez, y ahora siento que ya lo sé”, dijo el Gran Maestro Peter Heine Nielsen, analista del campeón mundial Magnus Carlsen. Gary Kasparov fue incluso más allá al asegurar que este tipo de conocimiento “puede cambiar el mundo”.

“Me encantará ver lo que podemos aprender sobre el ajedrez de Alpha Zero, que podrá descifrar reglas que los humanos no podemos detectar. Pero obviamente las implicaciones van mucho más allá del ajedrez. La habilidad de una máquina de replicar y superar siglos de conocimiento es una herramienta que puede cambiar el mundo”, aseguró el excampeón del mundo.

Es uno de los descubrimientos científicos de nuestra era porque permitirá entender los misterios del universo”

CREADORES DE ALPHA ZERO
Muchos teóricos se han encargado durante años de repetir que aunque las máquinas superen a los humanos, la creación de belleza nos pertenecía. Alpha Zero también ha puesto eso en duda. Y es que para muchos esta inteligencia artificial realiza un ajedrez único, que sacrifica piezas de forma humana, que se mantiene con desventaja material durante decenas de jugadas y que es capaz de especular como un humano en los finales de partida.

El camino que Alan Turing, padre de la informática, comenzó en 1947 parece haber alcanzado un nuevo nivel. Los padres de esta monstruosa criatura aseguran que estamos ante “uno de los descubrimientos científicos de nuestra era porque permitirá entender los misterios del universo y abordar algunos de nuestros desafíos más apremiantes en el mundo real”. Dicen desde Deep Mind que, “de tener éxito, se avanzaría más rápido en la prevención del cambio climático o en la necesidad de una atención médica radicalmente mejorada. Con la inteligencia artificial como multiplicador del ingenio humano, esas soluciones estarán a nuestro alcance”, explican. El futuro parece que ya se ha instalado en nuestro tiempo.
http://www.lavanguardia.com/deportes/otros-deportes/20171214/433624379301/alpha-zero-deep-mind-gary-kasparov-ajedrez-inteligencia-artificial.html

https://deepmind.com/blog/alphago-zero-learning-scratch/
https://en.wikipedia.org/wiki/AlphaGo_Zero

Google innovando con éxito, aunque parece ser que Stockfish jugó con desventajas: sin libro de aperturas y un hardware pobre. Aún así el futuro de Alpha Zero parece prometedor.

2

PaCoX #2 Dic '17 Ant queen

impresionantes las partidas. Hay una que encierra a la dama y al rey ahi en la esquina que te quedas asi @.@

1 respuesta

Vitov #3 Dic '17 Watson

#2 la ví, muy destroyer

HeXaN #4 Dic '17

Habiendo vencido ya en el Go (aunque usando unos métodos diferentes) el ajedrez como que se queda corto.

1 respuesta

B

[Borrado] #5 Dic '17

Una nueva religión se avecina, el dios google.

MSM #6 Dic '17

#4 No me he informado demasiado, pero he leído que esta IA es una versión nueva que con 8 horas de autoapredizaje desde cero ha vencido a la versión que derrotó al maestro aquel hará cosa de un año.

1 respuesta

Frave #7 Dic '17 Montedamus

#6 creo que para derrotar a la última versión de alphago se tira como 40 días entrenando y eso que lo hará en chorrocientas tpus de Google xD. La diferencia esencial es que en lugar de aprender de partidas de ehumanos y después entrenar contra sí misma resulta que es mejor pasar del conocimiento previo humano y aprender desde cero contra si misma, lo cual es muy wtf! XD

El aprendizaje con refuerzo combinado con el Deep learning es un hallazgo increíble, el problema es su aplicación ya que conlleva un coste computacional altísimo y eso que se trata de juegos muy acotados como el go o el ajedrez. Tengo ganas de ver esto en algo como el LOL o el Starcraft ( ya se han visto cosas pero no a este nivel de partir culos).

El problema también es como llevas esto fuera de juegos donde no solo es ganar o perder o directamente no sabes el resultado.

2 respuestas

TRuBi #8 Dic '17 Inocente

#7 Ya salió algo parecido en TI7 (Dota 2), aunque sólo sabe manejar un héroe y para 1 contra 1.

1 respuesta

HeXaN #9 Dic '17

#7 En el SCII va a estar chulo con la colaboración Google/Blizzard: https://deepmind.com/blog/deepmind-and-blizzard-release-starcraft-ii-ai-research-environment/

1 respuesta

Frave #10 Dic '17 Montedamus

#8 si si ya lo sé pero Elon no está al nivel de Deepmind

#9 eso sí que va ser un punto de inflexión brutal porque Starcraft ya se empieza a parecer a situaciones más realistas y mucho menos acotadas que un juego de mesa. Hype

Alpha Zero, IA y autoaprendizaje

Usuarios habituales

Tags