Principal Innovar Google Artificial Intelligence 'Alpha Go Zero' acaba de presionar Restablecer sobre cómo aprender

Google Artificial Intelligence 'Alpha Go Zero' acaba de presionar Restablecer sobre cómo aprender

Tu Horóscopo Para Mañana

¿Recuerda (vagamente) cómo aprendió a caminar, hablar, andar en bicicleta o conducir? Fue complicado y lleno de errores, pero las habilidades que aprendiste de esa manera se mantuvieron. Fuera de los sistemas vivos, ha sido un desafío estructurar algoritmos lo suficientemente fuertes para asimilar la 'experiencia de la vida real' y desarrollar comportamientos adaptables y pegajosos para la inteligencia artificial.

Bueno, Alpha Go Zero acaba de hacerlo.

`` Comienza desde una pizarra en blanco y se da cuenta solo por sí mismo, solo a partir del juego personal, y sin ningún conocimiento humano, ni datos humanos, características, ejemplos o intervención de humanos. Descubre cómo jugar el juego Go desde los primeros principios ”, dice el profesor de DeepMind, David Silver.

La IA ha tenido varias iteraciones, cada una más inteligente y más capaz que la anterior. La versión anterior usaba una enorme base de datos de juegos anteriores junto con un montón de algoritmos que apuntaban a ganar. Ese enfoque llevó a la derrota del actual campeón mundial, jugador profesional de Go. En el póquer, el AI Libratus recientemente desolló a los mejores jugadores de póquer del mundo en casi $ 2 millones, también aprendiendo a través del juego personal en lugar de los datos del juego humano.

camión greiner marido y greiner

Ahora, en esta última versión de Alpha Go, el programa de inteligencia artificial enseñó sí mismo cómo jugar Go - sin antecedentes humanos.

Al ejecutar millones de simulaciones de juegos contra sí mismo, le tomó 40 días aprender, desde cero, cómo vencer a la versión de campeón mundial de sí mismo. Eso es realmente un cambio de juego, no solo para Go, sino también para la forma en que se descubren nuevos conocimientos. ¿Qué tan precisa o completa es su experiencia en el dominio? Hay mucho Más por descubrir, es lo que nos dice este fascinante experimento de aprendizaje con Alpha Go Zero.

'La idea de Alpha Go no es salir y derrotar a los humanos, sino descubrir lo que significa hacer ciencia, para que un programa pueda aprender de sí mismo qué es el conocimiento', según Silver en una publicación de YouTube sobre el logro.

El equipo de Alpha Go Zero Deep Mind lo llama aprendizaje de primer principio, 'tabula rasa' (pizarra en blanco).

'Si puedes lograr tabula rasa aprendiendo, tienes un agente que puede ser trasplantado del juego de Go a cualquier otro dominio, y las especificaciones del juego en el que estás, se te ocurre un algoritmo que es tan general que se puede aplicar en cualquier lugar '', dice. . Esa es una idea provocativa cuando amplías el concepto. Solo piense en lo que podríamos hacer con un conjunto de algoritmos de aprendizaje sólidos que podrían abordar sistemáticamente problemas difíciles y aprender más rápido que el conocimiento colectivo de nuestra civilización. . . en días, no en décadas.

cuantos hijos tiene julie chrisley

Por ahora, la gran conclusión es que 'los algoritmos importan mucho más que la computación o los datos disponibles', dijo Silver. Esto por sí solo es un cambio de juego en la forma en que nos acercamos a ampliar el mundo conocido. Si bien Alpha Go funciona con alrededor de $ 25 millones en hardware, no es exactamente un sistema liviano, usted sabe que los gurús de la inteligencia artificial han estado trabajando durante mucho tiempo para crear conjuntos de datos mejores y más limpios. Hoy en día, muchos conjuntos de big data se consideran demasiado ruidosos, llenos de datos incorrectos, para entrenar con precisión una inteligencia artificial. Si la IA está aprendiendo de los datos y los datos son malos, no aprende. Gran problema.

¿Qué pasaría si no necesitara datos limpios, sino solo experiencia, y la inteligencia artificial pudiera entrenarse a sí misma?

Ese es el logro emocionante en Alpha Go Zero. A pesar de que está en el nicho, el mundo de los juegos basado en reglas, tiene grandes implicaciones en todas las industrias que trabajan a partir de reglas físicas: piense en la química, el tráfico, la biología, la farmacología, los viajes, la logística y la fabricación. Si podemos diseñar reglas tan flexibles que puedan funcionar a partir de una experiencia más amplia y tan direccionales que siempre creen habilidades más fuertes, como Alpha Go Zero, entonces es posible lograr una inteligencia artificial que dirija los sistemas. Estos sistemas no necesitarían datos externos, no tendrían problemas de limpieza de datos y no necesitarían ralentizaciones humanas. Esa es en parte la razón por la que la empresa matriz de Google, Alphabet, apostó a la empresa por la inteligencia artificial y está invirtiendo en inteligencia artificial a un ritmo rápido. (Amazon también está invirtiendo en inteligencia artificial, como su última adquisición de IA, BodyLabs).

yoon eun-hye edad

El profesor de Deep Mind, David Silver, dice: 'el hecho de que hayamos visto un programa lograr un rendimiento de alto nivel ... debería significar que ahora podemos comenzar a abordar algunos de los problemas más desafiantes e impactantes para la humanidad'.

Esta publicación se ha actualizado para aclarar que AI Libratus recientemente venció a los mejores jugadores de póquer utilizando una estrategia que involucra el juego personal en lugar de datos ingresados ​​por humanos.