martes, 11 de octubre de 2016

Google construye 'un gran cerebro' para enseñar a todos sus robots

La empresa está probando varias maneras de lograr que los robots ejecuten tareas complejas mediante los conocimientos previos aprendidos por sus compañeros, la robótica en la nube

¿Cuántos robots se necesitan para abrir una puerta? Si los robots intentan averiguar cómo hacer la tarea desde cero, le pedirían ayuda a tantos como fuera posible.
En tres trabajos de investigación publicados la semana pasada, investigadores de Google y de otras subsidiarias de Alphabet demostraron varias maneras en las que los robots pueden aprender a ejecutar tareas sencillas más rápidamente al compartir diferentes tipos de experiencias de aprendizaje.
Los investigadores están entrenando equipos de robots industriales para realizar tareas sencillas con una técnica llamada aprendizaje reforzado, que combina el ensayo y error con refuerzos positivos. De momento, estas tareas son extremadamente sencillas, como abrir puertas o mover objetos. Pero tales avances resultarán críticos si los robots van a llegar algún día a ser capaz de ayudarnos en tareas cotidianas como doblar la ropa o fregar los platos.

Foto: Cuatro robots practican abrir diferentes puertas. Crédito: Ali Yahya.
Aunque los robots son cada vez más baratos y hábiles, programarlos de forma fiable en situaciones cotidianas impredecibles es prácticamente imposible. El aprendizaje reforzado ofrece una solución, al permitir a los robots programarse solos mientras aprenden sobre la marcha. Pero puede resultar complicado que un robot individual pruebe con muchas formas distintas de ejecutar una tarea. Compartir el proceso de aprendizaje, una técnica a menudo denominada robótica en la nube, puede ayudar a acelerar el proceso, aunque la idea sigue estando en una fase temprana (ver Robots que se enseñan unos a otros).
En los tres trabajos publicados, el científico de investigación de Google que está liderando el esfuerzo de aprendizaje de robots, Sergey Levine, y sus compañeros detallan varias estrategias de aprendizaje que pueden ser distribuidas a un grupo de robots.
En cada caso, los robots emplearon redes neuronales que intentaron predecir el resultado de distintas acciones. Cada robot varió ligeramente su comportamiento, y después reforzó las variaciones que generaron los mayores beneficios. Estas redes entonces alimentaron periódicamente un servidor central que construía una nueva red neuronal que combinaba todos los comportamientos aprendidos, y esa red era redistribuida a los robots para otra ronda de aprendizaje.
En el primer experimento, el objetivo consistía en girar el pomo de una puerta para abrirla después, y cuatro robots diferentes fueron puestos a practicar con distintas puertas y tipos de pomos. "Puesto que se entrenaron con puertas distinstas, la política final tiene éxito con una puerta y un pomo que ninguno de los robots había visto anteriormente", escribió Levine en una actualización de blog que escribió en colaboración con el investigador de Google DeepMind Timoth Lillicrap y Mrinal Kalakrishnan, del laboratorio de "proyectos locos" de Google, X.
En el segundo experimento, el proceso de aprendizaje de los robots fue acelerado gracias a las interacciones de una persona que guía los movimientos de un brazo robótico. Y en un tercer experimento, un robot averiguó cómo mover y rotar objetos con las informaciones procedentes de una cámara y la capacidad aprendida de predecir cómo las acciones cambiarían la imagen. Un proceso que los investigadores describen como un sencillo modelo físico del mundo. La profesora adjunta de la Universidad de Brown (EEUU)Stephanie Tellex, que estudia el aprendizaje de los robots, lo considera emocionante. "Predecir los efectos físicos de acciones como empujar es emocionante porque permite que el robot aprenda algo sobre cómo funciona el mundo", apunta.
La empresa parece estar decidida a sacar el máximo provecho de lo que podría ser una próxima revolución en el campo gracias a la aplicación de técnicas de aprendizaje automático. Algunos fabricantes de robótica ya están explorando cómo emplear el aprendizaje reforzado para optimizar la programación de sus productos.
"Por supuesto, los tipos de comportamientos que los robots pueden aprender hoy siguen siendo bastante limitados", escribieron los autores. "Sin embargo, mientras mejoren los algoritmos y los robots sean desplegados más ampliamente, su capacidad de compartir y poner en común sus experiencias podría ser la herramienta para permitir que ayuden mejor en nuestro día a día", concluyen.
technologyreview.es

No hay comentarios:

Publicar un comentario