Inteligencia Artificial

Inteligencia Artificial: Aprender con castigos y recompensas

0
Inteligencia Artificial

La Inteligencia Artificial tiene muchas áreas, cuando hablamos de un aprendizaje basado en redes neuronales entrenadas en una máquina, nos referimos al Machine Learning, si tenemos varias capas de neuronas entonces podemos llamarle Deep Learning, y si, como en este artículo, hablamos de aprendizaje en base a castigos y recompensas, entonces estamos hablando de Deep Reinforcement Learning (Aprendizaje profundo reforzado).

En uno de los ejemplos que se muestran en la charla del vídeo, se han entrenado unos humanoides para andar por sí mismos, al comenzar el entrenamiento se caen hacia atrás, hacia delante… en definitiva, no saben ni sostenerse en pie. Durante este proceso vamos asignandoles puntuaciones, por ejemplo, si caen hacia atrás lo están haciendo MUY mal, por lo que les asignamos una recompensa negativa (-3 por ejemplo), si comienzan a caer hacia delante, podemos asignarles una recompensa ligeramente positiva (0.01 por ejemplo), así lo que iremos consiguiendo es que al menos cambien su tendencia a caer hacia delante.

Si además les premiamos por permanecer más tiempo en el aire sin caer, vererecmos que cada vez se sostienen mejor, y si finalmente les premiamos por cada metro que avanzan, los humanoides comenzarán a andar tras cientos de iteraciones.

En este tipo de aprendizaje por refuerzo tenemos mucho control sobre lo que sucede, ya que es un aprendizaje supervisado, por ejemplo, si los humanoides están andando muy encorvados, podemos establecer una recompensa por mantener los hombros erguidos, y un castigo cuando el hombro está por debajo de 1.5 metros. De esta manera iremos refinando la postura del humanoide hasta tener modelada la forma en la que un humano corre.

Repetidor WiFi: La clave para ampliar tu cobertura de Internet

Previous article

You may also like

Comments

Leave a reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *