CVSL Logo
FrancaisHome
AboutPeopleResearchPublicationsEventsProfile
About
Seminars


The CerVIM Seminars, Université Laval are held on Fridays at 11:00 a.m.
Please see the program for more details.

 

 

 

CERVIM

REPARTI

MIVIM

04-12-2009

Abdeslam Boularias

Le Transfert des Politiques dans l'Apprentissage par Imitation



Abstract

L'apprentissage par imitation est un mécanisme qui est largement utilisé par les primates pour acquérir des nouvelles compétences (ou politiques). En effet, il y a toute une catégorie de neurones dans le cerveau, appelés les neurones miroirs, qui sont spécialisés dans le mécanisme de l'imitation. Inspiré par cette évidence, l'apprentissage par imitation a toujours été considéré comme le moyen le plus efficace pour entraîner un robot (ou un agent intelligent) à effectuer une tâche complexe. Dans un processus d'imitation typique, un agent apprenti observe un agent expert en train d'effectuer une certaine tâche, et essaie de reproduire les actions exécutées. Cependant, la plupart des méthodes d'apprentissage par imitation actuelles ne permettent pas à l'agent apprenti de transférer les compétences apprises sur une certaine tâche vers une nouvelle tâche, ou vers une configuration différente de la même tâche.

Dans ce séminaire, je présenterai une méthode de transfert des politiques qui est basée sur l'homomorphisme des graphes. Les domaines des tâches sont représentés graphiquement par des Processus Décisionnels de Markov (MDP), et deux tâches données sont considérées comme similaires si on peut trouver un homomorphisme entre leurs graphes correspondants. Finalement, je présenterai les résultats de quelques expérimentations préliminaires sur une simulation d'une course de véhicules.


The CVSL seminars are held on Fridays at 11:30 a.m. in room PLT-2783.




     
   
   

©2002-. Computer Vision and Systems Laboratory. All rights reserved