Logo LVSN
EnglishAccueil
A proposPersonnesRecherchePublicationsEvenementsProfil
A propos
Séminaires


Les Séminaires CerVIM, Université Laval ont lieu le vendredi à 11h00.
Veuillez consulter le programme pour plus de détails.

 

 

 

 

CERVIM

REPARTI

MIVIM

04-12-2009

Abdeslam Boularias

Le Transfert des Politiques dans l'Apprentissage par Imitation



Résumé

L'apprentissage par imitation est un mécanisme qui est largement utilisé par les primates pour acquérir des nouvelles compétences (ou politiques). En effet, il y a toute une catégorie de neurones dans le cerveau, appelés les neurones miroirs, qui sont spécialisés dans le mécanisme de l'imitation. Inspiré par cette évidence, l'apprentissage par imitation a toujours été considéré comme le moyen le plus efficace pour entraîner un robot (ou un agent intelligent) à effectuer une tâche complexe. Dans un processus d'imitation typique, un agent apprenti observe un agent expert en train d'effectuer une certaine tâche, et essaie de reproduire les actions exécutées. Cependant, la plupart des méthodes d'apprentissage par imitation actuelles ne permettent pas à l'agent apprenti de transférer les compétences apprises sur une certaine tâche vers une nouvelle tâche, ou vers une configuration différente de la même tâche.

Dans ce séminaire, je présenterai une méthode de transfert des politiques qui est basée sur l'homomorphisme des graphes. Les domaines des tâches sont représentés graphiquement par des Processus Décisionnels de Markov (MDP), et deux tâches données sont considérées comme similaires si on peut trouver un homomorphisme entre leurs graphes correspondants. Finalement, je présenterai les résultats de quelques expérimentations préliminaires sur une simulation d'une course de véhicules.


Les séminaires du LVSN ont lieu le vendredi à 11h30 dans la salle PLT-2783.




     
   
   

©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés