Logo LVSN
EnglishAccueil
A proposPersonnesRecherchePublicationsEvenementsProfil
A propos
Séminaires REPARTI


Les Séminaires REPARTI à l'Université Laval ont lieu le vendredi à 11h30.
Veuillez consulter le programme pour plus de détails.

Projet de maîtrise, de doctorat ou stage postdoctoral en apprentissage automatique au sein de l'équipe du Prof. Christian Gagné : veuillez consulter l'annonce suivante pour tous les détails : http://vision.gel.ulaval.ca/~cgagne/postes2017.html
Sep 22 2017 11:30AM
Séminaire
Online optimization of microscopy imaging parameters

 

 

 

 

REPARTI

MIVIM

Apr 4 2014 11:30AM

Audrey Durand
Laboratoire LVSN
Dép. de génie électrique et de génie informatique,
Université Laval

Apprentissage par renforcement en-ligne dans un contexte multiobjectif avec Thompson Sampling



Résumé

En apprentissage par renforcement, un agent cherche à identifier l'action optimale parmi plusieurs actions disponibles par un processus d'essai-erreur. Dans un contexte en-ligne, on fait l'hypothèse qu'une erreur engendre une conséquence (négative). L'agent doit donc effectuer un compromis dans sa sélection d'actions à essayer, soit choisir d'accroître sa connaissance du problème en essayant des actions incertaines où se concentrer sur des actions mieux connues, mais pas nécessairement optimales.

La présentation portera sur l'utilisation du Thompson Sampling, approche classique en apprentissage par renforcement en-ligne, dans un contexte où le feedback (l'erreur) comporte plusieurs composantes (objectifs) évoluant en contradiction. L'agent ne cherchera donc plus à identifier une seule action optimale, mais plutôt un ensemble d'actions optimales représentant les divers compromis entre les divers objectifs à atteindre.




     
   
   

©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés