Logo LVSN
EnglishAccueil
A proposPersonnesRecherchePublicationsEvenementsProfil
A propos

 

 

 

 

CERVIM

REPARTI

MIVIM

Recherche d’images dans une base de données par des algorithmes de reconnaissance d’objets
Doctorat
Guillaume-Alexandre Bilodeau
Robert Bergevin (Directeur)
Problème: L’émergence des technologies de l’information fait en sorte qu’un grand nombre d’images et de séquences vidéo doivent être traitées automatiquement par des ordinateurs. C'est le cas pour la recherche d’images dans une base de données et les applications de télésurveillance. Les systèmes actuels de recherche d'images sont limités dans leurs utilisations, car les objets dans l'image ne sont pas modélisés adéquatements. La texture, la couleur et la forme 2D des objets ne les caractérisent pas suffisamment bien. Les modèles sont sensibles aux points de vue, et la couleur et la texture sont des éléments de distinction très important alors qu'en réalité, ils sont secondaires.
Motivation: Dans le cadre de cette problématique, et dans le but d’améliorer les connaissances dans le domaine de la reconnaissance d’objets, le but de ce projet de thèse est de proposer un modèle de représentation, de concevoir un logiciel et des outils qui permettent la reconnaissance et la comparaison d’objets manufacturés multi-parties en premier plan dans des images.
Approche: L’approche préconisée pour atteindre les objectifs énoncés est inspirée de deux théories en psychologie cognitive. La première théorie énoncée par Biederman a été développée suite à diverses expériences avec des sujets humains. Ces expériences montrent que les humains perçoivent les objets comme des hiérarchies de regroupement de primitives. La deuxième théorie énoncée par Lowe montre que si on présente à des humains des segments de droite disposés de façon quelconque dans une image, et qu’on leur demande de grouper ces segments par paire, l’humain groupe de façon naturelle les segments de même longueur, de plus grande proximité, de même orientation et ayant le plus grand niveau de recouvrement. Cela constitue les lois du regroupement perceptuel. Le modèle théorique de représentation des objets utilisé dans le cadre de ce projet est basé sur la première théorie, tandis que les algorithmes utilisés pour obtenir le modèle sont basées sur la deuxième théorie. Ainsi, le modèle théorique pour la représentation d’un objet consiste en un graphe attribué où les nœuds sont des solides volumétriques simples, alors que les arcs donnent les informations sur l’arrangement spatial des solides volumétriques. La théorie sur le groupement perceptuel est utilisée dans les algorithmes qui contribuent à la construction du modèle. En effet, les projections des solides volumétriques du modèle peuvent être perçues comme des segments de droite et d’arcs de cercle qui perceptuellement forment un groupe. Ainsi, les algorithmes pour la création du modèle font des groupements de lignes conforment aux lois de regroupement perceptuel humaines.
Défis: La comparaison et la recherche d’images requièrent un logiciel avec un habileté semblable à un opérateur humain. L’utilisation de la couleur, de texture et de points d’intérêt dans les images n’est pas suffisante, puisque deux chaises, par exemple, peuvent être de couleur différente et de dimensions et proportions différentes. La recherche et la comparaison d’images ou de séquences vidéo doivent être effectuées au niveau sémantique de base de l’identité de l’objet (ex : chaise, lampe, table, humain, etc.) et en tenant compte du contexte dans lequel est l’objet. Or, à ce jour, aucun logiciel ou algorithme offre cette fonctionnalité. L’incapacité de concevoir de tels algorithmes vient de la difficulté à diviser une image pour obtenir les différents objets qu’elle contient, de la difficulté à modéliser les formes de façon générique, et de la difficulté à faire abstraction des reflets, des textures, des ombres et des distorsions causées par le processus de prises d’images.
Applications: Recherche d'images dans des bases de données d'objets manufacturés, télé-surveillance, système de vision robotique.
Résultats attendus: Les résultats attendus de ce projet sont la proposition et conception d'un modèle théorique de représentation applicable en pratique pour décrire des objets manufacturés, de mettre au point des algorithmes pour comparer les objets décrits, de tester les performances des algorithmes développés et de comprendre à partir de ces résultats les difficultés spécifiques liées à l'approche choisie.
Calendrier: mai 1999 - décembre 2003
Support: Ce projet est supporté par des bourses du Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG) et du Fonds pour la Formation de Chercheurs et l’Aide à la Recherche (FCAR).
Référence web: /~bilodeau/plastique.html
Dernière modification: 2007/09/28 par bilodeau

     
   
   

©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés