Reconnaissance générique de l’objet principal d’une scène 2D par l’étude des relations entre les primitives de contour

Maîtrise

Alexandre Filiatrault

Robert Bergevin (Directeur)

Problème: La reconnaissance générique sans connaissance à priori sur les sujets d’une image est un domaine d’intérêt de longue date en vision numérique. La difficulté est de trouver les caractéristiques propres d’un objet réel qui le différencient de son entourage immédiat. Or ces caractéristiques diffèrent souvent d’une image à l’autre, ce qui nous pousse à vouloir utiliser plus d’un type de discrimination à la fois pour améliorer la segmentation et mieux isoler le contour de l’objet principal d’une scène par rapport à l’intérieur de cet objet et le fond de scène.

Motivation: Un système de reconnaissance générique « idéal » en vision numérique en deux dimensions comporte trois éléments essentiels, soient la segmentation de régions d’intérêt, la catégorisation de ces dernières en entités selon ses caractéristiques globales et l’association des entités ainsi trouvées avec une de celles d’une banque de connaissance établie à priori. Ces trois étapes étant chacune essentielles à un bon fonctionnement, le but de ce projet est de contribuer à l’avancement des connaissances sur l’étape de segmentation.

Approche: Le projet s’appuie sur la méthodologie SAFE qui consiste à :

Définir les résultats attendus pour chaque type d’image.
Choisir les images sur lesquelles l’algorithme sera testé
Choisir des critères subjectifs d’évaluation de solution.
Déterminer des critères formels, mathématiques d’évaluation de solution.
Concevoir, implanter et appliquer les algorithmes de résolution nécessaires à la résolution du problème sur les images choisies.
Donner des scores aux solutions obtenues et les comparer aux scores formels.
Modifier l’algorithme de résolution si nécessaire.

L’approche proposée pour identifier les parties importantes d’une images s’appuie principalement sur l’étude des primitives de contour. Elle consiste en l’utilisation des caractéristiques de ces primitives en vue de les regrouper et ensuite leur donner une mesure d’importance. Les données de regroupement incluent la couleur, la position, l’orientation, la longueur et le rayon dans le cas d’une primitive d’arc de cercle.

La suite du traitement à l’étude procède de façon itérative en vue de converger vers une solution où toutes les primitives sont en équilibre dans leurs relations avec les autres. Cette solution doit faire une discrimination la plus forte possible pour à la fois exclure un maximum de primitives non désirées, représentant des textures ou des parties d’arrière scène, et garder la grande majorité des données permettant d’identifier et de caractériser l’objet principal. Cette approche est réalisée en vue d’être combinée à d’autres pour obtenir des résultats supérieurs à l’aide d’images d’entrées complexes. Par la suite il sera possible de caractériser les objets ainsi trouvés et les identifier à l’aide d’une base de connaissance.

Défis: Les défis inhérents à une telle approche sont nombreux et complexes. Il faut mettre au point des algorithmes discriminants qui isolent efficacement l’objet principal d’une scène tout en gardant à l’esprit que les caractéristiques qui unissent les primitives à garder diffèrent grandement d’une image à l’autre. Il faut aussi tenir compte du bruit présent dans toute image numérique, la résolution limitée des images, la quantité de mémoire présente dans l’outil de traitement ainsi que la vitesse des outils de calcul. Un autre défi est celui de résoudre les problèmes reliés aux changements lents d’intensité. Ceux-ci sont moins enclins à produire des primitives et peuvent donc nuire aux traitements.

Applications: La mise au point d’un mécanisme de recherche d’objet principal est un pas important dans le processus de reconnaissance générique sans connaissance à priori. Cette habilité à reconnaître efficacement son environnement de façon automatique est très utile dans des domaines tels la robotique et la réalité virtuelle.

Calendrier: septembre 2004 - décembre 2007

Dernière modification: 2007/10/01 par afiliatr

		Accueil \| A propos \| Personnes \| Recherche \| Publications \| Événements \| Profil
		©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés