Catégorisation par regroupement perceptuel: Méthodologie et segmentation

Post-doctorat

Vénérée Randrianarisoa

Robert Bergevin (Directeur)

Problème: Les recherches en psychologie cognitive ont établi que même en absence de connaissances de haut niveau de la scène observée, le système visuel humain organise naturellement les éléments selon des lois appelées lois de regroupement perceptuel. Ainsi, le système visuel humain tend à grouper ensemble deux éléments qui sont symétriques, similaires, proches, parallèles, etc. David Lowe en a tiré sa théorie de non-accidentalité. Cette théorie stipule que des primitives ou des groupes de primitives ayant des caractéristiques perceptuelles telles que la similarité, le parallélisme, la symétrie, etc.… ne sont pas présentes par hasard dans l’image mais qu’ils doivent être issus d’un même objet ou d’un ensemble d’objets dans la scène. Le but du regroupement perceptuel est alors d’exploiter ces caractéristiques perceptuelles pour extraire une organisation structurelle qui représenterait un objet ou un groupe d’objets perceptuellement significatif. La plupart des méthodes de regroupement perceptuel existantes utilisent des caractéristiques perceptuelles unaires ou binaires. Par ailleurs, elles suivent une hiérarchie ascendante : ainsi, les primitives les plus saillantes respectant les lois de regroupement perceptuel sont groupées pour former un groupe qui devrait être perceptuellement significatif. Le problème qui apparaît dans ces approches est qu’elles ne proposent pas des critères globaux permettant d’évaluer la qualité globale du groupe perceptuellement saillant, car elles utilisent essentiellement des critères locaux liés aux caractéristiques perceptuelles locales. Par ailleurs, très peu de travaux utilisant des critères globaux proposent des méthodes qui traitent des groupes larges, c’est à dire formés par un grand nombre de primitives, la plupart traitent de groupes simples tels que des groupes convexes, des rectangles, des polygones…

Motivation: Notre approche diffère essentiellement de ces approches de par le fait que nous proposons de déterminer un ensemble de critères perceptuels globaux qui permettent d’extraire une catégorie d’objets. Ces critères permettront d’évaluer la qualité de la segmentation afin de déterminer si le groupe formé est perceptuellement significatif d’une part, et s’il a une bonne forme perceptuelle d’autre part.

Approche: Notre approche consiste à déterminer des critères optimum d’un objet multi-parties par des observations subjectives humaines, à formaliser les critères de qualité globaux définis par l’humain, à extraire les primitives qui optimisent ces critères de qualité globaux. Pour déterminer ces critères globaux, nous utilisons une méthodologie appelée méthodologie SAFE (Subjectivity And Formalism Explicitly). Le but de cette méthodologie est de valider le jugement humain que nous appelons SGT (Subjective Ground Truth) par le jugement issu de calculs formels que nous appelons FGT (Formal Ground Truth). Ainsi, la comparaison du jugement subjectif humain à celui du jugement formel permet d’utiliser une vérité-terrain subjective (ground truth) utile pour évaluer et valider l’algorithme proposé. Afin de mettre en oeuvre la méthodologie SAFE dans le cadre du regroupement perceptuel, nous avons mis en place un nouvel outil, SAFE-T, avec un étudiant au deuxième cycle, Jean-François Bernier. Cet outil interactif permet de générer manuellement et automatiquement des groupes formés de primitives à courbure constante (arcs de cercle et segments de droites).

Défis: La catégorisation d’objets devrait utiliser les mêmes critères que le système visuel humain pour classer un objet comme appartenant à un groupe donné. L’extraction d’un groupe perceptuellement significatif (gestalt) est un défi important mais encore plus est l’évaluation perceptuelle de ce groupe, telle que sa bonne forme représentée en psychologie cognitive par le « prägnanz ».

Applications: Nous appliquons notre approche dans la recherche des critères perceptuels globaux pour trouver la silhouette d’une catégorie d’objets, à savoir des objets multi-parties. Toutefois, l’approche pourrait être affinée par la suite vers la catégorisation d’objets plus spécifiques. Une des applications est la recherche d’images par le contenu (CBIR).

Résultats attendus: Les résultats attendus de ce projet sont la définition et la validation d’un ensemble de critères perpectuels globaux afin de catégoriser des objets multi-parties.

Calendrier: avril 2004 - avril 2005

Dernière modification: 2007/10/01 par veneree

		Accueil \| A propos \| Personnes \| Recherche \| Publications \| Événements \| Profil
		©2002-. Laboratoire de Vision et Systèmes Numériques. Tous droits réservés