Le but de ce projet est d'implémenter un algorithme qui, selon trois images indépendantes de trois canaux de couleurs, produit une image couleur en sortie. Différentes techniques seront utilisées pour permettre de trouver l'alignement optimal des trois images dans un temps raisonnable. Par la suite, ces techniques seront testées sur des images de différents formats en de différentes tailles tirées de la collection de Sergei Mikhailovich Prokudin-Gorskii. Finalement, les techniques seront testées sur une série de trois images dont les trois canaux de couleurs ont été extraits.
Pour cette partie, j'ai écrit un algorithme très simple qui effectue une recherche exhaustive sur un intervalle de [-15:15] pixels, tel que suggéré dans l'énoncé du travail. Cet algorithme est constitué de deux boucles imbriquées qui calculent les déplacements nécessaires, en x et en y, afin d'obtenir obtenir un alignement optimal des trois canaux de couleur. Pour ce faire, il suffit de minimiser la somme des différences aux carrés entre les deux images que l'on veut aligner.
Cette technique est efficace pour de petites images, mais le calcul de l'alignement devient rapidement long et inefficace lorsqu'on utilise l'algorithme pour aligner de grosses images.
Pour cette partie, j'ai développé un algorithme qui se base sur le principe d'une pyramide d'images afin de réduire le temps de recherche des déplacements. Je me suis inspirée des explications et des résultats présentés dans la page d'un étudiant de la session dernière (voir la section "Sources" au bas de la page). Cette approche est beaucoup plus rapide que celle à une seule échelle puisque le fait de diminuer la taille de l'image permet de trouver plus rapidement l'alignement optimal sur l'image de petite taille. Lorsque celui-ci est trouvé, il ne suffit que de remonter la pyramide d'images et de multiplier la translation calculée par 2. Par contre, en multipliant la taille de l'image par 2, la translation peut aussi avoir changé de 2 pixels. Il faut donc recalculer la somme des différences aux carrés pour s'assurer du meilleur alignement possible. Cependant, il n'est pas nécessaire de tester toutes les possibilités, un intervalle de [-3,3] suffit à couvrir les changements qui ont pu être occasionnés par le redimensionnement de l'image.
Je constate que l'alignement basé sur la somme des différences aux carrés est plus efficace sur des images de petite taille (.jpg). Son utilisation à une seule échelle sur des images de plus grande taille est beaucoup trop longue et ne donne pas de bons résultats. L'approche à échelles multiples peut permettre de remédier à la lenteur de l'approche à une seule échelle, mais elle n'améliore que de peu le résultat de l'alignement final.
Je me suis basée sur l'ébauche de code Matlab ainsi que sur l'ébauche de page web fournie dans l'énoncé du travail.
Je me suis également inspirée des explications présentées dans la page des résultats d'un étudiant de la session dernière lors de la conception des fonctions "reduction" et "bestAlignPyramid".