Date limite: 29 mars 2015 à 23h59
Due Date: 23h59 on March 29th, 2015
L'objectif de ce travail est d'implémenter une application vous permettant de créer une mosaïque d'images. Une mosaïque combine plusieurs images ayant des champs de vue se chevauchant afin de produire un panorama ou une image à haute résolution. La plupart des approches d'assemblage d'images nécessitent un chevauchement très exact et des expositions identiques entre les images pour produire des résultats sans joint apparent. Lors du travail, vous allez apprendre à calculer des homographies et à les utiliser pour déformer les images. Pour le travail, utilisez les photos suivantes : images.zip.
Dans un premier temps, vous ferez le recalage (appariement des caractéristiques similaires dans les différentes images afin de transformer des ensembles différents de données dans un seul système de coordonnées) manuellement. Ensuite, vous aurez à développer une méthode de détection de points d'intérêt et d'appariement automatiques.
Dans Matlab, il existe déjà des fonctions effectuant en grande partie la tâche qui vous est demandée. Par conséquent, vous n'êtes pas autorisés à utiliser les fonctions suivantes dans votre solution: cp2tform
, imtransform
, tformarray
, tformfwd
, tforminv
, et maketform
. Bien entendu, Matlab a tout de même plusieurs fonctions très utiles que vous êtes invités à utiliser (par exemple, pour la résolution de systèmes linéaires, l'inversion des matrices, interpolation linéaire, etc.). Si vous vous demandez si une fonction particulière est autorisée, n'hésitez pas à nous le demander.
The goal of this assignment is to implement an application of image mosaicing. Image mosaicing or image stitching is the process of combining multiple images with overlapping fields of view to produce a segmented panorama or high-resolution image. Most approaches to image stitching require nearly exact overlaps between images and identical exposures to produce seamless results. Along the way, you will learn how to compute homographies, and how to use them to warp images. For the homework, use those images: images.zip.
At first, you will do the registration (matching of similar features in different images to transform different sets of data into one coordinate system) manually. Afterwards, you will have to implement a way to automatically detect and match interesting features in images.
In Matlab, there are some functions that can do much of what is needed. However, we want you to write your own code. Therefore, you are not allowed to use the following functions in your solution: cp2tform
, imtransform
, tformarray
, tformfwd
, tforminv
, and maketform
. On the other hand, Matlab has a number of very helpful functions (e.g. for solving linear systems, inverting matrices, linear interpolation, etc.) that you are welcome to use. If you are wondering whether a particular function is allowed, ask us.
L'algorithme d'assemblage de photos consiste à:
Chacune des étapes de l'algorithme sont décrites plus bas.
The image stitching algorithm can be summarized as:
All of these steps are described further down.
Comme il a été mentionné dans le cours, le calcul d'une transformation globale comme une homographie nécessite des paires de correspondances. La calcul d'une homographie nécessite au moins 4 paires de correspondances. Dans un premier lieu, sélectionnez manuellement des points d'intérêt se retrouvant dans les deux images.
Établir une correspondance entre des points peut être délicat. Une erreur de quelques pixels peut produire d'énormes changements dans l'homographie estimée. La façon standard pour créer vos correspondances est d'utiliser la souris. Vous pouvez créer rapidement une petite interface en Matlab en utilisant la fonction ginput
ou cpselect
. Après avoir défini les correspondances manuellement, il est possible (mais pas obligatoire pour ce travail pratique) de les raffiner automatiquement. Cela peut être fait par SSD ou par corrélation normalisée sur un voisinage autour des points sélectionnés dans les deux images (voir cpcorr
). Faites attention, cette approche peut parfois produire des résultats indésirables.
As it was mentioned in class, the calculation as a global homography transformation requires pairs of correspondences. The calculation of a homography requires at least 4 pairs of correspondences; you will have to manually select these interest points in both images.
Establishing point correspondences is a tricky business. An error of a couple of pixels can produce huge changes in the recovered homography. The typical way of providing point matches is with a mouse-clicking interface. You can write your own using the bare-bones ginput
function. Or you can use a nifty (but often flaky) cpselect
. After defining the correspondences by hand, it’s often useful (but not required for this homework) to fine-tune them automatically. This can be done by SSD or normalized-correlation matching of the patches surrounding the clicked points in the two images (see cpcorr
), although sometimes it can produce undesirable results.
Avant de pouvoir effectuer la déformation projective sur vos images, vous devez récupérer les paramètres de la transformation entre chaque paire d'images. Dans notre cas, la transformation est une homographie: p'= Hp, où H est une matrice 3x3 avec 8 degrés de liberté (coin inférieur droit est un facteur d'échelle et peut être mis à 1). Un moyen de récupérer l'homographie est par l'intermédiaire d'un ensemble de paires de points correspondants prélevés sur les deux images (p', p). Vous allez devoir écrire une fonction sous la forme: H = computeH(im1_pts,im2_pts)
où im1_pts
et im2_pts
sont des matrices n-par-2 contenant les positions (x, y) de n correspondances des points des deux images et H
est une matrice 3x3 étant l'homographie récupérée. Afin de calculer les valeurs de la matrice H, vous devrez créer un système de n équations linéaires (c'est-à-dire une équation de la forme Ah = b où h est un vecteur contenant les 8 inconnues de H). Si n = 4, le système peut être résolu de façon standard. Cependant, avec seulement quatre points, le calcul de l'homographie sera très instable et très sensible au bruit. Donc, plus de 4 correspondances doivent être fournies pour produire un système surdéterminé qui serait résolu en utilisant les moindres carrés. Dans Matlab, ces deux opérations peuvent être effectuées en utilisant l'opérateur "\" (voir mldivide
pour les détails).
Before you can warp your images into alignment, you need to recover the parameters of the transformation between each pair of images. In our case, the transformation is a homography: p’=Hp, where H is a 3x3 matrix with 8 degrees of freedom (lower right corner is a scaling factor and can be set to 1). One way to recover the homography is via a set of (p’,p) pairs of corresponding points taken from the two images. You will need to write a function of the form:
H = computeH(im1_pts,im2_pts)
where im1_pts
and im2_pts
are n-by-2 matrices holding the (x,y) locations of n point correspondences from the two images and H
is the recovered 3x3 homography matrix. In order to compute the entries in the matrix H, you will need to set up a linear system of n equations (i.e. a matrix equation of the form Ah=b where h is a vector holding the 8 unknown entries of H). If n=4, the system can be solved using a standard technique. However, with only four points, the homography recovery will be very unstable and prone to noise. Therefore more than 4 correspondences should be provided. This will result in an overdetermined system which should be solved using least-squares. In Matlab, both operations can be performed using the "\" operator (see help mldivide
for details).
Maintenant que vous connaissez les paramètres de l'homographie, vous devez déformer vos images à l'aide de celle-ci. Écrivez une fonction de la forme: imwarped = warpImage(im,H)
où im
est l'image d'entrée à déformer et H
est l'homographie. Vous pouvez utiliser la déformation directe ou inverse (mais n'oubliez pas que pour la déformation inverse, vous devrez calculer H dans la bonne "direction"). Évitez le recouvrement spectral lorsque vous ré-échantillonnez l'image. Pour ce faire, pensez à utiliser interp2
et essayez d'écrire toute la fonction sans boucle selon le style Matlab. Votre expérience du TP3 devrait vous être utile. Vous devez faire attention à la taille de l'image résultante (vous pouvez prédire la taille de la nouvelle image en multipliant les quatre coins de l'image avec H).
Now that you know the parameters of the homography, you need to warp your images using this homography. Write a function of the form:
imwarped = warpImage(im,H)
where im
is the input image to be warped and H
is the homography. You can use either forward of inverse warping (but remember that for inverse warping you will need to compute H in the right "direction"). You will need to avoid aliasing when resampling the image. Consider using interp2
, and see if you can write the whole function without any loops, Matlab-style. Your experience from HW3 will be very useful here. One thing you need to pay attention to is the size of the resulting image (you can predict the bounding box by piping the four corners of the image through H).
Déformez les images une à une afin de créer une mosaïque d'images. Au lieu d'écraser une image par une autre, utilisez une moyenne pondérée entre les images dans les endroits de la mosaïque où il y a chevauchement. Vous pouvez laisser une image non déformée et déformer l'autre image ou les autres images dans sa projection, ou vous pouvez déformer toutes les images dans une nouvelle projection. De même, vous pouvez déformer toutes les images d'un seul coup ou une seule à la fois pour les ajouter un par un à votre mosaïque.
Si votre mosaïque s'étend sur plus de 180 degrés, vous aurez besoin de la séparer en morceaux, ou bien d'utiliser des systèmes non projectifs, par exemple, une projection sphérique ou cylindrique.
Warp the images so they're registered and create an image mosaic. Instead of having one picture overwrite the other, which would lead to strong edge artifacts, use weighted averaging. You can leave one image unwarped and warp the other image(s) into its projection, or you can warp all images into a new projection. Likewise, you can either warp all the images at once in one shot, or add them one by one, slowly growing your mosaic.
If your mosaic spans more than 180 degrees, you'll need to break it into pieces, or else use non-projective mappings, e.g. spherical or cylindrical projection.
Maintenant que vous avez une implémentation fonctionnelle de l'algorithme d'assemblage de photos, vous devez remplacer l'étape de sélection manuelle de caractéristiques par une méthode automatique. Cette méthode peut être décrite en quelques étapes simples:
Une caractéristique de coins dans une image représente un endroit dans l'image où les gradients horizontaux et verticaux sont tous les deux très forts. Le détecteur de coin d'Harris (Harris corner detector ou Harris detector) est un algorithme classique pour la détection de coins: vous pouvez utiliser ce code Matlab: harris.m, qui l'implémente. Ne vous souciez pas de la détection de coins sur plusieurs échelles -- n'utilisez qu'une seule échelle.
Implémentez la répression maximale non adaptative (Adaptive Non-Maximal Suppression, voir l'article). L'idée est de retirer certaines caractéristiques détectées afin de ne garder que les caractéristiques les plus importantes. Si cette partie de l'article vous semble compliquée, nous vous suggérons de la relire plusieurs fois. Si elle vous êtes bloqués, vous pouvez sauter cette étape temporairement et simplement sélectionner un sous-ensemble aléatoire de coins.
Sur chacun des points caractéristiques, vous devez extraire des groupements de pixels de 8x8. Il n'est pas nécessaire d'implémenter l'invariance en rotation. Notez qu'il est très important d'échantillonner ces groupements de pixels sur une plus grande fenêtre de 40x40 afin d'avoir un descripteur légèrement flou. N'oubliez pas de normaliser (avec le biais et le gain) les descripteurs (voir l'article).
Vous devez utiliser les descripteurs pour trouver les paires de caractéristiques qui se ressemblent dans le but de les apparier. La fonction matlab dist2.m devrait vous être utile pour le calcul rapide des distances. Pour le choix d'appariement, nous vous conseillons d'utiliser l'approche simple de Lowe qui calcule le rapport entre le premier et le deuxième plus proche voisin. Consultez la figure 6b dans l'article pour vous aider à choisir le seuil.
Une fois que vous avez des appariements de caractéristiques, vous pouvez calculer une estimation de l'homographie en utilisant l'algorithme RANSAC sur 4 points expliqués en classe. Vous devez implémenter RANSAC vous-même (c'est très simple).
Implement Adaptive Non-Maximal Suppression (see article). The idea is to remove some detected features. The paper section is a little confusing; you may need to read it a few times. You may want to skip this step and come back to it; just choose a random set of corners instead in the meantime.
On each feature points, extract axis-aligned 8x8 patches. Do not worry about rotation-invariance. Note that it’s extremely important to sample these patches from the larger 40x40 window to have a nice big blurred descriptor. Don’t forget to bias/gain-normalize the descriptors (see the article).
You will need to find pairs of features that look similar and are thus likely to be good matches. You may find dist2.m useful for fast distance computations. For thresholding, use the simpler approach from Lowe of thresholding on the ratio between the first and the second nearest neighbors. Consult Figure 6b in the paper to pick the threshold.
Once you have matched features, you can compute an estimate of the homography using the 4-point RANSAC algorithm described in class. Note: you must implement RANSAC yourself (it's very easy).
Testez votre algorithme entièrement automatique sur vos propres images! Si vous prenez vos photos sans trépied, faites bien attention à ne pas tourner la tête trop significativement... rappelez-vous, le centre de projection doit être le même pour que ça fonctionne bien. Vous devez tester votre algorithme sur au moins deux scènes différentes.
Test your fully automatic algorithm on your own images! If you take photos without a tripod, be careful not to move your head too much off-center... remember, the center of projection must be the same for mosaics to work well. You must test your algorithm on at least two different scenes.
Essayez une de ces idées pour approfondir vos connaissances (et augmenter votre note):
Try one of these ideas to increase your understanding on this subject (and increase your score):
Comme lors des travaux précédents, celui-ci sera remis dans un format page Web. Rappel: le site Web n'a pas besoin d'être esthétiquement agréable; ne faites que décrire ce que vous avez fait.
Plus précisément, la page devrait:
As in the previous homework, this one will be handed in a webpage format. Remember: the aesthetics of the website will not be evaluated, but it is important that the information be presented clearly.
More precisely, the webpage should:
Ce travail est évalué sur 100 points. La répartition des points va comme suit:
This assignment is evaluated on 100 points, as follows:
Pour la remise de votre travail, créez un fichier tp4.zip
qui contient:
tp4/web
. Vos images doivent être dans un dossier tp4/web/images
.tp4/web/index.html
. De plus, assurez-vous qu'il n'y a aucun caractère spécial (accent, ponctuation, espace, etc.) dans les noms de vos fichiers, images, etc.tp4/code
. N'incluez pas les images que vous avez utilisées pour produire vos résultats dans ce dossier dans le but de ne pas alourdir le fichier.Finalement, veuillez téléverser votre fichier tp4.zip
sur pixel (http://pixel.fsg.ulaval.ca) avant la date limite. La politique des retards mentionnée dans le plan de cours sera appliquée. Pour toutes questions concernant la procédure de remise ou le travail lui-même, posez vos questions sur Piazza!
Attention! La taille limite permise sur Pixel est de 50MB. Assurez-vous que la taille du fichier tp4.zip
n'excède pas 50MB.
For this homework, you must create a tp4.zip
file. In this file you'll put:
tp4/web
. Your images for this web page should be inside a folder named tp4/web/images
.tp4/web/index.html
. Make sure none of the files have special characters (e.g. accents, punctuation, spaces, etc.) in their filenames. tp4/code
. Do not include the images you have used to generate your results inside this folder, as this will likely generate huge files.
Finally, you should upload this file (tp4.zip
) on pixel (http://pixel.fsg.ulaval.ca) before the deadline. The late submission policy described in the course plan will be applied. For any question regarding the submission process or the project as such, ask your questions on Piazza!
Beware! File size limit on Pixel is 50MB. Make sure that your tp4.zip
file size does not exceed 50MB.
Merci à Alyosha Efros d'avoir créé le TP original qui a servi d'inspiration pour celui-ci!
Many thanks to Alyosha Efros for creating the assignment which inspired this one!