Avant sharpening | Après sharpening |
---|---|
Image Basse Fréquence | Image Haute Fréquence | Résultat |
---|---|---|
(Source) |
(Source) |
|
(Source) |
(Source) |
|
hitler(Source) |
chaplin(Source) |
|
(Source) |
(Source) |
Mon résultat préféré est la photo hybride du chat et du renard. Les transformés de Fourier 2D de ses images sont montrées ci-dessous. On peut voir que l'utilisation du filtre gaussien sur l'image du chat vient atténuer toutes hautes fréquence, il ne reste que les basses fréquence de l'image. L'image du chat contient beaucoup d'information haute fréquence à cause de la présence de nombreux poils, le filtre gaussien vient éliminer ses informations.
L'image de renard a été recadré durant alignement, cela a créé une bordure qui visible dans FFT. Contrairement au chat, la croix qui est visible sur la FFT n'est pas parrallèle aux bordures de l'image. Après le filtre passe-haut uniquement les contours de l'images et les détails sont conservés.
La FFT de l'image hybride montre la présence des croix des deux images ont été fusionné. De plus, les basses fréquences sont similaire aux basses fréquences la FFT du chat avant le filtre passe-bas.
La première ligne représente l'image original ayant subit divers niveaux de filtre gaussien(sigma = 2, 4, 8, 16 et 32). La seconde ligne est la pile laplacienne de l'image original. Chacune de ses images sont la subtraction entre l'image gaussienne au même niveau et l'image gaussienne du niveau précédente. Les images de la pile laplacienne ont été ajusté via imadjust() pour avoir un résultat plus visible.
Le procédé utilisé pour générer les mélanges multirésolutions est de faire une pile gaussienne pour les deux images et le masque, de créer une pile laplacienne pour chacune des images à partie de la pile gaussienne faisant la différence entre deux niveaux de la pile gaussienne, d'appliquer la pile du masque sur les piles laplaciennes, de fusionne la pile résultante en une image et finalement de rajouter à cet image le restant de la pile gaussienne.
L'image suivant montre le mélange d'une image de pomme et d'orange. La première ligne montre l'image de gauche soumit à des filtres gaussiens de différents niveaux. La seconde ligne représente la pile des masques soumit à différents filtres gausiens. La troisième ligne montre la pile de laplacienne de l'image de pomme après avoir subit le masque. La quatrième ligne montre la même chose que la précédente pile, mais pour l'image de l'orange. La cinquième ligne montre l'addition des deux précédentes piles.
Voici le résultat de l'addition des piles laplaciennes, la dernière image de la pile gaussienne des deux images ont été aussi rajouté pour avoir les fréquences manquantes:
Deux premières images hybrides ont été assez réussi, l'image résultante a été résonnablement mélangé sans la présence d'erreur évidente. L'image avec le penguin est la plus raté, puisque l'on peut clairement voir que deux images n'ont pas été prise avec la même caméra. Puisque l'image de fond est de mauvaise qualité, on peut voir une multitude de "grain". Puisque ses grains sont des hautes fréquences, elles ne sont pas transmit sur le penguin lors de la fusion. Une des solutions à ce problème serait de transmettre une seul laplacienne de haute fréquence sur le penguin. Par contre, les lignes de signalisation traverseraient le penguin, si l'on appliquerait cette solution.
Image A | Image B | Masque | Résultat |
---|---|---|---|
(Source) |
(Source) |
||
(Source) |
(Source) |
||
(Source) |
(Source) |
Le mélange des images s'est bien déroulé. Le seul problème rencontré est que sur l'image du laptop, l'éclérage a causé la présence de "grain". Ses grains permettent de voir clairement où commence et où fini la fusion de l'image. Pour l'image du castor et de la neige, la fusion a été très facile, puisque la texture de la neige est uniforme.
Image A | Image B | Masque | Résultat Cliquez pour voir |
---|---|---|---|
Le résultat du transfère de style est impressionant contenue de la simplicité de l'algortihme. La première image est bien réussie et l'éclairage de l'exemple a été parfaitement transmit sur l'image d'entrée. On peut même remarquer que les poiles de barbe sont devenues plus visible. Cela démontre qu'autant le style des hautes fréquences(poiles) et le style des basses fréquence(éclairage) ont été transfèré. L'utilisation du transfère d'energie local permet de transfèrer les hautes fréquences. Les basses fréquences de l'image d'exemple sont tranfèrées sur l'image d'entrée par le rejet des basses fréquences de l'image d'entrée.
L'image avec Bill Gate très différente de l'image d'entrée: présence de lunnettes et un éclairage avec un fort contrast. Malgré ses l'imitations le résultat est excellent, le visage est assombrie aux bonnes endroits. Le seul bémol est le halo blanc autour de tête du sujet, cela est causé par la différence du background entre l'image d'entrée et l'image d'exemple. L'article utilise un masque pour enlever le background des images d'entrée, j'ai essayer un masque, mais j'ai découvert que le masque était trop peu détaillé. L'effet d'halo est présent sur les autres images, mais puisque le background sont similaire entre les images d'entrées et les images d'exemple, cela est moins remarquable.
La dernière paire d'image montre la principale limitation de l'algorithme: les visage doit être aligné et de même dimension. Si les visages ne sont pas alignés, alors les mauvaises zones de l'image sont éclairées.
Image d'entrée | Image d'exemple | Résultat |
---|---|---|
| | |
| | |
| |