TP2: On s'amuse en fréquences

GIF-7105

Louis-Philippe Asselin

Note: Pour voir les images en taille originale, clic droit et "copy image address".

Note: Les valeurs des axes fréquentiels affichés sont relatives à la fréquence d'échantillonage ((-0.5 à 0.5) == (-pi à pi) == (-Fs/2 à Fs/2))

Partie 0: Réchauffement

Accentuation des détails d'une image par l'augmentation de la contribution des hautes fréquences.

Image basses fréquences obtenue par application du filtre gaussien 2D (filtre passe bas)

Image hautes fréquences obtenue par 1 - image_basses_fréquences

Image finale est image_originale + 3*image_hautes_fréquences

Résultats (click me) Avant / Après sharpening

Partie 1: Images hybrides

Addition des basses fréquences d'une image et des hautes fréquences d'une autre image.

Les basses fréquences sont obtenues par l'application d'un filtre gaussien (filtre passe bas).

Les hautes fréquences sont obtenues par 1 - img_passe_bas.

Pour les couleurs, l'article mélange l'image basse fréquence en teinte de gris à l'image haute fréquences en couleur.

Résultats Marylin Albert (click me)

im1 im2 im12_gray

Illustration fréquentielle pour le résultat précédent.

im1 | im2 | im1_passe_bas | im2_passe haut | image finale

Résultats supplémentaires(click me)

Résultats supplémentaires

im1 im2 im12_gray im12 color im12 low-gray high-color

Commentaires sur les résultats supplémentaires:

Les images avec teinte de gris et de couleur fonctionnent bien en général.

L'image 3 (Doge deep dream et Doge régulier) ne fonctionne pas très bien. Les images sont similaires et l'image ayant le plus de hautes fréquences (deep dream) est utilisé pour la partie passe bas. Nécessairement les hautes fréquences coupées sont difficiles à voir dans le résultat.

La dernière colonne utilise une image en couleur pour les hautes fréquences et une image grise pour les basses fréquences. Comme dans l'article Hybrid images de Oliva, Torralba et Schyns, on remarque que les hautes fréquences contribuent moins à la couleur que les basses fréquences. C'est normal puisque les arrêtes sont conservées et la valeur moyenne (couleur) est atténuée. Cependant on peut tout de même percevoir les couleurs lorsque l'image est à haute résolution:

Image haute résolution avec couleur hautes fréquences seulement(click me)

Partie 2: Piles gaussienne et laplacienne

Les résultats sur l'image de Dali sont plus difficiles à voir. Les composantes dans les hautes fréquences sont moins frappantes.

Sur l'image de Einstein et Marylin, on voit beaucoup beaucoup plus les arrêtes de Einstein sur la première image. C'est attendu.

Il est important de savoir que le filtre utilisé (passe bas par une gaussienne) est loin d'un filtre passe bas idéal. Je considère que la fréquence de coupure est à une standard deviation des fréquences du filtre, c'est à dire 1/sigma.

Le processus de création de la pile gaussienne est simplement filtrer l'image originale par une gaussienne. Pour la laplacienne, l'image basse fréquence obtenue au niveau précédent est soustraite à celle du niveau courant (image du résultat du filtre gaussien).

La pile laplacienne est en fait les composants fréquentielles d'une bande de fréquence obtenue avec des filtres gaussiens.

Stacks et Pyramids (click me)

Beaucoup plus facile voir les hautes fréquences (laplace) dans l'image en noir et blanc.

C'est seulement une difficulté d'affichage. L'image suivante montre le canal rouge pour les hautes fréquences:

Crédit supplémentaire:

Implementation du filtre passe bas par un resize (sans aliasing, pour bien montrer la différence).

L'image n'est pas identique à celle de la pile mais est semblable. Ceci est probablement causé par le repliement spectral de l'opération resize 1/2.

L'intérêt de l'utilisation de la pyramide est qu'elle permet d'appliquer les filtres à des images de plus en plus petites.

L'algorithme est plus rapide et requiert moins de mémoire, comme vu dans le laboratoire 1.

Partie 3: Mélange multirésolution

Pommmage

Le processus est simple. Une pile laplacienne et gaussienne est générée pour chaque fruit et est multipliée par la pile gaussienne d'un masque binaire (découpant la moitié de l'image).

Ensuite, les piles laplaciennes sont additionnées (en plus de la dernière image gaussienne de chaque pile). Le résultat est le suivant:

Note: Pour le masque, les valeurs qui ne sont pas 0.0 sont remplacées par des 1 avant son utilisation.

masque séparation verticale

Pour l'image suivante, le masque n'a pas été découpé correctement (mon erreur sur gimp)

Toutes les images utilisées sont "free to use without attribution".

Merci!