Le but de ce projet est de générer automatiquement une image couleur à partir des plaques de verre numérisées de la collection Prokudin-Gorskii pour finalement concrétiser les plans de ce dernier. Pour y arriver, deux méthodes seront utilisées. Premièrement, l'approche à une seule échelle sera utilisée pour les images à faible résolution. Cette méthode consiste à diviser l'image en chacun des canaux de couleurs, les chevaucher et les aligner pour produire une image couleur. Deuxièmement, l'approche multiéchelle sera utilisée pour les images à haute résolution. Cette méthode consiste à appliquer successivement l'approche à une seule échelle à partir de l'échelle la plus petite jusqu'à l'échelle la plus grande.
Cette méthode est bien simple, l'image est divisée en 3 images de dimensions égales et chacune de ces images représente un canal de couleur. Par la suite, les canaux de couleurs sont alignés ensemble. Pour ce faire, une plage de déplacements possibles est évaluée et le meilleur déplacement est conservé. La plage de déplacement en x et y a été fixé entre [−15,15] et la fonction de score est la somme des différences au carré. Un score minimum représente le meilleur déplacement. De plus, une petite particularité a été ajouté au calcul de score pour obtenir des résultats plus précis, le score n'est pas calculé sur la totalité des pixels de l'image mais plutôt sur un groupe de pixels centraux. De cette façon, les bordures qui ont beaucoup d'influence sur le score sont ignorés. Une fois les meilleurs déplacements connus, les images sont chevauchées et l'image couleur est générée.
Résultats avec les images fournies:
Cette approche utilise l'approche à une seule échelle successivement pour diminuer le temps de calcul avec des images à haute résolution. L'échelle minimale déterminée dans le cadre de ce projet est de 1/4. Les canaux de couleurs ont donc 4 fois moins de pixels en x et y pour la première itération. L'approche à une seule échelle est donc utilisé récursivement de l'échelle 1/4 jusqu'à l'échelle maximale, soit 1 dans notre cas. Après chaque itération, l'échelle est augmentée d'un facteur 2 et du même coup le nombre de pixels en x et y double pour chaque canal de l'image, ce qui permet d'augmenter la précision de l'algorithme graduellement.
Résultats avec les images fournies:
Résultats avec 10 images pris de la collection Prokudin-Gorskii:
Résultats avec des images personnelles:
L'alignement est aussi bon même meilleur avec un appareil photo. Aujourd'hui, les photos sont prises très rapidement contrairement au siècle dernier, la scène se ressemble donc plus entre 2 photos. Si on déplace la caméra entre les photos, les bordures entre les images vont être plus grandes, le même effet qu'avec les photos de Prokudin-Gorskii. Les photos d'aujourd'hui ont donc moins de bordures puisque la caméra a moins bougé entre les photos puisque la prise de photo est rapide. Si un élément de la scène bouge, il va y avoir du ghosting puisque des éléments dans la scène ne sont pas au même endroit lorsque les images sont superposées.