Histogramme (imagerie numérique)
En imagerie numérique, l’histogramme est la représentation graphique de la distribution des pixels d'une l'image, ou d'une partie d'image, selon leur intensité. La forme la plus classique répartit la plage d'intensité sur l'axe horizontal, le noir ou les tons sombres étant situés à l'origine du graphique. En tenant compte du nombre de pixels, l'histogramme peut être représenté en termes de proportions ou de probabilités.
Descriptions élémentaires des images, les histogrammes sont au cœur des processus d'acquisition et des opérations de traitement d'images.
Diverses opérations peuvent produire des histogrammes dérivés d'un histogramme original et correspondant à des transformations de l'image initiale. L'analyse de leurs histogrammes permet la comparaison de variantes d'images selon différents paramètres.
Définition
[modifier | modifier le code]Pour une seule composante ou une image monochrome, l'histogramme est défini comme une fonction discrète qui associe à chaque valeur d'intensité le nombre de pixels ayant cette valeur. La détermination de l'histogramme consiste à compter le nombre de pixels pour chaque intensité présente dans l'image. Une quantification, qui regroupe quelques valeurs en une seule classe, peut améliorer la représentation ou le traitement de la distribution.
Distributions inégales
[modifier | modifier le code]Dans la plupart des contextes, hors le cas des images assimilables à des images binaires, les images de qualité ont un histogramme plus ou moins équilibré avec des valeurs présentes pour un grand nombre d'intensités réparties entre les hautes et les basses valeurs. A contrario, une image pauvre en valeurs moyennes, aura une distribution d'histogramme en U ; la forme inverse (cloche resserrée ou pic) traduisant le défaut d'une image grisâtre, mal contrastée. De même, un tassement des valeurs d'un côté ou de l'autre est la marque d'une image globalement sombre (sous-exposée) ou claire (sur-exposée).
Ces défauts, éventuellement cumulés, sont réductibles par une des opérations d'égalisation.
Expression probabiliste
[modifier | modifier le code]Les histogrammes sont en général normalisés en divisant la valeur de chaque classe par le nombre de pixels. La valeur d'une classe varie alors entre 0 et 1, et peut s'interpréter comme la probabilité d'occurrence de la classe dans l'image. L'histogramme peut alors être vu comme une densité de probabilité[1]. Pour une image {x} en niveaux de gris codée sur niveaux, on définit nk le nombre d'occurrences du niveau xk. La probabilité d'occurrence d'un pixel de niveau xk dans l'image est :
avec n le nombre de pixels de l'image, et px définit alors l'histogramme normalisé sur [0,1].
On définit également l'histogramme cumulé, somme partielle des probabilités d'occurrence :
Il peut s'interpréter comme la fonction de répartition associée à la variable aléatoire {x}.
Exemple
[modifier | modifier le code]Exemple de construction d'un histogramme d'une image couleur, dans l'espace RGB, sur les composantes rouge et bleue uniquement : Chaque composante est quantifiée en quatre intervalles, ce qui donne un nombre de classes de . On peut alors représenter la table suivante par un histogramme 3D, où l'axe représente la composante bleue, l'axe représente la composante rouge et l'axe vertical est le nombre de pixels de chaque classe. Cet histogramme n'est pas normalisé.
Rouge | ||||||
0-63 | 64-127 | 128-191 | 192-255 | |||
Bleu | 0-63 | 43 | 78 | 18 | 0 | |
64-127 | 45 | 67 | 33 | 2 | ||
128-191 | 127 | 58 | 25 | 8 | ||
192-255 | 140 | 47 | 47 | 13 |
Propriétés
[modifier | modifier le code]Les histogrammes ne sont pas modifiés par certaines transformations de l'image, telles que les rotations et les translations, ainsi que dans une moindre mesure les changements de point de vue, et les changements d'échelle[2].
Une propriété intéressante est leur facilité de calcul, puisqu'il ne s'agit que de comptage de pixels, ce qui se prête bien à une implémentation matérielle. Les histogrammes sont donc souvent utilisés pour des applications temps-réel[1].
Types
[modifier | modifier le code]Images en couleur
[modifier | modifier le code]Pour les images en couleur, on peut considérer les histogrammes des trois composantes indépendamment, mais ce n'est en général pas efficace[3]. On construit plutôt un histogramme directement dans l'espace couleur. Les classes de l'histogramme correspondent désormais à une couleur (ou un ensemble de couleurs, en fonction de la quantification), plutôt qu'à une intensité.
Un histogramme peut être construit dans n'importe quel espace de couleur, (RVB, HSV), ou sous-ensemble de cet espace, ainsi que pour les images multispectrales ou hyperspectrales.
Histogramme partiel ou local
[modifier | modifier le code]Il est possible de ne calculer l'histogramme que pour toute partie de l'image, de forme arbitraire, ou au voisinage d'un point, on parle alors d'histogramme local.
Histogramme pondéré
[modifier | modifier le code]Un histogramme pondéré est un histogramme où la couleur d'un pixel ne vaudra pas 1 point de plus dans l'histogramme mais plutôt un poids défini en fonction de la position du pixel. Par exemple, les pixels centraux de l'image auront plus de poids dans l'histogramme (plus d'importance) que les pixels périphériques.
Histogramme conjoint
[modifier | modifier le code]Histogramme intégral
[modifier | modifier le code]L'histogramme intégral est une représentation qui permet un calcul rapide d'histogrammes locaux, dans n'importe quelle région de l'image. La méthode a été proposée en 2005, et s'inspire de la représentation proposée pour les images intégrales[4].
Traitements
[modifier | modifier le code]Égalisation d'histogramme
[modifier | modifier le code]L'égalisation d'histogramme est une méthode d'ajustement du contraste d'une image qui utilise l'histogramme. Elle consiste à appliquer une transformation sur chaque pixel de l'image, et donc d'obtenir une nouvelle image à partir d'une opération indépendante sur chacun des pixels. Cette transformation est construite à partir de l'histogramme cumulé de l'image de départ.
L'égalisation d'histogramme permet de mieux répartir les intensités sur l'ensemble de la plage de valeurs possibles (0 à 255 en général pour des images 8 bits), en « étalant » l'histogramme. Théoriquement (cas continu) l'histogramme devrait même être plat (loi uniforme continue). Toutefois à cause de la discrétisation, ceci est rarement le cas[5].
L'égalisation est intéressante pour les images dont la totalité, ou seulement une partie, est de faible contraste (pixels d'intensité proches). La méthode est rapide, facile d'implémentation, et complètement automatique (i.e. pas de réglages)[5].
Spécification d'histogramme
[modifier | modifier le code]Il n'est parfois pas pertinent de chercher à obtenir un histogramme uniforme par égalisation. La spécification d'histogramme est une méthode permettant de générer une image ayant une forme d'histogramme déterminée[6].
Si l'on souhaite obtenir un histogramme de forme , à partir d'une image originale à niveaux de gris, d'histogramme , alors la transformation est obtenue de la manière suivante :
La transformation par égalisation de l'image originale est donnée par
La transformation par égalisation de l'image souhaitée est
L'égalisation de l'image originale et l'image transformée doit aboutir au même histogramme égalisé, on a donc
- d'où
L'image transformée peut donc être obtenue avec l'histogramme spécifié , à partir des transformations (obtenue à partir de ) et (égalisation classique de l'image originale).
Mesures de similarité
[modifier | modifier le code]Dans de nombreuses applications, il est utile de calculer une distance (ou plus généralement une mesure de similarité/dissimilarité) entre histogrammes. Par exemple pour étudier les variations temporelles du contenu visuel dans une vidéo, ou pour trouver des images similaires à une image requête. On définit pour cela un certain nombre de distances pour mesurer si deux histogrammes sont « proches » l'un de l'autre. Soit et deux histogrammes de même taille (i.e. avec le même nombre de classes)
- Intersection :
- Corrélation : , où .
- Chi-2 :
De nombreuses autres mesures sont possibles, notamment la divergence de Kullback-Leibler et la distance de Bhattacharyya, puisque la comparaison d'histogrammes se ramène à une mesure de dissimilarité entre deux distributions de probabilités.
Applications
[modifier | modifier le code]L'histogramme est un outil de base en traitement d'images, il est utilisé dans de très nombreuses applications et méthodes[1].
Rehaussement d'images
[modifier | modifier le code]L'égalisation d'histogramme, qu'il soit global, ou appliqué de manière locale, est un outil très utilisé pour l'amélioration du contraste, et donc le rehaussement. De même, la spécification d'histogramme peut être utilisée pour le rehaussement.
Il est également possible d'utiliser les statistiques de l'histogramme (moyenne, variance) pour l'amélioration de l'intensité et du contraste[7].
Segmentation en plans
[modifier | modifier le code]Une segmentation en plans consiste à détecter les différents plans d'une vidéo. Pour cela, une méthode consiste à calculer un histogramme pour toutes les images de la vidéo, et d'étudier ensuite les variations temporelles des distances entre histogrammes consécutif. Une distance faible étant synonyme de similarité visuelle, et une distance élevé reflétant un fort changement visuel. Les changements de plans sont alors détectés comme étant les pics de ces variations temporelles.
Les histogrammes sont la méthode privilégiée pour la segmentation, qui donne les résultats parmi les plus robustes, tout en étant de faible complexité[8].
Reconnaissance d'objets
[modifier | modifier le code]Un histogramme peut être utilisé pour détecter, de manière simple, la présence d'un objet caractérisé par sa couleur spécifique[9].
Ceci fournit une vue d'ensemble bien plus compacte des données dans une image que de savoir la valeur exacte de chaque pixel. L'histogramme de couleurs d'une image est invariable selon la translation ou de la rotation de l'axe de vue, et varie progressivement selon l'angle de vue. Ce qui fait que l'histogramme de couleurs est un outil particulièrement intéressant pour la reconnaissance d'objets ayant une position et une rotation inconnue par rapport à la scène.
L'inconvénient principal de cet histogramme est que la représentation obtenue dépend seulement de la couleur de l'objet étudié, par ce fait il n'y a pas de moyen de distinguer la différence entre une tasse rouge et blanche d'une autre tasse blanche et rouge. En d'autres termes, l'algorithme de l'histogramme de couleurs n'a pas d'idée générale de la tasse, seulement de son nombre de couleurs, alors on ne peut la comparer avec une tasse bleue et blanche, car les informations obtenues ne seront pas semblables.
Suivi d'objets
[modifier | modifier le code]Photographie
[modifier | modifier le code]L'histogramme est un outil utile pour beaucoup de photographes. Il permet notamment de savoir très rapidement s'il existe des zones bouchées (noir complet) ou brûlées (blanc pur) dans la photographie. L'histogramme permet de contrôler la qualité de l'exposition de manière objective[10]. C'est toutefois une vision théorique des choses : il est impossible à un histogramme ne comportant qu'un nombre très limité de points d'affichage de rendre compte des valeurs de tous les pixels d'une photographie en comportant des millions. Cette méthode n'est pas fiable pour exposer correctement car, en photo numérique, il importe avant tout de garder des détails dans les tons clairs[11]. Pour vérifier s'il existe des zones de l'image surexposées le seul moyen vraiment efficace sur le terrain est la fonction de clignotement des zones écrêtées disponible sur la plupart des reflex numériques et certains autres modèles.
Il est important de considérer que l'histogramme peut être analysé correctement quel que soit l'écran utilisé et ses réglages, alors que la lecture d'une image seule ne sera pas juste si l'écran utilisé n'est pas bien calibré. L'histogramme est un moyen de vérifier certaines informations juste après la prise de vue.
Bibliographie
[modifier | modifier le code]- (en) Rafael C. Gonzalez et Richard E. Woods, Digital Image Processing, Pearson Prentice Hall,
- (en) Anil K. Jain, Fundamentals of Digital Image Processing, 1989.
Notes et références
[modifier | modifier le code]- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 120
- MJ Swain, DH Ballard: Color Indexing, International Journal of Computer Vision, 1991, p. 13
- Gonzalez, Woods (2008), Color Image Processing p. 438
- Porikli, F., "Integral Histogram: A Fast Way to Extract Histograms in Cartesian Spaces", proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2005
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 127
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 128-138
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 140-144
- (en) John S. Boreczky and Lawrence A. Rowe, « Comparison of video shot boundary detection techniques », Storage and Retrieval for Image and Video Databases (SPIE), 1996.
- MJ Swain, DH Ballard: Color Indexing, International Journal of Computer Vision, 1991
- Chasseur d'Images, n° 328, novembre 2010, p. 112
- Scott Kelby, Zoom sur la photo numérique, Pearson, (ISBN 978-2-7440-9289-3), p. 177