Guinslym:: My Blog

Introduction aux Métadonnées d'une image

Je me suis intéressé aux métadonnées des images parce que le Musée des Sciences et de la Technologie du Canada a mis disponible sur leur portail un ensemble de photographie en donnée ouverte (open source) et j'ai voulu savoir ce que ces métadonnées contiennent comme information.

Définition:

Métadonnée: Ce sont des informations permettant de décrire une ressource. Ces informations sont soit internes ou externes. Interne veux dire que la ressource elle-même contient des métadonnées par exemple, toute cellule contient l'acide désoxyribonucléique (ADN). L'ADN est en soit une métadonnée décrivant le bagage génétique de l'organisme qui le porte (un être humain, une plante...).


Ceci est une œuvre de Dale Chihuly. Alors, j'ai moi-même associé une information (une étiquette) à cette image donc, c'est une métadonnée externe. Que l'information soit vraie ou fausse le fait de l'associée à un objet( ex: une image) me permet de caractériser cette image dans le but de le catégoriser.


Autres définitions utiles:


L’Exchangeable image file format ou Exif est une spécification de format de fichier pour les images utilisées par les appareils photographiques numériques. Il a été établi par le Japan Electronic Industry Development Association (JEIDA). Cette spécification repose sur des formats existants tels que JPEG, TIFF version 6.0 et RIFF format de fichier audio WAVE, en y ajoutant des balises de métadonnées. L’Exif n’est pas supporté avec les formats JPEG 2000 ou PNG. source
IPTC: L'Information Interchange Model (IIM) est une structure et un jeu d'attributs de métadonnées applicable à des fichiers texte, des images et d'autres types de média. source

La différence entre les deux c'est que L'EXIF est un ensemble d'informations crées par l'appareil de photographie numérique ou par un logiciel lors de la création de l'image. Donc la création de métadonnées avec le standard EXIF est automatique et obligatoire, surtout pour les appareils de photographie numérique. Les métadonnées de l'IPTC dépendent de l'auteur de l'image : Est-ce que je veux ajouter les coordonnées géographiques, un droit d'auteur (copyright)... L'IPTC dépend aussi du logiciel utilisé pour créer l'image. Par exemple, un logiciel de photographie insère des métadonnées lors de la création de l'image ou de l'édition de celle-ci.

Pour ajouter un peu plus de confusion :) certains logiciels ont leur propre standard de métadonnées par exemple XMP (Extensible Metadata Platform) dans le cas d'Adobe Photoshop. Alors en plus de l'EXIF et de l'IPTC il peut y avoir d'autres standards de métadonnées.

Puisse que chaque standard à sa version par exemple EXIF (version 2.1.0), à chaque version ils ajoutent des métadonnées qui peuvent rentrer en conflit avec d'autres standard par exemple copyright, description, l'orientation de l'image (portrait ou paysage) peuvent se retrouver dans 'EXIF, l'XMP et l'IPTC alors pour ne pas faire de redondance, lors de la création du fichier numérique, le logiciel choisi la métadonnée qu'il veut, dans le cas d'Adobe Photoshop il priorisera sûrement sa version de copyright pour créer le fichier.


Quelles sont les métadonnées d'une image.



J'aimerais savoir comment est-ce que je peux reproduire cette image le plus fidèlement que possible. Alors j'aimerais savoir que contiennent les métadonnées de cette image.

Il y a plusieurs métadonnées qui peuvent se retrouver sur une image. C'est difficile d'en déterminer le nombre, cela dépend de l'appareil ou du logiciel utilisé lors de la création de l'image. Voici les métadonnées de l'image ci-haut (les cyclistes):

J'ai utilisé le logiciel Exiftool pour me permettre d'afficher les métadonnées mais il y existe plusieurs logiciels gratuit sur la toile qui vous permettra d'afficher les métadonnées par contre mais je vous recommande exiftool.

Des métadonnées affichées ci-haut dans le cadre, il y a des informations intéressantes pour tout le monde. Il contient des informations sur (Le modèle de la caméra, le logiciel utilisé pour éditer l'image, la version de l'EXIF, des informations géographiques, la miniature ou vignette (thumbnail) qui apparait le dossier où est placé l'image.). J'ai spécialement choisi cette image parce qu'il contient plusieurs métadonnées et de standard de métadonnées (XMP, IPTC et EXIF) juste pour démontrer que la liste peut être très longue. Mais, comme je l'ai mentionné plus haut le nombre de métadonnées que peuvent inclure une photo varie énormément. Voici un autre exemple celui-ci pris des données ouvertes qu'offre le Musée des Sciences et de la Technologie du Canada.


Donc, il y a vraiment peu de métadonnées pour la photo de la caisse enregistreuse.



Limite

Une image jpg peut contenir un maximum de 64kb de métadonnées. Alors on peut pas ajouter des métadonnées à l'infini. C'est sûr qu'il y a moyen de contourner la limite de 64kb imposée... Mais je ne veux pas entrer dans cette discussion. Ce qui est important de savoir c'est que L'EXIF et l'IPTC spécifient chacun quels sont les métadonnées qu'il faut absolument qu'une image contiennent, ensuite il appartient à la caméra numérique ou au logiciel, voire aussi l'utilisateur, d'ajouter des métadonnées. Donc, il y a un minimum de métadonnée à avoir et un maximum de métadonnée (en taille = 64kb), qu'une image pourra contenir.



Métadonnée et conversion du format de l'image

Je vais utiliser un logiciel en ligne de commande: imagemagick. Je vais convertir l'image des cyclistes de jpg en png. Voici les métadonnées après la conversion:

jpg en gif

jpg en pdf

jpg en tiff: Presque le même résultat que de jpg en png

Pour comparer la différence des fichiers ci-haut, vous pouvez les télécharger et ensuite exécuter en ligne de commande (Unix/Linux)

         diff premier_fichier.txt autre_fichier.txt | grep ">"
        

Parmi les différences; pas de métadonnées concernant les coordonnées géographique (GPSInfo) ni du modèle de caméra utilisé. Par contre, si vous répétez la conversion avec un autre logiciel (i.e. PaintShop pro) le résultat peut être différent.

Aussi quand vous téléversez des photos sur certains médias sociaux, par exemple Facebook, certaines métadonnées peuvent être supprimées, par exemple les coordonnées géographiques.


Voici ce qui conclut une introduction pratique aux métadonnées d'une image. Il y a beaucoup plus d'informations concernant l'EXIF et autres standards de métadonnées d'image que je n'ai pas couvert dans cette article, je vous conseille, si voulez en savoir plus, d'aller sur la page web de Phil Harvey. Malgré le design un peu archaïque, il contient plus d'information que wikipedia :)

References:

Guinsly Mondésir Ottawa

Web developer - Pythonist - Rubyist

EXIF XMP Metadata IPTC