La notion de granularité définit la taille du plus petit élément, de la plus grande finesse d'un système. Quand on arrive au niveau de granularité d'un système, on ne peut plus découper l'information.
J’ai répondu ce matin à la question d’un client qui me demandait de lui préciser ce qu’était la « granularité des contenus » sur un site web. C’est une question bien légitime qui me rappelle que bien souvent, nous utilisons un vocabulaire technique qui se rapproche du jargon et qui, par conséquent, demande éclarcissement.
J’ai donc décidé de publier la réponse ici puisque je considérais le sujet digne d’intérêt pour les lecteurs de mon blog.
Dans le cadre d’une analyse de l’architecture de l’information, il faut évaluer la répartition des contenus par rapport à leur niveau de profondeur sur le site. Généralement, les sites qui fonctionnent le mieux sont ceux qui répartissent bien l’information, c’est-à-dire que les contenus des premiers niveaux sont très segmentés et relativement superficiels (on voit souvent des survols d’un sujet ou de brèves présentations de concepts) et les contenus plus complexes, plus volumineux sont plus en profondeur.
La raison en est simple: plus un internaute « creuse » dans un site web, plus il précise son besoin en se dirigeant de plus en plus précisément vers un sujet qui l’intéresse spécifiquement et pour lequel il manifeste un intérêt supérieur. Cet intérêt se traduit généralement par une volonté accrûe de faire des efforts d’assimilation de l’information.
Par conséquent, un texte situé au troisième niveau de profondeur d’un site aura de meilleures chances d’être lu même s’il est très long qu’un texte de premier niveau dans lequel l’internaute cherche davantage un aiguillage et une confirmation qu’il est dans la bonne direction plutôt qu’un contenu très étoffé. Évidemment, les sites sur lesquels l’information est répartie très horizontalement (liste d’articles tous situés au même niveau) sont à considérer différemment.
Il faut donc que le découpage de l’information, et la segmentation selon différents niveaux, reflète cette réalité. Puisque nous parlons de taille des blocs d’information relativement à leur position dans la structure, il est facile de comparer le tout à un « tamis inversé »: les plus gros blocs tombent au fond, les plus petits restent en surface: nous parlons donc de « granularité ».
De la granularité de l’information
Niveau de détails contenus dans une unité d‘information. Plus il y a de détails, plus bas sera le niveau de la granularité. Inversement, moins il ya de détails, plus haut sera le niveau de la granularité.
Une définition moissonnée dans les champs du web:
Je ne suis pas sûr que cette définition soit la meilleure (et je n’ai pas dictionnaire des sciences de l’information sous la main, mais n’hésitez pas, c’est disponible dans toutes les bonnes bibliothèques…;-))…en voici donc une autre,
La granularité de l’information, en s’appuyant sur la structure implicite ou explicite des documents, permet de manipuler l’information à différents niveaux de granularité en fonction des besoins de l’utilisateur.
ça me semble mieux, en tout cas plus clair puisqu’on a la notion de structure et de besoins des utilisateurs.
Une dernière définition plus conceptuelle montre que le concept porte aussi sur l’organisation des systèmes, comme c’est indiqué dans ce Dictionnaire des arts médiatiques (non non c’est pas une secte). Attention accrochez vous c’est tordu :
Degré d’interactivité d’un programme, représenté par la quantité de points décisionnels qu’il comporte. Un grain est en ce sens l’unité fondamentale d’interaction dans un programme interactif. Un programme interactif (hypertexte ou hypermédia) à granularité élevée comporte un grand nombre de points décisionnels, ce qui correspond à un réseau dense de relations entre les noeuds. Un programme interactif à granularité faible comporte peu de points décisionnels et présente un réseau plus clairsemé de relations entre les noeuds.
Bon ok à quoi ça sert? Et ben c’est un concept et donc ça sert à exprimer des idées. Par exemple, appliqué aux blogs, par Olivier Ertzscheid voilà ce que ça donne :
La granularité de l’information sur laquelle les weblogs permettent de travailler dans une optique de réingénierie se décline selon deux axes :
- en termes de contenu tout d’abord : il est possible en sus des fils d’information standards fournis par les sites web, de mettre en place des filtres internes au contenu même du site. Le magazine américain « wired » propose ainsi de syndiquer uniquement les articles de l’éditorialiste Meg Ryan (spécialiste de la question des weblogs). Et cela est bien entendu possible pour d’autres éditorialistes et journalistes de Wired
- en terme de format ensuite, la plupart des sites proposant des contenus à syndiquer le font sous différentes options : syndication longue (contenu des billets postés), syndication courte (titre du billet seulement), syndication longue avec commentaires (tous les commentaires postés sont à leur tour syndiqués)
On comprend ainsi que la "granularité de l’information" permet d’exprimer le point d’où l’on se place pour structurer l’information en se posant la question du "niveau" ou du "grain" de l’unité de sens d’un document. En fait il s’agit de répondre à la question : Qu’est-ce qu’on veut repérer et indexer, pour quels usages? (le paragraphe? le mot? le chapitre? le livre? etc.) C’est un concept qui est très utile aujourd’hui et qui peut également servir à déterminer la manière dont on peut pérénniser le document numérique, comme le souligne Figoblog.
En substance :
Granularité. Les identifiants doivent être applicables à n’importe quelle échelle de la ressource : la ressource elle-même mais aussi la collection dont elle fait partie, les articles qu’elle rassemble, et pourquoi pas, le paragraphe de l’article (ou le commentaire du billet), et également différentes versions d’une même ressource. Il faut donc définir les différents niveaux de granularité de l’information qui doivent être identifiés, et comment cela va se décliner dans le système d’identification : le choix peut aller de l’attribution d’identifiants complètement indépendants à chaque niveau, jusqu’à un système hiérarchisé qui reflète l’organisation de la collection.