Subscribe to the RSS feed (english)

Quand tagger ?

Dans un article sur le web sémantique je terminais en parlant rapidement des tags. Le lecteur attentif aura compris que je ne parle pas des tags que l'on trouve sur les portes des métros.

Qu'est-ce qu'un tag ? En français, on dirait un mot-clé, et comme je défends la séparation des langues, je vais utiliser ce dernier terme.

Un mot-clé constitue un résumé réduit à sa forme la plus courte. Avec un seul mot clé on ne fait pas grand-chose, mais dès qu'on en associe trois ou quatre, on arrive à assez bien représenter un article. Comme l'écrivait Woody Allen : "j'ai suivi un stage de lecture rapide. J'ai lu Guerre et Paix en 10 minutes. J'ai tout compris, ça parle de la Russie".

Disons que ce type d'hyper résumé marche avec des contenus eux-mêmes courts, et comme ma maman me l'a appris : avec pas plus d'une idée à la fois...
En fait, les mot-clés ont deux intérêts.

Partant de l'idée de résumer un texte à quelques mots, on cherche des termes assez "conceptuels" pour reprendre les idées du texte. Très souvent, les mot-clés ne sont pas eux-mêmes dans le texte.
Mais les mots-clés sont utilisés dans l'autre sens : pour catégoriser des documents. L'ensemble des mot-clés d'un ensemble de textes s'organise naturellement en une classification desdits textes. Si l'ensemble des textes n'est pas trop disparate, les certains mots-clés reviendront souvent.
En fait, cette façon de faire des résumés permet d'obtenir une méthode de classification puissante.

Puissante d'une part, parce que demander à quiconque de classifier un ensemble de textes est une gageure. Personne n'arrive à construire une hiérarchie de thèmes, sous-thèmes, etc. En posant la question différemment (sous l'angle du résumé), on y arrive.
D'autre part la classification obtenue est multi-dimentionnelle. C'est à dire qu'un document peut appartenir à plusieurs thèmes à la fois. Et là, notre quidam qui avait déjà jeté l'éponge lorsqu'on lui demandait de créer une hiérarchie simple, s'arrache carrément les cheveux.

Dans quels cas les mot-clés sont-ils le plus efficace ?
Je me risque à affirmer que c'est dans le cas de textes courts (ou de documents non textuels comme des images ou des vidéos).

Plus un texte est court, plus il est monolytique, donc plus facile à résumer en quelques mots. Mais surtout, plus il est court, plus on a de chance de le résumer par un mot qu'il ne contient même pas !
Et que se passe-t-il quand un mot n'apparaît pas dans un texte ? Il n'est pas trouvé par les moteurs lorsqu'on cherche ce mot.

J'ai pensé à deux exemples d'utilisation des mots-clé (pour sortir des habituels Flickr et consors).
En 1997, j'ai créé une base de données de citations où j'enregistrais les phrases qui me plaisaient au fil de mes lectures. Le système de classification que j'ai inventé s'appellerait maintenant des mots-clés. Par exemple, je me souviens d'une phrase tirée du Portrait de l'artiste en jeune homme de Joyce qui me semblait le comble de la prétention. Je l'ai donc associé au mot "prétention". Pourtant, évidemment, le mot prétention n'apparaissait pas dans cette phrase !
Un deuxième champ d'application des mots-clés pourrait être les commentaires (comme ceux qui sont écrits sur des blogs par les lecteurs). Ceux-ci sont tellement courts que l'on peut les résumer très rapidement. Et une fois taggés (quel horrible anglicisme), les commentaires sont classifiables. Des mots-clés pouvant même refléter un jugement ("nul", "intéressant"...), on apporterait la possibilité de trier et de raffiner l'information apportée par les lecteurs…