Subscribe to the RSS feed (english)

Le web sémantique

Le web sémantique ou le supplice de Tantale de la recherche Internet.

On parle depuis des années d'analyse sémantique de contenu textuel. Jeune ingénieur, j'ai même voulu faire carrière dans la recherche en intelligence artificielle (IA). En 1997, j'écrivais dans KaFkaïens magazine qu'il était temps qu'on se rende compte que les sciences pouvaient atteindre leurs limites.
Et que l'une de ces limites concerne le langage naturel.

La complexité de l'analyse automatique du langage humain dépasse les espérances des experts. Ce que l'on croyait à portée de main s'éloigne toujours un peu plus quand on fait un pas. C'est un supplice de Tantale pour chercheurs...

Est-il alors si étonnant de voir le web sémantique figurer dans les 83 technologies clés du ministère de l'industrie ? Peut-être pas, si l'on considère que Tantale s'approche quand même à petit pas.
Mais qu'en est-il pour les entreprises aujourd'hui ?

On distingue souvent deux axes en intelligence artificielle :

  • la capacité à reconnaître un concept
  • la précision de la reconnaissance.
Or, les entreprises ont souvent plus besoin de précision que de reconnaissance. Je m'explique. La dimension confiance est fondamentale pour qu'une entreprise décide d'utiliser une technologie. Un système qui reconnaîtra à 100% un concept connu mais qui sera moins fiable pour en donner le sens restera suspect. Et si le doute subsiste, il ne sera pas utilisé, sauf dans certaines applications ou l'erreur est permise.

Aujourd'hui, malheureusement, on n'arrive pas à classifier automatiquement les contenus textuels (dont le web). Alors les entreprises ont commencé à utiliser une méthode absolument nulle du point de vue de l'IA : les tags (l'association manuelle de mot-clés).
Mais cette méthode idiote, le niveau zéro de la recherche, cette méthode marche.