Les médias de restitution

L'indexation est à la base une pratique documentaire dédiée aux textes, et dont l'objectif est de générer pour un document, une description sous forme d'index permettant de le retrouver dans un ensemble. Le choix des caractéristiques du document et du langage de description détermine la pertinence des index. Ces questions sont au centre des recherches actuelles sur l'indexation automatique de documents audiovisuels. Désormais, on arrive à indexer d’autres médias comme l’image, le son et la vidéo. Ensuite grâce à des moteurs de recherches, en entrant des mots clés ou des couleurs, il est possible de retrouver les médias indexés.

L'information non indexé (non structurée) est de plus en plus présente sur le net. Aujourd'hui, 80% des informations d'une entreprise ne sont pas structurées. Selon Gartner, le volume de ces données double tous les mois. Le défi pour l'entreprise moderne est d'essayer de comprendre et d'extraire la valeur qui se trouve dans cette vaste mer de données.

Dans une première partie nous allons voir les différents acteurs par média, et ensuite nous verrons les solutions qu’ils proposent.

Pourquoi l’indexation ?

Trois points importants :

  • Permettre la découverte de connaissances en organisant et en classifiant de façon dynamique l’actif informationnel en dossiers consultables pertinents dans le contexte, afin de permettre à l’utilisateur de prendre des décisions opportunes et de résoudre les problèmes rencontrés dans le monde réel.

  • Trouver des informations pertinentes sur le plan conceptuel, et les convertir en connaissances quelle que soit la langue dans laquelle elles sont conservées et les perspectives de recherche de l’utilisateur final.

  • Récupérer des résultats de recherche exhaustifs et pertinents, y compris lorsque les termes de la recherche sont différents de la source, tout en y étant apparentés.

Acteur Solution Médias traités
Image Son Vidéo Carte
Google Gaudi - X X -
INRIA IMEDIA X - - -
IBM CQBI X - - -
Business Geographic Aigle - - - X
Exalead CloudView X X X -
Groupe Quaero Quaero X X X -
IT channel.info LTU X - - -
Seigneurie Chromatic X - - -
Université de Cambridge Autonomy X X X -
Google Google Location Services - - - X
NewPhenix NewPhenix X - - -

IMEDIA de l’INRIA

Google Audio Indexing (Gaudi)

Aigle de Business Geographic

Aigle de Business Geographic

Quaero

LTU

Chromatic

Autonomy

NewPhenix

Depuis que les contenus audiovisuels s’échangent électroniquement, les techniques d’indexation automatique se développent :

  • pour le texte
  • pour l’image
  • pour le son
  • pour la vidéo
  • pour les cartes

Et les formats d’index se standardisent.

Néanmoins le volume de documents ne cesse de croitre et il est de plus en plus important de distinguer l’utile du futile.