Résumé
Après une rapide discussion de la notion d’annotation / méta- données pour le web sémantique, nous en proposons un scénario d’utilisation conséquent, dans le domaine de l’enseignement à distance. Nous montrons alors que si la problématique en soi n’est pas nouvelle, et est déjà traitée dans de nombreux domaines, l’échelle du Web et le niveau d’intégration technologique nécessaire sont quant à eux novateurs. Nous passons ensuite en revue un certain nombre de systèmes liés aux annotations / méta-données pour le Web sémantique, et concluons sur les directions probables que va prendre la recherche, en insistant sur la nécessité d’intégrer des chercheurs de SHS dans la réflexion.
Asbtract
After a short discussion of the notions of annotation and metadata for the semantic web, we illustrate them through a wide scenario in the domain of distance learning. We then advocate that if the problems are not so new, and have been dealt with in numerous domains, both the scale of the web and the needed technological integration effort are. After the presentation of several systems related to annotations and metadata for the semantic web, we conclude on some research directions, insisting on the need for associating humanities scientists to the collective discussion.
Table of Contents
Un des grands principes du Web sémantique est qu’il est nécessaire d’associer aux ressources du Web des informations exploitables par des agents logiciels afin de favoriser l’exploitation de ces ressources Annotation for the semantic web.
Associer par exemple une notice comprenant des champs :
Auteur
, Date de création
, Date de modification
, Mots-clés
, à une page Web permet de considérer celle-ci non plus
seulement comme comprenant du texte qui ne pourra qu’être traité statistiquement par un robot indexeur, mais également des informations structurées à la sémantique connue et utilisable comme telle par un agent logiciel. De la même manière, si ce qui apparaît comme un simple nombre dans une page Web est de façon explicite marqué comme un couple (valeur, devise), alors un agent pourra faire usage de ces connaissances.
Associer une information exploitable à une ressource signifie deux choses essentielles.
La première est que cette information doit d’une manière ou d’une autre être structurée – utilisable – et descriptive – de la ressource, de son utilisation. Il s’agit d’en faciliter et améliorer l’accès dans le cas d’une ressource directement visualisée par un utilisateur (par exemple en permettant une recherche d’information plus efficace et plus ciblée), mais aussi l’exploitation dans le cas d’une ressource exploitée dans le cadre d’un service à l’utilisateur (l’utilisateur n’est alors pas forcément conscient de l’utilisation de la ressource).
La seconde est que la ressource en question doit exister et pouvoir être exploitée sur le Web indépendamment des informations qui lui sont associées dans le cadre du Web sémantique : celles-ci sont utiles, mais non nécessaires pour accéder et utiliser la ressource, la page Web ou le service.
La figure Figure 1, “Une vision du Web Sémantique” donne une vision (proposée sur le site http:// www.semanticweb.org/) de l’utilisation des méta-données sur le Web sémantique. Des pages Web sont annotées à partir de connaissances disponibles dans une ou plusieurs ontologies (qui ont pour objectif de normaliser la sémantique des annotations), et ces annotations, regroupées en entrepôts de méta-données deviennent utiles pour des agents de recherche d’information, faisant ou non appel à des moteurs d’inférence permettant de déduire de nouvelles connaissances formelles des annotations.
Au-delà de ce schéma (sur lequel nous reviendrons au travers d’un scénario d’utilisation dans le domaine de l’apprentissage à distance), remarquons que deux termes principaux sont utilisés dans la littérature afin de décrire les informations associées à des ressources : méta-données et annotations.
Si nous revenons sur ces notions, et de façon générale :
une méta-donnée est « une donnée sur une donnée ». Cette définition est un peu vague voire ambiguë, et elle est comprise de manière différente par différentes communautés qui conçoivent, créent, écrivent, préservent et utilisent des systèmes d’information et des ressources. Par exemple, dans certains cas la donnée sur laquelle la méta-donnée porte est considérée comme ayant le même statut de donnée formalisée, traitable par un système informatique, dans d’autres, la donnée n’est qu’interprétable par un être humain, et seule la méta- donnée en permet le traitement automatique.
une annotation est à la base une note critique ou explicative accompagnant un texte, et par extension, une quelconque marque de lecture portée sur un document, que celui-ci soit textuel ou image.
Pour autant, si ces deux termes existent, c’est qu’ils n’ont pas le même sens.
La communauté anglophone du Web sémantique, circonspecte sur la différenciation, considère par exemple dans le schéma que nous reprenons plus haut que les annotations de pages Web deviennent des méta-données dès qu’elles sont stockées dans une base sur un serveur. On différencie alors l’information en tant qu’elle est attachée à (et présentée avec) une ressource et l’information manipulable et exploitable de façon plus indépendante de celle-ci.
D’un point de vue plus lié à la pratique de l’annotation / méta- données (du point de vue du processus de mise en place), et s’il est nécessaire de distinguer, nous proposons ce distinguo :
une méta-donnée sera plutôt attachée à une ressource identifiée en tant que telle sur le Web – aura plutôt une pertinence a priori et sera plutôt saisie suivant un schéma. Par exemple, la description normalisée d’un service Web, l’auteur d’un document, qui permettront de mettre en place des inférences.
une annotation sera plus située au sein de cette ressource et écrite au cours d’un processus d’annotation / lecture. Par exemple, un commentaire libre associé à un fragment d’une page Web – quelques mots, un paragraphe – déterminé au besoin.
Evidemment, cette distinction n’a rien de définitive, il s’agit simplement de mettre l’accent sur le caractère plus situé au sein de la ressource (du fait de son exploitation par un utilisateur) de l’annotation, par rapport à une méta-données plus indépendante, voire ressource en tant que telle.
Plusieurs critères, non indépendants – que nous illustrerons dans la suite – peuvent être envisagés pour considérer les différents types de méta-données (annotations) :
les types de ressources qu’elles concernent, plus ou moins fragmentées,
l’automatisation plus ou moins marquée de leur mise en place,
la structuration plus ou moins forte de leur « schéma »,
les tâches qu’elles soutiennent (ou sous-tendent),
l’utilisation qui en est faite par les agents logiciels, plus ou moins « intelligente ».
Remarquons que pour le Web sémantique, on parlera le plus souvent de méta-données ou d’annotations sémantiques. Deux possibilités d’interprétation sont ici disponibles : « sémantique » au sens de « sémantique formelle », et puis au sens plus vague de « faisant sens dans le cadre d’une tâsche pour un utilisateur ». Si certains tenants du Web sémantique souhaitent limiter la portée de celui-ci au premier sens – formel – ces deux interprétations nous semblent pourtant tout à la fois pertinentes et de toutes façons inextricablement reliées dans le cadre d’un Web sémantique riche et ouvert, à l’image de la richesse et de la diversité du Web actuel, qu’on pourrait qualifier d’ « un peu sémantique ».