... lyonnais1
Le laboratoire Reconnaissances des Formes et Vision (RFV) de l'Insa de Lyon ; le Laboratoire d'Informatique du Parallélisme (LIP) de l'ENS-Lyon ; le Laboratoire Image Signal et Accoustique (LISA) de CPE-Lyon ; le Laboratoire d'Ingéniérie des Systèmes d'Information (LISI) de l'Insa de Lyon.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... partenaires2
France 3 Rhône-Alpes-Auvergne et l'INA (Institut National de l'Audiovisuel) Centre-Est
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... technique3
le Centre Inter-universitaire de calcul Scientifique et Médical (CISM).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... connaissances4
Par opposition à une trace << brute >> sans référence à une base de connaissances.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... chemin5
Le noeud extrémité d'un chemin est déclaré comme étant en contexte avec le noeud de départ selon le chemin qui les réunit.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... texte1
L'auteur prend ici le terme texte est dans son sens le plus large, une image peut alors être considérée comme un texte qu'on lit.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... principalement2
Il convient d'y ajouter le toucher, qui est appelé à connaître un avenir intéressant. Ainsi les aveugles peuvent lire du braille généré par un ordinateur, ce qui sera également bientôt possible sur le WEB, tandis que des vêtements équipés de vibreurs permettront dans le futur de ressentir les documents musicaux (mais ne seront-ils pas alors autre chose ?) directement au niveau de la peau.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... document3
Cette définition pourrait aussi convenir au terme hypermédia, mais ce terme nous semble voué à disparaître, nous lui préférons donc multimédia.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... directement4
Quoique certains anciens évoquent le système keydex qui permettait de réaliser des ET sur des fiches-index perforées .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ées5
On notera qu'à ce niveau il peut y avoir désémantisation presque totale des identifiants de données, c'est à dire qu'un être humain devra avoir une connaissance totale du système et de l'application pour pouvoir les utiliser en tant que tels : c'est par exemple le cas dans des séances de déboggage les plus ardues.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... descripteurs6
Comme tout descripteur d'un document peut en servir d'index, nous emploierons indifféremment ces deux termes dans la suite.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Altavista7
Moteur de recherche bien connu http://www.altavista.com.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... exemple)8
Y. Chiaramella, Approche et modèles en Recherche d'Information, cours Inforsid'99, Toulon, Juin 99.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Core 9
Voir http://purl.org/dc/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Web10
Le moteur de recherche Altavista indexe également sous forme d'ensemble de mots-clé pondérés tous les documents du Web, en tenant désormais compte de leurs types (web, images, vidéos, sons), et l'utilisateur peut spécifier le type de document qu'il cherche.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... interroger11
Par exemple, l'utilisation d'une organisation conceptuelle des termes de description permet d'enrichir les requêtes http://www.sunlabs.com/research/knowledge/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... assistance12
Espérons-le, intelligente.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... audiovisuel1
Audiovisuel a également perdu son statut de << Nouvelles Technologies de l'Education >> (NTE) d'il y a vingt ans.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... mouvement2
C. Metz : << Le mouvement donne aux objets une corporalité et une autonomie qui étaient refusées à leur effigies immobiles, il les arrache à la surface plane où ils étaient confinés, il leur permet de mieux se détacher comme << figures >> sur un << fond >> : libéré de son support, l'objet se << substancialise >> >> [157].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...éel3
Mieux, si un personnage s'envole soudain, le spectateur, passant sans le savoir un << contrat de réalité >> avec le réalisateur du flux, considérera cela comme un mouvement réel, avec l'effroi que l'on peut imaginer au début du XXème siècle.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... flux4
Ceci pourrait changer avec de nouvelles technologies, telles MPEG4 (voir 1.2.1), dans lesquelles ont décrit les contenus audiovisuels à l'aide d'objets vidéo dont les représentations sont superposées à l'écran et sur les haut-parleurs : il devient possible d'accéder aux objets individuellement.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... jouer5
Les descriptions varient suivant les sources : l'enfant qui joue peut être remplacé par une << femme lascive >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... spectateur6
C. Metz : << Le film, que l'on croirait susceptible de donner lieu à une lecture transversale, par l'exploration à loisir du contenu visuel de chaque plan est presque à tout coup l'objet d'une lecture longitudinale, précipitée, déplacée vers l'avant et anxieuse de la << suite >>. La séquence n'additionne par les plans, elle les supprime >> [157].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... plan7
Auquels on peut rajouter les objets vidéo insérés, par exemple les incrustations de commentateurs météo sur les photos satellites.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... raconter8
Les règles du montage et de la narratologie ont été fort étudiées pour le cinéma [55,106].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... premiers9
La bande-son y prend une importance prépondérante sur l'image -- comme dans une interview. Comme le montrent de façon convaincante Sorlin [214] ou Chion [58], le rôle de la télévision dans la plupart des foyers est souvent pendant la journée celui qui était assuré par les radios dans le passé : celle d'une présence, essentiellement sonore, qui permet de vaquer à d'autres occupations, par exemple pousser le siège pour passer le balai, les programmes étant souvent conçus en conséquence.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... cause10
Voir par exemple la Nouvelle Vague en France.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ées11
Il n'est pas sûr qu'un réalisateur d'une émission de télé-achat ait plus de liberté qu'un rédacteur d'horoscope dans un magazine.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... rushes12
Les rushes sont les plans << bruts >> tels qu'ils ont été tournés. Les caméras numériques permettent de documenter les conditions de tournage, automatiquement (heure, température) ou manuellement. Cette opération est appelée logging en anglais [73].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... audiovisuels13
Voir par exemple les expérimentations de Peter Greenaway dans le film The pillow book (1996).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...és14
On notera que la manière dont un document est diffusé, par exemple comme partie d'un journal télévisé est souvent aussi pertinente que ce qui a été filmé .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... auteur15
Signalons au passage la volonté récente du gouvernement des Etats-Unis de financer la restauration et la préservation de quelques films anciens << témoignages du génie américain >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... France16
Créée en 1995, ce qui correspond à la reconnaissance officielle par l'Etat français des documents audiovisuels produits et diffusés en France comme partie de l'héritage culturel national [79]. l'Inathèque enregistre systématiquement les programmes des six principales chaînes françaises et de Radio France, et met les documents à disposition d'un public de chercheurs. Les notices sont consultables à http://inatheque.ina.fr.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... audiovisuelle17
Par exemple dans un rapport récent à l'UNESCO [85], les archivistes audiovisuels cherchent à définir leur métier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... détemporalisée18
Mais non forcément atemporalisée : la temporalité peut être en partie conservée, par exemple si on conserve des extraits de bande-son pour accompagner une image représentative d'un plan.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ère19
http://www.adobe.com.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... editor20
http://www.macromedia.com.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ération1
Ces considérations font écho à celles d'usage au niveau des documents textuels, dont les modèles de structuration permettent la manipulation et l'accès. Si bien entendu les documents audiovisuels sont différents des documents classiques, il n'empêche que bien des études menées sur eux sont consciemment ou non redevables des acquis issus des recherches sur les documents textuels. Sans préjuger d'évolutions futures pouvant radicalement changer notre manière de voir les documents audiovisuels, il convient de reconnaître que l'analogie avec les documents textuels se révèle féconde, pourvu qu'on en reste conscient.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... W3C1
http://www.w3c.org.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... automatique2
Aux problèmes liés aux transitions << exotiques >> entre plans prêt : un fondu enchaîné ou un volet seront moins évidents à repérer automatiquement qu'un simple cut.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...éalisateur3
Par exemple, dans le schéma d'indexation de l'INRIA pour les << audiovisuels >> en 1982 [40], les données de description globales sont réparties en données de cataloguage (Signalement :titre, durée, support, documents d'accompagnement ; Production-Réalisation : date, pays, producteur, auteur... ; Distribution) et données d'analyse (Contenu : explicitation du contenu, résumé, descripteurs ; Traitement audiovisuel : genre, analyse globale, son, image ; Utilisations : utilisations possibles, public, observations ; Appréciations et compléments : points forts, nature de l'analyse effectuée, etc.).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Questel4
Cf. http://www.questel.orbit.com/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... MPEG-75
Le format de compression de fichiers audio MPEG-3 n'a rien a voir avec une éventuelle indexation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...écis6
Véritable << patron >> de production.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...égories7
Catégories non limitatives : space, time, wheather, characters, objects, characters actions, objects actions, relative position, screen position, recording medium, cinematography, shot transitions, subjective thoughs about the material.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... physique8
Un mot-clé pour un acteur ou un personnage n'est créé qu'après au moins cinq apparitions : il ne suffit pas d'accéder à l'écran une fois pour passer à la postérité...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...é9
Nonobstant l'organisation hors-documents des descripteurs dans le thésaurus.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'importance10
Comme par exemple pour les descripteurs d'ouvrages de la base Rameau de la Bibliothèque Nationale, où le deuxième terme de description, s'il est présent, est un qualificateur du premier [108].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... exemple)11
Les liens entre objets-image (régions) et types sémantiques sont mis en place par un humain.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... dimensions12
Cette annotation est donc très riche, et difficile à mettre en place par l'utilisateur, c'est pourquoi un outil graphique d'aide à l'annotation de plan a été mis au point : il s'agit de spécifier dans un monde en trois dimensions vu du point de vue de la caméra les différents objets, leurs mouvements et interrelations, l'outil se chargeant de transcrire cette vue en description basée sur la logique spatio-temporelle STL [77], qui est un langage de représentation de relations spatio-temporelles. Une projection de la vue en trois dimensions sur un plan en deux dimensions d'après la position de la caméra permet d'obtenir le plan tel que représenté sur l'écran. Les requêtes sur les plans peuvent alors se faire par l'exemple, avec un langage iconique par exemple.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... tel13
Par exemple [63] annote des plans avec des mots-clé, et regroupe ceux-ci en scènes, également annotées elles-mêmes, sans pour autant mettre en place de hiérarchie arborescente pour le document (on en reste au niveau de scènes définies à volonté).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... film14
A titre d'indication, l'annotation complète (après passage des outils automatiques) d'un film comme Le guépard par les techniciens et les experts de la Cinémathèque Toscane a nécessité une journée, ce qui est peu en regard de l'investissement en temps nécessaire à la réalisation d'un tel film.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...[249]15
Le lecteur notera que les deux travaux d'origine japonaise présentés ici ne nous étaient pas connus au moment de l'étude bibliographique fondatrice de notre travail.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... floue16
Ces relations sont mises en place implicitement quand il y a co-occurence entre descripteurs ou explicitement quand l'utilisateur le spécifie en mettant deux n\oeuds en relation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...èque17
http://www.ina.fr/Inatheque/index.fr.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Paris18
http://www.vdp.fr/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... industriel19
Plus généralement, plusieurs produits destinés aux professionnels existent sur le marché, on en trouvera un état de l'offre sur http://www.footage.net/directory/dbsystems/. Le site propose également de rechercher des documents dans un réseau de plusieurs archives de documents audiovisuels.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... lien20
Cela pourrait accréditer la thèse de la nécessité d'une phase de pré-recherche textuelle dans la base avant de s'intéresser à des composantes images du document.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...éfilement21
Même accéléré ou ralenti, le défilement devient rapidement incompréhensible, au niveau de l'image, mais aussi, et de façon encore plus critique, au niveau du son.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ée22
Méthode qui peut d'ailleurs servir également à l'indexation, comme nous l'avons vu plus haut.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... mouvants23
Exemples disponibles sur http://nif.www.media.mit.edu/stills ou encore http://mmassey.www.media.mit.edu/people/mmassey/SSindex.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... pause)24
Pour une actualisation de ce prototype et quelques copies d'écran, voir http://www.interval.com/projects/mediast/index.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... pertinents25
Plus précisément on définit un schéma conceptuel, avec des classes, des attributs, des relations de propriété et d'héritage, puis de ce modèle abstrait, on procède à un appariement sur un graphe orienté au relations nommées, qui est la structure de données. On exploite ensuite les propriété des graphes pour définir des outils de manipulation, qui permettront les opérations de filtrage de données. La perspective est un sous-graphe de mêmes propriétés, le filtre est un ensemble de conditions sur les attributs d'objets, la sélection étant l'application de ce filtre par le biais de la perspective.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ées26
Il faut également tenir compte des capacités humaines d'attention, [225] décrit des interfaces de présentation vidéo en prenant en compte cet aspect.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... histoire27
Les histoires enfantines japonaises -- en dessins animés -- inspirent les chercheurs, serait-ce parce que leur trame est facilement représentable et étudiable ? Ceci peut être mis en lien avec les analyses de Propp sur les contes russes.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... format28
Ce format devrait avoir à faire à MPEG7 et à XML (voir section 5.2.4). On notera que [144] propose de décrire des prescriptions de mise en place de documents audiovisuels dans un format lié à SGML, tandis que [18] compte utiliser XSL pour générer de nouveaux documents à partir de descriptions de documents en XML : la prise en compte de description de documents audiovisuels comme des documents structurés décrits dans des langages de balises progresse donc.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... interprétables1
Et surtout non interprétés.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... primitives2
Passons sur deux problèmes importants. D'une part, exhiber une image comme requête signifie simplement l'espérance que la machine va elle-même y reconnaître les traits pertinents qu'on veut y trouver : on ne spécifie pas ce que l'on veut. Pour pallier ce problème, certains auteurs proposent que l'utilisateur dessine lui-même ce qu'il cherche, c'est à dire << écrive sa vision >>. Deux difficultés se posent encore à ce niveau. En premier lieu, tout le monde n'est pas capable de s'exprimer par le dessin. En deuxième lieu, la mise en place d'une icône obéit à des règles fortement culturalisées, ne participe pas de la même modalité sémiotique que l'image filmée [231]. Il n'y a donc a priori aucune raison pour qu'un traitement sur une icône donne des résultats exploitables par exemple sur une photographie. Pour le son, la question est sans doute plus nuancée, au sens où l'expression est << plus directe >> dans le matériau sonore, est plus phénoménologiquement située. Les erreurs de rythme ou les fausses notes n'en existent pas moins.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... justement3
Ces interprétants peuvent également être partagés culturellement : une photographie noir et blanc jaunie ne sera pas a priori considérée comme ayant été prise la veille. La perception de son contenu sera alors médiée par la supposition que les objets et les personnages représentés sont anciens.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'expliquant4
D'autre part, il ne nous semble pas pertinent de supposer qu'il est possible d'apprendre une combinaison (par exemple pondérée) de mesures de similarités d'un utilisateur, c'est à dire de supposer a priori que les primitives ininterprétables extraites pourraient former par combinaison des primitives interprétables.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Gestalttheorie5
Théorie de la perception développée au début du XXème siècle en Allemagne, qui a par exemple mis en évidence le fait que l'humain repère plus spontanément certaines formes géométriques simples.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... possible6
Citons cette éclairante déclaration de R. Jain [130] : << Keywords often provide a better description of the person who assigns them than they do the image >> ce qui signifie pour les auteurs que la diversité de l'appréhension humaine d'une image ne doit non pas être résolue en agissant sur les possibilités de description par l'homme des images (problème étudié depuis fort longtemps dans les bibliothèques), mais bien en allant chercher dans celles-ci un contenu objectif, supposé partagé, et -- celà va sans dire -- calculable.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ésultats7
Cela montre également qu'il n'est pas utile de traiter du signal pour traiter du signal, mais bien dans le cadre d'une aide à l'exploitation des documents en tant que signal. Le traitement du << signal documentaire >> doit donc être guidé par les besoins réels des utilisateurs de documents, qui n'ont pas à s'adapter aux similarités qu'on leur propose.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...égoriser8
On a ainsi les syntagmes parallèles, les syntagmes en accolade, les syntagmes descriptifs, les syntagmes alternés, les scènes et les séquences.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...és9
Ce qui prouve que Metz n'est pas si radical qu'on a pu l'interpréter, en figeant sa pensée dans un langage du cinéma strict, se rapprochant d'une grammaire telle qu'envisagée en informatique.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...écouvrir10
On peut observer le même phénomène pour les documents écrits, si par exemple un rapport de recherche est décrit suivant une hiérarchie document/partie/chapitre/section/etc., il pourra également l'être suivant les segments bibliographiques, originaux, de résultats, etc. sans que ce découpage reflète forcément le premier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... plans11
Sans vouloir anticiper trop, c'est ce genre de relations que nous autoriserons de façon naturelle dans les Strates Interconnectées par les Annotations.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... (joie)12
Lucas avouait lui-même volontier s'être inspiré des théories structuralistes de Propp pour construire le scénario de son film.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... même13
Des conférences et ateliers lui sont ainsi consacrés régulièrement ces dernières années, par exemple, les International and Interdiciplinary Conference on Modeling and Using Context (Rio de Janeiro, 1997 -- Trente, 1999), les conférences ISIC Information Seeking in Context tous les deux ans depuis 1996 ou l'atelier AAAI Workshop on Reasoning in Context for AI Applications de la conférence AAAI 1999.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... discrets14
Dans une approche logique par exemple, [149] définit un contexte comme une collection d'hypothèses. La relation ist(c, p) signifie que la proposition p est vraie dans le contexte c, une proposition ist étant elle-même toujours vraie dans un certain contexte. Une grande partie des travaux en logique se base sur l'étude des interactions entre contextes, la mise en place de contextes élémentaires qui sont ensuite couplés en fonction de la tâche courante, etc.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... machine15
Ces dernières peuvent bien entendu expliciter des phénomènes cognitifs, mais il y a lieu que ce soit en machine.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'image16
Rappelons que le système de [6] a été mis en place pour gérer les notes de travail vidéo des anthropologistes. Le << contenu de génération >> correspond alors à la réponse aux questions où, qui, quand, pourquoi, comment, et doit être documenté au moment du filmage.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ératif17
L'outil est explicitement un outil d'analyse : << This case study illustrated how our approach can be used to examine and identify temporal trends and how different types of relationships can be easely explored within MultiMedia Visual Information Seeking (MMVIS) >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... hors-besoins18
Ou plus précisément pour des besoins << standards >> tellement généraux qu'ils en deviennent inutiles, par exemple << trouver une image qui ressemble à >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ées19
Par exemple, si je cherche des objets archéologiques, alors il peut être utile d'utiliser telle ou telle similarité, parce que les images considérées seront connues comme images de résultats de fouilles archéologiques (données techniques, de forme, connaissance de la photographie comme prise devant un fond uni, etc.).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... possible20
Nous avons tenté, au début de notre travail de définir des invariants de description, notamment structurels (en se basant sur la narratologie ou l'analyse filmique) qui conviennent aux documents audiovisuels en général. L'échec de cette approche et notre volonté de ne pas définir ex-nihilo des schémas de description font que nous nous sommes plutôt concentrés sur des modèles abstraits de description adaptés à l'audiovisuel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... (temporel21
En se limitant à des parties comparables temporellement, c'est à dire issues d'un même flux.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... intelligente22
Cf. le premier chapitre, p. [*] : << une indexation intelligente est un indexation offrant dans son mode de fonctionnement/représentation même la possibilité de l'interroger sur elle-même, en tant qu'indexation et métadonnée. Tout document indexé ainsi offre par la description de son contenu structuré et indexé la possibilité d'inférences, de calcul sur ses index, que ceux-ci soient décrits en dehors de lui ou bien en son sein. Toute utilisation du document passe par conséquent par l'un de ses index, et peut être considérée comme ensemble de connaissances -- comme le sont également les index utilisés comme tels en situation d'action --. Le système est alors entièrement géré par les connaissances, puisque pour toute utilisation, tout est connaissance. >>
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...[19]1
Les auteurs proposent ainsi qu'un document virtuel soit composé de parties de documents éventuellement définis dans plusieurs fichiers différents. Par exemple, un document peut être considéré comme entier même s'il se trouve sur plusieurs bandes, ou alors il est possible de couper des parties d'un enregistrement (comme des publicités) pour les << projeter >> sur un document entier virtuel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...érerons2
Si les EA peuvent tous servir de relation, certains n'en sont pas moins plus << typés >> comme lien, par exemple un EA < CStruct > (contient structurellement) servant à lier deux EA structurels (< Scène > et < Plan > ) ne sera vraisemblablement utilisé que comme EA de relation. Il en ira de même pour des EA des cas-relations tels que < Agt > (Agent) ou < Rcpt > (Récepteur) [215], ou encore d'autres relations telles que < Meth > (Méthode), < Qty > (Quantité) [24]. On peut donc établir un continuum entre EA toujours utilisés comme relations et EA toujours utilisés comme concepts. Remarquons cependant qu'un EA de relation annotant une UAV n'est pas neutre : sa présence signifie qu'un autre EA de l'UAV est en relation par son intermédiaire, il y a donc bien information d'annotation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...és3
Nous n'en prétendons pas pour autant qu'il n'existe pas de structure << canonique >> dans un document audiovisuel, il nous paraît simplement qu'il est nécessaire de pouvoir exprimer toute autre structure de la même manière. On remarquera qu'en fonction de l'utilisation certains éléments peuvent permettre de donner plus ou moins un statut d'<< unités syntaxique >> aux UAV qu'ils annotent. Par exemple < Plan > si celui-ci est systématiquement utilisé comme tel, ou alors < Voix > , < Dialogue > ,< Musique > si l'intérêt principal d'une annotation du document est l'étude de la bande-son.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... secondaires4
Cela rejoint la critique des mots-clé et la solution proposée dans [172], << gaining the temporality of the multilayered approach without the disadvantages of using keywords, as keywords have been replaced by a structured content representation >>
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... audiovisuelles5
Certaines ayant des relations plus fortes que d'autres du fait de leur appartenance à un même flux.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... machine6
Ce que nous avons appelé << full indexing >>, indexation << totale >> dans [20] référence au << full text >>, plein texte, qui fournit des moyens d'accès à tout élément d'un texte.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... >7
Peut alors se poser la question pour les attributs ayant une valeur unique sous la forme de chaîne de caractère, c'est à dire également exprimables comme EA (par exemple l'attribut Réalisateur que nous évoquions précédemment). Sans apporter de réponse unique -- tout dépend de l'application -- nous choisissons de privilégier la notation sous forme d'EA, et réserveront de tels attributs (comme nom) à des EAA généraux comme par exemple < Homme politique > , qui seront utilisés quand les EA adéquats n'existent pas encore (par exemple un homme politique faisant une première apparition à l'écran).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... unique8
Ce qui nous rapprocherait d'un hapax tel que considéré en linguistique : tout mot est utilisé dans un contexte particulier et a un sens particulier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... entiers9
Tout dépend si on veut passer l'an 2000 ou non...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 19961
Extrait du corpus AIM (Action Indexation Multimédia), nous remercions le Département Innovation de l'Institut National de l'Audiovisuel qui a fourni une partie des matériaux de tests reproduits dans ce mémoire.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... ouverture2
Dans laquelle le journaliste salue les téléspectateurs et présente les grandes lignes du journal.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... d'annotation3
Résultant en partie d'un travail avec une documentaliste de l'INA Centre-Est.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'UAV4
Il y a au moins une annotation, qui est l'élément d'annotation primitif exprimant l'objet d'intérêt repéré, une UAV ne peut exister sans annotation. On peut cependant, à la limite, envisager d'utiliser un élément d'annotation très général < Universel > pour définir des parties de document seulement documentées par leur existence.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... UAV5
L'idée originale de notre approche consistait à aller dans un premier temps définir une UAV dans le contexte d'une autre, et à y sélectionner les EA d'annotation contextuelle.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... unique6
<< ... le sens d'un mot ne lui est pas immanent : il est toujours le produit d'une interprétation, cette interprétation fut-elle fondée sur des inférences par défaut, qui permettent d'hériter des traits sémantiques d'un type lexical pré-construit >> [195].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... associe7
fOp permet de regrouper les diverses fonctions de similarité fop associées aux objets de Op.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... cliques8
Une clique d'un graphe G est un sous-ensemble S de ses sommets tel que le sous-graphe de G engendré par S soit complet.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...G9
Plus précisément, ce graphe d'association a pour sommets des couples de correspondances (x, y) entre sommets de GX et de GY, et ses arêtes expriment une cohérence locale de relations entre correspondances deux à deux considérées.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... informelle10
Nous décrivons cet algorithme dans la suite.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 3]}11
On pourrait penser que [c, 10] fait partie de l'extension de e2 suivant e, ce qui serait vrai si on n'appliquait un critère de cohérence d'ordre 2 prenant en compte le nombre de relations entrantes et sortantes pour le sommet e, et vérifiant qu'il y en a suffisamment pour les candidats à la correspondance avec e. Dans le cas présent, les sommets 8 et 3 ont bien deux arcs entrants et un sortant, ce qui n'est pas le cas du sommet 10.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...é12
Le gel d'un état consiste à interdire toute extension future de celui-ci autre que résultant d'un autre état fusionnant avec lui. Le fait que l'état fusionne signifie qu'il transmet toutes ses propriétés d'extension au nouvel état fusionné, et abandonne donc celles-ci pour lui-même.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... particulier13
Pour peut qu'on n'oublie pas la vérification de la cohérence d'ordre 2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... calculer14
Il faudra alors faire appel à un calcul de voisinage temporel des EA. Ce genre de calcul dépend bien évidemment de la taille des flux et du nombre d'UAV qui y ont été définies.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...G15
Il est également possible de noter GPC = (GP,$ \mu_{C}^{}$) avec $ \mu_{C}^{}$ fonction associant éventuellement à chaque sommet de GP une étiquette de sommet d'intérêt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... figure16
Qui n'est autre qu'une version légèrement étendue du graphe de la figure 2.4.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... 17
Les exemples ici présentés ne sont bien sûr qu'indicatifs et nous ne prétendons pas qu'ils correspondent à une pratique avérée.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... description18
Eventuellement, on pourra avoir une dimension d'analyse << informelle >> < Nom, Texte,{} > simplement décrite par un nom et une description textuelle de la façon de la construire, par exemple << tous les EAA liés à la politique >>. La résolution de la DA fait alors appel à l'utilisateur à un moment ou à un autre.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... attentes19
Comme pour un texte, la lecture et l'interprétation d'un flux audiovisuel sont des phénomènes temporels qui impliquent une constitution du sens dans la durée, la dimension d'analyse est alors structurante de la pensée, de la visée, de la cohérence interprétative analytique de l'utilisateur (pour paraphraser [224]).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... d'EAA20
Bref un vocabulaire limité.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... d'analyse21
On le constate donc, l'approche des Strates-IA est unifiée aussi bien au niveau des descriptions que des descriptions de la manière de décrire ou des requêtes, on conçoit donc que les possibilités de réutilisation de l'expérience de description soient multiples, toutes les connaissances étant exprimées dans des formats comparables.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... d'instancier22
Remarquons que les graphes potentiels permettent d'exprimer implicitement ou explicitement des << conjonctions >> d'annotations (tel et tel EA doivent être présents), des << disjonctions >> (par exemple avec des graphes requête où une dimension d'analyse désigne tel EAA ou tel autre), mais ne permet pas de gérer les négations de façon simple. Cela s'accorde avec notre approche qui considère d'une part qu'on repère << positivement >> des objets d'intérêts, d'autre part que les graphes de recherche sont également construits à la manière de descriptions et non dans un fomalisme différent
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ête23
Cela revient à extraire un schéma de description local d'une annotation déjà en place considérée bon exemple de ce qu'on cherche, afin de construire un graphe requête.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... audiovisuelles24
Par exemple pour spécifier des liens explicites comme liens, on peut utiliser un EA < Lien > , l'éclairage de tels liens d'une UAV relevant alors de l'application d'une relation potentielle contextuelle à l'UAV courante, et du calcul des extrémités correspondantes.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ésignation25
C'est avec cette idée pour objectif qu'a été originalement mis au point le modèle des Strates-IA : il s'agissait d'envisager d'emblée l'annotation d'une unité audiovisuelle comme pouvant provenir de son contexte, aussi bien temporel que structurel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... LEDA1
Voir http://www.mpi-sb.mpg.de/LEDA/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... GRAS2
Voir http://www-i3.informatik.rwth-aachen.de/research/gras/index.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ètre3
Diamètre est ici considéré comme la longueur maximale des chemins d'un graphe.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...étude1
Cette étude reprend et complète les idées que nous avions présentées dans [189].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... contextuelles >>2
Voir 5.3.1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... d'utilisation3
A ne pas confondre avec les cas d'utilisation de la méthodologie de développement objet UML.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... logique1
Désormais : telle qu'elle est décrite dans les modèles documentaires classiques.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... connaissances2
A la limite, les documents XML peuvent devenir totalement structurés, et exprimer des connaissances telles qu'on les trouve dans les bases de données les plus classiques, c'est à dire ayant perdu tout lien avec une structure de présentation documentaire.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... documentaires3
Nous avons ainsi montré dans le cadre des documents audiovisuels que plusieurs organisations arborescentes pouvaient être considérées pour un même document, correspondant à diverses utilisations, sans que l'on puisse privilégier l'une ou l'autre a priori.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Web4
Voir par exemple : Ron Zohar. Web Annotation -- an Overview. Février 1999. [Publié sur le Web http://www.ee.technion.ac.il/ ronz/annotation/].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... documents5
Cette partie vient compléter l'étude bibliographique exposée dans le chapitre 2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... France6
Une description succincte de l'interface de l'outil se trouve dans [20].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'utilisateur7
[18] : << finally we came to the conclusion that content indexing was mostly a task devoted to attaching pieces of meta-information to the document following semantically expressed rules, and that the use of a knowledge representation language was certainly much better suited to this task that plain XML >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... propres8
Si on utilise un langage dérivé tel que RDF pour la représentation d'un graphe Strates-IA, on rapproche le langage documentaire -- mais l'est-il encore -- du modèle représenté : RDF sert à représenter des graphes.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... redevables9
Peut-être cela pourrait-il vouloir signifier qu'un pas serait alors fait vers une logique nouvelle d'organisation des connaissances documentaires et des documents, adaptée à une vision purement multimédia des documents. Les outils d'exploitation restent alors à inventer pour permettre de << lire >> des documents et d'en construire en cours de lecture des structures qu'il soit possible d'appréhender.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'audiovisuel10
La norme dépasse en fait de loin ce cadre, car ce sont rien moins que les documents multimédias qui sont visés ! L'ensemble des propositions jusqu'ici proposées se référant à des flux temporels continus, nous nous limiterons aux documents audiovisuels dans cette présentation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... basiques11
La distinction entre descripteurs et schémas de description est loin d'être claire et est régulièrement remise en cause. Il semble qu'elle fasse partie des ambiguï tés infantiles du modèle.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... XML12
La spécification de formats documentaires fait entre autres partie des objectifs de XML-Schéma ! Ce fait illustre un renversement de situation : à partir d'un langage documentaire (SGML) a été mis en place un langage plus souple (XML), toujours adapté aux documents, mais également à la représentation de n'importe quels types de données (ou connaissances). Structuration documentaire et structuration de données semblent donc en voie de fusionner. Il est possible d'analyser cette évolution par l'apparition de la notion de document bien formé en XML, qui n'existait pas en SGML. Cette notion a amené la possibilité de traiter les instances indépendamment de leur modèle, et lui a ôté de son importance, l'instance devenant le lieu d'expression de toutes les données.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... << composition >>13
Des liens d'héritage sont également possibles afin de spécialiser des DS.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... l'audiovisuel14
Ainsi que la volonté de s'attaquer également aux contenus multimédias, et de manière générale à un peu toute la connaissance imaginable : le MultimediaDS devrait contenir un HumanBodyDS pour décrire les parties du corps et leurs relations ! (lesquelles devront en toute logique être connectées à des actions, à des commentaires...)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... TEI15
Qui était à la base conçue pour un usage uniquement universitaire, sans ambition universelle, et est reprise dans d'autres domaines.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ésultats16
Ce que voulait être AEDI à ses débuts.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...étendue17
Aux objets à l'intérieur des images, ou aux objets en mouvement, cf. 1.2.1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...étouffement18
Les auteurs notent très justement qu'alors les plans sont mis en relation par les attributs d'unités sémantiques qui les concernent, ce qui est l'équivalent de ce que note Stiegler en considérant le travail d'annotation aidé du chercheur.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... lien19
Cela pourrait s'apparenter dans les Strates-IA à l'utilisation d'un graphe potentiel à partir d'un élément d'annotation abstrait. Les graphes potentiels associés aux valences peuvent alors être candidats à être utilisés comme graphe potentiels de navigation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... ordre20
En considérant grossièrement les n\oeuds comme des prédicats et les liens comme des opérateurs logiques.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... transformation21
Si d est une représentation de document, q une représentation de requête et K l'ensemble des connaissances, alors la mesure de pertinence r(d $ \rightarrow$ q) relativement à K est déterminée par transformation minimale appliquée à d pour obtenir d' tel que d' $ \rightarrow$ q. Bref, c'est la transformation de la requête telle qu'elle implique (dans le modèle logique) le document.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... connaissances22
Dans un ordre d'idée proche, mais sans spécialement utiliser les possibilités d'inférence des graphes conceptuels, citons les travaux de [184] repris par [196] dans le cadre des bases de documents multilingues.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... langue23
Et se rapproche des objectifs initiaux de Sowa [215].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... Wordnet24
Voir http://www.cogsci.princeton.edu/wn/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... juste25
Un processus de normalisation sémantique de la base de connaissance terminologique doit ainsi permettre que les sémantiques formelles (le concept comme prédicat) et opérationnelles (les manipulations sur les prédicats) aboutissent à des résultats signifiant quelque-chose lorsqu'ils seront interprétés. Ceci n'est réalisable que dans un domaine limité, avec des primitives parfaitement fixées, permettant d'exprimer des concepts non ambigus sur lesquels on fera des calculs.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... chemins26
Inférences contextuelles dirons-nous.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... description27
Le plus souvent, la mise en place d'ontologies de domaines résulte d'un traitement automatique de documents techniques associés au domaine, l'organisation des descripteurs dans l'ontologie relevant d'une démarche de rationalisation la plus limitée possible au niveau des ajouts de termes [24].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... relation28
Quoiqu'on puisse l'envisager dans le cadre de certaines dimensions d'analyse, voir plus loin.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ères29
Si on considère des unités audiovisuelles << étendues >> (pour désigner par exemple un objet se déplaçant ou bien une piste d'un flux sonore), il convient d'être plus prudent. Car alors il devient possible de charger l'unité d'ancrage d'une signification, par exemple << ceci est un objet déformable >> ou << ceci est la piste numéro 1 destinée aux effets spéciaux >>. Ces unités d'inspiration technologique peuvent alors être rapidement intrônisées unités syntaxiques d'un éventuel << langage audiovisuel >>, de la même manière que l'on distingue des mots et des phrases dans les textes. Si cela est tout à fait possible, il n'en reste pas moins qu'il convient d'être conscient des limitations et des a priori que l'on introduit par une telle approche. Les mots de textes n'en sont pas les unités ultimes, et les discours se ramènent en dernier lieu à une suite de phonèmes dépourvus de toute signification. Les documents audiovisuels, comme superpositions extrêmement complexes de flux audio et vidéo peuvent être étudiés suivant des décomposition syntaxiques à caractère technologique (par exemple les objets vidéo MPEG-4), pourvu qu'on n'affirme pas qu'il ne peut en être autrement. Les unités audiovisuelles des Strates-IA se fondent sur l'axe minimal qu'est l'axe temporel. L'extension des unités audiovisuelles de la façon la plus neutre possible consisterait par exemple à considérer une zone image (et non un objet) et à considérer un unique flux sonore. Il y aurait alors des strates audiovisuelles (avec une partie vidéo étant une zone d'image évolutive), des strates vidéo, et des strates audio.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...écialisation30
Cela pourrait être rapproché de certaines inférences dans les réseaux sémantiques, telles que les << path-based inferences >> proposées par [207].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... utilisent31
Ainsi bien entendu que par les mots utilisés pour les termes de description, dont l'interprétation a été suspendue par le passage au terme, mais qui sont, quoiqu'il arrive et quelque soit le contexte, interprétables [195].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...és32
Il est alors intéressant de constater que d'une certaine manière, on << termine la phrase >> qui a été commencée par la mise en place du premier élément d'annotation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... termes33
Ces classes peuvent être déclarées d'entrée de jeu dans la base de connaissances en utilisant les relations de spécialisation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... contextualisation34
Cependant, retrouver le contexte dans lequel un EA a été utilisé est l'assurance d'une lecture juste.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... multi-axiales35
Au sens où à la fois l'axe temporel et les axes de relations des graphes (un graphe n'est pas a priori un chemin) sont mobilisés.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... lecture36
Tout l'enjeu des interfaces d'annotation est alors de d'aider l'utilisateur à fournir ce travail, c'est à dire à gérer en même temps la détemporalisation de l'annotation et l'engagement dans le flux temporel qu'il visionne. L'interface d'annotation que nous proposons (cf. figure 3.2) est un exemple de réponse à cet enjeu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ées37
Par exemple en étudiant des cas d'utilisation rationalisés par les mêmes modèles de tâches.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... varient38
Certains valences peuvent également être proposées << dynamiquement >> pour des EAA en fonction des schémas de description auxquels ils participent par l'intermédiaire de dimensions d'analyse.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... d'EAA39
Le thésaurus pourrait par exemple être mis en place par un traitement automatique sur des textes de description, ou bien en utilisant un dictionnaire tel que Wordnet.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... connaissances1
Quoiqu'à la limite il soit possible d'imaginer un document et ses annotations sans base de connaissances : une base de connaissance minimale, plate, constituée des EAA utilisés dans l'annotation peut être mise en place et permettre l'exploitation du document.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... interactif >>2
Voir http://www.ina.fr/Production/Studio/index.fr.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... EuroDelphes3
Voir ttp://www.ina.fr/Recherche/Delphes/index.fr.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... textuels4
Même s'il est certain que des modèles textuels simples se révèlent utiles d'entrée de jeu, par exemple la possibilité d'accéder à une table des matières des chapitres dans les DVD.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... strates5
Nous nous sommes au long de ce mémoire limité à ce dernier degré.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
... RECIS6
Recherche et Exploration de Contenus Image et Son.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Yannick Prié
2000-01-25