- ... lyonnais1
- Le laboratoire
Reconnaissances des Formes et Vision (RFV) de l'Insa de Lyon ; le
Laboratoire d'Informatique du Parallélisme (LIP) de l'ENS-Lyon ;
le Laboratoire Image Signal et Accoustique (LISA) de CPE-Lyon ; le
Laboratoire d'Ingéniérie des Systèmes d'Information (LISI) de
l'Insa de Lyon.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... partenaires2
- France 3
Rhône-Alpes-Auvergne et l'INA (Institut National de l'Audiovisuel)
Centre-Est
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... technique3
- le Centre
Inter-universitaire de calcul Scientifique et Médical (CISM).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... connaissances4
- Par
opposition à une trace << brute >> sans référence à une base de
connaissances.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... chemin5
- Le
noeud extrémité d'un chemin est déclaré comme étant en contexte avec
le noeud de départ selon le chemin qui les réunit.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... texte1
- L'auteur prend ici le terme texte est
dans son sens le plus large, une image peut alors être
considérée comme un texte qu'on lit.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
principalement2
- Il convient d'y ajouter le toucher, qui est
appelé à connaître un avenir intéressant. Ainsi les aveugles
peuvent lire du braille généré par un ordinateur, ce qui sera
également bientôt possible sur le WEB, tandis que des
vêtements équipés de vibreurs permettront dans le futur de
ressentir les documents musicaux (mais ne seront-ils pas alors autre
chose ?) directement au niveau de la peau.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... document3
- Cette définition pourrait
aussi convenir au terme hypermédia, mais ce terme nous semble
voué à disparaître, nous lui préférons donc
multimédia.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... directement4
- Quoique certains
anciens évoquent le système keydex qui permettait de réaliser
des ET sur des fiches-index perforées .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ées5
- On notera qu'à ce niveau il peut y
avoir désémantisation presque totale des identifiants de
données, c'est à dire qu'un être humain devra avoir une
connaissance totale du système et de l'application pour pouvoir
les utiliser en tant que tels : c'est par exemple le cas dans des
séances de déboggage les plus ardues.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
descripteurs6
- Comme tout descripteur d'un document peut en
servir d'index, nous emploierons indifféremment ces deux termes dans
la suite.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... Altavista7
- Moteur de recherche bien connu http://www.altavista.com.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... exemple)8
- Y. Chiaramella, Approche et modèles en Recherche d'Information, cours
Inforsid'99, Toulon, Juin 99.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... Core 9
- Voir http://purl.org/dc/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... Web10
- Le moteur de recherche Altavista indexe
également sous forme d'ensemble de mots-clé pondérés tous
les documents du Web, en tenant désormais compte de leurs types
(web, images, vidéos, sons), et l'utilisateur peut spécifier le
type de document qu'il cherche.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... interroger11
- Par exemple,
l'utilisation d'une organisation conceptuelle des termes de
description permet d'enrichir les requêtes http://www.sunlabs.com/research/knowledge/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... assistance12
- Espérons-le, intelligente.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... audiovisuel1
- Audiovisuel a également
perdu son statut de << Nouvelles Technologies de l'Education >>
(NTE) d'il y a vingt ans.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... mouvement2
- C. Metz : << Le
mouvement donne aux objets une corporalité et une autonomie qui
étaient refusées à leur effigies immobiles, il les arrache à
la surface plane où ils étaient confinés, il leur permet de
mieux se détacher comme << figures >> sur un << fond >> :
libéré de son support, l'objet se << substancialise >> >>
[157].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...éel3
- Mieux, si un personnage s'envole soudain, le
spectateur, passant sans le savoir un << contrat de réalité >>
avec le réalisateur du flux, considérera cela comme un mouvement
réel, avec l'effroi que l'on peut imaginer au début du XXème
siècle.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... flux4
- Ceci pourrait changer avec de nouvelles
technologies, telles MPEG4 (voir 1.2.1), dans lesquelles ont
décrit les contenus audiovisuels à l'aide d'objets vidéo dont
les représentations sont superposées à l'écran et sur les
haut-parleurs : il devient possible d'accéder aux objets
individuellement.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
jouer5
- Les descriptions varient suivant les sources : l'enfant
qui joue peut être remplacé par une << femme lascive >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... spectateur6
- C. Metz : << Le film,
que l'on croirait susceptible de donner lieu à une lecture
transversale, par l'exploration à loisir du contenu visuel de
chaque plan est presque à tout coup l'objet d'une lecture
longitudinale, précipitée, déplacée vers l'avant et anxieuse
de la << suite >>. La séquence n'additionne par les plans, elle les
supprime >> [157].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... plan7
- Auquels on peut
rajouter les objets vidéo insérés, par exemple les incrustations de
commentateurs météo sur les photos satellites.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
raconter8
- Les règles du montage et de la narratologie ont
été fort étudiées pour le cinéma
[55,106].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... premiers9
- La bande-son y prend une
importance prépondérante sur l'image -- comme dans une
interview. Comme le montrent de façon convaincante
Sorlin [214] ou Chion [58], le rôle de la télévision
dans la plupart des foyers est souvent pendant la journée celui
qui était assuré par les radios dans le passé : celle d'une
présence, essentiellement sonore, qui permet de vaquer à
d'autres occupations, par exemple pousser le siège pour passer le
balai, les programmes étant souvent conçus en conséquence.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... cause10
- Voir par exemple la Nouvelle Vague en
France.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ées11
- Il n'est pas sûr qu'un
réalisateur d'une émission de télé-achat ait plus de
liberté qu'un rédacteur d'horoscope dans un magazine.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... rushes12
- Les rushes sont les plans << bruts >>
tels qu'ils ont été tournés. Les caméras numériques permettent
de documenter les conditions de tournage, automatiquement (heure,
température) ou manuellement. Cette opération est appelée
logging en anglais [73].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... audiovisuels13
- Voir
par exemple les expérimentations de Peter Greenaway dans le film
The pillow book (1996).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...és14
- On notera que la manière dont un document
est diffusé, par exemple comme partie d'un journal
télévisé est souvent aussi pertinente que ce qui a été
filmé .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
auteur15
- Signalons au passage la volonté récente du
gouvernement des Etats-Unis de financer la restauration et la
préservation de quelques films anciens << témoignages du génie
américain >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
France16
- Créée en 1995, ce qui correspond à la
reconnaissance officielle par l'Etat français des documents
audiovisuels produits et diffusés en France comme partie de
l'héritage culturel national [79]. l'Inathèque
enregistre systématiquement les programmes des six principales
chaînes françaises et de Radio France, et met les documents
à disposition d'un public de chercheurs. Les notices sont
consultables à http://inatheque.ina.fr.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... audiovisuelle17
- Par exemple dans un rapport
récent à l'UNESCO [85], les archivistes audiovisuels
cherchent à définir leur métier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... détemporalisée18
- Mais non
forcément atemporalisée : la temporalité peut être en partie
conservée, par exemple si on conserve des extraits de bande-son pour
accompagner une image représentative d'un plan.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ère19
- http://www.adobe.com.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... editor20
- http://www.macromedia.com.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ération1
- Ces considérations font
écho à celles d'usage au niveau des documents textuels, dont les
modèles de structuration permettent la manipulation et l'accès.
Si bien entendu les documents audiovisuels sont différents des
documents classiques, il n'empêche que bien des études menées
sur eux sont consciemment ou non redevables des acquis issus des
recherches sur les documents textuels. Sans préjuger
d'évolutions futures pouvant radicalement changer notre manière
de voir les documents audiovisuels, il convient de reconnaître
que l'analogie avec les documents textuels se révèle féconde,
pourvu qu'on en reste conscient.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... W3C1
- http://www.w3c.org.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... automatique2
- Aux problèmes liés
aux transitions << exotiques >> entre plans prêt : un fondu
enchaîné ou un volet seront moins évidents à repérer
automatiquement qu'un simple cut.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...éalisateur3
- Par exemple, dans le schéma d'indexation de
l'INRIA pour les << audiovisuels >> en 1982 [40], les
données de description globales sont réparties en données de
cataloguage (Signalement :titre, durée, support, documents
d'accompagnement ; Production-Réalisation : date, pays,
producteur, auteur... ; Distribution) et données d'analyse
(Contenu : explicitation du contenu, résumé, descripteurs ;
Traitement audiovisuel : genre, analyse globale, son, image ;
Utilisations : utilisations possibles, public, observations ;
Appréciations et compléments : points forts, nature de l'analyse
effectuée, etc.).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
Questel4
- Cf. http://www.questel.orbit.com/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
MPEG-75
- Le format de compression de fichiers audio MPEG-3 n'a
rien a voir avec une éventuelle indexation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...écis6
- Véritable << patron >> de
production.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...égories7
- Catégories non
limitatives : space, time, wheather, characters, objects, characters
actions, objects actions, relative position, screen position,
recording medium, cinematography, shot transitions, subjective
thoughs about the material.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... physique8
- Un mot-clé pour un acteur ou un
personnage n'est créé qu'après au moins cinq apparitions : il
ne suffit pas d'accéder à l'écran une fois pour passer à la
postérité...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...é9
- Nonobstant l'organisation
hors-documents des descripteurs dans le thésaurus.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
l'importance10
- Comme par exemple pour les descripteurs
d'ouvrages de la base Rameau de la Bibliothèque Nationale, où le
deuxième terme de description, s'il est présent, est un
qualificateur du premier [108].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
exemple)11
- Les liens entre objets-image (régions) et types
sémantiques sont mis en place par un humain.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... dimensions12
- Cette annotation est donc très riche, et
difficile à mettre en place par l'utilisateur, c'est pourquoi un
outil graphique d'aide à l'annotation de plan a été mis au
point : il s'agit de spécifier dans un monde en trois dimensions
vu du point de vue de la caméra les différents objets, leurs
mouvements et interrelations, l'outil se chargeant de transcrire
cette vue en description basée sur la logique
spatio-temporelle STL [77], qui est un langage
de représentation de relations spatio-temporelles. Une projection
de la vue en trois dimensions sur un plan en deux dimensions
d'après la position de la caméra permet d'obtenir le plan tel
que représenté sur l'écran. Les requêtes sur les plans
peuvent alors se faire par l'exemple, avec un langage iconique par
exemple.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
tel13
- Par exemple [63] annote des plans avec des
mots-clé, et regroupe ceux-ci en scènes, également annotées
elles-mêmes, sans pour autant mettre en place de hiérarchie
arborescente pour le document (on en reste au niveau de scènes
définies à volonté).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... film14
- A titre
d'indication, l'annotation complète (après passage des outils
automatiques) d'un film comme Le guépard par les techniciens
et les experts de la Cinémathèque Toscane a nécessité une
journée, ce qui est peu en regard de l'investissement en temps
nécessaire à la réalisation d'un tel film.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...[249]15
- Le lecteur notera que les
deux travaux d'origine japonaise présentés ici ne nous étaient
pas connus au moment de l'étude bibliographique fondatrice de
notre travail.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... floue16
- Ces
relations sont mises en place implicitement quand il y a
co-occurence entre descripteurs ou explicitement quand l'utilisateur
le spécifie en mettant deux nuds en relation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...èque17
- http://www.ina.fr/Inatheque/index.fr.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
Paris18
- http://www.vdp.fr/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
industriel19
- Plus généralement, plusieurs produits
destinés aux professionnels existent sur le marché, on en
trouvera un état de l'offre sur http://www.footage.net/directory/dbsystems/. Le site propose
également de rechercher des documents dans un réseau de
plusieurs archives de documents audiovisuels.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... lien20
- Cela pourrait accréditer
la thèse de la nécessité d'une phase de pré-recherche
textuelle dans la base avant de s'intéresser à des composantes
images du document.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...éfilement21
- Même accéléré ou ralenti, le
défilement devient rapidement incompréhensible, au niveau de
l'image, mais aussi, et de façon encore plus critique, au niveau
du son.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ée22
- Méthode qui peut d'ailleurs servir également
à l'indexation, comme nous l'avons vu plus haut.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... mouvants23
- Exemples disponibles sur http://nif.www.media.mit.edu/stills ou encore http://mmassey.www.media.mit.edu/people/mmassey/SSindex.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... pause)24
- Pour une
actualisation de ce prototype et quelques copies d'écran, voir http://www.interval.com/projects/mediast/index.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... pertinents25
- Plus précisément on définit un
schéma conceptuel, avec des classes, des attributs, des relations
de propriété et d'héritage, puis de ce modèle abstrait, on
procède à un appariement sur un graphe orienté au relations
nommées, qui est la structure de données. On exploite ensuite
les propriété des graphes pour définir des outils de
manipulation, qui permettront les opérations de filtrage de
données. La perspective est un sous-graphe de mêmes
propriétés, le filtre est un ensemble de conditions sur les
attributs d'objets, la sélection étant l'application de ce
filtre par le biais de la perspective.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ées26
- Il faut également tenir compte des
capacités humaines d'attention, [225]
décrit des interfaces de présentation vidéo en prenant en
compte cet aspect.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
histoire27
- Les histoires enfantines japonaises -- en dessins
animés -- inspirent les chercheurs, serait-ce parce que leur trame
est facilement représentable et étudiable ? Ceci peut être mis en
lien avec les analyses de Propp sur les contes russes.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
format28
- Ce format devrait avoir à faire à MPEG7 et à XML
(voir section 5.2.4). On notera que [144]
propose de décrire des prescriptions de mise en place de documents
audiovisuels dans un format lié à SGML, tandis que
[18] compte utiliser XSL pour générer de nouveaux
documents à partir de descriptions de documents en XML : la prise
en compte de description de documents audiovisuels comme des
documents structurés décrits dans des langages de balises
progresse donc.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... interprétables1
- Et surtout non interprétés.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... primitives2
- Passons sur deux
problèmes importants. D'une part, exhiber une image comme
requête signifie simplement l'espérance que la machine va
elle-même y reconnaître les traits pertinents qu'on veut y
trouver : on ne spécifie pas ce que l'on veut. Pour pallier ce
problème, certains auteurs proposent que l'utilisateur dessine lui-même ce qu'il cherche, c'est à dire << écrive
sa vision >>. Deux difficultés se posent encore à ce niveau. En
premier lieu, tout le monde n'est pas capable de s'exprimer par le
dessin. En deuxième lieu, la mise en place d'une icône
obéit à des règles fortement culturalisées, ne participe pas
de la même modalité sémiotique que l'image filmée
[231]. Il n'y a donc a priori aucune raison pour
qu'un traitement sur une icône donne des résultats exploitables
par exemple sur une photographie. Pour le son, la question est sans
doute plus nuancée, au sens où l'expression est << plus directe >>
dans le matériau sonore, est plus phénoménologiquement
située. Les erreurs de rythme ou les fausses notes n'en existent
pas moins.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... justement3
- Ces interprétants peuvent également être
partagés culturellement : une photographie noir et blanc jaunie ne
sera pas a priori considérée comme ayant été prise la
veille. La perception de son contenu sera alors médiée par la
supposition que les objets et les personnages représentés sont
anciens.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... l'expliquant4
- D'autre part, il ne nous
semble pas pertinent de supposer qu'il est possible d'apprendre une
combinaison (par exemple pondérée) de mesures de similarités
d'un utilisateur, c'est à dire de supposer a priori que les
primitives ininterprétables extraites pourraient former par
combinaison des primitives interprétables.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... Gestalttheorie5
- Théorie de la perception développée
au début du XXème siècle en Allemagne, qui a par exemple mis en
évidence le fait que l'humain repère plus spontanément certaines
formes géométriques simples.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
possible6
- Citons cette éclairante déclaration de R. Jain
[130] : << Keywords often provide a better description of
the person who assigns them than they do the image >> ce qui
signifie pour les auteurs que la diversité de l'appréhension
humaine d'une image ne doit non pas être résolue en agissant sur
les possibilités de description par l'homme des images (problème
étudié depuis fort longtemps dans les bibliothèques), mais
bien en allant chercher dans celles-ci un contenu objectif,
supposé partagé, et -- celà va sans dire -- calculable.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ésultats7
- Cela montre également
qu'il n'est pas utile de traiter du signal pour traiter du signal,
mais bien dans le cadre d'une aide à l'exploitation des documents
en tant que signal. Le traitement du << signal documentaire >> doit
donc être guidé par les besoins réels des utilisateurs de
documents, qui n'ont pas à s'adapter aux similarités qu'on leur
propose.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...égoriser8
- On a ainsi les syntagmes parallèles, les
syntagmes en accolade, les syntagmes descriptifs, les syntagmes
alternés, les scènes et les séquences.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...és9
- Ce qui prouve que Metz n'est pas si radical
qu'on a pu l'interpréter, en figeant sa pensée dans un langage du
cinéma strict, se rapprochant d'une grammaire telle qu'envisagée en
informatique.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...écouvrir10
- On peut observer le
même phénomène pour les documents écrits, si par exemple un
rapport de recherche est décrit suivant une hiérarchie
document/partie/chapitre/section/etc., il pourra également
l'être suivant les segments bibliographiques, originaux, de
résultats, etc. sans que ce découpage reflète forcément le
premier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
plans11
- Sans vouloir anticiper trop, c'est ce genre de
relations que nous autoriserons de façon naturelle dans les
Strates Interconnectées par les Annotations.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
(joie)12
- Lucas avouait lui-même volontier s'être inspiré
des théories structuralistes de Propp pour construire le
scénario de son film.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... même13
- Des conférences et ateliers lui sont
ainsi consacrés régulièrement ces dernières années, par
exemple, les International and Interdiciplinary Conference on
Modeling and Using Context (Rio de Janeiro, 1997 -- Trente,
1999), les conférences ISIC Information Seeking in Context
tous les deux ans depuis 1996 ou l'atelier AAAI Workshop on
Reasoning in Context for AI Applications de la conférence AAAI
1999.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... discrets14
- Dans une approche logique par exemple,
[149] définit un contexte comme une collection
d'hypothèses. La relation ist(c, p) signifie que la proposition
p est vraie dans le contexte c, une proposition ist étant
elle-même toujours vraie dans un certain contexte. Une grande
partie des travaux en logique se base sur l'étude des interactions
entre contextes, la mise en place de contextes élémentaires qui
sont ensuite couplés en fonction de la tâche courante, etc.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... machine15
- Ces dernières
peuvent bien entendu expliciter des phénomènes cognitifs, mais
il y a lieu que ce soit en machine.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... l'image16
- Rappelons que le système de
[6] a été mis en place pour gérer les notes de
travail vidéo des anthropologistes. Le << contenu de génération >>
correspond alors à la réponse aux questions où, qui, quand,
pourquoi, comment, et doit être documenté au moment du filmage.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ératif17
- L'outil est explicitement un outil d'analyse :
<< This case study illustrated how our approach can be used
to examine and identify temporal trends and how different
types of relationships can be easely explored within MultiMedia
Visual Information Seeking (MMVIS) >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... hors-besoins18
- Ou
plus précisément pour des besoins << standards >> tellement
généraux qu'ils en deviennent inutiles, par exemple << trouver
une image qui ressemble à >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ées19
- Par exemple, si je cherche des objets
archéologiques, alors il peut être utile d'utiliser telle ou
telle similarité, parce que les images considérées seront
connues comme images de résultats de fouilles archéologiques
(données techniques, de forme, connaissance de la photographie
comme prise devant un fond uni, etc.).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
possible20
- Nous avons tenté, au début de notre travail
de définir des invariants de description, notamment
structurels (en se basant sur la narratologie ou l'analyse filmique)
qui conviennent aux documents audiovisuels en général. L'échec de
cette approche et notre volonté de ne pas définir ex-nihilo
des schémas de description font que nous nous sommes plutôt
concentrés sur des modèles abstraits de description adaptés à
l'audiovisuel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... (temporel21
- En se limitant à des parties
comparables temporellement, c'est à dire issues d'un même flux.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... intelligente22
- Cf. le premier chapitre,
p. : << une indexation intelligente est un
indexation offrant dans son mode de
fonctionnement/représentation même la possibilité de
l'interroger sur elle-même, en tant qu'indexation et
métadonnée. Tout document indexé ainsi offre par la
description de son contenu structuré et indexé la possibilité
d'inférences, de calcul sur ses index, que ceux-ci soient
décrits en dehors de lui ou bien en son sein. Toute utilisation du
document passe par conséquent par l'un de ses index, et peut
être considérée comme ensemble de connaissances -- comme le
sont également les index utilisés comme tels en situation
d'action --. Le système est alors entièrement géré par les
connaissances, puisque pour toute utilisation, tout est
connaissance. >>
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...[19]1
- Les auteurs proposent ainsi
qu'un document virtuel soit composé de parties de documents
éventuellement définis dans plusieurs fichiers différents. Par
exemple, un document peut être considéré comme entier même
s'il se trouve sur plusieurs bandes, ou alors il est possible de
couper des parties d'un enregistrement (comme des publicités) pour
les << projeter >> sur un document entier virtuel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...érerons2
- Si les EA peuvent tous servir de relation,
certains n'en sont pas moins plus << typés >> comme lien, par
exemple un EA < CStruct > (contient structurellement) servant à
lier deux EA structurels (< Scène > et < Plan > ) ne sera
vraisemblablement utilisé que comme EA de relation. Il en ira de
même pour des EA des cas-relations tels que < Agt > (Agent) ou
< Rcpt > (Récepteur) [215], ou encore d'autres relations
telles que < Meth > (Méthode), < Qty > (Quantité)
[24]. On peut donc établir un continuum entre EA
toujours utilisés comme relations et EA toujours utilisés comme
concepts. Remarquons cependant qu'un EA de relation annotant une UAV
n'est pas neutre : sa présence signifie qu'un autre EA de l'UAV
est en relation par son intermédiaire, il y a donc bien
information d'annotation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...és3
- Nous n'en
prétendons pas pour autant qu'il n'existe pas de structure
<< canonique >> dans un document audiovisuel, il nous paraît
simplement qu'il est nécessaire de pouvoir exprimer toute autre
structure de la même manière. On remarquera qu'en fonction de
l'utilisation certains éléments peuvent permettre de donner plus
ou moins un statut d'<< unités syntaxique >> aux UAV qu'ils
annotent. Par exemple < Plan > si celui-ci est systématiquement
utilisé comme tel, ou alors < Voix > , < Dialogue > ,< Musique >
si l'intérêt principal d'une annotation du document est
l'étude de la bande-son.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... secondaires4
- Cela rejoint la critique des mots-clé et la
solution proposée dans [172], << gaining the temporality
of the multilayered approach without the disadvantages of using
keywords, as keywords have been replaced by a structured content
representation >>
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... audiovisuelles5
- Certaines ayant des relations plus fortes
que d'autres du fait de leur appartenance à un même flux.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
machine6
- Ce que nous avons appelé << full indexing >>,
indexation << totale >> dans [20] référence au
<< full text >>, plein texte, qui fournit des moyens d'accès à
tout élément d'un texte.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... >7
- Peut alors se poser la
question pour les attributs ayant une valeur unique sous la forme de
chaîne de caractère, c'est à dire également exprimables
comme EA (par exemple l'attribut Réalisateur que nous
évoquions précédemment). Sans apporter de réponse unique --
tout dépend de l'application -- nous choisissons de privilégier
la notation sous forme d'EA, et réserveront de tels attributs
(comme nom) à des EAA généraux comme par exemple
< Homme politique > , qui seront utilisés quand les EA adéquats
n'existent pas encore (par exemple un homme politique faisant une
première apparition à l'écran).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... unique8
- Ce qui nous rapprocherait d'un
hapax tel que considéré en linguistique : tout mot est utilisé
dans un contexte particulier et a un sens particulier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... entiers9
- Tout dépend si on veut passer l'an 2000 ou
non...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... 19961
- Extrait du corpus AIM (Action
Indexation Multimédia), nous remercions le Département
Innovation de l'Institut National de l'Audiovisuel qui a fourni une
partie des matériaux de tests reproduits dans ce mémoire.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
ouverture2
- Dans laquelle le journaliste salue les
téléspectateurs et présente les grandes lignes du journal.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
d'annotation3
- Résultant en partie d'un travail avec une
documentaliste de l'INA Centre-Est.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... l'UAV4
- Il y a au moins une annotation,
qui est l'élément d'annotation primitif exprimant l'objet
d'intérêt repéré, une UAV ne peut exister sans annotation.
On peut cependant, à la limite, envisager d'utiliser un
élément d'annotation très général < Universel > pour
définir des parties de document seulement documentées par leur
existence.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... UAV5
- L'idée originale de
notre approche consistait à aller dans un premier temps définir
une UAV dans le contexte d'une autre, et à y sélectionner les EA
d'annotation contextuelle.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
unique6
- << ... le sens d'un mot ne lui est pas immanent : il
est toujours le produit d'une interprétation, cette
interprétation fut-elle fondée sur des inférences par
défaut, qui permettent d'hériter des traits sémantiques d'un
type lexical pré-construit >> [195].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... associe7
- fOp permet de
regrouper les diverses fonctions de similarité fop associées aux objets de Op.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... cliques8
- Une
clique d'un graphe G est un sous-ensemble S de ses sommets tel
que le sous-graphe de G engendré par S soit complet.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...G9
- Plus précisément, ce graphe d'association a pour
sommets des couples de correspondances (x, y) entre sommets de
GX et de GY, et ses arêtes expriment une cohérence locale
de relations entre correspondances deux à deux considérées.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... informelle10
- Nous décrivons cet algorithme dans
la suite.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... 3]}11
- On pourrait penser que [c, 10] fait partie de
l'extension de e2 suivant e, ce qui serait vrai si on
n'appliquait un critère de cohérence d'ordre 2 prenant en compte
le nombre de relations entrantes et sortantes pour le sommet e, et
vérifiant qu'il y en a suffisamment pour les candidats à la
correspondance avec e. Dans le cas présent, les sommets 8 et
3 ont bien deux arcs entrants et un sortant, ce qui n'est pas le
cas du sommet 10.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...é12
- Le gel d'un état consiste à interdire toute
extension future de celui-ci autre que résultant d'un autre état
fusionnant avec lui. Le fait que l'état fusionne signifie qu'il
transmet toutes ses propriétés d'extension au nouvel état
fusionné, et abandonne donc celles-ci pour lui-même.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... particulier13
- Pour peut qu'on n'oublie pas la
vérification de la cohérence d'ordre 2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... calculer14
- Il faudra alors faire appel
à un calcul de voisinage temporel des EA. Ce genre de calcul
dépend bien évidemment de la taille des flux et du nombre d'UAV
qui y ont été définies.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...G15
- Il est également
possible de noter
GPC = (GP,) avec
fonction
associant éventuellement à chaque sommet de GP une
étiquette de sommet d'intérêt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... figure16
- Qui n'est autre qu'une version légèrement
étendue du graphe de la
figure 2.4.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
17
- Les exemples ici
présentés ne sont bien sûr qu'indicatifs et nous ne
prétendons pas qu'ils correspondent à une pratique avérée.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
description18
- Eventuellement, on pourra avoir une dimension
d'analyse << informelle >>
< Nom, Texte,{} > simplement décrite
par un nom et une description textuelle de la façon de la
construire, par exemple << tous les EAA liés à la politique >>.
La résolution de la DA fait alors appel à l'utilisateur à un
moment ou à un autre.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... attentes19
- Comme
pour un texte, la lecture et l'interprétation d'un flux audiovisuel
sont des phénomènes temporels qui impliquent une constitution du
sens dans la durée, la dimension d'analyse est alors structurante de
la pensée, de la visée, de la cohérence interprétative analytique de
l'utilisateur (pour paraphraser [224]).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... d'EAA20
- Bref un vocabulaire limité.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
d'analyse21
- On le constate donc, l'approche des Strates-IA est
unifiée aussi bien au niveau des descriptions que des descriptions
de la manière de décrire ou des requêtes, on conçoit donc que les
possibilités de réutilisation de l'expérience de description soient
multiples, toutes les connaissances étant exprimées dans des formats
comparables.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... d'instancier22
- Remarquons que les
graphes potentiels permettent d'exprimer implicitement ou
explicitement des << conjonctions >> d'annotations (tel et tel EA
doivent être présents), des << disjonctions >> (par exemple avec des
graphes requête où une dimension d'analyse désigne tel EAA ou tel
autre), mais ne permet pas de gérer les négations de façon simple.
Cela s'accorde avec notre approche qui considère d'une part qu'on
repère << positivement >> des objets d'intérêts, d'autre part que
les graphes de recherche sont également construits à la manière de
descriptions et non dans un fomalisme différent
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ête23
- Cela revient
à extraire un schéma de description local d'une annotation déjà en
place considérée bon exemple de ce qu'on cherche, afin de construire
un graphe requête.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
audiovisuelles24
- Par exemple pour spécifier des liens explicites comme liens, on peut utiliser un EA < Lien > ,
l'éclairage de tels liens d'une UAV relevant alors de
l'application d'une relation potentielle contextuelle à l'UAV
courante, et du calcul des extrémités correspondantes.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ésignation25
- C'est avec cette idée pour objectif qu'a
été originalement mis au point le modèle des Strates-IA : il
s'agissait d'envisager d'emblée l'annotation d'une unité
audiovisuelle comme pouvant provenir de son contexte, aussi bien
temporel que structurel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... LEDA1
- Voir http://www.mpi-sb.mpg.de/LEDA/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... GRAS2
- Voir http://www-i3.informatik.rwth-aachen.de/research/gras/index.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ètre3
- Diamètre
est ici considéré comme la longueur maximale des chemins d'un
graphe.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...étude1
- Cette étude
reprend et complète les idées que nous avions présentées dans
[189].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... contextuelles >>2
- Voir
5.3.1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... d'utilisation3
- A ne pas confondre avec les cas
d'utilisation de la méthodologie de développement objet UML.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
logique1
- Désormais : telle qu'elle est décrite dans les
modèles documentaires classiques.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... connaissances2
- A la limite, les documents XML
peuvent devenir totalement structurés, et exprimer des
connaissances telles qu'on les trouve dans les bases de données
les plus classiques, c'est à dire ayant perdu tout lien avec une
structure de présentation documentaire.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
documentaires3
- Nous avons ainsi montré dans le cadre des
documents audiovisuels que plusieurs organisations arborescentes
pouvaient être considérées pour un même document,
correspondant à diverses utilisations, sans que l'on puisse
privilégier l'une ou l'autre a priori.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... Web4
- Voir par
exemple : Ron Zohar. Web Annotation -- an Overview. Février
1999. [Publié sur le Web http://www.ee.technion.ac.il/ ronz/annotation/].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... documents5
- Cette
partie vient compléter l'étude bibliographique exposée dans le
chapitre 2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... France6
- Une
description succincte de l'interface de l'outil se trouve
dans [20].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
l'utilisateur7
- [18] : << finally we came to the
conclusion that content indexing was mostly a task devoted to
attaching pieces of meta-information to the document following
semantically expressed rules, and that the use of a knowledge
representation language was certainly much better suited to this
task that plain XML >>.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... propres8
- Si on utilise un langage
dérivé tel que RDF pour la représentation d'un graphe
Strates-IA, on rapproche le langage documentaire -- mais l'est-il
encore -- du modèle représenté : RDF sert à représenter
des graphes.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... redevables9
- Peut-être cela pourrait-il
vouloir signifier qu'un pas serait alors fait vers une logique
nouvelle d'organisation des connaissances documentaires et des
documents, adaptée à une vision purement multimédia des
documents. Les outils d'exploitation restent alors à inventer pour
permettre de << lire >> des documents et d'en construire en cours de
lecture des structures qu'il soit possible d'appréhender.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... l'audiovisuel10
- La norme dépasse en fait de
loin ce cadre, car ce sont rien moins que les documents multimédias
qui sont visés ! L'ensemble des propositions jusqu'ici proposées se
référant à des flux temporels continus, nous nous limiterons aux
documents audiovisuels dans cette présentation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... basiques11
- La distinction entre descripteurs et schémas de
description est loin d'être claire et est régulièrement
remise en cause. Il semble qu'elle fasse partie des ambiguï tés infantiles du modèle.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... XML12
- La spécification de formats
documentaires fait entre autres partie des objectifs de
XML-Schéma ! Ce fait illustre un renversement de situation : à
partir d'un langage documentaire (SGML) a été mis en place un
langage plus souple (XML), toujours adapté aux documents, mais
également à la représentation de n'importe quels types de
données (ou connaissances). Structuration documentaire et
structuration de données semblent donc en voie de fusionner. Il
est possible d'analyser cette évolution par l'apparition de la
notion de document bien formé en XML, qui n'existait pas en SGML.
Cette notion a amené la possibilité de traiter les instances
indépendamment de leur modèle, et lui a ôté de son
importance, l'instance devenant le lieu d'expression de toutes les
données.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... << composition >>13
- Des liens d'héritage
sont également possibles afin de spécialiser des DS.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... l'audiovisuel14
- Ainsi que la volonté de
s'attaquer également aux contenus multimédias, et de manière
générale à un peu toute la connaissance imaginable : le MultimediaDS devrait contenir un HumanBodyDS pour décrire
les parties du corps et leurs relations ! (lesquelles devront en
toute logique être connectées à des actions, à des
commentaires...)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... TEI15
- Qui était à la base conçue pour un
usage uniquement universitaire, sans ambition universelle, et est
reprise dans d'autres domaines.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ésultats16
- Ce que voulait être AEDI à ses débuts.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...étendue17
- Aux
objets à l'intérieur des images, ou aux objets en mouvement, cf. 1.2.1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...étouffement18
- Les auteurs notent très justement
qu'alors les plans sont mis en relation par les attributs d'unités
sémantiques qui les concernent, ce qui est l'équivalent de ce
que note Stiegler en considérant le travail d'annotation aidé du
chercheur.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... lien19
- Cela pourrait s'apparenter dans les
Strates-IA à l'utilisation d'un graphe potentiel à partir d'un
élément d'annotation abstrait. Les graphes potentiels associés
aux valences peuvent alors être candidats à être utilisés
comme graphe potentiels de navigation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... ordre20
- En considérant grossièrement les
nuds comme des prédicats et les liens comme des opérateurs
logiques.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... transformation21
- Si
d est une représentation de document, q une représentation de
requête et K l'ensemble des connaissances, alors la mesure de
pertinence
r(d
q) relativement à K est
déterminée par transformation minimale appliquée à d pour
obtenir d' tel que
d'
q. Bref, c'est la transformation
de la requête telle qu'elle implique (dans le modèle logique) le
document.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... connaissances22
- Dans un ordre d'idée proche,
mais sans spécialement utiliser les possibilités d'inférence des
graphes conceptuels, citons les travaux de [184] repris
par [196] dans le cadre des bases de documents
multilingues.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... langue23
- Et se
rapproche des objectifs initiaux de Sowa [215].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... Wordnet24
- Voir http://www.cogsci.princeton.edu/wn/.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... juste25
- Un
processus de normalisation sémantique de la base de connaissance
terminologique doit ainsi permettre que les sémantiques formelles
(le concept comme prédicat) et opérationnelles (les
manipulations sur les prédicats) aboutissent à des résultats
signifiant quelque-chose lorsqu'ils seront interprétés. Ceci
n'est réalisable que dans un domaine limité, avec des primitives
parfaitement fixées, permettant d'exprimer des concepts non
ambigus sur lesquels on fera des calculs.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... chemins26
- Inférences
contextuelles dirons-nous.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... description27
- Le plus souvent, la mise en place
d'ontologies de domaines résulte d'un traitement automatique de
documents techniques associés au domaine, l'organisation des
descripteurs dans l'ontologie relevant d'une démarche de
rationalisation la plus limitée possible au niveau des ajouts de
termes [24].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
relation28
- Quoiqu'on puisse l'envisager dans le cadre de
certaines dimensions d'analyse, voir plus loin.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ères29
- Si on considère des
unités audiovisuelles << étendues >> (pour désigner par
exemple un objet se déplaçant ou bien une piste d'un flux
sonore), il convient d'être plus prudent. Car alors il devient
possible de charger l'unité d'ancrage d'une signification, par
exemple << ceci est un objet déformable >> ou << ceci est la piste
numéro 1 destinée aux effets spéciaux >>. Ces unités
d'inspiration technologique peuvent alors être rapidement
intrônisées unités syntaxiques d'un éventuel << langage
audiovisuel >>, de la même manière que l'on distingue des mots
et des phrases dans les textes. Si cela est tout à fait possible,
il n'en reste pas moins qu'il convient d'être conscient des
limitations et des a priori que l'on introduit par une telle
approche. Les mots de textes n'en sont pas les unités ultimes, et
les discours se ramènent en dernier lieu à une suite de
phonèmes dépourvus de toute signification.
Les documents audiovisuels, comme superpositions extrêmement
complexes de flux audio et vidéo peuvent être étudiés suivant des
décomposition syntaxiques à caractère technologique (par exemple les
objets vidéo MPEG-4), pourvu qu'on n'affirme pas qu'il ne peut en
être autrement. Les unités audiovisuelles des Strates-IA se
fondent sur l'axe minimal qu'est l'axe temporel. L'extension des
unités audiovisuelles de la façon la plus neutre possible
consisterait par exemple à considérer une zone image (et non un
objet) et à considérer un unique flux sonore. Il y aurait alors des
strates audiovisuelles (avec une partie vidéo étant une zone d'image
évolutive), des strates vidéo, et des strates audio.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...écialisation30
- Cela pourrait être rapproché de
certaines inférences dans les réseaux sémantiques, telles que
les << path-based inferences >> proposées
par [207].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... utilisent31
- Ainsi bien entendu
que par les mots utilisés pour les termes de description, dont
l'interprétation a été suspendue par le passage au terme, mais qui
sont, quoiqu'il arrive et quelque soit le contexte,
interprétables [195].
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...és32
- Il est alors
intéressant de constater que d'une certaine manière, on
<< termine la phrase >> qui a été commencée par la mise en
place du premier élément d'annotation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... termes33
- Ces classes peuvent être déclarées
d'entrée de jeu dans la base de connaissances en utilisant les
relations de spécialisation.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... contextualisation34
- Cependant, retrouver le
contexte dans lequel un EA a été utilisé est l'assurance d'une
lecture juste.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... multi-axiales35
- Au sens où à la fois l'axe temporel et
les axes de relations des graphes (un graphe n'est pas a
priori un chemin) sont mobilisés.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
lecture36
- Tout l'enjeu des interfaces d'annotation est alors de
d'aider l'utilisateur à fournir ce travail, c'est à dire à
gérer en même temps la détemporalisation de l'annotation et
l'engagement dans le flux temporel qu'il visionne. L'interface
d'annotation que nous proposons (cf. figure 3.2) est
un exemple de réponse à cet enjeu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ées37
- Par
exemple en étudiant des cas d'utilisation rationalisés par les
mêmes modèles de tâches.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... varient38
- Certains valences peuvent
également être proposées << dynamiquement >> pour des EAA en
fonction des schémas de description auxquels ils participent par
l'intermédiaire de dimensions d'analyse.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... d'EAA39
- Le thésaurus pourrait par exemple être mis
en place par un traitement automatique sur des textes de
description, ou bien en utilisant un dictionnaire tel que Wordnet.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
connaissances1
- Quoiqu'à la limite il soit possible d'imaginer
un document et ses annotations sans base de connaissances : une base
de connaissance minimale, plate, constituée des EAA utilisés dans
l'annotation peut être mise en place et permettre l'exploitation du
document.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
interactif >>2
- Voir http://www.ina.fr/Production/Studio/index.fr.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... EuroDelphes3
- Voir ttp://www.ina.fr/Recherche/Delphes/index.fr.html.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... textuels4
- Même s'il est certain que des
modèles textuels simples se révèlent utiles d'entrée de jeu,
par exemple la possibilité d'accéder à une table des
matières des chapitres dans les DVD.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... strates5
- Nous nous sommes
au long de ce mémoire limité à ce dernier degré.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... RECIS6
- Recherche et
Exploration de Contenus Image et Son.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.