Titre : Repérage de communautés sur usenet Résumé : Repérer dans les archives de usenet des communautés se structurant autour de documents Encadreur : Yannick Prié Nombre de personnes (min-max): 1-2 Compétences requises : Java, usenet, intérêt pour la recherche Formation : mil Importance (A-E) : B Mots-clefs (séparés par une virgule) : Java, Usenet, Moteur de recherche, Documents, Communautés Présentation du sujet en détail..... Il s'agit de mettre en place une interface d'interrogation logicielle de GoogleGroups (http://www.google.fr/grphp, qui contient l'ensemble des archives usenet depuis de nobreuses années). L'objectif est de fournir un outil aidant la détection de communautés sur usenet. On part de l'hypothèse qu'une communauté (groupe d'individus) se structure entre autres autour de documents ou de textes appelés "documents de référence", qui parce que les membres du groupe y font allusion fournissent des indices de caractérisation des communautés. On considérera que les documents se trouvent à des URLs fixes. L'outil permettra de les repérer, de tester si un ensemble d'individus dans le groupe y fait référence, etc. On peut également imaginer qu'une recherche Web (Google ou autre) permette de confirmer des hypothèses en recherchant des liens entre individus et documents. Travail : définition des scénarios d'interrogation, mise en place de l'API d'interrogation, et de l'outil. Pour toute question, précision, évolution du sujet : yprie@liris.cnrs.fr