API pour l’accès à l’information scientifique et technique

Le livre blanc

Les APIs

arXiv

Qu’est-ce que c’est ?

arXiv est une base de données en ligne contenant des publications ainsi que des liens entre ces différents articles, comme par exemple des citations. Cette Base de données est gérée par la Bibliothèque de l’Université de Cornwall.

A quoi sert-elle ?

Cette API a pour but de permettre un accès facile à cette base de données. Elle est accessible par le protocole http, cette API ne nécessite donc pas l’installation d’un logiciel afin d’interroger cette BD.

Restrictions d’accès

Cette API est à but non lucratif. On peut donc l’utiliser gratuitement. Il est possible de créer un compte, mais cela n’est nécessaire que pour ajouter des publications.

Comment l’utiliser

On dispose en ligne d’un formulaire permettant d’effectuer des recherches, mais il est aussi possible de l’interroger directement via une url, par exemple, pour effectuer une recherche dans tous les domaines contenant le mot « electron » on utilisera :

http://export.arxiv.org/api/query?search_query=all:electron

En réponse on obtiendra un flux XML Atom.

Contenu de la base de données

Le 8/12/2010, la base de données contient 644,661 articles en libre accès dans les domaines de la Physique, les Mathématiques, les Sciences Informatiques, la Biologie, la Finance et les Statistiques.

Les avantages

Accès libre et rapide au contenu de la base de données.

Les inconvénients

Un nombre restreint de publications comparé à certaines API comme Springer qui rassemble plusieurs millions d’articles.

Springer

Qu’est-ce que c’est ?

Springer est une API regroupant des métadonnées pour plus de 4.8 millions de documents. Springer est ainsi un éditeur de presse scientifique.

A quoi sert-elle ?

Cette API fournit des accès sur les documents, les métadonnées et des images pour 80 000 articles dans le biomédical et les programmes libres de publication.

Que récupère-t-on ?

Cette API permet de fournir plusieurs variétés de documents aux formats XML ou JSON.

Comment l’utiliser ?

Exemple de requête : http://dev.springer.com/docs/read/Filters_Facets_and_Constraints

Il suffit de lancer une requête q, avec différents paramètres et filtres :

Exemples :

q=type:Book -> retourne les livres uniquement

q=name: «hughes, m" -> retrouve les articles qui incluent le nom de l’auteur : Hughes, M".

Exemple avec filtres multiples :

q=Issn:1573-4838 year:2009. La réponse fournie (dans le lien précédent) nous donne un exemple de réponse au format XML.

Ce lien : http://dev.springer.com/docs/read/Example_API_Responses montre d’autres formats de réponse en JSON ou en PAM (genre de format XML).

Comment déterminer le type de document et son format de réponse?

Exemple :

http://api.springer.com/metadata/pam/doi/10.1007/s11276-008-0131-4?api_key=yourKeyHere

Ceci est une requête pour obtenir des métadonnées (« métadata ») avec un format de sortie « PAM ». Ainsi, la requête analyse les métadonnées recherchées, et les métadonnées retournées sont retournés en format PAM.

Avantage

Fournit un grand nombre de documents sous plusieurs formats différents. Les filtres peuvent être multiples et les recherches assez précises.

Inconvénient

La requête à envoyer est assez complexe et pas très intuitive.

CatalogWS

Qu’est-ce que c’est ?

CatalogWS est une API en ligne permettant de consulter la base de données du NCSU (North Carolina State University). Cette API possède une interface Web permettant d’effectuer des recherches.

Malheureusement, pour l’instant l’interface renvoie toujours une erreur quel que soit la recherche effectuée.

On peut tout de même interroger l’API via une requête http en passant des paramètres en GET (directement dans l’adresse).

Utilisation en ligne

Exemple de recherche sur le thème de la déforestation :

http://www.lib.ncsu.edu/catalogws/?service=search&query=deforestation&output=rss

Les paramètres

Service = search spécifie que l’on souhaite effectuer une recherche dans la base de données.
Query = définit les mots clés à utiliser
output= permet de définir le format des résultats (par défaut XML). On peut obtenir les résultats sous forme d’un flux XML, RSS, XSL et PowerSearch.

Avantage

Utilisation gratuite.

Inconvénient

Très peu de documentation, uniquement une adresse mail de contact.

Source

http://www.lib.ncsu.edu/dli/projects/catalogws/

DeepDyve

Qu’est-ce que c’est ?

DeepDyve est le plus grand service de location pour la recherche scientifique, technique et médicale avec plus de 30 millions d’articles via des milliers de journaux.

Les recherches s’effectuent grâce à des mots clé.

Résultat

Les articles qui correspondent au mot recherché sont générés. La recherche peut être affinée en fonction de l’auteur, date, éditeur, source ou contenu.

L’API offre des résultats propres au site DeepDyve mais aussi des résultats du Web comme Wikipedia.

Avantage

On peut tester gratuitement l’API afin d’évaluer la qualité et l’importance du contenu avant d’acquérir quoi que ce soit.

Inconvénients

L’accès est payant, de plus, il est variable. En effet le prix est fixé par le détenteur des droits sur l’article. En résumé il faut payer, consulter ou imprimer un article.

Mendeley

Qu’est-ce que c’est ?

Mendeley est un logiciel de gestion bibliographique, destiné à la gestion et au partage de travaux de recherche. Il est composé d'un logiciel gratuit de bureautique (Windows/Mac/Linux) gérant notamment les PDF, les citations, et les références bibliographiques, et d'un réseau web. Il peut aussi être synchronisé avec un compte web utilisateur afin de présenter son identité numérique.

Une API est disponible afin de profiter de toutes les ressources bibliographiques fournies par cet outil.

Utilisation en ligne

Exemple de lien de recherche. Il faut remplacer la valeur par la clé API obtenue après avoir créé un compte.

http://www.mendeley.com/oapi/stats/authors?consumer_key=

Avantages

La base de données est imposante et il est possible d’effectuer des requêtes avec des filtres multiples.

Inconvénient

Il faut s’inscrire sur le site web avant de pouvoir essayer l’API.

Source

http://dev.mendeley.com/

Scopus

Qu’est-ce que c’est ?

Scopus est une API qui permet d’utiliser l’outil Sciverse. Sciverse est un outil simplifiant l’accès à l’information scientifique. Cet outil est destiné à différents acteurs, notamment les Chercheurs, les libraires et les développeurs.

L’API Scopus permet d’utiliser facilement Sciverse.

Cette API est destinée :

aux Chercheurs, pour leur permettre de consulter des publications, consulter les articles citant leurs propres publications.
aux Bibliothécaire, afin de mettre à disposition des utilisateurs des informations fiables et récentes. Cela permet aussi suivre les avancés dans certains domaines.
aux Gouvernements afin de leur permettre d’évaluer les performances de leurs laboratoires de recherche, mais aussi d’établir le profil de candidat.
aux Editeurs, afin d’améliorer la visibilité de leurs ouvrages.
aux Industriels afin de leur permettre un accès fiable aux dernières informations sur la recherche.

Comment l’interroger et que récupère-t-on ?

On peut utiliser cette API par l’intermédiaire d’une interface web développée par Sciverse, ou on peut utiliser directement l’API.

Dans le cas de l’interface web les résultats sont sous format texte, sinon on peut récupérer ces informations sous forme XML afin de les réutiliser.

Comment obtenir accès à cette API ?

L’accès à ces informations est payant. Le coût dépend du type et de la taille de l’institution concernée. Il est aussi possible d’essayer cette API pendant une durée limitée, il faut pour cela remplir un formulaire qui permettra à un représentant de la société de prendre contact avec le client.

Inconvénient

N’étant qu’étudiants, nous n’avons pu essayer cette API, de plus les frais d’inscription semblent être élevés.

Tableau comparatif

Afin de bien différencier ces API nous les avons présentés sous forme d’un tableau comparatif. Pour pouvoir établir ce tableau nous avons réfléchi à un certain nombre de critères présentés ci-dessous :

Le type d’information
Le domaine des informations et spécialités : cela nous permet d’identifier les API génériques et les API spécialisés. Ceci dépend uniquement de la base de données interrogée par l’API en question.
La méthode d’interrogation : cela permet d’établir un premier constat technique quant aux technologies à utiliser pour utiliser les API. La plupart des API s’interrogent via une requête http sur une url. L’utilisation du protocole http garantit un niveau technique faible, il n’est pas nécessaire de se former longuement avant de pouvoir utiliser l’API.
Les formats de sorties : Afin de permettre à plusieurs programmes d’interagir il est nécessaire d’établir des normes sur les modes de communication et les structures de données. Le format que l’on retrouve majoritairement est le XML, c’est un format largement répandu et une technologie mature. Il est donc facile de récupérer et de traiter ces informations.
L’accès : Les conditions d’accès à l’API est une variable majeure dans le choix d’une API. En effet il existe de nombreuses différences entre les différentes API. Certaines sont totalement gratuites, d’autre partiellement ou complètement payantes.
Avantages et inconvénients : Nous avons cherché à identifier les points forts et les points faibles pour chaque API. Dans certains cas cela n’a pas été possible, par exemple dans le cas de l’API Scopus. En effet il était nécessaire de prendre contact avec un responsable commercial afin de pouvoir se faire sa propre idée sur leur produit.
URL d’interrogation : Nous avons proposé une URL d’interrogation déjà paramétrée afin de pouvoir visualiser rapidement un exemple des informations obtenues. Cela ne fonctionne que pour les API gratuites ne nécessitant pas une clé API.
URL de documentation : C’est un lien vers les pages de documentation technique de l’API.

Le tableau comparatif

API pour l’accès à l’information scientifique et technique

Le livre blanc

Le livre blanc

Les APIs

Livre blanc en PDF