En ce 4 avril, jour de la Saint Isidore, célèbre évèque de Séville et auteur des Etymologies, nous fêterons Isidore (l’autre), la plateforme de recherche en sciences humaines et sociales du CNRS. Lancée en décembre 2010, cette réalisation du TGE Adonis sort de sa phase de réglage et de test aujourd’hui même (passage en version 1).
La plateforme de recherche Isidore a pour vocation de « fédérer l’accès aux données numériques de la recherche en SHS et d’en offrir un accès unifié pour les enseignants, chercheurs, doctorants et étudiants »1, avec l’ambition de valoriser la production scientifique française. Elle a été réalisé par le TGE Adonis et mise en oeuvre par le CCSD, en partenariat avec un consortium de sociétés privées.
Quelles données ? : Isidore puise actuellement dans 860 sources de données numériques, regroupées en 42 collections2. Il offre une interface de recherche unique dans des revues scientifiques (Cairn, Revues.org, Persée…), bibliothèques numériques (Gallica), catalogues d’archives (Calames) ou encore des dépôts d’archives ouvertes (HAL). Isidore privilégie les données francophones en libre accès produites par les acteurs de la recherche et de l’enseignement supérieur en SHS (édition électronique, bases de données, fonds numérisés, actualités scientifiques, sites web).
Comment ? : Isidore n’est un moteur de recherche classique. Il est fondé sur les principes du web de données (linked data) promus par le W3C. Il s’insère dans le mouvement international d’ouverture et de mise à disposition des données publiques et scientifiques.
Les grands principes du fonctionnement de la plateforme peuvent se résumer en trois points :
- Collecte : moissonnage ciblé de données et métadonnées scientifiques disponibles en libre accès sur le Web et structurées selon les standards internationaux (OAI-PMH, RSS/Atom, RDFa)3.
- Traitement : indexation des données non structurées (texte intégral), normalisation des métadonnées puis enrichissement des données au moyen de référentiels reconnus par les communautés SHS (listes d’autorités et thésaurus)4.
- Accès et recherche : mise à disposition d’API et d’un site web offrant une interface de recherche et de navigation.
Le portail Isidore propose une interface claire et ergonomique. La page d’accueil met en avant une discipline différente chaque jour. La recherche s’effectue au moyen d’un champ de recherche simple. On peut également suivre une démarche exploratoire en utilisant le menu « Naviguer ». La page-écran des résultats offre plusieurs fonctionnalités intéressantes de rebond, de filtrage ou d’élargissement de la recherche :
- pour chaque résultat, accès aux termes d’indexation de la ressource (concepts Rameau/Pactols), avec la possibilité de lancer une nouvelle requête en cliquant sur un terme.
- possibilité d’étendre la recherche à d’autres catalogues de bibliothèques (SUDOC, Bnf, Library of Congress, Frantiq…).
- accès à des options de recherche avancée pour restreindre la recherche (mots du titre, auteur, mot-clé, année).
- mise à disposition de filtres dynamiques (facettes), qui permettent de filtrer les résultats selon une combinaison de critères spatiaux, temporels, disciplinaires, thématiques, de types documentaires, etc.
- à noter aussi la présence d’un flux RSS par requête, offrant ainsi une fonction de veille sur une recherche.

Pour l’anecdote :
Isidore de Séville (v. 560 – 4 avril 636 ap. J.-C.) a été choisi comme Saint patron des informaticiens et de l’Internet du fait de l’organisation particulière de son oeuvre encyclopédique, les Etymologies. Doit-on y voir une coïncidence avec le choix de l’acronyme ISIDORE ?
[Mise à jour] En guise de clin d’oeil, Yannick Maignien confirme la référence à Isidore de Séville dans son article ISIDORE, de l’interconnexion de données à l’intégration de services, publié sur @rchivesSIC. [/Mise à jour]
Pour en savoir plus
Isidore a été présenté en détail lors de la 2ème Université d’été du TGE Adonis (décembre 2010) autour du thème « Construire une infrastructure numérique pour les SHS » : voir les supports des interventions et les vidéos sur le portail 25images/SHS. Voir aussi le document de présentation d’Isidore (pdf) par la société Antidot.
Pour une analyse complète d’Isidore et un point de vue utilisateur, voir l’article publié sur le site Descripteurs.
Sur la question du web de données, voir la présentation de Gautier Poupeau, Isidore à l’interface de la rencontre des SHS et du Web de données (sur Slideshare) et, dans une prespective plus large, l’article Construire le web de données pour les sciences humaines et sociales, par S. Pouyllau et S. Kilouchi (sur HAL-SHS).
Notes du texte
- http://www.tge-adonis.fr/service/isidore [↩]
- Un annuaire recense tous les réservoirs documentaires moissonnés et indexés par Isidore : http://www.rechercheisidore.fr/annuaire [↩]
- Afin de comprendre la procédure de moissonnage d’Isidore et la façon de respecter les standards, un guide de bonnes pratiques (pdf) est mis à disposition. [↩]
- Parmi ces référentiels, on peut citer RAMEAU (langage d’indexation matière utilisé par la Bnf), Geonames (données géographiques), PACTOLS (thésaurus spécialisé sur les sciences de l’Antiquité et l’archéologie), catégories de Calenda (actualités scientifiques en SHS), référentiels de HAL-SHS (archive ouverte du CNRS), Thésaurus W (Archives de France), etc. [↩]
Lire aussi sur Insula :
Régis Robineau, « Isidore, plateforme de recherche pour les SHS », Insula [En ligne], ISSN 2427-8297, mis en ligne le 4 avril 2011. URL : <https://insula.univ-lille3.fr/2011/04/isidore-plateforme-de-recherche-pour-les-shs/>. Consulté le 19 January 2021.
Bonjour,
L’Open Data, et plus largement la vague du Linked Data et du « web des données », concerne les États, avec leurs administrations et services publics, ainsi que les collectivités locales et aussi toutes les organisations, y compris les entreprises privées, petites et grandes, qui ont intérêt à partager ouvertement certaines informations (pas toutes évidemment) avec leurs clients, fournisseurs, partenaires, bref avec leur écosystème.
Et les technologies du web des données, ou web 3.0, en donnant directement accès à des données interconnectées plutôt qu’en ouvrant des API spécifiques à chaque source d’information ou silo de données, apportent un gain considérable en matière d’interopérabilité.
A cet égard, le projet ISIDORE, du CNRS – TGE Adonis, constitue effectivement le plus grand projet « web des données » / Linked Data / Open Data mené à bien en France à ce jour.
Le portail web, qui était ouvert en beta test depuis décembre 2010, donne accès à plus d’un million de documents et publications de la recherche française en sciences humaines et sociales, issues de plus de 800 sources différentes qui sont collectées, analysés, traitées et enrichies automatiquement.
Les métadonnées de tous ces documents ont été normalisées et alignées sur des référentiels et thésaurus scientifiques, automatiquement classifiées, articulées entre elles et enrichies et, pour finir, publiées dans un triple store RDF de plusieurs millions de triplets, où elles sont librement interrogeables en SparQL. Une démo de ce qu’il est possible de développer à partir de ce point d’entrée SparQL est disponible ici : http://www.lespetitescases.net/semweblabs/isidore/
Plus d’info sur ce projet et sur les outils logiciels pour le réaliser, fournis par Antidot (éditeur de logiciel français très impliqué dans les outils pour le web de données) :
– http://bit.ly/CasClientISIDORE (PDF de 4 pages présentant le projet ISIDORE)
– http://bit.ly/AIF-v1 (PDF de 4 pages présentant la solution Antidot Information Factory)