A Propos
Parti d’une expérimentation en 2012, Histoire de arts’Lab donne aujourd’hui un accès complet aux 5000 ressources du portail Histoire des arts du ministère de la Culture et de la Communication. Avec ses différents modules (géographique, temporel, thématique…), Histoire de arts’Lab offre autant de points d’entrée de recherche que de modes de représentation de l’histoire des arts.
Histoire des arts’Lab c’est aussi l’outil Renkan, qui permet de visualiser sur des cartes de connaissances, des parcours historiques dans une vingtaine de domaines artistiques ainsi que des parcours thématiques sur un artiste, une œuvre, un courant artistique, une technique… Renkan est également votre outil pour construire vos propres cartes et garder une trace de vos recherches en histoire des arts.
Le mot “Renkan” (“連環”) provient du japonais “Hyakugaku Renkan” (“百学連環” - “les cycles des cent sciences”) le titre d’une des premières encyclopédie japonaise moderne. “連環” signifie “cycle” mais est composé de 2 kanji qui peuvent être traduits par (parmi d’autres sens) :
- 連 : “connecter” ou “joindre”
- 環 : “cercle”, “lien”, “anneau”
I. HISTOIRE DU PROJET
Histoire des arts’ Lab est né d’une collaboration entre l’Institut de Recherche et d’Innovation (IRI) et le Ministère de la Culture et de la Communication. Ce projet de recherche et développement a permis la réalisation d’une interface de recherche et de navigation destinée à montrer le potentiel du tagging sémantique.
Histoire des arts’ Lab s’appuie sur une sémantisation (production de tags sémantiques) du corpus du Portail Histoire des Arts. Ce portail compte plus de 5 000 notices descriptives de ressources en ligne produites par plus de 350 institutions culturelles dans toute la France.
II. L'EXPERIMENTATION SEMANTIQUE
- Le tagging :
Les tags ou mots-clés sont la plupart du temps de simples chaînes de caractères utilisés comme des étiquettes pour décrire une ressource. Le tag est simple d’utilisation mais soulève parfois des ambiguïtés notamment en français où l’homonymie est courante. (exemple : Roman/Art Roman)
Avec le tagging sémantique, on passe d’une indexation par mot‐clé à une indexation par concept issu d’un référentiel. Il s’agit d’expliciter le sens des informations afin que les machines puissent les exploiter de façon automatique, sans ambiguïté et à grande échelle.
- Le corpus Histoire des Arts :
Le portail Histoire des arts compte un grand nombre de ressources couvrant tous les arts et s’étendant de la préhistoire au XXIème siècle, sans limite géographique. Il était difficile de trouver un thesaurus suffisamment riche, en ligne et dont le contenu serait légalement réutilisable. C’est de ce constat qu’est née l’idée d’utiliser l’encyclopédie en ligne Wikipedia comme référentiel, d’autant plus qu’elle est disponible sous une forme structurée selon les standards du Web sémantique, via le projet Dbpedia.org.
L’encyclopédie joue un rôle d’indicateur et permet d’affiner l’indexation mais n’est pas prise pour référence pour son contenu. Utiliser Wikipédia avec ses plus d’1 million articles, dont de très nombreux sur les arts, s’est révélé particulièrement pertinent.
- Le processus de sémantisation :
Le Département des programmes numériques du ministère de la Culture a conçu avec l’Institut de recherche et d’innovation un module de tagging sémantique avec une fonctionnalité de liaison avec Wikipédia.
Les simples mots-clés ont pu être liés aux entrées (les titres des articles de l’encyclopédie) de Wikipédia et enrichis grâce à un ensemble de métadonnées, dont les URIs de DBpedia.org.
- Apport de la sémantisation :
La précision des entrées de Wikipédia permet de lever l’ambiguïté sur le sens d’un mot. L’utilisateur n’est plus dans l’incertitude : il connaît d’avance la signification du tag et les résultats de sa recherche ne sont donc plus pollués par des documents hors sujets.
Par exemple, pour le simple mot-clé « Restauration », il existe plusieurs tags sémantiques :
Titre Wikipedia URL Wikipedia URI DBpedia Restauration (art) http://fr.wikipedia.org/wiki/Restauration_%28art%29 http://dbpedia.org/page/Conservation-restoration Restauration (histoire de France) http://fr.wikipedia.org/wiki/Restauration_%28histoire_de_France%29 http://dbpedia.org/page/Bourbon_Restoration
La valorisation des tags grâce aux relations logiques sous-jacentes aux contenus de Wikipédia permet d’enrichir les fonctionnalités de recherche, par exemple retrouver toutes les villes appartenant à une région. Les modules de recherche sont ainsi beaucoup plus puissants.
L’enrichissement automatique des métadonnées offre également la possibilité de faire des recherches dans 6 langues différentes (Français, anglais, italien, allemand, espagnol, japonais). Wikipédia est multilingue ce qui permet grâce à l’interopérabilité interlinguistique de traduire automatiquement les tags liés aux entrées de encyclopédie.
En savoir + : Qu’est-ce que le Web Sémantique ?
Les codes des applications informatiques développées sur « Histoire des arts’Lab » sont disponibles sous la licence libre CeCILL-C qui autorise leur réutilisation, duplication ou modification.