L’alignement des vocabulaires contrôlés, thesaurus et autres référentiels en tous genres relève d’un intérêt particulier pour les bibliothèques du fait d’une utilisation importante de vocabulaires documentaires pour la structuration des données. Cela concerne en fait tout producteur de données qui souhaite rendre celles-ci interopérables avec des jeux de données plus larges. De manière concrète, cette tâche est souvent une étape préliminaire pour une véritable intégration des données au sein du web sémantique.
Colligovoc offre une réponse générique à cette problématique en offrant un système d’alignement automatique modulaire couplé avec un système d’arbitrage et de vérification par les utilsiateurs permettant ainsi de bénéficier au maximum du potentiel offert par le traitement automatique sans pour autant faire de concession sur la qualité des données produites.
Détection automatique des correspondances
Colligovoc intègre un système modulaire de services dédiés à la recherche automatique de correspondance. Ceux-ci peuvent utiliser différentes informations, y compris des jeux de données tiers, afin de bénéficier au maximum des éléments d’information préexistants. La définition de ces processsus automatiques s’effectue de manière spécifique pour chaque processus de correspondance par des utilisateurs experts au moyen d’une interface dédiée.
Arbitrage des cas incertains
Les utilisateurs peuvent arbitrer les cas pour lesquels la correspondanc automatique n’est pas suffisante pour assurer sa validité. Le système permet de suivre l’avancement du processus et de voir les éléments nécessitant un traitement. Les éléments à arbitrer peuvent être attribués de manière spécifique à un utilisateur en fonction de divers critères.
Fonctionnement collaboratif
L’alignement de référentiels peut souvent être bénéfique pour plusieurs institutions différentes et il peut être ainsi souhaitable de mettre en commun à la fois l’effort requis pour les arbitrages utilisateurs et les bénéfices résultant du jeu de correspondances. Colligovoc est spécifiquement conçu pour répondre à ce type de besoins et permettre une utilisation partagée entre plusieurs groupes d’utilisateurs.
De manière générale, Colligovoc, comme l’ensemble des produits Datuman, dispose d’un système évolué de gestion de la provenance qui permet d’avoir une transparence complète sur les modifications effectuées, tant par les processus automatiques que par les utilisateurs. Et plus spécifiquement pour les correspondances effectuées par les utilisateurs, il est possible d’indiquer des informations complémentaires telles que des commentaires ou des indications sur le degré de certitude.