Musée d'archéoogie de Catalogne, site d'Ullastret
Gabriel de Prado Cordero, Josefina Simon Reig
Données, Archives et Textes Archéologiques : création et
exploitation d’un Lac de données sémantiques pour l’Archéologie de la
Catalogne
Financement par la Région Auvergne Rhône-Alpes puis par l'Université Lumière Lyon 2.
DataLAC est un projet interdisciplinaire international financé par la Région AURA puis par l'université Lyon 2, qui vise à extraire des informations qualitatives (sémantiques) à l’aide de l’intelligence artificielle, afin de constituer un stock de métadonnées nécessaire à l’analyse de documents numériques stockés dans un lac de données. Le lac va contenir trois types de données :
L’objectif du projet DataLAC est l’extraction de métadonnées (concepts présents dans les documents ci-dessus) par des méthodes de transcription supervisée, non supervisée et de fouille de texte. Il s’agit de rechercher par similitudes aussi bien l’affectation directe de métadonnées descriptives (« ce document représente cette entité ») que la documentation de liens logiques entre documents (« ces deux documents représentent la même entité »). Toutes les métadonnées sont rassemblées et structurées dans un thésaurus bilingue catalan-castillan apparié avec des concepts en français.
Gabriel de Prado Cordero, Josefina Simon Reig
Acceder au repo Gitlab se trouvent notre code source et notre documentation