Les séminaires du Cental, consacrés à la problématique du traitement automatique des langues, accueillent ce vendredi 14 décembre 2012 de 9h30 à 10h30, Max De Wilde (département des Sciences de l’Information et de la Communication, ULB). La conférence sera intitulée « L’extraction d’entités nommées : une opportunité pour le secteur culturel ? ». Il aura lieu, comme les autres années, en salle C.142 du collège Erasme (place Blaise Pascal, 1).
Les institutions culturelles, que ce soient les bibliothèques, les centres d’archives ou les musées, disposent souvent de peu de moyens financiers pour valoriser leurs collections. Les métadonnées encodées par des générations de documentalistes restent ainsi peu exploitées, leur format non-structuré les rendant difficile à traiter de manière automatisée. Dans ce contexte, les techniques d’extraction d’information, et particulièrement la reconnaissance d’entités nommées, offrent de nouvelles perspectives pour les gestionnaires de collections, leur permettant d’enrichir le contenu sémantique de leur données à bas coût. Le projet Free Your Metadata vise à encourager les institutions culturelles à tirer parti de cette technologie, parmi d’autres, dans le but d’interconnecter leurs métadonnées existantes avec celles d’autres collections, s’intégrant ainsi dans la mouvance du linked data. Dans le cadre de ce séminaire, Max De Wilde présentera les premiers résultats d’une étude de cas réalisée sur des données du Smithsonian Cooper-Hewitt National Design Museum à New York, ainsi que les futures possibilités et limites de cette approche pour le secteur culturel.