Réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique »

La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le jeudi 30 janvier 2014 à 14h00 à l’Université Libre de Bruxelles (salle Solvay, bâtiment NO, 5ème étage, campus de la Plaine).

Pluridisciplinaire, le groupe se situe aux confluents des sciences appliquées et des sciences humaines et politiques.

Après un bref rappel historique de vingt ans de recherches en matière d’évaluation et d’amélioration de la qualité des bases de données (slides), la rencontre se poursuivra par un exposé sur un thème d’actualité aux enjeux stratégiques : la qualité des adresses e-mail (slides – vidéos). La réunion se terminera par une table ronde au cours de laquelle tous les participants qui le souhaitent seront invités à intervenir et sera suivie d’une réception.

La période d’inscription est clôturée.

Programme

13h30 Accueil des participants

14h00 Mot d’accueil par Seth van Hooland, Chargé de cours à l’ULB et Président du Master en Sciences et Technologies de l’Information et de la Communication (MaSTIC)

14h10 « Du stemma codicum au data tracking » : vingt ans de recherche en matière d’évaluation et d’amélioration de la qualité des bases de données (slides), par Isabelle Boydens, Présidente du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique », Professeur ordinaire à l’ULB et responsable du « Data Quality Competence Center » au sein du département Recherche de Smals

14h45 Email Address Reliability, par Vandy Berten, Maître de Conférence à l’ULB et ICT Researcher chez Smals (slidesvidéos)

16h15 Débat et table ronde. Modérateur : Anthony Cleve, Secrétaire du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique », Professeur à la Faculté d’Informatique de l’Université de Namur et Chargé de cours au sein du MaSTIC de l’ULB

16h45 Réception

Résumés

« Du stemma codicum au data tracking » : vingt ans de recherches pluridisciplinaires en matière d’évaluation et d’amélioration de la qualité des bases de données (slides)

C’est en 1994, il y a vingt ans, que naissait, au sein du Centre d’Histoire Quantitative de l’Université de Liège, en collaboration avec la section Infodoc de l’Université Libre de Bruxelles, un premier groupe de contact pluridisciplinaire consacré à l’application de la critique historique aux sources informatiques. Le « data quality research » apparaissait alors timidement au sein de la communauté IT.

L’exposé évoquera, dans une large variété de domaines d’application aux enjeux stratégiques, plusieurs développements opérationnels auxquels ces recherches ont donné le jour.

Les données ne sont pas données : elles sont progressivement construites. Leur sens évolue dans le temps avec les observations qu’elles permettent d’appréhender. L’interprétation des bases de données dans le cadre de leur contexte permet, dès lors, d’améliorer la gestion de vastes et complexes systèmes d’information soumis à la tension entre l’homogénéité des représentations formelles et l’hétérogénéité des catégories empiriques.

Email Address reliability (slides – vidéos)

Avec la dématérialisation de l’information et des échanges, la qualité des adresses e-mail devient stratégique, tant dans les secteurs publics et privés que dans certains domaines d’application scientifiques. En effet, une bonne gestion de celles-ci peut, par exemple, dans le cadre de l’egovernment, contribuer à l’amélioration des services rendus et à la réduction des coûts.

C’est le cas lorsque les adresses e-mail sont utilisées en vue de l’envoi de notifications, même après authentification, dans le cadre des recommandés électroniques, par exemple. Si les adresses e-mail sont incorrectes, les notifications des envois recommandés doivent s’effectuer par voie postale, après traitement éventuel des cas erronés. Cela peut accroître les coûts cumulés sur 5 ans de plusieurs millions d’euros, selon la taille de la base de données. À ces éléments s’ajoutent les gains indirects associés (qui sont mentionnés également dans le secteur privé et « marketing ») : respect de la législation, service rendu au citoyen et crédibilité dans les campagnes de communication.

Dans de nombreux pays (Danemark, Suède, Norvège, Canada, …), le recours à l’adresse e-mail authentifiée dans le cadre des échanges entre administrations et citoyens se généralise au sein de l’egovernment. En 2012, le ROI sur 15 ans d’une telle approche est estimé en Norvège à 1,9 milliards de NOK (environ 250 millions d’euros). Opérationnelle depuis 1971, l’adresse e-mail demeure en effet de nos jours un canal incontournable, même si, avant ses 40 ans, en 2011, on prédisait sa fin, et ce, en dépit des canaux qu’offrent maintenant les réseaux sociaux et de la volatilité du monde IT.

Largement utilisées de nos jours et pour un certain temps encore, les adresses e-mail se caractérisent toutefois par un cumul d’incertitudes : qu’il s’agisse de la volatilité des usages, de la dynamique des noms de domaines ou de la présence de syntaxes non standard et évolutives. En vue d’en assurer la maîtrise, l’exposé présentera:

– Les éléments syntaxiques, de validation (tests d’existence) et de « data matching » applicables en batch et « on line », selon les cas ;
– Un ensemble de bonnes pratiques et une organisation en vue de maintenir la qualité d’une vaste source d’adresses e-mail dans le temps.

Cette étude repose sur plus de dix ans d’expérience au sein de la « Data Quality Cel » de la section « recherche » de Smals, sur un ensemble de tests pratiques et sur un prototype concret et original. L’exposé montre ainsi comment le recours aux contrôles et outils adéquats dans le cadre de bonnes pratiques et d’une organisation maitrisée, permet d’atteindre une qualité satisfaisante en fonction des usages et enjeux des données.

Intervenants

isabelleIsabelle Boydens est Historienne et Docteur en Philosophie et Lettres, orientation « sciences de l’information et de la documentation ». Elle est Professeur ordinaire à l’Université Libre de Bruxelles, Présidente du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » et ICT Researcher chez Smals, société informatique prestataire de services pour l’administration fédérale et régionale belge où elle a créé un centre de compétence en qualité de données. Elle a également contribué à la création, au sein de la filière STIC de l’ULB, d’un cours spécifiquement dédié à « la qualité de l’information et des documents numériques », confrontant théorie et pratique. Dans le contexte des enjeux technologiques et épistémologiques actuels, ses recherches portent sur les systèmes documentaires, l’évaluation et l’amélioration de la qualité des bases de données et l’application de la critique historique aux sources informatiques.

Elle est l’auteur de « Informatique, normes et temps » (Bruxelles, E. Bruylant, 1999), qui s’est vu décerner le prix de la fondation Davin de l’Académie Royale des Sciences, des Lettres et des Beaux Arts de Belgique. Elle a coédité en 2011 chez Springer à New York l’ouvrage suivant auquel elle a contribué en tant qu’auteur : Boydens I., « Strategic Issues Relating to Data Quality for E-government: Learning from an Approach Adopted in Belgium ». In Assar S., Boughzala I. et Boydens I., éds., « Practical Studies in E-Government : Best Practices from Around the World » (p. 113-130, chapitre 7). En 2012, elle a publié une synthèse de ses travaux dans la revue « Les Annales des Mines », « L’océan des données et le canal des normes » (Paris, n° 67, juillet 2012, pp. 22-29).

L’ensemble de ses publications ont fait l’objet en 2011 d’une recension par David Bade (Université de Chicago) : Bade D., « It’s about Time!: Temporal Aspects of Metadata Management in the Work of Isabelle Boydens » (rubrique « the International Observer »). In Cataloging & Classification Quarterly, volume 49, n° 4, 2011, pp. 328-338.

vandyVandy Berten est Maître de Conférence au département d’Informatique de l’Université Libre de Bruxelles et chercheur (ICT Researcher) chez Smals depuis mai 2013. Il était auparavant Professeur Assistant à l’U.L.B., au sein du groupe de recherche inter-facultaire PARTS.

Il a réalisé sa thèse de doctorat en tant qu’aspirant FNRS, de 2003 à 2007, sous la supervision du Professeur Joël Goossens. Entre 2008 et 2010, il était Chargé de Recherche FNRS, après un séjour post-doctoral d’un an passé à la National Taiwan University, à Taipei.

Ses sujets de recherche dans le monde académique étaient le « grid computing » (pendant sa thèse), et les systèmes embarqués temps-réel, avec des contraintes énergétiques. Il s’intéresse maintenant à des questions de qualité de données, essentiellement orientées vers les adresses électroniques.

Un commentaire

  1. Max De Wilde dit :

    Les slides des deux présentations, ainsi que des vidéos illustratives, ont été ajoutés.

Laissez une réponse

Vous devez être connecté pour déposer un commentaire.