Activités – Master en STIC

Vous trouverez ci-dessous les dernières activités et actualités du Master en STIC.

Réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique »

Posté par

Mathias Coeckelbergs

le

18 avril 2023

| Tags : conférence

(Téléchargez l’introduction d’Isabelle Boydens et la présentation de Pascal Rivière)

La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 17 mai 2023 à 14h00 à l’Université libre de Bruxelles (auditoire AY2.108, bâtiment A, campus du Solbosch).

Pluridisciplinaire, le groupe se situe au confluent des sciences appliquées et des sciences humaines et politiques. Le groupe, dont nous avons fêté les 25 ans en 2019, s’est réuni récemment en 2022.

La conférence sera présentée par Pascal Rivière, Docteur en informatique, ancien élève de l’Ecole Polytechnique et de l’ENSAE, et agrégé de mathématiques. Ayant acquis une vaste expérience sur le terrain (domaine hospitalier, de la sécurité sociale, …), il est actuellement, Directeur de l’Inspection générale à l’Insee (Paris) ainsi que de la revue « Courrier des statistiques » (voir biographie ci-dessous).

La conférence cette année, « Les répertoires : pivots indispensables et méconnus des systèmes d’information » examinera, sur la base d’exemples concrets (Répertoires d’entreprises, de personnes physiques, d’étudiants, …) la complexité que soulève la mise en place et la gouvernance des référentiels « sources authentiques ». Nous découvrirons également le caractère stratégique que joue leur qualité pour les bases de données auxquelles ils sont dynamiquement connectés. Pascal Rivière évoquera aussi les questions de recherche actuelles que soulèvent ces domaines.

La réunion se terminera par un débat suivi d’un drink. L’accès à la rencontre, qui est financée par le Fonds National de la Recherche Scientifique, est gratuit ; il est toutefois indispensable de s’inscrire avant le 15 mai 2023 au plus tard à l’événement via le lien suivant en indiquant votre nom, prénom et institution(s) d’appartenance(*). Vous recevrez par email une confirmation d’inscription.

Programme

14h00 Introduction, par Isabelle Boydens, Présidente du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique », Professeur ordinaire à l’ULB et responsable du « Data Quality Competence Center » au sein du département Recherche de Smals

14h05 « Les répertoires : pivots indispensables et méconnus des systèmes d’information» par Pascal Rivière, Docteur en Informatique et Directeur de l’Inspection générale à l’Insee (Paris)(voir ci-dessous, la biographie de l’intervenant pour plus d’information).

15h05 Débat et table ronde. Modérateur : Frédéric Servais, Docteur en Sciences Appliquées, enseignant à l’École Supérieure d’Informatique et chargé de Cours à l’ULB

15h30 réception

Résumé

Dans le monde de data qui désormais nous entoure, toutes les données ne se valent pas. Certaines occupent une place essentielle dans le paysage numérique : les données des répertoires, sources authentiques à statut référentiel ; et les exemples sont légion : répertoires d’entreprises, de personnes, d’étudiants, d’électeurs, d’établissements de santé, de produits, de véhicules, de formations, etc. Ayant émergé historiquement avant l’ère de l’informatique, leur importance est allée croissant avec l’interconnexion des systèmes d’information et la demande insatiable de données. Loin d’être « gravés dans le marbre », les répertoires sont au contraire des systèmes vivants, fortement interopérables, nécessitant une organisation rigoureuse voire industrialisée de leurs flux d’entrée, et une offre de services digne de ce nom. Ce sont ainsi de véritables pompes aspirantes et refoulantes d’informations : les répertoires d’entreprises ont par exemple de multiples usages pour la sécurité sociale, le fisc ou la statistique publique.

Humbles, souvent peu valorisés, ils jouent pourtant un rôle décisif en matière de qualité de données pour tous les systèmes qui les utilisent, soulevant des problématiques variées de gouvernance, de clarification des concepts, de normalisation des échanges, d’identification d’objets, et tout un « travail invisible des données » nécessaire au bon fonctionnement des infrastructures de connaissances du XXIe siècle.

Un peu isolés dans la littérature sur les SI, les répertoires n’en restent pas moins porteurs de nombreux sujets de recherche : algorithmes d’identification (cf. littérature sur le record linkage), détection de faux actifs, optimisation des contrôles automatiques de flux de données (et donc data editing), register-based statistics, voire, dans un tout autre domaine, la question des travailleurs de la donnée (en Science and Technology Studies), etc.

Intervenant

Pascal Rivière a effectué sa carrière dans la statistique publique (Insee) et les systèmes d’information, notamment dans le monde hospitalier et celui de la sécurité sociale. Il dirige aujourd’hui l’Inspection générale de l’Insee. Il est docteur en informatique, ancien élève de l’Ecole Polytechnique et de l’ENSAE, et agrégé de mathématiques. Ses travaux ont porté sur la méthodologie statistique, sur la qualité des données (qui a fait l’objet d’un cours au CNAM) et ses différentes dimensions, avec un accent particulier sur la normalisation des échanges de données et sur les référentiels (Les référentiels du système d’information, Dunod, 2013). Il dirige la revue Courrier des statistiques, et effectue régulièrement des interventions et formations sur la notion de donnée en général, statistique ou pas, et tout ce qui concourt à leur qualité.

(*)Réglementation en matière de protection des données :

Vous accédez à cette page et ces informations vous sont demandées car vous êtes repris sur une ou plusieurs listes de distribution par lesquelles l’Université libre de Bruxelles vous informe sur ses activités et/ou parce que vous vous inscrivez à un événement organisé par l’Université libre de Bruxelles. Le Règlement général sur la protection des données personnelles est entré en application le 25 mai 2018. L’ULB se conforme à cette législation et attache une grande importance à la protection de vos données à caractère personnel.

Ainsi, il vous est notamment possible, à tout moment, de vous désinscrire de cette invitation en envoyant un email à Mathias.Coeckelbergs@ulb.be

Dans tous les cas, sachez que l’Université n’utilise vos données que pour vous informer sur ses activités et qu’elle ne les communique pas à des tiers à des fins commerciales ou de marketing. Toutes vos questions sur la protection de vos données par l’ULB peuvent être envoyées à la Déléguée à la protection des données : rgpd@ulb.ac.be. Cette adresse est également celle par le biais de laquelle vous pouvez exercer vos droits en la matière : accès, rectification, effacement, limitation, opposition et portabilité.
Événement organisé à l’occasion des 45 ans de la filière InfoDoc/STIC

Posté par

Sébastien de Valeriola

le

23 mars 2023

| Tags : fête
Slides de la première réunion du groupe de contact FNRS « Les humanités des données »

Posté par

Sébastien de Valeriola

le

7 décembre 2022

| Tags : conférence, recherche

Le lundi 7 novembre 2022 s’est tenue la première réunion d’un nouveau groupe de contact FNRS intitulé « Les humanités des données », dont Sébastien de Valeriola (ULB) est le président et Paul Bertrand (UCLouain) et Nicolas Ruffini-Ronzani (UNamur et AEN) sont secrétaires. Le programme était le suivant :

Les slides de l’exposé sont disponibles ici :

RuffiniRonzani-deValeriola_Données, humanités et méthodes quantitatives_slides Télécharger
Consultez les slides de la session d’accueil 2022-2023

Posté par

Sébastien de Valeriola

le

20 septembre 2022

| Tags : accueil

Slides de présentation du master STIC ULB (version 2022-2023)Télécharger
Réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique »

Posté par

Mathias Coeckelbergs

le

21 février 2022

| Tags : conférence

(Téléchargez l’introduction d’Isabelle Boydens et la présentation de Laurence Dierickx.)

La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 18 mai 2022 de 14H à 15H45, elle aura lieu en ligne (vous recevrez le lien afin de rejoindre l’événement, une fois inscrits, voir ci-dessous).

Pluridisciplinaire, le groupe se situe au confluent des sciences appliquées et des sciences humaines et politiques.

Le groupe, dont nous avons fêté les 25 ans en 2019, s’est réuni récemment en 2021.

La conférence cette année, « Apprentissage automatique : les challenges de la qualité des données dans la perspective d’une adéquation aux usages » examinera, sur la base d’exemples issus des sciences humaines et sociales, l’importance de la «qualité des données» dans le contexte du Machine Learning (« apprentissage automatique ») et les formes particulières de la qualité des données dans ce contexte. Plus d’information est disponible dans l’abstract ci-dessous.

La conférence sera présentée par Laurence Dierickx, Docteur en Sciences de l’Information, Laurence publie et effectue de la recherche dans le domaine de l’apprentissage automatique (études du journalisme et études des médias), avec un accent particulier sur la qualité des données, domaine qu’elle enseigne également dans le cadre de formations en datajournalisme (voir plus d’information dans l’abstract).

La réunion se terminera par une table ronde au cours de laquelle tous les participants qui le souhaitent seront invités à intervenir. L’accès à la rencontre, qui est financée par le Fonds National de la Recherche Scientifique, est gratuit ; il est toutefois indispensable de s’inscrire avant le 10 mai 2022 au plus tard à l’événement via le lien suivant, en indiquant votre nom, prénom et institution(s) d’appartenance(*). Vous recevrez par email une confirmation d’inscription avec le lien Teams vous permettant de rejoindre l’événement du 18 mai.

Programme

14h00 Introduction, par Isabelle Boydens, Présidente du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique », Professeur ordinaire à l’ULB et responsable du « Data Quality Competence Center » au sein du département Recherche de Smals

14h05 « Apprentissage automatique : les challenges de la qualité des données dans la perspective d’une adéquation aux usages » par Laurence Dierickx

15h15 Débat et table ronde. Modérateur : Sébastien de Valeriola, spécialiste en Digital Humanities, auteur de nombreuses publications et initiatives sur le sujet et chargé de cours au sein du département SIC de l’ULB.

Résumé

La qualité des données joue un rôle central dans le développement de technologies d’apprentissage automatique (machine learning), lesquelles s’appuient sur des familles d’algorithmes conçus pour formaliser et optimiser un processus nourri par de larges volumes de données. S’il est communément admis que des données de mauvaise qualité ne peuvent donner lieu à une information de qualité, la problématique de la qualité des données est ici d’autant plus complexe qu’elle concerne à la fois les données qui nourrissent le modèle, la représentation du modèle, les mesures d’évaluation et la précision du modèle, ainsi que les méthodes de recherche du meilleur modèle. L’évaluation de la qualité des données et leur validation s’opèrent donc en amont et en aval de ces processus, lesquels ne peuvent être envisagés autrement que dans le contexte de leur domaine d’application.

Cet exposé présentera les concepts et enjeux de la qualité des données rencontrés dans l’apprentissage automatique, en s’appuyant sur une sélection d’exemples, tous domaines d’application confondus. Il mettra cette approche en perspective en se basant sur deux études de cas : en premier lieu, dans le domaine de la génération automatique en langage naturel dans un contexte journalistique (données quantitatives) ; et, en second lieu, dans celui de la fouille de textes (text mining) de contenus générés par des utilisateurs via les réseaux sociaux (données textuelles). Cette pratique est notamment utilisée dans les domaines de la politique et du marketing, mais aussi dans la recherche en humanités numériques et en sciences humaines. Dans ce cadre, nous nous intéresserons également au langage R et aux packages dédiés à la préparation des données (data wrangling), dont certains sont susceptibles de donner lieu à des problèmes de qualité supplémentaires.

Intervenant

Laurence Dierickx est docteure en Sciences de l’Information et la Communication, auteure d’une thèse traitant de l’automatisation de la production d’informations, soutenue en 2020, et titulaire d’un master en Sciences et Technologies de l’Information et de la Communication. Elle est actuellement consultante indépendante en information numérique, collaboratrice scientifique du centre de recherche (ReSIC) et membre du Laboratoire des pratiques et identités journalistiques (LaPIJ) de l’Université Libre de Bruxelles. Elle enseigne également le journalisme de données dans le cadre du Master en Journalisme de l’ULB. Elle poursuit actuellement un post-doctorat à l’Université de Bergen, en Norvège, où ses recherches portent sur le fact-checking automatisé.

(*)Réglementation en matière de protection des données :

Vous accédez à cette page et ces informations vous sont demandées car vous êtes repris sur une ou plusieurs listes de distribution par lesquelles l’Université libre de Bruxelles vous informe sur ses activités et/ou parce que vous vous inscrivez à un événement organisé par l’Université libre de Bruxelles. Le Règlement général sur la protection des données personnelles est entré en application le 25 mai 2018. L’ULB se conforme à cette législation et attache une grande importance à la protection de vos données à caractère personnel.

Ainsi, il vous est notamment possible, à tout moment, de vous désinscrire de cette invitation en envoyant un email à Mathias.Coeckelbergs@ulb.be

Dans tous les cas, sachez que l’Université n’utilise vos données que pour vous informer sur ses activités et qu’elle ne les communique pas à des tiers à des fins commerciales ou de marketing. Toutes vos questions sur la protection de vos données par l’ULB peuvent être envoyées à la Déléguée à la protection des données : rgpd@ulb.ac.be. Cette adresse est également celle par le biais de laquelle vous pouvez exercer vos droits en la matière : accès, rectification, effacement, limitation, opposition et portabilité.