Réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique »

La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 21 mai 2025 à 13h30 à l’Université libre de Bruxelles (auditoire AY.2.108bâtiment A, campus du Solbosch).

Pluridisciplinaire, le groupe se situe au confluent des sciences appliquées et des sciences humaines et politiques. Le groupe, dont nous avons fêté les 30 ans en 2024, s’est réuni l’an passé.

La conférence sera présentée par Katy Fokou, consultante recherche à la Smals depuis 2018, où elle s’est spécialisée dans les techniques d’intelligence artificielle.  Avant de rejoindre Smals, Katy a travaillé sur la mise en œuvre de systèmes informatiques de laboratoire dans le secteur pharmaceutique et l’industrie de la biotechnologie, et a obtenu un Master en sciences cognitives à l’Université d’Edimbourg.

La conférence cette année, intitulée « Qualité des données dans le processus d’ingestion pour les grands modèles de langage : pratiques et défis », examinera, sur la base d’exemples concrets, les questions que soulève l’ingestion de données dans les grands modèles de langage ainsi que les bonnes pratiques en la matière.

La réunion se terminera par un débat suivi d’un drink. L’accès à la rencontre, qui est financée par le Fonds National de la Recherche Scientifique, est gratuit ; il est toutefois indispensable de s’inscrire avant le 15 mai 2025 au plus tard à l’événement via un formulaire en indiquant votre nom, prénom et institution(s) d’appartenance (*). Vous recevrez par email une confirmation d’inscription.

Lien pour s’inscrire

Programme

13h30 Introduction, par Isabelle Boydens, Présidente du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique », Professeur ordinaire à l’ULB et responsable du « Data Quality Competence Center » au sein du département Recherche de Smals

13h35  « Qualité des données dans le processus d’ingestion pour les grands modèles de langage : pratiques et défis ? » par Katy Fokoudétentrice d’un Master en sciences cognitives à l’Université d’Edimbourg, spécialisée en IA et TAL au sein du centre de Recherche de Smals.

14h35 Débat et table ronde. Modérateur : Max De Wilde, Docteur en Sciences et Technologies de l’Information et de la Communication de l’Université libre de Bruxelles, consultant en TAL, maître de conférences à l’Université libre de Bruxelles et à l’Université de Genève.

15h35 réception

Résumé

Dans le contexte des grands modèles de langage, la qualité des données joue un rôle crucial dans la performance des modèles et des applications basées sur ces modèles.

Cette présentation explore les meilleures pratiques pour assurer la qualité des données tout au long du processus d’ingestion des données.

Nous aborderons les défis courants tels que la gestion des biais, la détection et la correction des erreurs, la gestion de la diversité des formats de données, etc.

En outre, nous discuterons des outils et des techniques qui peuvent être intégrés dans le pipeline d’ingestion pour garantir une qualité optimale.

Enfin, nous examinerons les implications de la qualité des données sur les résultats des modèles de langage et proposerons des stratégies pour surmonter les obstacles rencontrés. Cette présentation vise à fournir des recommandations pratiques pour le développement d’applications basée sur les grands modèles de langage, afin d’améliorer la précision et la robustesse de ces applications.

Intervenante

Katy Fokou est consultante recherche à la Smals depuis 2018, où elle s’est spécialisée dans les techniques d’intelligence artificielle, y compris l’apprentissage automatique et le traitement du langage naturel ; elle s’occupe de l’introduction de ces technologies dans le secteur public. Avant de rejoindre Smals, Katy a travaillé sur la mise en œuvre de systèmes informatiques de laboratoire dans le secteur pharmaceutique et l’industrie de la biotechnologie. Elle a obtenu un Master en sciences cognitives à la Faculté d’Informatique de l’Université d’Edimbourg. Avant cela, elle avait obtenu un Master en Gestion Industrielle à l’Université de Liège.

(*) Réglementation en matière de protection des données

Vous accédez à cette page et ces informations vous sont demandées car vous êtes repris sur une ou plusieurs listes de distribution par lesquelles l’Université libre de Bruxelles vous informe sur ses activités et/ou parce que vous vous inscrivez à un événement organisé par l’Université libre de Bruxelles. Le Règlement général sur la protection des données personnelles est entré en application le 25 mai 2018. L’ULB se conforme à cette législation et attache une grande importance à la protection de vos données à caractère personnel.

Ainsi, il vous est notamment possible, à tout moment, de vous désinscrire de cette invitation en envoyant un email à Guillaume.Quintin@ulb.be.

Dans tous les cas, sachez que l’Université n’utilise vos données que pour vous informer sur ses activités et qu’elle ne les communique pas à des tiers à des fins commerciales ou de marketing. Toutes vos questions sur la protection de vos données par l’ULB peuvent être envoyées à la Déléguée à la protection des données : rgpd@ulb.ac.be.  Cette adresse est également celle par le biais de laquelle vous pouvez exercer vos droits en la matière : accès, rectification, effacement, limitation, opposition et portabilité.