Thématiques

Les principaux thèmes de recherche des chercheurs de la filière sont les suivants :

Humanités numériques

Les humanités numériques constituent une discipline multi-facettes, qui peut être appréhendée de beaucoup de façons différentes. Les travaux de Sébastien de Valeriola concerne principalement l’application de méthodes quantitatives à des problématiques issues des sciences humaines. Les sujets concernés sont très divers (histoire, archéologie, journalisme, histoire de l’art, etc.), de même que les techniques mises en œuvre (statistiques, apprentissage automatique, fouille de textes, traitement d’images, etc.). Les activités de recherche dans ce thème sont regroupées dans le laboratoire QuaDiHum (Quantitative and Digital Humanities).

Gestion de la qualité de l’information numérique

L’axe principal de recherche de la filière réside dans l’analyse de l’interprétation de l’information numérique, de son organisation et de sa gestion dans les mécanismes de partage des connaissances, de conservation, de classement et de transmission des données. Une partie des recherches porte sur la qualité des données structurées et non structurées (data quality), plus particulièrement, la qualité des systèmes d’information automatisés à grande capacité, rendus possibles par l’informatisation. Ces recherches reposent sur la confrontation entre le cadre opératoire déterministe de l’outil informatique et l’interprétation du réel observable empirique représenté, afin de cerner les arbitrages auxquels sont confrontés les gestionnaires de systèmes. Sur la base de cette analyse pluridisciplinaire reposant sur la critique des sources et l’informatique, il s’agit de développer des technologies et des outils novateurs capables d’assister autant les concepteurs que les utilisateurs dans leur démarche de recherche et d’organisation de l’information.

La recherche à ce niveau est effectuée par Isabelle Boydens, professeur à l’ULB, chercheur à la Smals et présidente du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique », pluridisciplinaire couvrant à la fois les sciences appliquées et les sciences humaines et politiques.

Linguistique computationnelle et modélisation des connaissances

La modélisation des connaissances est un domaine qui concerne beaucoup de travaux d’extraction, de gestion et de partage des connaissances et qui prend toute son importance avec des initiatives comme le web of data. Dans ce cadre, les techniques de traitement automatique des langues, et notamment l’extraction d’information multilingue, constituent un atout pour améliorer l’accès à la connaissance dans un monde de plus en plus marqué par la surabondance d’information. Max De Wilde a défendu une thèse de doctorat et publié de nombreux travaux sur le sujet, et est à présent professeur en STIC.