AIRESS Research Seminar

As part of the AIRESS Research Seminar series, Professor Stéphane Mussard will explore large language models on Wednesday, February 19th at 12:30 p.m. During the session, he will present the mechanisms behind their architectural development and their applications in social and behavioral sciences.

ABSTRACT

Suite à l'abandon progressif des réseaux de neurones récurrents au profit des transformers, la recherche en traitement du langage naturel se concentre depuis 2018 dans la construction de grands modèles de langue (LLM). Capables de tenir des conversations ou de résoudre des tâches complexes telles que la génération de résumé et la traduction, l'entraînement de ces architectures suit deux principes : une phase généraliste sur des corpus gigantesques puis une spécialisation sur des problématiques bien définies. Au coeur de ces modèles, les mécanismes d'attention permettent le traitement de séquences de natures diverses (texte, audio, valeurs numériques) en connectant les éléments entre eux grâce à des matrices de scores. Ces mécanismes permettent de construire des LLM avec diverses applications possibles en sciences humaines et sociales.