Défiler vers le haut

[Séminaire ATILF] Jacques François & Justine Reynaud : La modélisation graphique de la polysémie évolutive à partir des entrées historiques du TLFi

3 mars 2023
Durée : 00:51:07
Nombre de vues 33
Nombre d’ajouts dans une liste de lecture 0
Nombre de favoris 0

Jacques François*, Justine Reynaud** et Laurette Chardon* (Université de Caen/ *CRISCO | **GREYC) : La modélisation graphique de la polysémie évolutive à partir des entrées historiques du TLFi

 

Bien que tous les membres de l’ATILF soient sans nul doute parfaitement informés de ce qui suit, il nous paraît souhaitable de rappeler les trois points suivants :

  • Les articles du TLFi se composent d’une entrée lexicographique, de données phonétiques, orthographiques et statistiques, établies à partir de la base de données textuelles FRANTEXT constituée simultanément, et d’une entrée « Étymologie et histoire », à l’exception des tous premiers où deux entrées Étymologie et Histoire copieuses ont été distinguées, ex. abstrait (1087 mots) ≠ concret (68 mots).
  • Les entrées lexicographiques ont bénéficié d’une informatisation fonctionnelle (attribuant une fonction à chaque segment et permettant ainsi tout un jeu de recherches transversales), mais l’ATILF s’est abstenu d’en faire de même pour les entrées historico-étymologiques (H-É), sans doute avec la conviction que la microstructure de ces entrées était trop hétérogène, et s’est contenté d’une informatisation formelle, c’est-à-dire limitée à la délimitation des entrées et au format typographique.
  • De ce fait, il est actuellement impossible de pratiquer sur les entrées H-É des recherches transversales similaires à celles que permettent les entrées lexicographiques.

Le projet qui sera exposé le 3 mars vise à convertir l’essentiel des données fournies par les entrées H-É du TLFi dotées d’une « POLYSEMIE EVOLUTIVE » (± 20 000 sur un total de ± 49 000) dans un format tabulaire, de leur associer un graphe historique (arborescent) et à moyen terme – si le résultat de ces opérations est jugé satisfaisant, au moins pour une version de démonstration – de publier pour chacune de ces entrées un couple graphe-tableau historique dans le cadre des éditions électroniques du CNRTL. À long terme, la base de données ainsi constituée devrait permettre au moins certaines recherches transversales élémentaires.

Les points suivants seront succinctement abordés :

  • le point de vue du linguiste sur la segmentation et l’enregistrement des données nécessaires à la construction de l’arbre historique de chaque vocable,
  • l’analyse statistique des 82 fichiers XML fournies par E. Petitjean, notamment la question des entrées historiques polysémiques dont les rubriques ne commencent qu’après un préambule,
  • les opérations de codage fonctionnel encore en chantier dont l’utilité est à discuter
  • la construction des arbres historiques dans un format orthonormé (siècles * identifiants des rubriques)

La présentation des étapes successives de ce projet sera effectuée pour sa dimension linguistique par Jacques François (CRISCO, Caen) et pour sa dimension informatique par Justine Reynaud (GREYC, Caen). La modélisation graphique du contenu des entrées H-É a été engagée par Triss Jacquiot (GREYC, 1er semestre 2022) et poursuivie par Laurette Chardon (CRISCO) depuis lors.
 

Références
Bernard P. / Dendien J. / Pierrel J.M. (2004), A computerized dictionary : Le Trésor de la langue française informatisé (TLFi). In Proceedings of the Workshop on Enhancing and Using Electronic Dictionaries, pp. 40–43, Geneva, Switzerland. COLING.
Dendien J. / Pierrel J.M. (2003), Le Trésor de la langue française informatisé : un exemple d’informatisation d’un dictionnaire de langue de référence. In Les dictionnaires électroniques, M. Zock et J. Carroll (eds), Traitement Automatique des langues, Vol 44 – n° 2/2003 : 11-37.
François J. (2020), Pour un retraitement informatisé et dynamique des notices historiques du TLFi, Cahiers de lexicologie Varia, n° 117, 2020–2 : 55-92
François J. (2021a), Comment visualiser l’évolution historique des polysémies lexicales : l’itinéraire sémantique de TERRE et MONDE. Zeitschrift für romanische Philologie 137(3): 625–665,
François J. (2021b), Les fluctuations historiques de la polysémie lexicale, Travaux de linguistique 2020/2 n° 81 : 57-98
Mazziotta N., / François J. / Kahane S. (dir. à paraître, 2023), Les diagrammes en sciences du langage. Travaux de Linguistique, n° thématique 1er semestre 2023. Éditions De Boeck Supérieur.

Mots clés : atilf caen cnrtl crisco greyc lexicographie phonetique tlfi xml « codage fonctionnel » « jacques francois » « e. petitjean » « etymologie et histoire » « justine reynaud » « laurette chardon » « modelisation graphique « polysemie evolutive

 Informations