Des insouciances de l'archivisme à une réflexivité constante : considérations éthiques en linguistique de terrain à l'ère du Traitement Automatique des Langues - Études aréales - Asies et Pacifique
Pré-Publication, Document De Travail Année : 2024

From archival activism to constant reflexivity: ethical considerations in field linguistics in the era of Natural Language Processing

Des insouciances de l'archivisme à une réflexivité constante : considérations éthiques en linguistique de terrain à l'ère du Traitement Automatique des Langues

从无所忌惮的数据存档激进主义到不断的反思:自动语言处理时代田野语言学的伦理考量

Camille Noûs

Résumé

This text is an attempt to look back on two decades of linguistic fieldwork on endangered languages in Yunnan (China) and of activism in favour of opening up fieldwork data. The time frame coincides with two decades of spectacular progress in computer science, and in particular in Natural Language Processing. Looking back, it seems clear that the consistent adoption of Open Science principles implies that the ethical and socio-political issues raised by the creation, electronic publication and exploitation of multimedia fieldwork corpora must be given a central place (rather than hoping for ready-made solutions to deflect concerns and fend off trouble). These topics call for constant collective reflection involving specialists in Natural Language Processing.
Ce texte se veut un essai de retour réflexif sur un parcours : deux décennies d’enquêtes linguistiques de terrain sur des langues rares, au Yunnan (Chine), et d’engagement en faveur de l’ouverture des données de terrain. Le cadre temporel coïncide avec deux décennies de progrès spectaculaires de l’informatique, et notamment du Traitement Automatique des Langues. Au fil des réflexions, il ressort que l’adoption conséquente de principes de Science ouverte amène, non pas à se doter d’un ensemble de solutions qui permettent d’éviter les soucis, mais à faire une place centrale aux questions éthiques et socio-politiques soulevées par la constitution, la publication électronique et l’exploitation de ressources en langues rares. Ces thèmes appellent une réflexion collective constante, à laquelle soient associé·es des spécialistes de Traitement Automatique des Langues.
本文试图回顾二十年来在云南(中国)开展的濒危语言田野调查,以及为开放田野调查数据所做的努力。这二十年,是计算机科学,包括自然语言处理技术取得巨大进步的二十年。回顾过去,似乎可以清楚地看到,始终如一地采用开放科学原则意味着:必须将实地调查数据的创建、电子出版和利用所引发的伦理和社会政治问题放在中心位置。而不是寄希望于依靠现成的解决方案来避免纠纷。这些问题的解决,需要语言学家与语言处理专家们协同合作,不断进行集体思考。
Fichier principal
Vignette du fichier
Insouciances_SoumissionHumanitesNumeriques_v3_accepte.pdf (719.92 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
licence

Dates et versions

hal-04518087 , version 1 (23-03-2024)
hal-04518087 , version 2 (12-04-2024)
hal-04518087 , version 3 (02-10-2024)

Licence

Identifiants

  • HAL Id : hal-04518087 , version 3

Citer

Camille Noûs, Alexis Michaud. Des insouciances de l'archivisme à une réflexivité constante : considérations éthiques en linguistique de terrain à l'ère du Traitement Automatique des Langues. 2024. ⟨hal-04518087v3⟩
186 Consultations
90 Téléchargements

Partager

More