Le français à luniversité

Corpus numériques, langues et sens. Enjeux épistémologiques et politiques

Rachel Panckhurst

Référence de l'oeuvre:

Debono, Marc (dir.), (2014), Corpus numériques, langues et sens. Enjeux épistémologiques et politiques, coll. « GRAMM-R. Études de linguistique française », Peter Lang, Bruxelles, Bern, Berlin, Frankfurt am Main, New York, Oxford, Wien, 216 pages.

Texte intégral

Image1

1Cet ouvrage collectif, s’inscrivant dans un paradigme herméneutique, avec des enjeux épistémologiques et politiques, contient six articles en plus de l’introduction présentée par le coordonnateur, Marc Debono, enseignant-chercheur en sciences du langage à l’Université François-Rabelais de Tours et membre de l’équipe de recherche EA 4246 PREFics-Dynadiv (comme le sont d’ailleurs la plupart des contributeurs). Ses propres recherches s’articulent autour de la didactique des langues-cultures et de la sociolinguistique.

2Dans l’introduction puis dans sa contribution, intitulée « Représentations et traitement des corpus numériques linguistiques. Quid des représentations du chercheur  ? », Marc Debono discute des « pratiques » et des « représentations » en sciences du langage. Il défend « une approche herméneutique des représentations — trame de tout l’ouvrage — qui reconnaît une part d’inaccessible de l’être humain (et donc une part d’incertitude dans la science “humaine”) » (p. 41). Pour ce faire, il prend appui sur un appel à propositions intitulé « Numérique et textualité : observation, description et analyse des pratiques contemporaines » lancé par la DGLFLF (Délégation générale à la langue française et aux langues de France) en 20121, texte dont il critique le contenu par la suite. Selon lui, dans ce type d’appel, et dans le traitement des corpus numériques linguistiques contemporains en général, les « représentations » du chercheur sont reléguées au second plan, face aux « pratiques/usages », qui occuperaient le devant de la scène. Il propose de réintroduire une « dose d’incertitude » dans la recherche.

3Dans sa contribution « Continuité épistémologique au sein de la révolution numérique », Elatiana Razafimandrimbimanana estime que « produire du sens scientifique en reconnaissant et en intégrant […] le sujet chercheur et ses représentations » (p. 78) est essentiel. Elle conteste l’idée d’une « révolution numérique », en avançant qu’il s’agit plutôt d’une « continuité » dans les représentations de la scientificité et que « le numérique n’aurait pas révolutionné les rapports au sens dans la recherche en SdL ». Je pense que la véritable révolution, ou plutôt nouveauté, concerne l’accès aux données authentiques; en deux décennies, la constitution de corpus numérisés ou nativement numériques est devenue monnaie courante, et cette accessibilité massive constitue en soi une nouveauté — cela permet sans doute une plus grande diversité des phénomènes observables.

4Lorenzo Bonoli, dans son texte « L’évacuation de l’interprétation. Un regard épistémologique sur les logiciels d’analyse textuelle », s’intéresse aux logiciels d’analyse textuelle, et notamment au débat entre logique quantitative et logique interprétative. Je m’aligne sur son avis, à savoir que les logiciels d’analyse textuelle peuvent seulement défricher le terrain, et, par là, ne constituent qu’une « approche des textes » (p. 93), car le chercheur doit obligatoirement replonger dans les corpus constitués. Ces logiciels ne peuvent en aucun cas permettre un réel accès sémantique, voire pragmatique (quoi qu’en disent leurs auteurs, même si des progrès ont été faits dans ce domaine). Mon avis serait plus nuancé concernant l’idée selon laquelle ils constitueraient de « nouvelles approches informatiques » (p. 91), car, tout comme les analyseurs morphosyntaxiques, ceux-ci existent depuis fort longtemps (cf. entre autres, Souchard et al. Le Pen, les mots. Analyse d’un discours d’extrême droite [1997], pour ne citer qu’un exemple d’analyse de discours positionnelle dans un cadre SdL).

5Dans « Corpus et numérique en sciences du langage. Enjeux épistémologiques », Isabelle Pierozak  met en garde le chercheur contre un positionnement exclusif de « technicien-méthodologue » (p. 114) donnant aux corpus numériques en SdL un statut « inconsidérablement prégnant » (p. 20). Elle cite, entre autres, l’excellente réflexion de Cori et al. (2008) sur la place des corpus en SdL et elle propose de resituer le débat en prenant en considération les rôles sociaux, éthiques, politiques du chercheur. Au passage, elle interroge la dénomination du corpus « brut », qui serait « indemne […] de toute intervention (sélection, annotations, etc.) » [p. 108], comme étant un mythe. Nous avons nous-mêmes mis à disposition un corpus « brut », « anonymisé », de SMS, récemment (cf. note 1). Pour nous, il est évident qu’une sélection, une « épuration » et une anonymisation des données doivent être effectuées, ne serait-ce que pour des raisons légales. Mais les données demeurent vierges de tout « transcodage » en français « standardisé » et de toute annotation; pour cette raison, le terme « brut » nous convient, entre guillemets. Ce choix, pour nous, constitue un choix théorique fort : nous considérons qu’annoter n’est pas une opération descriptive neutre. Elle relève nécessairement d’un cadre interprétatif. Puisque les choix théoriques diffèrent, les démarches pluridisciplinaires se distinguent, les questionnements scientifiques varient, etc., nous pensons qu’il est préférable que les chercheurs la prennent en charge en fonction de leur propre questionnement. On ne souhaite pas imposer des initiatives de balisage supplémentaire aux chercheurs (cf. Panckhurst, Roche, Lopez, 2015; Panckhurst, 2015).

6Dans sa contribution « Les pratiques linguistiques numériques/électroniques. Une source d’angoisse pour les linguistes ? », Valentin Feussi oriente sa réflexion vers l’herméneutique philosophique et questionne l’« angoisse » du linguiste face aux écrits numériques/électroniques, et notamment lorsqu’il s’agit de problématiser l’instabilité des pratiques linguistiques. Personnellement, je ne ressens jamais d’« angoisse » dans ce type de situation, mais plutôt une excitation intellectuelle, au contraire. Il s’attaque aux méthodes de description linguistique « les plus répandues » : « le but de la description [étant] de procéder à des modélisations des systèmes linguistiques avec comme conséquence une stabilisation artificielle des formes qui sont dès lors présentées comme objectives » (p. 125). Dans le cas de l’écriture SMS (puisque l’un de mes articles est cité), c’est tout l’inverse, me semble-t-il : l’absence de normes et de standardisation possibles est une caractéristique de ces processus scripturaux, mais cela n’empêche pas de proposer une certaine typologie de l’écriture SMS, pour approcher les phénomènes, pour tenter de les comprendre, décrivant les substitutions, réductions, suppressions, ajouts. Précisément, dresser une typologie, me semble-t-il, permet de réfléchir, de discuter, d’inventer, de modifier, par la suite. Approcher les phénomènes, essayer de dresser une liste non exhaustive n’équivaut pas à imposer une objectivité. On ne stabilise pas « artificiellement » — cela est, de toute façon, impossible lorsqu’on travaille sur l’écriture SMS.

7Dans l’article final, « Monnaie de signe, monnaie de singe ? Comment comprendre des corpus électroniques ? Implications épistémologiques, éthiques et politiques », Didier de Robillard refuse clairement le choix des corpus et se réclame d’une sociolinguistique herméneutique. L’auteur propose une autre vision des rapports entre sphères politique et de recherche, fondée sur « l’altérité et la diversité des formes de consultances et d’expertises plutôt que sur le partage d’implicites connivents d’autant plus lourds de conséquences qu’ils ne sont jamais soumis à discussion, sous prétexte que cela ne correspondrait pas à de la science » (p. 210). Article de fin d’ouvrage volontairement politique et provocateur : la lecture en sera « tonique » !

8Cet ouvrage, avec le titre qui inclut les « enjeux épistémologiques et politiques », ne peut demeurer neutre, bien entendu. Mais je reste sur ma faim après sa lecture; j’aurais souhaité que le débat « houleux » soit ouvert. Or, le livre est proposé exclusivement à partir d’un seul positionnement théorique — celui de l’herméneutique, qui me paraît assez fermé sur lui-même. Puis, critiquer, voire démolir les corpus numériques, certes, mais où sont les propositions concrètes ?

9Toutes les approches me semblent possibles, même si les chercheurs se distinguent par leurs positionnements et questionnements scientifiques. La discussion doit rester ouverte entre différentes disciplines et écoles de pensée. Après la lecture de ce livre, ma vision de l’analyse et de la mise à disposition de corpus numériques reste intacte, malgré leurs limites éventuelles (absence de contextualisation, par exemple, lorsqu’on recueille des SMS de manière anonyme, et que ceux-ci correspondent à des SMS envoyés à autrui, donc « isolés », par opposition à des SMS « conversationnels »), ne serait-ce que par la triple dimension suivante : photographie d’une époque, accessibilité, diffusion. Puis, dans le cadre du projet SMS, des applications pratiques sont envisagées pour l’avenir : améliorer, par exemple, pour le cas de la synthèse vocale (ou des conducteurs empêchés de regarder l’écran de leur téléphone), les dictionnaires électroniques par des systèmes d’alignement automatique statistique (Lopez et al., 2014).

10Même si des positionnements épistémologiques peuvent se distinguer, et si le livre a le mérite de remettre en question les approches relevant des « linguistiques de corpus » (cf. également Cori et al., 2008, pour un questionnement des corpus en SdL) et de permettre sans doute de susciter les débats et les réflexions afin d’améliorer les démarches scientifiques à l’avenir, les attaques contre certaines politiques linguistiques sont frontales dans cet écrit. Finalement, je trouve cela curieux de confronter ouvertement, au sein même de l’ouvrage, la politique de l’organisme (DGLFLF) qui a financé la dotation reçue par l’équipe de recherche, et qui a soutenu la publication de cet ouvrage.

Haut de page

Notes

1 Nous avons nous-mêmes répondu à cet appel (notre projet : « Pratiques contemporaines de la textualité numérique : observation, description et analyse d’un grand corpus de SMS ») et bénéficié d’un financement que nous avons estimé crucial pour le déroulement de notre projet de traitement et mise à disposition d’un corpus « brut » anonymisé de SMS, « 88milSMS » (cf. http://88milsms.huma-num.fr/ Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014).

Haut de page

Pour citer

Rachel Panckhurst, Corpus numériques, langues et sens. Enjeux épistémologiques et politiques
Le français à l'université , 20-02 | 2015
Mise en ligne le: 03 juin 2015, consulté le: 20 août 2017

Haut de page

Auteur

Rachel Panckhurst

Université Paul-Valéry Montpellier 3 (France)

Du même auteur

Haut de page