Le français à luniversité

Corpus : état des lieux et perspectives

Martine Schuwer

Référence de l'oeuvre:

(2007), Corpus : état des lieux et perspectives, Revue française de linguistique appliquée, vol. XII-I, juin, Publications linguistiques, Paris.

Texte intégral

Image1

1La recherche sur corpus constitue désormais un mode d’analyse privilégié pour le linguiste désireux de rendre compte de la réalité des phénomènes langagiers. Mais qu’entend-on par « corpus » ? Selon quels critères telle collecte de données peut-elle être considérée comme significative d’un état de la langue ? Quels nouveaux domaines d’application les corpus permettent-ils d’explorer ?

2C’est à partir de travaux d’un groupe de chercheurs réunis sur ces questions en octobre 2005 qu’a été élaboré le présent numéro de la Revue française de linguistique appliquée, qui comprend en outre trois contributions sur le même thème, dont l’apport a été jugé particulièrement pertinent. Le titre l’annonce : ces textes visent à dresser « le bilan du travail sur les corpus mené depuis une vingtaine d’années ». L’intérêt du recueil tient à la variété des domaines d’application étudiés. La lexicographie en est un des plus immédiats, en raison de la qualité des corpus de langue que les progrès de l’informatique permettent aujourd’hui de constituer. Henri Béjoint en décrit l’impact sur la conception des dictionnaires de langue contemporains.

3D’autres domaines étudiés ici sont celui de la traduction automatique (TA) et de ses corpus spécifiques (C. Boitet), celui de la sémantique de corpus appliquée au cas de la construction de terminologies (A. Condamines), ainsi que celui de la construction et de l’exploitation des écrits scolaires (M.L. Elalouf et C. Boré).

4Les corpus de parole sont également abordés, à propos des questions posées par la transcription automatique de l’oral (M. Adda Decker), d’une part, et à propos des aspects juridiques et éthiques de la conservation des corpus oraux (O. Baude), d’autre part.

5Transcendant les domaines d’application, P. Cappeau et F. Gadet rappellent la rigueur qui doit entourer la définition du concept de corpus et présider à sa constitution, afin d’en permettre une exploitation fiable. Le recueil comprend enfin trois inventaires de corpus existants : un corpus de langue romane en pays germanophone, et deux corpus de français parlé, en France et dans la francophonie.

Haut de page

Pour citer

Martine Schuwer, Corpus : état des lieux et perspectives
Le français à l'université , 13-01 | 2008
Mise en ligne le: 23 mars 2012, consulté le: 19 avril 2024

Haut de page

Auteur

Martine Schuwer

Université Européenne de Bretagne — Rennes 2 (France)

Du même auteur

Haut de page