Return to search

La caractérisation multiple en français. Description, comparaison avec d'autres langues et formalisation XML

Selon la théorie du syntagme nominal développée par Wilmet (2003), la notion de caractérisant est une notion fonctionnelle qui désigne tous les « accompagnateurs » du nom (ou déterminants) qui modifient l’extension du nom. Cette notion est indépendante des catégories morpho-syntaxique puisqu’on trouve parmi les caractérisants des adjectifs, des syntagmes prépositionnels, des noms, des adverbes, des propositions relatives voire des phrases entières.
Les linguistes du français se sont surtout intéressés à la position absolue de l’adjectif (antéposition ou postposition au nom), mais peu à leur ordre relatif. Il était intéressant d’étendre le point de vue à tous les caractérisants parce que le mélange de caractérisants de différentes natures, en particulier la séquence relative de l’adjectif et du complément du nom, pose d’intéressantes questions linguistiques. La notion fonctionnelle montre également sa valeur dans un cadre comparatiste, car différentes langues ne rendent pas le même concept avec la même catégorie morpho-syntaxique.
Notre théorie est que la séquence des caractérisants, tant en antéposition qu’en postposition, est régie par une hiérarchie de critères morpho-syntaxiques et sémantiques, en particulier par leur valeur classificatrice, descriptive ou spécificatrice. On a souvent classé les adjectifs en fonction de leur appartenance à une classe sémantique ontologique (couleur, forme, matière…). En réalité, de très nombreux adjectifs et caractérisants n’entrent pas dans ces catégories et ce type de classification n’est pas le premier critère à l’œuvre dans l’ordre des mots.
Le syntagme nominal apparaît dès lors comme structuré en différentes couches concentriques autour du nom ; il est délimité en antéposition par les quantifiants et en postposition par les caractérisants spécificateurs qui lui font en quelque sorte pendant. On observera dès lors d’intéressants phénomènes de sens et d’acceptabilité grammaticale dans le jeu des quantifiants et des caractérisants. Inversement, la position relative d’un caractérisant influe sur sa valeur. On pourrait résumer ces effets de sens par la formule : on dit d’abord ce que c’est, ensuite comment c’est, et enfin lequel c’est. De manière très générale donc, on observe que l’orientation des déterminants se fait selon un axe intrinsèque-extrinsèque ou objectif-subjectif.
L’étude d’expressions dans d’autres langues et dans des domaines spécialisés (cuisine, appellations officielles incluant des adjectifs géographiques, localisation de logiciels et chimie organique) permet de valider cette hypothèse tout en montrant que l’ordre des mots est un phénomène de génération, propre à chaque langue car la traduction modifie la nature morpho-syntaxique et peut modifier la valeur des caractérisants.
La partie technique de la thèse a exploité des techniques de traduction assistée par ordinateur, de traduction automatique et de traitement du langage, elle a fait appel aux langages de balisage standards de la famille XML pour la représentation des corpus et des règles ainsi que pour la réalisation des procédures. Les corpus spécialisés ont été constitués par alignement de corpus monolingues ou par traduction. Ils ont tous été mis au format XML ; les règles de traduction ont été formalisées dans le même format et elles ont été implémentées en XSLT. La formalisation des corpus en assure la portabilité et facilite les recherches de structures grammaticales sur un corpus catégorisé. Les corpus parallèles sont en outre d’une grande aide pour les traducteurs. Enfin, l’automatisation permet de valider les règles linguistiques proposées.

Identiferoai:union.ndltd.org:BICfB/oai:ulb.ac.be:ETDULB:ULBetd-06122005-115900
Date26 September 2005
CreatorsMerten, Pascaline B. M. G.
ContributorsPierrard, Michel, Bouillon, Pierrette, Englebert, Annick, Miller, Philip, Rosier, Laurence
PublisherUniversite Libre de Bruxelles
Source SetsBibliothèque interuniversitaire de la Communauté française de Belgique
LanguageFrench
Detected LanguageFrench
Typetext
Formatapplication/pdf
Sourcehttp://theses.ulb.ac.be/ETD-db/collection/available/ULBetd-06122005-115900/
Rightsunrestricted, J'accepte que le texte de la thèse (ci-après l'oeuvre), sous réserve des parties couvertes par la confidentialité, soit publié dans le recueil électronique des thèses ULB. A cette fin, je donne licence à ULB : - le droit de fixer et de reproduire l'oeuvre sur support électronique : logiciel ETD/db - le droit de communiquer l'oeuvre au public Cette licence, gratuite et non exclusive, est valable pour toute la durée de la propriété littéraire et artistique, y compris ses éventuelles prolongations, et pour le monde entier. Je conserve tous les autres droits pour la reproduction et la communication de la thèse, ainsi que le droit de l'utiliser dans de futurs travaux. Je certifie avoir obtenu, conformément à la législation sur le droit d'auteur et aux exigences du droit à l'image, toutes les autorisations nécessaires à la reproduction dans ma thèse d'images, de textes, et/ou de toute oeuvre protégés par le droit d'auteur, et avoir obtenu les autorisations nécessaires à leur communication à des tiers. Au cas où un tiers est titulaire d'un droit de propriété intellectuelle sur tout ou partie de ma thèse, je certifie avoir obtenu son autorisation écrite pour l'exercice des droits mentionnés ci-dessus.

Page generated in 0.0024 seconds