1 |
Ponctuation et syntaxe dans la langue française médiévale. Étude d'un corpus de chartes originales écrites à Liège entre 1236 et 1291Mazziotta, Nicolas 21 December 2007 (has links)
%%%Un résumé mis en forme disponible dans les fichiers joints%%%
Nous avons commencé par faire le pari que la syntaxe pouvait expliquer la majorité des signes de ponctuation. Cette optique nous a guidé durant toute notre étude, dont le but était de répondre à la question:
«Comment, d'après ce qu'on peut observer dans les chartes écrites en français à Liège avant 1292, la ponctuation originale interagit-elle avec la syntaxe dans la langue française médiévale?»
Nous avons d'emblée positionné notre étude par rapport à la réflexion sur la ponctuation médiévale, osant le pari que la syntaxe peut servir de point de référence pour expliquer la plus grande partie de la ponctuation des chartes. Nous avons ensuite décrit la constitution du corpus.
Face à une pareille question, il n'était pas envisageable de commencer
immédiatement à dépouiller les documents: il nous fallait définir avec exactitude les différents concepts dont nous allions avoir besoin.
*** Première partie: modélisation ***
La première partie du travail a ainsi été consacrée à la définition, sur des bases empiriques, des concepts mobilisés. Partant du sens commun et des principes fondamentaux de l'analyse linguistique classique (tenant du structuralisme et du
fonctionnalisme), nous avons exploité les matériaux à notre disposition pour en dégager des notions, dans une approche inductive par son rapport aux faits, mais déductive par sa progression.
Ainsi, au chapitre 2, l'observation du tracé des unités graphiques sur le parchemin nous a amené à abstraire les catégories nécessaires à une modélisation de l'ensemble des unités de la langue écrite, pour lesquelles
nous proposons une terminologie neuve reflétant notre analyse. Nous avons
progressivement défini _langue écrite_, puis _scriptèmes_,
_grammèmes_, etc., progressant des unités les plus générales aux unités les
plus particulières. Ce n'est qu'à ce prix que nous avons pu enfin délimiter
exactement, le moins intuitivement possible, notre propre acception du mot _ponctuation_: «ensemble des
ponctogrammes d'une langue écrite spécifique}. Dans cette définition, le terme _ponctogramme_ désigne une
unité minimale de la langue écrite (_scriptème_) n'organisant pas l'espace (_grammème_), exprimant un contenu (_plérégramme_), ne dépendant pas matériellement d'une autre
unité (_autogramme_), construit à l'aide de traits qui ne se combinent
pas obligatoirement sur un même axe (_nébulogramme_) et non paraphrasable par d'autres unités significatives... Employer ce terme ne pouvait se faire qu'à la fin d'un exposé détaillé, passant en revue tous les hyperonymes impliqués.
De manière moins audacieuse du point de vue de la terminologie employée, nous avons également tenté d'exposer notre conception de la syntaxe (chapitre 3). À nouveau, c'est le corpus qui nous a servi de guide: une fois les phrases délimitées de manière empirique, toutes les structures syntaxiques ont été passées en revue, nommées et intégrées dans un système théorique fondé sur la notion, héritée d'Alain Lemaréchal, de _relation minimale_. Nous sommes parti de l'existence d'un lien sémantique entre les unités en présence et nous
avons caractérisé la manière dont ce lien était _spécifié_.
Nous croyons, au delà de l'intérêt pratique de cette première partie, que les concepts dégagés peuvent être jugés suffisamment généraux sinon pour
servir à la comparaison d'autres systèmes graphiques ou syntaxiques, du moins afin de constituer une base à leur description.
*** Deuxième partie: analyse des données***
Une fois les concepts définis et l'ensemble du corpus annoté, il a été envisageable de répondre à la question posée. Néanmoins, l'ensemble des données disponibles, de par sa nature
et son abondance, rendait l'approche traditionnelle -- ou plutôt _manuelle_
-- difficilement applicable. C'est pourquoi nous avons ouvert la seconde partie du travail en annonçant le recours à des méthodes plus outillées: les statistiques (introduites au chapitre 4).
Ces méthodes présentées, nous avons sélectionné six caractéristiques
morphosyntaxiques et positionnelles que nous avons jugées fondamentales pour décrire tous les constituants. Ces variables répondaient à six
questions: 1/ du point de vue de l'ordre linéaire des mots, le constituant est-il le premier de la structure qu'il sert à construire? 2/ le constituant est-il le dernier de la structure qu'il sert à construire? 3/ quelle est la nature et le niveau d'intégration syntaxique de la structure qui le contient? 4/ quelle
est la fonction du constituant? 5/ est-il de nature propositionnelle (mode personnel ou non)? 6/ est-il relaté? Nous avons ensuite pu mettre en relation les réponses à ces questions et la simple présence de ponctuation de part et d'autre
des constituants, sans tenir compte, dans un premier temps, de la forme des
ponctogrammes.
Pour ce faire, nous avons essentiellement employé les techniques statistiques les plus classiques en sciences humaines: l'analyse des tableaux de contingence à l'aide
du test du chi². Après avoir évalué la relation entre chacune des six variables et la ponctuation, nous avons constaté l'inefficacité de la
méthode, ce qui nous a conduit à en rechercher une autre, permettant d'envisager simultanément toutes les variables morphosyntaxiques et positionnelles, en particulier. Ces nouveaux dépouillements nous ont permis de repérer, au milieu de la masse de constituants inégalement marqués par la présence d'un ponctogramme, ceux dont le marquage ou le rejet du marquage avait la plus faible probabilité d'être dû au hasard. Ce qui est ressorti de cette première étape, où les données étaient réduites à une représentation très abstraite, c'est une liste de points forts concernant:
- la différence de fréquence entre le marquage de la phrase et celui des autres propositions;
- la spécificité du marquage d'un certain nombre de types d'arguments;
- le rejet manifeste du marquage du prédicat;
- la faible fréquence de marquage à la suite des relateurs;
- la forte présence de marquage devant les coordonnants.
Nous avons ainsi pu observer que la ponctuation n'était pas obligatoire, mais que sa présence était certainement liée à un contexte syntaxique spécifique.
Ensuite, ces grandes lignes ont pu être inspectées de manière plus concrète: pour chaque tendance qui le justifiait, nous avons évalué la probabilité que l'attraction ou la répulsion observée soit généralisée. Nous avons adopté la position
pragmatique selon laquelle toute tendance suffisamment fréquente pouvait être considérée comme générale si le fait de retirer les chartes qui la manifestaient de manière significative de l'échantillon ne changeait pas significativement la
probabilité d'attraction.
Il en est ressorti que la plupart des tendances observées étaient générales ou trop faiblement illustrées pour être évaluées de ce point de vue.
Par ailleurs, nous avons essayé de mettre en relation la ponctuation avec le contexte immédiat, ce qui nous a laissé observer que beaucoup de constituants étaient davantage, voire exclusivement marqués au contact d'autres constituants attirant également le marquage ou dans un contexte de coordination.
Cet examen détaillé des tendances mises en évidence au chapitre 5 permet en fin de compte de faire le tri parmi les tendances et de repérer celles
qui sont manifestement dues à l'entourage du constituant ou au document dans lequel il est attesté. En observant plus intuitivement les attestations, nous avons également pu repérer, comme nous nous y attendions, un certain nombre de tendances liées à des facteurs étrangers à la morphosyntaxe: la ponctuation de formules spécifiques au type discursif, celle des chiffres ou encore la présence d'un ponctogramme
devant les noms de personnes.
En outre, l'examen du détail des attestations nous a amené à proposer des révisions concernant le modèle d'analyse morphosyntaxique présenté au chapitre 3: 1/ il conviendrait que soient pris en compte les lexèmes
employés; 2/ la notion de la coordination pourrait être étendue à des groupements de constituants que nous n'avons pas considérés comme coordonnés; 3/ il serait peut-être profitable de considérer les coordonnants de la même manière que les autres relateurs. D'autre part, nous avons insisté sur le fait que l'analyse des structures en syntaxe immédiate gagnerait à être moins abstraite.
De cette étude de la fréquence du marquage est ressorti un ensemble
d'environnements propices à la présence de ponctuation.
À ce moment, il nous a été possible de réintroduire les considérations portant sur la _forme_ des ponctogrammes et d'employer l'_Analyse Factorielle des Correspondances_ (AFC) pour décrire les données. Nous avons effectué un tri croisé pour mesurer les associations entre la forme des ponctogrammes et la tendance au
marquage spécifique à la position où se trouvait ce ponctogramme (ce qui
incluait l'absence d'environnement attirant le marquage). Après une analyse exploratoire, nous avons complété notre étude par une série de
tests évaluant la probabilité que les regroupements entre la forme des
ponctogrammes et l'environnement dans lequel on les rencontre soit due au
hasard. Dans la majorité des cas observés, les contrastes mis en évidence par l'AFC correspondaient à des oppositions significatives.
L'étude détaillée de la forme a mené à la conclusion suivante: les ponctogrammes autres que <·> sont plus rares, et leur emploi paraît plus spécifique à un environnement donné. En d'autres termes: non seulement les scribes ne ponctuaient pas n'importe où, mais, en plus, ils n'employaient pas indifféremment les signes.
Les méthodes ne permettant pas de traiter de manière efficace les ponctogrammes peu attestés, nous les avons simplement commentés, laissant de côté les statistiques pour une étude plus philologique. Ces observations ont mené, d'une part, à la critique de la validité de la transcription: 1/ certaines distinctions entre les formes sont
peut-être superflues; 2/ certaines unités peuvent être confondues avec d'autres. D'autre part, la forme des ponctogrammes pose la question de la relation entre les ponctogrammes et le reste du système graphique.
|
2 |
Erreurs aspectuelles chez des polonophones dans l'utilisation de l'imparfait et du passé composé en françaisMuszyńska, Małgorzata 04 1900 (has links)
Mémoire numérisé par la Direction des bibliothèques de l’Université de Montréal / L'objectif premier du présent travail est d'examiner les correspondances aspectuelles entre les systèmes verbaux en polonais et en français. Il s'agit d'analyser les rapports de ressemblance et de différence de deux systèmes au passé afin d'y retrouver certaines analogies sémantiques entre les catégories aspecto-temporelles des deux langues. À cette fin, nous avons expérimenté une tâche de traduction auprès de 40 polonophones ayant atteint au moins un niveau « intermédiaire » de compétence en français. On leur a demandé de juger quels membres de paires de phrases françaises à l'imparfait ou au passé composé constituaient des traductions plus courantes de phrases polonaises à l'imperfectif. Le caractère temporel des phrases est mis en valeur par la présence des quantifieurs adverbiaux. Les résultats obtenus dans notre expérience nous ont permis de procéder à l'analyse des erreurs issues de la traduction du polonais au français. L'analyse des erreurs de traduction suggère que les sujets polonophones n'utilisent pas les adverbiaux pour décider de la traduction française des formes aspectuelles en polonais. En revanche, ils semblent être sensibles notamment à la nature temporelle des verbes. Une telle hypothèse nous amène à croire que le rôle des compléments adverbiaux est traité par les participants comme un phénomène séparé et indépendant de celui des formes verbales. Nous soulignons l'importance de notre étude surtout du point de vue didactique. Ce volet de l'étude nous semble particulièrement intéressant en raison des perspectives pour renseignement et la pratique de la traduction des langues en question.
|
3 |
Création automatique d'un dictionnaire des régimes des verbes du françaisHassert, Naïma 06 1900 (has links)
Les dictionnaires de valence sont utiles dans plusieurs tâches en traitement automatique des langues. Or, les dictionnaires de qualité de ce type sont créés au moins en partie manuellement; ils nécessitent donc beaucoup de ressources et sont difficiles à mettre à jour. De plus, plusieurs de ces ressources ne prennent pas en compte les différents sens des lemmes, qui sont pourtant importants puisque les arguments sélectionnés ont tendance à varier selon le sens du verbe. Dans ce mémoire, nous créons automatiquement un dictionnaire de valence des verbes du français qui tient compte de la polysémie. Nous extrayons 20 000 exemples de phrases pour chacun des 2 000 verbes les plus fréquents du franc¸ais. Nous obtenons ensuite les plongements lexicaux de ces verbes en contexte à l’aide d’un modèle de langue
monolingue et de deux modèles de langue multilingues. Puis, nous utilisons des algorithmes
de regroupement pour induire les différents sens de ces verbes. Enfin, nous analysons automatiquement
les phrases à l’aide de différents analyseurs syntaxiques afin de trouver leurs arguments. Nous déterminons que la combinaison du modèle de langue français CamemBERT et d’un algorithme de regroupement agglomératif offre les meilleurs résultats dans la tâche d’induction de sens (58,19% de F1 B3), et que pour l’analyse syntaxique, Stanza est
l’outil qui a les meilleures performances (83,29% de F1). En filtrant les cadres syntaxiques obtenus à l’aide d’une estimation de la vraisemblance maximale, une méthode statistique très simple qui permet de trouver les paramètres les plus vraisemblables d’un modèle de probabilité qui explique nos données, nous construisons un dictionnaire de valence qui se passe presque complètement d’intervention humaine. Notre procédé est ici utilisé pour le français, mais peut être utilisé pour n’importe quelle autre langue pour laquelle il existe suffisamment de données écrites. / Valency dictionaries are useful for many tasks in automatic language processing. However, quality dictionaries of this type are created at least in part manually; they are therefore resource-intensive and difficult to update. In addition, many of these resources do not take into account the different meanings of lemmas, which are important because the arguments
selected tend to vary according to the meaning of the verb. In this thesis, we automatically create a French verb valency dictionary that takes polysemy into account. We extract 20 000 example sentences for each of the 2 000 most frequent French verbs. We then obtain the lexical embeddings of these verbs in context using a monolingual and two multilingual language models. Then, we use clustering algorithms to induce the different meanings of these verbs. Finally, we automatically parse the sentences using different parsers to find their arguments. We determine that the combination of the French language model CamemBERT and an agglomerative clustering algorithm offers the best results in the sense induction task (58.19% of F1 B3), and that for syntactic parsing, Stanza is the tool with the best performance (83.29%
of F1). By filtering the syntactic frames obtained using maximum likelihood estimation, a very simple statistical method for finding the most likely parameters of a probability model that explains our data, we build a valency dictionary that almost completely dispenses with human intervention. Our procedure is used here for French, but can be used for any other language for which sufficient written data exists.
|
4 |
La diphtongaison et l'apprentissage du registre chanté : étude sociolinguistique de Québécois enregistrés en MauricieBéland, Nancy 12 1900 (has links)
Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. / Une même chanson interprétée par un Québécois et un Français serait-elle semblable sur le plan phonétique? En ce sens, la rencontre entre la musique et la langue impose-t-elle des contraintes telles que l'on ne pourrait retrouver, dans la chanson, de variantes phonétiques comme la diphtongaison? Matte (1982: 142-143) répondrait probablement à cette dernière question par l'affirmative si l'on s'en remet à sa thèse voulant que, en français, la chanson exige le mode tendu (par opposition au mode relâché) et que celui-ci influencerait l'articulation des sons. De là son idée, en particulier, que le Québécois aurait moins tendance à diphtonguer en chantant. Le but de notre mémoire est de mettre à l'épreuve cette thèse de Matte; il nous apparaît en fait évident que chanson et diphtongaison peuvent se marier sans problème en français québécois. Notre première hypothèse (l) stipule donc que la chanson n'exige pas un mode articulatoire empêchant ou réduisant la diphtongaison. Une deuxième hypothèse (2) porte sur le conditionnement plus ou moins grand de la diphtongaison dans la chanson en français québécois; d'après cette hypothèse, la non-diphtongaison dans la chanson est un phénomène culturel et non linguistique, qui résulte d'un apprentissage provenant à la fois d'un enseignement, implicite ou explicite, de la chanson et de la maturation. Les deux sous-hypothèses suivantes découlent donc de cette deuxième hypothèse: (2.1) toutes choses étant égales, les sujets ayant eu un apprentissage de la chanson diphtonguent moins que les autres lorsqu'ils chantent; (2.2) toutes choses étant égales, les sujets plus âgés diphtonguent moins que les autres lorsqu'ils chantent. Afin de vérifier ces hypothèses, une enquête a été réalisée en Mauricie auprès de 78 locuteurs âgés entre 6 et 25 ans. Ces locuteurs avaient à interpréter la chanson Bonne fête à deux reprises, chaque fois avec un prénom différent, soit Audrey, Martin ou Jacques, selon le cas; ce sont les diphtongues en syllabe entravée du /c:/ de jeté et du /a/ de Jacques de même que celles, en syllabe ouverte, du /e/ de Audrey et du /ë/ de Martin qui sont étudiées dans les productions des locuteurs. Ces productions nous permettent, dans un premier temps, d'observer ce qu'il advient des contraintes inhérentes à la rencontre entre la musique et la langue dans la chanson Bonne fête. Sur plus d'un plan, le prénom problématique est Jacques, étant donné qu'il est monosyllabique et que la chanson Bonne fête est mieux adaptée aux prénoms dissyllabiques. Mais la plupart des locuteurs ont su développer des stratégies pour compenser la syllabe laissée en suspens dans Bonne fête Jacqu'. Quant au résultat des diphtongaisons proprement dit, il est clair que la diphtongaison et la chanson ne sont pas incompatibles. De façon générale, les locuteurs diphtonguent dans plus de 80 % des cas en chantant, ce qui n'est pas sans remettre en question la thèse de Matte. Reste à savoir à qui se réfère exactement ce dernier dans ce qu'il avance: au commun des mortels, au chanteur amateur ou au chanteur professionnel? En effet, il y a une importance à déterminer la sorte de chanteur dont on parle: les données du corpus prouvent que les chanteurs amateurs diphtonguent moins lorsqu'ils chantent que les non-initiés. Force est de conclure que c'est l'apprentissage, implicite ou explicite, de la chanson et non pas la maturation qui semble déterminante dans la non-diphtongaison associée au registre chanté.
|
5 |
L'évolution du cadrage journalistique des féminicides intimes au Québec entre 2019 et 2021Chalifour, Anaïs 12 1900 (has links)
Il semble y avoir depuis quelques années une considérable augmentation de l’utilisation du terme féminicide pour désigner les meurtres de femmes par un partenaire intime dans les journaux. Nous cherchons à établir dans la présente étude si cette nouvelle popularité apparente du terme ne constitue qu’une simple mode lexicale ou si elle s’accompagne aussi d’un changement plus profond dans le discours des médias et leur cadrage des nouvelles de meurtres de femmes par leur conjoint au Québec. Pour ce faire, nous analysons le cadrage des nouvelles de féminicides intimes dans la presse québécoise à partir d’un corpus de 71 articles parus entre 2019 et 2021 dans trois quotidiens montréalais, soit La Presse, Le Devoir et Le Journal de Montréal. Il s’agit d’identifier dans les articles les différents éléments contribuant à orienter l’interprétation de la nouvelle en fonction des trois principales composantes du cadrage médiatique définies par les études antérieures faites sur le sujet : le contexte présenté, le langage utilisé et les sources citées. À la lumière de nos résultats, il apparaît absolument indéniable que l’augmentation fulgurante de l’utilisation de féminicide pour désigner les meurtres de femmes par leur partenaire ou ex-partenaire ne constitue pas qu’une tendance linguistique isolée, mais s’inscrit plutôt dans une réelle transformation généralisée de la place et de l’importance accordée aux féminicides intimes dans les médias québécois entre 2019 et 2021. / There appears to be a recent increase in the use of the word feminicide by the press to refer to the murder of women by male intimate partners. We attempted with this present study to establish if this apparent popularity of the term is only a new lexical trend or if it is also accompanied by a more widespread and profound change in the media discourse and their framing of such news. To do so, we analysed the framing of intimate partner femicide news in the Quebec press in 71 articles published between 2019 and 2021 in three Montreal daily newspapers, La Presse, Le Devoir and Le Journal de Montréal. We identified in these articles different elements that contribute to shape the interpretation of the event based on the three main components of news framing according to previous research: the context of the murder, the language used and the sources cited. Our results show without a doubt that the considerable increase in the use of feminicide to refer to the murder of women by male intimate partners is not simply a new linguistic trend but is rather part of a wider and deeper transformation of the place and importance given to intimate partner femicides in the Quebec press between 2019 and 2021.
|
6 |
Identification et relation aux normes de l'espagnol vénézuélien : perceptions de locutrices et de locuteursGraindorge, Alexis 08 1900 (has links)
Ce mémoire situé en sociolinguistique, et plus particulièrement en dialectologie perceptive, prend un intérêt particulier pour les phénomènes de variation, de norme(s) et des attitudes de la communauté vénézuélienne envers les parlers de son pays. Au travers de l’analyse quantitative et qualitative des réponses de 380 locutrices et locuteurs de l’espagnol vénézuélien à un questionnaire sociolinguistique semi-dirigé en ligne, notre objectif final est de répondre à trois questions de recherche : peut-on observer une norme pour l’espagnol vénézuélien ? Peut-on déterminer si un domaine (phonétique, lexical ou grammatical) se prête significativement mieux à l’analyse dialectologique ? Enfin, où peut-on localiser la norme de l’espagnol vénézuélien, et comment peut-on expliquer nos résultats au regard de la littérature ?
Nous commençons donc par nous demander si l’on peut observer une norme pour l’espagnol vénézuélien. En quantifiant et qualifiant les attitudes et les opinions linguistiques, nous trouvons qu’il existe des différences significatives entre nos variables phonétiques-phonologiques, lexicales et morphologiques-syntaxiques qui permettent de les stratifier et de les regrouper par variables plus ou moins favorisées pour l’appartenance à la norme de l’espagnol vénézuélien oral.
Ayant été en mesure de comparer les résultats des trois domaines phonétique-phonologique, lexical et morphologique-syntaxique, nous avons déterminé pour notre deuxième question de recherche que les questions portant sur le lexique (plutôt que sur la prononciation ou la grammaire) généraient plus de réponses que le volet grammatical, et permettaient de conduire des analyses légèrement plus significatives que celles du volet phonétique-phonologique.
Enfin, dans un volet différent du questionnaire, nous souhaitions localiser la norme de l’espagnol vénézuélien dans le pays et comparer ces résultats à ceux de la littérature. Nous concluons que, dans le sens des observations diverses trouvables dans les travaux antérieurs, le Venezuela semble doté d’une norme bicéphale, quoique nos données ne permettent pas de déterminer s’il s’agit des normes des deux aires dialectales auxquelles appartient le Venezuela (la caraïbe et l’andine) ou s’il existe deux normes concurrentes chez l’ensemble de la population. / This thesis in sociolinguistics, and more specifically perceptual dialectology, takes specific interest in the topic of variation; the definition of norm(s); and the attitudes of the Venezuelan community towards the speech of its country. Through quantitative and qualitative analyses of the answers of 380 Venezuelan Spanish speakers to a semi-structured online sociolinguistics questionnaire, our final goal is to answer three research questions: can we observe a norm for Venezuelan Spanish? Can we determine whether the phonetical, lexical or grammatical level yields more statistically significant results when it comes to dialectological analysis? Finally, where can we localise the norm for Venezuelan Spanish, and how can we explain our findings with regard to previous literature?
We begin with addressing whether we can observe a phonetical, lexical, or grammatical norm for Venezuelan Spanish. After collecting and analysing our sample’s opinions both quantitatively and qualitatively, we find it possible to identify significant differences between our phonetical/ phonological, lexical, and morphological/syntactical variables. This finding allows us to group them into stratified groups, from least to most favoured when it comes to belonging to the norm of spoken Venezuelan Spanish.
As for our second research question, once we compared results from all three domains (phonetics/phonology, lexicon, and morphology/syntax), we determined that the questions we asked about vocabulary returned more spontaneous comments than those about grammatical features, and yielded more significant statistical analyses than those about phonetic features.
Finally, with a different section of the questionnaire, we aimed at locating the norm of Venezuelan Spanish within the country and comparing our results with literature. We conclude that, in line with previous studies, Venezuela seems to deal with a bicephalic norm, although our data do not allow us to determine whether we are in the presence of two norms for the two dialectal areas Venezuela is a part of (the Caribbean and the Andean ones), or if there are two competing norms for the whole of the population. / Esta tesina se ubica en sociolingüística, particularmente en dialectología perceptual. Se interesa por los fenómenos de variación, por la(s) norma(s) y por las actitudes de la comunidad venezolana acerca de las hablas de su país. Se basa en el análisis cuantitativo y cualitativo de las respuestas que 380 hablantes del español venezolano nos entregaron a través de un cuestionario sociolingüístico semiestructurado en línea. Proponemos responder a las siguientes tres preguntas: ¿puede observarse una norma para el español venezolano? ¿Puede determinarse si un campo (fonético, lexical o gramatical) produce resultados más significativos para el estudio dialectológico? Y, por último, ¿dónde se puede ubicar la norma del español venezolano, y cómo se pueden explicar nuestros resultados con respecto a la literatura previa?
Empezamos por preguntarnos si se puede observar una norma para el español venezolano. Tras cuantificar y cualificar las actitudes y opiniones lingüísticas, encontramos que sí existen diferencias significativas entre nuestras variables fonético-fonológicas, lexicales y morfológico- sintácticas que permiten estratificarlas y agruparlas según si se ven más o menos favorecidas en cuanto a su pertenencia a la norma del español venezolano oral.
Dado que fuimos capaces de comparar los resultados de los tres campos fonético-fonológico, lexical y morfológico-sintáctico, en el marco de nuestra segunda pregunta de investigación, determinamos que las preguntas acerca del léxico generaban más comentarios espontáneos que las de la sección gramatical, y permitían realizar un análisis levemente más significativo que las de la sección fonética-fonológica.
Finalmente, en una sección diferente del cuestionario, quisimos ubicar la norma del español venezolano en el país y comparar nuestros resultados con la literatura previa. Concluimos que, de acuerdo con las varias observaciones que se encuentran en trabajos anteriores, Venezuela parece contar con una norma bicéfala, aunque nuestros datos no permitieron determinar si se trata de las normas de cada una de las áreas dialectales a las que Venezuela pertenece (la caribe y la andina), o si existen dos normas concurrentes para el conjunto de la población.
|
7 |
Towards an empirical and typological exploration of the sonority of nasal vowelsIbrahim, Bayan 08 1900 (has links)
Ce mémoire est une étude phonologique et phonétique visant à ordonner les voyelles nasales en fonction de leur degré en sonorité. Jusqu'à présent, la sonorité des voyelles nasales n’a pas été abordée dans la littérature phonologique et phonétique; ainsi, cette étude vise à combler cette lacune de la recherche en menant une étude typologique et expérimentale des différentes qualités des voyelles nasales. La première partie du mémoire comprend un examen du comportement et de la distribution des voyelles nasales dans les langues du monde afin d'élucider leur place dans l’échelle de sonorité. La partie typologique montre que, dans trois des langues étudiées, seules les voyelles nasales hautes subissent des processus phonologiques comme l’harmonie nasale et la réduction vocalique tandis que, dans deux des langues étudiées, seule la voyelle nasale basse subit des processus phonologiques comme le changement vocalique déplacement de la voyelle et l’attraction de l’accent. La deuxième partie est une expérience nasométrique dans laquelle l’intensité des voyelles nasales et orales est mesurée. L’analyse d’intensité permet de déterminer le niveau de sonorité de chaque voyelle nasale car l’intensité est considérée comme le corrélat physique le plus saillant de la sonorité. L'analyse statistique descriptive effectuée sur l'ensemble des données des voyelles organisées selon leur hauteur (c'est-à-dire haute, mi-haute, mi-basse ou basse) et leur type (nasal ou oral) montre que [a] est la voyelle orale la plus haute en intensité relatif. Quant aux voyelles nasales, [ĩ] est la plus élevée en intensité. Ainsi, suite à l’analyse statistique inférentielle, nous avons établi une échelle permettant de classer les voyelles orales et nasales en fonction de leur intensité. / This thesis is a phonological and phonetic study to classify nasal vowels according to their rank in sonority. To date, the sonority of nasal vowels has not been covered in the phonology and phonetics literature; thus, this study aims to fill that research gap through conducting a typological and experimental investigation of different qualities of nasal vowels. The first part of this thesis includes an examination of the behaviour and the distribution of nasal vowels in the world’s languages to elucidate the place of nasal vowels in sonority hierarchy. The typological part of this study shows that, in three selected languages, only high nasal vowels undergo phonological processes such as nasal harmony and vowel reduction while, in two other selected languages, only the low nasal vowel undergoes phonological processes like vowel shift and attraction of stress. The second part of this study presents the findings of a nasometric experiment in which the intensity of nasal vowels and oral vowels is measured. Analysing intensity helps to determine the level of sonority of each nasal vowel, because intensity is considered the most salient physical correlate of sonority. The descriptive statistical analysis performed on the data set of vowels organized according to height (i.e., high, mid-high, mid-low, and low) and type (nasal or oral) shows that, [a] is the highest in relative intensity. As for nasal vowels, [ĩ] is the highest in intensity. Thus, according to the inferential statistical analysis, we established a scale that classifies oral and nasal vowels according to their intensity.
|
8 |
Cohérence discursive et implicatures conversationnelles : analyses empiriques et théoriques vers un modèle pragmatique à l'échelle de la conversationMeister, Fiona 08 1900 (has links)
Selon Asher (2013), la cohérence discursive force l’inférence de (1c)
dans les exemples (1a)-(1b), expliquant ainsi l’(in)acceptabilité des exemples.
(1) a. ‘John a un nombre pair d’enfants. Il en a 4.’
b. ‘ ? ?John a un nombre pair d’enfants. Il en a 3.’
c. +> John a n enfants et pas plus
Nous avons tenté de déterminer si les implicatures nécessaires au maintien
de la cohérence discursive sont systématiquement inférées en nous
appuyant sur les théories de la RST et de la SDRT.
Des tests linguistiques et la vérification du respect des contraintes sémantiques
associées aux relations de discours ont mis en évidence deux
catégories d’exemples contenant le quantificateur certains : ceux de type-
RenfNA, dont les implicatures ne sont pas nécessaires à la cohérence et
ceux de typeRenfA dans lesquels elles le sont. Nos tests ayant révélé que le
renforcement est nécessaire dans les exemples de typeRenfA, nous avons
conclu que les implicatures ne sont pas systématiquement inférées.
Nous avons tenté d’apporter une explication à ce phénomène en effectuant
des analyses de la structure discursive de nos exemples et avons
démontré que dans les exemples de typeRenfNA, les relations de discours
visent le constituant π∃ (certains), tandis que dans ceux de typeRenfA,
le constituant π¬∀ (mais pas tous) est visé.
Nos travaux ont démontré que les implicatures scalaires ne sont pas
systématiquement inférées rendant parfois leur renforcement obligatoire.
Nous avons également proposé un modèle à granularité fine prenant en
compte la structure discursive et la pragmatique afin d’expliquer ce phénomène. / According to Asher (2013), discourse coherence forces the inference of
(2c) in examples (2a)-(2b), thus explaining the (in)acceptability of these
examples.
(2) a. ‘John has an even number of children. He has 4.’
b. ‘??John has an even number of children. He has 3.’
c. +> John has n children and not more
We attempted to determine whether the implicatures that are necessary
to maintain discourse coherence are systematically inferred by drawing
on the theories of RST and SDRT.
Through linguistic tests and checking the respect of semantic constraints
associated with discourse relations, we identified two categories
of examples containing the quantifier some: typeRenfNA examples, in
which implicatures are not necessary for discourse coherence, and typeRenfA
examples in which they are. As our tests revealed that reinforcement
is necessary in typeRenfA examples, we concluded that implicatures are
not systematically inferred.
We then attempted to explain this phenomenon. We performed analyses
of the discourse structure of our examples and showed that in typeRenfNA
examples, the discourse relations target the π∃ (some) constituent,
while in typeRenfA examples, the π¬∀ (but not all) constituent
is targeted.
Thus, our work has shown that scalar implicatures are not systematically
inferred, making implicature reinforcement sometimes mandatory.
We also proposed a fine-grained model taking discourse structure and
pragmatics into account to explain this phenomenon.
|
9 |
L’atténuation et l’intensification dans les films de Marvel : une étude comparative des différences de genre dans le langageProvencher, Lysanne 08 1900 (has links)
Ce mémoire présente une étude de langue et genre s’intéressant à l’utilisation des atténuateurs et des intensificateurs par les superhéros de l’univers cinématographique de Marvel. En effet, les films de superhéros ont été largement critiqués pour leur représentation des héroïnes qui sont, malgré leur pouvoir, réduites à leur apparence. Toutefois, une montée en conscientisation du traitement de la femme dans le milieu cinématographique a eu lieu au cours des années 2010. La création d’organismes comme l’Institut Geena Davis, qui vise à promouvoir une représentation plus égalitaire des femmes dans les films, témoigne de ce changement.
Notre étude s’intéresse donc à la production linguistique des femmes dans les films de superhéros et à l’évolution de ce langage au cours des dix dernières années. Pour ce faire, nous suivrons le développement de l’héroïne Black Widow, qui a fait l’objet de nombreuses polémiques concernant l’hypersexualisation des femmes au cinéma. Nous nous sommes concentrée, plus précisément, sur son utilisation des atténuateurs et des intensificateurs, associés à un langage dit « féminin » ou subordonné par la littérature pionnière de langue et genre, comparativement à celle des autres Avengers et sur les changements dans son utilisation à travers le temps. Nous avons trouvé peu de différences considérables avec les personnages masculins, mais nous avons observé une tendance descendante dans son utilisation de ces éléments du langage dit féminin à travers les films. Nous concluons donc que l’utilisation des atténuateurs et des intensificateurs de Black Widow n’est pas nécessairement associée à son genre, mais plutôt au contexte et au développement du personnage. / This thesis presents a study of language and genre, focusing on the use of hedges and intensifiers by superheroes in the Marvel Cinematographic Universe. Indeed, superhero movies have been widely criticized for their representation of heroines who are often reduced to their appearance despite their strength. However, an increase in awareness of the treatment of women by the film industry occurred in the 2010s. The establishment of institutions such as the Geena Davis Institute on Gender in Media, whose purpose is the promotion of an equal representation of women in movies, reflects this change.
Therefore, our study explores the linguistic production of women in superhero movies and the evolution of female language in these movies over the last decade. For this purpose, we will follow the development of the heroine Black Widow, who has been the subject of numerous controversies concerning the hypersexualization of women in cinema. Our primary focus is on her use of hedges and intensifiers, which are typically associated with a language called "feminine" or "subordinated" by the pioneering literature of language and gender, compared to other Avengers and the changes in her use over time. We found little difference between Black Widow and the male characters in their frequency of use of hedges and intensifiers. However, we found a downward tendency in her use of these types of words throughout the movies. Hence, we conclude that Black Widow’s use of hedges and intensifiers is not necessarily associated with her gender, but rather with the context of their use and her character development.
|
10 |
Linguistic processes for content condensation in abstracting scientific textsChuah, Choy-Kim 04 1900 (has links)
Thèse numérisée par la Direction des bibliothèques de l’Université de Montréal / While content selection has been intensively explored in the sentence extraction approach to automatic swnmarization, there is generally little work on the other process of content condensation. To understand this process of condensation, we propose a partial typology based on whether a linguistic unit is replaced, deleted, compressed into fewer essential units, or combined with another unit. Four important categories of condensation processes: generalization, deletion, compression, and aggregation, including their inverse processes, e.g. insertion, and expansion, which were occasionally observed, are proposed. To guide the usage of the same tenu for similar operations, we borrow definitions from linguistics. The type and function of the linguistic units involved are also discussed. We carried out an empirical analysis of 57 author-written abstracts of on-line journal articles in entomology, tracing each abstract sentence back to the plausible source sentences in the corresponding full text. Unlike other studies which focus on the resultant abstract, our study focuses on the processes leading to the production of abstract sentences from corresponding full-text sentences. We do not, however, propose an algorithm for abstracting, or account for all the conditions under which individual condensation operations may apply. While a range of substitutes were used in abstracting, about half of the stems of lexical units in our abstracts share the same stem as their source words, or are their derived forms. Only a small proportion of substitutes were synonyms, and the rest were (quasi-)synonyms, or imprecise equivalents. Authors tend to use less technical forms in abstracts possibly in anticipation of non-specialist abstract readers. Numerical expressions are rendered less precise although no less accurate: absolute numbers and decimals are rounded off, and percentages replaced by ratios or fractions. These observations are consistent with the "new" context of an abstract where only the gist of a document s content need be re-conveyed. Among the linguistic units commonly deleted are metadiscourse phrases, and segments of text (e.g. parenthetical texts, and apposed texts), which provide details and precision in the full text, but are out of place in an abstract. Redundancies inserted for various reasons, or units deemed to be implicit to the comprehension of targeted readers are also often removed. While deletion is an important sub-process of condensation, we observed some instances of adding experimental and other details to compact more information into abstract. The expansion or "unpacking" of compact linguistic units was also observed. The secondary role of inverse processes observed calls for a review of the meaning of condensation from "not giving as much detail or using fewer words" to include the adding of information in order to make a unit of text informatively compact. Among the linguistic units compressed are verbal complexes containing a support verb, or a catenative. Like semantically empty support verbs (e.g. X caused decreases in Y = X reduced Y), some catenatives too may be deleted without significant changes in meaning to the verbal complex (e.g. X was allowed to hatch E-e X hatched). Redundancy in meaning between an adjective and a noun in a noun phrase, e.g. functional role, may be removed, and the phrase compressed to just the stem of the adjective, i.e. function. While not frequently occurring in the corpus studied, the compression of such units may be described by rules, and hence, might be operationalized for automatic abstracting. Aggregation, the combining of units of text within or between sentences, is an important sub-process of condensation. Two-thirds of sentences in abstracts studied were written using multiple sentences, and more sentences were combined without than with the use of an explicit sign, such as a connective, a colon or a semi-colon. If research in summarization is to progress beyond sentence selection, then we must work towards: (a) a clear distinction between operations that are condensation processes, and those that are not; (b) bringing operationally similar processes together under the same designation, and (c) a greater understanding of sub-processes constitutiiig condensation. To this end, our provisional typology for condensation, the range of type of linguistic units involved and their functions sets the first step to advance research into content condensation. We have only just begun to identify the condensation sub-processes in operation during abstracting. The factors that are critical on the interplay of these processes still need to be investigated.
|
Page generated in 0.1264 seconds