1 |
Sûreté, sécurité, insécurité. D'une description lexicologique à une etude du discours de presse : la campagne electorale 2001-2002 dans le quotidien Le Monde / Sûreté (safety), sécurité (security), insécurité (insecurity). From lexicological description to a press discourse study : the French presenditial campaign (2001-2002) in Le MondeNée, Émilie 30 November 2009 (has links)
Nous sommes partie de l’intensification d’emploi du mot insécurité observable pendant la campagne électorale 2001-2002 pour réfléchir sur le rôle des médias en lien avec l’agir politique. Afin d’éclairer l’usage qu’a fait le Monde du mot insécurité, notre étude a d’abord fait le détour d’un travail en langue sur insécurité, sûreté, sécurité comme mots construits et comme noms abstraits. Une première partie en décrit l’origine et la structure morpho-sémantique, le but étant de mettre en évidence des structures abstraites fondamentales dans lesquelles entrent ces mots. Une deuxième partie analyse l’évolution des usages des trois termes, et en particulier leur fonctionnement dans le discours politique, à partir de la base Frantext (du Moyen Âge au XXe siècle). Cette partie insiste sur l’ambivalence de mots comme sécurité-insécurité, qui dénotent un sentiment subjectif ou une réalité objective. La troisième partie travaille sur le Monde en prenant pour entrée l’unité insécurité. Trois outils d’analyse sont privilégiés, l’intensification d’emploi d’insécurité abordée avec les outils de la statistique textuelle, l’étude du consensus qui semble se construire autour du mot jusqu’au premier tour de la campagne, enfin le trajet argumentatif du mot. / Based on the increased proliferation of the word insécurité [insecurity] in press articles during the French presidential campaign in 2001-2002, we question the role of the media in the development of political themes. To explain the use of the word insécurité by the French newspaper Le Monde, we first carry out a linguistic study of the words insécurité (insecurity), sûreté (safety) and sécurité (security) as both construct nouns and abstract nouns. As a first step, we describe the etymology and morpho-semantic structure of these lexical items, in order to highlight the systematic paradigm in which these items are used. As a second step, we review the changes in the way these words are used from the Middle Ages to the twentieth century, with a particular focus on their application in political discourse, using the Frantext database. This part of the analysis centres around the semantic ambivalence of such items as sécurité and i! nsécurité, which can refer as much to a subjective emotion as they can to a concrete objective reality. As a third and final step, we conduct an analysis on the lexical entry insécurité in Le Monde. Three analysis tools are mainly employed : the increased use of the word insécurité, examined with the tools of textual statistics, the study of the consensus around the word that seems to last from the beginning of the campaign until the first ballot, and finally the deployment of the term in persuasive techniques and its “argumentative route”.
|
2 |
構文木からの再帰構造の除去による文圧縮MATSUBARA, Shigeki, KATO, Yoshihide, EGAWA, Seiji, 松原, 茂樹, 加藤, 芳秀, 江川, 誠二 18 July 2008 (has links)
No description available.
|
3 |
Improvement Of Corpus-based Semantic Word Similarity Using Vector Space ModelEsin, Yunus Emre 01 July 2009 (has links) (PDF)
This study presents a new approach for finding semantically similar words from corpora using
window based context methods. Previous studies mainly concentrate on either finding
new combination of distance-weight measurement methods or proposing new context methods.
The main difference of this new approach is that this study reprocesses the outputs of
the existing methods to update the representation of related word vectors used for measuring
semantic distance between words, to improve the results further. Moreover, this novel technique
provides a solution to the data sparseness of vectors which is a common problem in
methods which uses vector space model.
The main advantage of this new approach is that it is applicable to many of the existing word
similarity methods using the vector space model. The other and the most important advantage
of this approach is that it improves the performance of some of these existing word similarity
measuring methods.
|
4 |
Detektor plagiátů textových dokumentů / Text document plagiarism detectorKořínek, Lukáš January 2021 (has links)
This diploma thesis is concerned with research on available methods of plagiarism detection and then with design and implementation of such detector. Primary aim is to detect plagiarism within academic works or theses issued at BUT. The detector uses sophisticated preprocessing algorithms to store documents in its own corpus (document database). Implemented comparison algorithms are designed for parallel execution on graphical processing units and they compare a single subject document against all other documents within the corpus in the shortest time possible, enabling near real-time detection while maintaining acceptable quality of output.
|
5 |
Description du sakao, langue océanienne du nord-est Santo (Vanuatu) : phonologie, morphologie, syntaxe, sémantique et éléments de socio-linguistique / Description of Sakao, an Oceanic language of North-East Santo (Vanuatu) : phonology, morphology, syntax, semantics and elements of sociolinguisticsTouati, Benjamin 12 December 2014 (has links)
Le sakao est une langue océanienne parlée par plus de 1500 personnes, au nord-est de l'île d'Espiritu Santo, au Vanuatu. Cette thèse se fonde sur un travail de terrain de 8 mois au total. Après une présentation détaillée de la situation sociolinguistique de la région, elle décrit en détail la grammaire du sakao, à travers différents aspects : phonologie, morphologie, syntaxe et sémantique. Bien que présentant des traits caractéristiques de sa famille comme une tendance à la multiprédicativité, l'utilisation de séries verbales, ou encore le système de possession, la langue est assez innovante, notamment sur les plans phonologique et morphologique. L'ensemble de la thèse tente également de mettre en évidence les interactions entre structures intonatives et morphosyntaxe. Par ailleurs, cette thèse propose une étude détaillée de différents points, parmi lesquels : un marquage différencié de l'indéfini selon le mode REALIS/IRREALIS ; le système aspectuel et ses interactions avec le mode et l'Aktionsart ; le repérage spatial et la deixis (système à six degrés) ; et les notions de topicalisation, de focalisation, et de cadre discursif. La présente thèse comprend en annexe deux textes extraits du corpus oral, traduits et glosés, ainsi qu'une liste des différences majeures entre le sakao et le nkep, qui peuvent êtreconsidérés comme deux dialectes d'une même langue : le wanohe. / Sakao is an Oceanic language spoken by more than 1500 people in the north-east area of Espiritu Santo Island (Vanuatu, South Pacific). The present thesis is based on a total of eight months' fieldwork. After a thorough description of the sociolinguistic situation in the area, it describes the main phonological, morphological, syntactic and semantic features of Sakao. Sakao presents characteristic features of an Oceanic language (e.g. a tendency toward multipredicativity, the use of serial verbs constructions, the expression of possession, etc.). However, this language is also innovative, especially regarding its phonology and its morphology. The entire thesis also attempts to highlight the interaction between intonation and morphosyntactic structures. The thesis also proposes a precise study of various issues, including the following: differential marking of the indefinite depending on the mood of the sentence; the aspectual system and its interactions with mood and Aktionsart; spatial reference and the six-degree deictic system; and the notions of topicalization, focus, and discourse frame. The appendix presents the transcription of two narratives from our oral corpus (together with their glosses and French translations), as well as a list of the main differences between Sakao and Nkep, considered here as two dialects of a same language: Wanohe.
|
6 |
Synthèse de parole expressive au delà du niveau de la phrase : le cas du conte pour enfant : conception et analyse de corpus de contes pour la synthèse de parole expressive / Expressive speech synthesis beyond the level of the sentence : the children tale usecase : tale corpora design and analysis for expressive speech synthesisDoukhan, David 20 September 2013 (has links)
L'objectif de la thèse est de proposer des méthodes permettant d'améliorer l'expressivité des systèmes de synthèse de la parole. Une des propositions centrales de ce travail est de définir, utiliser et mesurer l'impact de structures linguistiques opérant au delà du niveau de la phrase, par opposition aux approches opérant sur des phrases isolées de leur contexte. Le cadre de l'étude est restreint au cas de la lecture de contes pour enfants. Les contes ont la particularité d'avoir été l'objet d'un certain nombre d'études visant à en dégager une structure narrative et de faire intervenir une certain nombre de stéréotypes de personnages (héros, méchant, fée) dont le discours est souvent rapporté. Ces caractéristiques particulières sont exploitées pour modéliser les propriétés prosodiques des contes au delà du niveau de la phrase. La transmission orale des contes a souvent été associée à une pratique musicale (chants, instruments) et leur lecture reste associée à des propriétés mélodiques très riches, dont la reproduction reste un défi pour les synthétiseurs de parole modernes. Pour répondre à ces problématiques, un premier corpus de contes écrits est collecté et annoté avec des informations relatives à la structure narrative des contes, l'identification et l'attribution des citations directes, le référencement des mentions des personnages ainsi que des entités nommées et des énumérations étendues. Le corpus analysé est décrit en terme de couverture et d'accord inter-annotateurs. Il est utilisé pour modéliser des systèmes de segmentation des contes en épisode, de détection des citations directes, des actes de dialogue et des modes de communication. Un deuxième corpus de contes lus par un locuteur professionnel est présenté. La parole est alignée avec les transcriptions lexicale et phonétique, les annotations du corpus texte et des méta-informations décrivant les caractéristiques des personnages intervenant dans le conte. Les relations entre les annotations linguistiques et les propriétés prosodiques observées dans le corpus de parole sont décrites et modélisées. Finalement, un prototype de contrôle des paramètres expressifs du synthétiseur par sélection d'unités Acapela est réalisé. Le prototype génère des instructions prosodiques opérant au delà du niveau de la phrase, notamment en utilisant les informations liées à la structure du conte et à la distinction entre discours direct et discours rapporté. La validation du prototype de contrôle est réalisée dans le cadre d'une expérience perceptive, qui montre une amélioration significative de la qualité de la synthèse. / The aim of this thesis is to propose ways to improve the expressiveness of speech synthesis systems. One of the central propositions of this work is to define, use and measure the impact of linguistic structures operating beyond the sentence level, as opposed to approaches operating on sentences out of their context. The scope of the study is restricted to the case of storytelling for children. The stories have the distinction of having been the subject of a number of studies in order to highlight a narrative structure and involve a number of stereotypical characters (hero, villain, fairy) whose speech is often reported. These special features are used to model the prosodic properties tales beyond the sentence level. The oral transmission of tales was often associated with musical practice (vocals, instruments) and their reading is associated with rich melodic properties including reproduction remains a challenge for modern speech synthesizers. To address these issues, a first corpus of written tales is collected and annotated with information about the narrative structure of stories, identification and allocation of direct quotations, referencing references to characters as well as named entities and enumerations areas. The corpus analyzed is described in terms of coverage and inter-annotator agreement. It is used to model systems segmentation tales episode, detection of direct quotes, dialogue acts and modes of communication. A second corpus of stories read by a professional speaker is presented. The word is aligned with the lexical and phonetic transcriptions, annotations of the corpus text and meta-information describing the characteristics of the characters involved in the story. The relationship between linguistic annotations and prosodic properties observed in the speech corpus are described and modeled. Finally, a prototype control expressive synthesizer parameters by Acapela unit selection is made. The prototype generates prosodic operating instructions beyond the sentence level, including using the information related to the structure of the story and the distinction between direct speech and reported speech. Prototype validation control is performed through a perceptual experience, which shows a significant improvement in the quality of the synthesis.
|
Page generated in 0.3826 seconds