211 |
Improving Topic Tracking with Domain ChainingYang, Li 08 1900 (has links)
Topic Detection and Tracking (TDT) research has produced some successful statistical tracking systems. While lexical chaining, a non-statistical approach, has also been applied to the task of tracking by Carthy and Stokes for the 2001 TDT evaluation, an efficient tracking system based on this technology has yet to be developed. In thesis we investigate two new techniques which can improve Carthy's original design. First, at the core of our system is a semantic domain chainer. This chainer relies not only on the WordNet database for semantic relationships but also on Magnini's semantic domain database, which is an extension of WordNet. The domain-chaining algorithm is a linear algorithm. Second, to handle proper nouns, we gather all of the ones that occur in a news story together in a chain reserved for proper nouns. In this thesis we also discuss the linguistic limitations of lexical chainers to represent textual meaning.
|
212 |
Dire la Chine en français : ses représentations dans des dictionnaires et encyclopédies (1627-1877) / Titre en anglais non renseignéYan, Xiaolei 01 February 2018 (has links)
L’histoire culturelle des dictionnaires a frayé un nouveau terrain de recherche des études des représentations. La rétroaction du sens figuré du mot chinois nous a dirigé vers ce présent travail visant aux représentations de la Chine dans les dictionnaires français. Avec l’histoire culturelle des dictionnaires comme cadre théorique principal, nos études se sont appliqués aux neuf dictionnaires dont les dates de publication couvrent une période de 250 ans. À travers les observations et les analyses sur la formation, le changement et la transmission des représentations de la Chine, nous avons découvert des influences complexes des multiples facteurs concernant les dictionnaires sur les représentations, et l’effet non négligeable au fil du temps des dictionnaires sur la formation des stéréotypes concernant la Chine dans la langue française. / The cultural history study of dictionaries has opened a new field for the research of representations. A retrospection of the extended meaning of the french word “chinois” led us to the present work about representations of China in french dictionaries. With the cultural history of dictionaries as the main theoretical framework, we have studied nine dictionaries whose publication dates cover 250 years. Through observations and analyzes on the formation, the change and the transmission of representations of China, we have uncovered complex influences of multiple factors about the dictionaries on representations, and the significant effect over time of dictionaries on the formation of stereotypes concerning China in the french language.
|
213 |
Réflexion préliminaire à la réalisation d'un dictionnaire du dialecte niçois / Preliminary thought on the compilation of a dictionary of the niçois dialectDel Giudice, Philippe 09 December 2017 (has links)
Que serait un bon dictionnaire du dialecte occitan de Nice ? Afin de répondre à cette question, la Réflexion préliminaire articule un propos théorique de nature métalexicographique et linguistique avec une étude ciblée du champ d’application dialectal. Sur le plan théorique, le modèle général d’élaboration et d’analyse des outils lexicographiques que l’on propose est couplé à une étude de la problématique dialectale. Un retour sur les aspects fondamentaux de la linguistique du signe complète le tout. Il montre que le dictionnaire – dialectal en particulier – gagne à adopter le point de vue de la sémantique motivation¬nelle, selon laquelle le caractère essentiellement arbitraire des unités lexi¬cales doit être réfuté. Conformément à la méthode fondamentale suggérée dans la mise au point théorique, le développe¬ment s’intéresse en détail au contexte lexicographique puis aux configurations linguistique et socio¬linguistique du dialecte niçois. L’analyse historico-critique insiste sur la diversité des dictionnaires occitans et sur les limites d’une lexicographie d’oc qui, depuis la fin de son âge d’or (de 1840 au début du XXe siècle) a cessé de développer des méthodes innovantes. Ce panorama lexicographique débouche sur l’inventaire de nou¬veaux besoins. L’étude (socio)linguistique qui le suit s’attache à définir l’espace dialectal niçois, à présenter les modalités de la variation et à circonscrire l’état de langue actuel. Elle aboutit à une proposition de structuration des données protéiformes qui repose sur la désignation (et sur l’élaboration) d’une variété référentielle. L’échantillon du Dictionnaire variationnel du niçois constitue le point d’orgue de la réflexion. / What would characterize a good dictionary of Nice’s Occitan dialect? To answer this question, this PhD dissertation links a theoretical approach of a metalexicographical and linguistic nature with a targeted study of the specific dialectal field of application. On the theoretical level, the thesis proposes a general model for the development and analysis of lexicographical tools that is coupled with a study of the dialectal problematic. A return to the basic aspects of the linguistic sign completes the whole and shows that a dictionary – especially a dialectal one – benefits greatly from the adoption of the motivational semantics point of view, according to which the arbitrary character of lexical units must be refuted. Following the basic method suggested in the theoretical section, the development also examines the lexicographical context and then studies in detail the linguistic and sociolinguistic configurations of the Niçois dialect. The historico-critical analysis insists on the diversity of Occitan dictionaries and on the limits of an Occitan lexicography which, since the end of its golden age (from 1840 to the beginning of the 20th century) has ceased to develop innovative methods. This lexicographical panorama leads to an inventory of new needs. The (socio-)linguistic study which follows sets out to define the dialectal space of Niçois, to present the modalities of variation and to circumscribe the current state of the language. It concludes with a proposal for the structuring of protean data based on the designation (and on the elaboration) of a referential variety. A sample of the Variational Dictionary of Niçois is the culmination of the study.
|
214 |
Česká přísloví a jejich německé ekvivalenty. Lexikografická analýza SČFL / Czech proverbs and their German equivalents. A lexicographic analysis of the SČFLKodadová, Ludmila January 2020 (has links)
This diploma thesis is focused on the analysis of German language equivalents of Czech proverbs in the dictionary of František Čermák Dictionary of Czech Phraseology and Idiomatics 4 (DCPI 4). The introductory part of the thesis characterizes proverbs as a phraseological unit and reflects the current state of Czech and German paremiography on the basis of selected dictionaries. Another theoretical starting point is the issue of equivalence, which in contrastive phraseology or, more precisely, paremiology plays an important role. The analytical part contains of multi-level analysis of German language equivalents of the Czech paremiological minimum in DPCI 4. Equivalents were verified using Hugo Siebenschein's Great Czech-German Dictionary, Duden 11, Hans Schemann's German Idiomatics, the corpuses InterCorp and DeReKo and the Google full-text search engine. The aim of this thesis is to evaluate the current state of German-language equivalents in DCPI 4 and offer possible suggestions for improvement. The chosen approach is therefore not only contemplative, but also constructive. Keywords lexikology, phraseology, paremiology, lexicography, phraseography, Corpus Linguistics, equivalence
|
215 |
Lexikografické zpracování zájmen / Lexicographical treatment of pronounsKroutilová, Kamila January 2019 (has links)
The present thesis is based on lexicographic processing of pronouns for the Large German- Czech Academic Dictionary (VNČAS). Its aim is to identify processing problems in selected dictionaries in the area of pronouns. Based on the dictionary entries proposed for VNČAS will be demonstrated a possible solution to these problems. The identified problems relate to the following areas: grammar in the dictionary, selection of example sentences, dictionary criminality, and user-friendliness of the dictionary. Key Words: lexicography, pronouns, contemporary German, corpus linguistics, grammar
|
216 |
Swahili Lexikographie:: Eine kritische BilanzHerms, Irmtraud January 1995 (has links)
Für das Swahili liegt eine Menge zweisprachiger Worterbucher mit der Ausgangssprache Swahili vor, weniger in umgekehrter Richtung. Die ersten bedeutenden lexikographischen Arbeiten wurden von Missionar L. Krapf seit der Mitte des 19 Jahrhunderts vor allem in Mombasa durchgeführt. 1982 erschien sein Dicitonary of the Swahili Language. Inzwischen gibt es Wörterbucher mit den Zielsprachen Englisch, Deutsch, F ranzosisch, Russisch, Schwedisch, ltalienisch, Polnisch, Tschechisch, Gujerati, Japanisch, Arabisch und anderen.
|
217 |
Création automatique d'un dictionnaire des régimes des verbes du françaisHassert, Naïma 06 1900 (has links)
Les dictionnaires de valence sont utiles dans plusieurs tâches en traitement automatique des langues. Or, les dictionnaires de qualité de ce type sont créés au moins en partie manuellement; ils nécessitent donc beaucoup de ressources et sont difficiles à mettre à jour. De plus, plusieurs de ces ressources ne prennent pas en compte les différents sens des lemmes, qui sont pourtant importants puisque les arguments sélectionnés ont tendance à varier selon le sens du verbe. Dans ce mémoire, nous créons automatiquement un dictionnaire de valence des verbes du français qui tient compte de la polysémie. Nous extrayons 20 000 exemples de phrases pour chacun des 2 000 verbes les plus fréquents du franc¸ais. Nous obtenons ensuite les plongements lexicaux de ces verbes en contexte à l’aide d’un modèle de langue
monolingue et de deux modèles de langue multilingues. Puis, nous utilisons des algorithmes
de regroupement pour induire les différents sens de ces verbes. Enfin, nous analysons automatiquement
les phrases à l’aide de différents analyseurs syntaxiques afin de trouver leurs arguments. Nous déterminons que la combinaison du modèle de langue français CamemBERT et d’un algorithme de regroupement agglomératif offre les meilleurs résultats dans la tâche d’induction de sens (58,19% de F1 B3), et que pour l’analyse syntaxique, Stanza est
l’outil qui a les meilleures performances (83,29% de F1). En filtrant les cadres syntaxiques obtenus à l’aide d’une estimation de la vraisemblance maximale, une méthode statistique très simple qui permet de trouver les paramètres les plus vraisemblables d’un modèle de probabilité qui explique nos données, nous construisons un dictionnaire de valence qui se passe presque complètement d’intervention humaine. Notre procédé est ici utilisé pour le français, mais peut être utilisé pour n’importe quelle autre langue pour laquelle il existe suffisamment de données écrites. / Valency dictionaries are useful for many tasks in automatic language processing. However, quality dictionaries of this type are created at least in part manually; they are therefore resource-intensive and difficult to update. In addition, many of these resources do not take into account the different meanings of lemmas, which are important because the arguments
selected tend to vary according to the meaning of the verb. In this thesis, we automatically create a French verb valency dictionary that takes polysemy into account. We extract 20 000 example sentences for each of the 2 000 most frequent French verbs. We then obtain the lexical embeddings of these verbs in context using a monolingual and two multilingual language models. Then, we use clustering algorithms to induce the different meanings of these verbs. Finally, we automatically parse the sentences using different parsers to find their arguments. We determine that the combination of the French language model CamemBERT and an agglomerative clustering algorithm offers the best results in the sense induction task (58.19% of F1 B3), and that for syntactic parsing, Stanza is the tool with the best performance (83.29%
of F1). By filtering the syntactic frames obtained using maximum likelihood estimation, a very simple statistical method for finding the most likely parameters of a probability model that explains our data, we build a valency dictionary that almost completely dispenses with human intervention. Our procedure is used here for French, but can be used for any other language for which sufficient written data exists.
|
218 |
A critical evaluation of bilingual Chinese/English dictionaries for elementary and intermediate Mandarin learners at Stellenbosch UniversityWang, Mei 03 1900 (has links)
Thesis (MPhil)--Stellenbosch University, 2012. / ENGLISH ABSTRACT: The number of Chinese-learners in South Africa has increased rapidly in recent
years, but the quality of the dictionaries that are available for their use has not
improved much. The more students study Chinese, the more it becomes necessary to
create suitable dictionaries to facilitate their studies. In the hope of meeting this need,
this study selects two written dictionaries commonly used by students at Stellenbosch
University in South Africa, namely the Oxford Beginner's Chinese Dictionary and the
Concise English-Chinese Chinese-English Dictionary, to analyze, comment on and
compare in terms of structure and equivalence. Using the results of this analysis, this
study offers suggestions for improving the quality of future Mandarin learner’s
dictionaries.
This study takes into consideration the situation faced by students when learning
Chinese abroad, especially in South Africa, the development of pedagogical
lexicography in Chinese-learner’s dictionaries in China and abroad, the relationship
between online dictionaries and written dictionaries, and some special characteristics
of the Chinese language, all of which factors greatly influence the making of a
dictionary.
Theoretically and methodically, this study is based on Function Theory as
presented by Sven Tarp. According to Function Theory, before writing a dictionary,
lexicographers must analyze specific types of users in specific types of situations.
This study attempts to follow Tarp’s suggestion by analyzing a small group of
dictionary users with the help of a survey conducted by the author in an attempt to get
a general idea of how Mandarin learners at Stellenbosch University use dictionaries. The main focus of this study is the frame structure, microstructure,
macrostructure and dictionary equivalence in two dictionaries--Concise and
Beginner’s. After carefully analyzing these aspects of the dictionaries, the author
identifies the sections of these dictionaries which successfully present information in
a way that will be most beneficial for their intended audiences. The study goes on to pinpoint less-successful sections of the two dictionaries and provides suggestions for
improvement. In sum, this study focuses on using the principle of Function Theory to
determine what features should be included in Mandarin learner’s dictionaries to make
them more suitable for elementary and intermediate learners of Mandarin at
Stellenbosch University, in South Africa, and, by extension, in other parts of the world. / AFRIKAANSE OPSOMMING: Die afgelope paar jaar het die aantal studente van Sjinees in Suid-Afrika aansienlik
toegeneem, maar die standaard van beskikbare woordeboeke het nie veel verbeter nie.
Hoe meer studente Sjinees bestudeer hoe noodsaakliker is dit om gepaste
woordeboeke te ontwikkel om hulle in hulle studie te help. Om aan hierdie behoefte te
voldoen, kies hierdie studie twee woordeboeke wat gereeld deur studente aan die
Universiteit van Stellenbosch benut word, naamlik die Oxford Beginner’s Chinese
Dictionary en die Concise English-Chinese Chinese-English Dictionary, om hulle te
ontleed, kommentaar te lewer en hulle met mekaar in terme van struktuur en
ekwivalensie te vergelyk. Met behulp van gevolgtrekkings uit hierdie ontleding word
voorstelle gemaak oor hoe om die standaard van toekomstige woordeboeke te
verbeter.
Die studie neem die situasie in ag waarmee studente wat in die buiteland Sjinees
studeer, veral in Suid Afrika, te doen kry, die ontwikkeling van pedagogiese
leksikografie in woordeboeke in Sjina sowel as die buiteland, die verhouding tussen
aanlynwoordeboeke en gedrukte woordeboeke en sekere spesiale eienskappe van die
Sjinese taal - alles faktore wat die opstel van woordeboeke beïnvloed.
Teoreties en metodologies is hierdie studie op die funksieteorie, soos aangebied deur
Sven Tarp, gebaseer. Volgens die funksieteorie moet leksikograwe voor die opstel van
'n woordeboek spesifieke tipes gebruikers in spesifieke situasies analiseer. Hierdie
studie poog om Tarp se voorstelle te volg deur 'n klein groep woordeboekgebruikers,
met behulp van 'n ondersoek, uitgevoer deur die outeur, te analiseer om sodoende 'n
algemene idee te formuleer van hoe Mandarynse studente aan die Universiteit van Stellenbosch woordeboeke benut.
Die hooffokus van hierdie studie is die raamwerk, mikrostruktuur, makrostruktuur en
ekwivalensie in die twee gekose woordeboeke – Concise en Beginner’s. Nadat hierdie
aspekte van die woordeboeke noukeurig ontleed is, identifiseer die outeur die dele wat
inligting op die voordeligste manier vir die bestemde gebruiker aanbied. Ook
identifiseer hierdie studie die minder suksesvolle dele en stel moontlike verbeteringe
voor. Samevattend fokus hierdie studie daarop om die beginsel van die funksieteorie te
benut deur vas te stel watter eienskappe in woordeboeke ingesluit moet word om hulle
meer geskik te maak vir elementêre en intermediêre Mandarynse studente aan die
Universiteit van Stellenbosch in Suid-Afrika, sowel as in ander dele van die wêreld.
|
219 |
Morfemizacija krnjih leksičkih osnova u engleskom jeziku:leksikološki i leksikografski aspekti / Morphemization of truncated lexical bases in present-day English:lexicological and lexicographic aspectsLalić-Krstin Gordana 15 September 2016 (has links)
<p>Ova disertacija se bavi procesom<br /> morfemizacije krnjih osnova koje su nastale<br />od leksičkihslivenica. Rekurzivinim<br />slivanjem s različitim inicijalnim elementima,<br />ove osnove se konsoliduju u svom skraćenom<br />obliku ili oblicima, što za rezultat ima<br />separaciju novih tvorbenih jedinica. Najbitniji<br />ciljevi istraživanja su sledeći: da se utvrdi<br />teorijski i terminološki status ovih elementa i<br />odrede kriterijumi za njihovo članstvo u ovoj<br />kategoriji; da se na osnovu tih kriterijuma<br />napravi popis morfemizovanih elemenata uz<br />razvoj metodologije potrebne za njihovu<br />ekscerpciju; da se sačini spisak leksema u<br />kojima se javljaju; da se ustanove formalne<br />varijacije i njihova relativna učestalost kao i<br />tipovi i oblici inicijalnih elementa sa kojima<br />se kombinuju, što bi za rezultat imalo<br />formulisanje prototipskog tvorbenog modela;<br />da istraži značenje ovih elemenata, eventualni<br />razvoj novih semema i smisaonih odnosa; da<br />dâ pregled njihove zastupljenosti u<br />postojećim rečnicima; da predloži model<br />njihove leksikografske obrada i da se na<br />osnovu tog predloga sačini rečnik kako<br />morfemizovanih krnjih osnova, tako i reči u<br />kojima se javljaju.</p> / <p>This dissertation investigates the process of<br />AB morphemization of truncated bases which<br />have originated from lexical blends. Through<br />their recurrent blending with various initial<br />elements, they become consolidated in their<br />truncated form or forms, resulting in the<br />secretion of new word-formational units. The<br />most important goals of the research are the<br />following: to determine the theoretical and<br />terminological status of these elements and<br />establish the criteria for category<br />membership; to compile a list of<br />morphemized elements based on these<br />criteria by developing the methodology for<br />their extraction; to compile a list of lexemes<br />containing these newly morphemized<br />elements; to determine formal variations and<br />their relative frequency as well as the types<br />and forms of initial elements with which they<br />combine, resulting in theformulation of the<br />prototypical word-formation pattern; to<br />investigate the meaning of these elements and<br />the development of new senses and sense<br />relations; to give an overview of their<br />representation in existing dictionaries; to<br />propose a model for their lexicographic<br />treatment and to apply that model in the<br />compilation of a specialized dictionary of<br />morphemized truncated bases and words in<br />which they appear.</p>
|
220 |
Dictionnaires bilingues et pédagogie de la lecture : vers un dictionnaire français-portugais d'appui à la compréhension écrite et à l'apprentissage du vocabulaire en français langue étrangère. / Bilingual dictionaries and pedagogy of reading : towards a French-Portuguese dictionary to support written comprehension and lexical acquisition in French as for foreign languageLoguercio, Sandra Dias 18 April 2013 (has links)
Cette étude s’appuie sur l’enseignement de la lecture-compréhension en français pour un public universitaire débutant en FLE au Brésil. Après avoir fait le point sur cette approche didactique et les enjeux de l’enseignement-apprentissage de la lecture en langue étrangère, dans lequel l’acquisition lexicale joue un rôle important, nous rappelons des notions-clés de la lexicologie et de la sémantique lexicale et présentons le cadre des travaux développés en lexicographie pédagogique, où nous situons plus précisément notre travail. En effet, malgré la diffusion de cet enseignement parmi les étudiants en Amérique latine et sa constante réélaboration afin de rendre compte de nouvelles situations d’apprentissage, il présente des lacunes importantes. Ces lacunes se trouvent autour d’un point névralgique pour une grande partie des lecteurs : le déficit lexical. Un déficit qui n’est pas lié qu’à un simple manque de vocabulaire, mais qui passe aussi par un savoir-apprendre les mots. Cette situation est mise à l’épreuve dans cette thèse par deux recherches expérimentales. Une première recherche à caractère plutôt prospectif vise à repérer le rôle du dictionnaire, et particulièrement du dictionnaire bilingue lors de la lecture et l’effet de son usage sur la construction du sens. Une deuxième recherche met en rapport l’emploi de deux outils lexicographiques, un dictionnaire bilingue et un dictionnaire pédagogique destiné à des apprenants de FLE. Ces recherches nous donnent des pistes essentielles pour l’intégration de l’étude lexicale à ce genre d’enseignement et sont complétées par l’analyse des dictionnaires disponibles pour ce public particulier. Ce parcours nous aide à tracer les principes méthodologiques pour l’élaboration d’un dictionnaire pédagogique d’appui à la lecture et à l’acquisition lexicale fondés sur la lexicographie fonctionnelle. / This study is based on the teaching model of reading French as a foreign language by university students who are beginners in this language in Brazil. After presenting the essential topics of this didactic approach and the issues related to the teaching-learning process when reading in a foreign language, in which the lexical acquisition plays a major role, we present the basics of lexicology and lexical semantics, and finally we portray the works developed in pedagogical lexicography, in which we place this study. Regardless of its dissemination among Latin America students and of its continuous reformulation to account for new learning situations, this teaching method contains some gaps. The gaps refer to a critical issue for a large number of readers: the lack of lexical knowledge. This issue relates not only to a lack of vocabulary knowledge, but also to the ability of word learning. In this study, this question has been further studied based on two experimental researches. The first one, using a more prospective approach, aims at identifying the role of the dictionary–especially bilingual dictionaries–in the reading process and the effects of dictionary use in the construction of meaning. The second one compares the use of two lexicographic instruments: a bilingual dictionary and a pedagogical dictionary for learners of French as a foreign language. Both researches yield important information about the integration of a lexical study with this teaching model; additionally, they are complemented by the analysis of the dictionaries available to this target audience. In this way, we can set methodological principles to build a pedagogical dictionary that helps students in reading activities and that supports vocabulary acquisition on the basis of functional lexicography.
|
Page generated in 0.3591 seconds