Spelling suggestions: "subject:"syntaxique"" "subject:"syntaxiques""
21 |
Analyse syntaxique à l'aide des tables du Lexique-Grammaire du françaisTolone, Elsa 31 March 2011 (has links) (PDF)
Les tables du Lexique-Grammaire, dont le développement a été initié par Gross (1975), constituent un lexique syntaxique très riche pour le français. Elles couvrent diverses catégories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de données linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplète et manque de cohérence. Chaque table regroupe un certain nombre d'entrées jugées similaires car elles acceptent des propriétés communes. Ces propriétés ont pour particularité de ne pas être codées dans les tables mêmes mais uniquement décrites dans la littérature. Pour rendre ces tables exploitables, il faut expliciter les propriétés intervenant dans chacune d'entre elles. De plus, un grand nombre de ces propriétés doivent être renommées dans un souci de cohérence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problèmes rencontrés et les méthodes adoptées pour permettre leur intégration dans un analyseur syntaxique. Nous proposons LGExtract, un outil générique pour générer un lexique syntaxique pour le TAL à partir des tables du Lexique-Grammaire. Il est relié à une table globale dans laquelle nous avons ajouté les propriétés manquantes et un unique script d'extraction incluant toutes les opérations liées à chaque propriété devant être effectuées pour toutes les tables. Nous présentons également LGLex, le nouveau lexique syntaxique généré des verbes, des noms prédicatifs, des expressions figées et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms prédicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff (Lexique des Formes Fléchies du Français) (Sagot, 2010), un lexique morphologique et syntaxique à large couverture et librement disponible pour le français. Ceci permet son intégration dans l'analyseur syntaxique FRMG (French MetaGrammar) (Thomasset et de La Clergerie, 2005), un analyseur profond à large couverture pour le français, basé sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette étape de conversion consiste à extraire l'information syntaxique codée dans les tables du Lexique-Grammaire. Nous présentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous évaluons l'analyseur syntaxique FRMG sur le corpus de référence de la campagne d'évaluation d'analyseur du français Passage (Produire des Annotations Syntaxiques à Grande Échelle) (Hamon et al., 2008), en comparant sa version basée sur le Lefff avec notre version reposant sur les tables du Lexique-Grammaire converties.
|
22 |
Outils et ressources linguistiques pour l'alignement de textes multilingues français-vietnamiensNguyen, Thi Minh Huyen 10 October 2006 (has links) (PDF)
Le travail présenté dans ce mémoire porte sur la construction des outils et ressources linguistiques pour les tâches fondamentales de traitement automatique de la langue vietnamienne, dans un contexte monolingue ainsi que multilingue. Nous présentons pour cette langue encore peu étudiée des solutions possibles aux problèmes d'annotation morpho-syntaxique (définition de descripteurs lexicaux « de référence », construction d'un lexique avec ces descriptions, des outils de segmentation et d'étiquetage lexical), d'analyse syntaxique (première tentative de modélisation de la grammaire vietnamienne en employant le formalisme TAG, cadre de construction de ressources pour l'analyse syntaxique) et d'alignement multilingue (constitution d'un corpus multilingue, développement d'un système d'alignement multilingue). Afin d'assurer la réutilisabilité des travaux réalisés, et dans l'espoir de les voir stimuler le développement du TAL au Vietnam, nous avons apporté une attention particulière aux questions de normalisation de la gestion des ressources linguistiques.
|
23 |
Leveraging MWEs in practical TAG parsing : towards the best of the two worlds / Optimisation d'analyse syntaxique basée sur les grammaires d'arbres adjoints grâce à la modélisation d'expression polylexicales et à l'algorithme AWaszczuk, Jakub 26 June 2017 (has links)
Dans ce mémoire, nous nous penchons sur les expressions polylexicales (EP) et leurs relations avec l’analyse syntaxique, la tâche qui consiste à déterminer les relations syntaxiques entre les mots dans une phrase donnée. Le défi que posent les EP dans ce contexte, par rapport aux expressions linguistiques régulières, provient de leurs propriétés parfois inattendues qui les rendent difficiles à gérer dans te traitement automatique des langues. Dans nos travaux, nous montrons qu’il est pourtant possible de profiter de ce cette caractéristique des EP afin d’améliorer les résultats d’analyse syntaxique. Notamment, avec les grammaires d’arbres adjoints (TAGs), qui fournissent un cadre naturel et puissant pour la modélisation des EP, ainsi qu’avec des stratégies de recherche basées sur l’algorithme A* , il est possible d’obtenir des gains importants au niveau de la vitesse sans pour autant détériorer la qualité de l’analyse syntaxique. Cela contraste avec des méthodes purement statistiques qui, malgré l’efficacité, ne fournissent pas de solutions satisfaisantes en ce qui concerne les EP. Nous proposons un analyseur syntaxique novateur qui combine les grammaires TAG avec La technique A*, axé sur la prédiction des EP, dont les fonctionnalités permettent des applications à grande échelle, facilement extensible au contexte probabiliste. / In this thesis, we focus on multiword expressions (MWEs) and their relationships with syntactic parsing. The latter task consists in retrieving the syntactic relations holding between the words in a given sentence. The challenge of MWEs in this respect is that, in contrast to regular linguistic expressions, they exhibit various irregular properties which make them harder to deal with in natural language processing. In our work, we show that the challenge of the MWE-related irregularities can be turned into an advantage in practical symbolic parsing. Namely, with tree adjoining grammars (TAGs), which provide first-cLass support for MWEs, and A* search strategies, considerable speed-up gains can be achieved by promoting MWE-based analyses with virtually no loss in syntactic parsing accuracy. This is in contrast to purely statistical state-of-the-art parsers, which, despite efficiency, provide no satisfactory support for MWEs. We contribute a TAG-A* -MWE-aware parsing architecture with facilities (grammar compression and feature structures) enabling real-world applications, easily extensible to a probabilistic framework.
|
24 |
Colocações do português brasileiro: tipologia, categorização e construção de uma base de dadosLopes, Julianne Larens January 2016 (has links)
LOPES, Julianne Larens. Colocações do português brasileiro: categorização, tipologia e construção de base de dados. 2016. 157f. - Tese (Doutorado) – Universidade Federal do Ceará, Programa de Pós-Graduação em Linguística, Fortaleza (CE), 2016. / Submitted by Gustavo Daher (gdaherufc@hotmail.com) on 2017-01-18T11:54:18Z
No. of bitstreams: 1
2016_tese_jllopes.pdf: 2817705 bytes, checksum: e031e83eca2e075b98d76b55cdb1ef38 (MD5) / Approved for entry into archive by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2017-01-25T14:36:42Z (GMT) No. of bitstreams: 1
2016_tese_jllopes.pdf: 2817705 bytes, checksum: e031e83eca2e075b98d76b55cdb1ef38 (MD5) / Made available in DSpace on 2017-01-25T14:36:42Z (GMT). No. of bitstreams: 1
2016_tese_jllopes.pdf: 2817705 bytes, checksum: e031e83eca2e075b98d76b55cdb1ef38 (MD5)
Previous issue date: 2016 / O presente trabalho tem por fito maior a construção de uma base de dados de colocações do português brasileiro. Sustentado pela catedral teórica da Fraseologia, a qual se ocupa do estudo das combinações polilexicais de uma língua natural cristalizadas pela tradição cultural e memorizadas em bloco pelos falantes dessa língua sem que necessariamente lhes sejam aplicadas regras de valores gerais, elegemos para reflexão especificamente aquelas unidades fraseológicas que se comportam como o que o linguista britânico Firth (1957) chamou de colocação (collocations), categoria fraseológica que trata, em última instância, de coocorrências léxico-sintáticas habituais, cuja associação se dá arbitrária e idiossincraticamente. Desse objetivo maior, surgem inquietações de várias ordens. Entre os desdobramentos mais imediatos, concentramo-nos, de uma parte, naquele respeitante à tipologia sintática consolidada na literatura especializada (notadamente Mel’čuk (1995), Tutin e Grossmann (2002), Corpas Pastor, Koike (2001); do lado de cá do atlântico, Fulgêncio (1998), Tagnin (1989; 2005; 2011), Araújo Vale (2001)), que culminou em nossa proposta de organização sintática macroestrutural das CPB em simples, superposta e complexa. Sustentamos que os elementos colocacionais não se apresentam homogeneamente a ponto de receberem o mesmo tratamento teórico-descritivo em termos estruturais, posicionamento construído a partir do confronto entre as ocorrências coletadas. De outra parte, as ocorrências sinalizavam particularidades composicionais de ordem sintático-semântico-discursiva as quais organizamos em termos de 19 propriedades microestruturais das CPB. O retorno à definição do fenômeno se nos apresentou como imperativo, consequência da fisiologia das ocorrências entendidas aqui como colocações, de modo que, ao alargar o horizonte de escopo do fenômeno colocacional no plano da expressão, redefinimos seu plano conceitual, ponto axial donde se deriva a unidade da classe. Como resultado desse trabalho teórico-descritivo, inauguramos a base de dados das colocações do português do Brasil.
|
25 |
Étude des mots indiquant la couleur dans les proverbes et les locutions proverbiales français et irakiens : étude linguistique comparée / Study of the words refering to color in french and iraqi proverbial proverbs and the expressions : compared linguistic studyAltaie, Liqaa 04 September 2015 (has links)
Notre thèse porte sur l’étude linguistique contrastive de la référence aux couleurs dans les proverbes à partir d'un corpus de 208 proverbes recueillis en France et en Irak. Nous étudierons la manière dont les couleurs sont exprimées dans les deux langues (catégories grammaticales, structure grammaticale et prosodique des énoncés, outils rhétoriques appliqués aux couleurs pour renforcer leur valeur expressive), ainsi que le rapport des locuteurs à l'usage des couleurs dans les proverbes qu'ils utilisent. Nous essayerons également d'explorer dans les deux langues les différences liées à l'époque où le proverbe a été le plus utilisé, ainsi que le degré de connaissance des proverbes selon l'âge, le sexe, la profession et la région du locuteur. La langue française, ainsi que le dialecte irakien contiennent une grande proportion de mots indiquant la couleur dans les proverbes. Et c’est la connotation de ces mots qui est à l’origine de la difficulté de compréhension. De plus, selon les pays, les cultures et les époques, les couleurs revêtent des significations différentes, parfois aux antipodes de celles des cultures voisines, comme le blanc, associé en occident et dans les pays arabes (comme en Irak) à la pureté, alors qu’il est lié au deuil dans la plupart des pays asiatiques. Grâce à la langue, comme nous le savons, l’homme peut communiquer, échanger les informations, les idées et les sentiments. En d’autres termes, les parleurs peuvent exprimer ce qu’ils veulent exprimer, ce qu’ils veulent dire et les auditeurs peuvent recevoir les informations. Cependant, dans la communication, il n’est pas toujours facile de comprendre complètement et exactement ce qui est dit et écrit, parce que le sens du mot est compliqué et sophistiqué. Le même mot, utilisé dans ces différentes situations, aura différentes significations. Les mots indiquant la couleur se heurtent aux mêmes problèmes. Fonctionnant comme une unité isolée, le proverbe est une combinaison de mots tirés du vocabulaire général de chaque langue. Nous considérons les mots indiquant la couleur dans les proverbes et les locutions proverbiales comme l’objet de notre étude parce que la couleur est partout dans notre vie : la couleur des plantes et des animaux, la couleur du ciel et de la terre, la couleur des aliments, mais aussi parce que les proverbes constituent une source de vocabulaire riche pour ceux qui apprennent la langue. Les proverbes portent divers champs sémantiques et ils reflètent bien les difficultés culturelles liées à l’apprentissage du français en Irak. En outre, nous essayerons de prouver, à travers des transformations et des manipulations, que ces proverbes peuvent être figés. Une étude approfondie de ces traits sémantiques et syntaxiques nous a paru de première nécessité pour rendre compte de l'existence du figement dans les proverbes, phénomène linguistique à la fois très important et très complexe. Par ailleurs, la comparaison critique entre ces deux langues, le français et l’arabe en l’occurrence, affirme que ce phénomène du figement n’est qu’un fait linguistique universel, et révèle que chaque langue a ses propres mécanismes de figement. Nous pouvons noter que du point de vue sémantique, le sens des proverbes n’est pas calculé selon les règles de la compositionalité ; autrement dit, le sens global des proverbes n’est pas l’addition du sens des éléments qui les composent. / Our thesis concerns the contrastive linguistic study of The reference to colors in the proverbs from a corpus of 208 proverbs collected in France and in Iraq. We shall study how the colors are expressed in both languages (word classes, grammatical and prosodic structure of the statements, the rhetoric tools applied to colors to strengthen their meaning value) as well as the link of the speakers for colors in the proverbs they use. We shall also try to explore in both languages the differences related to the period when the proverb was the most used as well as in the degree of knowledge of the proverbs according to age, sex, profession and the region of the speaker. The French language as well as the Iraqi dialect contain a big proportion of words indicating the color in the proverbs. And it is the connotation of these words that is the origin of the difficulty of understanding. Furthermore, according to countries, cultures and times, the colors take on different meanings sometimes to the antipodes of those of the nearby cultures like the colour white, associated in the West and in Arab countries to purity, while it is refers to mourning in most of the Asian countries. Thanks to the language, as we know it, the man can communicate, exchange information, ideas and eelings. In other words, the speakers can express what they want to express, what they want to sayand the listenerscan receive the information. However, in communication, it is not always easy to understand completely and exactly what is said and written, because the meaning of the word is complicated and sophisticated. The same word, used in these various situations, will have various meanings. The words indicating the color come up against with the same problems. Working as an isolated unity, the proverb is a combinatio of words taken from the general vocabulary of every language. We consider the words indicating the color in the proverbs and the proverbial expressions as the object of our study because the color is everywhere in our life : the color of the plants and animals, the color of the sky and the earth, the color of food, but also because the proverbs constitute a source of rich vocabulary for those who learn the language. The proverbs refers to diverse semantic fields and they reflect nicely the cultural difficulties related to learning of the French language in Iraq. Besides this, we would try to prove through transformations and manipulations that these proverbs can be frozen. An elaborate study of these semantic and syntactical features seemed to us absolutely essential to report the existence of the congealing in the proverbs, a very important and very complex linguistic phenomenon at the same time. Besides that, the critical comparison between these two languages : French and Arabic in this particular case, asserts that the phenomenon of the congealing is just a universal linguistic fact, and reveals that each language has its own mechanisms of congealing. We can note that, from the semantic point of view, the meaning of the proverbs is not calculated according to the rules of the compositionality ; in other words, the global meaning of the proverbs is not the addition of the meaning of the elements which compose them.
|
26 |
La scalarité de l'intégration syntaxique : étude syntaxique, sémantique et pragmatique de la proposition en "quand" / The scalarity of syntactic integration : syntaxic, semantic and pragmatic study of quand clause (when-clause)Saez, Frédérique 22 June 2011 (has links)
Cette étude sur les propositions (clauses) introduites par "quand" s’ancre dans une démarche descriptive qui se veut à l’interface entre syntaxe, sémantique et discours. Il s’agit donc dans un premier temps de définir des critères permettant de rendre compte de la syntaxe particulièrement variable de cette structure introduite par quand. Nous nous sommes inspirée des travaux de Smessaert et al. (2005) pour la distinction entre micro- et macro-syntaxe et Berrendonner & Reichler-Béguelin (1989), Berrendonner (1990) et Béguelin (2004) pour la description macro-syntaxique. L’utilisation des ces outils de descriptions nous a permis de sortir de la dichotomie traditionnelle (hypotaxe vs parataxe) par l’intégration d’un niveau intermédiaire (exotaxe, épitaxe et endotaxe) afin d’élaborer un continuum scalaire d’intégration de la clause introduite par "quand", sur l’exemple de ce que propose Lehmann (1988). Ce continuum d’intégration présente une double orientation de l’intégration : de la coalescence au dégroupage et inversement. Ce continuum d’intégration syntaxique de la clause introduite par quand est corroboré par l’interprétation plus ou moins subjective de cette même clause. Nous souhaitons que ce travail soit à l’origine d’une étude plus vaste sur les intégrateurs temporels en français (cependant, alors, en même temps, à ce moment-là etc.) afin de vérifier la constance prévisible de certains phénomènes. / Our study about the "Quand-p" (When-clause) in modern French settles in a descriptive approach in the interlacing of syntax, semantic and discourse. Therefore we first needed to define a criteria that could debrief the variability of the Quand-p syntax. We found inspiration in the interlaced work of Smessaert et al. (2005), for the difference between micro- and macro-syntax, and of Berrendonner & Reichler-Béguelin (1989), Berrendonner (1990) and Béguelin (2004) for the macro-syntax analysis. Using these analysis tools allowed us to leave the traditional dichotomy (hypotaxis vs parataxis) by means of integration of an intermediate level (exotaxis, epitaxis and endotaxis) to elaborate a continuing integration scale of the "Quand-p", based on the example given by Lehmann (1988). This integration scale presents two directions: from coalescence to unbundling and vice versa.This syntactic integration scale introduced by the Quand-p is corroborated by its more or less subjective interpretation. We hope for this work to be at the origin of a larger study of the temporal integrator in French (cependant, alors, en même temps, à ce moment-là etc.) in order to verify the predictable constancy of certain phenomena.
|
27 |
Alignement automatique de textes parallèles Français-JaponaisNakamura-Delloye, Yayoi 17 December 2007 (has links) (PDF)
L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications.<br />La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique.<br />Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'alignement des phrases. Ces travaux ont conduit à la réalisation d'un système d'alignement des phrases adapté au traitement des textes français et japonais.<br />Le noyau de la thèse est composé de deux types de travaux, études linguistiques et réalisations informatiques. Les études linguistiques se divisent elles-mêmes en deux sujets : la proposition en français et la proposition en japonais. Le but de nos études sur la proposition française est de définir une grammaire pour la détection des propositions. Pour cet effet, nous avons cherché à définir une typologie des propositions, basée sur des critères uniquement formels. Dans les études sur le japonais, nous définissons d'abord la phrase japonaise sur la base de l'opposition thème-rhème. Nous tentons ensuite d'élucider la notion de proposition.<br />Les réalisations informatiques comportent trois tâches composant ensemble au final l'opération d'alignement des propositions, incarnées par trois systèmes informatiques distincts : deux détecteurs de propositions (un pour le français et un pour le japonais), ainsi qu'un système d'alignement des propositions.
|
28 |
Alignement automatique de textes parallèles français-japonaisNakamura-Delloye, Yayoi 17 December 2007 (has links) (PDF)
L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications.<br />La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique.<br />Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'alignement des phrases. Ces travaux ont conduit à la réalisation d'un système d'alignement des phrases adapté au traitement des textes français et japonais.<br />Le noyau de la thèse est composé de deux types de travaux, études linguistiques et réalisations informatiques. Les études linguistiques se divisent elles-mêmes en deux sujets : la proposition en français et la proposition en japonais. Le but de nos études sur la proposition française est de définir une grammaire pour la détection des propositions. Pour cet effet, nous avons cherché à définir une typologie des propositions, basée sur des critères uniquement formels. Dans les études sur le japonais, nous définissons d'abord la phrase japonaise sur la base de l'opposition thème-rhème. Nous tentons ensuite d'élucider la notion de proposition.<br />Les réalisations informatiques comportent trois tâches composant ensemble au final l'opération d'alignement des propositions, incarnées par trois systèmes informatiques distincts : deux détecteurs de propositions (un pour le français et un pour le japonais), ainsi qu'un système d'alignement des propositions.
|
29 |
Développement de la production spontanée des constructions syntaxiques complexes chez les enfants de 3 à 6 ans : analyse de corpusBelkhiria, Sahar 07 1900 (has links)
Un nombre réduit, mais croissant de recherches étudie le développement de la complexité syntaxique pour l’anglais et le français européen, mais à notre connaissance aucune ne s’est intéressée au français québécois. Ce projet a donc pour ambition d’analyser la production de constructions complexes chez des enfants franco-québécois âgés de 3 à 6 ans, à partir d’un corpus composé de 30 échantillons de langage spontané répartis en trois groupes d’âge de 3-4 ans, 4-5 ans et 5-6 ans. Les échantillons ont été recueillis pendant que chaque enfant s’amusait avec des jouets standards. Des enregistrements audio-visuels ont été effectués pendant l’activité et ensuite transcrits sous forme de corpus écrits. Enfin, le logiciel SALT a été utilisé pour coder les transcriptions.
La présente étude se veut développementale, dans le sens qu’elle cherche à généraliser le processus de développement des complexités syntaxique en fonction de l’âge. Les constructions complexes considérées s’appuient sur la liste revisitée des introducteurs de complexité de Lentin (1998). À des fins d’analyse, elles ont été réparties en quatre catégories syntaxiques : les complétives, les coordonnées, les circonstancielles, et les relatives. Une analyse descriptive des constructions complexes basée sur des pourcentages a d’abord été effectuée suivie d’analyses statistiques pour vérifier la significativité des évolutions observées.
Les principales conclusions de cette étude se résument comme suit. La proportion de constructions complexes est invariante entre 3 et 6 ans, laissant croire que le développement de la complexité syntaxique s’effectue au-delà de l’âge de 6 ans. Néanmoins, comme pour l’anglais, les complétives sont les constructions les plus fréquentes dans le langage de l’enfant et ce, pour chaque groupe d’âge. Viennent ensuite les coordonnées, les circonstancielles et enfin les relatives. L’ordre de développement suit ainsi l’ordre d’émergence des constructions complexes. À l’intérieur des quatre catégories syntaxiques, certains sous-types de constructions apparaissent plus fréquemment que d’autres. Dans les complétives, ce sont les infinitives prépositionnelles et les complétives introduites par la conjonction « que ». Dans les circonstancielles, ce sont les propositions introduites par « parce que » qui sont les plus utilisés, dans les coordonnées, ce sont les juxtapositions de propositions et enfin dans les relatives, les relatives sujet en « qui ». Une analyse plus détaillée du développement des sous-types de constructions complexes révèle une augmentation significative des circonstancielles exprimant la conséquence à partir de 4 ans et du discours indirect à partir de 5 ans. Toutefois, une diminution significative de l’interrogative indirecte a été relevée à partir de 5 ans.
Des différences individuelles substantielles ont été observées entre les enfants d’un même groupe d’âge, en particulier dans le groupe de 4-5 ans. Les résultats obtenus mériteraient d’être vérifiés sur un corpus plus large et plus homogène afin de dégager des généralisations sur le processus de développement de la complexité syntaxique. Autre que l’âge, d’autres facteurs, tel que les facteurs cognitifs (comme la capacité de l’enfant à traiter l’information, la mémoire de travail) et les facteurs environnementaux (comme le type de discours, le langage adressé à l’enfant) seraient à considérer dans des travaux futurs. / A small but growing of research studies the development of syntactic complexity for English and European French, but to our knowledge none has focused on Quebec French. This project aims to analyze the production of complex constructions in Franco-Quebecer children aged 3 to 6, from a corpus composed of 30 samples of spontaneous language divided into three age groups of 3-4 years, 4-5 years and 5-6 years. The samples were collected while each child was playing with standard toys. Audio-visual recordings were made during the activity and then transcribed into a written corpus. Finally, SALT software was used to code the transcripts.
The present study is developmental, in the sense that it seeks to generalize the process of production of syntactic complexities according to age. The complex constructions considered are based on Lentin's revisited list of complexity introducer, and for analysis purposes, they have been divided into four syntactic categories: complements, coordinates, circumstantials, and relatives. A descriptive analysis of the complex constructions based on percentages was first carried out, followed by statistical analyzes to test the significance of the changes observed.
The main conclusions of this work can be summarized as follows. The proportion of complex constructions is invariant between 3 and 6 years, suggesting the development of syntactic complexity takes place beyond the age of 6 years. Nevertheless, as for English, complements are the most frequent constructions in child language, and this for each age group. This is followed respectively by coordinates, circumstantials and relatives. The order of development thus follows the order of emergence of complex constructions. Within these four syntactic categories, certain subtypes of constructions appear more frequently than others. In the category of complements, these are prepositional infinitives and the conjunction “que”. In circumstantials, "because" structures are the most used, and in coordinates, it is juxtapositions, and finally in relatives, the relative subject "qui” (who/which). A more detailed analysis of the development of complex construction subtypes reveals a significant increase in circumstantials expressing consequence from age 4, and indirect speech from age 5. However, a significant decrease in indirect questions was noted from the age of 5 years.
Substantial individual differences were observed between children within the same age group, particularly in the 4-5 year one. Results obtained should be verified on a larger and more homogeneous corpus in order to draw generalizations on the process of syntactic complexity development. Other than age, other factors, such as cognitive factors (such as the child's ability to process information and working memory) and environmental factors (such as type of speech, language addressed to the child) should be considered in future work.
|
30 |
Reconnaissance de structures bidimensionnelles : Application aux expressions mathématiques manuscrites en-ligneAwal, Ahmad-Montaser 12 November 2010 (has links) (PDF)
Les travaux présentés dans le cadre de cette thèse portent sur l'étude, la conception, le développement et le test d'un système de reconnaissance de structures manuscrites bidimensionnelles. Le système proposé se base sur une architecture globale qui considère le problème de reconnaissance en tant qu'optimisation simultanée de la segmentation, de la reconnaissance de symboles, et de l'interprétation. Le premier cadre d'applications a été celui d'un système de reconnaissance d'expressions mathématiques manuscrites. La difficulté du problème se situe aux trois niveaux évoqués. La segmentation est complexe du fait de la grande liberté de composition d'une expression, avec notamment la possibilité de symboles multi-traits non séquentiels ; la reconnaissance doit affronter un nombre élevé de classes et en particulier, gérer les situations de formes non-apprises ; l'interprétation peut-être ambiguë du fait du positionnement spatial approximatif. La solution proposée repose sur la minimisation d'une fonction de coût global qui met en compétition des coûts de reconnaissance et des coûts structurels pour explorer un vaste espace de solutions. Les résultats obtenus sont très compétitifs et prometteurs comparés à ceux de la littérature. Nous avons finalement montré la généricité de notre approche en l'adaptant à la reconnaissance d'un autre type de langage 2D, celui des représentations graphiques de type organigramme.
|
Page generated in 0.0458 seconds