Spelling suggestions: "subject:"segmentation een mot"" "subject:"segmentation enn mot""
1 |
Méthodes de segmentation et d'analyse automatique de textes thaïKosawat, Krit 08 September 2003 (has links) (PDF)
Ce travail de thèse a pour objectif de concevoir et réaliser un module informaticolinguistique apte à effectuer des analyses automatiques de textes thaï sous le système INTEX © . Basé fondamentalement sur les langues indo-européennes écrites avec l'alphabet latin, INTEX © rencontre quelques difficultés pour travailler sur une langue très différente comme le thaï. Le problème crucial est la segmentation en mots et en phrases, étant donné que le thaï n'a pas de séparateur de mot : une phrase est écrite en une séquence de lettres continues, et les séparateurs de phrase sont fréquemment ambigus. Aussi avons-nous développé et évalué deux méthodes de segmentation en mots, par expressions rationnelles et par transducteurs à nombre fini d'états, qui découpent respectivement des textes thaï en lettres et en syllabes. Nous avons également créé les dictionnaires électroniques du thaï qui servent à la fois à reconnaître les mots à partir des lettres ou des syllabes et à les étiqueter avec les codes syntaxiques et sémantiques. Deux méthodes de segmentation en phrases thaï, par la ponctuation et par mots-clés, sont également proposées et évaluées. Nous montrons enfin que, grâce à notre travail, INTEX © est capable d'analyser des documents thaï, malgré toutes les difficultés.
|
2 |
Acquisition de relations phonologiques non-adjacentes : de la perception de la parole à l'acquisition lexicaleGonzalez Gomez, Nayeli 01 August 2012 (has links) (PDF)
Les langues ont de nombreux types de dépendances, certaines concernant des éléments adjacents et d'autres concernant des éléments non adjacents. Au cours des dernières décennies, de nombreuses études ont montré comment les capacités précoces générales des enfants pour traiter le langage se transforment en capacités spécialisées pour la langue qu'ils acquièrent. Ces études ont montré que pendant la deuxième moitié de leur première année de vie, les enfants deviennent sensibles aux propriétés prosodiques, phonétiques et phonotactiques de leur langue maternelle concernant les éléments adjacents. Cependant, aucune étude n'avait mis en évidence la sensibilité des enfants à des dépendances phonologiques non-adjacentes, qui sont un élément clé dans les langues humaines. Par conséquent, la présente thèse a examiné si les enfants sont capables de détecter, d'apprendre et d'utiliser des dépendances phonotactiques non-adjacentes. Le biais Labial-Coronal, correspondant à la prévalence des structures commençant par une consonne labiale suivie d'une consonne coronale (LC, comme bateau), par rapport au pattern inverse Coronal-Labial (CL, comme tabac), a été utilisé pour explorer la sensibilité des nourrissons aux dépendances phonologiques non-adjacentes. Nos résultats établissent qu'à 10 mois les enfants de familles francophones sont sensibles aux dépendances phonologiques non-adjacentes (partie expérimentale 1.1). De plus, nous avons exploré le niveau auquel s'effectuent ces acquisitions. En effet, des analyses de fréquence sur le lexique du français ont montré que le biais LC est clairement présent pour les séquences de plosives et de nasales, mais pas pour les fricatives. Les résultats d'une série d'expériences suggèrent que le pattern de préférences des enfants n'est pas guidé par l'ensemble des fréquences cumulées dans le lexique, ou des fréquences de paires individuelles, mais par des classes de consonnes définies par le mode d'articulation (partie expérimentale 1.2). En outre, nous avons cherché à savoir si l'émergence du biais LC était liés à des contraintes de type maturationnel ou bien par l'exposition à l'input linguistique. Pour cela, nous avons tout d'abord testé l'émergence du biais LC dans une population présentant des différences de maturation, à savoir des enfants nés prématurément (± 3 mois avant terme), puis comparé leurs performances à un groupe d'enfants nés à terme appariés en âge de maturation, et à un groupe de nourrissons nés à terme appariés en âge chronologique. Nos résultats indiquent qu'à 10 mois les enfants prématurés ont un pattern qui ressemble plus au pattern des enfants nés à terme âgés de 10 mois (même âge d'écoute) qu'à celui des enfants nés à terme âgés de 7 mois (même âge de maturation ; partie expérimentale 1.3). Deuxièmement, nous avons testé une population apprenant une langue où le biais LC n'est pas aussi clairement présent dans le lexique : le japonais. Les résultats de cette série d'expériences n'a montré aucune préférence pour les structures LC ou CL chez les enfants japonais (partie expérimentale 1.4). Pris ensemble, ces résultats suggèrent que le biais LC peut être attribué à l'exposition à l'input linguistique et pas seulement à des contraintes maturationnelles. Enfin, nous avons exploré si, et quand, les acquisitions phonologiques apprises au cours de la première année de la vie influencent le début du développement lexical au niveau de la segmentation et de l'apprentissage des mots. Nos résultats montrent que les mots avec la structure phonotactique LC, plus fréquente, sont segmentés (partie expérimentale 2.1) et appris (partie expérimentale 2.2) à un âge plus précoce que les mots avec la structure phonotactique CL moins fréquente. Ces résultats suggèrent que les connaissances phonotactiques préalablement acquises peuvent influencer l'acquisition lexicale, même quand il s'agit d'une dépendance non-adjacente.
|
3 |
Acquisition de relations phonologiques non-adjacentes : de la perception de la parole à l’acquisition lexicale / Acquisition of non-adjacent phonological dependencies : From speech perception to lexical acquisitionGonzález Gómez, Nayeli 01 August 2012 (has links)
Les langues ont de nombreux types de dépendances, certaines concernant des éléments adjacents et d'autres concernant des éléments non adjacents. Au cours des dernières décennies, de nombreuses études ont montré comment les capacités précoces générales des enfants pour traiter le langage se transforment en capacités spécialisées pour la langue qu'ils acquièrent. Ces études ont montré que pendant la deuxième moitié de leur première année de vie, les enfants deviennent sensibles aux propriétés prosodiques, phonétiques et phonotactiques de leur langue maternelle concernant les éléments adjacents. Cependant, aucune étude n'avait mis en évidence la sensibilité des enfants à des dépendances phonologiques non-adjacentes, qui sont un élément clé dans les langues humaines. Par conséquent, la présente thèse a examiné si les enfants sont capables de détecter, d'apprendre et d’utiliser des dépendances phonotactiques non-adjacentes. Le biais Labial-Coronal, correspondant à la prévalence des structures commençant par une consonne labiale suivie d'une consonne coronale (LC, comme bateau), par rapport au pattern inverse Coronal-Labial (CL, comme tabac), a été utilisé pour explorer la sensibilité des nourrissons aux dépendances phonologiques non-adjacentes. Nos résultats établissent qu’à 10 mois les enfants de familles francophones sont sensibles aux dépendances phonologiques non-adjacentes (partie expérimentale 1.1). De plus, nous avons exploré le niveau auquel s’effectuent ces acquisitions. En effet, des analyses de fréquence sur le lexique du français ont montré que le biais LC est clairement présent pour les séquences de plosives et de nasales, mais pas pour les fricatives. Les résultats d'une série d'expériences suggèrent que le pattern de préférences des enfants n’est pas guidé par l'ensemble des fréquences cumulées dans le lexique, ou des fréquences de paires individuelles, mais par des classes de consonnes définies par le mode d'articulation (partie expérimentale 1.2). En outre, nous avons cherché à savoir si l’émergence du biais LC était liés à des contraintes de type maturationnel ou bien par l'exposition à l’input linguistique. Pour cela, nous avons tout d’abord testé l'émergence du biais LC dans une population présentant des différences de maturation, à savoir des enfants nés prématurément (± 3 mois avant terme), puis comparé leurs performances à un groupe d‘enfants nés à terme appariés en âge de maturation, et à un groupe de nourrissons nés à terme appariés en âge chronologique. Nos résultats indiquent qu’à 10 mois les enfants prématurés ont un pattern qui ressemble plus au pattern des enfants nés à terme âgés de 10 mois (même âge d'écoute) qu’à celui des enfants nés à terme âgés de 7 mois (même âge de maturation ; partie expérimentale 1.3). Deuxièmement, nous avons testé une population apprenant une langue où le biais LC n’est pas aussi clairement présent dans le lexique : le japonais. Les résultats de cette série d'expériences n’a montré aucune préférence pour les structures LC ou CL chez les enfants japonais (partie expérimentale 1.4). Pris ensemble, ces résultats suggèrent que le biais LC peut être attribué à l'exposition à l'input linguistique et pas seulement à des contraintes maturationnelles. Enfin, nous avons exploré si, et quand, les acquisitions phonologiques apprises au cours de la première année de la vie influencent le début du développement lexical au niveau de la segmentation et de l’apprentissage des mots. Nos résultats montrent que les mots avec la structure phonotactique LC, plus fréquente, sont segmentés (partie expérimentale 2.1) et appris (partie expérimentale 2.2) à un âge plus précoce que les mots avec la structure phonotactique CL moins fréquente. Ces résultats suggèrent que les connaissances phonotactiques préalablement acquises peuvent influencer l'acquisition lexicale, même quand il s'agit d'une dépendance non-adjacente. / Languages instantiate many different kinds of dependencies, some holding between adjacent elements and others holding between non-adjacent elements. During the past decades, many studies have shown how infant initial language-general abilities change into abilities that are attuned to the language they are acquiring. These studies have shown that during the second half of their first year of life, infants became sensitive to the prosodic, phonetic and phonotactic properties of their mother tongue holding between adjacent elements. However, at the present time, no study has established sensitivity to nonadjacent phonological dependencies, which are a key feature in human languages. Therefore, the present dissertation investigates whether infants are able to detect, learn and use non-adjacent phonotactic dependencies. The Labial-Coronal bias, corresponding to the prevalence of structures starting with a labial consonant followed by a coronal consonant (LC, i.e. bat), over the opposite pattern (CL, i.e. tab) was used to explore infants sensitivity to non-adjacent phonological dependencies. Our results establish that by 10 months of age French-learning infants are sensitive to non-adjacent phonological dependencies (experimental part 1.1). In addition, we explored the level of generalization of these acquisitions. Frequency analyses on the French lexicon showed that the LC bias is clearly present for plosive and nasal sequences but not for fricatives. The results of a series of experiments suggest that infants preference patterns are not guided by overall cumulative frequencies in the lexicon, or frequencies of individual pairs, but by consonant classes defined by manner of articulation (experimental part 1.2). Furthermore, we explored whether the LC bias was trigger by maturational constrains or by the exposure to the input. To do so, we tested the emergence of the LC bias firstly in a population having maturational differences, that is infants born prematurely (± 3 months before term) and compared their performance to a group of full-term infants matched in maturational age, and a group of full-term infants matched in chronological age. Our results indicate that the preterm 10-month-old pattern resembles much more that of the full-term 10-month-olds (same listening age) than that of the full-term 7-month-olds (same maturational age; experimental part 1.3). Secondly we tested a population learning a language with no LC bias in its lexicon, that is Japanese-learning infants. The results of these set of experiments failed to show any preference for either LC or CL structures in Japanese-learning infants (experimental part 1.4). Taken together these results suggest that the LC bias is triggered by the exposure to the linguistic input and not only to maturational constrains. Finally, we explored whether, and if so when, phonological acquisitions during the first year of life constrain early lexical development at the level of word segmentation and word learning. Our results show that words with frequent phonotactic structures are segmented (experimental part 2.1) and learned (experimental part 2.2) at an earlier age than words with a less frequent phonotactic structure. These results suggest that prior phonotactic knowledge can constrain later lexical acquisition even when it involves a non-adjacent dependency.
|
Page generated in 0.1443 seconds