Spelling suggestions: "subject:"confusability"" "subject:"configurabilité""
1 |
Le rôle des fréquences spatiales dans l’effet d’encombrement en identification de lettresZahabi, Sacha 12 1900 (has links)
L’effet d’encombrement, qui nous empêche d’identifier correctement un stimulus visuel
lorsqu’il est entouré de flanqueurs, est omniprésent à travers une grande variété de classes
de stimuli. L’excentricité du stimulus cible ainsi que la distance cible-flanqueur
constituent des facteurs fondamentaux qui modulent l’effet d’encombrement. La
similarité cible-flanqueur semble également contribuer à l’ampleur de l’effet
d’encombrement, selon des données obtenues avec des stimuli non-linguistiques. La
présente étude a examiné ces trois facteurs en conjonction avec le contenu en fréquences
spatiales des stimuli, dans une tâche d’identification de lettres. Nous avons présenté des
images filtrées de lettres à des sujets non-dyslexiques exempts de troubles neurologiques,
tout en manipulant l’excentricité de la cible ainsi que la similarité cible-flanqueurs (selon
des matrices de confusion pré-établies). Quatre types de filtrage de fréquences spatiales
ont été utilisés : passe-bas, passe-haut, à large bande et mixte (i.e. élimination des
fréquences moyennes, connues comme étant optimales pour l’identification de lettres).
Ces conditions étaient appariées en termes d’énergie de contraste. Les sujets devaient
identifier la lettre cible le plus rapidement possible en évitant de commettre une erreur.
Les résultats démontrent que la similarité cible-flanqueur amplifie l’effet
d’encombrement, i.e. l’effet conjoint de distance et d’excentricité. Ceci étend les
connaissances sur l’impact de la similarité sur l’encombrement à l’identification visuelle
de stimuli linguistiques. De plus, la magnitude de l’effet d’encombrement est plus grande
avec le filtre passe-bas, suivit du filtre mixte, du filtre passe-haut et du filtre à large
bande, avec différences significatives entre les conditions consécutives. Nous concluons
que : 1- les fréquences spatiales moyennes offrent une protection optimale contre
l’encombrement en identification de lettres; 2- lorsque les fréquences spatiales moyennes
sont absentes du stimulus, les hautes fréquences protègent contre l’encombrement alors
que les basses fréquences l’amplifient, probablement par l’entremise de leur impact
opposé quant la disponibilité de l’information sur les caractéristiques distinctives des
stimul. / Visual crowding, which impairs our ability to accurately identify a target stimulus when
surrounded by flankers, is ubiquitous across a wide variety of stimulus classes. Target
eccentricity and target-flanker distance constitute fundamental factors in crowding.
Target-flanker similarity appears as another key factor based on findings obtained with
non-linguistic stimuli. The present study investigated the impact of these factors in
conjunction with spatial frequency content on single letter identification performance.
We presented spatial frequency filtered letters to neurologically intact nondyslexic
readers while manipulating target-flanker distance, target eccentricity and target-flanker
similarity (metric based on published letter confusion matrices). Spatial frequency
filtering conditions were broadband, low-pass, high-pass and hybrid (i.e. medium spatial
frequencies, known as optimal for letter recognition, removed from the stimulus). These
conditions were matched on overall contrast energy. Participants were required to
identify the target letter as fast and as accurately as possible. The results show that high
target-flanker similarity enhances crowding, i.e. the joint effects of distance and
eccentricity. This extends past findings on the impact of similarity on crowding to the
visual identification of linguistic materials. Most importantly, the magnitude of the
crowding effect is greatest with low-pass filtering, followed by hybrids, high-pass, and
broadband, with all pairwise contrasts significant. We conclude that: 1- medium spatial
frequencies provide optimal protection from crowding in letter recognition; 2- when
medium spatial frequencies are absent from the stimulus, low spatial frequencies magnify
crowding and high spatial frequencies protect against it, most likely through their
opposite impact on the availability of distinctive feature information.
|
2 |
Phonemic variability and confusability in pronunciation modeling for automatic speech recognition / Variabilité et confusabilité phonémique pour les modèles de prononciations au sein d’un système de reconnaissance automatique de la paroleKaranasou, Panagiota 11 June 2013 (has links)
Cette thèse aborde les problèmes de variabilité et confusabilité phonémique du point de vue des modèles de prononciation pour un système de reconnaissance automatique de la parole. En particulier, plusieurs directions de recherche sont étudiées. Premièrement, on développe des méthodes de conversion automatique de graphème-phonème et de phonème-phonème. Ces méthodes engendrent des variantes de prononciation pour les mots du vocabulaire, ainsi que des prononciations et des variantes de prononciation, pour des mots hors-vocabulaire. Cependant, ajouter plusieurs prononciations par mot au vocabulaire peut introduire des homophones (ou quasi-homophones) et provoquer une augmentation de la confusabilité du système. Une nouvelle mesure de cette confusabilité est proposée pour analyser et étudier sa relation avec la performance d’un système de reconnaissance de la parole. Cette “confusabilité de prononciation” est plus élevée si des probabilités pour les prononciations ne sont pas fournies et elle peut potentiellement dégrader sérieusement la performance d’un système de reconnaissance de la parole. Il convient, par conséquent, qu’elle soit prise en compte lors de la génération de prononciations. On étudie donc des approches d’entraînement discriminant pour entraîner les poids d’un modèle de confusion phonémique qui autorise différentes facons de prononcer un mot tout en contrôlant le problème de confusabilité phonémique. La fonction objectif à optimiser est choisie afin de correspondre à la mesure de performance de chaque tâche particulière. Dans cette thèse, deux tâches sont étudiées: la tâche de reconnaissance automatique de la parole et la tâche de détection de mots-clés. Pour la reconnaissance automatique de la parole, une fonction objectif qui minimise le taux d’erreur au niveau des phonèmes est adoptée. Pour les expériences menées sur la détection de mots-clés, le “Figure of Merit” (FOM), une mesure de performance de la détection de mots-clés, est directement optimisée. / This thesis addresses the problems of phonemic variability and confusability from the pronunciation modeling perspective for an automatic speech recognition (ASR) system. In particular, several research directions are investigated. First, automatic grapheme-to- phoneme (g2p) and phoneme-to-phoneme (p2p) converters are developed that generate alternative pronunciations for in-vocabulary as well as out-of-vocabulary (OOV) terms. Since the addition of alternative pronunciation may introduce homophones (or close homophones), there is an increase of the confusability of the system. A novel measure of this confusability is proposed to analyze it and study its relation with the ASR performance. This pronunciation confusability is higher if pronunciation probabilities are not provided and can potentially severely degrade the ASR performance. It should, thus, be taken into account during pronunciation generation. Discriminative training approaches are, then, investigated to train the weights of a phoneme confusion model that allows alternative ways of pronouncing a term counterbalancing the phonemic confusability problem. The objective function to optimize is chosen to correspond to the performance measure of the particular task. In this thesis, two tasks are investigated, the ASR task and the KeywordSpotting (KWS) task. For ASR, an objective that minimizes the phoneme error rate is adopted. For experiments conducted on KWS, the Figure of Merit (FOM), a KWS performance measure, is directly maximized.
|
3 |
Rôle des différences interindividuelles dans la reconnaissance visuelle des mots : effets de voisinage orthographique par suppression d’une lettre et de confusabilité d’une lettre substituée / Role of interindividual differences in visual word recognition : effects of deletion orthographic neighborhood and confusability of the substituted letterDujardin, Emilie 05 June 2018 (has links)
L’objectif de cette thèse était d’étudier les variations possibles des processus impliqués dans la reconnaissance visuelle des mots selon les différences d’habiletés lexicales de lecteurs adultes (niveaux de lecture, orthographe et vocabulaire). Ainsi, nous avons testé l’effet de fréquence du voisinage orthographique par suppression et par substitution d’une lettre dans des tâches de décision lexicale (Exp. 1, 4), démasquage progressif (Exp. 2, 5), dénomination (Exp. 3, 6), et catégorisation de couleur (Exp. 7). Un effet inhibiteur de fréquence du voisinage orthographique par suppression (Exp. 1-3) et par substitution (Exp. 6) d’une lettre a été obtenu. Les temps de réponse étaient plus longs et les taux d’erreurs plus élevés pour les mots avec au moins un voisin orthographique plus fréquent que pour ceux sans un tel voisin, ce qui peut être expliqué en termes de compétition lexicale. De plus, la compétition lexicale du voisin par suppression d’une lettre était plus importante pour les individus ayant des habiletés lexicales hautes plutôt que basses (Exp. 1, 3), ces derniers individus témoignant de difficultés d’inhibition du compétiteur. Par ailleurs, les individus ayant des habiletés lexicales basses étaient moins rapides et moins précis que ceux ayant des habiletés lexicales hautes (Exp. 1-7). Les données de la tâche de catégorisation (Exp. 7) suggèrent des difficultés dans la mise en place de l’inhibition pour ces individus. Enfin, nous avons montré que l’effet de fréquence du voisinage orthographique était influencé par la confusabilité de la lettre substituée, ce qui différait selon les habiletés lexicales des individus (Exp. 4-6). Dans le cadre théorique de l’activation interactive et de codage spatial des lettres, les données soulignent l’importance des différences d’habiletés lexicales des lecteurs pour rendre compte des différences dans la diffusion de l’activation et de l’inhibition lexicales dans la reconnaissance visuelle des mots. / Word recognition, according to the adult readers’ lexical skill differences (reading, spelling and vocabulary levels). To do so, we tested the orthographic neighborhood frequency effect by deletion and substitution of a letter in lexical decision (Exp.1, 4), progressive demasking (Exp 2, 5), denomination (Exp. 3, 6), and color categorization tasks (Exp.7). Response times were longer and the error rates were higher for words with at least one higher frequency neighbor than for words without such a neighbor, which can be explained in terms of lexical competition. In addition, the lexical competition of the higher-frequency deletion neighbor seems more important for individuals with high lexical skills than for those with low lexical skills (Exp 1, 3), the latter showing difficulties in inhibiting the competitor. Furthermore, individuals with low lexical skills were slower and less accurate than those with high lexical skills (Exp 1-7). Data from the categorization task (Exp. 7) suggest difficulties in setting up inhibition for these individuals. Finally, we have shown that the orthographic neighborhood frequency effect was influenced by the confusability of the substituted letter, differing according to the lexical skills of the individuals (Exp 4-6). In the theoretical framework of activation-interactive and spatial coding, the data highlight the importance of readers’ differences in lexical skills for the diffusion of lexical activation and inhibition in visual word recognition.
|
4 |
Le rôle des fréquences spatiales dans l’effet d’encombrement en identification de lettresZahabi, Sacha 12 1900 (has links)
L’effet d’encombrement, qui nous empêche d’identifier correctement un stimulus visuel
lorsqu’il est entouré de flanqueurs, est omniprésent à travers une grande variété de classes
de stimuli. L’excentricité du stimulus cible ainsi que la distance cible-flanqueur
constituent des facteurs fondamentaux qui modulent l’effet d’encombrement. La
similarité cible-flanqueur semble également contribuer à l’ampleur de l’effet
d’encombrement, selon des données obtenues avec des stimuli non-linguistiques. La
présente étude a examiné ces trois facteurs en conjonction avec le contenu en fréquences
spatiales des stimuli, dans une tâche d’identification de lettres. Nous avons présenté des
images filtrées de lettres à des sujets non-dyslexiques exempts de troubles neurologiques,
tout en manipulant l’excentricité de la cible ainsi que la similarité cible-flanqueurs (selon
des matrices de confusion pré-établies). Quatre types de filtrage de fréquences spatiales
ont été utilisés : passe-bas, passe-haut, à large bande et mixte (i.e. élimination des
fréquences moyennes, connues comme étant optimales pour l’identification de lettres).
Ces conditions étaient appariées en termes d’énergie de contraste. Les sujets devaient
identifier la lettre cible le plus rapidement possible en évitant de commettre une erreur.
Les résultats démontrent que la similarité cible-flanqueur amplifie l’effet
d’encombrement, i.e. l’effet conjoint de distance et d’excentricité. Ceci étend les
connaissances sur l’impact de la similarité sur l’encombrement à l’identification visuelle
de stimuli linguistiques. De plus, la magnitude de l’effet d’encombrement est plus grande
avec le filtre passe-bas, suivit du filtre mixte, du filtre passe-haut et du filtre à large
bande, avec différences significatives entre les conditions consécutives. Nous concluons
que : 1- les fréquences spatiales moyennes offrent une protection optimale contre
l’encombrement en identification de lettres; 2- lorsque les fréquences spatiales moyennes
sont absentes du stimulus, les hautes fréquences protègent contre l’encombrement alors
que les basses fréquences l’amplifient, probablement par l’entremise de leur impact
opposé quant la disponibilité de l’information sur les caractéristiques distinctives des
stimul. / Visual crowding, which impairs our ability to accurately identify a target stimulus when
surrounded by flankers, is ubiquitous across a wide variety of stimulus classes. Target
eccentricity and target-flanker distance constitute fundamental factors in crowding.
Target-flanker similarity appears as another key factor based on findings obtained with
non-linguistic stimuli. The present study investigated the impact of these factors in
conjunction with spatial frequency content on single letter identification performance.
We presented spatial frequency filtered letters to neurologically intact nondyslexic
readers while manipulating target-flanker distance, target eccentricity and target-flanker
similarity (metric based on published letter confusion matrices). Spatial frequency
filtering conditions were broadband, low-pass, high-pass and hybrid (i.e. medium spatial
frequencies, known as optimal for letter recognition, removed from the stimulus). These
conditions were matched on overall contrast energy. Participants were required to
identify the target letter as fast and as accurately as possible. The results show that high
target-flanker similarity enhances crowding, i.e. the joint effects of distance and
eccentricity. This extends past findings on the impact of similarity on crowding to the
visual identification of linguistic materials. Most importantly, the magnitude of the
crowding effect is greatest with low-pass filtering, followed by hybrids, high-pass, and
broadband, with all pairwise contrasts significant. We conclude that: 1- medium spatial
frequencies provide optimal protection from crowding in letter recognition; 2- when
medium spatial frequencies are absent from the stimulus, low spatial frequencies magnify
crowding and high spatial frequencies protect against it, most likely through their
opposite impact on the availability of distinctive feature information.
|
Page generated in 0.0615 seconds