301 |
Mesure de confiance trame-synchrones et locales en reconnaissance automatique de la paroleRazik, Joseph 09 October 2007 (has links) (PDF)
En reconnaissance automatique de la parole, les mesures de confiance tentent d'estimer la confiance qu'on peut accorder au résultat (phonème, mot, phrase) fourni par le moteur de reconnaissance ; l'apport de la mesure de confiance permettant par exemple de mettre en évidence les mots mal reconnus ou hors vocabulaire.<br />Dans cette thèse nous proposons des mesures de confiance capables de faire cette estimation dans le cas d'applications nécessitant une reconnaissance "grand vocabulaire" en flux continu comme l'indexation en mots clés ou la transcription en ligne d'émissions radiophoniques et télévisuelles, ou bien encore la transcription du cours d'un enseignant dans une salle de classe pour des élèves malentendants.<br />Dans ce cadre, nous avons défini deux types de mesure de confiance. Les premières, fondées sur des rapports de vraisemblance, sont des mesures trame-synchrones qui peuvent être calculées au fur et à mesure de la progression du moteur de reconnaissance au sein de la phrase à reconnaître. Les secondes, fondées sur une estimation de la probabilité a posteriori limitée à un voisinage local du mot considéré, nécessitent seulement un court délai avant de pouvoir être calculées.<br />Ces mesures ont été évaluées et comparées à une mesure de l'état de l'art également fondée sur la probabilité a posteriori mais nécessitant la reconnaissance de toute la phrase. Cette évaluation a été faite d'une part dans une tâche de transcription automatique d'un corpus réel d'émissions radiophoniques issu de la campagne ESTER et en utilisant le critère d'évaluation EER (Equal Error Rate) ; d'autre part dans une tâche de détection de mots clés sur le même corpus. Des performances très proches de celles de la mesure de l'état de l'art ont été obtenues par nos mesures locales avec un délai de moins d'une seconde.<br />Nous avons également intégré l'une de nos mesures trame-synchrones dans le processus de décodage du moteur de reconnaissance afin d'améliorer la solution proposée par le système et ainsi diminuer le taux d'erreur en mots d'environ 6% en relatif.<br />Enfin, une de nos mesures de confiance a permis par la mise en valeur de mots de faible confiance d'améliorer la compréhension de malentendants.
|
302 |
Optimisation of liquid fuel injection in gas turbine enginesComer, Adam Landon January 2013 (has links)
No description available.
|
303 |
Traçage de contenu vidéo : une méthode robuste à l'enregistrement en salle de cinémaGarboan, Adriana 13 December 2012 (has links) (PDF)
Composantes sine qua non des contenus multimédias distribués et/ou partagés via un réseau, les techniques de fingerprinting permettent d'identifier tout contenu numérique à l'aide d'une signature (empreinte) de taille réduite, calculée à partir des données d'origine. Cette signature doit être invariante aux transformations du contenu. Pour des vidéos, cela renvoie aussi bien à du filtrage, de la compression, des opérations géométriques (rotation, sélection de sous-région... ) qu'à du sous-échantillonnage spatio-temporel. Dans la pratique, c'est l'enregistrement par caméscope directement dans une salle de projection qui combine de façon non linéaire toutes les transformations pré-citées.Par rapport à l'état de l'art, sous contrainte de robustesse à l'enregistrement en salle de cinéma, trois verrous scientifiques restent à lever : (1) unicité des signatures, (2) appariement mathématique des signatures, (3) scalabilité de la recherche au regard de la dimension de la base de données.La principale contribution de cette thèse est de spécifier, concevoir, implanter et valider TrackART, une nouvelle méthode de traçage des contenus vidéo relevant ces trois défis dans un contexte de traçage de contenus cinématographiques.L'unicité de la signature est obtenue par sélection d'un sous-ensemble de coefficients d'ondelettes, selon un critère statistique de leurs propriétés. La robustesse des signatures aux distorsions lors de l'appariement est garantie par l'introduction d'un test statistique Rho de corrélation. Enfin, la méthode développée est scalable : l'algorithme de localisation met en œuvre une représentation auto-adaptative par sac de mots visuels. TrackART comporte également un mécanisme de synchronisation supplémentaire, capable de corriger automatiquement le jitter introduit par les attaques de désynchronisation variables en temps.La méthode TrackART a été validée dans le cadre d'un partenariat industriel, avec les principaux professionnels de l'industrie cinématographique et avec le concours de la Commission Technique Supérieure de l'Image et du Son. La base de données de référence est constituée de 14 heures de contenu vidéo. La base de données requête correspond à 25 heures de contenu vidéo attaqué, obtenues en appliquant neuf types de distorsion sur le tiers des vidéo de la base de référence.Les performances de la méthode TrackART ont été mesurées objectivement dans un contexte d'enregistrement en salle : la probabilité de fausse alarme est inférieure à 16*10^-6, la probabilité de perte inférieure à 0,041, la précision et le rappel sont égal à 93%. Ces valeurs représentent une avancée par rapport à l'état de l'art qui n'exhibe aucune méthode de traçage robuste à l'enregistrement en salle et valident une première preuve de concept de la méthodologie statistique développée.
|
304 |
Affective word priming in the left and right visual fields in young and older individualsAbbassi, Ensie 12 1900 (has links)
Alors que les hypothèses de valence et de dominance hémisphérique droite ont longtemps été utilisées afin d’expliquer les résultats de recherches portant sur le traitement émotionnel de stimuli verbaux et non-verbaux, la littérature sur le traitement de mots émotionnels est généralement en désaccord avec ces deux hypothèses et semble converger vers celle du décours temporel. Cette dernière hypothèse stipule que le décours temporal lors du traitement de certains aspects du système sémantique est plus lent pour l’hémisphère droit que pour l’hémisphère gauche. L’objectif de cette thèse est d’examiner la façon dont les mots émotionnels sont traités par les hémisphères cérébraux chez des individus jeunes et âgés. À cet effet, la première étude a pour objectif d’évaluer l’hypothèse du décours temporel en examinant les patrons d’activations relatif au traitement de mots émotionnels par les hémisphères gauche et droit en utilisant un paradigme d’amorçage sémantique et une tâche d’évaluation. En accord avec l’hypothèse du décours temporel, les résultats obtenus pour les hommes montrent que l’amorçage débute plus tôt dans l’hémisphère gauche et plus tard dans l’hémisphère droit. Par contre, les résultats obtenus pour les femmes sont plutôt en accord avec l’hypothèse de valence, car les mots à valence positive sont principalement amorcés dans l’hémisphère gauche, alors que les mots à valence négative sont principalement amorcés dans l’hémisphère droit. Puisque les femmes sont considérées plus « émotives » que les hommes, les résultats ainsi obtenus peuvent être la conséquence des effets de la tâche, qui exige une décision explicite au sujet de la cible. La deuxième étude a pour objectif d’examiner la possibilité que la préservation avec l’âge de l’habileté à traiter des mots émotionnels s’exprime par un phénomène compensatoire d’activations bilatérales fréquemment observées chez des individus âgés et maintenant un haut niveau de performance, ce qui est également connu sous le terme de phénomène HAROLD (Hemispheric Asymmetry Reduction in OLDer adults). En comparant les patrons d’amorçages de mots émotionnels auprès de jeunes adultes et d’adultes âgés performants à des niveaux élevés sur le plan comportemental, les résultats révèlent que l’amorçage se manifeste unilatéralement chez les jeunes participants et bilatéralement chez les participants âgés. Par ailleurs, l’amorçage se produit chez les participants âgés avec un léger délai, ce qui peut résulter d’une augmentation des seuils sensoriels chez les participants âgés, qui nécessiteraient alors davantage de temps pour encoder les stimuli et entamer l’activation à travers le réseau sémantique. Ainsi, la performance équivalente au niveau de la précision retrouvée chez les deux groupes de participants et l’amorçage bilatéral observé chez les participants âgés sont en accord avec l’hypothèse de compensation du phénomène HAROLD. / While the right hemisphere and valence hypotheses have long been used to explain the results of research on emotional nonverbal and verbal stimuli processing, the literature on emotional word processing is highly inconsistent with both hypotheses, but appear to converge with the time course hypothesis. The time course hypothesis holds that in the processing of some parts of the semantic system the time course of activation is slower in the right hemisphere compared to the left hemisphere. The goal of this thesis was to find insight into the ways in which words with emotional words are processed in the cerebral hemispheres in young and older individuals. To this end, the first study investigated the time course hypothesis looking at the activation pattern of emotional words in the left and right hemispheres, using the priming paradigm and an evaluation task. Consistent with the time course hypothesis, the results in males revealed an early and later priming in the left and right hemispheres, respectively. The results for females, however, were consistent with the valence hypothesis, since positive and negative words were optimally primed in the left and right hemispheres, respectively. As females are considered more emotional than males, their results may be due to the nature of the task, which required an explicit decision concerning the target. The second study looked at the possibility that the preservation with age of the ability to process emotional words would follow the compensatory role of bilateral activation in high performing older individuals known as the HAROLD phenomenon (Hemispheric Asymmetry Reduction in OLDer adults). Comparing the pattern of emotional word priming in a group of equally high performing older and younger, it was shown that while priming occurred unilaterally in young participants, the pattern of priming in older participants appeared to be bilateral. The occurrence of priming in older adults occurred with a tiny delay, though, that may be due to an increase in sensory thresholds that causes older adults to need more time to encode stimuli and start activation through the semantic network. Thus, the bilateral pattern of priming and the equivalent level of performance in older adults provide behavioral evidence supporting the compensatory role of the HAROLD phenomenon.
|
305 |
Limiter le besoin de tiers de confiance en cryptographieAbdalla, Michel 24 November 2011 (has links) (PDF)
Les tiers de confiance sont essentiels aux communications sécurisées. Par exemple, dans une infrastructure de gestion de clés, l'autorité de certification est la clé de voute de l'authentification en garantissant le lien entre une identité et une clé publique. Une carte à puce se doit, pour sa part, d'assurer la confidentialité et l'intégrité des données secrètes lorsqu'elle sert de stockage de données cryptographiques. En effet, si ces garanties sont mises en défaut dans l'une de ces situations, alors la sécurité globale du système peut en être affectée. Plusieurs approches permettent de réduire l'importance des tiers de confiance, telles qu'accroître la difficulté de recouvrer la clé secrète, en la distribuant parmi plusieurs entités, ou limiter l'impact d'une fuite d'information secrète, comme dans les cryptosystèmes "intrusion-resilient" ou "forward-secure". Dans cette thèse, nous considérons deux méthodes complémentaires. La première méthode consiste à utiliser des mots de passe, ou des clés secrètes de faible entropie, qui n'ont pas besoin d'être stockés dans un dispositif cryptographique sécurisé. Malgré la faible entropie du secret, de tels protocoles peuvent fournir un niveau d'assurance satisfaisant pour la plupart des applications. On considère en particulier la mise en accord de clés. La deuxième méthode limite le besoin de garantie de la part des tiers de confiance en utilisant un cryptosystème basé sur l'identité, dans lequel la clé publique d'un utilisateur peut être une chaîne de caractères arbitraire, telle qu'une adresse email. Comme ces systèmes fournissent une résistance aux collusions, ils peuvent aussi être utilisés pour réduire les dommages causés par l'exposition de clés secrètes en générant des secrets indépendants pour chaque période de temps ou pour chaque périphérique/entité. Par ailleurs, ces systèmes basés sur l'identité permettent aux utilisateurs d'avoir un contrôle plus fin sur les capacités de déchiffrement des tiers, en limitant les conséquences liées à un mauvais usage.
|
306 |
Caractérisation des processus d'innovation dans les entreprises de servicesSoille, Philippe 21 December 2011 (has links) (PDF)
RESUME : Les recherches en matière d'innovation démontrent que tous les types d'entreprises sont concernés par le sujet. De même il est avéré que l'innovation, pour s'inscrire dans une réalité qualitative et acceptable économiquement, doit en permanence veiller à être en contact avec son marché. Simultanément à ces exigences, accentuées par l'accélération de la circulation de l'information, les entreprises sont amenées à organiser la recherche et l'innovation au sein de leurs organisations collectives respectives, de façon distribuée auprès de chacun de leurs acteurs. La part des services est croissante dans ce contexte complexe de pilotage de connaissances et de compétences requises, s'agissant des principales caractéristiques des intervenants. Les entreprises sont dès lors amenées à solliciter de plus en plus ces derniers dont principalement le client ou l'usager. Il occupe désormais une place centrale dans ces processus de partage de savoirs et de mise en œuvre de projets innovants. Piloter l'innovation dans les métiers de services, ne peut donc se limiter à une transposition de méthodes industrielles documentées et aujourd'hui bien connues. Innover ne peut être un métier seulement technique et la prise en compte de spécificités des métiers de services est indispensable. L'objectif de notre thèse est de proposer une caractérisation générale de méthodes et d'organisation R&D rendues possibles et efficaces dans une entreprise de services. Notre travail nous a permis d'identifier quatre volets dont les paramètres peuvent être ajustés en fonction des nécessités : 1-Un volet d'ingénierie : la gestion du risque dont l'objectif est de donner un socle tangible à notre modèle de fonctionnement ; 2-Un volet organisationnel, indissociable d'une approche par les sciences humaines et sociales, qui nous permet de modéliser ou caractériser la notion de pôle de compétences indispensable au bon fonctionnement de l'organisation. Il est possible de l'illustrer à la façon d'un cluster de connaissances, compétences et pratiques opérationnelles. 3-Un volet technique dont l'objectif est de faire émerger des outils de conception en lien avec les spécificités de chaque pratique de service. 4-Un volet économique peut optionnellement et avantageusement compléter l'approche que nous proposons afin de consolider notre schéma d'ensemble par la recherche d'une pertinence instantanée et mesurable de l'ensemble de nos actions et la quantification de la performance des outils utilisés à ce titre. Notre travail a fait l'objet de 2 communications dans des colloques nationaux et de 2 publications dans des revues nationales à comité de lecture. Une publication a été soumise dans une revue internationale à comité de lecture. Les recherches et les expérimentations que nous avons menées se sont appuyées sur le Pôle R&D du Groupe FLO, créé en 2008 et dirigé par l'auteur de la thèse. Cette réalisation unique dans le secteur de la restauration commerciale à table, constitue l'aboutissement de notre travail de recherche partenariale.
|
307 |
Extraction, Exploitation and Evaluation of Document-based KnowledgeDoucet, Antoine 30 April 2012 (has links) (PDF)
Les travaux présentés dans ce mémoire gravitent autour du document numérique : Extraction de connaissances, utilisation de connaissances et évaluation des connaissances extraites, d'un point de vue théorique aussi bien qu'expérimental. Le fil directeur de mes travaux de recherche est la généricité des méthodes produites, avec une attention particulière apportée à la question du passage à l'échelle. Ceci implique que les algorithmes, principalement appliqués au texte dans ce mémoire, fonctionnent en réalité pour tout type de donnée séquentielle. Sur le matériau textuel, la généricité et la robustesse algorithmique des méthodes permettent d'obtenir des approches endogènes, fonctionnant pour toute langue, pour tout genre et pour tout type de document (et de collection de documents). Le matériau expérimental couvre ainsi des langues utilisant différents alphabets, et des langues appartenant à différentes familles linguistiques. Les traitements peuvent d'ailleurs être appliqués de la même manière au grain phrase, mot, ou même caractère. Les collections traitées vont des dépêches d'agence de presse aux ouvrages numérisés, en passant par les articles scientifiques. Ce mémoire présente mes travaux en fonction des différentes étapes du pipeline de traitement des documents, de leur appréhension à l'évaluation applicative. Le document est ainsi organisé en trois parties décrivant des contributions en : extraction de connaissances (fouille de données séquentielle et veille multilingue) ; exploitation des connaissances acquises, par des applications en recherche d'information, classification et détection de synonymes via un algorithme efficace d'alignement de paraphrases ; méthodologie d'évaluation des systèmes d'information dans un contexte de données massives, notamment l'évaluation des performances des systèmes de recherche d'information sur des bibliothèques numérisées.
|
308 |
Elaboration de ressources électroniques pour les noms composés de type N (E+DET=G) N=G du grec moderneKyriakopoulou, Anthoula 25 March 2011 (has links) (PDF)
L'objectif de cette recherche est la construction manuelle de ressources lexicales pour les noms composés grecs qui sont définis par la structure morphosyntaxique : Nom (E+Déterminant au génitif) Nom au génitif, notés N (E+DET:G) N:G (e.g. ζώνη ασφαλείας/ceinture de sécurité). Les ressources élaborées peuvent être utilisées pour leur reconnaissance lexicale automatique dans les textes écrits et dans d'autres applications du TAL. Notre travail s'inscrit dans la perspective de l'élaboration du lexique-grammaire général du grec moderne en vue de l'analyse automatique des textes écrits. Le cadre théorique et méthodologique de cette étude est celui du lexique-grammaire (M. Gross 1975, 1977), qui s'appuie sur la grammaire transformationnelle harisienne.Notre travail s'organise en cinq parties. Dans la première partie, nous délimitons l'objet de notre travail tout en essayant de définir la notion fondamentale qui régit notre étude, à savoir celle de figement. Dans la deuxième partie, nous présentons la méthodologie utilisée pour le recensement de nos données lexicales et nous étudions les phénomènes de variation observés au sein des noms composés de type N (E+DET:G) N:G. La troisième partie est consacrée à la présentation des différentes sous-catégories des N (E+DET:G) N:G identifiées lors de l'étape du recensement et à l'étude de leur structure lexicale interne. La quatrième partie porte sur l'étude syntaxico-sémantique des N (E+DET:G) N:G. Enfin, dans la cinquième partie, nous présentons les différentes méthodes de représentation formalisée que nous proposons pour nos données lexicales en vue de leur reconnaissance lexicale automatique dans les textes écrits. Des échantillons représentatifs des ressources élaborées sont présentés en Annexe
|
309 |
Les effets d'un programme de développement de la compétence morphologique sur la compétence morphologique, l'identification et la production des mots écrits chez des élèves arabophones de 2e cycle du primaire scolarisés en françaisFejzo, Anila 06 1900 (has links) (PDF)
La présente recherche vise à examiner les effets d'un programme de développement de la compétence morphologique sur l'identification et la production des mots écrits chez des lecteurs et des scripteurs intermédiaires arabophones en FL2. Dans ce but, 53 élèves arabophones de 3e et 4e année du primaire scolarisés en français ont participé à cette recherche. Les élèves du groupe expérimental ont suivi des activités de compétence morphologique accompagnées d'activités en lecture et en écriture pendant douze semaines. Afin de vérifier les effets de cette intervention, les élèves des deux groupes ont passé des tests de compétence morphologique, d'identification des mots et de production des mots avant et après l'intervention. Des tests sur des variables de contrôle telles que la conscience phonologique, la dénomination rapide et la capacité d'apprentissage ont été également administrés. Après l'analyse des résultats, il ressort que les élèves du groupe expérimental performent significativement mieux que ceux du groupe contrôle en compétence morphologique, en identification et production des mots écrits morphologiquement complexes. Ces résultats suggèrent que le développement de la compétence morphologique pourrait contribuer à l'amélioration de l'identification et de la production des mots écrits chez les lecteurs et les scripteurs intermédiaires arabophones en FL2.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : morphèmes, compétence morphologique, règles de jonction des morphèmes, identification des mots écrits, production des mots écrits, français langue seconde, clientèle en L2, population arabophone, intervention, programme de développement, enseignement explicite.
|
310 |
Recensement et description des mots composés - méthodes et applicationsSavary, Agata 14 December 2000 (has links) (PDF)
Ce mémoire décrit les recherches en informatique linguistique menées par l'auteur dans le domaine des mots composés, et plus spécialement de la composition nominale en anglais général et spécialisé. Le point de départ pour toutes les recherches présentées a été le système de traitement automatique de grands corpus, INTEX?.<br />Nous nous sommes penchée sur le problème du recensement des mots composés à grande échelle. Nous avons essayé de répondre aux questions suivantes :<br />1) Comment ce recensement peut être effectué ?<br />2) Est-il utile de le réaliser ?<br />La réponse à la première question est donnée dans le contexte de la création de dictionnaires électroniques, sous formats disponibles dans le système INTEX. Nous analysons la morphologie flexionnelle des noms composés en trois langues : le français, l'anglais et le polonais. Nous proposons une méthode formelle de description du comportement flexionnel des composés, ainsi qu'un algorithme qui génère automatiquement leurs formes fléchies. Nous décrivons la construction de deux dictionnaires électroniques : l'un pour les mots composés de l'anglais général, l'autre pour les termes simples et composés anglais du domaine de l'informatique. Nous présentons une bibliothèque d'automates et de transducteurs finis pour la reconnaissance des déterminants numéraux cardinaux et ordinaux de l'anglais.<br />L'intérêt de la création de bases lexicales pour les mots composés est vérifié dans deux types d'applications du TALN. Premièrement, nous présentons une méthode d'acquisition de terminologie, basée sur l'emploi de ressources terminologiques initiales. Deuxièmement, nous proposons un algorithme de correction orthographique des mots simples et composés, basé sur la consultation d'un dictionnaire sous format d'automate fini.
|
Page generated in 0.0275 seconds