• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 7
  • 1
  • 1
  • Tagged with
  • 8
  • 8
  • 6
  • 6
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Transcription automatique de la parole spontanée

Dufour, Richard 01 December 2010 (has links) (PDF)
Les systèmes de Reconnaissance Automatique de la Parole (RAP) atteignent actuellement des performances suffisantes pour être intégrés dans diverses applications (dialogue homme-machine, recherche d'information, indexation automatique...). Cependant, dans le cadre de la reconnaissance automatique de la parole continue à grand vocabulaire, que l'on utilise par exemple pour transcrire des émissions radiophoniques d'information, la qualité des transcriptions varie selon le type de parole contenu dans les documents. En effet, les systèmes de RAP ont beaucoup plus de facilité à transcrire de la parole préparée, proche d'un texte lu, que de la parole spontanée, caractérisée par de nombreuses spécificités (disfluences, agrammaticalité, baisse de la fluidité de la parole...). Le travail de cette thèse vise le traitement de la parole spontanée et s'inscrit dans le cadre du projet EPAC (Exploration de masse de documents audio pour l'extraction et le traitement de la PArole Conversationnelle). L'objectif principal est de proposer des solutions pour améliorer les performances des systèmes de RAP sur ce type de parole. Nous avons choisi d'aborder, dans notre travail, la parole spontanée en tant qu'objet d'étude particulier nécessitant des traitements spécifiques. Ainsi, dans un premier temps, nous proposons un outil de détection automatique de la parole spontanée, basé sur les spécificités de ce type de parole. Cet outil est très important puisqu'il nous permet, dans un deuxième temps, de proposer une approche d'adaptation des modèles acoustiques et des modèles de langage du système de RAP à la parole spontanée sans ajout de données, en sélectionnant automatiquement les segments contenant ce type de parole. La transcription résultant de cette adaptation propose des hypothèses de reconnaissance différentes de celles fournies par le système de base. La combinaison de ces deux propositions de transcription permet d'observer une réduction significative du taux d'erreur-mot. Ce besoin de solutions spécifiques a finalement orienté une partie de notre travail vers la correction d'un problème particulièrement présent en français : l'homophonie. Nous cherchons alors à corriger les transcriptions, fournies par un système de RAP, au moyen d'une méthode proposant des solutions spécifiques à certains problèmes particuliers de l'homophonie. L'approche se focalise sur la correction de certaines erreurs, auxquelles une solution particulière est proposée. Cette méthode, en post-traitement des systèmes de RAP, corrige certains mots et classes de mots homophones, indépendamment du système de RAP utilisé.
2

Vers un raffinement des critères langagiers entre la Démence fronto-temporale et la maladie d'Alzheimer / Beyond lingüística differences between frontotemporal dementia and Alzheimer's disease

Martinez, Angela 25 September 2017 (has links)
Le diagnostic différentiel de Démence Fronto-Temporale (DFT) vs Maladie d’Alzheimer (MA) n’est pas toujours facile à établir, et peuvent être confondus avec ceux de l’Aphasie Primaire Progressive (APP) » (Snowden et al. 2011) puisque l’anomie est présente dans les deux pathologies (Assal et al. 2009, Barkat-Defadas et al. 2008, Léger et al. 2007). La MA peut se décrire comme une démence dégénérative, avec une perte de tissu neuronal plutôt dans les lobes pariétal et temporal, résultant dans des difficultés dans les domaines de l’attention, les fonctions exécutives, la mémoire, les compétences pour apprendre, le langage, le calcul, et les fonctions viso-spatiales (Robin et al. 2003). De l’autre coté, la DFT est une démence qui atteint plutôt les lobes frontal et temporal elle peut se classifier d’après trois variantes: variante comportementale (DFTbf), Aphasie primaire progressive (APP) et démence sémantique (DS) (Kertesz et al 2003). Dans les deux cas nous pouvons trouver des troubles communs du à la perte du tissu dans les régions temporales, dans les étapes initiales de la maladie. L’analyse du langage chez des patients avec DFT et MA, et la corrélation de celui-ci avec le profil psycholinguistique permettra l’isolement des caractéristiques cliniques propres du profil des patients, a fin de proposer des critères plus spécifiques pour disjoindre le profil clinique de langage entre la DFT et la MA.La présente thèse sera réalisée en co-tutelle entre l’hôpital San Ignacio / Pontificia Universidad Javeriana et l’Université Lumière-Lyon2. Ce projet poursuit trois objectifs : (i) recueillir des données psycholinguistiques et de langage (tenant compte des années de scolarité et la sévérité du cours de la maladie), (ii) étudier et isoler les variantes linguistiques, qui peuvent influencer erronément la différence des critères de diagnostique entre la DFT et MA; (iii) raffiner les critères de diagnostique de la DFT et MA. 75 sujets ont été évalués (FTD n = 63, AD = 12, 22 sujets contrôles). Le test d'afastie (BAT) (Paradis 1989) a été utilisé pour identifier la discrimination auditive, la compréhension des structures syntaxiques (auditive et lecture), la production de phrases, la compréhension des narrations, la lecture de phrases, ainsi qu'une analyse des erreurs selon la structure syntaxique. En outre, nous évaluons les fonctions exécutives et les tests cognitifs de base. Les échantillons de parole spontanée ont été transcrits en utilisant le format CHAT et analysés à l'aide des programmes CLAN. En adition aux analyses descriptives, une analyse de proximité des distances euclidiennes au carré a été effectuée ainsi que des corrélations et régréssions.Les résultats montrent que patients atteints de PPA ont eu la pire performance dans la plupart des tâches langagières. Les DFTvf montrent une bonne peormance pour les tâches standardisées, mais montrent des difficultées isolées pour la compréhension de structures syntaxiques de type négatif qui peut s’associer à l'incapacité de représenter une séquence temporelle de la phrase. Les résultats démontrent que le discours spontané nous permet de différencier tous les groupes de patients. Le discours de ces patients peut être distinctif et reflète non seulement les capacités linguistiques du sujet, mais aussi les autres fonctions cognitives. Même si la théorie différencie les groupes PPA selon leur fluence, les résultats montrent qu’avec les variables qui portent sur la fluence de la parole qu'il n'est pas possible de différencier la variante non fluente et la logopénique. D'autres variables telles que les erreurs et la grammaire doivent être incluses dans les analyses pour obtenir le diagnostic différentiel des variantes de la APP. La parole spontanée démontre être un outil inestimable dans la pratique quotidienne du clinicien pour les diagnostics précoces et les critères pour un diagnostic différentiel entre la MA et la DFT – et ces trois variantes-. / Even though the large majority of cortical dementia is of the Alzheimer’s disease type, there are differential diagnosis limitations of current diagnostic criteria for early-onset Alzheimer disease (AD) and frontotemporal lobar degeneration (FTLD, all three variants: behavioural variant frontotemporal –FTDbv-, Primary progressive aphasia –PPA- and semantic dementia –SD-). Initially, either AD and FTD share cognitive declines and first complain includes memory and no language in FTLD or language and no memory in AD. For instance, word retrieval deficits are common in AD and are thought to reflect a degradation of semantic memory. Yet, the nature of semantic deterioration in AD and the underlying neural correlates of these semantic memory changes remain largely unknown (Wierenga, 2011). On the other hand, PPA, FTDbv and SD have, as well, common behavioural features: PPA, prior to word loss, may show apathy and semantic dementia patients have, long before, the pure meaning loss, a great decline on emotional and conduct process. Since new guidelines for the differential diagnosis of behavioural FTD (Raskovsky, 2011) and selective language features –nonfluent/agrammatic, semantic, syntax, narrative - of the language variants are being revised (Gorno-Tempini, 2011) the present project present a novel way to define criteria regarding cognition profile through language analysis in all: AD and FTDL all variants. In sum, isolation of pure clinical characteristics in order to enriched the clinic profile and subtract the pure linguistic features will facilitate better common clinical compromise besides language differences (Zanini et al. 2011, Hernández et al. 2011, Ardila& Ramos, 2008). The present study aims to study through the Javeriana University Memory Clinic (PUJMC) at the San Ignacio Hospital in Colombia, based on the experience in the last 14 years where almost 3000 patients have been studied, language semiology between AD, FDT – all three variants. This project has three objectives: (i) to collect psycholinguistic and language data (taking into account the years of schooling and the severity of the course of the disease), (ii) study and isolate linguistic variants that may erroneously influence the difference in diagnostic criteria between DFT and MA; (iii) refining the diagnostic criteria for FTD and MA. 75 subjects were assessed (FTD n= 63, AD= 12, 22 control sample subjects). Bilingual Aphasia Test (BAT) (Paradis 1989) was used in order to identify auditory discrimination, syntactic structures comprehension (auditory and by reading), sentences production, auditory and by reading, comprehension of narrative structures, sentences reading, as well as an analysis of errors according to the syntactic structure. Additionally, we assess executive functions and basic cognition battery. Spontaneous speech samples were transcribed using the CHAT format, and analysed using the CLAN programs Besides a descriptive analysis, a hierarchical clustering through a squared Euclidean distances was done, where patients groups were formed by similar clinical neighbors regardless the FTD variant. Results show that deep language analysis is useful when heterogeneity w/groups is present and depends (in all groups) on the disease stage. PPA patients had the worse performance. bvFTD executive passive structure difficulty is associated with executive functions: The inability to represent a temporal sequence of the phrase –not understanding if.. Then). Results demonstrate that spontaneous speech allow us to differentiate between all groups of patients. Discourse of these patients can be distinctive and it reflects not only the subject's linguistic abilities but other cognitive functions as well....
3

Constitution d'un corpus oral deFLE : enjeux théoriques et méthodologiques / Constitution of an oral corpus of FLE : theoretical and methodological stakes

Arbach, Najib 06 February 2015 (has links)
Les méthodologies de constitution de corpus linguistiques ont été amplement étudiées, mais sont moins abondantes quand il s’agit de corpus oraux ; ces méthodologies sont encore plus rares en ce qui concerne l’interlangue orale. Le projet CIL (Corpus Inter Langue), en cours de finalisation à l’Université Rennes 2 et sous la supervision de l’équipe d’accueil LIDILE (EA 3874), vise à la constitution d’un corpus de productions écrites et orales d’apprenants en FLE et ALE. Cette thèse concerne le corpus oral de FLE du projet global (CIL-FLE). Partant du constat que l’intérêt des linguistes pour la langue orale a systématiquement été en retard par rapport à celui porté à la langue écrite, nous nous intéressons dans un premier temps à l’étude de l’oralité dans différents domaines de la linguistique d’un point de vue historique et épistémologique. Le second chapitre est consacré à la linguistique de corpus de manière générale et au corpus en tant qu’objet linguistique en particulier. En ce qui concerne la linguistique de corpus, nous tentons de présenter les différentes méthodologies auxquelles les linguistes ont recours lorsqu’il s’agit de consulter des données : introspection, élicitation ou consultation de données authentiques. Le concept de corpus est ensuite analysé selon un ensemble de critères définitoires que nous étudions en détail, afin de proposer une définition du corpus linguistique. Le troisième et dernier chapitre est la mise en application des constats théoriques dans la constitution du corpus CIL-FLE : nous détaillons lesconstituants du corpus, les protocoles de collecte et d’archivage. C’est au protocole de transcription que nous nous intéressons en particulier, en insistant sur les difficultés de la transcription de l’interlangue. Le corpus CILFLE, qui représente environ 105000 mots, représente le fruit de ce travail et sera ainsi détaillé. / The need to design linguistic corpora to support research in linguistics has triggered the development of numerous studies exploring various approaches and methodologies regarding good practices for written corpus building. Fewer studies are available when it comes to spoken data and those that concern the interlanguage of learners are even rarer. The CIL project (Corpus Inter Langue), under completion at the University of Rennes2 and supervised by a research team specialising in the fields of linguistics and pedagogy (LIDILE), aims at building a large corpus of written and spoken productions in EFL and in FFL. This phd dissertation mainly focuses on the FFL (French as a Foreign Language) corpus (CIL-FLE).The first chapter of the thesis is dedicated to the study of oral speech as a linguistic object from both a historical and an epistemological perspective. The second chapter tackles the question of corpus linguistics generally speaking as well as the concept/ notion of corpus as a linguistic object. Regarding corpus linguistics, we will review and explore the diverse approaches and methods that are used so as to carry out research enquiries: introspection, elicitation or consultation of authentic data. The concept of corpus is then analysed according to/following a series of criteria which we will closely examine in order to propose a definition of the linguistic corpus. The third and last chapter will implement the former theoretical findings through the description of the CIL corpus design. Thus, corpus constituents, transcription and archiving protocols will be described in detail. We are particularly interested in the transcription protocol and we will insist on the difficulties encountered when attempting to transcribe learners ‘data. Finally, the CIL-FLE corpus, which contains approximately 105 000 words and was developed all along this phd, will be described.
4

Langage et maladie d'Alzheimer : analyse multidimensionnelle d'un discours pathologique / Language and Alzheimer’s disease : multidimensional analysis of pathological discourse

Lee, Hyeran 12 December 2012 (has links)
Nous proposons dans ce travail une analyse multidimensionnelle du vieillissement langagier normal et du vieillissement pathologique de type Alzheimer. Une analyse comparative du discours oral spontané a été réalisée à travers trois niveaux linguistiques : 1) le niveau phonético-phonologique ; 2) le niveau lexico-sémantique ; 3) le niveau syntaxique. Nos résultats révèlent que le discours produit par les patients atteints de la maladie d’Alzheimer se distingue de celui des personnes âgées saines par une parole disfluente, une réduction significative de la diversité du vocabulaire et de l’informativité du discours, et enfin, par une réduction remarquable de la complexité syntaxique. L’ensemble de nos résultats entend contribuer à améliorer notre connaissance de la sémiologie linguistique de la maladie d’Alzheimer. Nous montrons ainsi qu’une meilleure connaissance des troubles du langage associés à cette pathologie pourrait contribuer de façon pertinente à améliorer le diagnostic précoce et/ou différentiel de la maladie d’Alzheimer. Du point de vue applicatif, l’enjeu de cette recherche translationnelle vise l’élaboration d’un outil d’évaluation du langage adapté à la personne âgée démente. A travers ce travail de thèse, nous espérons avoir contribué au développement futur d’une prise en charge non médicamenteuse de type orthophonique visant le maintien, voire l’amélioration, de la capacité communicative des patients souffrant de la maladie d’Alzheimer. / This study deals with a multidimensional analysis of language attrition in normal aging and in Alzheimer’s disease. A comparative analysis of spontaneous speech was conducted through three linguistic levels : 1) the phonetic-phonological level ; 2) the lexical-semantic level ; 3) the syntactic level. Our results show that the discourse produced by Alzheimer patients differs significantly from that produced by healthy elderly by a more disfluent speech, a significant reduction of the vocabulary diversity and discourse informativeness, and finally, by a remarkable reduction in syntactic complexity. Our results contribute to understand better the linguistic profile of Alzheimer’s patients. We show that a better understanding of language disorders associated with this pathology may contribute in a meaningful way to improve early and / or differential diagnosis of Alzheimer’s disease. In term of application, the goal of this research is to develop a language assessment tool adapted to the demented elderly. Through this work we hope to have contributed to the further development of speech therapy (i.e. non-pharmacological treatment) useful for the maintenance or improvement of the communicative capacity of patients suffering from Alzheimer’ disease.
5

Analyse et détection automatique de disfluences dans la parole spontanée conversationnelle / Disfluency analysis and automatic detection in conversational spontaneous speech

Dutrey, Camille 16 December 2014 (has links)
Extraire de l'information de données langagières est un sujet de plus en plus d'actualité compte tenude la quantité toujours croissante d'information qui doit être régulièrement traitée et analysée, etnous assistons depuis les années 90 à l'essor des recherches sur des données de parole également. Laparole pose des problèmes supplémentaires par rapport à l'écrit, notamment du fait de la présence dephénomènes propres à l'oral (hésitations, reprises, corrections) mais aussi parce que les donnéesorales sont traitées par un système de reconnaissance automatique de la parole qui génèrepotentiellement des erreurs. Ainsi, extraire de l'information de données audio implique d'extraire del'information tout en tenant compte du « bruit » intrinsèque à l'oral ou généré par le système dereconnaissance de la parole. Il ne peut donc s'agir d'une simple application de méthodes qui ont faitleurs preuves sur de l'écrit. L'utilisation de techniques adaptées au traitement des données issues del'oral et prenant en compte à la fois leurs spécificités liées au signal de parole et à la transcription –manuelle comme automatique – de ce dernier représente un thème de recherche en pleindéveloppement et qui soulève de nouveaux défis scientifiques. Ces défis sont liés à la gestion de lavariabilité dans la parole et des modes d'expressions spontanés. Par ailleurs, l'analyse robuste deconversations téléphoniques a également fait l'objet d'un certain nombre de travaux dans lacontinuité desquels s'inscrivent ces travaux de thèse.Cette thèse porte plus spécifiquement sur l'analyse des disfluences et de leur réalisation dans desdonnées conversationnelles issues des centres d'appels EDF, à partir du signal de parole et destranscriptions manuelle et automatique de ce dernier. Ce travail convoque différents domaines, del'analyse robuste de données issues de la parole à l'analyse et la gestion des aspects liés àl'expression orale. L'objectif de la thèse est de proposer des méthodes adaptées à ces données, quipermettent d'améliorer les analyses de fouille de texte réalisées sur les transcriptions (traitement desdisfluences). Pour répondre à ces problématiques, nous avons analysé finement le comportement dephénomènes caractéristiques de l'oral spontané (disfluences) dans des données oralesconversationnelles issues de centres d'appels EDF, et nous avons mis au point une méthodeautomatique pour leur détection, en utilisant des indices linguistiques, acoustico-prosodiques,discursifs et para-linguistiques.Les apports de cette thèse s'articulent donc selon trois axes de recherche. Premièrement, nousproposons une caractérisation des conversations en centres d'appels du point de vue de l'oralspontané et des phénomènes qui le caractérisent. Deuxièmement, nous avons mis au point (i) unechaîne d'enrichissement et de traitement des données orales effective sur plusieurs plans d'analyse(linguistique, prosodique, discursif, para-linguistique) ; (ii) un système de détection automatique desdisfluences d'édition adapté aux données orales conversationnelles, utilisant le signal et lestranscriptions (manuelles ou automatiques). Troisièmement, d'un point de vue « ressource », nousavons produit un corpus de transcriptions automatiques de conversations issues de centres d'appelsannoté en disfluences d'édition (méthode semi-automatique). / Extracting information from linguistic data has gain more and more attention in the last decades inrelation with the increasing amount of information that has to be processed on a daily basis in the world. Since the 90’s, this interest for information extraction has converged to the development of researches on speech data. In fact, speech data involves extra problems to those encountered on written data. In particular, due to many phenomena specific to human speech (e.g. hesitations, corrections, etc.). But also, because automatic speech recognition systems applied on speech signal potentially generates errors. Thus, extracting information from audio data requires to extract information by taking into account the "noise" inherent to audio data and output of automatic systems. Thus, extracting information from speech data cannot be as simple as a combination of methods that have proven themselves to solve the extraction information task on written data. It comes that, the use of technics dedicated for speech/audio data processing is mandatory, and epsecially technics which take into account the specificites of such data in relation with the corresponding signal and transcriptions (manual and automatic). This problem has given birth to a new area of research and raised new scientific challenges related to the management of the variability of speech and its spontaneous modes of expressions. Furthermore, robust analysis of phone conversations is subject to a large number of works this thesis is in the continuity.More specifically, this thesis focuses on edit disfluencies analysis and their realisation in conversational data from EDF call centres, using speech signal and both manual and automatic transcriptions. This work is linked to numerous domains, from robust analysis of speech data to analysis and management of aspects related to speech expression. The aim of the thesis is to propose appropriate methods to deal with speech data to improve text mining analyses of speech transcriptions (treatment of disfluencies). To address these issues, we have finely analysed the characteristic phenomena and behavior of spontaneous speech (disfluencies) in conversational data from EDF call centres and developed an automatic method for their detection using linguistic, prosodic, discursive and para-linguistic features.The contributions of this thesis are structured in three areas of research. First, we proposed a specification of call centre conversations from the prespective of the spontaneous speech and from the phenomena that specify it. Second, we developed (i) an enrichment chain and effective processings of speech data on several levels of analysis (linguistic, acoustic-prosodic, discursive and para-linguistic) ; (ii) an system which detect automaticcaly the edit disfluencies suitable for conversational data and based on the speech signal and transcriptions (manual or automatic). Third, from a "resource" point of view, we produced a corpus of automatic transcriptions of conversations taken from call centres which has been annotated in edition disfluencies (using a semi-automatic method).
6

Étude de la réduction segmentale en français parlé à travers différents styles : apports des grands corpus et du traitement automatique de la parole à l’étude du schwa, du /ʁ/ et des réductions à segments multiples / Segmental reduction in spoken French through different speech styles : contributions of large speech corpora and automatic speech processing on schwa, /ʁ/ and reduction of multiple segments

Wu, Yaru 14 September 2018 (has links)
Ce travail sur la réduction segmentale (i.e. délétion ou réduction temporelle) en français spontané nous a permis non seulement de proposer deux méthodes de recherche pour les études en linguistique, mais également de nous interroger sur l'influence de différents facteurs de variation sur divers phénomènes de réduction et d'apporter des connaissances sur la propension à la réduction des segments. Nous avons appliqué la méthode descendante qui utilise l'alignement forcé avec variantes lorsqu’il s’agissait de phénomènes de réduction spécifiques. Lorsque ce n'était pas le cas, nous avons utilisé la méthode ascendante qui examine des segments absents et courts. Trois phénomènes de réduction ont été choisis : l'élision du schwa, la chute du /ʁ/ et la propension à la réduction des segments. La méthode descendante a été utilisée pour les deux premiers. Les facteurs en commun étudiés sont le contexte post-lexical, le style, le sexe et la profession. L’élision du schwa en syllabe initiale de mots polysyllabiques et la chute du /ʁ/ post-consonantique en finale de mots ne sont pas toujours influencées par les mêmes facteurs. De même, l’élision du schwa lexical et celle du schwa épenthétique ne sont pas conditionnées par les mêmes facteurs. L’étude sur la propension à la réduction des segments nous a permis d'appliquer la méthode ascendante et d’étudier la réduction des segments de manière générale. Les résultats suggèrent que les liquides et les glides résistent moins à la réduction que les autres consonnes et que les voyelles nasales résistent mieux à la réduction que les voyelles orales. Parmi les voyelles orales, les voyelles hautes arrondies ont tendance à être plus souvent réduites que les autres voyelles orales. / This study on segmental reduction (i.e. deletion or temporal reduction) in spontaneous French allows us to propose two research methods for linguistic studies on large corpora, to investigate different factors of variation and to bring new insights on the propensity of segmental reduction. We applied the descendant method using forced alignment with variants when it concerns a specific reduction phenomena. Otherwise, we used the ascendant method using absent and short segments as indicators. Three reduction phenomena are studied: schwa elision, /ʁ/ deletion and the propensity of segmental reduction. The descendant method was used for analyzing schwa elision and /ʁ/ deletion. Common factors used for the two studies are post-lexical context, speech style, sex and profession. Schwas elision at initial syllable position in polysyllabic words and post-consonantal /ʁ/ deletion at word final position are not always conditioned by the same variation factors. Similarly, lexical schwa and epenthetic schwa are not under the influence of the same variation factors. The study on the propensity of segmental reduction allows us to apply the ascendant method and to investigate segmental reduction in general. Results suggest that liquids and glides resist less the reduction procedure than other consonants and nasal vowels resist better reduction procedure than oral vowels. Among oral vowels, high rounded vowels tend to be reduced more often than other oral vowels.
7

Langage et maladie d'Alzheimer : analyse multidimensionnelle d'un discours pathologique

Lee, Hyeran 12 December 2012 (has links) (PDF)
Nous proposons dans ce travail une analyse multidimensionnelle du vieillissement langagier normal et du vieillissement pathologique de type Alzheimer. Une analyse comparative du discours oral spontané a été réalisée à travers trois niveaux linguistiques : 1) le niveau phonético-phonologique ; 2) le niveau lexico-sémantique ; 3) le niveau syntaxique. Nos résultats révèlent que le discours produit par les patients atteints de la maladie d'Alzheimer se distingue de celui des personnes âgées saines par une parole disfluente, une réduction significative de la diversité du vocabulaire et de l'informativité du discours, et enfin, par une réduction remarquable de la complexité syntaxique. L'ensemble de nos résultats entend contribuer à améliorer notre connaissance de la sémiologie linguistique de la maladie d'Alzheimer. Nous montrons ainsi qu'une meilleure connaissance des troubles du langage associés à cette pathologie pourrait contribuer de façon pertinente à améliorer le diagnostic précoce et/ou différentiel de la maladie d'Alzheimer. Du point de vue applicatif, l'enjeu de cette recherche translationnelle vise l'élaboration d'un outil d'évaluation du langage adapté à la personne âgée démente. A travers ce travail de thèse, nous espérons avoir contribué au développement futur d'une prise en charge non médicamenteuse de type orthophonique visant le maintien, voire l'amélioration, de la capacité communicative des patients souffrant de la maladie d'Alzheimer.
8

Évaluation de la parole dysarthrique : Apport du traitement automatique de la parole face à l’expertise humaine / Evaluation of deviant zones in pathological speech : contribution of the automatic speech processing against the Human expertise

Laaridh, Imed 17 February 2017 (has links)
La dysarthrie est un trouble de la parole affectant la réalisation motrice de la parole causée par des lésions du système nerveux central ou périphérique. Elle peut être liée à différentes pathologies : la maladie de Parkinson, la Sclérose Latérale Amyotrophique(SLA), un Accident Vasculaire Cérébral (AVC), etc. Plusieurs travaux de recherche ont porté sur la caractérisation des altérations liées à chaque pathologie afin de les regrouper dans des classes de dysarthrie. La classification la plus répandue est celle établie parF. L. Darley comportant 6 classes en 1969, (complétée par deux classes supplémentaires en 2005)Actuellement, l’évaluation perceptive (à l’oreille) reste le standard utilisé dans lapratique clinique pour le diagnostique et le suivi thérapeutique des patients. Cette approcheest néanmoins reconnue comme étant subjective, non reproductible et coûteuseen temps. Ces limites la rendent inadaptée à l’évaluation de larges corpus (dans le cadred’études phonétiques par exemple) ou pour le suivi longitudinal de l’évolution des patientsdysarthriques.Face à ces limites, les professionnels expriment constamment leur besoin de méthodesobjectives d’évaluation de la parole dysarthrique. Les outils de Traitement Automatiquede la Parole (TAP) ont été rapidement considérés comme des solutions potentiellespour répondre à cette demande.Le travail présenté dans ce rapport s’inscrit dans ce cadre et étudie l’apport quepeuvent avoir ces outils dans l’évaluation de la parole dysarthrique, et plus généralementpathologique.Dans ce travail, une approche pour la détection automatique des phonèmes anormauxdans la parole dysarthrique est proposée et son comportement est analysé surdifférents corpus comportant différentes pathologies, classes dysarthriques, niveaux desévérité de la maladie et styles de parole. Contrairement à la majorité des approchesproposées dans la littérature permettant des évaluations de la qualité globale de la parole(évaluation de la sévérité, intelligibilité, etc.), l’approche proposée se focalise surle niveau phonème dans le but d’atteindre une meilleure caractérisation de la dysarthrieet de permettre un feed-back plus précis et utile pour l’utilisateur (clinicien, phonéticien,patient). L’approche s’articule autours de deux phases essentielles : (1) unepremière phase d’alignement automatique de la parole au niveau phonème (2) uneclassification de ces phonèmes en deux classes : phonèmes normaux et anormaux. L’évaluation de l’annotation réalisée par le système par rapport à une évaluationperceptive d’un expert humain considérée comme ”référence“ montre des résultats trèsencourageants et confirme la capacité de l’approche à detecter les anomalies au niveauphonème. L’approche s’est aussi révélée capable de capter l’évolution de la sévéritéde la dysarthrie suggérant une potentielle application lors du suivi longitudinal despatients ou pour la prédiction automatique de la sévérité de leur dysarthrie.Aussi, l’analyse du comportement de l’outil d’alignement automatique de la paroleface à la parole dysarthrique a révélé des comportements dépendants des pathologieset des classes dysarthriques ainsi que des différences entre les catégories phonétiques.De plus, un effet important du style de parole (parole lue et spontanée) a été constatésur les comportements de l’outil d’alignement de la parole et de l’approche de détectionautomatique d’anomalies.Finalement, les résultats d’une campagne d’évaluation de l’approche de détectiond’anomalies par un jury d’experts sont présentés et discutés permettant une mise enavant des points forts et des limites du système. / Dysarthria is a speech disorder resulting from neurological impairments of the speechmotor control. It can be caused by different pathologies (Parkinson’s disease, AmyotrophicLateral Sclerosis - ALS, etc.) and affects different levels of speech production (respiratory,laryngeal and supra-laryngeal). The majority of research work dedicated tothe study of dysarthric speech relies on perceptual analyses. The most known study, byF. L. Darley in 1969, led to the organization and the classification of dysarthria within 6classes (completed with 2 additional classes in 2005).Nowadays, perceptual evaluation is still the most used method in clinical practicefor the diagnosis and the therapeutic monitoring of patients. However, this method isknown to be subjective, non reproductive and time-consuming. These limitations makeit inadequate for the evaluation of large corpora (in case of phonetic studies) or forthe follow-up of the progression of the condition of dysarthric patients. In order toovercome these limitations, professionals have been expressing their need of objectivemethods for the evaluation of disordered speech and automatic speech processing hasbeen early seen as a potential solution.The work presented in this document falls within this framework and studies thecontributions that these tools can have in the evaluation of dysarthric, and more generallypathological speech.In this work, an automatic approach for the detection of abnormal phones in dysarthricspeech is proposed and its behavior is analyzed on different speech corpora containingdifferent pathologies, dysarthric classes, dysarthria severity levels and speechstyles (read and spontaneous speech). Unlike the majority of the automatic methodsproposed in the literature that provide a global evaluation of the speech on generalitems such as dysarthria severity, intelligibility, etc., our proposed method focuses onthe phone level aiming to achieve a better characterization of dysarthria effects and toprovide a precise and useful feedback to the potential users (clinicians, phoneticians,patients). This method consists on two essential phases : (1) an automatic phone alignmentof the speech (2) an automatic classification of the resulting phones in two classes :normal and abnormal phones.When compared to an annotation of phone anomalies provided by a human expertconsidered to be the ”gold standard“, the approach showed encouraging results andproved to be able to detect anomalies on the phone level. The approach was also able to capture the evolution of the severity of the dysarthria suggesting a potential relevanceand use in the longitudinal follow-up of dysarthric patients or for the automatic predictionof their intelligibility or the severity of their dysarthria.Also, the automatic phone alignment precision was found to be dependent on the severity,the pathology, the class of the dysarthria and the phonetic category of each phone.Furthermore, the speech style was found to have an interesting effect on the behaviorsof both automatic phone alignment and anomaly detection.Finally, the results of an evaluation campaign conducted by a jury of experts on theannotations provided by the proposed approach are presented and discussed in orderto draw a panel of the strengths and limitations of the system.

Page generated in 0.0557 seconds