• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • Tagged with
  • 4
  • 4
  • 4
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Diagnóstico dos mecanismos disfluentes em orações relativas do português brasileiro / Diagnosis of disfluencies mechanisms in relative clauses of Brazilian portuguese

Thiago Quintanilha da Silva 13 April 2012 (has links)
Alguns estudos na área da Psicolinguística tratam sobre a interrupção da forma natural da fluência da fala. Essas suspensões são denominadas disfluências e podem ser de variados tipos como, por exemplo, repetições, substituições ou pausas. Entre alguns trabalhos sobre disfluências, destaca-se o realizado por Jaeger (2005), que tratou da omissão do relativizador that na língua inglesa e a possibilidade desse fator ser responsável pela criação de disfluências. Nessa mesma linha, objetivamos analisar as disfluências na camada dos relativizadores camada CP em língua portuguesa brasileira. Para isso, tomaram-se dados obtidos por Corrêa et al (2008) sobre produção de orações relativas. Nesse estudo, os autores, buscando verificar a complexidade da formulação de orações relativas, manipularam duas condições: plenamente planejada que reduziria a carga de processamento e, consequentemente, levaria à maior produção de orações relativas padrões e parcialmente planejada a qual aumentaria a carga de processamento e, consequentemente, maior produção de orações relativas cortadoras e resumptivas. Diante disso, sabendo que o planejamento de estruturas mais complexas pode ser um fator que gere mais sentenças disfluentes, resta saber em qual das condições, estipuladas por Corrêa et al (2008), haveria maior caso de disfluências. Acreditamos que a condição parcialmente planejada resultaria mais casos de disfluências em comparação à condição inteiramente planejada. Para verificação de tal hipótese, a presente pesquisa focou suas atenções no banco de dados de Corrêa et al (2008). Após determinados critérios, privilegiamos sentenças de orações relativas genitivas, orações relativas de objeto indireto funcional e orações relativas de objeto indireto lexical, pois tais seriam construções sintáticas mais complexas e passíveis de terem mais casos de disfluências. Identificadas e quantificadas todas as falas de interesse, criamos tabelas para melhor visualização das disfluências em localizações específicas na sentença como, por exemplo, antes da oração relativa (AOR), na oração relativa (NAOR) e depois da oração relativa (DPOR). Com tais dados analisados, verificamos que eles corroboravam a hipótese levantada: na condição parcialmente planejada há mais casos de disfluências do que na condição inteiramente planejada, principalmente quando se é focalizada a localização NAOR. Entre os principais resultados, percebemos que as disfluências do tipo pausas preenchidas aparecem em grande quantidade na localização NAOR, fator que revela uma característica especial da oração relativa. Essa disfluência, nesse trecho da sentença, revela que os falantes não somente fazem uma procura lexical, como também, um planejamento discursivo. Tais resultados nos motivaram a pensar em outras determinadas situações de pesquisa como, por exemplo, a análise das disfluências em sentenças de voz passiva / Some studies in Psycholinguistics area deal with the interruption of the natural form of fluency speech. These suspensions are called disfluencies and can be of various types, for example, repetitions, substitutions or pauses. Among some works about disfluency, the one made by Jaeger (2005) deserves attention. His research dealt with the omission of the relativizer that in English and the possibility of this factor being the responsible for the creation of disfluencies. With this in mind, we aimed to analyze disfluencies in the layer of relativizers - CP layer - in Brazilian Portuguese. For this, data were taken by Côrrea et al (2008) on production of relative clauses. In this study, the authors, trying to verify the complexity of the formulation of relative clauses, manipulated two conditions: totally planned which would reduce the processing load and, consequently, major production of standard relative clauses and partially planned which would increase the processing load and, therefore, major production of gap and resumptive relative clauses. So, knowing that the planning of more complex structures can be a factor that generates more disffluent sentences, the question in which of the conditions stipulated by Corrêa et al (2008), we would find major cases of disfluency. We believe that the condition partly planned results in more cases of disfluencies in comparison with the condition entirely planned. To investigate this hypothesis, this research has focused its attention on the database of Corrêa et al (2008). After certain criterions, were privileged sentences of genitive relative clauses, functional indirect object of relative clauses and lexical indirect object of relative clauses, because these would be syntactic constructions more complex and likely to have more cases of disfluencies. Once identified and quantified all kinds of speech that interested us, there were created tables in order to enable a better visualization of disfluencies in specific locations in sentences, for instance, before the relative clause (BRC), in relative clause (IRC) and after the relative clause (ARC). With such data analyzed, it was found that the data corroborate the hypothesis: in the partially planned condition there are more cases of disfluencies than there are in the totally planned condition, principally when the location IRC is focused. Among the main results, we noticed that the disfluencies such as filled pauses appear in large amounts in IRC location, a factor that reveals a special feature of the relative clause. This disfluency, in this stretch of the sentence, reveals that the speakers are not only looking for a lexical, but also a discursive planning. These results motivated us to think of some other research situations, for example, analysis of disfluencies in the passive voice sentences
2

Diagnóstico dos mecanismos disfluentes em orações relativas do português brasileiro / Diagnosis of disfluencies mechanisms in relative clauses of Brazilian portuguese

Thiago Quintanilha da Silva 13 April 2012 (has links)
Alguns estudos na área da Psicolinguística tratam sobre a interrupção da forma natural da fluência da fala. Essas suspensões são denominadas disfluências e podem ser de variados tipos como, por exemplo, repetições, substituições ou pausas. Entre alguns trabalhos sobre disfluências, destaca-se o realizado por Jaeger (2005), que tratou da omissão do relativizador that na língua inglesa e a possibilidade desse fator ser responsável pela criação de disfluências. Nessa mesma linha, objetivamos analisar as disfluências na camada dos relativizadores camada CP em língua portuguesa brasileira. Para isso, tomaram-se dados obtidos por Corrêa et al (2008) sobre produção de orações relativas. Nesse estudo, os autores, buscando verificar a complexidade da formulação de orações relativas, manipularam duas condições: plenamente planejada que reduziria a carga de processamento e, consequentemente, levaria à maior produção de orações relativas padrões e parcialmente planejada a qual aumentaria a carga de processamento e, consequentemente, maior produção de orações relativas cortadoras e resumptivas. Diante disso, sabendo que o planejamento de estruturas mais complexas pode ser um fator que gere mais sentenças disfluentes, resta saber em qual das condições, estipuladas por Corrêa et al (2008), haveria maior caso de disfluências. Acreditamos que a condição parcialmente planejada resultaria mais casos de disfluências em comparação à condição inteiramente planejada. Para verificação de tal hipótese, a presente pesquisa focou suas atenções no banco de dados de Corrêa et al (2008). Após determinados critérios, privilegiamos sentenças de orações relativas genitivas, orações relativas de objeto indireto funcional e orações relativas de objeto indireto lexical, pois tais seriam construções sintáticas mais complexas e passíveis de terem mais casos de disfluências. Identificadas e quantificadas todas as falas de interesse, criamos tabelas para melhor visualização das disfluências em localizações específicas na sentença como, por exemplo, antes da oração relativa (AOR), na oração relativa (NAOR) e depois da oração relativa (DPOR). Com tais dados analisados, verificamos que eles corroboravam a hipótese levantada: na condição parcialmente planejada há mais casos de disfluências do que na condição inteiramente planejada, principalmente quando se é focalizada a localização NAOR. Entre os principais resultados, percebemos que as disfluências do tipo pausas preenchidas aparecem em grande quantidade na localização NAOR, fator que revela uma característica especial da oração relativa. Essa disfluência, nesse trecho da sentença, revela que os falantes não somente fazem uma procura lexical, como também, um planejamento discursivo. Tais resultados nos motivaram a pensar em outras determinadas situações de pesquisa como, por exemplo, a análise das disfluências em sentenças de voz passiva / Some studies in Psycholinguistics area deal with the interruption of the natural form of fluency speech. These suspensions are called disfluencies and can be of various types, for example, repetitions, substitutions or pauses. Among some works about disfluency, the one made by Jaeger (2005) deserves attention. His research dealt with the omission of the relativizer that in English and the possibility of this factor being the responsible for the creation of disfluencies. With this in mind, we aimed to analyze disfluencies in the layer of relativizers - CP layer - in Brazilian Portuguese. For this, data were taken by Côrrea et al (2008) on production of relative clauses. In this study, the authors, trying to verify the complexity of the formulation of relative clauses, manipulated two conditions: totally planned which would reduce the processing load and, consequently, major production of standard relative clauses and partially planned which would increase the processing load and, therefore, major production of gap and resumptive relative clauses. So, knowing that the planning of more complex structures can be a factor that generates more disffluent sentences, the question in which of the conditions stipulated by Corrêa et al (2008), we would find major cases of disfluency. We believe that the condition partly planned results in more cases of disfluencies in comparison with the condition entirely planned. To investigate this hypothesis, this research has focused its attention on the database of Corrêa et al (2008). After certain criterions, were privileged sentences of genitive relative clauses, functional indirect object of relative clauses and lexical indirect object of relative clauses, because these would be syntactic constructions more complex and likely to have more cases of disfluencies. Once identified and quantified all kinds of speech that interested us, there were created tables in order to enable a better visualization of disfluencies in specific locations in sentences, for instance, before the relative clause (BRC), in relative clause (IRC) and after the relative clause (ARC). With such data analyzed, it was found that the data corroborate the hypothesis: in the partially planned condition there are more cases of disfluencies than there are in the totally planned condition, principally when the location IRC is focused. Among the main results, we noticed that the disfluencies such as filled pauses appear in large amounts in IRC location, a factor that reveals a special feature of the relative clause. This disfluency, in this stretch of the sentence, reveals that the speakers are not only looking for a lexical, but also a discursive planning. These results motivated us to think of some other research situations, for example, analysis of disfluencies in the passive voice sentences
3

Segmentação de sentenças e detecção de disfluências em narrativas transcritas de testes neuropsicológicos / Sentence Segmentation and Disfluency Detection in Narrative Transcripts from Neuropsychological Tests

Treviso, Marcos Vinícius 20 December 2017 (has links)
Contexto: Nos últimos anos, o Comprometimento Cognitivo Leve (CCL) tem recebido uma grande atenção, pois pode representar um estágio pré-clínico da Doença de Alzheimer (DA). Em termos de distinção entre idosos saudáveis (CTL) e pacientes com CCL, vários estudos têm mostrado que a produção de discurso é uma tarefa sensível para detectar efeitos de envelhecimento e para diferenciar indivíduos com CCL dos saudáveis. Ferramentas de Processamento de Língua Natural (PLN) têm sido aplicadas em transcrições de narrativas em inglês e também em português brasileiro, por exemplo, o ambiente Coh-Metrix-Dementia. Lacunas: No entanto, a ausência de informações de limites de sentenças e a presença de disfluências em transcrições impedem a aplicação direta de ferramentas que dependem de um texto bem formado, como taggers e parsers. Objetivos: O objetivo principal deste trabalho é desenvolver métodos para segmentar as transcrições em sentenças e detectar/remover as disfluências presentes nelas, de modo que sirvam como uma etapa de pré-processamento para ferramentas subsequentes de PLN. Métodos e Avaliação: Propusemos um método baseado em redes neurais recorrentes convolucionais (RCNNs) com informações prosódicas, morfossintáticas e word embeddings para a tarefa de segmentação de sentenças (SS). Já para a detecção de disfluências (DD), dividimos o método e a avaliação de acordo com as categorias de disfluências: (i) para preenchimentos (pausas preenchidas e marcadores discursivos), propusemos a mesma RCNN com as mesmas features de SS em conjunto com uma lista pré-determinada de palavras; (ii) para disfluências de edição (repetições, revisões e recomeços), adicionamos features tradicionalmente empregadas em trabalhos relacionados e introduzimos um modelo de CRF na camada de saída da RCNN. Avaliamos todas as tarefas intrinsecamente, analisando as features mais importantes, comparando os métodos propostos com métodos mais simples, e identificando os principais acertos e erros. Além disso, um método final, chamado DeepBonDD, foi criado combinando todas as tarefas, e foi avaliado extrinsecamente com 9 métricas sintáticas do Coh-Metrix-Dementia. Conclusão: Para SS, obteve-se F1 = 0:77 em transcrições de CTL e F1 = 0:74 de CCL, caracterizando o estado-da-arte para esta tarefa em fala comprometida. Para detecção de preenchimentos, obtevese em média F1 = 0:90 para CTL e F1 = 0:92 para CCL, resultados que estão dentro da margem de trabalhos relacionados da língua inglesa. Ao serem ignorados os recomeços na detecção de disfluências de edição, obteve-se em média F1 = 0:70 para CTL e F1 = 0:75 para CCL. Na avaliação extrínseca, apenas 3 métricas mostraram diferença significativa entre as transcrições de CCL manuais e as geradas pelo DeepBonDD, sugerindo que, apesar das variações de limites de sentença e de disfluências, o DeepBonDD é capaz de gerar transcrições para serem processadas por ferramentas de PLN. / Background: In recent years, mild cognitive impairment (MCI) has received great attention because it may represent a pre-clinical stage of Alzheimers Disease (AD). In terms of distinction between healthy elderly (CTL) and MCI patients, several studies have shown that speech production is a sensitive task to detect aging effects and to differentiate individuals with MCI from healthy ones. Natural language procesing tools have been applied to transcripts of narratives in English and also in Brazilian Portuguese, for example, Coh-Metrix-Dementia. Gaps: However, the absence of sentence boundary information and the presence of disfluencies in transcripts prevent the direct application of tools that depend on well-formed texts, such as taggers and parsers. Objectives: The main objective of this work is to develop methods to segment the transcripts into sentences and to detect the disfluencies present in them (independently and jointly), to serve as a preprocessing step for the application of subsequent Natural Language Processing (NLP) tools. Methods and Evaluation: We proposed a method based on recurrent convolutional neural networks (RCNNs) with prosodic, morphosyntactic and word embeddings features for the sentence segmentation (SS) task. For the disfluency detection (DD) task, we divided the method and the evaluation according to the categories of disfluencies: (i) for fillers (filled pauses and discourse marks), we proposed the same RCNN with the same SS features along with a predetermined list of words; (ii) for edit disfluencies (repetitions, revisions and restarts), we added features traditionally employed in related works and introduced a CRF model after the RCNN output layer. We evaluated all the tasks intrinsically, analyzing the most important features, comparing the proposed methods to simpler ones, and identifying the main hits and misses. In addition, a final method, called DeepBonDD, was created combining all tasks and was evaluated extrinsically using 9 syntactic metrics of Coh-Metrix-Dementia. Conclusion: For SS, we obtained F1 = 0:77 in CTL transcripts and F1 = 0:74 in MCI, achieving the state of the art for this task on impaired speech. For the filler detection, we obtained, on average, F1 = 0:90 for CTL and F1 = 0:92 for MCI, results that are similar to related works of the English language. When restarts were ignored in the detection of edit disfluencies, F1 = 0:70 was obtained for CTL and F1 = 0:75 for MCI. In the extrinsic evaluation, only 3 metrics showed a significant difference between the manual MCI transcripts and those generated by DeepBonDD, suggesting that, despite result differences in sentence boundaries and disfluencies, DeepBonDD is able to generate transcriptions to be properly processed by NLP tools.
4

Segmentação de sentenças e detecção de disfluências em narrativas transcritas de testes neuropsicológicos / Sentence Segmentation and Disfluency Detection in Narrative Transcripts from Neuropsychological Tests

Marcos Vinícius Treviso 20 December 2017 (has links)
Contexto: Nos últimos anos, o Comprometimento Cognitivo Leve (CCL) tem recebido uma grande atenção, pois pode representar um estágio pré-clínico da Doença de Alzheimer (DA). Em termos de distinção entre idosos saudáveis (CTL) e pacientes com CCL, vários estudos têm mostrado que a produção de discurso é uma tarefa sensível para detectar efeitos de envelhecimento e para diferenciar indivíduos com CCL dos saudáveis. Ferramentas de Processamento de Língua Natural (PLN) têm sido aplicadas em transcrições de narrativas em inglês e também em português brasileiro, por exemplo, o ambiente Coh-Metrix-Dementia. Lacunas: No entanto, a ausência de informações de limites de sentenças e a presença de disfluências em transcrições impedem a aplicação direta de ferramentas que dependem de um texto bem formado, como taggers e parsers. Objetivos: O objetivo principal deste trabalho é desenvolver métodos para segmentar as transcrições em sentenças e detectar/remover as disfluências presentes nelas, de modo que sirvam como uma etapa de pré-processamento para ferramentas subsequentes de PLN. Métodos e Avaliação: Propusemos um método baseado em redes neurais recorrentes convolucionais (RCNNs) com informações prosódicas, morfossintáticas e word embeddings para a tarefa de segmentação de sentenças (SS). Já para a detecção de disfluências (DD), dividimos o método e a avaliação de acordo com as categorias de disfluências: (i) para preenchimentos (pausas preenchidas e marcadores discursivos), propusemos a mesma RCNN com as mesmas features de SS em conjunto com uma lista pré-determinada de palavras; (ii) para disfluências de edição (repetições, revisões e recomeços), adicionamos features tradicionalmente empregadas em trabalhos relacionados e introduzimos um modelo de CRF na camada de saída da RCNN. Avaliamos todas as tarefas intrinsecamente, analisando as features mais importantes, comparando os métodos propostos com métodos mais simples, e identificando os principais acertos e erros. Além disso, um método final, chamado DeepBonDD, foi criado combinando todas as tarefas, e foi avaliado extrinsecamente com 9 métricas sintáticas do Coh-Metrix-Dementia. Conclusão: Para SS, obteve-se F1 = 0:77 em transcrições de CTL e F1 = 0:74 de CCL, caracterizando o estado-da-arte para esta tarefa em fala comprometida. Para detecção de preenchimentos, obtevese em média F1 = 0:90 para CTL e F1 = 0:92 para CCL, resultados que estão dentro da margem de trabalhos relacionados da língua inglesa. Ao serem ignorados os recomeços na detecção de disfluências de edição, obteve-se em média F1 = 0:70 para CTL e F1 = 0:75 para CCL. Na avaliação extrínseca, apenas 3 métricas mostraram diferença significativa entre as transcrições de CCL manuais e as geradas pelo DeepBonDD, sugerindo que, apesar das variações de limites de sentença e de disfluências, o DeepBonDD é capaz de gerar transcrições para serem processadas por ferramentas de PLN. / Background: In recent years, mild cognitive impairment (MCI) has received great attention because it may represent a pre-clinical stage of Alzheimers Disease (AD). In terms of distinction between healthy elderly (CTL) and MCI patients, several studies have shown that speech production is a sensitive task to detect aging effects and to differentiate individuals with MCI from healthy ones. Natural language procesing tools have been applied to transcripts of narratives in English and also in Brazilian Portuguese, for example, Coh-Metrix-Dementia. Gaps: However, the absence of sentence boundary information and the presence of disfluencies in transcripts prevent the direct application of tools that depend on well-formed texts, such as taggers and parsers. Objectives: The main objective of this work is to develop methods to segment the transcripts into sentences and to detect the disfluencies present in them (independently and jointly), to serve as a preprocessing step for the application of subsequent Natural Language Processing (NLP) tools. Methods and Evaluation: We proposed a method based on recurrent convolutional neural networks (RCNNs) with prosodic, morphosyntactic and word embeddings features for the sentence segmentation (SS) task. For the disfluency detection (DD) task, we divided the method and the evaluation according to the categories of disfluencies: (i) for fillers (filled pauses and discourse marks), we proposed the same RCNN with the same SS features along with a predetermined list of words; (ii) for edit disfluencies (repetitions, revisions and restarts), we added features traditionally employed in related works and introduced a CRF model after the RCNN output layer. We evaluated all the tasks intrinsically, analyzing the most important features, comparing the proposed methods to simpler ones, and identifying the main hits and misses. In addition, a final method, called DeepBonDD, was created combining all tasks and was evaluated extrinsically using 9 syntactic metrics of Coh-Metrix-Dementia. Conclusion: For SS, we obtained F1 = 0:77 in CTL transcripts and F1 = 0:74 in MCI, achieving the state of the art for this task on impaired speech. For the filler detection, we obtained, on average, F1 = 0:90 for CTL and F1 = 0:92 for MCI, results that are similar to related works of the English language. When restarts were ignored in the detection of edit disfluencies, F1 = 0:70 was obtained for CTL and F1 = 0:75 for MCI. In the extrinsic evaluation, only 3 metrics showed a significant difference between the manual MCI transcripts and those generated by DeepBonDD, suggesting that, despite result differences in sentence boundaries and disfluencies, DeepBonDD is able to generate transcriptions to be properly processed by NLP tools.

Page generated in 0.0263 seconds