• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 234
  • 11
  • 7
  • 3
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 260
  • 202
  • 159
  • 125
  • 125
  • 124
  • 124
  • 124
  • 124
  • 124
  • 118
  • 52
  • 52
  • 45
  • 39
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
191

Características de la producción del habla en niños de 5 a 7 años según el frenillo lingual de una institución educativa particular del distrito de Carabayllo, 2021

Santa Cruz Valladares, Giuliana 10 October 2023 (has links)
La presente investigación realizada bajo un enfoque cuantitativo, de tipo no experimental y de diseño transeccional descriptivo, cuyo objetivo fue describir las características de la producción del habla en niños de 5 a 7 años con frenillo lingual adecuado y alterado de una institución educativa del distrito de Carabayllo. Para el recojo de datos se utilizó la técnica de observación sistemática y el protocolo de evaluación de frenillo de lengua de Irene Marchesan adaptado a Lima-Perú por Rivera y Susaníbar (2014) a una población de 30 niños de una institución educativa del distrito de Carabayllo. Los resultados indican que el 70% de los niños presentan frenillo lingual adecuado, mientras que un 30% presentan frenillo lingual alterado. Los niños con frenillo lingual adecuado, no presentaron alteraciones en el habla, mientras que los niños con frenillo lingual alterado, presentaron alteraciones en la producción de los fonos vibrante múltiple /r/, vibrante simple /r/ y grupos consonánticos de /r/. Se concluye que los niños con frenillo lingual alterado presentan alteraciones en la producción del habla, específicamente en la emisión de fonemas vibrantes y grupos consonánticos / This is a descriptive, non-experimental, cross-sectional research paper with a quantitative approach. Its purpose was to describe the speech production characteristics of 5-to 7- year-old children with adequate and altered lingual frenulum of a private educational institution. For data collection, the systematic observation technique and the lingual frenulum evaluation protocol by Irene Marchesan adapted to Lima-Peru by Rivera and Susaníbar (2014) were used on a population of 30 children from a private educational institution in the district of Carabayllo. The results show that 70% of children have an adequate lingual frenulum, while 30% have an altered lingual frenulum. Children with an adequate lingual frenulum did not present speech alterations, while children with altered lingual frenulum presented alterations in the production of the alveolar trill /r/, alveolar tap /r/ and consonant clusters /r/. It is concluded that children with altered lingual frenulum have alterations in speech production, especially in the emission of vibrating phonemes and consonant clusters
192

Intervención en Tartamudez en cuatro niños con diagnóstico de Tartamudez del Desarrollo de Lima Metropolitana

Benites Carbajal, Ana María Haydee, Villacorta Alfaro, Karla Isabel 12 February 2020 (has links)
La intervención en tartamudez beneficia a los niños disminuyendo sus disfluencias e incrementando sus habilidades comunicativas. El objetivo de la investigación fue determinar el efecto de la intervención en tartamudez en 4 niños con tartamudez del desarrollo de Lima Metropolitana. La investigación es tipo mixto y diseño integración múltiple. La muestra fue elegida de manera intencional y estuvo conformada por dos niños de 4 años y dos de 6 años de edad. La selección se dio después de una evaluación fonoaudiológica, donde se diagnosticó tartamudez del desarrollo. Se utilizó el Protocolo del Perfil de la Fluidez del habla, el Instrumento de Severidad de la Tartamudez y el Protocolo de Riesgo para la Tartamudez del Desarrollo para las evaluaciones. El tratamiento fue de 3 meses. Los resultados mostraron efectividad en todos los casos, quienes aumentaron el flujo de palabras y sílabas por minuto, disminuyeron las tipologías de las disfluencias, los puntajes de severidad y riesgo para la tartamudez. Se concluyó que, la intervención comprobó su efectividad en todos los casos. / Intervention in stuttering benefits children by decreasing their disfluencies and increasing their communication skills. The objective of the research is to determine the effect of the stuttering intervention in 4 children with development stuttering of Lima Metropolitana. The research is mixed type and multiple integration design. The sample is chosen intentionally and consists of 2 children of 4 years old and 2 of 6 years old. The selection is after a phonoaudiological evaluation, where development stuttering was diagnosed. The Speech Fluency Profile Protocol, the Stuttering Severity Instrument and the Development Stuttering Risk Protocol for the evaluations were used. The treatment lasted 3 months. The results showed effectiveness in all cases, which increased the flow of words and syllables per minute, decreased the typologies of disfluencies, the severity scores and risk for stuttering. It was concluded that the intervention proved its effectiveness in all cases.
193

Conocimiento del Trastorno Especifico del Lenguaje en Docentes y Psicólogos de la ciudad de Arequipa

Angles Angles, Gloria Isabel, Gutiérrez Navarro, Cynthia Magdalena 05 July 2021 (has links)
Esta investigación de tipo descriptiva, fue elaborada con el propósito de conocer el nivel de conocimiento en docentes y psicólogos sobre el Trastorno Específico del Lenguaje (TEL). Para lo cual se aplicó el cuestionario de conocimientos del trastorno específico del lenguaje a 98 personas, de las cuales, 42 fueron psicólogos y 56 docentes. Estos participantes resolvieron el cuestionario que consta de 31 ítems agrupados en 5 dimensiones: definición, características, causas, intervención y epidemiología. Asimismo, mediante un análisis se obtuvo que el conocimiento del TEL, se encontró en nivel deficiente con un porcentaje de 31,0%en psicólogos y 17,9%en docentes. Entre las discusiones subjetivas, el nivel de desconocimiento entre docentes y psicólogos no es de reciente data, pues existe un trabajo que refiere que esta situación problemática se encuentra presente por lo menos hace 20 años, por lo que se concluye que es necesario contar con mayor información específica acerca de este trastorno. Motivo por el cual es necesario que los docentes y psicólogos no prescindan en requerir mayor información acerca del trastorno específico de lenguaje, a partir de la formación académica de pre grado hasta capacitaciones externas y actualizaciones. / This descriptive research was developed with the purpose of knowing the level of knowledge in teachers and psychologists about the Specific Language Disorder (TEL). For which the questionnaire of knowledge of the specific language disorder was applied to 98 people, of which 42 were psychologists and 56 teachers. These participants solved the questionnaire consisting of 31 items grouped into 5 dimensions: definition, characteristics, causes, intervention and epidemiology. Likewise, through an analysis it was obtained that the knowledge of the TEL was found at a deficient level with a percentage of 31.0% in psychologists and 17.9% in teachers. Among subjective discussions, the level of ignorance between teachers and psychologists is not recent, as there is a work that refers to this problematic situation has been present for at least 20 years, so it is concluded that it is necessary to have more specific information about this disorder. Reason why it is necessary that teachers and psychologists do not dispense with requiring more information about the specific language disorder, from pre-grade academic training to external training and updates.
194

Adaptación de la batería Bedside de lenguaje para la evaluación de la afasia.

Quintana Vicente, Pamela Consuelo, Gensollen Durand, Jair Emmanuel 24 February 2015 (has links)
El objetivo del presente estudio es lograr la adaptación válida y confiable de la batería Bedside de lenguaje para su uso en la evaluación de la afasia en pacientes afásicos que se atienden en algunos hospitales de Lima y Callao. La batería Bedside de Lenguaje es un instrumento de cribaje (screening) diseñado para la detección de afasias tras una lesión cerebral, es de rápida y simple aplicación al pie de la cama, y puede ser utilizado por médicos o especialistas de lenguaje. Evalúa cinco dominios lingüísticos: Lenguaje espontáneo, Comprensión, Repetición, Escritura, Lectura. La puntuación máxima obtenible es 26, es de fácil corrección, con puntos de corte bien establecidos, y ofrece una excelente especificidad para la detección de la afasia y una buena correlación con pruebas formales como el Test de Boston para el diagnóstico de la afasia. La muestra estuvo conformada por 100 pacientes afásicos entre 18 y 89 años que se encontraban con tiempo de evolución dentro del periodo de 0 a 2 años luego de haber sufrido el daño cerebral, y que se atendieron en el Instituto Nacional de Rehabilitación del Callao, el Hospital Dos de Mayo, el Hospital Geriátrico de la Policía y el Hospital Nacional Guillermo Almenara Irigoyen. Los resultados indican que la batería Bedside adaptada es confiable y válida (alfa de Crombach 0.956, sig < .001) y ningún ítem ha sido objetado por criterio de jueces. Así mismo indican una excelente consistencia interna de la prueba adaptada. Además se calculó el coeficiente de Spearman Brown (0.876; sig <.001), siendo este último también altamente significativo. / A comprehensive evaluation of speech and language puts a lot of stress on the patient with a cerebral lesion. The battery Bedside of Language (BL) is short in duration and it is designed to presume a diagnosis of aphasia in patients with cerebral lesions. The present applied research is directed to validate the battery Bedside of Language in an urban population of adults from Peru (18-89 years old). The items were analyzed with U de Mann Whitney, for comparison, and rho de Spearman for correlations. The validity was determined by judges’ expert criteria and the Spearman-Brown Split half coefficient. A total of 100 subjects were evaluated using the battery BL and five linguistic dimensions were evaluated which were: spontaneous language, comprehension, repetition, writing and lecture. The maximum possible score is 26 with the cut-off score very well established. It was found that the battery BL has high feasibility and internal consistency. Alpha de Crombach for all the linguistic dimensions aforementioned was 0,956. Also when comparing the total of each scale with the grand total of the BL, subjects with presumed diagnosis of aphasia versus subjects with no diagnosis of aphasia; the U de Mann Whitney fluctuated between 5.287 and 6.706 which was highly significant and shows an excellent criterion-related validity as well. The results indicated that the battery BL is a potentially useful tool for predicting aphasia and sensible to the changes in the acute stages of language disorders.
195

Alteraciones del habla en niños de 6 y 7 años de edad con frenillo lingual alterado del Colegio Santa Rita de Casia

Dávila Gerónimo, Yulisa Merly, Parrales Robles, Rosa Azucena 18 October 2018 (has links)
La presente investigación es de tipo no experimental y diseño transeccional descriptivo y tiene como objetivo general describir las alteraciones del habla en niños de 6 y 7 años de edad con frenillo lingual alterado del colegio Santa Rita de Casia. Para la recolección de datos se utilizó la técnica de la observación sistemática y la aplicación del Protocolo de Evaluación del Frenillo de la Lengua a una población de 102 niños de 6 y 7 años obteniendo como muestra 14 niños quienes representan el 14% de la población investigada. En la muestra investigada se observa que las alteraciones en el habla son principalmente las distorsiones, presentes en un 79% en el habla espontánea y nominación de figuras, y 71% en el habla automática. Los fones que se ven más afectados en los niños que presentan frenillo lingual alterado son /s/ y el vibrante múltiple /r/. El frenillo lingual alterado causa dificultades en la producción del habla así como también en la movilidad de la lengua y alteraciones en la forma del ápice lingual.
196

Comparación del perfil lingüístico de niños diagnosticados con Trastorno por déficit de atención con hiperactividad (TDAH) y Trastorno específico del lenguaje (TEL)

Peña Villanueva, Nancy Katterine, Pérez Rodríguez, Alison Andrea 05 July 2021 (has links)
La investigación consistió en comparar el perfil lingüístico (léxico semántico, morfosintaxis, fonético fonológico y pragmático) de niños diagnosticados con Trastorno Específico del Lenguaje (TEL) y niños con Trastorno por déficit de atención con hiperactividad (TDAH), para ello se aplicó la prueba CELF-4 cuya finalidad es evaluar las facultades del lenguaje, detectar desórdenes del lenguaje y medir la eficacia del tratamiento. La muestra estuvo conformada por 10 niños de 7 a 9 años de edad, 5 diagnosticados con Trastorno Específico del Lenguaje y 5 diagnosticados con Trastorno por déficit de atención con hiperactividad, los cuales estudiaban en colegios de Lima Metropolitana. Los resultados obtenidos en la investigación evidencian que no existen diferencias estadísticamente significativas en los cuatro componentes del lenguaje entre un grupo de niños diagnosticados con TEL y el grupo de niños diagnosticados con TDAH. / The research consisted in comparing the linguistic profile (lexicon semantic, morphosyntactic, phonetic phonological and pragmatic) between children diagnosed with Specific Language Disorder (SLD) and children with Attention Deficit Hyperactivity Disorder (ADHD). To measure the linguistic profile the CELF-4 test was applied, whose purpose is to evaluate the language faculties, detect language disorders and measure the effectiveness of the treatment. |The sample consisted of 10 children between 7 and 9 years of age, 5 diagnosed with Specific Language Disorder and 5 diagnosed with Attention Deficit Hyperactivity Disorder respectively. The results obtained in the investigation show that .there is no significant differences in lexicon semantic, morphosyntactic, phonological and pragmatic level.
197

Medidas de los tercios faciales y características del frenillo lingual en adolescentes de un centro educativo del Callao

Carlos Rojas, Elizabeth Ivon, García Cavero, Roxana Gabriela 03 May 2018 (has links)
La evaluación en motricidad orofacial considera múltiples criterios, entre ellos, la medida de los tercios faciales y las características del frenillo lingual. El primero, nos permite designar el biotipo facial que presenta el paciente; el cual puede estar asociado a alguna alteración y nos sugiere un esquema básico de tratamiento. El segundo, características del frenillo lingual, es necesario conocer qué tipo de frenillos presenta la población y cómo se relaciona con la producción del habla; dicha relación tiene un sustento teórico y además nos permite corroborar estudios ya realizados acerca del tema. La presente investigación es de tipo exploratoria cuyo objetivo es conocer el tipo facial y las características del frenillo lingual en adolescentes. Para obtener dicha información utilizamos tres instrumentos: a) Protocolo de evaluación miofuncional, b) Protocolo del frenillo lingual y c) Calibrador digital. La muestra está compuesta por 307 estudiantes con edades entre 15 y 18 años; pertenecientes a la Institución Educativa. “Sor Ana de los Ángeles” del Callao. Los hallazgos evidencian que el tipo facial predominante es el mesofacial con 48%, seguido del dolicofacial con 37% y finaliza con 15% correspondiente al tipo braquifacial. Asimismo, hallamos un 12% de la población con alteración en el frenillo lingual, del cual el 11% corresponde a frenillo corto y 1% tiene frenillo anteriorizado; no se hallaron sujetos con alteración de frenillo corto y anteriorizado. El 12% de adolescentes con frenillo alterado son evaluados en habla espontánea y hallamos que, 20 adolescentes presentan dificultades en el habla, con alteración en la producción de fones linguodentales y alveolares. Al presentar la discusión de resultados inferimos que no existe relación entre el tipo facial y el frenillo de lengua alterado. No obstante, si evidenciamos una relación entre el frenillo alterado y la producción de habla. / The present investigation is of the exploratory type which target was to know the facial type and the characteristics of lingual bridle in adolescents. To obtain the above mentioned information we use three instruments: 1. Myofunctional evaluation protocol (section II), 2. Lingual bridle Protocol of language (section IV, V and VI.) and 3. Digital gage. It was 307 students who formed the sample. With ages between 15 and 18 years; belonging to “Sor Ana de los Angeles School” in Callao. The finds demonstrate that the predominant facial type was mesofacial with 48%, followed by the dolichofacial with 37 %, and finally with 15 % is the brachyfacial. Also we find 12 % with alteration in lingual bridle, of which 11 % corresponds to short lingual bridle and 1 % has anterior lingual bridle. There were not finds of people with short anterior lingual bridle. The adolescents with alteration in lingual bridle were evaluated in spontaneous speech; we found that of 37 adolescents, 20 present difficulties in the speech, with alteration in the production of dental and alveolar phonemes. While presenting the results discussions, we infer that there is no relation between the type of face and alteration lingual bridle of language. Nevertheless, we found a relation between the alteration in alteration lingual bridle and the speech production.
198

Características vocales y autopercepción de la voz de los estudiantes del II ciclo de las maestrías PUCP - CPAL 2020-2021

Gutiérrez Vidal, Gabriela Dora, Sandoval Huamán, Katherine Yuliana 04 June 2024 (has links)
Esta investigación busca identificar las Características y la autopercepción de la voz de los estudiantes del II ciclo de las Maestrías PUCP - CPAL 2020 - 2021. La investigación es básica y la muestra estuvo constituida por 27 participantes que accedieron al estudio, quienes fueron evaluadas individualmente a través de la plataforma Zoom utilizando el Análisis Perceptivo Auditivo de la voz de Mara Behlau 2009, el PRAAT VERSIÓN 6.0.33, el Índice de Desventaja Vocal (IDV) creado por Barbara H. Jacobson y col. en 1997 y de un cuestionario validado por un juicio de expertos, para establecer si existen o no diferencias entre la autopercepción de la voz y las características vocales de los participantes. La conclusión del estudio describe como es la autopercepción del II ciclo de las Maestrías PUCP - CPAL 2020 – 2021 según el análisis perceptivo auditivo realizado. Asimismo, se identifica que el 81% de los sujetos evaluados presentó una voz adecuada, siendo la característica más frecuente la disfonía (7%), la voz ronca (7%) soplada (5%). Finalmente, se concluye, que el 19% de los sujetos evaluados presentó algún tipo de problema en su voz durante el trabajo virtual. Siendo el dominio orgánico el de mayor incidencia, aun cuando no fue muy significativo. / This research seeks to identify the vocal characteristics and self-perception of the voice of the students of the II cycle of the Masters PUCP - CPAL 2020 - 2021. The sample consisted of 27 participants who agreed to participate in the study, who were evaluated individually through the Zoom platform due to the health emergency caused by the COVID-19 Pandemic. To carry out this research, a questionnaire validated by an expert judgment was elaborated, for the compilation of the data, in addition the Auditory Perceptual Analysis of Mara Behlau 2009 was used, the PRAAT VERSION 6.0.33 and the Index of Vocal Disadvantage (IDV) created by Barbara H. Jacobson et al. in 1997. The research belongs to a simple descriptive approach; Therefore, it identifies the voices of the students of the II cycle of the PUCP - CPAL Masters in the mention of Learning Difficulties and those of Speech Therapy with the mention in Language Disorders in Children and Adolescents, and Orofacial Motor, Voice and Stuttering, to from the conclusions found in the present study, it is clear that there is no relationship between the self-perception of the voice that the study subjects have and the auditory perceptual analysis carried out. Likewise, it is identified that 81% of the subjects evaluated presented an adequate voice, the most frequent characteristics being dysphonia (7%), hoarse voice (7%) and puffed voice (5%). Finally, it is concluded that 19% of the evaluated subjects presented some type of problem in their voice during virtual work. Being the organic domain the one with the highest incidence, even when it is not significant.
199

Producción de un corpus oral y modelado prosódico para la síntesis del habla expresiva

Iriondo Sanz, Ignasi 18 June 2008 (has links)
Aquesta tesi aborda diferents aspectes relacionats amb la síntesi de la parla expressiva. Es parteix de l'experiència prèvia en sistemes de conversió de text a parla del Grup en Processament Multimodal (GPMM) d'Enginyeria i Arquitectura La Salle, amb l'objectiu de millorar la capacitat expressiva d'aquest tipus de sistemes. La parla expressiva transmet informació paralingüística com, per exemple, l'emoció del parlant, el seu estat d'ànim, una determinada intenció o aspectes relacionats amb l'entorn o amb el seu interlocutor. Els dos objectius principals de la present tesi consisteixen, d'una banda, en el desenvolupament d'un corpus oral expressiu i, d'una altra, en la proposta d'un sistema de modelatge i predicció de la prosòdia per a la seva utilització en l'àmbit de la síntesi expressiva del parla.En primer lloc, es requereix un corpus oral adequat per a la generació d'alguns dels mòduls que componen un sistema de síntesi del parla expressiva. La falta de disponibilitat d'un recurs d'aquest tipus va motivar el desenvolupament d'un nou corpus. A partir de l'estudi dels procediments d'obtenció de parla emocionada o expressiva i de l'experiència prèvia del grup, es planteja el disseny, l'enregistrament, l'etiquetatge i la validació del nou corpus. El principal objectiu consisteix a aconseguir una elevada qualitat del senyal i una cobertura fonètica suficient (segmental i prosòdica), sense renunciar a l'autenticitat des del punt de vista de l'expressivitat oral. El corpus desenvolupat té una durada de més de cinc hores i conté cinc estils expressius: neutre, alegre, sensual, agressiu i trist. En tractar-se de parla expressiva obtinguda mitjançant la lectura de textos semànticament relacionats amb els estils definits, s'ha requerit un procés de validació que garanteixi que les locucions que formen el corpus incorporin el contingut expressiu desitjat. L'avaluació exhaustiva de tots els enunciats del corpus seria excessivament costosa en un corpus de gran grandària. D'altra banda, no existeix suficient coneixement científic per a emular completament la percepció subjectiva mitjançant tècniques automàtiques que permetin una validació exhaustiva i fiable dels corpus orals. En el present treball s'ha proposat un mètode que suposa un avanç cap a una solució pràctica i eficient d'aquest problema, mitjançant la combinació d'una avaluació subjectiva amb tècniques d'identificació automàtica de l'emoció en el parla. El mètode proposat s'utilitza per a portar a terme una revisió automàtica de l'expressivitat del corpus desenvolupat. Finalment, una prova subjectiva ha permès validar el correcte funcionament d'aquest procés automàtic. En segon lloc i, sobre la base dels coneixements actuals, de l'experiència adquirida i dels reptes que es desitjaven abordar, s'ha desenvolupat un sistema d'estimació de la prosòdia basat en corpus. Tal sistema es caracteritza per modelar de forma conjunta les funcions lingüística i paralingüística de la prosòdia a partir de l'extracció automàtica d'atributs prosòdics del text, que constitueixen l'entrada d'un sistema d'aprenentatge automàtic que prediu els trets prosòdics modelats prèviament. El sistema de modelatge prosòdic presentat en aquest treball es fonamenta en el raonament basat en casos, que es tracta d'una tècnica d'aprenentatge automàtic per analogia. Per a l'ajustament d'alguns paràmetres del sistema desenvolupat i per a la seva avaluació s'han utilitzat mesures objectives de l'error i de la correlació calculades en les locucions del conjunt de prova. Atès que les mesures objectives sempre es refereixen a casos concrets, no aporten informació sobre el grau d'acceptació que tindrà la parla sintetitzada en els oïdors. Per tant, s'han portat a terme una sèrie de proves de percepció en les quals un conjunt d'avaluadors ha puntuat un grup d'estímuls en cada estil. Finalment, s'han analitzat els resultats per a cada estil i s'han comparat amb les mesures objectives obtingudes, el que ha permès extreure algunes conclusions sobre la rellevància dels trets prosòdics en la parla expressiva, així com constatar que els resultats generats pel mòdul prosòdic han tingut una bona acceptació, encara que s'han produït diferències segons l'estil. / Esta tesis aborda diferentes aspectos relacionados con la síntesis del habla expresiva. Se parte de la experiencia previa en sistemas de conversión de texto en habla del Grup en Processament Multimodal (GPMM) de Enginyeria i Arquitectura La Salle, con el objetivo de mejorar la capacidad expresiva de este tipo de sistemas. El habla expresiva transmite información paralingüística como, por ejemplo, la emoción del hablante, su estado de ánimo, una determinada intención o aspectos relacionados con el entorno o con su interlocutor. Los dos objetivos principales de la presente tesis consisten, por una parte, en el desarrollo de un corpus oral expresivo y, por otra, en la propuesta de un sistema de modelado y predicción de la prosodia para su utilización en el ámbito de la síntesis expresiva del habla. En primer lugar, se requiere un corpus oral adecuado para la generación de algunos de los módulos que componen un sistema de síntesis del habla expresiva. La falta de disponibilidad de un recurso de este tipo motivó el desarrollo de un nuevo corpus. A partir del estudio de los procedimientos de obtención de habla emocionada o expresiva y de la experiencia previa del grupo, se plantea el diseño, la grabación, el etiquetado y la validación del nuevo corpus. El principal objetivo consiste en conseguir una elevada calidad de la señal y una cobertura fonética suficiente (segmental y prosódica), sin renunciar a la autenticidad desde el punto de vista de la expresividad oral. El corpus desarrollado tiene una duración de más de cinco horas y contiene cinco estilos expresivos: neutro, alegre, sensual, agresivo y triste. Al tratarse de habla expresiva obtenida mediante la lectura de textos semánticamente relacionados con los estilos definidos, se ha requerido un proceso de validación que garantice que las locuciones que forman el corpus incorporen el contenido expresivo deseado. La evaluación exhaustiva de todos los enunciados del corpus sería excesivamente costosa en un corpus de gran tamaño. Por otro lado, no existe suficiente conocimiento científico para emular completamente la percepción subjetiva mediante técnicas automáticas que permitan una validación exhaustiva y fiable de los corpus orales. En el presente trabajo se ha propuesto un método que supone un avance hacia una solución práctica y eficiente de este problema, mediante la combinación de una evaluación subjetiva con técnicas de identificación automática de la emoción en el habla. El método propuesto se utiliza para llevar a cabo una revisión automática de la expresividad del corpus desarrollado. Finalmente, una prueba subjetiva con oyentes ha permitido validar el correcto funcionamiento de este proceso automático.En segundo lugar y, sobre la base de los conocimientos actuales, a la experiencia adquirida y a los retos que se deseaban abordar, se ha desarrollado un sistema de estimación de la prosodia basado en corpus. Tal sistema se caracteriza por modelar de forma conjunta las funciones lingüística y paralingüística de la prosodia a partir de la extracción automática de atributos prosódicos del texto, que constituyen la entrada de un sistema de aprendizaje automático que predice los rasgos prosódicos modelados previamente. El sistema de modelado prosódico presentado en este trabajo se fundamenta en el razonamiento basado en casos que se trata de una técnica de aprendizaje automático por analogía. Para el ajuste de algunos parámetros del sistema desarrollado y para su evaluación se han utilizado medidas objetivas del error y de la correlación calculadas en las locuciones del conjunto de prueba. Dado que las medidas objetivas siempre se refieren a casos concretos, no aportan información sobre el grado de aceptación que tendrá el habla sintetizada en los oyentes. Por lo tanto, se han llevado a cabo una serie de pruebas de percepción en las que un conjunto de oyentes ha puntuado un grupo de estímulos en cada estilo. Finalmente, se han analizado los resultados para cada estilo y se han comparado con las medidas objetivas obtenidas, lo que ha permitido extraer algunas conclusiones sobre la relevancia de los rasgos prosódicos en el habla expresiva, así como constatar que los resultados generados por el módulo prosódico han tenido una buena aceptación, aunque se han producido diferencias según el estilo. / This thesis deals with different aspects related to expressive speech synthesis (ESS). Based on the previous experience in text-to-speech (TTS) systems of the Grup en Processament Multimodal (GPMM) of Enginyeria i Arquitectura La Salle, its main aim is to improve the expressive capabilities of such systems. The expressive speech transmits paralinguistic information as, for example, the emotion of the speaker, his/her mood, a certain intention or aspects related to the environment or to his/her conversational partner. The present thesis tackles two main objectives: on the one hand, the development of an expressive speech corpus and, on the other, the modelling and the prediction of prosody from text for their use in the ESS framework. First, an ESS system requires a speech corpus suitable for the development and the performance of some of its modules. The unavailability of a resource of this kind motivated the development of a new corpus. Based on the study of the strategies to obtain expressive speech and the previous experience of the group, the different tasks have been defined: design, recording, segmentation, tagging and validation. The main objective is to achieve a high quality speech signal and sufficient phonetic coverage (segmental and prosodic), preserving the authenticity from the point of view of the oral expressiveness. The recorded corpus has 4638 sentences and it is 5 h 12 min long; it contains five expressive styles: neutral, happy, sensual, aggressive and sad. Expressive speech has been obtained by means of the reading of texts semantically related to the defined styles. Therefore, a validation process has been required in order to guarantee that recorded utterances incorporate the desired expressive content. A comprehensive assessment of the whole corpus would be too costly. Moreover, there is insufficient scientific knowledge to completely emulate the subjective perception through automated techniques that yield a reliable validation of speech corpora. In this thesis, we propose an approach that supposes a step towards a practical solution to this problem, by combining subjective evaluation with techniques for the automatic identification of emotion in speech. The proposed method is used to perform an automatic review of the expressiveness of the corpus developed. Finally, a subjective test has allowed listeners to validate this automatic process.Second, based on our current experience and the proposed challenges, a corpus-based system for prosody estimation has been developed. This system is characterized by modelling both the linguistic and the paralinguistic functions of prosody. A set of prosodic attributes is automatically extracted from text. This information is the input to an automatic learning system that predicts the prosodic features modelled previously by a supervised training. The root mean squared error and the correlation coefficient have been used in both the adjustment of some system parameters and the objective evaluation. However, these measures are referred to specific utterances delivered by the speaker in the recording session, and then they do not provide information about the degree of acceptance of synthesized speech in listeners. Therefore, we have conducted different perception tests in which a group of listeners has scored a set of stimuli in each expressive style. Finally, the results for each style have been analyzed and compared with the objective measures, which has allowed to draw some conclusions about the relevance of prosodic features in expressive speech, as well as to verify that the results generated by the prosodic module have had a good acceptance, although with differences as a function of the style.
200

Modelado de la cualidad de la voz para la síntesis del habla expresiva

Monzo Sánchez, Carlos Manuel 14 July 2010 (has links)
Aquesta tesi es realitza dins del marc de treball existent en el grup d'investigació Grup de Recerca en Tecnologies Mèdia (GTM) d'Enginyeria i Arquitectura La Salle, amb l'objectiu de dotar de major naturalitat a la interacció home-màquina. Per això ens basem en les limitacions de la tecnologia emprada fins al moment, detectant punts de millora en els que poder aportar solucions. Donat que la naturalitat de la parla està íntimament relacionada amb l'expressivitat que aquesta pot transmetre, aquests punts de millora es centren en la capacitat de treballar amb emocions o estils de parla expressius en general.L'objectiu últim d'aquesta tesi és la generació d'estils de parla expressius en l'àmbit de sistemes de Conversió de Text a Parla (CTP) orientats a la Síntesi de la Parla Expressiva (SPE), essent possible transmetre un missatge oral amb una certa expressivitat que l'oient sigui capaç de percebre i interpretar correctament. No obstant, aquest objectiu implica diferents metes intermitges: conèixer les opcions de parametrització existents, entendre cadascun dels paràmetres, detectar els pros i contres de la seva utilització, descobrir les relacions existents entre ells i els estils de parla expressius i, finalment, portar a terme la síntesi de la parla expressiva. Donat això, el propi procés de síntesi implica un treball previ en reconeixement d'emocions, que en si mateix podria ser una línia complerta d'investigació, ja que aporta el coneixement necessari per extreure models que poden ser usats durant el procés de síntesi.La cerca de l'increment de la naturalitat ha implicat una millor caracterització de la parla emocional o expressiva, raó per la qual s'ha investigat en parametritzacions que poguessin portar a terme aquesta comesa. Aquests són els paràmetres de Qualitat de la Veu Voice Quality (VoQ), que presenten com a característica principal que són capaços de caracteritzar individualment la parla, identificant cadascun dels factors que fan que sigui única. Els beneficis potencials, que aquest tipus de parametrització pot aportar a la interacció natural, són de dos classes: el reconeixement i la síntesi d'estils de parla expressius. La proposta de la parametrització de VoQ no pretén substituir a la ja emprada prosòdia, sinó tot el contrari, treballar conjuntament amb ella per tal de millorar els resultats obtinguts fins al moment.Un cop realitzada la selecció de paràmetres es planteja el modelat de la VoQ, és a dir la metodologia d'anàlisi i de modificació, de forma que cadascun d'ells pugui ser extret a partir de la senyal de veu i posteriorment modificat durant la síntesi. Així mateix, es proposen variacions pels paràmetres implicats i tradicionalment utilitzats, adaptant la seva definició al context de la parla expressiva. A partir d'aquí es passa a treballar en les relacions existents amb els estils de parla expressius, presentant finalment la metodologia de transformació d'aquests últims, mitjançant la modificació conjunta de la VoQ y la prosòdia, per a la SPE en un sistema de CTP. / Esta tesis se realiza dentro del marco de trabajo existente en el grupo de investigación Grup de Recerca en Tecnologies Mèdia (GTM) de Enginyeria i Arquitectura La Salle, con el objetivo de dotar de mayor naturalidad a la interacción hombre-máquina. Para ello nos basamos en las limitaciones de la tecnología empleada hasta el momento, detectando puntos de mejora en los que poder aportar soluciones. Debido a que la naturalidad del habla está íntimamente relacionada con la expresividad que esta puede transmitir, estos puntos de mejora se centran en la capacidad de trabajar con emociones o estilos de habla expresivos en general.El objetivo último de esta tesis es la generación de estilos de habla expresivos en el ámbito de sistemas de Conversión de Texto en Habla (CTH) orientados a la Síntesis del Habla Expresiva (SHE), siendo posible transmitir un mensaje oral con una cierta expresividad que el oyente sea capaz de percibir e interpretar correctamente. No obstante, este objetivo implica diferentes metas intermedias: conocer las opciones de parametrización existentes, entender cada uno de los parámetros, detectar los pros y contras de su utilización, descubrir las relaciones existentes entre ellos y los estilos de habla expresivos y, finalmente, llevar a cabo la síntesis del habla expresiva. El propio proceso de síntesis implica un trabajo previo en reconocimiento de emociones, que en sí mismo podría ser una línea completa de investigación, ya que muestra la viabilidad de usar los parámetros seleccionados en la discriminación de estos y aporta el conocimiento necesario para extraer los modelos que pueden ser usados durante el proceso de síntesis.La búsqueda del incremento de la naturalidad ha implicado una mejor caracterización del habla emocional o expresiva, con lo que para ello se ha investigado en parametrizaciones que pudieran llevar a cabo este cometido. Estos son los parámetros de Cualidad de la Voz Voice Quality (VoQ), que presentan como característica principal que son capaces de caracterizar individualmente el habla, identificando cada uno de los factores que hacen que sea única. Los beneficios potenciales, que este tipo de parametrización puede aportar a la interacción natural, son de dos clases: el reconocimiento y la síntesis de estilos de habla expresivos. La propuesta de la parametrización de VoQ no pretende sustituir a la ya empleada prosodia, sino todo lo contrario, trabajar conjuntamente con ella para mejorar los resultados obtenidos hasta el momento.Una vez realizada la selección de los parámetros se plantea el modelado de la VoQ, es decir, la metodología de análisis y de modificación de forma que cada uno de ellos pueda ser extraído a partir de la señal de voz y posteriormente modificado durante la síntesis. Asimismo, se proponen variaciones para los parámetros implicados y tradicionalmente utilizados, adaptando su definición al contexto del habla expresiva.A partir de aquí se pasa a trabajar en las relaciones existentes con los estilos de habla expresivos, presentando finalmente la metodología de transformación de estos últimos, mediante la modificación conjunta de VoQ y prosodia, para la SHE en un sistema de CTH. / This thesis is conducted on the existing working framework in the Grup de Recerca en Tecnologies Mèdia (GTM) research group of the Enginyeria i Arquitectura La Salle, with the aim of providing the man-machine interaction with more naturalness. To do this, we are based on the limitations of the technology used up to now, detecting the improvement points where we could contribute solutions. Given that the speech naturalness is closely linked with the expressivity communication, these improvement points are focused on the ability of working with emotions or expressive speech styles in general.The final goal of this thesis is the expressive speech styles generation in the field of Text-to-Speech (TTS) systems aimed at Expressive Speech Synthesis (ESS), with the possibility of communicating an oral message with a certain expressivity that the listener will be able to correctly perceive and interpret. Nevertheless, this goal involves different intermediate aims: to know the existing parameterization options, to understand each of the parameters, to find out the existing relations among them and the expressive speech styles and, finally, to carry out the expressive speech synthesis. All things considered, the synthesis process involves a previous work in emotion recognition, which could be a complete research field, since it shows the feasibility of using the selected parameters during their discrimination and provides with the necessary knowledge for the modelling that can be used during the synthesis process.The search for the naturalness improvement has implied a better characterization of the emotional or expressive speech, so we have researched on parameterizations that could perform this task. These are the Voice Quality (VoQ) parameters, which main feature is they are able to characterize the speech in an individual way, identifying each factor that makes it unique. The potential benefits that this kind of parameterization can provide with natural interaction are twofold: the expressive speech styles recognition and the synthesis. The VoQ parameters proposal is not trying to replace prosody, but working altogether to improve the results so far obtained.Once the parameters selection is conducted, the VoQ modelling is raised (i. e. analysis and modification methodology), so each of them can be extracted from the voice signal and later on modified during the synthesis. Also, variations are proposed for the involved and traditionally used parameters, adjusting their definition to the expressive speech context. From here, we work on the existing relations with the expressive speech styles and, eventually we show the transformation methodology for these ones, by means of the modification of VoQ and prosody, for the ESS in a TTS system.

Page generated in 0.0953 seconds